Prvky statistického zpracování dat. Statistické zpracování dat a jeho vlastnosti Data pro statistické zpracování dat

Laboratorní práce №3. Statistické zpracování dat v systému MatLab

Obecné vyjádření problému

Hlavní účel implementace laboratorní práce je seznámit se se základy práce se statistickým zpracováním dat v prostředí MatLAB.

Teoretická část

Primární statistické zpracování dat

Statistické zpracování dat je založeno na primárních a sekundárních kvantitativních metodách. Účelem primárního zpracování statistických dat je strukturovat přijaté informace, což znamená seskupovat data do kontingenční tabulky podle různých parametrů. Nezpracovaná data by měla být prezentována v takovém formátu, aby osoba mohla provést přibližné posouzení přijatého souboru dat a odhalit informace o rozložení dat v přijatém vzorku dat, například o homogenitě nebo kompaktnosti dat. Po primární analýze dat jsou aplikovány metody sekundárního statistického zpracování dat, na jejichž základě jsou stanoveny statistické vzory v existujícím souboru dat.

Provedení primární statistické analýzy na poli dat vám umožní získat znalosti o následujícím:

Jaká je nejtypičtější hodnota pro vzorek? Za odpověď na tato otázka jsou určeny míry centrální tendence.

Existuje velký rozptyl dat vzhledem k této charakteristické hodnotě, tj. jaká je „fuzziness“ dat? V tento případ jsou stanoveny míry variability.

Za zmínku stojí skutečnost, že statistické ukazatele míry centrální tendence a variability jsou stanoveny pouze na kvantitativních datech.

Míry centrální tendence- skupina hodnot, kolem které je seskupen zbytek dat. Míry centrální tendence tedy zobecňují pole dat, což umožňuje vytvářet závěry jak o vzorku jako celku, tak i provádět srovnávací analýzu různých vzorků navzájem.

Předpokládejme, že existuje vzorek dat , pak jsou míry centrální tendence odhadnuty pomocí následujících ukazatelů:

1. průměr vzorku je výsledkem dělení součtu všech hodnot vzorku jejich počtem.Stanoví se vzorcem (3.1).

(3.1)

kde - i-tý prvek vzorku;

n je počet prvků vzorku.

Výběrový průměr poskytuje největší přesnost v procesu odhadu centrálního trendu.

Řekněme, že máme vzorek 20 lidí. Vzorové prvky jsou informace o průměrném měsíčním příjmu každého člověka. Předpokládejme, že 19 lidí má průměrný měsíční příjem 20 tisíc. a 1 osoba s příjmem 300 tr. Celkový měsíční příjem celého vzorku je 680 tr. Průměr vzorku je v tomto případě S=34.


2. Medián- generuje hodnotu, nad a pod kterou je počet různých hodnot stejný, tj. toto je centrální hodnota v sekvenční datové řadě. Určuje se v závislosti na sudosti / lichosti počtu prvků ve vzorku pomocí vzorců (3.2) nebo (3.3) Algoritmus pro odhad mediánu pro vzorek dat:

Nejprve jsou data seřazena (seřazena) ve vzestupném/sestupném pořadí.

Pokud má uspořádaný vzorek lichý počet prvků, pak je medián stejný jako střední hodnota.

(3.2)

kde n

V případě sudého počtu prvků je medián definován jako aritmetický průměr dvou centrálních hodnot.

(3.3)

kde je průměrný prvek uspořádaného vzorku;

- prvek uspořádaného výběru následující ;

Počet prvků vzorku.

V případě, že jsou všechny prvky vzorku odlišné, pak je přesně polovina prvků vzorku větší než medián a druhá polovina je menší. Například pro vzorek (1, 5, 9, 15, 16) je medián stejný jako u prvku 9.

Při statistické analýze dat vám medián umožňuje identifikovat prvky vzorku, které silně ovlivňují hodnotu průměru vzorku.

Řekněme, že máme vzorek 20 lidí. Vzorové prvky jsou informace o průměrném měsíčním příjmu každého člověka. Předpokládejme, že 19 lidí má průměrný měsíční příjem 20 tisíc. a 1 osoba s příjmem 300 tr. Celkový měsíční příjem celého vzorku je 680 tr. Medián je po seřazení vzorku definován jako aritmetický průměr desátého a jedenáctého prvku vzorku) a je roven Me = 20 tr. Tento výsledek je interpretován následovně: medián rozděluje vzorek do dvou skupin, takže můžeme dojít k závěru, že v první skupině má každá osoba průměrný měsíční příjem nejvýše 20 tisíc rublů a ve druhé skupině ne méně než 20 tisíc rublů. R. V tomto příkladu můžeme říci, že medián je charakterizován tím, kolik vydělává „průměrný“ člověk. Zatímco hodnota výběrového průměru je výrazně vyšší než S=34, což svědčí o nepřijatelnosti této charakteristiky při posuzování průměrného výdělku.

Čím větší je tedy rozdíl mezi mediánem a průměrem vzorku, tím větší je rozptyl dat vzorku (v uvažovaném příkladu je člověk s výdělkem 300 tr. zřetelně odlišný od průměrných lidí v konkrétním vzorku a má významný dopad na odhad průměrného příjmu). Co dělat s takovými prvky, se rozhoduje v každém jednotlivém případě. Ale v obecném případě, aby byla zajištěna spolehlivost vzorku, jsou staženy, protože mají silný vliv na hodnocení statistických ukazatelů.

3. móda (po)- generuje hodnotu, která se ve vzorku vyskytuje nejčastěji, tj. hodnotu s nejvyšší frekvencí. Algoritmus odhadu režimu:

V případě, že vzorek obsahuje prvky, které se vyskytují stejně často, pak říkáme, že v takovém vzorku žádný mód neexistuje.

Pokud dva sousední prvek vzorky mají stejnou frekvenci, která je větší než frekvence zbývajících prvků vzorku, pak se režim určí jako průměr těchto dvou hodnot.

Pokud dva prvky vzorku mají stejnou frekvenci, která je větší než frekvence zbývajících prvků vzorku, a tyto prvky spolu nesousedí, pak říkáme, že v tomto vzorku jsou dva módy.

Režim ve statistické analýze se používá v situacích, kdy je nutné rychle odhadnout míru centrální tendence a není vyžadována vysoká přesnost. Například módu (ve smyslu velikosti nebo značky) je vhodné použít k určení oblečení a obuvi, které jsou mezi kupujícími nejžádanější.

Míry rozptylu (variability)- skupina statistických ukazatelů, které charakterizují rozdíly mezi jednotlivými hodnotami vzorku. Na základě ukazatelů rozptylových opatření je možné posoudit stupeň homogenity a kompaktnosti prvků vzorku. Rozptylová opatření jsou charakterizována následujícím souborem indikátorů:

1. Přejetí - to je interval mezi maximální a minimální hodnotou výsledků pozorování (prvků vzorku). Indikátor rozsahu udává rozložení hodnot v sadě dat. Pokud je rozsah velký, pak jsou hodnoty v populaci velmi rozptýlené, jinak (rozsah je malý) se říká, že hodnoty v populaci leží blízko sebe. Rozsah je určen vzorcem (3.4).

(3.4)

Kde - maximální prvek vzorku;

je minimální prvek vzorku.

2.Průměrná odchylka je aritmetický průměr rozdílu (v absolutní hodnotě) mezi každou hodnotou ve vzorku a jejím průměrem ve vzorku. Průměrná odchylka je určena vzorcem (3.5).

(3.5)

kde - i-tý prvek vzorku;

Hodnota výběrového průměru vypočtená podle vzorce (3.1);

Počet prvků vzorku.

Modul nutné vzhledem k tomu, že odchylky od průměru pro každý konkrétní prvek mohou být kladné i záporné. Pokud se tedy modul nebere, pak se součet všech odchylek bude blížit nule a nebude možné posoudit míru variability dat (shlukování dat kolem průměru vzorku). Při statistické analýze lze místo průměrné hodnoty vzorku vzít modus a medián.

3. Disperze je míra rozptylu, která popisuje relativní odchylku mezi hodnotami dat a průměrem. Vypočítá se jako součet čtverců odchylek každého prvku vzorku od střední hodnoty. V závislosti na velikosti vzorku se odhadne rozptyl různé způsoby:

Pro velké vzorky (n>30) podle vzorce (3.6)

(3.6)

Pro malé vzorky (č<30) по формуле (3.7)

(3.7)

kde Xi - i-tý prvek vzorku;

S je střední hodnota vzorku;

Počet prvků vzorku;

(X i – S) - odchylka od střední hodnoty pro každou hodnotu souboru dat.

4. Standardní odchylka je mírou toho, jak široce jsou datové body rozptýleny vzhledem k jejich průměru.

Proces kvadratury jednotlivých odchylek při výpočtu rozptylu zvyšuje míru odchylky získané hodnoty odchylky od původních odchylek, což zase přináší další chyby. Aby se tedy odhad rozptylu datových bodů o jejich průměru přiblížil hodnotě průměrné odchylky, je z rozptylu extrahována druhá odmocnina. Extrahovaná odmocnina rozptylu charakterizuje míru variability nazývanou střední kvadratická hodnota neboli standardní odchylka (3.8).

(3.8)

Řekněme, že jste projektový manažer vývoje softwaru. Máte pod dohledem pět programátorů. Řízením procesu realizace projektu rozdělujete úkoly mezi programátory. Pro jednoduchost příkladu budeme vycházet ze skutečnosti, že úlohy jsou ekvivalentní ve složitosti a době provádění. Rozhodli jste se analyzovat práci každého programátora (počet dokončených úkolů během týdne) za posledních 10 týdnů, v důsledku čehož jste obdrželi následující vzorky:

Název týdne

Po vyhodnocení průměrného počtu splněných úkolů jste dostali následující výsledek:

Název týdne S
22,3
22,4
22,2
22,1
22,5

Na základě indikátoru S pracují všichni programátoři v průměru se stejnou efektivitou (asi 22 úkolů za týden). Ukazatel variability (rozsah) je však velmi vysoký (od 5 úloh pro čtvrtého programátora po 24 úloh pro pátého programátora).

Název týdne S P
22,3
22,4
22,2
22,1
22,5

Pojďme odhadnout směrodatnou odchylku, která ukazuje, jak jsou hodnoty distribuovány ve vzorcích vzhledem k průměru, konkrétně v našem případě odhadnout, jak velké je rozložení dokončení úkolu z týdne na týden.

Název týdne S P TAK
22,3 1,56
22,4 1,8
22,2 2,84
22,1 1,3
22,5 5,3

Výsledný odhad směrodatné odchylky říká následující (vyhodnoťme dva extrémní případy programátorů 4 a 5):

Každá hodnota ve vzorku 4 programátorů se v průměru odchyluje o 1,3 úlohy od průměru.

Každá hodnota v programátorském vzorku 5 se odchyluje v průměru o 5,3 úlohy od průměru.

Čím blíže je směrodatná odchylka 0, tím je průměr spolehlivější, protože ukazuje, že každá hodnota ve vzorku se téměř rovná průměru (22,5 položek v našem příkladu). Proto je 4. programátor nejdůslednější na rozdíl od pátého. Týdenní variabilita plnění úkolu u 5. programátora je 5,3 úkolu, což svědčí o značném rozptylu. V případě 5. programátora nelze průměru věřit, a proto je obtížné předvídat počet splněných úkolů na další týden, což následně znesnadňuje plánování a dodržování pracovních harmonogramů. Jaké manažerské rozhodnutí v tomto kurzu učiníte, není důležité. Je důležité, abyste obdrželi hodnocení, na jehož základě lze učinit vhodná manažerská rozhodnutí.

Lze tedy vyvodit obecný závěr, že průměr ne vždy správně odhadne data. Správnost odhadu průměru lze posoudit podle hodnoty směrodatné odchylky.


1. Nástroje pro statistické zpracování dat v Excelu

2. Použití speciálních funkcí

3. Pomocí nástroje ANALYSIS PACKAGE

Literatura:

hlavní:

1. Burke. Analýza dat pomocí Microsoft Excel. : Per. z angličtiny / Burke, Kenneth, Carey, Patrick. - M.: Nakladatelství "William", 2005. - S. 216 - 256.

2. Mishin A.V. Informační technologie v právní činnosti: dílna / A.V. Mishin. – M.: RAP, 2013. – S. 2-11.

další:

3. Informatika pro právníky a ekonomy: učebnice pro vysoké školy / Ed. S.V. Simonovič. - Petrohrad: Petr, 2004. - S. 498-516.

Cvičení #30

Téma číslo 11.1. Údržba databází v Access DBMS

Lekce je vedena metodou projektů.

Cíl projektu: vytvořit databázi o práci soudu.

Technický úkol:

1. Vytvořte databázi "Soud" ze dvou tabulek "Soudci" a "Nároky" s následující strukturou:

Tabulka "Soudci"

Název pole Kód rozhodčího CELÉ JMÉNO Přijímací dny Úřední hodiny Pracovní zkušenost
Datový typ Číselné Text Text Text Číselné
Velikost pole dlouhé celé číslo dlouhé celé číslo
Formát pole Základní Základní
Počet desetinných míst
Výchozí hodnota "St" "15:00-17:00"
Hodnotová podmínka >36200 And<36299 Po Nebo Út Nebo St Nebo Čt Nebo Pá >0 A<40
Chybové hlášení Platné hodnoty jsou Po, Út, St, Čt nebo Pá. Přepsat! ! Platné hodnoty jsou od 1 do 39. Zkuste to prosím znovu!
Povinné pole Ano Ano Ne Ne Ne
Indexované pole Ne Ne Ne Ne

Poznámka. Deklarujte klíčové pole „Kód rozhodčího“.

Tabulka "Nároky"

Název pole Číslo případu žalobce Odpověď-chik Kód rozhodčího Datum schůzky
Datový typ Číselné Text Text Číselné Čas schůzky
Vlastnosti pole: Záložka Obecné
Velikost pole dlouhé celé číslo dlouhé celé číslo Formát úplného data
Formát pole Základní
Počet desetinných míst
Výchozí hodnota
Hodnotová podmínka >0 A<99999 >36200 And<36299
Chybové hlášení Chybné zadání – zkuste to znovu! Platné hodnoty jsou od 36201 do 36298. Zkuste to prosím znovu!
Povinné pole Ano Ne Ne Ne Ne
Indexované pole Ano (žádné shody nejsou povoleny) Ne Ne Ano (Náhoda povolena) Ne

2. Do tabulky Soudci zadejte následující datové záznamy:

Do tabulky Reklamace zadejte následující datové záznamy:

3. Použijte pole "Kód rozhodčího" k vytvoření vztahu "jeden k mnoha" mezi tabulkami soudci A soudní spory. Zároveň nastavte "Zajistit integritu dat" a "kaskádovou aktualizaci souvisejících polí".

Literatura:

hlavní:

1. Mishin A.V. Informační technologie v odborné činnosti: studijní průvodce / A.V. Mishin, L.E. Mistrov, D.V. Kartavcev. - M.: RAP, 2011. - S. 259-264.

další:

Cvičení #31

Téma číslo 11.2. Principy vytváření formulářů a dotazů v Access DBMS

1. Vývoj vstupních formulářů pro zadávání dat.

2. Metodika provádění výpočtů a analýzy zadaných dat.

Literatura:

hlavní:

1. Mishin A.V. Informační technologie v odborné činnosti: studijní průvodce / A.V. Mishin, L.E. Mistrov, D.V. Kartavcev. - M.: RAP, 2011. - S. 265-271.

další:

2. Informatika a informační technologie: učebnice pro vysokoškoláky / I.G. Lesnichaya, I.V. Chybí, Yu.D. Romanová, V.I. Šestakov. - 2. vyd. - M.: Eksmo, 2006. - 544 s.

3. Mikheeva E.V. Informační technologie v odborné činnosti: učebnice pro studenty středních odborných škol / E.V. Michejev. - 2. vyd., vymazáno. - M.: Akademie, 2005. - 384 s.

Odeslat svou dobrou práci do znalostní báze je jednoduché. Použijte níže uvedený formulář

Studenti, postgraduální studenti, mladí vědci, kteří využívají znalostní základnu při svém studiu a práci, vám budou velmi vděční.

Hostováno na http://www.allbest.ru/

Zpracování statistických dat

Úvod

statistický rozptyl výběrová korelace

Metody statistického zpracování výsledků experimentu se nazývají matematické techniky, vzorce, metody kvantitativních výpočtů, s jejichž pomocí lze ukazatele získané během experimentu zobecnit, uvést do systému a odhalit v nich skryté zákonitosti. Hovoříme o takových zákonitostech statistické povahy, které existují mezi proměnnými studovanými v experimentu.

Některé z metod matematické a statistické analýzy umožňují vypočítat tzv. elementární matematické statistiky, které charakterizují výběrové rozdělení dat, jako je výběrový průměr, výběrový rozptyl, modus, medián a řada dalších. Jiné metody matematické statistiky, jako je analýza rozptylu, regresní analýza, umožňují posoudit dynamiku změn v jednotlivých výběrových statistikách. Pomocí třetí skupiny metod, řekněme korelační analýzy, faktorové analýzy, metod pro porovnávání výběrových dat, lze spolehlivě posoudit statistické vztahy, které existují mezi proměnnými, které jsou v tomto experimentu zkoumány.

1. Metody primárního statistického zpracování experimentálních výsledků

Všechny metody matematické a statistické analýzy jsou podmíněně rozděleny na primární a sekundární. Metody se nazývají primární, s jejichž pomocí je možné získat ukazatele, které přímo odrážejí výsledky měření provedených v experimentu. Primárními statistickými ukazateli se tedy rozumí ty, které se používají v samotných psychodiagnostických metodách a jsou výsledkem prvotního statistického zpracování výsledků psychodiagnostiky. Sekundární metody se nazývají statistické zpracování, pomocí kterého se na základě primárních dat odhalují statistické vzorce v nich skryté.

Primární metody statistického zpracování zahrnují například stanovení střední hodnoty vzorku, rozptylu vzorku, režimu vzorku a mediánu vzorku. Sekundární metody obvykle zahrnují korelační analýzu, regresní analýzu, metody pro srovnání primárních statistik ve dvou nebo více vzorcích.

Zvažte metody pro výpočet elementární matematické statistiky.

1.1 Móda

Číselnou charakteristikou vzorku, která zpravidla nevyžaduje výpočty, je tzv. modus. Modus je kvantitativní hodnota studovaného znaku, který se nejčastěji nachází ve vzorku. U symetrického rozdělení prvků, včetně normálního rozdělení, se hodnota režimu shoduje s hodnotami průměru a mediánu. Pro jiné typy distribuce, asymetrické, to není typické. Například v sekvenci hodnot funkcí 1, 2, 5, 2, 4, 2, 6, 7, 2 je hodnota 2 režim, protože se vyskytuje častěji než jiné hodnoty - čtyřikrát.

Móda se nachází podle následujících pravidel:

1) V případě, že se všechny hodnoty ve vzorku vyskytují stejně často, má se za to, že tato série vzorků nemá žádný režim. Například: 5, 5, 6, 6, 7, 7 – v tomto výběru není žádný režim.

2) Když dvě sousední (sousední) hodnoty mají stejnou frekvenci a jejich frekvence je větší než frekvence jakýchkoli jiných hodnot, režim se vypočítá jako aritmetický průměr těchto dvou hodnot. Například ve vzorku 1, 2, 2, 2, 5, 5, 5, 6 jsou frekvence sousedních hodnot 2 a 5 stejné a rovné 3. Tato frekvence je větší než frekvence ostatních hodnot ​1 a 6 (které mají hodnotu 1). Modus této řady tedy bude hodnota = 3,5

3) Pokud dvě nesousedící (nesousedící) hodnoty ve vzorku mají stejné frekvence, které jsou větší než frekvence jakékoli jiné hodnoty, pak se rozlišují dva režimy. Například v sérii 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 jsou režimy 11 a 14. V tomto případě se o vzorku říká, že je bimodální.

Mohou existovat také tzv. multimodální distribuce s více než dvěma vrcholy (módy).

4) Pokud je režim odhadován ze sady seskupených dat, je pro nalezení režimu nutné určit skupinu s nejvyšší frekvencí funkce. Tato skupina se nazývá modální skupina.

1.2 Medián

Medián je hodnota studovaného atributu, která dělí vzorek seřazený podle hodnoty tohoto atributu na polovinu. Napravo a nalevo od mediánu v uspořádané sérii zůstává stejný počet prvků. Například pro vzorek 2, 3, 4, 4, 5, 6, 8, 7, 9 bude medián hodnotou 5, protože nalevo a napravo od něj zůstávají čtyři indikátory. Pokud řada obsahuje sudý počet prvků, pak medián bude průměr, braný jako polovina součtu hodnot dvou centrálních hodnot řady. Pro další řádek 0, 1, 1, 2, 3, 4, 5, 5, 6, 7 bude medián 3,5.

Znalost mediánu je užitečná pro zjištění, zda je rozdělení konkrétních hodnot studovaného znaku symetrické a blíží se takzvanému normálnímu rozdělení. Průměr a medián pro normální rozdělení jsou obvykle stejné nebo se od sebe liší jen velmi málo. Pokud je výběrové rozdělení znaků normální, lze na něj aplikovat sekundární statistické výpočetní metody založené na normálním rozdělení dat. Jinak to nelze provést, protože do výpočtů se mohou vloudit závažné chyby.

1.3 Průměr vzorku

Výběrový průměr (aritmetický průměr) jako statistický ukazatel je průměrným hodnocením psychologické kvality studované v experimentu. Toto hodnocení charakterizuje stupeň jeho vývoje jako celku ve skupině subjektů, která byla podrobena psychodiagnostickému vyšetření. Přímým porovnáním průměrných hodnot dvou nebo více vzorků můžeme posoudit relativní stupeň vývoje posuzované kvality u lidí, kteří tvoří tyto vzorky.

1.4 Rozptyl vzorku

Rozptyl (někdy nazývaný rozsah) vzorku je označen písmenem R. Toto je nejjednodušší ukazatel, který lze pro vzorek získat - rozdíl mezi maximálními a minimálními hodnotami této konkrétní série variací, tj

R= xmax - xmin

Je zřejmé, že čím více se měřený znak liší, tím větší je hodnota R a naopak. Může se však stát, že dvě vzorové řady mají stejný průměr a rozsah, ale povaha variace těchto sérií bude odlišná. Uvedeme například dva vzorky:

X = 10 15 20 25 30 35 40 45 50X = 30 R = 40

Y=10 28 28 30 30 30 32 32 50 Y=30 R=40

Když jsou průměry a rozpětí stejné pro tyto dvě série vzorků, povaha jejich variace je odlišná. Aby bylo možné jasněji reprezentovat povahu variací vzorku, měli bychom se odkázat na jejich distribuce.

1.5 Rozptyl

Rozptyl je aritmetický průměr druhých mocnin odchylek hodnot proměnné od její střední hodnoty.

Disperze jako statistická hodnota charakterizuje, jak moc se jednotlivé hodnoty odchylují od průměrné hodnoty v daném vzorku. Čím větší je rozptyl, tím větší je rozptyl nebo rozptyl v datech.

Druhá odmocnina se bere ze součtu čtverců děleného počtem členů v řadě.

Někdy existuje poměrně mnoho počátečních soukromých primárních dat, která podléhají statistickému zpracování, a vyžadují velké množství elementárních aritmetických operací. Aby se snížil jejich počet a zároveň byla zachována požadovaná přesnost výpočtů, někdy se uchýlí k nahrazení výchozího vzorku konkrétních empirických dat intervaly. Interval je skupina hodnot atributů seřazených podle velikosti, která je v průběhu výpočtů nahrazena průměrnou hodnotou.

2. Metody sekundárního statistického zpracování experimentálních výsledků

Pomocí sekundárních metod statistického zpracování experimentálních dat se přímo ověřují, dokazují nebo vyvracejí hypotézy související s experimentem. Tyto metody jsou zpravidla složitější než metody primárního statistického zpracování a vyžadují, aby výzkumník byl dobře vyškolen v elementární matematice a statistice. (7).

Diskutovanou skupinu metod lze rozdělit do několika podskupin:

1. Regresní počet.

2. Metody pro porovnávání dvou nebo více elementárních statistik (průměrů, rozptylů atd.) náležejících k různým vzorkům.

3. Metody pro stanovení statistických vztahů mezi proměnnými, jako je jejich vzájemná korelace.

4. Metody odhalování vnitřní statistické struktury empirických dat (např. faktorová analýza). Podívejme se na každou z vybraných podskupin metod sekundárního statistického zpracování na příkladech.

2.1 Regresní počet

Regresní počet je metoda matematické statistiky, která umožňuje redukovat soukromá, nesourodá data do určitého lineárního grafu, který přibližně odráží jejich vnitřní vztah, a umět přibližně odhadnout pravděpodobnou hodnotu jiné proměnné hodnotou jedné z proměnných. (7).

Grafické vyjádření regresní rovnice se nazývá regresní přímka. Regresní přímka vyjadřuje nejlepší predikce závislé proměnné (Y) nad nezávislými proměnnými (X).

Regrese se vyjadřuje pomocí dvou regresních rovnic, které v nejpřímějším případě vypadají jako rovnice přímky.

Y = a 0 + a 1 * X

X = b 0 + b 1 * Y

V rovnici (1) je Y závislá proměnná, X je nezávislá proměnná, a 0 je volný člen, a 1 je regresní koeficient nebo sklon, který určuje sklon regresní přímky vzhledem k souřadnicovým osám.

V rovnici (2) je X závislá proměnná, Y je nezávislá proměnná, b 0 je volný člen, b 1 je regresní koeficient neboli sklon, který určuje sklon regresní přímky vzhledem k souřadnicovým osám.

Kvantitativní vyjádření vztahu (závislosti) mezi X a Y (mezi Y a X) se nazývá regresní analýza. Hlavním úkolem regresní analýzy je najít koeficienty a 0, b 0, a1 a b 1 a určit hladinu významnosti získaných analytických výrazů, které souvisí s proměnnými X a Y.

Chcete-li použít metodu lineární regresní analýzy, musí být splněny následující podmínky:

1. Srovnávané proměnné X a Y musí být měřeny na intervalové nebo poměrové stupnici.

2. Předpokládá se, že proměnné X a Y mají normální rozdělení.

3. Počet různých znaků ve srovnávaných proměnných by měl být stejný. (Pět).

2.2 Korelace

Další metoda sekundárního statistického zpracování, pomocí které se zjišťuje souvislost nebo přímá závislost mezi dvěma řadami experimentálních dat, se nazývá metoda korelací. Ukazuje, jak jeden jev ovlivňuje druhý nebo s ním ve své dynamice souvisí. Závislosti tohoto druhu existují například mezi veličinami, které jsou ve vzájemném kauzálním vztahu. Pokud se ukáže, že dva jevy spolu statisticky významně korelují, a pokud zároveň existuje jistota, že jeden z nich může působit jako příčina jevu druhého, pak z toho rozhodně vyplývá, že mezi nimi existuje příčinná souvislost . (7)

Když je zvýšení hladiny jedné proměnné doprovázeno zvýšením hladiny jiné, pak mluvíme o pozitivní korelaci. Dojde-li ke zvýšení jedné proměnné, když hladina druhé klesne, pak hovoříme o negativní korelaci. Při absenci souvislosti mezi proměnnými máme co do činění s nulovou korelací. (jeden)

Existuje několik druhů této metody: lineární, řazená, párová a vícenásobná. Lineární korelační analýza umožňuje vytvořit přímé vazby mezi proměnnými v jejich absolutních hodnotách. Tato spojení jsou graficky vyjádřena přímkou, odtud název „lineární“. Korelace pořadí určuje závislost nikoli mezi absolutními hodnotami proměnných, ale mezi pořadovými místy nebo pořadími, které zaujímají v řadě uspořádané podle velikosti. Analýza párových korelací zahrnuje studium korelací pouze mezi páry proměnných a více nebo více proměnných mezi mnoha proměnnými současně. Běžnou formou vícerozměrné korelační analýzy v aplikované statistice je faktorová analýza. (Pět)

Koeficient pořadové korelace se v psychologických a pedagogických výzkumech používá tehdy, jsou-li znaky, mezi kterými je vztah stanoven, kvalitativně rozdílné a nelze je přesně posoudit pomocí tzv. intervalové měřící škály. Intervalová stupnice je taková stupnice, která vám umožňuje vyhodnotit vzdálenosti mezi jejími hodnotami a posoudit, která z nich je větší a o kolik větší než druhá. Například pravítko, podle kterého se posuzují a porovnávají délky předmětů, je intervalová stupnice, protože jejím použitím můžeme konstatovat, že vzdálenost mezi dvěma a šesti centimetry je dvakrát větší než vzdálenost mezi šesti a osmi centimetry. Pokud pomocí nějakého měřícího nástroje můžeme pouze tvrdit, že některé ukazatele jsou větší než jiné, ale nejsme schopni říci o kolik, pak se takový měřící nástroj nazývá nikoli intervalový, ale pořadový.

Většina ukazatelů, které se získávají v psychologickém a pedagogickém výzkumu, se vztahuje k ordinálním, nikoli intervalovým škálám (například hodnocení jako „ano“, „ne“, „spíše ne než ano“ a další, která lze převést na body ), proto se na ně lineární korelační koeficient nevztahuje.

Metoda vícenásobných korelací, na rozdíl od metody párových korelací, umožňuje odhalit obecnou strukturu korelačních závislostí, které existují v rámci vícerozměrného experimentálního materiálu, který zahrnuje více než dvě proměnné, a prezentovat tyto korelační závislosti jako určitý systém. .

Pro uplatnění parciálního korelačního koeficientu musí být splněny následující podmínky:

1. Srovnávané proměnné musí být měřeny na intervalové nebo poměrové stupnici.

2. Předpokládá se, že všechny proměnné mají zákon normálního rozdělení.

3. Počet různých znaků ve srovnávaných proměnných by měl být stejný.

4. Pro posouzení úrovně významnosti Pearsonova korelačního poměru je třeba použít vzorec (11.9) a tabulku kritických hodnot pro Studentův t-test při k = n - 2. (5)

2.3 Faktorová analýza

Faktorová analýza je statistická metoda, která se používá při zpracování velkého množství experimentálních dat. Úkoly faktorové analýzy jsou: redukce počtu proměnných (redukce dat) a určení struktury vztahů mezi proměnnými, tzn. klasifikace proměnných, takže faktorová analýza se používá jako metoda redukce dat nebo jako metoda strukturální klasifikace.

Důležitým rozdílem mezi faktorovou analýzou a všemi výše popsanými metodami je, že ji nelze použít ke zpracování primárních, nebo, jak se říká, „surových“ experimentálních dat, tzn. získané přímo ze zkoušky předmětů. Materiálem pro faktorovou analýzu jsou korelace, nebo spíše Pearsonovy korelační koeficienty, které se počítají mezi proměnnými (tj. psychologickými charakteristikami) zahrnutými v průzkumu. Jinými slovy, korelační matice, nebo, jak se jim jinak říká, interkorelační matice, jsou podrobeny faktorové analýze. Názvy sloupců a řádků v těchto maticích jsou stejné, protože představují seznam proměnných zahrnutých do analýzy. Z tohoto důvodu jsou interkorelační matice vždy čtvercové, tzn. počet řádků v nich je roven počtu sloupců a symetrický, tzn. symetrická místa vzhledem k hlavní diagonále mají stejné korelační koeficienty.

Hlavním pojmem faktorové analýzy je faktor. Jedná se o umělý statistický ukazatel vyplývající ze speciálních transformací tabulky korelačních koeficientů mezi studovanými psychologickými charakteristikami, respektive maticí interkorelací. Postup pro extrakci faktorů z interkorelační matice se nazývá maticová faktorizace. V důsledku faktorizace lze z korelační matice extrahovat různý počet faktorů až do počtu, který se rovná počtu původních proměnných. Faktory identifikované jako výsledek faktorizace však zpravidla nemají stejnou hodnotu. (Pět)

Pomocí zjištěných faktorů je vysvětlena vzájemná závislost psychologických jevů. (7)

Nejčastěji se jako výsledek faktorové analýzy neurčuje jeden, ale několik faktorů, které vysvětlují matici interkorelací proměnných různými způsoby. V tomto případě se faktory dělí na obecné, obecné a jednotlivé. Nazývají se obecné faktory, jejichž všechna faktorová zatížení se výrazně liší od nuly (nulové zatížení znamená, že tato proměnná není nijak spojena s ostatními a nemá na ně v životě žádný vliv). Obecné - jedná se o faktory, u kterých je část faktorového zatížení odlišná od nuly. Single - to jsou faktory, ve kterých se pouze jedno ze zatížení výrazně liší od nuly. (7)

Faktorová analýza může být vhodná, pokud jsou splněna následující kritéria.

1. Není možné faktorizovat kvalitativní data získaná na škále jmen, např. barva vlasů (černá / hnědá / červená) atp.

2. Všechny proměnné musí být nezávislé a jejich rozdělení se musí blížit normálu.

3. Vztahy mezi proměnnými by měly být přibližně lineární, nebo alespoň ne jasně křivočaré.

4. V původní korelační matici by mělo být několik korelačních modulů vyšší než 0,3. V opačném případě je docela obtížné z matice extrahovat nějaké faktory.

5. Vzorek subjektů by měl být dostatečně velký. Rady odborníků se různí. Nejpřísnější hledisko doporučuje nepoužívat faktorovou analýzu, pokud je počet subjektů menší než 100, protože standardní chyby korelace v tomto případě budou příliš velké.

Pokud jsou však faktory dobře definovány (například se zatížením 0,7 spíše než 0,3), potřebuje experimentátor k jejich izolaci menší vzorek. Pokud je navíc známo, že získaná data jsou vysoce spolehlivá (například se používají validní testy), je možné analyzovat data na menším počtu subjektů. (Pět).

2.4 Ipomocí faktorové analýzy

Faktorová analýza je v psychologii široce využívána v různých oblastech souvisejících s řešením teoretických i praktických problémů.

V teoretické rovině je využití faktorové analýzy spojeno s rozvojem tzv. faktorovo-analytického přístupu ke studiu struktury osobnosti, temperamentu a schopností. Využití faktorové analýzy v těchto oblastech vychází z obecně uznávaného předpokladu, že pozorovatelné a přímo měřitelné ukazatele jsou pouze nepřímými a/nebo konkrétními vnějšími projevy obecnějších charakteristik. Tyto charakteristiky, na rozdíl od první, jsou latentní, takzvané latentní proměnné, protože se jedná o koncepty nebo konstrukty, které nejsou dostupné pro přímé měření. Lze je však stanovit faktorováním korelací mezi pozorovanými znaky a izolací faktorů, které (za předpokladu dobré struktury) lze interpretovat jako statistické vyjádření požadované latentní proměnné.

Ačkoli jsou faktory čistě matematické povahy, předpokládá se, že představují latentní proměnné (teoreticky postulované konstrukty nebo koncepty), takže názvy faktorů často odrážejí podstatu studovaného hypotetického konstruktu.

V současné době je faktorová analýza široce používána v diferenciální psychologii a psychodiagnostice. S jeho pomocí můžete vyvíjet testy, stanovit strukturu vztahů mezi jednotlivými psychologickými charakteristikami měřenými sadou testů nebo testovacích položek.

Faktorová analýza se také používá ke standardizaci testovacích metod, která se provádí na reprezentativním vzorku subjektů.

Závěr

Pokud jsou data získaná v experimentu kvalitativní povahy, pak správnost závěrů vyvozených na základě jejich závěrů zcela závisí na intuici, erudici a profesionalitě výzkumníka a také na logice jeho uvažování. Pokud jsou tato data kvantitativního typu, pak jsou nejprve podrobena primárnímu a poté sekundárnímu statistickému zpracování. Primární statistické zpracování spočívá ve stanovení požadovaného počtu elementárních matematických statistik. Takové zpracování téměř vždy zahrnuje alespoň stanovení průměru vzorku. V případech, kdy je informativním ukazatelem pro experimentální ověření navržených hypotéz rozptyl dat relativního průměru, se vypočítá rozptyl nebo kvadratická odchylka. Doporučuje se vypočítat hodnotu mediánu, pokud se předpokládá použití metod sekundárního statistického zpracování navržených pro normální rozdělení. Pro takové rozdělení výběrových dat se medián, stejně jako modus, shodují nebo jsou dostatečně blízké střední hodnotě. . Toto kritérium lze použít k přibližnému posouzení povahy distribuce získaných primárních dat.

Sekundární statistické zpracování (porovnání průměrů, rozptylů, rozdělení dat, regresní analýza, korelační analýza, faktorová analýza atd.) se provádí, pokud je pro vyřešení problémů nebo prokázání navržených hypotéz nutné určit statistické vzorce skryté v primárních experimentálních datech. Když se výzkumník pustí do sekundárního statistického zpracování, musí se především rozhodnout, kterou z různých sekundárních statistik by měl použít ke zpracování primárních experimentálních dat. Rozhodnutí je učiněno na základě zohlednění povahy testované hypotézy a povahy primárního materiálu získaného jako výsledek experimentu. Zde je několik doporučení v tomto ohledu.

Doporučení 1. Pokud experimentální hypotéza obsahuje předpoklad, že v důsledku probíhajícího psychologického a pedagogického výzkumu dojde ke zvýšení (nebo snížení) ukazatelů jakékoli kvality, pak se doporučuje použít Studentův test nebo p2-kritérium pro srovnání pre- a poexperimentální data. Posledně jmenovaný se používá, pokud jsou primární experimentální data relativní a vyjádřená například v procentech.

Doporučení 2. Pokud experimentálně testovaná hypotéza obsahuje tvrzení o kauzálním vztahu mezi některými proměnnými, pak je vhodné to ověřit odkazem na lineární nebo pořadové korelační koeficienty. Lineární korelace se používá, když jsou nezávislé a závislé proměnné měřeny pomocí intervalové stupnice a změny těchto proměnných před a po experimentu jsou malé. Pořadová korelace se používá, když stačí posoudit změny v pořadí posloupnosti nezávislých a závislých proměnných, nebo když jsou jejich změny dostatečně velké, nebo když byl měřicí nástroj spíše ordinální než intervalový.

Doporučení 3. Někdy hypotéza obsahuje předpoklad, že v důsledku experimentu se jednotlivé rozdíly mezi subjekty budou zvětšovat nebo zmenšovat. Tento předpoklad je dobře testován pomocí Fisherova testu, který umožňuje porovnat rozptyly před a po experimentu. Všimněte si, že pomocí Fisherova kritéria je možné pracovat pouze s absolutními hodnotami ukazatelů, ale ne s jejich pořadím.

Hostováno na Allbest.ru

...

Podobné dokumenty

    Základní techniky a metody zpracování a analýzy statistických dat. Výpočet aritmetických, harmonických a geometrických středních hodnot. Distribuční řady, jejich hlavní charakteristiky. Metody vyrovnání blízko dynamiky. Systém národních účtů.

    semestrální práce, přidáno 24.10.2014

    Pojem ekonomické analýzy jako vědy, její podstata, předmět, obecná charakteristika metod a socioekonomická efektivnost. Hlavní skupiny ekonometrických metod pro analýzu a zpracování dat. Faktorová analýza ekonomických dat podniku.

    abstrakt, přidáno 03.04.2010

    Výběrový aritmetický průměr, rozptyl, směrodatná odchylka. Zamítnutí podle chauvenetského kritéria. Pravidlo tři sigma. Odhad významnosti rozdílu mezi středními hodnotami dvou vzorků. Párové, vícenásobné regresní analýzy. Kompletní faktorová analýza.

    semestrální práce, přidáno 12.5.2012

    Aplikace různých metod prezentace a zpracování statistických dat. Prostorové statistické vzorky. Párová regrese a korelace. Časové řady. Budování trendu. Praktické příklady a metody jejich řešení, vzorce a jejich význam.

    průběh přednášek, přidáno 26.02.2009

    Statistické zpracování výsledků měření; aritmetický průměr, kvadratický, rozptyl. Stanovení výběrových parametrů: zákon tří sigma, histogram, regulační diagramy, Ishikawův diagram. Použití kvalitního nářadí při výrobě sedacích souprav.

    semestrální práce, přidáno 17.10.2014

    Průměrná hodnota ve statistice, její podstata a podmínky aplikace. Typy a formy průměrů: přítomností znaménkové váhy, formou výpočtu, pokrytím populace. Móda, medián. Statistická studie dynamiky zisku a ziskovosti na příkladu JSC "Bashmebel".

    kontrolní práce, přidáno 14.06.2008

    Principy statistického zpracování dat, metody a techniky používané v tomto procesu. Metodika a hlavní etapy konstrukce regulačních diagramů, jejich klasifikace a typy, funkční vlastnosti, stanovení výhod a nevýhod aplikace.

    semestrální práce, přidáno 23.08.2014

    Výpočet numerických charakteristik a zpracování výsledků výběrových pozorování. Výpočet a analýza statistických ukazatelů v ekonomice. Národní bohatství: prvky, hodnocení; bilance aktiv a pasiv; stálá aktiva, ukazatele pracovního kapitálu.

    semestrální práce, přidáno 25.12.2012

    Popisná statistika a statistická inference. Výběrové metody zajišťující reprezentativnost vzorku. Vliv typu vzorku na velikost chyby. Úkoly při aplikaci metody vzorkování. Distribuce pozorovacích dat k běžné populaci.

    test, přidáno 27.02.2011

    Zveřejnění pojmu: intervalová škála, aritmetický průměr, hladina statistické významnosti. Jak interpretovat modus, medián a průměr. Řešení problémů pomocí kritéria Friedman, Rosenbaum. Výpočet Spremenova korelačního koeficientu.

Metody statistického zpracování výsledků experimentu jsou matematické metody, vzorce, metody kvantitativních výpočtů, s jejichž pomocí lze ukazatele získané během experimentu zobecnit, vnést do systému a odhalit v nich skryté zákonitosti.

Hovoříme o takových zákonitostech statistické povahy, které existují mezi proměnnými studovanými v experimentu.

Data jsou hlavní prvky, které mají být klasifikovány nebo kategorizovány pro účely zpracování26.

Některé z metod matematické a statistické analýzy umožňují vypočítat tzv. elementární matematickou statistiku, která charakterizuje výběrové rozdělení dat, např.

vzorový průměr,

Vzorový rozptyl,

Medián a další.

Jiné metody matematické statistiky umožňují posuzovat dynamiku změn v jednotlivých výběrových statistikách, např.:

disperzní analýza,

Regresní analýza.

Pomocí třetí skupiny vzorkovacích metod lze spolehlivě posoudit statistické vztahy, které existují mezi proměnnými, které jsou v tomto experimentu zkoumány:

Korelační analýza;

Faktorová analýza;

srovnávací metody.

Všechny metody matematicko-statistické analýzy se konvenčně dělí na primární a sekundární 27 .

Metody se nazývají primární, s jejichž pomocí je možné získat ukazatele, které přímo odrážejí výsledky měření provedených v experimentu.

Sekundární metody se nazývají statistické zpracování, pomocí kterého se na základě primárních dat odhalují statistické vzorce v nich skryté.

Mezi primární statistické metody zpracování patří například:

Stanovení průměru vzorku;

Rozptyl vzorku;

Selektivní móda;

Ukázkový medián.

Sekundární metody obvykle zahrnují:

Korelační analýza;

Regresní analýza;

Metody pro porovnání primárních statistik pro dva nebo více vzorků.

Uvažujme metody pro výpočet elementární matematické statistiky, počínaje výběrovým průměrem.

Aritmetický průměr - je poměr součtu všech datových hodnot k počtu členů 28.

Průměrná hodnota jako statistický ukazatel je průměrným hodnocením psychologické kvality studované v experimentu.

Toto hodnocení charakterizuje stupeň jeho vývoje jako celku ve skupině subjektů, která byla podrobena psychodiagnostickému vyšetření. Přímým porovnáním průměrných hodnot dvou nebo více vzorků můžeme posoudit relativní stupeň vývoje posuzované kvality u lidí, kteří tvoří tyto vzorky.

Průměrná hodnota vzorku se stanoví pomocí následujícího vzorce 29:

kde x cf je výběrový průměr nebo aritmetický průměr vzorku;

n - počet subjektů ve výběrovém souboru nebo soukromých psychodiagnostických ukazatelích, na základě kterých je vypočtena průměrná hodnota;

x k - soukromé hodnoty ukazatelů pro jednotlivé subjekty. Existuje n takových indikátorů, takže index k této proměnné nabývá hodnot od 1 do n;

∑ - akceptováno v matematice, součtové znaménko hodnot těch proměnných, které jsou napravo od tohoto znaménka.

Disperze je mírou rozptylu dat o střední hodnotě 30 .

Čím větší je rozptyl, tím větší je rozptyl nebo rozptyl v datech. Stanovuje se proto, aby bylo možné od sebe odlišit veličiny, které mají stejný průměr, ale rozdílný rozptyl.

Disperze se určuje podle následujícího vzorce:

kde je výběrový rozptyl, nebo jednoduše rozptyl;

Výraz, který znamená, že pro všechna x k od prvního do posledního v tomto vzorku je nutné vypočítat rozdíly mezi soukromými a průměrnými hodnotami, umocnit tyto rozdíly a sečíst je;

n je počet subjektů ve vzorku nebo primární hodnoty, pro které se vypočítá rozptyl.

Medián nazývá se hodnota studovaného znaku, která rozdělí vzorek seřazený podle hodnoty tohoto znaku na polovinu.

Znalost mediánu je užitečná pro zjištění, zda je rozdělení konkrétních hodnot studovaného znaku symetrické a blíží se takzvanému normálnímu rozdělení. Průměr a medián pro normální rozdělení jsou obvykle stejné nebo se od sebe liší jen velmi málo.

Pokud je výběrové rozdělení znaků normální, lze na něj aplikovat sekundární statistické výpočetní metody založené na normálním rozdělení dat. Jinak to nelze provést, protože do výpočtů se mohou vloudit závažné chyby.

Móda ještě jedna elementární matematická statistika a charakteristika distribuce experimentálních dat. Modus je kvantitativní hodnota studovaného znaku, který se nejčastěji nachází ve vzorku.

U symetrického rozdělení prvků, včetně normálního rozdělení, se hodnoty režimu shodují se středními a středními hodnotami. Pro jiné typy distribuce, asymetrické, to není typické.

Nazývá se metoda sekundárního statistického zpracování, jejímž prostřednictvím se zjišťuje vztah nebo přímá souvislost mezi dvěma řadami experimentálních dat metoda korelační analýzy. Ukazuje, jak jeden jev ovlivňuje druhý nebo s ním ve své dynamice souvisí. Závislosti tohoto druhu existují například mezi veličinami, které jsou ve vzájemném kauzálním vztahu. Pokud se ukáže, že dva jevy spolu statisticky významně korelují, a pokud zároveň existuje jistota, že jeden z nich může působit jako příčina jevu druhého, pak z toho rozhodně vyplývá, že mezi nimi existuje příčinná souvislost .

Existuje několik druhů této metody:

Lineární korelační analýza umožňuje vytvořit přímé vazby mezi proměnnými v jejich absolutních hodnotách. Tato spojení jsou graficky vyjádřena přímkou, odtud název „lineární“.

Lineární korelační koeficient se určí pomocí následujícího vzorce 31:

kde r xy - lineární korelační koeficient;

x, y - průměrné vzorové hodnoty porovnávaných hodnot;

X i ,y i - hodnoty soukromého vzorku porovnávaných veličin;

P - celkový počet hodnot ve srovnávané řadě ukazatelů;

Rozptyl, odchylky porovnávaných hodnot od průměrných hodnot.

Korelace pořadí určuje závislost nikoli mezi absolutními hodnotami proměnných, ale mezi pořadovými místy nebo pořadími, které zaujímají v řadě uspořádané podle velikosti. Vzorec pro koeficient pořadové korelace je 32:

kde R s - koeficient pořadové korelace podle Spearmana;

d i - rozdíl mezi pořadími ukazatelů stejných subjektů v uspořádaných řádcích;

P - počet subjektů nebo digitálních dat (hodností) v korelované řadě.

Atyusheva Anna

V práci jsou na příkladu zpracování dat o pokroku žáků 7. ročníku uvažovány hlavní statistické charakteristiky, je prováděn sběr a seskupování statistických dat, přehledně prezentovány statistické informace a analýza dat. se provádí.

Práce obsahuje doprovodnou prezentaci.

Stažení:

Náhled:

Městská samosprávná vzdělávací instituce "Gymnázium č. 24"

XXII vědecká konference MAGNI

Statistické zpracování dat

MAOU "Gymnasium č. 24" Atyusheva Anna

Konzultant: učitel matematiky

Shchetinina Natalya Sergejevna

Magadan, 2016

Úvod……………………………………………………………………………………………………………………… 3

  1. Základní pojmy používané při statistickém zpracování dat………………………..5
  2. Výzkumná část ………………………………………………………………….. .....7

2.1 Statistické zpracování údajů o prospěchu žáků 7. ročníku „B“………………… ..7

18

2.3. Srovnávací charakteristiky vzdělávacích aktivit žáků na základě výsledků I. a II. čtvrtletí……………………………………………………………………………………………… …………..21

2.4. Analýza průzkumu u žáků 7. ročníku „B“ na rodičovskou kontrolu nad pokroky dětí………………………………………………………………………………………… …………23

Závěr………………………………………………………………………………………………………………...27

Literatura……………………………………………………………………………………………………………… 28

Úvod

Každý z nás, kdo otevře knihu nebo noviny, zapne televizi nebo se dostane na stanici, neustále čelí tabulkové formě prezentace informací. Jedná se o rozvrh lekcí, rozvrh vlaků, násobilku a mnoho dalšího. Všechny informace jsou prezentovány ve formě tabulek nebo grafů.

Takové informace musíte umět zpracovat a analyzovat. Bez zpracování dat, porovnávání událostí nelze vysledovat vývoj konkrétního problému.

V rámci algebry jsme studovali statistické charakteristiky, které jsou široce používány v různých studiích. Zaujala mě praktická aplikace studovaných charakteristik a schopnost zpracovat data tak, aby prezentované informace jednoznačně určovaly průběh vývoje konkrétního problému a ve výsledku i výsledek jeho řešení. Jako takový problém jsem se rozhodl považovat výkon své třídy za čtvrtletí prvního pololetí.

Objektová oblast studia– algebra

Předmět studia– statistické charakteristiky

Předmět studia- postup žáků 7. ročníku "B" za čtvrtletí 1. pololetí

Hypotéza: Věříme, že na příkladu zpracování dat o pokroku žáků v ročníku 7B se nejen seznámíme s hlavními statistickými charakteristikami, ale také se sami naučíme:

  • shromažďovat a seskupovat statistické údaje;
  • vizualizovat statistické informace;
  • analyzovat přijatá data.

Cílová: naučit se zpracovávat, analyzovat, vizualizovat dostupné informace.

úkoly:

  • studovat statistické charakteristiky;
  • shromažďovat informace o pokroku studentů v 7. ročníku ve čtvrtletích

první polovina roku;

  • zpracovávat informace;
  • vizualizovat informace pomocí histogramů;
  • analyzovat získaná data a vyvodit příslušné závěry.

Základní pojmy používané ve statistickém zpracování dat

Statistika je věda, která se zabývá získáváním, zpracováním a analýzou kvantitativních dat o různých hromadných jevech vyskytujících se v přírodě a společnosti. Slovo „statistika“ pochází z latinského slova „status“, což znamená „stav, stav věcí“.

Nejjednodušší statistické charakteristiky jsou aritmetický průměr, medián, rozsah, modus.

  • aritmetický průměrřada čísel se nazývá podíl dělení součtu těchto čísel počtem členů. Obvykle se aritmetický průměr zjistí, když chtějí určit průměrnou hodnotu pro určitou řadu údajů: průměrný výnos pšenice na 1 hektar v oblasti, průměrný výkon jedné brigády pracovníka za směnu, průměrnou známku certifikátu, průměrná teplota vzduchu v poledne v tomto desetiletí atd.
  • Medián uspořádané řady čísel s lichým počtem členů se nazývá číslo napsané uprostřed a medián uspořádané řady čísel se sudým počtem členů se nazývá aritmetický průměr dvou čísel zapsaných uprostřed. Všimněte si, že s číselnou řadou je pohodlnější a rychlejší pracovat, pokud je objednána, tzn. taková řada, ve které každé následující číslo není menší (nebo není větší) než předchozí.
  • Móda Číselná řada se nazývá číslo, které se v dané řadě vyskytuje nejčastěji. Sada čísel může mít více než jeden režim nebo žádný režim. Režim série dat se obvykle najde, když chceme odhalit nějaký typický indikátor. Všimněte si, že aritmetický průměr řady čísel se nemusí shodovat s žádným z těchto čísel a režim, pokud existuje, se nutně shoduje se dvěma nebo více čísly řady. Kromě toho, na rozdíl od aritmetického průměru, pojem "režim" neodkazuje pouze na číselná data.
  • ve velkém číselná řada se nazývá rozdíl mezi největším a nejmenším z těchto čísel. Rozsah řady se najde, když chtějí určit, jak velké je rozšíření dat v řadě.

Definici každé z charakteristik si ukážeme na příkladu řady čísel: 47,46,52,47,52,47,52,49,45,43,53,53,47,52.

aritmetický průměr 48,7.

Zjistíme to následovně: určíme součet čísel a vydělíme ho jejich počtem.

(47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7.

Medián daná řada čísel bude číslem 48.

Je to takto: uspořádáme řadu čísel a vybereme to, které je uprostřed. Pokud je počet čísel sudý, pak najdeme aritmetický průměr dvou čísel uprostřed řady.

43,45,46,47,47,47, 47,49 ,52,52,52,52,53,53

(47+49):2=48

Móda daná řada čísel bude čísly 47 a 52 . Tato čísla se opakují nejčastěji.

47 ,46, 52 , 47 , 52 , 47 , 52 ,49,45,43,53,53, 47 , 52 .

ve velkém tato řada čísel bude 10.

Zjistíme to následovně: vybereme největší a nejmenší číslo řady a najdeme rozdíl mezi těmito čísly.

47,46,52,47,52,47,52,49,45, 43, 53 ,53,47,52

53-43=10

Výzkumná část

Statistické zpracování údajů o prospěchu žáků 7. ročníku "B"

Přejděme ke zpracování informací. Pro každý z předmětů uděláme tabulky složené ze tří řádků, první bude obsahovat řadu údajů. Každá varianta z této série byla ve vzorku skutečně pozorována několikrát. Toto číslo se nazývá množství možností. Vložíme tedy do druhého řádku násobek odpovídající možnosti. Získáme vzorovou distribuční tabulku.

Pokud sečteme všechny násobnosti, pak dostaneme počet všech měření provedených během vzorku – velikost vzorku (V našem případě je toto číslo 24, což odpovídá počtu žáků ve třídě).

Ve třetím řádku se poměr, vyjádřený v procentech, nazývá frekvence opcí.

možnosti frekvence =

Obecně platí, že pokud se na základě výsledků studie sestaví tabulka relativních četností, pak je součet relativních četností 100 %.

I čtvrt

Ruský jazyk.

Seřaďme vzorová data (značky): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4 ,4 ,4,5.

Průměr předmětu:(průměrný).

Tabulka přidělení frekvence

Volba

Možnosti multiplicity

Ne

% frekvence

58.3%

37.5%

4.2%

Literatura.

Seřaďme vzorová data (značky): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5 ,5 ,5,5.

Průměr předmětu:(průměrný).

Možnosti hodnocení

mnohost

Ne

% frekvence

37.5%

41.7%

20.8%

Algebra.

Seřaďme vzorová data (značky): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4 ,4 ,5,5.

Průměr předmětu:(průměrný).

Největší počet studentů v předmětu má "4, 3" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

45.8%

45.8%

8.3%

Dějiny.

Seřaďme vzorová data (značky): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4 ,4 ,4,5

Průměr předmětu:(průměrný).

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

45.8%

4.2%

Sociologie.

Seřaďme vzorová data (značky): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5 ,5 .5.5

Průměr předmětu:(průměrný).

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

37.5%

41.7%

20.8%

Zeměpis.

Seřaďme vzorová data (značky): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5 5,5, pět

Průměr předmětu:(průměrný).

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

20.8%

41.7%

37.5%

Fyzika.

Seřaďme vzorová data (značky): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,4,5

Průměr předmětu:(průměrný).

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

37.5%

58.3%

4.2%

Biologie.

Seřaďme vzorová data (značky): 3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4.4,5,5,5,5,5 ,5 ,pět

Průměr předmětu:(průměrný).

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

45.8%

29.2%

ZÁKLADY BEZPEČNOSTI ŽIVOTA.

Seřaďme vzorová data (značky): 4,4,4,4,4,4.4.5,5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 ,pět

Průměr předmětu:(průměrný).

Možnosti hodnocení

mnohost

Ne

Ne

% frekvence

29.2%

70.8%

Seřaďme vzorová data (známky): 3,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5

Průměr předmětu:(průměrný).

Největší počet studentů v předmětu má „5“ (móda)

Přibližně polovina studentů ruštiny studuje v 5 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

4.2%

37.5%

58.3%

Anglický jazyk.

Seřaďme vzorová data (značky): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5 ,5 ,pět

Průměr předmětu:(průměrný).

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

37.5%

41.7%

20.8%

Informatika.

Seřaďme vzorová data (značky): 3,4,4,4,4.4,4,4,4,4,4,4,4,4,5,5,5,5.5.5,5,5,5 ,5

Průměr předmětu:(průměrný).

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

4.2%

54.2%

41.7%

Technologie.

Seřaďme vzorová data (značky): 3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,55,5,5,5,5 ,5

Průměr předmětu:(průměrný).

Největší počet studentů v předmětu má „5“ (móda)

Přibližně polovina studentů v ruském studiu na úrovni 4,5 (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

20.8%

54.2%

Pojďme nyní shromáždit podobné informace o výsledcích druhého čtvrtletí.

Ruský jazyk.

Seřaďme vzorová data (značky): 3,3,3.3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,4

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

Ne

% frekvence

41.7%

58.3%

Literatura.

Seřaďme vzorová data (značky): 3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,5,5,5 ,5 .5.5

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má „3“ (móda)

Přibližně polovina studentů ruštiny studuje ve 3 (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

41.7%

33.3%

Algebra.

Seřaďme vzorová data (značky): 3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4 ,5 .5.5

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má „3“ (móda)

Přibližně polovina studentů ruštiny studuje ve 3 (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

37.5%

12.5%

Dějiny.

Seřaďme vzorová data (značky): 3,3,3,3,3,3,3,3,3,4.4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,pět

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

37.5%

58.3%

4.2%

Společnost.

Seřaďme vzorová data (značky): 3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4 ,5 .5.5

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

16.7%

70.8%

12.5%

Zeměpis.

Seřaďme vzorová data (značky): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5 .5.5

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

12.5%

58.3%

29.2%

Fyzika.

Seřaďme vzorová data (značky): 3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,44,5 ,5 ,pět

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

33.3%

16.7%

12.5%

Biologie.

Seřaďme vzorová data (značky): 3,3,3,4,4,4,4,4,4,4.4,4,4,4,4,4,4,4,5,5,5,5 ,5 ,pět

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

12.5%

62.5%

ZÁKLADY BEZPEČNOSTI ŽIVOTA.

Seřaďme vzorová data (značky): 3,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 ,pět

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má „5“ (móda)

Přibližně polovina studentů ruštiny studuje v 5 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

4.2%

8.3%

87.5%

Historie a společnost rodné země.

Seřaďme vzorová data (značky): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5 ,5 .5.5

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

12.5%

45.8%

41.7%

Anglický jazyk.

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

20.8%

29.2%

Informatika.

Seřaďme vzorová data (značky): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5 .5.5

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má "4" (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

20.8%

29.2%

Technologie.

Seřaďme vzorová data (značky): 3,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 .5.5

Průměr předmětu:(průměrný)

Největší počet studentů v předmětu má „5“ (móda)

Přibližně polovina studentů ruštiny studuje ve 4 letech (medián)

Možnosti hodnocení

mnohost

Ne

% frekvence

4.2%

29.2%

66.7%

Vizualizujte data pomocí histogramů

Pro vizuální znázornění dat získaných jako výsledek statistické studie se široce používají různé metody jejich znázornění.

K vizualizaci dat použijeme histogramy. Histogram je stupňovitý obrazec složený z uzavřených obdélníků. Základna každého obdélníku se rovná délce intervalu a výška je násobkem varianty nebo relativní četností. V histogramu tedy na rozdíl od běžného sloupcového grafu nejsou základy obdélníku voleny libovolně, ale jsou striktně určeny délkou intervalu.

Srovnávací charakteristiky výkonů žáků v předmětech 1. čtvrtletí

Srovnávací charakteristika výkonů žáků v předmětech 2. čtvrtletí

závěry

Podle výsledků za první čtvrtletí je jasně vidět, že nejobtížnější studenti zvládají předměty jako: ruský jazyk a algebra, tedy předměty, u kterých je "trojka" hodnocením, které je prioritou ve vztahu k ostatním známkám. To znamená, že kvalita v těchto předmětech je nižší než v jiných.

Je také zřejmé, že vysoká úroveň se ztrojnásobuje v předmětech jako literatura, historie, společnost, fyzika, angličtina. Smutná je také přítomnost trojic v předmětech, jako je technika, biologie, zeměpis.

Podle výsledků za druhé čtvrtletí se výrazně snížil počet trojek a pětek, to znamená, že si studenti rozložili síly ve všech předmětech, nikoli v samostatně preferovaných.

Histogram rozložení průměrného skóre u subjektů prvního čtvrtletí

Histogram rozložení průměrného skóre u subjektů druhého čtvrtletí

Výstup

K vytvoření těchto grafů jsme použili takovou statistickou charakteristiku, jako je aritmetický průměr. Je jasně vidět, že ve druhém čtvrtletí se zhoršila znalost ruského jazyka, historie a společnosti rodné země a informatiky. Zlepšení v historii, společnosti, fyzice, biologii, bezpečnosti života, anglicky. Diagramy ale zároveň ukazují, že k výraznějším změnám k lepšímu došlo pouze ve fyzice a anglickém jazyce.

Srovnávací charakteristika vzdělávací činnosti žáků na základě výsledků I. a II. čtvrtletí

Histogram kvality znalostí v předmětech 1. čtvrtletí

Histogram kvality znalostí v předmětech 2. čtvrtletí

Spojením obou histogramů do jednoho je mnohem snazší vidět obrázek o výkonu třídy ve srovnání. A samostatně je snazší vidět, které položky jsou kvalitnější. Například v prvním čtvrtletí je kvalita méně než 60% v předmětech - algebra, ruština, dějepis, ve druhém - ruština, literatura, algebra, fyzika. Už teď je jasné, že ruský jazyk a algebra jsou pro studenty nejtěžší. A procento kvality ve všech předmětech se příliš neliší 66 % – první čtvrtletí, 68 % – druhé. To znamená, že křečovitá kvalita předmětů, která je jasně viditelná ve srovnávacím diagramu, naznačuje, že se studenti ve skutečnosti nesnaží zlepšit své znalosti a nezastávají své pozice v té či oné předmětové oblasti.

Graf srovnávající všechny položky podle kvality za 1 a 2 čtvrtletí

Během druhého čtvrtletí výrazně vzrostl počet dobrých studentů a vynikajících studentů v ruském jazyce, společnosti, biologii, angličtině a technice. Mírně se snížil počet literatury, algebry, bezpečnosti života, IORK a informatiky. A je vidět silný pokles kvality fyziky, který souvisí s nepřipraveností studentů na hodiny.

A opět docházíme k závěru, že děti se učí „skoky“ a ve směru vzdělávání nejsou žádné zvláštní preference (humanitní předměty, fyzikální a matematické předměty, předměty přírodního cyklu).

Analýza průzkumu u žáků 7. třídy "B" pro rodičovskou kontrolu nad pokroky dětí

Na základě výsledků výše uvedené studie jsme se rozhodli provést průzkum mezi žáky 7. ročníku „B“ pro rodičovskou kontrolu nad vzděláváním dětí (dotazníky viz příloha)

Velikost vzorku je 22 osob.

Kontrola domácích úkolů od rodičů

Výstup

Téměř čtvrtina studentů na toto téma nemá rodičovskou kontrolu, což samozřejmě ovlivňuje jejich studijní výsledky.

Počet kontrol za týden za domácí úkol

Medián = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7,7 = (3+3 ):2 = 3

Aritmetický průměr = 3

Výstup

V průměru se úkoly kontrolují třikrát týdně. Vzhledem ke skokům v učení to nestačí.

Medián = 0,0,0,0,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,5,5,6,7, 7,7 = (2+2):2 = 2

Aritmetický průměr = 3 (průměrně rodiče kontrolují deníky 3x týdně)

Množství času, které studenti stráví domácími úkoly

Možnosti

Méně než 1

% frekvence

  • Rozsah R=x(max) - x(min)= 3,5 - 0,5 = 3 hodiny

(charakterizuje velikost rozptylu pozorovaných hodnot, tj. ukazuje rozdíl mezi nejdelším a nejkratším časem)

  • Režim M(0) = 2,5 hodiny ( ukazuje hodnotu, která se vyskytuje častěji než ostatní, tzn. ukazuje čas, který studenti tráví nejčastěji)

Histogram času stráveného studenty nad domácími úkoly

Výstup

V průměru zaberou domácí úkoly 2,5 hodiny denně. Což je vzhledem k věku studentů považováno za normální.

Závěr

Díky odvedené práci jsem se naučil zpracovávat a analyzovat dostupné informace

Znalost statistických charakteristik mi pomohla určit průměrné skóre v různých předmětech a také módu a rozsah v těch výkonnostních ukazatelích, kde by se zdálo nemožné je určit. Bez zpracování dat, porovnávání událostí nelze vysledovat vývoj konkrétního problému. Snažili jsme se nejen vysledovat vzniklý problém - pokles kvality znalostí a studijních výsledků v předmětech, ale také se pokusit zjistit příčinu, která podle nás spočívala v nedostatečné kontrole rodičů nad akademické výkony svých dětí. Průzkum a výsledky školního prospěchu ukázaly, že žáci 7. třídy „B“ nemají dostatek dovedností v sebekontrole nad učením a rodiče si myslí opak.

Myslím, že odvedená práce bude užitečná jak pro třídního učitele při práci s rodiči, tak pro mé spolužáky ke zlepšení výsledků v jednotlivých předmětech v budoucnu.

Statistika je věda, která studuje, zpracovává a analyzuje kvantitativní data o široké škále hromadných jevů v životě. Jeho charakteristiku jsme si pro sebe poodhalili jen málo a před námi je ještě mnoho neznámého a zajímavého.

Bibliografie:

  1. http://www.nado5.ru/e-book/naibolshii-obzchii-delitel
    Náhled:

    Chcete-li používat náhled prezentací, vytvořte si účet Google (účet) a přihlaste se: https://accounts.google.com


    Popisky snímků:

    Statistické zpracování dat Zpracovala: studentka 7. ročníku "B" MAOU "Gymnázium č. 24" Atyusheva Anna Konzultantka: učitelka matematiky Shchetinina Natalya Sergeevna

    Účel: naučit se zpracovávat, analyzovat, vizualizovat dostupné informace. Úkoly: studovat statistické charakteristiky; shromažďovat informace o pokroku žáků v ročníku 7 B za čtvrtletí prvního pololetí; zpracovávat informace; vizualizovat informace pomocí histogramů; analyzovat získaná data a vyvodit příslušné závěry.

    Hypotézou na příkladu zpracování dat o výkonu žáka se můžeme nejen seznámit s hlavními statistickými charakteristikami, ale také se naučit sbírat a seskupovat statistická data; vizualizovat statistické informace; analyzovat přijatá data.

    Statistika je věda, která se zabývá získáváním, zpracováním a analýzou kvantitativních dat o různých hromadných jevech vyskytujících se v přírodě a společnosti. Slovo „statistika“ pochází z latinského slova „status“, což znamená „stav, stav věcí“. Nejjednodušší statistické charakteristiky: Aritmetický průměr Medián rozsahu

    O definici každé z charakteristik na příkladu řady čísel: 47,46,52,47,52,47,52,49,45,43,53,53,47,52. Aritmetický průměr této řady čísel bude číslo 48,7. (47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7. Medián této řady čísel bude číslo 48. být čísla 47 a 52. 47, 46, 52, 47, 52, 47, 52, 49,45,43,53,53, 47, 52. Rozsah této řady čísel bude 10. 47,46,52,47,52,47 ,52, 49,45, 43, 53 ,53,47,52 53-43=10

    Problémy s prospěchem v 7. třídě "B".

    Varianta 2 3 4 5 Násobnost bez variant 14 9 1 Četnost % 0 % 58,3 % 37,5 % 4,2 % Ruský jazyk. Seřaďme vzorová data (značky): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4 ,4 ,4,5. Průměrné skóre v předmětu: 14∙3+9∙4+5∙124=8324≈3,5 (aritmetický průměr). Největší počet studentů v předmětu má "3" (režim) Přibližně polovina studentů v ruském jazyce studuje na 3 (medián)

    Pro vizuální znázornění dat získaných jako výsledek statistické studie se široce používají různé metody jejich znázornění.

    Srovnávací charakteristika pokroku žáků v předmětech 1. čtvrtletí

    Srovnávací charakteristika pokroku žáků v předmětech 2. čtvrtletí

    Histogram rozložení průměrného skóre u subjektů I. a II. čtvrtletí

    Diagram srovnání všech položek z hlediska kvality za I. a II. čtvrtletí

    Dotazování žáků 7. ročníku "B" na rodičovskou kontrolu nad vzděláváním dětí DOTAZNÍK 1. Kontrolují vaši rodiče vaše domácí úkoly? ____________________________________________________________ 2. Kolikrát týdně? _______________________________________________________________ 3. Kolikrát týdně se vaši rodiče dívají do vašeho deníku? ________________________________________________________________ 4. Kolik času průměrně denně trávíte domácími úkoly? _________________________________________________________________

    Kontrola domácích úkolů od rodičů

    Počet kontrol za týden pro domácí úkoly Medián = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7 , 7 = (3+3):2 = 3 Aritmetický průměr = 3

    Histogram času stráveného studenty nad domácími úkoly