Prvky štatistického spracovania údajov. Štatistické spracovanie údajov a jeho vlastnosti Údaje pre štatistické spracovanie údajov

Laboratórne práce №3. Štatistické spracovanie údajov v systéme MatLab

Všeobecné vyjadrenie problému

Hlavný účel implementácie laboratórne práce je oboznámenie sa so základmi práce so štatistickým spracovaním údajov v prostredí MatLAB.

Teoretická časť

Primárne štatistické spracovanie údajov

Štatistické spracovanie údajov je založené na primárnych a sekundárnych kvantitatívnych metódach. Účelom primárneho spracovania štatistických údajov je štruktúrovať prijímané informácie, čo znamená zoskupovať údaje do kontingenčné tabuľky podľa rôznych parametrov. Nespracované údaje by mali byť prezentované v takom formáte, aby osoba mohla urobiť približné posúdenie prijatého súboru údajov a odhaliť informácie o rozložení údajov v prijatej vzorke údajov, napríklad o homogenite alebo kompaktnosti údajov. Po primárnej analýze údajov sa aplikujú metódy sekundárneho štatistického spracovania údajov, na základe ktorých sa určia štatistické vzorce v existujúcom súbore údajov.

Vykonanie primárnej štatistickej analýzy dátového poľa vám umožňuje získať znalosti o nasledujúcich veciach:

Aká je najtypickejšia hodnota pre vzorku? Za odpoveď na táto otázka sú určené miery centrálnej tendencie.

Existuje veľký rozptyl údajov vo vzťahu k tejto charakteristickej hodnote, t. j. aká je „rozmazanosť“ údajov? AT tento prípad určujú sa miery variability.

Za zmienku stojí skutočnosť, že štatistické ukazovatele miery centrálnej tendencie a variability sú určené len na kvantitatívnych údajoch.

Miery centrálnej tendencie- skupina hodnôt, okolo ktorých sú zoskupené ostatné údaje. Miery centrálnej tendencie teda zovšeobecňujú pole údajov, čo umožňuje vytvárať závery o vzorke ako celku a vykonávať porovnávaciu analýzu rôznych vzoriek navzájom.

Predpokladajme, že existuje vzorka údajov , potom sa miery centrálnej tendencie odhadujú pomocou nasledujúcich ukazovateľov:

1. vzorový priemer je výsledkom vydelenia súčtu všetkých hodnôt vzorky ich počtom. Určuje sa podľa vzorca (3.1).

(3.1)

kde - i-ty prvok vzorky;

n je počet prvkov vzorky.

Priemer vzorky poskytuje najväčšiu presnosť v procese odhadovania centrálneho trendu.

Povedzme, že máme vzorku 20 ľudí. Vzorovými prvkami sú informácie o priemernom mesačnom príjme každého človeka. Predpokladajme, že 19 ľudí má priemerný mesačný príjem 20 tisíc. a 1 osoba s príjmom 300 tr. Celkový mesačný príjem celej vzorky je 680 tr. Priemer vzorky je v tomto prípade S=34.


2. Medián- generuje hodnotu, nad a pod ktorou je počet rôznych hodnôt rovnaký, t. j. toto je centrálna hodnota v sekvenčnom rade údajov. Určuje sa v závislosti od párnosti / nepárnosti počtu prvkov vo vzorke pomocou vzorcov (3.2) alebo (3.3) Algoritmus na odhad mediánu pre vzorku údajov:

V prvom rade sú údaje zoradené (zoradené) vo vzostupnom/zostupnom poradí.

Ak má objednaná vzorka nepárny počet prvkov, potom je medián rovnaký ako stredová hodnota.

(3.2)

kde n

V prípade párneho počtu prvkov je medián definovaný ako aritmetický priemer dvoch centrálnych hodnôt.

(3.3)

kde je priemerný prvok usporiadanej vzorky;

- prvok usporiadaného výberu po ;

Počet prvkov vzorky.

V prípade, že sú všetky prvky vzorky odlišné, potom je presne polovica prvkov vzorky väčšia ako medián a druhá polovica je menšia. Napríklad pre vzorku (1, 5, 9, 15, 16) je medián rovnaký ako pri prvku 9.

Pri štatistickej analýze údajov vám medián umožňuje identifikovať prvky vzorky, ktoré silne ovplyvňujú hodnotu priemeru vzorky.

Povedzme, že máme vzorku 20 ľudí. Vzorovými prvkami sú informácie o priemernom mesačnom príjme každého človeka. Predpokladajme, že 19 ľudí má priemerný mesačný príjem 20 tisíc. a 1 osoba s príjmom 300 tr. Celkový mesačný príjem celej vzorky je 680 tr. Medián po zoradení vzorky je definovaný ako aritmetický priemer desiateho a jedenásteho prvku vzorky) a rovná sa Me = 20 tr. Tento výsledok sa interpretuje nasledovne: medián rozdeľuje vzorku do dvoch skupín, takže môžeme dospieť k záveru, že v prvej skupine má každá osoba priemerný mesačný príjem nie viac ako 20 000 rubľov a v druhej skupine nie menej ako 20 tisíc rubľov. R. V tomto príklade môžeme povedať, že medián je charakterizovaný tým, koľko zarába „priemerný“ človek. Pričom hodnota výberového priemeru je výrazne vyššia ako S=34, čo poukazuje na neprijateľnosť tejto charakteristiky pri hodnotení priemerného zárobku.

Čím väčší je teda rozdiel medzi mediánom a priemerom vzorky, tým väčší je rozptyl údajov vzorky (v uvažovanom príklade je osoba so zárobkom 300 tr. zreteľne odlišná od priemerných ľudí v konkrétnej vzorke a má významný vplyv na odhad priemerného príjmu). Čo robiť s takýmito prvkami, sa rozhoduje v každom jednotlivom prípade. Vo všeobecnosti sa však na zabezpečenie spoľahlivosti vzorky stiahnu, pretože majú silný vplyv na hodnotenie štatistických ukazovateľov.

3. Móda (Po)- generuje hodnotu, ktorá sa vo vzorke vyskytuje najčastejšie, t.j. hodnotu s najvyššou frekvenciou Algoritmus odhadu režimu:

V prípade, že vzorka obsahuje prvky, ktoré sa vyskytujú rovnako často, potom hovoríme, že v takejto vzorke neexistuje mód.

Ak dve susedný prvok vzorky majú rovnakú frekvenciu, ktorá je väčšia ako frekvencia zostávajúcich prvkov vzorky, potom sa režim určí ako priemer týchto dvoch hodnôt.

Ak dva prvky vzorky majú rovnakú frekvenciu, ktorá je väčšia ako frekvencia zostávajúcich prvkov vzorky a tieto prvky nie sú susediace, potom hovoríme, že v tejto vzorke sú dva módy.

Režim v štatistickej analýze sa používa v situáciách, keď je potrebné rýchlo odhadnúť mieru centrálnej tendencie a nevyžaduje sa vysoká presnosť. Napríklad móda (pokiaľ ide o veľkosť alebo značku) je vhodná na určenie oblečenia a obuvi, ktoré sú medzi kupujúcimi najžiadanejšie.

Miery rozptylu (variability)- skupina štatistických ukazovateľov, ktoré charakterizujú rozdiely medzi jednotlivými hodnotami vzorky. Na základe ukazovateľov rozptylových mier je možné posúdiť stupeň homogenity a kompaktnosti prvkov vzorky. Miery rozptylu charakterizuje nasledujúci súbor ukazovateľov:

1. Prejdite prstom - toto je interval medzi maximálnymi a minimálnymi hodnotami výsledkov pozorovaní (prvky vzorky). Indikátor rozsahu označuje rozloženie hodnôt v súbore údajov. Ak je rozsah veľký, potom sú hodnoty v populácii veľmi rozptýlené, inak (rozsah je malý) sa hovorí, že hodnoty v populácii ležia blízko seba. Rozsah je určený vzorcom (3.4).

(3.4)

Kde - maximálny prvok vzorky;

je minimálny prvok vzorky.

2.Priemerná odchýlka je aritmetický priemer rozdielu (v absolútnej hodnote) medzi každou hodnotou vo vzorke a jej priemerom vzorky. Priemerná odchýlka je určená vzorcom (3.5).

(3.5)

kde - i-ty prvok vzorky;

Hodnota priemeru vzorky vypočítaná podľa vzorca (3.1);

Počet prvkov vzorky.

modul potrebné vzhľadom na skutočnosť, že odchýlky od priemeru pre každý konkrétny prvok môžu byť pozitívne aj negatívne. Ak sa teda modul nezoberie, súčet všetkých odchýlok bude blízky nule a nebude možné posúdiť mieru variability údajov (nahromadenie údajov okolo priemeru vzorky). Pri štatistickej analýze možno namiesto priemernej vzorky použiť modus a medián.

3. Disperzia je miera rozptylu, ktorá popisuje relatívnu odchýlku medzi hodnotami údajov a priemerom. Vypočíta sa ako súčet štvorcových odchýlok každého prvku vzorky od strednej hodnoty. V závislosti od veľkosti vzorky sa odhaduje rozptyl rôzne cesty:

Pre veľké vzorky (n>30) podľa vzorca (3.6)

(3.6)

Pre malé vzorky (č<30) по формуле (3.7)

(3.7)

kde Xi - i-tý prvok vzorky;

S je stredná hodnota vzorky;

Počet prvkov vzorky;

(X i – S) - odchýlka od strednej hodnoty pre každú hodnotu súboru údajov.

4. Smerodajná odchýlka je mierou toho, do akej miery sú dátové body rozptýlené vzhľadom na ich priemer.

Proces kvadratúry jednotlivých odchýlok pri výpočte rozptylu zvyšuje mieru odchýlky získanej hodnoty odchýlky od pôvodných odchýlok, čo následne prináša ďalšie chyby. Aby sa teda odhad rozptylu údajových bodov o ich priemere priblížil k hodnote priemernej odchýlky, z rozptylu sa extrahuje druhá odmocnina. Extrahovaná odmocnina rozptylu charakterizuje mieru variability nazývanú stredná odmocnina alebo štandardná odchýlka (3.8).

(3.8)

Povedzme, že ste projektový manažér vývoja softvéru. Máte pod dohľadom päť programátorov. Riadením procesu realizácie projektu rozdeľujete úlohy medzi programátorov. Pre jednoduchosť príkladu budeme vychádzať zo skutočnosti, že úlohy sú ekvivalentné zložitosťou a časom vykonávania. Rozhodli ste sa analyzovať prácu každého programátora (počet dokončených úloh počas týždňa) za posledných 10 týždňov, v dôsledku čoho ste dostali nasledujúce vzorky:

Názov týždňa

Po vyhodnotení priemerného počtu dokončených úloh ste dostali nasledujúci výsledok:

Názov týždňa S
22,3
22,4
22,2
22,1
22,5

Na základe indikátora S pracujú všetci programátori v priemere rovnako efektívne (asi 22 úloh za týždeň). Ukazovateľ variability (rozsahu) je však veľmi vysoký (od 5 úloh pre štvrtého programátora po 24 úloh pre piateho programátora).

Názov týždňa S P
22,3
22,4
22,2
22,1
22,5

Poďme odhadnúť štandardnú odchýlku, ktorá ukazuje, ako sú hodnoty rozdelené vo vzorkách vzhľadom na priemer, konkrétne v našom prípade odhadnúť, aké veľké je rozpätie dokončenia úlohy z týždňa na týždeň.

Názov týždňa S P SO
22,3 1,56
22,4 1,8
22,2 2,84
22,1 1,3
22,5 5,3

Výsledný odhad smerodajnej odchýlky hovorí nasledovné (vyhodnoťme dva extrémne prípady programátorov 4 a 5):

Každá hodnota vo vzorke 4 programátorov sa v priemere odchyľuje o 1,3 úlohy od priemeru.

Každá hodnota v programátorskej vzorke 5 sa odchyľuje v priemere o 5,3 úlohy od priemeru.

Čím je štandardná odchýlka bližšie k 0, tým je priemer spoľahlivejší, pretože naznačuje, že každá hodnota vo vzorke sa takmer rovná priemeru (22,5 položiek v našom príklade). Preto je 4. programátor najdôslednejší na rozdiel od 5. Týždenná variabilita plnenia úloh u 5. programátora je 5,3 úlohy, čo svedčí o značnom rozptyle. V prípade 5. programátora sa priemeru nedá veriť, a preto je ťažké predpovedať počet dokončených úloh na nasledujúci týždeň, čo následne sťažuje plánovanie a dodržiavanie harmonogramov práce. Aké manažérske rozhodnutie urobíte v tomto kurze nie je dôležité. Je dôležité, aby ste dostali hodnotenie, na základe ktorého možno prijať vhodné manažérske rozhodnutia.

Dá sa teda vyvodiť všeobecný záver, že priemer nie vždy správne odhaduje údaje. Správnosť odhadu priemeru možno posúdiť podľa hodnoty smerodajnej odchýlky.


1. Nástroje na spracovanie štatistických údajov v Exceli

2. Používanie špeciálnych funkcií

3. Pomocou nástroja ANALYSIS PACKAGE

Literatúra:

Hlavná:

1. Burke. Analýza údajov pomocou programu Microsoft Excel. : Za. z angličtiny / Burke, Kenneth, Carey, Patrick. - M .: Vydavateľstvo "William", 2005. - S. 216 - 256.

2. Mishin A.V. Informačné technológie v právnej činnosti: dielňa / A.V. Mishin. – M.: RAP, 2013. – S. 2-11.

dodatočné:

3. Informatika pre právnikov a ekonómov: učebnica pre vysoké školy / Ed. S.V. Šimonovič. - Petrohrad: Peter, 2004. - S. 498-516.

Cvičenie #30

Téma číslo 11.1. Údržba databáz v Access DBMS

Hodina je vedená projektovou metódou.

Cieľ projektu: vytvoriť databázu o práci súdu.

Technická úloha:

1. Vytvorte databázu "Súd" z dvoch tabuliek "Sudcovia" a "Nároky" s nasledujúcou štruktúrou:

Tabuľka "Sudcovia"

Názov poľa Kód rozhodcu CELÉ MENO Prijímacie dni Pracovné hodiny Pracovné skúsenosti
Dátový typ Číselné Text Text Text Číselné
Veľkosť poľa dlhé celé číslo dlhé celé číslo
Formát poľa Základné Základné
Počet desatinných miest
Predvolená hodnota "st" "15:00-17:00"
Hodnotová podmienka >36200 And<36299 Po alebo Ut Alebo St Alebo Št alebo Pia >0 A<40
Chybná správa Platné hodnoty sú Po, Ut, St, Št alebo Pia. Prepíšte! ! Platné hodnoty sú od 1 do 39. Skúste to znova!
Povinné pole Áno Áno nie nie nie
Indexované pole nie nie nie nie

Poznámka. Vyhláste kľúčové pole „Kód sudcu“.

Tabuľka "Nároky"

Názov poľa Číslo prípadu žalobca Odpoveď-chik Kód rozhodcu Dátum stretnutia
Dátový typ Číselné Text Text Číselné Dátum Čas
Vlastnosti poľa: Záložka Všeobecné
Veľkosť poľa dlhé celé číslo dlhé celé číslo Formát úplného dátumu
Formát poľa Základné
Počet desatinných miest
Predvolená hodnota
Hodnotová podmienka >0 A<99999 >36200 And<36299
Chybná správa Nesprávne zadanie – skúste to znova! Platné hodnoty sú od 36201 do 36298. Skúste to znova!
Povinné pole Áno nie nie nie nie
Indexované pole Áno (žiadne zhody nie sú povolené) nie nie Áno (náhoda povolená) nie

2. Do tabuľky Sudcovia zadajte nasledujúce dátové záznamy:

Do tabuľky Nároky zadajte nasledujúce dátové záznamy:

3. Použite pole "Kód sudcu" na vytvorenie vzťahu "jeden k mnohým" medzi tabuľkami sudcovia a súdne spory. Zároveň nastavte "Zabezpečiť integritu údajov" a "kaskádovú aktualizáciu súvisiacich polí".

Literatúra:

Hlavná:

1. Mishin A.V. Informačné technológie v odbornej činnosti: študijný sprievodca / A.V. Mishin, L.E. Mistrov, D.V. Kartavcev. - M.: RAP, 2011. - S. 259-264.

dodatočné:

Cvičenie #31

Téma číslo 11.2. Princípy vytvárania formulárov a dotazov v Access DBMS

1. Vývoj vstupných formulárov pre zadávanie údajov.

2. Metodika vykonávania výpočtov a analýzy zadaných údajov.

Literatúra:

Hlavná:

1. Mishin A.V. Informačné technológie v odbornej činnosti: študijný sprievodca / A.V. Mishin, L.E. Mistrov, D.V. Kartavcev. - M.: RAP, 2011. - S. 265-271.

dodatočné:

2. Informatika a informačné technológie: učebnica pre vysokoškolákov / I.G. Lesnichaya, I.V. Chýba, Yu.D. Romanová, V.I. Šestakov. - 2. vyd. - M.: Eksmo, 2006. - 544 s.

3. Mikheeva E.V. Informačné technológie v odbornej činnosti: učebnica pre študentov stredných odborných škôl / E.V. Micheev. - 2. vyd., vymazané. - M.: Akadémia, 2005. - 384 s.

Odoslanie dobrej práce do databázy znalostí je jednoduché. Použite nižšie uvedený formulár

Študenti, postgraduálni študenti, mladí vedci, ktorí pri štúdiu a práci využívajú vedomostnú základňu, vám budú veľmi vďační.

Hostené na http://www.allbest.ru/

Spracovanie štatistických údajov

Úvod

štatistická odchýlka výberová korelácia

Metódy štatistického spracovania výsledkov experimentu sa nazývajú matematické techniky, vzorce, metódy kvantitatívnych výpočtov, pomocou ktorých možno ukazovatele získané počas experimentu zovšeobecniť, uviesť do systému a odhaliť v nich skryté vzorce. Hovoríme o takých zákonitostiach štatistického charakteru, ktoré existujú medzi premennými skúmanými v experimente.

Niektoré z metód matematickej a štatistickej analýzy umožňujú vypočítať takzvanú elementárnu matematickú štatistiku, ktorá charakterizuje výberové rozdelenie údajov, ako je výberový priemer, výberový rozptyl, modus, medián a mnohé ďalšie. Iné metódy matematickej štatistiky, ako je analýza rozptylu, regresná analýza, umožňujú posúdiť dynamiku zmien v štatistikách jednotlivých vzoriek. Pomocou tretej skupiny metód, povedzme, korelačnej analýzy, faktorovej analýzy, metód na porovnávanie údajov vzorky, je možné spoľahlivo posúdiť štatistické vzťahy, ktoré existujú medzi premennými, ktoré sa skúmajú v tomto experimente.

1. Metódy primárneho štatistického spracovania experimentálnych výsledkov

Všetky metódy matematickej a štatistickej analýzy sú podmienene rozdelené na primárne a sekundárne. Metódy sa nazývajú primárne, pomocou ktorých je možné získať ukazovatele, ktoré priamo odrážajú výsledky meraní vykonaných v experimente. Primárnymi štatistickými ukazovateľmi sa teda rozumejú tie, ktoré sa využívajú v samotných psychodiagnostických metódach a sú výsledkom prvotného štatistického spracovania výsledkov psychodiagnostiky. Sekundárne metódy sa nazývajú štatistické spracovanie, pomocou ktorého sa na základe primárnych údajov odhaľujú štatistické vzorce v nich skryté.

Primárne metódy štatistického spracovania zahŕňajú napríklad stanovenie priemeru vzorky, rozptylu vzorky, režimu vzorky a mediánu vzorky. Sekundárne metódy zvyčajne zahŕňajú korelačnú analýzu, regresnú analýzu, metódy na porovnávanie primárnych štatistík v dvoch alebo viacerých vzorkách.

Zvážte metódy na výpočet elementárnej matematickej štatistiky.

1.1 Móda

Číselná charakteristika vzorky, ktorá spravidla nevyžaduje výpočty, je takzvaný režim. Modus je kvantitatívna hodnota študovaného znaku, ktorý sa najčastejšie nachádza vo vzorke. V prípade symetrického rozdelenia prvkov vrátane normálneho rozdelenia sa hodnota režimu zhoduje s hodnotami priemeru a mediánu. Pre iné typy distribúcie, asymetrické, to nie je typické. Napríklad v sekvencii hodnôt vlastností 1, 2, 5, 2, 4, 2, 6, 7, 2 je hodnota 2 režim, pretože sa vyskytuje častejšie ako iné hodnoty - štyrikrát.

Móda sa nachádza podľa nasledujúcich pravidiel:

1) V prípade, že sa všetky hodnoty vo vzorke vyskytujú rovnako často, má sa za to, že táto vzorková séria nemá žiadny režim. Napríklad: 5, 5, 6, 6, 7, 7 – v tomto výbere nie je žiadny režim.

2) Keď dve susedné (susedné) hodnoty majú rovnakú frekvenciu a ich frekvencia je väčšia ako frekvencia akýchkoľvek iných hodnôt, režim sa vypočíta ako aritmetický priemer týchto dvoch hodnôt. Napríklad vo vzorke 1, 2, 2, 2, 5, 5, 5, 6 sú frekvencie susedných hodnôt 2 a 5 rovnaké a rovnajú sa 3. Táto frekvencia je väčšia ako frekvencia ostatných hodnôt ​1 a 6 (ktoré sa rovná 1). Preto bude režim tohto radu hodnota = 3,5

3) Ak dve nesusediace (nesusediace) hodnoty vo vzorke majú rovnaké frekvencie, ktoré sú väčšie ako frekvencie akejkoľvek inej hodnoty, potom sa rozlišujú dva režimy. Napríklad v sérii 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 sú režimy 11 a 14. V tomto prípade sa o vzorke hovorí, že je bimodálna.

Môžu existovať aj takzvané multimodálne distribúcie s viac ako dvoma vrcholmi (módmi).

4) Ak sa režim odhaduje zo súboru zoskupených údajov, potom na nájdenie režimu je potrebné určiť skupinu s najvyššou frekvenciou funkcie. Táto skupina sa nazýva modálna skupina.

1.2 Medián

Medián je hodnota študovaného atribútu, ktorá delí vzorku zoradenú podľa hodnoty tohto atribútu na polovicu. Napravo a naľavo od mediánu v objednanej sérii zostáva rovnaký počet prvkov. Napríklad pre vzorku 2, 3, 4, 4, 5, 6, 8, 7, 9 bude mediánom hodnota 5, pretože naľavo a napravo od neho zostávajú štyri ukazovatele. Ak séria obsahuje párny počet funkcií, potom medián bude priemer, ktorý sa berie ako polovica súčtu hodnôt dvoch centrálnych hodnôt série. Pre ďalší riadok 0, 1, 1, 2, 3, 4, 5, 5, 6, 7 bude medián 3,5.

Poznanie mediánu je užitočné na zistenie, či je rozdelenie konkrétnych hodnôt študovaného znaku symetrické a blíži sa takzvanému normálnemu rozdeleniu. Priemer a medián normálneho rozdelenia sú zvyčajne rovnaké alebo sa od seba líšia len veľmi málo. Ak je vzorová distribúcia znakov normálna, možno na ňu použiť sekundárne štatistické metódy výpočtu založené na normálnom rozdelení údajov. Inak to nie je možné, pretože do výpočtov sa môžu vkradnúť vážne chyby.

1.3 Priemer vzorky

Priemerná hodnota vzorky (aritmetický priemer) ako štatistický ukazovateľ je priemerným hodnotením psychologickej kvality študovanej v experimente. Toto hodnotenie charakterizuje stupeň jeho vývoja ako celku v skupine subjektov, ktorá bola podrobená psychodiagnostickému vyšetreniu. Pri priamom porovnaní priemerných hodnôt dvoch alebo viacerých vzoriek môžeme posúdiť relatívny stupeň vývoja hodnotenej kvality u ľudí, ktorí tvoria tieto vzorky.

1.4 Disperzia vzorky

Rozptyl (niekedy nazývaný rozsah) vzorky je označený písmenom R. Toto je najjednoduchší ukazovateľ, ktorý možno pre vzorku získať - rozdiel medzi maximálnymi a minimálnymi hodnotami tejto konkrétnej série variácií, t.j.

R = xmax - xmin

Je zrejmé, že čím viac sa meraná vlastnosť líši, tým väčšia je hodnota R a naopak. Môže sa však stať, že dve vzorové série majú rovnaký priemer a rozsah, ale povaha variácie týchto sérií bude odlišná. Napríklad uvedené dve vzorky:

X = 10 15 20 25 30 35 40 45 50X = 30 R = 40

Y=10 28 28 30 30 30 32 32 50 Y=30 R=40

Keď sú priemery a rozpätia rovnaké pre tieto dve série vzoriek, povaha ich variácií je odlišná. Aby bolo možné jasnejšie znázorniť povahu variácií vzorky, mali by sme odkázať na ich distribúcie.

1.5 Rozptyl

Rozptyl je aritmetický priemer druhých mocnín odchýlok hodnôt premennej od jej strednej hodnoty.

Disperzia ako štatistická hodnota charakterizuje, o koľko sa jednotlivé hodnoty odchyľujú od priemernej hodnoty v danej vzorke. Čím väčší rozptyl, tým väčší rozptyl alebo rozptyl v údajoch.

Druhá odmocnina sa získa zo súčtu druhých mocnín vydeleného počtom členov v rade.

Niekedy existuje pomerne veľa počiatočných súkromných primárnych údajov, ktoré sú predmetom štatistického spracovania a vyžadujú si obrovské množstvo základných aritmetických operácií. Aby sa znížil ich počet a zároveň sa zachovala požadovaná presnosť výpočtov, niekedy sa pristupuje k nahradeniu počiatočnej vzorky konkrétnych empirických údajov intervalmi. Interval je skupina hodnôt atribútov zoradených podľa veľkosti, ktorá je v priebehu výpočtov nahradená priemernou hodnotou.

2. Metódy sekundárneho štatistického spracovania experimentálnych výsledkov

Pomocou sekundárnych metód štatistického spracovania experimentálnych dát sa hypotézy súvisiace s experimentom priamo overujú, dokazujú alebo vyvracajú. Tieto metódy sú spravidla zložitejšie ako metódy primárneho štatistického spracovania a vyžadujú si od výskumníka dobrú prípravu v elementárnej matematike a štatistike. (7).

Diskutovanú skupinu metód možno rozdeliť do niekoľkých podskupín:

1. Regresný počet.

2. Metódy na porovnávanie dvoch alebo viacerých základných štatistík (priemery, rozptyly atď.) patriacich do rôznych vzoriek.

3. Metódy na stanovenie štatistických vzťahov medzi premennými, ako je ich vzájomná korelácia.

4. Metódy odhaľovania vnútornej štatistickej štruktúry empirických údajov (napríklad faktorová analýza). Uvažujme každú z vybraných podskupín sekundárnych metód štatistického spracovania na príkladoch.

2.1 Regresný počet

Regresný počet je metóda matematickej štatistiky, ktorá umožňuje zredukovať súkromné, nesúrodé údaje do určitého lineárneho grafu, ktorý približne odráža ich vnútorný vzťah, a vedieť približne odhadnúť pravdepodobnú hodnotu inej premennej hodnotou jednej z premenných. (7).

Grafické vyjadrenie regresnej rovnice sa nazýva regresná priamka. Regresná priamka vyjadruje najlepšie predpovede závislej premennej (Y) oproti nezávislým premenným (X).

Regresia je vyjadrená pomocou dvoch regresných rovníc, ktoré v najpriamejšom prípade vyzerajú ako rovnice priamky.

Y = a 0 + a 1 * X

X = b0 + b1 * Y

V rovnici (1) je Y závislá premenná, X je nezávislá premenná, a 0 je voľný člen, a 1 je regresný koeficient alebo sklon, ktorý určuje sklon regresnej priamky vzhľadom na súradnicové osi.

V rovnici (2) je X závislá premenná, Y je nezávislá premenná, b 0 je voľný člen, b 1 je regresný koeficient alebo sklon, ktorý určuje sklon regresnej priamky vzhľadom na súradnicové osi.

Kvantitatívna reprezentácia vzťahu (závislosti) medzi X a Y (medzi Y a X) sa nazýva regresná analýza. Hlavnou úlohou regresnej analýzy je nájsť koeficienty a 0, b 0, a1 a b 1 a určiť hladinu významnosti získaných analytických výrazov, ktoré súvisia s premennými X a Y.

Ak chcete použiť metódu lineárnej regresnej analýzy, musia byť splnené tieto podmienky:

1. Porovnávané premenné X a Y sa musia merať na intervalovej alebo pomerovej stupnici.

2. Predpokladá sa, že premenné X a Y majú normálne rozdelenie.

3. Počet rôznych znakov v porovnávaných premenných by mal byť rovnaký. (5).

2.2 Korelácia

Ďalšia metóda sekundárneho štatistického spracovania, pomocou ktorej sa zisťuje súvislosť alebo priama závislosť medzi dvoma sériami experimentálnych údajov, sa nazýva metóda korelácií. Ukazuje, ako jeden jav ovplyvňuje druhý alebo s ním súvisí vo svojej dynamike. Závislosti tohto druhu existujú napríklad medzi veličinami, ktoré sú vo vzájomnej príčinnej súvislosti. Ak sa ukáže, že dva javy spolu štatisticky významne korelujú, a ak zároveň existuje istota, že jeden z nich môže pôsobiť ako príčina druhého javu, potom rozhodne z toho vyplýva, že medzi nimi existuje príčinná súvislosť . (7)

Keď je zvýšenie úrovne jednej premennej sprevádzané zvýšením úrovne inej, potom hovoríme o pozitívnej korelácii. Ak k nárastu jednej premennej dôjde pri znížení úrovne druhej, potom hovoríme o negatívnej korelácii. Pri absencii spojenia medzi premennými máme do činenia s nulovou koreláciou. (jeden)

Existuje niekoľko odrôd tejto metódy: lineárna, zoradená, párová a viacnásobná. Lineárna korelačná analýza vám umožňuje vytvoriť priame väzby medzi premennými v ich absolútnych hodnotách. Tieto spojenia sú graficky vyjadrené priamkou, preto názov „lineárne“. Ranková korelácia určuje závislosť nie medzi absolútnymi hodnotami premenných, ale medzi poradovými miestami alebo poradiami, ktoré obsadzujú v sérii usporiadanej podľa veľkosti. Analýza párovej korelácie zahŕňa štúdium korelácií iba medzi pármi premenných a viacnásobnými alebo viacrozmernými medzi mnohými premennými súčasne. Bežnou formou viacrozmernej korelačnej analýzy v aplikovanej štatistike je faktorová analýza. (5)

Koeficient poradovej korelácie v psychologickom a pedagogickom výskume sa používa vtedy, keď znaky, medzi ktorými je vzťah stanovený, sú kvalitatívne odlišné a nemožno ich presne posúdiť pomocou takzvanej intervalovej meracej stupnice. Intervalová stupnica je taká stupnica, ktorá vám umožňuje vyhodnotiť vzdialenosti medzi jej hodnotami a posúdiť, ktorá z nich je väčšia a o koľko väčšia ako druhá. Napríklad pravítko, podľa ktorého sa posudzujú a porovnávajú dĺžky predmetov, je intervalová stupnica, pretože pomocou nej môžeme konštatovať, že vzdialenosť medzi dvoma a šiestimi centimetrami je dvakrát väčšia ako vzdialenosť medzi šiestimi a ôsmimi centimetrami. Ak pomocou nejakého meracieho nástroja môžeme len tvrdiť, že niektoré ukazovatele sú väčšie ako iné, ale nevieme povedať o koľko, potom sa takýto merací nástroj nazýva nie intervalový, ale ordinálny.

Väčšina ukazovateľov, ktoré sa získavajú v psychologickom a pedagogickom výskume, sa týka ordinálnych a nie intervalových škál (napríklad hodnotenia ako „áno“, „nie“, „skôr nie ako áno“ a iné, ktoré možno previesť na body ), preto na ne nie je možné použiť koeficient lineárnej korelácie.

Metóda viacnásobných korelácií, na rozdiel od metódy párových korelácií, umožňuje odhaliť všeobecnú štruktúru korelačných závislostí, ktoré existujú v rámci viacrozmerného experimentálneho materiálu, ktorý zahŕňa viac ako dve premenné, a prezentovať tieto korelačné závislosti ako určitý systém. .

Na uplatnenie parciálneho korelačného koeficientu musia byť splnené tieto podmienky:

1. Porovnávané premenné sa musia merať na intervalovej alebo pomerovej stupnici.

2. Predpokladá sa, že všetky premenné majú zákon normálneho rozdelenia.

3. Počet rôznych znakov v porovnávaných premenných by mal byť rovnaký.

4. Na posúdenie úrovne významnosti Pearsonovho korelačného pomeru je potrebné použiť vzorec (11.9) a tabuľku kritických hodnôt pre Studentov t-test pri k = n - 2. (5)

2.3 Faktorová analýza

Faktorová analýza je štatistická metóda, ktorá sa používa pri spracovaní veľkého množstva experimentálnych údajov. Úlohy faktorovej analýzy sú: zníženie počtu premenných (redukcia údajov) a určenie štruktúry vzťahov medzi premennými, t.j. klasifikácia premenných, preto sa faktorová analýza používa ako metóda redukcie údajov alebo ako metóda štrukturálnej klasifikácie.

Dôležitým rozdielom medzi faktorovou analýzou a všetkými vyššie opísanými metódami je to, že ju nemožno použiť na spracovanie primárnych, alebo, ako sa hovorí, „surových“ experimentálnych údajov, t. získané priamo zo skúšky predmetov. Materiálom pre faktorovú analýzu sú korelácie, alebo skôr Pearsonove korelačné koeficienty, ktoré sú vypočítané medzi premennými (t. j. psychologickými charakteristikami) zahrnutými v prieskume. Inými slovami, korelačné matice alebo, ako sa inak nazývajú, interkorelačné matice, sú podrobené faktorovej analýze. Názvy stĺpcov a riadkov v týchto maticiach sú rovnaké, pretože predstavujú zoznam premenných zahrnutých do analýzy. Z tohto dôvodu sú interkorelačné matice vždy štvorcové, t.j. počet riadkov v nich sa rovná počtu stĺpcov a symetrický, t.j. symetrické miesta vzhľadom na hlavnú uhlopriečku majú rovnaké korelačné koeficienty.

Hlavným konceptom faktorovej analýzy je faktor. Ide o umelý štatistický ukazovateľ, ktorý je výsledkom špeciálnych transformácií tabuľky korelačných koeficientov medzi skúmanými psychologickými charakteristikami, prípadne maticou interkorelácií. Postup extrakcie faktorov z interkorelačnej matice sa nazýva faktorizácia matice. V dôsledku faktorizácie možno z korelačnej matice extrahovať rôzny počet faktorov až do počtu, ktorý sa rovná počtu pôvodných premenných. Faktory identifikované ako výsledok faktorizácie však spravidla nemajú rovnakú hodnotu. (5)

Pomocou zistených faktorov sa vysvetľuje vzájomná závislosť psychologických javov. (7)

V dôsledku faktorovej analýzy sa najčastejšie neurčuje jeden, ale niekoľko faktorov, ktoré vysvetľujú maticu interkorelácií premenných rôznymi spôsobmi. V tomto prípade sú faktory rozdelené na všeobecné, všeobecné a jednotlivé. Nazývajú sa všeobecné faktory, ktorých všetky faktorové zaťaženia sú výrazne odlišné od nuly (nulové zaťaženie naznačuje, že táto premenná nie je nijako spojená s ostatnými a nemá na ne v živote žiadny vplyv). Všeobecné - sú to faktory, v ktorých je časť faktorových zaťažení iná ako nula. Single - to sú faktory, v ktorých sa iba jedno zo zaťažení výrazne líši od nuly. (7)

Faktorová analýza môže byť vhodná, ak sú splnené nasledujúce kritériá.

1. Nie je možné faktorizovať kvalitatívne údaje získané na škále mien, napríklad farba vlasov (čierna / hnedá / červená) atď.

2. Všetky premenné musia byť nezávislé a ich rozdelenie musí byť blízke normálu.

3. Vzťahy medzi premennými by mali byť približne lineárne, alebo aspoň nie jasne krivočiare.

4. V pôvodnej korelačnej matici by malo byť niekoľko korelačných modulov vyšších ako 0,3. V opačnom prípade je dosť ťažké extrahovať akékoľvek faktory z matrice.

5. Vzorka subjektov by mala byť dostatočne veľká. Rady odborníkov sa líšia. Najrigidnejšie hľadisko odporúča nepoužívať faktorovú analýzu, ak je počet subjektov menší ako 100, pretože štandardné chyby korelácie budú v tomto prípade príliš veľké.

Ak sú však faktory dobre definované (napríklad so zaťažením 0,7 namiesto 0,3), experimentátor potrebuje na ich izolovanie menšiu vzorku. Okrem toho, ak je známe, že získané údaje sú vysoko spoľahlivé (napríklad sa používajú platné testy), potom je možné analyzovať údaje na menšom počte subjektov. (5).

2.4 Ipomocou faktorovej analýzy

Faktorová analýza je široko používaná v psychológii v rôznych oblastiach súvisiacich s riešením teoretických aj praktických problémov.

Z teoretického hľadiska je využitie faktorovej analýzy spojené s rozvojom takzvaného faktorovo-analytického prístupu k štúdiu štruktúry osobnosti, temperamentu a schopností. Využitie faktorovej analýzy v týchto oblastiach vychádza zo všeobecne uznávaného predpokladu, že pozorovateľné a priamo merateľné ukazovatele sú len nepriamymi a/alebo konkrétnymi vonkajšími prejavmi všeobecnejších charakteristík. Tieto charakteristiky, na rozdiel od prvej, sú latentné, takzvané latentné premenné, keďže ide o koncepty alebo konštrukcie, ktoré nie sú dostupné na priame meranie. Môžu sa však stanoviť faktorovaním korelácií medzi pozorovanými znakmi a izolovanými faktormi, ktoré (za predpokladu dobrej štruktúry) možno interpretovať ako štatistické vyjadrenie požadovanej latentnej premennej.

Hoci faktory majú čisto matematický charakter, predpokladá sa, že predstavujú latentné premenné (teoreticky postulované konštrukty alebo koncepty), takže názvy faktorov často odrážajú podstatu skúmaného hypotetického konštruktu.

V súčasnosti je faktorová analýza široko používaná v diferenciálnej psychológii a psychodiagnostike. S jeho pomocou môžete vyvíjať testy, stanovovať štruktúru vzťahov medzi jednotlivými psychologickými charakteristikami meranými súborom testov alebo testovacích úloh.

Faktorová analýza sa používa aj na štandardizáciu testovacích metód, ktorá sa vykonáva na reprezentatívnej vzorke subjektov.

Záver

Ak sú údaje získané v experimente kvalitatívneho charakteru, potom správnosť záverov vyvodených na základe ich záverov úplne závisí od intuície, erudície a profesionality výskumníka, ako aj od logiky jeho uvažovania. Ak sú tieto údaje kvantitatívneho typu, potom sa najprv podrobia primárnemu a potom sekundárnemu štatistickému spracovaniu. Primárne štatistické spracovanie spočíva v určení požadovaného počtu elementárnych matematických štatistík. Takéto spracovanie takmer vždy zahŕňa aspoň stanovenie priemeru vzorky. V prípadoch, keď je informatívnym ukazovateľom pre experimentálne overenie navrhnutých hypotéz rozptyl údajov relatívnej strednej hodnoty, vypočíta sa rozptyl alebo štvorcová odchýlka. Odporúča sa vypočítať hodnotu mediánu, ak sa predpokladá použitie sekundárnych štatistických metód spracovania určených pre normálne rozdelenie. Pre tento druh rozdelenia údajov vzorky sa medián, ako aj modus zhodujú alebo sú dostatočne blízko k priemeru. hodnotu. Toto kritérium možno použiť na približné posúdenie povahy distribúcie získaných primárnych údajov.

Sekundárne štatistické spracovanie (porovnanie priemerov, rozptylov, distribúcií údajov, regresná analýza, korelačná analýza, faktorová analýza atď.) sa vykonáva, ak je na vyriešenie problémov alebo preukázanie navrhovaných hypotéz potrebné určiť štatistické vzorce. skryté v primárnych experimentálnych údajoch. Keď sa výskumník pustí do sekundárneho štatistického spracovania, musí sa v prvom rade rozhodnúť, ktorú z rôznych sekundárnych štatistík má použiť na spracovanie primárnych experimentálnych dát. Rozhodnutie sa robí na základe zohľadnenia povahy testovanej hypotézy a povahy primárneho materiálu získaného ako výsledok experimentu. Tu je niekoľko odporúčaní v tejto súvislosti.

Odporúčanie 1. Ak experimentálna hypotéza obsahuje predpoklad, že v dôsledku prebiehajúceho psychologického a pedagogického výskumu sa ukazovatele akejkoľvek kvality zvýšia (alebo znížia), potom sa odporúča použiť Studentov test alebo kritérium p2 na porovnanie pre- a poexperimentálne údaje. Posledné uvedené sa používa, ak sú primárne experimentálne údaje relatívne a sú vyjadrené napríklad v percentách.

Odporúčanie 2. Ak experimentálne testovaná hypotéza obsahuje tvrdenie o kauzálnom vzťahu medzi niektorými premennými, potom je vhodné to overiť odkazom na lineárne alebo poradové korelačné koeficienty. Lineárna korelácia sa používa, keď sa nezávislé a závislé premenné merajú pomocou intervalovej stupnice a zmeny týchto premenných pred experimentom a po ňom sú malé. Ranková korelácia sa používa vtedy, keď postačuje posúdiť zmeny v poradí postupnosti nezávislých a závislých premenných, alebo keď sú ich zmeny dostatočne veľké, alebo keď bol merací nástroj skôr ordinálny ako intervalový.

Odporúčanie 3. Niekedy hypotéza obsahuje predpoklad, že v dôsledku experimentu sa individuálne rozdiely medzi subjektmi zväčšia alebo znížia. Tento predpoklad je dobre testovaný pomocou Fisherovho testu, ktorý umožňuje porovnať odchýlky pred a po experimente. Upozorňujeme, že pomocou kritéria Fisher je možné pracovať iba s absolútnymi hodnotami ukazovateľov, ale nie s ich poradím.

Hostené na Allbest.ru

...

Podobné dokumenty

    Základné techniky a metódy spracovania a analýzy štatistických údajov. Výpočet aritmetických, harmonických a geometrických stredných hodnôt. Distribučné rady, ich hlavné charakteristiky. Metódy vyrovnávania blízko dynamiky. Systém národných účtov.

    semestrálna práca, pridaná 24.10.2014

    Pojem ekonomickej analýzy ako vedy, jej podstata, predmet, všeobecná charakteristika metód a sociálno-ekonomická efektívnosť. Hlavné skupiny ekonometrických metód pre analýzu a spracovanie údajov. Faktorová analýza ekonomických údajov podniku.

    abstrakt, pridaný 03.04.2010

    Vzorový aritmetický priemer, rozptyl, štandardná odchýlka. Zamietnutie podľa kritéria Chauvenet. Pravidlo troch sigma. Odhad významnosti rozdielu medzi strednými hodnotami dvoch vzoriek. Párové, viacnásobné regresné analýzy. Úplná faktorová analýza.

    ročníková práca, pridaná 12.05.2012

    Aplikácia rôznych metód prezentácie a spracovania štatistických údajov. Priestorové štatistické vzorky. Párová regresia a korelácia. Časové rady. Budovanie trendu. Praktické príklady a spôsoby ich riešenia, vzorce a ich význam.

    priebeh prednášok, doplnené 26.02.2009

    Štatistické spracovanie výsledkov meraní; aritmetický priemer, kvadratický, rozptyl. Stanovenie parametrov odberu: zákon troch sigma, histogram, regulačné diagramy, Ishikawov diagram. Použitie kvalitného náradia pri výrobe sedacích súprav.

    ročníková práca, pridaná 17.10.2014

    Priemerná hodnota v štatistike, jej podstata a podmienky aplikácie. Typy a formy priemerov: prítomnosťou znamienkovej váhy, formou výpočtu, pokrytím populácie. Móda, medián. Štatistická štúdia dynamiky zisku a ziskovosti na príklade JSC "Bashmebel".

    kontrolné práce, doplnené 14.06.2008

    Princípy štatistického spracovania údajov, metódy a techniky používané v tomto procese. Metodika a hlavné etapy konštrukcie regulačných diagramov, ich klasifikácia a typy, funkčné vlastnosti, určenie výhod a nevýhod aplikácie.

    semestrálna práca, pridaná 23.08.2014

    Výpočet numerických charakteristík a spracovanie výsledkov výberových pozorovaní. Výpočet a analýza štatistických ukazovateľov v ekonomike. Národné bohatstvo: prvky, hodnotenie; bilancia aktív a pasív; fixné aktíva, ukazovatele pracovného kapitálu.

    ročníková práca, pridaná 25.12.2012

    Opisná štatistika a štatistická inferencia. Metódy výberu, ktoré zabezpečujú reprezentatívnosť vzorky. Vplyv typu vzorky na veľkosť chyby. Úlohy pri aplikácii metódy odberu vzoriek. Distribúcia pozorovacích údajov medzi všeobecnú populáciu.

    test, pridané 27.02.2011

    Zverejnenie pojmu: intervalová stupnica, aritmetický priemer, hladina štatistickej významnosti. Ako interpretovať režim, medián a priemer. Riešenie problémov pomocou kritéria Friedmana, Rosenbauma. Výpočet Spremenovho korelačného koeficientu.

Metódy štatistického spracovania výsledkov experimentu sa nazývajú matematické techniky, vzorce, metódy kvantitatívnych výpočtov, pomocou ktorých možno ukazovatele získané počas experimentu zovšeobecniť, uviesť do systému a odhaliť v nich skryté vzorce.

Hovoríme o takých zákonitostiach štatistického charakteru, ktoré existujú medzi premennými skúmanými v experimente.

Údaje sú hlavné prvky, ktoré sa majú klasifikovať alebo kategorizovať na účely spracovania26.

Niektoré z metód matematickej a štatistickej analýzy umožňujú vypočítať takzvanú elementárnu matematickú štatistiku, ktorá charakterizuje výberové rozdelenie údajov, napr.

vzorový priemer,

Ukážkový rozptyl,

Medián a ďalšie.

Iné metódy matematickej štatistiky umožňujú posúdiť dynamiku zmien v jednotlivých výberových štatistikách, napr.

disperzná analýza,

Regresná analýza.

Pomocou tretej skupiny metód vzorkovania je možné spoľahlivo posúdiť štatistické vzťahy, ktoré existujú medzi premennými, ktoré sa skúmajú v tomto experimente:

Korelačná analýza;

Faktorová analýza;

porovnávacie metódy.

Všetky metódy matematicko-štatistickej analýzy sa konvenčne delia na primárne a sekundárne 27 .

Metódy sa nazývajú primárne, pomocou ktorých je možné získať ukazovatele, ktoré priamo odrážajú výsledky meraní vykonaných v experimente.

Sekundárne metódy sa nazývajú štatistické spracovanie, pomocou ktorého sa na základe primárnych údajov odhaľujú štatistické vzorce v nich skryté.

Primárne metódy štatistického spracovania zahŕňajú napríklad:

Stanovenie priemeru vzorky;

Ukážkový rozptyl;

Selektívna móda;

Ukážkový medián.

Sekundárne metódy zvyčajne zahŕňajú:

Korelačná analýza;

Regresná analýza;

Metódy na porovnávanie primárnych štatistík pre dve alebo viac vzoriek.

Uvažujme o metódach výpočtu elementárnej matematickej štatistiky, počnúc výberovým priemerom.

Aritmetický priemer - je pomer súčtu všetkých hodnôt údajov k počtu výrazov 28 .

Priemerná hodnota ako štatistický ukazovateľ je priemerným hodnotením psychologickej kvality skúmanej v experimente.

Toto hodnotenie charakterizuje stupeň jeho vývoja ako celku v skupine subjektov, ktorá bola podrobená psychodiagnostickému vyšetreniu. Pri priamom porovnaní priemerných hodnôt dvoch alebo viacerých vzoriek môžeme posúdiť relatívny stupeň vývoja hodnotenej kvality u ľudí, ktorí tvoria tieto vzorky.

Priemer vzorky sa určí pomocou tohto vzorca 29:

kde x cf je výberový priemer alebo aritmetický priemer vzorky;

n - počet subjektov vo výberovom súbore alebo súkromných psychodiagnostických ukazovateľoch, na základe ktorých sa vypočítava priemerná hodnota;

x k - súkromné ​​hodnoty ukazovateľov pre jednotlivé subjekty. Existuje n takýchto ukazovateľov, takže index k tejto premennej nadobúda hodnoty od 1 do n;

∑ - akceptovaný v matematike, súčtový znak hodnôt tých premenných, ktoré sú napravo od tohto znaku.

Disperzia je mierou rozptylu údajov o strednej hodnote 30 .

Čím väčší rozptyl, tým väčší rozptyl alebo rozptyl v údajoch. Stanovuje sa preto, aby bolo možné od seba odlíšiť veličiny, ktoré majú rovnaký priemer, ale rozdielny rozptyl.

Disperzia je určená nasledujúcim vzorcom:

kde je rozptyl vzorky alebo jednoducho rozptyl;

Výraz, ktorý znamená, že pre všetky x k od prvého do posledného v tejto vzorke je potrebné vypočítať rozdiely medzi súkromnými a priemernými hodnotami, umocniť tieto rozdiely a sčítať ich;

n je počet subjektov vo vzorke alebo primárnych hodnôt, pre ktoré sa vypočítava rozptyl.

Medián nazýva sa hodnota študovaného znaku, ktorý delí vzorku zoradenú podľa hodnoty tohto znaku na polovicu.

Poznanie mediánu je užitočné na zistenie, či je rozdelenie konkrétnych hodnôt študovaného znaku symetrické a blíži sa takzvanému normálnemu rozdeleniu. Priemer a medián normálneho rozdelenia sú zvyčajne rovnaké alebo sa od seba líšia len veľmi málo.

Ak je vzorová distribúcia znakov normálna, možno na ňu použiť sekundárne štatistické metódy výpočtu založené na normálnom rozdelení údajov. Inak to nie je možné, pretože do výpočtov sa môžu vkradnúť vážne chyby.

Móda ešte jedna elementárna matematická štatistika a charakteristika distribúcie experimentálnych dát. Modus je kvantitatívna hodnota študovaného znaku, ktorý sa najčastejšie nachádza vo vzorke.

V prípade symetrického rozdelenia prvkov vrátane normálneho rozdelenia sa hodnoty režimu zhodujú so strednými a strednými hodnotami. Pre iné typy rozdelenia, asymetrické, to nie je typické.

Metóda sekundárneho štatistického spracovania, prostredníctvom ktorej sa zisťuje vzťah alebo priamy vzťah medzi dvoma sériami experimentálnych údajov, sa nazýva tzv metóda korelačnej analýzy. Ukazuje, ako jeden jav ovplyvňuje druhý alebo s ním súvisí vo svojej dynamike. Závislosti tohto druhu existujú napríklad medzi veličinami, ktoré sú vo vzájomnej príčinnej súvislosti. Ak sa ukáže, že dva javy spolu štatisticky významne korelujú, a ak zároveň existuje istota, že jeden z nich môže pôsobiť ako príčina druhého javu, potom rozhodne z toho vyplýva, že medzi nimi existuje príčinná súvislosť .

Existuje niekoľko odrôd tejto metódy:

Lineárna korelačná analýza vám umožňuje vytvoriť priame väzby medzi premennými v ich absolútnych hodnotách. Tieto spojenia sú graficky vyjadrené priamkou, preto názov „lineárne“.

Koeficient lineárnej korelácie sa určí pomocou tohto vzorca 31:

kde r xy - lineárny korelačný koeficient;

x, y - priemerné vzorové hodnoty porovnávaných hodnôt;

X i ,y i - hodnoty súkromnej vzorky porovnávaných veličín;

P - celkový počet hodnôt v porovnávanej sérii ukazovateľov;

Disperzie, odchýlky porovnávaných hodnôt od priemerných hodnôt.

Ranková korelácia určuje závislosť nie medzi absolútnymi hodnotami premenných, ale medzi poradovými miestami alebo poradiami, ktoré obsadzujú v sérii usporiadanej podľa veľkosti. Vzorec pre koeficient poradovej korelácie je 32:

kde R s - koeficient poradovej korelácie podľa Spearmana;

d i - rozdiel medzi radmi ukazovateľov tých istých subjektov v usporiadaných riadkoch;

P - počet subjektov alebo digitálnych údajov (poradí) v korelovanom rade.

Atyusheva Anna

V práci sa na príklade spracovania údajov o postupoch žiakov 7. ročníka zvažujú hlavné štatistické charakteristiky, vykonáva sa zber a zoskupovanie štatistických údajov, prehľadne sú prezentované štatistické informácie a analýza údajov. sa uskutoční.

Práca obsahuje sprievodnú prezentáciu.

Stiahnuť ▼:

Náhľad:

Mestská autonómna vzdelávacia inštitúcia "Gymnázium č. 24"

XXII vedecká konferencia MAGNI

Štatistické spracovanie údajov

MAOU "Gymnázium č. 24" Atyusheva Anna

Konzultant: učiteľ matematiky

Shchetinina Natalya Sergeevna

Magadan, 2016

Úvod……………………………………………………………………………………………………………………… 3

  1. Základné pojmy používané pri štatistickom spracovaní údajov……………………….5
  2. Výskumná časť……………………………………………………………….................................. . ......7

2.1 Štatistické spracovanie údajov o prospechu žiakov v 7. ročníku „B“………………… ..7

18

2.3. Porovnávacia charakteristika vzdelávacích aktivít žiakov na základe výsledkov I. a II. štvrťroka……………………………………………………………………………………………… …………..21

2.4. Analýza prieskumu žiakov 7. ročníka „B“ na rodičovskú kontrolu nad napredovaním detí………………………………………………………………………………………… ……23

Záver………………………………………………………………………………………………………………...27

Literatúra……………………………………………………………………………………………………… 28

Úvod

Každý z nás, kto otvorí knihu alebo noviny, zapne televízor alebo sa dostane na stanicu, neustále čelí tabuľkovej forme prezentácie informácií. Ide o rozvrh hodín, rozvrh vlakov, násobilku a mnohé ďalšie. Všetky informácie sú prezentované vo forme tabuliek alebo grafov.

Takéto informácie musíte vedieť spracovať a analyzovať. Bez spracovania údajov, porovnávania udalostí nie je možné sledovať vývoj konkrétneho problému.

V rámci algebry sme študovali štatistické charakteristiky, ktoré sú široko používané v rôznych štúdiách. Zaujala ma praktická aplikácia študovaných charakteristík a schopnosť spracovať dáta tak, aby prezentované informácie jednoznačne určovali priebeh vývoja konkrétneho problému a v dôsledku toho aj výsledok jeho riešenia. Ako taký problém som sa rozhodol považovať výkon mojej triedy za štvrťroky prvého polroka.

Oblasť predmetu štúdia– algebra

Predmet štúdia– štatistické charakteristiky

Predmet štúdia- postup žiakov 7. ročníka "B" za štvrťroky 1. polroka

hypotéza: Veríme, že na príklade spracovania údajov o progrese žiakov ročníka 7B sa nielen zoznámime s hlavnými štatistickými charakteristikami, ale sa aj naučíme:

  • zbierať a zoskupovať štatistické údaje;
  • vizualizovať štatistické informácie;
  • analyzovať prijaté údaje.

Cieľ: naučiť sa spracovávať, analyzovať a vizualizovať dostupné informácie.

Úlohy:

  • študovať štatistické charakteristiky;
  • zbierať informácie o pokroku žiakov v 7. ročníku v štvrťrokoch

prvý polrok;

  • spracovávať informácie;
  • vizualizovať informácie pomocou histogramov;
  • analyzovať získané údaje a vyvodiť príslušné závery.

Základné pojmy používané pri štatistickom spracovaní údajov

Štatistika je veda, ktorá sa zaoberá získavaním, spracovaním a analýzou kvantitatívnych údajov o rôznych masových javoch vyskytujúcich sa v prírode a spoločnosti. Slovo „štatistika“ pochádza z latinského slova „status“, čo znamená „stav, stav vecí“.

Najjednoduchšie štatistické charakteristiky sú aritmetický priemer, medián, rozsah, modus.

  • aritmetický priemerrad čísel sa nazýva podiel delenia súčtu týchto čísel počtom členov. Zvyčajne sa aritmetický priemer zistí, keď chcú určiť priemernú hodnotu pre určitú sériu údajov: priemernú úrodu pšenice na 1 hektár oblasti, priemerný výkon jednej brigády pracovníka na zmenu, priemernú známku vysvedčenia, priemerná teplota vzduchu napoludnie v tomto desaťročí atď.
  • Medián usporiadaného radu čísel s nepárnym počtom členov sa nazýva číslo napísané v strede a medián usporiadaného radu čísel s párnym počtom členov sa nazýva aritmetický priemer dvoch čísel zapísaných v strede. Všimnite si, že je pohodlnejšie a rýchlejšie pracovať s číselným radom, ak je objednaný, t.j. taký rad, v ktorom každé nasledujúce číslo nie je menšie (alebo nie väčšie) ako predchádzajúce.
  • Móda Rad čísel sa nazýva číslo, ktoré sa v danom rade vyskytuje najčastejšie. Sada čísel môže mať viac ako jeden režim alebo žiadny režim. Režim série údajov sa zvyčajne nachádza, keď chceme odhaliť nejaký typický indikátor. Upozorňujeme, že aritmetický priemer radu čísel sa nemusí zhodovať so žiadnym z týchto čísel a režim, ak existuje, sa nevyhnutne zhoduje s dvoma alebo viacerými číslami radu. Okrem toho, na rozdiel od aritmetického priemeru, pojem „režim“ sa nevzťahuje len na číselné údaje.
  • vo veľkom rad čísel sa nazýva rozdiel medzi najväčším a najmenším z týchto čísel. Rozsah série sa zistí, keď chcú určiť, aké veľké je rozšírenie údajov v sérii.

Definíciu každej z charakteristík si ukážeme na príklade radu čísel: 47,46,52,47,52,47,52,49,45,43,53,53,47,52.

aritmetický priemer 48,7.

Zistíme to takto: určíme súčet čísel a vydelíme ich počtom.

(47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7.

Medián daný rad čísel bude číslom 48.

Je to takto: usporiadame sériu čísel a vyberieme to, ktoré je v strede. Ak je počet párnych čísel, potom nájdeme aritmetický priemer dvoch čísel v strede radu.

43,45,46,47,47,47, 47,49 ,52,52,52,52,53,53

(47+49):2=48

Móda daný rad čísel bude číslami 47 a 52 . Tieto čísla sa najčastejšie opakujú.

47 ,46, 52 , 47 , 52 , 47 , 52 ,49,45,43,53,53, 47 , 52 .

vo veľkom táto séria čísel bude 10.

Nájdeme to takto: vyberieme najväčšie a najmenšie číslo série a nájdeme rozdiel medzi týmito číslami.

47,46,52,47,52,47,52,49,45, 43, 53 ,53,47,52

53-43=10

Výskumná časť

Štatistické spracovanie údajov o prospechu žiakov 7. ročníka "B"

Prejdime k spracovaniu informácií. Pre každý z predmetov urobíme tabuľky pozostávajúce z troch riadkov, prvý bude obsahovať sériu údajov. Každý variant z tejto série bol vo vzorke skutočne pozorovaný určitý počet krát. Toto číslo sa nazýva množstvo možností. Do druhého riadku teda vložíme násobnosť zodpovedajúcej možnosti. Získame vzorovú distribučnú tabuľku.

Ak spočítame všetky násobnosti, dostaneme počet všetkých meraní vykonaných počas vzorky – veľkosť vzorky (v našom prípade je toto číslo 24, čo zodpovedá počtu žiakov v triede).

V treťom riadku sa pomer vyjadrený v percentách nazýva frekvencia opcií.

možnosti frekvencie =

Vo všeobecnosti, ak sa na základe výsledkov štúdie zostaví tabuľka relatívnych frekvencií, potom je súčet relatívnych frekvencií 100 %.

Ja štvrť

Ruský jazyk.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4 ,4 ,4,5.

Priemer predmetu:(priemer).

Tabuľka prideľovania frekvencií

Možnosť

Možnosti násobnosti

nie

% frekvencia

58.3%

37.5%

4.2%

Literatúra.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5 ,5 ,5,5.

Priemer predmetu:(priemer).

Možnosti hodnotenia

mnohosť

nie

% frekvencia

37.5%

41.7%

20.8%

Algebra.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4 ,4 ,5,5.

Priemer predmetu:(priemer).

Najväčší počet študentov v predmete má "4, 3" (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

45.8%

45.8%

8.3%

Príbeh.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4 ,4 ,4,5

Priemer predmetu:(priemer).

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

45.8%

4.2%

Spoločenské vedy.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5 ,5 .5.5

Priemer predmetu:(priemer).

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

37.5%

41.7%

20.8%

Geografia.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5 ,5.5 ,5

Priemer predmetu:(priemer).

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

20.8%

41.7%

37.5%

fyzika.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,4,5

Priemer predmetu:(priemer).

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

37.5%

58.3%

4.2%

Biológia.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4.4,5,5,5,5,5 ,5 ,5

Priemer predmetu:(priemer).

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

45.8%

29.2%

ZÁKLADY BEZPEČNOSTI ŽIVOTA.

Zoraďme vzorové údaje (značky): 4,4,4,4,4,4.4.5,5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 ,5

Priemer predmetu:(priemer).

Možnosti hodnotenia

mnohosť

nie

nie

% frekvencia

29.2%

70.8%

Zoraďme vzorové údaje (značky): 3,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5

Priemer predmetu:(priemer).

Najväčší počet študentov v predmete má „5“ (móda)

Približne polovica študentov ruštiny študuje v 5 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

4.2%

37.5%

58.3%

Anglický jazyk.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5 ,5 ,5

Priemer predmetu:(priemer).

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

37.5%

41.7%

20.8%

informatika.

Zoraďme vzorové údaje (značky): 3,4,4,4,4.4,4,4,4,4,4,4,4,4,5,5,5,5.5.5,5,5,5 ,5

Priemer predmetu:(priemer).

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

4.2%

54.2%

41.7%

technológie.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,55,5,5,5,5 ,5

Priemer predmetu:(priemer).

Najväčší počet študentov v predmete má „5“ (móda)

Približne polovica študentov v ruštine študuje na úrovni 4,5 (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

20.8%

54.2%

Teraz zozbierajme podobné informácie o výsledkoch druhého štvrťroka.

Ruský jazyk.

Zoraďme vzorové údaje (značky): 3,3,3.3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,4

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

nie

% frekvencia

41.7%

58.3%

Literatúra.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,5,5,5 ,5 .5.5

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „3“ (móda)

Približne polovica študentov ruštiny študuje v 3 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

41.7%

33.3%

Algebra.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4 ,5 .5.5

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „3“ (móda)

Približne polovica študentov ruštiny študuje v 3 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

37.5%

12.5%

Príbeh.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,3,3,3,4.4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,5

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

37.5%

58.3%

4.2%

Spoločnosť.

Zoraďme vzorové údaje (značky): 3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4 ,5 .5.5

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

16.7%

70.8%

12.5%

Geografia.

Zoraďme vzorové údaje (značky): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5 .5.5

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

12.5%

58.3%

29.2%

fyzika.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,44,5 ,5 ,5

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

33.3%

16.7%

12.5%

Biológia.

Zoraďme vzorové údaje (značky): 3,3,3,4,4,4,4,4,4,4.4,4,4,4,4,4,4,4,5,5,5,5 ,5 ,5

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

12.5%

62.5%

ZÁKLADY BEZPEČNOSTI ŽIVOTA.

Zoraďme vzorové údaje (značky): 3,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 ,5

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „5“ (móda)

Približne polovica študentov ruštiny študuje v 5 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

4.2%

8.3%

87.5%

História a spoločnosť rodnej krajiny.

Zoraďme vzorové údaje (značky): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5 ,5 .5.5

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

12.5%

45.8%

41.7%

Anglický jazyk.

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

20.8%

29.2%

informatika.

Zoraďme vzorové údaje (značky): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5 .5.5

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „4“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

20.8%

29.2%

technológie.

Zoraďme vzorové údaje (značky): 3,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 .5.5

Priemer predmetu:(priemer)

Najväčší počet študentov v predmete má „5“ (móda)

Približne polovica študentov ruštiny študuje na 4 rokoch (medián)

Možnosti hodnotenia

mnohosť

nie

% frekvencia

4.2%

29.2%

66.7%

Vizualizujte údaje pomocou histogramov

Pre vizuálnu reprezentáciu údajov získaných ako výsledok štatistickej štúdie sa široko používajú rôzne metódy ich znázornenia.

Na vizualizáciu údajov použijeme histogramy. Histogram je stupňovitý útvar tvorený uzavretými obdĺžnikmi. Základňa každého obdĺžnika sa rovná dĺžke intervalu a výška je násobkom variantu alebo relatívnou frekvenciou. V histograme teda na rozdiel od bežného stĺpcového grafu nie sú základne obdĺžnika zvolené svojvoľne, ale sú striktne určené dĺžkou intervalu.

Porovnávacia charakteristika výkonov žiakov v predmetoch prvého štvrťroka

Porovnávacia charakteristika výkonov žiakov v predmetoch 2. štvrťroka

zistenia

Podľa výsledkov prvého štvrťroka je jasne vidieť, že najťažší žiaci zvládajú predmety ako: ruský jazyk a algebra, teda predmety, pre ktoré je „trojkou“ hodnotenie, ktoré je prioritné vo vzťahu k ostatným známkam. To znamená, že kvalita v týchto predmetoch je nižšia ako v iných.

Je tiež zrejmé, že vysoká úroveň sa strojnásobí v predmetoch ako literatúra, história, spoločnosť, fyzika, angličtina. Smutná je aj prítomnosť trojičiek v predmetoch ako technika, biológia, geografia.

Podľa výsledkov druhého štvrťroka výrazne klesol počet trojok a pätákov, teda žiaci si rozložili sily vo všetkých predmetoch, nie v samostatne preferovaných.

Histogram rozdelenia priemerného skóre u subjektov prvého štvrťroka

Histogram rozdelenia priemerného skóre u subjektov druhého štvrťroka

Záver

Na vytvorenie týchto grafov sme použili takú štatistickú charakteristiku, ako je aritmetický priemer. Je jasne vidieť, že v druhom štvrťroku sa zhoršili znalosti ruského jazyka, histórie a spoločnosti rodnej krajiny a informatiky. Zdokonalil sa v histórii, spoločnosti, fyzike, biológii, bezpečnosti života, angl. Diagramy však zároveň ukazujú, že výraznejšie zmeny k lepšiemu nastali len vo fyzike a anglickom jazyku.

Porovnávacia charakteristika výchovno-vzdelávacej činnosti žiakov na základe výsledkov I. a II. štvrťroka

Histogram kvality vedomostí v predmetoch prvého štvrťroka

Histogram kvality vedomostí v predmetoch druhého štvrťroka

Spojením oboch histogramov do jedného je oveľa jednoduchšie vidieť obraz o výkonnosti triedy v porovnaní. A oddelene je ľahšie vidieť, ktoré položky sú kvalitnejšie. Napríklad v prvom štvrťroku je kvalita menej ako 60% v predmetoch - algebra, ruština, dejepis, v druhom - ruština, literatúra, algebra, fyzika. Už teraz je jasné, že pre študentov je najťažší ruský jazyk a algebra. A percento kvality vo všetkých predmetoch sa veľmi nelíši 66% - prvý štvrťrok, 68% - druhý. To znamená, že kŕčovitá kvalita predmetov, ktorá je jasne viditeľná v porovnávacom diagrame, naznačuje, že študenti sa skutočne nesnažia zlepšiť svoje vedomosti a nezastávajú svoje pozície v tej či onej oblasti predmetu.

Graf porovnávajúci všetky položky podľa kvality za 1. a 2. štvrťrok

V druhom štvrťroku výrazne vzrástol počet dobrých študentov a výborných študentov v ruskom jazyku, spoločnosti, biológii, angličtine a technike. Mierne sa znížil počet literatúry, algebry, bezpečnosti života, IORK a informatiky. A je vidieť silný pokles kvality fyziky, s čím súvisí aj nepripravenosť študentov na hodiny.

A opäť prichádzame k záveru, že deti sa učia „skoky“ a neexistujú žiadne špeciálne preferencie v smere vzdelávania (humanitné predmety, fyzikálne a matematické predmety, predmety prírodného cyklu).

Analýza prieskumu žiakov 7. ročníka „B“ na rodičovskú kontrolu napredovania detí

Na základe výsledkov vyššie uvedenej štúdie sme sa rozhodli uskutočniť prieskum medzi žiakmi 7. ročníka „B“ na rodičovskú kontrolu nad vzdelávaním detí (dotazníky, pozri prílohu)

Veľkosť vzorky je 22 osôb.

Kontrola domácich úloh rodičmi

Záver

Takmer štvrtina študentov o tejto otázke bez rodičovskej kontroly, čo samozrejme ovplyvňuje ich študijné výsledky.

Počet kontrol za týždeň za domácu úlohu

Medián = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7,7 = (3+3 ):2 = 3

Aritmetický priemer = 3

Záver

V priemere sa úlohy kontrolujú trikrát týždenne. Vzhľadom na skoky v učení to nestačí.

Medián = 0,0,0,0,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,5,5,6,7, 7,7 = (2+2):2 = 2

Aritmetický priemer = 3 (denníky v priemere kontrolujú rodičia 3-krát týždenne)

Množstvo času, ktorý študenti trávia písaním domácich úloh

možnosti

Menej ako 1

% frekvencia

  • Rozsah R=x(max) - x(min)= 3,5 - 0,5 = 3 hodiny

(charakterizuje veľkosť rozptylu pozorovaných hodnôt, t.j. zobrazuje rozdiel medzi najdlhším a najkratším časom)

  • Režim M(0) = 2,5 hodiny ( ukazuje hodnotu, ktorá sa vyskytuje častejšie ako ostatné, t.j. zobrazuje čas, ktorý študenti trávia najčastejšie)

Histogram času stráveného žiakmi pri domácich úlohách

Záver

Domáce úlohy zaberú v priemere 2,5 hodiny denne. Čo sa považuje za normálne vzhľadom na vek študentov.

Záver

Vďaka vykonanej práci som sa naučil spracovávať a analyzovať dostupné informácie

Znalosť štatistických charakteristík mi pomohla určiť priemerné skóre v rôznych predmetoch, ako aj módu a rozsah v tých výkonnostných ukazovateľoch, kde by sa zdalo nemožné ich určiť. Bez spracovania údajov, porovnávania udalostí nie je možné sledovať vývoj konkrétneho problému. Snažili sme sa nielen vystopovať vzniknutý problém – pokles kvality vedomostí a študijných výsledkov v predmetoch, ale pokúsiť sa zistiť aj príčinu, ktorá podľa nás spočívala v nedostatočnej kontrole rodičov nad akademický výkon svojich detí. Prieskum a výsledky študijného výkonu ukázali, že žiaci 7. „B“ ročníka nemajú dostatok zručností v sebakontrole nad učením a rodičia si myslia opak.

Myslím si, že vykonaná práca bude užitočná ako pre triedneho učiteľa pri práci s rodičmi, tak aj pre mojich spolužiakov na zlepšenie výsledkov v jednotlivých predmetoch v budúcnosti.

Štatistika je veda, ktorá študuje, spracováva a analyzuje kvantitatívne údaje o širokej škále hromadných javov v živote. Jeho charakteristiku sme si pre seba prezradili len trochu a pred nami je ešte veľa neznámeho a zaujímavého.

Bibliografia:

  1. http://www.nado5.ru/e-book/naibolshii-obzchii-delitel
    Náhľad:

    Ak chcete použiť ukážku prezentácií, vytvorte si Google účet (účet) a prihláste sa: https://accounts.google.com


    Popisy snímok:

    Spracovanie štatistických údajov Vypracovala: žiačka 7. ročníka "B" MAOU "Gymnázium č. 24" Atyusheva Anna Konzultantka: učiteľka matematiky Shchetinina Natalya Sergeevna

    Účel: naučiť sa spracovávať, analyzovať a vizualizovať dostupné informácie. Úlohy: študovať štatistické charakteristiky; zbierať informácie o postupoch žiakov 7. ročníka B za štvrťroky prvého polroka; spracovávať informácie; vizualizovať informácie pomocou histogramov; analyzovať získané údaje a vyvodiť príslušné závery.

    Hypotézou na príklade spracovania údajov o výkone žiakov sa môžeme nielen oboznámiť s hlavnými štatistickými charakteristikami, ale sa aj naučiť zbierať a zoskupovať štatistické údaje; vizualizovať štatistické informácie; analyzovať prijaté údaje.

    Štatistika je veda, ktorá sa zaoberá získavaním, spracovaním a analýzou kvantitatívnych údajov o rôznych masových javoch vyskytujúcich sa v prírode a spoločnosti. Slovo „štatistika“ pochádza z latinského slova „status“, čo znamená „stav, stav vecí“. Najjednoduchšie štatistické charakteristiky: Aritmetický priemer Medián rozsahu

    O definícii každej z charakteristík na príklade radu čísel: 47,46,52,47,52,47,52,49,45,43,53,53,47,52. Aritmetický priemer tohto radu čísel bude číslo 48,7. (47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7. Mediánom tohto radu čísel bude číslo 48, teda čísla 47 a 52. 47, 46, 52, 47, 52, 47, 52, 49,45,43,53,53, 47, 52. Rozsah tohto číselného radu bude 10. 47,46,52,47,52,47 ,52, 49,45, 43, 53 ,53,47,52 53-43=10

    Problémy so školským prospechom v 7. triede "B".

    Variant 2 3 4 5 Násobnosť bez variantov 14 9 1 Frekvencia % 0 % 58,3 % 37,5 % 4,2 % Ruský jazyk. Zoraďme vzorové údaje (značky): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4 ,4 ,4,5. Priemerné skóre v predmete: 14∙3+9∙4+5∙124=8324≈3,5 (aritmetický priemer). Najväčší počet študentov v predmete má "3" (režim) Približne polovica študentov v ruskom jazyku študuje na 3 (medián)

    Pre vizuálnu reprezentáciu údajov získaných ako výsledok štatistickej štúdie sa široko používajú rôzne metódy ich znázornenia.

    Porovnávacia charakteristika pokroku žiakov v predmetoch prvého štvrťroka

    Porovnávacia charakteristika pokroku žiakov v predmetoch 2. štvrťroka

    Histogram rozdelenia priemerného skóre u subjektov I. a II. štvrťroka

    Diagram porovnania všetkých položiek z hľadiska kvality za I. a II. štvrťrok

    Dotazovanie žiakov 7. ročníka „B“ na rodičovskú kontrolu nad vzdelávaním detí DOTAZNÍK 1. Kontrolujú vaši rodičia vaše domáce úlohy? ____________________________________________________________ 2. Koľkokrát týždenne? _______________________________________________________________ 3. Koľkokrát do týždňa sa vaši rodičia pozerajú do vášho denníka? ____________________________________________________________________________________________________________________________________________________________________________________________________________________ 4. Koľko času v priemere denne strávite robením domácich úloh? ________________________________________________________________

    Kontrola domácich úloh rodičmi

    Počet kontrol za týždeň za domácu úlohu Medián = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7 , 7 = (3+3):2 = 3 Aritmetický priemer = 3

    Histogram času stráveného žiakmi pri domácich úlohách