A statisztikai adatfeldolgozás elemei. Statisztikai adatfeldolgozás és jellemzői Adatok statisztikai adatfeldolgozáshoz

Laboratóriumi munka №3. Statisztikai adatfeldolgozás a MatLab rendszerben

A probléma általános megfogalmazása

A megvalósítás fő célja laboratóriumi munka célja, hogy megismerkedjen a statisztikai adatfeldolgozással végzett munka alapjaival a MatLAB környezetben.

Elméleti rész

Elsődleges statisztikai adatfeldolgozás

Az adatok statisztikai feldolgozása elsődleges és másodlagos kvantitatív módszereken alapul. A statisztikai adatok elsődleges feldolgozásának célja a kapott információk strukturálása, ami az adatok csoportosítását jelenti pivot táblák különböző paraméterek szerint. A nyers adatokat olyan formátumban kell bemutatni, hogy az érintett személy hozzávetőlegesen értékelhesse a kapott adatsort, és információkat tudjon feltárni a kapott adatminta adateloszlásáról, például az adatok homogenitásáról vagy tömörségéről. Az elsődleges adatelemzést követően a másodlagos statisztikai adatfeldolgozás módszereit alkalmazzák, amelyek alapján a meglévő adatállományban statisztikai mintákat határoznak meg.

Egy adattömb elsődleges statisztikai elemzésének elvégzése lehetővé teszi, hogy ismereteket szerezzen a következőkről:

Mi a minta legjellemzőbb értéke? A válaszért ez a kérdés a központi tendencia mértékét határozzák meg.

Van-e nagy adatszóródás ehhez a jellemző értékhez képest, azaz mekkora az adatok „fuzziness”-e? V ez az eset változékonyság mértékét határozzák meg.

Érdemes megjegyezni, hogy a központi tendencia és változékonyság mérőszámának statisztikai mutatóit csak kvantitatív adatok alapján határozzuk meg.

A központi tendencia mértékei- értékcsoport, amely köré a többi adat csoportosul, így a központi tendencia mértékei általánosítják az adattömböt, ami lehetővé teszi mind a minta egészére vonatkozó következtetések levonását, mind az összehasonlító elemzés elvégzését különböző minták egymással.

Tegyük fel, hogy van adatminta, akkor a központi tendencia mértékét a következő mutatók becsülik meg:

1. minta átlag az összes mintaérték összegének a számukkal való elosztásának eredménye. Ezt a (3.1) képlet határozza meg.

(3.1)

ahol - én-adik mintaelem;

n a mintaelemek száma.

A mintaátlag biztosítja a legnagyobb pontosságot a központi trend becslésének folyamatában.

Tegyük fel, hogy 20 fős mintánk van. A mintaelemek az egyes személyek átlagos havi jövedelmére vonatkozó információk. Tegyük fel, hogy 19 ember átlagos havi jövedelme 20 ezer. és 1 fő 300 tr. A teljes minta havi összjövedelme 680 tr. A minta átlaga ebben az esetben S=34.


2. Középső- olyan értéket generál, amely felett és alatt a különböző értékek száma megegyezik, vagyis ez egy szekvenciális adatsor központi értéke. Meghatározása a mintában lévő elemek számának egyenletességétől/páratlanságától függ a (3.2) vagy (3.3) képletekkel.. Algoritmus az adatminta mediánjának becsléséhez:

Mindenekelőtt az adatok növekvő/csökkenő sorrendbe kerülnek.

Ha a rendezett minta páratlan számú elemet tartalmaz, akkor a medián megegyezik a középértékkel.

(3.2)

ahol n

Páros számú elem esetén a mediánt a két központi érték számtani középértékeként definiáljuk.

(3.3)

ahol a rendezett minta átlagos eleme;

- a következő rendezett kiválasztás eleme;

A mintaelemek száma.

Abban az esetben, ha a minta minden eleme különbözik, akkor a minta elemeinek pontosan a fele nagyobb, mint a medián, a másik fele pedig kisebb. Például a mintánál (1, 5, 9, 15, 16) a medián megegyezik a 9. elemmel.

A statisztikai adatelemzés során a medián lehetővé teszi a minta azon elemeinek azonosítását, amelyek erősen befolyásolják a mintaátlag értékét.

Tegyük fel, hogy 20 fős mintánk van. A mintaelemek az egyes személyek átlagos havi jövedelmére vonatkozó információk. Tegyük fel, hogy 19 ember átlagos havi jövedelme 20 ezer. és 1 fő 300 tr. A teljes minta havi összjövedelme 680 tr. A mediánt a minta rendezése után a minta tizedik és tizenegyedik elemének számtani középértékeként definiáljuk, és egyenlő Me = 20 tr. Ezt az eredményt a következőképpen értelmezzük: a medián két csoportra bontja a mintát, így arra következtethetünk, hogy az első csoportban minden ember átlagos havi jövedelme nem haladja meg a 20 ezer rubelt, a második csoportban pedig nem kevesebb. mint 20 ezer rubel. R. Ebben a példában azt mondhatjuk, hogy a mediánt az jellemzi, hogy az „átlagos” ember mennyit keres. Míg a mintaátlag értéke szignifikánsan magasabb, mint S=34, ami ennek a jellemzőnek az elfogadhatatlanságát jelzi az átlagkeresetek értékelésénél.

Így minél nagyobb a különbség a medián és a mintaátlag között, annál nagyobb a mintaadatok szórása (a vizsgált példában egy 300 tr. keresetű személy egyértelműen eltér az adott mintában szereplő átlagemberektől, és jelentős hatással van az átlagos jövedelembecslésre). Az ilyen elemekkel való teendők minden esetben egyediek. Általában azonban a minta megbízhatósága érdekében ezeket visszavonják, mivel erősen befolyásolják a statisztikai mutatók értékelését.

3. Divat (hétfő)- a mintában leggyakrabban előforduló, azaz a legnagyobb gyakoriságú értéket generálja Módusbecslési algoritmus:

Abban az esetben, ha a minta ugyanolyan gyakran előforduló elemeket tartalmaz, akkor azt mondjuk, hogy egy ilyen mintában nincs mód.

Ha kettő szomszédos elem a minták azonos frekvenciájúak, ami nagyobb, mint a minta többi elemének gyakorisága, akkor ennek a két értéknek az átlagaként határozzuk meg a módust.

Ha a minta két elemének azonos frekvenciája van, ami nagyobb, mint a minta többi elemének gyakorisága, és ezek az elemek nincsenek szomszédosak, akkor azt mondjuk, hogy ebben a mintában két módus van.

A statisztikai elemzési módot olyan helyzetekben használják, amikor gyorsan meg kell becsülni a központi tendencia mértékét, és nincs szükség nagy pontosságra. Például a divat (méret vagy márka tekintetében) kényelmesen használható a vásárlók körében legkeresettebb ruhák és cipők meghatározására.

A szóródás mértéke (változékonyság)- statisztikai mutatók csoportja, amelyek a minta egyes értékei közötti különbségeket jellemzik. A diszperziós mérőszámok mutatói alapján a mintaelemek homogenitásának és tömörségének mértéke értékelhető. A szóródás mértékét a következő mutatók jellemzik:

1. Csúsztatás – ez az intervallum a megfigyelések eredményeinek (mintaelemek) maximális és minimális értéke között. A tartományjelző az értékek eloszlását jelzi egy adatkészletben. Ha a tartomány nagy, akkor a populációban lévő értékek erősen szórtak, ellenkező esetben (a tartomány kicsi) azt mondják, hogy a populációban lévő értékek közel vannak egymáshoz. A tartományt a (3.4) képlet határozza meg.

(3.4)

Ahol - a minta maximális eleme;

a minta minimális eleme.

2.Átlagos eltérés a számtani átlag különbség (abszolút értékben) a mintában szereplő egyes értékek és a minta átlaga között. Az átlagos eltérést a (3.5) képlet határozza meg.

(3.5)

ahol - én-adik mintaelem;

A (3.1) képlettel számított mintaátlag értéke;

A mintaelemek száma.

Modul szükséges, mivel az egyes elemek átlagától való eltérések lehetnek pozitívak és negatívak is. Ezért, ha a modulust nem veszik fel, akkor az összes eltérés összege közel lesz nullához, és lehetetlen lesz megítélni az adatok változékonyságának mértékét (az adatok a mintaátlag körüli zsúfoltsága). A statisztikai elemzés során a mintaátlag helyett a módusz és a medián vehetõ fel.

3. Diszperzió a szórás mértéke, amely az adatértékek és az átlag közötti relatív eltérést írja le. Kiszámítása az egyes mintaelemek átlagértéktől való négyzetes eltéréseinek összege. A minta méretétől függően a szórást becsüljük különböző utak:

Nagy minták esetén (n>30) a (3.6) képlet szerint

(3.6)

Kis mintákhoz (n<30) по формуле (3.7)

(3.7)

ahol X i - a minta i-edik eleme;

S a minta átlagértéke;

Mintaelemek száma;

(X i – S) - eltérés az adathalmaz egyes értékeinek középértékétől.

4. Szórás azt méri, hogy az adatpontok milyen széles körben vannak szórva az átlagukhoz képest.

Az egyedi eltérések négyzetre emelésének folyamata a variancia kiszámításakor növeli a kapott eltérési érték eltérésének mértékét az eredeti eltérésektől, ami további hibákat okoz. Így annak érdekében, hogy az adatpontok átlagos szórásának becslését az átlagos eltérés értékéhez közelítsük, a variancia négyzetgyökét vonjuk ki. A variancia kinyert gyöke jellemzi a variabilitás mértékét, amelyet négyzetgyöknek vagy szórásnak (3.8) neveznek.

(3.8)

Tegyük fel, hogy Ön szoftverfejlesztési projektmenedzser. Öt programozó van a felügyeleted alatt. A projektvégrehajtás folyamatának menedzselésével a feladatokat elosztja a programozók között. A példa egyszerűsége érdekében abból indulunk ki, hogy a feladatok bonyolultságban és végrehajtási időben egyenértékűek. Úgy döntött, hogy elemzi az egyes programozók munkáját (a hét során elvégzett feladatok számát) az elmúlt 10 hétben, aminek eredményeként a következő mintákat kapta:

Hét neve

Az elvégzett feladatok átlagos számának kiértékelése után a következő eredményt kapta:

Hét neve S
22,3
22,4
22,2
22,1
22,5

Az S mutató alapján átlagosan minden programozó azonos hatékonysággal dolgozik (körülbelül 22 feladat hetente). A változékonyság (tartomány) mutatója azonban nagyon magas (a negyedik programozó 5 feladatától az ötödik programozó 24 feladatáig).

Hét neve S P
22,3
22,4
22,2
22,1
22,5

Becsüljük meg a szórást, amely megmutatja, hogy az értékek hogyan oszlanak meg a mintákban az átlaghoz képest, vagyis esetünkben megbecsüljük, hogy hétről hétre mekkora a feladatvégzés eloszlása.

Hét neve S P ÍGY
22,3 1,56
22,4 1,8
22,2 2,84
22,1 1,3
22,5 5,3

A szórásra kapott becslés a következőt mondja (értékeljük a két szélső esetet, 4 és 5 programozót):

A 4 programozóból álló mintában minden érték átlagosan 1,3 munkával tér el az átlagtól.

A programozó 5-ös mintájában minden érték átlagosan 5,3 munkával tér el az átlagtól.

Minél közelebb van a szórás a 0-hoz, annál megbízhatóbb az átlag, mivel ez azt jelzi, hogy a mintában minden érték közel egyenlő az átlaggal (példánkban 22,5 elem). Ezért a 4. programozó a legkonzisztensebb az 5-össel szemben. Az 5. programozó feladat-végrehajtásának hétről hétre való változékonysága 5,3 feladat, ami jelentős szóródást jelez. Az 5. programozó esetében nem lehet megbízni az átlagban, ezért nehéz megjósolni a következő heti elvégzett feladatok számát, ami viszont megnehezíti a tervezést és a munkabeosztások betartását. Nem fontos, hogy ezen a tanfolyamon milyen vezetői döntést hoz. Fontos, hogy olyan értékelést kapjon, amely alapján megfelelő vezetői döntéseket lehet meghozni.

Így általános következtetés vonható le, hogy az átlag nem mindig becsüli meg helyesen az adatokat. Az átlag becslésének helyessége a szórás értékéből ítélhető meg.


1. Statisztikai adatfeldolgozó eszközök Excelben

2. Speciális funkciók használata

3. Az ANALYSIS PACKAGE eszköz használata

Irodalom:

fő-:

1. Burke. Adatelemzés Microsoft Excel programmal. : Per. angolból / Burke, Kenneth, Carey, Patrick. - M .: "William" kiadó, 2005. - S. 216 - 256.

2. Mishin A.V. Információs technológiák a jogi tevékenységben: műhely / A.V. Mishin. – M.: RAP, 2013. – S. 2-11.

további:

3. Informatika jogászoknak és közgazdászoknak: tankönyv egyetemek számára / Szerk. S.V. Simonovics. - Szentpétervár: Péter, 2004. - S. 498-516.

30. gyakorlat

Témaszám 11.1. Adatbázisok karbantartása az Access DBMS-ben

Az óra projektek módszerével zajlik.

A projekt célja: adatbázis kialakítása a bíróság munkájáról.

Technikai feladat:

1. Hozzon létre egy „Bíróság” adatbázist két „Bírók” és „Követelések” táblázatból a következő felépítéssel:

"Bírók" táblázat

Mező neve Játékvezető kódja TELJES NÉV Fogadónapok Nyitvatartási idő Munkatapasztalat
Adattípus Számszerű Szöveg Szöveg Szöveg Számszerű
Mező méret hosszú egész szám hosszú egész szám
Mezőformátum Alapvető Alapvető
Tizedesjegyek száma
Alapértelmezett érték "Házasodik" "15:00-17:00"
Értékfeltétel >36200 És<36299 H vagy K vagy Szer vagy Cs vagy P >0 És<40
Hiba üzenet Az érvényes értékek: H, K, Szer, Cs vagy P. Írd be újra! ! Az érvényes értékek 1 és 39 között vannak. Kérjük, próbálja újra!
Kötelező mező Igen Igen Nem Nem Nem
Indexelt mező Nem Nem Nem Nem

Jegyzet. Adja meg a „Bíró kódja” kulcsmezőt.

"Követelések" táblázat

Mező neve Ügyszám felperes Válasz-csik Játékvezető kódja Találkozó dátuma
Adattípus Számszerű Szöveg Szöveg Számszerű Dátum idő
Mező tulajdonságai: Általános lap
Mező méret hosszú egész szám hosszú egész szám Teljes dátumformátum
Mezőformátum Alapvető
Tizedesjegyek száma
Alapértelmezett érték
Értékfeltétel >0 És<99999 >36200 És<36299
Hiba üzenet Hibás bejegyzés – próbálja újra! Az érvényes értékek 36201 és 36298 között vannak. Kérjük, próbálja újra!
Kötelező mező Igen Nem Nem Nem Nem
Indexelt mező Igen (nincs egyezés megengedett) Nem Nem Igen (a véletlen egybeesés megengedett) Nem

2. A Bírák táblázatba írja be a következő adatrekordokat:

A Követelések táblázatba írja be a következő adatrekordokat:

3. Használja a "Bíró kód" mezőt, hogy "egy a többhez" kapcsolatot hozzon létre a táblázatok között bírákés perek. Ezzel egyidejűleg állítsa be az "Adatok integritásának biztosítása" és a "kapcsolódó mezők lépcsőzetes frissítése" lehetőséget.

Irodalom:

fő-:

1. Mishin A.V. Információs technológiák a szakmai tevékenységben: tanulmányi útmutató / A.V. Mishin, L.E. Mistrov, D.V. Kartavtsev. - M.: RAP, 2011. - S. 259-264.

további:

31. gyakorlat

Témaszám 11.2. Űrlapok és lekérdezések létrehozásának elvei az Access DBMS-ben

1. Adatbeviteli űrlapok kidolgozása.

2. A számítások elvégzésének és a bevitt adatok elemzésének módszertana.

Irodalom:

fő-:

1. Mishin A.V. Információs technológiák a szakmai tevékenységben: tanulmányi útmutató / A.V. Mishin, L.E. Mistrov, D.V. Kartavtsev. - M.: RAP, 2011. - S. 265-271.

további:

2. Informatika és információs technológiák: tankönyv egyetemisták számára / I.G. Lesnichaya, I.V. Eltűnt, Yu.D. Romanova, V.I. Shestakov. - 2. kiadás - M.: Eksmo, 2006. - 544 p.

3. Mikheeva E.V. Információs technológiák a szakmai tevékenységben: tankönyv szakközépiskolai tanulók számára / E.V. Mikheev. - 2. kiadás, törölve. - M.: Akadémia, 2005. - 384 p.

Küldje el a jó munkát a tudásbázis egyszerű. Használja az alábbi űrlapot

Azok a hallgatók, végzős hallgatók, fiatal tudósok, akik tanulmányaikban és munkájuk során használják fel a tudásbázist, nagyon hálásak lesznek Önnek.

Házigazda: http://www.allbest.ru/

Statisztikai adatok feldolgozása

Bevezetés

statisztikai varianciaminta korreláció

Egy-egy kísérlet eredményeinek statisztikai feldolgozásának módszereit matematikai technikáknak, képleteknek, mennyiségi számítási módszereknek nevezzük, amelyek segítségével a kísérlet során kapott mutatók általánosíthatók, rendszerbe hozhatók, feltárva a bennük rejlő mintákat. Olyan statisztikai jellegű törvényszerűségekről beszélünk, amelyek a kísérletben vizsgált változók között léteznek.

A matematikai és statisztikai elemzés egyes módszerei lehetővé teszik az úgynevezett elemi matematikai statisztikák kiszámítását, amelyek az adatok mintaeloszlását jellemzik, mint például a minta átlaga, a minta varianciája, módusza, mediánja és még sok más. A matematikai statisztika egyéb módszerei, így a varianciaanalízis, a regresszióanalízis lehetővé teszik az egyedi mintastatisztikák változásának dinamikájának megítélését. A harmadik módszercsoport, mondjuk a korrelációelemzés, a faktoranalízis, a mintaadatok összehasonlítására szolgáló módszerek segítségével megbízhatóan megítélhető a jelen kísérletben vizsgált változók között fennálló statisztikai összefüggések.

1. A kísérleti eredmények elsődleges statisztikai feldolgozásának módszerei

A matematikai és statisztikai elemzés minden módszerét feltételesen osztják elsődleges és másodlagosra. Elsődlegesnek nevezzük azokat a módszereket, amelyek segítségével olyan mutatókat lehet kapni, amelyek közvetlenül tükrözik a kísérletben végzett mérések eredményeit. Ennek megfelelően elsődleges statisztikai mutatók alatt azokat értjük, amelyeket magukban a pszichodiagnosztikai módszerekben alkalmaznak, és amelyek a pszichodiagnosztika eredményeinek kezdeti statisztikai feldolgozása eredményeként jönnek létre. A másodlagos módszereket statisztikai feldolgozásnak nevezzük, amelyek segítségével a primer adatok alapján a bennük rejtett statisztikai mintázatok tárulnak fel.

Az elsődleges statisztikai feldolgozási módszerek közé tartozik például a mintaátlag, a minta variancia, a mintavételi mód és a minta medián meghatározása. A másodlagos módszerek általában magukban foglalják a korrelációelemzést, a regresszióanalízist, valamint a két vagy több minta primer statisztikák összehasonlításának módszereit.

Fontolja meg az elemi matematikai statisztikák számítási módszereit.

1.1 Divat

A minta numerikus jellemzője, amely általában nem igényel számításokat, az ún. A módus a vizsgált tulajdonság mennyiségi értéke, amely leggyakrabban megtalálható a mintában. A jellemzők szimmetrikus eloszlása ​​esetén, beleértve a normál eloszlást is, a módusérték egybeesik az átlag és a medián értékével. Más típusú, aszimmetrikus eloszlásra ez nem jellemző. Például az 1, 2, 5, 2, 4, 2, 6, 7, 2 jellemzőértékek sorozatában a 2-es érték a mód, mivel gyakrabban fordul elő, mint más értékek - négyszer.

A divatot a következő szabályok szerint találják meg:

1) Abban az esetben, ha a mintában minden érték egyformán gyakran fordul elő, úgy tekintjük, hogy ennek a mintasorozatnak nincs módusza. Például: 5, 5, 6, 6, 7, 7 - ebben a kiválasztásban nincs mód.

2) Ha két szomszédos (szomszédos) értéknek azonos a gyakorisága, és ezek gyakorisága nagyobb, mint bármely más érték gyakorisága, a módot e két érték számtani átlagaként számítjuk ki. Például az 1., 2., 2., 2., 5., 5., 5., 6. mintában a szomszédos 2. és 5. értékek gyakorisága megegyezik, és egyenlő 3-mal. Ez a frekvencia nagyobb, mint más értékek gyakorisága. 1 és 6 (amelynek értéke 1). Ezért ennek a sorozatnak a módusa a = 3,5 érték lesz

3) Ha a mintában lévő két nem szomszédos (nem szomszédos) érték azonos frekvenciájú, és nagyobb, mint bármely más érték frekvenciája, akkor két módot különböztetünk meg. Például a 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 sorozatban a módok 11 és 14. Ebben az esetben a mintát bimodálisnak mondjuk.

Létezhetnek úgynevezett multimodális eloszlások is, amelyek kettőnél több csúcsot (módusokat) tartalmaznak.

4) Ha az üzemmódot csoportosított adatok halmazából becsüljük meg, akkor a mód megtalálásához meg kell határozni a jellemző legmagasabb gyakoriságú csoportját. Ezt a csoportot modális csoportnak nevezik.

1.2 Medián

A medián a vizsgált attribútum értéke, amely az attribútum értéke szerint rendezett mintát felére osztja. A rendezett sorozatban a mediántól jobbra és balra ugyanannyi jellemző marad. Például egy 2-es, 3-as, 4-es, 4-es, 5-ös, 6-os, 8-as, 7-es, 9-es mintánál a medián értéke 5 lesz, mivel négy mutató marad tőle balra és jobbra. Ha a sorozat páros számú jellemzőt tartalmaz, akkor a medián az átlag lesz, amely a sorozat két központi értékének összegének a fele. A következő 0, 1, 1, 2, 3, 4, 5, 5, 6, 7 sor esetén a medián 3,5 lesz.

A medián ismerete hasznos annak megállapítására, hogy a vizsgált tulajdonság egyes értékeinek eloszlása ​​szimmetrikus-e, és megközelíti-e az úgynevezett normál eloszlást. A normál eloszlás átlaga és mediánja általában megegyezik, vagy nagyon kevéssé különbözik egymástól. Ha a jellemzők mintaeloszlása ​​normális, akkor az adatok normál eloszlásán alapuló másodlagos statisztikai számítási módszerek alkalmazhatók rá. Ellenkező esetben ezt nem lehet megtenni, mivel a számításokba súlyos hibák kúszhatnak be.

1.3 Mintaátlag

A minta átlag (számtani átlag) értéke, mint statisztikai mutató a kísérletben vizsgált pszichológiai minőség átlagos értékelése. Ez az értékelés jellemzi fejlődésének mértékét összességében a pszichodiagnosztikai vizsgálatnak alávetett alanyok csoportjában. Két vagy több minta átlagértékeinek közvetlen összehasonlításával meg tudjuk ítélni, hogy az e mintákat alkotó személyek milyen relatív fejlettségi fokot képviselnek a vizsgált minőségben.

1.4 Minta diszperzió

A minta szórását (néha tartománynak is nevezik) R betűvel jelöljük. Ez a minta számára elérhető legegyszerűbb mutató - az adott variációs sorozat maximális és minimális értéke közötti különbség, azaz

R= xmax - xmin

Nyilvánvaló, hogy minél inkább változik a mért tulajdonság, annál nagyobb az R értéke, és fordítva. Előfordulhat azonban, hogy két mintasorozat átlaga és tartománya azonos, de ezeknek a sorozatoknak a variáció jellege eltérő lesz. Például adott két minta:

X = 10 15 20 25 30 35 40 45 50X = 30 R = 40

I=10 28 28 30 30 30 32 32 50 I=30 R=40

Ha a két mintasorozat átlaga és szórása egyenlő, akkor változásuk jellege eltérő. A mintaváltozatok természetének pontosabb ábrázolása érdekében utalni kell azok eloszlásaira.

1.5 Diszperzió

A variancia egy változó értékeinek átlagától való eltérésének négyzeteinek számtani átlaga.

A diszperzió, mint statisztikai érték azt jellemzi, hogy egy adott mintában az egyes értékek mennyivel térnek el az átlagtól. Minél nagyobb az eltérés, annál nagyobb az eltérés vagy szóródás az adatokban.

A négyzetgyök a négyzetek összege osztva a sorozat tagjainak számával.

Néha meglehetősen sok kezdeti privát primer adat van, amelyek statisztikai feldolgozásnak vannak kitéve, és rengeteg elemi aritmetikai műveletet igényelnek. Számuk csökkentése és ezzel egyidejűleg a számítások szükséges pontosságának megőrzése érdekében néha a részleges empirikus adatok kezdeti mintájának intervallumokkal való helyettesítéséhez folyamodnak. Az intervallum az attribútumértékek nagyságrendű csoportja, amelyet a számítások során egy átlagos érték helyettesít.

2. A kísérleti eredmények másodlagos statisztikai feldolgozásának módszerei

A kísérleti adatok statisztikai feldolgozásának másodlagos módszerei segítségével a kísérlethez kapcsolódó hipotézisek közvetlenül igazolódnak, bizonyítanak vagy megcáfolnak. Ezek a módszerek általában összetettebbek, mint a primer statisztikai feldolgozás módszerei, és az elemi matematika és statisztika terén jól képzett kutatót igényelnek. (7).

A tárgyalt módszercsoport több alcsoportra osztható:

1. Regressziós számítás.

2. Különböző mintákhoz tartozó két vagy több elemi statisztika (átlagok, szórások stb.) összehasonlításának módszerei.

3. Változók közötti statisztikai kapcsolatok megállapításának módszerei, mint például az egymással való korreláció.

4. Módszerek az empirikus adatok belső statisztikai szerkezetének feltárására (például faktoranalízis). Tekintsük példákon keresztül a másodlagos statisztikai feldolgozási módszerek kiválasztott alcsoportjait.

2.1 Regressziós számítás

A regressziószámítás egy matematikai statisztikai módszer, amely lehetővé teszi a privát, egymástól eltérő adatok egy bizonyos lineáris grafikonra való redukálását, amely megközelítőleg tükrözi azok belső kapcsolatát, és közelítőleg meg tudja becsülni egy másik változó valószínű értékét az egyik változó értékével. (7).

A regressziós egyenlet grafikus kifejezését regressziós egyenesnek nevezzük. A regressziós egyenes a függő változó (Y) legjobb előrejelzését fejezi ki a független változókkal (X) szemben.

A regressziót két regressziós egyenlet segítségével fejezzük ki, amelyek a legközvetlenebb esetben úgy néznek ki, mint egy egyenes egyenlete.

Y = a 0 + a 1 * X

X = b 0 + b 1 * Y

Az (1) egyenletben Y a függő változó, X a független változó, a 0 a szabad tag, egy 1 a regressziós együttható, vagy meredekség, amely meghatározza a regressziós egyenes meredekségét a koordinátatengelyekhez képest.

A (2) egyenletben X a függő változó, Y a független változó, b 0 a szabad tag, b 1 a regressziós együttható, vagy meredekség, amely meghatározza a regressziós egyenes meredekségét a koordinátatengelyekhez képest.

Az X és Y (Y és X közötti) kapcsolat (függőség) kvantitatív ábrázolását regressziós elemzésnek nevezzük. A regresszióanalízis fő feladata az a 0, b 0, a1 és b 1 együtthatók megtalálása, valamint a kapott analitikai kifejezések szignifikanciaszintjének meghatározása, amelyek az X és Y változókra vonatkoznak.

A lineáris regressziós analízis módszerének alkalmazásához a következő feltételeknek kell teljesülniük:

1. Az összehasonlítandó X és Y változókat intervallum- vagy arányskálán kell mérni.

2. Feltételezzük, hogy az X és Y változók normális eloszlásúak.

3. Az összehasonlított változókban a változó jellemzők számának azonosnak kell lennie. (5).

2.2 Összefüggés

A másodlagos statisztikai feldolgozás következő módszerét, amellyel két kísérleti adatsor kapcsolatát vagy közvetlen függését derítik ki, korrelációs módszernek nevezzük. Megmutatja, hogy egy jelenség hogyan hat a másikra, vagy hogyan kapcsolódik ahhoz dinamikájában. Ilyen függőségek léteznek például az egymással ok-okozati összefüggésben lévő mennyiségek között. Ha kiderül, hogy két jelenség statisztikailag szignifikánsan korrelál egymással, és ugyanakkor biztosak vagyunk abban, hogy az egyik oka lehet a másik jelenségnek, akkor ebből egyértelműen következik, hogy ok-okozati összefüggés van közöttük. . (7)

Ha az egyik változó szintjének növekedése egy másik szintjének növekedésével jár együtt, akkor pozitív korrelációról beszélünk. Ha az egyik változó növekedése akkor következik be, amikor a másik szintje csökken, akkor negatív korrelációról beszélünk. A változók közötti kapcsolat hiányában nulla korrelációval van dolgunk. (egy)

Ennek a módszernek számos változata létezik: lineáris, rangsorolt, páros és többszörös. A lineáris korrelációs elemzés lehetővé teszi, hogy közvetlen kapcsolatokat hozzon létre a változók között abszolút értékükben. Ezeket a kapcsolatokat grafikusan egy egyenes vonal fejezi ki, innen ered a "lineáris" elnevezés. A rangkorreláció nem a változók abszolút értékei, hanem az általuk elfoglalt sorrendi helyek vagy rangok közötti függést határozza meg egy nagyságrend szerint rendezett sorozatban. A páros korrelációelemzés magában foglalja a korrelációk tanulmányozását csak a változópárok között, valamint a több vagy többváltozós korrelációt sok változó között egyidejűleg. A többváltozós korrelációelemzés elterjedt formája az alkalmazott statisztikákban a faktoranalízis. (5)

A rangkorrelációs együtthatót a pszichológiai és pedagógiai kutatásokban akkor alkalmazzák, ha a kapcsolat létrejöttének jelei minőségileg eltérőek, és nem értékelhetők pontosan az ún. intervallummérő skálával. Az intervallumskála egy olyan skála, amely lehetővé teszi az értékei közötti távolságok értékelését, és annak megítélését, hogy melyik nagyobb és mennyivel nagyobb a másiknál. Például a vonalzó, amellyel az objektumok hosszát megítéljük és összehasonlítjuk, egy intervallumskála, mivel ennek használatával kijelenthetjük, hogy a két és hat centiméter közötti távolság kétszer akkora, mint a hat és nyolc centiméter közötti távolság. Ha valamilyen mérőeszközzel csak azt állíthatjuk, hogy egyes mutatók nagyobbak, mint mások, de nem tudjuk megmondani, hogy mennyivel, akkor egy ilyen mérőeszközt nem intervallumnak, hanem ordinálisnak nevezünk.

A pszichológiai és pedagógiai kutatások során kapott mutatók többsége a sorszámú, és nem az intervallumskálákra vonatkozik (például az olyan értékelések, mint az "igen", "nem", "inkább nem, mint igen" és mások, amelyek pontokká alakíthatók ), ezért a lineáris korrelációs együttható nem alkalmazható rájuk.

A többszörös korreláció módszere – a párkorrelációs módszerrel ellentétben – lehetővé teszi egy többdimenziós, kettőnél több változót tartalmazó kísérleti anyagon belüli korrelációs függőségek általános szerkezetének feltárását, és ezeknek a korrelációs függőségeknek egy bizonyos rendszerként történő bemutatását. .

A parciális korrelációs együttható alkalmazásához a következő feltételeknek kell teljesülniük:

1. Az összehasonlítandó változókat intervallum- vagy arányskálán kell mérni.

2. Feltételezzük, hogy minden változónak normális eloszlási törvénye van.

3. Az összehasonlított változókban a változó jellemzők számának azonosnak kell lennie.

4. A Pearson-féle korrelációs hányados szignifikancia szintjének felméréséhez a (11.9) képletet és a Student-féle t-próba kritikus értékeinek táblázatát kell használni k = n - 2 esetén. (5)

2.3 Faktorelemzés

A faktoranalízis egy statisztikai módszer, amelyet nagy mennyiségű kísérleti adat feldolgozásakor használnak. A faktoranalízis feladatai: a változók számának csökkentése (adatredukció) és a változók közötti kapcsolatok szerkezetének meghatározása, azaz. változók osztályozása, így a faktoranalízist adatredukciós módszerként vagy szerkezeti osztályozási módszerként alkalmazzák.

Fontos különbség a faktoranalízis és az összes fent leírt módszer között, hogy nem használható elsődleges, vagy ahogy mondani szokás, „nyers” kísérleti adatok, pl. közvetlenül a tantárgyak vizsgájából nyert. A faktoranalízis anyaga a korrelációk, pontosabban a Pearson-féle korrelációs együtthatók, amelyeket a felmérésben szereplő változók (azaz pszichológiai jellemzők) között számítanak ki. Más szóval, a korrelációs mátrixokat, vagy ahogy másképpen nevezik, az interkorrelációs mátrixokat faktoranalízisnek vetik alá. Ezekben a mátrixokban az oszlopok és sorok neve megegyezik, mivel az elemzésben szereplő változók listáját jelentik. Emiatt az interkorrelációs mátrixok mindig négyzet alakúak, azaz. a bennük lévő sorok száma megegyezik az oszlopok számával, és szimmetrikus, azaz. a főátlóhoz képest szimmetrikus helyek azonos korrelációs együtthatókkal rendelkeznek.

A faktoranalízis fő fogalma egy faktor. Ez egy mesterséges statisztikai mutató, amely a vizsgált pszichológiai jellemzők közötti korrelációs együtthatók táblázatának vagy az interkorrelációk mátrixának speciális transzformációiból adódik. Az interkorrelációs mátrixból a faktorok kinyerésének eljárását mátrixfaktorizációnak nevezik. A faktorizálás eredményeként a korrelációs mátrixból eltérő számú faktor kinyerhető az eredeti változók számával megegyező számig. A faktorizáció eredményeként azonosított tényezők azonban általában nem egyenlőek értékükben. (5)

Az azonosított tényezők segítségével a pszichológiai jelenségek egymásrautaltsága magyarázható. (7)

A faktoranalízis eredményeként leggyakrabban nem egy, hanem több olyan tényezőt határoznak meg, amelyek különböző módon magyarázzák a változók interkorrelációs mátrixát. Ebben az esetben a tényezőket általánosra, általánosra és egyedire osztják. Általános faktoroknak nevezzük, amelyek minden faktorterhelése jelentősen eltér a nullától (a nulla terhelés azt jelzi, hogy ez a változó semmilyen kapcsolatban nem áll a többivel, és az életben nincs rájuk hatással). Általános - ezek olyan tényezők, amelyekben a tényezőterhelés egy része eltér a nullától. Egyetlen - ezek olyan tényezők, amelyekben csak az egyik terhelés különbözik jelentősen a nullától. (7)

A faktorelemzés megfelelő lehet, ha a következő kritériumok teljesülnek.

1. Nem lehetséges a névskálán kapott minőségi adatok faktorizálása, például hajszín (fekete / barna / vörös) stb.

2. Minden változónak függetlennek kell lennie, és eloszlásuknak a normálishoz közelinek kell lenniük.

3. A változók közötti kapcsolatoknak megközelítőleg lineárisnak, vagy legalábbis nem egyértelműen görbe vonalúnak kell lenniük.

4. Az eredeti korrelációs mátrixban több 0,3-nál nagyobb modulo korrelációnak kell lennie. Ellenkező esetben elég nehéz bármilyen tényezőt kivonni a mátrixból.

5. Az alanyok mintája elég nagy legyen. A szakértői tanácsok eltérőek. A legmerevebb álláspont azt javasolja, hogy ne alkalmazzunk faktoranalízist, ha az alanyok száma kevesebb, mint 100, mivel a korrelációs standard hibák ebben az esetben túl nagyok lesznek.

Ha azonban a faktorok jól meghatározottak (például 0,3 helyett 0,7 terhelés esetén), a kísérletezőnek kisebb mintára van szüksége az elkülönítésükhöz. Ezen túlmenően, ha a kapott adatokról ismert, hogy nagyon megbízhatóak (például érvényes teszteket használnak), akkor lehetőség van az adatok kisebb számú alanyon történő elemzésére. (5).

2.4 Ifaktoranalízis segítségével

A faktoranalízist széles körben alkalmazzák a pszichológiában az elméleti és gyakorlati problémák megoldásához kapcsolódó különféle területeken.

Elméletileg a faktoranalízis alkalmazása a személyiségszerkezet, a temperamentum és a képességek vizsgálatának úgynevezett faktoranalitikus megközelítésének kialakításához kapcsolódik. A faktoranalízis alkalmazása ezeken a területeken azon a széles körben elfogadott feltételezésen alapul, hogy a megfigyelhető és közvetlenül mérhető mutatók csak közvetett és/vagy sajátos külső megnyilvánulásai általánosabb jellemzőknek. Ezek a jellemzők az elsőtől eltérően látens, úgynevezett látens változók, mivel olyan fogalmak vagy konstrukciók, amelyek nem állnak rendelkezésre közvetlen mérésre. Megállapíthatóak azonban a megfigyelt tulajdonságok közötti összefüggések faktorálásával és olyan tényezők elkülönítésével, amelyek (jó szerkezetet feltételezve) a kívánt látens változó statisztikai kifejeződéseként értelmezhetők.

Bár a faktorok pusztán matematikai jellegűek, feltételezésük szerint látens változókat (elméletileg feltételezett konstrukciókat vagy fogalmakat) reprezentálnak, így a faktorok nevei gyakran a vizsgált hipotetikus konstrukció lényegét tükrözik.

Jelenleg a faktoranalízist széles körben alkalmazzák a differenciálpszichológiában és a pszichodiagnosztikában. Segítségével teszteket fejleszthet, meghatározhatja az egyéni pszichológiai jellemzők közötti kapcsolatok struktúráját, teszt- vagy tesztelemekkel mérve.

A faktoranalízist a vizsgálati módszerek szabványosítására is használják, amelyet az alanyok reprezentatív mintáján hajtanak végre.

Következtetés

Ha a kísérletben nyert adatok kvalitatív jellegűek, akkor a következtetéseik alapján levont következtetések helyessége teljes mértékben a kutató intuíciójától, műveltségétől, szakmai felkészültségétől, valamint érvelésének logikájától függ. Ha ezek az adatok kvantitatív típusúak, akkor először elsődleges, majd másodlagos statisztikai feldolgozásnak vetik alá őket. Az elsődleges statisztikai feldolgozás a szükséges számú elemi matematikai statisztika meghatározásából áll. Az ilyen feldolgozás szinte mindig magában foglalja legalább a minta átlagának meghatározását. Azokban az esetekben, amikor a javasolt hipotézisek kísérleti igazolásának tájékoztató mutatója a relatív átlagadatok szórása, a szórást vagy az eltérés négyzetét számítjuk ki. A medián érték kiszámítása akkor javasolt, ha normális eloszlásra tervezett másodlagos statisztikai feldolgozási módszereket kell alkalmazni, a mintaadatok ilyen jellegű eloszlásához a medián, valamint a módusz egybeesik vagy elég közel van az átlaghoz. érték. Ezzel a kritériummal hozzávetőlegesen meg lehet ítélni a kapott elsődleges adatok eloszlásának jellegét.

Másodlagos statisztikai feldolgozásra (átlagok, szórások, adatok eloszlásának összehasonlítása, regresszióanalízis, korrelációanalízis, faktoranalízis stb.) akkor kerül sor, ha a problémák megoldásához vagy a felvetett hipotézisek bizonyításához szükséges a statisztikai minták meghatározása elrejtve az elsődleges kísérleti adatokban. A másodlagos statisztikai feldolgozás megkezdésekor a kutatónak mindenekelőtt el kell döntenie, hogy a különböző másodlagos statisztikák közül melyiket használja az elsődleges kísérleti adatok feldolgozására. A döntést a vizsgált hipotézis jellegének és a kísérlet eredményeként nyert elsődleges anyag jellegének figyelembevételével hozzák meg. Íme néhány ajánlás ezzel kapcsolatban.

Javaslat 1. Ha a kísérleti hipotézis azt a feltételezést tartalmazza, hogy a folyamatban lévő pszichológiai és pedagógiai kutatás eredményeként bármely minőség mutatói növekedni fognak (vagy csökkenni fognak), akkor javasolt a Student-féle teszt vagy p2-kritérium használata az elő- és a kísérletek utáni adatok. Ez utóbbit akkor használjuk, ha az elsődleges kísérleti adatok relatívak és például százalékban vannak kifejezve.

Javaslat 2. Ha egy kísérletileg tesztelt hipotézis tartalmaz állítást egyes változók közötti ok-okozati összefüggésre vonatkozóan, akkor azt célszerű a lineáris vagy rangkorrelációs együtthatók segítségével ellenőrizni. Lineáris korrelációt akkor használunk, ha a független és a függő változókat intervallumskálával mérjük, és ezekben a változókban a kísérlet előtt és után kicsik a változások. A rangkorrelációt akkor alkalmazzuk, ha elegendő a független és függő változók egymásutáni sorrendjében bekövetkezett változások értékeléséhez, vagy ha ezek változása elég nagy, vagy ha a mérőeszköz nem intervallum, hanem ordinális volt.

3. ajánlás. A hipotézis néha azt a feltételezést tartalmazza, hogy a kísérlet eredményeként az alanyok közötti egyéni különbségek növekedni vagy csökkenni fognak. Ez a feltételezés jól tesztelhető a Fisher-teszt segítségével, amely lehetővé teszi a kísérlet előtti és utáni eltérések összehasonlítását. Ne feledje, hogy a Fisher-kritérium használatával csak a mutatók abszolút értékeivel lehet dolgozni, a rangjukkal nem.

Az Allbest.ru oldalon található

...

Hasonló dokumentumok

    A statisztikai adatok feldolgozásának és elemzésének alapvető technikái és módszerei. Számtani, harmonikus és geometriai középértékek számítása. Eloszlási sorozatok, főbb jellemzőik. Igazítási módszerek a dinamika közelében. Nemzeti számlák rendszere.

    szakdolgozat, hozzáadva 2014.10.24

    A közgazdasági elemzés mint tudomány fogalma, lényege, tárgya, a módszerek általános jellemzői és a társadalmi-gazdasági hatékonyság. Az adatelemzés és -feldolgozás ökonometriai módszereinek fő csoportjai. A vállalkozás gazdasági adatainak faktoranalízise.

    absztrakt, hozzáadva: 2010.04.03

    A minta számtani átlaga, szórása, szórása. Elutasítás a Chauvenet-kritérium szerint. Három szigma szabály. A két minta átlagértékei közötti különbség szignifikancia becslése. Páros, többszörös regressziós elemzések. Teljes faktoranalízis.

    szakdolgozat, hozzáadva 2012.12.05

    A statisztikai adatok bemutatásának és feldolgozásának különféle módszereinek alkalmazása. Térstatisztikai minták. Páros regresszió és korreláció. Idősorok. Trend építése. Megoldásukra gyakorlati példák és módszerek, képletek és jelentésük.

    előadások tanfolyama, hozzáadva 2009.02.26

    Mérési eredmények statisztikai feldolgozása; számtani átlag, másodfokú, variancia. Mintavételi paraméterek meghatározása: három szigma törvénye, hisztogram, kontroll diagramok, Ishikawa diagram. Minőségi eszközök használata a kanapék gyártásában.

    szakdolgozat, hozzáadva 2014.10.17

    Statisztikai átlagérték, lényege, alkalmazási feltételei. Átlagok típusai, formái: előjelsúly meglétével, számítási formával, a sokaság lefedettségével. Divat, medián. A profit és a jövedelmezőség dinamikájának statisztikai vizsgálata a JSC "Bashmebel" példáján.

    ellenőrzési munka, hozzáadva 2008.06.14

    A statisztikai adatfeldolgozás elvei, a folyamat során alkalmazott módszerek és technikák. A vezérlőtáblák felépítésének módszertana és főbb szakaszai, osztályozása és típusai, funkcionális jellemzői, az alkalmazás előnyeinek és hátrányainak meghatározása.

    szakdolgozat, hozzáadva 2014.08.23

    Numerikus jellemzők számítása és mintamegfigyelések eredményeinek feldolgozása. Statisztikai mutatók számítása, elemzése a gazdaságban. Nemzeti vagyon: elemek, értékelés; eszközök és források egyenlege; állóeszközök, forgótőke mutatói.

    szakdolgozat, hozzáadva 2012.12.25

    Leíró statisztika és statisztikai következtetés. A minta reprezentativitását biztosító kiválasztási módszerek. A minta típusának hatása a hiba nagyságára. Feladatok a mintavételi módszer alkalmazásában. A megfigyelési adatok megoszlása ​​a lakosság körében.

    teszt, hozzáadva 2011.02.27

    A fogalom feltárása: intervallumskála, számtani átlag, statisztikai szignifikancia szintje. Hogyan kell értelmezni a módot, a mediánt és az átlagot. Feladatok megoldása a Friedman, Rosenbaum-kritérium segítségével. Spremen-féle korrelációs együttható számítása.

A kísérleti eredmények statisztikai feldolgozásának módszereit matematikai technikáknak, képleteknek, kvantitatív számítási módszereknek nevezzük, amelyek segítségével a kísérlet során kapott mutatókat általánosíthatjuk, rendszerbe hozhatjuk, feltárva a bennük rejlő mintákat.

Olyan statisztikai jellegű törvényszerűségekről beszélünk, amelyek a kísérletben vizsgált változók között léteznek.

Adat a feldolgozás céljából besorolandó vagy kategorizálandó fő elemek 26 .

A matematikai és statisztikai elemzés egyes módszerei lehetővé teszik az adatok mintaeloszlását jellemző úgynevezett elemi matematikai statisztikák kiszámítását, pl.

minta átlag,

Minta szórása,

Medián és mások.

A matematikai statisztika más módszerei lehetővé teszik az egyedi mintastatisztikák változásának dinamikájának megítélését, például:

diszperzióanalízis,

Regresszió analízis.

A mintavételi módszerek harmadik csoportjával megbízhatóan megítélhető, hogy a kísérletben vizsgált változók között milyen statisztikai összefüggések állnak fenn:

Korrelációelemzés;

Faktoranalízis;

összehasonlítási módszerek.

A matematikai-statisztikai elemzés valamennyi módszerét konvencionálisan elsődleges és másodlagos 27-re osztják.

Elsődlegesnek nevezzük azokat a módszereket, amelyek segítségével olyan mutatókat lehet kapni, amelyek közvetlenül tükrözik a kísérletben végzett mérések eredményeit.

A másodlagos módszereket statisztikai feldolgozásnak nevezzük, amelyek segítségével a primer adatok alapján a bennük rejtett statisztikai mintázatok tárulnak fel.

Az elsődleges statisztikai feldolgozási módszerek közé tartoznak például:

A minta átlagának meghatározása;

Minta szórása;

Szelektív divat;

Minta medián.

A másodlagos módszerek általában a következők:

Korrelációelemzés;

Regresszió analízis;

Két vagy több minta elsődleges statisztikáinak összehasonlítására szolgáló módszerek.

Tekintsük az elemi matematikai statisztika számítási módszereit, kezdve a mintaátlaggal.

Számtani átlaga - az összes adatérték összegének és a kifejezések számának aránya 28 .

Az átlagérték, mint statisztikai mutató a kísérletben vizsgált pszichológiai minőség átlagos értékelése.

Ez az értékelés jellemzi fejlődésének mértékét összességében a pszichodiagnosztikai vizsgálatnak alávetett alanyok csoportjában. Két vagy több minta átlagértékeinek közvetlen összehasonlításával meg tudjuk ítélni, hogy az e mintákat alkotó személyek milyen relatív fejlettségi fokot képviselnek a vizsgált minőségben.

A minta átlagát a következő 29 képlet segítségével határozzuk meg:

ahol x cf a minta átlaga vagy számtani átlaga;

n - a mintában szereplő alanyok száma vagy bizonyos pszichodiagnosztikai mutatók, amelyek alapján az átlagértéket kiszámítják;

x k - az egyes tantárgyak indikátorainak privát értékei. n ilyen mutató van, így ennek a változónak a k indexe 1 és n közötti értékeket vesz fel;

∑ - a matematikában elfogadott, azon változók értékeinek összegző jele, amelyek ettől a jeltől jobbra vannak.

Diszperzió a 30-as átlagértékre vonatkozó adatok szórásának mértéke.

Minél nagyobb az eltérés, annál nagyobb az eltérés vagy szóródás az adatokban. Meghatározása annak érdekében történik, hogy meg lehessen különböztetni egymástól az azonos átlagú, de eltérő szórású mennyiségeket.

A diszperziót a következő képlet határozza meg:

hol van a minta variancia, vagy egyszerűen a variancia;

Egy kifejezés, amely azt jelenti, hogy ebben a mintában az elsőtől az utolsóig minden x k-re ki kell számítani a privát és az átlagos értékek közötti különbségeket, ezeket a különbségeket négyzetre kell számítani és összegezni kell;

n a mintában szereplő alanyok száma vagy az elsődleges értékek, amelyekre a variancia számít.

középső a vizsgált tulajdonság értékét nevezzük, amely az e tulajdonság értéke szerint rendezett mintát felére osztja.

A medián ismerete hasznos annak megállapítására, hogy a vizsgált tulajdonság egyes értékeinek eloszlása ​​szimmetrikus-e, és megközelíti-e az úgynevezett normál eloszlást. A normál eloszlás átlaga és mediánja általában megegyezik, vagy nagyon kevéssé különbözik egymástól.

Ha a jellemzők mintaeloszlása ​​normális, akkor az adatok normál eloszlásán alapuló másodlagos statisztikai számítási módszerek alkalmazhatók rá. Ellenkező esetben ezt nem lehet megtenni, mivel a számításokba súlyos hibák kúszhatnak be.

Divat még egy elemi matematikai statisztika és a kísérleti adatok eloszlásának jellemzője. A módus a vizsgált tulajdonság mennyiségi értéke, amely leggyakrabban megtalálható a mintában.

A szimmetrikus jellemzőeloszlásoknál, beleértve a normál eloszlást is, a módusértékek egybeesnek az átlag- és mediánértékekkel. Más típusú, aszimmetrikus eloszlások esetén ez nem jellemző.

A másodlagos statisztikai feldolgozás módszerét, amellyel két kísérleti adatsor kapcsolatát vagy közvetlen kapcsolatát derítik ki, az ún. korrelációelemző módszer. Megmutatja, hogy egy jelenség hogyan hat a másikra, vagy hogyan kapcsolódik ahhoz dinamikájában. Ilyen függőségek léteznek például az egymással ok-okozati összefüggésben lévő mennyiségek között. Ha kiderül, hogy két jelenség statisztikailag szignifikánsan korrelál egymással, és ugyanakkor biztosak vagyunk abban, hogy az egyik oka lehet a másik jelenségnek, akkor ebből egyértelműen következik, hogy ok-okozati összefüggés van közöttük. .

Ennek a módszernek több fajtája létezik:

A lineáris korrelációs elemzés lehetővé teszi, hogy közvetlen kapcsolatokat hozzon létre a változók között abszolút értékükben. Ezeket a kapcsolatokat grafikusan egy egyenes vonal fejezi ki, innen ered a "lineáris" elnevezés.

A lineáris korrelációs együtthatót a következő 31 képlet segítségével határozzuk meg:

ahol r xy - lineáris korrelációs együttható;

x, y - az összehasonlított értékek átlagos mintaértékei;

x én ,y én - összehasonlított mennyiségek privát mintaértékei;

P - az értékek teljes száma az összehasonlított mutatósorozatban;

Az összehasonlított értékek diszperziói, eltérései az átlagértékektől.

A rangkorreláció nem a változók abszolút értékei, hanem az általuk elfoglalt sorrendi helyek vagy rangok közötti függést határozza meg egy nagyságrend szerint rendezett sorozatban. A rangkorrelációs együttható képlete 32:

ahol R s - rangkorrelációs együttható Spearman szerint;

d én - az azonos tantárgyak mutatóinak rangsorai közötti különbség a rendezett sorokban;

P - az alanyok vagy digitális adatok (rangsorok) száma a korrelált sorozatban.

Atyusheva Anna

A munkában a tanulók 7. évfolyamos előmenetelére vonatkozó adatok feldolgozásának példáján a főbb statisztikai jellemzők figyelembevétele, a statisztikai adatok gyűjtése, csoportosítása, a statisztikai információk áttekinthető bemutatása, az adatok elemzése történik. kapott.

A mű egy kísérő előadást tartalmaz.

Letöltés:

Előnézet:

Önkormányzati autonóm oktatási intézmény "Gimnasium No. 24"

XXII tudományos konferencia MAGNI

Statisztikai adatfeldolgozás

MAOU "Gimnázium No. 24" Atyusheva Anna

Konzulens: matematikatanár

Shchetinina Natalya Sergeevna

Magadan, 2016

Bevezetés………………………………………………………………………………………………………3

  1. A statisztikai adatfeldolgozásban használt alapfogalmak……………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………
  2. Kutatási rész…………………………………………………….......................... .....7

2.1 A 7. „B” osztályos tanulók előmenetelére vonatkozó adatok statisztikai feldolgozása………………… ..7

18

2.3. A tanulók oktatási tevékenységének összehasonlító jellemzői az I. és II. negyedév eredményei alapján………………………………………………………………………………………… …………..21

2.4. A 7. „B” osztályos tanulók körében végzett, a gyermekek előmenetelének szülői felügyeletét vizsgáló felmérés elemzése……………………………………………………………………………… …………23

Következtetés…………………………………………………………………………………………………27

Irodalom…………………………………………………………………………………………………28

Bevezetés

Bármelyikünk, aki kinyit egy könyvet vagy egy újságot, bekapcsolja a tévét vagy eljut az állomáshoz, állandóan az információk táblázatos formájával szembesül. Ezek az órarend, vonatmenetrend, szorzótábla és még sok más. Minden információ diagramok vagy grafikonok formájában jelenik meg.

Képesnek kell lennie az ilyen információk feldolgozására és elemzésére. Adatfeldolgozás, események összehasonlítása nélkül lehetetlen nyomon követni egy adott probléma kialakulását.

Az algebra során olyan statisztikai jellemzőket tanulmányoztunk, amelyeket széles körben alkalmaznak különböző vizsgálatokban. Érdekelt a vizsgált jellemzők gyakorlati alkalmazása, az adatok feldolgozásának képessége, hogy a bemutatott információk egyértelműen meghatározzák egy-egy probléma kialakulásának menetét, és ennek eredményeként a megoldás eredményét. Ilyen problémaként úgy döntöttem, hogy osztályom teljesítményét az első félévi negyedévekben veszem figyelembe.

Tanulmányi tárgyterület– algebra

A vizsgálat tárgya– statisztikai jellemzők

Tanulmányi tárgy- a 7. „B” osztályos tanulók előmenetelét az első félévi negyedévekre vonatkozóan

Hipotézis: Úgy gondoljuk, hogy a 7B osztályos tanulók előmenetelére vonatkozó adatok feldolgozásának példájával nemcsak megismerkedünk a fő statisztikai jellemzőkkel, hanem önállóan is megtanuljuk:

  • statisztikai adatok gyűjtése és csoportosítása;
  • statisztikai információk megjelenítése;
  • elemzi a kapott adatokat.

Cél: megtanulják feldolgozni, elemezni, vizualizálni a rendelkezésre álló információkat.

Feladatok:

  • statisztikai jellemzők tanulmányozása;
  • negyedévente gyűjtsön információkat a 7. évfolyamos tanulók előmeneteléről

az első félév;

  • feldolgozni az információkat;
  • hisztogramok segítségével vizualizálja az információkat;
  • elemezze a kapott adatokat és vonja le a megfelelő következtetéseket.

A statisztikai adatfeldolgozásban használt alapfogalmak

A statisztika olyan tudomány, amely a természetben és a társadalomban előforduló tömegjelenségek mennyiségi adatainak megszerzésével, feldolgozásával és elemzésével foglalkozik. A „statisztika” szó a latin „status” szóból származik, ami „állapotot, a dolgok állását” jelenti.

A legegyszerűbb statisztikai jellemzők a számtani átlag, medián, tartomány, módus.

  • számtani átlagaegy számsorozatot e számok összegének a tagok számával való osztásának hányadosának nevezzük. A számtani átlagot általában akkor találják meg, amikor egy adott adatsor átlagértékét akarják meghatározni: a területen 1 hektáronkénti átlagos búzatermés, műszakonként egy munkásbrigád átlagos kibocsátása, a bizonyítvány átlagértéke, a levegő átlagos hőmérséklete délben ebben az évtizedben stb.
  • középső páratlan számú tagú rendezett számsort a közepére írt számnak, a páros számú tagú rendezett számsor mediánját pedig a közepére írt két szám számtani középértékének nevezzük. Vegyük figyelembe, hogy kényelmesebb és gyorsabb egy számsorral dolgozni, ha az megrendelt, pl. olyan sorozat, amelyben minden következő szám nem kisebb (vagy nem több), mint az előző.
  • Divat Egy számsort az adott sorozatban leggyakrabban előforduló számnak nevezzük. Egy számkészletnek több üzemmódja is lehet, vagy egyáltalán nincs mód. Az adatsorok módozatát általában akkor találjuk meg, amikor valamilyen tipikus mutatót szeretnénk felfedni. Megjegyzendő, hogy egy számsorozat számtani átlaga nem eshet egybe ezen számok egyikével sem, és a módusz, ha létezik, szükségszerűen egybeesik a sorozat két vagy több számával. Ráadásul a számtani átlagtól eltérően a „mód” fogalma nem csak a numerikus adatokra vonatkozik.
  • nagyban számsort a legnagyobb és a legkisebb szám különbségének nevezzük. Egy sorozat tartományát akkor találjuk meg, amikor meg akarják határozni, hogy egy sorozatban mekkora az adatok terjedése.

Az egyes jellemzők definícióját egy számsor példáján mutatjuk meg: 47,46,52,47,52,47,52,49,45,43,53,53,47,52.

számtani átlaga 48,7.

Ezt a következőképpen találjuk meg: meghatározzuk a számok összegét, és elosztjuk a számukkal.

(47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7.

középső adott számsor lesz a szám 48.

Ez így van: számsort rendezünk, kiválasztva azt, amelyik középen van. Ha a számok száma páros, akkor a két szám számtani középértékét a sorozat közepén találjuk.

43,45,46,47,47,47, 47,49 ,52,52,52,52,53,53

(47+49):2=48

Divat adott számsor lesz a szám 47 és 52 . Leggyakrabban ezek a számok ismétlődnek.

47 ,46, 52 , 47 , 52 , 47 , 52 ,49,45,43,53,53, 47 , 52 .

nagyban ez a számsor lesz 10.

Ezt a következőképpen találjuk meg: kiválasztjuk a sorozat legnagyobb és legkisebb számát, és megtaláljuk a különbséget ezek között a számok között.

47,46,52,47,52,47,52,49,45, 43, 53 ,53,47,52

53-43=10

Kutatási rész

A 7. "B" osztályos tanulók előmenetelére vonatkozó adatok statisztikai feldolgozása

Térjünk át az információfeldolgozásra. A tantárgyak mindegyikéhez három sorból álló táblázatokat készítünk, az első egy sor adatot tartalmaz majd. A sorozat minden változatát bizonyos számú alkalommal megfigyelték a mintában. Ezt a számot az opciók sokaságának nevezzük. Tehát a második sorba tesszük a megfelelő opció többszörösét. Egy mintaeloszlási táblázatot kapunk.

Ha az összes multiplicitást összeadjuk, akkor megkapjuk a mintavétel során végzett összes mérés számát - a minta nagyságát (esetünkben ez a szám 24, ami megfelel az osztály tanulóinak számának).

A harmadik sorban a százalékban kifejezett arányt az opciók gyakoriságának nevezzük.

frekvencia opciók =

Általában, ha a vizsgálat eredményei alapján összeállítjuk a relatív gyakoriságok táblázatát, akkor a relatív gyakoriságok összege 100%.

I negyed

Orosz nyelv.

Rendeljük a mintaadatokat (pontok): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4 ,4 ,4,5.

Tantárgyi átlag:(átlagos).

Frekvenciakiosztási táblázat

választási lehetőség

Többszörös lehetőségek

Nem

Gyakoriság %

58.3%

37.5%

4.2%

Irodalom.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5 ,5,5,5.

Tantárgyi átlag:(átlagos).

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

37.5%

41.7%

20.8%

Algebra.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4 ,4 ,5,5.

Tantárgyi átlag:(átlagos).

A tantárgyból a legtöbb hallgató "4, 3" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

45.8%

45.8%

8.3%

Sztori.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4 ,4 ,4,5

Tantárgyi átlag:(átlagos).

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

45.8%

4.2%

Társadalomtudomány.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5 ,5 .5.5

Tantárgyi átlag:(átlagos).

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

37.5%

41.7%

20.8%

Földrajz.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5 ,5,5 ,5

Tantárgyi átlag:(átlagos).

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

20.8%

41.7%

37.5%

Fizika.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,4,5

Tantárgyi átlag:(átlagos).

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

37.5%

58.3%

4.2%

Biológia.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4.4,5,5,5,5,5 ,5,5

Tantárgyi átlag:(átlagos).

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

45.8%

29.2%

AZ ÉLETBIZTONSÁG ALAPJAI.

Rendeljük a mintaadatokat (jelek): 4,4,4,4,4,4.4.5,5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5,5

Tantárgyi átlag:(átlagos).

Osztályozási lehetőségek

sokféleség

Nem

Nem

Gyakoriság %

29.2%

70.8%

Rendeljük a mintaadatokat (jelek): 3,4,4,4.4,4,4,4,4,4,5,5,5,5,5,5,5.5,5,5.5,5,5,5

Tantárgyi átlag:(átlagos).

A tantárgyból a legtöbb hallgató "5" (divat)

Az orosz nyelvű hallgatók körülbelül fele 5 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

4.2%

37.5%

58.3%

Angol nyelv.

Rendeljük a mintaadatokat (pontok): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5.5,5 ,5,5

Tantárgyi átlag:(átlagos).

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

37.5%

41.7%

20.8%

Informatika.

Rendeljük a mintaadatokat (jelek): 3,4,4,4,4.4,4,4,4,4,4,4,4,4,5,5,5,5.5.5,5,5,5 ,5

Tantárgyi átlag:(átlagos).

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

4.2%

54.2%

41.7%

Technológia.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,4,4,4,4,4,4,5,5,5.5,5,5,55,5,5,5,5 ,5

Tantárgyi átlag:(átlagos).

A tantárgyból a legtöbb hallgató "5" (divat)

Az orosz hallgatók hozzávetőleg fele 4,5 (medián) szinten tanul

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

20.8%

54.2%

Most gyűjtsünk hasonló információkat a második negyedév eredményeiről.

Orosz nyelv.

Rendeljük a mintaadatokat (jelek): 3,3,3.3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,4

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Nem

Gyakoriság %

41.7%

58.3%

Irodalom.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,5,5,5 ,5 .5.5

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "3" (divat)

Az orosz nyelvű hallgatók körülbelül fele 3 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

41.7%

33.3%

Algebra.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4 ,5 .5.5

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "3" (divat)

Az orosz nyelvű hallgatók körülbelül fele 3 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

37.5%

12.5%

Sztori.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,3,3,3,3,4.4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,5

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

37.5%

58.3%

4.2%

Társadalom.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4 ,5 .5.5

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

16.7%

70.8%

12.5%

Földrajz.

Rendeljük a mintaadatokat (jelek): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5 .5.5

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

12.5%

58.3%

29.2%

Fizika.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,44,5 ,5,5

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

33.3%

16.7%

12.5%

Biológia.

Rendeljük a mintaadatokat (jelek): 3,3,3,4,4,4,4,4,4,4.4,4,4,4,4,4,4,4,5,5,5,5 ,5,5

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

12.5%

62.5%

AZ ÉLETBIZTONSÁG ALAPJAI.

Rendeljük a mintaadatokat (jelek): 3,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5,5

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "5" (divat)

Az orosz nyelvű hallgatók körülbelül fele 5 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

4.2%

8.3%

87.5%

A szülőföld története és társadalma.

Rendeljük a mintaadatokat (jelek): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5 ,5 .5.5

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

12.5%

45.8%

41.7%

Angol nyelv.

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

20.8%

29.2%

Informatika.

Rendeljük a mintaadatokat (jelek): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5 .5.5

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "4" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

20.8%

29.2%

Technológia.

Rendeljük a mintaadatokat (jelek): 3,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 .5.5

Tantárgyi átlag:(átlagos)

A tantárgyból a legtöbb hallgató "5" (divat)

Az orosz nyelvű hallgatók körülbelül fele 4 évesen tanul (medián)

Osztályozási lehetőségek

sokféleség

Nem

Gyakoriság %

4.2%

29.2%

66.7%

Vizualizálja az adatokat hisztogramokkal

A statisztikai vizsgálat eredményeként kapott adatok vizuális megjelenítéséhez széles körben alkalmazzák a reprezentációjuk különféle módszereit.

Az adatok megjelenítéséhez hisztogramokat fogunk használni. A hisztogram egy lépcsőzetes ábra, amely zárt téglalapokból áll. Minden téglalap alapja egyenlő az intervallum hosszával, magassága pedig a változat többszöröse vagy a relatív gyakoriság. Így a hisztogramban a normál oszlopdiagramtól eltérően a téglalap alapjait nem önkényesen választják ki, hanem szigorúan az intervallum hossza határozza meg.

A tanulói teljesítmények összehasonlító jellemzői az első negyedév tantárgyaiban

A tanulói teljesítmények összehasonlító jellemzői a második negyedév tantárgyaiban

következtetéseket

Az első negyedév eredményei alapján jól látható, hogy a legnehezebb tanulók olyan tantárgyakkal birkóznak meg, mint: orosz nyelv és algebra, olyan tantárgyak, amelyeknél a „trojka” a többi jegyhez képest prioritást élvező értékelés. Ez azt jelenti, hogy ezekben a tárgyakban a minőség alacsonyabb, mint másoké.

Az is nyilvánvaló, hogy a magas szintű hármas olyan tárgyakban, mint az irodalom, a történelem, a társadalom, a fizika, az angol. Szomorú a hármasok jelenléte olyan tantárgyakban is, mint a technika, biológia, földrajz.

A második negyedév eredményei szerint jelentősen csökkent a hármasok és az ötösök száma, vagyis minden tantárgyban elosztották az erejüket, nem pedig külön-külön előnyben.

Az első negyedévi alanyok átlagpontszámának megoszlásának hisztogramja

A második negyedév alanyainak átlagpontszámának megoszlásának hisztogramja

Következtetés

E diagramok elkészítéséhez olyan statisztikai jellemzőt használtunk, mint a számtani átlag. Jól látható, hogy a második negyedévben romlott az orosz nyelv ismerete, a szülőföld történelme és társadalma, valamint az informatika. Továbbfejlesztett történelem, társadalom, fizika, biológia, életbiztonság, angol nyelv. Ugyanakkor a diagramok azt mutatják, hogy jelentősebb javuló változás csak a fizikában és az angol nyelvben történt.

A tanulók oktatási tevékenységének összehasonlító jellemzői az I. és II. negyedév eredményei alapján

Az első negyedévi tantárgyak tudásminőségének hisztogramja

A második negyedévi tantárgyak tudásminőségének hisztogramja

A két hisztogram egyesítésével sokkal könnyebben látható az osztály teljesítményének összehasonlítása. Külön-külön pedig könnyebben látható, hogy mely tételek a jobb minőségűek. Például az első negyedévben a minőség kevesebb, mint 60% a tárgyakban - algebra, orosz, történelem, a másodikban - orosz, irodalom, algebra, fizika. Már most világos, hogy az orosz nyelv és az algebra a legnehezebb a diákok számára. És a százalékos minőség minden tantárgyban nem nagyon különbözik 66% - az első negyedévben, 68% - a második. Azaz az összehasonlító diagramon jól látható tantárgyi görcsösség arra utal, hogy a hallgatók nem igazán igyekeznek fejleszteni tudásukat, és nem tartják meg pozícióikat egyik vagy másik tantárgyi területen.

Az összes tételt minőség szerint összehasonlító diagram 1 és 2 negyedévre

A második negyedévben jelentősen nőtt az orosz nyelvből, társadalomból, biológiából, angolból és technikából jó tanulók és kitűnő tanulók száma. Kissé csökkent az irodalom, az algebra, az életbiztonság, az IORK és az informatika száma. És látható a fizika minőségének erős visszaesése, ami a tanulók tanórákra való felkészületlenségével függ össze.

És ismét arra a következtetésre jutunk, hogy a gyerekek „ugrásokat” tanulnak, és nincsenek speciális preferenciák az oktatás irányában (humanitárius tárgyak, fizikai és matematikai tárgyak, természetes körforgás tantárgyai).

A 7. "B" osztályos tanulók körében végzett felmérés elemzése a gyermekek előrehaladása feletti szülői kontroll érdekében

A fenti vizsgálat eredményei alapján úgy döntöttünk, hogy a 7. „B” osztályos tanulók körében felmérést végzünk a gyermekek nevelése feletti szülői kontroll érdekében (kérdőívek, lásd melléklet)

A minta létszáma 22 fő.

Házi feladat ellenőrzése a szülők által

Következtetés

A diákok csaknem negyede szülői felügyelet nélkül foglalkozik ezzel a kérdéssel, ami természetesen kihat a tanulmányi teljesítményére is.

Heti ellenőrzések száma a házi feladathoz

Medián = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7,7 = (3+3 ):2 = 3

Számtani közép = 3

Következtetés

A feladatokat átlagosan hetente háromszor nézik át. Tekintettel a tanulásban tapasztalható ugrásokra, ez nem elég.

Medián = 0,0,0,0,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,5,5,6,7, 7,7 = (2+2):2 = 2

Számtani átlag = 3 (átlagosan hetente háromszor ellenőrzik a naplót a szülők)

Az az idő, amit a tanulók házi feladattal töltenek

Opciók

1-nél kevesebb

Gyakoriság %

  • Tartomány R=x(max) - x(min)= 3,5 - 0,5 = 3 óra

(a megfigyelt értékek szórásának nagyságát jellemzi, azaz a leghosszabb és legrövidebb idő közötti különbséget mutatja)

  • M(0) mód = 2,5 óra ( a többinél gyakrabban előforduló értéket mutatja, pl. megmutatja, hogy a tanulók mennyi időt töltenek a leggyakrabban)

A tanulók által házi feladattal töltött idő hisztogramja

Következtetés

A házi feladat átlagosan napi 2,5 órát vesz igénybe. Ami normálisnak számít a tanulók életkorához képest.

Következtetés

Az elvégzett munka eredményeként megtanultam a rendelkezésre álló információk feldolgozását, elemzését

A statisztikai jellemzők ismerete segített meghatározni a különböző tantárgyak átlagpontszámát, valamint azon teljesítménymutatók divatját és terjedelmét, ahol lehetetlennek tűnik meghatározni őket. Adatfeldolgozás, események összehasonlítása nélkül lehetetlen nyomon követni egy adott probléma kialakulását. Nemcsak a felmerült problémát - a tantárgyi tudás és tanulmányi teljesítmény romlását - igyekeztünk nyomon követni, hanem az okot is, ami véleményünk szerint a szülők elégtelen kontrolljában rejlik. gyermekeik tanulmányi teljesítményét. A felmérés és a tanulmányi teljesítmények eredményei azt mutatták, hogy a 7. „B” osztályos tanulók nem rendelkeznek kellő önkontrollal a tanulással kapcsolatban, a szülők pedig ennek az ellenkezőjét gondolják.

Úgy gondolom, hogy az elvégzett munka hasznos lesz mind az osztályfőnöknek a szülőkkel való együttműködésben, mind az osztálytársaimnak az egyes tantárgyakból elért eredményeik javításában a jövőben.

A statisztika olyan tudomány, amely az élet számos tömegjelenségére vonatkozó mennyiségi adatokat tanulmányozza, feldolgozza és elemzi. Jellemzőit csak egy kicsit tártuk fel magunk előtt, és még sok ismeretlen és érdekesség áll előttünk.

Bibliográfia:

  1. http://www.nado5.ru/e-book/naibolshii-obzchii-delitel
    Előnézet:

    A prezentációk előnézetének használatához hozzon létre egy Google-fiókot (fiókot), és jelentkezzen be: https://accounts.google.com


    Diák feliratai:

    Statisztikai adatfeldolgozás Készítette: "B" MAOU "24. számú gimnázium" 7. osztályos tanuló Anna Atyusheva Konzulens: matematika tanár Shchetinina Natalia Sergeevna

    Cél: megtanulni feldolgozni, elemezni, vizualizálni a rendelkezésre álló információkat. Feladatok: statisztikai jellemzők tanulmányozása; félévi negyedévekre vonatkozó információkat gyűjt a 7. B osztályos tanulók előmeneteléről; feldolgozni az információkat; hisztogramok segítségével vizualizálja az információkat; elemezze a kapott adatokat és vonja le a megfelelő következtetéseket.

    Hipotézis a tanulói teljesítményre vonatkozó adatok feldolgozásának példáján, nemcsak a fő statisztikai jellemzőkkel ismerkedhetünk meg, hanem megtanulhatjuk a statisztikai adatok gyűjtését és csoportosítását is; statisztikai információk megjelenítése; elemzi a kapott adatokat.

    A statisztika olyan tudomány, amely a természetben és a társadalomban előforduló különféle tömegjelenségek mennyiségi adatainak megszerzésével, feldolgozásával és elemzésével foglalkozik. A „statisztika” szó a latin „status” szóból származik, ami „állapotot, a dolgok állását” jelenti. A legegyszerűbb statisztikai jellemzők: Aritmetikai átlag Medián Tartomány mód

    Az egyes jellemzők meghatározásáról egy számsor példáján: 47,46,52,47,52,47,52,49,45,43,53,53,47,52. Ennek a számsornak a számtani átlaga a 48,7 lesz. (47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7. Ennek a számsornak a mediánja a 48. legyen a 47 és 52 szám. 47, 46, 52, 47, 52, 47, 52, 49,45,43,53,53, 47, 52. Ennek a számsornak a tartománya 10. 47,46,52,47,52,47 ,52, 49,45, 43, 53 ,53,47,52 53-43=10

    Problémák a tanulmányi teljesítménnyel a 7 "B" osztályban

    2. változat 3 4 5 Sokféleség nincs változat 14 9 1 Gyakoriság % 0% 58,3% 37,5% 4,2% Orosz nyelv. Rendeljük a mintaadatokat (pontok): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4 ,4 ,4,5. A tantárgy átlagpontszáma: 14∙3+9∙4+5∙124=8324≈3,5 (számtani átlag). A tantárgyból a legtöbb hallgató "3" (mód) Az orosz nyelvű hallgatók körülbelül fele 3-as (medián) szinten tanul

    A statisztikai vizsgálat eredményeként kapott adatok vizuális megjelenítéséhez széles körben alkalmazzák a reprezentációjuk különféle módszereit.

    A tanulók előmenetelének összehasonlító jellemzői az első negyedév tantárgyaiból

    A tanulók előmenetelének összehasonlító jellemzői a második negyedév tantárgyaiban

    Az átlagpontszám eloszlásának hisztogramja az I. és II. negyed alanyaiban

    Az összes tétel összehasonlítási diagramja a minőség szempontjából az I. és II. negyedévre

    Kikérdezés a 7. "B" osztályos tanulók körében a gyermekek nevelése feletti szülői felügyelet témájában KÉRDŐÍV 1. Ellenőrzik-e a szülei a házi feladatot? _________________________________________________________________________ 2. Hányszor egy héten? ______________________________________________________________________________ 3. Szüleid hetente hányszor nézik meg a naplódat? _____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________

    Házi feladat ellenőrzése a szülők által

    Heti ellenőrzések száma házi feladathoz Medián = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7 , 7 = (3+3):2 = 3 Számtani átlag = 3

    A tanulók által házi feladattal töltött idő hisztogramja