Elementi statističke obrade podataka. Statistička obrada podataka i njene karakteristike Podaci za statističku obradu podataka

Laboratorijski rad №3. Statistička obrada podataka u MatLab sistemu

Opća izjava o problemu

Glavna svrha implementacije laboratorijski rad je upoznavanje sa osnovama rada sa statističkom obradom podataka u MatLAB okruženju.

Teorijski dio

Primarna statistička obrada podataka

Statistička obrada podataka zasniva se na primarnim i sekundarnim kvantitativnim metodama. Svrha primarne obrade statističkih podataka je strukturiranje primljenih informacija, što podrazumijeva grupisanje podataka u pivot table prema raznim parametrima. Neobrađene podatke treba prikazati u takvom formatu da osoba može napraviti približnu procjenu primljenog skupa podataka i otkriti informacije o distribuciji podataka uzorka primljenih podataka, na primjer, homogenost ili kompaktnost podataka. Nakon primarne analize podataka primjenjuju se metode sekundarne statističke obrade podataka, na osnovu kojih se utvrđuju statistički obrasci u postojećem skupu podataka.

Provođenje primarne statističke analize na nizu podataka omogućava vam da steknete znanje o sljedećem:

Koja je najtipičnija vrijednost za uzorak? Za odgovor na ovo pitanje određuju se mjere centralne tendencije.

Postoji li veliki raspršivanje podataka u odnosu na ovu karakterističnu vrijednost, tj. koja je „zamućenost“ podataka? AT ovaj slučaj određuju se mjere varijabilnosti.

Vrijedi napomenuti i činjenicu da se statistički pokazatelji mjere centralne tendencije i varijabilnosti određuju samo na kvantitativnim podacima.

Mjere centralne tendencije- grupa vrijednosti oko koje se grupišu ostali podaci. Dakle, mjere centralne tendencije generaliziraju niz podataka, što omogućava da se formiraju zaključci kako o uzorku u cjelini, tako i da se sprovede komparativna analiza različitih uzoraka međusobno.

Pretpostavimo da postoji uzorak podataka, tada se mjere centralne tendencije procjenjuju pomoću sljedećih indikatora:

1. srednja vrijednost uzorka je rezultat dijeljenja zbira svih vrijednosti uzorka njihovim brojem. Određuje se formulom (3.1).

(3.1)

gdje - i-ti element uzorka;

n je broj elemenata uzorka.

Srednja vrijednost uzorka daje najveću tačnost u procesu procjene centralnog trenda.

Recimo da imamo uzorak od 20 ljudi. Elementi uzorka su podaci o prosječnom mjesečnom prihodu svake osobe. Pretpostavimo da 19 ljudi ima prosječan mjesečni prihod od 20k. i 1 osoba sa prihodom od 300 tr. Ukupni mjesečni prihod cijelog uzorka iznosi 680 tr. Srednja vrijednost uzorka u ovom slučaju je S=34.


2. Medijan- generiše vrijednost iznad i ispod koje je broj različitih vrijednosti isti, tj. ovo je središnja vrijednost u nizu podataka u nizu. Određuje se u zavisnosti od parnosti/neparnosti broja elemenata u uzorku pomoću formula (3.2) ili (3.3) Algoritam za procjenu medijane za uzorak podataka:

Prije svega, podaci se rangiraju (poređaju) uzlaznim/silaznim redoslijedom.

Ako uređeni uzorak ima neparan broj elemenata, tada je medijan isti kao središnja vrijednost.

(3.2)

gdje n

U slučaju parnog broja elemenata, medijana se definira kao aritmetička sredina dvije središnje vrijednosti.

(3.3)

gdje je prosječni element naručenog uzorka;

- element uređenog odabira koji slijedi;

Broj elemenata uzorka.

U slučaju da su svi elementi uzorka različiti, tada je tačno polovina elemenata uzorka veća od medijane, a druga polovina manja. Na primjer, za uzorak (1, 5, 9, 15, 16), medijan je isti kao element 9.

U statističkoj analizi podataka, medijan vam omogućava da identifikujete elemente uzorka koji snažno utiču na vrednost uzorka.

Recimo da imamo uzorak od 20 ljudi. Elementi uzorka su podaci o prosječnom mjesečnom prihodu svake osobe. Pretpostavimo da 19 ljudi ima prosječan mjesečni prihod od 20k. i 1 osoba sa prihodom od 300 tr. Ukupni mjesečni prihod cijelog uzorka iznosi 680 tr. Medijan se nakon uređenja uzorka definira kao aritmetička sredina desetog i jedanaestog elementa uzorka) i jednaka je Me = 20 tr. Ovaj rezultat se tumači na sljedeći način: medijana dijeli uzorak u dvije grupe, tako da možemo zaključiti da u prvoj grupi svaka osoba ima prosječan mjesečni prihod od najviše 20 hiljada rubalja, au drugoj grupi ne manje. više od 20 hiljada rubalja. U ovom primjeru možemo reći da medijan karakterizira koliko zarađuje “prosječna” osoba. Dok je vrijednost prosjeka uzorka značajno veća od S=34, što ukazuje na neprihvatljivost ove karakteristike pri procjeni prosječne zarade.

Dakle, što je veća razlika između medijane i srednje vrijednosti uzorka, to je veći raspršivanje podataka uzorka (u razmatranom primjeru, osoba sa zaradom od 300 tr. jasno se razlikuje od prosječnih ljudi u određenom uzorku i ima značajan uticaj na procjenu prosječnog prihoda). Šta učiniti s takvim elementima odlučuje se u svakom pojedinačnom slučaju. Ali u opštem slučaju, da bi se osigurala pouzdanost uzorka, oni se povlače, jer imaju snažan uticaj na ocjenu statističkih pokazatelja.

3. moda (pon.)- generira vrijednost koja se najčešće javlja u uzorku, tj. vrijednost sa najvećom frekvencijom Algoritam za procjenu načina rada:

U slučaju kada uzorak sadrži elemente koji se javljaju podjednako često, onda kažemo da u takvom uzorku nema modusa.

Ako dva susjedni element uzorci imaju istu frekvenciju, koja je veća od frekvencije preostalih elemenata uzorka, tada se mod određuje kao prosjek ove dvije vrijednosti.

Ako dva elementa uzorka imaju istu frekvenciju, koja je veća od frekvencije preostalih elemenata uzorka, a ti elementi nisu susjedni, onda kažemo da u ovom uzorku postoje dva moda.

Modus u statističkoj analizi koristi se u situacijama kada je potrebno brzo procijeniti mjeru centralne tendencije i nije potrebna visoka tačnost. Na primjer, moda (u smislu veličine ili marke) pogodna je za određivanje odjeće i obuće koje su najtraženije među kupcima.

Mjere raspršenosti (varijabilnost)- grupa statističkih pokazatelja koji karakterišu razlike između pojedinačnih vrijednosti uzorka. Na osnovu indikatora mera disperzije moguće je proceniti stepen homogenosti i kompaktnosti elemenata uzorka. Mjere raspršenosti karakteriziraju sljedeći skup indikatora:

1. Prevucite - ovo je interval između maksimalne i minimalne vrijednosti rezultata promatranja (elementa uzorka). Indikator raspona pokazuje širenje vrijednosti u skupu podataka. Ako je raspon velik, tada su vrijednosti u populaciji jako raštrkane, u suprotnom (raspon je mali), kaže se da vrijednosti u populaciji leže blizu jedna drugoj. Raspon je određen formulom (3.4).

(3.4)

Gdje - maksimalni element uzorka;

je minimalni element uzorka.

2.Prosečno odstupanje je razlika aritmetičke sredine (u apsolutnoj vrijednosti) između svake vrijednosti u uzorku i srednje vrijednosti uzorka. Prosječna devijacija je određena formulom (3.5).

(3.5)

gdje - i-ti element uzorka;

Vrijednost srednje vrijednosti uzorka, izračunata po formuli (3.1);

Broj elemenata uzorka.

Modul neophodno zbog činjenice da odstupanja od prosjeka za svaki pojedini element mogu biti i pozitivna i negativna. Prema tome, ako se modul ne uzme, tada će zbir svih odstupanja biti blizu nule i biće nemoguće procijeniti stepen varijabilnosti podataka (natrpanost podataka oko srednje vrijednosti uzorka). U statističkoj analizi, mod i medijan se mogu uzeti umjesto srednje vrijednosti uzorka.

3. Disperzija je mjera raspršenosti koja opisuje relativno odstupanje između vrijednosti podataka i srednje vrijednosti. Izračunava se kao zbir kvadrata odstupanja svakog elementa uzorka od srednje vrijednosti. Ovisno o veličini uzorka, procjenjuje se varijansa Različiti putevi:

Za velike uzorke (n>30) prema formuli (3.6)

(3.6)

Za male uzorke (n<30) по формуле (3.7)

(3.7)

gdje je X i - i-ti element uzorka;

S je srednja vrijednost uzorka;

Broj elemenata uzorka;

(X i – S) - odstupanje od srednje vrijednosti za svaku vrijednost skupa podataka.

4. Standardna devijacija je mjera koliko su široko rasute tačke podataka u odnosu na njihovu srednju vrijednost.

Proces kvadriranja pojedinačnih odstupanja u proračunu varijanse povećava stepen odstupanja dobijene vrijednosti odstupanja od prvobitnih odstupanja, što zauzvrat unosi dodatne greške. Dakle, da bi se procjena širenja tačaka podataka oko njihovog prosjeka približila vrijednosti prosječne devijacije, kvadratni korijen se izdvaja iz varijanse. Izvučeni korijen varijanse karakterizira mjeru varijabilnosti koja se naziva srednji kvadrat ili standardna devijacija (3.8).

(3.8)

Recimo da ste menadžer projekta razvoja softvera. Pod vašim nadzorom imate pet programera. Upravljajući procesom izvođenja projekta, distribuirate zadatke među programerima. Radi jednostavnosti primjera, polazit ćemo od činjenice da su zadaci ekvivalentni po složenosti i vremenu izvršenja. Odlučili ste da analizirate rad svakog programera (broj obavljenih zadataka tokom sedmice) za posljednjih 10 sedmica, kao rezultat toga dobili ste sljedeće uzorke:

Week Name

Nakon procjene prosječnog broja obavljenih zadataka, dobili ste sljedeći rezultat:

Week Name S
22,3
22,4
22,2
22,1
22,5

Na osnovu S indikatora, svi programeri u prosjeku rade sa istom efikasnošću (oko 22 zadatka sedmično). Međutim, pokazatelj varijabilnosti (raspon) je veoma visok (od 5 zadataka za četvrtog programera do 24 zadatka za petog programera).

Week Name S P
22,3
22,4
22,2
22,1
22,5

Procijenimo standardnu ​​devijaciju, koja pokazuje kako su vrijednosti raspoređene u uzorcima u odnosu na srednju vrijednost, naime, u našem slučaju, da procijenimo koliki je raspon izvršenja zadatka iz sedmice u sedmicu.

Week Name S P SO
22,3 1,56
22,4 1,8
22,2 2,84
22,1 1,3
22,5 5,3

Rezultirajuća procjena standardne devijacije kaže sljedeće (procijenimo dva ekstremna slučaja 4 i 5 programera):

Svaka vrijednost u uzorku od 4 programera u prosjeku odstupa za 1,3 posla od srednje vrijednosti.

Svaka vrijednost u uzorku programera 5 odstupa u prosjeku za 5,3 posla od srednje vrijednosti.

Što je standardna devijacija bliža 0, to je srednja vrijednost pouzdanija, jer to ukazuje da je svaka vrijednost u uzorku skoro jednaka srednjoj (22,5 stavke u našem primjeru). Stoga je 4. programer najdosljedniji za razliku od 5. programera. Varijabilnost izvršavanja zadatka iz sedmice u sedmicu za 5. programera je 5,3 zadatka, što ukazuje na značajno širenje. U slučaju 5. programera, prosjeku se ne može vjerovati, pa je stoga teško predvidjeti broj obavljenih zadataka za narednu sedmicu, što opet otežava planiranje i pridržavanje rasporeda rada. Nevažno je kakvu ćete menadžersku odluku donijeti na ovom kursu. Važno je da dobijete procjenu na osnovu koje se mogu donijeti odgovarajuće upravljačke odluke.

Stoga se može izvesti opći zaključak da srednja vrijednost ne procjenjuje uvijek ispravno podatke. Ispravnost procjene srednje vrijednosti može se suditi po vrijednosti standardne devijacije.


1. Alati za statističku obradu podataka u Excel-u

2. Korištenje posebnih funkcija

3. Korištenje alata PAKET ANALIZE

Književnost:

main:

1. Burke. Analiza podataka pomoću programa Microsoft Excel. : Per. sa engleskog / Burke, Kenneth, Carey, Patrick. - M.: Izdavačka kuća "William", 2005. - S. 216 - 256.

2. Mishin A.V. Informacione tehnologije u pravnoj delatnosti: radionica / A.V. Mishin. – M.: RAP, 2013. – S. 2-11.

dodatno:

3. Informatika za pravnike i ekonomiste: udžbenik za univerzitete / Ed. S.V. Simonovich. - Sankt Peterburg: Peter, 2004. - S. 498-516.

Vježba #30

Tema broj 11.1. Održavanje baza podataka u Access DBMS-u

Nastava se izvodi metodom projekata.

Cilj projekta: Izrada baze podataka o radu suda.

Tehnički zadatak:

1. Kreirajte bazu podataka "Sud" od dvije tabele "Sudije" i "Tužbe" sa sljedećom strukturom:

Tabela "Sudije"

Naziv polja Referee Code PUNO IME Dani prijema Poslovni sati Radno iskustvo
Tip podataka Numerički Tekst Tekst Tekst Numerički
Veličina polja dugi cijeli broj dugi cijeli broj
Format polja Basic Basic
Broj decimalnih mjesta
Zadana vrijednost "srijeda" "15:00-17:00"
Stanje vrijednosti >36200 I<36299 Pon ili uto ili sre ili čet ili pet >0 I<40
Poruka o grešci Važeće vrijednosti su pon, uto, srijeda, čet ili pet. Upišite ponovo! ! Važeće vrijednosti su od 1 do 39. Molimo pokušajte ponovo!
Obavezno polje Da Da Ne Ne Ne
Indeksirano polje Ne Ne Ne Ne

Bilješka. Deklarirajte ključno polje "Šifra sudije".

Tabela "Zahtjevi"

Naziv polja Broj slucaja tužitelj Odgovori-čik Referee Code Datum sastanka
Tip podataka Numerički Tekst Tekst Numerički Datum i vrijeme
Svojstva polja: General Tab
Veličina polja dugi cijeli broj dugi cijeli broj Format punog datuma
Format polja Basic
Broj decimalnih mjesta
Zadana vrijednost
Stanje vrijednosti >0 I<99999 >36200 I<36299
Poruka o grešci Pogrešan unos - pokušajte ponovo! Važeće vrijednosti su od 36201 do 36298. Molimo pokušajte ponovo!
Obavezno polje Da Ne Ne Ne Ne
Indeksirano polje Da (nema dozvoljenih podudaranja) Ne Ne Da (dozvoljena slučajnost) Ne

2. U tabelu Sudije unesite sljedeće podatke:

U tablicu potraživanja unesite sljedeće podatke:

3. Koristite polje "Šifra suca" da uspostavite odnos "jedan prema više" između tabela Sudije i tužbe. Istovremeno, postavite "Osigurati integritet podataka" i "kaskadno ažuriranje povezanih polja".

Književnost:

main:

1. Mishin A.V. Informacione tehnologije u profesionalnoj delatnosti: studijski vodič / A.V. Mišin, L.E. Mistrov, D.V. Kartavtsev. - M.: RAP, 2011. - S. 259-264.

dodatno:

Vježba #31

Tema broj 11.2. Principi kreiranja obrazaca i upita u Access DBMS

1. Izrada obrazaca za unos podataka.

2. Metodologija za izvođenje proračuna i analizu unesenih podataka.

Književnost:

main:

1. Mishin A.V. Informacione tehnologije u profesionalnoj delatnosti: studijski vodič / A.V. Mišin, L.E. Mistrov, D.V. Kartavtsev. - M.: RAP, 2011. - S. 265-271.

dodatno:

2. Informatika i informacione tehnologije: udžbenik za studente / I.G. Lesnichaya, I.V. Nestao, Yu.D. Romanova, V.I. Shestakov. - 2. izd. - M.: Eksmo, 2006. - 544 str.

3. Mikheeva E.V. Informacione tehnologije u profesionalnoj delatnosti: udžbenik za učenike srednjih stručnih škola / E.V. Mikheev. - 2. izd., izbrisano. - M.: Akademija, 2005. - 384 str.

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Hostirano na http://www.allbest.ru/

Obrada statističkih podataka

Uvod

statistička korelacija uzorka varijanse

Metode statističke obrade rezultata eksperimenta nazivaju se matematičkim tehnikama, formulama, metodama kvantitativnih proračuna, uz pomoć kojih se pokazatelji dobijeni tokom eksperimenta mogu generalizirati, dovesti u sistem, otkrivajući obrasce skrivene u njima. Govorimo o takvim pravilnostima statističke prirode koje postoje između varijabli proučavanih u eksperimentu.

Neke od metoda matematičke i statističke analize omogućavaju da se izračunaju tzv. elementarne matematičke statistike koje karakterišu uzorak distribucije podataka, kao što su uzorkovana srednja vrednost, varijansa uzorka, mod, medijan i niz drugih. Druge metode matematičke statistike, kao što su analiza varijanse, regresiona analiza, omogućavaju prosuđivanje dinamike promjena u statistici pojedinačnih uzoraka. Uz pomoć treće grupe metoda, recimo, korelacione analize, faktorske analize, metoda poređenja podataka uzorka, mogu se pouzdano suditi o statističkim odnosima koji postoje između varijabli koje se istražuju u ovom eksperimentu.

1. Metode primarne statističke obrade eksperimentalnih rezultata

Sve metode matematičke i statističke analize uslovno se dijele na primarne i sekundarne. Metode se nazivaju primarnim, uz pomoć kojih je moguće dobiti indikatore koji direktno odražavaju rezultate mjerenja napravljenih u eksperimentu. Shodno tome, primarni statistički pokazatelji označavaju one koji se koriste u samim psihodijagnostičkim metodama i rezultat su početne statističke obrade rezultata psihodijagnostike. Sekundarne metode nazivaju se statističkom obradom, uz pomoć kojih se, na osnovu primarnih podataka, otkrivaju statistički obrasci skriveni u njima.

Metode primarne statističke obrade uključuju, na primjer, određivanje srednje vrijednosti uzorka, varijanse uzorka, načina uzorka i medijane uzorka. Sekundarne metode obično uključuju korelacione analize, regresione analize, metode za poređenje primarne statistike u dva ili više uzoraka.

Razmotriti metode za izračunavanje elementarne matematičke statistike.

1.1 Moda

Numerička karakteristika uzorka, koja po pravilu ne zahteva proračune, je tzv. Mod je kvantitativna vrijednost osobine koja se proučava, a koja se najčešće nalazi u uzorku. Za simetrične distribucije karakteristika, uključujući normalnu distribuciju, vrijednost moda se poklapa sa vrijednostima srednje vrijednosti i medijana. Za druge vrste distribucije, asimetrične, ovo nije tipično. Na primjer, u nizu vrijednosti karakteristika 1, 2, 5, 2, 4, 2, 6, 7, 2, vrijednost 2 je mod, jer se javlja češće od ostalih vrijednosti - četiri puta.

Moda se pronalazi prema sljedećim pravilima:

1) U slučaju kada se sve vrijednosti u uzorku javljaju podjednako često, smatra se da ova serija uzoraka nema mod. Na primjer: 5, 5, 6, 6, 7, 7 - u ovom odabiru nema moda.

2) Kada dvije susjedne (susjedne) vrijednosti imaju istu frekvenciju i njihova frekvencija je veća od frekvencija bilo koje druge vrijednosti, mod se računa kao aritmetička sredina ove dvije vrijednosti. Na primjer, u uzorku 1, 2, 2, 2, 5, 5, 5, 6, frekvencije susjednih vrijednosti 2 i 5 su iste i jednake su 3. Ova frekvencija je veća od frekvencije drugih vrijednosti ​​1 i 6 (koji su jednaki 1). Stoga će način ove serije biti vrijednost = 3,5

3) Ako dvije nesusjedne (nesusjedne) vrijednosti u uzorku imaju jednake frekvencije koje su veće od frekvencija bilo koje druge vrijednosti, tada se razlikuju dva moda. Na primjer, u serijama 10, 11, 11, 11, 12, 13, 14, 14, 14, 17, modovi su 11 i 14. U ovom slučaju se kaže da je uzorak bimodalan.

Mogu postojati i takozvane multimodalne distribucije sa više od dva vrha (moda).

4) Ako se mod procjenjuje iz skupa grupisanih podataka, tada je za pronalaženje moda potrebno odrediti grupu sa najvećom frekvencijom karakteristike. Ova grupa se zove modalna grupa.

1.2 Medijan

Medijan je vrijednost proučavanog atributa, koji uzorak, poredan prema vrijednosti ovog atributa, dijeli na pola. Desno i lijevo od medijane u uređenoj seriji ostaje isti broj karakteristika. Na primjer, za uzorak od 2, 3, 4, 4, 5, 6, 8, 7, 9, medijan će biti vrijednost 5, pošto četiri indikatora ostaju lijevo i desno od njega. Ako serija uključuje paran broj karakteristika, tada će medijan biti prosjek, uzet kao polovina zbroja vrijednosti dvije središnje vrijednosti serije. Za sljedeći red 0, 1, 1, 2, 3, 4, 5, 5, 6, 7, medijan će biti 3,5.

Poznavanje medijane je korisno kako bi se utvrdilo da li je distribucija pojedinih vrijednosti proučavane osobine simetrična i približava se takozvanoj normalnoj distribuciji. Srednja vrijednost i medijan za normalnu distribuciju su obično isti ili se vrlo malo razlikuju jedan od drugog. Ako je uzorkovana distribucija karakteristika normalna, onda se na nju mogu primijeniti sekundarne statističke metode proračuna zasnovane na normalnoj distribuciji podataka. U suprotnom, to se ne može učiniti, jer se ozbiljne greške mogu uvući u proračune.

1.3 Srednja vrijednost uzorka

Srednja vrijednost uzorka (aritmetička sredina) kao statistički indikator je prosječna procjena psihološkog kvaliteta proučavanog u eksperimentu. Ova procena karakteriše stepen njenog razvoja u celini u grupi ispitanika koja je bila podvrgnuta psihodijagnostičkom pregledu. Upoređujući direktno prosječne vrijednosti dva ili više uzoraka, možemo suditi o relativnom stepenu razvoja kvaliteta koji se ocjenjuje kod ljudi koji čine ove uzorke.

1.4 Disperzija uzorka

Rasipanje (ponekad se naziva raspon) uzorka označeno je slovom R. Ovo je najjednostavniji indikator koji se može dobiti za uzorak - razlika između maksimalne i minimalne vrijednosti ove određene serije varijacija, tj.

R= xmax - xmin

Jasno je da što više varira izmjerena osobina, veća je vrijednost R, i obrnuto. Međutim, može se dogoditi da se za dvije serije uzoraka i srednja vrijednost i raspon poklapaju, ali će priroda varijacije ovih serija biti različita. Na primjer, data su dva uzorka:

X = 10 15 20 25 30 35 40 45 50X = 30 R = 40

Y=10 28 28 30 30 30 32 32 50 Y=30 R=40

Kada su srednje vrijednosti i rasponi jednaki za ove dvije serije uzoraka, priroda njihove varijacije je drugačija. Da bi se jasnije predstavila priroda varijacije uzorka, treba se osvrnuti na njihove distribucije.

1.5 Disperzija

Varijanca je aritmetička sredina kvadrata odstupanja vrijednosti varijable od njene srednje vrijednosti.

Disperzija kao statistička vrijednost karakterizira koliko pojedinačne vrijednosti odstupaju od prosječne vrijednosti u datom uzorku. Što je varijansa veća, veća je varijansa ili raspršivanje podataka.

Kvadratni korijen se uzima iz zbira kvadrata podijeljenog sa brojem članova u nizu.

Ponekad postoji dosta inicijalnih privatnih primarnih podataka koji su podložni statističkoj obradi, a oni zahtijevaju ogroman broj elementarnih aritmetičkih operacija. Kako bi se smanjio njihov broj i, istovremeno, zadržala potrebna točnost proračuna, ponekad se pribjegava zamjeni početnog uzorka djelomičnih empirijskih podataka intervalima. Interval je grupa vrijednosti atributa poredanih po veličini, koja se u toku izračunavanja zamjenjuje prosječnom vrijednošću.

2. Metode sekundarne statističke obrade eksperimentalnih rezultata

Uz pomoć sekundarnih metoda statističke obrade eksperimentalnih podataka, hipoteze vezane za eksperiment se direktno provjeravaju, dokazuju ili opovrgavaju. Ove metode su obično složenije od metoda primarne statističke obrade i zahtijevaju od istraživača da bude dobro obučen u elementarnoj matematici i statistici. (7).

Grupa metoda o kojoj se raspravlja može se podijeliti u nekoliko podgrupa:

1. Regresijski račun.

2. Metode za poređenje dvije ili više elementarnih statistika (prosjeka, varijanse, itd.) koje pripadaju različitim uzorcima.

3. Metode za uspostavljanje statističkih odnosa između varijabli, kao što je njihova međusobna korelacija.

4. Metode za otkrivanje interne statističke strukture empirijskih podataka (na primjer, faktorska analiza). Razmotrimo svaku od odabranih podgrupa metoda sekundarne statističke obrade na primjerima.

2.1 Regresijski račun

Regresijski račun je metoda matematičke statistike koja vam omogućava da smanjite privatne, disparatne podatke na određeni linearni graf koji približno odražava njihov interni odnos, i da možete približno procijeniti vjerovatnu vrijednost druge varijable prema vrijednosti jedne od varijabli (7).

Grafički izraz jednačine regresije naziva se linija regresije. Linija regresije izražava najbolja predviđanja zavisne varijable (Y) u odnosu na nezavisne varijable (X).

Regresija se izražava pomoću dvije regresijske jednačine, koje u najdirektnijem slučaju izgledaju kao jednačine prave linije.

Y = a 0 + a 1 * X

X = b 0 + b 1 * Y

U jednačini (1), Y je zavisna varijabla, X je nezavisna varijabla, a 0 je slobodni član, a 1 je koeficijent regresije, ili nagib, koji određuje nagib regresione linije u odnosu na koordinatne ose.

U jednačini (2), X je zavisna varijabla, Y je nezavisna varijabla, b 0 je slobodni član, b 1 je koeficijent regresije, ili nagib, koji određuje nagib linije regresije u odnosu na koordinatne ose.

Kvantitativni prikaz odnosa (zavisnosti) između X i Y (između Y i X) naziva se regresiona analiza. Osnovni zadatak regresione analize je pronaći koeficijente a 0, b 0, a1 i b 1 i odrediti nivo značajnosti dobijenih analitičkih izraza koji povezuju varijable X i Y.

Za primjenu metode linearne regresione analize moraju biti ispunjeni sljedeći uslovi:

1. Varijable X i Y koje se upoređuju moraju se mjeriti na skali intervala ili omjera.

2. Pretpostavlja se da varijable X i Y imaju normalnu distribuciju.

3. Broj različitih karakteristika u upoređenim varijablama treba da bude isti. (5).

2.2 Korelacija

Sljedeća metoda sekundarne statističke obrade, pomoću koje se utvrđuje povezanost ili direktna zavisnost između dvije serije eksperimentalnih podataka, naziva se metoda korelacija. Pokazuje kako jedna pojava utječe na drugu ili je povezana s njom u svojoj dinamici. Zavisnosti ove vrste postoje, na primjer, između veličina koje su jedna s drugom u uzročno-posledičnoj vezi. Ako se pokaže da su dvije pojave statistički značajno povezane jedna s drugom, i ako u isto vrijeme postoji uvjerenje da jedna od njih može djelovati kao uzrok druge pojave, onda definitivno slijedi da između njih postoji uzročna veza. . (7)

Kada je povećanje nivoa jedne varijable praćeno povećanjem nivoa druge, onda govorimo o pozitivnoj korelaciji. Ako se povećanje jedne varijable javlja kada se nivo druge smanjuje, onda govorimo o negativnoj korelaciji. U nedostatku veze između varijabli, imamo posla sa nultom korelacijom. (jedan)

Postoji nekoliko varijanti ove metode: linearna, rangirana, uparena i višestruka. Analiza linearne korelacije omogućava vam da uspostavite direktne veze između varijabli u njihovim apsolutnim vrijednostima. Ove veze su grafički prikazane pravom linijom, pa otuda i naziv "linearni". Korelacija ranga određuje ovisnost ne između apsolutnih vrijednosti varijabli, već između rednih mjesta, ili rangova, koje zauzimaju u nizu poredanih po veličini. Analiza korelacije u paru uključuje proučavanje korelacija samo između parova varijabli, i višestrukih, ili multivarijantnih, između više varijabli istovremeno. Uobičajeni oblik multivarijantne korelacijske analize u primijenjenoj statistici je faktorska analiza. (5)

Koeficijent korelacije ranga u psihološkim i pedagoškim istraživanjima koristi se kada su znaci između kojih se uspostavlja odnos kvalitativno različiti i ne mogu se precizno procijeniti pomoću tzv. intervalne mjerne skale. Intervalna skala je takva skala koja vam omogućava da procijenite udaljenosti između njenih vrijednosti ​​​i prosudite koja je od njih veća, a koliko veća od druge. Na primjer, ravnalo po kojem se ocjenjuju i upoređuju dužine objekata je intervalna skala, jer se pomoću njega može konstatovati da je razmak između dva i šest centimetara dvostruko veći od udaljenosti između šest i osam centimetara. Ako pomoću nekog mjernog alata možemo samo tvrditi da su neki pokazatelji veći od drugih, ali ne možemo reći za koliko, onda se takav mjerni alat naziva ne intervalnim, već ordinalnim.

Većina indikatora koji se dobijaju u psihološkim i pedagoškim istraživanjima odnose se na ordinalnu, a ne na intervalnu skalu (npr. ocjene kao što su "da", "ne", "radije ne nego da" i druge koje se mogu pretvoriti u bodove ), dakle, linearni koeficijent korelacije nije primjenjiv na njih.

Metoda višestrukih korelacija, za razliku od metode parnih korelacija, omogućava da se otkrije opća struktura korelacijskih ovisnosti koje postoje unutar višedimenzionalnog eksperimentalnog materijala koji uključuje više od dvije varijable, te da se te korelacijske ovisnosti predstave kao određeni sistem. .

Za primjenu parcijalnog koeficijenta korelacije moraju biti ispunjeni sljedeći uslovi:

1. Varijable koje se upoređuju moraju se mjeriti na skali intervala ili omjera.

2. Pretpostavlja se da sve varijable imaju normalan zakon raspodjele.

3. Broj različitih karakteristika u upoređenim varijablama treba da bude isti.

4. Za procjenu nivoa značajnosti Pearsonovog korelacionog omjera treba koristiti formulu (11.9) i tabelu kritičnih vrijednosti za Studentov t-test pri k = n - 2. (5)

2.3 Faktorska analiza

Faktorska analiza je statistička metoda koja se koristi pri obradi velikih količina eksperimentalnih podataka. Zadaci faktorske analize su: smanjenje broja varijabli (redukcija podataka) i utvrđivanje strukture odnosa između varijabli, tj. klasifikaciju varijabli, pa se faktorska analiza koristi kao metoda redukcije podataka ili kao metoda strukturne klasifikacije.

Bitna razlika između faktorske analize i svih gore opisanih metoda je u tome što se njome ne mogu obraditi primarni, ili, kako kažu, "sirovi" eksperimentalni podaci, tj. dobijene direktno ispitivanjem subjekata. Materijal za faktorsku analizu su korelacije, odnosno Pirsonovi koeficijenti korelacije, koji se izračunavaju između varijabli (tj. psiholoških karakteristika) uključenih u istraživanje. Drugim riječima, korelacijske matrice ili, kako se inače nazivaju, interkorelacijske matrice, podliježu faktorskoj analizi. Imena kolona i redova u ovim matricama su ista, jer predstavljaju listu varijabli uključenih u analizu. Iz tog razloga, interkorelacijske matrice su uvijek kvadratne, tj. broj redova u njima jednak je broju kolona, ​​a simetričan, tj. simetrična mjesta u odnosu na glavnu dijagonalu imaju iste koeficijente korelacije.

Glavni koncept faktorske analize je faktor. Ovo je veštački statistički indikator koji je rezultat posebnih transformacija tabele koeficijenata korelacije između proučavanih psiholoških karakteristika, odnosno matrice interkorelacija. Procedura za izdvajanje faktora iz interkorelacione matrice naziva se faktorizacija matrice. Kao rezultat faktorizacije, različit broj faktora se može izdvojiti iz matrice korelacije do broja jednakog broju originalnih varijabli. Međutim, faktori identifikovani kao rezultat faktorizacije, po pravilu su nejednaki po svojoj vrednosti. (5)

Uz pomoć identifikovanih faktora objašnjava se međuzavisnost psiholoških pojava. (7)

Najčešće se kao rezultat faktorske analize ne utvrđuje jedan, već više faktora koji na različite načine objašnjavaju matricu međukorelacija varijabli. U ovom slučaju faktori se dijele na opšte, opšte i pojedinačne. Nazivaju se opći faktori čija se sva faktorska opterećenja značajno razlikuju od nule (nulto opterećenje označava da ova varijabla nije ni na koji način povezana s ostalima i da na njih nema nikakvog utjecaja u životu). Općenito - to su faktori kod kojih je dio faktorskih opterećenja različit od nule. Jednostruki - to su faktori u kojima se samo jedno opterećenje značajno razlikuje od nule. (7)

Faktorska analiza može biti prikladna ako su ispunjeni sljedeći kriteriji.

1. Nije moguće faktorizirati kvalitativne podatke dobijene na skali imena, na primjer, kao što je boja kose (crna/smeđa/crvena) itd.

2. Sve varijable moraju biti nezavisne, a njihova distribucija mora biti bliska normalnoj.

3. Odnosi između varijabli trebaju biti približno linearni, ili barem ne jasno krivolinijski.

4. U originalnoj korelacionoj matrici, trebalo bi da postoji nekoliko korelacija po modulu višim od 0,3. Inače je prilično teško izdvojiti bilo koji faktor iz matrice.

5. Uzorak ispitanika treba da bude dovoljno velik. Savjeti stručnjaka se razlikuju. Najrigidnije gledište preporučuje da se ne koristi faktorska analiza ako je broj ispitanika manji od 100, jer će standardne greške korelacije u ovom slučaju biti prevelike.

Međutim, ako su faktori dobro definirani (na primjer, sa opterećenjem od 0,7 umjesto 0,3), eksperimentatoru je potreban manji uzorak da ih izoluje. Osim toga, ako se zna da su dobijeni podaci visoko pouzdani (npr. koriste se validni testovi), onda je moguće analizirati podatke na manjem broju ispitanika. (5).

2.4 Ikoristeći faktorsku analizu

Faktorska analiza se široko koristi u psihologiji u različitim oblastima koje se odnose na rješavanje teorijskih i praktičnih problema.

U teorijskom smislu, upotreba faktorske analize povezana je sa razvojem takozvanog faktorsko-analitičkog pristupa proučavanju strukture ličnosti, temperamenta i sposobnosti. Upotreba faktorske analize u ovim oblastima zasniva se na široko prihvaćenoj pretpostavci da su vidljivi i direktno merljivi indikatori samo indirektne i/ili posebne eksterne manifestacije opštijih karakteristika. Ove karakteristike, za razliku od prve, su latentne, takozvane latentne varijable, budući da su koncepti ili konstrukcije koje nisu dostupne za direktno mjerenje. Međutim, oni se mogu uspostaviti faktoringom korelacija između uočenih osobina i izolacionih faktora koji se (pod pretpostavkom dobre strukture) mogu tumačiti kao statistički izraz željene latentne varijable.

Iako su faktori čisto matematičke prirode, pretpostavlja se da predstavljaju latentne varijable (teorijski postulirane konstrukcije ili koncepte), tako da nazivi faktora često odražavaju suštinu hipotetičkog konstrukta koji se proučava.

Trenutno se faktorska analiza široko koristi u diferencijalnoj psihologiji i psihodijagnostici. Uz njegovu pomoć možete razviti testove, uspostaviti strukturu odnosa između individualnih psiholoških karakteristika mjerenih setom testova ili testnih zadataka.

Faktorska analiza se takođe koristi za standardizaciju metoda ispitivanja, koja se sprovodi na reprezentativnom uzorku ispitanika.

Zaključak

Ako su podaci dobiveni u eksperimentu kvalitativne prirode, onda ispravnost zaključaka donesenih na temelju njihovih zaključaka u potpunosti ovisi o intuiciji, erudiciji i profesionalnosti istraživača, kao i o logici njegovog rasuđivanja. Ako su ti podaci kvantitativnog tipa, onda se prvo podvrgavaju primarnoj, a zatim sekundarnoj statističkoj obradi. Primarna statistička obrada se sastoji u određivanju potrebnog broja elementarnih matematičkih statistika. Takva obrada gotovo uvijek uključuje barem određivanje srednje vrijednosti uzorka. U slučajevima kada je informativni indikator za eksperimentalnu provjeru predloženih hipoteza raspršenost relativnih srednjih podataka, izračunava se varijansa ili kvadratna devijacija. Preporučljivo je izračunati vrijednost medijane kada se treba koristiti sekundarne statističke metode obrade dizajnirane za normalnu distribuciju.Za ovu vrstu distribucije podataka uzorka medijana, kao i mod, se poklapaju ili su dovoljno blizu srednje vrijednosti vrijednost. Ovaj kriterijum se može koristiti za grubu procenu prirode distribucije dobijenih primarnih podataka.

Sekundarna statistička obrada (poređenje srednjih vrijednosti, varijanse, distribucije podataka, regresiona analiza, korelaciona analiza, faktorska analiza itd.) provodi se ako je za rješavanje problema ili dokaz predloženih hipoteza potrebno utvrditi statističke obrasce. skrivene u primarnim eksperimentalnim podacima. Kada se upusti u sekundarnu statističku obradu, istraživač prije svega mora odlučiti koju od različitih sekundarnih statistika treba koristiti za obradu primarnih eksperimentalnih podataka. Odluka se donosi na osnovu uzimanja u obzir prirode hipoteze koja se testira i prirode primarnog materijala dobijenog kao rezultat eksperimenta. Evo nekoliko preporuka u tom pogledu.

Preporuka 1. Ako eksperimentalna hipoteza sadrži pretpostavku da će se kao rezultat kontinuiranog psihološko-pedagoškog istraživanja pokazatelji bilo kojeg kvaliteta povećati (ili smanjiti), onda se preporučuje korištenje Studentovog testa ili p2-kriterijuma za poređenje pre- i post-eksperimentalnih podataka. Potonji se koristi ako su primarni eksperimentalni podaci relativni i izraženi, na primjer, u postocima.

Preporuka 2. Ako eksperimentalno testirana hipoteza uključuje tvrdnju o uzročno-posledičnoj vezi između nekih varijabli, onda je preporučljivo to provjeriti pozivanjem na linearne ili rang korelacije koeficijenata. Linearna korelacija se koristi kada se nezavisne i zavisne varijable mjere pomoću intervalne skale, a promjene ovih varijabli prije i nakon eksperimenta su male. Korelacija ranga se koristi kada je dovoljno procijeniti promjene u redoslijedu sukcesije nezavisnih i zavisnih varijabli, ili kada su njihove promjene dovoljno velike, ili kada je mjerni alat bio ordinalni, a ne intervalni.

Preporuka 3. Ponekad hipoteza uključuje pretpostavku da će se kao rezultat eksperimenta individualne razlike između ispitanika povećati ili smanjiti. Ova pretpostavka je dobro testirana Fisherovim testom, koji omogućava da se uporede varijanse prije i poslije eksperimenta. Imajte na umu da je, koristeći Fisherov kriterij, moguće raditi samo s apsolutnim vrijednostima indikatora, ali ne i s njihovim rangovima.

Hostirano na Allbest.ru

...

Slični dokumenti

    Osnovne tehnike i metode za obradu i analizu statističkih podataka. Izračunavanje aritmetičkih, harmonijskih i geometrijskih srednjih vrijednosti. Distribucijske serije, njihove glavne karakteristike. Metode poravnanja blizu dinamike. Sistem nacionalnih računa.

    seminarski rad, dodan 24.10.2014

    Pojam ekonomske analize kao nauke, njena suština, predmet, opšte karakteristike metoda i društveno-ekonomska efikasnost. Glavne grupe ekonometrijskih metoda za analizu i obradu podataka. Faktorska analiza ekonomskih podataka preduzeća.

    sažetak, dodan 04.03.2010

    Uzorak aritmetičke sredine, varijansa, standardna devijacija. Odbijanje prema kriteriju Chauvenet. Tri sigma pravilo. Procjena značajnosti razlike između srednjih vrijednosti dva uzorka. Uparene, višestruke regresijske analize. Potpuna faktorska analiza.

    seminarski rad, dodan 05.12.2012

    Primjena različitih metoda prezentacije i obrade statističkih podataka. Prostorni statistički uzorci. Regresija i korelacija u paru. Vremenske serije. Izgradnja trenda. Praktični primjeri i metode za njihovo rješavanje, formule i njihovo značenje.

    kurs predavanja, dodato 26.02.2009

    Statistička obrada rezultata mjerenja; aritmetička sredina, kvadratna, varijansa. Određivanje parametara uzorkovanja: zakon tri sigme, histogram, kontrolne karte, Ishikawa dijagram. Upotreba kvalitetnog alata u izradi sofa.

    seminarski rad, dodan 17.10.2014

    Prosječna vrijednost u statistici, njena suština i uslovi primjene. Vrste i oblici prosjeka: po prisutnosti znak-težine, po obliku proračuna, po obuhvatu stanovništva. Moda, medijana. Statistička studija dinamike profita i profitabilnosti na primjeru JSC "Bashmebel".

    kontrolni rad, dodano 14.06.2008

    Principi statističke obrade podataka, metode i tehnike koje se koriste u ovom procesu. Metodologija i glavne faze u izradi kontrolnih karata, njihova klasifikacija i tipovi, funkcionalne karakteristike, utvrđivanje prednosti i mana aplikacije.

    seminarski rad, dodan 23.08.2014

    Proračun numeričkih karakteristika i obrada rezultata posmatranja uzorka. Proračun i analiza statističkih pokazatelja u privredi. Nacionalno bogatstvo: elementi, procjena; bilans imovine i obaveza; osnovna sredstva, pokazatelji obrtnih sredstava.

    seminarski rad, dodan 25.12.2012

    Deskriptivna statistika i statističko zaključivanje. Metode selekcije koje osiguravaju reprezentativnost uzorka. Utjecaj vrste uzorka na veličinu greške. Zadaci primjene metode uzorkovanja. Distribucija podataka opservacije općoj populaciji.

    test, dodano 27.02.2011

    Objašnjenje pojma: intervalna skala, aritmetička sredina, nivo statističke značajnosti. Kako protumačiti mod, medijan i srednju vrijednost. Rješavanje problema korištenjem Friedman, Rosenbaumov kriterij. Proračun Špremenovog koeficijenta korelacije.

Metode statističke obrade rezultata eksperimenta nazivaju se matematičkim tehnikama, formulama, metodama kvantitativnih proračuna, uz pomoć kojih se pokazatelji dobijeni tokom eksperimenta mogu generalizirati, dovesti u sistem, otkrivajući obrasce skrivene u njima.

Govorimo o takvim pravilnostima statističke prirode koje postoje između varijabli proučavanih u eksperimentu.

Podaci su glavni elementi koji se klasifikuju ili kategorišu u svrhu obrade 26 .

Neke od metoda matematičke i statističke analize omogućavaju izračunavanje takozvanih elementarnih matematičkih statistika koje karakteriziraju distribuciju uzoraka podataka, na primjer:

srednja vrijednost uzorka,

Varijanca uzorka,

Median i drugi.

Druge metode matematičke statistike omogućavaju procjenu dinamike promjena u statistici pojedinačnih uzoraka, na primjer:

analiza disperzije,

Regresiona analiza.

Koristeći treću grupu metoda uzorkovanja, može se pouzdano suditi o statističkim odnosima koji postoje između varijabli koje se ispituju u ovom eksperimentu:

Analiza korelacije;

Faktorska analiza;

metode poređenja.

Sve metode matematičko-statističke analize se konvencionalno dijele na primarne i sekundarne 27 .

Metode se nazivaju primarnim, uz pomoć kojih je moguće dobiti indikatore koji direktno odražavaju rezultate mjerenja napravljenih u eksperimentu.

Sekundarne metode nazivaju se statističkom obradom, uz pomoć kojih se, na osnovu primarnih podataka, otkrivaju statistički obrasci skriveni u njima.

Primarne statističke metode obrade uključuju, na primjer:

Određivanje srednje vrijednosti uzorka;

Varijanca uzorka;

Selektivna moda;

Medijan uzorka.

Sekundarne metode obično uključuju:

Analiza korelacije;

Regresiona analiza;

Metode za poređenje primarne statistike za dva ili više uzoraka.

Razmotrimo metode za izračunavanje elementarne matematičke statistike, počevši od srednje vrijednosti uzorka.

aritmetička sredina - je omjer zbira svih vrijednosti podataka i broja pojmova 28 .

Prosječna vrijednost kao statistički indikator je prosječna procjena psihološkog kvaliteta proučavanog u eksperimentu.

Ova procena karakteriše stepen njenog razvoja u celini u grupi ispitanika koja je bila podvrgnuta psihodijagnostičkom pregledu. Upoređujući direktno prosječne vrijednosti dva ili više uzoraka, možemo suditi o relativnom stepenu razvoja kvaliteta koji se ocjenjuje kod ljudi koji čine ove uzorke.

Srednja vrijednost uzorka se određuje korištenjem sljedeće formule 29:

gdje je x cf srednja vrijednost uzorka ili aritmetička sredina uzorka;

n - broj ispitanika u uzorku ili privatni psihodijagnostički indikatori, na osnovu kojih se izračunava prosječna vrijednost;

x k - privatne vrijednosti indikatora za pojedinačne subjekte. Postoji n takvih indikatora, tako da indeks k ove varijable ima vrijednosti od 1 do n;

∑ - prihvaćen u matematici, znak zbrajanja vrijednosti onih varijabli koje se nalaze desno od ovog znaka.

Disperzija je mjera raspršenosti podataka o srednjoj vrijednosti 30 .

Što je varijansa veća, veća je varijansa ili raspršivanje podataka. Određuje se kako bi se mogle međusobno razlikovati količine koje imaju isti prosjek, ali različito širenje.

Disperzija se određuje sljedećom formulom:

gdje je varijansa uzorka, ili jednostavno varijansa;

Izraz koji znači da je za sve x k od prvog do posljednjeg u ovom uzorku potrebno izračunati razlike između privatnih i prosječnih vrijednosti, kvadrirati ove razlike i zbrojiti ih;

n je broj ispitanika u uzorku ili primarnih vrijednosti za koje se izračunava varijansa.

Medijan naziva se vrijednost osobine koja se proučava, čime se uzorak, poredan po vrijednosti ove osobine, dijeli na pola.

Poznavanje medijane je korisno kako bi se utvrdilo da li je distribucija pojedinih vrijednosti proučavane osobine simetrična i približava se takozvanoj normalnoj distribuciji. Srednja vrijednost i medijan za normalnu distribuciju su obično isti ili se vrlo malo razlikuju jedan od drugog.

Ako je uzorkovana distribucija karakteristika normalna, onda se na nju mogu primijeniti sekundarne statističke metode proračuna zasnovane na normalnoj distribuciji podataka. U suprotnom, to se ne može učiniti, jer se ozbiljne greške mogu uvući u proračune.

Moda još jedna elementarna matematička statistika i karakteristika distribucije eksperimentalnih podataka. Mod je kvantitativna vrijednost osobine koja se proučava, a koja se najčešće nalazi u uzorku.

Za simetrične raspodjele obilježja, uključujući normalnu distribuciju, vrijednosti moda se poklapaju sa srednjom i medijanom vrijednosti. Za druge vrste distribucija, asimetrične, ovo nije tipično.

Metoda sekundarne statističke obrade, kojom se otkriva odnos ili direktna veza između dvije serije eksperimentalnih podataka, naziva se metoda korelacione analize. Pokazuje kako jedna pojava utječe na drugu ili je povezana s njom u svojoj dinamici. Zavisnosti ove vrste postoje, na primjer, između veličina koje su jedna s drugom u uzročno-posledičnoj vezi. Ako se pokaže da su dvije pojave statistički značajno povezane jedna s drugom, i ako u isto vrijeme postoji uvjerenje da jedna od njih može djelovati kao uzrok druge pojave, onda definitivno slijedi da između njih postoji uzročna veza. .

Postoji nekoliko varijanti ove metode:

Analiza linearne korelacije omogućava vam da uspostavite direktne veze između varijabli u njihovim apsolutnim vrijednostima. Ove veze su grafički prikazane pravom linijom, pa otuda i naziv "linearni".

Koeficijent linearne korelacije se određuje pomoću sljedeće formule 31:

gdje je r xy - koeficijent linearne korelacije;

x, y - prosječne vrijednosti uzorka upoređenih vrijednosti;

X i ,y i - vrijednosti privatnih uzoraka upoređenih količina;

P - ukupan broj vrijednosti u upoređenoj seriji indikatora;

Disperzije, odstupanja upoređenih vrijednosti od prosječnih vrijednosti.

Korelacija ranga određuje ovisnost ne između apsolutnih vrijednosti varijabli, već između rednih mjesta, ili rangova, koje zauzimaju u nizu poredanih po veličini. Formula za koeficijent korelacije ranga je 32:

gdje je R s - koeficijent korelacije ranga prema Spearmanu;

d i - razlika između rangova indikatora istih predmeta u uređenim redovima;

P - broj subjekata ili digitalnih podataka (rangova) u koreliranoj seriji.

Atyusheva Anna

U radu, na primeru obrade podataka o napredovanju učenika 7. razreda, razmatraju se glavne statističke karakteristike, vrši se prikupljanje i grupisanje statističkih podataka, jasno su prikazani statistički podaci, a analiza podataka dobijeno se sprovodi.

Rad sadrži propratnu prezentaciju.

Skinuti:

Pregled:

Opštinska autonomna obrazovna ustanova "Gimnazija br. 24"

XXII naučni skup MAGNI

Statistička obrada podataka

MAOU "Gimnazija br. 24" Atyusheva Anna

Konsultant: nastavnik matematike

Shchetinina Natalya Sergeevna

Magadan, 2016

Uvod…………………………………………………………………………………………………………………3

  1. Osnovni koncepti koji se koriste u statističkoj obradi podataka………………………………….5
  2. Istraživački dio……………………………………………………………………………….. . .....7

2.1.Statistička obrada podataka o napredovanju učenika 7. razreda “B”………………… ..7

18

2.3. Uporedne karakteristike obrazovno-vaspitne aktivnosti učenika na osnovu rezultata I i II tromjesečja……………………………………………………………………………………………………………………… …………..21

2.4. Analiza ankete učenika 7. "B" razreda za roditeljsku kontrolu napredovanja djece…………………………………………………………………………………………………………… ………...23

Zaključak…………………………………………………………………………………………………………….27

Literatura……………………………………………………………………………………………………………28

Uvod

Svako od nas, otvarajući knjigu ili novine, uključivanjem televizora ili dolaskom do stanice, stalno se suočava sa tabelarnim oblikom prezentacije informacija. Ovo su raspored časova, raspored vlakova, tablica množenja i još mnogo toga. Sve informacije su predstavljene u obliku grafikona ili grafikona.

Morate biti u stanju obraditi i analizirati takve informacije. Bez obrade podataka, poređenja događaja, nemoguće je pratiti razvoj određenog problema.

U okviru algebre proučavali smo statističke karakteristike koje se široko koriste u raznim studijama. Zanimala me je praktična primjena proučavanih karakteristika, te sposobnost obrade podataka tako da prezentirane informacije jasno određuju tok razvoja određenog problema i, kao rezultat, rezultat njegovog rješavanja. Kao takav problem, odlučio sam da smatram učinak mog razreda u kvartalima prve polovine godine.

Predmetna oblast proučavanja– algebra

Predmet proučavanja– statističke karakteristike

Predmet studija- napredak učenika 7. "B" razreda za tromjesečje prvog polugodišta

hipoteza: Vjerujemo da ćemo se na primjeru obrade podataka o napredovanju učenika 7B razreda ne samo upoznati sa glavnim statističkim karakteristikama, već i sami naučiti:

  • prikupljaju i grupišu statističke podatke;
  • vizualizirati statističke informacije;
  • analizirati primljene podatke.

Cilj: naučiti obraditi, analizirati, vizualizirati dostupne informacije.

Zadaci:

  • proučavanje statističkih karakteristika;
  • prikupljati podatke o napredovanju učenika 7. razreda po četvrtinama

prva polovina godine;

  • procesne informacije;
  • vizualizirati informacije koristeći histograme;
  • analizirati dobijene podatke i donijeti odgovarajuće zaključke.

Osnovni koncepti koji se koriste u statističkoj obradi podataka

Statistika je nauka koja se bavi dobijanjem, obradom i analizom kvantitativnih podataka o raznim masovnim pojavama koje se javljaju u prirodi i društvu. Reč "statistika" dolazi od latinske reči "status", što znači "stanje, stanje stvari".

Najjednostavnije statističke karakteristike su aritmetička sredina, medijan, raspon, mod.

  • aritmetička sredinaniz brojeva naziva se količnik dijeljenja zbira ovih brojeva brojem članova. Obično se aritmetička sredina traži kada se želi odrediti prosječna vrijednost za određenu seriju podataka: prosječan prinos pšenice po 1 hektaru površine, prosječan učinak jedne radničke brigade u smjeni, prosječna ocjena certifikata, prosječna temperatura zraka u podne u ovoj dekadi itd.
  • Medijan uređenog niza brojeva s neparnim brojem članova naziva se broj napisan u sredini, a medijana uređenog niza brojeva s parnim brojem članova naziva se aritmetička sredina dva broja zapisana u sredini. Imajte na umu da je praktičnije i brže raditi sa nizom brojeva ako je naručen, tj. takav niz u kojem svaki sljedeći broj nije manji (ili ne veći) od prethodnog.
  • Moda Niz brojeva naziva se broj koji se najčešće pojavljuje u datom nizu. Skup brojeva može imati više od jednog načina rada ili uopće nema načina. Način niza podataka obično se nalazi kada se želi otkriti neki tipičan indikator. Imajte na umu da se aritmetička sredina niza brojeva možda ne podudara ni sa jednim od ovih brojeva, a modus, ako postoji, nužno se podudara sa dva ili više brojeva u nizu. Osim toga, za razliku od aritmetičke sredine, koncept "moda" se ne odnosi samo na numeričke podatke.
  • na veliki način niz brojeva naziva se razlika između najvećeg i najmanjeg od ovih brojeva. Raspon niza se pronalazi kada se želi odrediti koliko je veliko širenje podataka u nizu.

Definiciju svake od karakteristika prikazaćemo na primjeru niza brojeva: 47,46,52,47,52,47,52,49,45,43,53,53,47,52.

aritmetička sredina 48,7.

Nalazi se na sljedeći način: odredimo zbir brojeva i podijelimo ga njihovim brojem.

(47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7.

Medijan dati niz brojeva će biti broj 48.

To je ovako: slažemo niz brojeva, birajući onaj koji je u sredini. Ako je broj brojeva paran, tada nalazimo aritmetičku sredinu dva broja u sredini niza.

43,45,46,47,47,47, 47,49 ,52,52,52,52,53,53

(47+49):2=48

Moda dati niz brojeva će biti brojevi 47 i 52 . Ovi brojevi se najčešće ponavljaju.

47 ,46, 52 , 47 , 52 , 47 , 52 ,49,45,43,53,53, 47 , 52 .

na veliki način ovaj niz brojeva će biti 10.

Nalazi se na sljedeći način: biramo najveći i najmanji broj niza i nalazimo razliku između ovih brojeva.

47,46,52,47,52,47,52,49,45, 43, 53 ,53,47,52

53-43=10

Istraživački dio

Statistička obrada podataka o napredovanju učenika 7 "B" razreda

Pređimo na obradu informacija. Napravićemo tabele za svaki od predmeta, koje se sastoje od tri reda, u prvom će se nalaziti niz podataka. Svaka varijanta iz ove serije je zapravo posmatrana određeni broj puta u uzorku. Ovaj broj se naziva višestrukost opcija. Dakle, u drugi red stavljamo višestrukost odgovarajuće opcije. Dobijamo uzorak tabele distribucije.

Ako saberemo sve višestruke vrijednosti, dobijamo broj svih mjerenja urađenih tokom uzorka - veličinu uzorka (u našem slučaju, ovaj broj je 24, što odgovara broju učenika u razredu).

U trećem redu, omjer, izražen kao postotak, naziva se učestalost opcija.

opcije frekvencije =

Općenito, ako se tabela relativnih frekvencija sastavi na osnovu rezultata studije, onda je zbir relativnih frekvencija 100%.

I četvrtina

Ruski jezik.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4 ,4 ,4,5.

Prosjek predmeta:(prosjek).

Tabela raspodjele frekvencija

Opcija

Opcije višestrukosti

Ne

Učestalost %

58.3%

37.5%

4.2%

Književnost.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5 ,5 ,5,5.

Prosjek predmeta:(prosjek).

Opcije ocjenjivanja

višestrukost

br

Učestalost %

37.5%

41.7%

20.8%

Algebra.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4 ,4 ,5,5.

Prosjek predmeta:(prosjek).

Najveći broj učenika iz predmeta ima "4, 3" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

45.8%

45.8%

8.3%

Priča.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4 ,4 ,4,5

Prosjek predmeta:(prosjek).

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

45.8%

4.2%

Društvene nauke.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5 ,5 .5.5

Prosjek predmeta:(prosjek).

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

37.5%

41.7%

20.8%

Geografija.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5 ,5,5 ,5

Prosjek predmeta:(prosjek).

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

20.8%

41.7%

37.5%

fizika.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,4,5

Prosjek predmeta:(prosjek).

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

37.5%

58.3%

4.2%

Biologija.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4.4,5,5,5,5,5 ,5 ,5

Prosjek predmeta:(prosjek).

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

45.8%

29.2%

OSNOVE ŽIVOTNE SIGURNOSTI.

Poručimo uzorke podataka (oznake): 4,4,4,4,4,4.4.5,5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 ,5

Prosjek predmeta:(prosjek).

Opcije ocjenjivanja

višestrukost

br

br

Učestalost %

29.2%

70.8%

Poručimo uzorke podataka (oznake): 3,4,4,4.4,4,4,4,4,4,5,5,5,5,5,5,5.5,5,5.5,5,5,5

Prosjek predmeta:(prosjek).

Najveći broj učenika iz predmeta ima "5" (moda)

Otprilike polovina studenata na ruskom studira sa 5 godina (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

4.2%

37.5%

58.3%

Engleski jezik.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5.5,5 ,5 ,5

Prosjek predmeta:(prosjek).

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

37.5%

41.7%

20.8%

Informatika.

Poručimo uzorke podataka (oznake): 3,4,4,4,4.4,4,4,4,4,4,4,4,4,5,5,5,5.5.5,5,5,5 ,5

Prosjek predmeta:(prosjek).

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

4.2%

54.2%

41.7%

Tehnologija.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,4,4,4,4,4,4,5,5,5.5,5,5,55,5,5,5,5 ,5

Prosjek predmeta:(prosjek).

Najveći broj učenika iz predmeta ima "5" (moda)

Otprilike polovina studenata na ruskom studira sa 4,5 (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

20.8%

54.2%

Sada skupimo slične podatke o rezultatima drugog kvartala.

Ruski jezik.

Poručimo uzorke podataka (oznake): 3,3,3.3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,4

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

Ne

br

Učestalost %

41.7%

58.3%

Književnost.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,5,5,5 ,5 .5.5

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "3" (moda)

Otprilike polovina studenata na ruskom studira u 3 (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

41.7%

33.3%

Algebra.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4 ,5 .5.5

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "3" (moda)

Otprilike polovina studenata na ruskom studira u 3 (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

37.5%

12.5%

Priča.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,3,3,3,4.4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,5

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

37.5%

58.3%

4.2%

Društvo.

Poručimo uzorke podataka (oznake): 3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4 ,5 .5.5

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

16.7%

70.8%

12.5%

Geografija.

Poručimo uzorke podataka (oznake): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5 .5.5

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

12.5%

58.3%

29.2%

fizika.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,44,5 ,5 ,5

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

33.3%

16.7%

12.5%

Biologija.

Poručimo uzorke podataka (oznake): 3,3,3,4,4,4,4,4,4,4.4,4,4,4,4,4,4,4,5,5,5,5 ,5 ,5

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

12.5%

62.5%

OSNOVE ŽIVOTNE SIGURNOSTI.

Poručimo uzorke podataka (oznake): 3,4,4,5,5,5,5,5.5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 ,5

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "5" (moda)

Otprilike polovina studenata na ruskom studira sa 5 godina (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

4.2%

8.3%

87.5%

Istorija i društvo zavičajnog kraja.

Poručimo uzorke podataka (oznake): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5 ,5 .5.5

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

12.5%

45.8%

41.7%

Engleski jezik.

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

20.8%

29.2%

Informatika.

Poručimo uzorke podataka (oznake): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5 .5.5

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "4" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

20.8%

29.2%

Tehnologija.

Poručimo uzorke podataka (oznake): 3,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 .5.5

Prosjek predmeta:(prosjek)

Najveći broj učenika iz predmeta ima "5" (moda)

Otprilike polovina studenata na ruskom studira sa 4 godine (medijan)

Opcije ocjenjivanja

višestrukost

br

Učestalost %

4.2%

29.2%

66.7%

Vizualizirajte podatke sa histogramima

Za vizuelni prikaz podataka dobijenih kao rezultat statističke studije, široko se koriste različite metode njihovog predstavljanja.

Koristićemo histograme za vizualizaciju podataka. Histogram je stepenasta figura sastavljena od zatvorenih pravokutnika. Osnova svakog pravougaonika jednaka je dužini intervala, a visina je višestrukost varijante ili relativna frekvencija. Dakle, u histogramu, za razliku od običnog trakastog grafikona, osnove pravokutnika se ne biraju proizvoljno, već su strogo određene dužinom intervala.

Uporedne karakteristike uspješnosti učenika iz predmeta prvog kvartala

Uporedne karakteristike uspjeha učenika u predmetima drugog tromjesečja

nalazi

Prema rezultatima prvog tromjesečja jasno se vidi da se najteži učenici snalaze sa predmetima kao što su: ruski jezik i algebra, predmeti za koje je „trojka“ ocjena koja je prioritetna u odnosu na ostale ocjene. To znači da je kvalitet ovih predmeta niži nego kod drugih.

Takođe je jasno da je visok nivo trojki u predmetima kao što su književnost, istorija, društvo, fizika, engleski jezik. Tužno je i prisustvo trojki u predmetima kao što su tehnologija, biologija, geografija.

Prema rezultatima drugog tromjesečja značajno je smanjen broj trojki i petica, odnosno učenici su rasporedili snage u svim predmetima, a ne u posebno preferiranim.

Histogram distribucije prosječne ocjene u ispitanicima prvog kvartala

Histogram distribucije prosječnog rezultata kod ispitanika drugog kvartala

Zaključak

Za kreiranje ovih grafikona koristili smo takvu statističku karakteristiku kao što je aritmetička sredina. Jasno se vidi da je u drugom kvartalu došlo do pogoršanja znanja ruskog jezika, istorije i društva zavičaja, informatike. Unaprijeđen iz istorije, društva, fizike, biologije, sigurnosti života, engleskog. Ali u isto vrijeme, dijagrami pokazuju da su se značajnije promjene na bolje dogodile samo u fizici i engleskom jeziku.

Uporedne karakteristike obrazovno-vaspitne aktivnosti učenika na osnovu rezultata I i II kvartala

Histogram kvaliteta znanja iz predmeta prvog kvartala

Histogram kvaliteta znanja iz predmeta II kvartal

Kombinovanjem oba histograma u jedan, mnogo je lakše sagledati sliku performansi klase u poređenju. A odvojeno je lakše vidjeti koji su artikli kvalitetniji. Na primjer, u prvom tromjesečju kvalitet je manji od 60% u predmetima - algebra, ruski, historija, u drugom - ruski, književnost, algebra, fizika. Već sada je jasno da su ruski jezik i algebra najteži za učenike. I postotak kvaliteta u svim predmetima nije mnogo različit 66% - prvi kvartal, 68% - drugi. Odnosno, grčeviti kvalitet u predmetima, koji je jasno vidljiv u dijagramu poređenja, sugerira da se studenti zapravo ne trude da unaprijede svoje znanje i ne drže svoje pozicije u jednoj ili drugoj predmetnoj oblasti.

Grafikon upoređivanja svih artikala po kvaliteti za 1 i 2 kvartala

Tokom drugog tromjesečja značajno je porastao broj dobrih učenika i odličnih učenika iz ruskog jezika, društva, biologije, engleskog i tehnologije. Nešto smanjen broj literature, algebre, sigurnosti života, IORK-a i informatike. I primjećuje se snažan pad kvaliteta fizike, koji je povezan sa nepripremljenošću učenika za nastavu.

I opet dolazimo do zaključka da djeca uče „skokove“, a nema posebnih preferencija u smjeru obrazovanja (humanitarni predmeti, fizičko-matematički predmeti, predmeti prirodnog ciklusa).

Analiza ankete učenika 7. "B" razreda za roditeljsku kontrolu napredovanja djece

Na osnovu rezultata navedenog istraživanja, odlučili smo da sprovedemo anketu među učenicima 7. "B" razreda za roditeljsku kontrolu obrazovanja djece (upitnici, vidi prilog)

Veličina uzorka je 22 osobe.

Provjera domaćih zadataka od strane roditelja

Zaključak

Gotovo četvrtina studenata po ovom pitanju je bez roditeljske kontrole, što naravno utiče na njihov akademski uspjeh.

Broj provjera sedmično za domaći zadatak

Medijan = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7,7 = (3+3 ):2 = 3

Aritmetička sredina = 3

Zaključak

U prosjeku, zadaci se pregledavaju tri puta sedmično. S obzirom na skokove u učenju, to nije dovoljno.

Medijan = 0,0,0,0,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,5,5,6,7, 7,7 = (2+2):2 = 2

Aritmetička sredina = 3 (u prosjeku roditelji provjeravaju dnevnike 3 puta sedmično)

Količina vremena koje učenici provode radeći domaće zadatke

Opcije

Manje od 1

Učestalost %

  • Raspon R=x(max) - x(min)= 3,5 - 0,5 = 3 sata

(karakterizira veličinu raspršenosti posmatranih vrijednosti, tj. pokazuje razliku između najdužeg i najkraćeg vremena)

  • Način rada M(0) = 2,5 sata ( pokazuje vrijednost koja se javlja češće od drugih, tj. pokazuje vrijeme koje učenici najčešće provode)

Histogram vremena utrošenog učenika na domaći zadatak

Zaključak

U prosjeku, domaći zadatak traje 2,5 sata dnevno. Što se smatra normalnim za uzrast učenika.

Zaključak

Kao rezultat obavljenog posla naučio sam kako da obradim i analiziram dostupne informacije

Poznavanje statističkih karakteristika pomoglo mi je da odredim prosječne ocjene iz različitih predmeta, kao i modu i raspon u onim pokazateljima uspješnosti gdje bi ih bilo nemoguće odrediti. Bez obrade podataka, poređenja događaja, nemoguće je pratiti razvoj određenog problema. Pokušali smo ne samo da uđemo u trag problemu koji se pojavio – smanjenju kvaliteta znanja i akademskog uspjeha iz predmeta, već i da pokušamo otkriti razlog, koji je, po našem mišljenju, ležao u nedovoljnoj kontroli roditelja nad akademski učinak svoje djece. Anketa i rezultati akademskog uspjeha pokazali su da učenici 7. "B" razreda nemaju dovoljno vještina samokontrole učenja, a roditelji misle suprotno.

Mislim da će obavljeni rad biti od koristi kako odeljenskom starešini u radu sa roditeljima, tako i mojim drugovima iz razreda da ubuduće popravljaju rezultate iz pojedinih predmeta.

Statistika je nauka koja proučava, obrađuje i analizira kvantitativne podatke o širokom spektru masovnih pojava u životu. Njegove karakteristike smo samo malo otkrili za sebe, a pred nama je još puno nepoznatog i zanimljivog.

Bibliografija:

  1. http://www.nado5.ru/e-book/naibolshii-obzchii-delitel
    Pregled:

    Za korištenje pregleda prezentacija, kreirajte Google račun (nalog) i prijavite se: https://accounts.google.com


    Naslovi slajdova:

    Statistička obrada podataka Pripremila: učenica 7. razreda "B" MAOU "Gimnazija br. 24" Atjuševa Anna Konsultant: nastavnica matematike Shchetinina Natalya Sergeevna

    Svrha: naučiti obraditi, analizirati, vizualizirati dostupne informacije. Zadaci: proučavanje statističkih karakteristika; prikuplja podatke o napredovanju učenika 7. B razreda za kvartale prvog polugodišta; procesne informacije; vizualizirati informacije koristeći histograme; analizirati dobijene podatke i donijeti odgovarajuće zaključke.

    Hipoteza na primjeru obrade podataka o uspješnosti učenika, ne samo da se možemo upoznati sa glavnim statističkim karakteristikama, već i naučiti kako prikupljati i grupirati statističke podatke; vizualizirati statističke informacije; analizirati primljene podatke.

    Statistika je nauka koja se bavi dobijanjem, obradom i analizom kvantitativnih podataka o raznim masovnim pojavama koje se javljaju u prirodi i društvu. Reč "statistika" dolazi od latinske reči "status", što znači "stanje, stanje stvari". Najjednostavnije statističke karakteristike: Aritmetička sredina Media Range Mode

    O definiciji svake od karakteristika na primjeru niza brojeva: 47,46,52,47,52,47,52,49,45,43,53,53,47,52. Aritmetička sredina ovog niza brojeva će biti broj 48,7. (47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7. Medijan ovog niza brojeva će biti broj 48. biti brojevi 47 i 52. 47, 46, 52, 47, 52, 47, 52, 49,45,43,53,53, 47, 52. Opseg ove serije brojeva će biti 10. 47,46,52,47,52,47 ,52, 49.45, 43, 53 .53.47.52 53-43=10

    Problemi sa uspehom u 7 "B" razredu

    Varijanta 2 3 4 5 Višestrukost bez varijanti 14 9 1 Učestalost % 0% 58,3% 37,5% 4,2% Ruski jezik. Poručimo uzorke podataka (oznake): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4 ,4 ,4,5. Prosječan rezultat iz predmeta: 14∙3+9∙4+5∙124=8324≈3,5 (aritmetička sredina). Najveći broj učenika u predmetu ima "3" (režim) Otprilike polovina učenika na ruskom jeziku uči na 3 (medijan)

    Za vizuelni prikaz podataka dobijenih kao rezultat statističke studije, široko se koriste različite metode njihovog predstavljanja.

    Uporedne karakteristike napredovanja učenika iz predmeta prvog kvartala

    Uporedne karakteristike napredovanja učenika iz predmeta drugog kvartala

    Histogram distribucije prosječne ocjene u predmetima I i II kvartala

    Dijagram poređenja svih stavki po kvalitetu za I i II kvartal

    Ispitivanje učenika 7 "B" razreda za roditeljsku kontrolu obrazovanja djece UPITNIK 1. Da li roditelji provjeravaju domaći zadatak? ___________________________________________________________ 2. Koliko puta sedmično? _______________________________________________________________ 3. Koliko puta sedmično tvoji roditelji pogledaju tvoj dnevnik? _______________________________________________________________ 4. Koliko vremena u prosjeku dnevno provodite radeći domaći? _______________________________________________________________

    Provjera domaćih zadataka od strane roditelja

    Broj provjera sedmično za domaći Median = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7 , 7 = (3+3):2 = 3 Aritmetička sredina = 3

    Histogram vremena utrošenog učenika na domaći zadatak