Elemente de prelucrare a datelor statistice. Prelucrarea datelor statistice și caracteristicile acesteia Date pentru prelucrarea datelor statistice

Lucrare de laborator nr 3. Prelucrarea datelor statistice în sistemul MatLab

Declarație generală a problemei

Scopul principal al implementării munca de laborator este o introducere în elementele de bază ale procesării datelor statistice în mediul MatLAB.

Partea teoretică

Prelucrarea datelor statistice primare

Prelucrarea datelor statistice se bazează pe metode cantitative primare și secundare. Scopul prelucrării primare a datelor statistice este structurarea informațiilor obținute, implicând gruparea datelor în tabele pivot prin diverși parametri. Datele primare ar trebui să fie prezentate într-un astfel de format încât o persoană să poată face o evaluare aproximativă a setului de date obținut și să dezvăluie informații despre distribuția datelor din eșantionul de date obținut, de exemplu, omogenitatea sau compactitatea datelor. După analiza datelor primare, se aplică metode de prelucrare a datelor statistice secundare, pe baza cărora se determină modele statistice în setul de date existent.

Efectuarea analizei statistice primare pe o matrice de date vă permite să obțineți cunoștințe despre următoarele:

Care este valoarea cea mai reprezentativă pentru eșantion? Pentru a răspunde la această întrebare se determină măsuri ale tendinţei centrale.

Este mare împrăștierea datelor în raport cu această valoare caracteristică, adică care este „blur”-ul datelor? V în acest caz sunt determinate măsuri de variabilitate.

Este de remarcat faptul că indicatorii statistici ai măsurării tendinței și variabilității centrale sunt determinați numai pe date cantitative.

Măsuri de tendință centrală- un grup de valori în jurul căruia sunt grupate restul datelor.Astfel, măsurile tendinței centrale sintetizează setul de date, ceea ce face posibilă formarea de inferențe atât despre eșantionul în ansamblu, cât și realizarea unui comparativ analiza diferitelor mostre între ele.

Să presupunem că există un eșantion de date, atunci măsurile tendinței centrale sunt estimate prin următorii indicatori:

1. Eșantion mediu Este rezultatul împărțirii sumei tuturor valorilor eșantionului la numărul lor. Este determinat de formula (3.1).

(3.1)

Unde - i al-lea element al probei;

n- numărul de elemente din probă.

Media eșantionului oferă cea mai mare precizie în evaluarea tendinței centrale.

Să presupunem că aveți un eșantion de 20 de persoane. Eșantioanele sunt informații despre venitul mediu lunar al fiecărei persoane. Să presupunem că 19 persoane au un venit mediu lunar de 20 tr. si 1 persoana cu un venit de 300 tr. Venitul lunar total al întregului eșantion este de 680 RUB. Media eșantionului în acest caz este S = 34.


2. Median- formează o valoare, deasupra și sub care numărul de valori diferite este același, adică este valoarea centrală într-o serie de date secvențiale. Se determină în funcție de paritatea/negetatea numărului de elemente din eșantion prin formulele (3.2) sau (3.3).Algoritmul de estimare a medianei pentru un eșantion de date:

În primul rând, datele sunt clasate (sortate) în ordine descrescătoare/crescătoare.

Dacă eșantionul ordonat are un număr impar de elemente, atunci mediana coincide cu valoarea centrală.

(3.2)

Unde n

În cazul unui număr par de elemente, mediana este definită ca media aritmetică a celor două valori centrale.

(3.3)

unde este elementul mediu al probei comandate;

- elementul de selecție ordonată care urmează;

Numărul de elemente din eșantion.

Dacă toate elementele eșantionului sunt diferite, atunci exact jumătate dintre elementele eșantionului sunt mai mari decât mediana, iar cealaltă jumătate este mai mică. De exemplu, pentru eșantionul (1, 5, 9, 15, 16), mediana este aceeași cu articolul 9.

În analiza statistică a datelor, mediana vă permite să determinați elementele eșantionului care influențează puternic valoarea mediei eșantionului.

Să presupunem că aveți un eșantion de 20 de persoane. Eșantioanele sunt informații despre venitul mediu lunar al fiecărei persoane. Să presupunem că 19 persoane au un venit mediu lunar de 20 tr. si 1 persoana cu un venit de 300 tr. Venitul lunar total al întregului eșantion este de 680 RUB. Mediana, după ordonarea probei, se determină ca medie aritmetică a elementelor al zecelea și al unsprezecelea ale eșantionului) și este egală cu Me = 20 tr. Acest rezultat este interpretat după cum urmează: mediana împarte eșantionul în două grupuri, astfel încât se poate concluziona că, în primul grup, fiecare persoană are un venit mediu lunar de cel mult 20 de mii de ruble, iar în al doilea grup, la cel puțin 20 de tone. R. În acest exemplu, putem spune că mediana este caracterizată de cât câștigă persoana „medie”. În același timp, valoarea mediei eșantionului este depășită semnificativ S = 34, ceea ce indică inacceptabilitatea acestei caracteristici la evaluarea câștigului mediu.

Astfel, cu cât diferența dintre mediană și media eșantionului este mai mare, cu atât este mai mare împrăștierea datelor eșantionului (în exemplul luat în considerare, o persoană cu un câștig de 300 de mii de ruble diferă în mod clar de oamenii medii dintr-un anumit eșantion și are o impact semnificativ asupra estimarii venitului mediu). Ce să faceți cu astfel de elemente se decide în fiecare caz individual. Dar în cazul general, pentru a asigura fiabilitatea eșantionului, acestea sunt îndepărtate, deoarece au o influență puternică asupra evaluării indicatorilor statistici.

3. Moda (Moe)- formează valoarea cel mai frecvent întâlnită în eșantion, adică valoarea cu cea mai mare frecvență Algoritm de estimare a modului:

În cazul în care o probă conține elemente care apar la fel de des, se spune că nu există modă într-o astfel de probă.

Dacă doi elemente adiacente Deoarece probele au aceeași frecvență, care este mai mare decât frecvența restului eșantionului, atunci modul este determinat ca media acestor două valori.

Dacă două probe au aceeași frecvență, care este mai mare decât frecvența celorlalte eșantioane, iar aceste elemente nu sunt adiacente, atunci se spune că există două moduri în această probă.

Modul în analiza statistică este utilizat în situațiile în care este necesară o evaluare rapidă a măsurării tendinței centrale și nu este necesară o precizie ridicată. De exemplu, moda (din punct de vedere al mărimii sau al mărcii) este convenabil de utilizat pentru a determina hainele și pantofii care sunt cele mai solicitate în rândul clienților.

Măsuri de dispersie (variabilitate).- un grup de indicatori statistici care caracterizează diferențele dintre valorile individuale ale eșantionului. Pe baza indicatorilor măsurilor de dispersie este posibilă estimarea gradului de omogenitate și compactitate a elementelor eșantionului. Măsurile de dispersie sunt caracterizate de următorul set de indicatori:

1. Glisați - este intervalul dintre valorile maxime și minime ale rezultatelor observației (unități de eșantion). O măsură de variație indică răspândirea valorilor într-o populație de date. Dacă intervalul este mare, atunci valorile din agregat sunt foarte împrăștiate, în caz contrar (intervalul este mic) se spune că valorile din agregat se află aproape una de alta. Intervalul este determinat de formula (3.4).

(3.4)

Unde - elementul maxim de probă;

este elementul minim de probă.

2.Abatere medie- diferența de medie aritmetică (în valoare absolută) dintre fiecare valoare din eșantion și media eșantionului acesteia. Abaterea medie este determinată de formula (3.5).

(3.5)

Unde - i al-lea element al probei;

Valoarea mediei eșantionului, calculată prin formula (3.1);

Numărul de elemente din eșantion.

Modul este necesar datorită faptului că abaterile de la medie pentru fiecare element specific pot fi atât pozitive, cât și negative. Prin urmare, dacă nu luați modulul, atunci suma tuturor abaterilor va fi aproape de zero și va fi imposibil să judecați gradul de variabilitate a datelor (aglomerarea datelor în jurul mediei eșantionului). La efectuarea analizei statistice, se pot lua modul și mediana în locul mediei eșantionului.

3. Dispersia- o măsură a împrăștierii care descrie abaterea comparativă între valorile datelor și medie. Se calculează ca suma pătratelor abaterilor fiecărui element eșantion de la medie. În funcție de dimensiunea eșantionului, varianța este estimată căi diferite:

Pentru probe mari (n> 30) prin formula (3.6)

(3.6)

Pentru mostre mici (n<30) по формуле (3.7)

(3.7)

unde X i este al i-lea element al probei;

S este valoarea medie a probei;

Numărul de elemente din eșantion;

(X i - S) este abaterea de la medie pentru fiecare valoare din setul de date.

4. Deviație standard-o măsură a cât de larg sunt împrăștiate punctele de date în raport cu media lor.

Procesul de pătrare a abaterilor individuale în calcularea varianței crește gradul de abatere a abaterii rezultate de la abaterile inițiale, ceea ce, la rândul său, introduce erori suplimentare. Astfel, pentru a aproxima estimarea răspândirii punctelor de date în raport cu media lor la valoarea abaterii medii, din varianță se extrage rădăcina pătrată. Rădăcina extrasă a varianței caracterizează o măsură a variabilității numită rădăcină pătrată medie sau abatere standard (3.8).

(3.8)

Să presupunem că sunteți manager de proiect de dezvoltare software. Aveți cinci programatori subordonați. Prin gestionarea procesului de execuție a proiectului, distribuiți sarcinile între programatori. Pentru simplitatea exemplului, vom pleca de la faptul că sarcinile sunt echivalente în complexitate și timp de execuție. Ați decis să analizați munca fiecărui programator (numărul de sarcini finalizate în timpul săptămânii) din ultimele 10 săptămâni, în urma cărora ați primit următoarele mostre:

Numele săptămânii

După estimarea numărului mediu de sarcini finalizate, ați obținut următorul rezultat:

Numele săptămânii S
22,3
22,4
22,2
22,1
22,5

Pe baza indicatorului S, toți programatorii lucrează în medie cu aceeași eficiență (aproximativ 22 de sarcini pe săptămână). Cu toate acestea, indicatorul de variabilitate (interval) este foarte mare (de la 5 sarcini ale celui de-al patrulea programator la 24 de sarcini pentru al cincilea).

Numele săptămânii S P
22,3
22,4
22,2
22,1
22,5

Să estimăm abaterea standard, care arată cum sunt distribuite valorile din eșantioane în raport cu medie, și anume, în cazul nostru, să estimăm cât de mare este răspândirea sarcinilor de la o săptămână la alta.

Numele săptămânii S P ASA DE
22,3 1,56
22,4 1,8
22,2 2,84
22,1 1,3
22,5 5,3

Estimarea rezultată a abaterii standard spune următoarele (să estimăm doi programatori de cazuri extreme 4 și 5):

Fiecare valoare dintr-un eșantion de 4 programatori se abate în medie cu 1,3 sarcini de la valoarea medie.

Fiecare valoare din eșantionul 5 al programatorului se abate în medie cu 5,3 sarcini de la valoarea medie.

Cu cât abaterea standard este mai aproape de 0, cu atât este mai fiabilă media, deoarece aceasta indică faptul că fiecare valoare a eșantionului este aproape egală cu medie (în exemplul nostru, aceasta este de 22,5 elemente). În consecință, al 4-lea programator este cel mai consistent în contrast cu al 5-lea. Variabilitatea performanței sarcinilor de la o săptămână la alta a celui de-al 5-lea programator este de 5,3 sarcini, ceea ce indică o dispersie semnificativă. În cazul celui de-al 5-lea programator, nu poți avea încredere în medie și, prin urmare, este dificil să prezici numărul de sarcini finalizate pentru săptămâna următoare, ceea ce, la rândul său, face dificilă planificarea și respectarea programelor de lucru. Ce decizie de management luați în acest curs este irelevantă. Este important să primiți o evaluare pe baza căreia pot fi luate decizii de management adecvate.

Astfel, se poate trage o concluzie generală că media nu întotdeauna estimează corect datele. Corectitudinea estimării mediei poate fi judecată după valoarea abaterii standard.


1. Instrumente pentru prelucrarea datelor statistice în Excel

2. Utilizarea funcţiilor speciale

3. Utilizarea instrumentului ANALYSIS PACKAGE

Literatură:

principalul:

1. Burke. Analiza datelor folosind Microsoft Excel. : Per. din engleză / Burke, Kenneth, Carey, Patrick. - M.: Editura „Williams”, 2005. - S. 216 - 256.

2. Mishin A.V. Tehnologii informaționale în activitatea juridică: atelier / A.V. Mishin. - M .: RAP, 2013 .-- S. 2-11.

adiţional:

3. Informatica pentru avocati si economisti: manual pentru universitati / Ed. S.V. Simonovici. - SPb .: Peter, 2004 .-- S. 498-516.

Lecția practică numărul 30

Subiectul nr. 11.1. Întreținerea bazei de date în Access DBMS

Lecția se desfășoară folosind metoda proiectului.

Scopul proiectului: dezvoltarea unei baze de date cu privire la activitatea instanței.

Sarcina tehnica:

1. Creați o bază de date „Instanța” din două tabele „Judecători” și „Pretenții” cu următoarea structură, respectiv:

Tabelul „Judecători”

Numele domeniului Codul judecătorului NUMELE COMPLET Zilele de recepție Ore de afaceri Experiență de muncă
Tip de date Numeric Text Text Text Numeric
Dimensiunea campului Număr întreg lung Număr întreg lung
Format câmp De bază De bază
Zecimale
Valoare implicită "miercuri" „15:00-17:00”
Condiție de valoare > 36200 Și<36299 Luni sau marți sau miercuri sau joi sau vineri > 0 Și<40
Mesaj de eroare Valorile valide sunt Luni, Marți, Miercuri, Joi sau Vineri. Vă rugăm să reintroduceți! ! Valorile valide sunt de la 1 la 39. Reintroduceți!
Câmp obligatoriu da da Nu Nu Nu
Câmp indexat Nu Nu Nu Nu

Notă. Declarați câmpul cheie „Cod judecător”.

Tabel de revendicari

Numele domeniului Numărul cazului Reclamant Răspuns-pui Codul judecătorului Data întâlnirii
Tip de date Numeric Text Text Numeric Data Ora
Proprietăți câmp: fila General
Dimensiunea campului Număr întreg lung Număr întreg lung Format de dată completă
Format câmp De bază
Zecimale
Valoare implicită
Condiție de valoare > 0 Și<99999 > 36200 Și<36299
Mesaj de eroare Intrare greșită - repetați! Valorile valide sunt de la 36201 la 36298. Vă rugăm să reintroduceți!
Câmp obligatoriu da Nu Nu Nu Nu
Câmp indexat Da (nu sunt permise potriviri) Nu Nu Da (meciuri permise) Nu

2. Introduceți următoarele înregistrări de date în tabelul Judecători:

Introduceți următoarele înregistrări de date în tabelul de revendicări:

3. În câmpul „Cod judecător” stabiliți o relație unu-la-mulți între tabele Judecătoriiși Procese... Când faceți acest lucru, setați „Asigurați integritatea datelor” și „Actualizarea în cascadă a câmpurilor legate”.

Literatură:

principalul:

1. Mishin A.V. Tehnologiile informației în activitatea profesională: manual / A.V. Mishin, L.E. Mistrov, D.V. Kartavtsev. - M .: RAP, 2011 .-- S. 259-264.

adiţional:

Lecția practică numărul 31

Subiectul nr. 11.2. Principiile creării de formulare și interogări în Access DBMS

1. Elaborarea formularelor de intrare pentru introducerea datelor.

2. Metodologia de calcul și analiză a datelor introduse.

Literatură:

principalul:

1. Mishin A.V. Tehnologiile informației în activitatea profesională: manual / A.V. Mishin, L.E. Mistrov, D.V. Kartavtsev. - M .: RAP, 2011 .-- S. 265-271.

adiţional:

2. Informatica si tehnologia informatiei: un manual pentru studenti / I.G. Lesnichaya, I.V. Lipsește, Yu.D. Romanov, V.I. Shestakov. - Ed. a II-a. - M .: Eksmo, 2006 .-- 544 p.

3. Mihaiva E.V. Tehnologiile informației în activitatea profesională: un manual pentru elevii școlilor secundare profesionale / E.V. Mihaiva. - Ed. a II-a, Șters. - M .: Academia, 2005 .-- 384 p.

Trimiteți-vă munca bună în baza de cunoștințe este simplu. Utilizați formularul de mai jos

Studenții, studenții absolvenți, tinerii oameni de știință care folosesc baza de cunoștințe în studiile și munca lor vă vor fi foarte recunoscători.

Postat pe http://www.allbest.ru/

Prelucrarea datelor statistice

Introducere

corelația eșantionului de varianță statistică

Metodele de prelucrare statistică a rezultatelor unui experiment sunt tehnici matematice, formule, metode de calcul cantitativ, cu ajutorul cărora indicatorii obținuți în timpul experimentului pot fi generalizați, aduși într-un sistem, dezvăluind legile ascunse în ele. Vorbim despre astfel de regularități de natură statistică care există între variabilele studiate în experiment.

Unele dintre metodele de analiză matematică și statistică permit calcularea așa-numitelor statistici matematice elementare care caracterizează distribuția eșantionului de date, de exemplu, media eșantionului, varianța eșantionului, modul, mediana și o serie de altele. Alte metode de statistică matematică, de exemplu, analiza varianței, analiza de regresie, fac posibilă aprecierea dinamicii modificărilor statisticilor individuale ale eșantionului. Cu ajutorul celui de-al treilea grup de metode, să zicem, analiza corelației, analiza factorială, metode de comparare a datelor din eșantion, se pot judeca în mod fiabil relațiile statistice care există între variabilele care sunt investigate în acest experiment.

1. Metode de prelucrare statistică primară a rezultatelor experimentale

Toate metodele de analiză matematică și statistică sunt împărțite în mod convențional în primare și secundare. Metodele care pot fi folosite pentru a obține indicatori care reflectă direct rezultatele măsurătorilor efectuate într-un experiment sunt numite metode primare. În consecință, indicatorii statistici primari înseamnă cei care sunt utilizați în metodele de psihodiagnostic în sine și sunt rezultatul prelucrării statistice inițiale a rezultatelor psihodiagnosticului. Sunt denumite metode secundare de prelucrare statistică, cu ajutorul cărora, pe baza datelor primare, sunt dezvăluite modele statistice ascunse în ele.

Metodele primare de procesare statistică includ, de exemplu, determinarea mediei eșantionului, a varianței eșantionului, a modului eșantionului și a mediei eșantionului. Metodele secundare includ de obicei analiza corelației, analiza regresiei, metode de comparare a statisticilor primare în două sau mai multe eșantioane.

Luați în considerare metode de calcul al statisticilor matematice elementare.

1.1 Moda

Caracteristica numerică a unui eșantion, care, de regulă, nu necesită calcule, este așa-numitul mod. Moda este valoarea cantitativă a trăsăturii studiate, care se regăsește cel mai adesea în eșantion. Pentru distribuțiile de caracteristici simetrice, inclusiv distribuția normală, valoarea modului coincide cu valorile medii și mediane. Pentru alte tipuri de distribuție, asimetrică, acest lucru nu este tipic. De exemplu, în secvența valorilor caracteristicilor 1, 2, 5, 2, 4, 2, 6, 7, 2, modul este valoarea 2, deoarece apare mai des decât alte valori - de patru ori.

Moda se găsește după următoarele reguli:

1) În cazul în care toate valorile din eșantion apar la fel de des, se acceptă în general că această serie de eșantion nu are nici un mod. De exemplu: 5, 5, 6, 6, 7, 7 - nu există modă în acest eșantion.

2) Când două valori adiacente (adiacente) au aceeași frecvență și frecvența lor este mai mare decât frecvența oricăror alte valori, modul este calculat ca media aritmetică a acestor două valori. De exemplu, în eșantionul 1, 2, 2, 2, 5, 5, 5, 6, frecvențele valorilor adiacente 2 și 5 coincid și sunt egale cu 3. Această frecvență este mai mare decât frecvența altor valori 1 și 6 (pentru care este egal cu 1). Prin urmare, modul acestei serii va fi valoarea = 3,5

3) Dacă două valori non-adiacente (nu adiacente) din eșantion au frecvențe egale care sunt mai mari decât frecvențele oricărei alte valori, atunci se disting două moduri. De exemplu, în rândul 10, 11, 11, 11, 12, 13, 14, 14, 14, 17, modurile sunt 11 și 14. În acest caz, se spune că eșantionul este bimodal.

Pot exista, de asemenea, așa-numitele distribuții multimodale cu mai mult de două vârfuri (moduri).

4) Dacă modul este estimat prin setul de date grupate, atunci pentru a găsi modul este necesar să se determine grupul cu cea mai mare frecvență a caracteristicii. Acest grup se numește grup modal.

1.2 Mediană

Mediana este valoarea trăsăturii studiate, care împarte eșantionul, ordonat după valoarea acestei trăsături, la jumătate. La dreapta și la stânga medianei, în seria ordonată rămâne același număr de caracteristici. De exemplu, pentru eșantionul 2, 3, 4, 4, 5, 6, 8, 7, 9, mediana va fi 5, deoarece există patru indicatori în stânga și în dreapta acestuia. Dacă seria include un număr par de caracteristici, atunci mediana va fi media luată ca o jumătate de sumă a valorilor celor două valori centrale ale seriei. Pentru următorul rând 0, 1, 1, 2, 3, 4, 5, 5, 6, 7, mediana va fi 3,5.

Cunoașterea mediei este utilă pentru a determina dacă distribuția valorilor particulare ale trăsăturii studiate este simetrică și apropiată de așa-numita distribuție normală. Media și mediana pentru distribuția normală coincid de obicei sau diferă foarte puțin una de cealaltă. Dacă distribuția eșantionului de caracteristici este normală, atunci i se pot aplica metode de calcule statistice secundare bazate pe distribuția normală a datelor. În caz contrar, acest lucru nu se poate face, deoarece erorile grave se pot strecura în calcule.

1.3 Media eșantionului

Valoarea medie a eșantionului (media aritmetică) ca indicator statistic este estimarea medie a calității psihologice studiate în experiment. Această evaluare caracterizează gradul dezvoltării sale în ansamblu în acel grup de subiecți care a fost supus examinării psihodiagnostice. Prin compararea directă a valorilor medii a două sau mai multe eșantioane, putem judeca gradul relativ de dezvoltare la persoanele care alcătuiesc aceste probe, calitatea evaluată.

1.4 Răspândirea probei

Răspândirea (uneori această valoare se numește interval) eșantionului este notă cu litera R. Acesta este cel mai simplu indicator care poate fi obținut pentru o probă - diferența dintre valorile maxime și minime ale unei anumite serii de variații, adică

R = xmax - xmin

Este clar că cu cât variază mai mult caracteristica măsurată, cu atât valoarea lui R este mai mare și invers. Cu toate acestea, se poate întâmpla ca pentru două serii de eșantioane atât mediile, cât și intervalul să fie aceleași, dar natura variației acestor serii va fi diferită. De exemplu, sunt date două mostre:

X = 10 15 20 25 30 35 40 45 50 X = 30 R = 40

Y = 10 28 28 30 30 30 32 32 50 Y = 30 R = 40

Cu egalitatea de medii și diferențe pentru aceste două serii de eșantioane, natura variației lor este diferită. Pentru a înțelege mai clar natura variației eșantioanelor, ar trebui să ne referim la distribuțiile acestora.

1.5 Dispersie

Varianta este media aritmetică a pătratelor abaterilor valorilor unei variabile de la media acesteia.

Varianta ca statistică caracterizează cât de mult se abate valorile particulare de la medie dintr-un eșantion dat. Cu cât varianța este mai mare, cu atât abaterea sau dispersarea datelor sunt mai mari.

Rădăcina pătrată este extrasă din suma pătratelor împărțită la numărul de termeni din serie.

Uneori, există destul de multe date primare private inițiale care sunt supuse prelucrării statistice și necesită un număr mare de operații aritmetice elementare. Pentru a reduce numărul acestora și, în același timp, a menține acuratețea necesară a calculelor, uneori recurg la înlocuirea eșantionului original de date empirice particulare cu intervale. Un interval este un grup de valori caracteristice sortate după valoare, care este înlocuit cu valoarea medie în procesul de calcul.

2. Metode de prelucrare statistică secundară a rezultatelor experimentale

Cu ajutorul metodelor secundare de prelucrare statistică a datelor experimentale, ipotezele asociate experimentului sunt direct verificate, dovedite sau infirmate. Aceste metode, de regulă, sunt mai complexe decât metodele de prelucrare statistică primară și necesită o bună pregătire din partea cercetătorului în domeniul matematicii și statisticii elementare. (7).

Grupul de metode discutat poate fi împărțit în mai multe subgrupe:

1. Calcul de regresie.

2. Metode de comparare a două sau mai multe statistici elementare (medii, varianțe etc.) legate de diferite eșantioane.

3. Metode de stabilire a relaţiilor statistice între variabile, de exemplu, corelarea acestora între ele.

4. Metode de identificare a structurii statistice interne a datelor empirice (de exemplu, analiza factorială). Să luăm în considerare fiecare dintre subgrupurile selectate de metode de procesare statistică secundară prin exemple.

2.1 Calcul de regresie

Calculul de regresie este o metodă de statistică matematică care vă permite să reduceți datele private, disparate la un anumit grafic linie, reflectând aproximativ interconectarea lor internă și să obțineți capacitatea de a estima aproximativ valoarea probabilă a unei alte variabile prin valoarea uneia dintre variabile. variabile (7).

Expresia grafică a unei ecuații de regresie se numește linie de regresie. Linia de regresie exprimă cele mai bune predicții ale variabilei dependente (Y) pentru variabilele independente (X).

Regresia este exprimată folosind două ecuații de regresie, care în cel mai direct caz arată ca ecuații în linie dreaptă.

Y = a 0 + a 1 * X

X = b 0 + b 1 * Y

În ecuația (1), Y este variabila dependentă, X este variabila independentă, a 0 este o intersecție, a 1 este coeficientul de regresie sau panta, care determină panta dreptei de regresie față de axele de coordonate.

În ecuația (2) X este variabila dependentă, Y este variabila independentă, b 0 este intersecția, b 1 este coeficientul de regresie sau panta, care determină panta dreptei de regresie față de axele de coordonate.

Cuantificarea relației (relației) dintre X și Y (între Y și X) se numește analiză de regresie. Sarcina principală a analizei de regresie este de a găsi coeficienții a 0, b 0, a1 și b 1 și de a determina nivelul de semnificație al expresiilor analitice obținute care leagă variabilele X și Y.

Pentru a aplica metoda analizei regresiei lineare, trebuie îndeplinite următoarele condiții:

1. Variabilele comparate X și Y ar trebui măsurate pe o scară de intervale sau rapoarte.

2. Se presupune că variabilele X și Y au o distribuție normală.

3. Numărul de caracteristici diferite din variabilele comparate ar trebui să fie același. (5).

2.2 Corelație

Următoarea metodă de prelucrare statistică secundară, prin care se clarifică relația sau relația directă dintre două serii de date experimentale, se numește metoda corelațiilor. Arată cum un fenomen influențează pe altul sau este legat de acesta în dinamica sa. Acest tip de relație există, de exemplu, între cantitățile care sunt în relații cauzale între ele. Dacă se dovedește că două fenomene se corelează statistic unul cu celălalt și dacă, în același timp, există încredere că unul dintre ele poate acționa ca cauza celuilalt fenomen, atunci aceasta implică cu siguranță concluzia că există o relație cauzală între ele. . (7)

Când o creștere a nivelului unei variabile este însoțită de o creștere a nivelului alteia, atunci vorbim de o corelație pozitivă. Dacă creșterea unei variabile are loc cu o scădere a nivelului celeilalte, atunci se vorbește de o corelație negativă. În absența unei legături între variabile, avem de-a face cu corelație zero. (unu)

Există mai multe variante ale acestei metode: liniară, ordonată, pereche și multiplă. Analiza corelației liniare vă permite să stabiliți relații directe între variabile prin valorile lor absolute. Aceste conexiuni sunt exprimate grafic ca o linie dreaptă, de unde și numele „liniar”. Corelația de rang determină dependența nu între valorile absolute ale variabilelor, ci între locurile ordinale sau rangurile ocupate de acestea în ordinea mărimii. Analiza corelației în perechi include studiul dependențelor de corelație doar între perechi de variabile și multiple, sau multivariabile, - între mai multe variabile în același timp. Analiza factorială este o formă răspândită de analiză a corelației multivariate în statistica aplicată. (5)

Coeficientul de corelare a rangului în cercetarea psihologică și pedagogică este abordat în cazul în care semnele între care se stabilește dependența sunt calitativ diferite și nu pot fi apreciate cu acuratețe folosind așa-numita scală de măsurare a intervalului. O scară de interval se numește o scară care permite cuiva să evalueze distanța dintre valorile sale și să judece care dintre ele este mai mare și cu cât mai mare decât cealaltă. De exemplu, rigla folosită pentru a evalua și compara lungimile obiectelor este o scară de interval, deoarece, folosind-o, putem argumenta că distanța dintre doi și șase centimetri este de două ori mai mare decât distanța dintre șase și opt centimetri. Dacă, folosind un instrument de măsurare, putem afirma doar că unii indicatori sunt mai mulți decât alții, dar nu sunt capabili să spună cu câți, atunci un astfel de instrument de măsurare se numește nu interval, ci ordinal.

Majoritatea indicatorilor care sunt obținuți în cercetarea psihologică și pedagogică se referă mai degrabă la scale ordinale decât pe intervale (de exemplu, evaluări precum „da”, „nu”, „mai degrabă nu decât da” și altele care pot fi convertite în puncte), prin urmare , nu le este aplicabil coeficientul de corelație liniară.

Metoda corelațiilor multiple, spre deosebire de metoda corelațiilor perechi, face posibilă dezvăluirea structurii generale a dependențelor de corelație existente în cadrul unui material experimental multidimensional, incluzând mai mult de două variabile, și prezentarea acestor dependențe de corelație sub forma unui anumit sistem.

Pentru a aplica un anumit coeficient de corelație, trebuie îndeplinite următoarele condiții:

1. Variabilele comparate trebuie măsurate pe o scară de intervale sau rapoarte.

2. Se presupune că toate variabilele au o distribuție normală.

3. Numărul de caracteristici diferite din variabilele comparate ar trebui să fie același.

4. Pentru a evalua nivelul de fiabilitate al raportului de corelație Pearson, utilizați formula (11.9) și tabelul de valori critice pentru testul t Student la k = n - 2. (5)

2.3 Analiza factorială

Analiza factorială este o metodă statistică care este utilizată atunci când se prelucrează matrice mari de date experimentale. Sarcinile analizei factoriale sunt: ​​reducerea numărului de variabile (reducerea datelor) și determinarea structurii relațiilor dintre variabile, i.e. clasificarea variabilelor, prin urmare analiza factorială este utilizată ca metodă de reducere a datelor sau ca metodă de clasificare structurală.

O diferență importantă între analiza factorială și toate metodele descrise mai sus este că nu poate fi utilizată pentru a procesa date experimentale primare sau, după cum se spune, „brute”, de exemplu. obtinute direct din examinarea subiectelor. Materialul pentru analiza factorială este legăturile de corelație, sau mai degrabă, coeficienții de corelație ai lui Pearson, care sunt calculați între variabilele (adică, caracteristicile psihologice) incluse în sondaj. Cu alte cuvinte, matricele de corelație sau, așa cum se numesc altfel, matricele de intercorelație, sunt supuse analizei factoriale. Numele coloanelor și rândurilor din aceste matrice sunt aceleași, deoarece reprezintă o listă de variabile incluse în analiză. Din acest motiv, matricele de intercorelare sunt întotdeauna pătrate, adică. numărul de rânduri din ele este egal cu numărul de coloane și simetric, adică în locuri simetrice față de diagonala principală, există aceiași coeficienți de corelație.

Conceptul principal de analiză factorială este un factor. Acesta este un indicator statistic artificial care apare ca urmare a unor transformări speciale ale tabelului de coeficienți de corelație între caracteristicile psihologice studiate, sau matricea de intercorelație. Procedura de extragere a factorilor din matricea de intercorelație se numește factorizare matriceală. Ca urmare a factorizării, din matricea de corelație se poate extrage un număr diferit de factori, până la un număr egal cu numărul de variabile inițiale. Cu toate acestea, factorii identificați ca urmare a factorizării sunt, de regulă, inegale ca importanță. (5)

Factorii identificați explică interdependența fenomenelor psihologice. (7)

Cel mai adesea, în urma analizei factoriale, nu se determină unul, ci mai mulți factori, care explică în moduri diferite matricea de intercorelație a variabilelor. În acest caz, factorii sunt împărțiți în factori generali, generali și individuali. Factorii generali sunt numiți factori, toate sarcinile factoriale sunt semnificativ diferite de zero (sarcina zero indică faptul că această variabilă nu este în niciun fel conectată cu restul și nu are niciun efect asupra lor în viață). Factorii comuni sunt factori pentru care unele dintre încărcările factorilor sunt diferite de zero. Factorii unici sunt factori în care doar una dintre sarcini diferă semnificativ de zero. (7)

Analiza factorială poate fi adecvată dacă sunt îndeplinite următoarele criterii.

1. Este imposibil să factorizați datele calitative obținute prin scara denumirilor, de exemplu, cum ar fi culoarea părului (negru / maro / roșu), etc.

2. Toate variabilele ar trebui să fie independente, iar distribuția lor să fie apropiată de normal.

3. Relațiile dintre variabile trebuie să fie aproximativ liniare, sau cel puțin să nu aibă un caracter clar curbiliniu.

4. Matricea de corelație originală trebuie să aibă mai multe corelații în valoare absolută peste 0,3. În caz contrar, este destul de dificil să extragi orice factori din matrice.

5. Eșantionul de subiecți ar trebui să fie suficient de mare. Sfatul experților variază. Cel mai rigid punct de vedere recomandă să nu se folosească analiza factorială dacă numărul de subiecți este mai mic de 100, deoarece erorile standard ale corelației în acest caz vor fi prea mari.

Cu toate acestea, dacă factorii sunt bine definiți (de exemplu, cu sarcini de 0,7 mai degrabă decât 0,3), experimentatorul are nevoie de o probă mai mică pentru a-i izola. În plus, dacă se știe că datele obținute sunt foarte fiabile (de exemplu, se folosesc teste valide), atunci datele pot fi analizate pentru un număr mai mic de subiecți. (5).

2.4 ȘIfolosind analiza factorială

Analiza factorială este utilizată pe scară largă în psihologie în diverse direcții legate de rezolvarea problemelor atât teoretice, cât și practice.

În termeni teoretici, utilizarea analizei factoriale este asociată cu dezvoltarea așa-numitei abordări analitice factoriale pentru studiul structurii personalității, temperamentului și abilităților. Utilizarea analizei factoriale în aceste domenii se bazează pe ipoteza larg acceptată că indicatorii observabili și direct măsurabili sunt doar manifestări externe indirecte și/sau parțiale ale unor caracteristici mai generale. Aceste caracteristici, spre deosebire de primele, sunt ascunse, așa-numitele variabile latente, deoarece sunt concepte sau constructe care nu sunt disponibile pentru măsurarea directă. Totuși, ele pot fi stabilite prin factorizarea corelațiilor dintre caracteristicile observate și identificarea factorilor care (cu condiția ca structura să fie bună) pot fi interpretați ca o expresie statistică a variabilei latente dorite.

Deși factorii sunt de natură pur matematică, se presupune că reprezintă variabile ascunse (construcții sau concepte postulate teoretic), prin urmare, denumirile factorilor reflectă adesea esența constructului ipotetic studiat.

În prezent, analiza factorială este utilizată pe scară largă în psihologia diferenţială şi psihodiagnostic. Cu ajutorul acestuia, puteți proiecta teste, puteți stabili structura conexiunilor dintre caracteristicile psihologice individuale măsurate printr-un set de teste sau elemente de testare.

Analiza factorială este, de asemenea, utilizată pentru standardizarea metodelor de testare, care este efectuată pe un eșantion reprezentativ de subiecți.

Concluzie

Dacă datele obținute în experiment sunt de natură calitativă, atunci corectitudinea concluziilor trase pe baza concluziilor lor depinde în totalitate de intuiția, erudiția și profesionalismul cercetătorului, precum și de logica raționamentului acestuia. Dacă aceste date sunt de tip cantitativ, atunci mai întâi își realizează prelucrarea statistică primară, apoi secundară. Prelucrarea statistică primară constă în determinarea numărului necesar de statistici matematice elementare. O astfel de prelucrare implică aproape întotdeauna cel puțin determinarea unei medii de probă. În cazurile în care răspândirea datelor medii relative reprezintă un indicator informativ pentru verificarea experimentală a ipotezelor propuse, se calculează varianța sau abaterea standard. Se recomandă calcularea valorii medianei atunci când se presupune că se utilizează metode de prelucrare statistică secundară calculate pe o distribuție normală.Pentru acest tip de distribuție a datelor eșantionului, mediana, precum și modul, coincid sau sunt suficient de apropiate. la valoarea medie. Acest criteriu poate fi utilizat pentru a aprecia în general natura distribuției rezultate a datelor primare.

Prelucrările statistice secundare (compararea mediilor, varianțele, distribuțiile datelor, analiza regresiei, analiza corelațiilor, analiza factorială etc.) se efectuează dacă, pentru a rezolva probleme sau pentru a demonstra ipotezele propuse, este necesară determinarea tiparelor statistice ascunse. în datele experimentale primare. Când începe procesarea statistică secundară, cercetătorul trebuie mai întâi să decidă care dintre diferitele statistici secundare ar trebui să folosească pentru a procesa datele experimentale primare. Decizia se ia pe baza luării în considerare a naturii ipotezei testate și a naturii materialului primar obținut în urma experimentului. Iată câteva recomandări în acest sens.

Recomandarea 1. Daca ipoteza experimentala contine presupunerea ca, in urma cercetarilor psihologice si pedagogice, indicatorii de orice calitate vor creste (sau scade), atunci se recomanda folosirea criteriului Student sau a criteriului ch2 pentru compararea pre - și date post-experimentale. La acesta din urmă se face referire dacă datele experimentale primare sunt relative și exprimate, de exemplu, ca procent.

Recomandarea 2. Dacă o ipoteză testată experimental include o afirmație despre o relație cauzală între unele variabile, atunci este recomandabil să o testăm prin referire la coeficienții de corelație liniară sau de rang. Corelația liniară este utilizată atunci când variabilele independente și dependente sunt măsurate folosind o scară de interval, iar modificările acestor variabile înainte și după experiment sunt mici. Se face referire la corelația de rang atunci când este suficient să se evalueze modificările în ordinea succesiunii în termeni de mărime a variabilelor independente și dependente, sau când modificările lor sunt suficient de mari, sau când instrumentul de măsurare a fost mai degrabă ordinal decât interval.

Recomandarea 3. Uneori, o ipoteză include presupunerea că, în urma experimentului, diferențele individuale dintre subiecți vor crește sau descrește. Această ipoteză este bine verificată folosind testul Fisher, care permite compararea variațiilor înainte și după experiment. Rețineți că, folosind criteriul lui Fisher, se poate lucra numai cu valori absolute ale indicatorilor, dar nu și cu rangurile acestora.

Postat pe Allbest.ru

...

Documente similare

    Tehnici și metode de bază de prelucrare și analiză a datelor statistice. Calculul valorilor medii aritmetice, armonice și geometrice. Serii de distribuție, principalele lor caracteristici. Tehnici de aliniere în apropierea dinamicii. Sistemul de Conturi Nationale.

    lucrare de termen adăugată la 24.10.2014

    Conceptul de analiză economică ca știință, esența sa, subiectul, caracteristicile generale ale metodelor și eficiența socio-economică. Principalele grupe de metode econometrice de analiză și prelucrare a datelor. Analiza factorială a datelor economice ale întreprinderii.

    rezumat, adăugat 03.04.2010

    Media aritmetică a eșantionului, varianță, abatere standard. Respingere după criteriul Chauvinet. Regula celor trei sigma. Evaluarea semnificației diferenței dintre valorile medii ale celor două eșantioane. Analize de regresie multiplă pereche. Analiza factorială completă.

    lucrare de termen adăugată la 12.05.2012

    Aplicarea diferitelor metode de prezentare și prelucrare a datelor statistice. Eșantioane statistice spațiale. Regresie și corelație în perechi. Serii de timp. Construirea unui trend. Exemple practice și metode de rezolvare a acestora, formule și semnificația lor.

    curs curs, adăugat 26.02.2009

    Prelucrarea statistică a rezultatelor măsurătorilor; medie aritmetică, pătratică, varianță. Determinarea parametrilor de eșantionare: legea trei sigma, histograma, diagramele de control, diagrama Ishikawa. Utilizarea instrumentelor de calitate la fabricarea canapelelor.

    lucrare de termen adăugată 17.10.2014

    Valoarea medie în statistică, esența acesteia și condițiile de utilizare. Tipuri si forme de medii: prin prezenta ponderii-atribut, prin forma de calcul, prin acoperirea populatiei. Moda, mediana. Studiu statistic al dinamicii profitului și rentabilității pe exemplul OJSC „Bashmebel”.

    test, adaugat 14.06.2008

    Principiile de prelucrare a datelor statistice, metodele și tehnicile utilizate în acest proces. Metodologia și etapele principale ale construirii diagramelor de control, clasificarea și tipurile acestora, caracteristicile funcționale, identificarea avantajelor și dezavantajelor utilizării.

    lucrare de termen, adăugată 23.08.2014

    Calculul caracteristicilor numerice și prelucrarea rezultatelor observațiilor în eșantion. Calculul și analiza indicatorilor statistici în economie. Averea națională: elemente, evaluare; soldul activelor și pasivelor; active fixe, indicatori ai capitalului de lucru.

    lucrare de termen, adăugată 25.12.2012

    Statistică descriptivă și inferență statistică. Metode de selecție pentru a se asigura că eșantionul este reprezentativ. Influența tipului de eșantion asupra mărimii erorii. Sarcini la aplicarea metodei de eșantionare. Diseminarea datelor de observație către populația generală.

    test, adaugat 27.02.2011

    Dezvăluirea conceptului: scară de interval, medie aritmetică, nivel de semnificație statistică. Cum să interpretezi moda, mediană și medie. Rezolvarea problemelor folosind criteriul Friedman, Rosenbaum. Calculul coeficientului de corelație al lui Sprimen.

Metodele de prelucrare statistică a rezultatelor unui experiment sunt tehnici matematice, formule, metode de calcul cantitativ, cu ajutorul cărora indicatorii obținuți în timpul experimentului pot fi generalizați, aduși într-un sistem, dezvăluind legile ascunse în ele.

Vorbim despre astfel de regularități de natură statistică care există între variabilele studiate în experiment.

Date Sunt principalele elemente care trebuie clasificate sau clasificate pentru prelucrare 26.

Unele dintre metodele de analiză matematică și statistică permit calcularea așa-numitelor statistici matematice elementare care caracterizează distribuția eșantionului de date, de exemplu:

Exemplu de medie,

Varianta eșantionului,

Median și un număr de alții.

Alte metode de statistică matematică fac posibilă aprecierea dinamicii modificărilor statisticilor individuale ale eșantionului, de exemplu:

Analiza variatiei,

Analiza regresiei.

Cu ajutorul celui de-al treilea grup de metode de eșantionare a datelor, se pot aprecia în mod fiabil relațiile statistice care există între variabilele care sunt investigate în acest experiment:

Analiza corelației;

Analiza factorilor;

Metode de comparare.

Toate metodele de analiză matematică și statistică sunt împărțite în mod convențional în primar și secundar 27.

Metodele care pot fi folosite pentru a obține indicatori care reflectă direct rezultatele măsurătorilor efectuate într-un experiment sunt numite metode primare.

Sunt denumite metode secundare de prelucrare statistică, cu ajutorul cărora, pe baza datelor primare, sunt dezvăluite modele statistice ascunse în ele.

Metodele primare de prelucrare statistică includ, de exemplu:

Determinarea mediei eșantionului;

Varianta selectiva;

Moda selectiva;

Mediana eșantionului.

Metodele secundare includ de obicei:

Analiza corelației;

Analiza regresiei;

Metode de comparare a statisticilor primare pentru două sau mai multe eșantioane.

Să luăm în considerare metodele de calcul al statisticilor matematice elementare, începând cu o medie eșantionului.

medie aritmetica - este raportul dintre suma tuturor valorilor datelor și numărul de termeni 28.

Valoarea medie ca indicator statistic este evaluarea medie a calității psihologice studiate în experiment.

Această evaluare caracterizează gradul dezvoltării sale în ansamblu în acel grup de subiecți care a fost supus examinării psihodiagnostice. Prin compararea directă a valorilor medii a două sau mai multe eșantioane, putem judeca gradul relativ de dezvoltare la persoanele care alcătuiesc aceste probe, calitatea evaluată.

Media eșantionului se determină folosind următoarea formulă 29:

unde x cf este media eșantionului sau media aritmetică a eșantionului;

n - numărul de subiecți din eșantion sau indicatori de psihodiagnostic privat, pe baza cărora se calculează valoarea medie;

x k - valori particulare ale indicatorilor pentru subiecții individuali. Există n astfel de indicatori în total, prin urmare indicele k al acestei variabile ia valori de la 1 la n;

∑ - acceptat în matematică semn de însumare a valorilor acelor variabile care se află în dreapta acestui semn.

Dispersia Este o măsură a dispersiei datelor în jurul mediei de 30.

Cu cât varianța este mai mare, cu atât abaterea sau dispersarea datelor sunt mai mari. Este determinată pentru a putea distinge unele de altele valori care au aceeași medie, dar dispersie diferită.

Varianta este determinată de următoarea formulă:

unde este varianța eșantionului sau pur și simplu varianța;

O expresie care înseamnă că pentru toți x k de la primul până la ultimul dintr-un eșantion dat, este necesar să se calculeze diferențele dintre valorile particulare și cele medii, pătratul acestor diferențe și suma;

n este numărul de subiecți din eșantion sau valorile primare pentru care se calculează varianța.

Median se numește valoarea trăsăturii studiate, care împarte proba, ordonată după valoarea trăsăturii date, la jumătate.

Cunoașterea mediei este utilă pentru a determina dacă distribuția valorilor particulare ale trăsăturii studiate este simetrică și apropiată de așa-numita distribuție normală. Media și mediana pentru distribuția normală coincid de obicei sau diferă foarte puțin una de cealaltă.

Dacă distribuția eșantionului de caracteristici este normală, atunci i se pot aplica metode de calcule statistice secundare bazate pe distribuția normală a datelor. În caz contrar, acest lucru nu se poate face, deoarece erorile grave se pot strecura în calcule.

Modă încă o statistică matematică elementară și caracteristici ale distribuției datelor experimentale. Moda este valoarea cantitativă a trăsăturii studiate, care se regăsește cel mai adesea în eșantion.

Pentru distribuțiile de caracteristici simetrice, inclusiv distribuția normală, valorile modului coincid cu valorile medii și mediane. Pentru alte tipuri de distribuții, asimetrice, acest lucru nu este tipic.

Metoda de prelucrare statistică secundară, prin care se clarifică legătura sau relația directă dintre două serii de date experimentale, se numește metoda de analiza a corelatiei. Arată cum un fenomen influențează pe altul sau este legat de acesta în dinamica sa. Acest tip de relație există, de exemplu, între cantitățile care sunt în relații cauzale între ele. Dacă se dovedește că două fenomene se corelează statistic unul cu celălalt și dacă, în același timp, există încredere că unul dintre ele poate acționa ca cauza celuilalt fenomen, atunci aceasta implică cu siguranță concluzia că există o relație cauzală între ele. .

Există mai multe variante ale acestei metode:

Analiza corelației liniare vă permite să stabiliți relații directe între variabile prin valorile lor absolute. Aceste conexiuni sunt exprimate grafic ca o linie dreaptă, de unde și numele „liniar”.

Coeficientul de corelație liniară se determină folosind următoarea formulă 31:

unde r xy - coeficient de corelație liniară;

X y - valori medii de eșantion ale valorilor comparate;

X i , la i - valorile eșantionului parțial ale valorilor comparate;

P - numărul total de valori din seria comparată de indicatori;

Dispersie, abateri ale valorilor comparate de la valorile medii.

Corelația de rang determină dependența nu între valorile absolute ale variabilelor, ci între locurile ordinale sau rangurile ocupate de acestea în ordinea mărimii. Formula pentru coeficientul de corelare a rangului este 32:

unde R s este coeficientul de corelare a rangului Spearman;

d i - diferența dintre rangurile indicatorilor acelorași subiecți în rânduri ordonate;

P - numărul de subiecți sau de date digitale (rangurile) din seria corelată.

Atyusheva Anna

În lucrare, folosind exemplul de prelucrare a datelor privind progresul elevilor de clasa a VII-a, sunt luate în considerare principalele caracteristici statistice, se realizează colectarea și gruparea datelor statistice, informațiile statistice sunt prezentate clar, iar analiza datelor obținute este executat.

Lucrarea conține o prezentare însoțitoare.

Descarca:

Previzualizare:

Instituția de învățământ autonomă municipală „Gimnaziul Nr. 24”

XXII conferință științifică MAGNI

Prelucrarea datelor statistice

MAOU "Gimnaziul nr. 24" Atyusheva Anna

Consultant: profesor de matematică

Şcetinina Natalia Sergheevna

Magadan, 2016

Introducere ……………………………………………………………………………………………… 3

  1. Concepte de bază utilizate în prelucrarea datelor statistice ……………………… .5
  2. Partea de cercetare ……………………………………………………… ............................. . ..... 7

2.1.Prelucrarea statistică a datelor privind progresul elevilor din clasa a VII-a „B” ………………… ..7

2.2 Prezentarea vizuală a datelor cu ajutorul histogramelor ……………………………………………………………………………………………… 18

2.3. Caracteristici comparative ale activității educaționale a elevilor în funcție de rezultatele trimestrului I și II ................................ ................................. 21

2.4. Analiza sondajului chestionar al elevilor din clasa a VII-a „B” pentru controlul parental asupra progresului copiilor ............................. ................................ 23

Concluzie ……………………………………………………………………………………………… ... 27

Literatură ……………………………………………………………………………………………… 28

Introducere

Oricare dintre noi, care deschide o carte sau un ziar, deschide televizorul sau ajunge la gară, se confruntă constant cu o formă tabelară de prezentare a informațiilor. Acestea sunt orarul lecției, orarul trenurilor, tabla înmulțirii și multe altele. Toate informațiile sunt prezentate sub formă de diagrame sau grafice.

Trebuie să fiți capabil să procesați și să analizați astfel de informații. Fără prelucrarea datelor, compararea evenimentelor, este imposibil de urmărit dezvoltarea unei anumite probleme.

În cursul algebrei, am studiat caracteristicile statistice care sunt utilizate pe scară largă în diverse studii. Am fost interesat de aplicarea practică a caracteristicilor studiate și de oportunitatea de a prelucra datele astfel încât informațiile prezentate să determine clar cursul dezvoltării unei anumite probleme și, în consecință, rezultatul soluționării acesteia. Ca o astfel de problemă, am decis să iau în considerare performanța clasei mele în trimestrul din prima jumătate a anului.

Zona de cercetare a obiectelor- algebră

Obiect de studiu- caracteristici statistice

Subiect de studiu- performanta academica a 7 elevi de clasa „B” in trimestrele din prima jumatate a anului

Ipoteză: Considerăm că, folosind exemplul de prelucrare a datelor privind performanța elevilor din clasa a 7-a B, nu numai că ne vom familiariza cu principalele caracteristici statistice, ci vom învăța și pe cont propriu:

  • colectarea și gruparea datelor statistice;
  • prezentarea vizuală a informațiilor statistice;
  • analiza datele obtinute.

Ţintă: învață să procesezi, să analizezi și să vizualizezi informațiile disponibile.

Sarcini:

  • studiul caracteristicilor statistice;
  • culege informații privind performanța elevilor din clasa a VII-a în trimestre

prima jumătate a anului;

  • procesează informații;
  • efectuați o prezentare vizuală a informațiilor folosind histograme;
  • analizați datele obținute, trageți concluziile adecvate.

Concepte de bază utilizate în prelucrarea datelor statistice

Statistica este o știință care se ocupă cu obținerea, prelucrarea și analizarea datelor cantitative despre diferite fenomene de masă care au loc în natură și societate. Cuvântul „statistică” provine din cuvântul latin „status”, care înseamnă „stat, starea lucrurilor”.

Cele mai simple caracteristici statistice sunt media aritmetică, mediana, intervalul, modul.

  • Media aritmeticăo serie de numere se numește câtul împărțirii sumei acestor numere la numărul de termeni. De obicei, media aritmetică se găsește atunci când se dorește să determine valoarea medie pentru o anumită serie de date: randamentul mediu de grâu la hectar în regiune, producția medie a unei echipe de lucru pe tură, scorul mediu al certificatului, temperatura medie a aerului la prânz în acest deceniu etc.
  • Median o serie ordonată de numere cu un număr impar de membri se numește numărul scris în mijloc, iar mediana unei serii ordonate de numere cu un număr par de membri se numește media aritmetică a două numere scrise în mijloc. Rețineți că este mai convenabil și mai rapid să lucrați cu o serie de numere dacă este comandată, de exemplu. un rând în care fiecare număr ulterior nu este mai mic (sau nu mai mult) decât cel anterior.
  • Modă o serie de numere se numește numărul cel mai des întâlnit într-o serie dată. Un număr de numere poate avea mai mult de un mod sau nici un mod. Modul unei serii de date este de obicei găsit atunci când se dorește identificarea unui indicator tipic. Rețineți că media aritmetică a unei serii de numere poate să nu coincidă cu niciunul dintre aceste numere, iar modul, dacă există, trebuie să coincidă în mod necesar cu două sau mai multe numere din serie. În plus, spre deosebire de media aritmetică, conceptul de „mod” se referă nu numai la date numerice.
  • Într-o măturare o serie de numere este diferența dintre cel mai mare și cel mai mic dintre aceste numere. Intervalul unei serii este găsit atunci când doresc să determine cât de mare este răspândirea datelor într-o serie.

Să arătăm definiția fiecăreia dintre caracteristici folosind exemplul unei serii de numere: 47,46,52,47,52,47,52,49,45,43,53,53,47,52.

Media aritmetică 48,7.

Se găsește astfel: determinăm suma numerelor și o împărțim la numărul lor.

(47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7.

Median din această serie de numere va fi numărul 48.

Se găsește astfel: ordonăm o serie de numere, alegând-o pe cea care se află la mijloc. Dacă numărul de numere este par, atunci găsim media aritmetică a celor două în mijlocul rândului de numere.

43,45,46,47,47,47, 47,49 ,52,52,52,52,53,53

(47+49):2=48

Modă din această serie de numere vor fi numerele 47 și 52 ... Aceste numere se repetă cel mai des.

47 ,46, 52 , 47 , 52 , 47 , 52 ,49,45,43,53,53, 47 , 52 .

Într-o măturare din această serie de numere vor fi 10.

Se găsește astfel: alegeți cel mai mare și cel mai mic număr din serie și găsiți diferența dintre aceste numere.

47,46,52,47,52,47,52,49,45, 43, 53 ,53,47,52

53-43=10

Partea de cercetare

Prelucrarea statistică a datelor privind performanța elevilor din clasa a VII-a „B”

Să trecem la procesarea informațiilor. Să compunem tabele pentru fiecare dintre subiecte, formate din trei rânduri, primul va conține o serie de date. Fiecare variantă din această serie a fost de fapt observată în eșantion de un anumit număr de ori. Acest număr se numește multiplicitatea opțiunilor. Deci, să punem în a doua linie multiplicitatea opțiunii corespunzătoare. Să obținem tabelul de distribuție al eșantionului.

Dacă adunăm toate multiplicitățile, atunci obținem numărul tuturor măsurătorilor efectuate în timpul eșantionării - dimensiunea eșantionului (În cazul nostru, acest număr este 24, care corespunde numărului de elevi din clasă).

În a treia linie, raportul, exprimat ca procent, se numește frecvența opțiunilor.

Opțiuni de frecvență =

În general, dacă se întocmește un tabel cu frecvențe relative pe baza rezultatelor studiului, atunci suma frecvențelor relative este egală cu 100%.

eu sfert

Limba rusă.

Să sortăm datele eșantionului (marcaj): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4 ,4,4, 4,5.

Nota medie la subiect:(in medie).

Tabel de alocare a frecvenței

Opțiune

Opțiuni de multiplicitate

Nu

Frecvență%

58.3%

37.5%

4.2%

Literatură.

Să ordonăm datele eșantionului (notele): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,5,5,5, 5,5.

Nota medie la subiect:(in medie).

Opțiuni de evaluare

multiplicitate

Nu

Frecvență%

37.5%

41.7%

20.8%

Algebră.

Să sortăm datele eșantionului (marcaj): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4 ,4,4,4, 5,5.

Nota medie la subiect:(in medie).

Cel mai mare număr de elevi la materie au „4, 3” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

multiplicitate

Nu

Frecvență%

45.8%

45.8%

8.3%

Poveste.

Să sortăm datele eșantionului (marcaj): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4 ,4,4,4, 4,5

Nota medie la subiect:(in medie).

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

45.8%

4.2%

Stiinte Sociale.

Să ordonăm datele eșantionului (notele): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,5,5,5, 5,5

Nota medie la subiect:(in medie).

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

37.5%

41.7%

20.8%

Geografie.

Să sortăm datele eșantionului (note): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5,5,5,5 ,5

Nota medie la subiect:(in medie).

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

20.8%

41.7%

37.5%

Fizică.

Să sortăm datele eșantionului (marcaje): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,4,4,4, 4,5

Nota medie la subiect:(in medie).

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

37.5%

58.3%

4.2%

Biologie.

Să sortăm datele eșantionului (marcaj): 3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5 ,5,5,5,5 ,5

Nota medie la subiect:(in medie).

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

45.8%

29.2%

FUNDAMENTELE SIGURANȚEI VIEȚII.

Să sortăm datele eșantionului (note): 4,4,4,4,4,4.4.5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5,5,5 ,5

Nota medie la subiect:(in medie).

Opțiuni de evaluare

Multiplicitate

Nu

Nu

Frecvență%

29.2%

70.8%

Să sortăm datele eșantionului (note): 3,4,4,4.4,4,4,4,4,4,5,5,5,5,5,5,5,5.5,5,5.5,5 ,5,5

Nota medie la subiect:(in medie).

Cel mai mare număr de elevi la materie au „5” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 5 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

4.2%

37.5%

58.3%

Limba engleză.

Să sortăm datele eșantionului (marcaje): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,5,5,5,5 ,5

Nota medie la subiect:(in medie).

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

37.5%

41.7%

20.8%

Informatica.

Să sortăm datele eșantionului (note): 3,4,4,4,4.4,4,4,4,4,4,4,4,4,5,5,5,5.5.5,5,5 ,5,5

Nota medie la subiect:(in medie).

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

4.2%

54.2%

41.7%

Tehnologie.

Să sortăm datele eșantionului (marcaj): 3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,5,55,5 ,5,5,5,5

Nota medie la subiect:(in medie).

Cel mai mare număr de elevi la materie au „5” (modă)

Aproximativ jumătate dintre studenții de limbă rusă studiază la 4,5 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

20.8%

54.2%

Acum să colectăm informații similare cu privire la rezultatele celui de-al doilea trimestru.

Limba rusă.

Să sortăm datele eșantionului (note): 3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4 ,4,4,4 ,4

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

multiplicitate

Nu

Nu

Frecvență%

41.7%

58.3%

Literatură.

Să sortăm datele eșantionului (marcaje): 3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5 ,5,5,5, 5,5

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „3” (modă)

Aproximativ jumătate dintre studenții de limba rusă studiază clasa a 3-a (mediană)

Opțiuni de evaluare

multiplicitate

Nu

Frecvență%

41.7%

33.3%

Algebră.

Să sortăm datele eșantionului (marcaje): 3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4 ,4,4,5 , 5,5

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „3” (modă)

Aproximativ jumătate dintre studenții de limba rusă studiază clasa a 3-a (mediană)

Opțiuni de evaluare

multiplicitate

Nu

Frecvență%

37.5%

12.5%

Poveste.

Să sortăm datele eșantionului (note): 3,3,3,3,3,3,3,3,3,4.4,4,4,4,4,4,4,4,4,4,4 ,4,4,4 ,5

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

37.5%

58.3%

4.2%

Societate.

Să sortăm datele eșantionului (marcaj): 3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4 ,4,4,5 , 5,5

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

16.7%

70.8%

12.5%

Geografie.

Să sortăm datele eșantionului (marcaj): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5 ,5,5,5, 5,5

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

12.5%

58.3%

29.2%

Fizică.

Să sortăm datele eșantionului (marcaj): 3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4 ,44,5,5 ,5

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

33.3%

16.7%

12.5%

Biologie.

Să sortăm datele eșantionului (note): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5 ,5,5,5 ,5

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

12.5%

62.5%

FUNDAMENTELE SIGURANȚEI VIEȚII.

Să sortăm datele eșantionului (marcaje): 3,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5,5,5 ,5

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „5” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 5 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

4.2%

8.3%

87.5%

Istoria și societatea pământului natal.

Să sortăm datele eșantionului (note): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5 ,5,5,5, 5,5

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

12.5%

45.8%

41.7%

Limba engleză.

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

20.8%

29.2%

Informatica.

Să sortăm datele eșantionului (note): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5 ,5,5,5, 5,5

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „4” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

20.8%

29.2%

Tehnologie.

Să sortăm datele eșantionului (marcaj): 3,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5 ,5,5,5, 5,5

Nota medie la subiect:(in medie)

Cel mai mare număr de elevi la materie au „5” (modă)

Aproximativ jumătate dintre studenții de limbă rusă învață la 4 (mediană)

Opțiuni de evaluare

Multiplicitate

Nu

Frecvență%

4.2%

29.2%

66.7%

Vizualizarea datelor cu histograme

Pentru o prezentare vizuală a datelor obținute în urma unui studiu statistic, sunt utilizate pe scară largă diverse metode de prezentare a acestora.

Vom folosi histograme pentru claritatea datelor. O histogramă este o formă în trepte alcătuită din dreptunghiuri închise. Baza fiecărui dreptunghi este egală cu lungimea intervalului, iar înălțimea este egală cu multiplicitatea variantei sau a frecvenței relative. Astfel, într-o histogramă, spre deosebire de o diagramă cu bare convențională, bazele dreptunghiului nu sunt alese în mod arbitrar, ci sunt strict determinate de lungimea intervalului.

Caracteristici comparative ale performanței elevilor la disciplinele din primul trimestru

Caracteristici comparative ale performanței elevilor la disciplinele din trimestrul II

concluzii

Conform rezultatelor primului trimestru, se vede clar că elevii sunt cel mai greu să facă față unor subiecte precum: limba rusă și algebra, discipline pentru care „trei” este o evaluare prioritară în raport cu alte note. Aceasta înseamnă că calitatea la aceste materii este mai scăzută decât la altele.

De asemenea, este clar că nivelul ridicat al tripleților la materii precum literatura, istorie, societate, fizică, engleză. De asemenea, este trist să ai triple la materii precum tehnologie, biologie, geografie.

Conform rezultatelor trimestrului doi, numărul de triple și cinci a scăzut semnificativ, adică elevii și-au distribuit punctele forte la toate materiile, și nu în funcție de cele preferate separat.

Histograma distribuţiei punctajului mediu la subiecţii din primul trimestru

Histograma distribuţiei punctajului mediu la subiecţii trimestrului II

Concluzie

Pentru a crea aceste diagrame, am folosit o astfel de caracteristică statistică precum media aritmetică. Se vede clar că, în al doilea trimestru, cunoașterea limbii ruse, istoria și societatea țării natale, informatica s-a deteriorat. Îmbunătățit în istorie, societate, fizică, biologie, siguranța vieții, engleză. Dar, în același timp, diagramele arată că schimbări mai semnificative în bine au avut loc doar în fizică și limba engleză.

Caracteristici comparative ale activității educaționale a elevilor în funcție de rezultatele trimestrului I și II

Histograma calității cunoștințelor la disciplinele din primul trimestru

Histograma calității cunoștințelor la disciplinele din trimestrul II

Combinând ambele histograme într-una singură, este mult mai ușor să vedeți imaginea performanței clasei în comparație. Și individual este mai ușor să vezi pentru ce subiecte calitatea este mai bună. De exemplu, în primul trimestru calitatea este mai mică de 60% la materiile - algebră, rusă, istorie, în al doilea - rusă, literatură, algebră, fizică. Este deja clar că cele mai dificile pentru elevi sunt limba rusă, algebra. Iar procentul de calitate la toate subiectele nu este foarte diferit 66% - primul trimestru, 68% - al doilea. Adică, calitatea superioară la materii, care este clar vizibilă pe diagrama de comparație, sugerează că studenții nu încearcă în mod deosebit să-și îmbunătățească nivelul de cunoștințe și nu își dețin pozițiile într-un domeniu sau altul.

Grafic care compară toate articolele după calitate pentru primul și al doilea trimestru

În al doilea trimestru, numărul studenților buni și excelenți la limba rusă, societate, biologie, engleză și tehnologie a crescut semnificativ. Numărul în literatură, algebră, siguranța vieții, IORK și informatică a scăzut ușor. Și puteți observa o scădere puternică a calității fizicii, care este asociată cu nepregătirea elevilor pentru lecții.

Și iarăși ajungem la concluzia că copiii învață „în salturi și limite”, și nu există preferințe speciale în direcția educației (discipline umanitare, fizică și matematică, materii ciclului natural).

Analiza sondajului chestionar a 7 elevi de clasa „B” pe tema controlului parental asupra progresului copiilor

Pe baza rezultatelor studiului de mai sus, am decis să realizăm un sondaj în rândul elevilor de clasa a 7-a „B” pentru controlul parental asupra predării copiilor (chestionare, vezi Anexa)

Dimensiunea eșantionului este de 22 de persoane.

Părinții verifică temele

Concluzie

Aproape un sfert dintre elevi se referă la această problemă fără control parental, ceea ce desigur le afectează performanța academică.

Numărul de verificări ale temelor pe săptămână

Mediană = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7,7 = (3 + 3 ): 2 = 3

Media aritmetică = 3

Concluzie

În medie, sarcina este verificată de trei ori pe săptămână. Având în vedere discontinuitatea învățării, acest lucru nu este suficient.

Mediană = 0,0,0,0,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,5,5,6, 7, 7,7 = (2 + 2): 2 = 2

Media aritmetică = 3 (în medie, jurnalele sunt verificate de părinți de 3 ori pe săptămână)

Cantitatea de timp pe care elevii o petrec făcând temele

Variante

Mai puțin de 1

Frecvență%

  • Swing R = x (max) - x (min) = 3,5 - 0,5 = 3 ore

(caracterizează mărimea împrăștierii valorilor observate, adică arată diferența dintre cel mai lung și cel mai scurt timp)

  • Modul M (0) = 2,5 ore ( arată valoarea care apare mai des decât altele, i.e. arată timpul petrecut cel mai des elevii)

Histograma timpului petrecut de elevi cu temele pentru acasă

Concluzie

În medie, temele durează 2,5 ore pe zi. Care este considerat un indicator normal pentru vârsta elevilor.

Concluzie

În urma muncii depuse, am învățat să procesez și să analizez informațiile disponibile

Cunoașterea caracteristicilor statistice m-a ajutat să determin GPA la diverse materii, precum și moda și amploarea în acei indicatori de performanță în care ar părea imposibil de determinat. Fără prelucrarea datelor, compararea evenimentelor, este imposibil de urmărit dezvoltarea unei anumite probleme. Am încercat nu doar să urmărim problema care a apărut - scăderea calității cunoștințelor și a performanței academice la discipline, ci și să încercăm să aflăm motivul, care, în opinia noastră, constă în controlul parental insuficient asupra performanței academice. a copiilor lor. Sondajul prin chestionar și rezultatele performanței academice au arătat că elevii de clasa a 7-a „B” nu au suficientă abilitate de autocontrol asupra învățării lor, iar părinții cred contrariul.

Munca depusă, cred, va fi utilă atât pentru profesorul de clasă în lucrul cu părinții, cât și pentru colegii mei de a-și îmbunătăți rezultatele la materiile individuale în viitor.

Statistica este o știință care studiază, prelucrează și analizează date cantitative privind o mare varietate de fenomene de masă din viață. Noi i-am dezvăluit doar puțin caracteristicile pentru noi înșine și încă mai sunt multe necunoscute și interesante în continuare.

Bibliografie:

  1. http://www.nado5.ru/e-book/naibolshii-obzchii-delitel
    Previzualizare:

    Pentru a utiliza previzualizarea prezentărilor, creați-vă un cont Google (cont) și conectați-vă la el: https://accounts.google.com


    Subtitrările diapozitivelor:

    Prelucrarea datelor statistice Întocmit de: elevă în clasa a VII-a „B” a MAOU „Gimnaziul nr. 24” Anna Atyusheva Consultant: profesoară de matematică Natalya Sergeevna Shchetinina

    Scop: învățați să procesați, analizați și vizualizați informațiile disponibile. Obiective: studierea caracteristicilor statistice; culege informații despre progresul elevilor din clasa a VII-a în trimestrele din prima jumătate a anului; procesează informații; efectuați o prezentare vizuală a informațiilor folosind histograme; analizați datele obținute, trageți concluziile adecvate.

    O ipoteză folosind exemplul de prelucrare a datelor privind performanța elevilor, nu numai că puteți să vă familiarizați cu principalele caracteristici statistice, ci și să învățați cum să colectați și să grupați date statistice; prezentarea vizuală a informațiilor statistice; analiza datele primite.

    Statistica este o știință care se ocupă cu obținerea, prelucrarea și analizarea datelor cantitative despre diferite fenomene de masă care au loc în natură și societate. Cuvântul „statistică” provine din cuvântul latin „status”, care înseamnă „stat, starea lucrurilor”. Cele mai simple caracteristici statistice: Media aritmetică Median Span Mode

    Determinarea fiecăreia dintre caracteristicile folosind exemplul unei serii de numere: 47,46,52,47,52,47,52,49,45,43,53,53,47,52. Media aritmetică a acestei serii de numere va fi numărul 48,7. (47 + 46 + 52 + 47 + 52 + 47 + 52 + 49 + 45 + 43 + 53 + 53 + 47 + 52): 14 = 48,7. Mediana acestei serii de numere va fi numărul 48.43,45,46,47,47,47, 47, 49, 52,52,52,52,53,53 (47 + 49): 2 = 48 Modul de această serie de numere va fi numerele 47 și 52. 47, 46, 52, 47, 52, 47, 52, 49,45,43,53,53, 47, 52. Intervalul acestei serii de numere va fi 10. 49,45, 43, 53, 53,47,52 53- 43 = 10

    Probleme cu performanța școlară în clasa a VII-a „B”

    Opțiunea 2 3 4 5 Rata de frecvență fără opțiuni 14 9 1 Frecvență% 0% 58,3% 37,5% 4,2% Limba rusă. Să sortăm datele eșantionului (marcaj): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4 ,4,4, 4,5. Scorul mediu la subiect: 14 ∙ 3 + 9 ∙ 4 + 5 ∙ 124 = 8324≈3,5 (media aritmetică). Cel mai mare număr de studenți la materie au „3” (modă) Aproximativ jumătate dintre studenții de la limba rusă studiază la 3 (mediana)

    Pentru o prezentare vizuală a datelor obținute în urma unui studiu statistic, sunt utilizate pe scară largă diverse metode de prezentare a acestora.

    Caracteristici comparative ale performanței elevilor la disciplinele din primul trimestru

    Caracteristici comparative ale performanței elevilor la disciplinele din trimestrul II

    Histograma distribuţiei punctajului mediu la subiecţii din trimestrul I şi II

    Diagrama comparativă a tuturor disciplinelor după calitate pentru trimestrul I și II

    Chestionare în rândul elevilor clasei a VII-a „B” pe tema controlului parental asupra educației copiilor CHESTIONAR 1. Părinții îți verifică temele? ___________________________________________________________ 2. De câte ori pe săptămână? ___________________________________________________________ 3. De câte ori pe săptămână se uită părinții tăi la jurnalul tău? ___________________________________________________________ 4. Cât timp petreci în medie în fiecare zi temelor? ________________________________________________________________

    Părinții verifică temele

    Numărul de verificări ale temelor pe săptămână Median = 0.0.0.0.0.0.1.1.2.2.3.3.3.3.4.4.5.7.7.7.7, 7 = (3 + 3): 2 = 3 Media aritmetică = 3

    Histograma timpului petrecut de elevi cu temele pentru acasă