Statistisko datu apstrādes elementi. Statistisko datu apstrāde un tās pazīmes Dati statistikas datu apstrādei

Laboratorijas darbs Nr.3. Statistiskā datu apstrāde MatLab sistēmā

Vispārējs problēmas izklāsts

Īstenošanas galvenais mērķis laboratorijas darbi ir ievads pamatos darbam ar statistisko datu apstrādi MatLAB vidē.

Teorētiskā daļa

Primārā statistikas datu apstrāde

Statistiskās datu apstrādes pamatā ir primārās un sekundārās kvantitatīvās metodes. Statistikas datu primārās apstrādes mērķis ir iegūtās informācijas strukturēšana, kas nozīmē datu grupēšanu rakurstabulas pēc dažādiem parametriem. Primārie dati ir jāuzrāda tādā formātā, lai persona varētu veikt aptuvenu iegūtās datu kopas novērtējumu un atklāt informāciju par iegūtās datu izlases datu sadalījumu, piemēram, datu viendabīgumu vai kompaktumu. Pēc primāro datu analīzes tiek pielietotas sekundāro statistisko datu apstrādes metodes, uz kuru pamata tiek noteiktas statistiskās shēmas esošajā datu kopā.

Primārās statistiskās analīzes veikšana datu masīvā ļauj iegūt zināšanas par:

Kāda ir izlases reprezentatīvākā vērtība? Lai atbildētu uz šo jautājumu tiek noteikti centrālās tendences mēri.

Vai datu izkliede attiecībā pret šo raksturīgo vērtību ir liela, ti, kāds ir datu "izplūdums"? V šajā gadījumā tiek noteikti mainīguma mēri.

Jāatzīmē, ka centrālās tendences un mainīguma mēra statistiskie rādītāji tiek noteikti tikai uz kvantitatīviem datiem.

Centrālie tendenču pasākumi- vērtību grupa, ap kuru tiek grupēti pārējie dati. Tādējādi centrālās tendences mēri apkopo datu kopu, kas ļauj izdarīt secinājumus gan par izlasi kopumā, gan veikt salīdzinošo dažādu paraugu savstarpēja analīze.

Pieņemsim, ka ir datu izlase, tad centrālās tendences mēri tiek novērtēti pēc šādiem rādītājiem:

1. Parauga vidējais Ir rezultāts, dalot visu paraugu vērtību summu ar to skaitu. To nosaka pēc formulas (3.1).

(3.1)

kur - i izlases elements;

n- elementu skaits izlasē.

Izlases vidējais lielums nodrošina vislielāko precizitāti centrālās tendences novērtēšanā.

Pieņemsim, ka jums ir 20 personas. Paraugi ir informācija par katras personas vidējiem mēneša ienākumiem. Pieņemsim, ka 19 cilvēkiem vidējie mēneša ienākumi ir 20 tr. un 1 persona ar ienākumiem 300 tr. Kopējie mēneša ienākumi no visas izlases ir 680 RUB. Izlases vidējais rādītājs šajā gadījumā ir S = 34.


2. Mediāna- veido vērtību, virs un zem kuras atšķirīgo vērtību skaits ir vienāds, tas ir, tā ir centrālā vērtība secīgā datu sērijā. To nosaka atkarībā no izlasē esošo elementu skaita paritātes / nepāra ar formulām (3.2) vai (3.3) Datu izlases mediānas novērtēšanas algoritms:

Pirmkārt, dati tiek sarindoti (kārtoti) dilstošā/augošā secībā.

Ja sakārtotajā paraugā ir nepāra elementu skaits, tad mediāna sakrīt ar centra vērtību.

(3.2)

kur n

Pāra elementu skaita gadījumā mediānu definē kā divu centrālo vērtību vidējo aritmētisko.

(3.3)

kur ir pasūtītā parauga vidējais elements;

- sekojošais pasūtītās atlases elements;

Elementu skaits izlasē.

Ja visi izlases elementi ir atšķirīgi, tad tieši puse izlases elementu ir lielāki par mediānu, bet otra puse ir mazāka. Piemēram, izlasei (1, 5, 9, 15, 16) mediāna ir tāda pati kā 9. vienumam.

Datu statistiskajā analīzē mediāna ļauj noteikt izlases elementus, kas spēcīgi ietekmē izlases vidējo vērtību.

Pieņemsim, ka jums ir 20 personas. Paraugi ir informācija par katras personas vidējiem mēneša ienākumiem. Pieņemsim, ka 19 cilvēkiem vidējie mēneša ienākumi ir 20 tr. un 1 persona ar ienākumiem 300 tr. Kopējie mēneša ienākumi no visas izlases ir 680 RUB. Mediānu pēc izlases sakārtošanas nosaka kā izlases desmitā un vienpadsmitā elementa vidējo aritmētisko) un ir vienāds ar Me = 20 tr. Šo rezultātu interpretē šādi: mediāna izlasi sadala divās grupās, tādējādi var secināt, ka pirmajā grupā katras personas vidējie mēneša ienākumi nepārsniedz 20 tūkstošus rubļu, bet otrajā grupā, plkst. vismaz 20 tonnas. R. Šajā piemērā var teikt, ka mediānu raksturo tas, cik nopelna “vidējais” cilvēks. Tajā pašā laikā izlases vidējā vērtība ir būtiski pārsniegta S = 34, kas norāda uz šī raksturlieluma nepieņemamību, vērtējot vidējo izpeļņu.

Tādējādi, jo lielāka ir atšķirība starp mediānu un izlases vidējo, jo lielāka ir izlases datu izkliede (aplūkotajā piemērā persona, kuras ienākumi ir 300 tūkstoši rubļu, nepārprotami atšķiras no vidējiem cilvēkiem konkrētajā izlasē un ir būtiska ietekme uz vidējo ienākumu aplēsi). Ko darīt ar šādiem elementiem, tiek izlemts katrā atsevišķā gadījumā. Bet vispārīgā gadījumā, lai nodrošinātu izlases ticamību, tie tiek noņemti, jo tiem ir spēcīga ietekme uz statistisko rādītāju novērtējumu.

3. Mode (Moe)- veido paraugā visbiežāk sastopamo vērtību, t.i., vērtību ar vislielāko biežumu. Režīmu novērtēšanas algoritms:

Gadījumā, ja paraugā ir elementi, kas sastopami vienlīdz bieži, tiek teikts, ka šādā izlasē nav modes.

Ja divi blakus esošie elementi Tā kā paraugiem ir vienāda frekvence, kas ir augstāka par pārējā parauga frekvenci, tad režīmu nosaka kā vidējo no šīm divām vērtībām.

Ja diviem paraugiem ir vienāda frekvence, kas ir augstāka par pārējo paraugu frekvenci, un šie elementi neatrodas blakus, tad tiek teikts, ka šajā izlasē ir divi režīmi.

Režīms statistiskajā analīzē tiek izmantots situācijās, kad nepieciešams ātrs centrālās tendences mēra novērtējums un nav nepieciešama augsta precizitāte. Piemēram, modi (izmēra vai zīmola ziņā) ir ērti izmantot, lai noteiktu klientu vidū pieprasītākos apģērbus un apavus.

Izkliedes (mainīguma) mēri- statistisko rādītāju grupa, kas raksturo atšķirības starp izlases individuālajām vērtībām. Pamatojoties uz dispersijas mēru rādītājiem, iespējams novērtēt parauga elementu viendabīguma un kompaktuma pakāpi. Izkliedes mērījumus raksturo šāds rādītāju kopums:

1. Velciet — tas ir intervāls starp novērojumu rezultātu (izlases vienību) maksimālo un minimālo vērtību. Svārstīšanās mērs norāda vērtību izplatību datu populācijā. Ja diapazons ir liels, tad agregāta vērtības ir ļoti izkliedētas, pretējā gadījumā (diapazons ir mazs) tiek teikts, ka vērtības kopsavilkumā atrodas tuvu viena otrai. Diapazonu nosaka pēc formulas (3.4.).

(3.4)

Kur - maksimālais parauga elements;

ir minimālais izlases elements.

2.Vidējā novirze- vidējā aritmētiskā starpība (absolūtā vērtībā) starp katru parauga vērtību un tās izlases vidējo. Vidējo novirzi nosaka pēc formulas (3.5).

(3.5)

kur - i izlases elements;

Izlases vidējā vērtība, kas aprēķināta pēc formulas (3.1.);

Elementu skaits izlasē.

Modulis ir nepieciešams tāpēc, ka novirzes no vidējā katram konkrētajam elementam var būt gan pozitīvas, gan negatīvas. Tāpēc, ja neņemsiet moduli, tad visu noviržu summa būs tuvu nullei un nebūs iespējams spriest par datu mainīguma pakāpi (datu drūzmēšanās ap izlases vidējo). Veicot statistisko analīzi, izlases vidējā vietā var ņemt režīmu un mediānu.

3. Izkliede- izkliedes mērs, kas apraksta salīdzinošo novirzi starp datu vērtībām un vidējo. To aprēķina kā katra parauga elementa noviržu kvadrātu summu no vidējā. Atkarībā no izlases lieluma tiek aprēķināta dispersija Dažādi ceļi:

Lieliem paraugiem (n> 30) pēc formulas (3.6.)

(3.6)

Maziem paraugiem (n<30) по формуле (3.7)

(3.7)

kur X i ir izlases i-tais elements;

S ir izlases vidējā vērtība;

Elementu skaits izlasē;

(X i - S) ir katras datu kopas vērtības novirze no vidējās vērtības.

4. Standarta novirze- mērs, cik plaši ir izkliedēti datu punkti attiecībā pret to vidējo vērtību.

Atsevišķu noviržu likšanas kvadrātā dispersijas aprēķināšanas process palielina iegūtās novirzes novirzes pakāpi no sākotnējām novirzēm, kas savukārt ievieš papildu kļūdas. Tādējādi, lai tuvinātu datu punktu izkliedes novērtējumu attiecībā pret to vidējo un vidējās novirzes vērtību, no dispersijas tiek iegūta kvadrātsakne. Izdalītā dispersijas sakne raksturo mainīguma mēru, ko sauc par vidējo kvadrātu vai standarta novirzi (3.8).

(3.8)

Pieņemsim, ka esat programmatūras izstrādes projektu vadītājs. Jums ir pakārtoti pieci programmētāji. Pārvaldot projekta izpildes procesu, jūs sadalāt uzdevumus starp programmētājiem. Piemēra vienkāršības labad mēs balstīsimies uz to, ka uzdevumi ir līdzvērtīgi sarežģītības un izpildes laika ziņā. Jūs nolēmāt analizēt katra programmētāja darbu (nedēļas laikā izpildīto uzdevumu skaitu) pēdējo 10 nedēļu laikā, kā rezultātā saņēmāt šādus paraugus:

Nedēļas nosaukums

Aprēķinot vidējo izpildīto uzdevumu skaitu, jūs saņēmāt šādu rezultātu:

Nedēļas nosaukums S
22,3
22,4
22,2
22,1
22,5

Pamatojoties uz S rādītāju, visi programmētāji strādā vidēji ar vienādu efektivitāti (apmēram 22 uzdevumi nedēļā). Taču mainīguma (diapazona) rādītājs ir ļoti augsts (no 5 ceturtā programmētāja uzdevumiem līdz 24 uzdevumiem piektajam).

Nedēļas nosaukums S P
22,3
22,4
22,2
22,1
22,5

Novērtēsim standartnovirzi, kas parāda, kā vērtības izlasēs sadalās attiecībā pret vidējo, proti, mūsu gadījumā novērtēsim, cik liela ir uzdevumu izkliede no nedēļas uz nedēļu.

Nedēļas nosaukums S P SO
22,3 1,56
22,4 1,8
22,2 2,84
22,1 1,3
22,5 5,3

Rezultātā iegūtais standartnovirzes novērtējums saka sekojošo (novērtēsim divus galējos gadījumus 4 un 5 programmētājus):

Katra vērtība 4 programmētāju izlasē vidēji atšķiras par 1,3 uzdevumiem no vidējās vērtības.

Katra vērtība programmētāja izlasē 5 vidēji atšķiras par 5,3 uzdevumiem no vidējās vērtības.

Jo tuvāk standarta novirze ir 0, jo ticamāks ir vidējais rādītājs, jo tas norāda, ka katra izlases vērtība ir gandrīz vienāda ar vidējo (mūsu piemērā tas ir 22,5 vienumi). Līdz ar to 4. programmētājs ir viskonsekventākais atšķirībā no 5. programmētāja. 5. programmētāja uzdevumu izpildes mainīgums no nedēļas uz nedēļu ir 5,3 uzdevumi, kas liecina par būtisku izkliedi. 5. programmētāja gadījumā nevar uzticēties vidējam rādītājam, un tāpēc ir grūti prognozēt izpildīto uzdevumu skaitu nākamajai nedēļai, kas savukārt apgrūtina plānošanu un darba grafiku ievērošanu. Tas, kādu vadības lēmumu pieņemat šajā kursā, nav svarīgi. Ir svarīgi, lai jūs saņemtu novērtējumu, uz kura pamata var pieņemt atbilstošus vadības lēmumus.

Tādējādi var izdarīt vispārīgu secinājumu, ka vidējais ne vienmēr pareizi novērtē datus. Vidējā novērtējuma pareizību var spriest pēc standartnovirzes vērtības.


1. Rīki statistikas datu apstrādei programmā Excel

2. Īpašu funkciju izmantošana

3. Izmantojot ANALĪZES PAKETES rīku

Literatūra:

galvenais:

1. Bērks. Datu analīze, izmantojot Microsoft Excel. : Per. no angļu val. / Burke, Kenneth, Carey, Patrick. - M.: Izdevniecība "Williams", 2005. - S. 216 - 256.

2. Mišins A.V. Informācijas tehnoloģijas juridiskajā darbībā: darbnīca / A.V. Mišins. - M .: RAP, 2013 .-- S. 2-11.

papildu:

3. Informātika juristiem un ekonomistiem: mācību grāmata augstskolām / Red. S.V. Simonovičs. - SPb .: Pēteris, 2004 .-- S. 498-516.

Praktiskā nodarbība numur 30

Tēma Nr.11.1. Datu bāzes uzturēšana Access DBVS

Nodarbība notiek, izmantojot projektu metodi.

Projekta mērķis: izstrādāt datubāzi par tiesas darbu.

Tehniskais uzdevums:

1. Izveidojiet datubāzi "Tiesa" no divām tabulām "Tiesneši" un "Prasības" attiecīgi ar šādu struktūru:

Galds "Tiesneši"

Lauka nosaukums Tiesneša kods PILNAIS VĀRDS Uzņemšanas dienas Biznesa stundas Darba pieredze
Datu tips Skaitlisks Teksts Teksts Teksts Skaitlisks
Lauka izmērs Garš vesels skaitlis Garš vesels skaitlis
Lauka formāts Pamata Pamata
Cipari aiz komata
Noklusējuma vērtība "treš" "15:00-17:00"
Nosacījums pēc vērtības > 36200 Un<36299 P. vai Otr. Vai T. Vai C. Vai Piekt > 0 Un<40
Kļūdas ziņojums Derīgās vērtības ir pirmdiena, otrdiena, trešdiena, ceturtdiena vai piektdiena. Lūdzu, ievadiet vēlreiz! ! Derīgās vērtības ir no 1 līdz 39. Ievadiet vēlreiz!
Obligāts lauks
Indeksēts lauks

Piezīme. Deklarē atslēgas lauku "Tiesneša kods".

Pretenziju tabula

Lauka nosaukums Lietas numurs Prasītājs Atbilde-čiks Tiesneša kods Tikšanās datums
Datu tips Skaitlisks Teksts Teksts Skaitlisks Datums Laiks
Lauka rekvizīti: cilne Vispārīgi
Lauka izmērs Garš vesels skaitlis Garš vesels skaitlis Pilns datuma formāts
Lauka formāts Pamata
Cipari aiz komata
Noklusējuma vērtība
Nosacījums pēc vērtības > 0 Un<99999 > 36200 Un<36299
Kļūdas ziņojums Nepareizs ieraksts - atkārtojiet! Derīgās vērtības ir no 36201 līdz 36298. Lūdzu, ievadiet vēlreiz!
Obligāts lauks
Indeksēts lauks Jā (nav atļautas spēles) Jā (atļautas spēles)

2. Tiesnešu tabulā ievadiet šādus datu ierakstus:

Tabulā Prasības ievadiet šādus datu ierakstus:

3. Laukā "Tiesneša kods" izveidojiet attiecību viens pret daudziem starp tabulām Tiesneši un Tiesvedības... To darot, iestatiet "Datu integritātes nodrošināšana" un "saistīto lauku kaskādes atjaunināšana".

Literatūra:

galvenais:

1. Mišins A.V. Informācijas tehnoloģijas profesionālajā darbībā: mācību grāmata / A.V. Mišins, L.E. Mistrovs, D.V. Kartavcevs. - M .: RAP, 2011 .-- S. 259-264.

papildu:

Praktiskā nodarbība 31. numurs

Tēma Nr.11.2. Veidlapu un vaicājumu izveides principi Access DBVS

1. Ievades formu izstrāde datu ievadei.

2. Ievadīto datu aprēķināšanas un analīzes metodika.

Literatūra:

galvenais:

1. Mišins A.V. Informācijas tehnoloģijas profesionālajā darbībā: mācību grāmata / A.V. Mišins, L.E. Mistrovs, D.V. Kartavcevs. - M .: RAP, 2011 .-- S. 265-271.

papildu:

2. Informātika un informācijas tehnoloģijas: mācību grāmata augstskolu studentiem / I.G. Ļesņičaja, I.V. Pazudis, Yu.D. Romanovs, V.I. Šestakovs. - 2. izd. - M .: Eksmo, 2006 .-- 544 lpp.

3. Mikheeva E.V. Informācijas tehnoloģijas profesionālajā darbībā: mācību grāmata vidusskolu audzēkņiem / E.V. Mihejeva. - 2. izdevums, dzēsts. - M .: Akadēmija, 2005 .-- 384 lpp.

Nosūtiet savu labo darbu zināšanu bāzē ir vienkārši. Izmantojiet zemāk esošo veidlapu

Studenti, maģistranti, jaunie zinātnieki, kuri izmanto zināšanu bāzi savās studijās un darbā, būs jums ļoti pateicīgi.

Ievietots vietnē http://www.allbest.ru/

Statistikas datu apstrāde

Ievads

statistiskās dispersijas izlases korelācija

Eksperimenta rezultātu statistiskās apstrādes metodes ir matemātiskie paņēmieni, formulas, kvantitatīvo aprēķinu metodes, ar kuru palīdzību eksperimenta laikā iegūtos rādītājus var vispārināt, ienest sistēmā, atklājot tajos slēptos likumus. Runa ir par tādām statistiska rakstura likumsakarībām, kas pastāv starp eksperimentā pētītajiem mainīgajiem.

Dažas no matemātiskās un statistiskās analīzes metodēm ļauj aprēķināt tā saukto elementāro matemātisko statistiku, kas raksturo datu izlases sadalījumu, piemēram, izlases vidējo lielumu, izlases dispersiju, režīmu, mediānu un vairākus citus. Citas matemātiskās statistikas metodes, piemēram, dispersijas analīze, regresijas analīze, ļauj spriest par izlases individuālās statistikas izmaiņu dinamiku. Ar trešās grupas metožu palīdzību, piemēram, korelācijas analīzi, faktoru analīzi, izlases datu salīdzināšanas metodēm, var droši spriest par statistiskajām sakarībām, kas pastāv starp šajā eksperimentā pētāmajiem mainīgajiem.

1. Eksperimentu rezultātu primārās statistiskās apstrādes metodes

Visas matemātiskās un statistiskās analīzes metodes parasti iedala primārajā un sekundārajā. Metodes, ar kurām var iegūt rādītājus, kas tieši atspoguļo eksperimentā veikto mērījumu rezultātus, sauc par primārajām metodēm. Attiecīgi primārie statistikas rādītāji ir tie, kas tiek izmantoti pašās psihodiagnostikas metodēs un ir psihodiagnostikas rezultātu sākotnējās statistiskās apstrādes rezultāts. Tiek izsauktas sekundārās statistiskās apstrādes metodes, ar kuru palīdzību, pamatojoties uz primārajiem datiem, tiek atklāti tajās slēptie statistikas modeļi.

Galvenās statistiskās apstrādes metodes ietver, piemēram, izlases vidējās vērtības, izlases dispersijas, izlases režīma un izlases mediānas noteikšanu. Sekundārās metodes parasti ietver korelācijas analīzi, regresijas analīzi, metodes primārās statistikas salīdzināšanai divos vai vairākos paraugos.

Apsveriet elementārās matemātiskās statistikas aprēķināšanas metodes.

1.1 Mode

Parauga skaitliskais raksturlielums, kuram, kā likums, nav nepieciešami aprēķini, ir tā sauktais režīms. Mode ir pētāmās pazīmes kvantitatīvā vērtība, kas visbiežāk sastopama izlasē. Simetriskiem pazīmju sadalījumiem, ieskaitot normālo sadalījumu, režīma vērtība sakrīt ar vidējo un vidējo vērtību. Citiem izplatīšanas veidiem, asimetriskiem, tas nav raksturīgi. Piemēram, pazīmju vērtību secībā 1, 2, 5, 2, 4, 2, 6, 7, 2 režīms ir vērtība 2, jo tas notiek biežāk nekā citas vērtības - četras reizes.

Mode tiek atrasta saskaņā ar šādiem noteikumiem:

1) Gadījumā, ja visas vērtības izlasē rodas vienlīdz bieži, ir vispāratzīts, ka šai paraugu sērijai nav režīma. Piemēram: 5, 5, 6, 6, 7, 7 - šajā paraugā nav modes.

2) Ja divām blakus esošām (blakus esošām) vērtībām ir vienāda frekvence un to frekvence ir lielāka par jebkuru citu vērtību frekvenci, režīms tiek aprēķināts kā šo divu vērtību vidējais aritmētiskais. Piemēram, 1., 2., 2., 2., 5., 5., 5., 6. paraugā blakus esošo vērtību 2 un 5 frekvences sakrīt un ir vienādas ar 3. Šī frekvence ir lielāka par citu vērtību 1 un 5 frekvenci. 6 (kuriem tas ir vienāds ar 1). Tāpēc šīs sērijas režīms būs vērtība = 3,5

3) Ja izlasē divām neblakus esošām (nav blakus esošām) vērtībām ir vienādas frekvences, kas ir augstākas par jebkuras citas vērtības frekvencēm, tad izšķir divus režīmus. Piemēram, rindā 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 režīmi ir 11 un 14. Šajā gadījumā paraugs tiek uzskatīts par bimodālu.

Var pastāvēt arī tā sauktie multimodālie sadalījumi ar vairāk nekā divām virsotnēm (režīmiem).

4) Ja režīms tiek novērtēts pēc grupēto datu kopas, tad, lai atrastu režīmu, ir jānosaka grupa ar visaugstāko pazīmes biežumu. Šo grupu sauc par modālo grupu.

1.2 Mediāna

Mediāna ir pētāmās pazīmes vērtība, kas izlasi, kas sakārtota pēc šīs pazīmes vērtības, dala uz pusēm. Pa labi un pa kreisi no mediānas sakārtotajā sērijā paliek vienāds pazīmju skaits. Piemēram, paraugam 2, 3, 4, 4, 5, 6, 8, 7, 9 mediāna būs 5, jo pa kreisi un pa labi no tā ir četri rādītāji. Ja sērijā ir iekļauts pāra skaits pazīmju, mediāna būs vidējā vērtība, kas tiek ņemta kā sērijas divu centrālo vērtību pusi summas summa. Nākamajai rindai 0, 1, 1, 2, 3, 4, 5, 5, 6, 7 vidējā vērtība būs 3,5.

Mediānas zināšanas ir noderīgas, lai noteiktu, vai pētāmās pazīmes konkrēto vērtību sadalījums ir simetrisks un tuvu tā sauktajam normālajam sadalījumam. Normālā sadalījuma vidējais un mediānas lielums parasti sakrīt vai ļoti maz atšķiras viens no otra. Ja raksturlielumu izlases sadalījums ir normāls, tad tam var piemērot sekundāro statistisko aprēķinu metodes, kuru pamatā ir datu normāls sadalījums. Pretējā gadījumā to nevar izdarīt, jo aprēķinos var iekļūt nopietnas kļūdas.

1.3. Parauga vidējā vērtība

Izlases vidējā (vidējā aritmētiskā) vērtība kā statistiskais rādītājs ir eksperimentā pētītās psiholoģiskās kvalitātes vidējais novērtējums. Šis novērtējums raksturo tā attīstības pakāpi kopumā tajā subjektu grupā, kas tika pakļauta psihodiagnostiskajai pārbaudei. Tieši salīdzinot divu vai vairāku paraugu vidējās vērtības, varam spriest par šo paraugu veidojošo cilvēku relatīvo attīstības pakāpi, novērtēto kvalitāti.

1.4. Parauga izkliedēšana

Izlases izplatību (dažreiz šo vērtību sauc par diapazonu) apzīmē ar burtu R. Tas ir vienkāršākais rādītājs, ko var iegūt paraugam - starpība starp noteiktās variāciju sērijas maksimālo un minimālo vērtību, ti

R = xmax - xmin

Ir skaidrs, ka jo vairāk mainās izmērītais raksturlielums, jo lielāka ir R vērtība un otrādi. Tomēr var gadīties, ka divām paraugu sērijām gan vidējie, gan diapazoni ir vienādi, taču šo sēriju variācijas raksturs būs atšķirīgs. Piemēram, tiek doti divi paraugi:

X = 10 15 20 25 30 35 40 45 50 X = 30 R = 40

Y = 10 28 28 30 30 30 32 32 50 Y = 30 R = 40

Tā kā šo divu paraugu sēriju vidējie un starpības ir vienādas, to variāciju raksturs ir atšķirīgs. Lai skaidrāk izprastu paraugu variāciju būtību, jāatsaucas uz to sadalījumiem.

1.5 Izkliede

Variance ir mainīgā lieluma vērtību novirzes no tā vidējās kvadrātu aritmētiskais vidējais.

Variance kā statistika raksturo to, cik lielā mērā konkrētās vērtības atšķiras no vidējā noteiktā paraugā. Jo lielāka dispersija, jo lielāka ir datu novirze vai izkliede.

Kvadrātsakne tiek iegūta no kvadrātu summas, kas dalīta ar rindas vārdu skaitu.

Dažreiz ir diezgan daudz sākotnējo privāto primāro datu, kas tiek pakļauti statistiskai apstrādei, un tiem ir nepieciešams milzīgs skaits elementāru aritmētisko darbību. Lai samazinātu to skaitu un vienlaikus saglabātu nepieciešamo aprēķinu precizitāti, dažreiz viņi izmanto sākotnējo konkrētu empīrisko datu paraugu aizvietošanu ar intervāliem. Intervāls ir raksturīgo vērtību grupa, kas sakārtota pēc vērtības, kas aprēķina procesā tiek aizstāta ar vidējo vērtību.

2. Eksperimentu rezultātu sekundārās statistiskās apstrādes metodes

Ar eksperimentālo datu statistiskās apstrādes sekundāro metožu palīdzību tiek tieši pārbaudītas, pierādītas vai atspēkotas ar eksperimentu saistītās hipotēzes. Šīs metodes, kā likums, ir sarežģītākas nekā primārās statistikas apstrādes metodes un prasa labu sagatavošanos no pētnieka elementārās matemātikas un statistikas jomā. (7).

Apskatīto metožu grupu var iedalīt vairākās apakšgrupās:

1. Regresijas aprēķins.

2. Metodes divu vai vairāku elementāru statistikas datu (vidējie, dispersijas utt.) salīdzināšanai, kas saistīti ar dažādām izlasēm.

3. Metodes statistisko sakarību noteikšanai starp mainīgajiem lielumiem, piemēram, to savstarpējā korelācija.

4. Empīrisko datu iekšējās statistiskās struktūras noteikšanas metodes (piemēram, faktoru analīze). Apskatīsim katru no atlasītajām sekundārās statistiskās apstrādes metožu apakšgrupām ar piemēriem.

2.1 Regresijas aprēķins

Regresijas aprēķins ir matemātiskās statistikas metode, kas ļauj reducēt privātos, atšķirīgos datus līdz noteiktam līniju grafikam, aptuveni atspoguļojot to iekšējo savstarpējo saistību, un iegūt iespēju aptuveni novērtēt cita mainīgā iespējamo vērtību pēc viena no mainīgā lieluma vērtības. mainīgie (7).

Regresijas vienādojuma grafisko izteiksmi sauc par regresijas līniju. Regresijas līnija izsaka labākās atkarīgā mainīgā (Y) prognozes neatkarīgiem mainīgajiem (X).

Regresiju izsaka, izmantojot divus regresijas vienādojumus, kas vistiešākajā gadījumā izskatās kā taisnās līnijas vienādojumi.

Y = a 0 + a 1 * X

X = b 0 + b 1 * Y

(1) vienādojumā Y ir atkarīgais mainīgais, X ir neatkarīgais mainīgais, a 0 ir krustpunkts, a 1 ir regresijas koeficients jeb slīpums, kas nosaka regresijas taisnes slīpumu attiecībā pret koordinātu asīm.

(2) vienādojumā X ir atkarīgais mainīgais, Y ir neatkarīgais mainīgais, b 0 ir krustpunkts, b 1 ir regresijas koeficients jeb slīpums, kas nosaka regresijas taisnes slīpumu attiecībā pret koordinātu asīm.

Attiecību (attiecību) starp X un Y (starp Y un X) kvantificēšanu sauc par regresijas analīzi. Regresijas analīzes galvenais uzdevums ir atrast koeficientus a 0, b 0, a1 un b 1 un noteikt iegūto analītisko izteiksmju nozīmības līmeni, kas savieno mainīgos X un Y.

Lai izmantotu lineārās regresijas analīzes metodi, ir jāievēro šādi nosacījumi:

1. Salīdzinātie mainīgie X un Y jāmēra intervālu vai attiecību skalā.

2. Pieņem, ka mainīgajiem X un Y ir normāls sadalījums.

3. Salīdzināmo mainīgo mainīgo pazīmju skaitam jābūt vienādam. (5).

2.2. Korelācija

Nākamo sekundārās statistiskās apstrādes metodi, ar kuras palīdzību tiek noskaidrota saistība vai tiešā sakarība starp divām eksperimentālo datu sērijām, sauc par korelāciju metodi. Tas parāda, kā viena parādība ietekmē citu vai ir saistīta ar to savā dinamikā. Šāda veida attiecības pastāv, piemēram, starp lielumiem, kas ir cēloņsakarībās savā starpā. Ja izrādās, ka divas parādības statistiski ticami korelē viena ar otru un ja tajā pašā laikā pastāv pārliecība, ka viena no tām var būt par cēloni otrai parādībai, tad tas noteikti liek secināt, ka starp tām pastāv cēloņsakarība. . (7)

Ja viena mainīgā līmeņa pieaugumu pavada cita līmeņa paaugstināšanās, tad mēs runājam par pozitīvu korelāciju. Ja viena mainīgā pieaugums notiek ar otra līmeņa pazemināšanos, tad runā par negatīvu korelāciju. Ja starp mainīgajiem nav saiknes, mums ir darīšana ar nulles korelāciju. (1)

Šai metodei ir vairākas variācijas: lineāra, ranžēta, savienota pārī un daudzkārtēja. Lineārā korelācijas analīze ļauj izveidot tiešas attiecības starp mainīgajiem pēc to absolūtajām vērtībām. Šie savienojumi ir grafiski izteikti kā taisna līnija, tāpēc arī nosaukums "lineārs". Ranga korelācija nosaka atkarību nevis starp mainīgo lielumu absolūtajām vērtībām, bet gan starp kārtas vietām vai to ieņemtajām rindām pēc lieluma. Pāru korelācijas analīze ietver korelācijas atkarību izpēti tikai starp mainīgo pāriem un vairāku vai daudzfaktoru - starp daudziem mainīgajiem vienlaikus. Faktoranalīze ir plaši izplatīta daudzfaktoru korelācijas analīzes forma lietišķajā statistikā. (5)

Ranga korelācijas koeficients psiholoģiskajā un pedagoģiskajā pētniecībā tiek aplūkots gadījumā, ja pazīmes, starp kurām tiek konstatēta atkarība, ir kvalitatīvi atšķirīgas un nav precīzi novērtējamas, izmantojot tā saukto intervālu mērīšanas skalu. Intervālu skalu sauc par skalu, kas ļauj novērtēt attālumu starp tā vērtībām un spriest, kura no tām ir lielāka un cik lielāka par otru. Piemēram, lineāls, ko izmanto objektu garumu novērtēšanai un salīdzināšanai, ir intervāla skala, jo, izmantojot to, mēs varam apgalvot, ka attālums starp diviem un sešiem centimetriem ir divreiz lielāks par attālumu starp sešiem un astoņiem centimetriem. Ja, izmantojot kādu mērinstrumentu, mēs varam tikai apgalvot, ka daži rādītāji ir vairāk nekā citi, bet nevaram pateikt, cik daudz, tad šādu mērinstrumentu sauc nevis par intervālu, bet gan par kārtas.

Lielākā daļa rādītāju, kas tiek iegūti psiholoģiskajos un pedagoģiskajos pētījumos, attiecas uz kārtas, nevis intervālu skalām (piemēram, vērtējumi "jā", "nē", "drīzāk nē, nevis jā" un citi, ko var pārvērst punktos), tāpēc , lineārās korelācijas koeficients tiem nav piemērojams.

Vairāku korelāciju metode, atšķirībā no pāru korelāciju metodes, ļauj atklāt korelācijas atkarību vispārējo struktūru daudzdimensionālā eksperimentālā materiālā, kas ietver vairāk nekā divus mainīgos lielumus, un parādīt šīs korelācijas atkarības kā noteikta sistēma.

Lai piemērotu noteiktu korelācijas koeficientu, ir jāievēro šādi nosacījumi:

1. Salīdzināmie mainīgie lielumi jāmēra intervālu vai attiecību skalā.

2. Tiek pieņemts, ka visiem mainīgajiem ir normāls sadalījums.

3. Salīdzināmo mainīgo mainīgo pazīmju skaitam jābūt vienādam.

4. Lai novērtētu Pīrsona korelācijas koeficienta ticamības līmeni, izmantojiet formulu (11.9) un kritisko vērtību tabulu Stjudenta t-testam pie k = n - 2. (5)

2.3. Faktoru analīze

Faktoru analīze ir statistikas metode, ko izmanto, apstrādājot lielus eksperimentālo datu masīvus. Faktoranalīzes uzdevumi ir: mainīgo lielumu skaita samazināšana (datu samazināšana) un mainīgo attiecību struktūras noteikšana, t.i. mainīgo lielumu klasifikācija, tāpēc faktoru analīze tiek izmantota kā datu samazināšanas metode vai kā strukturālās klasifikācijas metode.

Būtiska atšķirība starp faktoru analīzi un visām iepriekš aprakstītajām metodēm ir tā, ka to nevar izmantot primāro vai, kā saka, "neapstrādātu" eksperimentālo datu apstrādei, t.i. kas iegūti tieši no priekšmetu eksāmena. Faktoranalīzes materiāls ir korelācijas saites, pareizāk sakot, Pīrsona korelācijas koeficienti, kas tiek aprēķināti starp aptaujā iekļautajiem mainīgajiem (t.i., psiholoģiskajiem raksturlielumiem). Citiem vārdiem sakot, korelācijas matricas vai, kā tās citādi sauc, starpkorelācijas matricas, tiek pakļautas faktoru analīzei. Kolonnu un rindu nosaukumi šajās matricās ir vienādi, jo tie atspoguļo analīzē iekļauto mainīgo sarakstu. Šī iemesla dēļ savstarpējās korelācijas matricas vienmēr ir kvadrātveida, t.i. rindu skaits tajās ir vienāds ar kolonnu skaitu, un simetrisks, t.i. simetriskās vietās attiecībā pret galveno diagonāli ir vienādi korelācijas koeficienti.

Faktoranalīzes galvenais jēdziens ir faktors. Tas ir mākslīgs statistikas rādītājs, kas rodas īpašu pārveidojumu rezultātā korelācijas koeficientu tabulā starp pētītajiem psiholoģiskajiem raksturlielumiem jeb savstarpējās korelācijas matricu. Procedūru faktoru iegūšanai no savstarpējās korelācijas matricas sauc par matricas faktorizāciju. Faktorizācijas rezultātā no korelācijas matricas var iegūt atšķirīgu faktoru skaitu, līdz skaitlim, kas vienāds ar sākotnējo mainīgo skaitu. Tomēr faktori, kas identificēti faktorizācijas rezultātā, parasti ir nevienlīdzīgi pēc nozīmes. (5)

Identificētie faktori izskaidro psiholoģisko parādību savstarpējo atkarību. (7)

Visbiežāk faktoru analīzes rezultātā tiek noteikts nevis viens, bet vairāki faktori, kas dažādos veidos izskaidro mainīgo savstarpējās korelācijas matricu. Šajā gadījumā faktorus iedala vispārīgos, vispārīgos un individuālajos faktoros. Par faktoriem sauc vispārīgos faktorus, kuru visas faktoriālās slodzes būtiski atšķiras no nulles (nulles slodze norāda, ka šis mainīgais nekādi nav saistīts ar pārējiem un dzīvē uz tiem nekādi neietekmē). Kopējie faktori ir faktori, kuriem daži faktoru slodzes nav nulle. Atsevišķi faktori ir faktori, kuros tikai viena no slodzēm būtiski atšķiras no nulles. (7)

Faktoru analīze var būt piemērota, ja ir izpildīti šādi kritēriji.

1. Nav iespējams faktorizēt kvalitatīvos datus, kas iegūti pēc nosaukumu skalas, piemēram, piemēram, matu krāsa (melns / brūns / sarkans) utt.

2. Visiem mainīgajiem ir jābūt neatkarīgiem, un to sadalījumam jābūt tuvu normālam.

3. Attiecībām starp mainīgajiem ir jābūt aptuveni lineārām vai vismaz tām nav jābūt skaidri izliekta rakstura.

4. Sākotnējai korelācijas matricai jābūt vairākām korelācijām absolūtā vērtībā virs 0,3. Citādi no matricas ir diezgan grūti izvilkt kādus faktorus.

5. Priekšmetu izlasei jābūt pietiekami lielai. Ekspertu ieteikumi atšķiras. Stingrākais viedoklis iesaka neizmantot faktoru analīzi, ja subjektu skaits ir mazāks par 100, jo korelācijas standarta kļūdas šajā gadījumā būs pārāk lielas.

Tomēr, ja faktori ir labi definēti (piemēram, ar slodzi 0,7, nevis 0,3), eksperimentētājam ir nepieciešams mazāks paraugs, lai tos izolētu. Turklāt, ja ir zināms, ka iegūtie dati ir ļoti ticami (piemēram, tiek izmantoti derīgi testi), tad datus var analizēt mazākam subjektu skaitam. (5).

2.4 UNizmantojot faktoru analīzi

Faktoranalīzi plaši izmanto psiholoģijā dažādos virzienos, kas saistīti gan ar teorētisko, gan praktisko problēmu risināšanu.

Teorētiskā izteiksmē faktoru analīzes izmantošana ir saistīta ar tā sauktās faktoranalītiskās pieejas attīstību personības struktūras, temperamenta un spēju izpētē. Faktoranalīzes izmantošana šajās jomās ir balstīta uz plaši pieņemto pieņēmumu, ka novērojamie un tieši izmērāmie rādītāji ir tikai vispārīgāku raksturlielumu netiešas un/vai daļējas ārējās izpausmes. Šie raksturlielumi, atšķirībā no pirmajiem, ir slēpti, tā sauktie latentie mainīgie, jo tie ir jēdzieni vai konstrukcijas, kas nav pieejamas tiešai mērīšanai. Tomēr tos var noteikt, faktorējot korelācijas starp novērotajām pazīmēm un identificējot faktorus, kurus (ar nosacījumu, ka struktūra ir laba) var interpretēt kā vēlamā latentā mainīgā statistisko izteiksmi.

Lai gan faktoriem ir tīri matemātisks raksturs, tiek pieņemts, ka tie pārstāv slēptos mainīgos (teorētiski postulētas konstrukcijas vai jēdzienus), tāpēc faktoru nosaukumi bieži atspoguļo pētāmās hipotētiskās konstrukcijas būtību.

Pašlaik faktoru analīzi plaši izmanto diferenciālpsiholoģijā un psihodiagnostikā. Ar tās palīdzību jūs varat izveidot testus, izveidot savienojumu struktūru starp individuālajām psiholoģiskajām īpašībām, ko mēra ar testu vai testa priekšmetu kopu.

Faktoru analīzi izmanto arī, lai standartizētu pārbaudes metodes, ko veic reprezentatīvam subjektu paraugam.

Secinājums

Ja eksperimentā iegūtajiem datiem ir kvalitatīvs raksturs, tad uz to secinājumu pamata izdarīto secinājumu pareizība ir pilnībā atkarīga no pētnieka intuīcijas, erudīcijas un profesionalitātes, kā arī no viņa argumentācijas loģikas. Ja šie dati ir kvantitatīvi, tad vispirms tie veic primāro un pēc tam sekundāro statistisko apstrādi. Primārā statistiskā apstrāde sastāv no nepieciešamā elementārās matemātiskās statistikas skaita noteikšanas. Šāda apstrāde gandrīz vienmēr ietver vismaz parauga vidējās vērtības noteikšanu. Gadījumos, kad relatīvo vidējo datu izkliede ir informatīvs rādītājs izvirzīto hipotēžu eksperimentālai pārbaudei, tiek aprēķināta dispersija vai standartnovirze. Mediānas vērtību ieteicams aprēķināt, ja paredzēts izmantot sekundārās statistiskās apstrādes metodes, kas aprēķinātas uz normālā sadalījuma.Šādam izlases datu sadalījuma veidam mediāna, kā arī režīms sakrīt vai ir pietiekami tuvu uz vidējo vērtību. Šo kritēriju var izmantot, lai aptuveni spriestu par iegūtā primāro datu sadalījuma raksturu.

Sekundārā statistiskā apstrāde (vidējo, dispersiju, datu sadalījumu salīdzināšana, regresijas analīze, korelācijas analīze, faktoru analīze utt.) tiek veikta, ja problēmu risināšanai vai izvirzīto hipotēžu pierādīšanai nepieciešams noteikt slēptos statistikas modeļus. primārajos eksperimentālajos datos. Uzsākot sekundāro statistisko apstrādi, pētniekam vispirms jāizlemj, kura no dažādajām sekundārajām statistikā viņam jāizmanto primāro eksperimentālo datu apstrādei. Lēmums tiek pieņemts, pamatojoties uz pārbaudāmās hipotēzes raksturu un eksperimenta rezultātā iegūtā primārā materiāla raksturu. Šeit ir daži ieteikumi šajā sakarā.

Ieteikums 1. Ja eksperimentālā hipotēze satur pieņēmumu, ka psiholoģiskā un pedagoģiskā pētījuma rezultātā jebkuras kvalitātes rādītāji palielināsies (vai samazināsies), tad ieteicams izmantot Studenta kritēriju vai ch2 kritēriju, lai salīdzinātu pre - un pēceksperimenta dati. Uz pēdējo attiecas, ja primārie eksperimentālie dati ir relatīvi un izteikti, piemēram, procentos.

2. ieteikums. Ja eksperimentāli pārbaudīta hipotēze ietver apgalvojumu par cēloņsakarību starp dažiem mainīgajiem, tad ieteicams to pārbaudīt, atsaucoties uz lineārās vai rangu korelācijas koeficientiem. Lineāro korelāciju izmanto, ja neatkarīgie un atkarīgie mainīgie tiek mērīti, izmantojot intervālu skalu, un izmaiņas šajos mainīgajos pirms un pēc eksperimenta ir nelielas. Par ranga korelāciju sauc, ja pietiek ar to, lai novērtētu izmaiņas secības secībā neatkarīgo un atkarīgo mainīgo lieluma izteiksmē vai ja to izmaiņas ir pietiekami lielas, vai ja mērinstruments ir bijis kārtas, nevis intervāls.

3. ieteikums. Dažkārt hipotēze ietver pieņēmumu, ka eksperimenta rezultātā individuālās atšķirības starp subjektiem palielināsies vai samazināsies. Šis pieņēmums ir labi pārbaudīts, izmantojot Fišera testu, kas ļauj salīdzināt atšķirības pirms un pēc eksperimenta. Ņemiet vērā, ka, izmantojot Fišera kritēriju, var strādāt tikai ar rādītāju absolūtajām vērtībām, bet ne ar to rindām.

Ievietots vietnē Allbest.ru

...

Līdzīgi dokumenti

    Statistikas datu apstrādes un analīzes pamatmetodes un metodes. Vidējo aritmētisko, harmonisko un ģeometrisko vērtību aprēķins. Izplatīšanas sērijas, to galvenie raksturlielumi. Izlīdzināšanas tehnikas tuvu dinamikai. Nacionālo kontu sistēma.

    kursa darbs pievienots 24.10.2014

    Ekonomiskās analīzes kā zinātnes jēdziens, tās būtība, priekšmets, metožu vispārīgie raksturojumi un sociāli ekonomiskā efektivitāte. Galvenās ekonometriskās analīzes un datu apstrādes metožu grupas. Uzņēmuma ekonomisko datu faktoru analīze.

    abstrakts, pievienots 03.04.2010

    Izlases vidējais aritmētiskais, dispersija, standartnovirze. Noraidījums pēc Šovinē kritērija. Trīs sigmu noteikums. Abu paraugu vidējo vērtību starpības nozīmīguma novērtējums. Pārī savienotas, vairākas regresijas analīzes. Pilnīga faktoru analīze.

    kursa darbs pievienots 12.05.2012

    Dažādu statistisko datu prezentācijas un apstrādes metožu pielietošana. Telpiskās statistikas paraugi. Pāru regresija un korelācija. Laika rindas. Tendences veidošana. Praktiski piemēri un to risināšanas metodes, formulas un to nozīme.

    lekciju kurss, pievienots 26.02.2009

    Mērījumu rezultātu statistiskā apstrāde; vidējais aritmētiskais, kvadrātiskais, dispersija. Izlases parametru noteikšana: trīs sigmu likums, histogramma, kontroles diagrammas, Išikavas diagramma. Kvalitatīvu instrumentu izmantošana dīvānu ražošanā.

    kursa darbs pievienots 17.10.2014

    Vidējā vērtība statistikā, tās būtība un lietošanas nosacījumi. Vidējo rādītāju veidi un formas: pēc atribūta-svara klātbūtnes, pēc aprēķina formas, pēc populācijas pārklājuma. Mode, mediāna. Peļņas un rentabilitātes dinamikas statistiskais pētījums uz OJSC "Bashmebel" piemēra.

    tests, pievienots 14.06.2008

    Statistisko datu apstrādes principi, šajā procesā izmantotās metodes un paņēmieni. Vadības karšu konstruēšanas metodika un galvenie posmi, to klasifikācija un veidi, funkcionālās īpašības, izmantošanas priekšrocību un trūkumu identificēšana.

    kursa darbs, pievienots 23.08.2014

    Skaitlisko raksturlielumu aprēķināšana un izlases novērojumu rezultātu apstrāde. Statistisko rādītāju aprēķināšana un analīze ekonomikā. Nacionālā bagātība: elementi, novērtējums; aktīvu un pasīvu bilance; pamatlīdzekļi, apgrozāmo līdzekļu rādītāji.

    kursa darbs, pievienots 25.12.2012

    Aprakstošā statistika un statistiskie secinājumi. Atlases metodes, lai nodrošinātu, ka izlase ir reprezentatīva. Parauga veida ietekme uz kļūdas lielumu. Uzdevumi, pielietojot izlases metodi. Novērojumu datu izplatīšana plašai sabiedrībai.

    tests, pievienots 27.02.2011

    Jēdziena izpaušana: intervālu skala, vidējais aritmētiskais, statistiskās nozīmīguma līmenis. Kā interpretēt modi, mediānu un vidējo. Problēmu risināšana, izmantojot Frīdmena, Rozenbauma kritēriju. Sprimena korelācijas koeficienta aprēķins.

Eksperimenta rezultātu statistiskās apstrādes metodes ir matemātiskie paņēmieni, formulas, kvantitatīvo aprēķinu metodes, ar kuru palīdzību eksperimenta laikā iegūtos rādītājus var vispārināt, ienest sistēmā, atklājot tajos slēptos likumus.

Runa ir par tādām statistiska rakstura likumsakarībām, kas pastāv starp eksperimentā pētītajiem mainīgajiem.

Dati Vai galvenie elementi, kas klasificējami vai klasificējami apstrādei 26.

Dažas no matemātiskās un statistiskās analīzes metodēm ļauj aprēķināt tā saukto elementāro matemātisko statistiku, kas raksturo datu izlases sadalījumu, piemēram:

Vidējie paraugi,

Izlases dispersija,

Mediāna un vairākas citas.

Citas matemātiskās statistikas metodes ļauj spriest par izlases individuālās statistikas izmaiņu dinamiku, piemēram:

dispersijas analīze,

Regresijas analīze.

Ar trešās izlases datu metožu grupas palīdzību var droši spriest par statistiskajām sakarībām, kas pastāv starp šajā eksperimentā pētāmajiem mainīgajiem:

Korelācijas analīze;

Faktoru analīze;

Salīdzināšanas metodes.

Visas matemātiskās un statistiskās analīzes metodes parasti iedala primārajā un sekundārajā 27.

Metodes, ar kurām var iegūt rādītājus, kas tieši atspoguļo eksperimentā veikto mērījumu rezultātus, sauc par primārajām metodēm.

Tiek izsauktas sekundārās statistiskās apstrādes metodes, ar kuru palīdzību, pamatojoties uz primārajiem datiem, tiek atklāti tajās slēptie statistikas modeļi.

Galvenās statistikas apstrādes metodes ietver, piemēram:

Izlases vidējā noteikšana;

Selektīva dispersija;

Selektīvā mode;

Izlases mediāna.

Sekundārās metodes parasti ietver:

Korelācijas analīze;

Regresijas analīze;

Divu vai vairāku paraugu primārās statistikas salīdzināšanas metodes.

Apskatīsim elementārās matemātiskās statistikas aprēķināšanas metodes, sākot ar izlases vidējo.

Vidējais aritmētiskais - tā ir visu datu vērtību summas attiecība pret terminu skaitu 28.

Vidējā vērtība kā statistiskais rādītājs ir eksperimentā pētītās psiholoģiskās kvalitātes vidējais novērtējums.

Šis novērtējums raksturo tā attīstības pakāpi kopumā tajā subjektu grupā, kas tika pakļauta psihodiagnostiskajai pārbaudei. Tieši salīdzinot divu vai vairāku paraugu vidējās vērtības, varam spriest par šo paraugu veidojošo cilvēku relatīvo attīstības pakāpi, novērtēto kvalitāti.

Parauga vidējo nosaka, izmantojot šādu formulu 29:

kur x cf ir izlases vidējais vai vidējais aritmētiskais;

n - subjektu skaits izlasē vai privātie psihodiagnostikas rādītāji, uz kuru pamata aprēķina vidējo vērtību;

x k - atsevišķu priekšmetu specifiskas rādītāju vērtības. Kopumā ir n šādi rādītāji, tāpēc šī mainīgā indeksam k ir vērtības no 1 līdz n;

∑ - pieņemta matemātikā to mainīgo vērtību summēšanas zīme, kas atrodas pa labi no šīs zīmes.

Izkliede Ir datu izkliedes mērs ap vidējo 30.

Jo lielāka dispersija, jo lielāka ir datu novirze vai izkliede. To nosaka, lai varētu atšķirt vienu no otras vērtības, kurām ir vienāda vidējā, bet atšķirīga izkliede.

Izkliedi nosaka pēc šādas formulas:

kur ir izlases dispersija vai vienkārši dispersija;

Izteiksme, kas nozīmē, ka visiem x k ​​no pirmā līdz pēdējam konkrētajā izlasē ir jāaprēķina atšķirības starp konkrēto un vidējo vērtību, šīs atšķirības kvadrātā un summa;

n ir subjektu skaits izlasē vai primārās vērtības, kurām aprēķina dispersiju.

Mediāna tiek izsaukta pētāmās pazīmes vērtība, kas izlasi, kas sakārtota pēc dotās pazīmes vērtības, sadala uz pusēm.

Mediānas zināšanas ir noderīgas, lai noteiktu, vai pētāmās pazīmes konkrēto vērtību sadalījums ir simetrisks un tuvojas tā sauktajam normālajam sadalījumam. Normālā sadalījuma vidējais un mediānas lielums parasti sakrīt vai ļoti maz atšķiras viens no otra.

Ja raksturlielumu izlases sadalījums ir normāls, tad tam var piemērot sekundāro statistisko aprēķinu metodes, kuru pamatā ir datu normāls sadalījums. Pretējā gadījumā to nevar izdarīt, jo aprēķinos var iekļūt nopietnas kļūdas.

Mode vēl viena elementāra matemātiskā statistika un eksperimentālo datu sadalījuma raksturlielumi. Mode ir pētāmās pazīmes kvantitatīvā vērtība, kas visbiežāk sastopama izlasē.

Simetriskiem pazīmju sadalījumiem, ieskaitot normālo sadalījumu, režīma vērtības sakrīt ar vidējām un vidējām vērtībām. Citu veidu sadalījumiem, asimetriskiem, tas nav raksturīgi.

Sekundārās statistiskās apstrādes metodi, ar kuras palīdzību tiek noskaidrota divu eksperimentālo datu sēriju saikne vai tieša saistība, sauc. korelācijas analīzes metode. Tas parāda, kā viena parādība ietekmē citu vai ir saistīta ar to savā dinamikā. Šāda veida attiecības pastāv, piemēram, starp lielumiem, kas ir cēloņsakarībās savā starpā. Ja izrādās, ka divas parādības statistiski ticami korelē viena ar otru un ja tajā pašā laikā pastāv pārliecība, ka viena no tām var būt par cēloni otrai parādībai, tad tas noteikti liek secināt, ka starp tām pastāv cēloņsakarība. .

Šai metodei ir vairākas variācijas:

Lineārā korelācijas analīze ļauj izveidot tiešas attiecības starp mainīgajiem pēc to absolūtajām vērtībām. Šie savienojumi ir grafiski izteikti kā taisna līnija, tāpēc arī nosaukums "lineārs".

Lineārās korelācijas koeficientu nosaka, izmantojot šādu formulu 31:

kur r xy - lineārās korelācijas koeficients;

x, y - salīdzināmo vērtību vidējās paraugu vērtības;

NS i , plkst i - salīdzināmo vērtību daļējas izlases vērtības;

NS - kopējais vērtību skaits salīdzināmajā rādītāju sērijā;

Izkliede, salīdzināmo vērtību novirzes no vidējām vērtībām.

Ranga korelācija nosaka atkarību nevis starp mainīgo lielumu absolūtajām vērtībām, bet gan starp kārtas vietām vai to ieņemtajām rindām pēc lieluma. Ranga korelācijas koeficienta formula ir 32:

kur R s ir Spīrmena ranga korelācijas koeficients;

d i - atšķirību starp vienu un to pašu priekšmetu rādītāju rangiem sakārtotās rindās;

NS - subjektu vai digitālo datu (rangu) skaits korelētajā sērijā.

Atjuševa Anna

Darbā, izmantojot 7. klašu skolēnu sekmju datu apstrādes piemēru, aplūkoti galvenie statistiskie raksturlielumi, veikta statistikas datu vākšana un grupēšana, uzskatāmi atspoguļota statistiskā informācija, kā arī iegūto datu analīze. veikts.

Darbam ir pievienota prezentācija.

Lejupielādēt:

Priekšskatījums:

Pašvaldības autonomā izglītības iestāde "24.ģimnāzija"

XXII zinātniskā konference MAGNI

Statistisko datu apstrāde

MAOU "Ģimnāzija Nr. 24" Atjuševa Anna

Konsultants: matemātikas skolotājs

Ščetinina Natālija Sergejevna

Magadana, 2016

Ievads ………………………………………………………………………………………………… 3

  1. Statistikas datu apstrādes pamatjēdzieni ………………………… .5
  2. Pētījuma daļa ………………………………………………… ................................ . ...... 7

2.1.Datu statistiskā apstrāde par skolēnu sekmībām 7. "B" klasē ………………… ..7

2.2. Vizuāla datu prezentācija, izmantojot histogrammas ………………………………………………………………………………………………… 18

2.3. Skolēnu izglītības aktivitātes salīdzinošais raksturojums pēc 1. un 2. ceturkšņa rezultātiem ................................ .................................. 21

2.4. 7. "B" klases skolēnu anketas analīze vecāku kontrolei pār bērnu sekmēm ................................. ................................ 23

Secinājums …………………………………………………………………………………………… 27

Literatūra ………………………………………………………………………………………………… 28

Ievads

Jebkurš no mums, atverot grāmatu vai avīzi, ieslēdzot televizoru vai nokļūstot dzelzceļa stacijā, pastāvīgi saskaras ar informācijas sniegšanas tabulas formu. Tie ir nodarbību grafiks, vilcienu grafiks, reizināšanas tabula un daudz kas cits. Visa informācija tiek parādīta diagrammu vai grafiku veidā.

Jums ir jāspēj apstrādāt un analizēt šādu informāciju. Bez datu apstrādes, notikumu salīdzināšanas nav iespējams izsekot konkrētas problēmas attīstībai.

Algebras gaitā pētījām statistiskos raksturlielumus, kas tiek plaši izmantoti dažādos pētījumos. Mani interesēja pētāmo raksturlielumu praktiskā pielietošana un iespēja apstrādāt datus tā, lai sniegtā informācija skaidri noteiktu konkrētas problēmas attīstības gaitu un līdz ar to arī tās risināšanas rezultātu. Kā šādu problēmu nolēmu apsvērt savas klases sniegumu pirmā pusgada ceturkšņos.

Objektu izpētes zona- algebra

Pētījuma objekts- statistiskie raksturlielumi

Studiju priekšmets- 7 "B" klases skolēnu mācību sasniegumi pirmā pusgada ceturkšņos

Hipotēze: Mēs uzskatām, ka, izmantojot 7.B klases skolēnu sasniegumu datu apstrādes piemēru, mēs ne tikai iepazīsimies ar galvenajiem statistikas rādītājiem, bet arī paši iemācīsimies:

  • apkopot un grupēt statistikas datus;
  • vizuāli pasniegt statistisko informāciju;
  • analizēt iegūtos datus.

Mērķis: iemācīties apstrādāt, analizēt un vizualizēt pieejamo informāciju.

Uzdevumi:

  • pētīt statistiskos raksturlielumus;
  • ceturkšņos apkopot informāciju par skolēnu sniegumu 7. klasē

gada pirmajā pusē;

  • apstrādāt informāciju;
  • veikt informācijas vizuālu prezentāciju, izmantojot histogrammas;
  • analizēt iegūtos datus, izdarīt atbilstošus secinājumus.

Statistikas datu apstrādes pamatjēdzieni

Statistika ir zinātne, kas nodarbojas ar kvantitatīvu datu iegūšanu, apstrādi un analīzi par dažādām dabā un sabiedrībā sastopamām masu parādībām. Vārds "statistika" cēlies no latīņu vārda "status", kas nozīmē "stāvoklis, lietu stāvoklis".

Vienkāršākie statistiskie raksturlielumi ir vidējais aritmētiskais, mediāna, diapazons, režīms.

  • Vidējais aritmētiskaisskaitļu sēriju sauc par šo skaitļu summas dalījumu ar vārdu skaitu. Parasti vidējo aritmētisko nosaka, ja vēlas noteikt vidējo vērtību noteiktai datu sērijai: kviešu vidējā raža no hektāra reģionā, vienas darba grupas vidējā izlaide maiņā, sertifikāta vidējais vērtējums, vidējā gaisa temperatūra pusdienlaikā šajā dekādē u.c.
  • Mediāna sakārtotu skaitļu virkni ar nepāra skaitu locekļu sauc par vidū rakstīto skaitli, bet sakārtotas skaitļu sērijas ar pāra skaitu skaitļu mediānu sauc par vidējo aritmētisko diviem skaitļiem, kas ierakstīti vidū. Ņemiet vērā, ka ērtāk un ātrāk ir strādāt ar skaitļu sēriju, ja tā ir pasūtīta, t.i. rinda, kurā katrs nākamais skaitlis nav mazāks (vai ne lielāks) par iepriekšējo.
  • Mode skaitļu sēriju sauc par skaitli, kas visbiežāk atrodams dotajā sērijā. Vairākiem numuriem var būt vairāk nekā viens modifikācija vai modifikācija var nebūt vispār. Datu sērijas režīms parasti tiek atrasts, ja vēlas identificēt kādu tipisku rādītāju. Ņemiet vērā, ka skaitļu sērijas vidējais aritmētiskais var nesakrist ar kādu no šiem skaitļiem, un režīmam, ja tāds pastāv, noteikti jāsakrīt ar diviem vai vairākiem skaitļiem sērijā. Turklāt atšķirībā no vidējā aritmētiskā jēdziens "režīms" attiecas ne tikai uz skaitliskiem datiem.
  • Slaucot skaitļu sērija ir starpība starp lielāko un mazāko no šiem skaitļiem. Sērijas diapazons tiek atrasts, kad viņi vēlas noteikt, cik liela ir datu izplatība sērijā.

Parādīsim katra raksturlieluma definīciju, izmantojot skaitļu sērijas piemēru: 47,46,52,47,52,47,52,49,45,43,53,53,47,52.

Vidējais aritmētiskais 48,7.

Tas tiek atrasts šādi: mēs nosakām skaitļu summu un sadalām to ar to skaitu.

(47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7.

Mediāna no šīs skaitļu sērijas būs skaitlis 48.

Tas tiek atrasts šādi: mēs pasūtām skaitļu sēriju, izvēloties to, kas atrodas vidū. Ja skaitļu skaits ir pāra, tad vidējo aritmētisko no diviem atrodam skaitļu rindas vidū.

43,45,46,47,47,47, 47,49 ,52,52,52,52,53,53

(47+49):2=48

Mode no šīs skaitļu sērijas būs skaitļi 47 un 52 ... Šie skaitļi atkārtojas visbiežāk.

47 ,46, 52 , 47 , 52 , 47 , 52 ,49,45,43,53,53, 47 , 52 .

Slaucot no šīs skaitļu sērijas būs 10.

Tas tiek atrasts šādi: izvēlieties lielāko un mazāko numuru sērijā un atrodiet atšķirību starp šiem skaitļiem.

47,46,52,47,52,47,52,49,45, 43, 53 ,53,47,52

53-43=10

Pētījuma daļa

7. "B" klases skolēnu sasniegumu datu statistiskā apstrāde

Pāriesim pie informācijas apstrādes. Katram no priekšmetiem veidosim tabulas, kas sastāv no trim rindām, pirmajā būs datu virkne. Katrs šīs sērijas variants tika faktiski novērots izlasē noteiktu skaitu reižu. Šo skaitli sauc par iespēju daudzveidību. Tātad otrajā rindā ievietosim atbilstošās opcijas daudzveidību. Iegūsim parauga sadalījuma tabulu.

Ja saskaitām visus reizinājumus, tad iegūstam visu izlases laikā veikto mērījumu skaitu - izlases lielumu (Mūsu gadījumā šis skaitlis ir 24, kas atbilst skolēnu skaitam klasē).

Trešajā rindā attiecību, kas izteikta procentos, sauc par opciju biežumu.

Frekvences opcijas =

Kopumā, ja, pamatojoties uz pētījuma rezultātiem, tiek sastādīta relatīvo biežumu tabula, tad relatīvo biežumu summa ir vienāda ar 100%.

I ceturksnis

Krievu valoda.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4 ,4,4 , 4.5.

Vidējā atzīme priekšmetā:(vidēji).

Frekvenču sadales tabula

Opcija

Daudzveidības iespējas

Biežums%

58.3%

37.5%

4.2%

Literatūra.

Sakārtosim parauga datus (atzīmes): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4 ,5,5,5 , 5.5.

Vidējā atzīme priekšmetā:(vidēji).

Novērtēšanas iespējas

daudzveidība

Biežums%

37.5%

41.7%

20.8%

Algebra.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4 ,4,4,4 , 5.5.

Vidējā atzīme priekšmetā:(vidēji).

Lielākais studentu skaits priekšmetā ir "4, 3" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

daudzveidība

Biežums%

45.8%

45.8%

8.3%

Vēsture.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4 ,4,4,4 , 4.5

Vidējā atzīme priekšmetā:(vidēji).

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

45.8%

4.2%

Sociālās studijas.

Sakārtosim parauga datus (atzīmes): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4 ,5,5,5 , 5.5

Vidējā atzīme priekšmetā:(vidēji).

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

37.5%

41.7%

20.8%

Ģeogrāfija.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5,5,5,5 ,5

Vidējā atzīme priekšmetā:(vidēji).

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

20.8%

41.7%

37.5%

Fizika.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4 ,4,4,4 , 4.5

Vidējā atzīme priekšmetā:(vidēji).

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

37.5%

58.3%

4.2%

Bioloģija.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5,5 ,5,5,5,5 ,5

Vidējā atzīme priekšmetā:(vidēji).

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

45.8%

29.2%

DZĪVĪBAS DROŠĪBAS PAMATI.

Sakārtosim izlases datus (atzīmes): 4,4,4,4,4,4.4.5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5,5,5 ,5

Vidējā atzīme priekšmetā:(vidēji).

Novērtēšanas iespējas

Daudzveidība

Biežums%

29.2%

70.8%

Sakārtosim izlases datus (atzīmes): 3,4,4,4.4,4,4,4,4,4,5,5,5,5,5,5,5,5.5,5,5.5,5 ,5,5

Vidējā atzīme priekšmetā:(vidēji).

Lielākais studentu skaits priekšmetā ir "5" (mode)

Apmēram puse studentu krievu valodā mācās 5 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

4.2%

37.5%

58.3%

Angļu.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4 ,5.5,5,5 ,5

Vidējā atzīme priekšmetā:(vidēji).

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

37.5%

41.7%

20.8%

Datorzinātne.

Sakārtosim izlases datus (atzīmes): 3,4,4,4,4.4,4,4,4,4,4,4,4,4,5,5,5,5.5.5,5,5 ,5,5

Vidējā atzīme priekšmetā:(vidēji).

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

4.2%

54.2%

41.7%

Tehnoloģija.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,5,55,5 ,5,5,5,5

Vidējā atzīme priekšmetā:(vidēji).

Lielākais studentu skaits priekšmetā ir "5" (mode)

Apmēram puse studentu krievu valodā mācās 4,5 (mediāna)

Novērtēšanas iespējas

Daudzveidība

Biežums%

20.8%

54.2%

Tagad apkoposim līdzīgu informāciju par otrā ceturkšņa rezultātiem.

Krievu valoda.

Sakārtosim izlases datus (atzīmes): 3,3,3.3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4 ,4,4,4 ,4

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

daudzveidība

Biežums%

41.7%

58.3%

Literatūra.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,5 ,5,5,5 , 5.5

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "3" (mode)

Apmēram puse krievu valodas skolēnu mācās 3. klasē (mediāna)

Novērtēšanas iespējas

daudzveidība

Biežums%

41.7%

33.3%

Algebra.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4 ,4,4,5 , 5.5

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "3" (mode)

Apmēram puse krievu valodas skolēnu mācās 3. klasē (mediāna)

Novērtēšanas iespējas

daudzveidība

Biežums%

37.5%

12.5%

Vēsture.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,3,3,3,3,4.4,4,4,4,4,4,4,4,4,4,4 ,4,4,4 ,5

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

37.5%

58.3%

4.2%

Sabiedrība.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4 ,4,4,5 , 5.5

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

16.7%

70.8%

12.5%

Ģeogrāfija.

Sakārtosim izlases datus (atzīmes): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5 ,5,5,5 , 5.5

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

12.5%

58.3%

29.2%

Fizika.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,44,5,5 ,5

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

33.3%

16.7%

12.5%

Bioloģija.

Sakārtosim izlases datus (atzīmes): 3,3,3,4,4,4,4,4,4,4.4,4,4,4,4,4,4,4,4,5,5 ,5,5,5 ,5

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

12.5%

62.5%

DZĪVĪBAS DROŠĪBAS PAMATI.

Sakārtosim izlases datus (atzīmes): 3,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5,5,5 ,5

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "5" (mode)

Apmēram puse studentu krievu valodā mācās 5 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

4.2%

8.3%

87.5%

Dzimtās zemes vēsture un sabiedrība.

Sakārtosim izlases datus (atzīmes): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5 ,5,5,5 , 5.5

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

12.5%

45.8%

41.7%

Angļu.

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

20.8%

29.2%

Datorzinātne.

Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5 ,5,5,5 , 5.5

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "4" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

20.8%

29.2%

Tehnoloģija.

Sakārtosim izlases datus (atzīmes): 3,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5 ,5,5,5 , 5.5

Vidējā atzīme priekšmetā:(vidēji)

Lielākais studentu skaits priekšmetā ir "5" (mode)

Apmēram puse studentu krievu valodā mācās 4 (vidēji)

Novērtēšanas iespējas

Daudzveidība

Biežums%

4.2%

29.2%

66.7%

Datu vizualizācija ar histogrammām

Statistiskā pētījuma rezultātā iegūto datu vizuālai prezentēšanai plaši tiek izmantotas dažādas to noformēšanas metodes.

Datu skaidrības labad mēs izmantosim histogrammas. Histogramma ir pakāpju forma, kas sastāv no slēgtiem taisnstūriem. Katra taisnstūra pamatne ir vienāda ar intervāla garumu, un augstums ir vienāds ar varianta vai relatīvās frekvences daudzveidību. Tādējādi histogrammā, atšķirībā no parastās joslu diagrammas, taisnstūra pamatnes nav izvēlētas patvaļīgi, bet gan stingri noteiktas pēc intervāla garuma.

Studentu snieguma salīdzinošais raksturojums pirmā ceturkšņa priekšmetos

Studentu snieguma salīdzinošais raksturojums 2. ceturkšņa mācību priekšmetos

secinājumus

Pēc pirmā ceturkšņa rezultātiem skaidri redzams, ka visgrūtāk skolēniem tiek galā ar tādiem priekšmetiem kā: krievu valoda un algebra, priekšmeti, kuriem "trīs" ir vērtējums, kas ir prioritārs attiecībā pret citām atzīmēm. Tas nozīmē, ka šajos priekšmetos kvalitāte ir zemāka nekā citos.

Ir arī skaidrs, ka augstais trīnīšu līmenis tādos priekšmetos kā literatūra, vēsture, sabiedrība, fizika, angļu valoda. Skumji ir arī trīskārši tādos priekšmetos kā tehnoloģija, bioloģija, ģeogrāfija.

Pēc otrā ceturkšņa rezultātiem būtiski samazinājies trīsnieku un piecnieku skaits, proti, skolēni sadalīja spēkus visos priekšmetos, nevis pēc atsevišķi vēlamajiem.

Pirmā ceturkšņa mācību priekšmetu vidējā rezultāta sadalījuma histogramma

Otrā ceturkšņa mācību priekšmetu vidējā rezultāta sadalījuma histogramma

Izvade

Lai izveidotu šīs diagrammas, mēs izmantojām tādu statistisko raksturlielumu kā vidējais aritmētiskais. Skaidri redzams, ka otrajā ceturksnī pasliktinājās zināšanas par krievu valodu, dzimtās zemes vēsturi un sabiedrību, datorzinātnēm. Pilnveidots vēsturē, sabiedrībā, fizikā, bioloģijā, dzīvības drošībā, angļu valodā. Bet tajā pašā laikā diagrammas parāda, ka būtiskākas izmaiņas uz labo pusi notika tikai fizikā un angļu valodā.

Skolēnu izglītības aktivitātes salīdzinošais raksturojums pēc pirmā un otrā ceturkšņa rezultātiem

I ceturkšņa mācību priekšmetos zināšanu kvalitātes histogramma

Otrā ceturkšņa mācību priekšmetos zināšanu kvalitātes histogramma

Apvienojot abas histogrammas vienā, ir daudz vieglāk saskatīt priekšstatu par klases veiktspēju salīdzinājumā. Un individuāli ir vieglāk redzēt, kuriem priekšmetiem ir augstāka kvalitāte. Piemēram, pirmajā ceturksnī priekšmetos - algebra, krievu valoda, vēsture - kvalitāte ir zem 60%, otrajā - krievu valoda, literatūra, algebra, fizika. Jau tagad skaidrs, ka visgrūtāk skolēniem ir krievu valoda, algebra. Un kvalitātes procents visos priekšmetos nav ļoti atšķirīgs 66% - pirmais ceturksnis, 68% - otrais. Proti, lēcieniem līdzīgā kvalitāte priekšmetos, kas labi redzama salīdzināšanas diagrammā, liecina, ka skolēni īpaši necenšas uzlabot savu zināšanu līmeni un neieņem savas pozīcijas vienā vai otrā priekšmeta jomā.

Diagramma, kurā salīdzinātas visas preces pēc kvalitātes 1. un 2. ceturksnī

Otrajā ceturksnī ievērojami palielinājās labu un teicamnieku skaits krievu valodā, sabiedrībā, bioloģijā, angļu valodā un tehnoloģijās. Nedaudz samazinājies skaits literatūrā, algebrā, dzīvības drošībā, IORK un datorzinātnēs. Un var redzēt spēcīgu fizikas kvalitātes kritumu, kas saistīts ar skolēnu negatavību stundām.

Un atkal mēs nonākam pie secinājuma, ka bērni mācās "lēcieniem un robežām", un izglītības virzienā (humanitārie priekšmeti, fizika un matemātika, dabas cikla priekšmeti) nav īpašu priekšrocību.

7 "B" klases skolēnu anketas analīze par tēmu vecāku kontrole pār bērnu sekmēm

Pamatojoties uz iepriekšminētā pētījuma rezultātiem, nolēmām veikt aptauju 7. "B" klases skolēnu vidū par vecāku kontroli pār bērnu mācīšanu (anketas sk. Pielikumu)

Izlases lielums ir 22 cilvēki.

Vecāki pārbauda mājasdarbus

Izvade

Gandrīz ceturtā daļa studentu par šo jautājumu bez vecāku kontroles, kas, protams, ietekmē viņu akadēmisko sniegumu.

Mājas darbu pārbaužu skaits nedēļā

Mediāna = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7,7 = (3 + 3 ): 2 = 3

Vidējais aritmētiskais = 3

Izvade

Vidēji uzdevums tiek pārbaudīts trīs reizes nedēļā. Ņemot vērā mācīšanās pārtraukumu, ar to nepietiek.

Mediāna = 0,0,0,0,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,5,5,6, 7, 7,7 = (2 + 2): 2 = 2

Vidējais aritmētiskais = 3 (vidēji dienasgrāmatas vecāki pārbauda 3 reizes nedēļā)

Laiks, ko skolēni pavada mājasdarbu veikšanai

Varianti

Mazāk par 1

Biežums%

  • Swing R = x (maks.) - x (min) = 3,5 - 0,5 = 3 stundas

(raksturo novēroto vērtību izkliedes lielumu, t.i. parāda atšķirību starp garāko un īsāko laiku)

  • M režīms (0) = 2,5 stundas ( parāda vērtību, kas notiek biežāk nekā citi, t.i. parāda laiku, ko skolēni pavada visbiežāk)

Skolēnu mājasdarbu pildīšanai pavadītā laika histogramma

Izvade

Vidēji mājas darbi aizņem 2,5 stundas dienā. Kas tiek uzskatīts par normālu skolēnu vecuma rādītāju.

Secinājums

Paveiktā darba rezultātā iemācījos apstrādāt un analizēt pieejamo informāciju

Statistikas raksturlielumu pārzināšana man palīdzēja noteikt GPA dažādos mācību priekšmetos, kā arī modi un apjomu tajos darbības rādītājos, kur to noteikšana šķiet neiespējama. Bez datu apstrādes, notikumu salīdzināšanas nav iespējams izsekot konkrētas problēmas attīstībai. Mēs centāmies ne tikai izsekot radušajai problēmai - zināšanu kvalitātes un mācību sasniegumu kritumam priekšmetos, bet arī mēģināt noskaidrot cēloni, kas, mūsuprāt, slēpjas nepietiekamā vecāku kontrolē pār mācību sasniegumiem. saviem bērniem. Anketas aptauja un mācību sasniegumu rezultāti liecināja, ka 7. "B" klases skolēniem nav pietiekamas prasmes kontrolēt mācīšanos, un vecāki uzskata pretējo.

Paveiktais darbs, domāju, noderēs gan klases audzinātājai darbā ar vecākiem, gan maniem klasesbiedriem, lai turpmāk uzlabotu savus rezultātus atsevišķos priekšmetos.

Statistika ir zinātne, kas pēta, apstrādā un analizē kvantitatīvus datus par dažādām masu parādībām dzīvē. Mēs esam tikai nedaudz atklājuši tās īpašības, un priekšā vēl ir daudz nezināmā un interesanta.

Bibliogrāfija:

  1. http://www.nado5.ru/e-book/naibolshii-obzchii-delitel
    Priekšskatījums:

    Lai izmantotu prezentāciju priekšskatījumu, izveidojiet sev Google kontu (kontu) un piesakieties tajā: ​​https://accounts.google.com


    Slaidu paraksti:

    Statistisko datu apstrāde Sagatavoja: MAOU "24.ģimnāzijas" 7. "B" klases skolniece Anna Atjuševa Konsultante: matemātikas skolotāja Natālija Sergejevna Ščetiņina

    Mērķis: iemācīties apstrādāt, analizēt un vizualizēt pieejamo informāciju. Mērķi: izpētīt statistiskos raksturlielumus; pirmā pusgada ceturkšņos apkopo informāciju par skolēnu sekmēm 7.klasē; apstrādāt informāciju; veikt informācijas vizuālu prezentāciju, izmantojot histogrammas; analizēt iegūtos datus, izdarīt atbilstošus secinājumus.

    Hipotēze, izmantojot studentu snieguma datu apstrādes piemēru, jūs varat ne tikai iepazīties ar galvenajiem statistikas rādītājiem, bet arī uzzināt, kā apkopot un grupēt statistikas datus; vizuāli pasniegt statistisko informāciju; analizēt saņemtos datus.

    Statistika ir zinātne, kas nodarbojas ar kvantitatīvu datu iegūšanu, apstrādi un analīzi par dažādām dabā un sabiedrībā sastopamām masu parādībām. Vārds "statistika" cēlies no latīņu vārda "status", kas nozīmē "stāvoklis, lietu stāvoklis". Vienkāršākie statistiskie raksturlielumi: vidējais aritmētiskais mediānas diapazona režīms

    Katra raksturlieluma noteikšana, izmantojot skaitļu sērijas piemēru: 47,46,52,47,52,47,52,49,45,43,53,53,47,52. Šīs skaitļu sērijas vidējais aritmētiskais būs skaitlis 48,7. (47 + 46 + 52 + 47 + 52 + 47 + 52 + 49 + 45 + 43 + 53 + 53 + 47 + 52): 14 = 48,7. Šīs skaitļu sērijas mediāna būs skaitlis 48.43,45,46,47,47,47, 47, 49, 52,52,52,52,53,53 (47 + 49): 2 = 48 šī skaitļu sērija būs skaitļi 47 un 52. 47, 46, 52, 47, 52, 47, 52, 49,45,43,53,53, 47, 52. Šīs skaitļu sērijas diapazons būs 10. 49.45, 43, 53, 53.47.52 53- 43 = 10

    Problēmas ar akadēmisko sniegumu 7. "B" klasē

    Variants 2 3 4 5 Frekvence nav opciju 14 9 1 Biežums% 0% 58,3% 37,5% 4,2% Krievu valoda. Sakārtosim izlases datus (atzīmes): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4 ,4,4 , 4.5. Vidējais vērtējums priekšmetā: 14 ∙ 3 + 9 ∙ 4 + 5 ∙ 124 = 8324≈3,5 (vidējais aritmētiskais). Lielākais studentu skaits priekšmetā ir "3" (mode) Apmēram puse studentu krievu valodā mācās 3 (mediāna)

    Statistiskā pētījuma rezultātā iegūto datu vizuālai prezentēšanai plaši tiek izmantotas dažādas to noformēšanas metodes.

    Studentu snieguma salīdzinošais raksturojums 1. ceturkšņa mācību priekšmetos

    Studentu snieguma salīdzinošais raksturojums 2. ceturkšņa mācību priekšmetos

    Vidējā rezultāta sadalījuma histogramma I un II ceturkšņa priekšmetos

    Visu priekšmetu salīdzināšanas diagramma pēc kvalitātes I un II ceturksnī

    Aptaujāšana 7. "B" klases skolēnu vidū par tēmu vecāku kontrole pār bērnu izglītošanu ANKETA 1. Vai jūsu vecāki pārbauda jūsu mājasdarbus? _________________________________________________________________________ 2. Cik reizes nedēļā? _________________________________________________________________________ 3. Cik reizes nedēļā tavi vecāki ieskatās tavā dienasgrāmatā? _________________________________________________________________________ 4. Cik daudz laika vidēji katru dienu veltāt mājas darbiem? ____________________________________________________________________

    Vecāki pārbauda mājasdarbus

    Mājas darbu pārbaužu skaits nedēļā Mediāna = 0.0.0.0.0.0.1.1.2.2.3.3.3.3.4.4.5.7.7.7.7, 7 = (3 + 3): 2 = 3 vidējais aritmētiskais = 3

    Histogramma par skolēnu mājasdarbiem pavadīto laiku