Elemen pengolahan data statistik. Pemrosesan data statistik dan fitur-fiturnya Data untuk pemrosesan data statistik

Pekerjaan laboratorium 3. Pemrosesan data statistik dalam sistem MatLab

Pernyataan umum dari masalah

Tujuan utama dari implementasi Pekerjaan laboratorium adalah berkenalan dengan dasar-dasar bekerja dengan pemrosesan data statistik di lingkungan MatLAB.

Bagian teoretis

Pemrosesan data statistik primer

Pengolahan data secara statistik didasarkan pada metode kuantitatif primer dan sekunder. Tujuan pemrosesan utama data statistik adalah untuk menyusun informasi yang diterima, yang menyiratkan pengelompokan data ke dalam: tabel pivot menurut berbagai parameter. Data mentah harus disajikan dalam format sedemikian rupa sehingga seseorang dapat membuat penilaian perkiraan dari kumpulan data yang diterima dan mengungkapkan informasi tentang distribusi data dari sampel data yang diterima, misalnya, homogenitas atau kekompakan data. Setelah analisis data primer, metode pemrosesan data statistik sekunder diterapkan, berdasarkan pola statistik yang ditentukan dalam kumpulan data yang ada.

Melakukan analisis statistik utama pada larik data memungkinkan Anda memperoleh pengetahuan tentang hal-hal berikut:

Apa nilai yang paling khas untuk sampel? Untuk jawaban pertanyaan ini ukuran tendensi sentral ditentukan.

Apakah ada sebaran data yang besar relatif terhadap nilai karakteristik ini, yaitu, apa "ketidakjelasan" data? PADA kasus ini ukuran variabilitas ditentukan.

Perlu dicatat fakta bahwa indikator statistik ukuran tendensi sentral dan variabilitas hanya ditentukan pada data kuantitatif.

Ukuran tendensi sentral- sekelompok nilai di mana sisa data dikelompokkan Dengan demikian, ukuran tendensi sentral menggeneralisasi array data, yang memungkinkan untuk membuat kesimpulan baik tentang sampel secara keseluruhan dan untuk melakukan analisis komparatif sampel yang berbeda satu sama lain.

Misalkan ada sampel data , maka ukuran tendensi sentral diestimasi dengan indikator sebagai berikut:

1. sampel berarti adalah hasil membagi jumlah semua nilai sampel dengan jumlahnya, ditentukan oleh rumus (3.1).

(3.1)

di mana - saya-elemen sampel;

n adalah jumlah elemen sampel.

Rata-rata sampel memberikan akurasi terbesar dalam proses memperkirakan tren pusat.

Katakanlah kita memiliki sampel 20 orang. Elemen sampel adalah informasi tentang pendapatan bulanan rata-rata setiap orang. Misalkan 19 orang memiliki pendapatan bulanan rata-rata 20rb. dan 1 orang dengan penghasilan 300 tr. Pendapatan bulanan total seluruh sampel adalah 680 tr. Rata-rata sampel dalam hal ini adalah S=34.


2. median- menghasilkan nilai di atas dan di bawah yang jumlah nilai yang berbeda adalah sama, yaitu ini adalah nilai pusat dalam seri data berurutan. Hal ini ditentukan tergantung pada kemerataan / keanehan jumlah elemen dalam sampel menggunakan rumus (3.2) atau (3.3).Algoritma untuk memperkirakan median untuk sampel data:

Pertama-tama, data diberi peringkat (diurutkan) dalam urutan menaik/turun.

Jika sampel terurut memiliki jumlah elemen ganjil, maka median sama dengan nilai pusat.

(3.2)

di mana n

Dalam kasus sejumlah elemen genap, median didefinisikan sebagai rata-rata aritmatika dari dua nilai pusat.

(3.3)

di mana adalah elemen rata-rata dari sampel yang dipesan;

- elemen pemilihan berurutan berikut ;

Jumlah elemen sampel.

Jika semua elemen sampel berbeda, maka tepat setengah dari elemen sampel lebih besar dari median, dan setengah lainnya lebih kecil. Misalnya, untuk sampel (1, 5, 9, 15, 16), median sama dengan elemen 9.

Dalam analisis data statistik, median memungkinkan Anda untuk mengidentifikasi elemen sampel yang sangat mempengaruhi nilai mean sampel.

Katakanlah kita memiliki sampel 20 orang. Elemen sampel adalah informasi tentang pendapatan bulanan rata-rata setiap orang. Misalkan 19 orang memiliki pendapatan bulanan rata-rata 20rb. dan 1 orang dengan penghasilan 300 tr. Pendapatan bulanan total seluruh sampel adalah 680 tr. Median, setelah memesan sampel, didefinisikan sebagai rata-rata aritmatika dari elemen kesepuluh dan kesebelas dari sampel) dan sama dengan Me = 20 tr. Hasil ini ditafsirkan sebagai berikut: median membagi sampel menjadi dua kelompok, sehingga kita dapat menyimpulkan bahwa pada kelompok pertama, setiap orang memiliki pendapatan bulanan rata-rata tidak lebih dari 20 ribu rubel, dan pada kelompok kedua, tidak kurang dari 20 ribu rubel R. Dalam contoh ini, kita dapat mengatakan bahwa median dicirikan oleh berapa banyak penghasilan orang "rata-rata". Sedangkan nilai rata-rata sampel secara signifikan lebih tinggi dari S=34, yang menunjukkan tidak dapat diterimanya karakteristik ini ketika menilai pendapatan rata-rata.

Jadi, semakin besar perbedaan antara median dan rata-rata sampel, semakin besar penyebaran data sampel (dalam contoh yang dipertimbangkan, seseorang dengan penghasilan 300 tr jelas berbeda dari rata-rata orang dalam sampel tertentu dan memiliki dampak signifikan pada estimasi pendapatan rata-rata). Apa yang harus dilakukan dengan elemen-elemen tersebut diputuskan dalam setiap kasus individu. Tetapi dalam kasus umum, untuk memastikan keandalan sampel, mereka ditarik, karena mereka memiliki pengaruh kuat pada penilaian indikator statistik.

3. Mode (Mo)- menghasilkan nilai yang paling sering muncul dalam sampel, yaitu nilai dengan frekuensi tertinggi.Algoritme estimasi mode:

Dalam kasus ketika sampel mengandung unsur-unsur yang sering muncul sama, maka kita mengatakan bahwa tidak ada modus dalam sampel seperti itu.

Jika dua elemen yang berdekatan sampel memiliki frekuensi yang sama, yaitu lebih besar dari frekuensi elemen sampel yang tersisa, maka modus ditentukan sebagai rata-rata dari dua nilai ini.

Jika dua elemen sampel memiliki frekuensi yang sama, yang lebih besar dari frekuensi elemen sampel yang tersisa, dan elemen-elemen ini tidak berdekatan, maka kami mengatakan bahwa ada dua mode dalam sampel ini.

Modus dalam analisis statistik digunakan dalam situasi di mana perlu dengan cepat memperkirakan ukuran tendensi sentral dan akurasi yang tinggi tidak diperlukan. Misalnya, fashion (dalam hal ukuran atau merek) nyaman digunakan untuk menentukan pakaian dan sepatu yang paling diminati pembeli.

Ukuran pencar (variabilitas)- sekelompok indikator statistik yang mencirikan perbedaan antara nilai individu sampel. Berdasarkan indikator ukuran dispersi, dimungkinkan untuk menilai tingkat homogenitas dan kekompakan elemen sampel. Langkah-langkah pencar dicirikan oleh serangkaian indikator berikut:

1. Geser - ini adalah interval antara nilai maksimum dan minimum dari hasil pengamatan (elemen sampel). Indikator rentang menunjukkan penyebaran nilai dalam kumpulan data. Jika rentangnya besar, maka nilai-nilai dalam populasi sangat tersebar, sebaliknya (rentangnya kecil), dikatakan bahwa nilai-nilai dalam populasi terletak berdekatan satu sama lain. Rentang ditentukan oleh rumus (3.4).

(3.4)

Di mana - elemen maksimum sampel;

adalah elemen terkecil dari sampel.

2.Deviasi rata-rata adalah perbedaan rata-rata aritmatika (dalam nilai absolut) antara setiap nilai dalam sampel dan rata-rata sampelnya. Rata-rata deviasi ditentukan dengan rumus (3.5).

(3.5)

di mana - saya-elemen sampel;

Nilai mean sampel, dihitung dengan rumus (3.1);

Jumlah elemen sampel.

Modul diperlukan karena fakta bahwa penyimpangan dari rata-rata untuk setiap elemen tertentu dapat positif dan negatif. Oleh karena itu, jika modulus tidak diambil, maka jumlah semua penyimpangan akan mendekati nol dan tidak mungkin untuk menilai tingkat variabilitas data (data berkerumun di sekitar rata-rata sampel). Dalam analisis statistik, modus dan median dapat diambil sebagai pengganti mean sampel.

3. Penyebaran adalah ukuran pencar yang menggambarkan deviasi relatif antara nilai data dan mean. Ini dihitung sebagai jumlah deviasi kuadrat dari setiap elemen sampel dari nilai rata-rata. Tergantung pada ukuran sampel, varians diperkirakan cara yang berbeda:

Untuk sampel besar (n>30) sesuai dengan rumus (3.6)

(3.6)

Untuk sampel kecil (n<30) по формуле (3.7)

(3.7)

dimana X i - elemen ke-i dari sampel;

S adalah nilai rata-rata sampel;

Jumlah elemen sampel;

(X i – S) - penyimpangan dari nilai rata-rata untuk setiap nilai kumpulan data.

4. Standar deviasi adalah ukuran seberapa luas titik-titik data tersebar relatif terhadap rata-ratanya.

Proses mengkuadratkan deviasi individu dalam menghitung varians meningkatkan derajat deviasi dari nilai deviasi yang diperoleh dari deviasi awal, yang pada gilirannya menimbulkan kesalahan tambahan. Jadi, untuk memperkirakan perkiraan penyebaran titik data tentang rata-ratanya ke nilai rata-rata deviasi, akar kuadrat diekstraksi dari varians. Akar varians yang diekstraksi mencirikan ukuran variabilitas yang disebut kuadrat rata-rata akar atau deviasi standar (3.8).

(3.8)

Katakanlah Anda seorang manajer proyek pengembangan perangkat lunak. Anda memiliki lima programmer di bawah pengawasan Anda. Dengan mengelola proses eksekusi proyek, Anda mendistribusikan tugas di antara programmer. Untuk kesederhanaan contoh, kami akan melanjutkan dari fakta bahwa tugas setara dalam kompleksitas dan waktu eksekusi. Anda memutuskan untuk menganalisis pekerjaan setiap programmer (jumlah tugas yang diselesaikan selama seminggu) selama 10 minggu terakhir, sebagai akibatnya Anda menerima sampel berikut:

Nama Minggu

Setelah mengevaluasi jumlah rata-rata tugas yang diselesaikan, Anda mendapatkan hasil berikut:

Nama Minggu S
22,3
22,4
22,2
22,1
22,5

Berdasarkan indikator S, rata-rata semua programmer bekerja dengan efisiensi yang sama (sekitar 22 tugas per minggu). Namun, indikator variabilitas (rentang) sangat tinggi (dari 5 tugas untuk programmer keempat hingga 24 tugas untuk programmer kelima).

Nama Minggu S P
22,3
22,4
22,2
22,1
22,5

Mari kita perkirakan deviasi standar, yang menunjukkan bagaimana nilai didistribusikan dalam sampel relatif terhadap rata-rata, yaitu, dalam kasus kami, untuk memperkirakan seberapa besar penyebaran penyelesaian tugas dari minggu ke minggu.

Nama Minggu S P JADI
22,3 1,56
22,4 1,8
22,2 2,84
22,1 1,3
22,5 5,3

Perkiraan deviasi standar yang dihasilkan mengatakan sebagai berikut (mari kita evaluasi dua kasus ekstrim 4 dan 5 programmer):

Setiap nilai dalam sampel 4 programmer, rata-rata, menyimpang 1,3 pekerjaan dari rata-rata.

Setiap nilai dalam sampel pemrogram 5 menyimpang, rata-rata, sebesar 5,3 pekerjaan dari rata-rata.

Semakin dekat standar deviasi ke 0, semakin dapat diandalkan rata-ratanya, karena ini menunjukkan bahwa setiap nilai dalam sampel hampir sama dengan rata-rata (22,5 item dalam contoh kita). Oleh karena itu, programmer ke-4 adalah yang paling konsisten dibandingkan dengan yang ke-5. Variabilitas penyelesaian tugas dari minggu ke minggu untuk programmer ke-5 adalah 5,3 tugas, yang menunjukkan penyebaran yang signifikan. Dalam kasus programmer ke-5, rata-rata tidak dapat dipercaya, dan oleh karena itu sulit untuk memprediksi jumlah tugas yang diselesaikan untuk minggu berikutnya, yang pada gilirannya membuat sulit untuk merencanakan dan mematuhi jadwal kerja. Keputusan manajerial apa yang Anda buat dalam kursus ini tidak penting. Penting bagi Anda untuk menerima penilaian atas dasar pengambilan keputusan manajemen yang tepat.

Dengan demikian, kesimpulan umum dapat ditarik bahwa mean tidak selalu benar memperkirakan data. Kebenaran estimasi mean dapat dinilai dari nilai standar deviasi.


1. Alat pemrosesan data statistik di Excel

2. Menggunakan fungsi khusus

3. Menggunakan alat PAKET ANALISIS

literatur:

utama:

1. Burke. Analisis data dengan Microsoft Excel. : Per. dari bahasa Inggris / Burke, Kenneth, Carey, Patrick. - M .: Rumah penerbitan "William", 2005. - S. 216 - 256.

2. Mishin A.V. Teknologi informasi dalam kegiatan hukum: bengkel / A.V. Mishin. – M.: RAP, 2013. – S. 2-11.

tambahan:

3. Informatika untuk pengacara dan ekonom: buku teks untuk universitas / Ed. S.V. Simonovich. - St. Petersburg: Peter, 2004. - S. 498-516.

Latihan #30

Topik nomor 11.1. Memelihara database di Access DBMS

Pelajaran dilakukan dengan metode proyek.

Tujuan dari proyek ini: untuk mengembangkan database tentang pekerjaan pengadilan.

Tugas teknis:

1. Buat database "Pengadilan" dari dua tabel "Hakim" dan "Klaim" dengan struktur masing-masing sebagai berikut:

Meja "Hakim"

Nama bidang Kode wasit NAMA LENGKAP Hari resepsi Jam kerja Pengalaman kerja
Tipe data numerik Teks Teks Teks numerik
Ukuran lapangan bilangan bulat panjang bilangan bulat panjang
Format Lapangan Dasar Dasar
Jumlah tempat desimal
Nilai default "Menikahi" "15:00-17:00"
Kondisi nilai >36200 Dan<36299 Sen Atau Sel Atau Rab Atau Kam Atau Jum >0 Dan<40
Pesan eror Nilai yang valid adalah Sen, Sel, Rab, Kam, atau Jum. Ketik ulang! ! Nilai yang valid adalah dari 1 hingga 39. Silakan coba lagi!
bidang wajib Ya Ya Bukan Bukan Bukan
Bidang yang diindeks Bukan Bukan Bukan Bukan

Catatan. Nyatakan bidang kunci "Kode hakim".

Tabel "Klaim"

Nama bidang Nomor kasus penggugat jawaban-chik Kode wasit Tanggal pertemuan
Tipe data numerik Teks Teks numerik Tanggal Waktu
Properti Bidang: Tab Umum
Ukuran lapangan bilangan bulat panjang bilangan bulat panjang Format tanggal lengkap
Format Lapangan Dasar
Jumlah tempat desimal
Nilai default
Kondisi nilai >0 Dan<99999 >36200 Dan<36299
Pesan eror Entri salah - coba lagi! Nilai yang valid adalah dari 36201 hingga 36298. Silakan coba lagi!
bidang wajib Ya Bukan Bukan Bukan Bukan
Bidang yang diindeks Ya (Tidak ada kecocokan yang diizinkan) Bukan Bukan Ya (Kebetulan diperbolehkan) Bukan

2. Pada tabel Juri, masukkan data record berikut:

Pada tabel Claims, masukkan record data berikut ini:

3. Gunakan bidang "Kode juri" untuk membuat hubungan "satu-ke-banyak" antara tabel juri dan tuntutan hukum. Pada saat yang sama, atur "Pastikan integritas data" dan "pembaruan kaskade bidang terkait".

literatur:

utama:

1. Mishin A.V. Teknologi informasi dalam kegiatan profesional: panduan belajar / A.V. Mishin, L.E. Mistrov, D.V. Kartavtsev. - M.: RAP, 2011. - S. 259-264.

tambahan:

Latihan #31

Topik nomor 11.2. Prinsip membuat formulir dan kueri di Access DBMS

1. Pengembangan formulir input untuk entri data.

2. Metodologi untuk melakukan perhitungan dan menganalisis data yang dimasukkan.

literatur:

utama:

1. Mishin A.V. Teknologi informasi dalam kegiatan profesional: panduan belajar / A.V. Mishin, L.E. Mistrov, D.V. Kartavtsev. - M.: RAP, 2011. - S. 265-271.

tambahan:

2. Informatika dan teknologi informasi: buku teks untuk mahasiswa / I.G. Lesnichaya, I.V. Hilang, Yu.D. Romanova, V.I. Shestakov. - edisi ke-2. - M.: Eksmo, 2006. - 544 hal.

3. Mikheeva E.V. Teknologi informasi dalam kegiatan profesional: buku teks untuk siswa sekolah menengah kejuruan / E.V. Mikheev. - Edisi ke-2, terhapus. - M.: Akademi, 2005. - 384 hal.

Kirim karya bagus Anda di basis pengetahuan sederhana. Gunakan formulir di bawah ini

Mahasiswa, mahasiswa pascasarjana, ilmuwan muda yang menggunakan basis pengetahuan dalam studi dan pekerjaan mereka akan sangat berterima kasih kepada Anda.

Di-host di http://www.allbest.ru/

Pengolahan data statistik

pengantar

korelasi sampel varians statistik

Metode pemrosesan statistik hasil percobaan disebut teknik matematika, formula, metode perhitungan kuantitatif, yang dengannya indikator yang diperoleh selama percobaan dapat digeneralisasi, dibawa ke dalam sistem, mengungkapkan pola yang tersembunyi di dalamnya. Kita berbicara tentang keteraturan yang bersifat statistik yang ada di antara variabel-variabel yang dipelajari dalam eksperimen.

Beberapa metode analisis matematika dan statistik memungkinkan seseorang untuk menghitung apa yang disebut statistik matematika dasar yang mencirikan distribusi sampel data, seperti mean sampel, varians sampel, modus, median, dan sejumlah lainnya. Metode statistik matematika lainnya, seperti analisis varians, analisis regresi, memungkinkan untuk menilai dinamika perubahan dalam statistik sampel individu. Dengan bantuan metode kelompok ketiga, katakanlah, analisis korelasi, analisis faktor, metode untuk membandingkan data sampel, seseorang dapat dengan andal menilai hubungan statistik yang ada antara variabel yang diselidiki dalam percobaan ini.

1. Metode pengolahan statistik primer hasil eksperimen

Semua metode analisis matematika dan statistik secara kondisional dibagi menjadi primer dan sekunder. Metode disebut primer, yang dengannya dimungkinkan untuk memperoleh indikator yang secara langsung mencerminkan hasil pengukuran yang dilakukan dalam percobaan. Dengan demikian, indikator statistik primer berarti indikator yang digunakan dalam metode psikodiagnostik itu sendiri dan merupakan hasil pemrosesan statistik awal dari hasil psikodiagnostik. Metode sekunder disebut pemrosesan statistik, yang dengannya, berdasarkan data primer, pola statistik yang tersembunyi di dalamnya terungkap.

Metode pemrosesan statistik primer meliputi, misalnya, penentuan mean sampel, varians sampel, mode sampel, dan median sampel. Metode sekunder biasanya mencakup analisis korelasi, analisis regresi, metode untuk membandingkan statistik primer dalam dua atau lebih sampel.

Pertimbangkan metode untuk menghitung statistik matematika dasar.

1.1 Mode

Karakteristik numerik sampel, yang, sebagai suatu peraturan, tidak memerlukan perhitungan, adalah yang disebut mode. Modus adalah nilai kuantitatif dari sifat yang diteliti, yang paling sering ditemukan dalam sampel. Untuk distribusi simetris fitur, termasuk distribusi normal, nilai modus bertepatan dengan nilai rata-rata dan median. Untuk jenis distribusi lain, asimetris, ini tidak khas. Misalnya, dalam urutan nilai fitur 1, 2, 5, 2, 4, 2, 6, 7, 2, nilai 2 adalah mode, karena lebih sering muncul daripada nilai lain - empat kali.

Fashion ditemukan sesuai dengan aturan berikut:

1) Jika semua nilai dalam sampel sering muncul sama, seri sampel ini dianggap tidak memiliki mode. Misalnya: 5, 5, 6, 6, 7, 7 - tidak ada mode dalam pemilihan ini.

2) Ketika dua nilai tetangga (berdekatan) memiliki frekuensi yang sama dan frekuensinya lebih besar daripada frekuensi nilai lainnya, mode dihitung sebagai rata-rata aritmatika dari dua nilai ini. Misalnya, pada sampel 1, 2, 2, 2, 5, 5, 5, 6, frekuensi nilai yang berdekatan 2 dan 5 adalah sama dan sama dengan 3. Frekuensi ini lebih besar dari frekuensi nilai lainnya​ 1 dan 6 (yang sama dengan 1). Oleh karena itu, modus dari deret ini akan menjadi nilai = 3,5

3) Jika dua nilai yang tidak berdekatan (tidak berdekatan) dalam sampel memiliki frekuensi yang sama yang lebih besar dari frekuensi nilai lainnya, maka dua mode dibedakan. Misalnya, pada deret 10, 11, 11, 11, 12, 13, 14, 14, 14, 17, modusnya adalah 11 dan 14. Dalam hal ini, sampel dikatakan bimodal.

Ada juga yang disebut distribusi multimodal dengan lebih dari dua simpul (modus).

4) Jika mode diestimasi dari sekumpulan data yang dikelompokkan, maka untuk mencari mode tersebut perlu ditentukan grup dengan frekuensi fitur yang paling tinggi. Grup ini disebut grup modal.

1.2 Median

Median adalah nilai atribut yang dipelajari, yang membagi sampel, diurutkan berdasarkan nilai atribut ini, menjadi dua. Di sebelah kanan dan kiri median dalam deret berurutan tetap jumlah fitur yang sama. Misalnya, untuk sampel 2, 3, 4, 4, 5, 6, 8, 7, 9, median akan menjadi nilai 5, karena empat indikator tetap berada di kiri dan kanannya. Jika deret tersebut menyertakan sejumlah fitur genap, maka median akan menjadi rata-rata, diambil sebagai setengah dari jumlah nilai dari dua nilai sentral deret tersebut. Untuk baris berikutnya 0, 1, 1, 2, 3, 4, 5, 5, 6, 7, mediannya adalah 3,5.

Mengetahui median berguna untuk menentukan apakah distribusi nilai-nilai tertentu dari sifat yang dipelajari simetris dan mendekati apa yang disebut distribusi normal. Mean dan median untuk distribusi normal biasanya sama atau berbeda sangat sedikit satu sama lain. Jika distribusi sampel fitur normal, maka metode perhitungan statistik sekunder berdasarkan distribusi normal data dapat diterapkan padanya. Jika tidak, ini tidak dapat dilakukan, karena kesalahan serius dapat menyusup ke dalam perhitungan.

1.3 Rata-rata sampel

Nilai mean sampel (arithmetic mean) sebagai indikator statistik adalah rata-rata penilaian kualitas psikologis yang dipelajari dalam eksperimen. Penilaian ini mencirikan tingkat perkembangannya secara keseluruhan dalam kelompok mata pelajaran yang menjadi sasaran pemeriksaan psikodiagnostik. Membandingkan secara langsung nilai rata-rata dari dua atau lebih sampel, kita dapat menilai tingkat perkembangan relatif pada orang-orang yang membentuk sampel ini dari kualitas yang dinilai.

1.4 Dispersi sampel

Pencar (kadang-kadang disebut rentang) sampel dilambangkan dengan huruf R. Ini adalah indikator paling sederhana yang dapat diperoleh untuk sampel - perbedaan antara nilai maksimum dan minimum dari seri variasi khusus ini, yaitu

R= xmaks - xmin

Jelas bahwa semakin bervariasi sifat yang diukur, semakin besar nilai R, dan sebaliknya. Akan tetapi, mungkin saja terjadi dua deret sampel yang memiliki mean dan range yang sama, tetapi sifat variasi deret tersebut akan berbeda. Misalnya, diberikan dua sampel:

X = 10 15 20 25 30 35 40 45 50X = 30 R = 40

Y=10 28 28 30 30 30 32 32 50 Y=30 R=40

Ketika mean dan spread sama untuk dua seri sampel ini, sifat variasinya berbeda. Untuk lebih jelas mewakili sifat variasi sampel, kita harus mengacu pada distribusi mereka.

1.5 Dispersi

Varians adalah rata-rata aritmatika kuadrat dari deviasi nilai-nilai variabel dari nilai rata-ratanya.

Dispersi sebagai nilai statistik mencirikan seberapa besar nilai individu menyimpang dari nilai rata-rata dalam sampel yang diberikan. Semakin besar varians, semakin besar varians atau scatter dalam data.

Akar kuadrat diambil dari jumlah kuadrat dibagi jumlah suku dalam deret tersebut.

Kadang-kadang ada cukup banyak data primer pribadi awal yang tunduk pada pemrosesan statistik, dan mereka memerlukan sejumlah besar operasi aritmatika dasar. Untuk mengurangi jumlah mereka dan pada saat yang sama mempertahankan akurasi perhitungan yang diperlukan, kadang-kadang orang terpaksa mengganti sampel awal data empiris tertentu dengan interval. Interval adalah sekelompok nilai atribut yang diurutkan berdasarkan besarnya, yang diganti dengan nilai rata-rata selama perhitungan.

2. Metode pengolahan statistik sekunder hasil eksperimen

Dengan bantuan metode sekunder pemrosesan statistik data eksperimen, hipotesis yang terkait dengan eksperimen diverifikasi, dibuktikan, atau disangkal secara langsung. Metode-metode ini, sebagai suatu peraturan, lebih rumit daripada metode pemrosesan statistik primer, dan mengharuskan peneliti untuk terlatih dengan baik dalam matematika dan statistik dasar. (7).

Kelompok metode yang dibahas dapat dibagi menjadi beberapa subkelompok:

1. Kalkulus regresi.

2. Metode untuk membandingkan dua atau lebih statistik dasar (rata-rata, varians, dll.) milik sampel yang berbeda.

3. Metode untuk menetapkan hubungan statistik antar variabel, seperti korelasinya satu sama lain.

4. Metode untuk mengungkapkan struktur statistik internal data empiris (misalnya, analisis faktor). Mari kita pertimbangkan masing-masing subkelompok yang dipilih dari metode pemrosesan statistik sekunder menggunakan contoh.

2.1 Kalkulus regresi

Kalkulus regresi adalah metode statistik matematika yang memungkinkan Anda untuk mereduksi data pribadi yang berbeda menjadi grafik linier tertentu yang kira-kira mencerminkan hubungan internal mereka, dan untuk dapat memperkirakan nilai kemungkinan variabel lain dengan nilai salah satu variabel. (7).

Ekspresi grafis dari persamaan regresi disebut garis regresi. Garis regresi mengungkapkan prediksi terbaik dari variabel dependen (Y) atas variabel independen (X).

Regresi dinyatakan dengan menggunakan dua persamaan regresi, yang dalam kasus yang paling langsung terlihat seperti persamaan garis lurus.

Y = a 0 + a 1 * X

X = b 0 + b 1 * Y

Dalam persamaan (1), Y adalah variabel terikat, X adalah variabel bebas, a 0 adalah suku bebas, a 1 adalah koefisien regresi, atau kemiringan, yang menentukan kemiringan garis regresi terhadap sumbu koordinat.

Dalam persamaan (2) X adalah variabel terikat, Y adalah variabel bebas, b 0 adalah suku bebas, b 1 adalah koefisien regresi, atau kemiringan, yang menentukan kemiringan garis regresi terhadap sumbu koordinat.

Representasi kuantitatif dari hubungan (ketergantungan) antara X dan Y (antara Y dan X) disebut analisis regresi. Tugas utama analisis regresi adalah menemukan koefisien a 0, b 0, a1 dan b 1 dan menentukan tingkat signifikansi dari ekspresi analitik yang diperoleh yang menghubungkan variabel X dan Y.

Untuk menerapkan metode analisis regresi linier, kondisi berikut harus dipenuhi:

1. Variabel X dan Y yang dibandingkan harus diukur pada skala interval atau rasio.

2. Diasumsikan bahwa variabel X dan Y berdistribusi normal.

3. Jumlah fitur yang bervariasi dalam variabel yang dibandingkan harus sama. (5).

2.2 Korelasi

Metode pengolahan statistik sekunder berikutnya, yang dengannya ditemukan hubungan atau ketergantungan langsung antara dua rangkaian data eksperimen, disebut metode korelasi. Ini menunjukkan bagaimana satu fenomena mempengaruhi yang lain atau terkait dengannya dalam dinamikanya. Dependensi semacam ini ada, misalnya, antara besaran yang berada dalam hubungan sebab akibat satu sama lain. Jika ternyata dua fenomena secara statistik berkorelasi secara signifikan satu sama lain, dan jika pada saat yang sama ada keyakinan bahwa salah satunya dapat bertindak sebagai penyebab fenomena lainnya, maka pasti ada hubungan sebab akibat di antara mereka. . (7)

Ketika peningkatan level satu variabel disertai dengan peningkatan level variabel lain, maka kita berbicara tentang korelasi positif. Jika peningkatan dalam satu variabel terjadi ketika tingkat variabel lainnya menurun, maka kita berbicara tentang korelasi negatif. Dengan tidak adanya hubungan antar variabel, kita berhadapan dengan korelasi nol. (satu)

Ada beberapa jenis metode ini: linier, peringkat, berpasangan dan ganda. Analisis korelasi linier memungkinkan Anda untuk membangun hubungan langsung antara variabel dalam nilai absolutnya. Koneksi ini secara grafis dinyatakan dengan garis lurus, maka nama "linier". Korelasi peringkat menentukan ketergantungan bukan antara nilai absolut variabel, tetapi antara tempat ordinal, atau peringkat, yang ditempati oleh mereka dalam serangkaian yang diurutkan berdasarkan besarnya. Analisis korelasi berpasangan mencakup studi korelasi hanya antara pasangan variabel, dan beberapa, atau multivariat, antara banyak variabel secara bersamaan. Bentuk umum dari analisis korelasi multivariat dalam statistik terapan adalah analisis faktor. (5)

Koefisien korelasi peringkat dalam penelitian psikologis dan pedagogis digunakan ketika tanda-tanda di mana hubungan itu dibangun secara kualitatif berbeda dan tidak dapat dinilai secara akurat menggunakan apa yang disebut skala pengukuran interval. Skala interval adalah skala yang memungkinkan Anda untuk mengevaluasi jarak antara nilainya dan menilai mana yang lebih besar dan seberapa jauh lebih besar dari yang lain. Misalnya, penggaris yang digunakan untuk menilai dan membandingkan panjang benda adalah skala interval, karena dengan menggunakannya kita dapat menyatakan bahwa jarak antara dua dan enam sentimeter adalah dua kali lebih besar dari jarak antara enam dan delapan sentimeter. Jika, dengan menggunakan beberapa alat ukur, kita hanya dapat menyatakan bahwa beberapa indikator lebih besar dari yang lain, tetapi tidak dapat mengatakan berapa banyak, maka alat ukur seperti itu disebut bukan interval, tetapi ordinal.

Sebagian besar indikator yang diperoleh dalam penelitian psikologi dan pedagogis berhubungan dengan skala ordinal, bukan skala interval (misalnya penilaian seperti “ya”, “tidak”, “bukan tidak daripada ya” dan lain-lain yang dapat diubah menjadi poin. ), oleh karena itu, koefisien korelasi linier tidak berlaku untuk mereka.

Metode korelasi ganda, berbeda dengan metode korelasi berpasangan, memungkinkan untuk mengungkapkan struktur umum ketergantungan korelasi yang ada dalam bahan percobaan multidimensi yang mencakup lebih dari dua variabel, dan untuk menyajikan ketergantungan korelasi ini sebagai sistem tertentu. .

Untuk menerapkan koefisien korelasi parsial, kondisi berikut harus dipenuhi:

1. Variabel yang dibandingkan harus diukur pada skala interval atau rasio.

2. Diasumsikan bahwa semua variabel memiliki hukum distribusi normal.

3. Jumlah fitur yang bervariasi dalam variabel yang dibandingkan harus sama.

4. Untuk menilai tingkat signifikansi rasio korelasi Pearson, harus menggunakan rumus (11.9) dan tabel nilai kritis untuk Student's t-test pada k = n - 2. (5)

2.3 Analisis faktor

Analisis faktor adalah metode statistik yang digunakan saat memproses sejumlah besar data eksperimen. Tugas analisis faktor adalah: mereduksi jumlah variabel (reduksi data) dan menentukan struktur hubungan antar variabel, yaitu klasifikasi variabel, maka analisis faktor digunakan sebagai metode reduksi data atau sebagai metode klasifikasi struktural.

Perbedaan penting antara analisis faktor dan semua metode yang dijelaskan di atas adalah bahwa itu tidak dapat digunakan untuk memproses data primer, atau, seperti yang mereka katakan, data eksperimen "mentah", yaitu. diperoleh langsung dari pemeriksaan mata pelajaran. Bahan untuk analisis faktor adalah korelasi, atau lebih tepatnya, koefisien korelasi Pearson, yang dihitung antara variabel (yaitu, karakteristik psikologis) yang termasuk dalam survei. Dengan kata lain, matriks korelasi, atau, sebagaimana mereka disebut, matriks interkorelasi, dikenai analisis faktor. Nama kolom dan baris dalam matriks ini adalah sama, karena mewakili daftar variabel yang termasuk dalam analisis. Untuk alasan ini, matriks interkorelasi selalu persegi, yaitu. jumlah baris di dalamnya sama dengan jumlah kolom, dan simetris, mis. tempat simetris terhadap diagonal utama memiliki koefisien korelasi yang sama.

Konsep utama dari analisis faktor adalah faktor. Ini adalah indikator statistik buatan yang dihasilkan dari transformasi khusus dari tabel koefisien korelasi antara karakteristik psikologis yang dipelajari, atau matriks interkorelasi. Prosedur untuk mengekstrak faktor dari matriks interkorelasi disebut faktorisasi matriks. Sebagai hasil dari faktorisasi, sejumlah faktor yang berbeda dapat diekstraksi dari matriks korelasi hingga sejumlah yang sama dengan jumlah variabel asli. Namun, faktor-faktor yang diidentifikasi sebagai hasil dari faktorisasi, sebagai suatu peraturan, tidak sama nilainya. (5)

Dengan bantuan faktor-faktor yang diidentifikasi, saling ketergantungan fenomena psikologis dijelaskan. (7)

Paling sering, sebagai hasil dari analisis faktor, bukan hanya satu, tetapi beberapa faktor ditentukan yang menjelaskan matriks interkorelasi variabel dengan cara yang berbeda. Dalam hal ini, faktor dibagi menjadi umum, umum dan tunggal. Faktor umum disebut, semua pemuatan faktor yang secara signifikan berbeda dari nol (beban nol menunjukkan bahwa variabel ini sama sekali tidak terhubung dengan yang lain dan tidak memiliki efek apa pun pada mereka dalam kehidupan). Umum - ini adalah faktor di mana bagian dari beban faktor berbeda dari nol. Tunggal - ini adalah faktor-faktor di mana hanya satu beban yang berbeda secara signifikan dari nol. (7)

Analisis faktor mungkin tepat jika kriteria berikut terpenuhi.

1. Tidak mungkin memfaktorkan data kualitatif yang diperoleh pada skala nama, misalnya seperti warna rambut (hitam / coklat / merah), dll.

2. Semua variabel harus independen, dan distribusinya harus mendekati normal.

3. Hubungan antar variabel harus mendekati linier, atau setidaknya tidak secara jelas lengkung.

4. Dalam matriks korelasi asli, harus ada beberapa modulo korelasi yang lebih tinggi dari 0,3. Jika tidak, cukup sulit untuk mengekstrak faktor apa pun dari matriks.

5. Sampel subjek harus cukup besar. Saran ahli bervariasi. Sudut pandang yang paling kaku merekomendasikan untuk tidak menggunakan analisis faktor jika jumlah subjek kurang dari 100, karena kesalahan standar korelasi dalam hal ini akan terlalu besar.

Namun, jika faktor-faktor tersebut didefinisikan dengan baik (misalnya, dengan beban 0,7 daripada 0,3), peneliti membutuhkan sampel yang lebih kecil untuk mengisolasinya. Selain itu, jika data yang diperoleh diketahui sangat reliabel (misalnya digunakan tes yang valid), maka dimungkinkan untuk menganalisis data pada sejumlah kecil subjek. (5).

2.4 sayamenggunakan analisis faktor

Analisis faktor banyak digunakan dalam psikologi di berbagai bidang yang berkaitan dengan pemecahan masalah baik teoritis maupun praktis.

Dalam istilah teoretis, penggunaan analisis faktor dikaitkan dengan pengembangan apa yang disebut pendekatan analisis faktor untuk mempelajari struktur kepribadian, temperamen, dan kemampuan. Penggunaan analisis faktor di area ini didasarkan pada asumsi yang diterima secara luas bahwa indikator yang dapat diamati dan diukur secara langsung hanyalah manifestasi eksternal tidak langsung dan/atau khusus dari karakteristik yang lebih umum. Karakteristik ini, tidak seperti yang pertama, adalah laten, yang disebut variabel laten, karena mereka adalah konsep atau konstruksi yang tidak tersedia untuk pengukuran langsung. Namun, mereka dapat ditetapkan dengan memfaktorkan korelasi antara sifat-sifat yang diamati dan faktor-faktor isolasi yang (dengan asumsi struktur yang baik) dapat ditafsirkan sebagai ekspresi statistik dari variabel laten yang diinginkan.

Meskipun faktor-faktor tersebut murni matematis, mereka dianggap mewakili variabel laten (konstruk atau konsep yang didalilkan secara teoritis), sehingga nama-nama faktor sering kali mencerminkan esensi dari konstruk hipotetis yang dipelajari.

Saat ini, analisis faktor banyak digunakan dalam psikologi diferensial dan psikodiagnostik. Dengan bantuannya, Anda dapat mengembangkan tes, membangun struktur hubungan antara karakteristik psikologis individu yang diukur dengan serangkaian tes atau item tes.

Analisis faktor juga digunakan untuk membakukan metode pengujian, yang dilakukan pada sampel subjek yang representatif.

Kesimpulan

Jika data yang diperoleh dalam eksperimen bersifat kualitatif, maka kebenaran kesimpulan yang ditarik berdasarkan kesimpulannya sepenuhnya tergantung pada intuisi, pengetahuan dan profesionalisme peneliti, serta pada logika penalarannya. Jika data ini bertipe kuantitatif, maka pertama-tama dilakukan pemrosesan statistik primer, dan kemudian sekunder. Pemrosesan statistik primer terdiri dari penentuan jumlah statistik matematika dasar yang diperlukan. Pemrosesan seperti itu hampir selalu melibatkan setidaknya penentuan rata-rata sampel. Dalam kasus-kasus ketika indikator informatif untuk verifikasi eksperimental hipotesis yang diusulkan adalah penyebaran data rata-rata relatif, varians atau deviasi kuadrat dihitung. Direkomendasikan untuk menghitung nilai median ketika seharusnya menggunakan metode pemrosesan statistik sekunder yang dirancang untuk distribusi normal.Untuk jenis distribusi data sampel ini, median, serta mode, bertepatan atau cukup dekat dengan mean nilai. Kriteria ini dapat digunakan untuk menilai secara kasar sifat distribusi data primer yang diperoleh.

Pemrosesan statistik sekunder (perbandingan rata-rata, varians, distribusi data, analisis regresi, analisis korelasi, analisis faktor, dll.) dilakukan jika, untuk memecahkan masalah atau membuktikan hipotesis yang diajukan, perlu untuk menentukan pola statistik tersembunyi dalam data eksperimen primer. Ketika memulai pemrosesan statistik sekunder, peneliti pertama-tama harus memutuskan yang mana dari berbagai statistik sekunder yang harus digunakan untuk memproses data eksperimen primer. Keputusan dibuat atas dasar mempertimbangkan sifat hipotesis yang diuji dan sifat bahan utama yang diperoleh sebagai hasil percobaan. Berikut adalah beberapa rekomendasi dalam hal ini.

Rekomendasi 1. Jika hipotesis eksperimental mengandung asumsi bahwa sebagai hasil dari penelitian psikologis dan pedagogis yang sedang berlangsung, indikator kualitas apa pun akan meningkat (atau menurun), maka disarankan untuk menggunakan tes Student atau p2-criterion untuk membandingkan pra- dan data pasca eksperimen. Yang terakhir ini digunakan jika data eksperimen primer bersifat relatif dan dinyatakan, misalnya, sebagai persentase.

Rekomendasi 2. Jika hipotesis yang diuji secara eksperimental mencakup pernyataan tentang hubungan kausal antara beberapa variabel, maka disarankan untuk memeriksanya dengan mengacu pada koefisien korelasi linier atau peringkat. Korelasi linier digunakan ketika variabel independen dan dependen diukur menggunakan skala interval, dan perubahan variabel ini sebelum dan sesudah eksperimen kecil. Korelasi peringkat digunakan ketika cukup untuk menilai perubahan dalam urutan suksesi variabel independen dan dependen, atau ketika perubahannya cukup besar, atau ketika alat pengukurnya ordinal daripada interval.

Rekomendasi 3. Kadang-kadang hipotesis mencakup asumsi bahwa sebagai hasil percobaan, perbedaan individu antara subjek akan meningkat atau menurun. Asumsi ini diuji dengan baik menggunakan uji Fisher, yang memungkinkan seseorang untuk membandingkan varians sebelum dan sesudah eksperimen. Perhatikan bahwa, dengan menggunakan kriteria Fisher, dimungkinkan untuk bekerja hanya dengan nilai absolut indikator, tetapi tidak dengan peringkatnya.

Diselenggarakan di Allbest.ru

...

Dokumen serupa

    Teknik dan metode dasar untuk mengolah dan menganalisis data statistik. Perhitungan nilai rata-rata aritmatika, harmonik dan geometrik. Seri distribusi, karakteristik utama mereka. Metode penyelarasan dekat dinamika. Sistem rekening nasional.

    makalah, ditambahkan 24/10/2014

    Konsep analisis ekonomi sebagai ilmu, esensinya, subjek, karakteristik umum metode dan efisiensi sosial-ekonomi. Kelompok utama metode ekonometrika untuk analisis dan pemrosesan data. Analisis faktor data ekonomi perusahaan.

    abstrak, ditambahkan 03/04/2010

    Sampel rata-rata aritmatika, varians, standar deviasi. Penolakan menurut kriteria Chauvenet. Aturan Tiga Sigma. Estimasi signifikansi selisih antara nilai rata-rata kedua sampel. Analisis regresi berganda berpasangan. Analisis faktorial penuh.

    makalah, ditambahkan 12/05/2012

    Penerapan berbagai metode penyajian dan pengolahan data statistik. Sampel statistik spasial. Regresi dan korelasi berpasangan. Seri waktu. Membangun tren. Contoh dan metode praktis untuk solusinya, rumus dan artinya.

    mata kuliah, ditambahkan 26/02/2009

    Pengolahan statistik hasil pengukuran; rata-rata aritmatika, kuadrat, varians. Penentuan parameter sampling: hukum tiga sigma, histogram, diagram kendali, diagram Ishikawa. Penggunaan alat-alat berkualitas dalam pembuatan sofa.

    makalah, ditambahkan 17/10/2014

    Nilai rata-rata dalam statistik, esensi dan kondisi penerapannya. Jenis dan bentuk rata-rata: dengan adanya bobot tanda, dengan bentuk perhitungan, dengan cakupan populasi. Mode, median. Studi statistik tentang dinamika laba dan profitabilitas pada contoh JSC "Bashmebel".

    pekerjaan kontrol, ditambahkan 14/06/2008

    Prinsip-prinsip pengolahan data statistik, metode dan teknik yang digunakan dalam proses ini. Metodologi dan tahapan utama dalam pembangunan diagram kendali, klasifikasi dan jenisnya, fitur fungsional, penentuan kelebihan dan kekurangan aplikasi.

    makalah, ditambahkan 23/08/2014

    Perhitungan karakteristik numerik dan pengolahan hasil pengamatan sampel. Perhitungan dan analisis indikator statistik dalam perekonomian. Kekayaan negara: unsur, evaluasi; saldo aset dan kewajiban; aktiva tetap, indikator modal kerja.

    makalah, ditambahkan 25/12/2012

    Statistik deskriptif dan inferensi statistik. Metode pemilihan yang menjamin keterwakilan sampel. Pengaruh jenis sampel pada besarnya kesalahan. Tugas dalam menerapkan metode sampling. Distribusi data observasi ke populasi umum.

    tes, ditambahkan 27/02/2011

    Pengungkapan konsep: skala interval, rata-rata aritmatika, tingkat signifikansi statistik. Bagaimana menginterpretasikan modus, median dan mean. Memecahkan masalah menggunakan kriteria Friedman, Rosenbaum. Perhitungan koefisien korelasi Spremen.

Metode pemrosesan statistik hasil percobaan disebut teknik matematika, formula, metode perhitungan kuantitatif, yang dengannya indikator yang diperoleh selama percobaan dapat digeneralisasi, dibawa ke dalam sistem, mengungkapkan pola yang tersembunyi di dalamnya.

Kita berbicara tentang keteraturan yang bersifat statistik yang ada di antara variabel-variabel yang dipelajari dalam eksperimen.

Data adalah elemen utama yang diklasifikasikan atau dikategorikan untuk tujuan pemrosesan 26 .

Beberapa metode analisis matematika dan statistik memungkinkan untuk menghitung apa yang disebut statistik matematika dasar yang mencirikan distribusi sampel data, misalnya:

sampel rata-rata,

varians sampel,

Median dan lain-lain.

Metode statistik matematika lainnya memungkinkan untuk menilai dinamika perubahan dalam statistik sampel individu, misalnya:

analisis dispersi,

Analisis regresi.

Dengan menggunakan metode pengambilan sampel kelompok ketiga, seseorang dapat dengan andal menilai hubungan statistik yang ada antara variabel yang diperiksa dalam eksperimen ini:

Analisis korelasi;

Analisis faktor;

metode perbandingan.

Semua metode analisis statistik matematis secara konvensional dibagi menjadi primer dan sekunder 27 .

Metode disebut primer, yang dengannya dimungkinkan untuk memperoleh indikator yang secara langsung mencerminkan hasil pengukuran yang dilakukan dalam percobaan.

Metode sekunder disebut pemrosesan statistik, yang dengannya, berdasarkan data primer, pola statistik yang tersembunyi di dalamnya terungkap.

Metode pemrosesan statistik utama meliputi, misalnya:

Penentuan mean sampel;

varians sampel;

Mode selektif;

Median sampel.

Metode sekunder biasanya meliputi:

Analisis korelasi;

Analisis regresi;

Metode untuk membandingkan statistik primer untuk dua atau lebih sampel.

Mari kita pertimbangkan metode untuk menghitung statistik matematika dasar, dimulai dengan mean sampel.

Rata-rata aritmatika - adalah rasio jumlah semua nilai data dengan jumlah suku 28 .

Nilai rata-rata sebagai indikator statistik adalah rata-rata penilaian kualitas psikologis yang dipelajari dalam eksperimen.

Penilaian ini mencirikan tingkat perkembangannya secara keseluruhan dalam kelompok mata pelajaran yang menjadi sasaran pemeriksaan psikodiagnostik. Membandingkan secara langsung nilai rata-rata dari dua atau lebih sampel, kita dapat menilai tingkat perkembangan relatif pada orang-orang yang membentuk sampel ini dari kualitas yang dinilai.

Rata-rata sampel ditentukan dengan menggunakan rumus berikut 29:

di mana x cf adalah mean sampel atau mean aritmatika sampel;

n - jumlah subjek dalam sampel atau indikator psikodiagnostik pribadi, yang menjadi dasar penghitungan nilai rata-rata;

x k - nilai pribadi indikator untuk mata pelajaran individu. Ada n indikator seperti itu, jadi indeks k dari variabel ini mengambil nilai dari 1 hingga n;

- diterima dalam matematika, tanda penjumlahan dari nilai-nilai variabel yang ada di sebelah kanan tanda ini.

Penyebaran adalah ukuran penyebaran data tentang nilai rata-rata 30 .

Semakin besar varians, semakin besar varians atau scatter dalam data. Ditentukan agar dapat membedakan besaran-besaran yang mempunyai rata-rata yang sama, tetapi penyebarannya berbeda.

Dispersi ditentukan dengan rumus berikut:

di mana varians sampel, atau hanya varians;

Sebuah ekspresi yang berarti bahwa untuk semua x k dari yang pertama hingga yang terakhir dalam sampel ini, perlu untuk menghitung perbedaan antara nilai privat dan rata-rata, kuadratkan perbedaan ini dan jumlahkan;

n adalah jumlah subjek dalam sampel atau nilai utama yang variansnya dihitung.

median nilai sifat yang diteliti disebut, yang membagi sampel, diurutkan berdasarkan nilai sifat ini, menjadi dua.

Mengetahui median berguna untuk menentukan apakah distribusi nilai-nilai tertentu dari sifat yang dipelajari simetris dan mendekati apa yang disebut distribusi normal. Mean dan median untuk distribusi normal biasanya sama atau berbeda sangat sedikit satu sama lain.

Jika distribusi sampel fitur normal, maka metode perhitungan statistik sekunder berdasarkan distribusi normal data dapat diterapkan padanya. Jika tidak, ini tidak dapat dilakukan, karena kesalahan serius dapat menyusup ke dalam perhitungan.

Mode satu lagi statistik matematika dasar dan karakteristik distribusi data eksperimen. Modus adalah nilai kuantitatif dari sifat yang diteliti, yang paling sering ditemukan dalam sampel.

Untuk distribusi ciri simetris, termasuk distribusi normal, nilai modusnya bertepatan dengan nilai mean dan median. Untuk jenis distribusi lain, asimetris, ini tidak khas.

Metode pemrosesan statistik sekunder, di mana hubungan atau hubungan langsung antara dua seri data eksperimen ditemukan, disebut metode analisis korelasi. Ini menunjukkan bagaimana satu fenomena mempengaruhi yang lain atau terkait dengannya dalam dinamikanya. Dependensi semacam ini ada, misalnya, antara besaran yang berada dalam hubungan sebab akibat satu sama lain. Jika ternyata dua fenomena secara statistik berkorelasi secara signifikan satu sama lain, dan jika pada saat yang sama ada keyakinan bahwa salah satunya dapat bertindak sebagai penyebab fenomena lainnya, maka pasti ada hubungan sebab akibat di antara mereka. .

Ada beberapa jenis metode ini:

Analisis korelasi linier memungkinkan Anda untuk membangun hubungan langsung antara variabel dalam nilai absolutnya. Koneksi ini secara grafis dinyatakan dengan garis lurus, maka nama "linier".

Koefisien korelasi linier ditentukan dengan menggunakan rumus berikut 31:

dimana r xy - koefisien korelasi linier;

x, y - nilai sampel rata-rata dari nilai yang dibandingkan;

X saya , kamu saya - nilai sampel pribadi dari jumlah yang dibandingkan;

P - jumlah total nilai dalam rangkaian indikator yang dibandingkan;

Dispersi, penyimpangan nilai yang dibandingkan dari nilai rata-rata.

Korelasi peringkat menentukan ketergantungan bukan antara nilai absolut variabel, tetapi antara tempat ordinal, atau peringkat, yang ditempati oleh mereka dalam serangkaian yang diurutkan berdasarkan besarnya. Rumus untuk koefisien korelasi rank adalah 32:

dimana R s - koefisien korelasi rank menurut Spearman;

d saya - perbedaan antara peringkat indikator mata pelajaran yang sama dalam baris berurutan;

P - jumlah subjek atau data digital (peringkat) dalam deret yang berkorelasi.

Atyusheva Anna

Dalam pekerjaan, pada contoh pengolahan data tentang kemajuan siswa di kelas 7, karakteristik statistik utama dipertimbangkan, pengumpulan dan pengelompokan data statistik dilakukan, informasi statistik disajikan dengan jelas, dan analisis data diperoleh dilakukan.

Karya tersebut berisi presentasi yang menyertainya.

Unduh:

Pratinjau:

Lembaga pendidikan otonom kota "Gymnasium No. 24"

Konferensi Ilmiah XXII MAGNI

Pemrosesan data statistik

MAOU "Gymnasium No. 24" Atyusheva Anna

Konsultan: guru matematika

Shchetinina Natalya Sergeevna

Magadan, 2016

Pendahuluan………………………………………………………………………………………………………3

  1. Konsep dasar yang digunakan dalam pengolahan data statistik……………………….5
  2. Bagian penelitian……………………………………………………………………………. . .....7

2.1 Pengolahan statistik data perkembangan siswa kelas 7 “B”…………………… ..7

18

2.3. Perbandingan karakteristik kegiatan pendidikan siswa berdasarkan hasil triwulan I dan II……………………………………………………………………………………… …………..21

2.4. Analisis survei siswa kelas 7 "B" untuk kontrol orang tua atas kemajuan anak …………………………………………………………………………… ……….23

Kesimpulan……………………………………………………………………………………………...27

Sastra……………………………………………………………………………………………… 28

pengantar

Setiap dari kita, membuka buku atau koran, menyalakan TV atau pergi ke stasiun, selalu dihadapkan pada bentuk tabel penyajian informasi. Ini adalah jadwal pelajaran, jadwal kereta api, tabel perkalian dan banyak lagi. Semua informasi disajikan dalam bentuk bagan atau grafik.

Anda harus dapat memproses dan menganalisis informasi tersebut. Tanpa pemrosesan data, perbandingan peristiwa, tidak mungkin untuk melacak perkembangan masalah tertentu.

Dalam kursus aljabar, kami mempelajari karakteristik statistik yang banyak digunakan dalam berbagai penelitian. Saya tertarik pada penerapan praktis dari karakteristik yang dipelajari, dan kemampuan untuk memproses data sehingga informasi yang disajikan dengan jelas menentukan arah perkembangan masalah tertentu dan, sebagai hasilnya, hasil pemecahannya. Sebagai masalah seperti itu, saya memutuskan untuk mempertimbangkan kinerja kelas saya di kuartal semester pertama tahun ini.

Area objek studi– aljabar

Objek studi– karakteristik statistik

Subyek studi- kemajuan siswa di kelas 7 "B" untuk kuartal paruh pertama tahun ini

Hipotesa: Kami percaya bahwa dengan menggunakan contoh pemrosesan data tentang kemajuan siswa di kelas 7B, kami tidak hanya akan berkenalan dengan karakteristik statistik utama, tetapi juga belajar sendiri:

  • mengumpulkan dan mengelompokkan data statistik;
  • memvisualisasikan informasi statistik;
  • menganalisis data yang diterima.

Target: belajar memproses, menganalisis, memvisualisasikan informasi yang tersedia.

Tugas:

  • mempelajari karakteristik statistik;
  • mengumpulkan informasi tentang kemajuan siswa di kelas 7 di kuartal

paruh pertama tahun ini;

  • memproses informasi;
  • memvisualisasikan informasi menggunakan histogram;
  • menganalisis data yang diperoleh dan menarik kesimpulan yang sesuai.

Konsep dasar yang digunakan dalam pengolahan data statistik

Statistika adalah ilmu yang mempelajari untuk memperoleh, mengolah, dan menganalisis data kuantitatif tentang berbagai fenomena massa yang terjadi di alam dan masyarakat. Kata "statistik" berasal dari kata Latin "status", yang berarti "negara, keadaan".

Karakteristik statistik yang paling sederhana adalah mean aritmatika, median, range, mode.

  • rata-rata aritmatikaderet bilangan disebut hasil bagi membagi jumlah bilangan-bilangan tersebut dengan banyaknya suku. Biasanya, rata-rata aritmatika ditemukan ketika mereka ingin menentukan nilai rata-rata untuk serangkaian data tertentu: rata-rata hasil gandum per 1 hektar di area tersebut, output rata-rata satu brigade pekerja per shift, nilai rata-rata sertifikat, suhu udara rata-rata pada siang hari dalam dekade ini, dll.
  • median barisan bilangan berurut yang jumlah anggotanya ganjil disebut bilangan yang ditulis di tengah, dan median barisan bilangan berurut yang jumlah anggotanya genap disebut rata-rata aritmatika dari dua bilangan yang ditulis di tengah. Perhatikan bahwa lebih nyaman dan lebih cepat untuk bekerja dengan seri angka jika dipesan, mis. seri seperti itu di mana setiap nomor berikutnya tidak kurang (atau tidak lebih) dari yang sebelumnya.
  • Mode Deret bilangan disebut bilangan yang paling sering muncul pada deret tersebut. Satu set angka mungkin memiliki lebih dari satu mode atau tidak ada mode sama sekali. Modus dari serangkaian data biasanya ditemukan ketika seseorang ingin mengungkapkan beberapa indikator yang khas. Perhatikan bahwa rata-rata aritmatika dari serangkaian angka mungkin tidak bertepatan dengan salah satu dari angka-angka ini, dan mode, jika ada, harus bertepatan dengan dua atau lebih angka dari seri. Selain itu, tidak seperti mean aritmatika, konsep "modus" tidak hanya mengacu pada data numerik.
  • secara besar-besaran deret bilangan disebut selisih antara bilangan terbesar dan terkecil dari bilangan tersebut. Rentang suatu deret ditemukan ketika ingin menentukan seberapa besar penyebaran data dalam suatu deret.

Kami akan menunjukkan definisi dari masing-masing karakteristik menggunakan contoh rangkaian angka: 47,46,52,47,52,47,52,49,45,43,53,53,47,52.

rata-rata aritmatika 48,7.

Ditemukan sebagai berikut: kami menentukan jumlah angka dan membaginya dengan jumlah mereka.

(47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7.

median seri angka yang diberikan akan menjadi nomor 48.

Ini seperti ini: kami menyusun serangkaian angka, memilih yang ada di tengah. Jika banyaknya bilangan genap, maka kita mencari rata-rata aritmatika dari dua bilangan di tengah deret tersebut.

43,45,46,47,47,47, 47,49 ,52,52,52,52,53,53

(47+49):2=48

Mode seri angka yang diberikan akan menjadi angka 47 dan 52 . Angka-angka ini paling sering diulang.

47 ,46, 52 , 47 , 52 , 47 , 52 ,49,45,43,53,53, 47 , 52 .

secara besar-besaran deret angka ini akan menjadi 10.

Ditemukan sebagai berikut: kami memilih nomor seri terbesar dan terkecil dan menemukan perbedaan antara angka-angka ini.

47,46,52,47,52,47,52,49,45, 43, 53 ,53,47,52

53-43=10

Bagian penelitian

Pengolahan statistik data perkembangan siswa kelas 7 “B”

Mari beralih ke pemrosesan informasi. Kami akan membuat tabel untuk masing-masing mata pelajaran, terdiri dari tiga baris, yang pertama akan berisi serangkaian data. Setiap varian dari seri ini sebenarnya diamati beberapa kali dalam sampel. Jumlah ini disebut multiplisitas opsi. Jadi kami menempatkan di baris kedua multiplisitas opsi yang sesuai. Kami mendapatkan tabel distribusi sampel.

Jika kita menjumlahkan semua perkalian, maka kita mendapatkan jumlah semua pengukuran yang dilakukan selama sampel - ukuran sampel (Dalam kasus kami, angka ini adalah 24, yang sesuai dengan jumlah siswa di kelas).

Di baris ketiga, rasio, yang dinyatakan sebagai persentase, disebut frekuensi opsi.

pilihan frekuensi =

Secara umum, jika tabel frekuensi relatif disusun berdasarkan hasil penelitian, maka jumlah frekuensi relatifnya adalah 100%.

saya seperempat

Bahasa Rusia.

Mari kita pesan data sampel (nilai): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4 ,4,4,5.

Rata-rata subjek:(rata-rata).

Tabel Alokasi Frekuensi

Pilihan

Pilihan multiplisitas

Bukan

Frekuensi %

58.3%

37.5%

4.2%

Literatur.

Mari kita pesan data sampel (nilai): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5 ,5 ,5,5.

Rata-rata subjek:(rata-rata).

Opsi Penilaian

beragam

Tidak

Frekuensi %

37.5%

41.7%

20.8%

Aljabar.

Mari kita pesan data sampel (nilai): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4 ,4,5,5.

Rata-rata subjek:(rata-rata).

Jumlah siswa terbesar dalam mata pelajaran memiliki "4, 3" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

45.8%

45.8%

8.3%

Cerita.

Mari kita pesan data sampel (nilai): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4 ,4,4,5

Rata-rata subjek:(rata-rata).

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

45.8%

4.2%

Ilmu kemasyarakatan.

Mari kita pesan data sampel (nilai): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5 ,5 .5.5

Rata-rata subjek:(rata-rata).

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

37.5%

41.7%

20.8%

Geografi.

Mari kita pesan sampel data (nilai): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5 ,5.5 ,5

Rata-rata subjek:(rata-rata).

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

20.8%

41.7%

37.5%

Fisika.

Mari kita pesan data sampel (nilai): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,4,4,5

Rata-rata subjek:(rata-rata).

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

37.5%

58.3%

4.2%

Biologi.

Mari kita pesan sampel data (nilai): 3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4.4,5,5,5,5,5 ,5 ,5

Rata-rata subjek:(rata-rata).

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

45.8%

29.2%

DASAR KESELAMATAN HIDUP.

Mari kita pesan sampel data (nilai): 4,4,4,4,4,4.4.5,5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 ,5

Rata-rata subjek:(rata-rata).

Opsi Penilaian

beragam

Tidak

Tidak

Frekuensi %

29.2%

70.8%

Mari kita pesan sampel data (nilai): 3,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5

Rata-rata subjek:(rata-rata).

Jumlah siswa terbesar dalam mata pelajaran memiliki "5" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 5 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

4.2%

37.5%

58.3%

Bahasa Inggris.

Mari kita pesan data sampel (nilai): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5 ,5 ,5

Rata-rata subjek:(rata-rata).

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

37.5%

41.7%

20.8%

Informatika.

Mari kita pesan sampel data (nilai): 3,4,4,4,4.4,4,4,4,4,4,4,4,4,5,5,5,5,5.5,5,5,5 ,5

Rata-rata subjek:(rata-rata).

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

4.2%

54.2%

41.7%

Teknologi.

Mari kita pesan data sampel (nilai): 3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,55,5,5,5,5 ,5

Rata-rata subjek:(rata-rata).

Jumlah siswa terbesar dalam mata pelajaran memiliki "5" (fashion)

Sekitar setengah dari siswa dalam studi Rusia di 4,5 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

20.8%

54.2%

Sekarang mari kita kumpulkan informasi serupa tentang hasil kuartal kedua.

Bahasa Rusia.

Mari kita pesan data sampel (nilai): 3,3,3.3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4 ,4 ,4

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Bukan

Tidak

Frekuensi %

41.7%

58.3%

Literatur.

Mari kita pesan data sampel (nilai): 3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,5,5,5 ,5 .5.5

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "3" (fashion)

Sekitar setengah dari siswa dalam studi Rusia di 3 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

41.7%

33.3%

Aljabar.

Mari kita pesan data sampel (nilai): 3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4 ,5 .5.5

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "3" (fashion)

Sekitar setengah dari siswa dalam studi Rusia di 3 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

37.5%

12.5%

Cerita.

Mari kita pesan data sampel (nilai): 3,3,3,3,3,3,3,3,3,4.4,4,4,4,4,4,4,4,4,4,4,4 ,4,5

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

37.5%

58.3%

4.2%

Masyarakat.

Mari kita pesan sampel data (nilai): 3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4 ,5 .5.5

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

16.7%

70.8%

12.5%

Geografi.

Mari kita pesan sampel data (nilai): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5 .5.5

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

12.5%

58.3%

29.2%

Fisika.

Mari kita pesan sampel data (nilai): 3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,44,5 ,5 ,5

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

33.3%

16.7%

12.5%

Biologi.

Mari kita pesan sampel data (nilai): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5 ,5

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

12.5%

62.5%

DASAR KESELAMATAN HIDUP.

Mari kita pesan sampel data (nilai): 3,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 ,5

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "5" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 5 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

4.2%

8.3%

87.5%

Sejarah dan masyarakat tanah air.

Mari kita pesan sampel data (nilai): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5 ,5 .5.5

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

12.5%

45.8%

41.7%

Bahasa Inggris.

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

20.8%

29.2%

Informatika.

Mari kita pesan sampel data (nilai): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5 .5.5

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "4" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

20.8%

29.2%

Teknologi.

Mari kita pesan sampel data (nilai): 3,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5 .5.5

Rata-rata subjek:(rata-rata)

Jumlah siswa terbesar dalam mata pelajaran memiliki "5" (fashion)

Sekitar setengah dari siswa belajar bahasa Rusia di 4 (median)

Opsi Penilaian

beragam

Tidak

Frekuensi %

4.2%

29.2%

66.7%

Visualisasikan data dengan histogram

Untuk representasi visual dari data yang diperoleh sebagai hasil studi statistik, berbagai metode representasi mereka digunakan secara luas.

Kami akan menggunakan histogram untuk memvisualisasikan data. Histogram adalah sosok melangkah yang terdiri dari persegi panjang tertutup. Basis setiap persegi panjang sama dengan panjang interval, dan tingginya adalah multiplisitas varian atau frekuensi relatif. Jadi, dalam histogram, tidak seperti diagram batang biasa, alas persegi panjang tidak dipilih secara sembarangan, tetapi ditentukan secara ketat oleh panjang interval.

Karakteristik komparatif kinerja siswa dalam mata pelajaran kuartal pertama

Karakteristik komparatif kinerja siswa pada mata pelajaran kuartal kedua

temuan

Menurut hasil kuartal pertama, terlihat jelas bahwa siswa yang paling sulit mengatasi mata pelajaran seperti: bahasa Rusia dan aljabar, mata pelajaran yang "troika" merupakan penilaian yang merupakan prioritas dalam kaitannya dengan nilai lainnya. Ini berarti bahwa kualitas dalam mata pelajaran ini lebih rendah daripada yang lain.

Hal ini juga jelas bahwa tingkat tinggi tiga kali lipat dalam mata pelajaran seperti sastra, sejarah, masyarakat, fisika, bahasa Inggris. Kehadiran tiga kali lipat dalam mata pelajaran seperti teknologi, biologi, geografi juga menyedihkan.

Menurut hasil triwulan kedua, jumlah triple dan fives mengalami penurunan yang signifikan, yaitu siswa telah mendistribusikan kekuatan mereka di semua mata pelajaran, dan tidak disukai secara terpisah.

Histogram sebaran skor rata-rata pada mata pelajaran triwulan pertama

Histogram sebaran skor rata-rata mata pelajaran triwulan II

Kesimpulan

Untuk membuat grafik ini, kami menggunakan karakteristik statistik seperti mean aritmatika. Terlihat jelas bahwa pada kuartal kedua, pengetahuan tentang bahasa Rusia, sejarah dan masyarakat tanah air, ilmu komputer memburuk. Peningkatan dalam sejarah, masyarakat, fisika, biologi, keselamatan hidup, bahasa Inggris. Tetapi pada saat yang sama, diagram menunjukkan bahwa perubahan yang lebih signifikan menjadi lebih baik hanya terjadi dalam fisika dan bahasa Inggris.

Perbandingan karakteristik kegiatan pendidikan siswa berdasarkan hasil triwulan I dan II

Histogram kualitas pengetahuan pada mata pelajaran kuartal pertama

Histogram kualitas pengetahuan pada mata pelajaran kuartal kedua

Dengan menggabungkan kedua histogram menjadi satu, akan lebih mudah untuk melihat gambaran kinerja kelas dibandingkan. Dan secara terpisah, lebih mudah untuk melihat item mana yang memiliki kualitas lebih tinggi. Misalnya, pada kuartal pertama, kualitasnya kurang dari 60% dalam mata pelajaran - aljabar, bahasa Rusia, sejarah, pada yang kedua - bahasa Rusia, sastra, aljabar, fisika. Sudah jelas bahwa bahasa Rusia dan aljabar adalah yang paling sulit bagi siswa. Dan persentase kualitas pada semua mata pelajaran tidak jauh berbeda 66% - triwulan pertama, 68% - kedua. Artinya, kualitas spasmodik dalam mata pelajaran, yang terlihat jelas dalam diagram perbandingan, menunjukkan bahwa siswa tidak benar-benar berusaha untuk meningkatkan pengetahuan mereka dan tidak mempertahankan posisi mereka dalam satu atau lain bidang studi.

Bagan yang membandingkan semua item berdasarkan kualitas untuk 1 dan 2 kuartal

Selama kuartal kedua, jumlah siswa yang baik dan siswa yang sangat baik dalam bahasa Rusia, masyarakat, biologi, bahasa Inggris, dan teknologi meningkat secara signifikan. Sedikit mengurangi jumlah literatur, aljabar, keselamatan hidup, IORK dan ilmu komputer. Dan Anda dapat melihat penurunan yang kuat dalam kualitas fisika, yang terkait dengan ketidaksiapan siswa untuk pelajaran.

Dan sekali lagi, kami sampai pada kesimpulan bahwa anak-anak belajar "lompatan", dan tidak ada preferensi khusus dalam arah pendidikan (mata pelajaran kemanusiaan, mata pelajaran fisik dan matematika, mata pelajaran siklus alam).

Analisis survei siswa kelas 7 "B" untuk kontrol orang tua atas kemajuan anak-anak

Berdasarkan hasil penelitian di atas, kami memutuskan untuk melakukan survei di kalangan siswa kelas 7 "B" untuk kontrol orang tua atas pendidikan anak (kuesioner, lihat lampiran)

Besar sampelnya adalah 22 orang.

Memeriksa pekerjaan rumah oleh orang tua

Kesimpulan

Hampir seperempat siswa pada masalah ini tanpa kontrol orang tua, yang tentu saja mempengaruhi kinerja akademik mereka.

Jumlah cek per minggu untuk pekerjaan rumah

Median = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7,7 = (3+3 ):2 = 3

Rata-rata aritmatika = 3

Kesimpulan

Rata-rata, tugas ditinjau tiga kali seminggu. Mengingat lompatan dalam belajar, ini tidak cukup.

Median = 0,0,0,0,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,5,5,6,7, 7,7 = (2+2):2 = 2

Rata-rata aritmatika = 3 (rata-rata, buku harian diperiksa oleh orang tua 3 kali seminggu)

Jumlah waktu yang dihabiskan siswa untuk mengerjakan pekerjaan rumah

Pilihan

Kurang dari 1

Frekuensi %

  • Rentang R=x(maks) - x(min)= 3,5 - 0,5 = 3 jam

(mencirikan besarnya hamburan nilai-nilai yang diamati, yaitu menunjukkan perbedaan antara waktu terlama dan terpendek)

  • Mode M(0) = 2,5 jam ( menunjukkan nilai yang muncul lebih sering daripada yang lain, yaitu menunjukkan waktu yang paling sering dihabiskan siswa)

Histogram waktu yang dihabiskan siswa untuk mengerjakan pekerjaan rumah

Kesimpulan

Rata-rata, pekerjaan rumah membutuhkan waktu 2,5 jam sehari. Yang dianggap normal untuk usia siswa.

Kesimpulan

Sebagai hasil dari pekerjaan yang dilakukan, saya belajar bagaimana memproses dan menganalisis informasi yang tersedia

Pengetahuan tentang karakteristik statistik membantu saya menentukan skor rata-rata dalam berbagai mata pelajaran, serta mode dan jangkauan dalam indikator kinerja di mana tampaknya mustahil untuk menentukannya. Tanpa pemrosesan data, perbandingan peristiwa, tidak mungkin untuk melacak perkembangan masalah tertentu. Kami mencoba tidak hanya untuk melacak masalah yang muncul - penurunan kualitas pengetahuan dan kinerja akademik dalam mata pelajaran, tetapi juga untuk mencoba mencari tahu alasannya, yang menurut kami terletak pada kontrol yang tidak memadai dari orang tua atas prestasi akademik anak-anaknya. Survei dan hasil kinerja akademik menunjukkan bahwa siswa kelas 7 "B" tidak memiliki keterampilan yang cukup dalam pengendalian diri atas pembelajaran mereka, dan orang tua berpikir sebaliknya.

Saya pikir pekerjaan yang dilakukan akan berguna baik untuk guru kelas dalam bekerja dengan orang tua dan untuk teman sekelas saya untuk meningkatkan hasil mereka dalam mata pelajaran individu di masa depan.

Statistika adalah ilmu yang mempelajari, mengolah, dan menganalisis data kuantitatif pada berbagai fenomena massa dalam kehidupan. Kami hanya mengungkapkan karakteristiknya untuk diri kami sendiri sedikit, dan masih banyak yang tidak diketahui dan menarik di depan.

Bibliografi:

  1. http://www.nado5.ru/e-book/naibolshii-obzchii-delitel
    Pratinjau:

    Untuk menggunakan pratinjau presentasi, buat akun Google (akun) dan masuk: https://accounts.google.com


    Teks slide:

    Pemrosesan data statistik Disiapkan oleh: siswa kelas 7 "B" MAOU "Gymnasium No. 24" Atyusheva Anna Konsultan: guru matematika Shchetinina Natalya Sergeevna

    Tujuan: belajar mengolah, menganalisis, memvisualisasikan informasi yang tersedia. Tugas: mempelajari karakteristik statistik; mengumpulkan informasi tentang kemajuan siswa di kelas 7 B untuk kuartal semester pertama tahun ini; memproses informasi; memvisualisasikan informasi menggunakan histogram; menganalisis data yang diperoleh dan menarik kesimpulan yang sesuai.

    Hipotesis pada contoh pengolahan data kinerja siswa, kita tidak hanya bisa berkenalan dengan karakteristik statistik utama, tetapi juga belajar bagaimana mengumpulkan dan mengelompokkan data statistik; memvisualisasikan informasi statistik; menganalisis data yang diterima.

    Statistika adalah ilmu yang mempelajari untuk memperoleh, mengolah, dan menganalisis data kuantitatif tentang berbagai fenomena massa yang terjadi di alam dan masyarakat. Kata "statistik" berasal dari kata Latin "status", yang berarti "negara, keadaan". Karakteristik statistik paling sederhana: Rata-rata aritmatika Mode Rentang Median

    Tentang pengertian masing-masing sifat pada contoh barisan bilangan: 47,46,52,47,52,47,52,49,45,43,53,53,47,52. Rata-rata aritmatika dari deret angka ini adalah angka 48,7. (47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7. Median deret angka ini adalah angka 48. menjadi angka 47 dan 52. 47, 46, 52, 47, 52, 47, 52, 49,45,43,53,53, 47, 52. Jangkauan deret angka ini adalah 10. 47,46,52,47,52,47 ,52, 49,45, 43, 53 .53.47.52 53-43=10

    Masalah dengan prestasi akademik di kelas 7 "B"

    Varian 2 3 4 5 Multiplisitas tidak ada varian 14 9 1 Frekuensi % 0% 58,3% 37,5% 4,2% Bahasa Rusia. Mari kita pesan data sampel (nilai): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4 ,4,4,5. Skor rata-rata dalam subjek: 14∙3+9∙4+5∙124=8324≈3.5 (rata-rata aritmatika). Jumlah siswa terbesar dalam mata pelajaran memiliki "3" (modus) Sekitar setengah dari siswa dalam studi bahasa Rusia di 3 (median)

    Untuk representasi visual dari data yang diperoleh sebagai hasil studi statistik, berbagai metode representasi mereka digunakan secara luas.

    Karakteristik komparatif kemajuan siswa dalam mata pelajaran kuartal pertama

    Karakteristik komparatif kemajuan siswa dalam mata pelajaran kuartal kedua

    Histogram sebaran skor rata-rata pada mata pelajaran triwulan I dan II

    Diagram perbandingan semua item dalam hal kualitas untuk kuartal I dan II

    Menanyakan di kalangan siswa kelas 7 "B" untuk kontrol orang tua atas pendidikan anak KUESIONER 1. Apakah orang tua Anda memeriksa pekerjaan rumah Anda? ____________________________________________________________ 2. Berapa kali seminggu? _______________________________________________________________ 3. Berapa kali dalam seminggu orang tuamu melihat buku harianmu? _______________________________________________________________ 4. Berapa banyak waktu yang Anda habiskan rata-rata setiap hari untuk mengerjakan pekerjaan rumah Anda? _______________________________________________________________

    Memeriksa pekerjaan rumah oleh orang tua

    Jumlah pemeriksaan per minggu untuk pekerjaan rumah Median = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7 , 7 = (3+3):2 = 3 Rata-rata aritmatika = 3

    Histogram waktu yang dihabiskan siswa untuk mengerjakan pekerjaan rumah