სტატისტიკური მონაცემების დამუშავების ელემენტები. სტატისტიკური მონაცემების დამუშავება და მისი მახასიათებლები მონაცემები სტატისტიკური მონაცემების დამუშავებისთვის

ლაბორატორიული სამუშაო No3. სტატისტიკური მონაცემების დამუშავება MatLab სისტემაში

ზოგადი პრობლემის განცხადება

განხორციელების მთავარი მიზანი ლაბორატორიული სამუშაოარის შესავალი სტატისტიკურ მონაცემთა დამუშავებასთან მუშაობის საფუძვლებში MatLAB გარემოში.

თეორიული ნაწილი

პირველადი სტატისტიკური მონაცემების დამუშავება

სტატისტიკური მონაცემების დამუშავება ეფუძნება პირველად და მეორად რაოდენობრივ მეთოდებს. სტატისტიკური მონაცემების პირველადი დამუშავების მიზანია მიღებული ინფორმაციის სტრუქტურირება, რაც გულისხმობს მონაცემთა დაჯგუფებას საყრდენი ცხრილებისხვადასხვა პარამეტრით. პირველადი მონაცემები უნდა იყოს წარმოდგენილი იმ ფორმატში, რომ ადამიანმა შეძლოს მიღებული მონაცემთა ნაკრების მიახლოებითი შეფასება და გამოავლინოს ინფორმაცია მიღებული მონაცემთა ნიმუშის მონაცემთა განაწილების შესახებ, მაგალითად, მონაცემთა ერთგვაროვნება ან კომპაქტურობა. პირველადი მონაცემთა ანალიზის შემდეგ გამოიყენება მეორადი სტატისტიკური მონაცემების დამუშავების მეთოდები, რის საფუძველზეც დგინდება სტატისტიკური ნიმუშები არსებულ მონაცემთა ნაკრებში.

მონაცემთა მასივზე პირველადი სტატისტიკური ანალიზის ჩატარება საშუალებას გაძლევთ მიიღოთ ცოდნა შემდეგზე:

რა არის ყველაზე წარმომადგენლობითი მნიშვნელობა ნიმუშისთვის? პასუხის გასაცემად ეს შეკითხვაგანისაზღვრება ცენტრალური ტენდენციის ზომები.

არის თუ არა მონაცემების გაფანტვა ამ დამახასიათებელ მნიშვნელობასთან შედარებით დიდი, ანუ რა არის მონაცემების „ბუნდოვანება“? ვ ამ შემთხვევაშიგანისაზღვრება ცვალებადობის ზომები.

აღსანიშნავია ის ფაქტი, რომ ცენტრალური ტენდენციისა და ცვალებადობის საზომის სტატისტიკური მაჩვენებლები განისაზღვრება მხოლოდ რაოდენობრივ მონაცემებზე.

ცენტრალური ტენდენციის ზომები- რაოდენობების ჯგუფი, რომლის ირგვლივ დაჯგუფებულია დანარჩენი მონაცემები. ამრიგად, ცენტრალური ტენდენციის ზომები აჯამებს მონაცემთა ნაკრების, რაც შესაძლებელს ხდის დასკვნის გაკეთებას როგორც მთლიანობაში, ასევე ნიმუშზე და შედარებითი ანალიზის ჩატარებას. სხვადასხვა ნიმუშები ერთმანეთთან.

დავუშვათ, რომ არსებობს მონაცემთა ნიმუში, მაშინ ცენტრალური ტენდენციის ზომები შეფასებულია შემდეგი ინდიკატორებით:

1. ნიმუში ნიშნავსარის ყველა ნიმუშის მნიშვნელობების ჯამის გაყოფის შედეგი მათ რიცხვზე და განისაზღვრება ფორმულით (3.1).

(3.1)

სად - მენიმუშის ე ელემენტი;

ნ- ელემენტების რაოდენობა ნიმუშში.

შერჩევის საშუალო მაჩვენებელი უდიდეს სიზუსტეს იძლევა ცენტრალური ტენდენციის შეფასებისას.

2. მედიანური- აყალიბებს მნიშვნელობას, რომლის ზემოთ და ქვემოთაც განსხვავებული მნიშვნელობების რაოდენობა იგივეა, ანუ ის არის ცენტრალური მნიშვნელობა თანმიმდევრული მონაცემთა სერიებში. იგი განისაზღვრება ნიმუშში ელემენტების რაოდენობის პარიტეტის/უცნაურობის მიხედვით (3.2) ან (3.3) ფორმულებით. მონაცემთა ნიმუშის მედიანას შეფასების ალგორითმი:

უპირველეს ყოვლისა, მონაცემები დალაგებულია (დალაგებულია) კლებადი/აღმავალი თანმიმდევრობით.

თუ შეკვეთილ ნიმუშს აქვს ელემენტების უცნაური რაოდენობა, მაშინ მედიანა ემთხვევა ცენტრალურ მნიშვნელობას.

(3.2)

სადაც ნ

ელემენტების ლუწი რაოდენობის შემთხვევაში, მედიანა განისაზღვრება, როგორც ორი ცენტრალური მნიშვნელობის საშუალო არითმეტიკული.

(3.3)

სად არის შეკვეთილი ნიმუშის საშუალო ელემენტი;

- შეკვეთილი შერჩევის ელემენტი შემდეგი;

ელემენტების რაოდენობა ნიმუშში.

თუ ნიმუშის ყველა ელემენტი განსხვავებულია, მაშინ ნიმუშის ელემენტების ზუსტად ნახევარი მეტია მედიანაზე, ხოლო მეორე ნახევარი ნაკლებია. მაგალითად, ნიმუშისთვის (1, 5, 9, 15, 16), მედიანა იგივეა, რაც მე-9 პუნქტი.

მონაცემთა სტატისტიკური ანალიზის დროს მედიანა საშუალებას გაძლევთ განსაზღვროთ ნიმუშის ელემენტები, რომლებიც ძლიერ გავლენას ახდენენ ნიმუშის საშუალო მნიშვნელობაზე.

ვთქვათ, თქვენ გაქვთ 20 ადამიანის ნიმუში. ნიმუშები არის ინფორმაცია თითოეული ადამიანის საშუალო თვიური შემოსავლის შესახებ. დავუშვათ, რომ 19 ადამიანს აქვს საშუალო თვიური შემოსავალი 20 ტრ. და 1 პირი შემოსავლით 300 ტრ. მთლიანი ნიმუშის მთლიანი თვიური შემოსავალია 680 რუბლი. მედიანა, ნიმუშის შეკვეთის შემდეგ, განისაზღვრება ნიმუშის მეათე და მეთერთმეტე ელემენტების საშუალო არითმეტიკულად) და უდრის Me = 20 tr. ეს შედეგი შემდეგნაირად არის განმარტებული: მედიანა ნიმუშს ყოფს ორ ჯგუფად, ასე რომ, შეიძლება დავასკვნათ, რომ პირველ ჯგუფში თითოეულ ადამიანს აქვს საშუალო თვიური შემოსავალი არაუმეტეს 20 ათასი რუბლისა, ხოლო მეორე ჯგუფში, მინიმუმ 20 ტონა რ. ამ მაგალითში შეგვიძლია ვთქვათ, რომ მედიანა ხასიათდება იმით, თუ რამდენს შოულობს "საშუალო" ადამიანი. ამავდროულად, შერჩევის საშუალო მნიშვნელობა მნიშვნელოვნად აღემატება S = 34, რაც მიუთითებს ამ მახასიათებლის მიუღებლობაზე საშუალო მოგების შეფასებისას.

ამრიგად, რაც უფრო დიდია განსხვავება მედიანასა და შერჩევის საშუალოს შორის, მით მეტია ნიმუშის მონაცემების გაფანტვა (განხილულ მაგალითში, 300 ათასი რუბლის შემოსავალის მქონე პირი აშკარად განსხვავდება კონკრეტული ნიმუშის საშუალო ადამიანებისგან და აქვს მნიშვნელოვანი გავლენა საშუალო შემოსავლის შეფასებაზე). რა უნდა გააკეთოს ასეთ ელემენტებთან, გადაწყვეტილია თითოეულ ინდივიდუალურ შემთხვევაში. მაგრამ ზოგადად, ნიმუშის სანდოობის უზრუნველსაყოფად, ისინი ამოღებულია, რადგან მათ აქვთ ძლიერი გავლენა სტატისტიკური მაჩვენებლების შეფასებაზე.

3. მოდა (მოე)- აყალიბებს მნიშვნელობას, რომელსაც ყველაზე ხშირად ვხვდებით ნიმუშში, ანუ მნიშვნელობას უმაღლესი სიხშირით. რეჟიმის შეფასების ალგორითმი:

იმ შემთხვევაში, როდესაც ნიმუში შეიცავს ელემენტებს, რომლებიც გვხვდება თანაბრად ხშირად, ნათქვამია, რომ ასეთი ნიმუში არ არის მოდა.

თუ ორი მიმდებარე ელემენტებივინაიდან ნიმუშებს აქვთ იგივე სიხშირე, რაც უფრო მაღალია, ვიდრე დანარჩენი ნიმუშის სიხშირე, მაშინ რეჟიმი განისაზღვრება, როგორც ამ ორი მნიშვნელობის საშუალო.

თუ ორ ნიმუშს აქვს იგივე სიხშირე, რაც სხვა ნიმუშების სიხშირეზე მაღალია და ეს ელემენტები არ არის მიმდებარე, მაშინ ნათქვამია, რომ ამ ნიმუშში ორი რეჟიმია.

სტატისტიკური ანალიზის რეჟიმი გამოიყენება იმ სიტუაციებში, როდესაც საჭიროა ცენტრალური ტენდენციის საზომის სწრაფი შეფასება და არ არის საჭირო მაღალი სიზუსტე. მაგალითად, მოდა (ზომის ან ბრენდის თვალსაზრისით) მოსახერხებელია იმ ტანსაცმლისა და ფეხსაცმლის დასადგენად, რომელიც ყველაზე მოთხოვნადია მომხმარებლებში.

სკატერის (ცვალებადობის) ზომები- სტატისტიკური ინდიკატორების ჯგუფი, რომელიც ახასიათებს განსხვავებებს ნიმუშის ინდივიდუალურ მნიშვნელობებს შორის. დისპერსიული ზომების ინდიკატორებზე დაყრდნობით შესაძლებელია შეფასდეს ნიმუშის ელემენტების ჰომოგენურობისა და კომპაქტურობის ხარისხი. დისპერსიული ზომები ხასიათდება შემდეგი ინდიკატორებით:

1. გადაფურცვლა -ეს არის ინტერვალი დაკვირვების შედეგების მაქსიმალურ და მინიმალურ მნიშვნელობებს შორის (ნიმუშის ერთეულები). სვინგის ზომა მიუთითებს მნიშვნელობების გავრცელებას მონაცემთა პოპულაციაში. თუ დიაპაზონი დიდია, მაშინ აგრეგატში მნიშვნელობები ძალიან მიმოფანტულია, წინააღმდეგ შემთხვევაში (დიაპაზონი მცირეა) ამბობენ, რომ აგრეგატში არსებული მნიშვნელობები ერთმანეთთან ახლოსაა. დიაპაზონი განისაზღვრება ფორმულით (3.4).

(3.4)

სად - ნიმუშის მაქსიმალური ელემენტი;

არის მინიმალური ნიმუში ელემენტი.

2.საშუალო გადახრა- საშუალო არითმეტიკული სხვაობა (აბსოლუტურ მნიშვნელობაში) ნიმუშის თითოეულ მნიშვნელობასა და მის შერჩეულ საშუალოს შორის. საშუალო გადახრა განისაზღვრება ფორმულით (3.5).

(3.5)

სად - მენიმუშის ე ელემენტი;

ნიმუშის საშუალო მნიშვნელობა, გამოითვლება ფორმულით (3.1);

ელემენტების რაოდენობა ნიმუშში.

მოდული აუცილებელია იმის გამო, რომ გადახრები საშუალოდან თითოეული კონკრეტული ელემენტისთვის შეიძლება იყოს როგორც დადებითი, ასევე უარყოფითი. ამიტომ, თუ არ აიღებთ მოდულს, მაშინ ყველა გადახრის ჯამი ახლოს იქნება ნულთან და შეუძლებელი იქნება მონაცემთა ცვალებადობის ხარისხის შეფასება (მონაცემთა შეკრება ნიმუშის საშუალო ირგვლივ). სტატისტიკური ანალიზის ჩატარებისას, შერჩევის საშუალო ნაცვლად შეიძლება აიღოთ რეჟიმი და მედიანა.

3. დისპერსია- გაფანტვის საზომი, რომელიც აღწერს შედარებითი გადახრას მონაცემთა მნიშვნელობებსა და საშუალოს შორის. იგი გამოითვლება, როგორც თითოეული ნიმუშის ელემენტის გადახრების კვადრატების ჯამი საშუალოდან. შერჩევის ზომის მიხედვით, დისპერსიის შეფასება ხდება სხვადასხვა გზები:

დიდი ნიმუშებისთვის (n> 30) ფორმულით (3.6)

(3.6)

მცირე ნიმუშებისთვის (n<30) по формуле (3.7)

(3.7)

სადაც X i არის ნიმუშის i-ე ელემენტი;

S არის ნიმუშის საშუალო მნიშვნელობა;

ელემენტების რაოდენობა ნიმუშში;

(X i - S) არის გადახრა საშუალოდან მონაცემთა ნაკრების თითოეული მნიშვნელობისთვის.

4. Სტანდარტული გადახრა- საზომი, თუ რამდენად ფართოდ არის მიმოფანტული მონაცემთა წერტილები მათ საშუალოსთან მიმართებაში.

ინდივიდუალური გადახრების კვადრატის პროცესი დისპერსიის გამოთვლაში ზრდის შედეგად მიღებული გადახრის გადახრის ხარისხს საწყისი გადახრებისგან, რაც თავის მხრივ დამატებით შეცდომებს იწვევს. ამრიგად, მონაცემთა წერტილების გავრცელების შეფასების მიახლოების მიზნით მათ საშუალოსთან შედარებით საშუალო გადახრის მნიშვნელობამდე, კვადრატული ფესვი ამოღებულია დისპერსიიდან. დისპერსიის ამოღებული ფესვი ახასიათებს ცვალებადობის საზომს, რომელსაც ეწოდება ფესვის საშუალო კვადრატი ან სტანდარტული გადახრა (3.8).

(3.8)

ვთქვათ, თქვენ ხართ პროგრამული უზრუნველყოფის განვითარების პროექტის მენეჯერი. ხუთი პროგრამისტი გყავს დაქვემდებარებული. პროექტის შესრულების პროცესის მართვით, თქვენ ანაწილებთ დავალებებს პროგრამისტებს შორის. მაგალითის სიმარტივისთვის, ჩვენ გამოვალთ იქიდან, რომ ამოცანები ექვივალენტურია სირთულის და შესრულების დროში. თქვენ გადაწყვიტეთ გაანალიზოთ თითოეული პროგრამისტის მუშაობა (კვირის განმავლობაში შესრულებული დავალებების რაოდენობა) ბოლო 10 კვირის განმავლობაში, რის შედეგადაც მიიღეთ შემდეგი ნიმუშები:

კვირის სახელი

დასრულებული დავალებების საშუალო რაოდენობის შეფასების შემდეგ, თქვენ მიიღებთ შემდეგ შედეგს:

კვირის სახელი											ს
											22,3
											22,4
											22,2
											22,1
											22,5

S ინდიკატორის მიხედვით, ყველა პროგრამისტი მუშაობს საშუალოდ ერთნაირი ეფექტურობით (დაახლოებით 22 დავალება კვირაში). თუმცა, ცვალებადობის (დიაპაზონის) მაჩვენებელი ძალიან მაღალია (მეოთხე პროგრამისტის 5 დავალებიდან მეხუთესთვის 24 დავალებამდე).

კვირის სახელი	ს	პ
	22,3
	22,4
	22,2
	22,1
	22,5

მოდით შევაფასოთ სტანდარტული გადახრა, რომელიც გვიჩვენებს, თუ როგორ ნაწილდება ნიმუშებში მნიშვნელობები საშუალოსთან შედარებით, კერძოდ, ჩვენს შემთხვევაში, შეაფასეთ, რამდენად დიდია დავალებების გავრცელება კვირიდან კვირამდე.

კვირის სახელი	ს	პ	ᲘᲡᲔ
	22,3		1,56
	22,4		1,8
	22,2		2,84
	22,1		1,3
	22,5		5,3

სტანდარტული გადახრის შედეგად მიღებული შეფასება ამბობს შემდეგს (მოდით შევაფასოთ ორი უკიდურესი შემთხვევა 4 და 5 პროგრამისტი):

4 პროგრამისტის ნიმუშში თითოეული მნიშვნელობა საშუალოდ 1,3 ამოცანებით გადახრის საშუალო მნიშვნელობიდან.

პროგრამისტის 5 ნიმუშის თითოეული მნიშვნელობა საშუალოდ 5,3 ამოცანებით გადახრის საშუალო მნიშვნელობიდან.

რაც უფრო ახლოს არის სტანდარტული გადახრა 0-სთან, მით უფრო საიმედოა საშუალო, რადგან ეს მიუთითებს, რომ თითოეული ნიმუშის მნიშვნელობა თითქმის ტოლია საშუალოზე (ჩვენს მაგალითში ეს არის 22,5 ელემენტი). შესაბამისად, მე-4 პროგრამისტი მე-5-ისგან განსხვავებით ყველაზე თანმიმდევრულია. დავალებების შესრულების ცვალებადობა მე-5 პროგრამისტის კვირიდან კვირამდე არის 5.3 დავალება, რაც მიუთითებს მნიშვნელოვან გაფანტვაზე. მე-5 პროგრამისტის შემთხვევაში საშუალოს ვერ ენდობით და, შესაბამისად, რთულია მომავალი კვირის დასრულებული დავალების რაოდენობის პროგნოზირება, რაც თავის მხრივ ართულებს სამუშაო გრაფიკის დაგეგმვასა და დაცვას. რა მენეჯმენტის გადაწყვეტილებას მიიღებთ ამ კურსზე, შეუსაბამოა. მნიშვნელოვანია, რომ მიიღოთ შეფასება, რომლის საფუძველზეც შესაძლებელია მენეჯმენტის შესაბამისი გადაწყვეტილებების მიღება.

ამრიგად, შეიძლება გაკეთდეს ზოგადი დასკვნა, რომ საშუალო ყოველთვის არ აფასებს მონაცემებს სწორად. საშუალო შეფასების სისწორე შეიძლება შეფასდეს სტანდარტული გადახრის მნიშვნელობით.

1. Excel-ში სტატისტიკური მონაცემების დამუშავების ინსტრუმენტები

2. სპეციალური ფუნქციების გამოყენება

3. ANALYSIS PACKAGE ინსტრუმენტის გამოყენებით

ლიტერატურა:

მთავარი:

1. ბურკი. მონაცემთა ანალიზი Microsoft Excel-ის გამოყენებით. : პერ. ინგლისურიდან / Burke, Kenneth, Carey, Patrick. - მ.: გამომცემლობა "უილიამსი", 2005. - S. 216 - 256.

2. მიშინი ა.ვ. საინფორმაციო ტექნოლოგიები იურიდიულ საქმიანობაში: სახელოსნო / A.V. მიშინი. - M .: RAP, 2013 .-- S. 2-11.

დამატებითი:

3. ინფორმატიკა იურისტებისა და ეკონომისტებისთვის: სახელმძღვანელო უნივერსიტეტებისთვის / რედ. ს.ვ. სიმონოვიჩი. - SPb .: პეტრე, 2004 .-- S. 498-516.

პრაქტიკული გაკვეთილი ნომერი 30

თემა No11.1. მონაცემთა ბაზის შენარჩუნება Access DBMS-ში

გაკვეთილი ტარდება პროექტის მეთოდით.

პროექტის მიზანი: სასამართლოს მუშაობის შესახებ მონაცემთა ბაზის შემუშავება.

ტექნიკური დავალება:

1. შექმენით მონაცემთა ბაზის „სასამართლო“ ორი ცხრილიდან „მოსამართლეები“ და „საჩივრები“ შემდეგი სტრუქტურით, შესაბამისად:

მაგიდა "მოსამართლეები"

სფეროს სახელი	მოსამართლის კოდი	ᲡᲠᲣᲚᲘ ᲡᲐᲮᲔᲚᲘ	მიღების დღეები	სამუშაო საათები	Სამუშაო გამოცდილება
Მონაცემთა ტიპი	რიცხვითი	ტექსტი	ტექსტი	ტექსტი	რიცხვითი

ველის ზომა	გრძელი მთელი რიცხვი				გრძელი მთელი რიცხვი
ველის ფორმატი	ძირითადი				ძირითადი
ათწილადი ადგილები
ნაგულისხმევი მნიშვნელობა			"Ოთხ"	"15:00-17:00"
მდგომარეობა ღირებულებაზე	> 36200 და<36299		ორშაბათს ან სამ ან ოთხს ან ხუთ ან პარასკევს		> 0 და<40
შეცდომის შეტყობინება			მოქმედი მნიშვნელობებია ორშაბათი, სამშაბათი, ოთხშაბათი, ხუთ ან პარასკევი. გთხოვთ ხელახლა შედით!	!	მოქმედი მნიშვნელობებია 1-დან 39-მდე. ხელახლა შეიყვანეთ!
სავალდებულო სფერო	დიახ	დიახ	არა	არა	არა
ინდექსირებული ველი		არა	არა	არა	არა

Შენიშვნა. გამოაცხადეთ გასაღების ველი "მოსამართლე კოდი".

პრეტენზიების ცხრილი

სფეროს სახელი	Საქმის ნომერი	მოსარჩელე	პასუხი-ჩიკი	მოსამართლის კოდი	შეხვედრის თარიღი
Მონაცემთა ტიპი	რიცხვითი	ტექსტი	ტექსტი	რიცხვითი	თარიღის დრო
ველის თვისებები: ზოგადი ჩანართი
ველის ზომა	გრძელი მთელი რიცხვი			გრძელი მთელი რიცხვი	სრული თარიღის ფორმატი
ველის ფორმატი	ძირითადი
ათწილადი ადგილები
ნაგულისხმევი მნიშვნელობა
მდგომარეობა ღირებულებაზე	> 0 და<99999			> 36200 და<36299
შეცდომის შეტყობინება	არასწორი ჩანაწერი - გაიმეორეთ!			მოქმედი მნიშვნელობებია 36201-დან 36298-მდე. გთხოვთ, ხელახლა შეიყვანოთ!
სავალდებულო სფერო	დიახ	არა	არა	არა	არა
ინდექსირებული ველი	დიახ (შემთხვევა არ არის დაშვებული)	არა	არა	დიახ (შეხვედრები დაშვებულია)	არა

2. შეიყვანეთ შემდეგი მონაცემების ჩანაწერები მოსამართლეების ცხრილში:

შეიყვანეთ შემდეგი მონაცემების ჩანაწერები პრეტენზიების ცხრილში:

3. ველში „მოსამართლე კოდი“ დაადგინეთ ცხრილებს შორის ერთი-მრავალზე კავშირი მოსამართლეებიდა სარჩელები... ამის გაკეთებისას დააყენეთ „დარწმუნებული მონაცემთა მთლიანობა“ და „დაკავშირებული ველების კასკადური განახლება“.

ლიტერატურა:

მთავარი:

1. მიშინი ა.ვ. საინფორმაციო ტექნოლოგიები პროფესიულ საქმიანობაში: სახელმძღვანელო / A.V. მიშინი, ლ.ე. მისტროვი, დ.ვ. კარტავცევი. - M .: RAP, 2011 .-- S. 259-264.

დამატებითი:

პრაქტიკული გაკვეთილი ნომერი 31

თემა No11.2. Access DBMS-ში ფორმებისა და მოთხოვნების შექმნის პრინციპები

1. მონაცემთა შეყვანის შეყვანის ფორმების შემუშავება.

2. შეყვანილი მონაცემების გამოთვლისა და ანალიზის მეთოდოლოგია.

ლიტერატურა:

მთავარი:

1. მიშინი ა.ვ. საინფორმაციო ტექნოლოგიები პროფესიულ საქმიანობაში: სახელმძღვანელო / A.V. მიშინი, ლ.ე. მისტროვი, დ.ვ. კარტავცევი. - M .: RAP, 2011 .-- S. 265-271.

დამატებითი:

2. ინფორმატიკა და საინფორმაციო ტექნოლოგიები: სახელმძღვანელო უნივერსიტეტის სტუდენტებისთვის / ი.გ. ლესნიჩაია, ი.ვ. დაკარგული, იუ.დ. რომანოვი, ვ.ი. შესტაკოვი. - მე-2 გამოცემა. - M .: Eksmo, 2006 .-- 544გვ.

3. მიხეევა ე.ვ. საინფორმაციო ტექნოლოგიები პროფესიულ საქმიანობაში: სახელმძღვანელო საშუალო პროფესიული სასწავლებლების სტუდენტებისთვის / E.V. მიხეევა. - მე-2 გამოცემა, წაშლილია. - M .: აკადემია, 2005 .-- 384გვ.

თქვენი კარგი სამუშაოს გაგზავნა ცოდნის ბაზაში მარტივია. გამოიყენეთ ქვემოთ მოცემული ფორმა

სტუდენტები, კურსდამთავრებულები, ახალგაზრდა მეცნიერები, რომლებიც იყენებენ ცოდნის ბაზას სწავლასა და მუშაობაში, ძალიან მადლობლები იქნებიან თქვენი.

გამოქვეყნებულია http://www.allbest.ru/

სტატისტიკური მონაცემების დამუშავება

შესავალი

სტატისტიკური დისპერსიის შერჩევის კორელაცია

ექსპერიმენტის შედეგების სტატისტიკური დამუშავების მეთოდებია მათემატიკური ტექნიკა, ფორმულები, რაოდენობრივი გამოთვლების მეთოდები, რომელთა დახმარებით შესაძლებელია ექსპერიმენტის დროს მიღებული ინდიკატორების განზოგადება, სისტემაში მოყვანა, მათში დამალული კანონების გამოვლენა. საუბარია სტატისტიკური ხასიათის ისეთ კანონზომიერებებზე, რომლებიც არსებობს ექსპერიმენტში შესწავლილ ცვლადებს შორის.

მათემატიკური და სტატისტიკური ანალიზის ზოგიერთი მეთოდი საშუალებას იძლევა გამოთვალოს ეგრეთ წოდებული ელემენტარული მათემატიკური სტატისტიკა, რომელიც ახასიათებს მონაცემთა ნიმუშების განაწილებას, მაგალითად, ნიმუშის საშუალო, ნიმუშის დისპერსიას, მოდს, მედიანას და მრავალი სხვა. მათემატიკური სტატისტიკის სხვა მეთოდები, მაგალითად, დისპერსიული ანალიზი, რეგრესიული ანალიზი, შესაძლებელს ხდის განვსაჯოთ ნიმუშის ცალკეულ სტატისტიკაში ცვლილებების დინამიკაზე. მეთოდების მესამე ჯგუფის, ვთქვათ, კორელაციის ანალიზის, ფაქტორული ანალიზის, ნიმუშის მონაცემების შედარების მეთოდების დახმარებით, შეიძლება საიმედოდ ვიმსჯელოთ სტატისტიკური ურთიერთობების შესახებ, რომლებიც არსებობს ამ ექსპერიმენტში გამოკვლეულ ცვლადებს შორის.

1. ექსპერიმენტული შედეგების პირველადი სტატისტიკური დამუშავების მეთოდები

მათემატიკური და სტატისტიკური ანალიზის ყველა მეთოდი პირობითად იყოფა პირველად და მეორად. მეთოდებს, რომლებიც შეიძლება გამოყენებულ იქნას ინდიკატორების მისაღებად, რომლებიც პირდაპირ ასახავს ექსპერიმენტში ჩატარებული გაზომვების შედეგებს, ეწოდება პირველადი მეთოდები. შესაბამისად, პირველადი სტატისტიკური ინდიკატორები იგულისხმება ისინი, რომლებიც გამოიყენება თავად ფსიქოდიაგნოსტიკის მეთოდებში და არის ფსიქოდიაგნოსტიკის შედეგების საწყისი სტატისტიკური დამუშავების შედეგი. სტატისტიკური დამუშავების მეორად მეთოდებს უწოდებენ, რომელთა დახმარებით პირველადი მონაცემების საფუძველზე ვლინდება მათში დამალული სტატისტიკური შაბლონები.

სტატისტიკური დამუშავების პირველადი მეთოდები მოიცავს, მაგალითად, ნიმუშის საშუალო განსაზღვრას, ნიმუშის დისპერსიას, ნიმუშის რეჟიმს და ნიმუშის მედიანას. მეორადი მეთოდები ჩვეულებრივ მოიცავს კორელაციის ანალიზს, რეგრესიის ანალიზს, პირველადი სტატისტიკის შედარების მეთოდებს ორ ან მეტ ნიმუშში.

განვიხილოთ ელემენტარული მათემატიკური სტატისტიკის გამოთვლის მეთოდები.

1.1 მოდა

ნიმუშის რიცხვითი მახასიათებელი, რომელიც, როგორც წესი, არ საჭიროებს გამოთვლებს, არის ე.წ. მოდა არის შესწავლილი თვისების რაოდენობრივი მნიშვნელობა, რომელიც ყველაზე ხშირად გვხვდება ნიმუშში. სიმეტრიული მახასიათებლების განაწილებისთვის, მათ შორის ნორმალური განაწილებისთვის, რეჟიმის მნიშვნელობა ემთხვევა საშუალო და მედიანურ მნიშვნელობებს. სხვა ტიპის განაწილებისთვის, ასიმეტრიული, ეს არ არის ტიპიური. მაგალითად, 1, 2, 5, 2, 4, 2, 6, 7, 2 მნიშვნელობების თანმიმდევრობით, რეჟიმი არის მნიშვნელობა 2, რადგან ის უფრო ხშირად გვხვდება, ვიდრე სხვა მნიშვნელობები - ოთხჯერ.

მოდა გვხვდება შემდეგი წესების მიხედვით:

1) იმ შემთხვევაში, როდესაც ნიმუშში ყველა მნიშვნელობა ხდება თანაბრად ხშირად, ზოგადად მიღებულია, რომ ამ ნიმუშის სერიას არ აქვს რეჟიმი. მაგალითად: 5, 5, 6, 6, 7, 7 - ამ ნიმუშში მოდა არ არის.

2) როდესაც ორ მიმდებარე (მიმდებარე) მნიშვნელობას აქვს იგივე სიხშირე და მათი სიხშირე მეტია ნებისმიერი სხვა მნიშვნელობის სიხშირეზე, რეჟიმი გამოითვლება როგორც ამ ორი მნიშვნელობის საშუალო არითმეტიკული. მაგალითად, ნიმუშში 1, 2, 2, 2, 5, 5, 5, 6, მიმდებარე მნიშვნელობების სიხშირეები 2 და 5 ემთხვევა და უდრის 3. ეს სიხშირე მეტია სხვა მნიშვნელობების სიხშირეზე 1 და 6 (რომლისთვისაც ის უდრის 1-ს). ამიტომ, ამ სერიის რეჟიმი იქნება მნიშვნელობა = 3.5

3) თუ ნიმუშში ორ არამიმდებარე (არა მეზობელ) მნიშვნელობას აქვს თანაბარი სიხშირეები, რომლებიც აღემატება ნებისმიერი სხვა მნიშვნელობის სიხშირეებს, მაშინ გამოიყოფა ორი რეჟიმი. მაგალითად, 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 მწკრივში რეჟიმები არის 11 და 14. ამ შემთხვევაში, ნიმუში ნათქვამია, რომ ბიმოდალურია.

ასევე შეიძლება არსებობდეს ეგრეთ წოდებული მულტიმოდალური განაწილებები ორზე მეტი წვერით (რეჟიმები).

4) თუ რეჟიმი ფასდება დაჯგუფებული მონაცემების სიმრავლით, მაშინ რეჟიმის საპოვნელად აუცილებელია ფუნქციის ყველაზე მაღალი სიხშირის მქონე ჯგუფის დადგენა. ამ ჯგუფს ეწოდება მოდალური ჯგუფი.

1.2 მედიანა

მედიანა არის შესასწავლი მახასიათებლის მნიშვნელობა, რომელიც ყოფს ნიმუშს, დალაგებულია ამ მახასიათებლის მნიშვნელობით, შუაზე. მედიანის მარჯვნივ და მარცხნივ, ფუნქციების იგივე რაოდენობა რჩება შეკვეთილ სერიაში. მაგალითად, 2, 3, 4, 4, 5, 6, 8, 7, 9 ნიმუშისთვის, მედიანა იქნება 5, რადგან მარცხნივ და მარჯვნივ არის ოთხი ინდიკატორი. თუ სერია მოიცავს ლუწი რაოდენობის მახასიათებლებს, მაშინ მედიანა იქნება საშუალო აღებული, როგორც სერიის ორი ცენტრალური მნიშვნელობის მნიშვნელობების ნახევარი ჯამი. შემდეგი რიგისთვის 0, 1, 1, 2, 3, 4, 5, 5, 6, 7, მედიანა იქნება 3.5.

მედიანის ცოდნა სასარგებლოა იმის დასადგენად, არის თუ არა შესწავლილი ნიშან-თვისების კონკრეტული მნიშვნელობების განაწილება სიმეტრიული და ახლოს ე.წ ნორმალურ განაწილებასთან. ნორმალური განაწილების საშუალო და მედიანა ჩვეულებრივ ემთხვევა ან ძალიან ცოტა განსხვავდება ერთმანეთისგან. თუ მახასიათებლების ნიმუშის განაწილება ნორმალურია, მაშინ მასზე შეიძლება გამოყენებულ იქნას მეორადი სტატისტიკური გამოთვლების მეთოდები, რომლებიც დაფუძნებულია მონაცემთა ნორმალურ განაწილებაზე. წინააღმდეგ შემთხვევაში, ამის გაკეთება შეუძლებელია, რადგან სერიოზული შეცდომები შეიძლება შევიდეს გამოთვლებში.

1.3 ნიმუშის საშუალო

ნიმუშის საშუალო (საშუალო არითმეტიკული) მნიშვნელობა, როგორც სტატისტიკური მაჩვენებელი, არის ექსპერიმენტში შესწავლილი ფსიქოლოგიური ხარისხის საშუალო შეფასება. ეს შეფასება ახასიათებს მისი განვითარების ხარისხს მთლიანობაში იმ სუბიექტთა ჯგუფში, რომელიც ჩაუტარდა ფსიქოდიაგნოსტიკური გამოკვლევას. ორი ან მეტი ნიმუშის საშუალო მნიშვნელობების უშუალო შედარებით, ჩვენ შეგვიძლია ვიმსჯელოთ ამ ნიმუშების შემადგენელ ადამიანებში განვითარების შედარებით ხარისხზე, შეფასებულ ხარისხზე.

1.4 ნიმუშის გავრცელება

ნიმუშის გავრცელება (ზოგჯერ ამ მნიშვნელობას დიაპაზონს უწოდებენ) აღინიშნება ასო R-ით. ეს არის უმარტივესი მაჩვენებელი, რომელიც შეიძლება მიღებულ იქნას ნიმუშისთვის - განსხვავება მოცემული ვარიაციის სერიის მაქსიმალურ და მინიმალურ მნიშვნელობებს შორის. ე.ი

R = xmax - xmin

ნათელია, რომ რაც უფრო მეტად განსხვავდება გაზომილი მახასიათებელი, მით მეტია R-ის მნიშვნელობა და პირიქით. თუმცა, შეიძლება მოხდეს, რომ ორი ნიმუშის სერიისთვის, როგორც საშუალო, ასევე დიაპაზონი ერთნაირია, მაგრამ ამ სერიის ვარიაციის ბუნება განსხვავებული იქნება. მაგალითად, მოცემულია ორი ნიმუში:

X = 10 15 20 25 30 35 40 45 50 X = 30 R = 40

Y = 10 28 28 30 30 30 32 32 50 Y = 30 R = 40

ამ ორი სანიმუშო სერიის საშუალებისა და სპრედების თანაბარი მნიშვნელობით, მათი ვარიაციის ბუნება განსხვავებულია. იმისათვის, რომ უფრო ნათლად გავიგოთ ნიმუშების ცვალებადობის ბუნება, უნდა მივმართოთ მათ განაწილებას.

1.5 დისპერსია

ვარიაცია არის ცვლადის მნიშვნელობების მისი საშუალოდან გადახრების კვადრატების არითმეტიკული საშუალო.

ვარიაცია, როგორც სტატისტიკა, ახასიათებს, თუ რამდენად განსხვავდება კონკრეტული მნიშვნელობები მოცემულ ნიმუშში საშუალოდან. რაც უფრო დიდია განსხვავება, მით მეტია გადახრა ან გაფანტვა მონაცემებში.

კვადრატული ფესვი ამოღებულია კვადრატების ჯამიდან გაყოფილი სერიების ტერმინების რაოდენობაზე.

ზოგჯერ არის საკმაოდ ბევრი საწყისი კერძო პირველადი მონაცემები, რომლებიც ექვემდებარება სტატისტიკურ დამუშავებას და ისინი საჭიროებენ ელემენტარული არითმეტიკული ოპერაციების დიდ რაოდენობას. მათი რაოდენობის შესამცირებლად და ამავდროულად გამოთვლების საჭირო სიზუსტის შესანარჩუნებლად, ზოგჯერ მიმართავენ კონკრეტული ემპირიული მონაცემების ორიგინალური ნიმუშის ინტერვალებით შეცვლას. ინტერვალი არის მნიშვნელობის მიხედვით დახარისხებული დამახასიათებელი მნიშვნელობების ჯგუფი, რომელიც იცვლება გამოთვლის პროცესში საშუალო მნიშვნელობით.

2. ექსპერიმენტული შედეგების მეორადი სტატისტიკური დამუშავების მეთოდები

ექსპერიმენტული მონაცემების სტატისტიკური დამუშავების მეორადი მეთოდების დახმარებით ექსპერიმენტთან დაკავშირებული ჰიპოთეზები უშუალოდ მოწმდება, დასტურდება ან უარყოფილია. ეს მეთოდები, როგორც წესი, უფრო რთულია, ვიდრე პირველადი სტატისტიკური დამუშავების მეთოდები და მოითხოვს მკვლევარის კარგ მომზადებას ელემენტარული მათემატიკისა და სტატისტიკის დარგში. (7).

განხილული მეთოდების ჯგუფი შეიძლება დაიყოს რამდენიმე ქვეჯგუფად:

1. რეგრესიის გაანგარიშება.

2. სხვადასხვა ნიმუშებთან დაკავშირებული ორი ან მეტი ელემენტარული სტატისტიკის (საშუალებები, დისპერსიები და ა.შ.) შედარების მეთოდები.

3. ცვლადებს შორის სტატისტიკური კავშირის დამყარების მეთოდები, მაგალითად, მათი კორელაცია ერთმანეთთან.

4. ემპირიული მონაცემების შიდა სტატისტიკური სტრუქტურის იდენტიფიცირების მეთოდები (მაგალითად, ფაქტორული ანალიზი). განვიხილოთ მეორადი სტატისტიკური დამუშავების მეთოდების თითოეული შერჩეული ქვეჯგუფი მაგალითებით.

2.1 რეგრესიის გაანგარიშება

რეგრესიის გამოთვლა არის მათემატიკური სტატისტიკის მეთოდი, რომელიც საშუალებას გაძლევთ შეამციროთ პირადი, განსხვავებული მონაცემები გარკვეულ ხაზოვან დიაგრამამდე, დაახლოებით ასახავს მათ შიდა ურთიერთკავშირს და მიიღოთ შესაძლებლობა მიახლოებით შეაფასოთ სხვა ცვლადის სავარაუდო მნიშვნელობა ერთ-ერთის მნიშვნელობით. ცვლადები (7).

რეგრესიის განტოლების გრაფიკულ გამოხატულებას რეგრესიული ხაზი ეწოდება. რეგრესიის ხაზი გამოხატავს დამოკიდებული ცვლადის (Y) საუკეთესო პროგნოზებს დამოუკიდებელი ცვლადებისთვის (X).

რეგრესია გამოიხატება ორი რეგრესიის განტოლების გამოყენებით, რომლებიც ყველაზე პირდაპირ შემთხვევაში ჰგავს სწორხაზოვან განტოლებებს.

Y = a 0 + a 1 * X

X = b 0 + b 1 * Y

განტოლებაში (1) Y არის დამოკიდებული ცვლადი, X არის დამოუკიდებელი ცვლადი, a 0 არის კვეთა, a 1 არის რეგრესიის კოეფიციენტი ან დახრილობა, რომელიც განსაზღვრავს რეგრესიის ხაზის დახრილობას კოორდინატთა ღერძების მიმართ.

განტოლებაში (2) X არის დამოკიდებული ცვლადი, Y არის დამოუკიდებელი ცვლადი, b 0 არის კვეთა, b 1 არის რეგრესიის კოეფიციენტი, ან დახრილობა, რომელიც განსაზღვრავს რეგრესიის ხაზის დახრილობას კოორდინატთა ღერძების მიმართ.

X-სა და Y-ს (Y-სა და X-ს შორის) კავშირის (ურთიერთობის) რაოდენობრივ განსაზღვრას რეგრესიული ანალიზი ეწოდება. რეგრესიული ანალიზის მთავარი ამოცანაა მოძებნოს a 0, b 0, a1 და b 1 კოეფიციენტები და დადგინდეს X და Y ცვლადების დამაკავშირებელი მიღებული ანალიტიკური გამონათქვამების მნიშვნელოვნების დონე.

ხაზოვანი რეგრესიის ანალიზის მეთოდის გამოსაყენებლად შემდეგი პირობები უნდა დაკმაყოფილდეს:

1. შედარებული ცვლადები X და Y უნდა გაიზომოს ინტერვალების ან თანაფარდობების სკალაზე.

2. ვარაუდობენ, რომ X და Y ცვლადებს აქვთ ნორმალური განაწილება.

3. შედარებულ ცვლადებში განსხვავებული მახასიათებლების რაოდენობა უნდა იყოს იგივე. (5).

2.2 კორელაცია

მეორადი სტატისტიკური დამუშავების შემდეგ მეთოდს, რომლის მეშვეობითაც ირკვევა ექსპერიმენტული მონაცემების ორ სერიას შორის კავშირი ან პირდაპირი კავშირი, კორელაციების მეთოდს უწოდებენ. ის გვიჩვენებს, თუ როგორ მოქმედებს ერთი ფენომენი მეორეზე ან დაკავშირებულია მას დინამიკაში. ასეთი კავშირი არსებობს, მაგალითად, სიდიდეებს შორის, რომლებიც მიზეზობრივ კავშირში არიან ერთმანეთთან. თუ აღმოჩნდება, რომ ორი ფენომენი სტატისტიკურად საიმედოდ არის დაკავშირებული ერთმანეთთან და თუ ამავდროულად არის დარწმუნებული, რომ ერთ-ერთი მათგანი შეიძლება იყოს მეორე ფენომენის გამომწვევი მიზეზი, მაშინ ეს აუცილებლად გულისხმობს დასკვნას, რომ მათ შორის არსებობს მიზეზობრივი კავშირი. . (7)

როდესაც ერთი ცვლადის დონის ზრდას ახლავს მეორის დონის მატება, მაშინ ვსაუბრობთ დადებით კორელაციაზე. თუ ერთი ცვლადის ზრდა ხდება მეორის დონის შემცირებით, მაშინ საუბარია უარყოფით კორელაციაზე. ცვლადებს შორის კავშირის არარსებობის შემთხვევაში საქმე გვაქვს ნულოვანი კორელაციასთან. (ერთი)

ამ მეთოდის რამდენიმე ვარიაცია არსებობს: ხაზოვანი, რანჟირებული, დაწყვილებული და მრავალჯერადი. ხაზოვანი კორელაციის ანალიზი საშუალებას გაძლევთ დაამყაროთ პირდაპირი ურთიერთობები ცვლადებს შორის მათი აბსოლუტური მნიშვნელობებით. ეს კავშირები გრაფიკულად გამოიხატება როგორც სწორი ხაზი, აქედან მოდის სახელწოდება „წრფივი“. რანგის კორელაცია განსაზღვრავს დამოკიდებულებას არა ცვლადების აბსოლუტურ მნიშვნელობებს შორის, არამედ რიგით ადგილებს შორის, ან მათ მიერ დაკავებულ რიგებს შორის სიდიდის მიხედვით. წყვილთა კორელაციური ანალიზი მოიცავს კორელაციური დამოკიდებულების შესწავლას მხოლოდ ცვლადების წყვილებს შორის და მრავალჯერადი, ანუ მრავალვარიანტული - ერთდროულად მრავალ ცვლადს შორის. ფაქტორული ანალიზი არის მრავალვარიანტული კორელაციური ანალიზის ფართოდ გავრცელებული ფორმა გამოყენებითი სტატისტიკაში. (5)

რანგის კორელაციის კოეფიციენტი ფსიქოლოგიურ და პედაგოგიურ კვლევაში განიხილება იმ შემთხვევაში, როდესაც ნიშნები, რომელთა შორის დამოკიდებულება დგინდება, ხარისხობრივად განსხვავებულია და არ შეიძლება ზუსტად შეფასდეს ე.წ. ინტერვალის საზომი სკალის გამოყენებით. ინტერვალის სკალა ეწოდება სკალას, რომელიც საშუალებას აძლევს ადამიანს შეაფასოს მანძილი მის მნიშვნელობებს შორის და განსაჯოს, რომელი მათგანია უფრო დიდი და რამდენად მეტი მეორეზე. მაგალითად, სახაზავი, რომელიც გამოიყენება ობიექტების სიგრძის შესაფასებლად და შესადარებლად, არის ინტერვალის მასშტაბი, რადგან მისი გამოყენებით შეგვიძლია ვამტკიცოთ, რომ მანძილი ორ და ექვს სანტიმეტრს შორის ორჯერ მეტია, ვიდრე მანძილი ექვს და რვა სანტიმეტრს შორის. თუ რომელიმე საზომი ხელსაწყოს გამოყენებით შეგვიძლია მხოლოდ იმის მტკიცება, რომ ზოგიერთი ინდიკატორი სხვებზე მეტია, მაგრამ არ შეგვიძლია ვთქვათ რამდენით, მაშინ ასეთ საზომ ინსტრუმენტს ეწოდება არა ინტერვალი, არამედ რიგითი.

ინდიკატორების უმეტესობა, რომლებიც მიღებულია ფსიქოლოგიურ და პედაგოგიურ კვლევაში, ეხება რიგითი და არა ინტერვალის სკალებს (მაგალითად, შეფასებები, როგორიცაა "დიახ", "არა", "არა, ვიდრე დიახ" და სხვა, რომლებიც შეიძლება გადაკეთდეს ქულებად). , წრფივი კორელაციის კოეფიციენტი არ გამოიყენება მათზე.

მრავალგანზომილებიანი კორელაციის მეთოდი, წყვილური კორელაციის მეთოდისგან განსხვავებით, შესაძლებელს ხდის მრავალგანზომილებიან ექსპერიმენტულ მასალაში, ორზე მეტი ცვლადის ჩათვლით, არსებული კორელაციური დამოკიდებულებების ზოგადი სტრუქტურის გამოვლენას და ამ კორელაციური დამოკიდებულებების წარმოჩენას. გარკვეული სისტემა.

კონკრეტული კორელაციის კოეფიციენტის გამოსაყენებლად, შემდეგი პირობები უნდა დაკმაყოფილდეს:

1. შედარებული ცვლადები უნდა გაიზომოს ინტერვალების ან თანაფარდობების სკალაზე.

2. დაშვებულია, რომ ყველა ცვლადს აქვს ნორმალური განაწილება.

3. შედარებულ ცვლადებში განსხვავებული მახასიათებლების რაოდენობა უნდა იყოს იგივე.

4. პირსონის კორელაციის კოეფიციენტის სანდოობის დონის შესაფასებლად გამოიყენეთ ფორმულა (11.9) და კრიტიკული მნიშვნელობების ცხრილი სტუდენტის t-ტესტისთვის k = n - 2. (5)

2.3 ფაქტორული ანალიზი

ფაქტორული ანალიზი არის სტატისტიკური მეთოდი, რომელიც გამოიყენება ექსპერიმენტული მონაცემების დიდი მასივის დამუშავებისას. ფაქტორული ანალიზის ამოცანებია: ცვლადების რაოდენობის შემცირება (მონაცემთა შემცირება) და ცვლადებს შორის მიმართების სტრუქტურის განსაზღვრა, ე.ი. ცვლადების კლასიფიკაცია, ამიტომ ფაქტორული ანალიზი გამოიყენება როგორც მონაცემთა შემცირების მეთოდი ან როგორც სტრუქტურული კლასიფიკაციის მეთოდი.

მნიშვნელოვანი განსხვავება ფაქტორულ ანალიზსა და ზემოთ აღწერილ ყველა მეთოდს შორის არის ის, რომ მისი გამოყენება შეუძლებელია პირველადი, ან, როგორც ამბობენ, „ნედლი“ ექსპერიმენტული მონაცემების დასამუშავებლად, ე.ი. უშუალოდ საგნების გამოცდის შედეგად მიღებული. ფაქტორული ანალიზის მასალაა კორელაციური ბმულები, უფრო სწორად, პირსონის კორელაციის კოეფიციენტები, რომლებიც გამოითვლება კვლევაში შემავალ ცვლადებს (ანუ ფსიქოლოგიურ მახასიათებლებს) შორის. სხვა სიტყვებით რომ ვთქვათ, კორელაციური მატრიცები, ან, როგორც მათ სხვაგვარად უწოდებენ, ინტერკორელაციის მატრიცები, ექვემდებარება ფაქტორულ ანალიზს. ამ მატრიცებში სვეტების და სტრიქონების სახელები იგივეა, რადგან ისინი წარმოადგენენ ანალიზში ჩართული ცვლადების სიას. ამ მიზეზით, ურთიერთკორელაციური მატრიცები ყოველთვის კვადრატულია, ე.ი. მათში მწკრივების რაოდენობა უდრის სვეტების რაოდენობას და სიმეტრიული, ე.ი. მთავარ დიაგონალთან მიმართებაში სიმეტრიულ ადგილებში არის იგივე კორელაციის კოეფიციენტები.

ფაქტორული ანალიზის მთავარი კონცეფცია არის ფაქტორი. ეს არის ხელოვნური სტატისტიკური მაჩვენებელი, რომელიც წარმოიქმნება შესწავლილ ფსიქოლოგიურ მახასიათებლებს შორის კორელაციის კოეფიციენტების ცხრილის სპეციალური გარდაქმნების შედეგად, ანუ ურთიერთკორელაციის მატრიცას შორის. ურთიერთკორელაციის მატრიციდან ფაქტორების ამოღების პროცედურას ეწოდება მატრიცის ფაქტორიზაცია. ფაქტორიზაციის შედეგად კორელაციური მატრიციდან შეიძლება გამოიტანოს ფაქტორების განსხვავებული რაოდენობა, საწყისი ცვლადების რაოდენობის ტოლი რიცხვამდე. თუმცა, ფაქტორიზაციის შედეგად გამოვლენილი ფაქტორები, როგორც წესი, არათანაბარია მათი მნიშვნელობით. (5)

გამოვლენილი ფაქტორები ხსნის ფსიქოლოგიური ფენომენების ურთიერთდამოკიდებულებას. (7)

ყველაზე ხშირად ფაქტორული ანალიზის შედეგად დგინდება არა ერთი, არამედ რამდენიმე ფაქტორი, რომლებიც სხვადასხვა გზით ხსნის ცვლადების ურთიერთკორელაციის მატრიცას. ამ შემთხვევაში ფაქტორები იყოფა ზოგად, ზოგად და ინდივიდუალურ ფაქტორებად. ზოგად ფაქტორებს უწოდებენ ფაქტორებს, რომელთა ყველა ფაქტორული დატვირთვა მნიშვნელოვნად განსხვავდება ნულისაგან (ნულოვანი დატვირთვა მიუთითებს იმაზე, რომ ეს ცვლადი არანაირად არ არის დაკავშირებული დანარჩენებთან და არ ახდენს გავლენას მათზე ცხოვრებაში). საერთო ფაქტორები არის ფაქტორები, რომლებისთვისაც ზოგიერთი ფაქტორული დატვირთვა არ არის ნულოვანი. ერთჯერადი ფაქტორები არის ფაქტორები, რომლებშიც მხოლოდ ერთი დატვირთვა მნიშვნელოვნად განსხვავდება ნულიდან. (7)

ფაქტორული ანალიზი შეიძლება იყოს შესაბამისი, თუ დაკმაყოფილებულია შემდეგი კრიტერიუმები.

1. შეუძლებელია სახელების მასშტაბით მიღებული თვისებრივი მონაცემების ფაქტორიზირება, მაგალითად, თმის ფერი (შავი/ყავისფერი/წითელი) და ა.შ.

2. ყველა ცვლადი უნდა იყოს დამოუკიდებელი და მათი განაწილება ნორმალურთან ახლოს.

3. ცვლადებს შორის ურთიერთობა უნდა იყოს დაახლოებით წრფივი, ან თუნდაც არ ჰქონდეს აშკარად მრუდი ხასიათი.

4. ორიგინალური კორელაციის მატრიცას უნდა ჰქონდეს რამდენიმე კორელაცია აბსოლუტური მნიშვნელობით 0.3-ზე მეტი. წინააღმდეგ შემთხვევაში, მატრიციდან რაიმე ფაქტორების ამოღება საკმაოდ რთულია.

5. საგნების ნიმუში უნდა იყოს საკმარისად დიდი. ექსპერტების რჩევა განსხვავებულია. ყველაზე მკაცრი თვალსაზრისი გირჩევთ არ გამოიყენოთ ფაქტორული ანალიზი, თუ სუბიექტების რაოდენობა 100-ზე ნაკლებია, რადგან კორელაციის სტანდარტული შეცდომები ამ შემთხვევაში ძალიან დიდი იქნება.

თუმცა, თუ ფაქტორები კარგად არის განსაზღვრული (მაგალითად, დატვირთვით 0,7 და არა 0,3), ექსპერიმენტატორს სჭირდება უფრო მცირე ნიმუში მათი იზოლირებისთვის. გარდა ამისა, თუ ცნობილია, რომ მიღებული მონაცემები უაღრესად სანდოა (მაგალითად, გამოიყენება მოქმედი ტესტები), მაშინ მონაცემები შეიძლება გაანალიზდეს სუბიექტების უფრო მცირე რაოდენობაზე. (5).

2.4 დაფაქტორული ანალიზის გამოყენებით

ფაქტორული ანალიზი ფართოდ გამოიყენება ფსიქოლოგიაში სხვადასხვა მიმართულებით, რომელიც დაკავშირებულია როგორც თეორიული, ასევე პრაქტიკული პრობლემების გადაწყვეტასთან.

თეორიული თვალსაზრისით, ფაქტორული ანალიზის გამოყენება დაკავშირებულია პიროვნების სტრუქტურის, ტემპერამენტისა და შესაძლებლობების შესწავლის ე.წ. ფაქტორ-ანალიტიკური მიდგომის შემუშავებასთან. ამ სფეროებში ფაქტორული ანალიზის გამოყენება ემყარება ფართოდ მიღებულ დაშვებას, რომ დაკვირვებადი და უშუალოდ გაზომვადი ინდიკატორები არის უფრო ზოგადი მახასიათებლების მხოლოდ ირიბი და/ან ნაწილობრივი გარეგანი გამოვლინებები. ეს მახასიათებლები, პირველისგან განსხვავებით, არის ფარული, ეგრეთ წოდებული ლატენტური ცვლადები, რადგან ეს არის ცნებები ან კონსტრუქტები, რომლებიც მიუწვდომელია პირდაპირი გაზომვისთვის. თუმცა, მათი დადგენა შესაძლებელია დაკვირვებულ მახასიათებლებს შორის კორელაციებისა და ფაქტორების იდენტიფიცირებით, რომლებიც (იმ პირობით, რომ სტრუქტურა კარგია) შეიძლება განიმარტოს, როგორც სასურველი ლატენტური ცვლადის სტატისტიკური გამოხატულება.

მიუხედავად იმისა, რომ ფაქტორები ბუნებით წმინდა მათემატიკურია, ისინი წარმოადგენენ ფარულ ცვლადებს (თეორიულად პოსტულირებული კონსტრუქციები ან ცნებები), შესაბამისად, ფაქტორების სახელები ხშირად ასახავს შესასწავლი ჰიპოთეტური კონსტრუქციის არსს.

ამჟამად ფაქტორული ანალიზი ფართოდ გამოიყენება დიფერენციალურ ფსიქოლოგიასა და ფსიქოდიაგნოსტიკაში. მისი დახმარებით შეგიძლიათ შეიმუშაოთ ტესტები, დაამყაროთ კავშირების სტრუქტურა ინდივიდუალურ ფსიქოლოგიურ მახასიათებლებს შორის, რომლებიც იზომება ტესტების კომპლექტით ან ტესტის საგნებით.

ფაქტორული ანალიზი ასევე გამოიყენება ტესტის მეთოდების სტანდარტიზებისთვის, რომელიც ტარდება სუბიექტების წარმომადგენლობით ნიმუშზე.

დასკვნა

თუ ექსპერიმენტში მიღებული მონაცემები ხარისხობრივი ხასიათისაა, მაშინ მათი დასკვნების საფუძველზე გამოტანილი დასკვნების სისწორე მთლიანად დამოკიდებულია მკვლევარის ინტუიციაზე, ერუდიციასა და პროფესიონალიზმზე, ასევე მისი მსჯელობის ლოგიკაზე. თუ ეს მონაცემები რაოდენობრივი ტიპისაა, მაშინ ჯერ პირველად ახორციელებენ, შემდეგ კი მეორად სტატისტიკურ დამუშავებას. პირველადი სტატისტიკური დამუშავება შედგება ელემენტარული მათემატიკური სტატისტიკის საჭირო რაოდენობის განსაზღვრაში. ასეთი დამუშავება თითქმის ყოველთვის გულისხმობს არანაკლებ ნიმუშის საშუალო განსაზღვრას. იმ შემთხვევებში, როდესაც ფარდობითი საშუალო მონაცემების გავრცელება არის შემოთავაზებული ჰიპოთეზების ექსპერიმენტული გადამოწმების ინფორმაციული მაჩვენებელი, გამოითვლება ვარიაცია ან სტანდარტული გადახრა. რეკომენდირებულია მედიანის მნიშვნელობის გამოთვლა, როდესაც უნდა გამოვიყენოთ მეორადი სტატისტიკური დამუშავების მეთოდები, რომლებიც გამოითვლება ნორმალურ განაწილებაზე. ნიმუშის მონაცემების ამ სახის განაწილებისთვის მედიანა, ისევე როგორც რეჟიმი, ემთხვევა ან საკმარისად ახლოსაა. საშუალო მნიშვნელობამდე. ეს კრიტერიუმი შეიძლება გამოყენებულ იქნას პირველადი მონაცემების შედეგად მიღებული განაწილების ბუნების უხეშად შესაფასებლად.

მეორადი სტატისტიკური დამუშავება (საშუალოების შედარება, განსხვავებები, მონაცემთა განაწილება, რეგრესული ანალიზი, კორელაციური ანალიზი, ფაქტორული ანალიზი და ა. პირველად ექსპერიმენტულ მონაცემებში. მეორადი სტატისტიკური დამუშავების დაწყებისას მკვლევარმა ჯერ უნდა გადაწყვიტოს, სხვადასხვა მეორადი სტატისტიკიდან რომელი უნდა გამოიყენოს პირველადი ექსპერიმენტული მონაცემების დასამუშავებლად. გადაწყვეტილება მიიღება შესამოწმებელი ჰიპოთეზის ხასიათისა და ექსპერიმენტის შედეგად მიღებული პირველადი მასალის ბუნების გათვალისწინებით. აქ არის რამდენიმე რეკომენდაცია ამ კუთხით.

რეკომენდაცია 1. თუ ექსპერიმენტული ჰიპოთეზა შეიცავს ვარაუდს, რომ ფსიქოლოგიური და პედაგოგიური კვლევის შედეგად ნებისმიერი ხარისხის მაჩვენებლები გაიზრდება (ან შემცირდება), მაშინ რეკომენდებულია სტუდენტის კრიტერიუმის ან ch2 კრიტერიუმის გამოყენება წინასწარი შედარებისთვის. - და პოსტექსპერიმენტული მონაცემები. ეს უკანასკნელი მოიხსენიება, თუ პირველადი ექსპერიმენტული მონაცემები ფარდობითია და გამოხატულია, მაგალითად, პროცენტულად.

რეკომენდაცია 2. თუ ექსპერიმენტულად შემოწმებული ჰიპოთეზა შეიცავს დებულებას ზოგიერთ ცვლადს შორის მიზეზობრივი კავშირის შესახებ, მაშინ მიზანშეწონილია მისი შემოწმება წრფივი ან რანგის კორელაციის კოეფიციენტების მითითებით. ხაზოვანი კორელაცია გამოიყენება მაშინ, როდესაც დამოუკიდებელი და დამოკიდებული ცვლადები იზომება ინტერვალის სკალის გამოყენებით და ამ ცვლადებში ცვლილებები ექსპერიმენტამდე და მის შემდეგ მცირეა. რანგის კორელაცია მოიხსენიება, როდესაც საკმარისია თანმიმდევრობის რიგის ცვლილებების შეფასება დამოუკიდებელი და დამოკიდებული ცვლადების სიდიდის მიხედვით, ან როდესაც მათი ცვლილებები საკმარისად დიდია, ან როცა საზომი ინსტრუმენტი იყო რიგითი და არა ინტერვალი.

რეკომენდაცია 3. ზოგჯერ ჰიპოთეზა მოიცავს ვარაუდს, რომ ექსპერიმენტის შედეგად სუბიექტებს შორის ინდივიდუალური განსხვავებები გაიზრდება ან შემცირდება. ეს ვარაუდი კარგად არის დამოწმებული ფიშერის ტესტის გამოყენებით, რომელიც საშუალებას აძლევს ადამიანს შეადაროს დისპერსიები ექსპერიმენტამდე და მის შემდეგ. გაითვალისწინეთ, რომ ფიშერის კრიტერიუმის გამოყენებით, შეიძლება მუშაობა მხოლოდ ინდიკატორების აბსოლუტური მნიშვნელობებით, მაგრამ არა მათი წოდებებით.

გამოქვეყნებულია Allbest.ru-ზე

...

მსგავსი დოკუმენტები

სტატისტიკური მონაცემების დამუშავებისა და ანალიზის ძირითადი ტექნიკა და მეთოდები. არითმეტიკული, ჰარმონიული და გეომეტრიული საშუალო მნიშვნელობების გამოთვლა. განაწილების სერიები, მათი ძირითადი მახასიათებლები. გასწორების ტექნიკა დინამიკასთან ახლოს. ეროვნული ანგარიშების სისტემა.

ნაშრომი დამატებულია 24.10.2014

ეკონომიკური ანალიზის, როგორც მეცნიერების ცნება, მისი არსი, საგანი, მეთოდების ზოგადი მახასიათებლები და სოციალურ-ეკონომიკური ეფექტურობა. ანალიზისა და მონაცემთა დამუშავების ეკონომეტრიული მეთოდების ძირითადი ჯგუფები. საწარმოს ეკონომიკური მონაცემების ფაქტორული ანალიზი.

რეზიუმე, დამატებულია 03/04/2010

ნიმუშის საშუალო არითმეტიკული, განსხვავება, სტანდარტული გადახრა. უარი შოვინის კრიტერიუმის მიხედვით. სამი სიგმის წესი. ორი ნიმუშის საშუალო მნიშვნელობებს შორის სხვაობის მნიშვნელოვნების შეფასება. დაწყვილებული, მრავალჯერადი რეგრესიის ანალიზი. სრული ფაქტორული ანალიზი.

ნაშრომი დამატებულია 12/05/2012

სტატისტიკური მონაცემების წარმოდგენისა და დამუშავების სხვადასხვა მეთოდის გამოყენება. სივრცითი სტატისტიკური ნიმუშები. წყვილთა რეგრესია და კორელაცია. დროის სერიები. ტენდენციის აგება. მათი ამოხსნის პრაქტიკული მაგალითები და მეთოდები, ფორმულები და მათი მნიშვნელობა.

სალექციო კურსი, დამატებულია 26.02.2009წ

გაზომვის შედეგების სტატისტიკური დამუშავება; საშუალო არითმეტიკული, კვადრატული, დისპერსიული. შერჩევის პარამეტრების განსაზღვრა: სამი სიგმის კანონი, ჰისტოგრამა, საკონტროლო სქემები, იშიკავას დიაგრამა. დივანების წარმოებაში ხარისხიანი ხელსაწყოების გამოყენება.

საკურსო ნაშრომი დამატებულია 17.10.2014

საშუალო ღირებულება სტატისტიკაში, მისი არსი და გამოყენების პირობები. საშუალოების ტიპები და ფორმები: ატრიბუტი-წონის არსებობით, გამოთვლის ფორმით, პოპულაციის დაფარვით. მოდა, მედიანა. მოგების და მომგებიანობის დინამიკის სტატისტიკური შესწავლა OJSC "Bashmebel"-ის მაგალითზე.

ტესტი, დამატებულია 06/14/2008

სტატისტიკური მონაცემების დამუშავების პრინციპები, ამ პროცესში გამოყენებული მეთოდები და ტექნიკა. საკონტროლო სქემების აგების მეთოდოლოგია და ძირითადი ეტაპები, მათი კლასიფიკაცია და ტიპები, ფუნქციური მახასიათებლები, გამოყენების დადებითი და უარყოფითი მხარეების იდენტიფიცირება.

საკურსო ნაშრომი, დამატებულია 23.08.2014

რიცხვითი მახასიათებლების გამოთვლა და ნიმუშების დაკვირვების შედეგების დამუშავება. ეკონომიკაში სტატისტიკური მაჩვენებლების გაანგარიშება და ანალიზი. ეროვნული სიმდიდრე: ელემენტები, შეფასება; აქტივებისა და ვალდებულებების ბალანსი; ძირითადი საშუალებები, საბრუნავი კაპიტალის მაჩვენებლები.

ნაშრომი, დამატებულია 25.12.2012

აღწერითი სტატისტიკა და სტატისტიკური დასკვნა. შერჩევის მეთოდები იმის უზრუნველსაყოფად, რომ ნიმუში არის წარმომადგენლობითი. ნიმუშის ტიპის გავლენა შეცდომის სიდიდეზე. ამოცანები შერჩევის მეთოდის გამოყენებისას. დაკვირვების მონაცემების გავრცელება ზოგად მოსახლეობაში.

ტესტი, დამატებულია 02/27/2011

ცნების გამჟღავნება: ინტერვალის სკალა, საშუალო არითმეტიკული, სტატისტიკური მნიშვნელოვნების დონე. როგორ განვსაზღვროთ მოდა, მედიანა და საშუალო. პრობლემის გადაჭრა ფრიდმენის, როზენბაუმის კრიტერიუმის გამოყენებით. სპრიმენის კორელაციის კოეფიციენტის გამოთვლა.

საუბარია სტატისტიკური ხასიათის ისეთ კანონზომიერებებზე, რომლებიც არსებობს ექსპერიმენტში შესწავლილ ცვლადებს შორის.

მონაცემები არის ძირითადი ელემენტები, რომლებიც უნდა იყოს კლასიფიცირებული ან დასამუშავებლად 26.

მათემატიკური და სტატისტიკური ანალიზის ზოგიერთი მეთოდი საშუალებას იძლევა გამოვთვალოთ ეგრეთ წოდებული ელემენტარული მათემატიკური სტატისტიკა, რომელიც ახასიათებს მონაცემთა ნიმუშების განაწილებას, მაგალითად:

ნიმუშის საშუალო,

ნიმუშის ვარიაცია,

მედიანი და რიგი სხვა.

მათემატიკური სტატისტიკის სხვა მეთოდები შესაძლებელს ხდის ვიმსჯელოთ ნიმუშის ცალკეულ სტატისტიკაში ცვლილებების დინამიკაზე, მაგალითად:

დისპერსიის ანალიზი,

Რეგრესიული ანალიზი.

ნიმუშის მონაცემების მესამე ჯგუფის მეთოდების დახმარებით, შეიძლება საიმედოდ ვიმსჯელოთ სტატისტიკური ურთიერთობების შესახებ, რომლებიც არსებობს ამ ექსპერიმენტში გამოკვლეულ ცვლადებს შორის:

კორელაციური ანალიზი;

ფაქტორული ანალიზი;

შედარების მეთოდები.

მათემატიკური და სტატისტიკური ანალიზის ყველა მეთოდი პირობითად იყოფა პირველად და მეორად 27.

მეთოდებს, რომლებიც შეიძლება გამოყენებულ იქნას ინდიკატორების მისაღებად, რომლებიც პირდაპირ ასახავს ექსპერიმენტში ჩატარებული გაზომვების შედეგებს, ეწოდება პირველადი მეთოდები.

სტატისტიკური დამუშავების მეორად მეთოდებს უწოდებენ, რომელთა დახმარებით პირველადი მონაცემების საფუძველზე ვლინდება მათში დამალული სტატისტიკური შაბლონები.

სტატისტიკური დამუშავების ძირითადი მეთოდები მოიცავს, მაგალითად:

ნიმუშის საშუალო განსაზღვრა;

შერჩევითი ვარიაცია;

შერჩევითი მოდა;

ნიმუშის მედიანა.

მეორადი მეთოდები ჩვეულებრივ მოიცავს:

კორელაციური ანალიზი;

Რეგრესიული ანალიზი;

ორი ან მეტი ნიმუშის პირველადი სტატისტიკის შედარების მეთოდები.

მოდით განვიხილოთ ელემენტარული მათემატიკური სტატისტიკის გამოთვლის მეთოდები, დაწყებული ნიმუშის საშუალოდან.

Საშუალო არითმეტიკული - ეს არის ყველა მონაცემთა მნიშვნელობის ჯამის თანაფარდობა 28 ტერმინების რაოდენობასთან.

საშუალო მნიშვნელობა, როგორც სტატისტიკური მაჩვენებელი, არის ექსპერიმენტში შესწავლილი ფსიქოლოგიური ხარისხის საშუალო შეფასება.

ეს შეფასება ახასიათებს მისი განვითარების ხარისხს მთლიანობაში იმ სუბიექტთა ჯგუფში, რომელიც ჩაუტარდა ფსიქოდიაგნოსტიკური გამოკვლევას. ორი ან მეტი ნიმუშის საშუალო მნიშვნელობების უშუალო შედარებით, ჩვენ შეგვიძლია ვიმსჯელოთ ამ ნიმუშების შემადგენელ ადამიანებში განვითარების შედარებით ხარისხზე, შეფასებულ ხარისხზე.

ნიმუშის საშუალო მაჩვენებელი განისაზღვრება შემდეგი ფორმულით 29:

სადაც x cf არის ნიმუშის საშუალო ან არითმეტიკული საშუალო;

n - სუბიექტების რაოდენობა ნიმუშში ან კერძო ფსიქოდიაგნოსტიკური ინდიკატორების მიხედვით, რის საფუძველზეც გამოითვლება საშუალო მნიშვნელობა;

x k - ინდიკატორების კონკრეტული მნიშვნელობები ცალკეული საგნებისთვის. სულ არის n ასეთი ინდიკატორი, ამიტომ ამ ცვლადის k ინდექსი იღებს მნიშვნელობებს 1-დან n-მდე;

∑ - მიღებულია მათემატიკაში იმ ცვლადების მნიშვნელობების შეჯამების ნიშანი, რომლებიც მდებარეობს ამ ნიშნის მარჯვნივ.

დისპერსია არის მონაცემთა დისპერსიის საზომი საშუალო 30-ის გარშემო.

რაც უფრო დიდია განსხვავება, მით მეტია გადახრა ან გაფანტვა მონაცემებში. იგი განისაზღვრება იმისთვის, რომ შეძლოთ ერთმანეთისგან განასხვავოთ მნიშვნელობები, რომლებსაც აქვთ იგივე საშუალო, მაგრამ განსხვავებული გაფანტვა.

განსხვავება განისაზღვრება შემდეგი ფორმულით:

სად არის ნიმუშის ვარიაცია, ან უბრალოდ დისპერსია;

გამოთქმა, რომელიც ნიშნავს, რომ ყველა x k-სთვის მოცემულ ნიმუშში პირველიდან ბოლომდე, აუცილებელია გამოვთვალოთ განსხვავება კონკრეტულ და საშუალო სიდიდეებს შორის, ამ განსხვავებების კვადრატში და ჯამი;

n არის სუბიექტების რაოდენობა ნიმუშში ან პირველადი მნიშვნელობებით, რომლებისთვისაც გამოითვლება განსხვავება.

მედიანური ეწოდება შესასწავლი ნიშან-თვისების მნიშვნელობა, რომელიც ყოფს ნიმუშს მოცემული ნიშან-თვისების მნიშვნელობის მიხედვით ორად.

თუ მახასიათებლების ნიმუშის განაწილება ნორმალურია, მაშინ მასზე შეიძლება გამოყენებულ იქნას მეორადი სტატისტიკური გამოთვლების მეთოდები, რომლებიც დაფუძნებულია მონაცემთა ნორმალურ განაწილებაზე. წინააღმდეგ შემთხვევაში, ამის გაკეთება შეუძლებელია, რადგან სერიოზული შეცდომები შეიძლება შევიდეს გამოთვლებში.

მოდა კიდევ ერთი ელემენტარული მათემატიკური სტატისტიკა და ექსპერიმენტული მონაცემების განაწილების მახასიათებლები. მოდა არის შესწავლილი თვისების რაოდენობრივი მნიშვნელობა, რომელიც ყველაზე ხშირად გვხვდება ნიმუშში.

სიმეტრიული მახასიათებლების განაწილებისთვის, მათ შორის ნორმალური განაწილებისთვის, რეჟიმის მნიშვნელობები ემთხვევა საშუალო და მედიანურ მნიშვნელობებს. სხვა ტიპის განაწილებისთვის, ასიმეტრიული, ეს არ არის ტიპიური.

მეორადი სტატისტიკური დამუშავების მეთოდი, რომლის მეშვეობითაც ირკვევა ექსპერიმენტული მონაცემების ორ სერიას შორის კავშირი ან პირდაპირი კავშირი, ე.წ. კორელაციის ანალიზის მეთოდი. ის გვიჩვენებს, თუ როგორ მოქმედებს ერთი ფენომენი მეორეზე ან დაკავშირებულია მას დინამიკაში. ასეთი კავშირი არსებობს, მაგალითად, სიდიდეებს შორის, რომლებიც მიზეზობრივ კავშირში არიან ერთმანეთთან. თუ აღმოჩნდება, რომ ორი ფენომენი სტატისტიკურად საიმედოდ არის დაკავშირებული ერთმანეთთან და თუ ამავდროულად არის დარწმუნებული, რომ ერთ-ერთი მათგანი შეიძლება იყოს მეორე ფენომენის გამომწვევი მიზეზი, მაშინ ეს აუცილებლად გულისხმობს დასკვნას, რომ მათ შორის არსებობს მიზეზობრივი კავშირი. .

ამ მეთოდის რამდენიმე ვარიაციაა:

ხაზოვანი კორელაციის ანალიზი საშუალებას გაძლევთ დაამყაროთ პირდაპირი ურთიერთობები ცვლადებს შორის მათი აბსოლუტური მნიშვნელობებით. ეს კავშირები გრაფიკულად გამოიხატება როგორც სწორი ხაზი, აქედან მოდის სახელწოდება „წრფივი“.

წრფივი კორელაციის კოეფიციენტი განისაზღვრება შემდეგი ფორმულით 31:

სადაც r xy - წრფივი კორელაციის კოეფიციენტი;

x, y -შედარებული მნიშვნელობების საშუალო ნიმუშის მნიშვნელობები;

X მე , ზე მე - შედარებული მნიშვნელობების ნაწილობრივი ნიმუშის მნიშვნელობები;

P -ინდიკატორების შედარებით სერიების მნიშვნელობების საერთო რაოდენობა;

დისპერსია, შედარებული მნიშვნელობების გადახრები საშუალო მნიშვნელობებისგან.

რანგის კორელაცია განსაზღვრავს დამოკიდებულებას არა ცვლადების აბსოლუტურ მნიშვნელობებს შორის, არამედ რიგით ადგილებს შორის, ან მათ მიერ დაკავებულ რიგებს შორის სიდიდის მიხედვით. რანგის კორელაციის კოეფიციენტის ფორმულა არის 32:

სადაც R s არის Spearman რანგის კორელაციის კოეფიციენტი;

დ მე - განსხვავება ერთი და იგივე საგნების ინდიკატორთა რიგებს შორის მოწესრიგებულ რიგებში;

P -საგნების ან ციფრული მონაცემების (წოდებების) რაოდენობა კორელაციური სერიაში.

ატიუშევა ანა

ნაშრომში მე-7 კლასის მოსწავლეთა პროგრესის შესახებ მონაცემების დამუშავების მაგალითის გამოყენებით განიხილება ძირითადი სტატისტიკური მახასიათებლები, ტარდება სტატისტიკური მონაცემების შეგროვება და დაჯგუფება, ნათლად არის წარმოდგენილი სტატისტიკური ინფორმაცია და მიღებული მონაცემების ანალიზი. განახორციელა.

ნამუშევარი შეიცავს თანმხლებ პრეზენტაციას.

ჩამოტვირთვა:

გადახედვა:

მუნიციპალური ავტონომიური საგანმანათლებლო დაწესებულება „გიმნაზია No24“

XXII სამეცნიერო კონფერენცია MAGNI

სტატისტიკური მონაცემების დამუშავება

MAOU "გიმნაზია No24" ატიუშევა ანა

კონსულტანტი: მათემატიკის მასწავლებელი

შჩეტინინა ნატალია სერგეევნა

მაგადანი, 2016 წ

შესავალი …………………………………………………………………………………………………… 3

სტატისტიკური მონაცემების დამუშავებისას გამოყენებული ძირითადი ცნებები ………………………… .5
კვლევის ნაწილი ………………………………………………………………………………………………. ..... 7

2.1 მე-7 „ბ“ კლასის მოსწავლეთა პროგრესის შესახებ მონაცემების სტატისტიკური დამუშავება …………………… ..7

2.2 მონაცემთა ვიზუალური წარმოდგენა ჰისტოგრამების გამოყენებით …………………………………………………………………………………………………………………………………………………………………………………………………………

2.3. მოსწავლეთა საგანმანათლებლო საქმიანობის შედარებითი მახასიათებლები I და II კვარტლის შედეგების მიხედვით ................................ ................................ 21

2.4. მე-7 „B“ კლასის მოსწავლეთა კითხვარი გამოკითხვის ანალიზი ბავშვების წინსვლაზე მშობელთა კონტროლისთვის ............................. ................................ 23

დასკვნა ……………………………………………………………………………………………… 27

ლიტერატურა ………………………………………………………………………………………………… 28

შესავალი

ნებისმიერ ჩვენგანს, წიგნის ან გაზეთის გახსნას, ტელევიზორის ჩართვას ან რკინიგზის სადგურამდე მისულს, მუდმივად აწყდება ინფორმაციის წარდგენის ცხრილის ფორმას. ეს არის გაკვეთილების განრიგი, მატარებლის განრიგი, გამრავლების ცხრილი და მრავალი სხვა. ყველა ინფორმაცია წარმოდგენილია დიაგრამების ან გრაფიკების სახით.

თქვენ უნდა შეძლოთ ასეთი ინფორმაციის დამუშავება და ანალიზი. მონაცემთა დამუშავების, მოვლენების შედარების გარეშე შეუძლებელია კონკრეტული პრობლემის განვითარებაზე მიკვლევა.

ალგებრის კურსში შევისწავლეთ სტატისტიკური მახასიათებლები, რომლებიც ფართოდ გამოიყენება სხვადასხვა კვლევებში. მაინტერესებდა შესწავლილი მახასიათებლების პრაქტიკული გამოყენება და მონაცემების დამუშავების შესაძლებლობა ისე, რომ წარმოდგენილი ინფორმაცია მკაფიოდ განსაზღვრავდა კონკრეტული პრობლემის განვითარების კურსს და, შედეგად, მისი გადაჭრის შედეგს. ასეთ პრობლემად გადავწყვიტე განვიხილო ჩემი კლასის საქმიანობა წლის პირველი ნახევრის კვარტალებში.

ობიექტის კვლევის არეალი- ალგებრა

კვლევის ობიექტი- სტატისტიკური მახასიათებლები

შესწავლის საგანი- 7 „ბ“ კლასის მოსწავლის აკადემიური მოსწრება პირველი ნახევრის კვარტალებში

ჰიპოთეზა: ჩვენ გვჯერა, რომ მონაცემთა დამუშავების მაგალითის გამოყენებით 7B კლასის მოსწავლეების მუშაობის შესახებ, ჩვენ არა მხოლოდ გავეცნობით ძირითად სტატისტიკურ მახასიათებლებს, არამედ თავად ვისწავლით:

სტატისტიკური მონაცემების შეგროვება და დაჯგუფება;
სტატისტიკური ინფორმაციის ვიზუალურად წარმოდგენა;
გაანალიზეთ მიღებული მონაცემები.

სამიზნე: ისწავლეთ არსებული ინფორმაციის დამუშავება, ანალიზი და ვიზუალიზაცია.

Დავალებები:

სტატისტიკური მახასიათებლების შესწავლა;
შეაგროვოს ინფორმაცია მე-7 კლასში მოსწავლეთა მოსწრების შესახებ კვარტალებში

წლის პირველი ნახევარი;

ინფორმაციის დამუშავება;
განახორციელოს ინფორმაციის ვიზუალური პრეზენტაცია ჰისტოგრამების გამოყენებით;
მიღებული მონაცემების გაანალიზება, შესაბამისი დასკვნების გამოტანა.

სტატისტიკური მონაცემების დამუშავებისას გამოყენებული ძირითადი ცნებები

სტატისტიკა არის მეცნიერება, რომელიც ეხება რაოდენობრივი მონაცემების მოპოვებას, დამუშავებას და ანალიზს ბუნებასა და საზოგადოებაში მომხდარ სხვადასხვა მასობრივ მოვლენებზე. სიტყვა "სტატისტიკა" მომდინარეობს ლათინური სიტყვიდან "status", რაც ნიშნავს "სახელმწიფოს, მდგომარეობას".

უმარტივესი სტატისტიკური მახასიათებლებია საშუალო არითმეტიკული, მედიანა, დიაპაზონი, რეჟიმი.

Საშუალო არითმეტიკულირიცხვთა სერიას ეწოდება ამ რიცხვების ჯამის წევრთა რაოდენობაზე გაყოფის კოეფიციენტი. ჩვეულებრივ, საშუალო არითმეტიკული პოვნა ხდება მაშინ, როდესაც მათ სურთ დაადგინონ საშუალო მნიშვნელობა გარკვეული სერიის მონაცემებისთვის: ხორბლის საშუალო მოსავალი 1 ჰექტარიდან რეგიონში, ერთი სამუშაო ჯგუფის საშუალო გამომუშავება ცვლაში, სერტიფიკატის საშუალო ქულა. ამ ათწლეულის შუადღისას ჰაერის საშუალო ტემპერატურა და ა.შ.
მედიანური კენტი რაოდენობის წევრების მქონე რიცხვების დალაგებულ სერიას ეწოდება შუაში ჩაწერილი რიცხვი, ხოლო ლუწი წევრების მქონე რიცხვების რიგის მედიანას ეწოდება შუაში ჩაწერილი ორი რიცხვის საშუალო არითმეტიკული. გაითვალისწინეთ, რომ რიცხვების სერიებთან მუშაობა უფრო მოსახერხებელი და სწრაფია, თუ ის შეკვეთილია, ე.ი. მწკრივი, რომელშიც ყოველი მომდევნო რიცხვი არ არის ნაკლები (ან არა მეტი) ვიდრე წინა.
მოდა რიცხვების სერიას უწოდებენ რიცხვს, რომელიც ყველაზე ხშირად გვხვდება მოცემულ სერიაში. ზოგიერთ რიცხვს შეიძლება ჰქონდეს ერთზე მეტი მოდიფიკაცია ან საერთოდ არ იყოს მოდიფიკაცია. მონაცემთა სერიის რეჟიმი ჩვეულებრივ გვხვდება, როდესაც ვინმეს სურს რაიმე ტიპიური ინდიკატორის იდენტიფიცირება. გაითვალისწინეთ, რომ რიცხვების სერიის საშუალო არითმეტიკული შეიძლება არ ემთხვეოდეს არცერთ ამ რიცხვს და რეჟიმი, თუ ის არსებობს, აუცილებლად უნდა ემთხვეოდეს სერიის ორ ან მეტ რიცხვს. გარდა ამისა, საშუალო არითმეტიკისგან განსხვავებით, ცნება "რეჟიმი" ეხება არა მხოლოდ ციფრულ მონაცემებს.
წმენდაში რიცხვების სერია არის განსხვავება ამ რიცხვებს შორის ყველაზე დიდსა და უმცირესს შორის. სერიების დიაპაზონი გვხვდება, როდესაც მათ სურთ დაადგინონ, რამდენად დიდია მონაცემთა გავრცელება სერიაში.

მოდით ვაჩვენოთ თითოეული მახასიათებლის განმარტება რიცხვების სერიის მაგალითის გამოყენებით: 47,46,52,47,52,47,52,49,45,43,53,53,47,52.

Საშუალო არითმეტიკული 48,7.

გვხვდება ასე: ვადგენთ რიცხვთა ჯამს და ვყოფთ მათ რიცხვზე.

(47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7.

მედიანური რიცხვების ამ სერიის რიცხვი იქნება 48.

ის ასე გვხვდება: ჩვენ ვუკვეთავთ რიცხვების სერიას, ვირჩევთ ერთს, რომელიც შუაშია. თუ რიცხვების რაოდენობა ლუწია, მაშინ რიცხვთა მწკრივის შუაში ვპოულობთ ორის საშუალო არითმეტიკულს.

43,45,46,47,47,47, 47,49 ,52,52,52,52,53,53

(47+49):2=48

მოდა რიცხვების ამ სერიის რიცხვები იქნება 47 და 52 ... ეს რიცხვები ყველაზე ხშირად მეორდება.

47 ,46, 52 , 47 , 52 , 47 , 52 ,49,45,43,53,53, 47 , 52 .

წმენდაში რიცხვების ამ სერიის იქნება 10.

ის ასე მოიძებნება: აირჩიე უდიდესი და უმცირესი რიცხვი სერიაში და იპოვე განსხვავება ამ რიცხვებს შორის.

47,46,52,47,52,47,52,49,45, 43, 53 ,53,47,52

53-43=10

კვლევის ნაწილი

მე-7 „ბ“ კლასის მოსწავლეთა მოსწრების შესახებ მონაცემების სტატისტიკური დამუშავება.

გადავიდეთ ინფორმაციის დამუშავებაზე. მოდით შევადგინოთ ცხრილები თითოეული საგნისთვის, რომელიც შედგება სამი სტრიქონისგან, პირველი შეიცავს მონაცემთა სერიას. ამ სერიიდან თითოეული ვარიანტი რეალურად დაფიქსირდა ნიმუშში რამდენჯერმე. ამ რიცხვს ეწოდება ვარიანტების სიმრავლე. ასე რომ, მეორე სტრიქონში ჩავსვათ შესაბამისი ვარიანტის სიმრავლე. მოდით მივიღოთ ნიმუშის განაწილების ცხრილი.

თუ ყველა სიმრავლეს დავუმატებთ, მაშინ მივიღებთ შერჩევის დროს ჩატარებული ყველა გაზომვის რაოდენობას - ნიმუშის ზომას (ჩვენს შემთხვევაში ეს რიცხვია 24, რაც შეესაბამება კლასში მოსწავლეთა რაოდენობას).

მესამე სტრიქონში პროცენტულად გამოხატულ თანაფარდობას ეწოდება ოფციონის სიხშირე.

სიხშირის პარამეტრები =

ზოგადად, თუ კვლევის შედეგების მიხედვით შედგენილია ფარდობითი სიხშირეების ცხრილი, მაშინ ფარდობითი სიხშირეების ჯამი უდრის 100%-ს.

მე მეოთხედი

Რუსული ენა.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4. ,4,4, 4.5.

საშუალო ნიშანი თემაში:(საშუალო).

სიხშირის განაწილების ცხრილი

ვარიანტი
სიმრავლის ვარიანტები	არა
სიხშირე%		58.3%	37.5%	4.2%

ლიტერატურა.

დავალაგოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4. ,5,5,5 , 5.5.

საშუალო ნიშანი თემაში:(საშუალო).

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		37.5%	41.7%	20.8%

Ალგებრა.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4. ,4,4,4, 5.5.

საშუალო ნიშანი თემაში:(საშუალო).

საგანში ყველაზე მეტი მოსწავლეა „4, 3“ (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		45.8%	45.8%	8.3%

ამბავი.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4. ,4,4,4, 4.5

საშუალო ნიშანი თემაში:(საშუალო).

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		45.8%	4.2%

სოციალური მეცნიერება.

დავალაგოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4. ,5,5,5 , 5.5

საშუალო ნიშანი თემაში:(საშუალო).

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		37.5%	41.7%	20.8%

გეოგრაფია.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5,5,5.5 ,5

საშუალო ნიშანი თემაში:(საშუალო).

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		20.8%	41.7%	37.5%

ფიზიკა.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4. ,4,4,4, 4.5

საშუალო ნიშანი თემაში:(საშუალო).

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		37.5%	58.3%	4.2%

ბიოლოგია.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5,5 ,5,5,5,5 ,5

საშუალო ნიშანი თემაში:(საშუალო).

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		45.8%	29.2%

სიცოცხლის უსაფრთხოების საფუძვლები.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 4,4,4,4,4,4.4.5,5,5,5,5,5,5,5,5,5,5,5,5,5,5. ,5,5,5 ,5

საშუალო ნიშანი თემაში:(საშუალო).

შეფასების ვარიანტები
სიმრავლე	არა	არა
სიხშირე%			29.2%	70.8%

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5.5,5,5.5,5. ,5,5

საშუალო ნიშანი თემაში:(საშუალო).

საგანში ყველაზე მეტი მოსწავლეა "5" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 5 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		4.2%	37.5%	58.3%

Ინგლისური ენა.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4. ,5,5,5,5 ,5

საშუალო ნიშანი თემაში:(საშუალო).

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		37.5%	41.7%	20.8%

ინფორმატიკა.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,4,4,4,4.4,4,4,4,4,4,4,4,5,5,5,5.5.5,5,5. ,5,5

საშუალო ნიშანი თემაში:(საშუალო).

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		4.2%	54.2%	41.7%

ტექნიკა.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,5,55,5 ,5,5,5,5

საშუალო ნიშანი თემაში:(საშუალო).

საგანში ყველაზე მეტი მოსწავლეა "5" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4,5 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		20.8%	54.2%

ახლა შევაგროვოთ მსგავსი ინფორმაცია მეორე კვარტლის შედეგებზე.

Რუსული ენა.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3.3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4. ,4,4,4,4

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა			არა
სიხშირე%		41.7%	58.3%

ლიტერატურა.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,5 ,5,5,5 , 5.5

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "3" (მოდა)

რუსულენოვანი სტუდენტების დაახლოებით ნახევარი სწავლობს მე-3 კლასს (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		41.7%	33.3%

Ალგებრა.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4. ,4,4,5 , 5.5

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "3" (მოდა)

რუსულენოვანი სტუდენტების დაახლოებით ნახევარი სწავლობს მე-3 კლასს (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		37.5%	12.5%

ამბავი.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,3,3,3,4.4,4,4,4,4,4,4,4,4,4,4. ,4,4,4,5

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		37.5%	58.3%	4.2%

Საზოგადოება.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4. ,4,4,5 , 5.5

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		16.7%	70.8%	12.5%

გეოგრაფია.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5 ,5,5,5 , 5.5

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		12.5%	58.3%	29.2%

ფიზიკა.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4. ,44,5,5 ,5

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		33.3%	16.7%	12.5%

ბიოლოგია.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,4,4,4,4,4,4,4.4,4,4,4,4,4,4,4,4,5,5 ,5,5,5 ,5

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		12.5%	62.5%

სიცოცხლის უსაფრთხოების საფუძვლები.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5. ,5,5,5 ,5

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "5" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 5 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		4.2%	8.3%	87.5%

სამშობლოს ისტორია და საზოგადოება.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5. ,5,5,5 , 5.5

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		12.5%	45.8%	41.7%

Ინგლისური ენა.

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		20.8%	29.2%

ინფორმატიკა.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5 ,5,5,5 , 5.5

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "4" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		20.8%	29.2%

ტექნიკა.

დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5. ,5,5,5 , 5.5

საშუალო ნიშანი თემაში:(საშუალო)

საგანში ყველაზე მეტი მოსწავლეა "5" (მოდა)

რუსულ ენაზე სტუდენტების დაახლოებით ნახევარი სწავლობს 4 (მედიანა)

შეფასების ვარიანტები
სიმრავლე	არა
სიხშირე%		4.2%	29.2%	66.7%

მონაცემთა ვიზუალიზაცია ჰისტოგრამებით

სტატისტიკური კვლევის შედეგად მიღებული მონაცემების ვიზუალური წარმოდგენისთვის ფართოდ გამოიყენება მათი წარმოდგენის სხვადასხვა მეთოდი.

ჩვენ გამოვიყენებთ ჰისტოგრამებს მონაცემთა სიცხადისთვის. ჰისტოგრამა არის საფეხურიანი ფორმა, რომელიც შედგება დახურული მართკუთხედებისგან. თითოეული მართკუთხედის საფუძველი უდრის ინტერვალის სიგრძეს, ხოლო სიმაღლე უდრის ვარიანტის სიმრავლის ან ფარდობითი სიხშირის. ამრიგად, ჰისტოგრამაში, ჩვეულებრივი სვეტოვანი დიაგრამისგან განსხვავებით, მართკუთხედის საფუძვლები არ არის არჩეული თვითნებურად, მაგრამ მკაცრად განისაზღვრება ინტერვალის სიგრძით.

მოსწავლეთა მუშაობის შედარებითი მახასიათებლები პირველი კვარტლის საგნებში

მეორე კვარტალის საგნებში მოსწავლეთა მოსწრების შედარებითი მახასიათებლები

დასკვნები

პირველი კვარტლის შედეგების მიხედვით, ნათლად ჩანს, რომ მოსწავლეებს ყველაზე რთულად უმკლავდებიან ისეთ საგნებს, როგორიცაა: რუსული ენა და ალგებრა, საგნები, რომლებშიც „სამი“ არის შეფასება, რომელიც პრიორიტეტულია სხვა ნიშნებთან მიმართებაში. ეს ნიშნავს, რომ ამ საგნებში ხარისხი უფრო დაბალია, ვიდრე სხვებში.

ასევე ნათელია, რომ ტრიპლეტების მაღალი დონე ისეთ საგნებში, როგორიცაა ლიტერატურა, ისტორია, საზოგადოება, ფიზიკა, ინგლისური. ასევე სამწუხაროა, რომ გვაქვს სამეული ისეთ საგნებში, როგორიცაა ტექნოლოგია, ბიოლოგია, გეოგრაფია.

მეორე კვარტლის შედეგების მიხედვით, საგრძნობლად შემცირდა სამეულებისა და ხუთეულების რაოდენობა, ანუ მოსწავლეებმა თავიანთი ძალები ყველა საგანში გაანაწილეს და არა ცალკე სასურველის მიხედვით.

პირველი კვარტალის საგნებში საშუალო ქულის განაწილების ჰისტოგრამა

მეორე კვარტალის საგნებში საშუალო ქულის განაწილების ჰისტოგრამა

დასკვნა

ამ დიაგრამების შესაქმნელად ჩვენ გამოვიყენეთ ისეთი სტატისტიკური მახასიათებელი, როგორიცაა საშუალო არითმეტიკული. ნათლად ჩანს, რომ მეორე კვარტალში რუსული ენის, მშობლიური მიწის ისტორიისა და საზოგადოების, კომპიუტერული მეცნიერების ცოდნა გაუარესდა. გაუმჯობესდა ისტორიაში, საზოგადოებაში, ფიზიკაში, ბიოლოგიაში, სიცოცხლის უსაფრთხოებაში, ინგლისურ ენაში. მაგრამ ამავე დროს, დიაგრამები აჩვენებს, რომ უფრო მნიშვნელოვანი ცვლილებები უკეთესობისკენ მოხდა მხოლოდ ფიზიკასა და ინგლისურ ენაში.

მოსწავლეთა საგანმანათლებლო საქმიანობის შედარებითი მახასიათებლები პირველი და მეორე კვარტლის შედეგების მიხედვით

პირველი კვარტალის საგნებში ცოდნის ხარისხის ჰისტოგრამა

მეორე კვარტალის საგნებში ცოდნის ხარისხის ჰისტოგრამა

ორივე ჰისტოგრამის ერთში გაერთიანებით, ბევრად უფრო ადვილია კლასის შესრულების სურათის დანახვა შედარებით. და ინდივიდუალურად უფრო ადვილია იმის დანახვა, თუ რომელი საგნების ხარისხი უფრო მაღალია. მაგალითად, პირველ კვარტალში ხარისხი 60%-ზე ნაკლებია საგნებში - ალგებრა, რუსული, ისტორია, მეორეში - რუსული, ლიტერატურა, ალგებრა, ფიზიკა. უკვე გასაგებია, რომ მოსწავლეებისთვის ყველაზე რთული რუსული ენა, ალგებრაა. და ხარისხის პროცენტული მაჩვენებელი ყველა საგანში დიდად არ განსხვავდება 66% - პირველი კვარტალი, 68% - მეორე. ანუ საგნებში ნახტომი ხარისხი, რომელიც აშკარად ჩანს შედარების დიაგრამაზე, ვარაუდობს, რომ სტუდენტები განსაკუთრებით არ ცდილობენ ცოდნის დონის გაუმჯობესებას და არ იკავებენ თავიანთ პოზიციებს ამა თუ იმ საგნობრივ სფეროში.

დიაგრამა, რომელიც ადარებს ყველა ელემენტს ხარისხის მიხედვით პირველი და მე-2 კვარტლისთვის

მეორე კვარტალში საგრძნობლად გაიზარდა კარგი და წარჩინებული სტუდენტების რაოდენობა რუსულ ენაში, საზოგადოებაში, ბიოლოგიაში, ინგლისურში და ტექნოლოგიაში. მცირედით შემცირდა რიცხვი ლიტერატურაში, ალგებრაში, სიცოცხლის უსაფრთხოებაში, IORK-სა და კომპიუტერულ მეცნიერებებში. და ჩანს ფიზიკის ხარისხის მკვეთრი ვარდნა, რაც დაკავშირებულია სტუდენტების გაკვეთილებისთვის მოუმზადებლობასთან.

და ისევ მივდივართ დასკვნამდე, რომ ბავშვები სწავლობენ "ნახტომებით და საზღვრებით" და არ არსებობს განსაკუთრებული პრეფერენციები განათლების მიმართულებით (ჰუმანიტარული საგნები, ფიზიკა და მათემატიკა, ბუნებრივი ციკლის საგნები).

7 „B“ კლასის მოსწავლის ანკეტური გამოკითხვის ანალიზი თემაზე „მშობლის კონტროლი ბავშვების წინსვლაზე“.

ზემოაღნიშნული კვლევის შედეგებზე დაყრდნობით, გადავწყვიტეთ ჩაგვეტარებინა გამოკითხვა მე-7 „B“ კლასის მოსწავლეებს შორის ბავშვების სწავლებაზე მშობელთა კონტროლისთვის (კითხრები, იხ. დანართი)

ნიმუშის ზომაა 22 ადამიანი.

მშობლები ამოწმებენ საშინაო დავალებას

დასკვნა

სტუდენტების თითქმის მეოთხედი აღნიშნულ საკითხს მშობლის კონტროლის გარეშე ეკიდება, რაც, რა თქმა უნდა, გავლენას ახდენს მათ აკადემიურ მოსწრებაზე.

საშინაო დავალების შემოწმების რაოდენობა კვირაში

მედიანა = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7,7 = (3 + 3 ): 2 = 3

საშუალო არითმეტიკული = 3

დასკვნა

საშუალოდ, დავალება კვირაში სამჯერ შემოწმდება. სწავლის შეუწყვეტლობის გათვალისწინებით, ეს საკმარისი არ არის.

მედიანა = 0,0,0,0,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,5,5,6, 7, 7.7 = (2 + 2): 2 = 2

საშუალო არითმეტიკული = 3 (საშუალოდ, დღიურებს მშობლები ამოწმებენ კვირაში 3-ჯერ)

დროის რაოდენობა, რომელსაც სტუდენტები უთმობენ საშინაო დავალების შესრულებას

ვარიანტები	1-ზე ნაკლები
სიხშირე%

Swing R = x (მაქს) - x (წთ) = 3.5 - 0.5 = 3 საათი

(ახასიათებს დაკვირვებული მნიშვნელობების გაფანტვის სიდიდეს, ე.ი. აჩვენებს განსხვავებას ყველაზე ხანგრძლივ და უმოკლეს დროებს შორის)

რეჟიმი M (0) = 2,5 საათი ( აჩვენებს მნიშვნელობას, რომელიც უფრო ხშირად ხდება ვიდრე სხვები, ე.ი. აჩვენებს იმ დროს, რომელსაც სტუდენტები ატარებენ ყველაზე ხშირად)

მოსწავლეთა საშინაო დავალებაზე დახარჯული დროის ჰისტოგრამა

დასკვნა

საშუალოდ, საშინაო დავალებას დღეში 2,5 საათი სჭირდება. რაც ნორმალურ მაჩვენებლად ითვლება მოსწავლეთა ასაკისთვის.

დასკვნა

გაწეული სამუშაოს შედეგად ვისწავლე არსებული ინფორმაციის დამუშავება და ანალიზი

სტატისტიკური მახასიათებლების ცოდნა დამეხმარა GPA-ის დადგენაში სხვადასხვა საგანში, ასევე მოდასა და ფარგლებს შესრულების იმ ინდიკატორებში, სადაც მათი დადგენა შეუძლებელი ჩანდა. მონაცემთა დამუშავების, მოვლენების შედარების გარეშე შეუძლებელია კონკრეტული პრობლემის განვითარებაზე მიკვლევა. ჩვენ ვცდილობდით არა მხოლოდ თვალყური ადევნოთ წარმოშობილ პრობლემას - საგნებში ცოდნის ხარისხისა და აკადემიური მოსწრების დაქვეითებას, არამედ დაგვედგინა მიზეზი, რომელიც, ჩვენი აზრით, მდგომარეობდა მშობლის არასაკმარისი კონტროლი აკადემიურ მოსწრებაზე. მათი შვილების. კითხვარულმა გამოკითხვამ და აკადემიური მოსწრების შედეგებმა აჩვენა, რომ მე-7 „B“ კლასის მოსწავლეებს არ გააჩნიათ სწავლაზე თვითკონტროლის საკმარისი უნარი, მშობლები კი საპირისპიროს თვლიან.

შესრულებული სამუშაო, ვფიქრობ, გამოადგება როგორც კლასის მასწავლებელს მშობლებთან მუშაობისას, ასევე ჩემს კლასელებს, რომ მომავალში ცალკეულ საგნებში შედეგები გააუმჯობესონ.

სტატისტიკა არის მეცნიერება, რომელიც სწავლობს, ამუშავებს და აანალიზებს რაოდენობრივ მონაცემებს ცხოვრების მრავალფეროვან მასობრივ ფენომენებზე. მისი მახასიათებლები ჩვენთვის მხოლოდ ცოტათი გავამჟღავნეთ და წინ კიდევ ბევრი უცნობი და საინტერესო გველოდება.

ბიბლიოგრაფია:

http://www.nado5.ru/e-book/naibolshii-obzchii-delitel
გადახედვა:
პრეზენტაციების წინასწარი გადახედვის გამოსაყენებლად, შექმენით Google ანგარიში (ანგარიში) და შედით მასში: https://accounts.google.com

სლაიდის წარწერები:
სტატისტიკური მონაცემების დამუშავება მოამზადა: MAOU „24 გიმნაზიის“ მე-7 კლასი „ბ“ მოსწავლე ანა ატიუშევა კონსულტანტი: მათემატიკის მასწავლებელი ნატალია სერგეევნა შჩეტინინა.
მიზანი: ვისწავლოთ არსებული ინფორმაციის დამუშავება, ანალიზი და ვიზუალიზაცია. მიზნები: სტატისტიკური მახასიათებლების შესწავლა; შეაგროვოს ინფორმაცია მე-7 კლასის მოსწავლეთა პროგრესის შესახებ წლის პირველი ნახევრის კვარტალებში; ინფორმაციის დამუშავება; განახორციელოს ინფორმაციის ვიზუალური პრეზენტაცია ჰისტოგრამების გამოყენებით; მიღებული მონაცემების გაანალიზება, შესაბამისი დასკვნების გამოტანა.
ჰიპოთეზა სტუდენტის მუშაობის შესახებ მონაცემების დამუშავების მაგალითის გამოყენებით, თქვენ შეგიძლიათ არა მხოლოდ გაეცნოთ ძირითად სტატისტიკურ მახასიათებლებს, არამედ ისწავლოთ სტატისტიკური მონაცემების შეგროვება და დაჯგუფება; სტატისტიკური ინფორმაციის ვიზუალურად წარმოდგენა; გაანალიზეთ მიღებული მონაცემები.
სტატისტიკა არის მეცნიერება, რომელიც ეხება რაოდენობრივი მონაცემების მოპოვებას, დამუშავებას და ანალიზს ბუნებასა და საზოგადოებაში მომხდარ სხვადასხვა მასობრივ მოვლენებზე. სიტყვა "სტატისტიკა" მომდინარეობს ლათინური სიტყვიდან "status", რაც ნიშნავს "სახელმწიფოს, მდგომარეობას". უმარტივესი სტატისტიკური მახასიათებლები: საშუალო არითმეტიკული შუალედის რეჟიმი
თითოეული მახასიათებლის განსაზღვრა რიცხვების სერიის მაგალითის გამოყენებით: 47,46,52,47,52,47,52,49,45,43,53,53,47,52. რიცხვების ამ სერიის საშუალო არითმეტიკული იქნება რიცხვი 48.7. (47 + 46 + 52 + 47 + 52 + 47 + 52 + 49 + 45 + 43 + 53 + 53 + 47 + 52): 14 = 48,7. რიცხვების ამ სერიის მედიანა იქნება რიცხვი 48.43,45,46,47,47,47, 47, 49, 52,52,52,52,53,53 (47 + 49): 2 = 48 რეჟიმი რიცხვების ეს სერია იქნება 47 და 52 რიცხვები. 47, 46, 52, 47, 52, 47, 52, 49,45,43,53,53, 47, 52. რიცხვების ამ სერიის დიაპაზონი იქნება 10. 49.45, 43, 53, 53.47.52 53- 43 = 10
პრობლემები აკადემიურ მოსწრებასთან დაკავშირებით 7 კლასში "B"
ვარიანტი 2 3 4 5 სიხშირის მაჩვენებელი ვარიანტების გარეშე 14 9 1 სიხშირე% 0% 58.3% 37.5% 4.2% რუსული ენა. დავახარისხოთ ნიმუშის მონაცემები (ნიშნები): 3,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4. ,4,4, 4.5. საშუალო ქულა საგანში: 14 ∙ 3 + 9 ∙ 4 + 5 ∙ 124 = 8324≈3.5 (საშუალო არითმეტიკული). საგანში სტუდენტების ყველაზე დიდი რაოდენობაა "3" (მოდა) რუსულ ენაში სტუდენტების დაახლოებით ნახევარი სწავლობს 3-ზე (მედიანა)
სტატისტიკური კვლევის შედეგად მიღებული მონაცემების ვიზუალური წარმოდგენისთვის ფართოდ გამოიყენება მათი წარმოდგენის სხვადასხვა მეთოდი.
მოსწავლეთა მუშაობის შედარებითი მახასიათებლები პირველი კვარტალის საგნებში
მეორე კვარტალის საგნებში მოსწავლეთა მუშაობის შედარებითი მახასიათებლები
I და II კვარტლის საგნებში საშუალო ქულების განაწილების ჰისტოგრამა
I და II კვარტლის ხარისხის მიხედვით ყველა საგნის შედარების სქემა
კითხვარი მე-7 „ბ“ კლასის მოსწავლეებს შორის ბავშვების აღზრდაზე მშობელთა კონტროლის საკითხზე კითხვარი 1. ამოწმებენ თუ არა თქვენი მშობლები საშინაო დავალებას? _________________________________________________________________ 2. კვირაში რამდენჯერ? _________________________________________________________________ 3. კვირაში რამდენჯერ უყურებენ მშობლები შენს დღიურს? _________________________________________________________________ 4. დღეში საშუალოდ რამდენ დროს უთმობთ საშინაო დავალებას? _________________________________________________________________
მშობლები ამოწმებენ საშინაო დავალებას
საშინაო დავალების შემოწმების რაოდენობა კვირაში მედიანა = 0.0.0.0.0.0.1.1.2.2.3.3.3.3.4.4.5.7.7.7.7, 7 = (3 + 3): 2 = 3 საშუალო არითმეტიკული = 3
მოსწავლეთა საშინაო დავალებაზე დახარჯული დროის ჰისტოგრამა