სპირმენის, კენდალის, ფეხნერის წოდებების კორელაციური კოეფიციენტები. კენდალის და კენდალის წოდების კორელაციის კოეფიციენტები სპირმენისა და კენდალის წოდების კორელაციის კოეფიციენტები

იგი გამოიყენება რაოდენობრივ ან ხარისხობრივ ინდიკატორებს შორის კავშირის დასადგენად, თუ შესაძლებელია მათი რანჟირება. X ინდიკატორის მნიშვნელობები დაყენებულია ზრდადი თანმიმდევრობით და ენიჭება წოდებები. Y ინდექსის მნიშვნელობები დალაგებულია და გამოითვლება კენდალის კორელაციის კოეფიციენტი:

სადაც = .

დიდი Y რანგის მნიშვნელობა.

არის ამჟამინდელი დაკვირვებების შემდგომი დაკვირვებების საერთო რაოდენობა მას შემდეგ უფრო პატარა Y რანგის მნიშვნელობა. (თანაბარი წოდებები არ ითვლება!)

თუ შესწავლილი მონაცემები მეორდება (აქვთ იგივე წოდებები), მაშინ გამოთვლებში გამოიყენება კორექტირებული კენდალის კორელაციის კოეფიციენტი:

- დაკავშირებული წოდებების რაოდენობა X და Y სერიებში, შესაბამისად.

19. რა უნდა იყოს ამოსავალი კვლევის თემის, ობიექტის, საგნის, მიზნის, ამოცანებისა და ჰიპოთეზის განსაზღვრისას?

კვლევის პროგრამა, როგორც წესი, შედგება ორი განყოფილებისგან: მეთოდოლოგიური და პროცედურული. პირველი მოიცავს თემის აქტუალურობის დასაბუთებას, პრობლემის ფორმულირებას, საგნისა და საგნის განსაზღვრას, კვლევის მიზნებსა და ამოცანებს, ძირითადი ცნებების (კატეგორიული აპარატის) ჩამოყალიბებას, კვლევის ობიექტის წინასწარ სისტემურ ანალიზს და სამუშაო ჰიპოთეზის შემუშავება. მეორე ნაწილში მოცემულია კვლევის სტრატეგიული გეგმა, ასევე პირველადი მონაცემების შეგროვებისა და ანალიზის გეგმა და ძირითადი პროცედურები.

უპირველეს ყოვლისა, საკვლევი თემის არჩევისას, უნდა იხელმძღვანელოთ შესაბამისობიდან. რელევანტურობის დასაბუთებამოიცავს მითითებას სასწავლო და განათლების თეორიისა და პრაქტიკის შემდგომი განვითარებისათვის პრობლემის შესწავლისა და გადაჭრის აუცილებლობისა და დროულობის შესახებ. ამჟამინდელი კვლევა იძლევა პასუხს დღევანდელი დროის ყველაზე აქტუალურ კითხვებზე, ასახავს საზოგადოების სოციალურ წესრიგს პედაგოგიური მეცნიერებისთვის და ავლენს პრაქტიკაში არსებულ ყველაზე მნიშვნელოვან წინააღმდეგობებს. შესაბამისობის კრიტერიუმი არის დინამიური, მობილური, დამოკიდებულია დროზე, კონკრეტული და კონკრეტული გარემოებების გათვალისწინებით. მისი ყველაზე ზოგადი ფორმით, რელევანტურობა ახასიათებს შეუსაბამობის ხარისხს სამეცნიერო იდეებსა და პრაქტიკულ რეკომენდაციებზე მოთხოვნას (კონკრეტული საჭიროების დასაკმაყოფილებლად) და იმ წინადადებებს შორის, რომლებიც მეცნიერებასა და პრაქტიკას შეუძლია უზრუნველყოს ამჟამად.

ყველაზე დამაჯერებელი საფუძველი, რომელიც განსაზღვრავს კვლევის თემას, არის სოციალური წესრიგი, რომელიც ასახავს ყველაზე მწვავე, სოციალურად მნიშვნელოვან პრობლემებს, რომლებიც საჭიროებენ სასწრაფო გადაწყვეტას. სოციალური წესრიგი მოითხოვს კონკრეტული თემის დასაბუთებას. ჩვეულებრივ, ეს არის მეცნიერებაში საკითხის განვითარების ხარისხის ანალიზი.

თუ სოციალური წესრიგი გამომდინარეობს პედაგოგიური პრაქტიკის ანალიზიდან, მაშინ ის მეცნიერული პრობლემაარის სხვა თვითმფრინავში. ის გამოხატავს მთავარ წინააღმდეგობას, რომელიც უნდა გადაწყდეს მეცნიერების საშუალებით. პრობლემის გადაწყვეტა ჩვეულებრივ არის კვლევის მიზანი.მიზანი არის გადაფორმებული პრობლემა.

პრობლემის ფორმულირება გულისხმობს ობიექტის შერჩევაკვლევა. ეს შეიძლება იყოს პედაგოგიური პროცესი, პედაგოგიური რეალობის სფერო, ან რაიმე სახის პედაგოგიური ურთიერთობა, რომელიც შეიცავს წინააღმდეგობას. სხვა სიტყვებით რომ ვთქვათ, ობიექტი შეიძლება იყოს ყველაფერი, რაც აშკარად ან ირიბად შეიცავს წინააღმდეგობას და წარმოქმნის პრობლემურ სიტუაციას. ობიექტი არის ის, რისკენაც მიმართულია შემეცნების პროცესი. სასწავლო საგანი -ნაწილი, ობიექტის მხარე. ეს არის ყველაზე მნიშვნელოვანი პრაქტიკული თუ თეორიული თვალსაზრისით ობიექტის თვისებები, ასპექტები, მახასიათებლები, რომლებიც ექვემდებარება უშუალო შესწავლას.

კვლევის მიზნის, ობიექტისა და საგნის შესაბამისად, კვლევა დავალებები,რომლებიც ჩვეულებრივ გამოიყენება შესამოწმებლად ჰიპოთეზები.ეს უკანასკნელი არის თეორიულად დასაბუთებული ვარაუდების ერთობლიობა, რომლის ჭეშმარიტება ექვემდებარება შემოწმებას.

Კრიტერიუმი სამეცნიერო სიახლეგამოიყენება დასრულებული კვლევების ხარისხის შესაფასებლად. იგი ახასიათებს ახალ თეორიულ და პრაქტიკულ დასკვნებს, განათლების კანონებს, მის სტრუქტურასა და მექანიზმებს, შინაარსს, პრინციპებსა და ტექნოლოგიებს, რომლებიც ამ დროისთვის არ იყო ცნობილი და არ იყო დაფიქსირებული პედაგოგიურ ლიტერატურაში. კვლევის სიახლეს შეიძლება ჰქონდეს როგორც თეორიული, ასევე პრაქტიკული მნიშვნელობა. კვლევის თეორიული მნიშვნელობა მდგომარეობს კონცეფციის შექმნაში, ჰიპოთეზის, კანონზომიერების, პრობლემის, ტენდენციის, მიმართულების იდენტიფიცირების მეთოდის, მოდელის მოპოვებაში. კვლევის პრაქტიკული მნიშვნელობა მდგომარეობს წინადადებების, რეკომენდაციების მომზადებაში და ა.შ. სიახლის, თეორიული და პრაქტიკული მნიშვნელობის კრიტერიუმები განსხვავდება კვლევის ტიპის მიხედვით, ისინი ასევე დამოკიდებულია ახალი ცოდნის მიღების დროზე.

რანგის კორელაციის კოეფიციენტიახასიათებს არაწრფივი დამოკიდებულების ზოგად ბუნებას: შედეგიანი ნიშნის მატება ან შემცირება ფაქტორულის ზრდით. ეს არის მონოტონური არაწრფივი ურთიერთობის შებოჭილობის მაჩვენებელი.

სამსახურის დავალება. ეს ონლაინ კალკულატორი ითვლის კენდალის წოდების კორელაციის კოეფიციენტიყველა ძირითადი ფორმულისთვის, ასევე მისი მნიშვნელობის შეფასება.

ინსტრუქცია. მიუთითეთ მონაცემთა რაოდენობა (სტრიქონების რაოდენობა). შედეგად მიღებული გამოსავალი ინახება Word ფაილში.

კენდალის მიერ შემოთავაზებული კოეფიციენტი აგებულია „მეტ-ნაკლებად“ ტიპის ურთიერთობების საფუძველზე, რომლის მართებულობა დადგინდა სასწორის აგებისას.
გამოვყოთ რამდენიმე ობიექტი და შევადაროთ მათი რიგები ერთი ატრიბუტის მიხედვით და მეორის მიხედვით. თუ რიგები ქმნიან პირდაპირ წესრიგს ამ მახასიათებლის მიხედვით (ანუ ბუნებრივი რიგის რიგი), მაშინ წყვილს ენიჭება +1, თუ პირიქით, მაშინ -1. არჩეული წყვილისთვის მრავლდება შესაბამისი პლუს-მინუს ერთეულები (X და Y მახასიათებლის მიხედვით). შედეგი აშკარად არის +1; თუ ორივე მახასიათებლის წყვილის რიგები ერთნაირი თანმიმდევრობითაა და -1 თუ ისინი საპირისპირო მიმდევრობით არიან.
თუ ორივე მახასიათებლის რიგები ერთნაირია ყველა წყვილისთვის, მაშინ ყველა წყვილ ობიექტზე მინიჭებული ერთეულების ჯამი მაქსიმალურია და ტოლია წყვილების რაოდენობაზე. თუ ყველა წყვილის რიგები შებრუნებულია, მაშინ –C 2 N. ზოგად შემთხვევაში, C 2 N = P + Q, სადაც P არის დადებითი და Q უარყოფითი ერთეულების რაოდენობა, რომლებიც ენიჭება წყვილებს მათი რიგების შედარებისას ორივე მახასიათებლისთვის.
მნიშვნელობას ეწოდება კენდალის კოეფიციენტი.
ფორმულიდან ჩანს, რომ კოეფიციენტი τ არის განსხვავება ობიექტების წყვილთა პროპორციას შორის, რომლებსაც აქვთ იგივე რიგი ორივე მახასიათებელში (ყველა წყვილის რაოდენობასთან მიმართებაში) და წყვილი ობიექტების პროპორციას შორის, რომლებსაც არ აქვთ. იგივე ბრძანება.
მაგალითად, კოეფიციენტის მნიშვნელობა 0,60 ნიშნავს, რომ წყვილების 80%-ს აქვს ობიექტების ერთნაირი რიგი, ხოლო 20%-ს არა (80% + 20% = 100%; 0,80 - 0,20 = 0,60). იმათ. τ შეიძლება განიმარტოს, როგორც განსხვავება დამთხვევისა და შეუსაბამობის ალბათობას შორის ორივე მახასიათებლებში შემთხვევით შერჩეული ობიექტების წყვილისთვის.
ზოგად შემთხვევაში, τ (უფრო ზუსტად, P ან Q) გამოთვლა, თუნდაც 10-ის რიგის N-ისთვის, რთული აღმოჩნდება.
მოდით ვაჩვენოთ როგორ გავამარტივოთ გამოთვლები.


მაგალითი. კავშირი სამრეწველო პროდუქციის მოცულობასა და ძირითად კაპიტალში ინვესტიციებს შორის 2003 წელს რუსეთის ფედერაციის ერთ-ერთი ფედერალური ოლქის 10 რეგიონში ხასიათდება შემდეგი მონაცემებით:


გამოთვალეთ სპირმენისა და კენდალის რანგის კორელაციის კოეფიციენტები. შეამოწმეთ მათი მნიშვნელობა α=0.05-ზე. ჩამოაყალიბეთ დასკვნა სამრეწველო წარმოების მოცულობასა და რუსეთის ფედერაციის განსახილველ რეგიონებში ძირითად აქტივებში ინვესტიციებს შორის ურთიერთობის შესახებ.

გამოსავალი. მიანიჭეთ რანგები Y მახასიათებელს და X ფაქტორს.


დავახარისხოთ მონაცემები X-ის მიხედვით.
Y სერიაში, 3-ის მარჯვნივ, არის 7 წოდება 3-ზე მეტი, შესაბამისად, 3 წარმოშობს ტერმინს 7 P-ში.
1-ის მარჯვნივ არის 1-ზე მეტი 8 წოდება (ეს არის 2, 4, 6, 9, 5, 10, 7, 8), ე.ი. P მოიცავს 8 და ა.შ. შედეგად, P = 37 და ფორმულების გამოყენებით გვაქვს:

Xწოდება X, dxწოდება Y, d y
18.4 5.57 1 3 7 2
20.6 2.88 2 1 8 0
21.5 4.12 3 2 7 0
35.7 7.24 4 4 6 0
37.1 9.67 5 6 4 1
39.8 10.48 6 9 1 3
51.1 8.58 7 5 3 0
54.4 14.79 8 10 0 2
64.6 10.22 9 7 1 0
90.6 10.45 10 8 0 0
37 8


გამარტივებული ფორმულები:




სადაც n არის ნიმუშის ზომა; z kp არის ორმხრივი კრიტიკული რეგიონის კრიტიკული წერტილი, რომელიც გვხვდება ლაპლასის ფუნქციის ცხრილიდან ტოლობით Ф(z kp)=(1-α)/2.
თუ |τ|< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - ნულოვანი ჰიპოთეზა უარყოფილია. ხარისხობრივ მახასიათებლებს შორის მნიშვნელოვანი რანგის კორელაციაა.
ვიპოვოთ კრიტიკული წერტილი z kp
Ф(z kp) = (1-α)/2 = (1 - 0.05)/2 = 0.475

მოდი ვიპოვოთ კრიტიკული წერტილი:

ვინაიდან τ > T kp - უარვყოფთ ნულოვან ჰიპოთეზას; რანგის კორელაცია ორ ტესტში ქულებს შორის მნიშვნელოვანია.

მაგალითი. დამოუკიდებლად შესრულებული სამშენებლო და სამონტაჟო სამუშაოების მოცულობისა და რუსეთის ფედერაციის ერთ-ერთ ქალაქში 10 სამშენებლო კომპანიაში დასაქმებულთა რაოდენობის მიხედვით, განსაზღვრავს ამ მახასიათებლებს შორის ურთიერთობას კენდელის კოეფიციენტის გამოყენებით.

გამოსავალიიპოვნეთ კალკულატორით.
მიანიჭეთ რანგები Y მახასიათებელს და X ფაქტორს.
მოდით მოვაწყოთ ობიექტები ისე, რომ მათი რიგები X-ში წარმოადგენდეს ნატურალურ რიცხვებს. ვინაიდან ამ სერიის თითოეულ წყვილზე მინიჭებული რეიტინგები დადებითია, P-ში შეტანილი მნიშვნელობები "+1" გენერირებული იქნება მხოლოდ იმ წყვილების მიერ, რომელთა რიგები Y-ში ქმნიან პირდაპირ წესრიგს.
მათი გამოთვლა მარტივია Y მწკრივში თითოეული ობიექტის ფოლადის რიგების თანმიმდევრული შედარებით.
კენდალის კოეფიციენტი.

ზოგად შემთხვევაში, τ (უფრო ზუსტად, P ან Q) გამოთვლა, თუნდაც 10-ის რიგის N-ისთვის, რთული აღმოჩნდება. მოდით ვაჩვენოთ როგორ გავამარტივოთ გამოთვლები.

ან

გამოსავალი.
დავახარისხოთ მონაცემები X-ის მიხედვით.
Y სერიაში, 2-ის მარჯვნივ, არის 8 წოდება 2-ზე მეტი, ამიტომ 2 წარმოშობს ტერმინს 8 P-ში.
4-ის მარჯვნივ არის 4-ზე მეტი 6 წოდება (ეს არის 7, 5, 6, 8, 9, 10), ე.ი. P მოიცავს 6 და ა.შ. შედეგად, P = 29 და ფორმულების გამოყენებით გვაქვს:

Xწოდება X, dxწოდება Y, d y
38 292 1 2 8 1
50 302 2 4 6 2
52 366 3 7 3 4
54 312 4 5 4 2
59 359 5 6 3 2
61 398 6 8 2 2
66 401 7 9 1 2
70 298 8 3 1 1
71 283 9 1 1 0
73 413 10 10 0 0
29 16


გამარტივებული ფორმულები:


იმისათვის, რომ შევამოწმოთ ნულოვანი ჰიპოთეზა მნიშვნელოვნების α დონეზე, რომ კენდალის ზოგადი რანგის კორელაციის კოეფიციენტი ნულის ტოლია კონკურენტულ ჰიპოთეზაში Н 1: τ ≠ 0, აუცილებელია კრიტიკული წერტილის გამოთვლა:

სადაც n არის ნიმუშის ზომა; z kp არის ორმხრივი კრიტიკული რეგიონის კრიტიკული წერტილი, რომელიც ლაპლასის ფუნქციის ცხრილიდან გვხვდება Ф(z kp)=(1 - α)/2 ტოლობით.
თუ |τ| T kp - ნულოვანი ჰიპოთეზა უარყოფილია. ხარისხობრივ მახასიათებლებს შორის მნიშვნელოვანი რანგის კორელაციაა.
ვიპოვოთ კრიტიკული წერტილი z kp
Ф(z kp) = (1 - α)/2 = (1 - 0.05)/2 = 0.475
ლაპლასის ცხრილის მიხედვით ვპოულობთ z kp = 1.96
მოდი ვიპოვოთ კრიტიკული წერტილი:

მას შემდეგ, რაც თ

ეკონომიკური და სოციალური პრაქტიკის საჭიროებები მოითხოვს პროცესების რაოდენობრივი აღწერის მეთოდების შემუშავებას, რაც შესაძლებელს გახდის ზუსტად აღრიცხოს არა მხოლოდ რაოდენობრივი, არამედ ხარისხობრივი ფაქტორებიც. იმ პირობით, რომ ხარისხობრივი მახასიათებლების მნიშვნელობები შეიძლება დალაგდეს ან დალაგდეს მახასიათებლის შემცირების (ზრდის) ხარისხის მიხედვით, შესაძლებელია შეფასდეს ხარისხობრივ მახასიათებლებს შორის კავშირის სიახლოვე. ხარისხობრივი არის ნიშანი, რომლის ზუსტად გაზომვა შეუძლებელია, მაგრამ ის საშუალებას გაძლევთ შეადაროთ ობიექტები ერთმანეთს და, შესაბამისად, მოაწყოთ ისინი ხარისხის კლებადობით ან მზარდი თანმიმდევრობით. ხოლო გაზომვების რეალური შინაარსი რანჟირების სკალებში არის ობიექტების განლაგების თანმიმდევრობა გაზომილი მახასიათებლის სიმძიმის მიხედვით.

პრაქტიკული მიზნებისთვის, რანგის კორელაციის გამოყენება ძალიან სასარგებლოა. მაგალითად, თუ მაღალი რანგის კორელაცია დამყარდა პროდუქციის ორ ხარისხის ატრიბუტს შორის, მაშინ საკმარისია პროდუქციის კონტროლი მხოლოდ ერთ-ერთი ატრიბუტისთვის, რაც ამცირებს ღირებულებას და აჩქარებს კონტროლს.

მაგალითად, შეგვიძლია განვიხილოთ კავშირის არსებობა რიგი საწარმოებისთვის გაყიდვადი პროდუქციის ხელმისაწვდომობასა და გაყიდვის ზედნადურ ხარჯებს შორის. 10 დაკვირვების შედეგად მიღებული იქნა შემდეგი ცხრილი:

მოდით დავახარისხოთ X-ის მნიშვნელობები ზრდადი თანმიმდევრობით, ხოლო თითოეულ მნიშვნელობას მიენიჭება რიგითი ნომერი (რანგი):

Ამგვარად,

ავაშენოთ შემდეგი ცხრილი, სადაც ჩაწერილია დაკვირვების შედეგად მიღებული წყვილი X და Y მათი რიგებით:

რანგებში სხვაობის აღნიშვნით, ჩვენ ვწერთ ფორმულას სპირმანის ნიმუშის კორელაციის კოეფიციენტის გამოსათვლელად:

სადაც n არის დაკვირვებების რაოდენობა, რომელიც ასევე არის რიგების წყვილთა რაოდენობა.

Spearman კოეფიციენტს აქვს შემდეგი თვისებები:

თუ არსებობს სრული პირდაპირი კავშირი ხარისხობრივ მახასიათებლებს შორის X და Y იმ გაგებით, რომ ობიექტების რიგები იგივეა i-ს ყველა მნიშვნელობისთვის, მაშინ Spearman ნიმუშის კორელაციის კოეფიციენტი არის 1. მართლაც, ფორმულაში ჩანაცვლებით, ჩვენ მიიღეთ 1.

თუ X და Y თვისებრივ მახასიათებლებს შორის არის სრული შებრუნებული კავშირი იმ გაგებით, რომ წოდება შეესაბამება წოდებას, მაშინ Spearman-ის ნიმუშის კორელაციის კოეფიციენტი არის -1.

მართლაც, თუ

მნიშვნელობის ჩანაცვლებით Spearman-ის კორელაციის კოეფიციენტის ფორმულაში, მივიღებთ -1.

თუ ხარისხობრივ მახასიათებლებს შორის არ არის არც სრული პირდაპირი და არც სრული უკუკავშირი, მაშინ Spearman-ის ნიმუშის კორელაციის კოეფიციენტი არის -1-დან 1-მდე და რაც უფრო ახლოს არის მისი მნიშვნელობა 0-თან, მით უფრო მცირეა კავშირი მახასიათებლებს შორის.

ზემოაღნიშნული მაგალითის მიხედვით, ჩვენ ვიპოვით P-ს მნიშვნელობას, ამისათვის ჩვენ შევავსებთ ცხრილს მნიშვნელობებით და:

კენდალის სანიმუშო კორელაციის კოეფიციენტი. თქვენ შეგიძლიათ შეაფასოთ კავშირი ორ თვისებრივ მახასიათებელს შორის კენდალის რანგის კორელაციის კოეფიციენტის გამოყენებით.

მოდით, ობიექტების რიგები n ზომის ნიმუშში იყოს:

X ნიშნით:

Y-ის საფუძველზე: . დავუშვათ, რომ მარჯვნივ არის რიგები, დიდი, მარჯვნივ არის რიგები, დიდი, მარჯვნივ არის რიგები, დიდი. შემოვიღოთ წოდებების ჯამის აღნიშვნა

ანალოგიურად, ჩვენ შემოგვაქვს აღნიშვნა, როგორც მარჯვნივ მდგომი რიგების რაოდენობის ჯამი, მაგრამ უფრო მცირე.

კენდალის ნიმუშის კორელაციის კოეფიციენტი იწერება შემდეგნაირად:

სადაც n არის ნიმუშის ზომა.

კენდალის კოეფიციენტს აქვს იგივე თვისებები, რაც Spearman-ის კოეფიციენტს:

თუ არსებობს სრული პირდაპირი კავშირი X და Y ხარისხობრივ მახასიათებლებს შორის იმ გაგებით, რომ ობიექტების რიგები იგივეა i-ის ყველა მნიშვნელობისთვის, მაშინ კენდალის ნიმუშის კორელაციის კოეფიციენტი არის 1. მართლაც, მარჯვნივ არის n-1 რიგები, რომლებიც დიდია, შესაბამისად, ანალოგიურად ვაყენებთ რა. მერე. ხოლო კენდალის კოეფიციენტი არის: .

თუ არსებობს სრული საპირისპირო კავშირი X და Y მახასიათებლებს შორის იმ გაგებით, რომ რანგი შეესაბამება წოდებას, მაშინ კენდალის ნიმუშის კორელაციის კოეფიციენტი არის -1. მარჯვნივ არ არის წოდებები, ამიტომ დიდი. ანალოგიურად. R+=0 ​​მნიშვნელობის კენდალის კოეფიციენტის ფორმულით ჩანაცვლებით, მივიღებთ -1.

საკმარისად დიდი ნიმუშის ზომით და რანგის კორელაციის კოეფიციენტების მნიშვნელობებით, რომლებიც არ მიუახლოვდება 1-ს, ხდება სავარაუდო თანასწორობა:

იძლევა თუ არა კენდალის კოეფიციენტი კორელაციის უფრო კონსერვატიულ შეფასებას, ვიდრე სპირმენის კოეფიციენტი? (რიცხობრივი მნიშვნელობა? ყოველთვის ნაკლებია). მიუხედავად იმისა, რომ კოეფიციენტის გაანგარიშება? კოეფიციენტის გამოთვლაზე ნაკლებ დროს მოითხოვს, ამ უკანასკნელის ხელახალი გამოთვლა უფრო ადვილია, თუ სერიას დაემატება ახალი ტერმინი.

კოეფიციენტის მნიშვნელოვანი უპირატესობა ის არის, რომ მისი გამოყენება შესაძლებელია ნაწილობრივი რანგის კორელაციის კოეფიციენტის დასადგენად, რაც შესაძლებელს ხდის შეაფასოს ორ რანგის მახასიათებელს შორის „სუფთა“ ურთიერთობის ხარისხი, რაც გამორიცხავს მესამეს გავლენას:

რანგის კორელაციის კოეფიციენტების მნიშვნელობა. სანიმუშო მონაცემებზე დაფუძნებული რანგის კორელაციის სიძლიერის განსაზღვრისას აუცილებელია გავითვალისწინოთ შემდეგი კითხვა: რა სანდოობის ხარისხით შეიძლება დაეყრდნო დასკვნას, რომ არსებობს კორელაცია ზოგად პოპულაციაში, თუ მიიღება გარკვეული შერჩევის რანგის კორელაციის კოეფიციენტი. . სხვა სიტყვებით რომ ვთქვათ, დაკვირვებული რანგის კორელაციების მნიშვნელოვნება უნდა შემოწმდეს ორი განხილული რეიტინგის სტატისტიკური დამოუკიდებლობის ჰიპოთეზის საფუძველზე.

შედარებით დიდი ნიმუშის n ზომით, რანგის კორელაციის კოეფიციენტების მნიშვნელოვნება შეიძლება შემოწმდეს ნორმალური განაწილების ცხრილის გამოყენებით (დანართის ცხრილი 1). სპირმენის კოეფიციენტის მნიშვნელოვნების შესამოწმებლად? (n>20-ისთვის) გამოთვალეთ მნიშვნელობა

და კენდალის კოეფიციენტის მნიშვნელოვნების შესამოწმებლად? (n>10-ისთვის) გამოთვალეთ მნიშვნელობა

სადაც S=R+- R-, n არის ნიმუშის ზომა.

შემდგომში დგინდება მნიშვნელობის დონე ?, კრიტიკული მნიშვნელობა tcr (?, k) განისაზღვრება სტუდენტის განაწილების კრიტიკული წერტილების ცხრილიდან და გამოთვლილი სიდიდედან ან შედარებულია მასთან. თავისუფლების გრადუსების რაოდენობა ითვლება k = n-2. თუ ან > tcr, მაშინ მნიშვნელობები ან აღიარებულია, როგორც მნიშვნელოვანი.

ფეხნერის კორელაციის კოეფიციენტი.

ბოლოს უნდა აღვნიშნოთ ფეხნერის კოეფიციენტი, რომელიც ახასიათებს კავშირის სიახლოვის ელემენტარულ ხარისხს, რომელიც მიზანშეწონილია გამოვიყენოთ კავშირის არსებობის ფაქტის დასადგენად, როდესაც არსებობს მცირე რაოდენობის საწყისი ინფორმაცია. მისი გაანგარიშების საფუძველია თითოეული ვარიაციის სერიის საშუალო არითმეტიკულიდან გადახრების მიმართულების გათვალისწინება და ამ გადახრების ნიშნების თანმიმდევრულობის განსაზღვრა ორი სერიისთვის, რომელთა შორის ურთიერთობა იზომება.

ეს კოეფიციენტი განისაზღვრება ფორმულით:

სადაც na არის ინდივიდუალური მნიშვნელობების გადახრის ნიშნების დამთხვევების რაოდენობა მათი არითმეტიკული საშუალოდან; nb - შესაბამისად, შეუსაბამობების რაოდენობა.

ფეხნერის კოეფიციენტი შეიძლება განსხვავდებოდეს -1.0 ფარგლებში<= Кф<= +1,0.

წოდების კორელაციის გამოყენებითი ასპექტები. როგორც უკვე აღვნიშნეთ, რანგის კორელაციის კოეფიციენტები შეიძლება გამოყენებულ იქნას არა მხოლოდ ორ რანგის მახასიათებელს შორის ურთიერთობის თვისებრივი ანალიზისთვის, არამედ რანგის და რაოდენობრივ მახასიათებლებს შორის ურთიერთობის სიძლიერის დასადგენად. ამ შემთხვევაში, რაოდენობრივი ატრიბუტის მნიშვნელობები დალაგებულია და მათ ენიჭება შესაბამისი წოდებები.

არსებობს მთელი რიგი სიტუაციები, როდესაც რანგის კორელაციის კოეფიციენტების გამოთვლა ასევე მიზანშეწონილია ორ რაოდენობრივ მახასიათებელს შორის კავშირის სიძლიერის განსაზღვრისას. ასე რომ, ერთი მათგანის (ან ორივეს) განაწილების ნორმალური განაწილებიდან მნიშვნელოვანი გადახრის შემთხვევაში, ნიმუშის კორელაციის კოეფიციენტის r მნიშვნელოვნების დონის განსაზღვრა არასწორი ხდება, ხოლო რანგის კოეფიციენტები? და? არ არის დაკავშირებული ასეთ შეზღუდვებთან მნიშვნელობის დონის განსაზღვრისას.

ამ ტიპის კიდევ ერთი სიტუაცია ხდება მაშინ, როდესაც ურთიერთობა ორ რაოდენობრივ მახასიათებელს შორის არის არაწრფივი (მაგრამ ერთფეროვანი). თუ ნიმუშში ობიექტების რაოდენობა მცირეა, ან თუ ურთიერთობის ნიშანი მკვლევარისთვის მნიშვნელოვანია, მაშინ კორელაციური ურთიერთობის გამოყენება? შეიძლება აქ შეუსაბამო იყოს. რანგის კორელაციის კოეფიციენტის გამოთვლა საშუალებას იძლევა გვერდის ავლით ეს სირთულეები.

პრაქტიკული ნაწილი

ამოცანა 1. კორელაციური და რეგრესიული ანალიზი

პრობლემის განცხადება და ფორმალიზება:

მოცემულია ემპირიული ნიმუში, რომელიც შედგენილია აღჭურვილობის მდგომარეობის (მარცხისთვის) და წარმოებული ნივთების რაოდენობის დაკვირვების სერიის საფუძველზე. ნიმუში ირიბად ახასიათებს კავშირი წარუმატებელი აღჭურვილობის მოცულობასა და წარმოებული ნივთების რაოდენობას შორის. ნიმუშის მნიშვნელობის მიხედვით, ცხადია, რომ წარმოებული პროდუქცია იწარმოება იმ აღჭურვილობაზე, რომელიც დარჩა ექსპლუატაციაში, ვინაიდან რაც მეტია მარცხის აღჭურვილობის პროცენტი, მით ნაკლებია წარმოებული პროდუქცია. საჭიროა ნიმუშის შესწავლა კორელაცია-რეგრესიული დამოკიდებულებისთვის, ანუ დამოკიდებულების ფორმის დადგენა, რეგრესიის ფუნქციის შეფასება (რეგრესიული ანალიზი), ასევე შემთხვევით ცვლადებს შორის კავშირის დადგენა და მისი სიმჭიდროვის შეფასება (კორელაციური ანალიზი). კორელაციური ანალიზის დამატებით ამოცანას წარმოადგენს ერთი ცვლადის რეგრესიული განტოლების შეფასება მეორესთან მიმართებაში. გარდა ამისა, აუცილებელია წარმოებული პროდუქციის რაოდენობის პროგნოზირება 30% აღჭურვილობის უკმარისობით.

ჩვენ ვაფორმებთ ზემოთ მოცემულ ნიმუშს ცხრილში, სადაც აღვნიშნავთ მონაცემებს "აღჭურვილობის გაუმართაობა,%" როგორც X, ხოლო მონაცემებს "პროდუქტების რაოდენობა" როგორც Y:

საწყისი მონაცემები. ცხრილი 1

პრობლემის ფიზიკური მნიშვნელობიდან გამომდინარე, ჩანს, რომ წარმოებული პროდუქციის რაოდენობა Y პირდაპირ დამოკიდებულია აღჭურვილობის უკმარისობის პროცენტზე, ანუ არსებობს Y-ის დამოკიდებულება X-ზე. კორელაციისგან განსხვავებით, იგი ვარაუდობს, რომ მნიშვნელობა X მოქმედებს როგორც დამოუკიდებელი ცვლადი, ან ფაქტორი, Y-ის მნიშვნელობა - როგორც მასზე დამოკიდებული, ან ეფექტური მახასიათებელი. ამრიგად, საჭიროა ადეკვატური ეკონომიკური და მათემატიკური მოდელის სინთეზირება, ე.ი. განსაზღვრეთ (იპოვეთ, შეარჩიეთ) ფუნქცია Y = f(X), რომელიც ახასიათებს ურთიერთობას X და Y მნიშვნელობებს შორის, რომლის გამოყენებითაც შესაძლებელი იქნება Y-ის მნიშვნელობის პროგნოზირება X = 30-ზე. პრობლემა შეიძლება შესრულდეს კორელაცია-რეგრესიული ანალიზის გამოყენებით.

კორელაცია-რეგრესიული ამოცანების ამოხსნის მეთოდების მოკლე მიმოხილვა და არჩეული ამოხსნის მეთოდის დასაბუთება.

ეფექტურ ატრიბუტზე მოქმედი ფაქტორების რაოდენობის მიხედვით რეგრესიული ანალიზის მეთოდები იყოფა ერთ და მრავალფაქტორად. ერთფაქტორიანი - დამოუკიდებელი ფაქტორების რაოდენობა = 1, ე.ი. Y = F(X)

მრავალფაქტორული - ფაქტორების რაოდენობა > 1, ე.ი.

შესწავლილი დამოკიდებული ცვლადების (შედეგის მახასიათებლების) რაოდენობის მიხედვით, რეგრესიის ამოცანები ასევე შეიძლება დაიყოს ამოცანებად ერთი და მრავალი პროდუქტიული მახასიათებლით. ზოგადად, მრავალი ეფექტური მახასიათებლის მქონე ამოცანა შეიძლება დაიწეროს შემდეგნაირად:

კორელაცია-რეგრესიული ანალიზის მეთოდი შედგება ფორმის მიახლოებითი (დაახლოებითი) დამოკიდებულების პარამეტრების პოვნაში.

ვინაიდან ზემოხსენებულ ამოცანაში მხოლოდ ერთი დამოუკიდებელი ცვლადი ჩნდება, ანუ შესწავლილია დამოკიდებულება მხოლოდ ერთ ფაქტორზე, რომელიც გავლენას ახდენს შედეგზე, უნდა გამოვიყენოთ კვლევა ერთფაქტორიან დამოკიდებულებაზე, ან დაწყვილებულ რეგრესიაზე.

მხოლოდ ერთი ფაქტორის არსებობისას, დამოკიდებულება განისაზღვრება, როგორც:

კონკრეტული რეგრესიული განტოლების დაწერის ფორმა დამოკიდებულია ფუნქციის არჩევანზე, რომელიც აჩვენებს სტატისტიკურ ურთიერთობას ფაქტორსა და მიღებულ მახასიათებელს შორის და მოიცავს შემდეგს:

წრფივი რეგრესია, ფორმის განტოლება,

პარაბოლური, ფორმის განტოლება

კუბური, ფორმის განტოლება

ჰიპერბოლური, ფორმის განტოლება

სემილოგარითმული, ფორმის განტოლება

ექსპონენციალური, ფორმის განტოლება

სიმძლავრე, ფორმის განტოლება.

ფუნქციის პოვნა მცირდება რეგრესიის განტოლების პარამეტრების დადგენით და თავად განტოლების სანდოობის შეფასებამდე. პარამეტრების დასადგენად შეგიძლიათ გამოიყენოთ როგორც უმცირესი კვადრატების, ასევე უმცირესი მოდულების მეთოდი.

პირველი მათგანი არის ის, რომ Yi ემპირიული მნიშვნელობების კვადრატული გადახრების ჯამი გამოთვლილი საშუალო Yi-დან უნდა იყოს მინიმალური.

უმცირესი მოდულის მეთოდი შედგება Yi ემპირიულ მნიშვნელობებსა და გამოთვლილ საშუალო მაჩვენებლებს შორის სხვაობის მოდულების ჯამის მინიმუმამდე შემცირებაში.

პრობლემის გადასაჭრელად ვირჩევთ უმცირეს კვადრატების მეთოდს, როგორც უმარტივეს და კარგ შეფასებებს სტატისტიკური თვისებების მიხედვით.

რეგრესიის ანალიზის პრობლემის გადაჭრის ტექნოლოგია უმცირესი კვადრატების მეთოდით.

თქვენ შეგიძლიათ განსაზღვროთ დამოკიდებულების ტიპი (წრფივი, კვადრატული, კუბური და ა.შ.) ცვლადებს შორის y რეალური მნიშვნელობის გადახრის შეფასებით გამოთვლილიდან:

სადაც - ემპირიული მნიშვნელობები, - გამოთვლილი მნიშვნელობები მიახლოებითი ფუნქციისთვის. სხვადასხვა ფუნქციისთვის Si-ის მნიშვნელობების შეფასებით და მათგან უმცირესის არჩევით, ჩვენ ვირჩევთ მიახლოებით ფუნქციას.

ფუნქციის ტიპი განისაზღვრება კოეფიციენტების მოძიებით, რომლებიც ნაპოვნია თითოეული ფუნქციისთვის, როგორც განტოლებათა გარკვეული სისტემის ამონახსნი:

წრფივი რეგრესია, ტიპის განტოლება, სისტემა -

პარაბოლური, ფორმის განტოლება, სისტემა -

კუბური, ტიპის განტოლება, სისტემა -

სისტემის ამოხსნის შემდეგ ვპოულობთ, რომლის დახმარებითაც მივდივართ ანალიტიკური ფუნქციის კონკრეტულ გამოხატულებამდე, რომლის მქონეც ვპოულობთ გამოთვლილ მნიშვნელობებს. შემდეგ არის ყველა მონაცემი S გადახრის შეფასების მოსაძებნად და მინიმალური ანალიზისთვის.

წრფივი დამოკიდებულებისთვის, ჩვენ ვაფასებთ კავშირის სიახლოვეს X ფაქტორსა და Y ეფექტურ მახასიათებელს შორის კორელაციის კოეფიციენტის r სახით:

ინდიკატორის საშუალო მნიშვნელობა;

ფაქტორის საშუალო მნიშვნელობა;

y - ინდიკატორის ექსპერიმენტული მნიშვნელობა;

x - ფაქტორის ექსპერიმენტული მნიშვნელობა;

სტანდარტული გადახრა x;

სტანდარტული გადახრა y-ში.

თუ კორელაციის კოეფიციენტი r = 0, მაშინ ითვლება, რომ მახასიათებლებს შორის კავშირი უმნიშვნელოა ან არ არსებობს, თუ r = 1, მაშინ მახასიათებლებს შორის ძალიან მაღალი ფუნქციონალური კავშირია.

ჩადოკის ცხრილის გამოყენებით შესაძლებელია ნიშანთა შორის კორელაციის სიახლოვის თვისებრივი შეფასება:

ჩადოკის მაგიდა ცხრილი 2.

არაწრფივი დამოკიდებულებისთვის განისაზღვრება კორელაციის კოეფიციენტი (0 1) და კორელაციის ინდექსი R, რომლებიც გამოითვლება შემდეგი დამოკიდებულებებიდან.

სადაც მნიშვნელობა არის ინდიკატორის მნიშვნელობა, რომელიც გამოითვლება რეგრესიის დამოკიდებულებიდან.

როგორც გამოთვლების სიზუსტის შეფასება, ჩვენ ვიყენებთ საშუალო ფარდობითი მიახლოების შეცდომის მნიშვნელობას

მაღალი სიზუსტით მდგომარეობს 0-12% დიაპაზონში.

ფუნქციური დამოკიდებულების შერჩევის შესაფასებლად ვიყენებთ განსაზღვრის კოეფიციენტს

განსაზღვრის კოეფიციენტი გამოიყენება, როგორც ფუნქციური მოდელის შერჩევის ხარისხის „განზოგადებული“ საზომი, ვინაიდან იგი გამოხატავს თანაფარდობას ფაქტორულ და მთლიან დისპერსიას შორის, უფრო ზუსტად, ფაქტორების დისპერსიის წილს ჯამში.

კორელაციური ინდექსის R მნიშვნელოვნების შესაფასებლად გამოიყენება ფიშერის F-ტესტი. კრიტერიუმის რეალური მნიშვნელობა განისაზღვრება ფორმულით:

სადაც m არის რეგრესიის განტოლების პარამეტრების რაოდენობა, n არის დაკვირვებების რაოდენობა. მნიშვნელობა შედარებულია კრიტიკულ სიდიდესთან, რომელიც განისაზღვრება F-კრიტერიუმის ცხრილიდან მიღებული მნიშვნელოვნების დონის და თავისუფლების გრადუსების რაოდენობის გათვალისწინებით u. თუ, მაშინ კორელაციის ინდექსის მნიშვნელობა R აღიარებულია, როგორც მნიშვნელოვანი.

რეგრესიის შერჩეული ფორმისთვის გამოითვლება რეგრესიის განტოლების კოეფიციენტები. მოხერხებულობისთვის, გაანგარიშების შედეგები შედის შემდეგი სტრუქტურის ცხრილში (ზოგადად, სვეტების რაოდენობა და მათი გარეგნობა განსხვავდება რეგრესიის ტიპის მიხედვით):

ცხრილი 3

პრობლემის გადაწყვეტა.

დაკვირვება განხორციელდა ეკონომიკურ ფენომენზე - პროდუქციის გამოშვების დამოკიდებულება აღჭურვილობის უკმარისობის პროცენტზე. მიღებულია მნიშვნელობების ნაკრები.

შერჩეული მნიშვნელობები აღწერილია ცხრილში 1.

ჩვენ ვაშენებთ მოცემულ ნიმუშზე ემპირიული დამოკიდებულების გრაფიკს (ნახ. 1).

გრაფიკის ფორმით, ჩვენ განვსაზღვრავთ, რომ ანალიტიკური დამოკიდებულება შეიძლება წარმოდგენილი იყოს როგორც წრფივი ფუნქცია:

გამოთვალეთ წყვილი კორელაციის კოეფიციენტი X და Y შორის კავშირის შესაფასებლად:

ავაშენოთ დამხმარე ცხრილი:

ცხრილი 4

ჩვენ ვხსნით განტოლებათა სისტემას, რომ ვიპოვოთ კოეფიციენტები და:

პირველი განტოლებიდან, მნიშვნელობის შემცვლელი

მეორე განტოლებაში მივიღებთ:

Ჩვენ ვიპოვეთ

ვიღებთ რეგრესიის განტოლების ფორმას:

9. აღმოჩენილი ურთიერთობის სიმკაცრის შესაფასებლად ვიყენებთ კორელაციის კოეფიციენტს r:

ჩადოკის ცხრილის მიხედვით, ჩვენ ვხვდებით, რომ r = 0.90-ისთვის X და Y-ს შორის კავშირი ძალიან მაღალია, შესაბამისად რეგრესიის განტოლების სანდოობაც მაღალია. გამოთვლების სიზუსტის შესაფასებლად ვიყენებთ საშუალო ფარდობითი მიახლოების შეცდომის მნიშვნელობას:

ჩვენ გვჯერა, რომ მნიშვნელობა უზრუნველყოფს რეგრესიის განტოლების საიმედოობის მაღალ ხარისხს.

X-სა და Y-ს შორის წრფივი ურთიერთობისთვის განსაზღვრის ინდექსი უდრის კორელაციის კოეფიციენტის კვადრატს r: . მაშასადამე, მთლიანი ვარიაციის 81% აიხსნება X ფაქტორის თვისების ცვლილებით.

კორელაციური ინდექსის R მნიშვნელოვნების შესაფასებლად, რომელიც სწორხაზოვანი დამოკიდებულების შემთხვევაში, აბსოლუტური მნიშვნელობით უდრის კორელაციის კოეფიციენტს r, გამოიყენება ფიშერის F-ტესტი. ჩვენ განვსაზღვრავთ რეალურ მნიშვნელობას ფორმულით:

სადაც m არის რეგრესიის განტოლების პარამეტრების რაოდენობა, n არის დაკვირვებების რაოდენობა. ანუ, n = 5, m = 2.

მიღებული მნიშვნელობის = 0.05 დონის და თავისუფლების გრადუსების რაოდენობის გათვალისწინებით მივიღებთ კრიტიკულ ცხრილის მნიშვნელობას. ვინაიდან, კორელაციის ინდექსის მნიშვნელობა R აღიარებულია, როგორც მნიშვნელოვანი.

მოდით გამოვთვალოთ Y-ის პროგნოზირებული მნიშვნელობა X = 30-ზე:

ავაშენოთ ნაპოვნი ფუნქციის გრაფიკი:

11. დაადგინეთ კორელაციის კოეფიციენტის ცდომილება სტანდარტული გადახრის მნიშვნელობით

და შემდეგ განსაზღვრეთ ნორმალიზებული გადახრის მნიშვნელობა

95%-იანი ალბათობით > 2-დან შეიძლება ვისაუბროთ მიღებული კორელაციის კოეფიციენტის მნიშვნელობაზე.

ამოცანა 2. ხაზოვანი ოპტიმიზაცია

ვარიანტი 1.

რეგიონის განვითარების გეგმაში გათვალისწინებულია 3 ნავთობის საბადოს ექსპლუატაციაში გაშვება 9 მილიონი ტონა წარმოების მთლიანი მოცულობით. პირველ საბადოზე წარმოების მოცულობა მინიმუმ 1 მილიონი ტონაა, მეორეზე - 3 მილიონი ტონა, მესამეზე - 5 მილიონი ტონა. ამ პროდუქტიულობის მისაღწევად მინიმუმ 125 ჭა უნდა იყოს გაბურღული. ამ გეგმის განსახორციელებლად 25 მილიონი რუბლი გამოიყო. კაპიტალური ინვესტიციები (ინდიკატორი K) და 80 კმ მილები (ინდიკატორი L).

საჭიროა თითოეული ველის დაგეგმილი პროდუქტიულობის უზრუნველსაყოფად ჭაბურღილების ოპტიმალური (მაქსიმალური) რაოდენობის განსაზღვრა. ამოცანის შესახებ საწყისი მონაცემები მოცემულია ცხრილში.

საწყისი მონაცემები

პრობლემის განცხადება მოცემულია ზემოთ.

ჩვენ ვაფორმირებთ პრობლემაში მითითებულ პირობებსა და შეზღუდვებს. ამ ოპტიმიზაციის პრობლემის გადაჭრის მიზანია ნავთობის წარმოების მაქსიმალური მნიშვნელობის პოვნა თითოეული საბადოსთვის ჭაბურღილების ოპტიმალური რაოდენობით, პრობლემის არსებული შეზღუდვების გათვალისწინებით.

სამიზნე ფუნქცია პრობლემის მოთხოვნების შესაბამისად მიიღებს ფორმას:

სადაც არის ჭაბურღილების რაოდენობა თითოეული ველისთვის.

დავალებაზე არსებული შეზღუდვები:

მილსადენის სიგრძე:

ჭაბურღილების რაოდენობა თითოეულ სფეროში:

1 ჭაბურღილის მშენებლობის ღირებულება:

ხაზოვანი ოპტიმიზაციის პრობლემები მოგვარებულია, მაგალითად, შემდეგი მეთოდებით:

გრაფიკულად

მარტივი მეთოდი

გრაფიკული მეთოდის გამოყენება მოსახერხებელია მხოლოდ ხაზოვანი ოპტიმიზაციის ამოცანების გადაჭრისას ორი ცვლადით. ცვლადების უფრო დიდი რაოდენობის შემთხვევაში აუცილებელია ალგებრული აპარატის გამოყენება. განვიხილოთ წრფივი ოპტიმიზაციის ამოცანების გადაჭრის ზოგადი მეთოდი, რომელსაც სიმპლექსის მეთოდი ეწოდება.

Simlex მეთოდი არის განმეორებითი გამოთვლების ტიპიური მაგალითი, რომელიც გამოიყენება ოპტიმიზაციის პრობლემების უმეტესობის გადასაჭრელად. განხილულია ამ ტიპის განმეორებითი პროცედურები, რომლებიც უზრუნველყოფენ პრობლემის გადაჭრას ოპერაციების კვლევის მოდელების დახმარებით.

სიმპლექსის მეთოდის გამოყენებით ოპტიმიზაციის პრობლემის გადასაჭრელად აუცილებელია, რომ უცნობი Xi რიცხვი მეტი იყოს განტოლებათა რაოდენობაზე, ე.ი. განტოლებათა სისტემა

დააკმაყოფილა მიმართება მ

A=იყო m-ის ტოლი.

აღნიშნეთ A მატრიცის სვეტი როგორც, ხოლო თავისუფალი ტერმინების სვეტი როგორც

სისტემის ძირითადი ამონახსნები (1) არის m უცნობის სიმრავლე, რომელიც წარმოადგენს სისტემის (1) ამონახს.

მოკლედ, მარტივი მეთოდის ალგორითმი აღწერილია შემდეგნაირად:

თავდაპირველი შეზღუდვა, დაწერილი, როგორც ტიპის უტოლობა<= (=>), შეიძლება წარმოდგენილი იყოს ტოლობის სახით ნარჩენი ცვლადის დამატებით შეზღუდვის მარცხენა მხარეს (მარცხნიდან ზედმეტი ცვლადის გამოკლებით).

მაგალითად, ორიგინალური შეზღუდვის მარცხენა მხარეს

შემოდის ნარჩენი ცვლადი, რის შედეგადაც საწყისი უტოლობა გადაიქცევა თანასწორობაში

თუ თავდაპირველი შეზღუდვა განსაზღვრავს მილის მოხმარებას, მაშინ ცვლადი უნდა იქნას ინტერპრეტირებული, როგორც ამ რესურსის დარჩენილი ან გამოუყენებელი ნაწილი.

ობიექტური ფუნქციის მაქსიმიზაცია უდრის საპირისპირო ნიშნით აღებული იგივე ფუნქციის მინიმიზაციას. ანუ ჩვენს შემთხვევაში

უდრის

მარტივი ცხრილი შედგენილია შემდეგი ფორმის ძირითადი ამოხსნისთვის:

ეს ცხრილი მიუთითებს, რომ ამ უჯრედებში პრობლემის გადაჭრის შემდეგ იქნება ძირითადი გამოსავალი. - კერძო სვეტის ერთ-ერთ სვეტზე გაყოფისგან; - დამატებითი ნულოვანი მამრავლები მნიშვნელობებისთვის ცხრილის უჯრედებში, რომლებიც დაკავშირებულია ჩართვის სვეტთან. - ობიექტური ფუნქციის მინიმალური მნიშვნელობა -Z, - კოეფიციენტების მნიშვნელობები ობიექტურ ფუნქციაში უცნობისთვის.

მნიშვნელობებს შორის იპოვნეთ რაიმე დადებითი. თუ ეს ასე არ არის, მაშინ პრობლემა მოგვარებულად ითვლება. აირჩიეთ ცხრილის ნებისმიერი სვეტი, რომელსაც აქვს იგი, ამ სვეტს ეწოდება "ნებადართული" სვეტი. თუ გადამწყვეტი სვეტის ელემენტებს შორის არ არის დადებითი რიცხვები, მაშინ პრობლემა გადაუჭრელია მისი ამონახსნების სიმრავლეში ობიექტური ფუნქციის შეუზღუდავობის გამო. თუ რეზოლუციის სვეტში დადებითი რიცხვებია, გადადით მე-5 საფეხურზე.

სვეტი ივსება წილადებით, რომელთა მრიცხველში არის სვეტის ელემენტები, ხოლო მნიშვნელში - განმსაზღვრელი სვეტის შესაბამისი ელემენტები. ყველა მნიშვნელობიდან არჩეულია ყველაზე პატარა. ხაზს, რომელშიც უმცირეს შედეგს ეწოდება "ნებადართული" ხაზი. ნებადართული ხაზისა და დასაშვები სვეტის გადაკვეთაზე გვხვდება დასაშვები ელემენტი, რომელიც ხაზგასმულია რაღაცნაირად, მაგალითად, ფერით.

პირველი სიმპლექსის ცხრილის საფუძველზე შედგენილია შემდეგი, რომელშიც:

მწკრივის ვექტორი ჩანაცვლებულია სვეტის ვექტორით

დასაშვები სტრიქონი იცვლება იმავე სტრიქონით, რომელიც იყოფა ნებადართული ელემენტით

ცხრილის ყოველი სხვა მწკრივი ჩანაცვლებულია ამ მწკრივის ჯამით გარჩევადობით, გამრავლებული სპეციალურად შერჩეული დამატებითი ფაქტორით, რათა მიიღოთ 0 რეზოლუციის სვეტის უჯრედში.

ახალი ცხრილით მივდივართ მე-4 წერტილზე.

პრობლემის გადაწყვეტა.

პრობლემის განცხადების საფუძველზე, ჩვენ გვაქვს უტოლობების შემდეგი სისტემა:

და ობიექტური ფუნქცია

ჩვენ გარდაქმნით უტოლობათა სისტემას განტოლებათა სისტემად დამატებითი ცვლადების შემოღებით:

მოდით შევამციროთ ობიექტური ფუნქცია მის ეკვივალენტამდე:

მოდით ავაშენოთ საწყისი სიმპლექსის ცხრილი:

მოდით ავირჩიოთ ნებართვის სვეტი. მოდით გამოვთვალოთ სვეტი:

ჩვენ ვწერთ მნიშვნელობებს ცხრილში. მათგან უმცირესი = 10-ით, ჩვენ განვსაზღვრავთ ჩართვის სტრიქონს: . განმსაზღვრელი მწკრივისა და განმსაზღვრელი სვეტის გადაკვეთაზე ვპოულობთ განმსაზღვრელ ელემენტს = 1. ცხრილის ნაწილს ვავსებთ დამატებითი ფაქტორებით, ასე რომ: მათზე გამრავლებული გადამწყვეტი სტრიქონი დაემატება ცხრილის დარჩენილ სტრიქონებს, აყალიბებს 0-ს გადამწყვეტი სვეტის ელემენტებში.

ჩვენ ვადგენთ მეორე სიმპლექსის ცხრილს:

მასში ვიღებთ გადაწყვეტის სვეტს, ვიანგარიშებთ მნიშვნელობებს, ვათავსებთ მათ ცხრილში. მინიმუმ, ჩვენ ვიღებთ დასაშვებ სტრიქონს. გადამწყვეტი ელემენტი იქნება 1. ვპოულობთ დამატებით ფაქტორებს, შეავსეთ სვეტები.

ჩვენ ვადგენთ შემდეგ მარტივ ცხრილს:

ანალოგიურად, ჩვენ ვპოულობთ გადაჭრის სვეტს, გადამჭრელ მწკრივს და ამოხსნის ელემენტს = 2. ჩვენ ვაშენებთ შემდეგ მარტივ ცხრილს:

ვინაიდან -Z ხაზში არ არის დადებითი მნიშვნელობები, ეს ცხრილი სასრულია. პირველი სვეტი იძლევა უცნობის სასურველ მნიშვნელობებს, ე.ი. ოპტიმალური ძირითადი გადაწყვეტა:

ამ შემთხვევაში ობიექტური ფუნქციის მნიშვნელობა არის -Z = -8000, რაც უდრის Zmax = 8000-ს. პრობლემა მოგვარებულია.

ამოცანა 3. კლასტერული ანალიზი

პრობლემის ფორმულირება:

განახორციელეთ ობიექტების დაყოფა ცხრილში მოცემული მონაცემების მიხედვით. ამოხსნის მეთოდის არჩევა უნდა განხორციელდეს დამოუკიდებლად, მონაცემთა დამოკიდებულების გრაფიკის შესაქმნელად.

ვარიანტი 1.

საწყისი მონაცემები

მითითებული ტიპის პრობლემების გადაჭრის მეთოდების მიმოხილვა. გადაწყვეტის მეთოდის დასაბუთება.

კლასტერული ანალიზის ამოცანები წყდება შემდეგი მეთოდების გამოყენებით:

გაერთიანების ან ხეების დაჯგუფების მეთოდი გამოიყენება "განსხვავებულობის" ან "ობიექტებს შორის მანძილის" კლასტერების ფორმირებისთვის. ეს მანძილი შეიძლება განისაზღვროს ერთგანზომილებიან ან მრავალგანზომილებიან სივრცეში.

ორმხრივი შეერთება გამოიყენება (შედარებით იშვიათად) იმ შემთხვევებში, როდესაც მონაცემები ინტერპრეტირებულია არა "ობიექტების" და "ობიექტების თვისებების" თვალსაზრისით, არამედ დაკვირვებებისა და ცვლადების თვალსაზრისით. მოსალოდნელია, რომ ორივე დაკვირვება და ცვლადი ერთდროულად შეუწყობს ხელს მნიშვნელოვანი კლასტერის აღმოჩენას.

K- ნიშნავს მეთოდი. გამოიყენება მაშინ, როდესაც უკვე არსებობს ჰიპოთეზა კლასტერების რაოდენობასთან დაკავშირებით. თქვენ შეგიძლიათ უთხრათ სისტემას, რომ ჩამოაყალიბოს ზუსტად, მაგალითად, სამი კლასტერი ისე, რომ ისინი მაქსიმალურად განსხვავდებოდეს. ზოგად შემთხვევაში, K-means მეთოდი აშენებს ზუსტად K სხვადასხვა კლასტერებს, რომლებიც განლაგებულია ერთმანეთისგან რაც შეიძლება შორს.

მანძილების გაზომვის შემდეგი გზები არსებობს:

ევკლიდური მანძილი. ეს არის ყველაზე გავრცელებული ტიპის მანძილი. ეს არის უბრალოდ გეომეტრიული მანძილი მრავალგანზომილებიან სივრცეში და გამოითვლება შემდეგნაირად:

გაითვალისწინეთ, რომ ევკლიდეს მანძილი (და მისი კვადრატი) გამოითვლება ორიგინალური მონაცემებით და არა სტანდარტიზებული მონაცემებით.

ქალაქის ბლოკის მანძილი (მანჰეტენის მანძილი). ეს მანძილი უბრალოდ არის კოორდინატებზე განსხვავებების საშუალო მაჩვენებელი. უმეტეს შემთხვევაში, მანძილის ეს ზომა იწვევს იგივე შედეგებს, რაც ჩვეულებრივ ევკლიდეს მანძილს. თუმცა, გაითვალისწინეთ, რომ ამ საზომისთვის ინდივიდუალური დიდი განსხვავებების (განსხვავებების) გავლენა მცირდება (რადგან ისინი არ არის კვადრატი). მანჰეტენის მანძილი გამოითვლება ფორმულით:

ჩებიშევის მანძილი. ეს მანძილი შეიძლება იყოს სასარგებლო, როდესაც ადამიანს სურს ორი ობიექტის "განსხვავებულად" განსაზღვრა, თუ ისინი განსხვავდებიან რომელიმე კოორდინატში (ნებისმიერ განზომილებაში). ჩებიშევის მანძილი გამოითვლება ფორმულით:

სიმძლავრის მანძილი. ზოგჯერ სასურველია თანდათან გაიზარდოს ან შემცირდეს წონა, რომელიც დაკავშირებულია განზომილებთან, რომლისთვისაც შესაბამისი ობიექტები ძალიან განსხვავებულია. ამის მიღწევა შესაძლებელია ძალაუფლების კანონის მანძილის გამოყენებით. სიმძლავრის მანძილი გამოითვლება ფორმულით:

სადაც r და p არის მომხმარებლის მიერ განსაზღვრული პარამეტრები. გამოთვლების რამდენიმე მაგალითს შეუძლია აჩვენოს, თუ როგორ "მუშაობს" ეს ზომა. p პარამეტრი პასუხისმგებელია ცალკეულ კოორდინატებში განსხვავებების თანდათანობით აწონვაზე, r პარამეტრი პასუხისმგებელია ობიექტებს შორის დიდი მანძილების პროგრესულ წონაზე. თუ ორივე პარამეტრი - r და p უდრის ორს, მაშინ ეს მანძილი ემთხვევა ევკლიდეს მანძილს.

უთანხმოების პროცენტი. ეს ზომა გამოიყენება, როდესაც მონაცემები კატეგორიულია. ეს მანძილი გამოითვლება ფორმულით:

პრობლემის გადასაჭრელად, ჩვენ ვირჩევთ ასოციაციის მეთოდს (ხის მსგავსი კლასტერირება), როგორც ყველაზე შესაფერისი პირობებისა და პრობლემის განცხადებისთვის (ობიექტების დაყოფის განსახორციელებლად). თავის მხრივ, შეერთების მეთოდს შეუძლია გამოიყენოს ბმულის წესების რამდენიმე ვარიანტი:

ერთჯერადი კავშირი (უახლოესი მეზობლის მეთოდი). ამ მეთოდით, მანძილი ორ კლასტერს შორის განისაზღვრება მანძილით ორ უახლოეს ობიექტს (უახლოეს მეზობლებს) შორის სხვადასხვა კლასტერში. ანუ, ორ კლასტერში ნებისმიერი ორი ობიექტი ერთმანეთთან უფრო ახლოსაა, ვიდრე შესაბამისი ბმული მანძილი. ამ წესმა, გარკვეული გაგებით, უნდა შეაერთოს სტრიქონები, რათა შექმნან მტევანი, და შედეგად მიღებული კლასტერები, როგორც წესი, წარმოდგენილია გრძელი „სტრიქონებით“.

სრული კავშირი (ყველაზე შორეული მეზობლების მეთოდი). ამ მეთოდით, კლასტერებს შორის მანძილი განისაზღვრება ყველაზე დიდი მანძილით ნებისმიერ ორ ობიექტს შორის სხვადასხვა კლასტერში (ანუ "ყველაზე შორეული მეზობლები").

ასევე არსებობს მრავალი სხვა კლასტერული შეერთების მსგავსი მეთოდები (მაგ. დაუწონავი დაწყვილება, შეწონილი დაწყვილება და ა.შ.).

გადაწყვეტის მეთოდის ტექნოლოგია. ინდიკატორების გაანგარიშება.

პირველ საფეხურზე, როდესაც თითოეული ობიექტი ცალკე კასეტურია, ამ ობიექტებს შორის მანძილი განისაზღვრება არჩეული საზომით.

ვინაიდან მახასიათებლების საზომი ერთეულები არ არის მითითებული პრობლემაში, ვარაუდობენ, რომ ისინი ემთხვევა. აქედან გამომდინარე, არ არის საჭირო საწყისი მონაცემების ნორმალიზება, ამიტომ დაუყოვნებლივ გადავდივართ მანძილის მატრიცის გაანგარიშებაზე.

პრობლემის გადაწყვეტა.

მოდით ავაშენოთ დამოკიდებულების გრაფიკი საწყის მონაცემებზე დაყრდნობით (ნახ. 2)

ავიღოთ ჩვეულებრივი ევკლიდური მანძილი, როგორც მანძილი ობიექტებს შორის. შემდეგ ფორმულის მიხედვით:

სადაც l - ნიშნები; k - მახასიათებლების რაოდენობა, მანძილი 1 და 2 ობიექტებს შორის არის:

ჩვენ ვაგრძელებთ დარჩენილი მანძილების გამოთვლას:

მიღებული მნიშვნელობებიდან ავაშენებთ ცხრილს:

ყველაზე პატარა მანძილი. ეს ნიშნავს, რომ ელემენტები 3,6 და 5 გაერთიანებულია ერთ კლასტერში. ჩვენ ვიღებთ შემდეგ ცხრილს:

ყველაზე პატარა მანძილი. 3,6,5 და 4 ელემენტები გაერთიანებულია ერთ კლასტერში.ჩვენ ვიღებთ ცხრილს ორი კლასტერიდან:

მინიმალური მანძილი 3 და 6 ელემენტებს შორის ტოლია. ეს ნიშნავს, რომ ელემენტები 3 და 6 გაერთიანებულია ერთ კლასტერში. ჩვენ ვირჩევთ მაქსიმალურ მანძილს ახლად წარმოქმნილ კლასტერსა და დანარჩენ ელემენტებს შორის. მაგალითად, მანძილი კლასტერსა და 3,6 კლასტერს შორის არის max(13.34166, 13.60147)= 13.34166. შევადგინოთ შემდეგი ცხრილი:

მასში მინიმალური მანძილი არის მანძილი 1 და 2 კლასტერებს შორის. 1 და 2 ერთ კლასტერში გაერთიანებით მივიღებთ:

ამრიგად, „შორეული მეზობლის“ მეთოდის გამოყენებით მიიღეს ორი კლასტერი: 1.2 და 3.4.5.6, რომელთა შორის მანძილი არის 13.60147.

პრობლემა მოგვარებულია.

აპლიკაციები. პრობლემების გადაჭრა აპლიკაციის პაკეტების გამოყენებით (MS Excel 7.0)

კორელაცია-რეგრესიული ანალიზის პრობლემა.

საწყის მონაცემებს შევიყვანთ ცხრილში (ნახ. 1)

აირჩიეთ მენიუ "სერვისი / მონაცემთა ანალიზი". გამოსულ ფანჯარაში აირჩიეთ ხაზი „რეგრესია“ (ნახ. 2).

შემდეგ ფანჯარაში დავაყენებთ შეყვანის ინტერვალებს X და Y-სთვის, დავტოვებთ სანდოობის დონეს 95%-ზე და გამომავალი მონაცემები განვათავსებთ ცალკე ფურცელზე „ანგარიშის ფურცელი“ (ნახ. 3).

გაანგარიშების შემდეგ, ჩვენ ვიღებთ რეგრესიის ანალიზის საბოლოო მონაცემებს "ანგარიშის ფურცელზე":

ის ასევე აჩვენებს მიახლოებითი ფუნქციის სკატერის დიაგრამას, ან „შერჩევის გრაფიკს“:


გამოთვლილი მნიშვნელობები და გადახრები ნაჩვენებია ცხრილში, შესაბამისად, სვეტებში "პროგნოზირებული Y" და "ნარჩენები".

საწყისი მონაცემებისა და გადახრების საფუძველზე აგებულია ნარჩენების გრაფიკი:

ოპტიმიზაციის პრობლემა


ჩვენ შევიყვანთ საწყის მონაცემებს შემდეგნაირად:

სასურველი უცნობი X1, X2, X3 შეყვანილია C9, D9, E9 უჯრედებში, შესაბამისად.

ობიექტური ფუნქციის კოეფიციენტები X1, X2, X3 შეყვანილია C7, D7, E7 შესაბამისად.

ობიექტური ფუნქცია შეყვანილია უჯრედში B11 ფორმულის სახით: =C7*C9+D7*D9+E7*E9.

დავალებაზე არსებული შეზღუდვები

მილსადენის სიგრძისთვის:

შეიყვანეთ უჯრედებში C5, D5, E5, F5, G5

ჭაბურღილების რაოდენობა თითოეულ ველზე:

X3 £100; შევდივართ უჯრედებში C8, D8, E8.

1 ჭაბურღილის მშენებლობის ღირებულება:

ჩვენ შევდივართ უჯრედებში C6, D6, E6, F6, G6.

C5*C9+D5*D9+E5*E9 ჯამური სიგრძის გამოთვლის ფორმულა მოთავსებულია B5 უჯრედში, C6*C9+D6*D9+E6*E9 ჯამური ღირებულების გამოთვლის ფორმულა მოთავსებულია B6 უჯრედში.


მენიუში ვირჩევთ „ინსტრუმენტები / გადაწყვეტის ძიება“, შეყვანილი საწყისი მონაცემების შესაბამისად შევიყვანთ გამოსავლის პოვნის პარამეტრებს (ნახ. 4):

ღილაკზე „პარამეტრები“ დაჭერით ამოხსნის საძიებლად ვაყენებთ შემდეგ პარამეტრებს (ნახ. 5):


გამოსავლის ძიების შემდეგ, ჩვენ ვიღებთ ანგარიშს შედეგების შესახებ:

Microsoft Excel 8.0e შედეგების ანგარიში

ანგარიში შეიქმნა: 17.11.2002 01:28:30

სამიზნე უჯრედი (მაქსიმალური)

შედეგი

მთლიანი წარმოება

ცვალებადი უჯრედები

შედეგი

ჭაბურღილების რაოდენობა

ჭაბურღილების რაოდენობა

ჭაბურღილების რაოდენობა

შეზღუდვები

მნიშვნელობა

სიგრძე

დაკავშირებული

პროექტის ღირებულება

არ არის დაკავშირებული.

ჭაბურღილების რაოდენობა

არ არის დაკავშირებული.

ჭაბურღილების რაოდენობა

დაკავშირებული

ჭაბურღილების რაოდენობა

დაკავშირებული

პირველ ცხრილში ნაჩვენებია სამიზნე უჯრედის საწყისი და საბოლოო (ოპტიმალური) მნიშვნელობა, რომელშიც მოთავსებულია მოგვარებული პრობლემის ობიექტური ფუნქცია. მეორე ცხრილში ჩვენ ვხედავთ ოპტიმიზირებული ცვლადების საწყის და საბოლოო მნიშვნელობებს, რომლებიც შეიცავს შესასაცვლელ უჯრედებში. შედეგების ანგარიშის მესამე ცხრილი შეიცავს ინფორმაციას შეზღუდვების შესახებ. სვეტი "ღირებულება" შეიცავს საჭირო რესურსებისა და ოპტიმიზებული ცვლადების ოპტიმალურ მნიშვნელობებს. სვეტი "ფორმულა" შეიცავს მოხმარებული რესურსების შეზღუდვებს და ოპტიმიზებულ ცვლადებს, რომლებიც დაწერილია ამ მონაცემების შემცველი უჯრედების მითითების სახით. სტატუსის სვეტი განსაზღვრავს, არის თუ არა ეს შეზღუდვები შეკრული თუ შეუზღუდავი. აქ „შეზღუდული“ არის შეზღუდვები, რომლებიც განხორციელებულია ოპტიმალურ გადაწყვეტაში ხისტი თანასწორობების სახით. რესურსების ლიმიტების სვეტი „განსხვავება“ განსაზღვრავს გამოყენებული რესურსების ბალანსს, ე.ი. სხვაობა რესურსების საჭირო რაოდენობასა და მათ ხელმისაწვდომობას შორის.

ანალოგიურად, გადაწყვეტის ძიების შედეგის ჩაწერით „ანგარიში მდგრადობის შესახებ“ სახით, ვიღებთ შემდეგ ცხრილებს:

Microsoft Excel 8.0e მდგრადობის ანგარიში

სამუშაო ფურცელი: [ოპტიმიზაციის პრობლემის გადაწყვეტა.xls] წარმოების ოპტიმიზაციის პრობლემის გადაწყვეტა

ანგარიში შეიქმნა: 17.11.2002 1:35:16 AM

ცვალებადი უჯრედები

დასაშვებია

დასაშვებია

მნიშვნელობა

ფასი

კოეფიციენტი

Მომატება

შემცირება

ჭაბურღილების რაოდენობა

ჭაბურღილების რაოდენობა

ჭაბურღილების რაოდენობა

შეზღუდვები

შეზღუდვა

დასაშვებია

დასაშვებია

მნიშვნელობა

მარჯვენა ნაწილი

Მომატება

შემცირება

სიგრძე

პროექტის ღირებულება

სტაბილურობის ანგარიში შეიცავს ინფორმაციას ცვლადის (ოპტიმიზებული) ცვლადების და მოდელის შეზღუდვების შესახებ. ეს ინფორმაცია დაკავშირებულია წრფივი ამოცანების ოპტიმიზაციისას გამოყენებული სიმპლექსის მეთოდთან, რომელიც ზემოთ იყო აღწერილი პრობლემის გადაჭრის თვალსაზრისით. ეს საშუალებას გაძლევთ შეაფასოთ რამდენად მგრძნობიარეა მიღებული ოპტიმალური გადაწყვეტა მოდელის პარამეტრების შესაძლო ცვლილებების მიმართ.

მოხსენების პირველი ნაწილი შეიცავს ინფორმაციას ცვლადი უჯრედების შესახებ, რომლებიც შეიცავს მნიშვნელობებს ველებში ჭაბურღილების რაოდენობის შესახებ. სვეტი "შედეგი მნიშვნელობა" მიუთითებს ოპტიმიზირებული ცვლადების ოპტიმალურ მნიშვნელობებზე. სვეტი „სამიზნე კოეფიციენტი“ შეიცავს ობიექტური ფუნქციის კოეფიციენტის მნიშვნელობების საწყის მონაცემებს. შემდეგი ორი სვეტი ასახავს ამ კოეფიციენტების დასაშვებ მატებას და შემცირებას ნაპოვნი ოპტიმალური ამოხსნის შეცვლის გარეშე.

სტაბილურობის ანგარიშის მეორე ნაწილი შეიცავს ინფორმაციას ოპტიმიზირებული ცვლადებზე დაწესებული შეზღუდვების შესახებ. პირველ სვეტში მითითებულია რესურსის მოთხოვნები ოპტიმალური გადაწყვეტისთვის. მეორე შეიცავს ჩრდილოვანი ფასების მნიშვნელობებს გამოყენებული რესურსების ტიპებისთვის. ბოლო ორი სვეტი შეიცავს მონაცემებს არსებული რესურსების ოდენობის შესაძლო ზრდის ან შემცირების შესახებ.

კლასტერიზაციის პრობლემა.

პრობლემის გადაჭრის ეტაპობრივი მეთოდი მოცემულია ზემოთ. აქ არის Excel ცხრილები, რომლებიც ასახავს პრობლემის გადაჭრის პროგრესს:

"უახლოესი მეზობლის მეთოდი"

კლასტერული ანალიზის ამოცანის ამოხსნა - "NAREST NEHBOR METHOD"

საწყისი მონაცემები

სადაც x1 არის გამომავალი მოცულობა;

x2 - მთავარის საშუალო წლიური ღირებულება

სამრეწველო წარმოების ფონდები

"შორეული მეზობლის მეთოდი"

კლასტერული ანალიზის პრობლემის გადაჭრა - „შორეული მეზობლის მეთოდი“

საწყისი მონაცემები

სადაც x1 არის გამომავალი მოცულობა;

x2 - მთავარის საშუალო წლიური ღირებულება

სამრეწველო წარმოების ფონდები

საექსპერტო შეფასებების პრეზენტაცია და წინასწარი დამუშავება

პრაქტიკაში გამოიყენება შეფასების რამდენიმე ტიპი:

- ხარისხი (ხშირად-იშვიათად, უარესი-უკეთესი, დიახ-არა),

- მასშტაბის ქულები (მნიშვნელობების დიაპაზონი 50-75, 76-90, 91-120 და ა.შ.),

ქულები მოცემული ინტერვალიდან (2-დან 5-მდე, 1-10), ურთიერთდამოუკიდებლად,

რანჟირებული (ობიექტები განლაგებულია ექსპერტის მიერ გარკვეული თანმიმდევრობით და თითოეულს ენიჭება სერიული ნომერი - წოდება),

შედარებითი მიღებული შედარების ერთ-ერთი მეთოდით

თანმიმდევრული შედარების მეთოდი

ფაქტორების წყვილთა შედარების მეთოდი.

საექსპერტო დასკვნის დამუშავების შემდეგ ეტაპზე აუცილებელია შეფასება ამ შეხედულებებს შორის შეთანხმების ხარისხი.

ექსპერტებისგან მიღებული შეფასებები შეიძლება ჩაითვალოს შემთხვევით ცვლადად, რომლის განაწილება ასახავს ექსპერტების მოსაზრებებს მოვლენის (ფაქტორის) ამა თუ იმ არჩევანის ალბათობის შესახებ. ამიტომ, ექსპერტთა შეფასებების გაფანტვისა და თანმიმდევრულობის გასაანალიზებლად გამოიყენება განზოგადებული სტატისტიკური მახასიათებლები - საშუალო და გაფანტული ზომები:

საშუალო კვადრატული შეცდომა,

ვარიაციების დიაპაზონი მინ - მაქს,

- ვარიაციის კოეფიციენტი V \u003d rms. devi. / არითმი. საშუალო. (გამოდგება ნებისმიერი ტიპის შეფასებისთვის)

V i = σ i / x i შდრ

განაკვეთისთვის მსგავსების ზომებიმაგრამ მოსაზრებები ექსპერტების თითოეული წყვილისხვადასხვა მეთოდის გამოყენება შეიძლება:

ასოციაციის კოეფიციენტები, რომელიც ითვალისწინებს შესატყვისი და შეუსაბამო პასუხების რაოდენობას,

შეუსაბამობის კოეფიციენტებიექსპერტების მოსაზრებები,

ყველა ეს ზომა შეიძლება გამოყენებულ იქნას ან ორი ექსპერტის მოსაზრებების შესადარებლად, ან ორ კრიტერიუმზე შეფასებების სერიას შორის კავშირის გასაანალიზებლად.

სპირმენის წყვილის რანგის კორელაციის კოეფიციენტი:

სადაც n არის ექსპერტების რაოდენობა,

c k არის სხვაობა i-ე და j-th ექსპერტების შეფასებებს შორის ყველა T ფაქტორისთვის

კენდალის რანგის კორელაციის კოეფიციენტი (შესაბამისობის კოეფიციენტი) იძლევა საერთო შეფასებას ყველა ექსპერტის მოსაზრებების თანმიმდევრულობის შესახებ ყველა ფაქტორზე, მაგრამ მხოლოდ იმ შემთხვევისთვის, როდესაც გამოყენებული იყო რანგის შეფასება.

დადასტურებულია, რომ S-ის მნიშვნელობა, როდესაც ყველა ექსპერტი ყველა ფაქტორს ერთნაირად აფასებს, აქვს მაქსიმალური მნიშვნელობა ტოლი

სადაც n არის ფაქტორების რაოდენობა,

m არის ექსპერტების რაოდენობა.

შესაბამისობის კოეფიციენტი თანაფარდობის ტოლია

უფრო მეტიც, თუ W არის 1-თან ახლოს, მაშინ ყველა ექსპერტმა საკმაოდ თანმიმდევრული შეფასება მისცა, წინააღმდეგ შემთხვევაში მათი მოსაზრებები არათანმიმდევრულია.

S-ის გამოთვლის ფორმულა მოცემულია ქვემოთ:

სადაც r ij - j-ე ექსპერტის მიერ i-ე ფაქტორის რანჟირების შეფასება,

r cf - საშუალო რანგი შეფასებების მთელ მატრიცაზე და უდრის

და, შესაბამისად, S-ის გამოთვლის ფორმულას შეუძლია მიიღოს ფორმა:

თუ ერთი ექსპერტის ინდივიდუალური ქულები ერთნაირია და ისინი სტანდარტიზებულია დამუშავების დროს, მაშინ შესაბამისობის კოეფიციენტის გამოსათვლელად გამოიყენება სხვა ფორმულა:



სადაც T j გამოითვლება თითოეული ექსპერტისთვის (იმ შემთხვევაში, თუ მისი შეფასებები განმეორდა სხვადასხვა ობიექტზე), გამეორებების გათვალისწინებით შემდეგი წესების მიხედვით:

სადაც t j არის თანაბარი რანგის ჯგუფების რაოდენობა j-ე ექსპერტისთვის და

h k - თანაბარი წოდებების რაოდენობა j-ე ექსპერტის მონათესავე წოდებების k-ე ჯგუფში.

მაგალითი. დაე, ექვს ფაქტორზე 5 ექსპერტმა უპასუხოს რანჟირებისას, როგორც ნაჩვენებია ცხრილში 3:

ცხრილი 3 - ექსპერტების პასუხები

ექსპერტები O1 O2 O3 O4 O5 O6 წოდებების ჯამი ექსპერტის მიხედვით
E1
E2
E3
E4
E5

იმის გამო, რომ მიღებულია არა მკაცრი რეიტინგი (ექსპერტების შეფასებები მეორდება და წოდებების ჯამები არ არის თანაბარი), ჩვენ გარდაქმნით შეფასებებს და მივიღებთ ასოცირებულ წოდებებს (ცხრილი 4):

ცხრილი 4 - ექსპერტთა რეიტინგების შესაბამისი წოდებები

ექსპერტები O1 O2 O3 O4 O5 O6 წოდებების ჯამი ექსპერტის მიხედვით
E1 2,5 2,5
E2
E3 1,5 1,5 4,5 4,5
E4 2,5 2,5 4,5 4,5
E5 5,5 5,5
წოდებების ჯამი ობიექტის მიხედვით 7,5 9,5 23,5 29,5

ახლა მოდით განვსაზღვროთ ექსპერტთა მოსაზრებების შეთანხმების ხარისხი შესაბამისობის კოეფიციენტის გამოყენებით. ვინაიდან წოდებები დაკავშირებულია, ჩვენ გამოვთვალოთ W ფორმულის გამოყენებით (**).

შემდეგ r cf \u003d 7 * 5 / 2 \u003d 17.5

S = 10 2 +8 2 +4.5 2 +4.5 2 +6 2 +12 2 = 384.5

გადავიდეთ W-ის გამოთვლაზე. ამისათვის ჩვენ ცალკე ვიანგარიშებთ T j-ის მნიშვნელობებს. მაგალითში ნიშნები სპეციალურად არის შერჩეული ისე, რომ თითოეულ ექსპერტს ჰქონდეს განმეორებითი ნიშნები: 1-ს აქვს ორი, მეორეს აქვს სამი, მესამეს აქვს ორი ჯგუფი ორი ნიშნით, მეოთხე და მეხუთე აქვს ორი იდენტური ნიშანი. აქედან:

T 1 \u003d 2 3 - 2 \u003d 6 T 5 \u003d 6

T 2 \u003d 3 3 - 3 \u003d 24

T 3 \u003d 2 3 -2+ 2 3 -2 \u003d 12 T 4 \u003d 12

ჩვენ ვხედავთ, რომ ექსპერტთა მოსაზრებების კონსენსუსი საკმაოდ მაღალია და შესაძლებელია გადავიდეს კვლევის შემდეგ ეტაპზე - ექსპერტების მიერ რეკომენდებული ალტერნატიული გადაწყვეტის დასაბუთება და მიღება.

წინააღმდეგ შემთხვევაში, თქვენ უნდა დაუბრუნდეთ ნაბიჯებს 4-8.

რანგის კორელაციის კენდალის კოეფიციენტი

ორი შემთხვევითი ცვლადის (მახასიათებლის) დამოკიდებულების ერთ-ერთი საზომი X და Y,ნიმუშის ელემენტების რანჟირების საფუძველზე (X 1, Y x), .. ., (Х n, Y n). კ.კ რ. შესაბამისად, ეხება სტატისტიკოსების რეიტინგშიდა განისაზღვრება ფორმულით

სადაც რ ი- შენ იმ წყვილს ეკუთვნი ( X, Y), რისთვისაც Xraven მე, S = 2N-(n-1)/2, N- ნიმუში ელემენტების რაოდენობა, რომლისთვისაც j>i და რჟ >რ ი. Ყოველთვის არის როგორც დამოკიდებულების შერჩევითი საზომი კ. ფართოდ იყენებდა მ.კენდალს (მ. კენდალი, იხ.).

კ.კ რ. შემთხვევითი ცვლადების დამოუკიდებლობის ჰიპოთეზის შესამოწმებლად გამოიყენება k. თუ დამოუკიდებლობის ჰიპოთეზა მართალია, მაშინ E t =0 და D t =2(2n+5)/9n(n-1). მცირე ნიმუშის ზომით, სტატისტიკის შემოწმება დამოუკიდებლობის ჰიპოთეზები მზადდება სპეციალური ცხრილების გამოყენებით (იხ.). n>10-ისთვის გამოიყენება m-ის განაწილების ნორმალური მიახლოება: თუ

მაშინ დამოუკიდებლობის ჰიპოთეზა უარყოფილია, წინააღმდეგ შემთხვევაში მიიღება. აქ ა . - მნიშვნელოვნების დონე, u a /2 არის ნორმალური განაწილების პროცენტული წერტილი. კ.კ რ. k., ისევე როგორც ნებისმიერი, შეიძლება გამოყენებულ იქნას ორი თვისებრივი მახასიათებლის დამოკიდებულების დასადგენად, თუ მხოლოდ ნიმუშის ელემენტების შეკვეთა შესაძლებელია ამ მახასიათებლების მიმართ. Თუ X, Yაქვს ერთობლივი ნორმა კორელაციის კოეფიციენტით p, მაშინ კავშირი K-ს შორის. და აქვს ფორმა:

იხილეთ ასევე Spearman წოდების კორელაცია, რანგის ტესტი.

განათებული: კენდალ მ., რანგის კორელაციები, ტრანს. ინგლისურიდან, მ., 1975; Van der Waerden B. L., მათემატიკური, თარგმანი. გერმანულიდან, მ., 1960; ბოლშევი ლ.ნ., სმირნოვი ნ.ვ., მათემატიკური სტატისტიკის ცხრილები, მ., 1965 წ.

A.V. პროხოროვი.


მათემატიკური ენციკლოპედია. - მ.: საბჭოთა ენციკლოპედია. I. M. ვინოგრადოვი. 1977-1985 წწ.

ნახეთ, რა არის "KENDALL RANK COEFFICIENT" სხვა ლექსიკონებში:

    ინგლისური ეფექტური, რანგის კორელაციით კენდალი; გერმანული კენდალს რანგკორელაციის ეფექტურობა. კორელაციის კოეფიციენტი, რომელიც განსაზღვრავს ობიექტების ყველა წყვილის ორი ცვლადის მიხედვით დალაგების შესაბამისობის ხარისხს. ანტინაზი. სოციოლოგიის ენციკლოპედია, 2009 ... სოციოლოგიის ენციკლოპედია

    კენდალის რანგის კოეფიციენტი- ინგლისური. ეფექტური, რანგის კორელაცია კენდალი; გერმანული კენდალს რანგკორელაციის ეფექტურობა. კორელაციის კოეფიციენტი, რომელიც განსაზღვრავს ობიექტების ყველა წყვილის დალაგების შესაბამისობის ხარისხს ორი ცვლადით ... სოციოლოგიის განმარტებითი ლექსიკონი

    ორი შემთხვევითი ცვლადის (მახასიათებლების) X და Y დამოკიდებულების საზომი, დამოუკიდებელი დაკვირვების შედეგების რეიტინგის საფუძველზე (X1, Y1), . . ., (Xn,Yn). თუ X მნიშვნელობების რიგები არის ბუნებრივი რიგით i=1, . . ., n,a Ri წოდება Y, რომელიც შეესაბამება…… მათემატიკური ენციკლოპედია

    Კორელაციის კოეფიციენტი- (კორელაციის კოეფიციენტი) კორელაციის კოეფიციენტი არის ორი შემთხვევითი ცვლადის დამოკიდებულების სტატისტიკური მაჩვენებელი. ინვესტორის ენციკლოპედია

    დამოკიდებულება შემთხვევით ცვლადებს შორის, რომელსაც, ზოგადად რომ ვთქვათ, არ აქვს მკაცრად ფუნქციონალური ხასიათი. ფუნქციური დამოკიდებულებისგან განსხვავებით, K., როგორც წესი, განიხილება, როდესაც ერთ-ერთი რაოდენობა დამოკიდებულია არა მხოლოდ მოცემულ მეორეზე, არამედ ... ... მათემატიკური ენციკლოპედია

    კორელაცია (კორელაციის დამოკიდებულება) არის სტატისტიკური კავშირი ორ ან მეტ შემთხვევით ცვლადს შორის (ან ცვლადებს, რომლებიც შეიძლება ჩაითვალოს ასეთად გარკვეული მისაღები სიზუსტით). ამავდროულად, იცვლება ერთი ან ... ... ვიკიპედიის მნიშვნელობები

    კორელაცია- (კორელაცია) კორელაცია არის ორი ან მეტი შემთხვევითი ცვლადის სტატისტიკური ურთიერთობა. ინვესტორის ენციკლოპედია

    ზოგადად მიღებულია, რომ დასაწყისი ს. ან, როგორც მას ხშირად უწოდებენ, "მცირე n" სტატისტიკა, შეიქმნა მე-20 საუკუნის პირველ ათწლეულში W. Gosset-ის ნაშრომის გამოქვეყნებით, რომელშიც მან მოათავსა პოსტულირებული მსოფლიო განაწილებით პოსტულირებული t განაწილება. ცოტა მოგვიანებით...... ფსიქოლოგიური ენციკლოპედია

    მორის კენდალი სერ მორის ჯორჯ კენდალი დაბადების თარიღი: 1907 წლის 6 სექტემბერი (1907 09 06) დაბადების ადგილი: კეტერინგი, გაერთიანებული სამეფო გარდაცვალების თარიღი ... ვიკიპედია

    პროგნოზი- (პროგნოზი) პროგნოზის განსაზღვრა, ამოცანები და პროგნოზირების პრინციპები პროგნოზის განსაზღვრა, ამოცანები და პროგნოზირების პრინციპები, პროგნოზირების მეთოდები სარჩევი შინაარსი განმარტება პროგნოზირების ძირითადი ცნებები ამოცანები და პროგნოზირების პრინციპები ... ... ინვესტორის ენციკლოპედია