მულტიკოლნეარობის განმარტება. მულტიკოლინეარობის მიზეზები და შედეგები

მულტიკოლინეარულობაარის წრფივი კავშირი ორ ან მეტ ფაქტორულ ცვლადს შორის მრავალჯერადი რეგრესიის განტოლებაში. თუ ასეთი დამოკიდებულება ფუნქციონალურია, მაშინ საუბარია სრული მულტიკოლინეარულობა... თუ ეს არის კორელაცია, მაშინ ნაწილობრივი მულტიკოლინარობა... თუ სრული მულტიკოლნეარულობა უფრო თეორიული აბსტრაქციაა (ის ვლინდება, კერძოდ, თუ ცვლადი, რომელსაც აქვს კხარისხის დონეები, შეცვალეთ კდიქოტომიური ცვლადები), მაშინ ნაწილობრივი მულტიკოლნეარულობა ძალიან რეალურია და თითქმის ყოველთვის არის წარმოდგენილი. მხოლოდ მისი სიმძიმის ხარისხზე შეგვიძლია ვისაუბროთ. მაგალითად, თუ განმარტებითი ცვლადები მოიცავს ერთჯერად შემოსავალს და მოხმარებას, მაშინ ორივე ეს ცვლადი, რა თქმა უნდა, იქნება მაღალი კორელაცია.

მულტიკოლინეარობის არარსებობა კლასიკური ხაზოვანი მრავალჯერადი მოდელის ერთ-ერთი სასურველი წინაპირობაა. ეს გამოწვეულია შემდეგი მოსაზრებებით:

1) სრული მულტიკოლნეარობის შემთხვევაში, ზოგადად შეუძლებელია წრფივი მრავალჯერადი რეგრესიის პარამეტრების შეფასების აგება OLS-ის გამოყენებით.

2) ნაწილობრივი მულტიკოლნეარობის შემთხვევაში, რეგრესიის პარამეტრების შეფასებები შეიძლება იყოს არასანდო და, გარდა ამისა, ძნელი დადგენა

ფაქტორების იზოლირებული წვლილი ეფექტურ მაჩვენებელში.

მულტიკოლინეარობის წარმოქმნის მთავარი მიზეზი არის პროცესების შესწავლილ ობიექტში არსებობა, რომლებიც ერთდროულად გავლენას ახდენენ შეყვანის ზოგიერთ ცვლადზე, მაგრამ არ არის გათვალისწინებული მოდელში. ეს შეიძლება იყოს საგნის არეალის უხარისხო შესწავლის ან შესწავლილი ობიექტის პარამეტრების ურთიერთდამოკიდებულების სირთულის შედეგი.

მულტიკოლინეარულობა ეჭვმიტანილია:

- მოდელში უმნიშვნელო ფაქტორების დიდი რაოდენობა;

- რეგრესიის პარამეტრების დიდი სტანდარტული შეცდომები;

- შეფასებების არასტაბილურობა (საწყის მონაცემებში მცირე ცვლილება იწვევს მნიშვნელოვან ცვლილებას).

ერთ-ერთი მიდგომა მულტიკოლინეარობის არსებობის ან არარსებობის დასადგენად არის კორელაციის მატრიცის ანალიზი

ახსნა ცვლადებს შორის და მაღალი წყვილის კორელაციის კოეფიციენტებით (ჩვეულებრივ 0,7-ზე მეტი) ფაქტორების წყვილის იდენტიფიცირებას შორის. თუ ასეთი ფაქტორები არსებობს, მაშინ მათ შორის აშკარა კოლინარობაა.

თუმცა, დაწყვილებული კორელაციის კოეფიციენტები, რომლებიც ინდივიდუალურად განიხილება, არ შეუძლია შეაფასოს რამდენიმე ფაქტორის (და არა მხოლოდ ორი) კუმულაციური ურთიერთქმედება.

ამიტომ, მოდელში მულტიკოლნეარობის არსებობის შესაფასებლად, ფაქტორებს შორის წყვილი კორელაციის კოეფიციენტების მატრიცის განმსაზღვრელი ( ინტერფაქტორების კორელაციის მატრიცის განმსაზღვრელი)

რაც უფრო უახლოვდება ინტერფაქტორების კორელაციის მატრიცის განმსაზღვრელი 0-ს, მით უფრო ძლიერია მულტიკოლინეარულობა და პირიქით, რაც უფრო ახლოსაა განმსაზღვრელი 1-თან, მით ნაკლებია მულტიკოლნეარულობა.

ფაქტორების მულტიკოლნეარობის სტატისტიკური მნიშვნელობა განისაზღვრება ნულოვანი ჰიპოთეზის შემოწმებით ალტერნატიული ჰიპოთეზის ქვეშ. ნულოვანი ჰიპოთეზის შესამოწმებლად გამოიყენება პირსონის განაწილება თავისუფლების ხარისხით. სტატისტიკის დაკვირვებული მნიშვნელობა გვხვდება ფორმულით, სადაც ნ- დაკვირვებების რაოდენობა, მ- ფაქტორების რაოდენობა. მოცემული მნიშვნელოვნების დონისთვის კრიტიკული მნიშვნელობა განისაზღვრება პირსონის განაწილების კრიტიკული წერტილების ცხრილიდან. თუ, მაშინ ჰიპოთეზა უარყოფილია და მიჩნეულია, რომ მოდელში არსებობს ფაქტორების მულტიკოლინარულობა.

მულტიკოლინეარულობაზე მოქმედი ფაქტორების გამოყოფა შესაძლებელია აგრეთვე მრავალჯერადი განსაზღვრის კოეფიციენტების ანალიზით, გამოთვლილი იმ პირობით, რომ თითოეული ფაქტორი განიხილება, როგორც სხვა ფაქტორების დამოკიდებულ ცვლადად:,,…,. რაც უფრო ახლოს არიან ისინი 1-თან, მით უფრო ძლიერია ფაქტორების მრავალმხრივობა. ეს ნიშნავს, რომ ფაქტორები მრავალჯერადი განსაზღვრის კოეფიციენტის მინიმალური მნიშვნელობით უნდა დარჩეს განტოლებაში.

რაც შეეხება სრულ მულტიკოლინეარობას, მას ყველაზე გადამწყვეტი ბრძოლა უნდა აწარმოოთ: დაუყოვნებლივ ამოიღეთ რეგრესიის განტოლებიდან ცვლადები, რომლებიც სხვა ცვლადების წრფივი კომბინაციებია.

ნაწილობრივი მულტიკოლინეარულობა არ არის ისეთი სერიოზული ბოროტება, რომ მისი იდენტიფიცირება და აღმოფხვრა უნდა მოხდეს. ეს ყველაფერი დამოკიდებულია კვლევის მიზნებზე. თუ მოდელირების მთავარი ამოცანაა მხოლოდ დამოკიდებული ცვლადის მნიშვნელობების პროგნოზირება, მაშინ განსაზღვრის საკმარისად დიდი კოეფიციენტით () მულტიკოლნეარობის არსებობა გავლენას არ ახდენს მოდელის პროგნოზირებულ თვისებებზე. თუ მოდელირების მიზანია ასევე განსაზღვროს თითოეული ფაქტორის წვლილი დამოკიდებული ცვლადის ცვლილებაში, მაშინ მულტიკოლინეარობის არსებობა სერიოზული პრობლემაა.

მულტიკოლინეარობის აღმოფხვრის უმარტივესი მეთოდია მოდელიდან ერთი ან რამდენიმე კორელაციური ცვლადის გამორიცხვა.

ვინაიდან მულტიკოლნეარობა პირდაპირ დამოკიდებულია ნიმუშზე, შესაძლებელია, რომ განსხვავებული ნიმუშით, საერთოდ არ იყოს მულტიკოლნეარულობა, ან არც იყოს ისეთი სერიოზული. ამიტომ, მულტიკოლნეარობის შესამცირებლად, ზოგიერთ შემთხვევაში, საკმარისია ნიმუშის ზომის გაზრდა.

ზოგჯერ მულტიკოლნეარობის პრობლემა შეიძლება მოგვარდეს მოდელის სპეციფიკაციის შეცვლით: ან იცვლება მოდელის ფორმა, ან ემატება ფაქტორები, რომლებიც არ იყო გათვალისწინებული თავდაპირველ მოდელში, მაგრამ მნიშვნელოვნად მოქმედებს დამოკიდებულ ცვლადზე.

ზოგიერთ შემთხვევაში, მულტიკოლინეარულობა შეიძლება შემცირდეს ან მთლიანად აღმოიფხვრას ფაქტორების ცვლადების გარდაქმნით. ამ შემთხვევაში, შემდეგი ტრანსფორმაციები ყველაზე გავრცელებულია:

1. მულტიკოლინეარული ცვლადების ხაზოვანი კომბინაცია (მაგალითად,).

2. მულტიკოლინეარული ცვლადის ჩანაცვლება მისი ნაზრდით.

3. ერთი კოლინარული ცვლადის გაყოფა მეორეზე.

დავუშვათ, განვიხილავთ რეგრესიის განტოლებას და მისი შეფასების მონაცემები შეიცავს დაკვირვებებს სხვადასხვა ხარისხის ობიექტებზე: მამაკაცებისთვის და ქალებისთვის, თეთრებისთვის და შავებისთვის. კითხვა, რომელიც შეიძლება დაგვინტერესოს აქ არის შემდეგი - მართალია თუ არა, რომ განსახილველი მოდელი ემთხვევა ორ ნიმუშს, რომლებიც დაკავშირებულია სხვადასხვა ხარისხის ობიექტებთან? ამ კითხვაზე პასუხის გაცემა შეგიძლიათ Chow ტესტის გამოყენებით.

განვიხილოთ მოდელები:

, მე=1,…,ნ (1);

, მე=ნ+1,…,ნ+მ (2).

პირველ ნიმუშში ნდაკვირვებები, მეორეში - მდაკვირვებები. მაგალითი: ი- ხელფასები, ახსნის ცვლადები - ასაკი, სტაჟი, განათლების დონე. არსებული მონაცემებიდან გამომდინარეობს თუ არა, რომ ხელფასების დამოკიდებულების მოდელი მარჯვენა მხარეს მდებარე განმარტებით ცვლადებზე ერთნაირია მამაკაცებისთვის და ქალებისთვის?

ამ ჰიპოთეზის შესამოწმებლად, შეგიძლიათ გამოიყენოთ ზოგადი ჰიპოთეზის ტესტირების სქემა შეზღუდული რეგრესიის და შეუზღუდავი რეგრესიის შედარების გზით. რეგრესია შეზღუდვების გარეშე აქ არის რეგრესიის (1) და (2) გაერთიანება, ე.ი. ESS UR = ESS 1 + ESS 2, თავისუფლების ხარისხების რაოდენობა - ნ + მ - 2კ... შეზღუდული რეგრესია (ე.ი. რეგრესია იმ ვარაუდით, რომ ნულოვანი ჰიპოთეზა შესრულებულია) იქნება რეგრესია დაკვირვებების მთელი ხელმისაწვდომი ნაკრებისთვის:

, მე = 1,…, ნ+მ (3).

(3) შეფასებით ვიღებთ ESS R... ნულოვანი ჰიპოთეზის შესამოწმებლად ვიყენებთ შემდეგ სტატისტიკას:

რომელსაც, თუ ნულოვანი ჰიპოთეზა ჭეშმარიტია, აქვს ფიშერის განაწილება მრიცხველის თავისუფლების ხარისხით. კდა მნიშვნელი ნ+ მ- 2კ.

თუ ნულოვანი ჰიპოთეზა მართალია, ჩვენ შეგვიძლია გავაერთიანოთ არსებული ნიმუშები და შევაფასოთ მოდელი ნ+მდაკვირვებები. თუ ჩვენ უარვყოფთ ნულოვანი ჰიპოთეზას, მაშინ ვერ გავაერთიანებთ ორ ნიმუშს ერთში და ამ ორი მოდელის ცალ-ცალკე შეფასება მოგვიწევს.

ზოგადი ხაზოვანი მოდელის შესწავლა, რომელიც ადრე განვიხილეთ, ძალზე არსებითია, როგორც ვნახეთ, სტატისტიკურ აპარატზე დაყრდნობით. თუმცა, როგორც ყველა განაცხადში მათე. სტატისტიკის თანახმად, მეთოდის სიძლიერე დამოკიდებულია მის საფუძველში არსებულ და მისი გამოყენებისთვის აუცილებელ დაშვებებზე. გარკვეული პერიოდის განმავლობაში განვიხილავთ სიტუაციებს, როდესაც დარღვეულია ერთი ან რამდენიმე ჰიპოთეზა, რომელიც საფუძვლად უდევს ხაზოვან მოდელს. ამ შემთხვევებში განვიხილავთ შეფასების ალტერნატიულ მეთოდებს. ჩვენ დავინახავთ, რომ ზოგიერთი ჰიპოთეზის როლი უფრო მნიშვნელოვანია, ვიდრე სხვების როლი. ჩვენ უნდა დავინახოთ, რა შედეგები შეიძლება მოჰყვეს გარკვეული პირობების (დაშვებების) დარღვევას, შევძლოთ შევამოწმოთ ისინი დაკმაყოფილებულია თუ არა და ვიცოდეთ რა სტატისტიკური მეთოდები შეიძლება და უნდა იქნას გამოყენებული, როდესაც კლასიკური უმცირესი კვადრატების მეთოდი არ არის შესაფერისი.

1. ცვლადებს შორის კავშირი წრფივია და გამოიხატება განტოლებით - მოდელის სპეციფიკაციის შეცდომები (განტოლებაში მნიშვნელოვანი განმარტებითი ცვლადების არ ჩართვა, განტოლებაში არასაჭირო ცვლადების ჩართვა, დამოკიდებულების ფორმის არასწორი არჩევანი განტოლებაში. ცვლადები);

2. X 1 ,…,X კ- განმსაზღვრელი ცვლადები - სტოქასტური რეგრესორები, წრფივად დამოუკიდებელი - სრული მულტიკოლნეარულობა;

4. - ჰეტეროსკედასტიურობა;

5.როდის მე ¹ კ- შეცდომების ავტოკორელაცია

საუბრის დაწყებამდე განიხილეთ შემდეგი ცნებები: წყვილის კორელაციის კოეფიციენტი და ნაწილობრივი კორელაციის კოეფიციენტი.

დავუშვათ, რომ ჩვენ ვიკვლევთ ერთი ცვლადის გავლენას მეორე ცვლადზე ( იდა X). იმისათვის, რომ გავიგოთ, თუ როგორ არის ეს ცვლადები ერთმანეთთან დაკავშირებული, ჩვენ ვიანგარიშებთ წყვილის კორელაციის კოეფიციენტს შემდეგი ფორმულის გამოყენებით:

თუ კორელაციის კოეფიციენტის მნიშვნელობას მივიღებთ 1-თან ახლოს, დავასკვნით, რომ ცვლადები საკმაოდ მჭიდრო კავშირშია ერთმანეთთან.

თუმცა, თუ ინტერესის ორ ცვლადს შორის კორელაციის კოეფიციენტი 1-ს უახლოვდება, ისინი შეიძლება რეალურად არ იყოს დამოკიდებული. ფსიქიკურად დაავადებულთა და რადიოს შემთხვევა არის მაგალითი იმისა, რასაც „ცრუ კორელაცია“ ჰქვია. კორელაციის კოეფიციენტის მაღალი მნიშვნელობა შესაძლოა განპირობებული იყოს მესამე ცვლადის არსებობითაც, რომელიც ძლიერ გავლენას ახდენს პირველ ორ ცვლადზე, რაც მათი მაღალი კორელაციის მიზეზია. აქედან გამომდინარე, პრობლემა ჩნდება ცვლადებს შორის „სუფთა“ კორელაციის გაანგარიშებისას Xდა ი, ანუ კორელაცია, რომელშიც სხვა ცვლადების გავლენა (წრფივი) გამორიცხულია. ამისათვის შემოღებულია ნაწილობრივი კორელაციის კოეფიციენტის კონცეფცია.

ასე რომ, ჩვენ გვინდა განვსაზღვროთ ცვლადებს შორის ნაწილობრივი კორელაციის კოეფიციენტი Xდა იცვლადის წრფივი გავლენის გამოკლებით ზ... მის დასადგენად გამოიყენება შემდეგი პროცედურა:

1. ჩვენ ვაფასებთ რეგრესიას,

2. ვიღებთ ნარჩენებს,

3. ჩვენ ვაფასებთ რეგრესიას,

4. ვიღებთ ნარჩენებს,

5. - ნაწილობრივი კორელაციის ნიმუშის კოეფიციენტი, ზომავს ცვლადებს შორის ურთიერთობის ხარისხს Xდა იცვლადის გავლენისგან გასუფთავებული ზ.

პირდაპირი გამოთვლები:

საკუთრება:

ნაწილობრივი კორელაციის კოეფიციენტის აგების პროცედურა განზოგადებულია იმ შემთხვევაში, თუ გვინდა თავი დავაღწიოთ ორი ან მეტი ცვლადის გავლენისგან.

1. იდეალური მულტიკოლინეარულობა.

გაუს-მარკოვის ერთ-ერთი მოთხოვნა გვეუბნება, რომ განმარტებითი ცვლადები არ უნდა იყოს დაკავშირებული რაიმე ზუსტ ურთიერთობაში. თუ ასეთი კავშირი არსებობს ცვლადებს შორის, ჩვენ ვამბობთ, რომ მოდელს აქვს სრულყოფილი მულტიკოლინიარულობა. მაგალითი. განვიხილოთ მოდელი საგამოცდო საშუალო ქულით, რომელიც შედგება სამი განმარტებითი ცვლადისგან: მე- მშობლების შემოსავალი, დ- ტრენინგზე დახარჯული საათების საშუალო რაოდენობა დღეში, ვ- კვირაში ვარჯიშზე დახარჯული საათების საშუალო რაოდენობა. აშკარაა რომ ვ=7დ... და ეს თანაფარდობა შესრულდება თითოეული სტუდენტისთვის, რომელიც მოხვდება ჩვენს ნიმუშში. სრული მულტიკოლნეარობის შემთხვევა მარტივია, რადგან ამ შემთხვევაში შეუძლებელია შეფასებების აგება უმცირესი კვადრატების მეთოდით.

2. ნაწილობრივი მულტიკოლნეარულობა ან უბრალოდ მულტიკოლნეარულობა.

ბევრად უფრო გავრცელებული სიტუაციაა, როდესაც არ არის ზუსტი წრფივი კავშირი ახსნა-განმარტებებს შორის, მაგრამ არის მათ შორის მჭიდრო კორელაცია - ამ შემთხვევას ეწოდება რეალური ან ნაწილობრივი მულტიკოლნეარულობა (უბრალოდ მულტიკოლნეარულობა) - ცვლადებს შორის მჭიდრო სტატისტიკური ურთიერთობების არსებობა. უნდა ითქვას, რომ მულტიკოლნეარობის საკითხი უფრო ფენომენის გამოვლინების ხარისხზეა, ვიდრე მის ტიპზე. ნებისმიერი რეგრესიის ქულა დაზარალდება მას ამა თუ იმ ფორმით, თუ ყველა ახსნა-განმარტებადი ცვლადი სრულიად შეუსაბამოა. ამ პრობლემის განხილვა იწყება მხოლოდ მაშინ, როდესაც ის იწყებს სერიოზულ გავლენას რეგრესიული შეფასების შედეგებზე (რეგრესორებს შორის სტატისტიკური ურთიერთობების არსებობა სულაც არ იძლევა არადამაკმაყოფილებელ შეფასებებს). ასე რომ, მულტიკოლინეარულობა არის პრობლემა, სადაც მჭიდრო კორელაცია რეგრესორებს შორის იწვევს არასანდო რეგრესიის შეფასებებს.

მულტიკოლინეარობის შედეგები:

ფორმალურად მას შემდეგ, რაც ( X"X) არის არადეგენერატი, მაშინ ჩვენ შეგვიძლია ავაშენოთ OLS შეფასებები რეგრესიის კოეფიციენტებზე. თუმცა, გავიხსენოთ, როგორ არის გამოხატული რეგრესიის კოეფიციენტების შეფასებების თეორიული დისპერსიები:, სადაც ii - მემატრიცის დიაგონალური ელემენტი. ვინაიდან მატრიცა (X "X) ახლოს არის დეგენერატთან და დეტთან ( X"X) »0, მაშინ

1) შებრუნებული მატრიცის მთავარ დიაგონალზე არის ძალიან დიდი რიცხვები, რადგან შებრუნებული მატრიცის ელემენტები უკუპროპორციულია დეტთან ( X"X). აქედან გამომდინარე, თეორიული განსხვავება მე-ე კოეფიციენტი საკმარისად დიდია და დისპერსიის შეფასებაც დიდია, შესაბამისად, ტ- სტატისტიკა მცირეა, რამაც შეიძლება გამოიწვიოს სტატისტიკური უმნიშვნელობა მეკოეფიციენტი. ანუ ცვლადი მნიშვნელოვან გავლენას ახდენს ახსნილ ცვლადზე და ჩვენ ვასკვნით, რომ ის უმნიშვნელოა.

2) ვინაიდან შეფასებები და დამოკიდებულია ( X"X) -1, რომლის ელემენტები უკუპროპორციულია დეტთან ( X"X), მაშინ თუ დავამატებთ ან წავშლით ერთ ან ორ დაკვირვებას, დავამატებთ ან ამოვიღებთ მატრიცას ერთ ან ორ სტრიქონს. X"X, შემდეგ მნიშვნელობები და შეიძლება მნიშვნელოვნად შეიცვალოს ნიშნის ცვლილებამდე - შეფასების შედეგების არასტაბილურობა.

3) რეგრესიის განტოლების ინტერპრეტაციის სირთულე. ვთქვათ, განტოლებაში გვაქვს ორი ცვლადი, რომლებიც დაკავშირებულია ერთმანეთთან: X 1 და X 2. რეგრესიის კოეფიციენტი at X 1 განმარტებულია, როგორც ცვლილების საზომი იშეცვლით X 1 ceteris paribus, ე.ი. ყველა სხვა ცვლადის მნიშვნელობები იგივე რჩება. თუმცა, ვინაიდან ცვლადები NS 1 და NS 2 დაკავშირებულია, შემდეგ ცვლილებები ცვლადში NS 1 გამოიწვევს ცვლადში პროგნოზირებად ცვლილებებს NS 2 და ღირებულება NS 2 იგივე არ დარჩება.

მაგალითი: სად NS 1 - საერთო ფართი, NS 2 - საცხოვრებელი ფართი. ჩვენ ვამბობთ: „საცხოვრებელი ფართი 1 კვ.მ-ით რომ გაიზრდება, მაშინ, როცა ყველა სხვა თანაბარია, ბინის ფასი აშშ დოლარით გაიზრდება“. თუმცა ამ შემთხვევაში საცხოვრებელი ფართიც გაიზრდება 1 კვ.მ. მ და ფასის ზრდა იქნება. ცვლადზე გავლენის განსაზღვრა ითითოეული ცვლადი ცალკე აღარ არის შესაძლებელი. გამოსავალი ამ სიტუაციაში ბინის ფასთან დაკავშირებით არის მოდელში არა მთლიანი ფართის, არამედ ე.წ.

მულტიკოლინეარობის ნიშნები.

არ არსებობს ზუსტი კრიტერიუმები მულტიკოლინეარობის არსებობის (არარსებობის) დასადგენად. თუმცა, არსებობს ევრისტიკული რეკომენდაციები მისი გამოვლენისთვის:

1) გააანალიზეთ დაწყვილებული კორელაციის კოეფიციენტების მატრიცა რეგრესორებს შორის და თუ კორელაციის კოეფიციენტის მნიშვნელობა უახლოვდება 1-ს, მაშინ ეს განიხილება მულტიკოლნეარობის ნიშნად.

2) კორელაციური მატრიცის ანალიზი არის მხოლოდ ზედაპირული განსჯა მულტიკოლინეარობის არსებობის (არარსებობის) შესახებ. ამ საკითხის უფრო ფრთხილად შესწავლა მიიღწევა ნაწილობრივი კორელაციის კოეფიციენტების გაანგარიშებით ან თითოეული ახსნა-განმარტებითი ცვლადის განსაზღვრის კოეფიციენტების გამოთვლით რეგრესიის ყველა სხვა ახსნა-განმარტებით ცვლადზე.

4) (NS’X) არის სიმეტრიული დადებითი განსაზღვრული მატრიცა, ამიტომ მისი ყველა საკუთრივ მნიშვნელობა არაუარყოფითია. თუ მატრიცის განმსაზღვრელი ( NS’X) უდრის ნულს, მაშინ მინიმალური საკუთრივ მნიშვნელობაც ნულის ტოლია და უწყვეტობა შენარჩუნებულია. შესაბამისად, ცხოველური საკუთრივ მნიშვნელობის მნიშვნელობა ასევე შეიძლება შეფასდეს მატრიცის დეტერმინანტის ნულთან სიახლოვეზე ( NS’X). ამ თვისების გარდა, მინიმალური საკუთრივ მნიშვნელობა ასევე მნიშვნელოვანია, რადგან კოეფიციენტის სტანდარტული შეცდომა უკუპროპორციულია.

5) მულტიკოლნეარობის არსებობა შეიძლება შეფასდეს გარე ნიშნებით, რომლებიც მულტიკოლნეარობის შედეგია:

ა) ზოგიერთ შეფასებას აქვს ნიშნები, რომლებიც არასწორია ეკონომიკური თეორიის თვალსაზრისით ან გაუმართლებლად მაღალი ღირებულებები;

ბ) საწყისი ეკონომიკური მონაცემების მცირე ცვლილება იწვევს მოდელის კოეფიციენტების შეფასების მნიშვნელოვან ცვლილებას;

გ) უმრავლესობა ტ- კოეფიციენტების სტატისტიკა უმნიშვნელოდ განსხვავდება ნულიდან, ამავდროულად, მოდელი მთლიანობაში მნიშვნელოვანია, რასაც მოწმობს მაღალი მნიშვნელობა. ფ- სტატისტიკა.

როგორ გავთავისუფლდეთ მულტიკოლინეარობისგან, როგორ მოვიშოროთ იგი:

1) ფაქტორული ანალიზის გამოყენება. რეგრესორების თავდაპირველი ნაკრებიდან გადასვლა, რომელთა შორის არის სტატისტიკურად დამოკიდებულები, ახალ რეგრესორებზე. ზ 1 ,…,ზ მძირითადი კომპონენტების მეთოდის გამოყენებით - საწყისი ცვლადების ნაცვლად, საწყისი ცვლადების ნაცვლად განვიხილავთ მათ ზოგიერთ წრფივ კომბინაციას, რომელთა შორის კორელაცია მცირეა ან საერთოდ არ არსებობს. აქ გამოწვევა არის ახალი ცვლადების მნიშვნელოვანი ინტერპრეტაციის მიცემა. ზ... თუ ის ვერ მოხერხდა, ჩვენ ვუბრუნდებით საწყის ცვლადებს ინვერსიული გარდაქმნების გამოყენებით. მიღებული შეფასებები, თუმცა, იქნება მიკერძოებული, მაგრამ ექნება უფრო დაბალი განსხვავება.

2) ყველა ხელმისაწვდომ ცვლადს შორის შეარჩიეთ ის ფაქტორები, რომლებიც ყველაზე მნიშვნელოვან გავლენას ახდენენ ახსნილ ცვლადზე. შერჩევის პროცედურები ქვემოთ იქნება განხილული.

3) მიკერძოებულ შეფასების მეთოდებზე გადასვლა.

როდესაც ჩვენ ვდგებით მულტიკოლინეარობის პრობლემის წინაშე, გამოუცდელ მკვლევარს თავდაპირველად უჩნდება სურვილი უბრალოდ გამორიცხოს არასაჭირო რეგრესორები, რომლებიც შეიძლება გამომწვევდეს მას. თუმცა, ყოველთვის არ არის ნათელი, რომელი ცვლადებია ზედმეტი ამ თვალსაზრისით. გარდა ამისა, როგორც ქვემოთ იქნება ნაჩვენები, ეგრეთ წოდებული მნიშვნელოვანი ზეგავლენის მქონე ცვლადების გაუქმება იწვევს OLS შეფასებების მიკერძოებას.

გაითვალისწინეთ, რომ რიგ შემთხვევებში მულტიკოლინარობა არ არის ისეთი სერიოზული „ბოროტება“, რომ მნიშვნელოვანი ძალისხმევა გამოიჩინოს მის იდენტიფიცირებასა და აღმოფხვრაზე. ძირითადად, ეს ყველაფერი დამოკიდებულია კვლევის მიზნებზე.
თუ მოდელის მთავარი ამოცანაა დამოკიდებული ცვლადის მომავალი მნიშვნელობების პროგნოზირება, მაშინ განსაზღვრის საკმარისად დიდი კოეფიციენტით R2 (gt; 0.9), მულტიკოლნეარობის არსებობა ჩვეულებრივ გავლენას არ ახდენს მოდელის პროგნოზირებულ თვისებებზე ( თუ მომავალში კორელაციური ცვლადები იგივე დარჩება, როგორც ადრე ).
თუ საჭიროა თითოეული ახსნა-განმარტებითი ცვლადის გავლენის ხარისხის დადგენა დამოკიდებულ ცვლადზე, მაშინ მულტიკოლინეარულობა, რომელიც იწვევს სტანდარტული შეცდომების ზრდას, სავარაუდოდ ამახინჯებს ცვლადებს შორის ნამდვილ ურთიერთობებს. ამ სიტუაციაში მულტიკოლინეარულობა სერიოზული პრობლემაა.
არ არსებობს მულტიკოლინეარობის აღმოფხვრის ერთი მეთოდი, რომელიც ნებისმიერ შემთხვევაში შესაფერისია. ეს გამოწვეულია იმით, რომ მულტიკოლინეარობის მიზეზები და შედეგები ორაზროვანია და დიდწილად დამოკიდებულია შერჩევის შედეგებზე.
ცვლადის (ებ)ის გამორიცხვა მოდელიდან
მულტიკოლინეარობის აღმოფხვრის უმარტივესი მეთოდია მოდელიდან ერთი ან რამდენიმე კორელაციური ცვლადის გამორიცხვა. ამ მეთოდის გამოყენებისას საჭიროა გარკვეული სიფრთხილე. ამ სიტუაციაში შესაძლებელია სპეციფიკაციების შეცდომები, ამიტომ გამოყენებული ეკონომეტრიულ მოდელებში მიზანშეწონილია არ გამოირიცხოს ახსნა-განმარტებითი ცვლადები, სანამ მულტიკოლინეარობა არ გახდება სერიოზული პრობლემა.
დამატებითი მონაცემების ან ახალი ნიმუშის მოძიება
ვინაიდან მულტიკოლინეარულობა პირდაპირ დამოკიდებულია ნიმუშზე, შესაძლებელია, რომ განსხვავებული ნიმუშით, მულტიკოლნეარობა არ იყოს ან არ იყოს ისეთი სერიოზული. ზოგჯერ, ნიმუშის ზომის გაზრდა საკმარისია მულტიკოლინეარობის შესამცირებლად. მაგალითად, თუ იყენებთ წლიურ მონაცემებს, შეგიძლიათ გადახვიდეთ კვარტალურ მონაცემებზე. მონაცემთა რაოდენობის გაზრდა ამცირებს რეგრესიის კოეფიციენტების დისპერსიას და ამით ზრდის მათ სტატისტიკურ მნიშვნელობას. თუმცა, ახალი ნიმუშის მიღება ან ძველის გაფართოება ყოველთვის არ არის შესაძლებელი ან სერიოზულ ხარჯებს მოითხოვს. გარდა ამისა, ამ მიდგომას შეუძლია გააძლიეროს ავტოკორელაცია. ეს პრობლემები ზღუდავს ამ მეთოდის გამოყენებას.
მოდელის სპეციფიკაციის შეცვლა
ზოგიერთ შემთხვევაში, მულტიკოლინეარობის პრობლემა შეიძლება მოგვარდეს მოდელის სპეციფიკაციის შეცვლით: ან იცვლება მოდელის ფორმა, ან ემატება განმარტებითი ცვლადები, რომლებიც არ იყო გათვალისწინებული თავდაპირველ მოდელში, მაგრამ მნიშვნელოვნად მოქმედებს დამოკიდებულ ცვლადზე. თუ ეს მეთოდი გამართლებულია, მაშინ მისი გამოყენება ამცირებს გადახრების კვადრატების ჯამს, რითაც ამცირებს რეგრესიის სტანდარტულ შეცდომას. ეს იწვევს კოეფიციენტების სტანდარტული შეცდომების შემცირებას.
ზოგიერთი პარამეტრის შესახებ წინასწარი ინფორმაციის გამოყენება
ზოგჯერ, მრავალჯერადი რეგრესიის მოდელის აგებისას, შეგიძლიათ გამოიყენოთ წინასწარი ინფორმაცია, კერძოდ, ზოგიერთი რეგრესიის კოეფიციენტის ცნობილი მნიშვნელობები.
სავარაუდოა, რომ კოეფიციენტების მნიშვნელობები გამოთვლილი ნებისმიერი წინასწარი (ჩვეულებრივ უფრო მარტივი) მოდელისთვის ან მსგავსი მოდელისთვის, რომელიც დაფუძნებულია ადრე მიღებულ ნიმუშზე, შეიძლება გამოყენებულ იქნას ამ მომენტისთვის შემუშავებული მოდელისთვის.
ყველაზე მნიშვნელოვანი განმარტებითი ცვლადების შერჩევა. ელემენტების თანმიმდევრული კავშირის პროცედურა
ნაკლებ განმარტებით ცვლადებზე გადასვლამ შეიძლება შეამციროს ძალზედ ურთიერთდამოკიდებული მახასიათებლებით მიწოდებული ინფორმაციის დუბლირება. ეს არის ზუსტად ის, რის წინაშეც ვდგავართ მულტიკოლინეარული ახსნა-განმარტებითი ცვლადების შემთხვევაში.
დაე იყოს

მრავალჯერადი კოეფიციენტი
კორელაციები დამოკიდებულ ცვლადს Y და ახსნითი ცვლადების სიმრავლეს შორის X 1, X 2, ..., Xm. იგი განისაზღვრება, როგორც ჩვეულებრივი წყვილი კორელაციის კოეფიციენტი Y-სა და ხაზოვან ფუნქციას შორის
რეგრესია Y = b0 + KX1 + b2X2 + ... + bmXm. ნება amp; = R-1 - მატრიცა შებრუნებული მატრიცის R:

მაშინ კვადრატული კოეფიციენტი Ry.X = Rr (xi, x2, .., x) შეიძლება გამოითვალოს ფორმულით:

შეფასება R * 2.X, შესწორებული R2y.X კოეფიციენტის მიუკერძოებლობისთვის, აქვს ფორმა:

(თუ უარყოფითი რიცხვი მიიღება ფორმულით (6.7), მაშინ ვივარაუდებთ

ნდობის ქვედა ზღვარი

განსაზღვრული
ფორმულის მიხედვით:

პრაქტიკაში, როდესაც გადაწყვეტთ, რომელი ახსნა-განმარტებითი ცვლადები უნდა იყოს შეტანილი მოდელში, ხშირად გამოიყენება ელემენტების თანმიმდევრული შეერთების პროცედურა.
(j = 1, 2, ..., მ). სადაც

ემთხვევა ჩვეულების კვადრატს
წყვილის კორელაციის კოეფიციენტი

დაე იყოს

მაშინ xp ცვლადი იქნება ყველაზე ინფორმაციული. შემდეგ გამოითვლება მიუკერძოებლობის გამო შესწორებული კოეფიციენტი
(m = 1-ისთვის) და მისი ქვედა ნდობის ზღვარი R2 წთ (1).

წყვილი jxp, xq უფრო ინფორმატიული იქნება). შემდეგ გამოითვლება მიუკერძოებლობისთვის შესწორებული კოეფიციენტი (m = 2)
და მისი ქვედა ნდობის ზღვარი R2 წთ (2).

პროცედურა გრძელდება მანამ, სანამ საფეხურზე (+1) არ შესრულდება პირობა:
შემდეგ მოდელი მოიცავს პირველ ნაბიჯებში მიღებულ ყველაზე ინფორმაციულ ცვლადებს. გაითვალისწინეთ, რომ გამოთვლებში გამოყენებულია ფორმულები (6.7) და (6.8), რომლებშიც m-ის ნაცვლად აღებულია k საფეხურის ნომრის შესაბამისი მნიშვნელობა.
ფაქტობრივად, ეს მეთოდი არ იძლევა გარანტიას, რომ ჩვენ გავთავისუფლდებით მულტიკოლინეარობისგან.
ასევე გამოიყენება მულტიკოლინეარობის აღმოფხვრის სხვა მეთოდები.
მაგალითი 6.1. არსებობს შემდეგი პირობითი მონაცემები (ცხრილი 6.1):
ცხრილი 6.1
მონაცემები გვირილა-ჯაჭვის მეთოდისთვის

X1	X2	X3	აქვს
1	1,5	0,7	12
2	2,5	1,2	20
3	1	1,4	15
4	5,5	1,9	41
5	3	2,5	33
6	3	3,1	35
7	2,8	3,5	38
8	0,5	4	28
9	4	3,8	47
10	2	5,3	40

განვიხილოთ თითოეული განმარტებითი ცვლადის დამოკიდებულ ცვლადზე გავლენა ცალ-ცალკე. დაწყვილებული კორელაციის კოეფიციენტების გამოთვლით ვხვდებით, რომ კოეფიციენტი

შემდეგ:

განვიხილოთ ცვლადების (x1, x2) და (x1, x3) წყვილის ეფექტი დამოკიდებულ ცვლადზე. პირველ რიგში, განიხილეთ ცვლადის წყვილის გავლენა (x1, x2).

Icuvum uvjpcuuivi
ცვლადების შეერთებისას განტოლებაში უნდა იყოს ჩართული ორი ახსნა-განმარტებადი ცვლადი. ამრიგად, თეორიული განტოლება მიიღებს ფორმას:
ქედის მეთოდი
განვიხილოთ ქედის მეთოდი (ქედის რეგრესია) მულტიკოლინეარობის აღმოსაფხვრელად. მეთოდი შემოგვთავაზა A.E. Hoerl-მა 1962 წელს და გამოიყენება, როდესაც მატრიცა (xtX) ახლოსაა დეგენერატთან. მცირე რიცხვი (0.1-დან 0.4-მდე) ემატება მატრიცის დიაგონალურ ელემენტებს (xtX). ამ შემთხვევაში მიიღება განტოლების პარამეტრების მიკერძოებული შეფასებები. მაგრამ ასეთი შეფასებების სტანდარტული შეცდომები მულტიკოლნეარობის შემთხვევაში უფრო დაბალია ვიდრე ჩვეულებრივი უმცირესი კვადრატების მეთოდით მოცემული.
მაგალითი 6.2. საწყისი მონაცემები წარმოდგენილია „ცხრილი 6 2 განმარტებითი ცვლადების კორელაციის კოეფიციენტი

რა
მიუთითებს ძლიერ მულტიკოლინეარულობაზე.
ცხრილი 6.2
ქედის მეთოდით მულტიკოლინიარობის კვლევის მონაცემები

x1	x2	აქვს
1	1,4	7
2	3,1	12

შემდეგ მივიღებთ განტოლებას y = 2,63 + 1,37x1 + 1,95x2. ინვერსიული მატრიცის დიაგონალური ელემენტები მნიშვნელოვნად შემცირდება და ტოლი იქნება z00 = 0,45264, z11 = 1,57796, z00 = 0,70842, რაც იწვევს კოეფიციენტების სტანდარტული შეცდომების შემცირებას.
Შემაჯამებელი
მთავარ შედეგებს შორის, რაც შეიძლება გამოიწვიოს მრავალმხრივობამ, შეიძლება გამოიყოს შემდეგი:

ძირითადი ჰიპოთეზის ტესტირებისას მრავალჯერადი რეგრესიის კოეფიციენტების უმნიშვნელოობის შესახებ t-ტესტის გამოყენებით, უმეტეს შემთხვევაში იგი მიიღება, თუმცა, თავად რეგრესიის განტოლება A-ტესტის გამოყენებით ტესტირებისას მნიშვნელოვანი აღმოჩნდება, რაც მიუთითებს გადაჭარბებულ მნიშვნელობაზე. მრავალჯერადი კორელაციის კოეფიციენტის;
მრავლობითი რეგრესიის განტოლების კოეფიციენტების მიღებული შეფასებები, როგორც წესი, გაუმართლებლად არის გადაჭარბებული ან აქვს არასწორი ნიშნები;
საწყისი მონაცემებიდან ერთი ან ორი დაკვირვების დამატება ან გამორიცხვა ძლიერ გავლენას ახდენს მოდელის კოეფიციენტების შეფასებაზე;
მრავალმხრივი რეგრესიის მოდელში მულტიკოლინეარობის არსებობამ შეიძლება ის შეუსაბამო გახადოს შემდგომი გამოყენებისთვის (მაგალითად, პროგნოზების გასაკეთებლად).

თვითტესტის კითხვები

რა არის მულტიკოლინეარულობა?
რა ინდიკატორები მიუთითებს მულტიკოლინეარობის არსებობაზე?
რა არის XTX მატრიცის განმსაზღვრელი სრულყოფილი მულტიკოლნეარობის შემთხვევაში?
რა შეიძლება ითქვას ახსნა-განმარტებითი ცვლადების კოეფიციენტების მნიშვნელობაზე მულტიკოლინიარობის შემთხვევაში?
რა ტრანსფორმაცია ხდება სავარცხლის მეთოდში, რას იწვევს?
როგორია მოქმედებების თანმიმდევრობა ამხსნელი ცვლადების რაოდენობის თანმიმდევრულად გაზრდის მეთოდში?
რას აჩვენებს კორელაციის კოეფიციენტი?
რას აჩვენებს ნაწილობრივი კორელაციის კოეფიციენტი?

რუსეთის ფედერაციის განათლებისა და მეცნიერების სამინისტრო

ფედერალური სახელმწიფო საბიუჯეტო საგანმანათლებლო დაწესებულება

უმაღლესი განათლება

ტვერის სახელმწიფო ტექნიკური უნივერსიტეტი

"ბუღალტრული აღრიცხვისა და ფინანსების" დეპარტამენტი

კურსის პროექტი
დისციპლინაში "ეკონომეტრია"

"მულტიკოლინეარობის გამოკვლევა ეკონომეტრიულ მოდელებში: ცვლადის (ებ)ის გამორიცხვა მოდელიდან"

სამუშაო ხელმძღვანელი:

Cand. იმათ. მეცნიერებათა ასოცირებული პროფესორი

კონოვალოვა

შემსრულებელი:

EK-1315 EPO ჯგუფის სტუდენტი

ტვერი, 2015 წელი

შესავალი ……………………………………………………………………………… 3

1. ანალიტიკური ნაწილი ……………………………………………………………… 4

1.1. მულტიკოლინალურობის განზოგადებული ნიშნები ეკონომეტრიულ მოდელებში …………………………………………………………………………………… .4

1.2. ეკონომეტრიულ მოდელებში მულტიკოლინეარობის აღმოფხვრის ძირითადი გზები …………… .. …………………………………………………

2. დიზაინის ნაწილი ……………………………………………………………………………………………………………………………………………

2.1. ეკონომეტრიული კვლევის საინფორმაციო და მეთოდოლოგიური მხარდაჭერა …………………………………………………………………………… .11

2.2. ეკონომეტრიული კვლევის მაგალითი ……………………………… .17

დასკვნა …………………………………………………………………….. 30

გამოყენებული წყაროების სია ……………………………………………… 31

შესავალი

ნაშრომის თემის „მულტიკოლნეარობის გამოკვლევა ეკონომეტრიულ მოდელებში: ცვლადის (ებ)ის გამორიცხვა მოდელიდან“ აქტუალურობა განპირობებულია იმით, რომ დღესდღეობით ეს პრობლემა ხშირად გვხვდება გამოყენებითი ეკონომეტრიულ მოდელებში.

კვლევის საგანია მულტიკოლინეარობის პრობლემა. კვლევის ობიექტს წარმოადგენს ეკონომეტრიული მოდელები.

სამუშაოს მთავარი მიზანია ეკონომეტრიული კვლევის საინფორმაციო და მეთოდოლოგიური უზრუნველყოფის საპროექტო გადაწყვეტილებების შემუშავება.

მიზნის მისაღწევად დაისახა და გადაწყდა შემდეგი ძირითადი კვლევითი ამოცანები:

მულტიკოლნეარულობის მახასიათებლების განზოგადება ეკონომეტრიულ მოდელებში.
მულტიკოლინეარობის აღმოფხვრის ძირითადი გზების იდენტიფიცირება.

3. ეკონომეტრიული კვლევების საინფორმაციო და მეთოდოლოგიური უზრუნველყოფის შემუშავება.

ანალიტიკური ნაწილი

1.1. მულტიკოლინეარობის განზოგადებული ნიშნები ეკონომეტრიულ მოდელებში

მულტიკოლინეარულობა - ეკონომეტრიაში (რეგრესიული ანალიზი) - რეგრესიის მოდელის ახსნა-განმარტებით ცვლადებს (ფაქტორებს) შორის წრფივი ურთიერთობის არსებობა. ამავე დროს, არსებობს სრული კოლინარულობა, რაც ნიშნავს ფუნქციური (იდენტური) წრფივი დამოკიდებულების არსებობას და ნაწილობრივიან უბრალოდ მულტიკოლინეარულობა- ფაქტორებს შორის ძლიერი კორელაციის არსებობა.

სრული კოლინარულობა იწვევს გაურკვევლობებიპარამეტრები ხაზოვანი რეგრესიის მოდელში, შეფასების მეთოდების მიუხედავად. განვიხილოთ ეს მაგალითის სახით შემდეგი ხაზოვანი მოდელის გამოყენებით:

მოდით, ამ მოდელის ფაქტორები იდენტურად იყოს დაკავშირებული შემდეგნაირად:. შემდეგ განვიხილოთ ორიგინალური წრფივი მოდელი, რომელშიც ვამატებთ პირველ კოეფიციენტს თვითნებურინომერი ა, და გამოვაკლოთ იგივე რიცხვი დანარჩენ ორ კოეფიციენტს. შემდეგ გვაქვს (შემთხვევითი შეცდომის გარეშე):

ამრიგად, მოდელის კოეფიციენტების შედარებით თვითნებური ცვლილების მიუხედავად, მიიღება იგივე მოდელი. ეს მოდელი ფუნდამენტურად დაუდგენელია. გაურკვევლობა უკვე არსებობს თავად მოდელში. თუ განვიხილავთ კოეფიციენტთა 3-განზომილებიან სივრცეს, მაშინ ამ სივრცეში ჭეშმარიტი კოეფიციენტების ვექტორი ამ შემთხვევაში არ არის ერთადერთი, არამედ არის მთლიანი სწორი ხაზი. ამ ხაზის ნებისმიერი წერტილი არის კოეფიციენტების ნამდვილი ვექტორი.

თუ სრული კოლინარულობა იწვევს პარამეტრის მნიშვნელობებში გაურკვევლობას, მაშინ ნაწილობრივი მულტიკოლნეარულობა იწვევს მათ არასტაბილურობას. შეფასებები... არასტაბილურობა გამოიხატება სტატისტიკური განუსაზღვრელობის ზრდით - შეფასებების დისპერსიით. ეს ნიშნავს, რომ კონკრეტული შეფასების შედეგები შეიძლება მნიშვნელოვნად განსხვავდებოდეს ნიმუშიდან ნიმუშამდე, მიუხედავად იმისა, რომ ნიმუშები ერთგვაროვანია.

მოგეხსენებათ, უმცირესი კვადრატების მეთოდის გამოყენებით მრავალჯერადი რეგრესიის პარამეტრების შეფასების კოვარიანტული მატრიცა უდრის. ამრიგად, რაც უფრო „პატარა“ არის კოვარიანტული მატრიცა (მისი განმსაზღვრელი), მით უფრო „დიდია“ პარამეტრის შეფასების კოვარიანტობის მატრიცა და, კერძოდ, რაც უფრო დიდია ამ მატრიცის დიაგონალური ელემენტები, ანუ პარამეტრის შეფასებების ვარიაცია. სიცხადისთვის, განიხილეთ ორფაქტორიანი მოდელის მაგალითი:

მაშინ პარამეტრის შეფასების სხვაობა, მაგალითად, პირველი ფაქტორისთვის უდრის:

სად არის ნიმუშის კორელაციის კოეფიციენტი ფაქტორებს შორის.

აქ ნათლად ჩანს, რომ რაც უფრო დიდია ფაქტორებს შორის კორელაციის მოდული, მით მეტია პარამეტრის შეფასებების ვარიაცია. ზე (სრული კოლინარობა), დისპერსია მიდრეკილია უსასრულობისკენ, რაც შეესაბამება ადრე ნათქვამს.

ამრიგად, პარამეტრების შეფასებები მიიღება არაზუსტად, რაც ნიშნავს, რომ რთული იქნება გარკვეული ფაქტორების გავლენის ინტერპრეტაცია ახსნილ ცვლადზე. ამავდროულად, მულტიკოლინეარულობა გავლენას არ ახდენს მთლიანი მოდელის ხარისხზე - ის შეიძლება იყოს სტატისტიკურად მნიშვნელოვანი, მაშინაც კი, როდესაც ყველაკოეფიციენტები უმნიშვნელოა (ეს მულტიკოლინეარობის ერთ-ერთი ნიშანია).

ხაზოვან მოდელებში, პარამეტრებს შორის კორელაციის კოეფიციენტები შეიძლება იყოს დადებითი და უარყოფითი. პირველ შემთხვევაში, ერთი პარამეტრის ზრდას ახლავს სხვა პარამეტრის ზრდა. მეორე შემთხვევაში, როდესაც ერთი პარამეტრი იზრდება, მეორე მცირდება.

ამის საფუძველზე შესაძლებელია დადგინდეს მისაღები და მიუღებელი მულტიკოლინარობა. მიუღებელი მულტიკოლინიარულობა მოხდება მაშინ, როდესაც არსებობს მნიშვნელოვანი დადებითი კორელაცია 1 და 2 ფაქტორებს შორის, და ამავდროულად, თითოეული ფაქტორის გავლენა კორელაციაზე y ფუნქციასთან არის ცალმხრივი, ანუ იზრდება ორივე ფაქტორი 1 და 2. იწვევს y-ის ფუნქციის გაზრდას ან შემცირებას. სხვა სიტყვებით რომ ვთქვათ, ორივე ფაქტორი მოქმედებს y ფუნქციაზე ერთნაირად და მათ შორის მნიშვნელოვანი პოზიტიური კორელაცია შეიძლება ერთ-ერთი მათგანის გამორიცხვის საშუალებას იძლევა.

დასაშვები მულტიკოლინიარულობა ისეთია, რომ ფაქტორები y ფუნქციაზე განსხვავებულად მოქმედებს. აქ შესაძლებელია ორი შემთხვევა:

ა) ფაქტორებს შორის მნიშვნელოვანი დადებითი კორელაციით, თითოეული ფაქტორის გავლენა y ფუნქციასთან კორელაციაზე მრავალმხრივია, ე.ი. ერთი ფაქტორის ზრდა იწვევს ფუნქციის ზრდას, ხოლო მეორე ფაქტორის ზრდა იწვევს y-ის ფუნქციის შემცირებას.

ბ) ფაქტორებს შორის მნიშვნელოვანი უარყოფითი კორელაციით, ერთი ფაქტორის ზრდას თან ახლავს მეორე ფაქტორის შემცირება და ეს ფაქტორებს ორაზროვანს ხდის, შესაბამისად, შესაძლებელია y-ის ფუნქციაზე ფაქტორების გავლენის ნებისმიერი ნიშანი.

პრაქტიკაში განასხვავებენ მულტიკოლინეარობის ყველაზე დამახასიათებელ მახასიათებლებს: 1. საწყის მონაცემებში მცირე ცვლილება (მაგალითად, ახალი დაკვირვებების დამატება) იწვევს მოდელის კოეფიციენტების შეფასების მნიშვნელოვან ცვლილებას. 2. შეფასებებს აქვს დიდი სტანდარტული შეცდომები, დაბალი მნიშვნელოვნება, ხოლო მოდელს მთლიანობაში მნიშვნელოვანი აქვს (განსაზღვრების კოეფიციენტის მაღალი მნიშვნელობა R 2 და შესაბამისი F- სტატისტიკა). 3. კოეფიციენტების შეფასებას აქვს თეორიული თვალსაზრისით არასწორი ნიშნები ან გაუმართლებლად დიდი მნიშვნელობები.

მულტიკოლინეარობის არაპირდაპირი ნიშნებია მოდელის პარამეტრების შეფასების მაღალი სტანდარტის შეცდომები, მცირე t- სტატისტიკა (ანუ უმნიშვნელო კოეფიციენტები), შეფასების არასწორი ნიშნები, ხოლო მოდელი მთლიანად აღიარებულია, როგორც სტატისტიკურად მნიშვნელოვანი (F- სტატისტიკის დიდი მნიშვნელობა). . მულტიკოლინალურობა ასევე შეიძლება დადასტურდეს პარამეტრის შეფასების ძლიერი ცვლილებით ნიმუშის მონაცემების დამატებით (ან ამოღებით) (თუ დაკმაყოფილებულია ნიმუშის საკმარისი ჰომოგენურობის მოთხოვნები).

ფაქტორების მულტიკოლნეარობის გამოსავლენად, ფაქტორების კორელაციური მატრიცა შეიძლება პირდაპირ გაანალიზდეს. უკვე წყვილის კორელაციის კოეფიციენტების დიდი აბსოლუტური მნიშვნელობის (0,7-0,8-ზე მეტი) მნიშვნელობების არსებობა მიუთითებს მიღებული შეფასებების ხარისხთან შესაძლო პრობლემებზე.

თუმცა, დაწყვილებული კორელაციის კოეფიციენტების ანალიზი არასაკმარისია. აუცილებელია სხვა ფაქტორებისთვის ფაქტორების რეგრესიის განსაზღვრის კოეფიციენტების ანალიზი (). რეკომენდებულია ინდიკატორის გამოთვლა. ამ უკანასკნელის ძალიან მაღალი მნიშვნელობები ნიშნავს მულტიკოლინეარობის არსებობას.

ამრიგად, მულტიკოლინეარობის გამოვლენის ძირითადი კრიტერიუმებია: მაღალი R 2 ყველა უმნიშვნელო კოეფიციენტისთვის, მაღალი წყვილის კორელაციის კოეფიციენტები, VIF კოეფიციენტის მაღალი მნიშვნელობები.

1.2. ეკონომეტრიულ მოდელებში მულტიკოლინეარობის აღმოფხვრის ძირითადი გზები

მულტიკოლინეარობის აღმოფხვრის ძირითადი მეთოდების დაზუსტებამდე აღვნიშნავთ, რომ რიგ შემთხვევებში მულტიკოლნეარულობა არ არის სერიოზული პრობლემა, რომელიც მოითხოვს მნიშვნელოვან ძალისხმევას მის იდენტიფიცირებასა და აღმოსაფხვრელად. ძირითადად, ეს ყველაფერი დამოკიდებულია კვლევის მიზნებზე.

თუ მოდელის მთავარი ამოცანაა რეგრესიის მომავალი მნიშვნელობების პროგნოზირება და, მაშინ განსაზღვრის საკმარისად დიდი კოეფიციენტით R2 (> 0.9), მულტიკოლნეარობის არსებობა ჩვეულებრივ გავლენას არ ახდენს მოდელის პროგნოზირებულ თვისებებზე. თუმცა ეს განცხადება გამართლებული იქნება მხოლოდ იმ შემთხვევაში, თუ მომავალში კორელაციური რეგრესორები შეინარჩუნებენ იგივე ურთიერთობას, როგორც ადრე. თუ კვლევის მიზანია დადგინდეს თითოეული რეგრესორის გავლენის ხარისხი რეგრესორზე და, მაშინ მულტიკოლინეარობის არსებობა, რაც იწვევს სტანდარტული შეცდომების ზრდას, სავარაუდოდ ამახინჯებს ნამდვილ ურთიერთობებს რეგრესორებს შორის. ამ სიტუაციაში მულტიკოლინეარულობა სერიოზული პრობლემაა.

გაითვალისწინეთ, რომ არ არსებობს მულტიკოლინეარობის აღმოფხვრის ერთი მეთოდი, რომელიც ნებისმიერ შემთხვევაში შესაფერისია. ეს გამოწვეულია იმით, რომ მულტიკოლინეარობის მიზეზები და შედეგები ორაზროვანია და დიდწილად დამოკიდებულია შერჩევის შედეგებზე.

პრაქტიკაში განასხვავებენ მულტიკოლინეარობის აღმოფხვრის ძირითად მეთოდებს:

რეგრესორების აღმოფხვრა მოდელიდან მულტიკოლინეარობის აღმოფხვრის უმარტივესი მეთოდია მოდელიდან ერთი ან რამდენიმე კორელაციური რეგრესორის გამორიცხვა. თუმცა, ამ მეთოდის გამოყენებისას საჭიროა გარკვეული სიფრთხილე. ამ სიტუაციაში შესაძლებელია სპეციფიკაციის შეცდომები. მაგალითად, გარკვეულ საქონელზე მოთხოვნის შესწავლისას, ამ საქონლის ფასი და ამ საქონლის შემცვლელების ფასები, რომლებიც ხშირად კორელაციაშია ერთმანეთთან, შეიძლება გამოყენებულ იქნას როგორც ახსნა-განმარტებითი ცვლადები. მოდელიდან შემცვლელების ფასების გამორიცხვით, ჩვენ უფრო სავარაუდოა, რომ დაგვიშვათ სპეციფიკაციის შეცდომა. შედეგად, შესაძლებელია მიკერძოებული შეფასებების მიღება და არაგონივრული დასკვნების გამოტანა. ამრიგად, გამოყენებითი ეკონომეტრიულ მოდელებში სასურველია არ გამოირიცხოს რეგრესორები, სანამ მათი კოლინარულობა არ გახდება სერიოზული პრობლემა.
დამატებითი მონაცემების ან ახალი ნიმუშის მოპოვება, რადგან მულტიკოლნეარულობა პირდაპირ დამოკიდებულია ნიმუშზე, მაშინ, შესაძლოა, სხვა ნიმუშით, საერთოდ არ იქნება მულტიკოლნეარულობა, ან არც ისე სერიოზული იქნება. ზოგჯერ, ნიმუშის ზომის გაზრდა საკმარისია მულტიკოლინეარობის შესამცირებლად. მაგალითად, თუ იყენებთ წლიურ მონაცემებს, შეგიძლიათ გადახვიდეთ კვარტალურ მონაცემებზე. მონაცემთა რაოდენობის გაზრდა ამცირებს რეგრესიის კოეფიციენტების დისპერსიას და ამით ზრდის მათ სტატისტიკურ მნიშვნელობას. თუმცა, ახალი ნიმუშის მიღება ან ძველის გაფართოება ყოველთვის არ არის შესაძლებელი ან სერიოზულ ხარჯებს მოითხოვს. გარდა ამისა, ამ მიდგომას შეუძლია გააძლიეროს ავტოკორელაცია. ეს პრობლემები ზღუდავს ამ მეთოდის გამოყენებას.

III. მოდელის სპეციფიკაციის შეცვლა ზოგიერთ შემთხვევაში, მულტიკოლნეარობის პრობლემა შეიძლება მოგვარდეს მოდელის სპეციფიკაციის შეცვლით: ან იცვლება მოდელის ფორმა, ან ემატება ახალი რეგრესორები, რომლებიც არ იყო გათვალისწინებული თავდაპირველ მოდელში, მაგრამ მნიშვნელოვნად მოქმედებს დამოკიდებულზე. ცვლადი. თუ ეს მეთოდი გამართლებულია, მაშინ მისი გამოყენება ამცირებს გადახრების კვადრატების ჯამს, რითაც ამცირებს რეგრესიის სტანდარტულ შეცდომას. ეს იწვევს კოეფიციენტების სტანდარტული შეცდომების შემცირებას.

ცვლადების ტრანსფორმაცია ზოგიერთ შემთხვევაში შეიძლება მინიმუმამდე დაიყვანოს ან საერთოდ აღმოიფხვრას მულტიკოლნეარობის პრობლემა მხოლოდ ცვლადების ტრანსფორმაციის დახმარებით. თავდაპირველი მონაცემები თითოეულ შემთხვევაში იყოფა ერთ-ერთი დამოკიდებული რეგრესორის მნიშვნელობებზე ამ შემთხვევაში. ძირითადი კომპონენტების მეთოდის გამოყენება მოდელის ფაქტორებზე საშუალებას გაძლევთ გარდაქმნათ საწყისი ფაქტორები და მიიღოთ ორთოგონალური (არაკორელირებული) ფაქტორების ნაკრები. ამ შემთხვევაში, მულტიკოლინეარობის არსებობა საშუალებას მოგვცემს შევიზღუდოთ ძირითადი კომპონენტების მცირე რაოდენობა. მიუხედავად ამისა, შეიძლება წარმოიშვას ძირითადი კომპონენტების შინაარსიანი ინტერპრეტაციის პრობლემა.

თუ ყველა მითითებით არსებობს მულტიკოლინეარულობა, მაშინ ეკონომეტრიკოსებს შორის ამ საკითხზე განსხვავებული მოსაზრებებია. მულტიკოლინეარობის პრობლემის წინაშე, შეიძლება გაჩნდეს ბუნებრივი სურვილი გაუქმდეს „არასაჭირო“ დამოუკიდებელი ცვლადები, რომლებიც შეიძლება გამომწვევდეს მას. თუმცა, უნდა გვახსოვდეს, რომ ამით შეიძლება წარმოიშვას ახალი სირთულეები. პირველი, ყოველთვის არ არის ნათელი, რომელი ცვლადებია ზედმეტი ამ თვალსაზრისით.

Multicollinearity ნიშნავს მხოლოდ მიახლოებით წრფივ ურთიერთობას ფაქტორებს შორის, მაგრამ ეს ყოველთვის არ ხაზს უსვამს "ზედმეტ" ცვლადებს. მეორეც, ბევრ სიტუაციაში, ნებისმიერი დამოუკიდებელი ცვლადის ამოღებამ შეიძლება მნიშვნელოვნად იმოქმედოს მოდელის მნიშვნელობაზე. საბოლოოდ, ეგრეთ წოდებული არსებითი ცვლადების გაუქმება, ე.ი. დამოუკიდებელი ცვლადები, რომლებიც რეალურად მოქმედებს შესწავლილ დამოკიდებულ ცვლადზე, იწვევს მოდელის კოეფიციენტების მიკერძოებას. პრაქტიკაში, როგორც წესი, როდესაც გამოვლენილია მულტიკოლნეარულობა, ანალიზისთვის ყველაზე ნაკლებად მნიშვნელოვანი ფაქტორი ამოღებულია და შემდეგ გამოთვლები მეორდება.

ამრიგად, პრაქტიკაში განასხვავებენ მულტიკოლნეარობის აღმოფხვრის ძირითად მეთოდებს: ნიმუშის შეცვლა ან გაზრდა, ერთ-ერთი ცვლადის გამორიცხვა, მულტიკოლნეარული ცვლადების ტრანსფორმაცია (გამოიყენეთ არაწრფივი ფორმები, გამოიყენეთ აგრეგატები (რამდენიმე ცვლადის წრფივი კომბინაცია), გამოიყენეთ პირველი განსხვავებები. თავად ცვლადები.თუმცა, თუ მულტიკოლნეარულობა არ არის აღმოფხვრილი, შეგიძლიათ მისი იგნორირება, გამორიცხვის მიზანშეწონილობის გათვალისწინებით.

პროექტის ნაწილი

2.1. ეკონომეტრიული კვლევის საინფორმაციო და მეთოდოლოგიური მხარდაჭერა

ეკონომეტრიული კვლევის საინფორმაციო მხარდაჭერა მოიცავს შემდეგ ინფორმაციას:

შეყვანის ინფორმაცია:

დამოკიდებულ ცვლადად განსაზღვრული სოციალურ-ეკონომიკური ინდიკატორის სტატისტიკური მონაცემები (ფაქტორები - შედეგები);
სტატისტიკური მონაცემები სოციალურ-ეკონომიკური მაჩვენებლების შესახებ, განმარტებული ცვლადების სახით (ფაქტორები - ნიშნები);

შუალედური ინფორმაცია:

რეგრესიის განტოლების მოდელი, სავარაუდო რეგრესიის განტოლება, ხარისხის ინდიკატორები და დასკვნა რეგრესიის განტოლების ხარისხის შესახებ, დასკვნა მულტიკოლინეარობის პრობლემის არსებობის (არარსებობის) შესახებ, მოდელის გამოყენების რეკომენდაციები;

ეფექტური ინფორმაცია:

სავარაუდო რეგრესიის განტოლება, დასკვნა რეგრესიის განტოლების ხარისხის შესახებ, დასკვნა მულტიკოლინეარობის პრობლემის არსებობის (არარსებობის) შესახებ, მოდელის გამოყენების რეკომენდაციები.

ეკონომეტრიული კვლევის მეთოდოლოგია შემდეგია: სპეციფიკაცია; პარამეტრიზაცია, გადამოწმება, დამატებითი კვლევა, პროგნოზირება.

1. რეგრესიის განტოლების მოდელის სპეციფიკაცია მოიცავს თითოეულ ახსნა-განმარტებით ცვლადზე დამოკიდებული ცვლადის კორელაციური დამოკიდებულების გრაფიკულ ანალიზს. გრაფიკული ანალიზის შედეგების საფუძველზე კეთდება დასკვნა წრფივი ან არაწრფივი ტიპების რეგრესიული განტოლების მოდელის შესახებ. გრაფიკული ანალიზისთვის, ყველაზე ხშირად რეკომენდებული MsExcel Scatter Chart ინსტრუმენტი. ამ ეტაპის შედეგად დგინდება რეგრესიის განტოლების მოდელი და არაწრფივი ფორმის შემთხვევაში მისი წრფივობის მეთოდებიც.

2. რეგრესიის განტოლების პარამეტრიზაცია მოიცავს რეგრესიის პარამეტრების შეფასებას და მათ სოციალურ-ეკონომიკურ ინტერპრეტაციას. პარამეტრიზაციისთვის გამოიყენეთ ინსტრუმენტი "რეგრესია", როგორც დანამატების "მონაცემთა ანალიზი" MsExcel. ავტომატური რეგრესიული ანალიზის შედეგების საფუძველზე (სვეტი "კოეფიციენტები") განისაზღვრება რეგრესიის პარამეტრები და მათი ინტერპრეტაციაც მოცემულია სტანდარტული წესის მიხედვით:

Bj არის თანხა, რომლითაც იცვლება Y ცვლადის მნიშვნელობა საშუალოდ, როდესაც დამოუკიდებელი ცვლადი Xj იზრდება ერთით, ceteris paribus.

რეგრესიის განტოლების შუალედი უდრის დამოკიდებული Y ცვლადის პროგნოზირებულ მნიშვნელობას, როდესაც ყველა დამოუკიდებელი ცვლადი ნულის ტოლია.

3. რეგრესიის განტოლების დამოწმება ხორციელდება ავტომატური რეგრესიული ანალიზის შედეგების საფუძველზე (სტადია 2) შემდეგი მაჩვენებლების მიხედვით: „R-კვადრატი“, „მნიშვნელოვნება F“, „P-მნიშვნელობა“ (თითოეული პარამეტრისთვის. რეგრესიის), ასევე შერჩევისა და ნარჩენების გრაფიკებზე ...

განისაზღვრება კოეფიციენტების მნიშვნელობა და ფასდება მოდელის ხარისხი. ამისათვის განიხილება "მნიშვნელობა F", "P-მნიშვნელობა" და "R-კვადრატი". თუ "P-მნიშვნელობა" ნაკლებია სტატიკური მნიშვნელობის განტოლებაზე, მაშინ ეს მიუთითებს კოეფიციენტის მნიშვნელობაზე. თუ „R-კვადრატი“ 0.6-ზე მეტია, ეს ნიშნავს, რომ რეგრესიის მოდელი კარგად აღწერს Y დამოკიდებული ცვლადის ქცევას ცვლადების ფაქტორებზე.

თუ „მნიშვნელოვნება F“ ნაკლებია მნიშვნელობის სტატიკური განტოლებაზე, მაშინ განსაზღვრის კოეფიციენტი (R-კვადრატი) ითვლება პირობითად სტატისტიკურად მნიშვნელოვანი.

ნარჩენი ნაკვეთი საშუალებას გაძლევთ შეაფასოთ შეცდომების ცვალებადობა. თუ Xi-ს სხვადასხვა მნიშვნელობებთან შესაბამის შეცდომებს შორის განსაკუთრებული განსხვავებები არ არის, ანუ Xi-ს სხვადასხვა მნიშვნელობებისთვის შეცდომებში ვარიაციები დაახლოებით იგივეა და შეიძლება ვივარაუდოთ, რომ პრობლემები არ არის. შესაბამისი განრიგი საშუალებას გაძლევთ ჩამოაყალიბოთ განსჯა საბაზისო, პროგნოზირებული და ფაქტორების მნიშვნელობების შესახებ.

დასასრულს, ყალიბდება განაჩენი რეგრესიის განტოლების ხარისხის შესახებ.

დამატებითი კვლევა.

4.1 მულტიკოლინეარობის პირველი ნიშნის გამოვლენა. 2-3 პუნქტებში მიღებული რეგრესიული ანალიზის შედეგებზე დაყრდნობით, მოწმდება სიტუაცია, როდესაც განსაზღვრის კოეფიციენტს აქვს მაღალი მნიშვნელობა (R 2> 0.7) და სტატიკურად მნიშვნელოვანი (მნიშვნელოვნება F.<0,05), и хотя бы один из коэффициентов регрессии не может быть признан статистически значим (P-значение >0.05) .ასეთი სიტუაციის გამოვლენისას კეთდება დასკვნა მულტიკოლნეარობის დაშვების შესახებ.

4.2 მულტიკოლნეარობის მეორე ნიშნის გამოვლენა. ფაქტორების ცვლადებს შორის კორელაციის კოეფიციენტების გამოთვლების საფუძველზე განისაზღვრება ცალკეული ფაქტორების მნიშვნელოვანი ურთიერთობა. MS Excel-ში გამოთვლებისთვის მიზანშეწონილია გამოიყენოთ მონაცემთა ანალიზი / კორელაციის ინსტრუმენტი. კორელაციის კოეფიციენტის სიდიდეებიდან გამომდინარე, გამოტანილია დასკვნები: რაც უფრო ახლოსაა (r) უკიდურეს წერტილებთან (± 1), მით მეტია წრფივი ურთიერთობის ხარისხი, თუ კორელაციის კოეფიციენტი 0.5-ზე ნაკლებია, მაშინ განიხილება. რომ ურთიერთობა სუსტია. მულტიკოლინეარობის არსებობა ვარაუდობენ შემდეგ შემთხვევაში, თუ არსებობს მნიშვნელოვანი კორელაციის კოეფიციენტი მინიმუმ ორ ცვლადს შორის (ანუ 0,7-ზე მეტი მოდულში).

4.3 მულტიკოლნეარობის მესამე ნიშნის გამოვლენა. დამხმარე რეგრესიის შეფასების საფუძველზე ფაქტორულ ცვლადებს შორის და ცვლადებს შორის, სადაც არის მნიშვნელოვანი კორელაციის კოეფიციენტი (ნაწილი 4.2), დასკვნა ხდება, რომ მულტიკოლინეარულობა არსებობს, თუ მინიმუმ ერთ დამხმარე რეგრესიაში ის მნიშვნელოვანი და მნიშვნელოვანია. განსაზღვრის კოეფიციენტის დამატებითი რეგრესიების მეთოდი ასეთია: 1) აგებულია რეგრესიული განტოლებები, რომლებიც აკავშირებს თითოეულ რეგრესორს ყველა დარჩენილთან; 2) R 2 განსაზღვრის კოეფიციენტები გამოითვლება თითოეული რეგრესიის განტოლებისთვის; 3) თუ განტოლება და განსაზღვრის კოეფიციენტი განიხილება სტატისტიკურად მნიშვნელოვანი, მაშინ ეს რეგრესორი იწვევს მულტიკოლინეარობას.

4.4 მსჯელობის განზოგადება.

4.1-4.3 პუნქტების საფუძველზე ყალიბდება გადაწყვეტილება მულტიკოლინეარობისა და რეგრესორების არსებობა/არარსებობის შესახებ, რაც იწვევს მულტიკოლნეარობას.

გარდა ამისა, ყალიბდება მოდელის გამოყენების მიმართულებები (მულტიკოლნეარობის პრობლემის იგნორირება ან არარსებობის შემთხვევაში) ან რეკომენდაციები მულტიკოლნეარობის აღმოსაფხვრელად (პრაქტიკაში, ცვლადის გამოკლებით).

ცვლადის გამორიცხვისას მიზანშეწონილია გამოიყენოთ წესი:

განსაზღვრის კოეფიციენტი განისაზღვრება რეგრესიის განტოლებისთვის, რომელიც თავდაპირველად აგებულია n დაკვირვებით (R 2 1);

ბოლო ცვლადების გამორიცხვით განსახილველიდან (k), ფორმდება განტოლება დარჩენილი ფაქტორებისთვის საწყისი n დაკვირვების საფუძველზე და მისთვის განსაზღვრის კოეფიციენტი (R 2 2);

F- სტატისტიკა გამოითვლება: სადაც (R 1 2 -R 2 2) არის განტოლების დაკარგვა ცვლადებზე გადასვლის შედეგად, (K) არის თავისუფლების დამატებითი გრადუსების რაოდენობა, რომელიც გამოჩნდა, (1- R 1). 2) / (ნმლ) არის საწყისი განტოლებების აუხსნელი ვარიაცია;

F a, k, n-m -1-ის კრიტიკული მნიშვნელობა განისაზღვრება ფიშერის განაწილების კრიტიკული წერტილების ცხრილების მიხედვით მნიშვნელოვნების მოცემულ დონეზე a და თავისუფლების ხარისხით v 1 = k, v 2 = n-m-l;

გამონაკლისის მიზანშეწონილობის შესახებ განსჯა ყალიბდება წესის მიხედვით: განტოლებიდან k ცვლადის (ერთდროული) გამორიცხვა მიჩნეულია შეუფერებლად F> F a, k, n-m - 1-ისთვის, წინააღმდეგ შემთხვევაში ასეთი გამონაკლისი დასაშვებია.

როდესაც ცვლადი აღმოიფხვრება, მიღებული მოდელი ანალიზდება 3-4 პუნქტების შესაბამისად; და შედარებულია ორიგინალურ მოდელთან, რის შედეგადაც შეირჩევა „საუკეთესო“. პრაქტიკაში, ვინაიდან მულტიკოლინეარულობა გავლენას არ ახდენს მოდელის პროგნოზირებულ თვისებებზე, ეს პრობლემა შეიძლება იგნორირებული იყოს.

5. პროგნოზირება ხორციელდება 4.4 პუნქტში შერჩეული საწყისი/„საუკეთესო“ მოდელის მიხედვით, რეტროსპექტული პროგნოზირების სქემის მიხედვით, რომელშიც პროგნოზირებისთვის გამოიყენება დაკვირვებების ბოლო 1/3.

5.1. პუნქტიანი პროგნოზი. ფაქტორების ცვლადების ფაქტობრივი მნიშვნელობები საპროგნოზო პერიოდში ითვლება ნაწინასწარმეტყველებად, შედეგიანი ცვლადის პროგნოზირებული მნიშვნელობები განისაზღვრება როგორც პროგნოზირებულია ორიგინალური / "საუკეთესო" მოდელის მიხედვით, ფაქტორების ცვლადების საფუძველზე საპროგნოზო პერიოდში. Microsoft Excel "გრაფიკის" ხელსაწყოს გამოყენებით, დაკვირვების მიხედვით იკვეთება შედეგის ცვლადის რეალური და პროგნოზირებული მნიშვნელობების გრაფიკი და კეთდება დასკვნა რეალური მნიშვნელობების სიახლოვის შესახებ.

5.2. ინტერვალის პროგნოზირება მოიცავს პროგნოზირების სტანდარტული შეცდომების გამოთვლას (სალკევერის მოჩვენებითი ცვლადების გამოყენებით) და პროგნოზირებული მნიშვნელობების ზედა და ქვედა საზღვრებს.

Microsoft Excel მონაცემთა ანალიზის / რეგრესიის ხელსაწყოს გამოყენებით, აგებულია რეგრესია ნიმუშის მთლიანი მონაცემთა ნაკრებისთვის და საპროგნოზო პერიოდისთვის, მაგრამ მოტყუებული ცვლადების დამატებით D 1, D 2, ..., D p. ამ შემთხვევაში, D i = 1 მხოლოდ დაკვირვების მომენტისთვის (n + i), ყველა სხვა მომენტისთვის D i = 0. მაშინ მოჩვენებითი ცვლადის D i კოეფიციენტი უდრის წინასწარმეტყველების შეცდომას დროს (n + i), ხოლო კოეფიციენტის სტანდარტული შეცდომა უდრის წინასწარმეტყველების სტანდარტულ შეცდომას (S i). ამრიგად, ტარდება მოდელის ავტომატური რეგრესიული ანალიზი, სადაც ფაქტორების ცვლადების საერთო (ნიმუში და პროგნოზირებული) მნიშვნელობები და სალკევერის მოჩვენებითი ცვლადების მნიშვნელობები გამოიყენება როგორც X მნიშვნელობები, ხოლო აგრეგატი (ნიმუში და პროგნოზირებული) შედეგიანი ცვლადის მნიშვნელობები გამოიყენება Y მნიშვნელობებად.

სალკევერის ცვლადების კოეფიციენტების მიღებული სტანდარტული შეცდომები უდრის პროგნოზირების სტანდარტულ შეცდომებს. შემდეგ ინტერვალის პროგნოზის საზღვრები გამოითვლება შემდეგი ფორმულების გამოყენებით: Ymin n + i = Yemp n + i -S i * t cr, Ymax n + i = Yemp n + i + S i * t cr, სადაც t cr არის სტუდენტის განაწილების კრიტიკული მნიშვნელობა, რომელიც განისაზღვრება ფორმულით "= STYURASPOBR (0.05; nm-1)", m არის ახსნა-განმარტებითი ფაქტორების რაოდენობა მოდელში (Y * t), Yemp n + i არის პროგნოზირებული მნიშვნელობები. შედეგიანი ცვლადის (პუნქტი 5.1).

Microsoft Excel "გრაფიკის" ხელსაწყოს გამოყენებით, გრაფიკი აგებულია შედეგიანი ცვლადის რეალური და პროგნოზირებული მნიშვნელობების მიხედვით, დაკვირვების პროგნოზის ზედა და ქვედა საზღვრების მიხედვით. კეთდება დასკვნა შედეგიანი ცვლადის რეალური მნიშვნელობების ინტერვალის პროგნოზის საზღვრებში მორგების შესახებ.

5.3. მოდელის სტაბილურობის შეფასება NCO ტესტის გამოყენებით ხორციელდება შემდეგნაირად:

ა) Microsoft Excel-ის "მონაცემთა ანალიზი / რეგრესია" ხელსაწყოს გამოყენებით აგებულია რეგრესია, სადაც ფაქტორების ცვლადების აგრეგატი (ნიმუში და პროგნოზირებული) მნიშვნელობები აღებულია X მნიშვნელობებად, ხოლო აგრეგატი (ნიმუში და პროგნოზირებული) მნიშვნელობები. შედეგიანი ცვლადის აღებულია Y მნიშვნელობები. ეს რეგრესია გამოიყენება S ნარჩენების კვადრატების ჯამის დასადგენად;

ბ) 5.2 პუნქტის რეგრესიის მიხედვით სალკევერის მოჩვენებითი ცვლადებით, განისაზღვრება ნარჩენების კვადრატების ჯამი Sd;

გ) F სტატისტიკის მნიშვნელობა გამოითვლება და ფასდება ფორმულით:

სადაც p არის პროგნოზირების ნაბიჯების რაოდენობა. თუ მიღებული მნიშვნელობა აღემატება კრიტიკულ მნიშვნელობას F cr, რომელიც განისაზღვრება ფორმულით "= FDISP (0.05; p; nm-1)", მაშინ ჰიპოთეზა მოდელის სტაბილურობის შესახებ საპროგნოზო პერიოდში უარყოფილია, წინააღმდეგ შემთხვევაში ეს იქნება. მიღებულია.

5.4 მოდელის პროგნოზირებადი თვისებების შესახებ მსჯელობების განზოგადება 5.1-5.3 პუნქტების საფუძველზე, რის შედეგადაც ყალიბდება დასკვნა მოდელის პროგნოზირების ხარისხზე და რეკომენდაციები მოდელის პროგნოზირებისთვის გამოყენების შესახებ.

ამრიგად, შემუშავებული ინფორმაცია და მეთოდოლოგიური მხარდაჭერა შეესაბამება მრავალმხრივი რეგრესიის მოდელებში მულტიკოლინიარობის პრობლემის ეკონომეტრიული კვლევის ძირითად მიზნებს.

2.2. ეკონომეტრიული კვლევის მაგალითი

კვლევა ტარდება 2003-2011 წლების რუსეთის ფედერაციის რეალური მაკროეკონომიკური მაჩვენებლების ამსახველი მონაცემების საფუძველზე. (ცხრილი 1), პუნქტის 2.1 მეთოდის მიხედვით.

ცხრილი 1

სახლის ხარჯები. ფერმები (მილიარდ რუბლი) [Y]	მოსახლეობა (მილიონი ადამიანი)	ფულის მიწოდება (მილიარდ რუბლი)	Უმუშევრობის დონე (%)

1.სპეციფიკაციარეგრესიის განტოლების მოდელი მოიცავს Y დამოკიდებული ცვლადის კორელაციური დამოკიდებულების გრაფიკულ ანალიზს (ოჯახის ხარჯები განმარტებით ცვლადზე X 1 (მოსახლეობა) (ნახ. 1), დამოკიდებული ცვლადის Y კორელაციით დამოკიდებულების (ოჯახის ხარჯები განმარტებით ცვლადზე). X 2 (ფულის მიწოდება) (ნახ. 2), დამოკიდებული ცვლადის Y კორელაციური დამოკიდებულება (საყოფაცხოვრებო ხარჯები განმარტებით ცვლადზე X 3 (უმუშევრობის დონე) (ნახ. 3).

Y-სა და X 1-ს შორის კორელაციური დამოკიდებულების გრაფიკი, რომელიც წარმოდგენილია ნახაზ 1-ში, ასახავს Y-ის მნიშვნელოვან (R 2 = 0.71) შებრუნებულ წრფივ დამოკიდებულებას X 1-ზე.

Y-სა და X 2-ს შორის კორელაციური დამოკიდებულების გრაფიკი, წარმოდგენილი 2-ზე, ასახავს Y-ის მნიშვნელოვან (R 2 = 0,98) პირდაპირ ხაზოვან დამოკიდებულებას X 2-ზე.

Y-სა და X 3-ს შორის კორელაციური დამოკიდებულების გრაფიკი, რომელიც წარმოდგენილია 3-ზე, ასახავს Y-ის უმნიშვნელო (R 2 = 0,15) შებრუნებულ წრფივ დამოკიდებულებას X 3-ზე.

სურათი 1

სურათი 2

სურათი 3

შედეგად, წრფივი მრავალჯერადი რეგრესიის მოდელი შეიძლება იყოს მითითებული Y = b 0 + b 1 X 1 + b 2 X 2 + b 3 X 3.

2.პარამეტრიზაციარეგრესიის განტოლებები ხორციელდება "რეგრესიის" ხელსაწყოს გამოყენებით, როგორც "მონაცემთა ანალიზის" დანამატების MsExcel-ის ნაწილი (ნახ. 4).

სურათი 4

რეგრესიის სავარაუდო განტოლება არის:

233983.8-1605.6X 1 + 1.0X 2 + 396.22X 3.

ამ შემთხვევაში, რეგრესიის კოეფიციენტები ინტერპრეტირებულია შემდეგნაირად: მოსახლეობის 1 მილიონი ადამიანით ზრდით, სახლის ხარჯები. ფერმები მცირდება 1605,6 მილიარდი რუბლით; ფულის მასის 1 მილიარდი რუბლით ზრდით. სახლის ხარჯები. ფერმები გაიზრდება 1,0 მილიარდი რუბლით; უმუშევრობის 1%-იანი ზრდით, საცხოვრებლის ხარჯები. ფერმები გაიზრდება 396,2 მილიარდი რუბლით. ფაქტორების ცვლადების ნულოვანი მნიშვნელობებით, სახლის ხარჯები. ფერმები იქნება 233,983.8 მილიარდი რუბლი, რასაც, ალბათ, არ აქვს ეკონომიკური ინტერპრეტაცია.

3.შემოწმებარეგრესიის განტოლება ხორციელდება ავტომატური რეგრესიული ანალიზის შედეგების საფუძველზე (სტადია 2).

ასე რომ, "R-კვადრატი" უდრის 0,998, ე.ი. რეგრესიის განტოლება აღწერს დამოკიდებული ცვლადის ქცევას 99%-ით, რაც მიუთითებს განტოლების აღწერის მაღალ დონეზე. "F-ის მნიშვნელობა" არის 2.14774253442155E-07, რაც მიუთითებს იმაზე, რომ "R-კვადრატი" მნიშვნელოვანია. "P-Value" b 0-სთვის არის 0.002, რაც მიუთითებს, რომ ეს პარამეტრი მნიშვნელოვანია. "P-მნიშვნელობა" b 1-ისთვის არის 0.002, რაც მიუთითებს, რომ ეს კოეფიციენტი მნიშვნელოვანია. "P-Value" b 2-ისთვის არის 8.29103190343224E-07, რაც მიუთითებს იმაზე, რომ ეს კოეფიციენტი მნიშვნელოვანია. "P-Value" b 3-ისთვის არის 0.084, რაც მიუთითებს იმაზე, რომ ეს კოეფიციენტი არ არის მნიშვნელოვანი.

ნარჩენების ნაკვეთებზე დაყრდნობით, ნარჩენები e არის შემთხვევითი მნიშვნელობები.

მორგებული ნაკვეთებიდან გამომდინარე, კეთდება დასკვნა მოდელისთვის რეალური და პროგნოზირებული მნიშვნელობების სიახლოვის შესახებ.

ასე რომ, მოდელი არის კარგი ხარისხის, ხოლო b 3 არ არის მნიშვნელოვანი, ამიტომ შეგვიძლია ვივარაუდოთ მულტიკოლნეარობის არსებობა.

4. დამატებითი კვლევა.

4.1. მულტიკოლინეარობის პირველი ნიშნის გამოვლენა.რეგრესიული ანალიზის მონაცემების მიხედვით (სურათი 5), შეგვიძლია ვთქვათ, რომ არსებობს მულტიკოლნეარობის პირველი ნიშანი, რადგან გამოვლენილია მაღალი და მნიშვნელოვანი R 2, ვლინდება, რომ განტოლებას აქვს მაღალი განსაზღვრის კოეფიციენტი და ერთ-ერთი კოეფიციენტები არ არის მნიშვნელოვანი. ეს მიუთითებს მულტიკოლინეარობის არსებობაზე.

4.2 მულტიკოლნეარობის მეორე ნიშნის გამოვლენა.

ფაქტორების ცვლადებს შორის კორელაციის კოეფიციენტების გამოთვლების საფუძველზე განისაზღვრება ცალკეული ფაქტორების მნიშვნელოვანი ურთიერთობა. (ცხრილი 2). მულტიკოლინეარობის არსებობა ვარაუდობენ შემდეგ შემთხვევაში, თუ არსებობს მნიშვნელოვანი კორელაციის კოეფიციენტი მინიმუმ ორ ცვლადს შორის (ანუ 0,5-ზე მეტი მოდულში).

ცხრილი 2

	[ X2]	[ X3]


[ X2]
[ X3]

ჩვენს შემთხვევაში, არსებობს კორელაციის კოეფიციენტი X 1-სა და X 2-ს შორის (-0,788), რაც მიუთითებს ძლიერ დამოკიდებულებაზე X 1, X 2 ცვლადებს შორის, ასევე არის კორელაციის კოეფიციენტი X 1-სა და X 3-ს შორის (0,54). რაც მიუთითებს ძლიერ დამოკიდებულებაზე X 1, X 3 ცვლადებს შორის.

შედეგად, შეიძლება ვივარაუდოთ მულტიკოლინეარობის არსებობა.

4.3 მულტიკოლნეარობის მესამე ნიშნის გამოვლენა.

ვინაიდან 4.2 სექციაში აღმოჩნდა ძლიერი კავშირი X 1 და X 2 ცვლადებს შორის, მაშინ ამ ცვლადებს შორის დამხმარე რეგრესია გაანალიზებულია (ნახ. 5).

სურათი 5

ვინაიდან "F მნიშვნელობა" არის 0.01, რაც მიუთითებს, რომ "R-კვადრატი" და დამხმარე რეგრესია მნიშვნელოვანია, შეიძლება ვივარაუდოთ, რომ რეგრესორი X 2 იწვევს მულტიკოლნეარობას.

ვინაიდან 4.2 ნაწილში კავშირი X 1 და X 3 ცვლადებს შორის აღმოჩნდა საშუალო დონის ზემოთ, მაშინ ამ ცვლადებს შორის დამხმარე რეგრესია გაანალიზებულია (ნახ. 6).

სურათი 6

ვინაიდან "მნიშვნელოვნება F" არის 0.13, რაც მიუთითებს იმაზე, რომ "R-კვადრატი" და დამხმარე რეგრესია არ არის მნიშვნელოვანი, შეიძლება ვივარაუდოთ, რომ რეგრესორი X 3 არ იწვევს მულტიკოლნეარობას.

ასე რომ, მესამე მახასიათებლის მიხედვით, შეიძლება ვივარაუდოთ მულტიკოლინეარობის არსებობა.

4.4 მსჯელობის განზოგადება.

4.1-4.3 აბზაცების ანალიზის მიხედვით აღმოჩნდა მულტიკოლნეარობის სამივე ნიშანი, ამიტომ შეიძლება ვივარაუდოთ მაღალი ალბათობით. ამავდროულად, 4.3 განყოფილებაში დაშვების მიუხედავად, რეგრესორთან დაკავშირებით, რომელიც იწვევს მულტიკოლნეარობას, შესაძლებელია რეკომენდაცია გავუწიოთ X 3-ის გამორიცხვას ორიგინალური მოდელიდან, ვინაიდან X 3-ს აქვს ყველაზე მცირე კორელაციის კოეფიციენტი Y-თან და ამ რეგრესორის კოეფიციენტი უმნიშვნელოა თავდაპირველ განტოლებაში. რეგრესიული ანალიზის შედეგები X 3-ის გამორიცხვის შემდეგ ნაჩვენებია ნახ. 7.

სურათი 7

ამ შემთხვევაში, ჩვენ გამოვთვლით F - სტატისტიკას გამორიცხვის მიზანშეწონილობის შესამოწმებლად:

F ფაქტი = 4.62,

და F ჩანართი = F 0.05; 1; 5 = 6.61, რადგან F ფაქტი< F табл, то исключение допустимо для переменной X 3 .

წრფივი მრავალჯერადი რეგრესიის მოდელის ხარისხის შეფასება Y = b 0 + b 1 X 1 + b 2 X 2. "R-კვადრატი" არის 0,996, ე.ი. რეგრესიის განტოლება აღწერს დამოკიდებული ცვლადის ქცევას 99%-ით, რაც მიუთითებს განტოლების აღწერის მაღალ დონეზე. "F მნიშვნელობა" არის 3.02415218982089E-08, რაც მიუთითებს, რომ "R-კვადრატი" მნიშვნელოვანია. "P-მნიშვნელობა" b 0-სთვის არის 0.004, რაც მიუთითებს, რომ ეს პარამეტრი მნიშვნელოვანია, "P-მნიშვნელობა" b 1-ისთვის არის 0.005, რაც მიუთითებს, რომ ეს კოეფიციენტი მნიშვნელოვანია. "P-Value" b 2-ისთვის არის 3.87838361673427E-07, რაც მიუთითებს იმაზე, რომ ეს კოეფიციენტი მნიშვნელოვანია. რეგრესიის სავარაუდო განტოლება არის:

201511.7 -1359.6X 1 + 1.01X 2

ამ შემთხვევაში, რეგრესიის კოეფიციენტები ინტერპრეტირებულია შემდეგნაირად: მოსახლეობის 1 მილიონი ადამიანით შემცირებით, სახლის ხარჯები. ფერმები მცირდება 1359,6 მილიარდი რუბლით; ფულის მიწოდების დონის მატებასთან ერთად, სახლის ხარჯები. ფერმები გაიზრდება 1.0) (მილიარდ რუბლი). ფაქტორების ცვლადების ნულოვანი მნიშვნელობებით, სახლის ხარჯები. ფერმები იქნება 201511,7 მილიარდი რუბლი, რომელსაც შეიძლება ჰქონდეს ეკონომიკური ინტერპრეტაცია.

ასე რომ, მოდელი = 201511.7 -1359.6X 1 + 1.01X 2 არის კარგი ხარისხის და რეკომენდებულია პროგნოზირებისთვის, როგორც "საუკეთესო" ორიგინალურ მოდელთან შედარებით.

5. პროგნოზირება.

5.1 წერტილის პროგნოზირება.ფაქტორების ცვლადების რეალური მნიშვნელობები საპროგნოზო პერიოდში განიხილება წინასწარმეტყველებად, შედეგიანი ცვლადის პროგნოზირებული მნიშვნელობები განისაზღვრება "საუკეთესო" მოდელის მიხედვით (= 201511.7 -1359.6X 1 + 1.01X 2) ფაქტორების ცვლადები საპროგნოზო პერიოდში. Microsoft Excel "გრაფიკის" ხელსაწყოს გამოყენებით, დაკვირვების მიხედვით იკვეთება შედეგის ცვლადის რეალური და პროგნოზირებული მნიშვნელობების გრაფიკი და კეთდება დასკვნა რეალური მნიშვნელობების სიახლოვის შესახებ.

ფაქტორების ცვლადების პროგნოზირებული მნიშვნელობები წარმოდგენილია ცხრილში 3.

ცხრილი 3

ეფექტური ცვლადის პროგნოზირებული მნიშვნელობები განისაზღვრება "საუკეთესო" მოდელის მიხედვით (= 201511.7 -1359.6X 1 + 1.01X 2) პროგნოზირების პერიოდში ფაქტორების ცვლადების საფუძველზე. პროგნოზირებული მნიშვნელობები წარმოდგენილია ცხრილში 4; ფაქტობრივი მნიშვნელობები დამატებულია შედარებისთვის.

ცხრილი 4

			[Y] ემპირიული

სურათი 8 გვიჩვენებს შედეგიანი ცვლადის ფაქტობრივ და საპროგნოზო მნიშვნელობებს, ასევე პროგნოზის ქვედა და ზედა საზღვრებს.

Ფიგურა 8

ნახ. 8-ის მიხედვით, პროგნოზი ინარჩუნებს მზარდ ტენდენციას და ყველა საპროგნოზო მნიშვნელობა ახლოს არის რეალურთან.

5.2. ინტერვალის პროგნოზი.

ცხრილი 5

						[Y] ბუები

სურათი 9

მაშინ მოჩვენებითი ცვლადის კოეფიციენტის სტანდარტული შეცდომა უდრის სტანდარტული პროგნოზირების შეცდომას (S i): 2012 წლისთვის ეს იქნება 738,5; 2013 წლისთვის იქნება 897,1; 2014 წლისთვის იქნება 1139.4.

ინტერვალის პროგნოზის საზღვრები გამოითვლება ცხრილში 6.

ცხრილი 6

[Y] ემპირიული	[Y] ბუები	[S] პრ

ცხრილის მიხედვით. 6, Microsoft Excel "გრაფიკის" ხელსაწყოს გამოყენებით, გრაფიკი აგებულია შედეგიანი ცვლადის რეალური და პროგნოზირებული მნიშვნელობების მიხედვით, დაკვირვების პროგნოზის ზედა და ქვედა საზღვრებს (ნახ. 10).

სურათი 10

გრაფიკის მიხედვით, პროგნოზირებული მნიშვნელობები ჯდება ინტერვალის პროგნოზის საზღვრებში, რაც მიუთითებს პროგნოზის კარგ ხარისხზე.

5.3. მოდელის სტაბილურობის შეფასება NCO ტესტის გამოყენებითხორციელდება შემდეგნაირად:

ა) Microsoft Excel ინსტრუმენტის "მონაცემთა ანალიზი / რეგრესია" გამოყენებით აგებულია რეგრესია (ნახ. 11), სადაც ფაქტორების ცვლადების აგრეგატი (ნიმუში და პროგნოზი) მნიშვნელობები აღებულია X მნიშვნელობებად, ხოლო აგრეგატი ( ნიმუში და პროგნოზი) მნიშვნელობები აღებულია, როგორც Y აფასებს შედეგის ცვლადს. ეს რეგრესია გამოიყენება ნარჩენების კვადრატების ჯამის დასადგენად S = 2058232.333.

სურათი 11

ბ) 3.2 პუნქტის რეგრესიით სალკევერის მოჩვენებითი ცვლადებით (ნახ. 9), განისაზღვრება ნარჩენების კვადრატების ჯამი Sd = 1270272.697.

გ) F სტატისტიკის მნიშვნელობა გამოითვლება და ფასდება:

ხოლო F cr = F 0.05; 3; 5 = 5.40, მაშინ მიღებული მნიშვნელობა ნაკლებია კრიტიკულ მნიშვნელობაზე F cr და მიღებულია ჰიპოთეზა მოდელის სტაბილურობის შესახებ საპროგნოზო პერიოდში.

5.4 მოდელის პროგნოზირებადი თვისებების შესახებ განსჯის განზოგადება 5.1-5.3 პუნქტების საფუძველზე, შედეგად, ყალიბდება დასკვნა მოდელის მაღალი პროგნოზირების ხარისხზე (= 201511.7 -1359.6X 1 + 1.01X 2) და მოცემულია რეკომენდაციები მოდელის პროგნოზირებისთვის გამოყენების შესახებ.

პუნქტი 2.1-ის ტექნიკა წარმატებით იქნა გამოცდილი, ის საშუალებას გვაძლევს განვსაზღვროთ მულტიკოლინეარობის ძირითადი ნიშნები და შეიძლება რეკომენდებული იყოს ასეთი კვლევებისთვის.

დასკვნა

მულტიკოლინეარულობა - ეკონომეტრიაში (რეგრესიული ანალიზი) - რეგრესიის მოდელის ახსნა-განმარტებით ცვლადებს (ფაქტორებს) შორის წრფივი ურთიერთობის არსებობა. ამავდროულად, განასხვავებენ სრულ კოლინარობას, რაც ნიშნავს ფუნქციური (იდენტური) წრფივი ურთიერთობის არსებობას და ნაწილობრივ ან უბრალოდ მულტიკოლნეარობას, რაც ნიშნავს ფაქტორებს შორის ძლიერი კორელაციის არსებობას.

მულტიკოლინეარობის ძირითადი შედეგებია: შეფასებების დიდი ვარიაციები, კოეფიციენტების t- სტატისტიკის დაქვეითება, უმცირესი კვადრატების მეთოდის გამოყენებით კოეფიციენტების შეფასება ხდება არასტაბილური, ძნელია ცვლადების წვლილის დადგენა და კოეფიციენტის არასწორი ნიშანი. მიღებულია.

მულტიკოლინეარობის გამოვლენის ძირითადი კრიტერიუმებია: მაღალი R 2 უმნიშვნელო კოეფიციენტებით; მაღალი დაწყვილებული კორელაციის კოეფიციენტები; VIF კოეფიციენტის მაღალი მნიშვნელობები.

მულტიკოლინეარობის აღმოფხვრის ძირითადი მეთოდებია: ცვლადის (ებ)ის გამორიცხვა მოდელიდან; დამატებითი მონაცემების ან ახალი ნიმუშის მოპოვება; მოდელის სპეციფიკაციის შეცვლა; ზოგიერთი პარამეტრის შესახებ წინასწარი ინფორმაციის გამოყენება.

შემუშავებული ინფორმაცია და მეთოდოლოგიური მხარდაჭერა შეესაბამება მრავალმხრივი რეგრესიის მოდელებში მულტიკოლინეარობის პრობლემის ეკონომეტრიული კვლევის ძირითად მიზნებს და შეიძლება რეკომენდებული იყოს ასეთი კვლევებისთვის.

გამოყენებული წყაროების სია

ასტახოვი, ს.ნ. ეკონომეტრია [ტექსტი]: სასწავლო-მეთოდური კომპლექსი. ყაზანი, 2008 წ.-- 107 წ.
ბარდასოვი, S. A. ECONOMETRICS [ტექსტი]: სახელმძღვანელო. მე-2 გამოცემა, Rev. და დაამატეთ. ტიუმენი: ტიუმენის სახელმწიფო უნივერსიტეტის გამომცემლობა, 2010.264 გვ.
ბოროდკინა, ლ.ი. ლექციების კურსი [ელექტრონული რესურსი]. წვდომის რეჟიმი - http://www.iskunstvo.info/materials/history/2/inf/correl.htm
ვოსკობოინიკოვი, იუ. ECONOMETRICS EXCEL-ში ნაწილი 1 [ტექსტი]: სასწავლო სახელმძღვანელო, ნოვოსიბირსკი 2005,156 გვ.
ელისეევა, ი.ი. სემინარი ეკონომიკაზე: სახელმძღვანელო. სახელმძღვანელო ეკონომიკისთვის. უნივერსიტეტები / Eliseeva, I.I., Kurysheva, S.V., Gordeenko, N.M. , [და სხვ.] ; რედ. ი.ი. ელისეევა - მ .: ფინანსები და სტატისტიკა, 2001 წ.-- 191 გვ. - (14126-1).
მულტიკოლინეარულობა [ელექტრონული რესურსი]. წვდომის რეჟიმი - https://ru.wikipedia.org/wiki/Multicollinearity.
ნოვიკოვი, ა.ი. ეკონომიკა [ტექსტი]: სახელმძღვანელო. სახელმძღვანელო მაგ. "ფინანსები და კრედიტი", "ეკონომიკა" - მ .: დაშკოვი და კ, 2013. - 223 გვ. - (93895-1).
მულტიკოლინეარობის პრობლემა [ელექტრონული რესურსი]. წვდომის რეჟიმი - http://crow.academy.ru/econometrics/lectures_/lect_09_/lect_09_4.pdf.
Chernyak V. გამოყენებითი ეკონომიკა. ლექცია No9 [ელექტრონული რესურსი]. წვდომის რეჟიმი http://www.slideshare.net/vtcherniak/lect-09.
ru - ენციკლოპედიური საიტი [ელექტრონული რესურსი]. წვდომის რეჟიმი - http://kodcupon.ru/ra17syplinoe97/ Multicollinearity.

ჩამოტვირთვა: თქვენ არ გაქვთ წვდომა ფაილების ჩამოტვირთვაზე ჩვენი სერვერიდან.

რუსეთის ფედერაციის განათლებისა და მეცნიერების ფედერალური სააგენტო

კოსტრომას სახელმწიფო ტექნოლოგიური უნივერსიტეტი.

უმაღლესი მათემატიკის კათედრა

ეკონომიკაზე თემაზე:

მულტიკოლინეარულობა

Შესრულებული

1 კურსის სტუდენტი

კორესპონდენციის ფაკულტეტი

sp-t "ბუღალტერია,

ანალიზი და აუდიტი“.

შემოწმებული

კატეჟინა ს.ფ.

კოსტრომა 2008 წ

მულტიკოლინეარულობა

მულტიკოლინეარულობა გაგებულია, როგორც ახსნა ცვლადების მაღალი ურთიერთკორელაცია. მულტიკოლნეარულობა შეიძლება გამოვლინდეს ფუნქციური (გამოკვეთილი) და სტოქასტური (ლატენტური) ფორმებში.

მულტიკოლინეარობის ფუნქციონალურ ფორმაში, ახსნით ცვლადებს შორის დაწყვილებული კავშირიდან ერთი მაინც არის წრფივი ფუნქციონალური დამოკიდებულება. ამ შემთხვევაში X`X მატრიცა განსაკუთრებულია, ვინაიდან შეიცავს წრფივად დამოკიდებულ სვეტის ვექტორებს და მისი განმსაზღვრელი ნულის ტოლია, ე.ი. დარღვეულია რეგრესიული ანალიზის წინაპირობა, რაც იწვევს ნორმალური განტოლებების შესაბამისი სისტემის ამოხსნის და რეგრესიის მოდელის პარამეტრების შეფასების მოპოვების შეუძლებლობას.

თუმცა, ეკონომიკურ კვლევაში მულტიკოლინეარულობა ხშირად ვლინდება სტოქასტური ფორმით, როდესაც არსებობს მჭიდრო კორელაცია მინიმუმ ორ ახსნა-განმარტებით ცვლადს შორის. მატრიცა X`X ამ შემთხვევაში არაერთგულოვანია, მაგრამ მისი დეტერმინანტი ძალიან მცირეა.

ამავდროულად, b შეფასებების ვექტორი და მისი კოვარიანტული მატრიცა ∑ b პროპორციულია შებრუნებული მატრიცის (X`X) -1, რაც ნიშნავს, რომ მათი ელემენტები უკუპროპორციულია | X`X | დეტერმინანტის მნიშვნელობისა. შედეგად მიიღება b 0, b 1,…, bp რეგრესიის კოეფიციენტების მნიშვნელოვანი სტანდარტული გადახრები (სტანდარტული შეცდომები) და მათი მნიშვნელოვნების შეფასება t-კრიტერიუმით აზრი არ აქვს, თუმცა ზოგადად რეგრესიის მოდელი შეიძლება შემობრუნდეს. მნიშვნელოვანი იყოს F- კრიტერიუმით.

შეფასებები ძალიან მგრძნობიარე ხდება დაკვირვებებისა და ნიმუშის ზომის მცირე ცვლილებების მიმართ. რეგრესიულ განტოლებებს ამ შემთხვევაში, როგორც წესი, არ აქვთ რეალური მნიშვნელობა, რადგან მის ზოგიერთ კოეფიციენტს შეიძლება ჰქონდეს ნიშნები, რომლებიც არასწორია ეკონომიკური თეორიის თვალსაზრისით და გაუმართლებლად დიდი მნიშვნელობები.

არ არსებობს ზუსტი რაოდენობრივი კრიტერიუმები მულტიკოლინეარობის არსებობის ან არარსებობის დასადგენად. მიუხედავად ამისა, არსებობს მისი გამოვლენის რამდენიმე ევრისტიკული მიდგომა.

ერთ-ერთი ასეთი მიდგომაა კორელაციური მატრიცის ანალიზი X 1, X 2, ..., X p განმარტებით ცვლადებს შორის და ცვლადების წყვილის იდენტიფიცირება მაღალი კორელაციის ცვლადებით (ჩვეულებრივ, 0,8-ზე მეტი). თუ ასეთი ცვლადები არსებობს, საუბარია მათ შორის მულტიკოლინეარულობაზე. ასევე სასარგებლოა განსაზღვრის მრავალი კოეფიციენტის პოვნა ერთ-ერთ ახსნა-განმარტებით ცვლადსა და მათ ზოგიერთ ჯგუფს შორის. განსაზღვრის მაღალი მრავალჯერადი კოეფიციენტის არსებობა (ჩვეულებრივ 0,6-ზე მეტი) მიუთითებს მულტიკოლინეარულობაზე.

კიდევ ერთი მიდგომაა X`X მატრიცის გამოკვლევა. თუ X`X მატრიცის განმსაზღვრელი ან მისი მინიმალური საკუთარი მნიშვნელობა λ min ახლოს არის ნულთან (მაგალითად, სიდიდის იგივე რიგის დაგროვების გამოთვლით შეცდომებთან ერთად), მაშინ ეს მიუთითებს მულტიკოლნეარობის არსებობაზე. იგივე შეიძლება დადასტურდეს X`X მატრიცის მაქსიმალური საკუთარი მნიშვნელობის λ max მნიშვნელოვანი გადახრით მისი მინიმალური საკუთარი მნიშვნელობიდან λ min.

მულტიკოლინეარობის აღმოსაფხვრელად ან შესამცირებლად გამოიყენება მრავალი მეთოდი. მათგან უმარტივესი (მაგრამ ყოველთვის არ არის შესაძლებელი) არის ის, რომ ორი ახსნითი ცვლადი მაღალი კორელაციის კოეფიციენტით (0.8-ზე მეტი), ერთი ცვლადი გამორიცხულია განხილვისგან. ამავდროულად, რომელი ცვლადი უნდა დატოვოს და რომელი ამოიღოს ანალიზიდან, წყდება, პირველ რიგში, ეკონომიკური მოსაზრებებიდან გამომდინარე. თუ ეკონომიკური თვალსაზრისით, არც ერთი ცვლადი არ შეიძლება იყოს უპირატესი, მაშინ დარჩენილია ორი ცვლადიდან ერთი, რომელსაც აქვს უფრო დიდი კორელაციის კოეფიციენტი დამოკიდებულ ცვლადთან.

მულტიკოლინეარობის აღმოფხვრის ან შემცირების კიდევ ერთი მეთოდი არის უმცირესი კვადრატების მეთოდით განსაზღვრული მიუკერძოებელი შეფასებებიდან გადაადგილება მიკერძოებულ შეფასებებზე, რომლებსაც აქვთ ნაკლები გაფანტვა შეფასებულ პარამეტრთან შედარებით, ე.ი. b j შეფასების გადახრის კვადრატის დაბალი მათემატიკური მოლოდინი β j ან M (b j - β j) პარამეტრიდან 2.

ვექტორით განსაზღვრულ შეფასებებს, გაუს-მარკოვის თეორემის შესაბამისად, აქვთ მინიმალური ვარიაციები ყველა ხაზოვანი მიუკერძოებელი შეფასების კლასში, მაგრამ მულტიკოლნეარობის არსებობის შემთხვევაში, ეს დისპერსიები შეიძლება აღმოჩნდეს ძალიან დიდი და გადავიდეს შესაბამისზე. მიკერძოებულმა შეფასებებმა შეიძლება გაზარდოს რეგრესიის პარამეტრების შეფასების სიზუსტე. ფიგურაში ნაჩვენებია შემთხვევა, როდესაც მიკერძოებული შეფასება β j ^, რომლის ნიმუშის განაწილება მოცემულია φ სიმკვრივით (β j ^).

მართლაც, მაქსიმალური დასაშვები ნდობის ინტერვალი სავარაუდო β j პარამეტრისთვის იყოს (β j -Δ, β j + Δ). მაშინ ნდობის ალბათობა, ან შეფასების სანდოობა, რომელიც განსაზღვრულია განაწილების მრუდის ქვეშ არსებული ფართობით ინტერვალში (β j -Δ, β j + Δ), როგორც ეს ნახატიდან ადვილად ჩანს, ამ შემთხვევაში იქნება. უფრო დიდი β j-ის შესაფასებლად bj-თან შედარებით (სურათზე ეს უბნები დაჩრდილულია). შესაბამისად, შეფასების გადახრის საშუალო კვადრატი სავარაუდო პარამეტრიდან ნაკლები იქნება მიკერძოებული შეფასებისთვის, ე.ი.

M (β j ^ - β j) 2< M (b j - β j) 2

ქედის რეგრესიის (ან ქედის რეგრესიის) გამოყენებისას მიუკერძოებელი შეფასებების ნაცვლად, მიკერძოებული შეფასებები მოცემულია ვექტორის მიერ

β τ ^ = (X`X + τ E p +1) -1 X`Y,

სადაც τ – რაღაც დადებითი რიცხვი, რომელსაც ეწოდება "ქედი" ან "ქედი",

E p +1 არის (р + 1) - რიგის ერთეული მატრიცა.

დამატება τ X`X მატრიცის დიაგონალურ ელემენტებთან მიმართავს მოდელის პარამეტრების შეფასებებს მიკერძოებულად, მაგრამ ამავე დროს იზრდება ნორმალური განტოლებების სისტემის მატრიცის განმსაზღვრელი - ნაცვლად (X`X) -დან ტოლი იქნება

| X`X + τ E p +1 |

ამრიგად, შესაძლებელი ხდება მულტიკოლნეარობის გამორიცხვა იმ შემთხვევაში, როდესაც განმსაზღვრელი |X`X | ახლოს არის ნულთან.

მულტიკოლნეარობის აღმოსაფხვრელად, შეიძლება გამოყენებულ იქნას გადასვლის საწყისი ახსნა-განმარტებითი ცვლადები X 1, X 2, ..., X n, რომლებიც ერთმანეთთან არის დაკავშირებული საკმაოდ მჭიდრო კორელაციური დამოკიდებულებით, ახალ ცვლადებზე, რომლებიც წარმოადგენენ ორიგინალის ხაზოვან კომბინაციებს. ამ შემთხვევაში, ახალი ცვლადები უნდა იყოს სუსტად კორელირებული ან ზოგადად არაკორელირებული. როგორც ასეთ ცვლადებს, ჩვენ ვიღებთ, მაგალითად, კომპონენტების ანალიზში შესწავლილი საწყისი ახსნა-განმარტებითი ცვლადების ვექტორის ეგრეთ წოდებულ ძირითად კომპონენტებს და განვიხილავთ რეგრესიას ძირითად კომპონენტებზე, რომლებშიც ეს უკანასკნელი მოქმედებს როგორც განზოგადებული განმარტებითი ცვლადები, რომლებიც ექვემდებარება შემდგომ მნიშვნელობას. ეკონომიკური) ინტერპრეტაცია.

ძირითადი კომპონენტების ორთოგონალურობა ხელს უშლის მულტიკოლინარული ეფექტის გამოვლინებას. გარდა ამისა, გამოყენებული მეთოდი საშუალებას აძლევს ადამიანს შეზღუდოს საკუთარი თავი ძირითადი კომპონენტების მცირე რაოდენობით თავდაპირველი განმარტებითი ცვლადების შედარებით დიდი რაოდენობით.

მულტიკოლნეარულობა -ეს არის ტერმინი, რომელიც გამოიყენება პრობლემის აღსაწერად, სადაც ახსნით ცვლადებს შორის ფხვიერი წრფივი კავშირი იწვევს არასანდო რეგრესიის შეფასებებს. რა თქმა უნდა, ასეთი ურთიერთობა სულაც არ იძლევა არადამაკმაყოფილებელ შეფასებებს. თუ ყველა სხვა პირობა ხელსაყრელია, ანუ თუ დაკვირვებების რაოდენობა და ახსნა-განმარტებითი ცვლადების ნიმუშის ვარიაციები დიდია, ხოლო შემთხვევითი ტერმინის ვარიაცია მცირეა, მაშინ, შედეგად, საკმაოდ კარგი შეფასებების მიღება შეიძლება.

ასე რომ, მულტიკოლინეარულობა უნდა იყოს გამოწვეული ფხვიერი დამოკიდებულების და ერთი (ან მეტი) არახელსაყრელი პირობების კომბინაციით და ეს არის კითხვა.

ფენომენის სიმძიმე და არა მისი ტიპი. ნებისმიერი რეგრესიის ქულა გარკვეულწილად დაზარალდება მისგან, თუ ყველა ახსნა-განმარტებადი ცვლადი სრულიად შეუსაბამოა. ამ პრობლემის განხილვა იწყება მხოლოდ მაშინ, როდესაც ის სერიოზულად იმოქმედებს რეგრესიის შეფასების შედეგებზე.

ეს პრობლემა ხშირია დროის სერიების რეგრესიებში, ანუ, როდესაც მონაცემები შედგება გარკვეული პერიოდის განმავლობაში დაკვირვების სერიისგან. თუ ორ ან მეტ ახსნა-განმარტებით ცვლადს აქვს ძლიერი დროითი ტენდენცია, მაშინ ისინი მჭიდრო კორელაციაში იქნება და ამან შეიძლება გამოიწვიოს მულტიკოლინიურობა.

რა შეიძლება გაკეთდეს ამ შემთხვევაში?

სხვადასხვა მეთოდები, რომლებიც შეიძლება გამოყენებულ იქნას მულტიკოლინეარობის შესამცირებლად, იყოფა ორ კატეგორიად: პირველი კატეგორია მოიცავს მცდელობებს გააუმჯობესოს ოთხი პირობა, რომელიც უზრუნველყოფს რეგრესიის შეფასებების სანდოობას; მეორე კატეგორია არის გარე ინფორმაციის გამოყენება. თუ შესაძლებელია პირველ რიგში გამოყენებული იქნას უშუალოდ მიღებული მონაცემები, მაშინ ცხადია, სასარგებლო იქნება დაკვირვებების რაოდენობის გაზრდა.

თუ იყენებთ დროის სერიების მონაცემებს, ამის გაკეთება შეგიძლიათ ყოველი დროის პერიოდის ხანგრძლივობის შემცირებით. მაგალითად, 5.3 და 5.6 სავარჯიშოებში მოთხოვნის ფუნქციის განტოლებების შეფასებისას შეგიძლიათ წლიური მონაცემების გამოყენებით კვარტალურ მონაცემებზე გადახვიდეთ.

ამის შემდეგ, 25 დაკვირვების ნაცვლად, იქნება 100. ეს იმდენად აშკარა და ადვილი გასაკეთებელია, რომ დროის სერიების გამოყენებით მკვლევართა უმეტესობა თითქმის ავტომატურად იყენებს კვარტალურ მონაცემებს, თუ ეს შესაძლებელია, წლიური მონაცემების ნაცვლად, თუნდაც მულტიკოლნეარობის პრობლემა. არ ღირს, მხოლოდ რეგრესიის კოეფიციენტების თეორიული ვარიაციების მინიმუმამდე შემცირება. თუმცა, ამ მიდგომასთან დაკავშირებით პოტენციური პრობლემებია. ავტოკორელაცია შეიძლება დაინერგოს ან გაძლიერდეს, მაგრამ შეიძლება განეიტრალდეს. გარდა ამისა, მიკერძოება გაზომვის შეცდომების გამო შეიძლება დანერგილი იყოს (ან გაძლიერდეს), თუ კვარტალური მონაცემები შეფასდება ნაკლები სიზუსტით, ვიდრე შესაბამისი წლიური მონაცემები. ამ პრობლემის მოგვარება ადვილი არ არის, მაგრამ შეიძლება არც იყოს მნიშვნელოვანი.