Çoklu bağlantının tanımı. Çoklu bağlantının nedenleri ve sonuçları

çoklu doğrusallıkÇoklu regresyon denkleminde iki veya daha fazla faktöriyel değişken arasındaki doğrusal bir ilişkidir. Böyle bir bağımlılık işlevsel ise, o zaman şundan söz edilir: tam çoklu bağlantı... Eğer korelasyon ise, o zaman kısmi çoklu doğrusallık... Tam çoklu bağlantı daha çok teorik bir soyutlama ise (özellikle k kalite seviyeleri, ile değiştirin k ikili değişkenler), o zaman kısmi çoklu bağlantı çok gerçektir ve neredeyse her zaman mevcuttur. Sadece şiddetinin derecesi hakkında konuşabiliriz. Örneğin, açıklayıcı değişkenler harcanabilir gelir ve tüketimi içeriyorsa, bu değişkenlerin her ikisi de elbette yüksek oranda ilişkili olacaktır.

Çoklu doğrusal bağlantının olmaması, klasik doğrusal çoklu modelin istenen ön koşullarından biridir. Bu, aşağıdaki hususlardan kaynaklanmaktadır:

1) Tam çoklu bağlantı durumunda, OLS kullanarak doğrusal çoklu regresyon parametrelerinin tahminlerini oluşturmak genellikle imkansızdır.

2) Kısmi çoklu bağlantı durumunda, regresyon parametrelerinin tahminleri güvenilmez olabilir ve buna ek olarak, belirlenmesi zordur.

faktörlerin etkin göstergeye izole katkısı.

Çoklu bağlantının ortaya çıkmasının ana nedeni, bazı girdi değişkenlerini aynı anda etkileyen, ancak modelde dikkate alınmayan süreçlerin çalışılan nesnesinde bulunmasıdır. Bu, konu alanının kalitesiz bir çalışmasının veya çalışılan nesnenin parametrelerinin karşılıklı ilişkilerinin karmaşıklığının sonucu olabilir.

Çoklu doğrusal bağlantının şu olduğundan şüpheleniliyor:

- modelde çok sayıda önemsiz faktör;

- regresyon parametrelerinin büyük standart hataları;

- tahminlerin kararsızlığı (ilk verilerdeki küçük bir değişiklik önemli bir değişikliğe yol açar).

Çoklu doğrusallığın varlığını veya yokluğunu belirlemeye yönelik bir yaklaşım, korelasyon matrisini analiz etmektir.

açıklayıcı değişkenler ile yüksek çift korelasyon katsayıları (genellikle 0,7'den fazla) olan faktör çiftlerinin belirlenmesi arasında. Bu tür faktörler varsa, aralarında açık bir doğrusallık vardır.

Bununla birlikte, tek tek ele alındığında eşleştirilmiş korelasyon katsayıları, birkaç faktörün (sadece iki değil) kümülatif etkileşimini değerlendiremez.

Bu nedenle, modelde çoklu bağlantının varlığını değerlendirmek için, faktörler arasındaki ikili korelasyon katsayılarının matrisinin belirleyicisi ( faktörler arası korelasyon matrisinin belirleyicisi)

Faktörler arası korelasyon matrisinin determinantı 0'a ne kadar yakınsa, çoklu bağlantı o kadar güçlüdür ve bunun tersi, determinant 1'e ne kadar yakınsa çoklu bağlantı o kadar az olur.

Faktörlerin çoklu doğrusallığının istatistiksel önemi, alternatif bir hipotez altında sıfır hipotezinin test edilmesiyle belirlenir. Boş hipotezi test etmek için serbestlik dereceli Pearson dağılımı kullanılır. İstatistiklerin gözlenen değeri formülle bulunur, burada n- gözlem sayısı, m- faktörlerin sayısı. Belirli bir önem düzeyi için kritik değer, Pearson dağılımının kritik noktaları tablosundan belirlenir. Eğer öyleyse hipotez reddedilir ve modelde faktörlerin çoklu doğrusal ilişkisinin olduğu kabul edilir.

Çoklu doğrusallığı etkileyen faktörler, faktörlerin her birinin diğer faktörlerin bağımlı değişkeni olarak kabul edilmesi koşuluyla hesaplanan çoklu belirleme katsayılarının analiziyle de ayırt edilebilir:,,…,. 1'e ne kadar yakınlarsa, faktörlerin çoklu doğrusallığı o kadar güçlüdür. Bu, çoklu belirleme katsayısının minimum değerine sahip faktörlerin denklemde bırakılması gerektiği anlamına gelir.

Tam çoklu bağlantıya gelince, en belirleyici mücadele onunla verilmelidir: diğer değişkenlerin doğrusal kombinasyonları olan değişkenleri regresyon denkleminden hemen çıkarın.

Kısmi çoklu bağlantı, tanımlanması ve ortadan kaldırılması gereken ciddi bir kötülük değildir. Her şey çalışmanın amaçlarına bağlıdır. Modellemenin ana görevi yalnızca bağımlı değişkenin değerlerini tahmin etmekse, o zaman yeterince büyük bir belirleme katsayısı ile () çoklu doğrusallığın varlığı, modelin tahmin niteliklerini etkilemez. Modellemenin amacı, her bir faktörün bağımlı değişkendeki değişime katkısını da belirlemekse, çoklu bağlantının varlığı ciddi bir sorundur.

Çoklu doğrusallığı ortadan kaldırmanın en basit yöntemi, bir veya birkaç ilişkili değişkeni modelden çıkarmaktır.

Çoklu doğrusallık doğrudan örneğe bağlı olduğundan, farklı bir örneklemle çoklu doğrusal bağlantı olmaması ya da çok ciddi olmaması mümkündür. Bu nedenle, çoklu doğrusallığı azaltmak için bazı durumlarda örneklem büyüklüğünü artırmak yeterlidir.

Bazen çoklu bağlantı sorunu, model spesifikasyonunu değiştirerek çözülebilir: ya modelin şekli değişir ya da orijinal modelde dikkate alınmayan, ancak bağımlı değişkeni önemli ölçüde etkileyen faktörler eklenir.

Bazı durumlarda, faktör değişkenleri dönüştürülerek çoklu bağlantı en aza indirilebilir veya tamamen ortadan kaldırılabilir. Bu durumda, aşağıdaki dönüşümler en yaygın olanıdır:

1. Çoklu doğrusal değişkenlerin doğrusal kombinasyonu (örneğin,).

2. Çoklu doğrusal değişkeni artışıyla değiştirme.

3. Bir eşdoğrusal değişkenin diğerine bölünmesi.

Bir regresyon denklemi düşündüğümüzü ve onun tahminine ilişkin verilerin farklı kalitedeki nesneler için gözlemler içerdiğini varsayalım: erkekler ve kadınlar, beyazlar ve siyahlar için. Burada bizi ilgilendirebilecek soru şudur - incelenen modelin farklı kalitedeki nesnelerle ilgili iki örnek için çakıştığı doğru mu? Bu soruyu Chow testini kullanarak cevaplayabilirsiniz.

Modelleri düşünün:

, Bence=1,…,n (1);

, Bence=n+1,…,n+m (2).

ilk örnekte n gözlemler, ikinci - m gözlemler. Örnek: Y- ücretler, değişkenlerin açıklanması - yaş, hizmet süresi, eğitim düzeyi. Sağdaki açıklayıcı değişkenlere bağlı ücretlerin bağımlılığı modelinin kadın ve erkek için aynı olduğu eldeki verilerden mi çıkıyor?

Bu hipotezi test etmek için kısıtlı regresyon ve kısıtlamasız regresyonu karşılaştırarak genel hipotez test şemasını kullanabilirsiniz. Burada kısıtlamasız regresyon, (1) ve (2) regresyonlarının birleşimidir, yani. ESS UR = ESS 1 + ESS 2, serbestlik derecesi sayısı - n + m - 2k... Kısıtlı regresyon (yani, boş hipotezin karşılandığı varsayımı altındaki regresyon), mevcut tüm gözlem seti için regresyon olacaktır:

, Bence = 1,…, n+m (3).

Tahmin (3), elde ederiz ESS R... Boş hipotezi test etmek için aşağıdaki istatistikleri kullanırız:

Hangi, eğer boş hipotez doğruysa, payın serbestlik derecesi sayısı ile Fisher dağılımına sahiptir. k ve payda n+ m- 2k.

Sıfır hipotezi doğruysa, mevcut örnekleri tek bir örnekte birleştirebilir ve modeli şu şekilde tahmin edebiliriz: n+m gözlemler. Sıfır hipotezini reddedersek, iki örneği tek bir örnekte birleştiremeyiz ve bu iki modeli ayrı ayrı değerlendirmemiz gerekir.

Daha önce ele aldığımız genel doğrusal modelin incelenmesi, gördüğümüz gibi, istatistiksel aygıta dayalı olarak çok önemlidir. Ancak tüm uygulamalarda olduğu gibi dostum. İstatistiklere göre, bir yöntemin gücü, onun altında yatan ve uygulanması için gerekli olan varsayımlara bağlıdır. Bir süreliğine, lineer modelin altında yatan hipotezlerden birinin veya birkaçının ihlal edildiği durumları ele alacağız. Bu durumlarda alternatif değerlendirme yöntemlerini ele alacağız. Bazı hipotezlerin rolünün diğerlerinin rolünden daha önemli olduğunu göreceğiz. Belirli koşulların (varsayımların) ihlalinin ne gibi sonuçlara yol açabileceğini görmemiz, bunların sağlanıp sağlanmadığını kontrol edebilmemiz ve klasik en küçük kareler yönteminin uygun olmadığı durumlarda hangi istatistiksel yöntemlerin uygulanabileceğini ve uygulanması gerektiğini bilmemiz gerekir.

1. Değişkenler arasındaki ilişki doğrusaldır ve denklem - model belirleme hataları (denklemde önemli açıklayıcı değişkenlerin dahil edilmemesi, denkleme gereksiz değişkenlerin dahil edilmesi, bağımlılık biçiminin yanlış seçimi) ile ifade edilir. değişkenler);

2. x 1 ,…,x k- deterministik değişkenler - stokastik regresörler, lineer bağımsız - tam çoklu bağlantı;

4. - değişen varyans;

5. ne zaman Bence ¹ k- hataların otokorelasyonu

Konuşmaya başlamadan önce şu kavramları göz önünde bulundurun: çift korelasyon katsayısı ve kısmi korelasyon katsayısı.

Bir değişkenin başka bir değişken üzerindeki etkisini araştırdığımızı varsayalım ( Y ve x). Bu değişkenlerin birbirleriyle nasıl ilişkili olduğunu anlamak için aşağıdaki formülü kullanarak çift korelasyon katsayısını hesaplıyoruz:

Korelasyon katsayısının değerini 1'e yakın alırsak, değişkenlerin birbirleriyle oldukça güçlü bir şekilde ilişkili olduğu sonucuna varırız.

Ancak, ilgilenilen iki değişken arasındaki korelasyon katsayısı 1'e yakınsa, aslında bağımlı olmayabilirler. Akıl hastası ve radyo vakası, "yanlış korelasyon" denen şeyin bir örneğidir. Korelasyon katsayısının yüksek olması, ilk iki değişken üzerinde güçlü bir etkiye sahip olan üçüncü bir değişkenin varlığından da kaynaklanabilir, bu da yüksek korelasyonlarının nedenidir. Bu nedenle, değişkenler arasındaki "saf" korelasyonun hesaplanması sorunu ortaya çıkar. x ve Y, yani, diğer değişkenlerin etkisinin (doğrusal) hariç tutulduğu bir korelasyon. Bunun için kısmi korelasyon katsayısı kavramı tanıtılır.

Böylece değişkenler arasındaki kısmi korelasyon katsayısını belirlemek istiyoruz. x ve Y, değişkenin doğrusal etkisi hariç Z... Bunu belirlemek için aşağıdaki prosedür kullanılır:

1. Regresyonu tahmin ediyoruz,

2. Artanları alırız,

3. Regresyonu tahmin ediyoruz,

4. Artanları alırız,

5. - kısmi korelasyonun örnek katsayısı, değişkenler arasındaki ilişkinin derecesini ölçer x ve Y, değişkenin etkisinden arındırılmış Z.

Doğrudan hesaplamalar:

Mülk:

Kısmi korelasyon katsayısı oluşturma prosedürü, iki veya daha fazla değişkenin etkisinden kurtulmak istediğimizde genelleştirilmiştir.

1. Mükemmel çoklu doğrusallık.

Gauss-Markov gereksinimlerinden biri bize açıklayıcı değişkenlerin herhangi bir kesin ilişki içinde ilişkili olmaması gerektiğini söyler. Değişkenler arasında böyle bir ilişki varsa, modelin mükemmel çoklu bağlantıya sahip olduğunu söyleriz. Örnek. Üç açıklayıcı değişkenden oluşan ortalama sınav puanına sahip bir model düşünün: Bence- ebeveyn geliri, D- günde eğitime harcanan ortalama saat sayısı, W- haftada eğitime harcanan ortalama saat sayısı. bariz ki W=7D... Ve bu oran, örneklemimize giren her öğrenci için yerine getirilecektir. Tam çoklu bağlantı durumunun izlenmesi kolaydır, çünkü bu durumda en küçük kareler yöntemini kullanarak tahminler oluşturmak imkansızdır.

2. Kısmi çoklu doğrusallık veya basitçe çoklu doğrusallık.

Çok daha yaygın bir durum, açıklayıcı değişkenler arasında kesin bir doğrusal ilişki olmadığı, ancak aralarında yakın bir korelasyon olduğu zamandır - bu duruma gerçek veya kısmi çoklu doğrusallık (basitçe çoklu doğrusallık) denir - değişkenler arasında yakın istatistiksel ilişkilerin varlığı. Çoklu bağlantı sorununun, fenomenin türünden ziyade tezahürünün derecesi ile ilgili olduğu söylenmelidir. Tüm açıklayıcı değişkenler tamamen ilişkisiz olmadıkça, herhangi bir regresyon puanı şu veya bu şekilde bundan zarar görecektir. Bu problemin ele alınması, yalnızca regresyon tahmininin sonuçlarını ciddi şekilde etkilemeye başladığında başlar (regresörler arasındaki istatistiksel ilişkilerin varlığı, mutlaka tatmin edici olmayan tahminler vermez). Dolayısıyla çoklu bağlantı, regresörler arasındaki sıkı korelasyonun güvenilmez regresyon tahminlerine yol açtığı bir problemdir.

Çoklu doğrusal bağlantının sonuçları:

Resmi olarak, beri ( x"x) Dejenere değilse, regresyon katsayılarının OLS tahminlerini oluşturabiliriz. Ancak, regresyon katsayılarının tahminlerinin teorik varyanslarının nasıl ifade edildiğini hatırlayalım: bir ii - Bence matrisin th köşegen elemanı. Matris (X "X) dejenere ve det ( x"x) »0, sonra

1) Ters matrisin elemanları det ile ters orantılı olduğundan, ters matrisin ana köşegeninde çok büyük sayılar vardır ( x"x). Bu nedenle teorik varyans Bence-th katsayısı yeterince büyüktür ve varyans tahmini de büyüktür, bu nedenle, T- istatistikler küçüktür, bu da istatistiksel anlamsızlığa yol açabilir Bence katsayı. Yani değişken, açıklanan değişken üzerinde anlamlı bir etkiye sahiptir ve bunun önemsiz olduğu sonucuna varırız.

2) Tahminler ve bağlı olduğundan ( x"x) -1, öğeleri det ile ters orantılı olan ( x"x), o zaman bir veya iki gözlem ekler veya çıkarırsak, matrise bir veya iki satır ekler veya çıkarırsak x"x, daha sonra değerler ve önemli ölçüde değişebilir, işaretteki bir değişikliğe kadar - tahmin sonuçlarının kararsızlığı.

3) Regresyon denklemini yorumlamada zorluk. Diyelim ki denklemde birbiriyle ilişkili iki değişkenimiz var: x 1 ve x 2. regresyon katsayısı x 1, değişimin bir ölçüsü olarak yorumlanır Y değiştirerek x 1 ceteris paribus, yani diğer tüm değişkenlerin değerleri aynı kalır. Ancak değişkenler olduğundan x 1 ve x 2 bağlanır, ardından değişkendeki değişiklikler x 1 değişkende öngörülebilir değişikliklere neden olur x 2 ve değer x 2 aynı kalmayacak.

Örnek: nerede x 1 - toplam alan, x 2 - yaşam alanı. Diyoruz ki: "Yaşam alanı 1 m2 artarsa, o zaman diğer her şey eşit olunca daire fiyatı USD artacak." Ancak bu durumda yaşam alanı da 1 metrekare artacaktır. m. ve fiyat artışı olacaktır. Değişken Üzerindeki Etkiyi Tanımlayın Y her değişken ayrı ayrı artık mümkün değildir. Bu durumda bir dairenin fiyatı ile çıkış yolu, modele toplam alanı değil, "ek" veya "ek" alanı dahil etmektir.

Çoklu doğrusallık işaretleri.

Çoklu doğrusal bağlantının varlığını (yokluğunu) belirlemek için kesin bir kriter yoktur. Ancak, bunu tespit etmek için buluşsal öneriler vardır:

1) Regresörler arasındaki eşleştirilmiş korelasyon katsayılarının matrisini analiz edin ve korelasyon katsayısının değeri 1'e yakınsa, bu çoklu doğrusallığın bir işareti olarak kabul edilir.

2) Korelasyon matrisinin analizi, çoklu doğrusallığın varlığı (yokluğu) hakkında yalnızca yüzeysel bir yargıdır. Bu konuda daha dikkatli bir çalışma, regresyondaki diğer tüm açıklayıcı değişkenler için kısmi korelasyon katsayıları veya açıklayıcı değişkenlerin her biri için belirleme katsayıları hesaplanarak elde edilir.

4) (x’x) Simetrik pozitif tanımlı bir matristir; bu nedenle, tüm özdeğerleri negatif değildir. Matrisin determinantı ise ( x’x) sıfıra eşitse, minimum özdeğer de sıfır olur ve süreklilik korunur. Sonuç olarak, büyük özdeğerin değeri, matrisin determinantının sıfıra yakınlığı üzerinden de değerlendirilebilir ( x’x). Bu özelliğin yanı sıra minimum özdeğer de önemlidir çünkü katsayının standart hatası ters orantılıdır.

5) Çoklu bağlantının varlığı, çoklu bağlantının sonuçları olan dış işaretlerle değerlendirilebilir:

a) bazı tahminlerin ekonomik teori açısından yanlış olan veya haksız yere yüksek değerlere sahip işaretleri var;

b) ilk ekonomik verilerdeki küçük bir değişiklik, model katsayılarının tahminlerinde önemli bir değişikliğe yol açar;

c) çoğunluk T- katsayıların istatistikleri sıfırdan önemsiz derecede farklıdır, aynı zamanda yüksek değerle kanıtlandığı gibi model bir bütün olarak önemlidir F-İstatistik.

Çoklu doğrusallıktan nasıl kurtulur, nasıl ortadan kaldırılır:

1) Faktör analizini kullanma. Aralarında istatistiksel olarak bağımlı olanların da bulunduğu orijinal regresör setinden yeni regresörlere geçiş Z 1 ,…,zm Temel bileşenler yöntemini kullanarak - ilk değişkenler yerine, ilk değişkenler yerine, aralarındaki korelasyonun küçük veya hiç olmadığı bazı doğrusal kombinasyonlarını dikkate alıyoruz. Buradaki zorluk, yeni değişkenlere anlamlı yorumlar vermektir. Z... Başarısız olursa, ters dönüşümleri kullanarak orijinal değişkenlere döneriz. Bununla birlikte, elde edilen tahminler yanlı olacak, ancak daha düşük varyansa sahip olacaktır.

2) Mevcut tüm değişkenler arasından açıklanan değişkeni en çok etkileyen faktörleri seçin. Seçim prosedürleri aşağıda tartışılacaktır.

3) Önyargılı tahmin yöntemlerine geçiş.

Çoklu bağlantı sorunuyla karşı karşıya kaldığımızda, deneyimsiz araştırmacı ilk başta buna neden olabilecek gereksiz regresyonları dışlama arzusuna sahiptir. Ancak, bu anlamda hangi değişkenlerin gereksiz olduğu her zaman açık değildir. Ek olarak, aşağıda gösterileceği gibi, sözde önemli ölçüde etkileyen değişkenlerin göz ardı edilmesi, OLS tahminlerinin yanlılığına yol açar.

Bazı durumlarda çoklu bağlantının, onu belirlemek ve ortadan kaldırmak için önemli çaba sarf edecek kadar ciddi bir "kötülük" olmadığına dikkat edin. Temel olarak, hepsi çalışmanın hedeflerine bağlıdır.
Modelin ana görevi, bağımlı değişkenin gelecekteki değerlerini tahmin etmekse, o zaman yeterince büyük bir belirleme katsayısı R2 (gt; 0.9) ile, çoklu doğrusallığın varlığı genellikle modelin tahmin niteliklerini etkilemez ( gelecekte ilişkili değişkenler öncekiyle aynı kalırsa).
Açıklayıcı değişkenlerin her birinin bağımlı değişken üzerindeki etki derecesini belirlemek gerekirse, standart hataların artmasına neden olan çoklu bağlantının, değişkenler arasındaki gerçek ilişkileri çarpıtması muhtemeldir. Bu durumda çoklu bağlantı ciddi bir problemdir.
Çoklu doğrusallığı ortadan kaldırmak için her durumda uygun tek bir yöntem yoktur. Bunun nedeni, çoklu bağlantının neden ve sonuçlarının belirsiz olması ve büyük ölçüde örneklem sonuçlarına bağlı olmasıdır.
Değişken(ler)in modelden hariç tutulması
Çoklu doğrusallığı ortadan kaldırmanın en basit yöntemi, bir veya birkaç ilişkili değişkeni modelden çıkarmaktır. Bu yöntemi uygularken biraz dikkatli olmak gerekir. Bu durumda, spesifikasyon hataları mümkündür, bu nedenle, uygulamalı ekonometrik modellerde, çoklu bağlantı ciddi bir sorun haline gelene kadar açıklayıcı değişkenlerin dışlanmaması tavsiye edilir.
Ek veri veya yeni bir örnek alma
Çoklu bağlantı doğrudan örneğe bağlı olduğundan, farklı bir örneklemle çoklu bağlantının çok ciddi olmaması veya olmaması mümkündür. Bazen örneklem büyüklüğünü artırmak, çoklu doğrusallığı azaltmak için yeterlidir. Örneğin yıllık veri kullanıyorsanız üç aylık verilere gidebilirsiniz. Veri miktarının arttırılması, regresyon katsayılarının varyansını azaltır ve dolayısıyla istatistiksel anlamlılığını artırır. Ancak yeni bir numune elde etmek veya eskisini genişletmek her zaman mümkün değildir veya ciddi maliyetler içerir. Ek olarak, bu yaklaşım otokorelasyonu artırabilir. Bu sorunlar, bu yöntemin kullanımını sınırlar.
Model spesifikasyonunu değiştirme
Bazı durumlarda, çoklu bağlantı sorunu model spesifikasyonunu değiştirerek çözülebilir: ya modelin şekli değişir ya da orijinal modelde dikkate alınmayan ancak bağımlı değişkeni önemli ölçüde etkileyen açıklayıcı değişkenler eklenir. Bu yöntem doğrulanırsa, kullanımı sapmaların karelerinin toplamını azaltır, böylece regresyonun standart hatasını azaltır. Bu, katsayıların standart hatalarında bir azalmaya yol açar.
Bazı parametreler hakkında ön bilgilerin kullanılması
Bazen çoklu regresyon modeli oluştururken bazı regresyon katsayılarının bilinen değerleri başta olmak üzere ön bilgileri kullanabilirsiniz.
Herhangi bir ön (genellikle daha basit) model için veya daha önce elde edilmiş bir örneğe dayalı benzer bir model için hesaplanan katsayıların değerlerinin şu anda geliştirilmekte olan model için kullanılması muhtemeldir.
En önemli açıklayıcı değişkenlerin seçimi. Elemanların sıralı bağlantısı için prosedür
Daha az açıklayıcı değişkene geçmek, birbirine oldukça bağımlı özellikler tarafından sağlanan bilgilerin tekrarını azaltabilir. Bu, çoklu doğrusal açıklayıcı değişkenler durumunda tam olarak karşılaştığımız şeydir.
İzin vermek

Çoklu katsayı
bağımlı değişken Y ile açıklayıcı değişkenler kümesi X 1, X 2, ..., Xm arasındaki korelasyonlar. Y ve doğrusal bir fonksiyon arasındaki olağan ikili korelasyon katsayısı olarak tanımlanır.
regresyon Y = b0 + KX1 + b2X2 + ... + bmXm. Amp'e izin ver; = R-1 - matris R matrisinin tersi:

Daha sonra Ry.X = Rr (xi, x2, .., x) kare katsayısı aşağıdaki formülle hesaplanabilir:

R2y.X belirleme katsayısının tarafsızlığı için düzeltilmiş R * 2.X tahmini şu şekildedir:

(Eğer formül (6.7) ile negatif bir sayı elde edilirse, o zaman varsayıyoruz:

için alt güven sınırı

belirlenen
formüle göre:

Uygulamada, modele hangi açıklayıcı değişkenlerin dahil edileceğine karar verirken, öğelerin sıralı birleştirilmesi prosedürü sıklıkla kullanılır.
(j = 1, 2, ..., m). nerede

normalin karesi ile çakışıyor
çift korelasyon katsayısı

İzin vermek

o zaman xp değişkeni en bilgilendirici olacaktır. Daha sonra tarafsızlık için düzeltilmiş katsayı hesaplanır.
(m = 1 için) ve alt güven sınırı R2min (1).

jxp, xq çifti daha bilgilendirici olacaktır). Daha sonra tarafsızlık için düzeltilmiş katsayı hesaplanır (m = 2 ile)
ve alt güven sınırı R2min (2).

Prosedür, (+1'e) adımdaki koşul yerine getirilene kadar devam eder:
Daha sonra model, ilk adımlarda elde edilen en bilgilendirici değişkenleri içerir. Hesaplamalarda, m yerine k adım sayısının karşılık gelen değerinin alındığı formüller (6.7) ve (6.8) kullanıldığını unutmayın.
Aslında bu yöntem çoklu bağlantıdan kurtulacağımızı garanti etmez.
Çoklu doğrusallığı ortadan kaldırmak için başka yöntemler de kullanılır.
Örnek 6.1. Aşağıdaki koşullu veriler vardır (Tablo 6.1):
Tablo 6.1
Zincirleme bağlama yöntemine ilişkin veriler

X1	X2	X3	Sahip olmak
1	1,5	0,7	12
2	2,5	1,2	20
3	1	1,4	15
4	5,5	1,9	41
5	3	2,5	33
6	3	3,1	35
7	2,8	3,5	38
8	0,5	4	28
9	4	3,8	47
10	2	5,3	40

Açıklayıcı değişkenlerin her birinin bağımlı değişken üzerindeki etkisini ayrı ayrı ele alalım. Eşleştirilmiş korelasyon katsayılarını hesaplayarak, katsayının

O zamanlar:

(x1, x2) ve (x1, x3) değişken çiftlerinin bağımlı değişken üzerindeki etkisini düşünün. İlk olarak, bir çift değişkenin (x1, x2) etkisini düşünün.

Icuvum uvjpcuuivi
Değişkenleri birleştirirken, denkleme iki açıklayıcı değişken dahil edilmelidir. Bu nedenle, teorik denklem şu şekilde olacaktır:
sırt yöntemi
Çoklu doğrusallığı ortadan kaldırmak için sırt yöntemini (sırt regresyonu) düşünün. Yöntem, 1962'de A.E. Hoerl tarafından önerildi ve matris (xtX) dejenere olmaya yakın olduğunda uygulanır. Matrisin (xtX) köşegen elemanlarına bazı küçük sayılar (0,1'den 0,4'e kadar) eklenir. Bu durumda, denklemin parametrelerinin yanlı tahminleri elde edilir. Ancak çoklu bağlantı durumunda bu tür tahminlerin standart hataları, olağan en küçük kareler yöntemiyle verilenlerden daha düşüktür.
Örnek 6.2. İlk veriler "Tablo 6 2 Açıklayıcı değişkenlerin korelasyon katsayısı

ne
güçlü çoklu bağlantı olduğunu gösterir.
Tablo 6.2
Sırt yöntemiyle çoklu bağlantı çalışması için veriler

x1	x2	Sahip olmak
1	1,4	7
2	3,1	12

Sonra y = 2.63 + 1.37x1 + 1.95x2 denklemini elde ederiz. Ters matrisin köşegen elemanları önemli ölçüde azalacak ve z00 = 0.45264, z11 = 1.57796, z00 = 0.70842'ye eşit olacak ve bu da katsayıların standart hatalarında bir azalmaya yol açacaktır.
Özet
Çoklu bağlantının yol açabileceği ana sonuçlar arasında aşağıdakiler ayırt edilebilir:

t-testi kullanılarak çoklu regresyon katsayılarının önemsizliği hakkındaki ana hipotezi test ederken, çoğu durumda kabul edilir, ancak, A-testi kullanılarak test edildiğinde regresyon denkleminin kendisinin anlamlı olduğu ortaya çıkar, bu da fazla tahmin edilen bir değeri gösterir çoklu korelasyon katsayısının;
çoklu regresyon denkleminin katsayılarının elde edilen tahminleri genellikle haksız bir şekilde fazla tahmin edilmiştir veya yanlış işaretlere sahiptir;
ilk verilere bir veya iki gözlem eklemek veya hariç tutmak, model katsayılarının tahminleri üzerinde güçlü bir etkiye sahiptir;
Çoklu regresyon modelinde çoklu bağlantının varlığı, onu daha fazla kullanım için (örneğin, tahmin yapmak için) uygunsuz hale getirebilir.

Kendi kendine test soruları

Çoklu doğrusallık nedir?
Hangi göstergeler çoklu bağlantının varlığını gösterir?
Mükemmel çoklu bağlantı durumunda XTX matrisinin belirleyicisi nedir?
Çoklu doğrusallık durumunda açıklayıcı değişkenlerin katsayılarının anlamı hakkında ne söylenebilir?
Tarak yönteminde nasıl bir dönüşüm yapılır, nelere yol açar?
Açıklayıcı değişkenlerin sayısını art arda artırma yöntemindeki eylemlerin sırası nedir?
Korelasyon katsayısı neyi gösterir?
Kısmi korelasyon katsayısı neyi gösterir?

Rusya Federasyonu Eğitim ve Bilim Bakanlığı

Federal Devlet Bütçe Eğitim Kurumu

Yüksek öğretim

TVER DEVLET TEKNİK ÜNİVERSİTESİ

"Muhasebe ve Finans" Bölümü

KURS PROJESİ
"Ekonometri" disiplininde

"Ekonometrik modellerde çoklu bağlantının araştırılması: değişken(ler)in modelden çıkarılması"

İş süpervizörü:

Cand. şunlar. Bilimler, Doçent

Konovalova

Yürütücü:

EK-1315 EPO grubunun öğrencisi

Tver, 2015

Giriş ……………………………………………………………………… ... 3

1. Analitik kısım ………………………………………………………… 4

1.1. Ekonometrik modellerde genelleştirilmiş çoklu bağlantı işaretleri ………………………………………………………………………… .4

1.2. Ekonometrik modellerde çoklu doğrusallığı ortadan kaldırmanın başlıca yolları ………… .. ………………………………………… ..7

2. Tasarım bölümü …………………………………………………………… ..11

2.1. Ekonometrik araştırmanın bilgi ve metodolojik desteği ……………………………………………………………… .11

2.2. Bir ekonometrik çalışma örneği ……………………………… .17

Sonuç ……………………………………………………………… .... 30

Kullanılan kaynakların listesi ………………………………………… ... 31

Tanıtım

“Ekonometrik modellerde çoklu bağlantının incelenmesi: değişken(ler)in modelden çıkarılması” başlıklı çalışmanın konusunun önemi, günümüzde bu soruna uygulamalı ekonometrik modellerde sıklıkla rastlanmasından kaynaklanmaktadır.

Araştırmanın konusu çoklu bağlantı sorunudur. Araştırmanın amacı ekonometrik modellerdir.

Çalışmanın temel amacı, ekonometrik araştırmaların bilgi ve metodolojik desteği için tasarım çözümleri geliştirmektir.

Hedefe ulaşmak için aşağıdaki ana araştırma görevleri belirlendi ve çözüldü:

Ekonometrik modellerde çoklu bağlantı özelliklerinin genelleştirilmesi.
Çoklu doğrusallığı ortadan kaldırmanın ana yollarının belirlenmesi.

3. Ekonometrik araştırmalar için bilgi ve metodolojik desteğin geliştirilmesi.

analitik kısım

1.1. Ekonometrik modellerde genelleştirilmiş çoklu bağlantı işaretleri

Çoklu doğrusallık - ekonometride (regresyon analizi) - regresyon modelinin açıklayıcı değişkenleri (faktörleri) arasında doğrusal bir ilişkinin varlığı. Aynı zamanda, var tam doğrusallık, bu, işlevsel (özdeş) bir doğrusal bağımlılığın varlığı anlamına gelir ve kısmi ya da sadece çoklu bağlantı- faktörler arasında güçlü bir ilişkinin varlığı.

Tam doğrusallık belirsizlikler Tahmin yöntemlerinden bağımsız olarak doğrusal bir regresyon modelindeki parametreler. Örnek olarak aşağıdaki doğrusal modeli kullanarak bunu düşünün:

Bu modelin faktörleri aşağıdaki gibi aynı şekilde ilişkili olsun: Ardından, ilk katsayıya eklediğimiz orijinal doğrusal modeli düşünün. keyfi numara a, ve aynı sayıyı diğer iki katsayıdan çıkarın. Sonra (rastgele bir hata olmadan):

Böylece modelin katsayılarındaki görece keyfi değişime rağmen aynı model elde edilir. Bu model temelde tanımlanamaz. Belirsizlik, modelin kendisinde zaten mevcuttur. 3 boyutlu katsayılar uzayını düşünürsek, o zaman bu uzayda bu durumda gerçek katsayıların vektörü tek değil, tam bir düz çizgidir. Bu doğru üzerindeki herhangi bir nokta gerçek bir katsayı vektörüdür.

Tam doğrusallık parametre değerlerinde belirsizliğe yol açarsa, kısmi çoklu doğrusallık onların kararsızlığına yol açar. değerlendirmeler... Kararsızlık, istatistiksel belirsizlikteki bir artışla ifade edilir - tahminlerin varyansı. Bu, numuneler homojen olsa bile belirli değerlendirme sonuçlarının numuneden numuneye büyük ölçüde değişebileceği anlamına gelir.

Bildiğiniz gibi, en küçük kareler yöntemini kullanarak çoklu regresyon parametrelerinin tahminlerinin kovaryans matrisi eşittir. Bu nedenle, kovaryans matrisi (determinantı) ne kadar "küçük"se, parametre tahminlerinin kovaryans matrisi o kadar "büyük" ve özellikle bu matrisin köşegen elemanları, yani parametre tahminlerinin varyansı o kadar büyük olur. Netlik için, iki faktörlü bir model örneğini düşünün:

O zaman örneğin birinci faktör için parametre tahmininin varyansı şuna eşittir:

faktörler arasındaki örnek korelasyon katsayısı nerede.

Burada açıkça görülmektedir ki, faktörler arasındaki korelasyon modülü ne kadar büyük olursa, parametre tahminlerinin varyansı da o kadar büyük olur. (Tam eşdoğrusallıkta), varyans, daha önce söylenenlere karşılık gelen sonsuzluğa eğilimlidir.

Bu nedenle, parametrelerin tahminleri yanlış elde edilir, bu da belirli faktörlerin açıklanan değişken üzerindeki etkisini yorumlamanın zor olacağı anlamına gelir. Aynı zamanda, çoklu bağlantı bir bütün olarak modelin kalitesini etkilemez - istatistiksel olarak anlamlı olarak kabul edilebilir. Tümü katsayılar önemsizdir (bu, çoklu bağlantının işaretlerinden biridir).

Doğrusal modellerde parametreler arasındaki korelasyon katsayıları pozitif ve negatif olabilir. İlk durumda, bir parametredeki artışa başka bir parametredeki artış eşlik eder. İkinci durumda, bir parametre arttığında diğeri azalır.

Buna dayanarak, kabul edilebilir ve kabul edilemez çoklu bağlantı kurmak mümkündür. Faktör 1 ve 2 arasında anlamlı bir pozitif korelasyon olduğunda ve her faktörün y'nin fonksiyonu ile korelasyon üzerindeki etkisi tek yönlü olduğunda, yani hem faktör 1 hem de 2'deki bir artış bir artışa yol açtığında, kabul edilemez bir çoklu doğrusallık ortaya çıkacaktır. veya y'nin fonksiyonunda azalma. Başka bir deyişle, her iki faktör de y işlevi üzerinde aynı şekilde etki eder ve aralarındaki anlamlı pozitif korelasyon, bunlardan birinin hariç tutulmasına izin verebilir.

İzin verilen çoklu bağlantı, faktörlerin y fonksiyonunu farklı şekilde etkilemesidir. Burada iki durum mümkündür:

a) Faktörler arasında anlamlı bir pozitif korelasyon ile, her bir faktörün y fonksiyonu ile korelasyon üzerindeki etkisi çok yönlüdür, yani. Bir faktördeki artış, fonksiyonda bir artışa yol açar ve diğer bir faktördeki artış, y'nin fonksiyonunda bir azalmaya yol açar.

b) faktörler arasında önemli bir negatif korelasyon ile, bir faktördeki artışa başka bir faktördeki azalma eşlik eder ve bu, faktörleri belirsiz hale getirir, bu nedenle, faktörlerin y'nin işlevi üzerindeki etkisinin herhangi bir işareti mümkündür.

Uygulamada, çoklu bağlantının en karakteristik özelliklerinden bazıları ayırt edilir: 1. İlk verilerdeki küçük bir değişiklik (örneğin, yeni gözlemlerin eklenmesi), model katsayılarının tahminlerinde önemli bir değişikliğe yol açar. 2. Tahminler büyük standart hatalara, düşük anlamlılığa sahipken, model bir bütün olarak anlamlıdır (R2 belirleme katsayısının yüksek değeri ve karşılık gelen F istatistikleri). 3. Katsayıların tahminleri, teorik açıdan yanlış işaretlere veya haksız şekilde büyük değerlere sahiptir.

Dolaylı çoklu doğrusallık işaretleri, model parametrelerinin tahminlerinin yüksek standart hataları, küçük t istatistikleri (yani, önemsiz katsayılar), yanlış tahmin işaretleri iken, model bir bütün olarak istatistiksel olarak anlamlı olarak kabul edilir (büyük F istatistikleri değeri) . Çoklu doğrusallık, numune verilerinin eklenmesinden (veya çıkarılmasından) (yeterli numune homojenliği için gereksinimler karşılanıyorsa) parametre tahminlerinde güçlü bir değişiklikle de kanıtlanabilir.

Faktörlerin çoklu doğrusallığını tespit etmek için faktörlerin korelasyon matrisi doğrudan analiz edilebilir. Zaten çift korelasyon katsayılarının mutlak değer (0.7-0.8'in üzerinde) değerlerinin büyük olması, elde edilen tahminlerin kalitesiyle ilgili olası sorunları gösterir.

Ancak, ikili korelasyon katsayılarının analizi yetersizdir. Diğer faktörler () için faktörlerin regresyonlarının belirlenmesi katsayılarını analiz etmek gerekir. Göstergeyi hesaplamanız önerilir. İkincisinin çok yüksek değerleri, çoklu doğrusallığın varlığı anlamına gelir.

Bu nedenle, çoklu doğrusallığı tespit etmek için ana kriterler şunlardır: tüm önemsiz katsayılar için yüksek R2, yüksek çift korelasyon katsayıları, VIF katsayısının yüksek değerleri.

1.2. Ekonometrik modellerde çoklu doğrusallığı ortadan kaldırmanın ana yolları

Çoklu doğrusallığı ortadan kaldırmanın ana yöntemlerini belirtmeden önce, bazı durumlarda çoklu doğrusallığın, onu belirlemek ve ortadan kaldırmak için önemli çabalar gerektiren ciddi bir sorun olmadığını belirtelim. Temel olarak, hepsi çalışmanın hedeflerine bağlıdır.

Modelin ana görevi, regresyonun gelecekteki değerlerini tahmin etmekseve, o zaman yeterince büyük bir belirleme katsayısı R2 (> 0.9) ile, çoklu doğrusallığın varlığı genellikle modelin öngörücü niteliklerini etkilemez. Her ne kadar bu ifade yalnızca gelecekte ilişkili regresörlerin daha önce olduğu gibi aynı ilişkiyi sürdüreceği durumda haklı gösterilecektir. Çalışmanın amacı, regresörlerin her birinin regresyon üzerindeki etki derecesini belirlemekse, standart hataların artmasına yol açan çoklu doğrusal bağlantının varlığı, regresörler arasındaki gerçek ilişkileri bozabilir. Bu durumda çoklu bağlantı ciddi bir problemdir.

Her durumda uygun olan çoklu doğrusallığı ortadan kaldırmak için tek bir yöntem olmadığını unutmayın. Bunun nedeni, çoklu bağlantının neden ve sonuçlarının belirsiz olması ve büyük ölçüde örneklem sonuçlarına bağlı olmasıdır.

Uygulamada, çoklu doğrusallığı ortadan kaldırmanın ana yöntemleri ayırt edilir:

Modelden regresyonları ortadan kaldırmak Çoklu doğrusallığı ortadan kaldırmanın en basit yöntemi, bir veya birkaç ilişkili regresörü modelden çıkarmaktır. Ancak bu yöntemi uygularken biraz dikkatli olmak gerekiyor. Bu durumda, spesifikasyon hataları mümkündür. Örneğin, belirli bir mala olan talebi incelerken, bu malın fiyatı ve bu malın ikamelerinin fiyatları, genellikle birbiriyle ilişkili olan açıklayıcı değişkenler olarak kullanılabilir. İkame fiyatlarını modelden çıkardığımızda, şartname hatası yapmamız daha olasıdır. Sonuç olarak, yanlı tahminler elde edilebilir ve mantıksız sonuçlar çıkarılabilir. Bu nedenle, uygulamalı ekonometrik modellerde, doğrusallıkları ciddi bir sorun haline gelene kadar regresyonların dışlanmaması arzu edilir.
Ek veri veya yeni bir örnek elde etmek, çoklu bağlantı doğrudan örneğe bağlı olduğundan, o zaman belki de farklı bir örnekle, çoklu doğrusallık olmayacak veya çok ciddi olmayacak. Bazen örneklem büyüklüğünü artırmak, çoklu doğrusallığı azaltmak için yeterlidir. Örneğin yıllık veri kullanıyorsanız üç aylık verilere gidebilirsiniz. Veri miktarının arttırılması, regresyon katsayılarının varyansını azaltır ve dolayısıyla istatistiksel anlamlılığını artırır. Ancak yeni bir numune elde etmek veya eskisini genişletmek her zaman mümkün değildir veya ciddi maliyetler içerir. Ek olarak, bu yaklaşım otokorelasyonu artırabilir. Bu sorunlar, bu yöntemin kullanımını sınırlar.

III. Model spesifikasyonunun değiştirilmesi Bazı durumlarda, çoklu doğrusallık problemi model spesifikasyonunu değiştirerek çözülebilir: ya modelin şekli değiştirilir ya da orijinal modelde dikkate alınmayan, ancak bağımlı modeli önemli ölçüde etkileyen yeni regresörler eklenir. değişken. Bu yöntem doğrulanırsa, kullanımı sapmaların karelerinin toplamını azaltır, böylece regresyonun standart hatasını azaltır. Bu, katsayıların standart hatalarında bir azalmaya yol açar.

Bazı durumlarda değişkenlerin dönüşümü, yalnızca değişkenlerin dönüştürülmesiyle çoklu bağlantı sorunu en aza indirilebilir veya tamamen ortadan kaldırılabilir. Her durumda orijinal veriler, bu durumda bağımlı regresörlerden birinin değerlerine bölünür. Temel bileşenler yönteminin modelin faktörlerine uygulanması, başlangıç faktörlerini dönüştürmenize ve bir dizi dikey (ilişkisiz) faktör elde etmenize olanak tanır. Bu durumda, çoklu bağlantının varlığı, kendimizi az sayıda temel bileşenle sınırlamamıza izin verecektir. Bununla birlikte, temel bileşenlerin anlamlı bir şekilde yorumlanması sorunu ortaya çıkabilir.

Tüm göstergelerde çoklu bağlantı varsa, ekonometristler arasında bu konuda farklı görüşler vardır. Çoklu bağlantı sorunu ile karşı karşıya kalındığında, buna neden olabilecek “gereksiz” bağımsız değişkenleri atmak için doğal bir istek olabilir. Ancak, bunu yaparken yeni zorlukların ortaya çıkabileceği unutulmamalıdır. Birincisi, bu anlamda hangi değişkenlerin gereksiz olduğu her zaman net değildir.

Çoklu doğrusallık, faktörler arasında yalnızca yaklaşık bir doğrusal ilişki anlamına gelir, ancak bu her zaman "ekstra" değişkenleri vurgulamaz. İkincisi, birçok durumda herhangi bir bağımsız değişkenin çıkarılması modelin anlamını önemli ölçüde etkileyebilir. Son olarak, sözde temel değişkenleri, yani. Çalışılan bağımlı değişkeni fiilen etkileyen bağımsız değişkenler, modelin katsayılarında bir yanlılığa yol açar. Uygulamada, genellikle çoklu bağlantı tespit edildiğinde, analiz için en az anlamlı olan faktör kaldırılır ve ardından hesaplamalar tekrarlanır.

Bu nedenle, pratikte, çoklu doğrusallığı ortadan kaldırmak için ana yöntemler ayırt edilir: değişkenlerden birini hariç tutarak örneği değiştirmek veya arttırmak, çoklu doğrusal değişkenleri dönüştürmek (doğrusal olmayan formları kullanın, kümeleri kullanın (birkaç değişkenin doğrusal kombinasyonlarını kullanın), bunun yerine ilk farkları kullanın. Ancak, çoklu doğrusallık ortadan kaldırılmazsa, dışlamanın uygunluğunu dikkate alarak bunu yok sayabilirsiniz.

proje bölümü

2.1. Ekonometrik araştırmanın bilgi ve metodolojik desteği

Ekonometrik araştırmanın bilgi desteği aşağıdaki bilgileri içerir:

Giriş bilgileri:

bağımlı değişken olarak tanımlanan sosyo-ekonomik göstergeye ilişkin istatistiksel veriler (faktörler - sonuçlar);
açıklayıcı değişkenler (faktörler - işaretler) olarak tanımlanan sosyo-ekonomik göstergelere ilişkin istatistiksel veriler;

Ara bilgiler:

bir regresyon denklemi modeli, tahmin edilen regresyon denklemi, kalite göstergeleri ve regresyon denkleminin kalitesi hakkında bir sonuç, bir çoklu doğrusallık probleminin varlığı (yokluğu) hakkında bir sonuç, modelin kullanılması için öneriler;

Etkili bilgi:

tahmini regresyon denklemi, regresyon denkleminin kalitesi hakkında sonuç, çoklu doğrusallık probleminin varlığı (yokluğu) hakkında sonuç, modelin uygulanması için öneriler.

Ekonometrik araştırma metodolojisi aşağıdaki gibidir: spesifikasyon; parametreleştirme, doğrulama, ek araştırma, tahmin.

1. Regresyon denklemi modelinin belirtimi, bağımlı değişkenin her bir açıklayıcı değişken üzerindeki korelasyon bağımlılığının grafiksel bir analizini içerir. Grafik analizin sonuçlarına dayanarak, doğrusal veya doğrusal olmayan tiplerin regresyon denklemi modeli hakkında bir sonuç çıkar. Grafiksel analiz için en sık önerilen MsExcel Dağılım Grafiği aracı. Bu aşamanın bir sonucu olarak, bir regresyon denklemi modeli belirlenir ve doğrusal olmayan bir form durumunda, doğrusallaştırma yöntemleri de belirlenir.

2. Regresyon denkleminin parametreleştirilmesi, regresyon parametrelerinin tahminini ve sosyo-ekonomik yorumlarını içerir. Parametrelendirme için, MsExcel "Veri Analizi" eklentilerinin bir parçası olarak "Regresyon" aracını kullanın. Otomatik regresyon analizinin sonuçlarına dayanarak ("Katsayılar" sütunu), regresyon parametreleri belirlenir ve bunların yorumları da standart kurala göre verilir:

Bj, bağımsız değişken Xj bir artarken Y değişkeninin değerinin ortalama olarak değiştiği miktardır, ceteris paribus.

Tüm bağımsız değişkenler sıfır olduğunda, regresyon denkleminin kesişimi, bağımlı değişken Y'nin tahmin edilen değerine eşittir.

3. Regresyon denkleminin doğrulanması, aşağıdaki göstergelere göre otomatikleştirilmiş regresyon analizinin (aşama 2) sonuçları temelinde gerçekleştirilir: "R-kare", "Önem F", "P-değeri" (her parametre için) regresyonun yanı sıra seçim ve artıkların grafiklerinde ...

Katsayıların önemi belirlenir ve modelin kalitesi değerlendirilir. Bunun için “Önem F”, “P-Değeri” ve “R-kare” dikkate alınır. "P-değeri" statik anlamlılık denkleminden küçükse, bu, katsayının önemini gösterir. "R-kare" 0,6'dan büyükse, bu, regresyon modelinin, bağımlı değişken Y'nin değişkenlerin faktörleri üzerindeki davranışını iyi tanımladığı anlamına gelir.

"Anlam F", statik önem denkleminden küçükse, belirleme katsayısı (R-kare) koşullu istatistiksel olarak anlamlı kabul edilir.

Artık grafiği, hatalardaki varyasyonu tahmin etmenize olanak tanır. Xi'nin farklı değerlerine karşılık gelen hatalar arasında özel bir fark yoksa, yani Xi'nin farklı değerleri için hatalardaki varyasyonlar yaklaşık olarak aynıdır ve herhangi bir sorun olmadığı varsayılabilir. Uydurma programı, temel, tahmin edilen ve faktör değerleri hakkında yargılar oluşturmanıza olanak tanır.

Sonuç olarak, regresyon denkleminin kalitesi hakkında bir yargı oluşturulmuştur.

Ek araştırma.

4.1 Çoklu bağlantının ilk işaretinin tespiti. Madde 2-3'te elde edilen regresyon analizi sonuçlarına dayanarak, belirleme katsayısının yüksek bir değere (R 2> 0.7) ve statik olarak anlamlı (Önem F) olduğu durum kontrol edilir.<0,05), и хотя бы один из коэффициентов регрессии не может быть признан статистически значим (P-значение >0.05) .Böyle bir durum tespit edildiğinde, çoklu bağlantı varsayımı hakkında bir sonuca varılır.

4.2 Çoklu bağlantının ikinci işaretinin tespiti. Faktör değişkenleri arasındaki korelasyon katsayılarının hesaplanmasına dayanarak, bireysel faktörlerin anlamlı bir ilişkisi belirlenir. MS Excel'deki hesaplamalar için Veri Analizi / Korelasyon aracının kullanılması tavsiye edilir. Korelasyon katsayısının değerlerine dayanarak, sonuçlar çıkarılır: aşırı noktalara (± 1) ne kadar yakın (r) olursa, doğrusal ilişkinin derecesi o kadar büyük olur, korelasyon katsayısı 0,5'ten az ise, o zaman kabul edilir. ilişkinin zayıf olmasıdır. Aşağıdaki durumda, en az iki değişken arasında anlamlı bir korelasyon katsayısı varsa (yani, modülde 0.7'den büyük) çoklu bağlantının varlığı varsayılır.

4.3 Çoklu bağlantının üçüncü işaretinin tespiti. Faktör değişkenleri arasındaki ve anlamlı bir korelasyon katsayısının (Bölüm 4.2) olduğu değişkenler arasındaki yardımcı regresyonların değerlendirilmesine dayanarak, en az bir yardımcı regresyonda anlamlı ve anlamlı ise çoklu bağlantının mevcut olduğu sonucuna varılır. Belirleme katsayısının ek regresyon yöntemi aşağıdaki gibidir: 1) regresörlerin her birini geri kalanların tümüne bağlayan regresyon denklemleri oluşturulur; 2) belirleme katsayıları R2 her bir regresyon denklemi için hesaplanır; 3) Denklem ve belirleme katsayısı istatistiksel olarak anlamlı kabul edilirse, bu regresör çoklu doğrusallığa yol açar.

4.4 Yargıların genelleştirilmesi.

4.1-4.3 maddeleri temelinde, çoklu doğrusallığın varlığı / yokluğu ve çoklu doğrusallığa yol açan regresyonlar hakkında bir yargı oluşturulur.

Ayrıca, modeli kullanma yönergeleri (çoklu bağlantı sorununun göz ardı edilmesi veya olmaması durumunda) veya çoklu bağlantının ortadan kaldırılması için öneriler (pratikte bir değişken hariç) oluşturulur.

Bir değişkeni hariç tutarken şu kuralı kullanmanız önerilir:

Belirleme katsayısı, orijinal olarak n gözlemden oluşturulan regresyon denklemi için belirlenir (R 2 1);

Son değişkenler (k) değerlendirmesinden çıkarılarak, ilk n gözleme dayalı olarak kalan faktörler için bir denklem oluşturulur ve bunun için belirleme katsayısı (R 2 2) belirlenir;

F-istatistikleri hesaplanır: burada (R 1 2 -R 2 2), değişkenlere düşme sonucu denklemin kaybıdır, (K) ortaya çıkan ek serbestlik derecesi sayısıdır, (1- R 1 2) / (nml) başlangıç denklemlerinin açıklanamayan varyansıdır;

Fa, k, n-m -1'in kritik değeri, belirli bir önem düzeyindeki Fisher dağılımının kritik noktalarının tablolarına ve v 1 = k, v 2 = n-m-l serbestlik derecelerine göre belirlenir;

Kurala göre bir istisnanın uygunluğu hakkında yargılar oluşturulur: k değişkenin denklemden (eşzamanlı) hariç tutulması F> Fa, k, n-m - 1 için uygun değildir, aksi takdirde böyle bir istisnaya izin verilir.

Değişken ortadan kaldırıldığında, ortaya çıkan model 3-4. maddelere göre analiz edilir; ve orijinal modelle karşılaştırılır, sonuç olarak "en iyi" seçilir. Uygulamada çoklu bağlantı modelin tahmin edici niteliklerini etkilemediği için bu sorun göz ardı edilebilir.

5. Tahmin, gözlemlerin son 1/3'ünün tahmin için kullanıldığı geriye dönük tahmin şemasına göre, paragraf 4.4'te seçilen ilk / "en iyi" modele göre gerçekleştirilir.

5.1. Nokta tahmini. Tahmin dönemindeki faktör değişkenlerinin gerçek değerleri tahmin edilmiş kabul edilir, ortaya çıkan değişkenin tahmin edilen değerleri tahmin dönemindeki faktör değişkenlerine dayalı olarak orijinal / "en iyi" model tarafından tahmin edildiği gibi belirlenir. Microsoft Excel "Grafik" aracı kullanılarak, ortaya çıkan değişkenin gerçek ve tahmin edilen değerlerinin bir grafiği gözlemlere göre çizilir ve gerçek değerlerin tahmin edilenlere yakınlığı hakkında bir sonuca varılır.

5.2. Aralık tahmini, tahmin standart hatalarının (Salkever kukla değişkenleri kullanılarak) ve tahmin edilen değerlerin üst ve alt sınırlarının hesaplanmasını içerir.

Microsoft Excel Veri Analizi / Regresyon aracını kullanarak, örneğin toplu veri kümesi ve tahmin dönemi için bir regresyon oluşturulur, ancak D 1, D 2, ..., D p kukla değişkenlerin eklenmesiyle. Bu durumda, D i = 1 sadece gözlem anı için (n + i), diğer tüm anlar için D i = 0. Daha sonra, kukla değişken Di'nin katsayısı, zamandaki tahmin hatasına (n + i) eşittir ve katsayının standart hatası, tahmin standart hatasına (S i) eşittir. Böylece, faktör değişkenlerinin toplam (örnek ve tahmin edilen) değerlerinin ve Salkever kukla değişkenlerinin değerlerinin X değerleri olarak kullanıldığı ve toplamın (örnek ve tahmin edilen) modelin otomatik bir regresyon analizi yapılır. Y değerleri olarak elde edilen değişkenin tahmin edilen) değerleri kullanılır.

Salkever kukla değişkenleri için katsayıların elde edilen standart hataları, tahmin standart hatalarına eşittir. Daha sonra aşağıdaki formüller kullanılarak aralık tahmininin sınırları hesaplanır: Ymin n + i = Yemp n + i -S i * t cr, Ymax n + i = Yemp n + i + S i * t cr, burada t cr Öğrenci dağılımının kritik değeri, “= STYURASPOBR (0.05; nm-1)” formülü ile belirlenir, m modeldeki açıklayıcı faktör sayısıdır (Y*t), Yemp n+i ise tahmin edilen değerlerdir sonuç değişkeni (madde 5.1).

Microsoft Excel "Grafik" aracını kullanarak, ortaya çıkan değişkenin gerçek ve tahmin edilen değerlerine, gözlemler için tahminin üst ve alt sınırlarına göre bir grafik oluşturulur. Ortaya çıkan değişkenin gerçek değerlerinin aralık tahmininin sınırlarına uygunluğu hakkında bir sonuca varılır.

5.3. NCO testi kullanılarak modelin kararlılığının değerlendirilmesi şu şekilde yapılır:

a) Microsoft Excel "Veri Analizi / Regresyon" aracı kullanılarak faktör değişkenlerinin toplam (örnek ve tahmin edilen) değerlerinin X değerleri olarak alındığı ve toplam (örnek ve tahmin edilen) değerlerin alındığı bir regresyon oluşturulur. ortaya çıkan değişkenin Y değerleri olarak alınır. Bu regresyon, S artıklarının karelerinin toplamını belirlemek için kullanılır;

b) Madde 5.2'nin Salkever kukla değişkenleri ile regresyonuna göre, artıkların karelerinin toplamı Sd belirlenir;

c) F istatistiklerinin değeri aşağıdaki formülle hesaplanır ve tahmin edilir:

p, tahmini adımların sayısıdır. Elde edilen değer, "= FDISP (0.05; p; nm-1)" formülüyle belirlenen kritik F cr değerinden büyükse, modelin tahmin dönemindeki kararlılığı hakkındaki hipotez reddedilir, aksi takdirde kabul edilmiş.

5.4 Modelin öngörücü nitelikleri hakkındaki yargıların 5.1-5.3 maddeleri temelinde genelleştirilmesi, sonuç olarak, modelin tahmin kalitesi ve modeli tahmin için kullanma önerileri hakkında bir sonuç oluşturulur.

Bu nedenle, geliştirilen bilgi ve metodolojik destek, çoklu regresyon modellerinde çoklu bağlantı sorununun ekonometrik çalışmasının ana hedeflerine karşılık gelmektedir.

2.2. Bir ekonometrik çalışma örneği

Çalışma, 2003-2011 dönemi için Rusya Federasyonu'nun reel makroekonomik göstergelerini yansıtan veriler temelinde yürütülmektedir. (tablo 1), madde 2.1 yöntemine göre.

tablo 1

Ev masrafları. çiftlikler (milyar ruble) [Y]	Nüfus (milyon kişi)	Para arzı (milyar ruble)	İşsizlik oranı (%)

1. Özellikler Regresyon denklemi modeli, bağımlı değişken Y'nin korelasyon bağımlılığının (Açıklayıcı değişken X'e göre hanehalkı giderleri (Nüfus) (Şekil 1)), bağımlı değişken Y'nin korelasyon bağımlılığının (açıklayıcı değişkene göre hanehalkı giderleri) grafiksel bir analizini içerir. X 2 (Para arzı) (Şekil 2), bağımlı değişken Y'nin korelasyon bağımlılığı (Hane giderleri açıklayıcı değişken X 3 (İşsizlik oranı) (Şekil 3).

Şekil 1'de sunulan Y ve X 1 arasındaki korelasyon bağımlılığı grafiği, Y'nin X 1'e önemli bir (R 2 = 0.71) ters doğrusal bağımlılığını yansıtır.

Şekil 2'de sunulan Y ve X 2 arasındaki korelasyon bağımlılığı grafiği, Y'nin X 2'ye önemli bir doğrudan doğrusal bağımlılığını (R 2 = 0.98) yansıtır.

Şekil 3'te sunulan Y ve X3 arasındaki korelasyon bağımlılığı grafiği, Y'nin X3'e önemsiz (R 2 = 0.15) ters doğrusal bağımlılığını yansıtır.

Resim 1

Resim 2

Figür 3

Sonuç olarak, doğrusal bir çoklu regresyon modeli belirtilebilir Y = b 0 + b 1 X 1 + b 2 X 2 + b 3 X 3.

2.Parametriizasyon Regresyon denklemleri, "Veri Analizi" eklentileri MsExcel'in bir parçası olarak "Regresyon" aracı kullanılarak gerçekleştirilir (Şekil 4).

Şekil 4

Tahmini regresyon denklemi:

233983.8-1605.6X 1 + 1.0X 2 + 396.22X 3.

Bu durumda, regresyon katsayıları şu şekilde yorumlanır: nüfusta 1 milyon kişilik bir artışla, ev giderleri. çiftlikler 1605.6 milyar ruble azaldı; para arzında 1 milyar ruble artışla. ev masrafları. çiftlikler 1,0 milyar ruble artacak; % 1 işsizlik oranındaki artışla, ev giderleri. çiftlikler 396,2 milyar ruble artacak. Faktör değişkenlerinin sıfır değerleri ile evin maliyeti. çiftlikler, belki de ekonomik bir yorumu olmayan 233.983,8 milyar ruble tutarında olacak.

3.Doğrulama regresyon denklemi, otomatik regresyon analizinin sonuçları temelinde gerçekleştirilir (aşama 2).

Yani, "R-kare" 0.998'e eşittir, yani. regresyon denklemi, bağımlı değişkenin davranışını %99 oranında tanımlar, bu da denklemin yüksek düzeyde tanımlandığını gösterir. "F'nin anlamı" 2.14774253442155E-07'dir ve bu, "R-kare"nin anlamlı olduğunu gösterir. b 0 için "P-Değeri" 0,002'dir ve bu parametrenin anlamlı olduğunu gösterir. b 1 için "P-Değeri" 0,002'dir ve bu katsayının anlamlı olduğunu gösterir. b 2 için “P-Değeri” 8.29103190343224E-07'dir ve bu katsayının anlamlı olduğunu gösterir. b 3 için "P-Değeri" 0.084'tür ve bu katsayının anlamlı olmadığını gösterir.

Artıkların grafiğine dayalı olarak, artıklar e rastgele değerlerdir.

Uydurma grafiklere dayanarak, model için gerçek ve tahmin edilen değerlerin yakınlığı hakkında bir sonuca varılır.

Dolayısıyla model iyi kalitede iken b 3 anlamlı değildir, dolayısıyla çoklu doğrusal bağlantının varlığını varsayabiliriz.

4. Ek araştırma.

4.1. Çoklu bağlantının ilk işaretinin tespiti. Regresyon analizi verilerine göre (Şekil 5) çoklu bağlantının ilk işaretinin olduğunu söyleyebiliriz, yüksek ve anlamlı bir R 2 tespit edildiğinden denklemin yüksek bir belirleme katsayısına sahip olduğu ve aynı zamanda bir tane olduğu ortaya çıkmaktadır. katsayıları anlamlı değildir. Bu durum çoklu doğrusal bağlantının varlığını göstermektedir.

4.2 Çoklu bağlantının ikinci işaretinin tespiti.

Faktör değişkenleri arasındaki korelasyon katsayılarının hesaplanmasına dayanarak, bireysel faktörlerin anlamlı bir ilişkisi belirlenir. (Tablo 2). Aşağıdaki durumda, en az iki değişken arasında anlamlı bir korelasyon katsayısı varsa (yani, modülde 0,5'ten büyük) çoklu bağlantının varlığı varsayılır.

Tablo 2

	[ X2]	[ X3]


[ X2]
[ X3]

Bizim durumumuzda X 1 ile X 2 arasında X 1, X 2 değişkenleri arasında güçlü bir bağımlılığa işaret eden bir korelasyon katsayısı (-0,788), ayrıca X 1 ile X3 arasında bir korelasyon katsayısı (0,54), bu da X 1, X 3 değişkenleri arasındaki güçlü bağımlılığı gösterir.

Sonuç olarak, çoklu bağlantının varlığı varsayılabilir.

4.3 Çoklu bağlantının üçüncü işaretinin tespiti.

Bölüm 4.2'de X 1 ve X 2 değişkenleri arasında güçlü bir ilişki bulunduğundan, bu değişkenler arasındaki yardımcı regresyon analiz edilmiştir (Şekil 5).

Şekil 5

"R-kare" ve yardımcı regresyonun anlamlı olduğunu gösteren "F Anlamı" 0.01 olduğundan, X2 regresörünün çoklu doğrusallığa yol açtığı varsayılabilir.

Bölüm 4.2'de X 1 ve X3 değişkenleri arasında ortalama seviyenin üzerinde bir ilişki bulunduğundan, bu değişkenler arasındaki yardımcı regresyon analiz edilmiştir (Şekil 6).

Şekil 6

"R-kare" ve yardımcı regresyonun anlamlı olmadığını gösteren "Anlam F" 0.13 olduğundan, X3 regresörünün çoklu doğrusallığa yol açmadığı varsayılabilir.

Dolayısıyla üçüncü özelliğe göre çoklu bağlantının varlığı varsayılabilir.

4.4 Yargıların genelleştirilmesi.

4.1-4.3 paragraflarının analizine göre, çoklu bağlantının üç işaretinin tümü bulundu, bu nedenle yüksek bir olasılıkla varsayılabilir. Aynı zamanda, çoklu bağlantıya yol açan regresörle ilgili Bölüm 4.3'teki varsayıma rağmen, X3'ün orijinal modelden hariç tutulmasını önermek mümkündür, çünkü X 3, Y ile en küçük korelasyon katsayısına sahiptir ve bu regresörün katsayısı orijinal denklemde önemsizdir. X3 hariç tutulduktan sonra regresyon analizinin sonuçları Şekil 2'de gösterilmektedir. 7.

Şekil 7

Bu durumda, hariç tutmanın uygulanabilirliğini kontrol etmek için F - istatistiklerini hesaplayacağız:

F gerçeği = 4.62,

ve F sekmesi = F 0.05; 1; 5 = 6.61, F gerçeğinden beri< F табл, то исключение допустимо для переменной X 3 .

Doğrusal çoklu regresyon modelinin kalitesinin değerlendirilmesi Y = b 0 + b 1 X 1 + b 2 X 2. "R-kare" 0.996'dır, yani. regresyon denklemi, bağımlı değişkenin davranışını %99 oranında tanımlar, bu da denklemin yüksek düzeyde tanımlandığını gösterir. "F önemi" 3.02415218982089E-08'dir ve bu, "R-kare"nin anlamlı olduğunu gösterir. b 0 için "P-Değeri" 0,004'tür ve bu parametrenin anlamlı olduğunu gösterir. b 1 için "P-Değeri" ise bu katsayının anlamlı olduğunu gösteren 0,005'tir. b 2 için “P-Değeri” 3.87838361673427E-07'dir ve bu katsayının anlamlı olduğunu gösterir. Tahmini regresyon denklemi:

201511.7 -1359.6X 1 + 1.01X 2

Bu durumda, regresyon katsayıları şu şekilde yorumlanır: nüfusun 1 milyon kişi azalmasıyla evin maliyeti. çiftlikler 1.359.6 milyar ruble azaldı; para arzı seviyesindeki bir artışla, ev giderleri. çiftlikler 1.0 artacak) (milyar ruble). Faktör değişkenlerinin sıfır değerleri ile evin maliyeti. Çiftlikler, ekonomik bir yorumu olabilecek 201511,7 milyar ruble tutarında olacak.

Bu nedenle, = 201511.7 -1359.6X 1 + 1.01X 2 modeli iyi kalitededir ve orijinal modele kıyasla "en iyi" olarak tahmin edilmesi için önerilir.

5. Tahmin.

5.1 Nokta tahmini. Tahmin periyodundaki faktör değişkenlerinin gerçek değerleri tahmin edilmiş kabul edilir, ortaya çıkan değişkenin tahmin edilen değerleri, "en iyi" model (= 201511.7 -1359.6X 1 + 1.01X 2) tarafından tahmin edildiği gibi belirlenir. tahmin dönemindeki faktör değişkenleri. Microsoft Excel "Grafik" aracı kullanılarak, ortaya çıkan değişkenin gerçek ve tahmin edilen değerlerinin bir grafiği gözlemlere göre çizilir ve gerçek değerlerin tahmin edilenlere yakınlığı hakkında bir sonuca varılır.

Faktör değişkenlerinin tahmin edilen değerleri Tablo 3'te sunulmuştur.

Tablo 3

Etkili değişkenin tahmin edilen değerleri, tahmin dönemindeki faktör değişkenlerine dayalı olarak "en iyi" model (= 201511.7 -1359.6X 1 + 1.01X 2) tarafından tahmin edildiği gibi belirlenir. Öngörülen değerler Tablo 4'te sunulmuştur; karşılaştırma için gerçek değerler eklenmiştir.

Tablo 4

			[Y] ampirik

Şekil 8, ortaya çıkan değişkenin gerçek ve tahmin değerlerini ve ayrıca tahminin alt ve üst sınırlarını gösterir.

Şekil 8

Şekil 8'e göre, tahmin artan bir trendi koruyor ve tüm tahmin değerleri gerçek değerlere yakın.

5.2. Aralık tahmini.

Tablo 5

						[Y] baykuşlar

Şekil 9

O zaman kukla değişken için katsayının standart hatası, standart tahmin hatasına (S i) eşittir: 2012 için 738.5 olacaktır; 2013 için 897.1 olacak; 2014 için 1139.4 olacak.

Aralık tahmininin sınırları Tablo 6'da hesaplanmıştır.

Tablo 6

[Y] ampirik	[Y] baykuşlar	[S] pr

Tabloya göre. 6, Microsoft Excel "Grafik" aracını kullanarak, ortaya çıkan değişkenin gerçek ve tahmin edilen değerlerine, gözlemler için tahminin üst ve alt sınırlarına göre bir grafik oluşturulur (Şekil 10).

Şekil 10

Grafiğe göre, tahmin edilen değerler, iyi bir tahmin kalitesini gösteren aralık tahmininin sınırlarına uyar.

5.3. NCO testi kullanılarak modelin kararlılığının değerlendirilmesi aşağıdaki gibi gerçekleştirilir:

a) Microsoft Excel aracı "Veri Analizi / Regresyon" kullanılarak, faktör değişkenlerinin toplam (örnek ve tahmin) değerlerinin X değerleri olarak alındığı bir regresyon oluşturulur (Şekil 11). örnek ve tahmin) değerleri sonuç değişkeni olan Y değerleri olarak alınmıştır. Bu regresyon, S = 2058232.333 artıklarının karelerinin toplamını belirlemek için kullanılır.

Şekil 11

b) 3.2 maddesinin Salkever kukla değişkenleri ile regresyonu ile (Şekil 9) artıkların karelerinin toplamı Sd = 1270272.697 belirlenir.

c) F istatistiklerinin değeri hesaplanır ve değerlendirilir:

F cr = F 0.05; 3; 5 = 5.40 iken, elde edilen değer F cr kritik değerinden küçüktür ve modelin tahmin dönemindeki kararlılığı ile ilgili hipotez kabul edilir.

5.4 Modelin öngörücü nitelikleri hakkında yargıların genelleştirilmesi 5.1-5.3 maddeleri temelinde, sonuç olarak, modelin yüksek tahmin kalitesi (= 201511.7 -1359.6X 1 + 1.01X 2) hakkında bir sonuç çıkarılır ve modelin tahmin için kullanımına ilişkin öneriler verilir.

Madde 2.1'deki teknik başarıyla test edilmiştir, çoklu bağlantının ana işaretlerini belirlememize izin verir ve bu tür çalışmalar için önerilebilir.

Çözüm

Çoklu doğrusallık - ekonometride (regresyon analizi) - regresyon modelinin açıklayıcı değişkenleri (faktörleri) arasında doğrusal bir ilişkinin varlığı. Aynı zamanda, işlevsel (özdeş) bir doğrusal ilişkinin varlığı anlamına gelen tam doğrusallık ile faktörler arasında güçlü bir korelasyonun varlığı anlamına gelen kısmi veya basitçe çoklu doğrusallık arasında bir ayrım yapılır.

Çoklu bağlantının başlıca sonuçları şunlardır: tahminlerin büyük varyansları, katsayıların t istatistiklerinde azalma, en küçük kareler yöntemini kullanan katsayı tahminlerinin kararsız hale gelmesi, değişkenlerin katkısını belirlemenin zor olması ve katsayı işaretinin yanlış olması. elde edildi.

Çoklu doğrusallığı tespit etmek için ana kriterler şunlardır: önemsiz katsayılarla yüksek R 2; Yüksek eşleştirilmiş korelasyon katsayıları; VIF katsayısının yüksek değerleri.

Çoklu doğrusallığı ortadan kaldırmanın ana yöntemleri şunlardır: değişken(ler)in modelden çıkarılması; ek veri veya yeni bir örnek alınması; model spesifikasyonunu değiştirmek; bazı parametreler hakkında ön bilgilerin kullanılması.

Geliştirilen bilgi ve metodolojik destek, çoklu regresyon modellerinde çoklu bağlantı sorununun ekonometrik çalışmasının ana hedeflerine karşılık gelmektedir ve bu tür çalışmalar için önerilebilir.

Kullanılan kaynakların listesi

Astakhov, S.N. Ekonometri [Metin]: Eğitim-yöntemsel kompleks. Kazan, 2008 .-- 107s.
Bardasov, S. A. EKONOMETRİK [Metin]: bir eğitim. 2. baskı, Rev. ve Ekle. Tümen: Tümen Devlet Üniversitesi Yayınevi, 2010.264 s.
Borodkina, L.I. Ders anlatımı [Elektronik kaynak]. Erişim modu - http://www.iskunstvo.info/materials/history/2/inf/correl.htm
Voskoboinikov, Yu. EXCEL'de EKONOMETRİK Bölüm 1 [Metin]: çalışma kılavuzu, Novosibirsk 2005,156 s.
Eliseeva, I.I. Ekonometri üzerine atölye çalışması: ders kitabı. ekonomi rehberi. üniversiteler / Eliseeva, I.I., Kurysheva, S.V., Gordeenko, N.M. , [ve benzeri.] ; ed. I.I. Eliseeva - M.: Finans ve İstatistik, 2001 .-- 191 s. - (14126-1).
Çoklu doğrusallık [Elektronik kaynak]. Erişim modu - https://ru.wikipedia.org/wiki/Multicollinearity.
Novikov, A.I. Ekonometri [Metin]: ders kitabı. Örn. "Finans ve Kredi", "Ekonomi" - M.: Dashkov ve K, 2013. - 223 s. - (93895-1).
Çoklu bağlantı sorunu [Elektronik kaynak]. Erişim modu - http://crow.academy.ru/econometrics/lectures_/lect_09_/lect_09_4.pdf.
Chernyak V. Uygulamalı Ekonometri. Ders No. 9 [Elektronik kaynak]. Erişim modu http://www.slideshare.net/vtcherniak/lect-09.
ru - ansiklopedik site [Elektronik kaynak]. Erişim modu - http://kodcupon.ru/ra17syplinoe97/ Çoklu Bağlantı.

İndirmek: Sunucumuzdan dosya indirme erişiminiz yok.

Rusya Federasyonu Federal Eğitim ve Bilim Ajansı

Kostroma Devlet Teknoloji Üniversitesi.

Yüksek Matematik Bölümü

konuyla ilgili ekonometri hakkında:

çoklu doğrusallık

Gerçekleştirilen

1. sınıf öğrencisi

yazışma fakültesi

sp-t "Muhasebe,

analiz ve denetim".

Kontrol

Katezhina S.F.

Kostroma 2008

çoklu doğrusallık

Çoklu doğrusallık, açıklayıcı değişkenlerin yüksek karşılıklı korelasyonu olarak anlaşılır. Çoklu bağlantı, fonksiyonel (açık) ve stokastik (gizli) formlarda kendini gösterebilir.

Çoklu doğrusal bağlantının işlevsel biçiminde, açıklayıcı değişkenler arasındaki ikili ilişkilerden en az biri doğrusal bir işlevsel bağımlılıktır. Bu durumda, X`X matrisi özeldir, çünkü doğrusal olarak bağımlı sütun vektörleri içerir ve determinantı sıfıra eşittir, yani. regresyon analizinin öncülü ihlal edilir, bu, karşılık gelen normal denklem sistemini çözmenin ve regresyon modelinin parametrelerinin tahminlerini elde etmenin imkansızlığına yol açar.

Bununla birlikte, ekonomik araştırmalarda, en az iki açıklayıcı değişken arasında yakın bir korelasyon olduğunda, çoklu bağlantı genellikle stokastik bir biçimde kendini gösterir. Bu durumda X`X matrisi tekil değildir, ancak determinantı çok küçüktür.

Aynı zamanda, b tahminlerinin vektörü ve kovaryans matrisi ∑ b, ters matris (X`X) -1 ile orantılıdır; bu, öğelerinin |X`X | determinantının değeriyle ters orantılı olduğu anlamına gelir. Sonuç olarak, b 0, b 1,…, bp regresyon katsayılarının önemli standart sapmaları (standart hatalar) elde edilir ve genel olarak regresyon modeli dönebilse de, önemlerinin t-kriteri tarafından değerlendirilmesi anlamlı değildir. F-kriterine göre önemli olduğu ortaya çıktı.

Tahminler, gözlemlerdeki ve örneklem büyüklüğündeki küçük değişikliklere karşı çok hassas hale gelir. Bu durumda regresyon denklemlerinin kural olarak gerçek bir anlamı yoktur, çünkü bazı katsayıları ekonomik teori açısından yanlış olan işaretlere ve haksız yere büyük değerlere sahip olabilir.

Çoklu bağlantının varlığını veya yokluğunu belirlemek için kesin nicel kriterler yoktur. Bununla birlikte, tespitine yönelik bazı sezgisel yaklaşımlar vardır.

Bu yaklaşımlardan biri, açıklayıcı değişkenler X 1, X 2, ..., X p arasındaki korelasyon matrisini analiz etmek ve yüksek korelasyon değişkenlerine (genellikle 0,8'den büyük) sahip değişken çiftlerini belirlemektir. Bu tür değişkenler varsa, aralarında çoklu bağlantı olduğundan söz edilir. Açıklayıcı değişkenlerden biri ile bazı grupları arasında birden çok belirleme katsayısı bulmak da yararlıdır. Yüksek bir çoklu belirleme katsayısının (genellikle 0,6'dan fazla) varlığı, çoklu bağlantı olduğunu gösterir.

Diğer bir yaklaşım, X`X matrisini incelemektir. X`X matrisinin determinantı veya minimum özdeğeri λ min sıfıra yakınsa (örneğin, biriken hesaplama hatalarıyla aynı büyüklük mertebesinde), bu çoklu doğrusallığın varlığını gösterir. aynısı, X`X matrisinin maksimum özdeğeri λmax'ın minimum özdeğeri λ min'den önemli bir sapması ile kanıtlanabilir.

Çoklu doğrusallığı ortadan kaldırmak veya azaltmak için bir takım yöntemler kullanılmaktadır. Bunların en basiti (ancak her zaman mümkün değildir), yüksek korelasyon katsayısına sahip (0.8'den büyük) iki açıklayıcı değişkendir, bir değişken dikkate alınmaz. Aynı zamanda, hangi değişkenin analizden çıkarılacağına ve hangi değişkenin analizden çıkarılacağına öncelikle ekonomik değerlendirmeler temelinde karar verilir. Ekonomik açıdan, değişkenlerden hiçbiri tercih edilemiyorsa, iki değişkenden bağımlı değişkenle korelasyon katsayısı daha büyük olan biri bırakılır.

Çoklu doğrusallığı ortadan kaldırmanın veya azaltmanın başka bir yöntemi, en küçük kareler yöntemiyle belirlenen yansız tahminlerden, tahmin edilen parametreye göre daha az saçılıma sahip olan yanlı tahminlere geçmektir; b j tahmininin β j veya M (b j - β j) 2 parametresinden sapmasının karesinin daha düşük matematiksel beklentisi.

Vektör tarafından Gauss-Markov teoremine göre belirlenen tahminler, tüm lineer yansız tahminler sınıfında minimum varyanslara sahiptir, ancak çoklu doğrusallık varlığında bu varyanslar çok büyük olabilir ve karşılık gelen değere dönebilir. taraflı tahminler, regresyon parametrelerinin tahmin edilmesinin doğruluğunu artırabilir. Şekil, örnek dağılımı yoğunluk φ (β j ^) tarafından verilen yanlı tahmin β j ^ olduğu durumu göstermektedir.

Aslında, tahmin edilen β j parametresi için maksimum kabul edilebilir güven aralığı (β j -Δ, β j + Δ) olsun. Daha sonra, şekilden kolayca görülebileceği gibi (β j -Δ, β j + Δ) aralığında dağılım eğrisi altındaki alan tarafından belirlenen güven olasılığı veya tahminin güvenilirliği, bu durumda olacaktır. bj ile karşılaştırıldığında β j tahmini için daha büyüktür (şekilde bu alanlar gölgelenmiştir). Buna göre, tahminin tahmin edilen parametreden sapmasının ortalama karesi, taraflı bir tahmin için daha az olacaktır, yani:

M (β j ^ - β j) 2< M (b j - β j) 2

Sırt regresyonu (veya sırt regresyonu) kullanıldığında, yansız tahminler yerine, vektör tarafından verilen yanlı tahminler

β τ ^ = (X`X + τ E p +1) -1 X`Y,

nerede τ – "sırt" veya "sırt" olarak adlandırılan bazı pozitif sayılar,

E p +1 (р + 1) -. dereceden birim matrisidir.

Ekleme τ matrisin köşegen elemanlarına X`X, model parametrelerinin tahminlerini önyargılı yapar, ancak aynı zamanda normal denklem sisteminin matrisinin determinantı artar - yerine (X`X) 'den eşit olacaktır.

|X`X + τ E p +1 |

Böylece, determinant |X`X | sıfıra yakındır.

Çoklu doğrusallığı ortadan kaldırmak için, oldukça yakın bir korelasyon bağımlılığı ile birbirine bağlı orijinal açıklayıcı değişkenler X 1, X 2, ..., X n'den orijinallerin doğrusal kombinasyonlarını temsil eden yeni değişkenlere geçiş kullanılabilir. Bu durumda, yeni değişkenler zayıf korelasyonlu veya genel olarak korelasyonsuz olmalıdır. Bu tür değişkenler olarak, örneğin, bileşen analizinde incelenen ilk açıklayıcı değişkenlerin vektörünün sözde temel bileşenlerini alıyoruz ve ikincisinin daha fazla anlamlılığa tabi olan genelleştirilmiş açıklayıcı değişkenler olarak hareket ettiği temel bileşenler üzerindeki regresyonu dikkate alıyoruz ( ekonomik) yorumlama.

Ana bileşenlerin ortogonalliği, çoklu bağlantı etkisinin ortaya çıkmasını engeller. Ek olarak, uygulanan yöntem, kişinin kendisini nispeten çok sayıda ilk açıklayıcı değişkenle az sayıda temel bileşenle sınırlandırmasına izin verir.

Çoklu doğrusallık - açıklayıcı değişkenler arasındaki gevşek doğrusal ilişkinin güvenilmez regresyon tahminlerine yol açtığı bir sorunu tanımlamak için kullanılan bir terimdir. Tabii ki, böyle bir ilişki mutlaka tatmin edici olmayan derecelendirmeler vermez. Diğer tüm koşullar uygunsa, yani açıklayıcı değişkenlerin gözlem sayısı ve örnek varyansları büyükse ve rastgele terimin varyansı küçükse, sonuç olarak oldukça iyi tahminler elde edilebilir.

Dolayısıyla çoklu bağlantı, gevşek bir bağımlılık ve bir (veya daha fazla) olumsuz koşulun bir kombinasyonundan kaynaklanmalıdır ve soru bu.

fenomenin ciddiyeti ve türü değil. Tüm açıklayıcı değişkenler tamamen ilişkisiz olmadıkça, herhangi bir regresyon puanı bir dereceye kadar bundan zarar görecektir. Bu problemin ele alınması ancak regresyon tahmininin sonuçlarını ciddi şekilde etkilediğinde başlar.

Bu sorun, zaman serisi regresyonlarında, yani verilerin belirli bir süre boyunca bir dizi gözlemden oluştuğu durumlarda yaygındır. İki veya daha fazla açıklayıcı değişkenin güçlü bir zamansal eğilimi varsa, bunlar yakından ilişkili olacaktır ve bu çoklu bağlantıya yol açabilir.

Bu durumda ne yapılabilir?

Çoklu doğrusallığı azaltmak için kullanılabilecek çeşitli yöntemler iki kategoriye ayrılır: birinci kategori, regresyon tahminlerinin güvenilirliğini sağlayan dört koşulun karşılanma derecesini iyileştirme girişimleridir; ikinci kategori, dış bilgilerin kullanımıdır. Mümkünse önce doğrudan elde edilen veriler kullanılırsa, gözlem sayısının arttırılmasının faydalı olacağı açıktır.

Zaman serisi verilerini kullanıyorsanız, bunu her bir zaman periyodunun uzunluğunu kısaltarak yapabilirsiniz. Örneğin, Alıştırma 5.3 ve 5.6'daki talep fonksiyonu denklemlerini değerlendirirken, yıllık verileri kullanmaktan üç aylık verilere geçiş yapabilirsiniz.

Bundan sonra 25 gözlem yerine 100 tane olacak.Bu o kadar bariz ve yapılması o kadar kolay ki, zaman serilerini kullanan çoğu araştırmacı, çoklu bağlantı sorunu olsa bile, varsa yıllık veriler yerine neredeyse otomatik olarak üç aylık verileri kullanıyor. buna değmez, sadece regresyon katsayılarının minimum teorik varyanslarını azaltmak için. Bununla birlikte, bu yaklaşımla ilgili potansiyel sorunlar vardır. Otokorelasyon tanıtılabilir veya geliştirilebilir, ancak etkisiz hale getirilebilir. Ek olarak, üç aylık veriler karşılık gelen yıllık verilerden daha az hassasiyetle ölçülürse, ölçüm hatalarından kaynaklanan sapma ortaya çıkabilir (veya güçlendirilebilir). Bu sorunu çözmek kolay değildir, ancak önemli olmayabilir.