Spearman, kendall, fechner ranklarının korelasyon katsayıları. Kendall ve Spearman Sıra Korelasyon Katsayıları Spearman ve Kendall Sıra Korelasyon Katsayıları

Sıralanabilirlerse, nicel veya nitel göstergeler arasındaki ilişkiyi belirlemek için kullanılır. X göstergesinin değerleri artan sırada ayarlanır ve sıralara atanır. Y indeksinin değerleri sıralanır ve Kendall korelasyon katsayısı hesaplanır:

nerede S = PQ.

P büyük Y basamaklarının değeri.

Q o zamandan beri mevcut gözlemleri takip eden toplam gözlem sayısıdır. daha küçük Y basamaklarının değeri. (eşit sıralar sayılmaz!)

İncelenen veriler tekrarlanırsa (aynı sıralara sahipse), hesaplamalarda düzeltilmiş Kendall korelasyon katsayısı kullanılır:

T- sırasıyla X ve Y serilerindeki ilgili sıraların sayısı.

19. Çalışmanın konusunu, amacını, konusunu, amacını, amaçlarını ve hipotezini belirlerken çıkış noktası ne olmalıdır?

Araştırma programının kural olarak iki bölümü vardır: metodolojik ve prosedürel. Birincisi, konunun uygunluğunun gerekçesini, sorunun formülasyonunu, nesne ve konunun tanımını, çalışmanın amaç ve hedeflerini, temel kavramların formülasyonunu (kategorik aparat), bir ön sistem analizini içerir. çalışmanın amacı ve çalışan bir hipotezin geliştirilmesi. İkinci bölüm, çalışmanın stratejik planının yanı sıra birincil verilerin toplanması ve analiz edilmesi için plan ve temel prosedürleri ortaya koymaktadır.

Her şeyden önce, bir araştırma konusu seçerken, alaka düzeyinden hareket edilmelidir. alaka düzeyi için gerekçe eğitim ve öğretim teori ve pratiğinin daha da geliştirilmesi için problemin incelenmesi ve çözülmesi ihtiyacının ve zamanlılığının bir göstergesini içerir. Mevcut araştırmalar, günümüzün en acil sorularına cevap vermekte, pedagojik bilim için toplumun sosyal düzenini yansıtmakta ve uygulamada yer alan en önemli çelişkileri ortaya koymaktadır. Uygunluk kriteri dinamiktir, hareketlidir, belirli ve özel koşullar dikkate alınarak zamana bağlıdır. En genel biçimiyle alaka düzeyi, bilimsel fikirlere ve pratik önerilere (belirli bir ihtiyacı karşılamak için) olan talep ile bilim ve pratiğin şu anda sağlayabileceği öneriler arasındaki tutarsızlığın derecesini karakterize eder.

Çalışmanın konusunu belirleyen en inandırıcı temel, acil çözümler gerektiren en akut, sosyal açıdan önemli sorunları yansıtan toplumsal düzendir. Sosyal düzen, belirli bir konunun doğrulanmasını gerektirir. Genellikle bu, konunun bilimdeki gelişme derecesinin bir analizidir.

Toplumsal düzen, pedagojik pratiğin analizinden çıkıyorsa, o zaman bilimsel problem farklı bir düzlemdedir. Bilim yoluyla çözülmesi gereken ana çelişkiyi ifade eder. Bir sorunun çözümü genellikle bu çalışmanın amacı. Amaç, yeniden formüle edilmiş bir sorundur.

Problemin formülasyonu şunları içerir: nesne seçimi Araştırma. Pedagojik bir süreç, pedagojik gerçeklik alanı veya çelişki içeren bir tür pedagojik ilişki olabilir. Başka bir deyişle, bir nesne, açıkça veya zımnen bir çelişki içeren ve bir sorun durumu oluşturan her şey olabilir. Bir nesne, biliş sürecinin yönlendirildiği bir şeydir. Çalışma konusu - bir cismin parçası, yanı. Bunlar, doğrudan çalışmaya konu olan bir nesnenin özellikleri, yönleri, özellikleri pratik veya teorik açıdan en önemlileridir.

Araştırmanın amacı, konusu ve konusuna uygun olarak araştırma, görevler, genellikle kontrol etmek için kullanılan hipotezler.İkincisi, gerçeği doğrulamaya tabi olan teorik olarak doğrulanmış bir dizi varsayımdır.

kriter bilimsel yenilik tamamlanan çalışmaların kalitesini değerlendirmek için geçerlidir. Bu zamana kadar pedagojik literatürde bilinmeyen ve kaydedilmemiş yeni teorik ve pratik sonuçları, eğitim yasalarını, yapısını ve mekanizmalarını, içeriğini, ilkelerini ve teknolojilerini karakterize eder. Araştırmanın yeniliği hem teorik hem de pratik öneme sahip olabilir. Çalışmanın teorik önemi, bir problem, eğilim, yön belirlemek için bir kavram oluşturma, bir hipotez, düzenlilik, yöntem, model elde etmede yatmaktadır. Çalışmanın pratik önemi, tekliflerin, tavsiyelerin vb. hazırlanmasında yatmaktadır. Yenilik, teorik ve pratik önem kriterleri, araştırmanın türüne bağlı olarak değişir, ayrıca yeni bilgi edinme zamanına da bağlıdır.

Sıra korelasyon katsayısı doğrusal olmayan bağımlılığın genel doğasını karakterize eder: faktöriyel olanda bir artışla sonuç işaretinde bir artış veya azalma. Bu, monotonik doğrusal olmayan bir ilişkinin sıkılığının bir göstergesidir.

Servis ataması. Bu çevrimiçi hesap makinesi Kendal'ın sıra korelasyon katsayısı tüm temel formüller ve öneminin bir değerlendirmesi için.

Talimat. Veri miktarını belirtin (satır sayısı). Ortaya çıkan çözüm bir Word dosyasına kaydedilir.

Kendall'ın önerdiği katsayı, geçerliliği ölçekler oluşturulurken kurulan “çok-az” türündeki ilişkiler temelinde oluşturulmuştur.
Birkaç nesneyi seçelim ve sıralarını bir niteliğe ve diğerine göre karşılaştıralım. Sıralar bu özelliğe göre doğrudan bir sıra oluşturuyorsa (yani doğal serinin sırası), çifte +1, tersi ise -1 verilir. Seçilen çift için, karşılık gelen artı-eksi birimler (X özelliğine göre ve Y özelliğine göre) çarpılır. Sonuç açıkça +1'dir; her iki özelliğin bir çiftinin sıraları aynı sıradaysa ve -1 ters sıradaysa.
Her iki özelliğin sıra sıraları tüm çiftler için aynıysa, tüm nesne çiftlerine atanan birimlerin toplamı maksimumdur ve çiftlerin sayısına eşittir. Tüm çiftlerin sıra sıraları tersine çevrilirse, o zaman –C 2 N . Genel durumda, C 2 N = P + Q, burada P, her iki özellik için sıralarını karşılaştırırken çiftlere atanan pozitif ve Q negatif birimlerin sayısıdır.
Değer Kendall katsayısı olarak adlandırılır.
Formülden, τ katsayısının, her iki özellikte (tüm çiftlerin sayısına göre) aynı sıraya sahip nesne çiftlerinin oranı ile sahip olmayan nesne çiftlerinin oranı arasındaki fark olduğu görülebilir. aynı sipariş.
Örneğin, 0.60 katsayı değeri, çiftlerin %80'inin aynı nesne sırasına sahip olduğu ve %20'sinin sahip olmadığı (%80 + %20 = %100; 0.80 - 0.20 = 0.60) anlamına gelir. Şunlar. τ, rastgele seçilen bir nesne çifti için her iki özellikteki çakışma ve sıralı olmama olasılıkları arasındaki fark olarak yorumlanabilir.
Genel durumda, τ (daha kesin olarak, P veya Q) hesaplanması, 10 mertebesindeki N için bile hantal hale gelir.
Hesaplamaların nasıl basitleştirileceğini gösterelim.


Örnek. 2003 yılında Rusya Federasyonu'nun federal bölgelerinden birinin 10 bölgesinde endüstriyel üretim hacmi ile sabit sermaye yatırımları arasındaki ilişki aşağıdaki verilerle karakterize edilir:


Spearman ve Kendall sıra korelasyon katsayılarını hesaplayın. Önemlerini α=0.05'te kontrol edin. Rusya Federasyonu'nun söz konusu bölgelerindeki endüstriyel üretim hacmi ile sabit kıymetlere yapılan yatırımlar arasındaki ilişki hakkında bir sonuç formüle edin.

Çözüm. Y özelliğine ve X faktörüne dereceler atayın.


Verileri X'e göre sıralayalım.
Y serisinde, 3'ün sağında, 3'ten büyük 7 sıra vardır, bu nedenle 3, P'de 7 terimini doğuracaktır.
1'in sağında 1'den büyük 8 sıra vardır (bunlar 2, 4, 6, 9, 5, 10, 7, 8'dir), yani. P, 8'i içerecektir, vb. Sonuç olarak, P = 37 ve sahip olduğumuz formülleri kullanarak:

xYsıra X, dxSıra Y, d yPQ
18.4 5.57 1 3 7 2
20.6 2.88 2 1 8 0
21.5 4.12 3 2 7 0
35.7 7.24 4 4 6 0
37.1 9.67 5 6 4 1
39.8 10.48 6 9 1 3
51.1 8.58 7 5 3 0
54.4 14.79 8 10 0 2
64.6 10.22 9 7 1 0
90.6 10.45 10 8 0 0
37 8


Basitleştirilmiş formüller:




n, numune boyutudur; z kp, Laplace fonksiyonunun tablosundan Ф(z kp)=(1-α)/2 eşitliği ile bulunan iki taraflı kritik bölgenin kritik noktasıdır.
Eğer |τ|< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - boş hipotez reddedilir. Nitel özellikler arasında önemli bir sıralama korelasyonu vardır.
Kritik noktayı bulalım z kp
Ф(z kp) = (1-α)/2 = (1 - 0.05)/2 = 0.475

Kritik noktayı bulalım:

τ > T kp - olduğundan, boş hipotezi reddediyoruz; iki testteki puanlar arasındaki sıralama korelasyonu önemlidir.

Örnek. Kendi başlarına yapılan inşaat ve montaj işlerinin hacmine ve Rusya Federasyonu şehirlerinden birindeki 10 inşaat şirketindeki çalışan sayısına göre, Kendel katsayısını kullanarak bu özellikler arasındaki ilişkiyi belirleyin.

Çözüm hesap makinesi ile bulun.
Y özelliğine ve X faktörüne dereceler atayın.
Nesneleri, X'deki sıraları doğal sayıları temsil edecek şekilde düzenleyelim. Bu serinin her bir çiftine atanan derecelendirmeler pozitif olduğundan, P'ye dahil edilen "+1" değerleri, yalnızca Y'deki sıraları doğrudan bir sıra oluşturan çiftler tarafından üretilecektir.
Y satırındaki her nesnenin sırasını çelik olanlarla sırayla karşılaştırarak hesaplamaları kolaydır.
Kendall katsayısı.

Genel durumda, τ (daha kesin olarak, P veya Q) hesaplanması, 10 mertebesindeki N için bile hantal hale gelir. Hesaplamaların nasıl basitleştirileceğini gösterelim.

veya

Çözüm.
Verileri X'e göre sıralayalım.
Y serisinde, 2'nin sağında, 2'den büyük 8 sıra vardır, bu nedenle 2, P'de 8 terimini doğuracaktır.
4'ün sağında 4'ten büyük 6 sıra vardır (bunlar 7, 5, 6, 8, 9, 10'dur), yani. P, 6'yı içerecektir, vb. Sonuç olarak, P = 29 ve sahip olduğumuz formülleri kullanarak:

xYsıra X, dxSıra Y, d yPQ
38 292 1 2 8 1
50 302 2 4 6 2
52 366 3 7 3 4
54 312 4 5 4 2
59 359 5 6 3 2
61 398 6 8 2 2
66 401 7 9 1 2
70 298 8 3 1 1
71 283 9 1 1 0
73 413 10 10 0 0
29 16


Basitleştirilmiş formüller:


Rakip hipotez Н 1: τ ≠ 0 altında Kendall'ın genel sıra korelasyon katsayısının sıfıra eşit olduğu α anlamlılık düzeyinde boş hipotezi test etmek için kritik noktayı hesaplamak gerekir:

n, numune boyutudur; z kp, Laplace fonksiyonunun tablosundan Ф(z kp)=(1 - α)/2 eşitliği ile bulunan iki taraflı kritik bölgenin kritik noktasıdır.
Eğer |τ| T kp - boş hipotez reddedilir. Nitel özellikler arasında önemli bir sıralama korelasyonu vardır.
Kritik noktayı bulalım z kp
Ф(z kp) = (1 - α)/2 = (1 - 0,05)/2 = 0,475
Laplace tablosuna göre z kp = 1,96 buluyoruz.
Kritik noktayı bulalım:

T den beri

Ekonomik ve sosyal pratiğin ihtiyaçları, yalnızca nicel değil, aynı zamanda nitel faktörleri de doğru bir şekilde kaydetmeyi mümkün kılan süreçlerin nicel tanımı için yöntemlerin geliştirilmesini gerektirir. Niteliksel özelliklerin değerleri, özelliğin azalma (artma) derecesine göre sıralanabilir veya sıralanabilirse, niteliksel özellikler arasındaki ilişkinin yakınlığını değerlendirmek mümkündür. Nitelik, doğru bir şekilde ölçülemeyen bir işarettir, ancak nesneleri birbirleriyle karşılaştırmanıza ve bu nedenle onları azalan veya artan kalite sırasına göre düzenlemenize olanak tanır. Sıralama ölçeklerindeki ölçümlerin gerçek içeriği, ölçülen özelliğin ciddiyetine göre nesnelerin düzenlenme sırasıdır.

Pratik amaçlar için, sıra korelasyonunun kullanımı çok faydalıdır. Örneğin, ürünlerin iki kalite özelliği arasında yüksek dereceli bir korelasyon kurulursa, bu niteliklerden sadece biri için ürünleri kontrol etmek yeterlidir, bu da maliyeti düşürür ve kontrolü hızlandırır.

Örnek olarak, birkaç işletme için pazarlanabilir ürünlerin mevcudiyeti ile satışlar için genel giderler arasında bir ilişkinin varlığını ele alabiliriz. 10 gözlem sırasında aşağıdaki tablo elde edildi:

Her değere sıra numarası (sıralama) atanırken, X değerlerini artan düzende sıralayalım:

Böylece,

Rütbeleri ile gözlem sonucunda elde edilen X ve Y çiftlerinin kaydedildiği aşağıdaki tabloyu oluşturalım:

Sıralardaki farkı şu şekilde ifade ederek, Spearman örnek korelasyon katsayısını hesaplamak için formülü yazıyoruz:

burada n, aynı zamanda sıra çiftlerinin sayısı olan gözlem sayısıdır.

Spearman katsayısı aşağıdaki özelliklere sahiptir:

Nesnelerin sıralarının tüm i değerleri için aynı olduğu anlamında X ve Y nitel özellikleri arasında tam bir doğrudan ilişki varsa, o zaman Spearman örnek korelasyon katsayısı 1'dir. 1. al

Niteliksel özellikler X ve Y arasında sıranın sıraya karşılık gelmesi anlamında tam bir ters ilişki varsa, o zaman Spearman örnek korelasyon katsayısı -1'dir.

Gerçekten, eğer

Değeri Spearman korelasyon katsayısı formülüne koyarak -1 elde ederiz.

Nitel özellikler arasında tam doğrudan veya tam bir geri bildirim yoksa, Spearman örnek korelasyon katsayısı -1 ile 1 arasındadır ve değeri 0'a ne kadar yakınsa, özellikler arasındaki ilişki o kadar küçüktür.

Yukarıdaki örneğe göre, P değerini bulacağız, bunun için tabloyu değerlerle tamamlayacağız ve:

Kendall'ın örnek korelasyon katsayısı. Kendall sıra korelasyon katsayısını kullanarak iki nitel özellik arasındaki ilişkiyi değerlendirebilirsiniz.

n boyutundaki örneklemdeki nesnelerin sıraları şöyle olsun:

X işaretiyle:

Y bazında: . Sağda sıralar var, büyük, sağda sıralar var, büyük, sağda sıralar var, büyük. Sıraların toplamı için gösterimi tanıtalım

Benzer şekilde, gösterimi, sağa uzanan, ancak daha küçük olan sıraların sayısının toplamı olarak tanıtıyoruz.

Kendall'ın örnek korelasyon katsayısı şu şekilde yazılır:

N, örnek boyutudur.

Kendall katsayısı, Spearman katsayısı ile aynı özelliklere sahiptir:

Nesnelerin sıralarının tüm i değerleri için aynı olması anlamında X ve Y'nin niteliksel özellikleri arasında tam bir doğrudan ilişki varsa, o zaman Kendall örnek korelasyon katsayısı 1'dir. Büyük olan n-1 sıraları, bu nedenle, aynı şekilde ne ayarlıyoruz. O zamanlar. Ve Kendall katsayısı: .

X ve Y özellikleri arasında sıranın sıraya karşılık gelmesi anlamında tam bir ters ilişki varsa, Kendall'ın örnek korelasyon katsayısı -1'dir. Sağda sıra yok, bu nedenle büyük. Aynı şekilde. R+=0 ​​değerini Kendall katsayı formülüne koyarak -1 elde ederiz.

Yeterince büyük bir örneklem büyüklüğü ve 1'e yakın olmayan sıralama korelasyon katsayılarının değerleri ile yaklaşık eşitlik gerçekleşir:

Kendall katsayısı, Spearman katsayısından daha ihtiyatlı bir korelasyon tahmini veriyor mu? (sayısal değer? her zaman küçüktür). Katsayının hesaplanmasına rağmen? katsayıyı hesaplamaktan daha az zaman alır, seriye yeni bir terim eklenirse katsayıyı yeniden hesaplamak daha kolaydır.

Katsayının önemli bir avantajı, iki sıra özelliği arasındaki "saf" ilişkinin derecesini değerlendirmeyi mümkün kılan ve üçüncünün etkisini ortadan kaldıran kısmi sıra korelasyon katsayısını belirlemek için kullanılabilmesidir:

Sıra korelasyon katsayılarının önemi. Örnek verilere dayanarak sıra korelasyonunun gücünü belirlerken, aşağıdaki soruyu dikkate almak gerekir: belirli bir örnek sıra korelasyon katsayısı varsa, genel popülasyonda bir korelasyon olduğu sonucuna ne derecede güvenilirlikle güvenilebilir? elde edildi. Başka bir deyişle, gözlenen sıra korelasyonlarının önemi, dikkate alınan iki sıralamanın istatistiksel bağımsızlığı hipotezine dayalı olarak test edilmelidir.

Nispeten büyük bir örneklem büyüklüğü n ile, sıra korelasyon katsayılarının önemi normal dağılım tablosu kullanılarak kontrol edilebilir (Ek Tablo 1). Spearman katsayısının önemini test etmek için mi? (n>20 için) değeri hesapla

ve Kendall katsayısının önemini test etmek için? (n>10 için) değeri hesapla

burada S=R+- R-, n örnek boyutudur.

Ayrıca, önem düzeyi ? belirlenir, Student dağılımının kritik noktaları tablosundan kritik değer tcr (?, k) belirlenir ve hesaplanan değer veya onunla karşılaştırılır. Serbestlik derecesi sayısının k = n-2 olduğu varsayılır. Eğer veya > tcr ise, o zaman veya değerleri önemli olarak kabul edilir.

Fechner korelasyon katsayısı.

Son olarak, az miktarda ilk bilgi olduğunda bir bağlantının varlığı gerçeğini belirlemek için kullanılması tavsiye edilen, bağlantının temel yakınlık derecesini karakterize eden Fechner katsayısından bahsetmeliyiz. Hesaplamanın temeli, her bir varyasyon serisinin aritmetik ortalamasından sapmaların yönünü dikkate almak ve aralarındaki ilişkinin ölçüldüğü iki seri için bu sapmaların işaretlerinin tutarlılığını belirlemektir.

Bu katsayı aşağıdaki formülle belirlenir:

na, bireysel değerlerin aritmetik ortalamalarından sapma işaretlerinin tesadüf sayısıdır; nb - sırasıyla, uyumsuzlukların sayısı.

Fechner katsayısı -1.0 aralığında değişebilir<= Кф<= +1,0.

Sıra korelasyonunun uygulamalı yönleri. Daha önce belirtildiği gibi, sıra korelasyon katsayıları yalnızca iki sıra özelliği arasındaki ilişkinin niteliksel bir analizi için değil, aynı zamanda sıra ve niceliksel özellikler arasındaki ilişkinin gücünü belirlemede de kullanılabilir. Bu durumda, nicel özelliğin değerleri sıralanır ve bunlara karşılık gelen sıralar atanır.

İki nicel özellik arasındaki bağlantının gücünü belirlerken sıra korelasyon katsayılarının hesaplanmasının da önerildiği bazı durumlar vardır. Yani, birinin (veya her ikisinin) dağılımının normal dağılımdan önemli bir sapma ile, örnek korelasyon katsayısının r anlamlılık düzeyinin belirlenmesi yanlış olur, sıra katsayıları? ve? önem düzeyinin belirlenmesinde bu tür kısıtlamalarla ilişkili değildir.

Bu türden başka bir durum, iki nicel özellik arasındaki ilişkinin doğrusal olmadığı (ancak monoton) olduğu zaman ortaya çıkar. Örneklemdeki nesnelerin sayısı azsa veya ilişkinin işareti araştırmacı için önemliyse, o zaman bir korelasyon ilişkisi kullanılıyor mu? burada uygunsuz olabilir. Sıra korelasyon katsayısının hesaplanması, kişinin bu zorlukları atlamasını sağlar.

pratik kısım

Görev 1. Korelasyon ve regresyon analizi

Sorunun ifadesi ve resmileştirilmesi:

Ekipmanın durumuna (arıza için) ve üretilen parça sayısına ilişkin bir dizi gözlem temelinde derlenen ampirik bir örnek verilmiştir. Örnek, arızalı ekipmanın hacmi ile üretilen parça sayısı arasındaki ilişkiyi dolaylı olarak karakterize eder. Numunenin anlamına göre, üretilen ürünlerin, çalışır durumda kalan ekipman üzerinde üretildiği görülebilir, çünkü arızalı ekipman yüzdesi ne kadar fazlaysa, o kadar az üretilen ürünler. Korelasyon-regresyon bağımlılığı için örneklemi incelemek, yani bağımlılık biçimini oluşturmak, regresyon fonksiyonunu değerlendirmek (regresyon analizi) ve ayrıca rastgele değişkenler arasındaki ilişkiyi belirlemek ve sıkılığını değerlendirmek (korelasyon analizi) gerekir. Korelasyon analizinin ek bir görevi, bir değişkenin diğerine göre regresyon denklemini değerlendirmektir. Ayrıca %30 ekipman arızası ile üretilen ürün sayısını da tahmin etmek gerekir.

Yukarıdaki örneği, "Ekipman arızası, %" verilerini X, "Ürün sayısı" verilerini Y olarak göstererek tabloda resmileştiriyoruz:

İlk veri. tablo 1

Problemin fiziksel anlamına göre, üretilen ürün sayısının Y doğrudan ekipman arıza yüzdesine bağlı olduğu, yani Y'nin X'e bağımlılığı olduğu görülebilir. Korelasyondan farklı olarak, değerinin olduğunu varsayar. X, bağımsız bir değişken veya faktör, Y'nin değeri - ona bağlı olarak veya etkili bir özellik olarak hareket eder. Bu nedenle, yeterli bir ekonomik ve matematiksel modelin sentezlenmesi gerekmektedir, yani. X = 30'da Y değerini tahmin etmenin mümkün olacağı X ve Y değerleri arasındaki ilişkiyi karakterize eden Y = f(X) işlevini belirleyin (bulun, seçin). problem korelasyon-regresyon analizi kullanılarak gerçekleştirilebilir.

Korelasyon-regresyon problemlerini çözme yöntemlerinin kısa bir incelemesi ve seçilen çözüm yönteminin doğrulanması.

Etkili özelliği etkileyen faktör sayısına göre regresyon analizi yöntemleri, tek ve çok faktörlü olarak ayrılır. Tek faktör - bağımsız faktörlerin sayısı = 1, yani. Y = F(X)

çok faktörlü - faktör sayısı > 1, yani

İncelenen bağımlı değişkenlerin (sonuç özellikleri) sayısına göre, regresyon görevleri de bir ve birçok üretken özelliğe sahip görevlere ayrılabilir. Genel olarak, birçok etkili özelliği olan bir görev şu şekilde yazılabilir:

Korelasyon-regresyon analizi yöntemi, formun yaklaşık (yaklaşan) bağımlılığının parametrelerini bulmaktan oluşur.

Yukarıdaki görevde yalnızca bir bağımsız değişken göründüğünden, yani sonucu etkileyen yalnızca bir faktöre bağımlılık araştırıldığından, tek faktörlü bağımlılık veya ikili regresyon üzerine bir çalışma yapılmalıdır.

Sadece bir faktörün varlığında bağımlılık şu şekilde tanımlanır:

Spesifik bir regresyon denklemi yazma şekli, faktör ile elde edilen özellik arasındaki istatistiksel ilişkiyi gösteren ve aşağıdakileri içeren bir fonksiyonun seçimine bağlıdır:

lineer regresyon, formun denklemi,

parabolik, formun denklemi

kübik, formun denklemi

hiperbolik, formun denklemi

semilogaritmik, formun denklemi

üstel, formun denklemi

güç, formun denklemi.

Fonksiyonu bulmak, regresyon denkleminin parametrelerini belirlemeye ve denklemin kendisinin güvenilirliğini değerlendirmeye indirgenir. Parametreleri belirlemek için hem en küçük kareler yöntemini hem de en küçük modüller yöntemini kullanabilirsiniz.

Bunlardan ilki, deneysel değerler olan Yi'nin hesaplanan ortalama Yi'den sapmalarının karelerinin toplamının minimum olması gerektiğidir.

En az modül yöntemi, deneysel değerler Yi ile hesaplanan ortalamalar Yi arasındaki farkın modüllerinin toplamını en aza indirmekten oluşur.

Problemi çözmek için en basit ve istatistiksel özellikler açısından iyi tahminler veren en küçük kareler yöntemini seçiyoruz.

En küçük kareler yöntemini kullanarak regresyon analizi problemini çözme teknolojisi.

Gerçek y değerinin hesaplanandan sapmasını tahmin ederek değişkenler arasındaki bağımlılığın türünü (doğrusal, ikinci dereceden, kübik vb.) belirleyebilirsiniz:

nerede - ampirik değerler, - yaklaşık fonksiyon için hesaplanmış değerler. Çeşitli fonksiyonlar için Si değerlerini tahmin ederek ve bunlardan en küçüğünü seçerek yaklaşık bir fonksiyon seçiyoruz.

Bir fonksiyonun türü, belirli bir denklem sisteminin çözümü olarak her fonksiyon için bulunan katsayıların bulunmasıyla belirlenir:

lineer regresyon, tip denklem, sistem -

parabolik, formun denklemi, sistem -

kübik, tip denklemi, sistem -

Sistemi çözdükten sonra, analitik fonksiyonun belirli bir ifadesine ulaştığımız yardımı ile hesaplanan değerleri bulduğumuzu buluruz. Ardından, sapma S'nin bir tahminini bulmak ve bir minimum için analiz yapmak için tüm veriler var.

Doğrusal bir bağımlılık için, faktör X ile etkin özellik Y arasındaki ilişkinin yakınlığını bir korelasyon katsayısı r biçiminde tahmin ederiz:

Göstergenin ortalama değeri;

Faktörün ortalama değeri;

y - göstergenin deneysel değeri;

x - faktörün deneysel değeri;

Standart sapma x;

y'de standart sapma.

Korelasyon katsayısı r = 0 ise, özellikler arasındaki ilişkinin önemsiz veya yok olduğu, r = 1 ise özellikler arasında çok yüksek bir işlevsel ilişki olduğu kabul edilir.

Chaddock tablosunu kullanarak, işaretler arasındaki ilişkinin yakınlığının niteliksel bir değerlendirmesini yapmak mümkündür:

Chaddock masası Tablo 2.

Doğrusal olmayan bir bağımlılık için, aşağıdaki bağımlılıklardan hesaplanan korelasyon oranı (0 1) ve korelasyon indeksi R belirlenir.

burada değer, regresyon bağımlılığından hesaplanan göstergenin değeridir.

Hesaplamaların doğruluğunun bir tahmini olarak, ortalama göreceli yaklaşım hatasının değerini kullanırız.

Yüksek doğrulukta %0-12 aralığındadır.

Fonksiyonel bağımlılığın seçimini değerlendirmek için belirleme katsayısını kullanırız.

Belirleme katsayısı, faktöriyel ve toplam varyans arasındaki oranı, daha doğrusu faktör varyansının toplamdaki payını ifade ettiğinden, fonksiyonel bir modelin seçiminin kalitesinin "genelleştirilmiş" bir ölçüsü olarak kullanılır.

Korelasyon indeksi R'nin önemini değerlendirmek için Fisher's F-testi kullanılır. Kriterin gerçek değeri şu formülle belirlenir:

m, regresyon denkleminin parametre sayısıdır, n, gözlem sayısıdır. Değer, kabul edilen anlamlılık düzeyi ve u serbestlik derecesi sayısı dikkate alınarak F-kriter tablosundan belirlenen kritik değer ile karşılaştırılır. Eğer, o zaman korelasyon indeksi R'nin değeri anlamlı olarak kabul edilir.

Seçilen regresyon formu için regresyon denkleminin katsayıları hesaplanır. Kolaylık sağlamak için, hesaplamaların sonuçları aşağıdaki yapıya ait bir tabloya dahil edilmiştir (genel olarak, sütunların sayısı ve görünümleri, regresyon tipine bağlı olarak değişir):

Tablo 3

Sorunun çözümü.

Ekonomik bir fenomen hakkında gözlemler yapıldı - ürünlerin çıktısının ekipman arızasının yüzdesine bağımlılığı. Bir dizi değer alındı.

Seçilen değerler Tablo 1'de açıklanmıştır.

Verilen örneğe ampirik bağımlılığın bir grafiğini oluşturuyoruz (Şekil 1)

Grafiğin formuyla, analitik bağımlılığın doğrusal bir fonksiyon olarak temsil edilebileceğini belirleriz:

X ve Y arasındaki ilişkiyi değerlendirmek için ikili korelasyon katsayısını hesaplayın:

Yardımcı bir tablo oluşturalım:

Tablo 4

Katsayıları bulmak için bir denklem sistemi çözüyoruz ve:

değeri yerine koyarak ilk denklemden

ikinci denklemde şunu elde ederiz:

Bulduk

Regresyon denkleminin şeklini alırız:

9. Bulunan ilişkinin sıkılığını tahmin etmek için korelasyon katsayısını kullanırız r:

Chaddock tablosuna göre, r = 0.90 için X ve Y arasındaki ilişkinin çok yüksek olduğunu, dolayısıyla regresyon denkleminin güvenilirliğinin de yüksek olduğunu bulduk. Hesaplamaların doğruluğunu değerlendirmek için ortalama göreceli yaklaşım hatasının değerini kullanırız:

Değerin, regresyon denkleminin yüksek derecede güvenilirliğini sağladığına inanıyoruz.

X ve Y arasındaki doğrusal bir ilişki için, belirleme indeksi, r: korelasyon katsayısının karesine eşittir. Bu nedenle, toplam varyasyonun %81'i, X faktör özelliğindeki bir değişiklikle açıklanmaktadır.

Doğrusal bir bağımlılık durumunda, korelasyon katsayısı r'ye mutlak değerde eşit olan korelasyon indeksi R'nin önemini değerlendirmek için Fisher'in F-testi kullanılır. Gerçek değeri aşağıdaki formülle belirleriz:

m, regresyon denkleminin parametre sayısıdır, n, gözlem sayısıdır. Yani, n = 5, m = 2.

Kabul edilen anlamlılık düzeyi = 0,05 ve serbestlik derecesi sayısını dikkate alarak kritik tablo değerini elde ederiz. Çünkü, korelasyon indeksi R'nin değeri anlamlı olarak kabul edilmektedir.

X = 30'da Y'nin tahmin edilen değerini hesaplayalım:

Bulunan fonksiyonun bir grafiğini oluşturalım:

11. Standart sapma değerine göre korelasyon katsayısının hatasını belirleyin

ve sonra normalleştirilmiş sapmanın değerini belirleyin

%95 olasılıkla > 2 oranından elde edilen korelasyon katsayısının öneminden bahsedebiliriz.

Görev 2. Doğrusal optimizasyon

Seçenek 1.

Bölgenin kalkınma planının, toplam üretim hacmi 9 milyon ton olan 3 petrol sahasının faaliyete geçmesi bekleniyor. Birinci sahada üretim hacmi en az 1 milyon ton, ikinci - 3 milyon ton, üçüncü - 5 milyon tondur. Bu verimin sağlanabilmesi için en az 125 kuyu açılması gerekmektedir. Bu planın uygulanması için 25 milyon ruble tahsis edildi. sermaye yatırımları (gösterge K) ve 80 km boru (gösterge L).

Her tarlanın planlanan verimini sağlamak için optimal (maksimum) kuyu sayısının belirlenmesi gerekmektedir. Görevle ilgili ilk veriler tabloda verilmiştir.

İlk veri

Problem ifadesi yukarıda verilmiştir.

Problemde belirtilen koşulları ve kısıtlamaları resmileştiririz. Bu optimizasyon problemini çözmenin amacı, problem üzerindeki mevcut kısıtlamaları dikkate alarak, her saha için optimal kuyu sayısı ile maksimum petrol üretim değerini bulmaktır.

Problemin gereksinimlerine uygun olarak hedef fonksiyon şu şekli alacaktır:

her alan için kuyu sayısı nerede.

Aşağıdakiler için görevle ilgili mevcut kısıtlamalar:

boru uzunluğu:

her alandaki kuyu sayısı:

1 kuyunun inşaat maliyeti:

Doğrusal optimizasyon problemleri, örneğin aşağıdaki yöntemlerle çözülür:

grafiksel olarak

Simpleks yöntemi

Grafik yöntemini kullanmak, yalnızca iki değişkenli doğrusal optimizasyon problemlerini çözerken uygundur. Daha fazla sayıda değişkenle, cebirsel bir aygıtın kullanılması gereklidir. Simpleks yöntemi olarak adlandırılan doğrusal optimizasyon problemlerini çözmek için genel bir yöntem düşünün.

Simlex yöntemi, çoğu optimizasyon probleminin çözümünde kullanılan yinelemeli hesaplamaların tipik bir örneğidir. Yöneylem araştırması modelleri yardımıyla problem çözmeyi sağlayan bu tür yinelemeli prosedürler göz önünde bulundurulur.

Simpleks yöntemini kullanarak bir optimizasyon problemini çözmek için, Xi bilinmeyen sayısının denklem sayısından büyük olması gerekir, yani. denklem sistemi

m ilişkisini tatmin etti

A=m'ye eşitti.

A matrisinin sütununu ve serbest terimler sütununu şu şekilde belirtin:

(1) sisteminin temel çözümü, (1) sisteminin çözümü olan bir dizi m bilinmeyendir.

Kısaca, simpleks yönteminin algoritması şu şekilde açıklanmaktadır:

Bir tür eşitsizliği olarak yazılan orijinal kısıtlama<= (=>) , kısıtlamanın sol tarafına artık değişken eklenerek (gereksiz değişkeni sol taraftan çıkararak) bir eşitlik olarak gösterilebilir.

Örneğin, orijinal kısıtlamanın sol tarafına

orijinal eşitsizliğin eşitliğe dönüşmesinin bir sonucu olarak artık bir değişken eklenir

Orijinal kısıtlama boru tüketimini belirtiyorsa, değişken o kaynağın geri kalanı veya kullanılmayan kısmı olarak yorumlanmalıdır.

Amaç fonksiyonunu maksimize etmek, zıt işaretli aynı fonksiyonu minimize etmeye eşdeğerdir. Yani, bizim durumumuzda

eşdeğerdir

Aşağıdaki formun temel çözümü için bir simpleks tablosu derlenmiştir:

Bu tablo, bu hücrelerdeki sorunu çözdükten sonra temel bir çözüm olacağını göstermektedir. - bir sütunu sütunlardan birine bölmekten özel; - etkinleştirme sütunuyla ilgili tablonun hücrelerindeki değerler için ek sıfırlama çarpanları. - amaç fonksiyonunun min değeri -Z, - bilinmeyenler için amaç fonksiyonundaki katsayıların değerleri.

Değerler arasında herhangi bir pozitif bulun. Eğer durum böyle değilse, sorun çözülmüş olarak kabul edilir. Tablonun sahip olduğu herhangi bir sütunu seçin, bu sütuna "izin verilen" sütun denir. Çözüm sütununun öğeleri arasında pozitif sayılar yoksa, çözüm kümesindeki amaç fonksiyonunun sınırsızlığı nedeniyle sorun çözülemez. Çözünürlük sütununda pozitif sayılar varsa 5. adıma gidin.

Sütun, payda sütunun öğeleri olan ve paydada - çözümleme sütununun karşılık gelen öğeleri olan kesirler ile doldurulur. Tüm değerlerden en küçüğü seçilir. En küçük sonucun olduğu satıra "izin veren" satır denir. İzin verilen çizginin ve izin verilen sütunun kesişiminde, bir şekilde, örneğin renkle vurgulanan izin veren bir öğe bulunur.

İlk tek yönlü tabloya dayanarak, aşağıdaki derlenmiştir:

Satır vektörü sütun vektörüyle değiştirildi

izin verilen dize, izin veren öğeye bölünen aynı dizeyle değiştirilir

tablonun diğer satırlarının her biri, çözünürlük sütununun hücresinde 0 elde etmek için bu satırın çözünürlüğü ile toplamı, özel olarak seçilmiş bir ek faktörle çarpılarak değiştirilir.

Yeni tablo ile 4. maddeye dönüyoruz.

Sorunun çözümü.

Problem ifadesine dayanarak, aşağıdaki eşitsizlik sistemine sahibiz:

ve amaç fonksiyonu

Ek değişkenler ekleyerek eşitsizlik sistemini bir denklem sistemine dönüştürüyoruz:

Amaç fonksiyonunu eşdeğerine indirgeyelim:

İlk simpleks tablosunu oluşturalım:

Bir izin sütunu seçelim. Sütunu hesaplayalım:

Değerleri tabloya giriyoruz. Bunların en küçüğü = 10 ile etkinleştirme dizesini belirleriz: . Çözümleme satırının ve çözümleme sütununun kesişiminde, çözümleme elemanı = 1'i buluruz. Tablonun bir kısmını ek faktörlerle doldururuz, öyle ki: çözümleme dizesi bunlarla çarpılır, tablonun kalan satırlarına eklenir, çözümleme sütununun öğelerinde 0 oluşturur.

İkinci tek yönlü tabloyu oluşturuyoruz:

İçinde bir çözümleme sütunu alıyoruz, değerleri hesaplıyoruz, bir tabloya koyuyoruz. En azından, izin verilen bir dize alırız. Çözümleme öğesi 1 olacaktır. Ek faktörler buluyoruz, sütunları dolduruyoruz.

Aşağıdaki tek yönlü tabloyu oluşturuyoruz:

Benzer şekilde, bir çözümleme sütunu, bir çözümleme satırı ve bir çözümleme elemanı = 2 buluyoruz. Aşağıdaki tek yönlü tabloyu oluşturuyoruz:

-Z satırında pozitif değerler olmadığı için bu tablo sonludur. İlk sütun bilinmeyenlerin istenen değerlerini verir, yani. optimal temel çözüm:

Bu durumda amaç fonksiyonunun değeri -Z = -8000 olup, bu Zmax = 8000'e eşittir. Problem çözülmüştür.

Görev 3. Küme analizi

Sorunun formülasyonu:

Tabloda verilen verilere göre nesnelerin bölümlenmesini gerçekleştirin. Çözüm yönteminin seçimi, bir veri bağımlılığı grafiği oluşturmak için bağımsız olarak gerçekleştirilecektir.

Seçenek 1.

İlk veri

Belirtilen türdeki sorunları çözmek için yöntemlerin gözden geçirilmesi. Çözüm yönteminin gerekçesi.

Küme analizinin görevleri aşağıdaki yöntemler kullanılarak çözülür:

Birlik veya ağaç kümeleme yöntemi, "benzersizlik" veya "nesneler arası uzaklık" kümelerinin oluşumunda kullanılır. Bu mesafeler tek boyutlu veya çok boyutlu uzayda tanımlanabilir.

İki yönlü birleştirme (nispeten nadiren) verilerin "nesneler" ve "nesnelerin özellikleri" açısından değil, gözlemler ve değişkenler açısından yorumlandığı durumlarda kullanılır. Hem gözlemlerin hem de değişkenlerin aynı anda anlamlı kümelerin keşfedilmesine katkıda bulunması beklenir.

K-yöntemi anlamına gelir. Küme sayısıyla ilgili zaten bir hipotez olduğunda kullanılır. Sisteme tam olarak, örneğin mümkün olduğunca farklı olmaları için üç küme oluşturmasını söyleyebilirsiniz. Genel durumda, K-araçlar yöntemi, mümkün olduğunca uzakta bulunan tam olarak K farklı küme oluşturur.

Mesafeleri ölçmenin aşağıdaki yolları vardır:

Öklid mesafesi. Bu en yaygın mesafe türüdür. Çok boyutlu uzayda basit bir geometrik uzaklıktır ve şu şekilde hesaplanır:

Öklid mesafesinin (ve karesinin) standart verilerden değil, orijinal verilerden hesaplandığını unutmayın.

Şehir bloğu mesafesi (Manhattan mesafesi). Bu mesafe, sadece koordinatlar üzerindeki farkların ortalamasıdır. Çoğu durumda, bu mesafe ölçüsü, olağan Öklid mesafesi ile aynı sonuçlara yol açar. Ancak, bu ölçü için bireysel büyük farklılıkların (aykırı değerlerin) etkisinin azaldığına (kare alınmadıkları için) dikkat edin. Manhattan mesafesi aşağıdaki formül kullanılarak hesaplanır:

Chebyshev mesafesi. Bu mesafe, herhangi bir koordinatta (herhangi bir boyutta) farklılık gösteriyorsa, iki nesneyi "farklı" olarak tanımlamak istendiğinde yararlı olabilir. Chebyshev mesafesi aşağıdaki formülle hesaplanır:

Güç mesafesi. Bazen, karşılık gelen nesnelerin çok farklı olduğu bir boyuta ilişkin ağırlığın aşamalı olarak arttırılması veya azaltılması istenir. Bu, bir güç yasası mesafesi kullanılarak elde edilebilir. Güç mesafesi aşağıdaki formülle hesaplanır:

burada r ve p kullanıcı tanımlı parametrelerdir. Birkaç hesaplama örneği, bu önlemin nasıl "işe yaradığını" gösterebilir. p parametresi, bireysel koordinatlardaki farklılıkların kademeli olarak ağırlıklandırılmasından sorumludur, r parametresi, nesneler arasındaki büyük mesafelerin aşamalı olarak ağırlıklandırılmasından sorumludur. Her iki parametre de - r ve p, ikiye eşitse, bu mesafe Öklid mesafesiyle çakışır.

Anlaşmazlık yüzdesi. Bu ölçü, veriler kategorik olduğunda kullanılır. Bu mesafe aşağıdaki formülle hesaplanır:

Problemi çözmek için, koşullara ve problem ifadesine (nesnelerin bir bölümünü yürütmek için) en uygun olan ilişkilendirme yöntemini (ağaç benzeri kümeleme) seçeceğiz. Buna karşılık, birleştirme yöntemi, bağlantı kurallarının çeşitli türevlerini kullanabilir:

Tek bağlantı (en yakın komşu yöntemi). Bu yöntemde, iki küme arasındaki mesafe, farklı kümelerdeki en yakın iki nesne (en yakın komşular) arasındaki mesafe ile belirlenir. Yani, iki kümedeki herhangi iki nesne birbirine karşılık gelen bağlantı mesafesinden daha yakındır. Bu kural, bir anlamda, kümeleri oluşturmak için nesneleri bir araya getirmelidir ve sonuçta ortaya çıkan kümeler, uzun "dizeler" ile temsil edilme eğilimindedir.

Tam bağlantı (en uzak komşuların yöntemi). Bu yöntemde, kümeler arasındaki mesafeler, farklı kümelerdeki herhangi iki nesne arasındaki en büyük mesafeyle tanımlanır (yani "en uzak komşular").

Bunun gibi başka birçok küme birleştirme yöntemi de vardır (örneğin, ağırlıksız eşleştirme, ağırlıklı eşleştirme, vb.).

Çözüm yöntemi teknolojisi. Göstergelerin hesaplanması.

İlk adımda, her nesne ayrı bir küme olduğunda, bu nesneler arasındaki mesafeler seçilen ölçü ile belirlenir.

Özellik ölçü birimleri problemde belirtilmediği için bunların çakıştığı varsayılır. Bu nedenle, ilk verileri normalleştirmeye gerek yoktur, bu nedenle hemen mesafe matrisinin hesaplanmasına geçiyoruz.

Sorunun çözümü.

İlk verilere dayanarak bir bağımlılık grafiği oluşturalım (Şekil 2)

Nesneler arasındaki mesafe olarak normal Öklid mesafesini alalım. Sonra formüle göre:

nerede l - işaretler; k - özelliklerin sayısı, 1 ve 2 numaralı nesneler arasındaki mesafe:

Kalan mesafeleri hesaplamaya devam ediyoruz:

Elde edilen değerlerden bir tablo oluşturacağız:

En küçük mesafe. Bu, 3,6 ve 5 öğelerinin tek bir kümede birleştirildiği anlamına gelir. Aşağıdaki tabloyu alıyoruz:

En küçük mesafe. 3,6,5 ve 4 elementleri tek bir kümede birleştirilir.İki kümeden bir tablo elde ederiz:

3. ve 6. elemanlar arasındaki minimum mesafe eşittir. Bu, 3 ve 6 numaralı öğelerin tek bir kümede birleştirildiği anlamına gelir. Yeni oluşturulan küme ile diğer öğeler arasındaki maksimum mesafeyi seçiyoruz. Örneğin, küme 1 ile küme 3,6 arasındaki mesafe max(13.34166, 13.60147)= 13.34166'dır. Aşağıdaki tabloyu yapalım:

İçinde minimum mesafe, 1 ve 2 kümeleri arasındaki mesafedir. 1 ve 2'yi tek bir kümede birleştirerek şunları elde ederiz:

Böylece, "uzak komşu" yöntemi kullanılarak iki küme elde edildi: 1.2 ve 3.4.5.6, aralarındaki mesafe 13.60147.

Sorun çözüldü.

Uygulamalar Uygulama paketlerini kullanarak sorunları çözme (MS Excel 7.0)

Korelasyon-regresyon analizi sorunu.

İlk verileri tabloya giriyoruz (Şekil 1)

"Servis / Veri Analizi" menüsünü seçin. Görünen pencerede "Regresyon" satırını seçin (Şek. 2).

Bir sonraki pencerede, X ve Y için giriş aralıklarını ayarlayacağız, güvenilirlik seviyesini %95'te bırakacağız ve çıktı verilerini ayrı bir “Rapor Sayfası”na yerleştireceğiz (Şekil 3).

Hesaplamadan sonra, “Rapor Sayfası” sayfasında regresyon analizinin nihai verilerini alıyoruz:

Ayrıca, yaklaşık işlevin dağılım grafiğini veya "Seçim Grafiği"ni de görüntüler:


Hesaplanan değerler ve sapmalar, sırasıyla "Öngörülen Y" ve "Kalıntılar" sütunlarında tabloda görüntülenir.

İlk verilere ve sapmalara dayanarak, bir artık grafiği oluşturulur:

optimizasyon sorunu


İlk verileri aşağıdaki gibi giriyoruz:

İstenen bilinmeyenler X1, X2, X3 sırasıyla C9, D9, E9 hücrelerine girilir.

Amaç fonksiyonunun X1, X2, X3'teki katsayıları sırasıyla C7, D7, E7'ye girilir.

Amaç işlevi B11 hücresine formül olarak girilir: =C7*C9+D7*D9+E7*E9.

Görevle ilgili mevcut kısıtlamalar

Boru uzunluğu için:

C5, D5, E5, F5, G5 hücrelerine girin

Her alandaki kuyu sayısı:

X3 £100; C8, D8, E8 hücrelerine giriyoruz.

1 kuyu inşaat maliyeti:

C6, D6, E6, F6, G6 hücrelerine giriyoruz.

C5*C9+D5*D9+E5*E9 toplam uzunluğunu hesaplama formülü B5 hücresine, toplam maliyeti hesaplama formülü C6*C9+D6*D9+E6*E9 B6 hücresine yerleştirilir.


"Araçlar / Çözüm ara" menüsünden seçiyoruz, girilen ilk verilere göre çözüm bulmak için parametreleri giriyoruz (Şekil 4):

"Parametreler" düğmesine tıklayarak, çözüm aramak için aşağıdaki parametreleri belirledik (Şekil 5):


Bir çözüm aradıktan sonra, sonuçlar hakkında bir rapor alıyoruz:

Microsoft Excel 8.0e Sonuç Raporu

Rapor oluşturuldu: 17.11.2002 01:28:30

Hedef Hücre (Maksimum)

Sonuç

Toplam üretim

Değiştirilebilir hücreler

Sonuç

kuyu sayısı

kuyu sayısı

kuyu sayısı

Kısıtlamalar

Anlam

Uzunluk

İlişkili

Proje maliyeti

bağlı değil.

kuyu sayısı

bağlı değil.

kuyu sayısı

İlişkili

kuyu sayısı

İlişkili

İlk tablo, çözülmekte olan problemin amaç fonksiyonunun yerleştirildiği hedef hücrenin başlangıç ​​ve son (optimal) değerini gösterir. İkinci tabloda, değiştirilecek hücrelerde yer alan, optimize edilecek değişkenlerin başlangıç ​​ve son değerlerini görüyoruz. Sonuç raporunun üçüncü tablosu, sınırlamalar hakkında bilgi içerir. "Değer" sütunu, gerekli kaynakların ve optimize edilmiş değişkenlerin optimal değerlerini içerir. "Formül" sütunu, bu verileri içeren hücrelere referanslar şeklinde yazılmış, tüketilen kaynaklar ve optimize edilmiş değişkenler üzerindeki sınırları içerir. Durum sütunu, bu kısıtlamaların bağlı mı yoksa ilişkisiz mi olduğunu belirler. Burada "sınırlı", katı eşitlikler biçiminde optimal çözümde uygulanan kısıtlamalardır. Kaynak limitleri için "Fark" sütunu, kullanılan kaynakların dengesini belirler; gerekli kaynak miktarı ile kullanılabilirliği arasındaki fark.

Benzer şekilde çözüm arayışının sonucunu “Sürdürülebilirlik Raporu” şeklinde yazarak aşağıdaki tabloları elde ederiz:

Microsoft Excel 8.0e Sürdürülebilirlik Raporu

Çalışma sayfası: [Optimizasyon sorunu çözümü.xls] Üretim optimizasyonu sorunu çözümü

Rapor oluşturuldu: 17.11.2002 01:35:16

Değiştirilebilir hücreler

İzin verilebilir

İzin verilebilir

anlam

fiyat

katsayı

Artırmak

Azaltmak

kuyu sayısı

kuyu sayısı

kuyu sayısı

Kısıtlamalar

sınırlama

İzin verilebilir

İzin verilebilir

anlam

Sağ kısım

Artırmak

Azaltmak

Uzunluk

Proje maliyeti

Kararlılık raporu, değişken (optimize edilmiş) değişkenler ve model kısıtlamaları hakkında bilgi içerir. Bu bilgi, problemin çözümü açısından yukarıda açıklanan lineer problemlerin optimizasyonunda kullanılan simpleks yöntemi ile ilgilidir. Elde edilen optimal çözümün model parametrelerindeki olası değişikliklere ne kadar duyarlı olduğunu değerlendirmenizi sağlar.

Raporun ilk kısmı, alanlardaki kuyu sayısı ile ilgili değerleri içeren değişken hücreler hakkında bilgi içerir. "Sonuç değeri" sütunu, optimize edilecek değişkenlerin optimal değerlerini gösterir. "Hedef Katsayısı" sütunu, amaç fonksiyonu katsayı değerlerinin başlangıç ​​verilerini içerir. Sonraki iki sütun, bulunan optimal çözümü değiştirmeden bu katsayıların izin verilen artış ve azalışlarını göstermektedir.

Kararlılık raporunun ikinci kısmı, optimize edilen değişkenlere getirilen kısıtlamalar hakkında bilgi içerir. İlk sütun, optimal çözüm için kaynak gereksinimlerini gösterir. İkincisi, kullanılan kaynak türleri için gölge fiyatların değerlerini içerir. Son iki sütun, mevcut kaynakların miktarındaki olası bir artış veya azalmaya ilişkin verileri içerir.

kümeleme sorunu

Sorunu çözmek için adım adım bir yöntem yukarıda verilmiştir. Sorunu çözmenin ilerlemesini gösteren Excel tabloları:

"en yakın komşu yöntemi"

Kümeleme analizi probleminin çözümü - "EN YAKIN KOMŞU YÖNTEMİ"

İlk veri

burada x1 çıktı hacmidir;

x2 - ana maliyetin ortalama yıllık maliyeti

Endüstriyel üretim fonları

"uzak komşu yöntemi"

Kümeleme analizi sorununun çözümü - "UZAK KOMŞU YÖNTEMİ"

İlk veri

burada x1 çıktı hacmidir;

x2 - ana maliyetin ortalama yıllık maliyeti

Endüstriyel üretim fonları

Uzman değerlendirmelerinin sunumu ve ön işlemesi

Uygulamada, çeşitli değerlendirme türleri kullanılır:

- kalite (sıklıkla-nadiren, daha kötü-daha iyi, evet-hayır),

- ölçek puanları (50-75, 76-90, 91-120 vb. değer aralıkları),

Belirli bir aralıktaki puanlar (2'den 5'e, 1 -10), karşılıklı olarak bağımsız,

Dereceli (nesneler uzman tarafından belirli bir sırayla düzenlenir ve her birine bir seri numarası atanır - rütbe),

Karşılaştırma yöntemlerinden biri ile elde edilen karşılaştırma

ardışık karşılaştırma yöntemi

faktörlerin ikili karşılaştırma yöntemi.

Uzman görüşlerinin işlenmesinde bir sonraki adımda, Bu görüşler arasındaki anlaşma derecesi.

Uzmanlardan alınan tahminler, dağılımı bir veya başka bir olay (faktör) seçiminin olasılığı hakkındaki uzmanların görüşlerini yansıtan rastgele bir değişken olarak kabul edilebilir. Bu nedenle, uzman tahminlerinin dağılımını ve tutarlılığını analiz etmek için genelleştirilmiş istatistiksel özellikler kullanılır - ortalamalar ve dağılım ölçümleri:

ortalama kare hatası,

Varyasyon aralığı min - maks,

- varyasyon katsayısı V \u003d rms.devi. / aritm. ortalama. (her türlü değerlendirme için uygundur)

V ben = σ ben / x ben cf

oran için benzerlik ölçüleri ama görüşler her bir uzman çiftiÇeşitli yöntemler kullanılabilir:

ilişki katsayıları eşleşen ve eşleşmeyen cevapların sayısını dikkate alan,

tutarsızlık katsayıları uzman görüşleri,

Tüm bu ölçümler, iki uzmanın görüşlerini karşılaştırmak veya iki kritere ilişkin tahminler dizisi arasındaki ilişkiyi analiz etmek için kullanılabilir.

Spearman's Çift Sıra Korelasyon Katsayısı:

n uzman sayısıdır,

c k, tüm T faktörleri için i-th ve j-th uzmanlarının tahminleri arasındaki farktır.

Kendall'ın sıra korelasyon katsayısı (uyum katsayısı), tüm uzmanların tüm faktörler hakkındaki görüşlerinin tutarlılığının genel bir değerlendirmesini verir, ancak yalnızca sıralama tahminlerinin kullanıldığı durumlar için.

Tüm uzmanlar tüm faktörler için aynı değerlendirmeyi yaptığında S değerinin maksimum değerine eşit olduğu kanıtlanmıştır.

n faktör sayısıdır,

m uzman sayısıdır.

Uyum katsayısı orana eşittir

dahası, eğer W 1'e yakınsa, o zaman tüm uzmanlar oldukça tutarlı tahminler vermiştir, aksi takdirde görüşleri tutarsızdır.

S hesaplama formülü aşağıda verilmiştir:

nerede r ij - j-inci uzman tarafından i-inci faktörün sıralama tahminleri,

r cf - tüm tahmin matrisi üzerindeki ortalama sıralama ve eşittir

Bu nedenle S'yi hesaplama formülü şu şekilde olabilir:

Bir uzmanın bireysel değerlendirmeleri çakışıyorsa ve bunlar işleme sırasında standart hale getirildiyse, uyum katsayısını hesaplamak için başka bir formül kullanılır:



burada T j, aşağıdaki kurallara göre tekrarlar dikkate alınarak (farklı nesneler için değerlendirmelerinin tekrarlanması durumunda) her uzman için hesaplanır:

burada t j, j'inci uzman için eşit sıradaki grupların sayısıdır ve

h k - j'inci uzmanın ilgili sıralarının k'inci grubundaki eşit sıra sayısı.

ÖRNEK. Tablo 3'te gösterildiği gibi sıralama yaparken altı faktöre ilişkin 5 uzmanın yanıt vermesine izin verin:

Tablo 3 - Uzmanların cevapları

uzmanlar O1 O2 O3 O4 O5 O6 Uzmana göre rütbe toplamı
E1
E2
E3
E 4
E5

Kesin olmayan bir sıralama elde edildiğinden (uzmanların tahminleri tekrarlanır ve sıraların toplamları eşit değildir), tahminleri dönüştüreceğiz ve ilgili sıraları elde edeceğiz (Tablo 4):

Tablo 4 - Uzman derecelendirmelerinin ilgili sıraları

uzmanlar O1 O2 O3 O4 O5 O6 Uzmana göre rütbe toplamı
E1 2,5 2,5
E2
E3 1,5 1,5 4,5 4,5
E 4 2,5 2,5 4,5 4,5
E5 5,5 5,5
Nesneye göre sıra toplamı 7,5 9,5 23,5 29,5

Şimdi uyum katsayısını kullanarak uzmanların görüşleri arasındaki uyuşma derecesini belirleyelim. Sıralar birbiriyle ilişkili olduğu için (**) formülünü kullanarak W'yi hesaplayacağız.

Ardından r cf \u003d 7 * 5 / 2 \u003d 17.5

S = 10 2 +8 2 +4,5 2 +4,5 2 +6 2 +12 2 = 384.5

W hesaplamasına geçelim. Bunu yapmak için T j değerlerini ayrı ayrı hesaplıyoruz. Örnekte, puanlar özel olarak seçilmiştir, böylece her uzman tekrarlanan puanlara sahiptir: 1.'nin iki, ikincinin üç, üçüncünün ikişerli iki grubu, dördüncü ve beşincinin iki özdeş işareti vardır. Buradan:

T 1 \u003d 2 3 - 2 \u003d 6 T 5 \u003d 6

T 2 \u003d 3 3 - 3 \u003d 24

T 3 \u003d 2 3 -2+ 2 3 -2 \u003d 12 T 4 \u003d 12

Uzmanların görüşlerinin fikir birliğinin oldukça yüksek olduğunu ve çalışmanın bir sonraki aşaması olan uzmanlar tarafından önerilen alternatif çözümün doğrulanması ve benimsenmesi aşamasına geçilmesinin mümkün olduğunu görüyoruz.

Aksi takdirde, 4-8 arasındaki adımlara geri dönmelisiniz.

KENDALL SIRA KORELASYONU KATSAYISI

İki rastgele değişkenin (özelliklerin) bağımlılığının örnek ölçümlerinden biri X ve Y,örnek elemanların sıralamasına göre (X 1 , Yx), .. ., (Х n, Y n). K. k. r. bu nedenle, şuna atıfta bulunur: sıralama istatistikçileri ve formül tarafından belirlenir

nerede ri- U o çifte ait ( X, Y), hangi Xraven için ben, S = 2N-(n-1)/2, hem j>i hem de rj >r ben. Her zaman K.'ye bağımlılığın seçici bir ölçüsü olarak. to., M. Kendall tarafından yaygın olarak kullanılmıştır (M. Kendall, bkz.).

K. k. r. k. rastgele değişkenlerin bağımsızlığı hipotezini test etmek için kullanılır. Bağımsızlık hipotezi doğruysa, E t =0 ve D t =2(2n+5)/9n(n-1) olur. Küçük bir örneklem büyüklüğü ile istatistiksel olarak kontrol bağımsızlık hipotezleri özel tablolar kullanılarak yapılır (bkz.). n>10 için, m'nin dağılımı için normal yaklaşım kullanılır:

daha sonra bağımsızlık hipotezi reddedilir, aksi takdirde kabul edilir. Burada bir . - anlamlılık düzeyi, u a /2, normal dağılımın yüzde noktasıdır. K. k. r. k., herhangi biri gibi, yalnızca numunenin öğeleri bu özelliklere göre sıralanabiliyorsa, iki nitel özelliğin bağımlılığını tespit etmek için kullanılabilir. Eğer X, Y p korelasyon katsayısına sahip ortak bir normale sahip olmak, daha sonra K. ile arasındaki ilişki. ve forma sahiptir:

Ayrıca bakınız Spearman sıra korelasyonu, Sıra testi.

Aydınlatılmış.: Kendal M., Sıra bağıntıları, çev. İngilizce'den, M., 1975; Van der Waerden B.L., Matematiksel, çev. Almanca'dan, M., 1960; Bolshev L.N., Smirnov N.V., Matematiksel istatistik tabloları, M., 1965.

A.V. Prohorov.


Matematiksel ansiklopedi. - M.: Sovyet Ansiklopedisi. I.M. Vinogradov. 1977-1985.

Diğer sözlüklerde "KENDALL RANK COEFFICIENT" in ne olduğunu görün:

    ingilizce verimli, sıra korelasyonu ile Kendall; Almanca Kendalls Rangkorrelationskoye verimli. Tüm nesne çiftlerinin iki değişken tarafından sıralanmasının yazışma derecesini belirleyen korelasyon katsayısı. Antinazi. Sosyoloji Ansiklopedisi, 2009 ... Sosyoloji Ansiklopedisi

    KENDALL SIRALAMA KATSAYISI- İngilizce. verimli, sıra korelasyonu Kendall; Almanca Kendalls Rangkorrelationskoye verimli. Tüm nesne çiftlerinin iki değişkene göre sıralanmasının yazışma derecesini belirleyen korelasyon katsayısı ... Açıklayıcı Sosyoloji Sözlüğü

    Bağımsız gözlem sonuçlarının (X1, Y1) sıralamasına dayalı olarak iki rastgele değişkenin (özellik) X ve Y'nin bağımlılığının bir ölçüsü. . ., (Xn,Yn). X değerlerinin sıraları doğal sırada ise i=1, . . ., n,a Ri rank Y karşılık gelen … … Matematik Ansiklopedisi

    Korelasyon katsayısı- (Korelasyon katsayısı) Korelasyon katsayısı, iki rastgele değişkenin bağımlılığının istatistiksel bir göstergesidir Korelasyon katsayısının tanımı, korelasyon katsayısı türleri, korelasyon katsayısının özellikleri, hesaplama ve uygulama ... ... yatırımcının ansiklopedisi

    Genel olarak konuşursak, kesinlikle işlevsel bir karaktere sahip olmayan rastgele değişkenler arasındaki bağımlılık. İşlevsel bağımlılığın aksine, K., bir kural olarak, niceliklerden birinin yalnızca verilen diğerine değil, aynı zamanda ... ... Matematik Ansiklopedisi

    Korelasyon (korelasyon bağımlılığı), iki veya daha fazla rastgele değişken (veya kabul edilebilir bir doğruluk derecesi ile bu şekilde kabul edilebilecek değişkenler) arasındaki istatistiksel bir ilişkidir. Aynı zamanda, birinin değerlerindeki değişiklikler veya ... ... Wikipedia

    korelasyon- (Korelasyon) Korelasyon, iki veya daha fazla rastgele değişkenin istatistiksel bir ilişkisidir Korelasyon kavramı, korelasyon türleri, korelasyon katsayısı, korelasyon analizi, fiyat korelasyonu, Forex'teki döviz çiftlerinin korelasyonu İçerikler ... ... yatırımcının ansiklopedisi

    S. m.'nin başlangıcı olduğu genel olarak kabul edilir. ya da sık sık denildiği gibi, "küçük n" istatistikleri, 20. yüzyılın ilk on yılında, W. Gosset'in, dünya dağılımına göre varsayılan t dağılımını yerleştirdiği çalışmasının yayınlanmasıyla kuruldu. biraz sonra ... ... Psikolojik Ansiklopedi

    Maurice Kendall Sir Maurice George Kendall Doğum tarihi: 6 Eylül 1907 (1907 09 06) Doğum yeri: Kettering, Birleşik Krallık Ölüm tarihi ... Wikipedia

    Tahmin etmek- (Tahmin) Tahminin tanımı, tahminin görevleri ve ilkeleri Tahminin tanımı, tahminin görevleri ve ilkeleri, tahmin yöntemleri İçindekiler İçindekiler Tanım Tahminin temel kavramları Tahminin görevleri ve ilkeleri ... ... yatırımcının ansiklopedisi