Korelační koeficienty Spearmanovy, Kendallovy hodnosti, Fechnerův koeficient. Kendall a Spearman hodnostní korelační koeficienty Spearman a spearman hodnostní korelační koeficienty

Používá se k identifikaci vztahu mezi kvantitativními nebo kvalitativními ukazateli, pokud je lze seřadit. Hodnoty indikátoru X jsou nastaveny ve vzestupném pořadí a přiřazeny pořadí. Hodnoty indikátoru Y jsou seřazeny a je vypočítán Kendallův korelační koeficient:

kde S = PQ.

P velký hodnota pořadí Y.

Q- celkový počet pozorování po aktuálních pozorováních s menší hodnota pořadí Y. (stejné pozice se nepočítají!)

Pokud se studovaná data opakují (mají stejné pořadí), pak se ve výpočtech použije Kendallův korigovaný korelační koeficient:

t- počet souvisejících pozic v řádku X a Y.

19.Co by mělo být výchozím bodem při definování tématu, objektu, předmětu, cíle, cílů a hypotézy výzkumu?

Výzkumný program má zpravidla dvě části: metodickou a procedurální. První zahrnuje zdůvodnění relevance tématu, formulaci problému, vymezení objektu a předmětu, cílů a cílů výzkumu, formulaci základních pojmů (kategoriální aparát), předběžnou systematickou analýzu zkoumaného objektu a předložení pracovní hypotézy. Druhá část odhaluje strategický plán výzkumu a také plán a základní postupy pro sběr a analýzu primárních dat.

V první řadě je třeba při výběru výzkumného tématu vycházet z relevance. Odůvodnění relevance zahrnuje uvedení potřeby a aktuálnosti studia a řešení problému pro další rozvoj teorie a praxe vyučování a výchovy. Aktuální výzkumy dávají odpověď na nejpalčivější otázky současnosti, reflektují společenské uspořádání společnosti až po pedagogickou vědu a odhalují nejdůležitější rozpory, které se v praxi odehrávají. Kritérium relevance je dynamické, mobilní, závisí na čase, s přihlédnutím ke konkrétním a specifickým okolnostem. Relevance ve své nejobecnější podobě charakterizuje míru nesrovnalosti mezi poptávkou po vědeckých nápadech a praktických doporučeních (k uspokojení konkrétní potřeby) a návrhy, které věda a praxe mohou v současné době poskytnout.

Nejpřesvědčivějším základem vymezujícím téma výzkumu je společenský řád, reflektující nejakutnější, společensky významné problémy, které vyžadují naléhavá řešení. Společenská objednávka vyžaduje zdůvodnění konkrétního tématu. Obvykle se jedná o analýzu stupně rozpracování otázky ve vědě.

Pokud z rozboru pedagogické praxe vyplývá společenská objednávka, pak sama sebe vědecký problém je v jiné rovině. Vyjadřuje hlavní rozpor, který je třeba řešit pomocí vědy. Řešením problému je obvykle účel studia. Cílem je přeformulovaný problém.

Formulace problému obnáší výběr objektu výzkum. Může to být pedagogický proces, oblast pedagogické reality nebo nějaký druh pedagogického postoje, který obsahuje rozpor. Jinými slovy, objekt může být cokoli, co explicitně nebo implicitně obsahuje rozpor a vytváří problémovou situaci. Objekt je to, k čemu směřuje proces poznání. Předmět studia -část, strana objektu. Jedná se o nejvýznamnější z praktického nebo teoretického hlediska, vlastnosti, aspekty, znaky předmětu, které jsou předmětem přímého studia.

V souladu s účelem, předmětem a předmětem zkoumání výzkum úkoly, které jsou zpravidla zaměřeny na kontrolu hypotézy. Ten je souborem teoreticky podložených předpokladů, jejichž pravdivost podléhá ověření.

Kritérium vědecká novinka lze použít k posouzení kvality ukončeného studia. Charakterizuje nové teoretické a praktické závěry, zákonitosti vzdělávání, jeho strukturu a mechanismy, obsah, principy a technologie, které v této době nebyly známy a nebyly zaznamenány v pedagogické literatuře. Novost výzkumu může mít teoretický i praktický význam. Teoretická hodnota výzkumu spočívá ve vytvoření konceptu, získání hypotézy, zákonitosti, metody, modelu pro identifikaci problému, tendence, směru. Praktický význam výzkumu spočívá v přípravě návrhů, doporučení atp. Kritéria novosti, teoretického a praktického významu se mění v závislosti na typu výzkumu, závisí také na době získávání nových poznatků.

Pořadový korelační koeficient charakterizuje obecnou povahu nelineární závislosti: zvýšení nebo snížení efektivního znaku se zvýšením faktoru jedna. To je indikátor těsnosti monotónního nelineárního vztahu.

Účel služby... Tato online kalkulačka počítá Kendallův koeficient pořadové korelace podle všech základních vzorců, jakož i posouzení jeho významu.

Návod. Uveďte množství dat (počet řádků). Výsledné řešení se uloží do souboru aplikace Word.

Koeficient navržený Kendallem je postaven na základě vztahů typu „více-méně“, jejichž platnost byla stanovena při konstrukci škál.
Vyberme několik objektů a porovnejme jejich pořadí v jednom atributu a v jiném. Pokud podle tohoto kritéria tvoří pořadí přímé pořadí (tj. pořadí přirozené řady), pak je páru přiřazeno +1, pokud je to naopak, pak –1. Pro vybraný pár se vynásobí odpovídající jednotky plus - mínus (atributem X a atributem Y). Výsledek je zjevně +1; pokud jsou řádky dvojice obou prvků umístěny ve stejném pořadí, a –1, pokud jsou obrácené.
Pokud jsou pořadí hodností pro všechny dvojice podle obou kritérií stejné, pak součet jednotek přiřazených všem dvojicím objektů je maximální a rovná se počtu dvojic. Pokud jsou pořadí všech párů obrácená, pak –C 2 N. V obecném případě C 2 N = P + Q, kde P je počet kladných a Q je počet záporných přiřazených párům při porovnání jejich pořadí pro obě kritéria.
Veličina se nazývá Kendallův koeficient.
Ze vzorce je vidět, že koeficient τ je rozdíl mezi podílem dvojic objektů, ve kterých je pořadí v obou kritériích stejné (ve vztahu k počtu všech dvojic), a podílem dvojic objektů, ve kterých pořadí není stejné.
Například hodnota koeficientu 0,60 znamená, že 80 % párů má stejné pořadí objektů, zatímco 20 % nikoli (80 % + 20 % = 100 %; 0,80 - 0,20 = 0,60). Tito. τ lze interpretovat jako rozdíl mezi pravděpodobnostmi koincidence a nekoincidence řádů v obou znacích pro náhodně vybranou dvojici objektů.
V obecném případě se výpočet τ (přesněji P nebo Q) i pro N v řádu 10 ukazuje jako těžkopádný.
Pojďme si ukázat, jak zjednodušit výpočty.


Příklad. Vztah mezi objemem průmyslové výroby a investicemi do dlouhodobého majetku v 10 regionech jednoho z federálních okresů Ruské federace v roce 2003 charakterizují následující údaje:


Vypočítejte Spearmanovy a Kendalovy hodnostní korelační koeficienty. Zkontrolujte jejich významnost při α = 0,05. Formulujte závěr o vztahu mezi objemem průmyslové výroby a investicemi do stálých aktiv v uvažovaných regionech Ruské federace.

Řešení... Přiřaďme hodnosti atributu Y a faktoru X.


Seřaďme data podle X.
V řádku Y napravo od 3 je 7 řádků přesahujících 3, proto 3 vygeneruje výraz 7 v P.
Napravo od 1 je 8 řad přesahujících 1 (jedná se o 2, 4, 6, 9, 5, 10, 7, 8), tzn. 8 zadá P a tak dále. Výsledkem je, že Р = 37 a pomocí vzorců, které máme:

XYpořadí X, d xhodnost Y, d yPQ
18.4 5.57 1 3 7 2
20.6 2.88 2 1 8 0
21.5 4.12 3 2 7 0
35.7 7.24 4 4 6 0
37.1 9.67 5 6 4 1
39.8 10.48 6 9 1 3
51.1 8.58 7 5 3 0
54.4 14.79 8 10 0 2
64.6 10.22 9 7 1 0
90.6 10.45 10 8 0 0
37 8


Podle zjednodušených vzorců:




kde n je velikost vzorku; z kp je kritický bod bilaterální kritické oblasti, který se zjistí z tabulky Laplaceovy funkce pomocí rovnosti Ф (z kp) = (1-α) / 2.
Pokud | τ |< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - nulová hypotéza je zamítnuta. Mezi kvalitativními znaky existuje významná korelace pořadí.
Najděte kritický bod z kp
Ф (z kp) = (1-α) / 2 = (1 - 0,05) / 2 = 0,475

Pojďme najít kritický bod:

Protože τ> T kp - zamítáme nulovou hypotézu; korelace pořadí mezi skóre ve dvou testech je významná.

Příklad. Na základě údajů o objemu stavebních a montážních prací provedených vlastními silami a počtu zaměstnanců v 10 stavebních firmách v jednom z měst Ruské federace určete vztah mezi těmito znaky pomocí Kendalova koeficientu.

Řešení najít pomocí kalkulačky.
Přiřaďme hodnosti atributu Y a faktoru X.
Uspořádejme objekty tak, aby jejich X řady představovaly přirozenou řadu. Protože odhady přiřazené každému páru této série jsou kladné, hodnoty „+1“ zahrnuté v P budou generovány pouze těmi páry, jejichž pořadí v Y tvoří přímé pořadí.
Lze je snadno vypočítat postupným porovnáváním pořadí každého objektu v řadě Y s ocelovými.
Kendallův koeficient.

V obecném případě se výpočet τ (přesněji P nebo Q) i pro N v řádu 10 ukazuje jako těžkopádný. Pojďme si ukázat, jak zjednodušit výpočty.

nebo

Řešení.
Seřaďme data podle X.
V řádku Y napravo od 2 je 8 řádků přesahujících 2, proto 2 vygeneruje výraz 8 v P.
Napravo od 4 je 6 řad přesahujících 4 (jedná se o 7, 5, 6, 8, 9, 10), tzn. 6 zadá P a tak dále. Výsledkem je, že P = 29 a pomocí vzorců máme:

XYpořadí X, d xhodnost Y, d yPQ
38 292 1 2 8 1
50 302 2 4 6 2
52 366 3 7 3 4
54 312 4 5 4 2
59 359 5 6 3 2
61 398 6 8 2 2
66 401 7 9 1 2
70 298 8 3 1 1
71 283 9 1 1 0
73 413 10 10 0 0
29 16


Podle zjednodušených vzorců:


Abychom mohli otestovat nulovou hypotézu o rovnosti Kendallova obecného koeficientu pořadové korelace k nule na hladině významnosti α s konkurenční hypotézou H 1: τ ≠ 0, je nutné vypočítat kritický bod:

kde n je velikost vzorku; z kp je kritický bod oboustranné kritické oblasti, který se zjistí z tabulky Laplaceovy funkce pomocí rovnosti Ф (z kp) = (1 - α) / 2.
Pokud | τ | T kp - nulová hypotéza je zamítnuta. Mezi kvalitativními znaky existuje významná korelace pořadí.
Najděte kritický bod z kp
Ф (z kp) = (1 - α) / 2 = (1 - 0,05) / 2 = 0,475
Pomocí Laplaceovy tabulky zjistíme z kp = 1,96
Pojďme najít kritický bod:

Protože τ

Potřeby hospodářské a společenské praxe vyžadují vývoj metod kvantitativního popisu procesů, které umožňují přesnou evidenci nejen kvantitativních, ale i kvalitativních faktorů. Za předpokladu, že hodnoty kvalitativních charakteristik lze seřadit, případně seřadit podle míry poklesu (zvýšení) charakteristiky, lze posoudit blízkost vztahu mezi kvalitativními charakteristikami. Kvalitativní znamená vlastnost, kterou nelze přesně změřit, ale umožňuje porovnávat objekty mezi sebou, a proto je seřadit v sestupném nebo rostoucím pořadí kvality. A skutečným obsahem měření v hodnostních škálách je pořadí, ve kterém jsou objekty uspořádány podle závažnosti měřeného znaku.

Pro praktické účely je velmi užitečné použití hodnostní korelace. Je-li například mezi dvěma kvalitativními vlastnostmi produktů stanovena vysoká korelace pořadí, pak stačí produkty řídit pouze podle jedné z vlastností, čímž je kontrola levnější a rychlejší.

Jako příklad lze uvažovat existenci souvislosti mezi dostupností komerčních produktů řady podniků a režijními náklady na prodej. V průběhu 10 pozorování byla získána následující tabulka:

Uspořádejme hodnoty X ve vzestupném pořadí, přičemž každé hodnotě přiřadíme své pořadové číslo (hodnost) každé hodnotě:

Tím pádem,

Sestavme si následující tabulku, kde jsou zapsány dvojice X a Y, získané jako výsledek pozorování s jejich hodnostmi:

Označením rozdílu v pořadí jako napíšeme vzorec pro výpočet Spearmanova výběrového korelačního koeficientu:

kde n je počet pozorování, je to také počet dvojic pozic.

Spearmanův koeficient má následující vlastnosti:

Pokud existuje úplný přímý vztah mezi kvalitativními znaky X a Y v tom smyslu, že se pořadí objektů shodují pro všechny hodnoty i, pak Spearmanův korelační koeficient vzorku je 1. Ve skutečnosti, dosadíme-li jej do vzorce, dostaneme 1.

Pokud existuje úplný inverzní vztah mezi kvalitativními znaky X a Y v tom smyslu, že pořadí odpovídá pořadí, pak Spearmanův výběrový korelační koeficient je -1.

Opravdu, kdyby

Dosazením hodnoty do vzorce Spearmanův korelační koeficient dostaneme -1.

Pokud neexistuje ani úplná přímá, ani úplná zpětná vazba mezi kvalitativními znaky, pak Spearmanův výběrový korelační koeficient je mezi -1 a 1 a čím blíže k 0, tím menší je souvislost mezi znaky.

Podle výše uvedeného příkladu najdeme hodnotu P, za tímto účelem doplníme tabulku o hodnoty a:

Kendallův výběrový korelační koeficient. Vztah mezi dvěma kvalitativními charakteristikami můžete posoudit pomocí Kendallova koeficientu korelace pořadí.

Nechť jsou řady objektů vzorku velikosti n stejné:

na základě X:

na základě Y:. Předpokládejme, že vpravo jsou řady, velké, vpravo jsou řady, velké, vpravo jsou řady, velké. Zaveďme zápis pro součet hodností

Podobně zavedeme zápis jako součet počtu hodností ležících vpravo, ale méně.

Kendallův výběrový korelační koeficient je zapsán vzorcem:

Kde n je velikost vzorku.

Kendallův koeficient má stejné vlastnosti jako Spearmanův koeficient:

Pokud existuje úplný přímý vztah mezi kvalitativními znaky X a Y v tom smyslu, že se pořadí objektů shodují pro všechny hodnoty i, pak Kendallův korelační koeficient vzorku je 1. Ve skutečnosti je vpravo n-1 řady větší, tedy stejným způsobem stanovíme, co. Pak. A Kendallův koeficient je:.

Pokud existuje úplný inverzní vztah mezi kvalitativními znaky X a Y v tom smyslu, že pořadí odpovídá pořadí, pak Kendallův výběrový korelační koeficient je -1. Napravo nejsou žádné řady, tedy velké. Rovněž. Dosazením hodnoty R + = 0 do vzorce Kendallova koeficientu dostaneme -1.

S dostatečně velkou velikostí vzorku a s hodnotami korelačních koeficientů blízkých 1 dochází k přibližné rovnosti:

Poskytuje Kendallův koeficient konzervativnější odhad korelace než Spearmanův koeficient? (číselná hodnota? je vždy menší než). Při výpočtu koeficientu? méně pracné než výpočet koeficientu, ten se snáze přepočítá, pokud se do řady přidá nový člen.

Důležitou výhodou koeficientu je, že jej lze použít ke stanovení koeficientu dílčí hodnostní korelace, což umožňuje posoudit míru „čisté“ provázanosti dvou hodnostních znaků, čímž se eliminuje vliv třetího:

Význam koeficientů pořadové korelace. Při určování síly hodnostní korelace na základě výběrových dat je nutné zvážit následující otázku: s jakou mírou spolehlivosti se lze spolehnout na závěr, že existuje korelace v obecné populaci, pokud je určitý výběrový koeficient hodnostní korelace získané. Jinými slovy, významnost pozorovaných korelací pořadí by měla být kontrolována na základě hypotézy, že dvě uvažovaná hodnocení jsou statisticky nezávislá.

Při relativně velké velikosti vzorku n lze významnost koeficientů pořadové korelace zkontrolovat pomocí tabulky normálního rozdělení (Příloha Tabulka 1). Testovat význam Spearmanova koeficientu? (pro n> 20) vypočítat hodnotu

a otestovat význam Kendallova koeficientu? (pro n> 10) vypočítat hodnotu

kde S = R + - R-, n je velikost vzorku.

Dále se nastaví hladina významnosti, kritická hodnota tcr (?, K) se určí z tabulky kritických bodů Studentova rozdělení a vypočtená hodnota nebo se s ní porovná. Předpokládá se, že počet stupňů volnosti je k = n-2. Pokud nebo> tcr, pak jsou hodnoty nebo považovány za významné.

Fechnerův korelační koeficient.

Na závěr je třeba zmínit Fechnerův koeficient, který charakterizuje elementární stupeň těsnosti spojení, který je vhodné použít pro zjištění faktu spojení při malém množství výchozích informací. Základem pro jeho výpočet je zohlednění směru odchylek od aritmetického průměru variant každé variační řady a stanovení konzistence znamének těchto odchylek pro dvě řady, mezi nimiž se měří vztah.

Tento koeficient je určen vzorcem:

kde na je počet shod znamének odchylek jednotlivých hodnot od jejich aritmetického průměru; nb - respektive počet neshod.

Fechnerův koeficient se může pohybovat mezi -1,0<= Кф<= +1,0.

Aplikované aspekty hodnostní korelace. Jak již bylo uvedeno, koeficienty hodnostní korelace lze použít nejen pro kvalitativní analýzu vztahu mezi dvěma hodnostními rysy, ale také pro stanovení síly vztahu mezi hodnostními a kvantitativními rysy. V tomto případě jsou hodnoty kvantitativní charakteristiky seřazeny a jsou jim přiřazeny odpovídající úrovně.

Existuje řada situací, kdy je při určování síly vztahu mezi dvěma kvantitativními znaky také vhodné vypočítat koeficienty pořadové korelace. Takže při výrazné odchylce rozdělení jednoho z nich (nebo obou) od normálního rozdělení se stanovení hladiny významnosti výběrového korelačního koeficientu r stává nesprávným, zatímco pořadové koeficienty? a? nepodléhají takovým omezením při stanovení hladiny významnosti.

Jiná situace tohoto druhu nastává, když je vztah mezi dvěma kvantitativními znaky nelineární (ale monotónní). Pokud je počet objektů ve vzorku malý nebo pokud je pro výzkumníka důležité znaménko souvislosti, pak použití korelačního poměru? zde může být nedostatečné. Výpočet koeficientu hodnostní korelace umožňuje obejít naznačené obtíže.

Praktická část

Úkol 1. Korelační-regresní analýza

Vyjádření a formalizace problému:

Je uveden empirický vzorek sestavený na základě řady pozorování stavu zařízení (na poruchu) a počtu vyrobených výrobků. Vzorek implicitně charakterizuje vztah mezi množstvím zařízení, které selhalo, a počtem vyrobených položek. Podle významu vzorku je zřejmé, že vyrobené výrobky jsou vyráběny na zařízení, které zůstává v provozu, protože čím více % zařízení selhalo, tím méně vyrobených výrobků. Je nutné provést studii vzorku na korelační-regresní závislost, to znamená stanovit formu závislosti, vyhodnotit regresní funkci (regresní analýza), stejně jako identifikovat vztah mezi náhodnými proměnnými a posoudit její těsnost. (korelační analýza). Dalším úkolem korelační analýzy je odhadnout regresní rovnici jedné proměnné pro druhou. Kromě toho je nutné předvídat počet vyrobených produktů s 30% selháním zařízení.

Daný vzorek formalizujme v tabulce, přičemž údaj „Selhání zařízení, %“ označíme jako X, údaj „Počet výrobků“ jako Y:

Počáteční údaje. stůl 1

Podle fyzikálního významu problému lze vidět, že počet vyrobených produktů Y přímo závisí na % selhání zařízení, to znamená, že existuje závislost Y na X. Při provádění regresní analýzy je nutné najít matematický vztah (regresi) spojující hodnoty X a Y. V tomto případě regresní analýza na rozdíl od korelace předpokládá, že hodnota X působí jako nezávislá proměnná, neboli faktor, hodnota Y - jako na něm závislý nebo účinný znak. Je tedy potřeba syntetizovat adekvátní ekonomický a matematický model, tzn. určit (najít, vybrat) funkci Y = f (X), která charakterizuje vztah mezi hodnotami X a Y, pomocí které bude možné předpovědět hodnotu Y při X = 30. Tento problém lze řešeno pomocí korelační-regresní analýzy.

Stručný přehled metod řešení korelačně-regresních úloh a zdůvodnění zvolené metody řešení.

Metody regresní analýzy se dělí na jedno- a vícefaktorové na základě počtu faktorů ovlivňujících efektivní vlastnost. Univariantní - počet nezávislých faktorů = 1, tzn. Y = F (X)

multifaktoriální - počet faktorů> 1, tzn.

Podle počtu zkoumaných závislých proměnných (efektivních ukazatelů) lze regresní problémy rozdělit také na úlohy s jedním nebo více efektivními ukazateli. Obecně lze napsat úlohu s mnoha účinnými funkcemi:

Metoda korelačně-regresní analýzy spočívá ve zjištění parametrů aproximační (aproximační) závislosti tvaru

Protože se ve výše uvedeném problému objevuje pouze jedna nezávislá proměnná, tj. zkoumá se závislost pouze na jednom faktoru ovlivňujícím výsledek, měla by být aplikována studie jednosměrné závislosti neboli párové regrese.

Pokud existuje pouze jeden faktor, závislost je definována jako:

Forma zápisu konkrétní regresní rovnice závisí na volbě funkce, která zobrazuje statistický vztah mezi faktorem a efektivním ukazatelem a zahrnuje následující:

lineární regrese, rovnice tvaru,

parabolická, rovnice tvaru

kubická, rovnice tvaru

hyperbolický, rovnice tvaru

semilogaritmická, rovnice tvaru

exponenciála, rovnice tvaru

mocninný zákon, rovnice tvaru.

Hledání funkce se redukuje na stanovení parametrů regresní rovnice a posouzení spolehlivosti rovnice samotné. K určení parametrů můžete použít jak metodu nejmenších čtverců, tak metodu nejmenšího modulu.

První z nich je, že součet čtverců odchylek empirických hodnot Yi od vypočteného průměru Yi je minimální.

Metoda nejmenšího modulu spočívá v minimalizaci součtu modulů rozdílu mezi empirickými hodnotami Yi a vypočteným průměrem Yi.

K vyřešení problému zvolíme metodu nejmenších čtverců, protože je nejjednodušší a poskytuje dobré odhady z hlediska statistických vlastností.

Technologie pro řešení problému regresní analýzy metodou nejmenších čtverců.

Vyhodnocením odchylky skutečné hodnoty y od vypočtené je možné určit typ závislosti (lineární, kvadratická, kubická atd.) mezi proměnnými:

kde - empirické hodnoty, - vypočítané hodnoty aproximační funkcí. Odhadem hodnot Si pro různé funkce a výběrem nejmenší z nich vybereme aproximační funkci.

Typ funkce je určen nalezením koeficientů, které se nacházejí pro každou funkci jako řešení určitého systému rovnic:

lineární regrese, rovnice tvaru, systém -

parabolická, rovnice tvaru, soustava -

kubická, rovnice tvaru, soustava -

Po vyřešení systému najdeme, pomocí kterého dojdeme ke konkrétnímu vyjádření analytické funkce, která má, najdeme vypočítané hodnoty. Dále jsou zde všechna data pro zjištění odhadu hodnoty odchylky S a analýzu pro minimum.

Pro lineární vztah odhadujeme blízkost vztahu mezi faktorem X a efektivním ukazatelem Y ve formě korelačního koeficientu r:

Průměrná hodnota ukazatele;

Průměrná hodnota faktoru;

y je experimentální hodnota indikátoru;

x je experimentální hodnota faktoru;

Směrodatná odchylka v x;

Směrodatná odchylka v y.

Pokud je korelační koeficient r = 0, pak se má za to, že vztah mezi rysy je nevýznamný nebo chybí, jestliže r = 1, pak je mezi rysy velmi vysoký funkční vztah.

Pomocí tabulky Chaddock můžete kvalitativně posoudit těsnost korelace mezi znaky:

Chaddock stůl Tabulka 2.

Pro nelineární závislost se určí korelační poměr (0 1) a korelační index R, které se vypočítají z následujících závislostí.

kde hodnota je hodnota ukazatele vypočítaná regresní závislostí.

Jako odhad přesnosti výpočtu používáme hodnotu průměrné relativní aproximační chyby

S vysokou přesností leží v rozmezí 0-12%.

Pro posouzení výběru funkční závislosti používáme koeficient determinace

Koeficient determinace se používá jako "zobecněné" měřítko kvality výběru funkčního modelu, protože vyjadřuje poměr mezi faktoriálem a celkovým rozptylem, respektive podíl faktoriálového rozptylu na celku.

K posouzení významnosti korelačního indexu R se používá Fisherův F test. Skutečná hodnota kritéria je určena vzorcem:

kde m je počet parametrů regresní rovnice, n je počet pozorování. Hodnota je porovnána s kritickou hodnotou, která je stanovena podle tabulky F-kriterií, s přihlédnutím k přijaté hladině významnosti a počtu stupňů volnosti a. Pokud, pak je hodnota korelačního indexu R považována za významnou.

Pro zvolenou formu regrese jsou vypočteny koeficienty regresní rovnice. Pro usnadnění jsou výsledky výpočtu zahrnuty v tabulce následující struktury (obecně se počet sloupců a jejich vzhled mění v závislosti na typu regrese):

Tabulka 3

Řešení problému.

Byly pozorovány ekonomický jev – závislost uvolňování produktů na procentu selhání zařízení. Získá se sada hodnot.

Vybrané hodnoty jsou popsány v tabulce 1.

Sestavíme graf empirické závislosti pro daný vzorek (obr. 1)

Podle typu grafu určíme, že analytickou závislost lze reprezentovat jako lineární funkci:

Vypočítejme párový korelační koeficient pro posouzení vztahu mezi X a Y:

Vytvoříme pomocnou tabulku:

Tabulka 4

Řešíme soustavu rovnic, abychom našli koeficienty a:

z první rovnice dosazením hodnoty

do druhé rovnice dostaneme:

Shledáváme

Dostaneme tvar regresní rovnice:

9. Pro posouzení těsnosti nalezeného vztahu použijeme korelační koeficient r:

Podle Chaddockovy tabulky zjistíme, že pro r = 0,90 je vztah mezi X a Y velmi vysoký, a proto je také vysoká spolehlivost regresní rovnice. Pro odhad přesnosti výpočtů používáme hodnotu průměrné relativní chyby aproximace:

Věříme, že hodnota poskytuje vysoký stupeň spolehlivosti regresní rovnice.

Pro lineární vztah mezi X a Y je index determinace roven druhé mocnině korelačního koeficientu r:. V důsledku toho je 81 % celkové odchylky vysvětleno změnou faktoru X.

Pro posouzení významnosti korelačního indexu R, který se v případě lineárního vztahu rovná v absolutní hodnotě korelačnímu koeficientu r, je použit Fisherův F-test. Skutečnou hodnotu určíme pomocí vzorce:

kde m je počet parametrů regresní rovnice, n je počet pozorování. To znamená, že n = 5, m = 2.

Vezmeme-li v úvahu přijatou hladinu významnosti = 0,05 a počet stupňů volnosti, získáme kritickou tabulkovou hodnotu. Protože je hodnota korelačního indexu R považována za významnou.

Vypočítejme předpovězenou hodnotu Y při X = 30:

Sestavme graf nalezené funkce:

11. Určete chybu korelačního koeficientu hodnotou směrodatné odchylky

a poté určíme hodnotu normalizované odchylky

Z poměru> 2 s pravděpodobností 95 % lze hovořit o významnosti získaného korelačního koeficientu.

Úloha 2. Lineární optimalizace

Možnost 1.

Plán rozvoje regionu má zprovoznit 3 ropná pole o celkovém objemu těžby 9 milionů tun. Na prvním poli je objem výroby nejméně 1 milion tun, na druhém - 3 miliony tun, na třetím - 5 milionů tun. K dosažení této produktivity je nutné vyvrtat minimálně 125 vrtů. Na realizaci tohoto plánu bylo přiděleno 25 milionů rublů. kapitálové investice (ukazatel K) a 80 km potrubí (ukazatel L).

Je nutné stanovit optimální (maximální) počet vrtů, aby byla zajištěna plánovaná produktivita každého pole. Počáteční údaje o úloze jsou uvedeny v tabulce.

Počáteční údaje

Prohlášení o problému je uvedeno výše.

Pojďme formalizovat podmínky a omezení specifikované v problému. Cílem řešení tohoto optimalizačního problému je najít maximální hodnotu těžby ropy s optimálním počtem vrtů pro každé pole, s přihlédnutím ke stávajícím omezením problému.

Cílová funkce v souladu s požadavky úkolu bude mít podobu:

kde je počet jamek pro každé pole.

Stávající omezení úkolu pro:

délka pokládky potrubí:

počet vrtů v každém poli:

náklady na stavbu 1 studny:

Problémy lineární optimalizace se řeší například následujícími metodami:

Graficky

Simplexní metoda

Použití grafické metody je vhodné pouze při řešení lineárních optimalizačních úloh se dvěma proměnnými. Při větším počtu proměnných je nutné použití algebraického aparátu. Zvažte obecnou metodu pro řešení lineárních optimalizačních problémů nazývanou simplexní metoda.

Simplexová metoda je typickým příkladem iterativních výpočtů používaných k řešení většiny optimalizačních problémů. Uvažují se o iteračních postupech tohoto druhu, které zajišťují řešení problémů pomocí modelů operačního výzkumu.

Pro řešení optimalizační úlohy simplexovou metodou je nutné, aby počet neznámých Xi byl větší než počet rovnic, tzn. soustava rovnic

splňuje vztah m

A = se rovnalo m.

Označme sloupec matice A jako a sloupec volných členů jako

Základní řešení soustavy (1) je množina m neznámých, které jsou řešením soustavy (1).

Stručně, algoritmus simplexové metody je popsán takto:

Původní omezení zapsané jako nerovnost<= (=>) lze reprezentovat jako rovnost přidáním zbytkové proměnné k levé straně omezení (odečtením redundantní proměnné od levé strany).

Například nalevo od původního omezení

je zavedena zbytková proměnná, v důsledku čehož se původní nerovnost změní v rovnost

Pokud původní omezení určuje průtok potrubím, pak by proměnná měla být interpretována jako zbytek nebo nevyužitá část tohoto zdroje.

Maximalizace účelové funkce je ekvivalentní minimalizaci stejné funkce s opačným znaménkem. Tedy v našem případě

ekvivalentní

Pro základní řešení je sestavena simplexní tabulka v následujícím tvaru:

V této tabulce je naznačeno, že po vyřešení problému v těchto buňkách dojde k základnímu řešení. - podíly z dělení sloupce jedním ze sloupců; - další násobiče pro nulování hodnot v buňkách tabulky souvisejících s rozlišovacím sloupcem. - minimální hodnota účelové funkce -Z, - hodnoty koeficientů v účelové funkci s neznámými.

Mezi významy lze nalézt jakoukoli kladnou hodnotu. Pokud tomu tak není, je problém považován za vyřešený. Vybere se libovolný sloupec tabulky, který se v ní nachází, tento sloupec se nazývá „povolující“ sloupec. Pokud mezi prvky rozlišovacího sloupce nejsou kladná čísla, pak je problém neřešitelný kvůli neohraničenosti účelové funkce na množině jejích řešení. Pokud jsou ve sloupci pro rozlišení přítomna kladná čísla, přejděte ke kroku 5.

Sloupec je vyplněn zlomky, v jejichž čitateli jsou prvky sloupce a ve jmenovateli - odpovídající prvky rozlišovacího sloupce. Je vybrána nejmenší ze všech hodnot. Řádek s nejmenším výsledkem se nazývá řádek „povolit“. Na průsečíku rozlišovací čáry a rozlišovacího sloupce je nalezen rozlišovací prvek, který je nějakým způsobem zvýrazněn např. barvou.

Na základě první simplexní tabulky je sestaven následující, ve kterém:

Nahradí řádkový vektor sloupcovým vektorem

permisivní linie je nahrazena stejnou linií rozdělenou permisivním prvkem

každý z ostatních řádků tabulky je nahrazen součtem tohoto řádku s rozlišovacím, vynásobeným speciálně vybraným dodatečným faktorem, aby se v buňce rozlišovacího sloupce získala 0.

S novou tabulkou se vrátíme k bodu 4.

Řešení problému.

Na základě formulace problému máme následující systém nerovností:

a objektivní funkce

Systém nerovnic transformujeme na systém rovnic zavedením dalších proměnných:

Redukujme účelovou funkci na její ekvivalent:

Pojďme sestavit původní simplexní tabulku:

Zvolme permisivní sloupec. Vypočítejme sloupec:

Hodnoty zadáme do tabulky. Pro nejmenší z nich = 10 určíme rozlišovací přímku:. Na průsečíku rozlišovací čáry a rozlišovacího sloupce najdeme rozlišovací prvek = 1. Část tabulky naplníme dalšími faktory, a to tak, že: jimi vynásobený rozlišovací řádek, přičtený ke zbytku řádků tabulky, tvoří 0 v prvcích rozlišovacího sloupce.

Sestavíme druhou simplexní tabulku:

Vezmeme v něm rozlišovací sloupec, vypočítáme hodnoty, zaneseme je do tabulky. Minimálně dostaneme rozlišovací čáru. Rozlišovacím prvkem bude 1. Najděte další faktory, vyplňte sloupce.

Vytvoříme následující simplexní tabulku:

Podobně najdeme rozlišovací sloupec, rozlišovací řádek a rozlišovací prvek = 2. Sestavíme následující simplexní tabulku:

Protože v řádku -Z nejsou žádné kladné hodnoty, je tato tabulka konečná. První sloupec udává požadované hodnoty neznámých, tj. optimální základní řešení:

V tomto případě je hodnota účelové funkce -Z = -8000, což je ekvivalentní Zmax = 8000. Problém je vyřešen.

Úkol 3. Shluková analýza

Formulace problému:

Rozdělte objekty na základě údajů uvedených v tabulce. Výběr metody řešení je třeba provést nezávisle, vytvořit graf závislosti dat.

Možnost 1.

Počáteční údaje

Přehled metod řešení tohoto typu problémů. Zdůvodnění způsobu řešení.

Úlohy shlukové analýzy se řeší pomocí následujících metod:

Pro vytvoření shluků "nepodobnosti" nebo "vzdálenosti mezi objekty" se používá metoda sjednocení nebo stromového shlukování. Tyto vzdálenosti lze definovat v jednorozměrném nebo vícerozměrném prostoru.

Obousměrné kombinování se používá (relativně zřídka) za okolností, kdy data nejsou interpretována z hlediska „objektů“ a „vlastností objektů“, ale z hlediska pozorování a proměnných. Od pozorování a proměnných se očekává, že přispějí k detekci smysluplných shluků současně.

Metoda K-means. Používá se, když již existuje hypotéza týkající se počtu shluků. Systému můžete říci, aby vytvořil přesně například tři shluky tak, aby byly co nejvíce odlišné. Obecně platí, že metoda K-means staví přesně K různých shluků umístěných v největších možných vzdálenostech od sebe.

Existují následující způsoby měření vzdáleností:

Euklidovská vzdálenost. Toto je nejběžnější typ vzdálenosti. Je to jednoduše geometrická vzdálenost ve vícerozměrném prostoru a počítá se takto:

Všimněte si, že euklidovská vzdálenost (a její druhá mocnina) se počítá z původních, nikoli standardizovaných dat.

Vzdálenost městských bloků (vzdálenost Manhattan). Tato vzdálenost je jednoduše průměrem souřadnicových rozdílů. Ve většině případů vede tato míra vzdálenosti ke stejným výsledkům jako pro běžnou euklidovskou vzdálenost. Všimněte si však, že u tohoto měření se vliv jednotlivých velkých rozdílů (odlehlých hodnot) snižuje (protože nejsou umocněny). Vzdálenost na Manhattanu se vypočítá podle vzorce:

Čebyševova vzdálenost. Tato vzdálenost může být užitečná, když chcete definovat dva objekty jako "odlišné", pokud se liší v jakékoli jedné souřadnici (jakémkoli jednom rozměru). Čebyševova vzdálenost se vypočítá podle vzorce:

Výkonová vzdálenost. Někdy se chce postupně zvyšovat nebo snižovat hmotnost vztahující se k rozměru, pro který jsou odpovídající předměty velmi odlišné. Toho lze dosáhnout pomocí mocninné vzdálenosti. Mocninná vzdálenost se vypočítá podle vzorce:

kde r a p jsou uživatelem definované parametry. Několik příkladů výpočtů může ukázat, jak toto opatření „funguje“. Parametr p zodpovídá za postupné vážení rozdílů v jednotlivých souřadnicích, parametr r za postupné vážení velkých vzdáleností mezi objekty. Pokud jsou oba parametry - r a p, rovny dvěma, pak se tato vzdálenost shoduje s euklidovskou vzdáleností.

Procento nesouhlasu. Tato míra se používá, když jsou data kategorická. Tato vzdálenost se vypočítá podle vzorce:

Pro řešení problému zvolíme metodu sjednocení (stromové shlukování), která nejlépe vyhovuje podmínkám a formulaci problému (rozdělení objektů). Metoda sjednocení může zase používat několik variant komunikačních pravidel:

Jediný odkaz (metoda nejbližšího souseda). V této metodě je vzdálenost mezi dvěma shluky určena vzdáleností mezi dvěma nejbližšími objekty (nejbližšími sousedy) v různých shlucích. To znamená, že jakékoli dva objekty ve dvou shlucích jsou k sobě blíže, než je odpovídající vzdálenost spojení. Toto pravidlo by mělo v jistém smyslu spojovat objekty dohromady a vytvářet shluky a výsledné shluky bývají dlouhé „řetězce“.

Plná komunikace (metoda nejvzdálenějších sousedů). V této metodě je vzdálenost mezi shluky určena největší vzdáleností mezi libovolnými dvěma prvky v různých shlucích (tj. „nejvzdálenějšími sousedy“).

Existuje také mnoho dalších podobných metod shlukování (např. nevážené párování, vážené párování atd.).

Technologie metody řešení. Výpočet ukazatelů.

V prvním kroku, kdy je každý objekt samostatným shlukem, jsou vzdálenosti mezi těmito objekty určeny vybranou mírou.

Protože úloha nespecifikuje měrné jednotky pro charakteristiky, předpokládá se, že jsou stejné. Počáteční data tedy není potřeba normalizovat, takže rovnou přistoupíme k výpočtu matice vzdálenosti.

Řešení problému.

Sestavme graf závislosti podle výchozích dat (obr. 2)

Vezmeme obvyklou euklidovskou vzdálenost jako vzdálenost mezi objekty. Pak podle vzorce:

kde l - znaky; k je počet prvků, vzdálenost mezi objekty 1 a 2 je rovna:

Pokračujeme ve výpočtu zbývajících vzdáleností:

Ze získaných hodnot sestavíme tabulku:

Nejmenší vzdálenost. To znamená, že spojíme prvky 3, 6 a 5 do jednoho shluku. Dostaneme následující tabulku:

Nejmenší vzdálenost. Do jednoho shluku jsou sloučeny prvky 3, 6, 5 a 4. Získáme tabulku dvou shluků:

Minimální vzdálenost mezi položkami 3 a 6 je. To znamená, že prvky 3 a 6 jsou spojeny do jednoho shluku. Volíme maximální vzdálenost mezi nově vytvořeným shlukem a zbytkem prvků. Například vzdálenost mezi shlukem 1 a shlukem 3,6 je max (13,34166, 13,60147) = 13,34166. Sestavme si následující tabulku:

V něm je minimální vzdálenost vzdálenost mezi shluky 1 a 2. Spojením 1 a 2 do jednoho shluku dostaneme:

Pomocí metody „dalekého souseda“ byly získány dva shluky: 1,2 a 3,4,5,6, jejichž vzdálenost je 13,60147.

Problém byl vyřešen.

Aplikace. Řešení problémů pomocí softwarových balíků (MS Excel 7.0)

Problém korelační a regresní analýzy.

Do tabulky zadáme výchozí údaje (obr. 1)

Vyberte nabídku „Servis / Analýza dat“. V okně, které se objeví, vyberte řádek "Regrese" (obr. 2).

Nastavíme v dalším okně vstupní intervaly pro X a Y, úroveň spolehlivosti bude 95 % a výstupní data se umístí na samostatný list „Report Sheet“ (obr. 3).

Po provedení výpočtu získáme konečná data regresní analýzy na listu "Report Sheet":

Zobrazuje také bodový graf aproximační funkce nebo "Výběrový graf":


Vypočítané hodnoty a odchylky jsou zobrazeny v tabulce ve sloupcích „Předpokládané Y“ a „Zůstatky“.

Na základě počátečních dat a odchylek je vykreslen zbytkový graf:

Optimalizační úkol


Počáteční údaje zadáme takto:

Neznámé neznámé X1, X2, X3 se zadávají do buněk C9, D9, E9, resp.

Koeficienty účelové funkce pro X1, X2, X3 se zadávají do C7, D7, E7.

Zadejte účelovou funkci do buňky B11 jako vzorec: = C7 * C9 + D7 * D9 + E7 * E9.

Stávající omezení úkolů

Pro délku pokládky potrubí:

přidáme do buněk C5, D5, E5, F5, G5

Počet jamek v každém poli:

X3 Ј 100; přidáme do buněk C8, D8, E8.

Cena výstavby 1 studny:

přidáme do buněk C6, D6, E6, F6, G6.

Vzorec pro výpočet celkové délky C5 * C9 + D5 * D9 + E5 * E9 se umístí do buňky B5, vzorec pro výpočet celkových nákladů C6 * C9 + D6 * D9 + E6 * E9 se umístí do buňky B6.


Vybereme v menu "Servis / Hledat řešení", zadáme parametry pro nalezení řešení v souladu s výchozími údaji (obr. 4):

Pomocí tlačítka "Parametry" nastavte následující parametry pro nalezení řešení (obr. 5):


Po vyhledání řešení dostaneme zprávu o výsledcích:

Zpráva o výsledcích aplikace Microsoft Excel 8.0e

Zpráva Vytvořeno: 17.11.2002 1:28:30

Cílová buňka (maximální)

Výsledek

Celková kořist

Modifikovatelné buňky

Výsledek

Počet studní

Počet studní

Počet studní

Omezení

Význam

Délka

Příbuzný

Náklady na projekt

nesouvisející.

Počet studní

nesouvisející.

Počet studní

Příbuzný

Počet studní

Příbuzný

V první tabulce je uvedena počáteční a konečná (optimální) hodnota cílové buňky, kam byla umístěna účelová funkce řešeného problému. Ve druhé tabulce vidíme počáteční a konečné hodnoty proměnných k optimalizaci, které jsou obsaženy v upravených buňkách. Třetí tabulka ve výsledkové zprávě obsahuje informace o omezeních. Sloupec "Hodnota" obsahuje optimální hodnoty požadovaných zdrojů a proměnných, které mají být optimalizovány. Sloupec "Vzorec" obsahuje limity spotřebovaných zdrojů a proměnných, které mají být optimalizovány, zapsané ve formě odkazů na buňky obsahující tato data. Sloupec "Stav" určuje, zda tato nebo ta omezení spolu souvisejí nebo nesouvisejí. Zde jsou „svázána“ omezení implementovaná v optimálním řešení ve formě rigidních rovnosti. Sloupec "Rozdíl" pro omezení zdrojů určuje zbytek použitých zdrojů, tzn. rozdíl mezi požadovaným množstvím zdrojů a jejich dostupností.

Obdobně po zapsání výsledku hledání řešení do formuláře „Zpráva o udržitelnosti“ obdržíme následující tabulky:

Zpráva o odolnosti aplikace Microsoft Excel 8.0e

Pracovní list: [Řešení optimalizační úlohy.xls] Řešení optimalizační úlohy

Zpráva Vytvořeno: 17.11.2002 1:35:16

Modifikovatelné buňky

Dovolený

Dovolený

význam

cena

Součinitel

Zvýšit

Pokles

Počet studní

Počet studní

Počet studní

Omezení

Omezení

Dovolený

Dovolený

význam

Pravá část

Zvýšit

Pokles

Délka

Náklady na projekt

Zpráva o udržitelnosti obsahuje informace o modifikovatelných (optimalizovaných) proměnných a modelových omezeních. Tyto informace jsou spojeny s simplexovou metodou používanou při optimalizaci lineárních úloh, popsanou výše z hlediska řešení úlohy. Umožňuje odhadnout, jak citlivé je získané optimální řešení na případné změny parametrů modelu.

První část zprávy obsahuje informace o upravených buňkách obsahujících hodnoty o počtu jamek v polích. Sloupec "Výsledná hodnota" označuje optimální hodnoty proměnných, které mají být optimalizovány. Sloupec "Cílový koeficient" obsahuje počáteční data hodnot koeficientů účelové funkce. Následující dva sloupce ilustrují povolené zvýšení a snížení těchto koeficientů beze změny nalezeného optimálního řešení.

Druhá část zprávy o udržitelnosti obsahuje informace o omezeních kladených na optimalizované proměnné. První sloupec ukazuje požadavky na zdroje pro optimální řešení. Druhý obsahuje hodnoty stínových cen pro typy použitých zdrojů. Poslední dva sloupce obsahují údaje o možném zvýšení nebo snížení množství dostupných zdrojů.

Problém shlukování.

Postup řešení problému krok za krokem je uveden výše. Zde jsou tabulky Excelu ilustrující postup řešení problému:

Metoda nejbližšího souseda

Řešení problému shlukové analýzy - "METODA NEJBLIŽŠÍHO SOUSE"

Počáteční údaje

kde x1 je objem produktů;

х2 - průměrné roční náklady na hlavní

Aktiva průmyslové výroby

Metoda vzdáleného souseda

Řešení problému shlukové analýzy - "METODA VZDÁLENÝCH SOUSEDŮ"

Počáteční údaje

kde x1 je objem produktů;

х2 - průměrné roční náklady na hlavní

Aktiva průmyslové výroby

Předkládání a předzpracování znaleckých posudků

V praxi se používá několik typů hodnocení:

- vysoce kvalitní (často-zřídka, horší-lepší, ano-ne),

- odhady měřítka (rozsahy hodnot 50-75, 76-90, 91-120 atd.),

Skóre z daného intervalu (od 2 do 5, 1 -10), vzájemně nezávislé,

Hodnoceno (objekty jsou seřazeny odborníkem v určitém pořadí a každému je přiděleno pořadové číslo - hodnost),

Srovnávací, získaný jednou ze srovnávacích metod

sekvenční srovnávací metoda

metoda párového porovnávání faktorů.

V dalším kroku zpracování znaleckých posudků je nutné vyhodnotit míru konzistentnosti těchto názorů.

Odhady získané od expertů lze považovat za náhodnou veličinu, jejíž rozložení odráží názory expertů na pravděpodobnost konkrétní volby události (faktoru). Proto se pro analýzu rozptylu a konzistence odborných odhadů používají zobecněné statistické charakteristiky - průměry a rozptylové míry:

střední kvadratická chyba,

Variační rozsah min - max,

- variační koeficient V = střední kvadratická odchylka / střední aritmus. (vhodné pro jakýkoli typ hodnocení)

V i = σ i / x i prům

Pro sazbu míry podobnosti ale názory každá dvojice odborníků lze použít různé metody:

asociační koeficienty, pomocí kterého se zohledňuje počet shodných a neshodných odpovědí,

koeficienty nekonzistence znalecké posudky,

Všechna tato opatření lze použít buď k porovnání názorů dvou expertů, nebo k analýze vztahu mezi sérií hodnocení ze dvou důvodů.

Koeficient korelace pořadí Spearmanových párů:

kde n je počet odborníků,

c k - rozdíl mezi odhady i-tého a j-tého experta pro všechny T faktory

Kendallův koeficient pořadové korelace (koeficient shody) poskytuje celkové hodnocení konzistence názorů všech odborníků na všechny faktory, ale pouze pro případy, kdy byly použity odhady pořadí.

Je prokázáno, že hodnota S, když všichni experti dávají stejné odhady všech faktorů, má maximální hodnotu rovnou

kde n je počet faktorů,

m je počet odborníků.

Koeficient shody se rovná poměru

navíc, pokud se W blíží 1, pak všichni experti poskytli dostatečně konzistentní odhady, jinak se jejich názory neshodují.

Vzorec pro výpočet S je uveden níže:

kde r ij jsou odhady pořadí i-tého faktoru j-tým expertem,

r cf je průměrné pořadí v celé matici odhadů a rovná se

A proto vzorec pro výpočet S může mít tvar:

Pokud se jednotlivá hodnocení jednoho odborníka shodují a při zpracování byla standardizována, použije se pro výpočet koeficientu shody jiný vzorec:



kde Tj se vypočítá pro každého odborníka (v případě, že jeho posouzení byla opakována pro různé objekty), s přihlédnutím k opakování podle následujících pravidel:

kde t j je počet skupin stejné úrovně pro j-tého odborníka a

h k - počet stejných řad v k-té skupině příbuzných řad j-tého odborníka.

PŘÍKLAD. Nechte 5 odborníků na šest faktorů odpovědět v pořadí, jak je uvedeno v tabulce 3:

Tabulka 3 - Odpovědi odborníků

Experti О1 О2 O3 О4 O5 O6 Součet hodnocení podle experta
E1
E2
E3
E4
E5

Vzhledem k tomu, že nebylo získáno přesné pořadí (hodnocení od odborníků se opakují a součty pořadí nejsou stejné), provedeme transformaci odhadů a získáme související pořadí (tabulka 4):

Tabulka 4 - Související pořadí znaleckých posudků

Experti О1 О2 O3 О4 O5 O6 Součet hodnocení podle experta
E1 2,5 2,5
E2
E3 1,5 1,5 4,5 4,5
E4 2,5 2,5 4,5 4,5
E5 5,5 5,5
Součet úrovní objektu 7,5 9,5 23,5 29,5

Nyní určíme míru shody znaleckých posudků pomocí koeficientu shody. Protože hodnosti spolu souvisí, vypočítáme W podle vzorce (**).

Pak r cf = 7 * 5/2 = 17,5

S = 10 2 +8 2 +4,5 2 +4,5 2 +6 2 +12 2 = 384,5

Pokračujme k výpočtům W. K tomu vypočítáme samostatně hodnoty T j. V příkladu jsou posudky speciálně vybrány tak, že každý expert má opakované posudky: první má dva, druhý tři, třetí má dvě skupiny po dvou hodnoceních a čtvrtý má dvě stejná hodnocení. Proto:

Ti = 2 3 - 2 = 6 T5 = 6

T2 = 3 3 - 3 = 24

Т 3 = 2 3 –2+ 2 3 –2 = 12 Т 4 = 12

Vidíme, že shoda názorů odborníků je poměrně vysoká a můžeme přistoupit k další fázi studie - zdůvodnění a přijetí alternativy rozhodnutí doporučené odborníky.

V opačném případě se musíte vrátit ke krokům 4-8.

KENDALLA KORELAČNÍ KORELAČNÍ KOEFICIENT

Jedno z výběrových měření závislosti dvou náhodných veličin (znaků) X a Y, na základě pořadí položek vzorku (X 1, Y x), .. ., (X n, Y n). K. až R. k. odkazuje tedy k hodnost statistiků a je určen vzorcem

kde r i- U patřící k tomuto páru ( X, Y), pro roj Xravenů i, S = 2N- (n-1) / 2, N je počet prvků vzorku, pro které je současně j> i a r j> r i... Je vždy Jako selektivní měřítko závislosti To. To. R. to. hojně používal M. Kendall (M. Kendall, viz).

K. až R. K. slouží k testování hypotézy nezávislosti náhodných veličin. Pokud je hypotéza nezávislosti pravdivá, pak Et = 0 a Dt = 2 (2n + 5) / 9n (n-1). Při malé velikosti vzorku je kontrola statistická. hypotéza nezávislosti se provádí pomocí speciálních tabulek (viz). Pro n> 10 se pro rozdělení m použije normální aproximace: if

pak je hypotéza nezávislosti zamítnuta, jinak je přijata. Zde a . - hladina významnosti, u a / 2 je procentní bod normálního rozdělení. K. až R. Protože jako každý jiný jej lze použít k detekci závislosti dvou kvalitativních znaků, pokud lze s ohledem na tyto znaky řadit pouze prvky vzorku. Li X, Y mají společnou normálu s korelačním koeficientem p, pak vztah mezi K. k. p. to. a má tvar:

viz také Spearmanova hodnostní korelace, hodnostní test.

Lit.: Kendal M., Rank correlations, přel. z angličtiny, M., 1975; Van der Waerden B.L., Matematický, přel. z it., M., 1960; Bol'shev L.N., Smirnov N.V., Tabulky matematické statistiky, Moskva, 1965.

A. V. Prochorov.


Encyklopedie matematiky. - M .: Sovětská encyklopedie... I. M. Vinogradov. 1977-1985.

Podívejte se, co je "KENDALLA RANK CORRELATION COEFFICIENT" v jiných slovnících:

    Angličtina. с efektivní, hodnostní korelace Kendall; Němec Kendalls Rangkorrelationskoeffizient. Korelační koeficient, který určuje míru korespondence řazení všech dvojic objektů ve dvou proměnných. antinacistické. Encyklopedie sociologie, 2009 ... Encyklopedie sociologie

    KENDALLŮV KORELAČNÍ KOEFICIENT POŘADÍ- Angličtina. efektivní, hodnostní korelace Kendall; Němec Kendalls Rangkorrelationskoeffizient. Korelační koeficient, který určuje míru shody řazení všech dvojic objektů ve dvou proměnných ... Výkladový slovník sociologie

    Míra závislosti dvou náhodných proměnných (znaků) X a Y na základě pořadí nezávislých výsledků pozorování (X1, Y1). ... (Xn, Yn). Pokud jsou řady hodnot X umístěny v přirozeném pořadí i = 1,. ... ., n a Ri hodnost Y odpovídající ... ... Encyklopedie matematiky

    Korelační koeficient- (Korelační koeficient) Korelační koeficient je statistický ukazatel závislosti dvou náhodných veličin Stanovení korelačního koeficientu, typy korelačních koeficientů, vlastnosti korelačního koeficientu, výpočet a aplikace ... ... Investorská encyklopedie

    Vztah mezi náhodnými proměnnými, který, obecně řečeno, není striktně funkční. Na rozdíl od funkční závislosti se K. zpravidla uvažuje, když jedna z veličin závisí nejen na této druhé, ale také ... ... Encyklopedie matematiky

    Korelace (korelační závislost) je statistický vztah dvou nebo více náhodných veličin (nebo veličin, které lze za takové považovat s určitou přijatelnou mírou přesnosti). V tomto případě změny hodnot jednoho nebo ... ... Wikipedie

    Korelace- (Korelace) Korelace je statistický vztah dvou nebo více náhodných proměnných Pojem korelace, typy korelace, korelační koeficient, korelační analýza, cenová korelace, korelace měnových párů na Forexu Obsah ... ... Investorská encyklopedie

    Všeobecně se uznává, že počátek S. z m. Století. nebo, jak se často říká, statistika „malého n“, byla zasazena do prvního desetiletí XX století publikací práce W. Gosseta, do které umístil distribuci t, postulovanou těmi, kteří obdrželi svět o něco později ... ... Psychologická encyklopedie

    Maurice Kendall Sir Maurice George Kendall Datum narození: 6. září 1907 (1907 09 06) Místo narození: Kettering, Spojené království Datum úmrtí ... Wikipedia

    Předpověď- (Forecast) Definice prognózy, úkoly a principy prognózování Definice prognózy, úkoly a principy prognózování, metody prognóz Obsah Obsah Definice Základní pojmy prognózování Úkoly a principy prognózování ... ... Investorská encyklopedie