Korelačné koeficienty Spearmanovho, Kendallovho rangu, Fechnerovho koeficientu. Kendall a Spearman poradové korelačné koeficienty Spearman a spearman poradové korelačné koeficienty

Používa sa na identifikáciu vzťahu medzi kvantitatívnymi alebo kvalitatívnymi ukazovateľmi, ak ich možno zoradiť. Hodnoty indikátora X sú nastavené vo vzostupnom poradí a sú priradené hodnosti. Hodnoty indikátora Y sú zoradené a vypočíta sa Kendallov korelačný koeficient:

kde S = PQ.

P veľký hodnota poradia Y.

Q- celkový počet pozorovaní po súčasných pozorovaniach s menšie hodnota poradia Y. (rovnaké pozície sa nepočítajú!)

Ak sa študované údaje opakujú (majú rovnaké poradie), potom sa pri výpočtoch použije Kendallov opravený korelačný koeficient:

t- počet súvisiacich hodností v riadku X a Y.

19.Čo by malo byť východiskom pri definovaní témy, predmetu, predmetu, cieľa, cieľov a hypotézy výskumu?

Výskumný program má spravidla dve časti: metodickú a procedurálnu. Prvá zahŕňa zdôvodnenie relevantnosti témy, sformulovanie problému, definovanie objektu a predmetu, cieľov a cieľov výskumu, sformulovanie základných pojmov (kategoriálny aparát), predbežnú systematickú analýzu predmetu výskumu a predloženie pracovnej hypotézy. Druhá časť odhaľuje strategický plán výskumu, ako aj plán a základné postupy zberu a analýzy primárnych údajov.

V prvom rade treba pri výbere výskumnej témy vychádzať z relevantnosti. Odôvodnenie relevantnosti zahŕňa označenie potreby a aktuálnosti štúdia a riešenia problému pre ďalší rozvoj teórie a praxe vyučovania a výchovy. Aktuálny výskum dáva odpoveď na najpálčivejšie otázky súčasnosti, reflektuje spoločenské usporiadanie spoločnosti až po pedagogickú vedu a odhaľuje najdôležitejšie rozpory, ktoré sa odohrávajú v praxi. Kritérium relevantnosti je dynamické, mobilné, závisí od času, berúc do úvahy špecifické a špecifické okolnosti. Vo svojej najvšeobecnejšej forme relevantnosť charakterizuje mieru nesúladu medzi dopytom po vedeckých nápadoch a praktických odporúčaniach (na uspokojenie konkrétnej potreby) a návrhmi, ktoré môže veda a prax v súčasnosti poskytnúť.

Najpresvedčivejším základom definujúcim tému výskumu je spoločenský poriadok, reflektujúci najakútnejšie, spoločensky najvýznamnejšie problémy, ktoré si vyžadujú urgentné riešenia. Spoločenská objednávka si vyžaduje zdôvodnenie konkrétnej témy. Zvyčajne ide o analýzu stupňa rozpracovanosti otázky vo vede.

Ak z rozboru pedagogickej praxe vyplýva spoločenská objednávka, tak sama vedecký problém je v inej rovine. Vyjadruje hlavný rozpor, ktorý treba vyriešiť pomocou vedy. Riešenie problému je zvyčajne účel štúdie. Cieľom je preformulovaný problém.

Znenie problému obnáša výber objektu výskumu. Môže to byť pedagogický proces, oblasť pedagogickej reality alebo nejaký druh pedagogického postoja, ktorý obsahuje rozpor. Inými slovami, objektom môže byť čokoľvek, čo explicitne alebo implicitne obsahuje rozpor a generuje problémovú situáciu. Objekt je to, k čomu smeruje proces poznania. Predmet štúdia -časť, strana objektu. Ide o najvýznamnejšie z praktického alebo teoretického hľadiska, vlastnosti, aspekty, znaky objektu, ktoré sú predmetom priameho štúdia.

V súlade s účelom, predmetom a predmetom skúmania výskum úlohy, ktoré sú spravidla zamerané na kontrolu hypotéz. Ten je súborom teoreticky podložených predpokladov, ktorých pravdivosť podlieha overeniu.

Kritérium vedecká novinka možno použiť na posúdenie kvality ukončeného štúdia. Charakterizuje nové teoretické a praktické závery, zákonitosti vzdelávania, jeho štruktúru a mechanizmy, obsah, princípy a technológie, ktoré v tomto období neboli známe a neboli zaznamenané v pedagogickej literatúre. Novosť výskumu môže mať teoretický aj praktický význam. Teoretická hodnota výskumu spočíva vo vytvorení konceptu, získaní hypotézy, zákonitosti, metódy, modelu identifikácie problému, tendencie, smeru. Praktický význam výskumu spočíva v príprave návrhov, odporúčaní a pod. Kritériá novosti, teoretického a praktického významu sa menia v závislosti od typu výskumu, závisia aj od času získavania nových poznatkov.

Koeficient poradovej korelácie charakterizuje všeobecnú povahu nelineárnej závislosti: zvýšenie alebo zníženie efektívnej vlastnosti so zvýšením faktora jedna. Toto je indikátor tesnosti monotónneho nelineárneho vzťahu.

Účel služby... Táto online kalkulačka počíta Kendallov koeficient poradovej korelácie podľa všetkých základných vzorcov, ako aj posúdenie jeho významu.

Poučenie. Uveďte množstvo údajov (počet riadkov). Výsledné riešenie sa uloží do súboru programu Word.

Koeficient navrhovaný Kendallom je vybudovaný na základe vzťahov typu „viac-menej“, ktorých platnosť bola stanovená pri konštrukcii škál.
Vyberme si pár objektov a porovnajme ich poradie v jednom a druhom atribúte. Ak podľa tohto kritéria tvoria poradia priame poradie (t. j. poradie prirodzeného radu), potom sa páru pridelí +1, ak je to naopak, potom -1. Pre vybraný pár sa vynásobia zodpovedajúce jednotky plus - mínus (podľa atribútu X a atribútu Y). Výsledok je zjavne +1; ak sú rady dvojice oboch prvkov umiestnené v rovnakom poradí, a –1, ak sú opačné.
Ak sú poradia hodností pre všetky dvojice podľa oboch kritérií rovnaké, potom súčet jednotiek priradených všetkým dvojiciam objektov je maximálny a rovná sa počtu dvojíc. Ak sú poradia všetkých párov obrátené, potom –C 2 N. Vo všeobecnom prípade C2N = P + Q, kde P je počet kladných a Q je počet záporných priradených párom pri porovnaní ich hodnotení pre obe kritériá.
Množstvo sa nazýva Kendallov koeficient.
Zo vzorca je zrejmé, že koeficient τ je rozdiel medzi podielom dvojíc predmetov, v ktorých je poradie rovnaké v oboch kritériách (vo vzťahu k počtu všetkých dvojíc), a podielom dvojíc predmetov, v ktorých poradie nie je rovnaké.
Napríklad hodnota koeficientu 0,60 znamená, že 80 % párov má rovnaké poradie objektov, zatiaľ čo 20 % nie (80 % + 20 % = 100 %; 0,80 – 0,20 = 0,60). Tie. τ možno interpretovať ako rozdiel medzi pravdepodobnosťami zhody a nezhody rádov v oboch znamienkach pre náhodne vybranú dvojicu objektov.
Vo všeobecnom prípade sa výpočet τ (presnejšie P alebo Q) aj pre N rádovo 10 ukazuje ako ťažkopádny.
Ukážme si, ako zjednodušiť výpočty.


Príklad. Vzťah medzi objemom priemyselnej výroby a investíciami do fixných aktív v 10 regiónoch jedného z federálnych okresov Ruskej federácie v roku 2003 charakterizujú tieto údaje:


Vypočítajte korelačné koeficienty hodnotenia Spearmana a Kendala. Skontrolujte ich význam pri α = 0,05. Formulujte záver o vzťahu medzi objemom priemyselnej výroby a investíciami do fixných aktív v uvažovaných regiónoch Ruskej federácie.

Riešenie... Priraďme hodnosti atribútu Y a faktoru X.


Zoraďme údaje podľa X.
V riadku Y napravo od 3 je 7 radov presahujúcich 3, preto 3 vygeneruje výraz 7 v P.
Napravo od 1 je 8 radov presahujúcich 1 (sú to 2, 4, 6, 9, 5, 10, 7, 8), t.j. 8 zadá P a tak ďalej. Výsledkom je, že Р = 37 a pomocou vzorcov, ktoré máme:

XYporadie X, d xporadie Y, d yPQ
18.4 5.57 1 3 7 2
20.6 2.88 2 1 8 0
21.5 4.12 3 2 7 0
35.7 7.24 4 4 6 0
37.1 9.67 5 6 4 1
39.8 10.48 6 9 1 3
51.1 8.58 7 5 3 0
54.4 14.79 8 10 0 2
64.6 10.22 9 7 1 0
90.6 10.45 10 8 0 0
37 8


Podľa zjednodušených vzorcov:




kde n je veľkosť vzorky; z kp je kritický bod bilaterálnej kritickej oblasti, ktorý sa zistí z tabuľky Laplaceovej funkcie pomocou rovnosti Ф (z kp) = (1-α) / 2.
Ak | τ |< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - nulová hypotéza sa zamieta. Medzi kvalitatívnymi znakmi existuje významná korelácia poradia.
Nájdite kritický bod z kp
Ф (z kp) = (1-α) / 2 = (1 - 0,05) / 2 = 0,475

Poďme nájsť kritický bod:

Keďže τ> T kp - zamietame nulovú hypotézu; poradová korelácia medzi skóre v dvoch testoch je významná.

Príklad. Na základe údajov o objeme vlastných stavebných a montážnych prác a počte zamestnancov v 10 stavebných firmách v jednom z miest Ruskej federácie určte vzťah medzi týmito znakmi pomocou Kendalovho koeficientu.

Riešenie nájsť pomocou kalkulačky.
Priraďme hodnosti atribútu Y a faktoru X.
Usporiadajme objekty tak, aby ich X rad predstavoval prirodzenú sériu. Keďže odhady priradené ku každému páru tejto série sú kladné, hodnoty „+1“ zahrnuté v P vygenerujú iba tie páry, ktorých poradie v Y tvorí priame poradie.
Je ľahké ich vypočítať postupným porovnávaním radov každého objektu v rade Y s oceľovými.
Kendallov koeficient.

Vo všeobecnom prípade sa výpočet τ (presnejšie P alebo Q) aj pre N rádovo 10 ukazuje ako ťažkopádny. Ukážme si, ako zjednodušiť výpočty.

alebo

Riešenie.
Zoraďme údaje podľa X.
V riadku Y napravo od 2 je 8 radov presahujúcich 2, preto 2 vygeneruje člen 8 v P.
Napravo od 4 je 6 radov presahujúcich 4 (ide o 7, 5, 6, 8, 9, 10), t.j. 6 zadá P a tak ďalej. Výsledkom je, že P = 29 a pomocou vzorcov máme:

XYporadie X, d xporadie Y, d yPQ
38 292 1 2 8 1
50 302 2 4 6 2
52 366 3 7 3 4
54 312 4 5 4 2
59 359 5 6 3 2
61 398 6 8 2 2
66 401 7 9 1 2
70 298 8 3 1 1
71 283 9 1 1 0
73 413 10 10 0 0
29 16


Podľa zjednodušených vzorcov:


Aby sme mohli otestovať nulovú hypotézu o rovnosti Kendallovho všeobecného koeficientu poradovej korelácie na nulu na hladine významnosti α s konkurenčnou hypotézou H 1: τ ≠ 0, je potrebné vypočítať kritický bod:

kde n je veľkosť vzorky; z kp je kritický bod obojstrannej kritickej oblasti, ktorý sa zistí z tabuľky Laplaceovej funkcie pomocou rovnosti Ф (z kp) = (1 - α) / 2.
Ak | τ | T kp - nulová hypotéza sa zamieta. Medzi kvalitatívnymi znakmi existuje významná korelácia poradia.
Nájdite kritický bod z kp
Ф (z kp) = (1 - α) / 2 = (1 - 0,05) / 2 = 0,475
Pomocou Laplaceovej tabuľky zistíme z kp = 1,96
Poďme nájsť kritický bod:

Keďže τ

Potreby hospodárskej a spoločenskej praxe si vyžadujú vývoj metód kvantitatívneho popisu procesov, ktoré umožňujú presnú registráciu nielen kvantitatívnych, ale aj kvalitatívnych faktorov. Za predpokladu, že hodnoty kvalitatívnych znakov je možné zoradiť, prípadne zoradiť podľa miery poklesu (zvýšenia) charakteristiky, je možné posúdiť tesnosť vzťahu medzi kvalitatívnymi charakteristikami. Kvalitatívny znamená vlastnosť, ktorá sa nedá presne zmerať, ale umožňuje porovnávať objekty navzájom, a preto ich usporiadať v klesajúcom alebo rastúcom poradí podľa kvality. A skutočným obsahom meraní v hodnotových škálach je poradie, v ktorom sú objekty usporiadané podľa závažnosti meraného znaku.

Pre praktické účely je použitie korelácie hodnosti veľmi užitočné. Napríklad, ak je medzi dvoma kvalitatívnymi znakmi produktov zistená vysoká hodnotová korelácia, potom stačí produkty kontrolovať len podľa jednej z vlastností, čím je kontrola lacnejšia a rýchlejšia.

Ako príklad môžeme uvažovať existenciu prepojenia medzi dostupnosťou komerčných produktov viacerých podnikov a režijnými nákladmi na predaj. V priebehu 10 pozorovaní sa získala nasledujúca tabuľka:

Usporiadajme hodnoty X vo vzostupnom poradí, pričom každej hodnote priradíme ku každej hodnote svoje poradové číslo (poradie):

teda

Zostavme si nasledujúcu tabuľku, kde sú zapísané dvojice X a Y, získané ako výsledok pozorovania s ich hodnosťami:

Označením rozdielu v poradí ako napíšeme vzorec na výpočet Spearmanovho vzorového korelačného koeficientu:

kde n je počet pozorovaní, je to aj počet párov hodností.

Spearmanov koeficient má tieto vlastnosti:

Ak existuje úplný priamy vzťah medzi kvalitatívnymi znakmi X a Y v tom zmysle, že poradie objektov sa zhoduje pre všetky hodnoty i, potom Spearmanov vzorový korelačný koeficient je 1. Ak ho dosadíme do vzorca, dostaneme 1.

Ak existuje úplný inverzný vzťah medzi kvalitatívnymi znakmi X a Y v tom zmysle, že poradie zodpovedá poradiu, potom Spearmanov korelačný koeficient vzorky je -1.

Skutočne, ak

Dosadením hodnoty do vzorca Spearmanovho korelačného koeficientu dostaneme -1.

Ak medzi kvalitatívnymi znakmi neexistuje ani úplná priama, ani úplná spätná väzba, potom je Spearmanov korelačný koeficient vzorky medzi -1 a 1 a čím je jeho hodnota bližšie k 0, tým je medzi znakmi menšia súvislosť.

Podľa vyššie uvedeného príkladu nájdeme hodnotu P, na tento účel doplníme tabuľku o hodnoty a:

Kendallov výberový korelačný koeficient. Vzťah medzi dvoma kvalitatívnymi charakteristikami môžete posúdiť pomocou Kendallovho koeficientu poradovej korelácie.

Nech sú rady objektov vzorky veľkosti n rovnaké:

na základe X:

na základe Y:. Predpokladajme, že vpravo sú hodnosti, veľké, vpravo hodnosti, veľké, vpravo sú hodnosti, veľké. Uveďme si zápis súčtu hodností

Podobne zavedieme zápis ako súčet počtu hodností ležiacich vpravo, ale menej.

Kendallov vzorový korelačný koeficient je zapísaný vzorcom:

Kde n je veľkosť vzorky.

Kendallov koeficient má rovnaké vlastnosti ako Spearmanov koeficient:

Ak existuje úplný priamy vzťah medzi kvalitatívnymi znakmi X a Y v tom zmysle, že poradie objektov sa zhoduje pre všetky hodnoty i, potom Kendallov vzorový korelačný koeficient je 1. V skutočnosti je napravo n-1 radí väčší, teda rovnakým spôsobom ustanovíme, čo. Potom. A Kendallov koeficient je:.

Ak existuje úplný inverzný vzťah medzi kvalitatívnymi znakmi X a Y v tom zmysle, že poradie zodpovedá poradiu, potom Kendallov korelačný koeficient vzorky je -1. Napravo nie sú žiadne rady, teda veľké. Podobne. Dosadením hodnoty R + = 0 do vzorca Kendallovho koeficientu dostaneme -1.

Pri dostatočne veľkej veľkosti vzorky a pri hodnotách koeficientov poradovej korelácie nie blízkym 1 nastáva približná rovnosť:

Poskytuje Kendallov koeficient konzervatívnejší odhad korelácie ako Spearmanov koeficient? (číselná hodnota? je vždy menšia ako). Pri výpočte koeficientu? menej prácne ako výpočet koeficientu, ten sa dá ľahšie prepočítať, ak sa do radu pridá nový člen.

Dôležitou výhodou koeficientu je, že sa dá použiť na určenie koeficientu čiastočnej poradovej korelácie, čo umožňuje posúdiť mieru „čistého“ prepojenia dvoch prvkov poradia, čím sa eliminuje vplyv tretieho:

Význam koeficientov poradovej korelácie. Pri určovaní sily poradovej korelácie na základe výberových údajov je potrebné zvážiť nasledujúcu otázku: s akou mierou spoľahlivosti sa možno spoľahnúť na záver, že existuje korelácia vo všeobecnej populácii, ak je určitý výberový koeficient poradovej korelácie získané. Inými slovami, významnosť pozorovaných korelácií poradia by sa mala kontrolovať na základe hypotézy, že dve posudzované poradia sú štatisticky nezávislé.

Pri relatívne veľkej veľkosti vzorky n je možné skontrolovať významnosť koeficientov poradovej korelácie pomocou tabuľky normálneho rozdelenia (tabuľka 1 v prílohe). Testovať význam Spearmanovho koeficientu? (pre n> 20) vypočítajte hodnotu

a testovať význam Kendallovho koeficientu? (pre n> 10) vypočítajte hodnotu

kde S = R + - R-, n je veľkosť vzorky.

Ďalej sa nastaví hladina významnosti, kritická hodnota tcr (?, K) sa určí z tabuľky kritických bodov Studentovho rozdelenia a vypočítanej hodnoty alebo sa s ňou porovná. Predpokladá sa, že počet stupňov voľnosti je k = n-2. Ak alebo> tcr, potom sa hodnoty alebo považujú za významné.

Fechnerov korelačný koeficient.

Na záver treba spomenúť Fechnerov koeficient, ktorý charakterizuje elementárny stupeň tesnosti spojenia, ktorý je vhodné použiť na zistenie faktu spojenia pri malom množstve počiatočných informácií. Základom pre jeho výpočet je zohľadnenie smeru odchýlok od aritmetického priemeru variantov každého variačného radu a určenie konzistencie znamienok týchto odchýlok pre dva rady, medzi ktorými sa meria vzťah.

Tento koeficient je určený vzorcom:

kde na je počet zhôd znakov odchýlok jednotlivých hodnôt od ich aritmetického priemeru; nb - respektíve počet nezhôd.

Fechnerov koeficient sa môže pohybovať medzi -1,0<= Кф<= +1,0.

Aplikované aspekty rank korelácie. Ako už bolo uvedené, koeficienty poradovej korelácie možno použiť nielen na kvalitatívnu analýzu vzťahu medzi dvoma znakmi poradia, ale aj na určenie sily vzťahu medzi poradovými a kvantitatívnymi znakmi. V tomto prípade sú hodnoty kvantitatívnej charakteristiky zoradené a sú im priradené zodpovedajúce hodnosti.

Existuje niekoľko situácií, kedy sa pri určovaní sily vzťahu medzi dvoma kvantitatívnymi znakmi odporúča aj výpočet koeficientov poradovej korelácie. Takže pri výraznej odchýlke rozdelenia jedného z nich (alebo oboch) od normálneho rozdelenia sa určenie hladiny významnosti výberového korelačného koeficientu r stáva nesprávnym, kým poradové koeficienty? a? nepodliehajú takýmto obmedzeniam pri určovaní hladiny významnosti.

Iná situácia tohto druhu nastáva, keď je vzťah medzi dvoma kvantitatívnymi znakmi nelineárny (ale monotónny). Ak je počet objektov vo vzorke malý alebo ak je pre výskumníka dôležitý znak súvislosti, potom použitie korelačného pomeru? tu môže byť nedostatočné. Výpočet koeficientu poradovej korelácie umožňuje obísť naznačené ťažkosti.

Praktická časť

Úloha 1. Korelačno-regresná analýza

Vyjadrenie a formalizácia problému:

Uvádza sa empirická vzorka zostavená na základe série pozorovaní stavu zariadenia (na poruchu) a počtu vyrobených výrobkov. Vzorka implicitne charakterizuje vzťah medzi množstvom zariadení, ktoré zlyhalo, a počtom vyrobených položiek. Podľa významu vzorky je zrejmé, že vyrobené výrobky sa vyrábajú na zariadení, ktoré zostáva v prevádzke, pretože čím viac % zariadení zlyhalo, tým menej vyrobených výrobkov. Je potrebné vykonať štúdiu vzorky na korelačno-regresnú závislosť, to znamená stanoviť formu závislosti, vyhodnotiť regresnú funkciu (regresná analýza), ako aj identifikovať vzťah medzi náhodnými premennými a posúdiť jej tesnosť. (korelačná analýza). Ďalšou úlohou korelačnej analýzy je odhadnúť regresnú rovnicu jednej premennej pre druhú. Okrem toho je potrebné predpovedať počet vyrobených výrobkov s 30% poruchou zariadenia.

Danú vzorku formalizujme v tabuľke, pričom údaj „Porucha zariadenia, %“ označíme ako X, údaj „Počet výrobkov“ ako Y:

Počiatočné údaje. stôl 1

Podľa fyzikálneho významu problému je možné vidieť, že počet vyrobených produktov Y priamo závisí od % zlyhania zariadenia, to znamená, že existuje závislosť Y od X. Pri vykonávaní regresnej analýzy je potrebné nájsť matematický vzťah (regresiu) spájajúci hodnoty X a Y. V tomto prípade regresná analýza na rozdiel od korelácie predpokladá, že hodnota X pôsobí ako nezávislá premenná, alebo faktor, hodnota Y - ako závislý na ňom, alebo účinný znak. Vyžaduje sa teda syntetizácia adekvátneho ekonomického a matematického modelu, t.j. určiť (nájsť, vybrať) funkciu Y = f (X), ktorá charakterizuje vzťah medzi hodnotami X a Y, pomocou ktorej bude možné predpovedať hodnotu Y pri X = 30. Tento problém môže byť riešené pomocou korelačnej-regresnej analýzy.

Stručný prehľad metód riešenia korelačno-regresných problémov a zdôvodnenie zvolenej metódy riešenia.

Metódy regresnej analýzy sú rozdelené na jednofaktorové a viacfaktorové na základe počtu faktorov ovplyvňujúcich efektívnu vlastnosť. Univariantné - počet nezávislých faktorov = 1, t.j. Y = F (X)

multifaktoriálny - počet faktorov> 1, t.j.

Podľa počtu skúmaných závislých premenných (efektívnych ukazovateľov) možno regresné problémy rozdeliť aj na úlohy s jedným alebo viacerými efektívnymi ukazovateľmi. Vo všeobecnosti možno napísať úlohu s mnohými efektívnymi funkciami:

Metóda korelačno-regresnej analýzy spočíva v hľadaní parametrov aproximačnej (aproximačnej) závislosti tvaru

Keďže vo vyššie uvedenom probléme sa objavuje iba jedna nezávislá premenná, t. j. skúma sa závislosť iba od jedného faktora ovplyvňujúceho výsledok, mala by sa použiť štúdia jednosmernej závislosti alebo párovej regresie.

Ak existuje iba jeden faktor, závislosť je definovaná ako:

Forma zápisu špecifickej regresnej rovnice závisí od výberu funkcie, ktorá zobrazuje štatistický vzťah medzi faktorom a efektívnym ukazovateľom a zahŕňa nasledovné:

lineárna regresia, rovnica tvaru,

parabolická, rovnica tvaru

kubická, rovnica tvaru

hyperbolický, rovnica tvaru

semilogaritmická, rovnica tvaru

exponenciálna, rovnica tvaru

mocninný zákon, rovnica tvaru.

Hľadanie funkcie sa redukuje na určenie parametrov regresnej rovnice a posúdenie spoľahlivosti samotnej rovnice. Na určenie parametrov môžete použiť metódu najmenších štvorcov aj metódu najmenšieho modulu.

Prvým z nich je, že súčet štvorcov odchýlok empirických hodnôt Yi od vypočítaného priemeru Yi je minimálny.

Metóda najmenšieho modulu spočíva v minimalizácii súčtu modulov rozdielu medzi empirickými hodnotami Yi a vypočítaným priemerom Yi.

Na vyriešenie problému zvolíme metódu najmenších štvorcov, pretože je najjednoduchšia a poskytuje dobré odhady z hľadiska štatistických vlastností.

Technológia riešenia problému regresnej analýzy metódou najmenších štvorcov.

Medzi premennými je možné určiť typ závislosti (lineárna, kvadratická, kubická atď.) vyhodnotením odchýlky skutočnej hodnoty y od vypočítanej:

kde - empirické hodnoty, - vypočítané hodnoty pomocou aproximačnej funkcie. Odhadnutím hodnôt Si pre rôzne funkcie a výberom najmenšej z nich vyberieme aproximatívnu funkciu.

Typ funkcie je určený nájdením koeficientov, ktoré sa nachádzajú pre každú funkciu ako riešenie určitého systému rovníc:

lineárna regresia, rovnica tvaru, systém -

parabolická rovnica tvaru, sústava -

kubický, rovnica tvaru, sústava -

Po vyriešení systému nájdeme, pomocou ktorého sa dostaneme ku konkrétnemu vyjadreniu analytickej funkcie, s ktorou nájdeme vypočítané hodnoty. Ďalej sú tu všetky údaje pre nájdenie odhadu hodnoty odchýlky S a analýzu pre minimum.

Pre lineárny vzťah odhadujeme tesnosť vzťahu medzi faktorom X a efektívnym ukazovateľom Y vo forme korelačného koeficientu r:

Priemerná hodnota ukazovateľa;

Priemerná hodnota faktora;

y je experimentálna hodnota ukazovateľa;

x je experimentálna hodnota faktora;

Smerodajná odchýlka v x;

Smerodajná odchýlka v r.

Ak je korelačný koeficient r = 0, potom sa predpokladá, že vzťah medzi znakmi je nevýznamný alebo chýba, ak r = 1, potom medzi znakmi existuje veľmi vysoký funkčný vzťah.

Pomocou tabuľky Chaddock môžete kvalitatívne posúdiť tesnosť korelácie medzi znakmi:

Chaddockový stôl Tabuľka 2.

Pre nelineárnu závislosť sa určí korelačný pomer (0 1) a korelačný index R, ktoré sa vypočítajú z nasledujúcich závislostí.

kde hodnota je hodnota ukazovateľa vypočítaná regresnou závislosťou.

Ako odhad presnosti výpočtu používame hodnotu priemernej relatívnej chyby aproximácie

S vysokou presnosťou leží v rozmedzí 0-12%.

Na posúdenie výberu funkčnej závislosti používame koeficient determinácie

Koeficient determinácie sa používa ako „zovšeobecnená“ miera kvality výberu funkčného modelu, keďže vyjadruje pomer medzi faktoriálovým a celkovým rozptylom, resp. podiel faktoriálneho rozptylu na celku.

Na posúdenie významnosti korelačného indexu R sa používa Fisherov F test. Skutočná hodnota kritéria je určená vzorcom:

kde m je počet parametrov regresnej rovnice, n je počet pozorovaní. Hodnota sa porovnáva s kritickou hodnotou, ktorá sa určuje podľa tabuľky F-kritérií, pričom sa berie do úvahy akceptovaná hladina významnosti a počet stupňov voľnosti a. Ak, potom sa hodnota korelačného indexu R považuje za významnú.

Pre zvolenú formu regresie sa vypočítajú koeficienty regresnej rovnice. Pre pohodlie sú výsledky výpočtu zahrnuté v tabuľke nasledujúcej štruktúry (vo všeobecnosti sa počet stĺpcov a ich vzhľad mení v závislosti od typu regresie):

Tabuľka 3

Riešenie problému.

Boli vykonané pozorovania ekonomického javu - závislosti uvoľňovania produktov od percenta zlyhania zariadenia. Získa sa súbor hodnôt.

Vybrané hodnoty sú popísané v tabuľke 1.

Zostavíme graf empirickej závislosti pre danú vzorku (obr. 1)

Podľa typu grafu určíme, že analytická závislosť môže byť reprezentovaná ako lineárna funkcia:

Vypočítajme párový korelačný koeficient na posúdenie vzťahu medzi X a Y:

Zostavme pomocnú tabuľku:

Tabuľka 4

Riešime sústavu rovníc, aby sme našli koeficienty a:

z prvej rovnice dosadením hodnoty

do druhej rovnice dostaneme:

nachádzame

Dostaneme tvar regresnej rovnice:

9. Na posúdenie tesnosti zisteného vzťahu použijeme korelačný koeficient r:

Podľa Chaddockovej tabuľky sme zistili, že pre r = 0,90 je vzťah medzi X a Y veľmi vysoký, a preto je spoľahlivosť regresnej rovnice tiež vysoká. Na odhad presnosti výpočtov používame hodnotu priemernej relatívnej chyby aproximácie:

Sme presvedčení, že hodnota poskytuje vysoký stupeň spoľahlivosti regresnej rovnice.

Pre lineárny vzťah medzi X a Y sa determinačný index rovná štvorcu korelačného koeficientu r:. V dôsledku toho sa 81 % celkovej variácie vysvetľuje zmenou faktora X.

Na posúdenie významnosti korelačného indexu R, ktorý sa v prípade lineárneho vzťahu v absolútnej hodnote rovná korelačnému koeficientu r, sa používa Fisherov F-test. Skutočnú hodnotu určíme pomocou vzorca:

kde m je počet parametrov regresnej rovnice, n je počet pozorovaní. To znamená, že n = 5, m = 2.

Ak vezmeme do úvahy akceptovanú hladinu významnosti = 0,05 a počet stupňov voľnosti, získame kritickú tabuľkovú hodnotu. Keďže hodnota korelačného indexu R sa považuje za významnú.

Vypočítajme predpokladanú hodnotu Y pri X = 30:

Zostavme graf nájdenej funkcie:

11. Určte chybu korelačného koeficientu hodnotou smerodajnej odchýlky

a potom určíme hodnotu normalizovanej odchýlky

Z pomeru> 2 s pravdepodobnosťou 95% môžeme hovoriť o významnosti získaného korelačného koeficientu.

Úloha 2. Lineárna optimalizácia

Možnosť 1.

Plán rozvoja regiónu má uviesť do prevádzky 3 ropné polia s celkovým objemom produkcie 9 miliónov ton. V prvom poli je objem výroby najmenej 1 milión ton, v druhom - 3 milióny ton, v treťom - 5 miliónov ton. Na dosiahnutie tejto produktivity je potrebné vyvŕtať najmenej 125 vrtov. Na realizáciu tohto plánu bolo pridelených 25 miliónov rubľov. kapitálové investície (ukazovateľ K) a 80 km potrubí (ukazovateľ L).

Je potrebné určiť optimálny (maximálny) počet vrtov, aby sa zabezpečila plánovaná produktivita každého poľa. Počiatočné údaje o úlohe sú uvedené v tabuľke.

Počiatočné údaje

Vyhlásenie o probléme je uvedené vyššie.

Formalizujme podmienky a obmedzenia špecifikované v probléme. Cieľom riešenia tohto optimalizačného problému je nájsť maximálnu hodnotu ťažby ropy s optimálnym počtom vrtov pre každé pole, berúc do úvahy existujúce obmedzenia problému.

Cieľová funkcia v súlade s požiadavkami úlohy bude mať formu:

kde je počet jamiek pre každé pole.

Existujúce obmedzenia úlohy pre:

dĺžka uloženia potrubia:

počet jamiek v každom poli:

náklady na výstavbu 1 studne:

Problémy lineárnej optimalizácie sa riešia napríklad nasledujúcimi metódami:

Graficky

Simplexná metóda

Použitie grafickej metódy je vhodné len pri riešení lineárnych optimalizačných úloh s dvoma premennými. Pri väčšom počte premenných je nevyhnutné použitie algebraického aparátu. Zvážte všeobecnú metódu na riešenie problémov lineárnej optimalizácie nazývanú simplexná metóda.

Simplexová metóda je typickým príkladom iteračných výpočtov používaných na riešenie väčšiny optimalizačných problémov. Uvažujú sa o iteračných postupoch tohto druhu, ktoré zabezpečujú riešenie problémov pomocou modelov operačného výskumu.

Na riešenie optimalizačnej úlohy simplexovou metódou je potrebné, aby počet neznámych Xi bol väčší ako počet rovníc, t.j. sústava rovníc

spĺňa vzťah m

A = sa rovnalo m.

Označme stĺpec matice A ako a stĺpec voľných členov ako

Základné riešenie sústavy (1) je množina m neznámych, ktoré sú riešením sústavy (1).

Stručne, algoritmus simplexovej metódy je opísaný takto:

Pôvodné obmedzenie zapísané ako nerovnosť<= (=>) možno reprezentovať ako rovnosť pridaním zvyškovej premennej na ľavú stranu obmedzenia (odčítaním redundantnej premennej od ľavej strany).

Napríklad naľavo od pôvodného obmedzenia

zavádza sa zvyšková premenná, v dôsledku ktorej sa pôvodná nerovnosť zmení na rovnosť

Ak pôvodné obmedzenie určuje prietok potrubia, potom by sa premenná mala interpretovať ako zvyšok alebo nevyužitá časť tohto zdroja.

Maximalizácia účelovej funkcie je ekvivalentná minimalizácii tej istej funkcie s opačným znamienkom. Teda v našom prípade

ekvivalentné k

Pre základné riešenie je zostavená simplexná tabuľka v nasledujúcom tvare:

V tejto tabuľke je uvedené, že po vyriešení problému v týchto bunkách bude existovať základné riešenie. - podiely z delenia stĺpca jedným zo stĺpcov; - dodatočné multiplikátory na nulovanie hodnôt v bunkách tabuľky súvisiacich s rozlišovacím stĺpcom. - minimálna hodnota účelovej funkcie -Z, - hodnoty koeficientov v účelovej funkcii s neznámymi.

Medzi významami sa nachádza akákoľvek kladná hodnota. Ak tomu tak nie je, potom sa problém považuje za vyriešený. Vyberie sa ľubovoľný stĺpec tabuľky, ktorý sa v nej nachádza, tento stĺpec sa nazýva „povolený“ stĺpec. Ak medzi prvkami rozlišovacieho stĺpca nie sú kladné čísla, potom je problém neriešiteľný z dôvodu neohraničenosti cieľovej funkcie na množine jeho riešení. Ak sa v rozlišovacom stĺpci nachádzajú kladné čísla, prejdite na krok 5.

Stĺpec je naplnený zlomkami, v čitateli ktorých sú prvky stĺpca a v menovateli - zodpovedajúce prvky rozlišovacieho stĺpca. Vyberie sa najmenšia zo všetkých hodnôt. Riadok s najmenším výsledkom sa nazýva "povoliť" riadok. Na priesečníku rozlišovacej čiary a rozlišovacieho stĺpca sa nachádza rozlišovací prvok, ktorý je nejakým spôsobom zvýraznený, napríklad farbou.

Na základe prvej simplexnej tabuľky je zostavená nasledujúca, v ktorej:

Nahradí riadkový vektor stĺpcovým vektorom

permisívna línia je nahradená tou istou líniou delenou permisívnym prvkom

každý z ostatných riadkov tabuľky sa nahradí súčtom tohto riadka s rozlišovacím, vynásobeným špeciálne vybraným dodatočným faktorom, aby sa v bunke rozlišovacieho stĺpca získala 0.

S novou tabuľkou prejdeme k bodu 4.

Riešenie problému.

Na základe formulácie problému máme nasledujúci systém nerovností:

a objektívna funkcia

Systém nerovníc transformujeme na systém rovníc zavedením ďalších premenných:

Zredukujme účelovú funkciu na jej ekvivalent:

Zostavme pôvodnú simplexnú tabuľku:

Vyberme si permisívny stĺpec. Vypočítajme stĺpec:

Hodnoty zadáme do tabuľky. Pre najmenšiu z nich = 10 určíme rozlišovaciu čiaru:. Na priesečníku rozlišovacej čiary a rozlišovacieho stĺpca nájdeme rozlišovací prvok = 1. Časť tabuľky vyplníme ďalšími faktormi, a to tak, že: nimi vynásobený rozlišovací riadok, pripočítaný k ostatným riadkom tabuľky, tvorí 0 v prvkoch rozlišovacieho stĺpca.

Zostavíme druhú simplexnú tabuľku:

Vezmeme v ňom rozlišovací stĺpec, vypočítame hodnoty a zadáme ich do tabuľky. Minimálne dostaneme rozlišovaciu čiaru. Rozlišovacím prvkom bude 1. Nájdite ďalšie faktory, vyplňte stĺpce.

Vytvoríme nasledujúcu simplexnú tabuľku:

Podobne nájdeme rozlišovací stĺpec, rozlišovací riadok a rozlišovací prvok = 2. Zostavíme nasledujúcu simplexnú tabuľku:

Keďže v riadku -Z nie sú žiadne kladné hodnoty, táto tabuľka je konečná. Prvý stĺpec udáva požadované hodnoty neznámych, t.j. optimálne základné riešenie:

V tomto prípade je hodnota účelovej funkcie -Z = -8000, čo je ekvivalentné Zmax = 8000. Úloha je vyriešená.

Úloha 3. Zhluková analýza

Formulácia problému:

Rozdeľte objekty na základe údajov uvedených v tabuľke. Výber metódy riešenia sa má vykonať nezávisle, aby sa vytvoril graf závislosti údajov.

Možnosť 1.

Počiatočné údaje

Prehľad metód riešenia tohto typu problémov. Zdôvodnenie spôsobu riešenia.

Úlohy klastrovej analýzy sa riešia pomocou nasledujúcich metód:

Metóda zväzku alebo stromového zhlukovania sa používa na vytváranie zhlukov „odlišnosti“ alebo „vzdialenosti medzi objektmi“. Tieto vzdialenosti môžu byť definované v jednorozmernom alebo viacrozmernom priestore.

Obojsmerné kombinovanie sa používa (pomerne zriedkavo) za okolností, keď sa údaje interpretujú nie z hľadiska „objektov“ a „vlastností objektov“, ale z hľadiska pozorovaní a premenných. Očakáva sa, že pozorovania a premenné prispejú k detekcii zmysluplných zhlukov súčasne.

Metóda K-means. Používa sa, keď už existuje hypotéza týkajúca sa počtu zhlukov. Systému môžete prikázať, aby vytvoril presne napríklad tri zhluky tak, aby boli čo najrôznejšie. Vo všeobecnosti metóda K-means vytvára presne K rôznych zhlukov umiestnených v najväčších možných vzdialenostiach od seba.

Existujú nasledujúce spôsoby merania vzdialeností:

Euklidovská vzdialenosť. Toto je najbežnejší typ vzdialenosti. Je to jednoducho geometrická vzdialenosť vo viacrozmernom priestore a vypočíta sa takto:

Všimnite si, že euklidovská vzdialenosť (a jej druhá mocnina) sa vypočítava z pôvodných, nie štandardizovaných údajov.

Vzdialenosť mestských blokov (vzdialenosť Manhattan). Táto vzdialenosť je jednoducho priemerom súradnicových rozdielov. Vo väčšine prípadov táto miera vzdialenosti vedie k rovnakým výsledkom ako pre obyčajnú euklidovskú vzdialenosť. Všimnite si však, že pre toto meranie sa vplyv jednotlivých veľkých rozdielov (odľahlých hodnôt) znižuje (keďže nie sú na druhú). Vzdialenosť Manhattan sa vypočíta podľa vzorca:

Čebyševova vzdialenosť. Táto vzdialenosť môže byť užitočná, keď chcete definovať dva objekty ako "odlišné", ak sa líšia v ktorejkoľvek jednej súradnici (akýkoľvek jeden rozmer). Čebyševova vzdialenosť sa vypočíta podľa vzorca:

Výkonová vzdialenosť. Niekedy sa chce postupne zvyšovať alebo znižovať hmotnosť súvisiacu s rozmerom, pre ktorý sú zodpovedajúce predmety veľmi odlišné. To sa dá dosiahnuť pomocou mocninnej vzdialenosti. Mocninná vzdialenosť sa vypočíta podľa vzorca:

kde r a p sú užívateľom definované parametre. Niekoľko príkladov výpočtu môže ukázať, ako toto opatrenie „funguje“. Parameter p je zodpovedný za postupné váženie rozdielov v jednotlivých súradniciach, parameter r je zodpovedný za progresívne váženie veľkých vzdialeností medzi objektmi. Ak sa oba parametre - r a p, rovnajú dvom, potom sa táto vzdialenosť zhoduje s euklidovskou vzdialenosťou.

Percento nesúhlasu. Toto opatrenie sa používa, keď sú údaje kategorické. Táto vzdialenosť sa vypočíta podľa vzorca:

Na vyriešenie problému zvolíme metódu zjednotenia (stromové zhlukovanie), ktorá najlepšie vyhovuje podmienkam a formulácii problému (rozdelenie objektov). Metóda únie môže zase využívať niekoľko variantov pravidiel komunikácie:

Jediný odkaz (metóda najbližšieho suseda). V tejto metóde je vzdialenosť medzi dvoma zhlukami určená vzdialenosťou medzi dvoma najbližšími objektmi (najbližšími susedmi) v rôznych zhlukoch. To znamená, že akékoľvek dva objekty v dvoch zhlukoch sú k sebe bližšie, než je zodpovedajúca vzdialenosť spojenia. Toto pravidlo by malo v istom zmysle spájať objekty do zhlukov a výsledné zhluky majú tendenciu byť dlhými „reťazcami“.

Plná komunikácia (metóda najvzdialenejších susedov). V tejto metóde je vzdialenosť medzi klastrami určená najväčšou vzdialenosťou medzi akýmikoľvek dvoma prvkami v rôznych zhlukoch (tj "najvzdialenejší susedia").

Existuje aj mnoho ďalších podobných metód zhlukovania (napr. nevážené párovanie, vážené párovanie atď.).

Technológia metódy riešenia. Výpočet ukazovateľov.

V prvom kroku, keď je každý objekt samostatným zhlukom, sú vzdialenosti medzi týmito objektmi určené vybranou mierou.

Keďže úloha nešpecifikuje merné jednotky pre charakteristiky, predpokladá sa, že sú rovnaké. Preto nie je potrebné normalizovať počiatočné údaje, takže okamžite pristúpime k výpočtu matice vzdialenosti.

Riešenie problému.

Zostavme si graf závislosti podľa počiatočných údajov (obr. 2)

Ako vzdialenosť medzi objektmi budeme brať obvyklú euklidovskú vzdialenosť. Potom podľa vzorca:

kde l - znaky; k je počet prvkov, vzdialenosť medzi objektmi 1 a 2 sa rovná:

Pokračujeme vo výpočte zostávajúcich vzdialeností:

Zo získaných hodnôt zostavíme tabuľku:

Najmenšia vzdialenosť. To znamená, že spojíme prvky 3, 6 a 5 do jedného zhluku. Dostaneme nasledujúcu tabuľku:

Najmenšia vzdialenosť. Do jedného zhluku sú spojené prvky 3, 6, 5 a 4. Dostaneme tabuľku dvoch zhlukov:

Minimálna vzdialenosť medzi položkami 3 a 6 je. To znamená, že prvky 3 a 6 sú spojené do jedného zhluku. Zvolíme maximálnu vzdialenosť medzi novovytvoreným zhlukom a zvyškom prvkov. Napríklad vzdialenosť medzi klastrom 1 a klastrom 3,6 je max (13,34166, 13,60147) = 13,34166. Zostavme si nasledujúcu tabuľku:

V ňom je minimálna vzdialenosť vzdialenosť medzi klastrami 1 a 2. Spojením 1 a 2 do jedného zhluku dostaneme:

Pomocou metódy „ďalekého suseda“ sa teda získali dva zhluky: 1,2 a 3,4,5,6, pričom vzdialenosť medzi nimi je 13,60147.

Problém bol vyriešený.

Aplikácie. Riešenie problémov pomocou softvérových balíkov (MS Excel 7.0)

Problém korelačnej a regresnej analýzy.

Do tabuľky zadáme počiatočné údaje (obr. 1)

Vyberte menu "Servis / Analýza dát". V zobrazenom okne vyberte riadok „Regresia“ (obr. 2).

V ďalšom okne nastavíme vstupné intervaly pre X a Y, úroveň spoľahlivosti bude 95% a výstupné údaje budú umiestnené na samostatnom hárku "Hárok výkazu" (obr. 3).

Po vykonaní výpočtu získame konečné údaje regresnej analýzy na hárku "Report Sheet":

Zobrazuje tiež bodový graf aproximačnej funkcie alebo „graf výberu“:


Vypočítané hodnoty a odchýlky sú uvedené v tabuľke v stĺpcoch „Predpokladané Y“ a „Zostatky“.

Na základe počiatočných údajov a odchýlok sa vykreslí zvyškový graf:

Úloha optimalizácie


Počiatočné údaje zadáme takto:

Neznáme neznáme X1, X2, X3 sa vkladajú do buniek C9, D9, E9, resp.

Koeficienty cieľovej funkcie pre X1, X2, X3 sa vkladajú do C7, D7, E7.

Zadajte cieľovú funkciu do bunky B11 ako vzorec: = C7 * C9 + D7 * D9 + E7 * E9.

Existujúce obmedzenia úloh

Pre dĺžku kladenia potrubia:

pridáme do buniek C5, D5, E5, F5, G5

Počet jamiek v každom poli:

X3 C 100; pridáme do buniek C8, D8, E8.

Náklady na výstavbu 1 studne:

pridáme do buniek C6, D6, E6, F6, G6.

Vzorec na výpočet celkovej dĺžky C5 * C9 + D5 * D9 + E5 * E9 sa umiestni do bunky B5, vzorec na výpočet celkových nákladov C6 * C9 + D6 * D9 + E6 * E9 sa umiestni do bunky B6.


Vyberieme v menu „Servis / Vyhľadať riešenie“, zadáme parametre pre nájdenie riešenia v súlade s počiatočnými údajmi (obr. 4):

Pomocou tlačidla "Parametre" nastavte nasledujúce parametre pre hľadanie riešenia (obr. 5):


Po hľadaní riešenia dostaneme správu o výsledkoch:

Správa o výsledkoch programu Microsoft Excel 8.0e

Správa vytvorená: 17.11.2002 1:28:30

Cieľová bunka (maximálne)

Výsledok

Celková korisť

Modifikovateľné bunky

Výsledok

Počet studní

Počet studní

Počet studní

Obmedzenia

Význam

Dĺžka

Súvisiace

Náklady na projekt

Nesúvisiace.

Počet studní

Nesúvisiace.

Počet studní

Súvisiace

Počet studní

Súvisiace

Prvá tabuľka zobrazuje počiatočnú a konečnú (optimálnu) hodnotu cieľovej bunky, kde bola umiestnená objektívna funkcia riešeného problému. V druhej tabuľke vidíme počiatočné a konečné hodnoty premenných na optimalizáciu, ktoré sú obsiahnuté v upravených bunkách. Tretia tabuľka v správe s výsledkami obsahuje informácie o obmedzeniach. Stĺpec "Hodnota" obsahuje optimálne hodnoty požadovaných zdrojov a premenných, ktoré sa majú optimalizovať. Stĺpec "Vzorec" obsahuje limity na spotrebované zdroje a premenné, ktoré sa majú optimalizovať, zapísané vo forme odkazov na bunky obsahujúce tieto údaje. Stĺpec „State“ určuje, či tieto alebo tieto obmedzenia súvisia alebo nesúvisia. Tu sú „viazané“ obmedzenia implementované v optimálnom riešení vo forme rigidných rovnosti. Stĺpec "Rozdiel" pre obmedzenia zdrojov určuje zvyšok použitých zdrojov, t.j. rozdiel medzi požadovaným množstvom zdrojov a ich dostupnosťou.

Podobne po zapísaní výsledku hľadania riešenia do formulára „Správa o udržateľnosti“ dostaneme nasledujúce tabuľky:

Správa o odolnosti programu Microsoft Excel 8.0e

Pracovný list: [Riešenie optimalizačného problému.xls] Riešenie optimalizačného problému

Správa vytvorená: 17.11.2002 1:35:16

Modifikovateľné bunky

Prípustné

Prípustné

význam

cena

Koeficient

Zvýšiť

Znížiť

Počet studní

Počet studní

Počet studní

Obmedzenia

Obmedzenie

Prípustné

Prípustné

význam

Pravá časť

Zvýšiť

Znížiť

Dĺžka

Náklady na projekt

Správa o udržateľnosti obsahuje informácie o modifikovateľných (optimalizovaných) premenných a modelových obmedzeniach. Tieto informácie sú spojené s simplexnou metódou používanou pri optimalizácii lineárnych úloh, opísanou vyššie z hľadiska riešenia úlohy. Umožňuje odhadnúť, ako citlivé je získané optimálne riešenie na možné zmeny parametrov modelu.

Prvá časť správy obsahuje informácie o upravených bunkách obsahujúcich hodnoty o počte jamiek v poliach. Stĺpec „Výsledná hodnota“ označuje optimálne hodnoty premenných, ktoré sa majú optimalizovať. Stĺpec "Cieľový koeficient" obsahuje počiatočné údaje hodnôt koeficientov cieľovej funkcie. Nasledujúce dva stĺpce ilustrujú prípustné zvýšenie a zníženie týchto koeficientov bez zmeny nájdeného optimálneho riešenia.

Druhá časť správy o udržateľnosti obsahuje informácie o obmedzeniach kladených na optimalizované premenné. Prvý stĺpec zobrazuje požiadavky na zdroje pre optimálne riešenie. Druhá obsahuje hodnoty tieňových cien pre typy použitých zdrojov. Posledné dva stĺpce obsahujú údaje o možnom zvýšení alebo znížení množstva dostupných zdrojov.

Problém klastrovania.

Postup riešenia problému krok za krokom je uvedený vyššie. Tu sú tabuľky programu Excel, ktoré ilustrujú postup riešenia problému:

Metóda najbližšieho suseda

Riešenie problému zhlukovej analýzy - "METÓDA NAJBLIŽŠIEHO SUSEDA"

Počiatočné údaje

kde x1 je objem produktov;

х2 - priemerné ročné náklady na hlavnú

Aktíva priemyselnej výroby

Metóda vzdialeného suseda

Riešenie problému klastrovej analýzy - "METÓDA VZDIALENEJ SUSEDY"

Počiatočné údaje

kde x1 je objem produktov;

х2 - priemerné ročné náklady na hlavnú

Aktíva priemyselnej výroby

Predkladanie a predspracovanie znaleckých posudkov

V praxi sa používa niekoľko typov hodnotenia:

- vysoká kvalita (často-zriedkavo, horšie-lepšie, áno-nie),

- odhady mierky (rozsahy hodnôt 50-75, 76-90, 91-120 atď.),

Skóre z daného intervalu (od 2 do 5, 1 -10), vzájomne nezávislé,

Zoradené (objekty sú usporiadané odborníkom v určitom poradí a každému je pridelené poradové číslo - hodnosť),

Porovnávací, získaný jednou z porovnávacích metód

metóda sekvenčného porovnávania

metóda párového porovnávania faktorov.

V ďalšom kroku spracovania znaleckých posudkov je potrebné vyhodnotiť mieru konzistentnosti týchto názorov.

Odhady získané od expertov možno považovať za náhodnú premennú, ktorej rozdelenie odráža názory expertov na pravdepodobnosť konkrétneho výberu udalosti (faktora). Preto sa na analýzu rozptylu a konzistentnosti odborných odhadov používajú zovšeobecnené štatistické charakteristiky - priemery a miery rozptylu:

Stredná štvorcová chyba,

Variačný rozsah min - max,

- variačný koeficient V = stredná kvadratická odchýlka / priemerný aritmus. (vhodné pre akýkoľvek typ hodnotenia)

V i = σ i / x i priem

Pre sadzbu miery podobnosti ale názory každý pár odborníkov možno použiť rôzne metódy:

asociačné koeficienty, pomocou ktorého sa zohľadňuje počet zhodných a nezhodujúcich sa odpovedí,

koeficienty nekonzistencie znalecké posudky,

Všetky tieto opatrenia možno použiť buď na porovnanie názorov dvoch expertov, alebo na analýzu vzťahu medzi sériou hodnotení z dvoch dôvodov.

Koeficient poradovej korelácie Spearmanovho páru:

kde n je počet odborníkov,

c k - rozdiel medzi odhadmi i-tého a j-tého experta pre všetky T faktory

Kendallov koeficient poradovej korelácie (koeficient zhody) poskytuje celkové hodnotenie konzistentnosti názorov všetkých expertov na všetky faktory, ale len pre prípady, keď sa použili odhady poradia.

Je dokázané, že hodnota S, keď všetci experti uvádzajú rovnaké odhady všetkých faktorov, má maximálnu hodnotu rovnú

kde n je počet faktorov,

m je počet odborníkov.

Koeficient zhody sa rovná pomeru

navyše, ak sa W blíži k 1, potom všetci experti poskytli dostatočne konzistentné odhady, inak sa ich názory nezhodujú.

Vzorec na výpočet S je uvedený nižšie:

kde r ij sú odhady poradia i-tého faktora j-tým odborníkom,

r cf je priemerné poradie v rámci celej matice odhadov a rovná sa

A preto vzorec na výpočet S môže mať tvar:

Ak sa jednotlivé hodnotenia jedného odborníka zhodujú a pri spracovaní boli štandardizované, potom sa na výpočet koeficientu zhody použije iný vzorec:



kde Tj sa vypočíta pre každého odborníka (v prípade, že sa jeho hodnotenia opakovali pre rôzne objekty), pričom sa zohľadňujú opakovania podľa nasledujúcich pravidiel:

kde t j je počet skupín rovnakého postavenia pre j-tého odborníka a

h k - počet rovnakých radov v k-tej skupine príbuzných radov j-tého odborníka.

PRÍKLAD. Nechajte 5 odborníkov na šesť faktorov odpovedať v poradí, ako je uvedené v tabuľke 3:

Tabuľka 3 - Odpovede odborníkov

Odborníci О1 О2 O3 О4 O5 O6 Súčet hodnotení podľa experta
E1
E2
E3
E4
E5

Vzhľadom na to, že nebolo dosiahnuté presné poradie (hodnotenia od expertov sa opakujú a súčty poradí nie sú rovnaké), pretransformujeme odhady a získame súvisiace poradie (tabuľka 4):

Tabuľka 4 - Súvisiace poradia odborných posudkov

Odborníci О1 О2 O3 О4 O5 O6 Súčet hodnotení podľa experta
E1 2,5 2,5
E2
E3 1,5 1,5 4,5 4,5
E4 2,5 2,5 4,5 4,5
E5 5,5 5,5
Súčet radov objektu 7,5 9,5 23,5 29,5

Teraz určme mieru súladu znaleckých posudkov pomocou koeficientu zhody. Keďže poradia spolu súvisia, vypočítame W podľa vzorca (**).

Potom r cf = 7 * 5/2 = 17,5

S = 10 2 +8 2 +4,5 2 +4,5 2 +6 2 +12 2 = 384,5

Poďme k výpočtom W. Na tento účel počítame oddelene hodnoty T j. V príklade sú hodnotenia špeciálne vybrané tak, že každý expert má opakované hodnotenia: prvý má dva, druhý tri, tretí má dve skupiny po dvoch hodnoteniach a štvrtý má dve rovnaké hodnotenia. teda:

Ti = 2 3 - 2 = 6 T5 = 6

T2 = 3 3 - 3 = 24

Т 3 = 2 3 –2+ 2 3 –2 = 12 Т 4 = 12

Vidíme, že zhoda názorov odborníkov je pomerne vysoká a môžeme pristúpiť k ďalšej fáze štúdie - zdôvodnenie a prijatie alternatívy rozhodnutia odporúčanej odborníkmi.

V opačnom prípade sa musíte vrátiť ku krokom 4-8.

KENDALLA KORELAČNÝ KORELAČNÝ KOEFICIENT

Jedna z výberových mier závislosti dvoch náhodných premenných (znakov) X a Y, na základe poradia položiek vzorky (X 1, Y x), .. ., (X n, Y n). K. až R. odkazuje teda na hodnosť štatistikov a je určený vzorcom

kde RI- U patríte k tomuto páru ( X, Y), pre roj Xravenov i, S = 2N- (n-1) / 2, N je počet prvkov vzorky, pre ktoré súčasne j> i a r j> r i... Je vždy Ako selektívne meradlo závislosti To. To. R. to. široko používal M. Kendall (M. Kendall, pozri).

K. až R. K. sa používa na testovanie hypotézy nezávislosti náhodných premenných. Ak je hypotéza nezávislosti pravdivá, potom Et = 0 a Dt = 2 (2n + 5) / 9n (n-1). Pri malej veľkosti vzorky je kontrola štatistická. hypotéza nezávislosti sa robí pomocou špeciálnych tabuliek (pozri). Pre n> 10 sa na rozdelenie m použije normálna aproximácia: ak

potom je hypotéza nezávislosti zamietnutá, inak je prijatá. Tu a . - hladina významnosti, u a / 2 je percentuálny bod normálneho rozdelenia. K. až R. Pretože, ako každý iný, môže byť použitý na zistenie závislosti dvoch kvalitatívnych znakov, ak sa dajú zoradiť iba prvky vzorky vzhľadom na tieto znaky. Ak X, Y majú spoločnú normálu s korelačným koeficientom p, potom vzťah medzi K. a p. do. a má tvar:

pozri tiež Spearmanova poradová korelácia, poradový test.

Lit.: Kendal M., Rank correlations, trans. z angličtiny, M., 1975; Van der Waerden B.L., Matematický, prekl. z toho, M., 1960; Bol'shev L.N., Smirnov N.V., Tabuľky matematickej štatistiky, Moskva, 1965.

A. V. Prochorov.


Encyklopédia matematiky. - M .: Sovietska encyklopédia... I. M. Vinogradov. 1977-1985.

Zistite, čo je „KENDALLA RANK CORRELATION COEFFICIENT“ v iných slovníkoch:

    Angličtina. с efektívny, korelácia hodnosti Kendall; nemecký Kendalls Rangkorrelationskoeffizient. Korelačný koeficient, ktorý určuje mieru zhody zoradenia všetkých dvojíc objektov v dvoch premenných. antinacistický. Encyklopédia sociológie, 2009 ... Encyklopédia sociológie

    KENDALLOV KORELAČNÝ KORELAČNÝ KOEFICIENT- Angličtina. efektívny, rank korelácia Kendall; nemecký Kendalls Rangkorrelationskoeffizient. Korelačný koeficient, ktorý určuje mieru zhody usporiadania všetkých párov objektov v dvoch premenných ... Výkladový slovník sociológie

    Miera závislosti dvoch náhodných premenných (znakov) X a Y na základe poradia výsledkov nezávislých pozorovaní (X1, Y1). ... (Xn, Yn). Ak sú rady hodnôt X umiestnené v prirodzenom poradí i = 1,. ... ., n a Ri poradie Y zodpovedajúce ... ... Encyklopédia matematiky

    Korelačný koeficient- (Korelačný koeficient) Korelačný koeficient je štatistický ukazovateľ závislosti dvoch náhodných veličín Stanovenie korelačného koeficientu, typy korelačných koeficientov, vlastnosti korelačného koeficientu, výpočet a aplikácia ... ... Encyklopédia investorov

    Vzťah medzi náhodnými premennými, ktorý vo všeobecnosti nie je striktne funkčný. Na rozdiel od funkčnej závislosti sa K. spravidla zvažuje, keď jedna z veličín závisí nielen od tejto druhej, ale aj ... ... Encyklopédia matematiky

    Korelácia (korelačná závislosť) je štatistický vzťah dvoch alebo viacerých náhodných premenných (alebo veličín, ktoré možno za také považovať s určitou prijateľnou mierou presnosti). V tomto prípade zmeny hodnôt jedného alebo ... ... Wikipedia

    Korelácia- (Korelácia) Korelácia je štatistický vzťah dvoch alebo viacerých náhodných premenných Koncept korelácie, typy korelácií, korelačný koeficient, korelačná analýza, cenová korelácia, korelácia menových párov na Forexe Obsah ... ... Encyklopédia investorov

    Všeobecne sa uznáva, že začiatkom S. z m. Storočia. alebo, ako sa to často nazýva, štatistika „malého n“, bola vložená do prvej dekády XX storočia publikovaním práce W. Gosseta, v ktorej umiestnil distribúciu t, ktorú predpokladali tí, ktorí dostali svet o niečo neskôr...... Psychologická encyklopédia

    Maurice Kendall Sir Maurice George Kendall Dátum narodenia: 6. september 1907 (1907 09 06) Miesto narodenia: Kettering, Spojené kráľovstvo Dátum úmrtia ... Wikipedia

    Predpoveď- (Forecast) Definícia prognózy, úlohy a princípy prognózovania Definícia prognózy, úlohy a princípy prognózovania, metódy prognózovania Obsah Obsah Definícia Základné pojmy prognózovania Úlohy a princípy prognózovania ... ... Encyklopédia investorov