Koeficijenti korelacije Spearmanovih, Kendallovih rangova, Fechnerov koeficijent. Koeficijenti korelacije ranga Kendall i Spearman Koeficijenti korelacije ranga Spearman i Spearman

Koristi se za identifikaciju odnosa između kvantitativnih ili kvalitativnih indikatora, ako se mogu rangirati. Vrijednosti indikatora X postavljaju se uzlaznim redoslijedom i dodjeljuju im se rangovi. Vrijednosti Y indikatora se rangiraju i izračunava se Kendall koeficijent korelacije:

gdje S = PQ.

P veliki vrijednost ranga Y.

Q- ukupan broj zapažanja nakon tekućih zapažanja sa manji vrijednost ranga Y. (jednaki rangovi se ne računaju!)

Ako se proučavani podaci ponavljaju (imaju iste rangove), tada se u proračunima koristi Kendallov korigirani koeficijent korelacije:

t- broj povezanih činova u redu X i Y, respektivno.

19. Šta treba da bude polazna tačka pri definisanju teme, objekta, predmeta, cilja, ciljeva i hipoteze istraživanja?

Program istraživanja, po pravilu, ima dva dijela: metodološki i proceduralni. Prvi uključuje potkrepljivanje relevantnosti teme, formulisanje problema, definisanje objekta i predmeta, ciljeva i zadataka istraživanja, formulisanje osnovnih pojmova (kategorijalni aparat), preliminarnu sistematsku analizu objekta istraživanja i postavljanje radne hipoteze. Drugi dio otkriva strateški plan istraživanja, kao i plan i osnovne procedure za prikupljanje i analizu primarnih podataka.

Prije svega, pri odabiru teme istraživanja, mora se polaziti od relevantnosti. Obrazloženje relevantnosti uključuje ukazivanje na potrebu i blagovremenost proučavanja i rješavanja problema za dalji razvoj teorije i prakse nastave i odgoja. Aktualna istraživanja pružaju odgovore na najhitnija pitanja u ovom trenutku, odražavaju društveni poredak društva pedagoškoj nauci i otkrivaju najvažnije kontradikcije koje se dešavaju u praksi. Kriterijum relevantnosti je dinamičan, mobilan, zavisi od vremena, uzimajući u obzir specifične i specifične okolnosti. U svom najopštijem obliku, relevantnost karakteriše stepen neslaganja između potražnje za naučnim idejama i praktičnim preporukama (za zadovoljavanje određene potrebe) i predloga koje nauka i praksa mogu da daju u ovom trenutku.

Najuvjerljivija osnova koja definira temu istraživanja je društveni poredak, koji odražava najakutnije, društveno značajne probleme koji zahtijevaju hitna rješenja. Društveni poredak zahtijeva obrazloženje određene teme. Obično je ovo analiza stepena razrađenosti nekog pitanja u nauci.

Ako društveni poredak slijedi iz analize pedagoške prakse, onda on sam naučni problem je u drugoj ravni. Ona izražava glavnu kontradikciju koja se mora riješiti pomoću nauke. Rješenje problema je obično svrha studije. Cilj je preformulisani problem.

Formulacija problema podrazumijeva odabir objekta istraživanja. To može biti pedagoški proces, područje pedagoške stvarnosti ili neka vrsta pedagoškog stava koji sadrži kontradiktornost. Drugim riječima, objekt može biti bilo šta što eksplicitno ili implicitno sadrži kontradikciju i stvara problemsku situaciju. Objekt je ono na što je usmjeren proces spoznaje. Predmet studija - dio, strana objekta. To su najznačajnija sa praktične ili teorijske tačke gledišta, svojstva, aspekti, karakteristike predmeta koji su predmet neposrednog proučavanja.

U skladu sa svrhom, objektom i predmetom istraživanja, istraživanje zadaci, koji su po pravilu usmjereni na provjeru hipoteze. Potonji je skup teorijski zasnovanih pretpostavki, čija je istinitost podložna provjeri.

Kriterijum naučna novina može se koristiti za procjenu kvaliteta završenih studija. Karakterizira nove teorijske i praktične zaključke, obrasce obrazovanja, njegovu strukturu i mehanizme, sadržaje, principe i tehnologije, koji u ovom trenutku nisu bili poznati i nisu zabilježeni u pedagoškoj literaturi. Novost istraživanja može imati i teorijski i praktični značaj. Teorijska vrijednost istraživanja je u kreiranju koncepta, dobijanju hipoteze, pravilnosti, metode, modela za identifikaciju problema, tendencije, smjera. Praktični značaj istraživanja je u pripremi prijedloga, preporuka i sl. Kriterijumi novine, teorijske i praktične važnosti mijenjaju se u zavisnosti od vrste istraživanja, a zavise i od vremena sticanja novih znanja.

Koeficijent korelacije ranga karakteriše opštu prirodu nelinearne zavisnosti: povećanje ili smanjenje efektivne osobine sa povećanjem faktora jedan. Ovo je pokazatelj čvrstoće monotone nelinearne veze.

Svrha usluge... Ovaj online kalkulator izračunava Kendallov koeficijent korelacije ranga prema svim osnovnim formulama, kao i ocjenu njegovog značaja.

Uputstvo. Navedite količinu podataka (broj redova). Rezultirajuće rješenje se pohranjuje u Word datoteku.

Koeficijent koji je predložio Kendall izgrađen je na osnovu relacija tipa "više-manje", čija je valjanost utvrđena pri konstruisanju skala.
Odaberimo nekoliko objekata i uporedimo njihove rangove u jednom i drugom atributu. Ako, prema ovom kriteriju, rangovi formiraju direktan red (odnosno red prirodnog niza), tada se paru dodjeljuje +1, ako je suprotno, onda –1. Za odabrani par, odgovarajuće plus - minus jedinice (po atributu X i po atributu Y) se množe. Rezultat je očigledno +1; ako se rangovi para oba svojstva nalaze u istom nizu, a –1 ako su obrnuti.
Ako su redosljedi rangova isti za sve parove po oba kriterija, tada je zbir jedinica dodijeljenih svim parovima objekata maksimalan i jednak je broju parova. Ako je redoslijed ranga svih parova obrnut, onda –C 2 N. U opštem slučaju, C 2 N = P + Q, gde je P broj pozitivnih, a Q broj negativnih koji se dodeljuju parovima kada se porede njihov rang za oba kriterijuma.
Količina se naziva Kendallov koeficijent.
Iz formule se vidi da je koeficijent τ razlika između udjela parova objekata u kojima je redoslijed isti u oba kriterija (u odnosu na broj svih parova) i udjela parova objekata u kojima je poredak nije isti.
Na primjer, vrijednost koeficijenta 0,60 znači da 80% parova ima isti redoslijed objekata, dok 20% nema (80% + 20% = 100%; 0,80 - 0,20 = 0,60). One. τ se može tumačiti kao razlika između vjerovatnoća slučajnosti i nepodudarnosti redosljeda u oba znaka za slučajno odabrani par objekata.
U opštem slučaju, izračunavanje τ (tačnije, P ili Q) čak i za N reda veličine 10 pokazuje se glomaznim.
Hajde da pokažemo kako pojednostaviti proračune.


Primjer. Odnos između obima industrijske proizvodnje i ulaganja u osnovna sredstva u 10 regiona jednog od federalnih okruga Ruske Federacije u 2003. godini karakterišu sledeći podaci:


Izračunajte koeficijente korelacije ranga Spearman i Kendal. Provjerite njihovu značajnost na α = 0,05. Formulirajte zaključak o odnosu između obima industrijske proizvodnje i ulaganja u osnovna sredstva u razmatranim regijama Ruske Federacije.

Rješenje... Dodijelimo rangove atributu Y i faktoru X.


Hajde da sortiramo podatke po X.
U redu Y desno od 3 nalazi se 7 rangova koji prelaze 3, stoga će 3 generirati termin 7 u P.
Desno od 1 nalazi se 8 rangova koji prelaze 1 (ovo su 2, 4, 6, 9, 5, 10, 7, 8), tj. 8 će unijeti P, i tako dalje. Kao rezultat, R = 37 i koristeći formule imamo:

XYrang X, d xrang Y, d yPQ
18.4 5.57 1 3 7 2
20.6 2.88 2 1 8 0
21.5 4.12 3 2 7 0
35.7 7.24 4 4 6 0
37.1 9.67 5 6 4 1
39.8 10.48 6 9 1 3
51.1 8.58 7 5 3 0
54.4 14.79 8 10 0 2
64.6 10.22 9 7 1 0
90.6 10.45 10 8 0 0
37 8


Po pojednostavljenim formulama:




gdje je n veličina uzorka; z kp je kritična tačka bilateralne kritične oblasti, koja se nalazi iz tabele Laplaceove funkcije jednakošću F (z kp) = (1-α) / 2.
Ako |τ |< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - nulta hipoteza se odbacuje. Postoji značajna rang korelacija između kvalitativnih karakteristika.
Naći kritičnu tačku z kp
F (z kp) = (1-α) / 2 = (1 - 0,05) / 2 = 0,475

Hajde da pronađemo kritičnu tačku:

Pošto je τ> T kp - odbacujemo nultu hipotezu; rang korelacija između rezultata na dva testa je značajna.

Primjer. Na osnovu podataka o obimu samostalno izvedenih građevinskih i instalaterskih radova i broju zaposlenih u 10 građevinskih kompanija u jednom od gradova Ruske Federacije, utvrditi odnos između ovih znakova koristeći Kendal koeficijent.

Rješenje pronađite pomoću kalkulatora.
Dodijelimo rangove atributu Y i faktoru X.
Složimo objekte tako da njihovi X rangovi predstavljaju prirodni niz. Budući da su procjene dodijeljene svakom paru ove serije pozitivne, vrijednosti "+1" uključene u P će biti generisane samo od onih parova čiji rangovi u Y formiraju direktan poredak.
Lako ih je izračunati uzastopnim poređenjem rangova svakog objekta u Y redu sa čeličnim.
Kendall koeficijent.

U opštem slučaju, izračunavanje τ (tačnije, P ili Q) čak i za N reda veličine 10 pokazuje se glomaznim. Hajde da pokažemo kako pojednostaviti proračune.

ili

Rješenje.
Hajde da sortiramo podatke po X.
U redu Y desno od 2 nalazi se 8 rangova koji prelaze 2, stoga će 2 generirati termin 8 u P.
Desno od 4 nalazi se 6 rangova koji prelaze 4 (ovo su 7, 5, 6, 8, 9, 10), tj. 6 će unijeti P, i tako dalje. Kao rezultat, P = 29 i koristeći formule imamo:

XYrang X, d xrang Y, d yPQ
38 292 1 2 8 1
50 302 2 4 6 2
52 366 3 7 3 4
54 312 4 5 4 2
59 359 5 6 3 2
61 398 6 8 2 2
66 401 7 9 1 2
70 298 8 3 1 1
71 283 9 1 1 0
73 413 10 10 0 0
29 16


Po pojednostavljenim formulama:


Da bismo testirali nultu hipotezu o jednakosti Kendallovog generalnog koeficijenta korelacije ranga nuli na nivou značajnosti α sa konkurentskom hipotezom H 1: τ ≠ 0, potrebno je izračunati kritičnu tačku:

gdje je n veličina uzorka; z kp je kritična tačka dvostranog kritičnog područja, koja se nalazi iz tabele Laplaceove funkcije jednakošću F (z kp) = (1 - α) / 2.
Ako |τ | T kp - nulta hipoteza se odbacuje. Postoji značajna rang korelacija između kvalitativnih karakteristika.
Naći kritičnu tačku z kp
F (z kp) = (1 - α) / 2 = (1 - 0,05) / 2 = 0,475
Koristeći Laplaceovu tablicu, nalazimo z kp = 1,96
Hajde da pronađemo kritičnu tačku:

Pošto je τ

Potrebe ekonomske i društvene prakse zahtijevaju razvoj metoda za kvantitativni opis procesa koji omogućavaju tačnu registraciju ne samo kvantitativnih, već i kvalitativnih faktora. Pod uslovom da se vrednosti kvalitativnih karakteristika mogu poredati, ili rangirati po stepenu smanjenja (povećanja) karakteristike, moguće je proceniti bliskost odnosa između kvalitativnih karakteristika. Kvalitativna znači karakteristika koja se ne može precizno izmjeriti, ali vam omogućava da uporedite objekte jedan s drugim i, stoga, rasporedite ih u opadajućem ili rastućem redoslijedu kvalitete. A stvarni sadržaj mjerenja na ljestvici ranga je redosljed kojim su objekti raspoređeni prema ozbiljnosti mjerenog svojstva.

U praktične svrhe, upotreba rang korelacije je vrlo korisna. Na primjer, ako se uspostavi korelacija visokog ranga između dvije kvalitativne karakteristike proizvoda, onda je dovoljno kontrolirati proizvode samo po jednom od svojstava, što kontrolu čini jeftinijom i bržom.

Kao primjer možemo uzeti u obzir postojanje veze između dostupnosti komercijalnih proizvoda određenog broja preduzeća i režijskih troškova za prodaju. U toku 10 posmatranja dobijena je sledeća tabela:

Rasporedimo vrijednosti X u rastućem redoslijedu, pri čemu svaka vrijednost dodjeljuje svoj redni broj (rang) svakoj vrijednosti:

dakle,

Napravimo sljedeću tabelu u kojoj su upisani parovi X i Y, dobijeni kao rezultat posmatranja sa njihovim rangovima:

Označavajući razliku u rangovima kao, pišemo formulu za izračunavanje koeficijenta korelacije Spearmanovog uzorka:

gdje je n broj opservacija, to je i broj parova rangova.

Spearmanov koeficijent ima sljedeća svojstva:

Ako postoji potpuna direktna veza između kvalitativnih karakteristika X i Y u smislu da se rangovi objekata poklapaju za sve vrijednosti i, tada je Spearmanov koeficijent korelacije uzorka 1. Zaista, zamjenom ga u formulu, dobijamo 1.

Ako postoji potpuna inverzna veza između kvalitativnih karakteristika X i Y u smislu da rang odgovara rangu, tada je Spearmanov koeficijent korelacije uzorka -1.

Zaista, ako

Zamjenom vrijednosti u formuli Spearmanovog koeficijenta korelacije dobijamo -1.

Ako ne postoji ni potpuna direktna ni potpuna povratna informacija između kvalitativnih karakteristika, tada je Spearmanov koeficijent korelacije uzorka između -1 i 1, a što je njegova vrijednost bliža 0, to je manja povezanost između karakteristika.

Prema gornjem primjeru, naći ćemo vrijednost P, za to ćemo popuniti tablicu s vrijednostima i:

Kendallov koeficijent korelacije uzorka. Možete procijeniti odnos između dvije kvalitativne karakteristike koristeći Kendallov koeficijent korelacije ranga.

Neka su rangovi objekata uzorka veličine n jednaki:

na osnovu X:

na osnovu Y:. Pretpostavimo da se desno nalaze činovi, veliki, desno su činovi, veliki, desno su činovi, veliki. Hajde da uvedemo notaciju za zbir rangova

Slično, uvodimo zapis kao zbir broja rangova koji leže desno, ali manje.

Kendallov koeficijent korelacije uzorka piše se formulom:

Gdje je n veličina uzorka.

Kendallov koeficijent ima ista svojstva kao i Spearmanov koeficijent:

Ako postoji potpuna direktna veza između kvalitativnih obilježja X i Y u smislu da se rangovi objekata poklapaju za sve vrijednosti i, tada je Kendallov koeficijent korelacije uzorka 1. Zaista, desno se nalazi n-1 činovi, veliki, dakle, na isti način utvrđujemo, šta. Onda. A Kendallov koeficijent je:.

Ako postoji potpuna inverzna veza između kvalitativnih karakteristika X i Y u smislu da rang odgovara rangu, tada je Kendallov koeficijent korelacije uzorka -1. Desno nema činova, dakle velikih. Isto tako. Zamjenom vrijednosti R + = 0 u formulu Kendalovog koeficijenta, dobijamo -1.

Uz dovoljno veliku veličinu uzorka i sa vrijednostima koeficijenata rang korelacije koja nije blizu 1, dolazi do približne jednakosti:

Da li Kendallov koeficijent daje konzervativniju procjenu korelacije od Spearmanovog koeficijenta? (numerička vrijednost? je uvijek manja od). Prilikom izračunavanja koeficijenta? manje naporan od izračunavanja koeficijenta, potonje je lakše ponovo izračunati ako se seriji doda novi član.

Važna prednost koeficijenta je u tome što se može koristiti za određivanje koeficijenta korelacije privatnog ranga, što omogućava procjenu stepena "čiste" međupovezanosti dvije karakteristike ranga, eliminirajući utjecaj trećeg:

Značaj koeficijenata rang korelacije. Prilikom određivanja jačine rang korelacije na osnovu podataka uzorka potrebno je razmotriti sljedeće pitanje: s kojim se stupnjem pouzdanosti može osloniti na zaključak da postoji korelacija u opštoj populaciji ako je određeni koeficijent rang korelacije uzorka dobijeno. Drugim rečima, značajnost posmatranih rang korelacija treba proveriti na osnovu hipoteze da su dva rangiranja koja se razmatraju statistički nezavisna.

Sa relativno velikom veličinom uzorka n, značajnost koeficijenata rang korelacije može se provjeriti korištenjem tabele normalne distribucije (Dodatak Tabela 1). Da testiram značaj Spearmanovog koeficijenta? (za n> 20) izračunajte vrijednost

i testirati značaj Kendalovog koeficijenta? (za n> 10) izračunajte vrijednost

gdje je S = R + - R-, n je veličina uzorka.

Zatim se postavlja nivo značajnosti, kritična vrednost tcr (?, K) se određuje iz tabele kritičnih tačaka Studentove distribucije i izračunate vrednosti ili se poredi sa njom. Pretpostavlja se da je broj stepeni slobode k = n-2. Ako ili>tcr, tada se vrijednosti ili smatraju značajnim.

Fechnerov koeficijent korelacije.

Na kraju treba spomenuti i Fechnerov koeficijent, koji karakterizira elementarni stupanj čvrstoće veze, koji je preporučljivo koristiti za utvrđivanje činjenice veze kada postoji mala količina početnih informacija. Osnova za njegovo izračunavanje je uzimanje u obzir smjera odstupanja od aritmetičke sredine varijanti svake varijacione serije i određivanje konzistentnosti predznaka ovih odstupanja za dvije serije, među kojima se mjeri odnos.

Ovaj koeficijent je određen formulom:

gdje je na broj podudarnosti znakova odstupanja pojedinačnih vrijednosti od njihove aritmetičke sredine; nb - odnosno broj neusklađenosti.

Fechnerov koeficijent može varirati između -1,0<= Кф<= +1,0.

Primijenjeni aspekti korelacije rangova. Kao što je već napomenuto, koeficijenti korelacije ranga mogu se koristiti ne samo za kvalitativnu analizu odnosa između dvije karakteristike ranga, već i za određivanje jačine veze između ranga i kvantitativnih karakteristika. U ovom slučaju, vrijednosti kvantitativne karakteristike se sortiraju i dodjeljuju im se odgovarajući rangovi.

Postoji niz situacija kada je izračunavanje koeficijenata rang korelacije preporučljivo i pri određivanju jačine veze između dva kvantitativne karakteristike. Dakle, uz značajno odstupanje distribucije jednog od njih (ili oba) od normalne distribucije, određivanje nivoa značajnosti koeficijenta korelacije uzorka r postaje netačno, dok koeficijenti ranga? i? ne podliježu takvim ograničenjima prilikom određivanja nivoa značaja.

Druga situacija ove vrste nastaje kada je odnos između dvije kvantitativne karakteristike nelinearan (ali monoton). Ako je broj objekata u uzorku mali ili ako je predznak veze važan za istraživača, onda se koristi korelacijski odnos? ovdje može biti neadekvatno. Izračunavanje koeficijenta rang korelacije omogućava da se zaobiđu naznačene poteškoće.

Praktični dio

Zadatak 1. Korelaciono-regresiona analiza

Iskaz i formalizacija problema:

Dat je empirijski uzorak, sastavljen na osnovu niza zapažanja stanja opreme (za kvar) i broja proizvedenih proizvoda. Uzorak implicitno karakterizira odnos između količine opreme koja je otkazala i broja proizvedenih artikala. Prema značenju uzorka, jasno je da se proizvedeni proizvodi proizvode na opremi koja ostaje u funkciji, jer što je više% opreme koja je otkazala, to je manje proizvedenih proizvoda. Potrebno je provesti istraživanje uzorka na korelaciono-regresijsku ovisnost, odnosno utvrditi oblik ovisnosti, ocijeniti regresionu funkciju (regresiona analiza), kao i identificirati odnos između slučajnih varijabli i ocijeniti njegovu čvrstoću. (analiza korelacije). Dodatni zadatak korelacione analize je procena regresione jednačine jedne varijable za drugu. Osim toga, potrebno je predvidjeti broj proizvedenih proizvoda sa 30% kvara opreme.

Formalizirajmo dati uzorak u tabeli, označavajući podatke "Kvar opreme,%" kao X, podatke "Broj proizvoda" kao Y:

Početni podaci. Tabela 1

Prema fizičkom značenju problema, vidi se da broj proizvedenih proizvoda Y direktno zavisi od % kvara opreme, odnosno postoji zavisnost Y od X. Prilikom provođenja regresione analize potrebno je pronaći matematički odnos (regresiju) koji povezuje vrijednosti X i Y. U ovom slučaju, regresiona analiza, u Za razliku od korelacije, pretpostavlja da X vrijednost djeluje kao nezavisna varijabla, odnosno faktor, Y vrijednost - kao zavisan od njega, ili efikasan znak. Dakle, potrebno je sintetizirati adekvatan ekonomsko-matematički model, tj. odrediti (pronaći, odabrati) funkciju Y = f (X), koja karakterizira odnos između vrijednosti X i Y, pomoću koje će biti moguće predvidjeti vrijednost Y na X = 30. Ovaj problem može biti riješeno korištenjem korelaciono-regresijske analize.

Kratak pregled metoda za rješavanje korelacijsko-regresijskih problema i obrazloženje odabrane metode rješenja.

Metode regresione analize se dijele na jednofaktorske i višefaktorske na osnovu broja faktora koji utiču na efektivnu osobinu. Univarijantna - broj nezavisnih faktora = 1, tj. Y = F (X)

multifaktorski - broj faktora > 1, tj.

Prema broju istraživanih zavisnih varijabli (efektivnih indikatora), regresijski problemi se takođe mogu podijeliti na zadatke sa jednim ili više efektivnih indikatora. Generalno, zadatak sa mnogo efikasnih karakteristika može se napisati:

Metoda korelaciono-regresijske analize sastoji se u pronalaženju parametara aproksimativne (aproksimativne) zavisnosti oblika

Pošto se u datom problemu pojavljuje samo jedna nezavisna varijabla, odnosno istražuje se zavisnost samo od jednog faktora koji utiče na rezultat, trebalo bi primeniti studiju za jednosmernu zavisnost, odnosno regresiju para.

Ako postoji samo jedan faktor, zavisnost se definiše kao:

Oblik pisanja specifične regresione jednadžbe ovisi o izboru funkcije koja prikazuje statistički odnos između faktora i efektivnog indikatora i uključuje sljedeće:

linearna regresija, jednadžba oblika,

parabolična, jednačina oblika

kubni, jednadžba oblika

hiperbolička, jednačina oblika

semilogaritamska, jednadžba oblika

eksponencijalna, jednačina oblika

potencijskog zakona, jednačina oblika.

Pronalaženje funkcije se svodi na određivanje parametara regresione jednadžbe i procjenu pouzdanosti same jednačine. Da biste odredili parametre, možete koristiti i metodu najmanjih kvadrata i metodu najmanjeg modula.

Prvi od njih je da je zbroj kvadrata odstupanja empirijskih vrijednosti Yi od izračunatih srednjih vrijednosti Yi minimalan.

Metoda najmanjeg modula sastoji se u minimiziranju sume modula razlike između empirijskih vrijednosti Yi i izračunatih srednjih vrijednosti Yi.

Da bismo riješili problem, izabraćemo metod najmanjih kvadrata, jer je najjednostavniji i daje dobre procjene u smislu statističkih svojstava.

Tehnologija rješavanja problema regresione analize metodom najmanjih kvadrata.

Moguće je odrediti vrstu zavisnosti (linearna, kvadratna, kubična, itd.) između varijabli procjenom odstupanja stvarne vrijednosti y od izračunate:

gdje je - empirijske vrijednosti, - izračunate vrijednosti aproksimirajućom funkcijom. Procjenjujući vrijednosti Si za različite funkcije i birajući najmanju od njih, odabiremo aproksimirajuću funkciju.

Tip funkcije se određuje pronalaženjem koeficijenata koji se nalaze za svaku funkciju kao rješenje određenog sistema jednadžbi:

linearna regresija, jednadžba oblika, sistem -

parabolično, jednačina oblika, sistem -

kubni, jednadžba oblika, sistem -

Nakon što smo riješili sistem, nalazimo, uz pomoć kojih dolazimo do specifičnog izraza analitičke funkcije, posjedujući koju, nalazimo izračunate vrijednosti. Dalje, postoje svi podaci za pronalaženje procjene vrijednosti odstupanja S i analizu za minimum.

Za linearni odnos, procjenjujemo bliskost veze između faktora X i efektivnog indikatora Y u obliku koeficijenta korelacije r:

Prosječna vrijednost indikatora;

Prosječna vrijednost faktora;

y je eksperimentalna vrijednost indikatora;

x je eksperimentalna vrijednost faktora;

Standardna devijacija u x;

Standardna devijacija u y.

Ako je koeficijent korelacije r = 0, onda se vjeruje da je odnos između obilježja beznačajan ili ga nema, ako je r = 1, onda postoji vrlo visoka funkcionalna veza između obilježja.

Koristeći Chaddock tablicu, možete kvalitativno procijeniti čvrstoću korelacije između znakova:

Tablica čaddoka Tabela 2.

Za nelinearnu ovisnost određuju se korelacijski omjer (0 1) i korelacijski indeks R, koji se izračunavaju iz sljedećih ovisnosti.

gdje je vrijednost vrijednost indikatora izračunata zavisnošću od regresije.

Za procjenu tačnosti proračuna koristimo vrijednost prosječne relativne greške aproksimacije

Sa visokom preciznošću, nalazi se u rasponu od 0-12%.

Za procjenu izbora funkcionalne zavisnosti koristimo koeficijent determinacije

Koeficijent determinacije se koristi kao "generalizovana" mjera kvaliteta odabira funkcionalnog modela, jer izražava odnos između faktorske i ukupne varijanse, odnosno udio faktorske varijanse u ukupnoj.

Za procjenu značajnosti indeksa korelacije R koristi se Fišerov F test. Stvarna vrijednost kriterija određena je formulom:

gdje je m broj parametara regresione jednadžbe, n je broj opservacija. Vrijednost se upoređuje sa kritičnom vrijednošću koja se utvrđuje prema tabeli F-kriterijuma, uzimajući u obzir prihvaćeni nivo značajnosti i broj stupnjeva slobode i. Ako, onda se vrijednost indeksa korelacije R smatra značajnom.

Za odabrani oblik regresije izračunavaju se koeficijenti jednačine regresije. Radi praktičnosti, rezultati izračuna su uključeni u tablicu sljedeće strukture (općenito, broj stupaca i njihov izgled se mijenjaju ovisno o vrsti regresije):

Tabela 3

Rješenje problema.

Izvršena su zapažanja o ekonomskom fenomenu - ovisnosti oslobađanja proizvoda od procenta kvara opreme. Dobija se skup vrijednosti.

Odabrane vrijednosti su opisane u tabeli 1.

Gradimo graf empirijske zavisnosti za dati uzorak (slika 1)

Po vrsti grafa utvrđujemo da se analitička zavisnost može predstaviti kao linearna funkcija:

Izračunajmo koeficijent parne korelacije da bismo procijenili odnos između X i Y:

Napravimo pomoćnu tabelu:

Tabela 4

Rješavamo sistem jednačina da bismo pronašli koeficijente i:

iz prve jednačine, zamjenjujući vrijednost

u drugu jednačinu dobijamo:

Mi nalazimo

Dobijamo oblik regresione jednadžbe:

9. Za procjenu čvrstoće pronađene veze koristimo koeficijent korelacije r:

Prema Chaddock tabeli, utvrđujemo da je za r = 0,90 odnos između X i Y veoma visok, pa je i pouzdanost regresione jednačine takođe visoka. Za procjenu tačnosti proračuna koristimo vrijednost prosječne relativne greške aproksimacije:

Vjerujemo da vrijednost obezbjeđuje visok stepen pouzdanosti regresione jednačine.

Za linearni odnos između X i Y, indeks determinacije je jednak kvadratu koeficijenta korelacije r:. Shodno tome, 81% ukupne varijacije objašnjava se promjenom faktorske karakteristike X.

Za procjenu značajnosti indeksa korelacije R, koji je u slučaju linearne veze jednak po apsolutnoj vrijednosti koeficijentu korelacije r, koristi se Fisherov F-test. Stvarnu vrijednost određujemo pomoću formule:

gdje je m broj parametara regresione jednadžbe, n je broj opservacija. To jest, n = 5, m = 2.

Uzimajući u obzir prihvaćeni nivo značajnosti = 0,05 i broj stepeni slobode, dobijamo kritičnu tabelarnu vrednost. Budući da je vrijednost indeksa korelacije R prepoznata kao značajna.

Izračunajmo predviđenu vrijednost Y na X = 30:

Napravimo graf pronađene funkcije:

11. Odrediti grešku koeficijenta korelacije vrijednošću standardne devijacije

a zatim odredimo vrijednost normaliziranog odstupanja

Iz omjera >2 sa vjerovatnoćom od 95% možemo govoriti o značajnosti dobijenog koeficijenta korelacije.

Problem 2. Linearna optimizacija

Opcija 1.

Planom razvoja regiona predviđeno je da se u rad dovedu 3 naftna polja ukupnog obima proizvodnje od 9 miliona tona. Na prvom polju obim proizvodnje je najmanje milion tona, na drugom - 3 miliona tona, na trećem - 5 miliona tona. Za postizanje ove produktivnosti potrebno je izbušiti najmanje 125 bušotina. Za realizaciju ovog plana izdvojeno je 25 miliona rubalja. kapitalna ulaganja (indikator K) i 80 km cijevi (indikator L).

Potrebno je odrediti optimalan (maksimalni) broj bušotina kako bi se osigurala planirana produktivnost svakog polja. Početni podaci o zadatku dati su u tabeli.

Početni podaci

Izjava o problemu je data gore.

Hajde da formalizujemo uslove i ograničenja navedena u problemu. Cilj rješavanja ovog problema optimizacije je pronaći maksimalnu vrijednost proizvodnje nafte sa optimalnim brojem bušotina za svako polje, uzimajući u obzir postojeća ograničenja na problem.

Funkcija cilja, u skladu sa zahtjevima zadatka, imat će oblik:

gdje je broj bunara za svako polje.

Postojeća ograničenja zadatka za:

dužina polaganja cijevi:

broj bunara u svakom polju:

troškovi izgradnje 1 bunara:

Problemi linearne optimizacije rješavaju se, na primjer, sljedećim metodama:

Grafički

Simpleks metoda

Upotreba grafičke metode je zgodna samo kada se rješavaju problemi linearne optimizacije s dvije varijable. Kod većeg broja varijabli neophodna je upotreba algebarskog aparata. Razmotrimo opštu metodu za rešavanje problema linearne optimizacije koja se zove simpleks metoda.

Simpleks metoda je tipičan primjer iterativnih proračuna koji se koriste za rješavanje većine problema optimizacije. Razmatraju se iterativne procedure ove vrste koje osiguravaju rješavanje problema uz pomoć modela istraživanja operacija.

Za rješavanje problema optimizacije simpleks metodom potrebno je da broj nepoznanica Xi bude veći od broja jednačina, tj. sistem jednačina

zadovoljava relaciju m

A = je bilo jednako m.

Označimo stupac matrice A kao, a stupac slobodnih pojmova kao

Osnovno rješenje sistema (1) je skup od m nepoznanica koje su rješenje za sistem (1).

Ukratko, algoritam simpleks metode je opisan na sljedeći način:

Originalno ograničenje napisano kao nejednakost kao<= (=>) može se predstaviti kao jednakost dodavanjem rezidualne varijable na lijevu stranu ograničenja (oduzimanjem redundantne varijable s lijeve strane).

Na primjer, lijevo od originalnog ograničenja

uvodi se rezidualna varijabla, zbog čega se izvorna nejednakost pretvara u jednakost

Ako izvorno ograničenje određuje brzinu protoka cijevi, tada varijablu treba tumačiti kao ostatak ili neiskorišteni dio ovog resursa.

Maksimiziranje ciljne funkcije je ekvivalentno minimiziranju iste funkcije, uzete sa suprotnim predznakom. To jest, u našem slučaju

ekvivalentno

Simpleksna tabela se sastavlja za osnovno rešenje sledećeg oblika:

U ovoj tabeli je naznačeno da će nakon rješavanja problema u ovim ćelijama doći do osnovnog rješenja. - količnike dijeljenja stupca jednim od stupaca; - dodatni množitelji za nuliranje vrijednosti u ćelijama tablice koje se odnose na kolonu za rješavanje. - min vrijednost funkcije cilja -Z, - vrijednosti koeficijenata u funkciji cilja sa nepoznanicama.

Bilo koja pozitivna vrijednost nalazi se među značenjima. Ako to nije slučaj, onda se problem smatra riješenim. Bilo koja kolona tabele koja se nalazi u njoj je odabrana, ova kolona se zove "dozvoljena" kolona. Ako nema pozitivnih brojeva među elementima rješenog stupca, onda je problem nerješiv zbog neograničenosti ciljne funkcije na skupu njegovih rješenja. Ako su pozitivni brojevi prisutni u koloni za razrješavanje, idite na korak 5.

Kolona je popunjena razlomcima u čijem su brojiocu elementi kolone, a u nazivniku - odgovarajući elementi kolone za razrješenje. Odabire se najmanja od svih vrijednosti. Linija sa najmanjim rezultatom naziva se linija "omogući". Na raskrsnici linije za razrješenje i kolone za razrješenje nalazi se razlučujući element, koji je na neki način istaknut, na primjer, bojom.

Na osnovu prve simpleksne tabele sastavlja se sledeće u kojoj:

Zamjenjuje vektor reda vektorom stupca

permisivna linija je zamijenjena istom linijom podijeljenom permisivnim elementom

svaki od ostalih redova tabele je zamenjen zbirom ovog reda sa rezolutivnim, pomnoženim sa posebno odabranim dodatnim faktorom da bi se dobila 0 u ćeliji kolone za rešavanje.

Sa novom tabelom prelazimo na tačku 4.

Rješenje problema.

Na osnovu formulacije problema imamo sledeći sistem nejednakosti:

i ciljnu funkciju

Sistem nejednačina transformišemo u sistem jednačina uvođenjem dodatnih varijabli:

Svedujmo ciljnu funkciju na njen ekvivalent:

Napravimo originalnu simpleks tablicu:

Odaberimo permisivnu kolonu. Izračunajmo kolonu:

Vrijednosti unosimo u tabelu. Za najmanji od njih = 10 određujemo rezolucionu liniju:. Na presjeku linije za razrješavanje i kolone za razrješenje nalazimo element za rješavanje = 1. Dio tabele popunjavamo dodatnim faktorima, kao što su: red za rešavanje pomnožen njima, dodat ostatku redova tabele, formira 0 u elementima kolone za razrješenje.

Sastavljamo drugu simpleks tabelu:

Uzimamo kolonu za rješavanje u njoj, izračunavamo vrijednosti, unosimo ih u tabelu. Kao minimum, dobijamo liniju za razrješenje. Element rješavanja će biti 1. Pronađite dodatne faktore, popunite kolone.

Kreiramo sljedeću simpleks tablicu:

Slično, nalazimo kolonu za rješavanje, red za rješavanje i element za rješavanje = 2. Gradimo sljedeću simpleks tablicu:

Pošto nema pozitivnih vrijednosti u -Z redu, ova tablica je konačna. Prva kolona daje željene vrijednosti nepoznanica, tj. optimalno osnovno rešenje:

U ovom slučaju, vrijednost ciljne funkcije je -Z = -8000, što je ekvivalentno Zmax = 8000. Problem je riješen.

Zadatak 3. Klaster analiza

Formulacija problema:

Podijelite objekte na osnovu podataka navedenih u tabeli. Odabir metode rješenja vrši se samostalno, kako bi se izgradio graf ovisnosti podataka.

Opcija 1.

Početni podaci

Pregled metoda za rješavanje ove vrste problema. Opravdanje metode rješenja.

Zadaci klaster analize rješavaju se sljedećim metodama:

Unija ili metoda klasteriranja stabla koristi se za formiranje klastera "različitosti" ili "udaljenosti između objekata". Ove udaljenosti se mogu definirati u jednodimenzionalnom ili višedimenzionalnom prostoru.

Dvosmjerno kombinovanje se koristi (relativno rijetko) u okolnostima u kojima se podaci ne tumače u smislu „objekata“ i „svojstava objekata“, već u smislu opservacija i varijabli. Očekuje se da i posmatranja i varijable doprinesu otkrivanju značajnih klastera u isto vrijeme.

K-means metoda. Koristi se kada već postoji hipoteza o broju klastera. Možete reći sistemu da formira tačno, na primjer, tri klastera tako da budu što je moguće različitiji. Općenito, K-means metoda gradi tačno K različitih klastera koji se nalaze na najvećim mogućim udaljenostima jedan od drugog.

Postoje sljedeći načini mjerenja udaljenosti:

Euklidska udaljenost. Ovo je najčešći tip udaljenosti. To je jednostavno geometrijska udaljenost u višedimenzionalnom prostoru i izračunava se na sljedeći način:

Imajte na umu da se Euklidska udaljenost (i njen kvadrat) izračunavaju iz originalnih, a ne standardiziranih podataka.

Udaljenost gradskih blokova (udaljenost od Manhattana). Ova udaljenost je jednostavno prosjek koordinatnih razlika. U većini slučajeva, ova mjera udaljenosti dovodi do istih rezultata kao i za običnu euklidsku udaljenost. Imajte na umu, međutim, da se za ovu mjeru smanjuje utjecaj pojedinačnih velikih razlika (outliers) (pošto nisu na kvadrat). Udaljenost Manhattan se izračunava pomoću formule:

Čebiševljeva udaljenost. Ova udaljenost može biti korisna kada želite da definirate dva objekta kao "različita" ako se razlikuju u bilo kojoj koordinati (bilo kojoj jednoj dimenziji). Čebiševljeva udaljenost se izračunava po formuli:

Udaljenost snage. Ponekad se želi progresivno povećati ili smanjiti težinu koja se odnosi na dimenziju za koju su odgovarajući objekti vrlo različiti. Ovo se može postići korištenjem udaljenosti po stepenu. Udaljenost po stepenu se izračunava po formuli:

gdje su r i p korisnički definirani parametri. Nekoliko primjera proračuna može pokazati kako ova mjera "funkcioniše". Parametar p je odgovoran za postepeno ponderisanje razlika u pojedinačnim koordinatama, parametar r je odgovoran za progresivno ponderisanje velikih udaljenosti između objekata. Ako su oba parametra - r i p, jednaka dva, tada se ova udaljenost poklapa s euklidskom udaljenosti.

Procenat neslaganja. Ova mjera se koristi kada su podaci kategorični. Ova udaljenost se izračunava po formuli:

Da bismo riješili problem, izabraćemo metod objedinjavanja (klasteri u obliku stabla) kao onu koja najbolje ispunjava uslove i formulaciju problema (za podjelu objekata). Zauzvrat, sindikalna metoda može koristiti nekoliko varijanti pravila komunikacije:

Jedna veza (metoda najbližeg susjeda). U ovoj metodi, udaljenost između dva klastera određena je udaljenosti između dva najbliža objekta (najbližih susjeda) u različitim klasterima. To jest, bilo koja dva objekta u dva klastera su bliža jedan drugom od odgovarajuće udaljenosti veze. Ovo pravilo bi trebalo, na neki način, nizati objekte zajedno da formiraju klastere, a rezultirajući klasteri imaju tendenciju da budu dugački "lanci".

Potpuna komunikacija (metoda najudaljenijih susjeda). U ovoj metodi, udaljenost između klastera određena je najvećom udaljenosti između bilo koje dvije karakteristike u različitim klasterima (tj. "najdaljem susjedima").

Postoje i mnoge druge metode grupisanja poput ovih (npr. neponderisano uparivanje, ponderisano uparivanje, itd.).

Tehnologija metode rješenja. Izračunavanje indikatora.

U prvom koraku, kada je svaki objekt zaseban klaster, udaljenosti između ovih objekata određuju se odabranom mjerom.

Pošto u zadatku nisu navedene mjerne jedinice za karakteristike, pretpostavlja se da su iste. Stoga nema potrebe za normalizacijom početnih podataka, pa odmah prelazimo na izračunavanje matrice udaljenosti.

Rješenje problema.

Napravimo graf zavisnosti prema početnim podacima (slika 2)

Uzet ćemo uobičajenu euklidsku udaljenost kao udaljenost između objekata. Zatim prema formuli:

gdje je l - znakovi; k je broj karakteristika, udaljenost između objekata 1 i 2 je jednaka:

Nastavljamo računati preostale udaljenosti:

Napravimo tabelu od dobijenih vrednosti:

Najmanja udaljenost. To znači da kombinujemo elemente 3, 6 i 5 u jedan klaster. Dobijamo sledeću tabelu:

Najmanja udaljenost. Elementi 3, 6, 5 i 4 se kombinuju u jedan klaster. Dobijamo tabelu sa dva klastera:

Minimalna udaljenost između stavki 3 i 6 je. To znači da su elementi 3 i 6 kombinovani u jedan klaster. Biramo maksimalnu udaljenost između novoformiranog klastera i ostalih elemenata. Na primjer, udaljenost između klastera 1 i klastera 3.6 je max (13,34166, 13,60147) = 13,34166. Sastavimo sledeću tabelu:

U njemu je minimalna udaljenost razmak između klastera 1 i 2. Kombinujući 1 i 2 u jedan klaster, dobijamo:

Tako su metodom „dalekog susjeda“ dobijena dva klastera: 1,2 i 3,4,5,6, razmak između kojih je 13,60147.

Problem je riješen.

Prijave. Rješavanje problema korištenjem softverskih paketa (MS Excel 7.0)

Problem korelacione i regresione analize.

Početne podatke unosimo u tabelu (slika 1)

Odaberite meni "Usluga / Analiza podataka". U prozoru koji se pojavi odaberite liniju "Regresija" (slika 2).

Postavimo u sljedećem prozoru ulazne intervale za X i Y, nivo pouzdanosti će biti 95%, a izlazni podaci će biti smješteni na posebnom listu "Izvještaj list" (Sl. 3)

Nakon izvršenog proračuna dobijamo konačne podatke regresione analize na listu "Izvještaj":

Takođe prikazuje tačku aproksimativne funkcije, ili "Grafikon izbora":


Izračunate vrijednosti i odstupanja prikazani su u tabeli u kolonama „Predviđeno Y“ i „Stanje“.

Na osnovu početnih podataka i odstupanja iscrtava se rezidualni graf:

Zadatak optimizacije


Početne podatke unosimo na sljedeći način:

Nepoznate nepoznate X1, X2, X3 unose se u ćelije C9, D9, E9, respektivno.

Koeficijenti funkcije cilja za X1, X2, X3 unose se u C7, D7, E7, respektivno.

Unesite ciljnu funkciju u ćeliju B11 kao formulu: = C7 * C9 + D7 * D9 + E7 * E9.

Postojeća ograničenja zadataka

Za dužinu polaganja cijevi:

dodajemo ćelijama C5, D5, E5, F5, G5

Broj bunara u svakom polju:

X3 J 100; dodajemo ćelijama C8, D8, E8.

Cijena izgradnje 1 bunara:

dodajemo ćelijama C6, D6, E6, F6, G6.

Formula za izračunavanje ukupne dužine C5 * C9 + D5 * D9 + E5 * E9 nalazi se u ćeliji B5, formula za izračunavanje ukupnog troška C6 * C9 + D6 * D9 + E6 * E9 nalazi se u ćeliji B6.


Odaberemo u meniju "Usluga / Traženje rješenja", unesemo parametre za pronalaženje rješenja u skladu sa početnim podacima (slika 4):

Pomoću dugmeta „Parametri“ podesite sledeće parametre za pronalaženje rešenja (slika 5):


Nakon traženja rješenja, dobijamo izvještaj o rezultatima:

Izvještaj o rezultatima Microsoft Excel 8.0e

Izvještaj kreiran: 17.11.2002 1:28:30

Ciljna ćelija (maksimalno)

Rezultat

Total loot

Promjenjive ćelije

Rezultat

Broj bunara

Broj bunara

Broj bunara

Ograničenja

Značenje

Dužina

Povezano

Trošak projekta

nije povezano.

Broj bunara

nije povezano.

Broj bunara

Povezano

Broj bunara

Povezano

Prva tabela prikazuje početnu i konačnu (optimalnu) vrijednost ciljne ćelije u koju je postavljena ciljna funkcija problema koji se rješava. U drugoj tabeli vidimo početne i konačne vrijednosti varijabli koje treba optimizirati, a koje se nalaze u modificiranim ćelijama. Treća tabela u izvještaju o rezultatima sadrži informacije o ograničenjima. Kolona "Vrijednost" sadrži optimalne vrijednosti potrebnih resursa i varijable koje treba optimizirati. Kolona "Formula" sadrži ograničenja utrošenih resursa i varijabli koje treba optimizirati, napisana u obliku referenci na ćelije koje sadrže ove podatke. Kolona "State" određuje da li su ova ili ona ograničenja povezana ili nepovezana. Ovdje su "vezane" ograničenja implementirana u optimalno rješenje u obliku krutih jednakosti. Kolona "Razlika" za ograničenja resursa određuje ostatak iskorištenih resursa, tj. razlika između potrebne količine resursa i njihove dostupnosti.

Slično tome, nakon što zapišemo rezultat potrage za rješenjem u obrazac "Izvještaj o održivosti", dobićemo sljedeće tabele:

Izvještaj o otpornosti Microsoft Excel 8.0e

Radni list: [Rješenje problema optimizacije.xls] Rješenje problema optimizacije

Izvještaj kreiran: 17.11.2002 1:35:16

Promjenjive ćelije

Dozvoljeno

Dozvoljeno

značenje

Cijena

Koeficijent

Povećati

Smanjenje

Broj bunara

Broj bunara

Broj bunara

Ograničenja

Ograničenje

Dozvoljeno

Dozvoljeno

značenje

Desni dio

Povećati

Smanjenje

Dužina

Trošak projekta

Izvještaj o održivosti sadrži informacije o promjenjivim (optimiziranim) varijablama i ograničenjima modela. Ova informacija je povezana sa simpleks metodom koja se koristi u optimizaciji linearnih problema, koja je gore opisana u smislu rješavanja problema. Omogućava vam da procenite koliko je dobijeno optimalno rešenje osetljivo na moguće promene parametara modela.

Prvi dio izvještaja sadrži informacije o izmijenjenim ćelijama koje sadrže vrijednosti o broju bunara u poljima. Kolona "Rezultirajuća vrijednost" označava optimalne vrijednosti varijabli koje treba optimizirati. Kolona "Ciljni koeficijent" sadrži početne podatke o vrijednostima koeficijenata ciljne funkcije. Sljedeće dvije kolone ilustruju dozvoljeno povećanje i smanjenje ovih koeficijenata bez promjene pronađenog optimalnog rješenja.

Drugi dio izvještaja o održivosti sadrži informacije o ograničenjima nametnutim varijablama koje se optimiziraju. Prva kolona prikazuje zahtjeve za resursima za optimalno rješenje. Drugi sadrži vrijednosti cijena u sjeni za vrste korištenih resursa. Posljednje dvije kolone sadrže podatke o mogućem povećanju ili smanjenju količine raspoloživih resursa.

Problem grupisanja.

Metoda korak po korak za rješavanje problema je data gore. Evo Excel tabela koje ilustruju napredak rješavanja problema:

Metoda najbližeg susjeda

Rješavanje problema klaster analize - "METOD NAJBLIŽEG SUSJEDA"

Početni podaci

gdje je x1 volumen proizvoda;

h2 - prosječni godišnji trošak glavnog

Sredstva industrijske proizvodnje

Metoda dalekog susjeda

Rješenje problema klaster analize - "METOD DISTANCE NIGHBOR"

Početni podaci

gdje je x1 volumen proizvoda;

h2 - prosječni godišnji trošak glavnog

Sredstva industrijske proizvodnje

Dostavljanje i prethodna obrada stručnih ocjena

U praksi se koristi nekoliko vrsta procjena:

- visok kvalitet (često-rijetko, lošiji-bolji, da-ne),

- procjene skale (rasponi vrijednosti 50-75, 76-90, 91-120, itd.),

Bod iz datog intervala (od 2 do 5, 1 -10), međusobno nezavisni,

Rangiranje (objekte sređuje stručnjak po određenom redoslijedu, a svakom se dodjeljuje serijski broj - čin),

Komparativ, dobijen jednom od metoda poređenja

metod sekvencijalnog poređenja

metoda parnog poređenja faktora.

U narednom koraku obrade stručnih mišljenja potrebno je izvršiti evaluaciju stepen konzistentnosti ovih mišljenja.

Procjene dobijene od stručnjaka mogu se smatrati slučajnom varijablom, čija distribucija odražava mišljenja stručnjaka o vjerovatnoći određenog izbora događaja (faktora). Stoga se za analizu raspršenosti i konzistentnosti stručnih procjena koriste generalizovane statističke karakteristike - prosjeci i mjere raspršivanja:

Srednja kvadratna greška,

Varijabilni raspon min - max,

- koeficijent varijacije V = srednja kvadratna devijacija / srednja aritma. (pogodno za bilo koju vrstu ocjenjivanja)

V i = σ i / x i avg

Za stopu mjere sličnosti ali mišljenja svaki par stručnjaka mogu se koristiti razne metode:

koeficijenti asocijacije, uz pomoć kojih se uzima u obzir broj podudarnih i nepodudarnih odgovora,

koeficijenti nedosljednosti stručna mišljenja,

Sve ove mjere mogu se koristiti ili za poređenje mišljenja dvaju stručnjaka, ili za analizu odnosa između niza ocjena po dva osnova.

Spearmanov par rang koeficijent korelacije:

gdje je n broj stručnjaka,

c k - razlika između procjena i-tog i j-tog stručnjaka za sve T faktore

Kendallov koeficijent rang korelacije (koeficijent konkordancije) daje ukupnu ocjenu konzistentnosti mišljenja svih eksperata o svim faktorima, ali samo za slučajeve gdje su korištene procjene ranga.

Dokazano je da vrijednost S, kada svi stručnjaci daju iste procjene svih faktora, ima maksimalnu vrijednost jednaku

gdje je n broj faktora,

m je broj stručnjaka.

Koeficijent podudarnosti je jednak omjeru

štaviše, ako je W blizu 1, onda su svi stručnjaci dali dovoljno konzistentne procjene, inače se njihova mišljenja ne slažu.

Formula za izračunavanje S prikazana je u nastavku:

gdje su r ij procjene ranga i-tog faktora od strane j-tog stručnjaka,

r cf je prosječan rang u cijeloj matrici procjena i jednak je

I stoga formula za izračunavanje S može imati oblik:

Ako se pojedinačne procjene jednog stručnjaka poklapaju, a standardizovane su tokom obrade, onda se za izračunavanje koeficijenta podudarnosti koristi drugačija formula:



gdje se T j izračunava za svakog stručnjaka (u slučaju da su njegove procjene ponovljene za različite objekte), uzimajući u obzir ponavljanja prema sljedećim pravilima:

gdje je t j broj grupa jednakih rangova za j-tog stručnjaka, i

h k - broj jednakih činova u k-toj grupi srodnih činova j-tog stručnjaka.

PRIMJER. Neka 5 stručnjaka za šest faktora odgovori u rangiranju kao što je prikazano u tabeli 3:

Tabela 3 – Odgovori stručnjaka

Eksperti O1 O2 O3 O4 O5 O6 Zbir rangova stručnjaka
E1
E2
E3
E4
E5

Zbog činjenice da nije dobijen strogi rang (procjene stručnjaka se ponavljaju, a zbroji rangova nisu jednaki), transformiraćemo procjene i dobiti odgovarajuće rangove (tabela 4):

Tabela 4 - Povezani rangovi stručnih ocjena

Eksperti O1 O2 O3 O4 O5 O6 Zbir rangova stručnjaka
E1 2,5 2,5
E2
E3 1,5 1,5 4,5 4,5
E4 2,5 2,5 4,5 4,5
E5 5,5 5,5
Zbir rangova objekta 7,5 9,5 23,5 29,5

Odredimo sada stepen konzistentnosti mišljenja stručnjaka koristeći koeficijent podudarnosti. Pošto su rangovi povezani, izračunaćemo W po formuli (**).

Tada je r cf = 7 * 5/2 = 17,5

S = 10 2 +8 2 +4,5 2 +4,5 2 +6 2 +12 2 = 384,5

Pređimo na proračune W. Za to posebno izračunavamo vrijednosti T j. U primjeru, ocjene su posebno odabrane tako da svaki stručnjak ima ponovljene ocjene: prvi ima dvije, drugi tri, treći dvije grupe po dvije ocjene, a četvrti ima dvije identične ocjene. dakle:

T 1 = 2 3 - 2 = 6 T 5 = 6

T 2 = 3 3 - 3 = 24

T 3 = 2 3 –2+ 2 3 –2 = 12 T 4 = 12

Vidimo da je slaganje mišljenja eksperata prilično veliko i možemo preći na sljedeću fazu studije – obrazloženje i usvajanje alternative odluke koju su preporučili stručnjaci.

U suprotnom, morate se vratiti na korake 4-8.

KENDALLA KOEFICIJENT KORELACIJE RANGA

Jedna od mjera uzorka ovisnosti dvije slučajne varijable (obilježja) X i Y, na osnovu rangiranja uzoraka stavki (X 1, Y x), .. ., (X n, Y n). K. do R. odnosi se, dakle, na rang statističara a određuje se formulom

gdje r i- Vi pripadate tom paru ( X, Y), za roj Xravena i, S = 2N- (n-1) / 2, N je broj elemenata uzorka, za koje je istovremeno j> i i r j> r i... Uvijek je Kao selektivna mjera zavisnosti To. To. R. do. je naširoko koristio M. Kendall (M. Kendall, vidi).

K. do R. K. se koristi za testiranje hipoteze o nezavisnosti slučajnih varijabli. Ako je hipoteza nezavisnosti tačna, onda je E t = 0 i D t = 2 (2n + 5) / 9n (n-1). Uz malu veličinu uzorka, provjera je statistička. hipoteza nezavisnosti je napravljena pomoću posebnih tabela (vidi). Za n> 10, koristi se normalna aproksimacija za distribuciju m: if

tada se hipoteza nezavisnosti odbacuje, inače se prihvata. Evo a . - nivo značajnosti, u a / 2 je procentualni poen normalne distribucije. K. do R. Jer, kao i svaki drugi, može se koristiti za otkrivanje zavisnosti dvaju kvalitativnih karakteristika, ako se samo elementi uzorka mogu poredati u odnosu na ove karakteristike. Ako X, Y imaju zajedničku normalu sa koeficijentom korelacije p, zatim odnos između K. do. p. do. i ima oblik:

vidi takođe Spearmanova korelacija ranga, rang test.

Lit.: Kendal M., Korelacije ranga, trans. s engleskog, M., 1975; Van der Waerden B.L., Matematika, trans. iz nje, M., 1960; Bol'shev L.N., Smirnov N.V., Tabele matematičke statistike, Moskva, 1965.

A. V. Prokhorov.


Enciklopedija matematike. - M .: Sovjetska enciklopedija... I. M. Vinogradov. 1977-1985.

Pogledajte šta je "KOEFICIJENT KENDALLA RANK KORELACIJE" u drugim rječnicima:

    engleski. s efikasna, rang korelacija Kendall; njemački Kendalls Rangkorrelationskoeffizient. Koeficijent korelacije, koji određuje stepen korespondencije uređenja svih parova objekata u dve varijable. Antinazi. Enciklopedija sociologije, 2009 ... Enciklopedija sociologije

    KENDALLOV KOEFICIJENT KORELACIJE RANGA- Engleski. efikasna, rang korelacija Kendall; njemački Kendalls Rangkorrelationskoeffizient. Koeficijent korelacije, koji određuje stepen korespondencije uređenja svih parova objekata u dve varijable... Eksplanatorni rečnik sociologije

    Mjera zavisnosti dvije slučajne varijable (obilježja) X i Y, zasnovana na rangiranju rezultata nezavisnih posmatranja (X1, Y1). ... ., (Xn, Yn). Ako se rangovi vrijednosti X nalaze u prirodnom redu i = 1,. ... ., n, i Ri rang Y koji odgovara ... ... Enciklopedija matematike

    Koeficijent korelacije- (Koeficijent korelacije) Koeficijent korelacije je statistički pokazatelj zavisnosti dve slučajne varijable.Određivanje koeficijenta korelacije, vrste koeficijenata korelacije, svojstva koeficijenta korelacije, proračun i primena ... ... Enciklopedija investitora

    Odnos između slučajnih varijabli, koji, općenito govoreći, nije striktno funkcionalan. Za razliku od funkcionalne zavisnosti, K. se po pravilu smatra kada jedna od veličina zavisi ne samo od ove druge, već i ... ... Enciklopedija matematike

    Korelacija (korelaciona zavisnost) je statistički odnos dve ili više slučajnih varijabli (ili veličina koje se kao takve mogu smatrati sa nekim prihvatljivim stepenom tačnosti). U ovom slučaju, promjene vrijednosti jedne ili ... ... Wikipedije

    Korelacija- (Korelacija) Korelacija je statistički odnos dve ili više slučajnih varijabli.Koncept korelacije, vrste korelacije, koeficijent korelacije, analiza korelacije, korelacija cena, korelacija valutnih parova na Forex sadržaju ... ... Enciklopedija investitora

    Općenito je prihvaćeno da je početak S. m. stoljeća. ili, kako se to često naziva, statistika "malog n", postavljena je u prvoj deceniji XX veka objavljivanjem dela W. Gosseta, u koji je postavio t raspodelu, postuliranu od strane onih koji su primili svet malo kasnije..... Psihološka enciklopedija

    Maurice Kendall Sir Maurice George Kendall Datum rođenja: 6. septembar 1907 (1907 09 06) Mjesto rođenja: Kettering, UK Datum smrti ... Wikipedia

    Prognoza- (Prognoza) Definicija prognoze, zadaci i principi prognoziranja Definicija prognoze, zadaci i principi prognoziranja, metode predviđanja Sadržaj Sadržaj Definicija Osnovni pojmovi prognoze Zadaci i principi prognoziranja ... ... Enciklopedija investitora