Auaste korrelatsioon ja Kendalli järgu korrelatsioonikordaja. Kendalli ja Spearmani astme korrelatsioonikordajad Kendalli korrelatsioonikordaja valem

KENDALLA ASEME KORRELATSIOONIKOEFITSIENT

Üks kahe juhusliku suuruse (tunnuse) sõltuvuse näidismõõtudest X ja jah näidisüksuste järjestuse põhjal (X 1, Y x), .. ., (X n, Y n). K. kuni R. viitab seega sellele auastme statistikud ja määratakse valemiga

kus r i- Sina kuulud sellesse paari ( X, Y), Xraveni sülemile i, S = 2N- (n-1) / 2, N on nende valimielementide arv, mille puhul samaaegselt j> i ja r j> r i... On alati Selektiivse sõltuvuse mõõdupuuna To. To. R. kasutas laialdaselt M. Kendall (M. Kendall, vt).

K. kuni R. K. kasutatakse juhuslike suuruste sõltumatuse hüpoteesi kontrollimiseks. Kui sõltumatuse hüpotees on tõene, siis E t = 0 ja D t = 2 (2n + 5) / 9n (n-1). Väikese valimi korral on kontroll statistiline. iseseisvuse hüpotees püstitatakse spetsiaalsete tabelite abil (vt.). Kui n> 10, kasutatakse m jaotuse normaallähendamist: kui

siis iseseisvuse hüpotees lükatakse tagasi, muidu aktsepteeritakse. Siin a . - olulisuse tase, u a / 2 on normaaljaotuse protsendipunkt. K. kuni R. Sest nagu iga teist, saab seda kasutada kahe kvalitatiivse tunnuse sõltuvuse tuvastamiseks, kui ainult valimi elemente saab nende tunnuste suhtes järjestada. Kui X, Y on ühine normaal korrelatsioonikordaja p, siis seos K. kuni p. ja sellel on vorm:

Vaata ka Spearmani järgu korrelatsioon, Rank test.

Valgus: Kendal M., Auaste korrelatsioonid, tlk. inglise keelest., M., 1975; Van der Waerden B.L., Matemaatika, tlk. sellest., M., 1960; Bol'shev L.N., Smirnov N.V., Matemaatilise statistika tabelid, Moskva, 1965.

A. V. Prohhorov.


Matemaatika entsüklopeedia. - M .: Nõukogude entsüklopeedia... I. M. Vinogradov. 1977-1985.

Vaadake, mis on "KENDALLA RANK KORRELAATSIOONIKORRATSIOON" teistes sõnaraamatutes:

    Inglise. с tõhus, auaste korrelatsioon Kendall; saksa keel Kendalls Rangkorrelationskoeffizient. Korrelatsioonikordaja, mis määrab kõigi objektipaaride järjestuse vastavusastme kahes muutujas. Antinazi. Sotsioloogia entsüklopeedia, 2009 ... Sotsioloogia entsüklopeedia

    KENDALLI EDETAKORRELAATSIOONI KOEFITSIENT- Inglise. tõhus, auaste korrelatsioon Kendall; saksa keel Kendalls Rangkorrelationskoeffizient. Korrelatsioonikordaja, mis määrab kõigi objektipaaride järjestuse vastavusastme kahes muutujas ... Sotsioloogia seletav sõnaraamat

    Kahe juhusliku muutuja (tunnuse) X ja Y sõltuvuse mõõt, mis põhineb sõltumatute vaatlustulemuste järjestamisel (X1, Y1). ... ., (Xn, Yn). Kui X väärtuste auastmed asuvad loomulikus järjekorras i = 1,. ... ., n ja Ri auaste Y, mis vastab ... ... Matemaatika entsüklopeedia

    Korrelatsioonikordaja- (Korrelatsioonikordaja) Korrelatsioonikordaja on kahe juhusliku suuruse sõltuvuse statistiline näitaja Korrelatsioonikordaja määramine, korrelatsioonikordajate liigid, korrelatsioonikordaja omadused, arvutamine ja rakendamine ... ... Investorite entsüklopeedia

    Juhuslike muutujate vaheline seos, mis üldiselt ei ole rangelt funktsionaalne. Erinevalt funktsionaalsest sõltuvusest arvestatakse K.-ga reeglina siis, kui üks suurustest ei sõltu mitte ainult sellest teisest, vaid ka ... ... Matemaatika entsüklopeedia

    Korrelatsioon (korrelatsioonisõltuvus) on kahe või enama juhusliku muutuja (või suuruse, mida võib selliseks pidada teatud aktsepteeritava täpsusastmega) statistiline seos. Sel juhul muutused ühe või ... ... Wikipedia väärtustes

    Korrelatsioon- (Korrelatsioon) Korrelatsioon on kahe või enama juhusliku muutuja statistiline seos. Korrelatsiooni mõiste, korrelatsioonitüübid, korrelatsioonikordaja, korrelatsioonianalüüs, hinnakorrelatsioon, valuutapaaride korrelatsioon Forexil Sisu ... ... Investorite entsüklopeedia

    On üldtunnustatud, et sajandi alguses S. või, nagu sageli nimetatakse, "väikese n" statistika pandi XX sajandi esimesse kümnendisse W. Gosseti teose avaldamisega, millesse ta paigutas t jaotuse, mille postuleerisid saajad. maailm veidi hiljem...... Psühholoogiline entsüklopeedia

    Maurice Kendall Sir Maurice George Kendall Sünniaeg: 6. september 1907 (1907 09 06) Sünnikoht: Kettering, Ühendkuningriik Surmaaeg ... Wikipedia

    Prognoos- (Prognoos) Prognoosi mõiste, prognoosimise ülesanded ja põhimõtted Prognoosi definitsioon, prognoosimise ülesanded ja põhimõtted, prognoosimise meetodid Sisukord Määratlus Prognoosimise põhimõisted Prognoosimise ülesanded ja põhimõtted ... ... Investorite entsüklopeedia

Eksperthinnangute esitamine ja eeltöötlemine

Praktikas kasutatakse mitut tüüpi hinnanguid:

- kvaliteetne (sageli-harva, halvem-parem, jah-ei),

- skaala hinnangud (väärtuste vahemikud 50-75, 76-90, 91-120 jne),

Hinne antud intervallist (2 kuni 5, 1 -10), vastastikku sõltumatud,

Järjestatud (ekspert paigutab objektid kindlasse järjekorda ja igaühele määratakse seerianumber - koht),

Võrdlev, saadud ühe võrdlusmeetodiga

järjestikune võrdlusmeetod

tegurite paaripõhise võrdlemise meetod.

Ekspertarvamuste töötlemise järgmises etapis on vaja hinnata nende arvamuste järjepidevuse aste.

Ekspertidelt saadud hinnanguid võib pidada juhuslikuks muutujaks, mille jaotus peegeldab ekspertide arvamusi sündmuse (teguri) konkreetse valiku tõenäosuse kohta. Seetõttu kasutatakse eksperthinnangute hajumise ja järjepidevuse analüüsimiseks üldistatud statistilisi tunnuseid - keskmisi ja hajuvusmõõte:

Keskmine ruutviga,

variatsioonivahemik min - max,

- variatsioonikoefitsient V = keskmine ruuthälve / keskmine aritm. (sobib igat tüüpi hindamiseks)

V i = σ i / x i keskm

Hindadeks sarnasuse meetmed aga arvamused iga ekspertide paar saab kasutada erinevaid meetodeid:

assotsiatsioonikoefitsiendid, mille abil võetakse arvesse sobivate ja mittevastavate vastuste arvu,

ebakõla koefitsiendid ekspertide arvamused,

Kõiki neid meetmeid saab kasutada kas kahe eksperdi arvamuste võrdlemiseks või hinnangute seeriate vaheliste seoste analüüsimiseks kahel alusel.

Spearmani paari astme korrelatsioonikordaja:

kus n on ekspertide arv,

c k - erinevus i-nda ja j-nda eksperdi hinnangute vahel kõigi T-tegurite puhul

Kendalli järgu korrelatsioonikoefitsient (konkordantsustegur) annab üldhinnangu kõigi ekspertide arvamuste järjepidevusele kõigi tegurite kohta, kuid ainult nendel juhtudel, kui kasutati auastme hinnanguid.

On tõestatud, et kui kõik eksperdid annavad kõikidele teguritele ühesugused hinnangud, on S väärtuse maksimaalne väärtus võrdne

kus n on tegurite arv,

m on ekspertide arv.

Vastavuskordaja on võrdne suhtega

pealegi, kui W on 1-le lähedane, siis on kõik eksperdid andnud piisavalt järjekindlaid hinnanguid, vastasel juhul ei ole nende arvamus ühel meelel.

S arvutamise valem on näidatud allpool:

kus r ij on i-nda teguri hinnangud j-nda eksperdi poolt,

r cf on kogu hinnangumaatriksi keskmine aste ja on võrdne

Seetõttu võib S arvutamise valem olla järgmisel kujul:

Kui ühe eksperdi individuaalsed hinnangud langevad kokku ja need standarditi töötlemise käigus, siis kasutatakse vastavuskoefitsiendi arvutamiseks teist valemit:



kus T j arvutatakse iga eksperdi kohta (juhul, kui tema hinnanguid korrati erinevate objektide kohta), võttes arvesse kordusi vastavalt järgmistele reeglitele:

kus t j on j-nda eksperdi võrdse auastmega rühmade arv ja

h k - võrdsete auastmete arv j-nda eksperdi seotud auastmete k-ndas rühmas.

NÄIDE. Laske paremusjärjestuses vastata 5 kuue teguri ekspertidel, nagu on näidatud tabelis 3:

Tabel 3 – ekspertide vastused

Eksperdid О1 О2 O3 О4 O5 O6 Auastmete summa eksperdi järgi
E1
E2
E3
E4
E5

Kuna ranget pingerida ei saadud (ekspertide hinnangud korduvad ja auastmete summad ei ole võrdsed), siis teisendame hinnanguid ja saame vastavad järjestused (tabel 4):

Tabel 4 – Seotud eksperdihinnangute järjestused

Eksperdid О1 О2 O3 О4 O5 O6 Auastmete summa eksperdi järgi
E1 2,5 2,5
E2
E3 1,5 1,5 4,5 4,5
E4 2,5 2,5 4,5 4,5
E5 5,5 5,5
Objekti astmete summa 7,5 9,5 23,5 29,5

Nüüd määrame ekspertarvamuste järjepidevuse astme, kasutades vastavuskordaja. Kuna auastmed on omavahel seotud, siis arvutame W valemiga (**).

Siis r cf = 7 * 5/2 = 17,5

S = 10 2 +8 2 +4,5 2 +4,5 2 +6 2 +12 2 = 384,5

Jätkame W arvutustega. Selleks arvutame eraldi T j väärtused. Näites on hinnangud valitud spetsiaalselt nii, et igal eksperdil on korduvad hinnangud: esimesel on kaks, teisel kolm, kolmandal on kaks kahe reitinguga gruppi ja neljandal on kaks identset hinnangut. Seega:

T 1 = 2 3 - 2 = 6 T 5 = 6

T 2 = 3 3 - 3 = 24

Т 3 = 2 3 –2+ 2 3 –2 = 12 Т 4 = 12

Näeme, et ekspertide arvamuste üksmeel on küllalt kõrge ja saame edasi minna uuringu järgmisesse etappi - ekspertide poolt soovitatud otsuse alternatiivi põhjendamisse ja vastuvõtmisse.

Vastasel juhul peate minema tagasi sammude 4–8 juurde.

Aste korrelatsioonikordaja iseloomustab mittelineaarse sõltuvuse üldist olemust: efektiivse tunnuse suurenemine või vähenemine teguri üks suurenemisega. See on monotoonse mittelineaarse seose tiheduse näitaja.

Teenuse eesmärk... See veebikalkulaator arvutab Kendalli astme korrelatsioonikordaja vastavalt kõikidele põhivalemitele, samuti hinnang selle olulisusele.

Juhend. Märkige andmete hulk (ridade arv). Saadud lahendus salvestatakse Wordi faili.

Kendalli pakutud koefitsient on üles ehitatud "rohkem-vähem" tüüpi seoste alusel, mille kehtivus tehti kindlaks skaalade koostamisel.
Valime paar objekti ja võrdleme nende auastmeid ühes ja teises atribuudis. Kui selle kriteeriumi järgi moodustavad järgud otsese järjestuse (st loomuliku jada järjekorra), siis määratakse paarile +1, kui vastupidi, siis –1. Valitud paari puhul korrutatakse vastavad pluss-miinus ühikud (atribuudi X ja Y järgi). Tulemuseks on ilmselgelt +1; kui mõlema tunnuse paari auastmed asuvad samas järjestuses ja –1, kui vastupidi.
Kui auastmete järjestused on mõlema kriteeriumi järgi kõigil paaridel samad, siis on kõikidele objektipaaridele määratud ühikute summa maksimaalne ja võrdub paaride arvuga. Kui kõigi paaride järjestused on vastupidised, siis –C 2 N. Üldjuhul C 2 N = P + Q, kus P on positiivsete arv ja Q on negatiivsete arv, mis on määratud paaridele, kui võrrelda nende auastmeid mõlema kriteeriumi puhul.
Kogust nimetatakse Kendalli koefitsiendiks.
Valemist on näha, et koefitsient τ on erinevus nende objektipaaride osakaalu vahel, milles järjekord on mõlemas kriteeriumis sama (kõikide paaride arvu suhtes) ja objektipaaride osakaalu vahel, milles järjekord on sama. järjekord pole sama.
Näiteks koefitsiendi väärtus 0,60 tähendab, et 80% paaridest on objektide järjestus sama, 20% aga mitte (80% + 20% = 100%; 0,80 - 0,20 = 0,60). Need. τ võib tõlgendada kui erinevust juhuslikult valitud objektipaari mõlema märgi järjekordade kokkulangemise ja mittekatsumise tõenäosuse vahel.
Üldjuhul osutub τ (täpsemalt P või Q) arvutamine isegi suurusjärgus 10 N puhul tülikaks.
Näitame, kuidas arvutusi lihtsustada.


Näide. Tööstustoodangu mahu ja põhivarasse tehtud investeeringute vahelist seost ühe Vene Föderatsiooni föderaalringkonna 10 piirkonnas 2003. aastal iseloomustavad järgmised andmed:


Arvutage Spearmani ja Kendali järgu korrelatsioonikoefitsiendid. Kontrollige nende olulisust α = 0,05 juures. Sõnastage järeldus tööstustoodangu mahu ja põhivarasse investeerimise vahelise seose kohta vaadeldavates Vene Föderatsiooni piirkondades.

Lahendus... Määrame atribuudile Y ja tegurile X auastmed.


Sorteerime andmed X järgi.
Reas Y 3-st paremal on 7 astet, mis ületavad 3, seega genereerib 3 P-s termini 7.
1-st paremal on 8 astet, mis ületavad 1 (need on 2, 4, 6, 9, 5, 10, 7, 8), st. 8 sisestab P ja nii edasi. Selle tulemusel Р = 37 ja kasutades valemeid, saame:

XYauaste X, d xauaste Y, d yPK
18.4 5.57 1 3 7 2
20.6 2.88 2 1 8 0
21.5 4.12 3 2 7 0
35.7 7.24 4 4 6 0
37.1 9.67 5 6 4 1
39.8 10.48 6 9 1 3
51.1 8.58 7 5 3 0
54.4 14.79 8 10 0 2
64.6 10.22 9 7 1 0
90.6 10.45 10 8 0 0
37 8


Lihtsustatud valemite järgi:




kus n on valimi suurus; z kp on kahepoolse kriitilise piirkonna kriitiline punkt, mis leitakse Laplace'i funktsiooni tabelist võrrandiga Ф (z kp) = (1-α) / 2.
Kui | τ |< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - nullhüpotees lükatakse tagasi. Kvalitatiivsete tunnuste vahel on oluline auaste korrelatsioon.
Leidke kriitiline punkt z kp
Ф (z kp) = (1-α) / 2 = (1 - 0,05) / 2 = 0,475

Leiame kriitilise punkti:

Kuna τ> T kp - lükkame nullhüpoteesi tagasi; auastme korrelatsioon kahe testi skooride vahel on märkimisväärne.

Näide. Tuginedes andmetele meie enda tehtud ehitus- ja paigaldustööde mahu ning 10 ehitusettevõtte töötajate arvu kohta ühes Vene Föderatsiooni linnas, määrake nende märkide vaheline seos Kendali koefitsiendi abil.

Lahendus leia kalkulaatoriga.
Määrame atribuudile Y ja tegurile X auastmed.
Paigutame objektid nii, et nende X järgud kujutavad endast loomulikku jada. Kuna selle seeria igale paarile määratud hinnangud on positiivsed, genereerivad P-s sisalduvad väärtused "+1" ainult need paarid, mille Y-järgud moodustavad otsese järjestuse.
Neid on lihtne arvutada, kui võrrelda järjestikku iga Y-rea objekti auastmeid terasobjektidega.
Kendalli koefitsient.

Üldjuhul osutub τ (täpsemalt P või Q) arvutamine isegi suurusjärgus 10 N puhul tülikaks. Näitame, kuidas arvutusi lihtsustada.

või

Lahendus.
Sorteerime andmed X järgi.
Reas Y 2-st paremal on 8 astet, mis ületavad 2, seega genereerib 2 P-s termini 8.
4-st paremal on 6 astet, mis ületavad 4 (need on 7, 5, 6, 8, 9, 10), st. 6 sisestab P ja nii edasi. Selle tulemusel P = 29 ja kasutades valemeid, saame:

XYauaste X, d xauaste Y, d yPK
38 292 1 2 8 1
50 302 2 4 6 2
52 366 3 7 3 4
54 312 4 5 4 2
59 359 5 6 3 2
61 398 6 8 2 2
66 401 7 9 1 2
70 298 8 3 1 1
71 283 9 1 1 0
73 413 10 10 0 0
29 16


Lihtsustatud valemite järgi:


Selleks, et testida nullhüpoteesi Kendalli üldise järgu korrelatsioonikordaja võrdsuse kohta nulliga olulisuse tasemel α konkureeriva hüpoteesiga H 1: τ ≠ 0, on vaja arvutada kriitiline punkt:

kus n on valimi suurus; z kp on kahepoolse kriitilise piirkonna kriitiline punkt, mis leitakse Laplace'i funktsiooni tabelist võrrandiga Ф (z kp) = (1 - α) / 2.
Kui | τ | T kp - nullhüpotees lükatakse tagasi. Kvalitatiivsete tunnuste vahel on oluline auaste korrelatsioon.
Leidke kriitiline punkt z kp
Ф (z kp) = (1 - α) / 2 = (1 - 0,05) / 2 = 0,475
Laplace'i tabelit kasutades leiame z kp = 1,96
Leiame kriitilise punkti:

Alates τ

Kendalli korrelatsioonikoefitsienti kasutatakse juhul, kui muutujad on esindatud kahe järguskaalaga, eeldusel, et nendega seotud auastmeid pole. Kendalli koefitsiendi arvutamine hõlmab vastete ja inversioonide arvu lugemist. Vaatleme seda protseduuri eelmise ülesande näitel.

Probleemi lahendamise algoritm on järgmine:

    Registreerime andmed uuesti tabelisse. 8.5, nii et üks ridadest (antud juhul rida x i) osutus järjestatuks. Teisisõnu paigutame paarid ümber x ja y õiges järjekorras ja sisestame andmed tabeli veergudesse 1 ja 2. 8.6.

Tabel 8.6

x i

y i

2. Määrake 2. rea "järjestusaste" ( y i). See protseduur viiakse läbi järgmises järjestuses:

a) võtame järjestamata rea ​​esimese väärtuse "3". Auastmete arvu arvutamine allpool antud number, mis rohkem võrreldav väärtus. Selliseid väärtusi on 9 (numbrid 6, 7, 4, 9, 5, 11, 8, 12 ja 10). Sisestame veergu "vasted" numbri 9. Seejärel loendame nende väärtuste arvu vähem kolm. Selliseid väärtusi on 2 (järgud 1 ja 2); lisage veergu "inversioon" number 2.

b) visake ära number 3 (oleme sellega juba töötanud) ja korrake protseduuri järgmise väärtuse "6" jaoks: vastete arv on 6 (7, 9, 11, 8, 12 ja 10), inversioon on 4 (järgud 1, 2, 4 ja 5). Sisestame veergu "kokkusattumused" numbri 6 ja veergu "inversioonid" numbri 4.

c) samamoodi korratakse protseduuri rea lõpuni; tuleb meeles pidada, et iga "väljatöötatud" väärtus jäetakse edasisest kaalumisest välja (arvestatakse ainult neid auastmeid, mis jäävad sellest numbrist alla).

Märge

Et arvutustes mitte vigu teha, tuleb silmas pidada, et iga "sammuga" väheneb kokkulangevuste ja inversioonide summa ühe võrra; see on arusaadav, kui võtta arvesse, et iga kord jäetakse üks väärtus arvestamisest välja.

3. Arvutatakse välja vastete summa (R) ja inversioonide summa (Q); andmed sisestatakse ühte ja kolme Kendalli koefitsiendi (8,10) vahetatavasse valemisse. Tehakse vastavad arvutused.

t (8.10)

Meie puhul:

Tabel XIV lisades on antud proovi koefitsiendi kriitilised väärtused: τ cr. = 0,45; 0,59. Empiiriliselt saadud väärtust võrreldakse tabeli väärtusega.

Järeldus

τ = 0,55> τ kr. = 0,45. Korrelatsioon on statistiliselt oluline 1. taseme puhul.

Märge:

Vajadusel (näiteks kriitiliste väärtuste tabeli puudumisel) statistiline olulisus t Kendalli saab määrata järgmise valemiga:

(8.11)

kus S * = P - Q+ 1 kui P< Q , ja S * = P - Q - 1 kui P> Q.

Väärtused z vastava olulisuse taseme jaoks vastavad Pearsoni mõõdule ja leitakse vastavate tabelite järgi (ei sisaldu lisas. Standardsete olulisuse tasemete jaoks z cr = 1,96 (β 1 = 0,95) ja 2,58 (β 2 = 0,99). Kendalli korrelatsioonikordaja on statistiliselt oluline, kui z > z kr

Meie puhul S * = P - Q- 1 = 35 ja z= 2,40, st esialgne järeldus leiab kinnitust: märkide vaheline korrelatsioon on statistiliselt oluline 1. olulisuse taseme puhul.

Üks normaalsuse eeldusel põhinevate kriteeriumide rakendamist piirav tegur on valimi suurus. Kuni valim on piisavalt suur (näiteks 100 või enam vaatlust), võite eeldada, et valimi jaotus on normaalne, isegi kui te pole kindel, et muutuja jaotus üldkogumis on normaalne. Kuid kui valim on väike, tuleks neid kriteeriume kasutada ainult siis, kui on kindel, et muutuja on tõepoolest normaalselt jaotunud. Seda eeldust ei saa aga väikeses valimis testida.

Normaalsuse eeldusel põhinevate kriteeriumide kasutamine on samuti piiratud mõõtmiste skaalaga (vt ptk Andmeanalüüsi põhimõisted). Statistilised meetodid nagu t-test, regressioon jne eeldavad, et algandmed on pidevad. Siiski on olukordi, kus andmed lihtsalt järjestatakse (mõõdetakse järguskaalal), mitte ei mõõdeta täpselt.

Tüüpilise näite annavad Internetis leiduvate saitide hinnangud: esimesel positsioonil on maksimaalse külastajate arvuga sait, teisel positsioonil on ülejäänud saitide hulgas (saitide hulgas) maksimaalse külastajate arvuga sait millelt esimene sait on eemaldatud) jne. Teades hinnanguid, võime öelda, et ühe saidi külastajate arv on suurem kui teise saidi külastajate arv, kuid kui palju rohkem, on võimatu öelda. Kujutage ette, et teil on 5 saiti: A, B, C, D, E, mis on 5 parimas kohas. Oletame, et käesoleval kuul oli meil järgmine korraldus: A, B, C, D, E ja eelmisel kuul: D, E, A, B, C. Küsimus on selles, et saidi hinnangutes on toimunud olulisi muudatusi või mitte? Ilmselgelt ei saa me selles olukorras kasutada t-testi nende kahe andmerühma võrdlemiseks ja liikuda edasi konkreetsete tõenäosusarvutuste valdkonda (ja iga statistiline kriteerium sisaldab tõenäosusarvutust!). Arutleme järgmiselt: kui tõenäoline on, et kahe saidi paigutuse erinevus on tingitud puhtjuhuslikest põhjustest või et erinevus on liiga suur ja seda ei saa seletada puhta juhusega. Selles arutluses kasutame ainult saitide auastmeid või permutatsioone ega kasuta mingil viisil nende külastajate arvu jaotuse konkreetset vormi.

Väikeste proovide analüüsimiseks ja kehvadel skaalal mõõdetud andmete jaoks kasutatakse mitteparameetrilisi meetodeid.

Kiire ringkäik mitteparameetriliste protseduuride kohta

Põhimõtteliselt on iga parameetrilise kriteeriumi jaoks olemas vähemalt üks mitteparameetriline alternatiiv.

Üldiselt kuuluvad need protseduurid ühte järgmistest kategooriatest:

  • sõltumatute valimite eristamiskriteeriumid;
  • sõltuvate valimite eristamiskriteeriumid;
  • muutujate vahelise sõltuvuse määra hindamine.

Üldiselt peaks statistiliste kriteeriumide lähenemine andmeanalüüsis olema pragmaatiline ja mitte koormatud tarbetute teoreetiliste arutlustega. Kui teie käsutuses on STATISTICA arvuti, saate oma andmetele hõlpsalt rakendada mitmeid kriteeriume. Teades mõningaid meetodite lõkse, valite katsetamise teel õige lahenduse. Graafiku areng on üsna loomulik: kui on vaja võrrelda kahe muutuja väärtusi, siis kasuta t-testi. Siiski tuleb meeles pidada, et see põhineb normaalsuse ja dispersioonide võrdsuse eeldusel igas rühmas. Nendest eeldustest vabanemine toob kaasa mitteparameetrilised testid, mis on eriti kasulikud väikeste proovide puhul.

T-testi arendamine viib dispersioonanalüüsini, mida kasutatakse juhul, kui võrreldavate rühmade arv on üle kahe. Mitteparameetriliste protseduuride vastav areng toob kaasa mitteparameetrilise dispersioonanalüüsi, kuigi see on oluliselt kehvem kui klassikaline dispersioonanalüüs.

Ühenduse sõltuvuse või, veidi pompoosselt öeldes, tiheduse astme hindamiseks arvutatakse Pearsoni korrelatsioonikordaja. Rangelt võttes on selle rakendamisel piirangud, mis on seotud näiteks andmete mõõtmise skaala tüübi ja sõltuvuse mittelineaarsusega, seetõttu kasutatakse alternatiivina ka mitteparameetrilisi ehk nn auaste korrelatsioonikordajaid, mis on kasutatakse näiteks järjestatud andmete jaoks. Kui andmeid mõõdetakse nominaalsel skaalal, siis on loomulik esitada need situatsioonitabelites, mis kasutavad Pearsoni hii-ruut testi koos erinevate variatsioonide ja täpsuse parandamisega.

Seega on sisuliselt vaid mõnda tüüpi kriteeriume ja protseduure, mida pead teadma ja oskama kasutada, olenevalt andmete spetsiifikast. Peate kindlaks määrama, millist kriteeriumi tuleks konkreetses olukorras kohaldada.

Mitteparameetrilised meetodid on kõige sobivamad, kui valimi suurus on väike. Kui andmeid on palju (näiteks n> 100), ei ole sageli mõtet mitteparameetrilist statistikat kasutada.

Kui valimi suurus on väga väike (näiteks n = 10 või vähem), saab nende mitteparameetriliste testide olulisuse tasemeid, mis kasutavad tavalist lähendust, pidada ainult ligikaudseks hinnanguks.

Erinevused sõltumatute rühmade vahel... Kui on kaks proovi (näiteks mehed ja naised), mida on vaja võrrelda mõne keskmise väärtuse, näiteks keskmise rõhu või vere leukotsüütide arvu suhtes, saab t-testi kasutada sõltumatuks. proovid.

Selle testi mitteparameetrilised alternatiivid on Val'd-Wolfowitzi, Mann-Whitney seeria kriteeriumid) / n, kus x i on i-s väärtus, n on vaatluste arv. Kui muutuja sisaldab negatiivseid väärtusi või nulli (0), ei saa geomeetrilist keskmist arvutada.

Harmooniline keskmine

Harmooniliste keskmist kasutatakse mõnikord sageduste keskmistamiseks. Harmooniline keskmine arvutatakse valemiga: ГС = n / S (1 / x i) kus ГС on harmooniline keskmine, n on vaatluste arv, х i on vaatluse väärtus arvuga i. Kui muutuja sisaldab nulli (0), ei saa harmoonilist keskmist arvutada.

Dispersioon ja standardhälve

Valimi dispersioon ja standardhälve on kõige sagedamini kasutatavad andmete varieeruvuse (variatsiooni) mõõdikud. Dispersioon arvutatakse valimi keskmisest muutuja väärtuste kõrvalekallete ruutude summana, jagatuna n-1-ga (kuid mitte n-ga). Standardhälve arvutatakse dispersioonihinnangu ruutjuurena.

Kiik

Muutuja vahemik on volatiilsuse näitaja, mis arvutatakse maksimumina miinus miinimum.

Kvartiilne ulatus

Kvartiil definitsiooni järgi on järgmine: ülemine kvartiil miinus alumine kvartiil (75% protsentiil miinus 25% protsentiil). Kuna 75% protsentiil (ülemine kvartiil) on väärtus, millest vasakul asuvad 75% juhtudest ja 25% protsentiil (alumine kvartiil) on väärtus, millest vasakul asuvad 25% juhtudest, siis kvartiil vahemik on mediaani ümber olev intervall, mis sisaldab 50% juhtudest (muutuvad väärtused).

Asümmeetria

Asümmeetria on jaotuse kuju tunnus. Jaotus kaldub vasakule, kui kaldsuse väärtus on negatiivne. Jaotus on kaldu paremale, kui asümmeetria on positiivne. Standardse normaaljaotuse viltus on 0. Kalduvus on seotud kolmanda momendiga ja defineeritakse järgmiselt: viltus = n × M 3 / [(n-1) × (n-2) × s 3], kus M 3 on: (xi -x keskmine x) 3, s 3 on standardhälve tõstetud kolmanda astmeni, n on vaatluste arv.

Liigne

Kurtoos on jaotuse kuju tunnus, nimelt selle tipu raskusastme mõõt (normaaljaotuse suhtes, mille kurtoos on 0). Reeglina on normaalsest teravama tipuga jaotustel positiivne kurtoos; jaotustel, mille tipp on normaaljaotuse tipust vähem terav, on negatiivne kurtoos. Ülejääk on seotud neljanda hetkega ja määratakse järgmise valemiga:

kurtosis = / [(n-1) × (n-2) × (n-3) × s 4], kus M j on: (xx keskmine x, s 4 on standardhälve neljanda astmeni, n on vaatluste arv...