Ռանգերի հարաբերակցությունը և Քենդալի աստիճանի հարաբերակցության գործակիցը: Քենդալի և Սփիրմանի վարկանիշային հարաբերակցության գործակիցները Քենդալի հարաբերակցության գործակիցների բանաձևը

ՔԵՆԴԱԼԻ ԳՈՐԾԱԿՑԻ ԿԱՐԳԱՎԻՃԱԿԻ ՀԱՐԱԿԱՑՈՒԹՅԱՆ

Երկու պատահական փոփոխականների (առանձնահատկությունների) կախվածության ընտրանքային չափումներից մեկը X և Y,ընտրանքի տարրերի դասակարգման հիման վրա (X 1, Y x), .. ., (Х n, Y n). Կ.կ.ռ. դեպի, հետևաբար, վերաբերում է վարկանիշային վիճակագիրներև որոշվում է բանաձևով

որտեղ r i- Դուք պատկանում եք այդ զույգին ( X, Y), որի համար Xraven i, S = 2N-(n-1)/2, N- նմուշ տարրերի թիվը, որոնց համար և՛ j>i, և՛ rj >r i. Միշտ է Որպես կախվածության ընտրովի միջոց Կ. to.-ը լայնորեն կիրառվել է Մ.Քենդալի կողմից (M. Kendall, տես)։

Կ.կ.ռ. Կ–ն օգտագործվում է պատահական փոփոխականների անկախության վարկածը ստուգելու համար։ Եթե ​​անկախության վարկածը ճիշտ է, ապա E t =0 և D t =2(2n+5)/9n(n-1): Փոքր նմուշի չափով՝ ստուգելով վիճակագրական տվյալները անկախության վարկածները կազմվում են հատուկ աղյուսակների միջոցով (տես): n>10-ի համար օգտագործվում է m-ի բաշխման նորմալ մոտարկումը՝ եթե

ապա անկախության վարկածը մերժվում է, հակառակ դեպքում՝ ընդունվում։ Այստեղ ա . - նշանակության մակարդակ, u a /2-ը նորմալ բաշխման տոկոսային կետն է: Կ.կ.ռ. k.-ն, ինչպես ցանկացածը, կարող է օգտագործվել երկու որակական հատկանիշների կախվածությունը հայտնաբերելու համար, եթե միայն նմուշի տարրերը կարող են պատվիրվել այս հատկանիշների համեմատ: Եթե X, Yունեն միացյալ նորմալ p հարաբերակցության գործակցով, ապա կապը Կ–ի միջև։ դեպի. և ունի ձև.

տես նաեւ Spearman աստիճանի հարաբերակցությունը, Rank test.

Լիտ.Քենդալ Մ., Ռանկային հարաբերակցություններ, թարգմ. անգլերենից, Մ., 1975; Van der Waerden B. L., Mathematical, trans. գերմաներենից, Մ., 1960; Bolshev L. N., Smirnov N. V., Մաթեմատիկական վիճակագրության աղյուսակներ, Մ., 1965:

Ա.Վ.Պրոխորով.


Մաթեմատիկական հանրագիտարան. - Մ.: Սովետական ​​հանրագիտարան. Ի.Մ.Վինոգրադով. 1977-1985 թթ.

Տեսեք, թե ինչ է «KENDALL RANK COEFFICIENT»-ը այլ բառարաններում.

    Անգլերեն արդյունավետ, աստիճանային հարաբերակցությամբ Քենդալ; գերմաներեն Kendalls Rangkorrelationskoeffizient. Հարաբերակցության գործակից, որը որոշում է բոլոր զույգ օբյեկտների երկու փոփոխականների դասավորության համապատասխանության աստիճանը։ Անտինազի. Սոցիոլոգիայի հանրագիտարան, 2009 ... Սոցիոլոգիայի հանրագիտարան

    ՔԵՆԴԱԼԻ ՌԱՆԿԻ ԳՈՐԾԱԿՑՈՂ- Անգլերեն. արդյունավետ, վարկանիշային հարաբերակցություն Քենդալ; գերմաներեն Kendalls Rangkorrelationskoeffizient. Հարաբերակցության գործակիցը, որը որոշում է օբյեկտների բոլոր զույգերի երկու փոփոխականների դասավորության համապատասխանության աստիճանը ... Սոցիոլոգիայի բացատրական բառարան

    Երկու պատահական փոփոխականների (հատկանիշների)՝ X և Y կախվածության չափում, որը հիմնված է անկախ դիտարկման արդյունքների դասակարգման վրա (X1, Y1), . . ., (Xn,Yn). Եթե ​​X արժեքների շարքերը բնական կարգով են i=1, . . ., n,a Ri աստիճան Y, որը համապատասխանում է…… Մաթեմատիկական հանրագիտարան

    Հարաբերակցության գործակիցը- (Կոռելյացիայի գործակից) Հարաբերակցության գործակիցը երկու պատահական փոփոխականների կախվածության վիճակագրական ցուցիչ է. Ներդրողի հանրագիտարան

    Կախվածությունը պատահական փոփոխականների միջև, որը, ընդհանուր առմամբ, չունի խիստ ֆունկցիոնալ բնույթ։ Ի տարբերություն ֆունկցիոնալ կախվածության, Կ., որպես կանոն, համարվում է, երբ մեծություններից մեկը կախված է ոչ միայն տվյալ մյուսից, այլ նաև ... ... Մաթեմատիկական հանրագիտարան

    Հարաբերակցությունը (կոռելյացիայի կախվածություն) վիճակագրական հարաբերություն է երկու կամ ավելի պատահական փոփոխականների (կամ փոփոխականների, որոնք կարող են այդպիսին համարվել որոշակի ընդունելի ճշգրտությամբ): Միևնույն ժամանակ, մեկ կամ ... ... Վիքիպեդիայի արժեքների փոփոխություններ

    Հարաբերակցություն- (Հարաբերակցություն) Հարաբերակցությունը երկու կամ ավելի պատահական փոփոխականների վիճակագրական հարաբերություն է: Հարաբերակցության հայեցակարգը, հարաբերակցության տեսակները, հարաբերակցության գործակիցը, հարաբերակցության վերլուծությունը, գների հարաբերակցությունը, արժութային զույգերի հարաբերակցությունը Forex Contents-ում ... ... Ներդրողի հանրագիտարան

    Ընդհանրապես ընդունված է, որ սկիզբը Ս. կամ, ինչպես հաճախ կոչվում է, «փոքր n» վիճակագրություն, սահմանվել է 20-րդ դարի առաջին տասնամյակում Վ. Գոսեթի աշխատության հրապարակմամբ, որտեղ նա տեղադրել է t բաշխումը, որը ենթադրում է աշխարհի կողմից ստացված բաշխումը. մի փոքր ուշ ... ... Հոգեբանական հանրագիտարան

    Մորիս Քենդալ Սըր Մորիս Ջորջ Քենդալ Ծննդյան ամսաթիվ՝ 1907 թվականի սեպտեմբերի 6 (1907 09 06) Ծննդյան վայր՝ Քեթերինգ, Միացյալ Թագավորություն Մահվան տարեթիվ ... Վիքիպեդիա

    Կանխատեսում- (Կանխատեսում) Կանխատեսման, խնդիրների և կանխատեսման սկզբունքների սահմանում Կանխատեսման սահմանում, կանխատեսման առաջադրանքներ և սկզբունքներ, կանխատեսման մեթոդներ Բովանդակություն Բովանդակություն Սահմանում Կանխատեսման հիմնական հասկացությունները Կանխատեսման առաջադրանքներ և սկզբունքներ ... ... Ներդրողի հանրագիտարան

Փորձագիտական ​​գնահատականների ներկայացում և նախնական մշակում

Գործնականում օգտագործվում են գնահատման մի քանի տեսակներ.

- որակ (հաճախ-հազվադեպ, վատ-լավ, այո-ոչ),

- սանդղակի միավորներ (արժեքների միջակայքեր 50-75, 76-90, 91-120 և այլն),

Տրված միջակայքից միավորներ (2-ից 5, 1-10), փոխադարձ անկախ,

Դասակարգված (առարկաները դասավորված են փորձագետի կողմից որոշակի հերթականությամբ, և յուրաքանչյուրին տրվում է սերիական համար. աստիճան),

Համեմատական ​​ստացված համեմատական ​​մեթոդներից մեկով

հաջորդական համեմատությունների մեթոդ

գործոնների զույգ համեմատության մեթոդ.

Փորձագիտական ​​եզրակացությունների մշակման հաջորդ քայլին անհրաժեշտ է գնահատել այս տեսակետների համաձայնության աստիճանը։

Փորձագետներից ստացված գնահատականները կարող են դիտվել որպես պատահական փոփոխական, որի բաշխումն արտացոլում է փորձագետների կարծիքները որևէ իրադարձության (գործոնի) որոշակի ընտրության հավանականության վերաբերյալ: Հետևաբար, փորձագիտական ​​գնահատումների ցրվածությունն ու հետևողականությունը վերլուծելու համար օգտագործվում են ընդհանրացված վիճակագրական բնութագրեր՝ միջիններ և ցրման չափումներ.

միջին քառակուսի սխալ,

Տատանումների միջակայքը նվազագույն - առավելագույնը,

- տատանումների գործակից V \u003d rms. devi. / թվաբանություն. միջին: (հարմար է ցանկացած տեսակի գնահատման համար)

V i = σ i / x i տես

Փոխարժեքի համար նմանության միջոցներբայց կարծիքներ յուրաքանչյուր զույգ փորձագետԿարող են օգտագործվել մի շարք մեթոդներ.

ասոցիացիայի գործակիցները, որոնք հաշվի են առնում համապատասխան և չհամապատասխանող պատասխանների քանակը,

անհամապատասխանության գործակիցներփորձագիտական ​​կարծիքներ,

Այս բոլոր միջոցները կարող են օգտագործվել կա՛մ երկու փորձագետների կարծիքները համեմատելու համար, կա՛մ երկու չափորոշիչների վրա գնահատականների շարքի միջև կապը վերլուծելու համար:

Spearman's Pair Rank Correlation Coefficient:

որտեղ n-ը փորձագետների թիվն է,

c k-ը i-րդ և j-րդ փորձագետների գնահատումների տարբերությունն է բոլոր T գործոնների համար

Քենդալի աստիճանի հարաբերակցության գործակիցը (համապատասխանության գործակիցը) տալիս է բոլոր փորձագետների կարծիքների համահունչության ընդհանուր գնահատականը բոլոր գործոնների վերաբերյալ, բայց միայն այն դեպքերում, երբ օգտագործվել են վարկանիշային գնահատումներ:

Ապացուցված է, որ S-ի արժեքը, երբ բոլոր փորձագետները բոլոր գործոններին տալիս են նույն գնահատականը, ունի առավելագույն արժեք, որը հավասար է.

որտեղ n-ը գործոնների քանակն է,

m-ը փորձագետների թիվն է:

Համապատասխանության գործակիցը հավասար է հարաբերակցությանը

Ավելին, եթե W-ը մոտ է 1-ին, ապա բոլոր փորձագետները տվել են բավականին հետևողական գնահատականներ, հակառակ դեպքում նրանց կարծիքները անհամապատասխան են:

S-ի հաշվարկման բանաձևը տրված է ստորև.

որտեղ r ij - j-րդ փորձագետի կողմից i-րդ գործոնի գնահատականները,

r cf - միջին վարկանիշը գնահատումների ողջ մատրիցով և հավասար է

Եվ, հետևաբար, S-ի հաշվարկման բանաձևը կարող է ունենալ հետևյալ ձևը.

Եթե ​​մեկ փորձագետի անհատական ​​միավորները նույնն են, և մշակման ընթացքում դրանք ստանդարտացվել են, ապա համապատասխանության գործակիցը հաշվարկելու համար օգտագործվում է մեկ այլ բանաձև.



որտեղ T j-ն հաշվարկվում է յուրաքանչյուր փորձագետի համար (այն դեպքում, երբ նրա գնահատականները կրկնվել են տարբեր օբյեկտների համար)՝ հաշվի առնելով կրկնությունները հետևյալ կանոնների համաձայն.

որտեղ t j-ը j-րդ փորձագետի համար հավասար կոչումների խմբերի թիվն է, և

h k - j-րդ փորձագետի հարակից կոչումների k-րդ խմբում հավասար կոչումների թիվը:

ՕՐԻՆԱԿ. Թող վեց գործոններով 5 փորձագետներ արձագանքեն, երբ դասակարգվում են, ինչպես ցույց է տրված Աղյուսակ 3-ում.

Աղյուսակ 3 - Փորձագետների պատասխանները

Փորձագետներ O1 O2 O3 O4 O5 O6 Մասնագետի դասակարգումների գումարը
E1
E2
E3
E4
E5

Հաշվի առնելով այն հանգամանքը, որ ստացվել է ոչ խիստ վարկանիշ (փորձագետների գնահատականները կրկնվում են, իսկ շարքերի գումարները հավասար չեն), մենք կվերափոխենք գնահատումները և կստանանք հարակից վարկանիշները (Աղյուսակ 4).

Աղյուսակ 4. Փորձագետների վարկանիշների հարակից վարկանիշները

Փորձագետներ O1 O2 O3 O4 O5 O6 Մասնագետի դասակարգումների գումարը
E1 2,5 2,5
E2
E3 1,5 1,5 4,5 4,5
E4 2,5 2,5 4,5 4,5
E5 5,5 5,5
Ըստ օբյեկտների դասակարգումների գումարը 7,5 9,5 23,5 29,5

Այժմ որոշենք փորձագետների կարծիքների համաձայնության աստիճանը՝ օգտագործելով համապատասխանության գործակիցը։ Քանի որ շարքերը փոխկապակցված են, մենք կհաշվարկենք W-ն՝ օգտագործելով (**) բանաձևը:

Այնուհետև r cf \u003d 7 * 5 / 2 \u003d 17.5

S = 10 2 +8 2 +4,5 2 +4,5 2 +6 2 +12 2 = 384,5

Եկեք անցնենք W-ի հաշվարկին: Դա անելու համար մենք առանձին հաշվարկում ենք T j-ի արժեքները: Օրինակում գնահատականները հատուկ ընտրված են այնպես, որ յուրաքանչյուր փորձագետ ունենա կրկնվող գնահատականներ՝ 1-ինն ունի երկու, երկրորդը՝ երեք, երրորդը՝ երկու միավորից բաղկացած երկու խումբ, չորրորդն ու հինգերորդը՝ երկու նույնական գնահատական: Այստեղից.

T 1 \u003d 2 3 - 2 \u003d 6 T 5 \u003d 6

T 2 \u003d 3 3 - 3 \u003d 24

T 3 \u003d 2 3 -2+ 2 3 -2 \u003d 12 T 4 \u003d 12

Մենք տեսնում ենք, որ փորձագետների կարծիքների կոնսենսուսը բավականին բարձր է, և հնարավոր է անցնել ուսումնասիրության հաջորդ փուլին՝ փորձագետների առաջարկած այլընտրանքային լուծման հիմնավորմանն ու ընդունմանը։

Հակառակ դեպքում, դուք պետք է վերադառնաք 4-8 քայլերին:

Ռանգերի հարաբերակցության գործակիցըբնութագրում է ոչ գծային կախվածության ընդհանուր բնույթը՝ արդյունքի նշանի ավելացում կամ նվազում՝ գործոնայինի ավելացմամբ։ Սա միապաղաղ ոչ գծային հարաբերությունների խստության ցուցիչ է:

Ծառայության հանձնարարություն. Այս առցանց հաշվիչը հաշվարկում է Քենդալի աստիճանի հարաբերակցության գործակիցըբոլոր հիմնական բանաձեւերի համար, ինչպես նաև դրա նշանակության գնահատումը։

Հրահանգ. Նշեք տվյալների քանակը (տողերի քանակը): Ստացված լուծումը պահվում է Word ֆայլում:

Քենդալի առաջարկած գործակիցը կառուցված է «ավելի-պակաս» տեսակի հարաբերությունների հիման վրա, որոնց վավերականությունը հաստատվել է կշեռքի կառուցման ժամանակ։
Առանձնացնենք մի երկու առարկա և համեմատենք դրանց շարքերը՝ ըստ մի հատկանիշի և ըստ մյուսի։ Եթե ​​ըստ այս հատկանիշի (այսինքն՝ բնական շարքի կարգի) շարքերը կազմում են ուղիղ կարգ, ապա զույգին վերագրվում է +1, եթե հակառակը, ապա -1։ Ընտրված զույգի համար համապատասխան գումարած-մինուս միավորները (ըստ X հատկանիշի և ըստ Y հատկանիշի) բազմապատկվում են: Արդյունքն ակնհայտորեն +1 է; եթե երկու հատկանիշների զույգի շարքերը նույն հաջորդականությամբ են, և -1, եթե դրանք հակառակ հերթականությամբ են:
Եթե ​​երկու հատկանիշների դասակարգումները նույնն են բոլոր զույգերի համար, ապա բոլոր զույգ օբյեկտներին հատկացված միավորների գումարը առավելագույնն է և հավասար է զույգերի թվին: Եթե ​​բոլոր զույգերի շարքային կարգերը հակադարձված են, ապա –C 2 N . Ընդհանուր դեպքում, C 2 N = P + Q, որտեղ P-ն դրական և Q բացասական միավորների թիվն է, որոնք վերագրվում են զույգերին՝ երկու հատկանիշների համար նրանց շարքերը համեմատելիս:
Արժեքը կոչվում է Քենդալի գործակից:
Բանաձևից երևում է, որ τ գործակիցը տարբերությունն է առարկաների զույգերի համամասնության միջև, որոնք ունեն նույն կարգը երկու հատկանիշներում (բոլոր զույգերի քանակի նկատմամբ) և այն զույգերի հարաբերակցությունը, որոնք չունեն։ նույն կարգը.
Օրինակ՝ 0,60 գործակցի արժեքը նշանակում է, որ զույգերի 80%-ն ունեն առարկաների նույն կարգը, իսկ 20%-ը՝ ոչ (80% + 20% = 100%; 0,80 - 0,20 = 0,60): Նրանք. τ-ն կարող է մեկնաբանվել որպես պատահականորեն ընտրված զույգ օբյեկտների համար երկու հատկանիշների համընկնման և չհամընկնման հավանականությունների տարբերություն:
Ընդհանուր դեպքում, τ (ավելի ճիշտ՝ P կամ Q) հաշվարկը նույնիսկ 10-ի կարգի N-ի համար, պարզվում է, որ դժվար է։
Եկեք ցույց տանք, թե ինչպես պարզեցնել հաշվարկները:


Օրինակ. 2003 թվականին Ռուսաստանի Դաշնության դաշնային շրջաններից մեկի 10 շրջաններում արդյունաբերական արտադրանքի ծավալի և հիմնական կապիտալում ներդրումների միջև կապը բնութագրվում է հետևյալ տվյալներով.


Հաշվե՛ք Սփիրմանի և Քենդալի աստիճանի հարաբերակցության գործակիցները։ Ստուգեք դրանց նշանակությունը α=0.05-ում: Եզրակացություն ձևակերպել Ռուսաստանի Դաշնության դիտարկվող շրջաններում արդյունաբերական արտադրության ծավալների և հիմնական միջոցներում ներդրումների միջև փոխհարաբերությունների վերաբերյալ:

Լուծում. Վարկանիշներ հատկացրեք Y հատկանիշին և X գործոնին:


Տվյալները դասավորենք ըստ X-ի:
Y շարքում, 3-ից աջ, կան 3-ից մեծ 7 աստիճան, հետևաբար, 3-ը կառաջացնի 7-րդ տերմին P-ում։
1-ի աջ կողմում 1-ից մեծ են 8 աստիճաններ (դրանք 2, 4, 6, 9, 5, 10, 7, 8), այսինքն. P-ն կներառի 8-ը և այլն: Արդյունքում, P = 37 և օգտագործելով բանաձևերը, մենք ունենք.

XՅաստիճան X, dxաստիճան Y, d yՊՔ
18.4 5.57 1 3 7 2
20.6 2.88 2 1 8 0
21.5 4.12 3 2 7 0
35.7 7.24 4 4 6 0
37.1 9.67 5 6 4 1
39.8 10.48 6 9 1 3
51.1 8.58 7 5 3 0
54.4 14.79 8 10 0 2
64.6 10.22 9 7 1 0
90.6 10.45 10 8 0 0
37 8


Պարզեցված բանաձևեր.




որտեղ n-ը նմուշի չափն է. z kp-ը երկկողմանի կրիտիկական շրջանի կրիտիկական կետն է, որը հայտնաբերվում է Լապլասի ֆունկցիայի աղյուսակից Ф(z kp)=(1-α)/2 հավասարությամբ։
Եթե ​​|տ|< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - զրոյական վարկածը մերժվում է: Որակական հատկանիշների միջև զգալի աստիճանային հարաբերակցություն կա։
Եկեք գտնենք z kp կրիտիկական կետը
Ф(z kp) = (1-α)/2 = (1 - 0.05)/2 = 0.475

Գտնենք կրիտիկական կետը.

Քանի որ τ > T kp - մենք մերժում ենք զրոյական վարկածը. երկու թեստերի միավորների միջև աստիճանային հարաբերակցությունը նշանակալի է:

Օրինակ. Համաձայն ինքնուրույն կատարված շինարարական և տեղադրման աշխատանքների ծավալի և Ռուսաստանի Դաշնության քաղաքներից մեկի 10 շինարարական ընկերությունների աշխատողների թվի, որոշեք այս հատկանիշների միջև կապը՝ օգտագործելով Քենդելի գործակիցը:

Լուծումգտնել հաշվիչով:
Վարկանիշներ հատկացրեք Y հատկանիշին և X գործոնին:
Առարկաները դասավորենք այնպես, որ X-ում նրանց շարքերը ներկայացնեն բնական թվեր։ Քանի որ այս շարքի յուրաքանչյուր զույգին տրված գնահատականները դրական են, P-ում ներառված «+1» արժեքները կստեղծվեն միայն այն զույգերի կողմից, որոնց Y-ի դասակարգումները ուղիղ կարգ են կազմում:
Դրանք հեշտ է հաշվարկել՝ հաջորդաբար համեմատելով Y շարքի յուրաքանչյուր առարկայի դասակարգումը պողպատեների հետ:
Քենդալի գործակիցը.

Ընդհանուր դեպքում, τ (ավելի ճիշտ՝ P կամ Q) հաշվարկը նույնիսկ 10-ի կարգի N-ի համար, պարզվում է, որ դժվար է։ Եկեք ցույց տանք, թե ինչպես պարզեցնել հաշվարկները:

կամ

Լուծում.
Տվյալները դասավորենք ըստ X-ի:
Y շարքում, 2-ից աջ, կան 2-ից մեծ 8 աստիճաններ, ուստի 2-ը կառաջացնի 8-րդ անդամ P-ում:
4-ի աջ կողմում 4-ից մեծ 6 աստիճան կա (դրանք 7, 5, 6, 8, 9, 10), այսինքն. P-ն կներառի 6-ը և այլն: Արդյունքում, P = 29 և օգտագործելով բանաձևերը, մենք ունենք.

XՅաստիճան X, dxաստիճան Y, d yՊՔ
38 292 1 2 8 1
50 302 2 4 6 2
52 366 3 7 3 4
54 312 4 5 4 2
59 359 5 6 3 2
61 398 6 8 2 2
66 401 7 9 1 2
70 298 8 3 1 1
71 283 9 1 1 0
73 413 10 10 0 0
29 16


Պարզեցված բանաձևեր.


Որպեսզի փորձարկենք զրոյական վարկածը α նշանակության մակարդակում, որ Քենդալի ընդհանուր վարկանիշային հարաբերակցության գործակիցը հավասար է զրոյի մրցակցող Н 1: τ ≠ 0 վարկածով, անհրաժեշտ է հաշվարկել կրիտիկական կետը.

որտեղ n-ը նմուշի չափն է. z kp-ը երկկողմանի կրիտիկական շրջանի կրիտիկական կետն է, որը հայտնաբերվել է Լապլասի ֆունկցիայի աղյուսակից Ф(z kp)=(1 - α)/2 հավասարությամբ։
Եթե ​​|տ| T kp - զրոյական վարկածը մերժվում է: Որակական հատկանիշների միջև զգալի աստիճանային հարաբերակցություն կա։
Եկեք գտնենք z kp կրիտիկական կետը
Ф(z kp) = (1 - α)/2 = (1 - 0.05)/2 = 0.475
Ըստ Լապլասի աղյուսակի, մենք գտնում ենք z kp = 1.96
Գտնենք կրիտիկական կետը.

Քանի որ տ

Քենդալի հարաբերակցության գործակիցը օգտագործվում է, երբ փոփոխականները ներկայացված են երկու հերթական սանդղակով, պայմանով, որ չկան հարակից աստիճաններ: Քենդալի գործակցի հաշվարկը կապված է համընկնումների և շրջումների քանակի հաշվման հետ։ Դիտարկենք այս ընթացակարգը նախորդ խնդրի օրինակով:

Խնդիրը լուծելու ալգորիթմը հետևյալն է.

    Մենք վերաֆորմատավորում ենք աղյուսակի տվյալները։ 8.5 այնպես, որ տողերից մեկը (այս դեպքում տող xթ) դասակարգվել է. Այլ կերպ ասած, մենք զույգերով փոխանակում ենք xև y ճիշտ կարգով և մենք տվյալները մուտքագրում ենք աղյուսակի 1-ին և 2-րդ սյունակներում: 8.6.

Աղյուսակ 8.6

x ես

y ես

2. Որոշեք 2-րդ շարքի «վարկանիշի աստիճանը» ( y i). Այս ընթացակարգն իրականացվում է հետևյալ հաջորդականությամբ.

ա) վերցրեք «3» չդասավորվող շարքի առաջին արժեքը: Շարքերի քանակի հաշվում ստորևտրված համարը, որը ավելինհամեմատած արժեք. Կան 9 նման արժեքներ (թվեր 6, 7, 4, 9, 5, 11, 8, 12 և 10): «Համապատասխանություն» սյունակում մուտքագրում ենք 9 թիվը։ Այնուհետև մենք հաշվում ենք այն արժեքների քանակը, որոնք ավելի քիչերեք. Կան 2 նման արժեքներ (1-ին և 2-րդ հորիզոնականներ); մուտքագրեք 2 համարը «ինվերսիոն» սյունակում:

բ) հրաժարվել 3 համարից (մենք արդեն աշխատել ենք դրա հետ) և կրկնել հաջորդ «6» արժեքի կարգը. ինվերսիաները 4-ն են (1-ին, 2-րդ, 4-րդ և 5-րդ տեղերը): «Համապատասխանություն» սյունակում մուտքագրում ենք 6 թիվը, իսկ «ինվերսիա» սյունակում՝ 4:

գ) նույն ձևով ընթացակարգը կրկնվում է մինչև շարքի ավարտը. Միևնույն ժամանակ, պետք է հիշել, որ յուրաքանչյուր «մշակված» արժեք բացառվում է հետագա քննարկումից (հաշվարկվում են միայն այն շարքերը, որոնք գտնվում են այս թվից ցածր):

Նշում

Հաշվարկներում սխալներ թույլ չտալու համար պետք է նկատի ունենալ, որ յուրաքանչյուր «քայլի» հետ համընկնումների և շրջադարձերի գումարը նվազում է մեկով. Սա հասկանալի է, հաշվի առնելով, որ ամեն անգամ մեկ արժեք բացառվում է քննարկումից:

3. Լուցկիների գումարը հաշվարկվում է (R)և ինվերսիաների գումարը (Q); տվյալները մուտքագրվում են մեկ և երեք փոխանակելի Քենդալի գործակիցների բանաձևերում (8.10): Կատարվում են համապատասխան հաշվարկներ։

տ (8.10)

Մեր դեպքում.

Աղյուսակում. XIV հավելվածները տվյալ նմուշի համար գործակիցի կրիտիկական արժեքներն են՝ τ cr. = 0,45; 0,59. Էմպիրիկորեն ստացված արժեքը համեմատվում է աղյուսակի արժեքի հետ:

Եզրակացություն

τ = 0,55 > τ կր. = 0,45: Հարաբերակցությունը վիճակագրորեն նշանակալի է 1-ին մակարդակի համար:

Նշում:

Անհրաժեշտության դեպքում (օրինակ, կրիտիկական արժեքների աղյուսակի բացակայության դեպքում), վիճակագրական նշանակություն տՔենդալը կարող է սահմանվել հետևյալ բանաձևով.

(8.11)

որտեղ S* = P - Q+ 1 եթե Պ< Q , և S* = P - Q - 1 եթե Պ > Ք.

Արժեքներ զհամապատասխան նշանակության մակարդակի համար համապատասխանում են Պիրսոնի չափմանը և գտնվել են համապատասխան աղյուսակների համաձայն (ներառված չեն հավելվածում: Նշանակության ստանդարտ մակարդակների համար զ cr = 1.96 (β 1 = 0.95-ի համար) և 2.58 (β 2 = 0.99-ի համար): Քենդալի հարաբերակցության գործակիցը վիճակագրորեն նշանակալի է, եթե զ > զկր

Մեր դեպքում S* = P - Q– 1 = 35 և զ= 2,40, այսինքն՝ հաստատված է նախնական եզրակացությունը՝ նշանների միջև հարաբերակցությունը վիճակագրորեն նշանակալի է նշանակության 1-ին մակարդակի համար։

Նորմալության ենթադրության վրա հիմնված չափանիշների կիրառումը սահմանափակող գործոններից մեկը ընտրանքի չափն է: Քանի դեռ ընտրանքը բավականաչափ մեծ է (օրինակ՝ 100 կամ ավելի դիտարկում), դուք կարող եք ենթադրել, որ ընտրանքի բաշխումը նորմալ է, նույնիսկ եթե վստահ չեք, որ փոփոխականի բաշխումը բնակչության մեջ նորմալ է։ Այնուամենայնիվ, եթե նմուշը փոքր է, այս թեստերը պետք է օգտագործվեն միայն այն դեպքում, եթե վստահություն կա, որ փոփոխականն իսկապես նորմալ բաշխված է: Այնուամենայնիվ, այս ենթադրությունը փոքր նմուշի վրա ստուգելու միջոց չկա:

Նորմալության ենթադրության վրա հիմնված չափանիշների օգտագործումը նույնպես սահմանափակվում է չափման սանդղակով (տե՛ս գլուխը Տվյալների վերլուծության տարրական հասկացություններ): Վիճակագրական մեթոդները, ինչպիսիք են t-test-ը, ռեգրեսիան և այլն, ենթադրում են, որ սկզբնական տվյալները շարունակական են: Այնուամենայնիվ, կան իրավիճակներ, երբ տվյալները պարզապես դասակարգվում են (չափվում են հերթական սանդղակով), այլ ոչ թե ճշգրիտ չափվում:

Տիպիկ օրինակ են կայքերի վարկանիշները ինտերնետում. առաջին տեղը զբաղեցնում է կայքը առավելագույն թվով այցելուներով, երկրորդ տեղը զբաղեցնում է կայքը մաքսիմալ այցելուներով մնացած կայքերի մեջ (կայքերի շարքում, որոնցից առաջին կայքը հեռացվել է) և այլն։ Իմանալով վարկանիշները՝ կարելի է ասել, որ մի կայքի այցելուների թիվն ավելի մեծ է, քան մյուսի այցելուների թիվը, բայց որքան ավելին, անհնար է ասել։ Պատկերացրեք, որ ունեք 5 կայք՝ A, B, C, D, E, որոնք գտնվում են լավագույն 5 տեղերում։ Ենթադրենք, որ ընթացիկ ամսում ունեինք հետևյալ դասավորությունը՝ A, B, C, D, E, իսկ նախորդ ամսին՝ D, E, A, B, C: Հարցն այն է, թե արդյոք վարկանիշներում էական փոփոխություններ եղե՞լ են։ կայքերի, թե ոչ. Այս իրավիճակում, ակնհայտորեն, մենք չենք կարող օգտագործել t-թեստ՝ տվյալների այս երկու հավաքածուները համեմատելու համար, և մենք շարժվում ենք դեպի կոնկրետ հավանականական հաշվարկների տիրույթ (և ցանկացած վիճակագրական թեստ պարունակում է հավանականական հաշվարկ): Մենք մոտավորապես հետևյալն ենք պատճառաբանում. որքանո՞վ է հավանական, որ երկու կայքի պայմանավորվածությունների տարբերությունը պայմանավորված է զուտ պատահական պատճառներով, կամ այս տարբերությունը չափազանց մեծ է և չի կարող բացատրվել զուտ պատահականությամբ: Այս քննարկումներում մենք օգտագործում ենք միայն կայքերի շարքերը կամ փոխարկումները և չենք օգտագործում դրանց այցելուների թվի բաշխման հատուկ տեսակ:

Փոքր նմուշների վերլուծության և վատ մասշտաբներով չափված տվյալների համար օգտագործվում են ոչ պարամետրային մեթոդներ:

Ոչ պարամետրային ընթացակարգերի համառոտ ակնարկ

Ըստ էության, յուրաքանչյուր պարամետրային չափանիշի համար կա առնվազն մեկ ոչ պարամետրային այլընտրանք:

Ընդհանուր առմամբ, այս ընթացակարգերը պատկանում են հետևյալ կատեգորիաներից մեկին.

  • անկախ նմուշների տարբերության չափանիշներ;
  • Կախված նմուշների տարբերության չափանիշները;
  • փոփոխականների միջև կախվածության աստիճանի գնահատում.

Ընդհանուր առմամբ, տվյալների վերլուծության մեջ վիճակագրական չափանիշների մոտեցումը պետք է լինի պրագմատիկ և չծանրաբեռնվի ավելորդ տեսական նկատառումներով: Ձեր տրամադրության տակ գտնվող STATISTICA համակարգիչով դուք կարող եք հեշտությամբ կիրառել մի քանի չափանիշներ ձեր տվյալների նկատմամբ: Իմանալով մեթոդների որոշ թակարդների մասին՝ դուք ճիշտ լուծում կընտրեք փորձերի միջոցով։ Հողամասի զարգացումը միանգամայն բնական է. եթե ձեզ անհրաժեշտ է համեմատել երկու փոփոխականների արժեքները, ապա օգտագործում եք t-test-ը: Այնուամենայնիվ, պետք է հիշել, որ այն հիմնված է յուրաքանչյուր խմբի նորմալության և շեղումների հավասարության ենթադրության վրա: Այս ենթադրություններից ազատվելը հանգեցնում է ոչ պարամետրային թեստերի, որոնք հատկապես օգտակար են փոքր նմուշների համար:

t-թեստի մշակումը հանգեցնում է շեղումների վերլուծության, որն օգտագործվում է, երբ համեմատվող խմբերի թիվը երկուսից մեծ է: Ոչ պարամետրային պրոցեդուրաների համապատասխան զարգացումը հանգեցնում է դիսպերսիայի ոչ պարամետրիկ վերլուծության, թեև այն շատ ավելի վատ է, քան դասական շեղումների վերլուծությունը:

Կախվածությունը կամ, փոքր-ինչ շքեղ ասած, կապի սերտության աստիճանը գնահատելու համար հաշվարկվում է Պիրսոնի հարաբերակցության գործակիցը։ Խստորեն ասած, դրա օգտագործումն ունի սահմանափակումներ, որոնք կապված են, օրինակ, սանդղակի տեսակի հետ, որով չափվում են տվյալները և կախվածության ոչ գծայինությունը, հետևաբար, որպես այլընտրանքային, ոչ պարամետրիկ կամ, այսպես կոչված, աստիճանական հարաբերակցության գործակիցներ: օգտագործվում են նաև, որոնք օգտագործվում են, օրինակ, դասակարգված տվյալների համար։ Եթե ​​տվյալները չափվում են անվանական մասշտաբով, ապա բնական է դրանք ներկայացնել պատահական աղյուսակներում, որոնք օգտագործում են Pearson-ի chi-square թեստը տարբեր տատանումներով և ճշգրտումներով ճշգրտության համար:

Այսպիսով, ըստ էության, կան միայն մի քանի տեսակի չափանիշներ և ընթացակարգեր, որոնք դուք պետք է իմանաք և կարողանաք օգտագործել՝ կախված տվյալների առանձնահատկություններից: Դուք պետք է որոշեք, թե որ չափանիշը պետք է կիրառվի որոշակի իրավիճակում:

Ոչ պարամետրիկ մեթոդներն առավել նպատակահարմար են, երբ ընտրանքի չափը փոքր է: Եթե ​​կան շատ տվյալներ (օրինակ՝ n > 100), հաճախ անիմաստ է օգտագործել ոչ պարամետրային վիճակագրություն։

Եթե ​​ընտրանքի չափը շատ փոքր է (օրինակ՝ n = 10 կամ ավելի քիչ), ապա այն ոչ պարամետրային թեստերի համար նշանակալի մակարդակները, որոնք օգտագործում են նորմալ մոտարկումը, կարող են դիտարկվել միայն որպես կոպիտ գնահատականներ:

Տարբերությունները անկախ խմբերի միջև. Եթե ​​կան երկու նմուշներ (օրինակ՝ տղամարդիկ և կանայք), որոնք պետք է համեմատվեն որոշ միջին արժեքների հետ կապված, ինչպիսիք են արյան միջին ճնշումը կամ լեյկոցիտների քանակը, ապա կարող է օգտագործվել անկախ նմուշի t-թեստ:

Այս թեստի ոչ պարամետրային այլընտրանքներն են Wald-Wolfowitz, Mann-Whitney )/n շարքի թեստը, որտեղ x i-ը i-րդ արժեքն է, n-ը դիտարկումների քանակը: Եթե ​​փոփոխականը պարունակում է բացասական արժեքներ կամ զրո (0), երկրաչափական միջինը չի կարող հաշվարկվել:

Հարմոնիկ միջին

Հարմոնիկ միջինը երբեմն օգտագործվում է միջին հաճախականությունների համար: Հարմոնիկ միջինը հաշվարկվում է բանաձևով. HS = n/S(1/x i) որտեղ HS-ը ներդաշնակ միջինն է, n-ը՝ դիտումների քանակը, x i-ը՝ i թվով դիտարկման արժեքը: Եթե ​​փոփոխականը պարունակում է զրո (0), ապա ներդաշնակ միջինը չի կարող հաշվարկվել:

Տարբերություն և ստանդարտ շեղում

Նմուշի շեղումը և ստանդարտ շեղումը տվյալների փոփոխականության (տարբերակման) առավել հաճախ օգտագործվող չափորոշիչներն են: Տարբերությունը հաշվարկվում է որպես փոփոխականի արժեքների քառակուսի շեղումների գումարը ընտրանքի միջինից՝ բաժանված n-1-ով (բայց ոչ n-ով): Ստանդարտ շեղումը հաշվարկվում է որպես շեղումների գնահատման քառակուսի արմատ:

շրջանակը

Փոփոխականի միջակայքը անկայունության չափումն է, որը հաշվարկվում է որպես առավելագույնը հանած նվազագույնը:

Կվարտիլային միջակայք

Եռամսյակային միջակայքը, ըստ սահմանման, հետևյալն է. վերևի քառորդը հանած ստորին քառորդը (75% ցենտիլ հանած 25% ցենտիլ): Քանի որ 75% ցենտիլը (վերին քառորդը) այն արժեքն է դեպի ձախ, որից դիտումների 75%-ը, իսկ 25% ցենտիլը (ներքևի քառորդը) այն արժեքն է, որից ձախում են դիտարկումների 25%-ը, ապա քառորդը. միջակայքը մեդիանայի շուրջ միջակայքն է, որը պարունակում է դիտարկումների 50%-ը (փոփոխականի արժեքները):

Ասիմետրիա

Շեղությունը բաշխման ձևի հատկանիշն է: Բաշխումը թեքված է դեպի ձախ, եթե թեքությունը բացասական է: Բաշխումը թեքված է դեպի աջ, եթե թեքությունը դրական է: Ստանդարտ նորմալ բաշխման թեքությունը 0 է: Թեքությունը կապված է երրորդ պահի հետ և սահմանվում է հետևյալ կերպ. թեքություն = n × M 3 /[(n-1) × (n-2) × s 3 ], որտեղ M 3 է` (xi -xmean x) 3 , s 3 - ստանդարտ շեղում բարձրացված երրորդ աստիճանի, n - դիտումների քանակը:

Ավելորդություն

Կուրտոզը բաշխման ձևի բնութագիրն է, այն է՝ նրա գագաթնակետի կտրուկության չափանիշը (նորմալ բաշխման համեմատ, որի կուրտոզը 0 է)։ Որպես ընդհանուր կանոն, նորմալ բաշխման համեմատ ավելի սուր գագաթնակետ ունեցող բաշխումները դրական կուրտոզ ունեն. այն բաշխումները, որոնց գագաթնակետը ավելի քիչ սուր է, քան նորմալ բաշխման գագաթնակետը, ունեն բացասական կուրտոզ: Կուրտոզը կապված է չորրորդ պահի հետ և որոշվում է բանաձևով.

kurtosis = /[(n-1) × (n-2) × (n-3) × s 4], որտեղ M j-ն է. դիտարկումների քանակը.