Քենդալի աստիճանի հարաբերակցության գործակիցը. Rank-ի հարաբերակցությունը և Քենդալի աստիճանի հարաբերակցության գործակիցը Քենդալի աստիճանի հարաբերակցության գործակիցը excel-ում

Համառոտ տեսություն

Քենդալի հարաբերակցության գործակիցը օգտագործվում է, երբ փոփոխականները ներկայացված են երկու հերթական սանդղակով, պայմանով, որ չկան հարակից աստիճաններ: Քենդալի գործակցի հաշվարկը ներառում է համընկնումների և շրջումների քանակի հաշվում։

Այս գործակիցը տատանվում է ներսում և հաշվարկվում է բանաձևով.

Հաշվարկի համար բոլոր միավորները դասակարգվում են ըստ հատկանիշի. Ըստ մի շարք այլ չափանիշների՝ յուրաքանչյուր աստիճանի համար հաշվարկվում է տրվածը գերազանցող հաջորդական (նշում ենք) և տրվածից ցածր (նշում ենք) շարքերը։

Կարելի է ցույց տալ, որ

իսկ Քենդալի աստիճանի հարաբերակցության գործակիցը կարելի է գրել այսպես

Որպեսզի փորձարկենք զրոյական վարկածը նշանակալիության մակարդակով, որ ընդհանուր Քենդալի վարկանիշային հարաբերակցության գործակիցը հավասար է զրոյի մրցակցող վարկածի դեպքում, անհրաժեշտ է հաշվարկել կրիտիկական կետը.

որտեղ է ընտրանքի չափը; Արդյո՞ք երկկողմանի կրիտիկական շրջանի կրիտիկական կետը, որը հայտնաբերվում է Լապլասի ֆունկցիայի աղյուսակից հավասարությամբ

Եթե ​​- զրոյական վարկածը մերժելու պատճառ չկա: Հատկանիշների միջև աստիճանային հարաբերակցությունը աննշան է:

Եթե ​​- զրոյական վարկածը մերժվում է: Առանձնահատկությունների միջև զգալի աստիճանային հարաբերակցություն կա:

Խնդրի լուծման օրինակ

Առաջադրանքը

Թափուր պաշտոնների համար յոթ թեկնածուների հավաքագրելիս առաջարկվել է երկու թեստ. Թեստի արդյունքները (կետերով) ներկայացված են աղյուսակում.

Փորձարկում Թեկնածու 1 2 3 4 5 6 7 1 31 82 25 26 53 30 29 2 21 55 8 27 32 42 26

Հաշվեք Քենդալի աստիճանի հարաբերակցության գործակիցը երկու թեստի արդյունքների միջև և գնահատեք դրա նշանակությունը մակարդակում:

Խնդրի լուծումը

Հաշվի՛ր Քենդալի գործակիցը

Գործոն հատկանիշի շարքերը դասավորված են խիստ աճման կարգով, իսկ արդյունավետ հատկանիշի համապատասխան շարքերը գրանցվում են զուգահեռաբար: Նրան հաջորդող շարքերից յուրաքանչյուրի համար հաշվարկվում է ավելի բարձր կոչումների թիվը (սյունակում մուտքագրված) և ցածր (սյունակում մուտքագրված) աստիճանների թիվը:

1 1 6 0 2 4 3 2 3 3 3 1 4 6 1 2 5 2 2 0 6 5 1 0 7 7 0 0 Գումար 16 5

Նորմալության ենթադրության վրա հիմնված չափանիշների կիրառումը սահմանափակող գործոններից մեկն ընտրանքի չափն է: Քանի դեռ ընտրանքը բավականաչափ մեծ է (օրինակ՝ 100 կամ ավելի դիտարկում), դուք կարող եք ենթադրել, որ ընտրանքի բաշխումը նորմալ է, նույնիսկ եթե վստահ չեք, որ փոփոխականի բաշխումը բնակչության մեջ նորմալ է։ Այնուամենայնիվ, եթե ընտրանքը փոքր է, այս չափանիշները պետք է օգտագործվեն միայն այն դեպքում, եթե վստահություն կա, որ փոփոխականն իսկապես նորմալ բաշխված է: Այնուամենայնիվ, այս ենթադրությունը փոքր նմուշում ստուգելու միջոց չկա:

Նորմալության ենթադրության վրա հիմնված չափանիշների օգտագործումը նույնպես սահմանափակվում է չափումների մասշտաբով (տե՛ս գլուխը Տվյալների վերլուծության հիմնական հասկացությունները): Վիճակագրական մեթոդները, ինչպիսիք են t-test-ը, ռեգրեսիան և այլն, ենթադրում են, որ սկզբնական տվյալները շարունակական են: Այնուամենայնիվ, կան իրավիճակներ, երբ տվյալները պարզապես դասակարգվում են (չափվում են հերթական սանդղակով), այլ ոչ թե ճշգրիտ չափվում:

Տիպիկ օրինակ բերված է ինտերնետում կայքերի վարկանիշներով. առաջին տեղը զբաղեցնում է առավելագույն այցելուների թվով կայքը, երկրորդ տեղը՝ մնացած կայքերի մեջ առավելագույն այցելուներով կայքը (կայքերի շարքում. որտեղից հեռացվել է առաջին կայքը) և այլն։ Իմանալով վարկանիշները՝ կարելի է ասել, որ մի կայքի այցելուների թիվն ավելի մեծ է, քան մյուսի այցելուների թիվը, բայց որքան ավելին անհնար է ասել։ Պատկերացրեք, որ ունեք 5 կայք՝ A, B, C, D, E, որոնք գտնվում են լավագույն 5 տեղերում։ Ենթադրենք, որ ընթացիկ ամսում ունեինք հետևյալ դասավորությունը՝ A, B, C, D, E, իսկ նախորդ ամսում՝ D, E, A, B, C: Հարցն այն է, որ կայքի վարկանիշներում զգալի փոփոխություններ են եղել։ կամ ոչ? Այս իրավիճակում, ակնհայտորեն, մենք չենք կարող օգտագործել t-թեստը տվյալների այս երկու խմբերը համեմատելու համար և անցնելու կոնկրետ հավանականական հաշվարկների տարածք (և ցանկացած վիճակագրական չափանիշ պարունակում է հավանականական հաշվարկ): Մենք բացատրում ենք այսպես. որքանո՞վ է հավանական, որ երկու կայքի դասավորությունների տարբերությունը պայմանավորված է զուտ պատահական պատճառներով, կամ որ տարբերությունը չափազանց մեծ է և չի կարող բացատրվել զուտ պատահականությամբ: Այս պատճառաբանության մեջ մենք օգտագործում ենք միայն կայքերի շարքերը կամ փոխարկումները և ոչ մի կերպ չենք օգտագործում դրանց այցելուների թվի բաշխման հատուկ ձև:

Փոքր նմուշների վերլուծության և վատ մասշտաբներով չափված տվյալների համար օգտագործվում են ոչ պարամետրային մեթոդներ:

Արագ շրջայց ոչ պարամետրիկ ընթացակարգերով

Ըստ էության, յուրաքանչյուր պարամետրային չափանիշի համար կա առնվազն մեկ ոչ պարամետրային այլընտրանք:

Ընդհանուր առմամբ, այս ընթացակարգերը պատկանում են հետևյալ կատեգորիաներից մեկին.

  • անկախ նմուշների տարբերակման չափանիշներ;
  • Կախված նմուշների տարբերակման չափանիշներ;
  • փոփոխականների միջև կախվածության աստիճանի գնահատում.

Ընդհանուր առմամբ, տվյալների վերլուծության մեջ վիճակագրական չափանիշների մոտեցումը պետք է լինի պրագմատիկ և չծանրաբեռնվի անհարկի տեսական հիմնավորումներով: Ձեր տրամադրության տակ գտնվող STATISTICA համակարգիչով դուք կարող եք հեշտությամբ կիրառել մի քանի չափանիշներ ձեր տվյալների նկատմամբ: Իմանալով մեթոդների որոշ թակարդների մասին՝ դուք ճիշտ լուծում կընտրեք փորձերի միջոցով։ Հողամասի զարգացումը միանգամայն բնական է. եթե ձեզ անհրաժեշտ է համեմատել երկու փոփոխականների արժեքները, ապա օգտագործում եք t-test-ը: Այնուամենայնիվ, պետք է հիշել, որ այն հիմնված է յուրաքանչյուր խմբի նորմալության և շեղումների հավասարության ենթադրության վրա: Այս ենթադրություններից ազատվելը հանգեցնում է ոչ պարամետրային թեստերի, որոնք հատկապես օգտակար են փոքր նմուշների համար:

t-թեստի մշակումը հանգեցնում է շեղումների վերլուծության, որն օգտագործվում է, երբ համեմատվող խմբերի թիվը երկուսից ավելի է: Ոչ պարամետրային պրոցեդուրաների համապատասխան զարգացումը հանգեցնում է դիսպերսիայի ոչ պարամետրիկ վերլուծության, թեև այն զգալիորեն ավելի վատ է, քան դասական շեղումների վերլուծությունը:

Կախվածությունը կամ, որոշ շքեղ ասած, կապի խստության աստիճանը գնահատելու համար հաշվարկվում է Պիրսոնի հարաբերակցության գործակիցը։ Խստորեն ասած, դրա կիրառումը ունի սահմանափակումներ, որոնք կապված են, օրինակ, սանդղակի տեսակի հետ, որով չափվում են տվյալները և կախվածության ոչ գծայինությունը, հետևաբար, որպես այլընտրանք, օգտագործվում են նաև ոչ պարամետրական կամ, այսպես կոչված, աստիճանական, հարաբերակցության գործակիցներ, որոնք. օգտագործվում է, օրինակ, դասակարգված տվյալների համար: Եթե ​​տվյալները չափվում են անվանական մասշտաբով, ապա բնական է դրանք ներկայացնել պատահական աղյուսակներում, որոնք օգտագործում են Պիրսոնի խի-քառակուսի թեստը տարբեր տատանումներով և ճշգրտումների համար:

Այսպիսով, ըստ էության, կան միայն մի քանի տեսակի չափանիշներ և ընթացակարգեր, որոնք դուք պետք է իմանաք և կարողանաք օգտագործել՝ կախված տվյալների առանձնահատկություններից: Դուք պետք է որոշեք, թե որ չափանիշը պետք է կիրառվի որոշակի իրավիճակում:

Ոչ պարամետրիկ մեթոդներն առավել նպատակահարմար են, երբ նմուշի չափերը փոքր են: Եթե ​​կան շատ տվյալներ (օրինակ՝ n> 100), հաճախ իմաստ չունի օգտագործել ոչ պարամետրային վիճակագրություն։

Եթե ​​ընտրանքի չափը շատ փոքր է (օրինակ՝ n = 10 կամ ավելի քիչ), ապա այն ոչ պարամետրային թեստերի համար նշանակալի մակարդակները, որոնք օգտագործում են նորմալ մոտարկումը, կարող են դիտարկվել միայն որպես կոպիտ գնահատականներ:

Տարբերությունները անկախ խմբերի միջև... Եթե ​​կան երկու նմուշներ (օրինակ՝ տղամարդիկ և կանայք), որոնք պետք է համեմատվեն ինչ-որ միջին արժեքի հետ կապված, օրինակ՝ միջին ճնշման կամ արյան մեջ լեյկոցիտների քանակի հետ, ապա t-թեստը կարող է օգտագործվել անկախ. նմուշներ.

Այս թեստի ոչ պարամետրիկ այլընտրանքները Val'd-Wolfowitz, Mann-Whitney շարքի չափանիշն են) / n, որտեղ x i-ը i-րդ արժեքն է, n-ը դիտարկումների քանակը: Եթե ​​փոփոխականը պարունակում է բացասական արժեքներ կամ զրո (0), երկրաչափական միջինը չի կարող հաշվարկվել:

Հարմոնիկ միջին

Հարմոնիկ միջինը երբեմն օգտագործվում է միջին հաճախականությունների համար: Ներդաշնակ միջինը հաշվարկվում է բանաձևով՝ ГС = n / S (1 / x i) որտեղ ГС ներդաշնակ միջինն է, n-ը դիտարկումների քանակը, х i՝ i թվով դիտարկման արժեքը: Եթե ​​փոփոխականը պարունակում է զրո (0), ապա ներդաշնակ միջինը չի կարող հաշվարկվել:

Դիսպերսիա և ստանդարտ շեղում

Նմուշի շեղումը և ստանդարտ շեղումը տվյալների փոփոխականության (տարբերակման) առավել հաճախ օգտագործվող չափումն են: Շեղումը հաշվարկվում է որպես ընտրանքի միջինից փոփոխականի արժեքների շեղումների քառակուսիների գումարը՝ բաժանված n-1-ով (բայց ոչ n-ով): Ստանդարտ շեղումը հաշվարկվում է որպես շեղումների գնահատման քառակուսի արմատ:

Ճոճանակ

Փոփոխականի միջակայքը անկայունության ցուցիչ է, որը հաշվարկվում է որպես առավելագույն՝ հանած նվազագույնը:

Քառյակի շրջանակը

Եռամսյակային միջակայքը, ըստ սահմանման, հետևյալն է՝ վերին քառորդ հանած ստորին քառորդը (75% մինուս 25% տոկոս): Քանի որ 75% ցենտիլը (վերին քառորդը) այն արժեքն է դեպի ձախ, որից գտնվում է դեպքերի 75%-ը, իսկ 25% ցենտիլը (ներքևի քառորդը) այն արժեքն է, որից ձախում է գտնվում դեպքերի 25%-ը, ապա քառորդը. միջակայքը միջանկյալ միջակայքի միջակայքն է, որը պարունակում է դեպքերի 50%-ը (փոփոխական արժեքներ):

Ասիմետրիա

Ասիմետրիկությունը բաշխման ձևի բնութագիրն է: Բաշխումը թեքված է դեպի ձախ, եթե թեքության արժեքը բացասական է: Բաշխումը թեքված է դեպի աջ, եթե ասիմետրիան դրական է: Ստանդարտ նորմալ բաշխման թեքությունը 0 է: Թեքությունը կապված է երրորդ պահի հետ և սահմանվում է հետևյալ կերպ՝ թեքություն = n × M 3 / [(n-1) × (n-2) × s 3], որտեղ M 3 (xi -x նշանակում է x) 3, s 3-ը ստանդարտ շեղումը բարձրացված է երրորդ աստիճանի, n-ը դիտարկումների թիվն է:

Ավելորդություն

Կուրտոզը բաշխման ձևի բնութագիրն է, այն է՝ դրա գագաթնակետի ծանրության չափանիշը (նորմալ բաշխման համեմատ, որի կուրտոզը հավասար է 0-ի): Որպես կանոն, նորմալից ավելի սուր գագաթնակետ ունեցող բաշխումները դրական կուրտոզ ունեն. այն բաշխումները, որոնց գագաթնակետը ավելի քիչ սուր է, քան նորմալ բաշխման գագաթնակետը, ունեն բացասական կուրտոզ: Ավելցուկը կապված է չորրորդ պահի հետ և որոշվում է բանաձևով.

kurtosis = / [(n-1) × (n-2) × (n-3) × s 4], որտեղ M j-ն է. մի շարք դիտարկումներ...

Այն օգտագործվում է քանակական կամ որակական ցուցանիշների միջև կապը բացահայտելու համար, եթե դրանք հնարավոր է դասակարգել: X ցուցիչի արժեքները սահմանվում են աճման կարգով և նշանակվում են շարքեր: Y ցուցանիշի արժեքները դասակարգվում են և հաշվարկվում է Քենդալի հարաբերակցության գործակիցը.

որտեղ Ս = ՊՔ.

Պ մեծկոչման արժեքը Յ.

Ք- ընթացիկ դիտարկումներին հաջորդող դիտարկումների ընդհանուր թիվը ավելի փոքրկոչման արժեքը Յ. (հավասար աստիճանները չեն հաշվվում!)

Եթե ​​ուսումնասիրված տվյալները կրկնվում են (ունեն նույն աստիճանները), ապա հաշվարկներում օգտագործվում է Քենդալի շտկված հարաբերակցության գործակիցը.

տ- համապատասխանաբար X և Y շարքերում հարակից շարքերի քանակը:

19. Ո՞րը պետք է լինի ելակետը հետազոտության թեման, օբյեկտը, առարկան, նպատակը, նպատակները և վարկածը սահմանելիս:

Հետազոտական ​​ծրագիրը, որպես կանոն, ունի երկու բաժին՝ մեթոդական և ընթացակարգային։ Առաջինը ներառում է թեմայի արդիականության հիմնավորումը, խնդրի ձևակերպումը, հետազոտության օբյեկտի և առարկայի, նպատակների և խնդիրների սահմանումը, հիմնական հասկացությունների ձևակերպումը (կատեգորիայի ապարատ), հետազոտական ​​օբյեկտի նախնական համակարգված վերլուծությունը և աշխատանքային վարկածի առաջադրումը: Երկրորդ բաժինը բացահայտում է ռազմավարական հետազոտության ծրագիրը, ինչպես նաև նախնական տվյալների հավաքագրման և վերլուծության պլանն ու հիմնական ընթացակարգերը:

Նախ՝ հետազոտության թեմա ընտրելիս պետք է ելնել արդիականությունից։ Համապատասխանության հիմնավորումներառում է ուսուցման և դաստիարակության տեսության և պրակտիկայի հետագա զարգացման համար խնդրի ուսումնասիրության և լուծման անհրաժեշտության և ժամանակին ցուցում: Տեղական հետազոտությունները պատասխանում են այս պահին ամենահրատապ հարցերին, արտացոլում են հասարակության սոցիալական կարգը մանկավարժական գիտությանը և բացահայտում են պրակտիկայում տեղի ունեցող ամենակարևոր հակասությունները: Համապատասխանության չափանիշը դինամիկ է, շարժական, կախված է ժամանակից՝ հաշվի առնելով կոնկրետ և կոնկրետ հանգամանքները։ Իր ամենաընդհանուր ձևով համապատասխանությունը բնութագրում է գիտական ​​գաղափարների և գործնական առաջարկությունների պահանջարկի անհամապատասխանության աստիճանը (որոշակի կարիքը բավարարելու համար) և այն առաջարկությունների միջև, որոնք գիտությունն ու պրակտիկան կարող են ներկայացնել ներկա պահին:

Հետազոտության թեման սահմանող ամենահամոզիչ հիմքը սոցիալական կարգն է, որն արտացոլում է հրատապ լուծում պահանջող առավել սուր, սոցիալապես նշանակալի խնդիրները: Սոցիալական կարգը պահանջում է կոնկրետ թեմայի հիմնավորում։ Սովորաբար սա գիտության մեջ հարցի մշակման աստիճանի վերլուծություն է։

Եթե ​​մանկավարժական պրակտիկայի վերլուծությունից բխում է սոցիալական կարգը, ապա ինքն իրեն գիտական ​​խնդիրգտնվում է այլ հարթությունում: Այն արտահայտում է հիմնական հակասությունը, որը պետք է լուծվի գիտության միջոցով։ Խնդրի լուծումը սովորաբար ուսումնասիրության նպատակը։Նպատակը վերաձեւակերպված խնդիրն է։

Խնդրի ձևակերպումը ենթադրում է օբյեկտի ընտրությունհետազոտություն. Դա կարող է լինել մանկավարժական գործընթաց, մանկավարժական իրականության տարածք կամ ինչ-որ մանկավարժական վերաբերմունք, որը հակասություն է պարունակում: Այլ կերպ ասած, օբյեկտ կարող է լինել ցանկացած բան, որը բացահայտ կամ անուղղակիորեն պարունակում է հակասություն և առաջացնում է խնդրահարույց իրավիճակ: Օբյեկտն այն է, ինչին ուղղված է ճանաչողության գործընթացը: Ուսումնասիրության առարկա -մաս, առարկայի կողմ: Սրանք առավել նշանակալից են գործնական կամ տեսական տեսանկյունից, անմիջական ուսումնասիրության ենթակա օբյեկտի հատկությունները, ասպեկտները, առանձնահատկությունները։

Հետազոտության նպատակին, օբյեկտին և առարկային համապատասխան առաջադրանքներ,որոնք, որպես կանոն, ուղղված են ստուգելուն վարկածներ.Վերջինս տեսականորեն հիմնավորված ենթադրությունների ամբողջություն է, որոնց ճշմարտացիությունը ենթակա է ստուգման։

Չափանիշ գիտական ​​նորությունկարող է օգտագործվել ավարտված ուսումնասիրությունների որակը գնահատելու համար: Այն բնութագրում է նոր տեսական և գործնական եզրահանգումներ, կրթության օրինաչափություններ, դրա կառուցվածքն ու մեխանիզմները, բովանդակությունը, սկզբունքներն ու տեխնոլոգիաները, որոնք ժամանակի այս պահին հայտնի չեն եղել և չեն արձանագրվել մանկավարժական գրականության մեջ: Հետազոտության նորույթը կարող է ունենալ ինչպես տեսական, այնպես էլ գործնական նշանակություն։ Հետազոտության տեսական արժեքը հայեցակարգ ստեղծելու, վարկածի, օրինաչափության, մեթոդի, խնդրի, միտումի, ուղղության բացահայտման մոդելի ստացման մեջ է։ Հետազոտության գործնական նշանակությունը կայանում է առաջարկությունների, առաջարկությունների պատրաստման մեջ և այլն։ Նորության, տեսական և գործնական նշանակության չափանիշները փոխվում են՝ կախված հետազոտության տեսակից, կախված են նաև նոր գիտելիքների ստացման ժամանակից։

ՔԵՆԴԱԼԱ ՌԱՆԿԻ ՀԱՄԱԿԱՐԳԱԿԱՆ ԳՈՐԾԱԿՑՈՂ

Երկու պատահական փոփոխականների (առանձնահատկությունների) կախվածության ընտրանքային չափումներից մեկը X և Y,ելնելով ընտրանքային կետերի դասակարգումից (X 1, Y x), .. ., (X n, Y n). Կ.-ից Ռ. Հետևաբար վերաբերում է դեպի վարկանիշային վիճակագիրներև որոշվում է բանաձևով

որտեղ r i- Դուք պատկանում եք այդ զույգին ( X, Y), Xraven-ի երամի համար i, S = 2N- (n-1) / 2, N-ը նմուշի տարրերի թիվն է, որոնց համար միաժամանակ j> i և r j> r i... Միշտ է Որպես կախվածության ընտրովի միջոց To. To. R. to.-ը լայնորեն կիրառվել է Մ.Քենդալի կողմից (M. Kendall, տես)։

Կ.-ից Ռ. Պատահական փոփոխականների անկախության վարկածը ստուգելու համար օգտագործվում է Կ. Եթե ​​անկախության վարկածը ճիշտ է, ապա E t = 0 և D t = 2 (2n + 5) / 9n (n-1): Փոքր նմուշի չափով ստուգումը վիճակագրական է: անկախության վարկածը կազմված է հատուկ աղյուսակների միջոցով (տես): n> 10-ի համար օգտագործվում է m-ի բաշխման նորմալ մոտարկումը. եթե

ապա անկախության վարկածը մերժվում է, հակառակ դեպքում՝ ընդունվում։ Այստեղ ա . - նշանակության մակարդակը, u a / 2-ը նորմալ բաշխման տոկոսային կետն է: Կ.-ից Ռ. Քանի որ, ինչպես ցանկացած այլ, այն կարող է օգտագործվել երկու որակական հատկանիշների կախվածությունը հայտնաբերելու համար, եթե միայն նմուշի տարրերը կարող են պատվիրվել այս հատկանիշների նկատմամբ: Եթե X, Yունեն միացյալ նորմալ p հարաբերակցության գործակցի հետ, այնուհետև կապը Կ-ի միջև p. դեպի և ունի ձև.

տես նաեւ Սփիրմանի աստիճանի հարաբերակցություն, Ռանկային թեստ:

Լիտ.Քենդալ Մ., Ռանկային հարաբերակցություններ, թարգմ. անգլերենից., Մ., 1975; Van der Waerden B.L., Mathematical, trans. դրանից., Մ., 1960; Բոլշև Լ.Ն., Սմիրնով Ն.Վ., Մաթեմատիկական վիճակագրության աղյուսակներ, Մոսկվա, 1965 թ.

Ա.Վ.Պրոխորով.


Մաթեմատիկայի հանրագիտարան. - Մ.: Խորհրդային հանրագիտարան... Ի.Մ.Վինոգրադով. 1977-1985 թթ.

Տեսեք, թե ինչ է «KENDALLA RANK CORRELATION COFFICIENT»-ը այլ բառարաններում.

    Անգլերեն. с արդյունավետ, աստիճանային հարաբերակցություն Քենդալ; գերմաներեն Kendalls Rangkorrelationskoeffizient. Հարաբերակցության գործակից, որը որոշում է երկու փոփոխականներում բոլոր զույգ առարկաների դասավորության համապատասխանության աստիճանը։ Անտինազի. Սոցիոլոգիայի հանրագիտարան, 2009 ... Սոցիոլոգիայի հանրագիտարան

    ՔԵՆԴԱԼԻ ԿԱՐԳԱՎԻՃԱԿԻ ՀԱՄԱԿԱՐԳԱԿԱՆ ԳՈՐԾԱԿՑԸ- Անգլերեն. արդյունավետ, աստիճանային հարաբերակցություն Քենդալ; գերմաներեն Kendalls Rangkorrelationskoeffizient. Հարաբերակցության գործակիցը, որը որոշում է բոլոր զույգ օբյեկտների դասավորության համապատասխանության աստիճանը երկու փոփոխականներում ... Սոցիոլոգիայի բացատրական բառարան

    Երկու պատահական փոփոխականների (հատկանիշների)՝ X և Y կախվածության չափում, որը հիմնված է անկախ դիտարկման արդյունքների դասակարգման վրա (X1, Y1): ... ., (Xn, Yn): Եթե ​​X-ի արժեքների շարքերը գտնվում են բնական կարգով i = 1,. ... ., n, իսկ Ri-ին համապատասխանող Y աստիճանը ... ... Մաթեմատիկայի հանրագիտարան

    Հարաբերակցության գործակիցը- (Կոռելյացիայի գործակից) Հարաբերակցության գործակիցը երկու պատահական փոփոխականների կախվածության վիճակագրական ցուցանիշ է: Հարաբերակցության գործակիցի որոշումը, հարաբերակցության գործակիցների տեսակները, հարաբերակցության գործակիցի հատկությունները, հաշվարկը և կիրառումը ... ... Ներդրողների հանրագիտարան

    Պատահական փոփոխականների միջև կապը, որը, ընդհանուր առմամբ, խիստ ֆունկցիոնալ չէ: Ի տարբերություն ֆունկցիոնալ կախվածության, Կ., որպես կանոն, համարվում է այն դեպքում, երբ մեծություններից մեկը կախված է ոչ միայն այս մյուսից, այլև ... ... Մաթեմատիկայի հանրագիտարան

    Հարաբերակցությունը (կոռելյացիայի կախվածությունը) երկու կամ ավելի պատահական փոփոխականների (կամ քանակությունների, որոնք կարող են այդպիսին համարվել որոշակի ընդունելի ճշգրտությամբ) վիճակագրական հարաբերություն է։ Այս դեպքում մեկ կամ ... ... Վիքիպեդիայի արժեքների փոփոխություններ

    Հարաբերակցություն- (Հարաբերակցություն) Հարաբերակցությունը երկու կամ ավելի պատահական փոփոխականների վիճակագրական հարաբերություն է: Հարաբերակցության հայեցակարգը, հարաբերակցության տեսակները, հարաբերակցության գործակիցը, հարաբերակցության վերլուծությունը, գների հարաբերակցությունը, արժութային զույգերի հարաբերակցությունը Forex Contents-ում ... ... Ներդրողների հանրագիտարան

    Ընդհանրապես ընդունված է, որ մ.դ.-ի սկիզբը Ս. կամ, ինչպես հաճախ անվանում են, «փոքր n»-ի վիճակագրությունը դրվել է XX դարի առաջին տասնամյակում Վ. աշխարհը մի փոքր ուշ ...... Հոգեբանական հանրագիտարան

    Մորիս Քենդալ Սըր Մորիս Ջորջ Քենդալ Ծննդյան ամսաթիվ՝ 1907 թվականի սեպտեմբերի 6 (1907 09 06) Ծննդյան վայր՝ Քեթերինգ, Մեծ Բրիտանիա Մահվան տարեթիվ ... Վիքիպեդիա

    Կանխատեսում- (Կանխատեսում) Կանխատեսման սահմանում, կանխատեսման առաջադրանքներ և սկզբունքներ Կանխատեսման սահմանում, կանխատեսման առաջադրանքներ և սկզբունքներ, կանխատեսման մեթոդներ Բովանդակություն Բովանդակություն Սահմանում Կանխատեսման հիմնական հասկացությունները Կանխատեսման առաջադրանքներ և սկզբունքներ ... ... Ներդրողների հանրագիտարան

Քենդալի աստիճանի հարաբերակցության գործակիցը հաշվարկելու համար r kանհրաժեշտ է ատրիբուտներից մեկի տվյալները դասակարգել աճման կարգով և որոշել երկրորդ հատկանիշի համապատասխան աստիճանները։ Այնուհետև երկրորդ հատկանիշի յուրաքանչյուր աստիճանի համար որոշվում է հաջորդ աստիճանների թիվը, որոնք մեծությամբ ավելի մեծ են, քան վերցված աստիճանը, և գտնվում է այդ թվերի գումարը։

Քենդալի աստիճանի հարաբերակցության գործակիցը որոշվում է բանաձևով


որտեղ R i- երկրորդ փոփոխականի աստիճանների թիվը՝ սկսած ես+1, որի մեծությունն ավելի մեծ է, քան մեծությունը եսայս փոփոխականի վարկանիշը:

Կան գործակիցի բաշխման տոկոսային կետերի աղյուսակներ r k, որը թույլ է տալիս ստուգել հարաբերակցության գործակցի նշանակության մասին վարկածը։

Մեծ նմուշի չափերի համար՝ կրիտիկական արժեքներ r kաղյուսակավորված չեն, և դրանք պետք է հաշվարկվեն՝ օգտագործելով մոտավոր բանաձևեր, որոնք հիմնված են այն փաստի վրա, որ զրոյական հիպոթեզում H 0: r k= 0 և մեծ nպատահական արժեք

բաշխված մոտավորապես ստանդարտ նորմալ օրենքի համաձայն:

40. Անվանական կամ հերթական սանդղակով չափվող հատկանիշների փոխհարաբերությունը

Հաճախ խնդիր է առաջանում անվանական կամ հերթական սանդղակով չափվող երկու հատկանիշների անկախությունը ստուգելու հարցում:

Թող որոշ առարկաներ չափեն երկու հատկանիշ Xև Յմակարդակների քանակով rև սհամապատասխանաբար. Նման դիտարկումների արդյունքները հարմար կերպով ներկայացված են աղյուսակի տեսքով, որը կոչվում է պատահականության աղյուսակ:

Աղյուսակում u i(ես = 1, ..., r) և v ժ (ժ= 1, ..., ս) - հատկանիշների կողմից վերցված արժեքները, արժեքը n ij- օբյեկտների թիվը այն օբյեկտների ընդհանուր թվից, որոնց հատկանիշը Xիմաստը վերցրեց u i, և նշանը Յ- իմաստը v ժ

Մենք ներկայացնում ենք հետևյալ պատահական փոփոխականները.

u i


- արժեք ունեցող օբյեկտների քանակը v ժ


Բացի այդ, կան ակնհայտ հավասարություններ



Դիսկրետ պատահական փոփոխականներ Xև Յանկախ, եթե և միայն, եթե

բոլոր զույգերի համար ես, ժ

Հետևաբար, դիսկրետ պատահական փոփոխականների անկախության մասին ենթադրությունը Xև Յկարելի է գրել այսպես.

Որպես այլընտրանք, որպես կանոն, օգտագործում են վարկածը

H 0 վարկածի վավերականությունը պետք է դատել ընտրանքի հաճախականությունների հիման վրա n ijարտակարգ իրավիճակների աղյուսակներ. Մեծ թվերի օրենքի համաձայն ժամը n→ ∞, հարաբերական հաճախականությունները մոտ են համապատասխան հավանականություններին.



H 0 վարկածը ստուգելու համար օգտագործվում է վիճակագրություն

որը, եթե վարկածը ճշմարիտ է, ունի բաշխվածություն χ 2 վրկ rs − (r + ս- 1) ազատության աստիճաններ.

Անկախության չափանիշ χ 2-ը մերժում է α նշանակության մակարդակով H 0 վարկածը, եթե.


41. Ռեգրեսիոն վերլուծություն. Ռեգրեսիոն վերլուծության հիմնական հասկացությունները

Ուսումնասիրված փոփոխականների միջև վիճակագրական հարաբերությունների մաթեմատիկական նկարագրության համար պետք է լուծվեն հետևյալ խնդիրները.

ü ընտրել գործառույթների մի դաս, որտեղ նպատակահարմար է փնտրել հետաքրքրության կախվածության լավագույն (որոշակի իմաստով) մոտարկումը.

ü գտնել պահանջվող կախվածության հավասարումների մեջ ներառված պարամետրերի անհայտ արժեքների գնահատումները.

ü հաստատել պահանջվող կախվածության ստացված հավասարման համարժեքությունը.

ü բացահայտել առավել տեղեկատվական մուտքային փոփոխականները:

Թվարկված առաջադրանքների ամբողջությունը ռեգրեսիոն վերլուծության հետազոտության առարկա է։

Ռեգրեսիոն ֆունկցիան (կամ ռեգրեսիան) մեկ պատահական փոփոխականի մաթեմատիկական ակնկալիքի կախվածությունն է մեկ այլ պատահական փոփոխականի կողմից վերցված արժեքից, որը առաջինի հետ կազմում է պատահական փոփոխականների երկչափ համակարգ։

Թող լինի պատահական փոփոխականների համակարգ ( X,Յ), ապա ռեգրեսիայի ֆունկցիան Յվրա X

Իսկ ռեգրեսիայի ֆունկցիան Xվրա Յ

Ռեգրեսիայի գործառույթներ զ(x) և φ (y) փոխադարձ շրջելի չեն, եթե միայն փոխհարաբերությունները Xև Յֆունկցիոնալ չէ.

Երբ n- ծավալային վեկտոր կոորդինատներով X 1 , X 2 ,…, X nԴուք կարող եք դիտարկել ցանկացած բաղադրիչի պայմանական մաթեմատիկական ակնկալիքը: Օրինակ, համար X 1


կոչվում է ռեգրեսիա X 1 վրա X 2 ,…, X n.

Ռեգրեսիոն ֆունկցիայի ամբողջական սահմանման համար անհրաժեշտ է իմանալ ելքային փոփոխականի պայմանական բաշխումը մուտքային փոփոխականի ֆիքսված արժեքների համար:

Քանի որ իրական իրավիճակում նման տեղեկատվությունը հասանելի չէ, դրանք սովորաբար սահմանափակվում են համապատասխան մոտավոր ֆունկցիայի որոնմամբ զ ա(x) համար զ(x), հիմնվելով ձևի վիճակագրական տվյալների վրա ( x i, y i), ես = 1,…, n... Այս տվյալները արդյունքն են nանկախ դիտարկումներ y 1 ,…, y nպատահական փոփոխական Յմուտքային փոփոխականի արժեքների համար x 1 ,…, x n, մինչդեռ ռեգրեսիոն վերլուծությունը ենթադրում է, որ մուտքային փոփոխականի արժեքները ճշգրտորեն նշված են:

Լավագույն մոտավոր ֆունկցիայի ընտրության խնդիրը զ ա(x), լինելով հիմնականը ռեգրեսիոն վերլուծության մեջ և չունի դրա լուծման պաշտոնական ընթացակարգեր։ Երբեմն ընտրությունը որոշվում է փորձարարական տվյալների վերլուծության հիման վրա, ավելի հաճախ՝ տեսական նկատառումներից:

Եթե ​​ենթադրվում է, որ ռեգրեսիոն ֆունկցիան բավականաչափ հարթ է, ապա մոտավոր ֆունկցիան զ ա(x) կարող է ներկայացվել որպես գծային անկախ հիմքի ֆունկցիաների բազմության գծային համակցություն ψ կ(x), կ = 0, 1,…, մ−1, այսինքն՝ ձևով


որտեղ մ- անհայտ պարամետրերի քանակը θ k(ընդհանուր դեպքում արժեքը անհայտ է, զտված մոդելի կառուցման ընթացքում):

Նման ֆունկցիան պարամետրերով գծային է, հետևաբար, դիտարկվող դեպքում մենք խոսում ենք ռեգրեսիոն ֆունկցիայի մոդելի մասին, որը պարամետրերով գծային է։

Այնուհետև հետընթացի գծի լավագույն մոտավորությունը գտնելու խնդիրը զ(x) կրճատվում է պարամետրերի այնպիսի արժեքներ գտնելու համար, որոնց համար զ ա(x; θ) ամենահամարժեքն է առկա տվյալներին: Այս խնդիրը լուծելու մեթոդներից մեկը նվազագույն քառակուսիների մեթոդն է:

42. Նվազագույն քառակուսի մեթոդ

Թող միավորների հավաքածուն ( x i, y i), ես= 1,…, nգտնվում է հարթության վրա ինչ-որ ուղիղ գծով

Հետո՝ որպես ֆունկցիա զ ա(x) ռեգրեսիոն ֆունկցիայի մոտավորացում զ(x) = Մ [Յ|x] բնական է փաստարկի գծային ֆունկցիա վերցնելը x:


Այսինքն՝ այստեղ ընտրված են բազային ֆունկցիաները ψ 0 (x) ≡1 և ψ 1 (x)≡x... Այս ռեգրեսիան կոչվում է պարզ գծային ռեգրեսիա։

Եթե ​​միավորների բազմությունը ( x i, y i), ես= 1,…, nգտնվում է ինչ-որ կորի երկայնքով, ապա՝ որպես զ ա(x) բնական է փորձել ընտրել պարաբոլների ընտանիքը

Այս ֆունկցիան պարամետրերով ոչ գծային է θ 0 և θ 1, սակայն, ֆունկցիոնալ փոխակերպմամբ (այս դեպքում, հաշվի առնելով լոգարիթմը), այն կարող է կրճատվել նոր ֆունկցիայի f ’a(x), գծային պարամետրերով.


43. Պարզ գծային ռեգրեսիա

Ամենապարզ ռեգրեսիոն մոդելը պարզ (միաչափ, մեկ գործոնով, զույգացված) գծային մոդելն է, որն ունի հետևյալ ձևը.


որտեղ ε i- պատահական փոփոխականներ (սխալներ), որոնք փոխկապակցված չեն միմյանց հետ, որոնք ունեն զրոյական մաթեմատիկական ակնկալիքներ և նույն շեղումները. σ 2 , աև բ- հաստատուն գործակիցներ (պարամետրեր), որոնք պետք է գնահատվեն պատասխանի չափված արժեքներից y i.

Պարամետրերի գնահատականները գտնելու համար աև բգծային ռեգրեսիա, որը որոշում է փորձարարական տվյալներին առավել բավարարող ուղիղ գիծը.


կիրառվում է նվազագույն քառակուսիների մեթոդը:

Համաձայն նվազագույն քառակուսիները պարամետրերի գնահատականներ աև բհայտնաբերվում են արժեքների շեղումների քառակուսիների գումարը նվազագույնի հասցնելու պայմանից y iուղղահայաց «ճշմարիտ» ռեգրեսիայի գծից.

Թող լինի տասը պատահական փոփոխականի դիտարկում Յփոփոխականի ֆիքսված արժեքներով X

Նվազագույնի հասցնելու համար Դմասամբ ածանցյալները հավասարեցնում ենք զրոյի աև բ:



Արդյունքում, մենք ստանում ենք հետևյալ հավասարումների համակարգը գնահատումներ գտնելու համար աև բ:


Այս երկու հավասարումների լուծումը տալիս է.



Արտահայտություններ պարամետրերի գնահատումների համար աև բկարող է ներկայացվել նաև որպես.

Այնուհետև ռեգրեսիոն գծի էմպիրիկ հավասարումը Յվրա Xկարելի է գրել այսպես.


Անաչառ շեղումների գնահատում σ Արժեքների 2 շեղումներ y iռեգրեսիայի հարմարեցված ուղիղ գծից տրված է արտահայտությունը

Հաշվենք ռեգրեսիայի հավասարման պարամետրերը


Այսպիսով, ռեգրեսիայի գիծն ունի հետևյալ տեսքը.


Իսկ արժեքների շեղումների շեղումների գնահատումը y iհետընթացի հարմարեցված ուղիղ գծից


44. Ստուգելով ռեգրեսիոն գծի նշանակությունը

Գտնված գնահատական բ≠ 0-ը կարող է լինել պատահական փոփոխականի իրականացում, որի մաթեմատիկական ակնկալիքը զրո է, այսինքն՝ կարող է պարզվել, որ իրականում ռեգրեսիոն կախվածություն չկա։

Այս իրավիճակին դիմակայելու համար դուք պետք է փորձարկեք H 0 վարկածը. բ= 0 մրցակցող վարկածով H 1: բ ≠ 0.

Ռեգրեսիոն գծի նշանակության թեստը կարող է իրականացվել՝ օգտագործելով շեղումների վերլուծություն:

Հաշվի առեք հետևյալ ինքնությունը.

Մեծությունը y iŷ i = ε iկոչվում է մնացորդ և տարբերություն է երկու մեծությունների միջև.

ü դիտարկվող արժեքի (պատասխանի) շեղումը ընդհանուր միջին պատասխանից.

ü կանխատեսված պատասխանի արժեքի շեղում ŷ iնույն միջինից

Գրավոր ինքնությունը կարող է գրվել որպես


Քառակուսի բերելով դրա երկու մասերը և ամփոփելով ես, ստանում ենք.


Որտեղ քանակները նշված են.

SC n-ի քառակուսիների ընդհանուր (ընդհանուր) գումարը, որը հավասար է դիտումների շեղումների քառակուսիների գումարին՝ դիտումների միջին արժեքի նկատմամբ.

SK p-ի ռեգրեսիայի շնորհիվ քառակուսիների գումարը, որը հավասար է ռեգրեսիոն գծի արժեքների շեղումների քառակուսիների գումարին` համեմատած դիտումների միջինի հետ:

քառակուսիների մնացորդային գումարը SK 0: որը հավասար է ռեգրեսիոն գծի արժեքների նկատմամբ դիտարկումների շեղումների քառակուսիների գումարին

Այսպիսով, տարածումը Յ-kov հարաբերական իրենց միջինին կարող է որոշ չափով վերագրել այն փաստը, որ ոչ բոլոր դիտարկումներն են ընկած ռեգրեսիայի գծի վրա: Եթե ​​դա այդպես լիներ, ապա ռեգրեսիային հարաբերական քառակուսիների գումարը կլիներ զրո: Հետևում է, որ ռեգրեսիան նշանակալի կլինի, եթե SC p-ի քառակուսիների գումարը մեծ լինի SC 0-ի քառակուսիների գումարից։

Ռեգրեսիայի նշանակության թեստի հաշվարկները կատարվում են հետևյալ ANOVA աղյուսակում:

Եթե ​​սխալներ ε iբաշխված է սովորական օրենքի համաձայն, ապա եթե H 0 վարկածը վավեր է. բ= 0 վիճակագրություն:


բաշխված ըստ Ֆիշերի օրենքի՝ ազատության աստիճանների թվով 1 և n−2.

Զուր վարկածը կմերժվի α նշանակության մակարդակում, եթե հաշվարկված վիճակագրական արժեքը Ֆավելի մեծ կլինի α-ի տոկոսային կետից զ 1;n−2; Ֆիշերի բաշխման α.

45. Հետադարձ մոդելի համարժեքության ստուգում. Մնացորդային մեթոդ

Կառուցված ռեգրեսիոն մոդելի համարժեքությունը հասկացվում է որպես այն փաստը, որ ոչ մի այլ մոդել էական բարելավում չի տալիս արձագանքը կանխատեսելու հարցում:

Եթե ​​պատասխանների բոլոր արժեքները ստացվում են տարբեր արժեքներով x, այսինքն, չկան մի քանի պատասխան արժեքներ, որոնք ստացվել են նույնով x i, ապա կարող է իրականացվել միայն գծային մոդելի համարժեքության սահմանափակ փորձարկում։ Նման ստուգման հիմքը մնացորդներն են.

Սահմանված օրինաչափությունից շեղումներ.

Այնքանով, որքանով X- միաչափ փոփոխական, միավորներ ( x i, դ i) կարող է գծագրվել հարթության վրա, այսպես կոչված, մնացորդային հողամասի տեսքով։ Նման ներկայացումը երբեմն հնարավորություն է տալիս որոշակի օրինաչափություն գտնել մնացորդների վարքագծի մեջ։ Բացի այդ, մնացորդների վերլուծությունը թույլ է տալիս վերլուծել սխալների բաշխման վերաբերյալ ենթադրությունը:

Այն դեպքում, երբ սխալները բաշխված են սովորական օրենքի համաձայն և կա դրանց շեղումների ապրիորի գնահատում. σ 2 (նախկինում կատարված չափումների հիման վրա ստացված գնահատական), ապա հնարավոր է մոդելի համարժեքության ավելի ճշգրիտ գնահատում:

Միջոցով Ֆ-Ֆիշերի չափանիշը կարող է օգտագործվել ստուգելու համար, թե արդյոք մնացորդային շեղումը նշանակալի է ս 0 2-ը տարբերվում է ապրիորի գնահատականից: Եթե ​​այն զգալիորեն ավելի մեծ է, ապա կա անբավարարություն, և մոդելը պետք է վերանայվի։

Եթե ​​նախնական գնահատականը σ 2 ոչ, բայց պատասխանի չափումներ Յկրկնվում է երկու կամ ավելի անգամ նույն արժեքներով X, ապա այս կրկնվող դիտարկումները կարող են օգտագործվել մեկ այլ գնահատական ​​ստանալու համար σ 2 (առաջինը մնացորդային շեղումն է): Ասվում է, որ նման գնահատականը ներկայացնում է «մաքուր» սխալ, քանի որ եթե xնույնն են երկու կամ ավելի դիտարկումների դեպքում, ապա միայն պատահական փոփոխությունները կարող են ազդել արդյունքների վրա և ստեղծել ցրում դրանց միջև:

Ստացված գնահատականը պարզվում է, որ շեղումների ավելի հուսալի գնահատական ​​է, քան այլ մեթոդներով ստացված գնահատականը: Այդ իսկ պատճառով փորձեր պլանավորելիս իմաստ ունի փորձեր կազմակերպել կրկնություններով:

Ենթադրենք՝ ունենք մտարբեր իմաստներ X : x 1 , x 2 , ..., x մ... Թող այս արժեքներից յուրաքանչյուրի համար x iկա n iպատասխան դիտարկումներ Յ... Ընդհանուր դիտարկումները ստացվում են.

Այնուհետև պարզ գծային ռեգրեսիայի մոդելը կարելի է գրել հետևյալ կերպ.


Եկեք գտնենք «մաքուր» սխալների տարբերությունը: Այս շեղումը շեղման համակցված գնահատումն է σ 2, եթե մենք ներկայացնում ենք պատասխանների արժեքները y ijժամը x = x iորպես նմուշի ծավալ n i... Արդյունքում, «մաքուր» սխալների տարբերությունը հետևյալն է.

Այս տարբերությունը ծառայում է որպես գնահատական σ 2 անկախ նրանից, թե արդյոք տեղադրված մոդելը ճիշտ է:

Եկեք ցույց տանք, որ «մաքուր սխալների» քառակուսիների գումարը քառակուսիների մնացորդային գումարի մի մասն է (մնացորդային շեղումների արտահայտության մեջ ներառված քառակուսիների գումարը): Մնացած համար ժրդ դիտարկումը ժամը x iկարելի է գրել այսպես.

Եթե ​​այս հավասարության երկու կողմերն էլ քառակուսի դարձնեք, ապա գումարեք դրանք ժև ըստ ես, ստանում ենք.

Այս հավասարության ձախ կողմում քառակուսիների մնացորդային գումարն է: Աջ կողմում գտնվող առաջին անդամը «մաքուր» սխալների քառակուսիների գումարն է, երկրորդ անդամը կարելի է անվանել անբավարարության քառակուսիների գումար: Վերջին գումարն ունի մ−2 աստիճան ազատության, հետևաբար՝ անբավարարության շեղում

H 0 վարկածի փորձարկման չափանիշի վիճակագրությունը. պարզ գծային մոդելը համարժեք է, Հ 1 վարկածի հակառակ. պարզ գծային մոդելն անբավարար է, պատահական փոփոխականը՝

Եթե ​​զրոյական վարկածը ճշմարիտ է, արժեքը Ֆունի Ֆիշերի բաշխում՝ ազատության աստիճաններով մ−2 և nմ... Ռեգրեսիոն գծի գծայինության վարկածը պետք է մերժվի α նշանակալի մակարդակով, եթե վիճակագրության ստացված արժեքը մեծ է ազատության աստիճանների թվով Ֆիշերի բաշխման α-տոկոսային կետից։ մ−2 և nմ.

46. Հետադարձ մոդելի համարժեքության ստուգում (տես 45): ԱՆՈՎԱ

47. Հետադարձ մոդելի համարժեքության ստուգում (տես 45): Որոշման գործակից

Երբեմն ռեգրեսիոն գծի որակը բնութագրելու համար օգտագործվում է որոշման օրինակելի գործակից Ռ 2, ցույց տալով, թե քառակուսիների գումարի որ մասն է (կոտորակ), ռեգրեսիայի շնորհիվ, SK p-ն գտնվում է SK n քառակուսիների ընդհանուր գումարում:

Որքան ավելի մոտ Ռ 2-ից մեկին, որքան ավելի լավ է ռեգրեսիան մոտավոր փորձարարական տվյալներին, այնքան ավելի մոտ են դիտարկումները ռեգրեսիոն գծի հարևանությամբ: Եթե Ռ 2 = 0, ապա պատասխանի փոփոխություններն ամբողջությամբ պայմանավորված են չհաշվառված գործոնների ազդեցությամբ, իսկ ռեգրեսիոն գիծը զուգահեռ է առանցքին: x-ով. Պարզ գծային ռեգրեսիայի դեպքում որոշման գործակիցը Ռ 2-ը հավասար է հարաբերակցության գործակցի քառակուսուն r 2 .

R 2 = 1 առավելագույն արժեքը կարելի է ձեռք բերել միայն այն դեպքում, երբ դիտարկումները կատարվել են x-ov-ի տարբեր արժեքներով: Եթե ​​տվյալների մեջ կրկնվող փորձեր կան, ապա R 2-ի արժեքը չի կարող հասնել միասնության, անկախ նրանից, թե որքան լավ է մոդելը:

48. Պարզ գծային ռեգրեսիայի պարամետրերի վստահության միջակայքերը

Ինչպես որ ընտրանքի միջինը իրական միջինի գնահատումն է (բնակչության միջինը), այնպես էլ ռեգրեսիայի հավասարման ընտրանքային պարամետրերը աև բ- ոչ այլ ինչ, քան իրական ռեգրեսիայի գործակիցների գնահատում: Տարբեր նմուշներ տալիս են միջինի տարբեր գնահատականներ, ճիշտ այնպես, ինչպես տարբեր նմուշները կտան ռեգրեսիայի գործակիցների տարբեր գնահատականներ:

Ենթադրելով, որ սխալի բաշխման օրենքը ε iնկարագրված են նորմալ օրենքով՝ պարամետրի գնահատմամբ բկունենա նորմալ բաշխում՝ պարամետրերով.


Քանի որ պարամետրի գնահատումը աանկախ նորմալ բաշխված մեծությունների գծային համակցություն է, այն կունենա նաև նորմալ բաշխում միջինով և շեղումներով.


Այս դեպքում դիսպերսիան գնահատելու վստահության միջակայքը (1 - α): σ 2, հաշվի առնելով, որ հարաբերակցությունը ( n−2)ս 0 2 /σ 2 օրենքով բաշխված χ 2 ազատության աստիճանների քանակով n−2-ը կորոշվի արտահայտությամբ


49. Հետադարձ գծի վստահության միջակայքերը: Կախված փոփոխական արժեքների վստահության միջակայքը

Մենք սովորաբար չգիտենք ռեգրեսիայի գործակիցների իրական արժեքները: աև բ... Մենք գիտենք միայն նրանց գնահատականները։ Այլ կերպ ասած, իրական ռեգրեսիոն գիծը կարող է գնալ ավելի բարձր կամ ցածր, լինել ավելի կտրուկ կամ մակերեսային, քան կառուցվածը նմուշի տվյալների հիման վրա: Մենք հաշվարկել ենք ռեգրեսիայի գործակիցների վստահության միջակայքերը: Դուք կարող եք նաև հաշվարկել վստահության շրջանը հենց ռեգրեսիայի գծի համար:

Պարզ գծային ռեգրեսիայի համար անհրաժեշտ է կառուցել (1− α ) պատասխանի մաթեմատիկական ակնկալիքի վստահության միջակայքը Յարժեքով X = X 0. Այս մաթեմատիկական ակնկալիքն է ա+bx 0, և դրա գնահատումը

Այդ ժամանակվանից.

Մաթեմատիկական ակնկալիքի ստացված գնահատումը անկապ նորմալ բաշխված արժեքների գծային համակցություն է և, հետևաբար, ունի նաև նորմալ բաշխում, որը կենտրոնացած է պայմանական մաթեմատիկական ակնկալիքի և շեղումների իրական արժեքի կետում:

Հետևաբար, յուրաքանչյուր արժեքի դեպքում ռեգրեսիոն գծի վստահության միջակայքը x 0-ը կարող է ներկայացվել որպես


Ինչպես տեսնում եք, նվազագույն վստահության միջակայքը ստացվում է ժամը x 0 հավասար է միջինին և մեծանում է որպես x 0 «հեռանում է» մեջտեղից ցանկացած ուղղությամբ:

Համատեղ վստահության միջակայքների մի շարք ձեռք բերելու համար, որը հարմար է ամբողջ ռեգրեսիոն ֆունկցիայի համար, դրա ողջ երկարությամբ, վերը նշված արտահայտության փոխարեն t n −2,α / 2-ը պետք է փոխարինվի