Spearman-, Kendall-sorok, Fechner-együttható korrelációs együtthatói. Kendall és Spearman rangkorrelációs együtthatók Spearman és Spearman rangkorrelációs együtthatók

A mennyiségi vagy minőségi mutatók közötti kapcsolat azonosítására szolgál, amennyiben rangsorolhatók. Az X mutató értékei növekvő sorrendben vannak beállítva, és rangokhoz vannak rendelve. Az Y mutató értékeit rangsoroljuk, és kiszámítjuk a Kendall-korrelációs együtthatót:

ahol S = PK.

P nagy a rangérték Y.

K- az aktuális megfigyeléseket követő megfigyelések teljes száma kisebb a rangérték Y. (az egyenlő fokozatok nem számítanak!)

Ha a vizsgált adatok megismétlődnek (azonos rangúak), akkor a Kendall-féle korrigált korrelációs együtthatót használjuk a számításokhoz:

t- a kapcsolódó rangok száma az X, illetve Y sorban.

19. Mi legyen a kiindulópont a kutatás témájának, tárgyának, tárgyának, céljának, célkitűzéseinek és hipotézisének meghatározásakor?

A kutatási program általában két részből áll: módszertani és eljárási. Az első része a téma relevanciájának alátámasztása, a probléma megfogalmazása, a kutatás tárgyának és alanyának, a kutatás céljainak és célkitűzéseinek meghatározása, az alapfogalmak (kategorikus apparátus) megfogalmazása, a kutatási tárgy előzetes szisztematikus elemzése és munkahipotézis felállítása. A második rész a stratégiai kutatási tervet, valamint a primer adatok gyűjtésének és elemzésének tervét és alapvető eljárásait mutatja be.

A kutatási téma kiválasztásánál mindenekelőtt a relevanciából kell kiindulni. A relevancia indoklása tartalmazza a probléma tanulmányozásának és megoldásának szükségességét és időszerűségét a tanítás és nevelés elméletének és gyakorlatának továbbfejlesztése érdekében. Az aktuális kutatás választ ad az ekkoriban legégetőbb kérdésekre, tükrözi a társadalom társadalmi berendezkedését a pedagógiatudományig, és feltárja a gyakorlatban fellépő legfontosabb ellentmondásokat. A relevancia kritériuma dinamikus, mobil, időfüggő, sajátos és konkrét körülményeket figyelembe véve. A relevancia legáltalánosabb formájában azt a mértéket jellemzi, hogy milyen eltérés van a tudományos ötletek és gyakorlati ajánlások iránti igény (egy adott igény kielégítésére) és azon javaslatok között, amelyeket a tudomány és a gyakorlat jelenleg nyújtani tud.

A kutatási témát meghatározó legmeggyőzőbb alap a társadalmi rend, amely a legégetőbb, társadalmilag legjelentősebb, sürgős megoldást igénylő problémákat tükrözi. A társadalmi rend egy konkrét téma alátámasztását igényli. Általában ez egy tudományos kérdés kidolgozottsági fokának elemzése.

Ha a pedagógiai gyakorlat elemzéséből a társadalmi rend következik, akkor önmagát tudományos probléma más síkban van. Kifejezi azt a fő ellentmondást, amelyet a tudomány eszközeivel fel kell oldani. A probléma megoldása általában az a tanulmány célja. A cél egy újrafogalmazott probléma.

A probléma megfogalmazása magában foglalja objektum kiválasztása kutatás. Ez lehet egy pedagógiai folyamat, a pedagógiai valóság egy területe, vagy valamiféle pedagógiai attitűd, amely ellentmondást tartalmaz. Más szóval, tárgy lehet bármi, ami kifejezetten vagy implicit ellentmondást tartalmaz, és problémahelyzetet generál. A tárgy az, amire a megismerési folyamat irányul. Tanulmányi tárgy - a tárgy része, oldala. Ezek gyakorlati vagy elméleti szempontból a legjelentősebbek, egy tárgy tulajdonságai, szempontjai, jellemzői, amelyek közvetlen vizsgálat tárgyát képezik.

A kutatás, kutatás céljának, tárgyának és tárgyának megfelelően feladatok, amelyek főszabály szerint az ellenőrzést célozzák hipotéziseket. Ez utóbbi elméleti alapokon nyugvó feltevések halmaza, amelyek igazsága ellenőrzés alá vehető.

Kritérium tudományos újdonság segítségével értékelhető az elvégzett tanulmányok minősége. Olyan új elméleti és gyakorlati következtetéseket, oktatási mintákat, felépítését és mechanizmusait, tartalmát, elveit és technológiáit jellemzi, amelyek ekkor még nem voltak ismertek és nem kerültek rögzítésre a pedagógiai szakirodalomban. A kutatás újszerűsége elméleti és gyakorlati jelentőséggel is bírhat. A kutatás elméleti értéke a koncepció megalkotásában, a hipotézis megszerzésében rejlik, szabályszerűség, módszer, modell, probléma, tendencia, irány azonosítására. A kutatás gyakorlati jelentősége a javaslatok, ajánlások stb. elkészítésében rejlik. Az újdonság, az elméleti és gyakorlati jelentőség kritériumai a kutatás típusától függően változnak, függenek az új ismeretek megszerzésének időpontjától is.

Rangkorrelációs együttható jellemzi a nemlineáris függőség általános természetét: az effektív tulajdonság növekedése vagy csökkenése az egyes faktor növekedésével. Ez a monoton nemlineáris kapcsolat szorosságának mutatója.

A szolgáltatás célja... Ez az online számológép kiszámítja Kendall rangkorrelációs együtthatója minden alapképlet szerint, valamint jelentőségének értékelése.

Utasítás. Adja meg az adatok mennyiségét (sorok számát). Az eredményül kapott megoldás egy Word fájlba kerül mentésre.

A Kendall által javasolt együttható a „több-kevesebb” típusú relációk alapján épül fel, amelyek érvényességét a skálák felépítése során állapították meg.
Válasszunk ki néhány objektumot, és hasonlítsuk össze rangjukat az egyik attribútumban és a másikban. Ha e kritérium szerint a rangok közvetlen sorrendet alkotnak (vagyis a természetes sorozat sorrendjét), akkor a párhoz +1, ha az ellenkezője, akkor –1. A kiválasztott párhoz a megfelelő plusz-mínusz egységek (X attribútum és Y attribútum alapján) megszorozódnak. Az eredmény nyilvánvalóan +1; ha mindkét jellemző párjának rangsorai ugyanabban a sorrendben helyezkednek el, és –1, ha fordítva.
Ha a rangsorok mindkét feltétel alapján azonosak minden párnál, akkor az összes objektumpárhoz rendelt egységek összege maximális, és megegyezik a párok számával. Ha az összes pár rangsorrendje megfordul, akkor –C 2 N. Általános esetben C 2 N = P + Q, ahol P a pozitívak száma, Q pedig a negatívok száma, amelyek a párokhoz vannak rendelve, ha összehasonlítjuk a rangsorukat mindkét kritériumra.
A mennyiséget Kendall-együtthatónak nevezzük.
A képletből látható, hogy a τ együttható azon objektumpárok arányának különbsége, amelyekben a sorrend mindkét kritériumban azonos (az összes pár számához viszonyítva), valamint azon objektumpárok aránya között, amelyekben a sorrend nem ugyanaz.
Például a 0,60-as együttható érték azt jelenti, hogy a párok 80%-ának azonos sorrendje van az objektumoknak, míg 20%-ának nem (80% + 20% = 100%; 0,80 - 0,20 = 0,60). Azok. A τ úgy értelmezhető, mint a véletlenszerűen kiválasztott objektumpár mindkét előjelében lévő sorrendek egybeesésének és nem egybeesésének valószínűsége közötti különbség.
Általános esetben a τ (pontosabban P vagy Q) kiszámítása még 10-es nagyságrendű N-re is körülményesnek bizonyul.
Mutatjuk, hogyan lehet egyszerűsíteni a számításokat.


Egy példa. Az Orosz Föderáció egyik szövetségi körzetének 10 régiójában 2003-ban az ipari termelés volumene és az állóeszköz-befektetések közötti kapcsolatot a következő adatok jellemzik:


Számítsa ki a Spearman és Kendal rangkorrelációs együtthatókat! Ellenőrizze szignifikanciájukat α = 0,05-nél. Fogalmazzon meg következtetést az ipari termelés volumene és az állóeszközökbe történő beruházás közötti összefüggésről az Orosz Föderáció vizsgált régióiban.

Megoldás... Rendeljünk rangokat az Y attribútumhoz és az X faktorhoz.


Az adatokat X szerint rendezzük.
A 3-tól jobbra lévő Y sorban 7 rang van, amely meghaladja a 3-at, ezért a 3 7-es tagot generál P-ben.
1-től jobbra 8 1-et meghaladó rang van (ezek 2, 4, 6, 9, 5, 10, 7, 8), i.e. 8 P-t ír be, és így tovább. Ennek eredményeként Р = 37, és a képleteket használva megkapjuk:

xYrang X, d xY, d yPK
18.4 5.57 1 3 7 2
20.6 2.88 2 1 8 0
21.5 4.12 3 2 7 0
35.7 7.24 4 4 6 0
37.1 9.67 5 6 4 1
39.8 10.48 6 9 1 3
51.1 8.58 7 5 3 0
54.4 14.79 8 10 0 2
64.6 10.22 9 7 1 0
90.6 10.45 10 8 0 0
37 8


Egyszerűsített képletekkel:




ahol n a minta mérete; z kp a kétoldali kritikus tartomány kritikus pontja, amelyet a Laplace-függvény táblázatából az Ф (z kp) = (1-α) / 2 egyenlőséggel találunk meg.
Ha | τ |< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - a nullhipotézist elvetik. A minőségi jellemzők között jelentős rangkorreláció van.
Keresse meg a z kp kritikus pontot
Ф (z kp) = (1-α) / 2 = (1 - 0,05) / 2 = 0,475

Keressük meg a kritikus pontot:

Mivel τ> T kp - elvetjük a nullhipotézist; a két teszt pontszámai közötti rangkorreláció szignifikáns.

Egy példa. Az önállóan végzett építési és szerelési munkák mennyiségére és az Orosz Föderáció egyik városában lévő 10 építőipari cég alkalmazottainak száma alapján határozza meg a Kendal-együttható segítségével e jelek közötti kapcsolatot.

Megoldás számológéppel keresse meg.
Rendeljünk rangokat az Y attribútumhoz és az X faktorhoz.
Rendezzük el az objektumokat úgy, hogy X rangjuk természetes sorozatot képviseljen. Mivel ennek a sorozatnak az egyes párjaihoz rendelt becslések pozitívak, a P-ben szereplő "+1" értékeket csak azok a párok generálják, amelyek Y-beli sorai közvetlen sorrendet alkotnak.
Könnyű kiszámítani, ha az Y sorban lévő objektumok rangsorát egymás után összehasonlítjuk az acél objektumokkal.
Kendall-együttható.

Általános esetben a τ (pontosabban P vagy Q) kiszámítása még 10-es nagyságrendű N-re is körülményesnek bizonyul. Mutatjuk, hogyan lehet egyszerűsíteni a számításokat.

vagy

Megoldás.
Az adatokat X szerint rendezzük.
A 2-től jobbra lévő Y sorban 8 rang van, amely meghaladja a 2-t, ezért a 2 8-as tagot generál P-ben.
A 4-től jobbra van 6 4-et meghaladó rang (ezek 7, 5, 6, 8, 9, 10), i.e. A 6 P-t ír be, és így tovább. Ennek eredményeként P = 29, és a képletekkel a következőt kapjuk:

xYrang X, d xY, d yPK
38 292 1 2 8 1
50 302 2 4 6 2
52 366 3 7 3 4
54 312 4 5 4 2
59 359 5 6 3 2
61 398 6 8 2 2
66 401 7 9 1 2
70 298 8 3 1 1
71 283 9 1 1 0
73 413 10 10 0 0
29 16


Egyszerűsített képletekkel:


A Kendall-féle általános rangkorrelációs együttható nullával való egyenlőségére vonatkozó nullhipotézis teszteléséhez α szignifikanciaszinten egy versengő H 1: τ ≠ 0 hipotézissel, ki kell számítani a kritikus pontot:

ahol n a minta mérete; z kp a kétoldali kritikus tartomány kritikus pontja, amelyet a Laplace-függvény táblázatából az Ф (z kp) = (1 - α) / 2 egyenlőséggel találunk meg.
Ha | τ | T kp - a nullhipotézist elvetik. A minőségi jellemzők között jelentős rangkorreláció van.
Keresse meg a z kp kritikus pontot
Ф (z kp) = (1 - α) / 2 = (1 - 0,05) / 2 = 0,475
A Laplace-táblázat segítségével z kp = 1,96-ot kapunk
Keressük meg a kritikus pontot:

Mivel τ

A gazdasági-társadalmi gyakorlat igényei megkövetelik a folyamatok mennyiségi leírására szolgáló módszerek kidolgozását, amelyek lehetővé teszik nemcsak mennyiségi, hanem minőségi tényezők pontos regisztrálását is. Feltéve, hogy a minőségi jellemzők értékei sorba rendezhetők, vagy a jellemző csökkenésének (növekedésének) mértéke szerint rangsorolhatók, felmérhető a minőségi jellemzők közötti kapcsolat szorossága. A kvalitatív olyan tulajdonságot jelent, amely nem mérhető pontosan, de lehetővé teszi az objektumok egymással való összehasonlítását, és ezáltal csökkenő vagy növekvő minőségi sorrendbe rendezését. A mérések valódi tartalma pedig a rangskálákban az, hogy az objektumok milyen sorrendben vannak elrendezve a mért jellemző súlyossága szerint.

Gyakorlati célokra nagyon hasznos a rangkorreláció használata. Például, ha a termékek két minőségi jellemzője között magas rangú korrelációt állapítunk meg, akkor elegendő csak az egyik jellemző alapján ellenőrizni a termékeket, ami olcsóbbá és gyorsabbá teszi az ellenőrzést.

Példaként tekinthetjük a kapcsolat meglétét számos vállalkozás kereskedelmi termékeinek elérhetősége és az értékesítés rezsiköltsége között. 10 megfigyelés során a következő táblázatot kaptuk:

Rendezzük X értékeit növekvő sorrendbe úgy, hogy minden értékhez rendelje a sorszámát (rangsorát):

És így,

Készítsük el a következő táblázatot, ahol az X és Y párok vannak felírva, a megfigyelés eredményeként kapott rangjaikkal:

A rangok különbségét mint jelölve felírjuk a Spearman-féle mintakorrelációs együttható kiszámításának képletét:

ahol n a megfigyelések száma, ez egyben a rangpárok száma is.

A Spearman-együttható a következő tulajdonságokkal rendelkezik:

Ha teljes közvetlen kapcsolat van az X és Y minőségi jellemzők között abban az értelemben, hogy az objektumok rangsorai az i összes értékére egybeesnek, akkor a Spearman-féle mintakorrelációs együttható 1. Valójában, ha behelyettesítjük a képletbe, azt kapjuk, hogy 1.

Ha az X és Y minőségi jellemzők között teljes inverz kapcsolat van abban az értelemben, hogy a rang a rangnak felel meg, akkor a Spearman-féle mintakorrelációs együttható -1.

Valóban, ha

A Spearman korrelációs együttható képletében szereplő értéket behelyettesítve -1-et kapunk.

Ha nincs sem teljes közvetlen, sem teljes visszacsatolás a minőségi jellemzők között, akkor a Spearman-féle mintakorrelációs együttható -1 és 1 között van, és minél közelebb van a 0-hoz, annál kisebb a kapcsolat a jellemzők között.

A fenti példa szerint megtaláljuk P értékét, ehhez kiegészítjük a táblázatot az értékekkel és:

Kendall minta korrelációs együtthatója. A Kendall-féle rangkorrelációs együttható segítségével felmérheti két minőségi jellemző közötti kapcsolatot.

Legyenek egyenlők az n méretű minta objektumainak rangsorai:

X alapján:

Y alapján:. Tételezzük fel, hogy jobbra vannak nagyok, jobbra nagyok, jobbra nagyok. Vezessük be a rangok összegének jelölését

Hasonlóképpen bevezetjük a jelölést a jobbra fekvő rangok számának összegeként, de kevesebbet.

A Kendall-féle mintakorrelációs együttható a következő képlettel írható fel:

Ahol n a minta mérete.

Kendall együtthatója ugyanazokkal a tulajdonságokkal rendelkezik, mint Spearman együtthatója:

Ha teljes közvetlen kapcsolat van az X és Y minőségi jellemzők között abban az értelemben, hogy az objektumok rangsorai az i összes értékére egybeesnek, akkor Kendall mintakorrelációs együtthatója 1. Valójában jobbra n-1 van rangok, nagyok, ezért ugyanúgy megállapítjuk, mit. Azután. Kendall együtthatója pedig:.

Ha az X és Y minőségi jellemzők között teljes inverz kapcsolat van abban az értelemben, hogy a rang a rangnak felel meg, akkor Kendall mintakorrelációs együtthatója -1. Jobbra nincsenek rangok, ezért nagyok. Hasonlóképpen. A Kendall-együttható képletben az R + = 0 értéket behelyettesítve -1-et kapunk.

Megfelelően nagy minta esetén és a rangkorrelációs együtthatók értékei nem közelítik meg az 1-et, közelítő egyenlőség jön létre:

Kendall együtthatója konzervatívabb becslést ad a korrelációra, mint a Spearman-féle együttható? (a számérték? mindig kisebb, mint). Az együttható kiszámítása közben? kevésbé fáradságos, mint az együttható kiszámítása, az utóbbit könnyebb újraszámítani, ha új tagot adunk a sorozathoz.

Az együttható fontos előnye, hogy felhasználható a parciális rangkorrelációs együttható meghatározására, ami lehetővé teszi két rangjellemző "tiszta" összekapcsolásának mértékét, kiküszöbölve a harmadik befolyását:

A rangkorrelációs együtthatók jelentősége. A rangkorreláció erősségének mintaadatok alapján történő meghatározásakor figyelembe kell venni a következő kérdést: milyen megbízhatósági fok mellett lehet arra a következtetésre támaszkodni, hogy az általános sokaságban van összefüggés, ha egy adott minta rangkorrelációs együtthatója kapott. Vagyis a megfigyelt rangkorrelációk szignifikanciáját azon hipotézis alapján kell ellenőrizni, hogy a vizsgált két rangsor statisztikailag független.

Viszonylag nagy n mintaszám esetén a rangkorrelációs együtthatók szignifikanciája a normál eloszlási táblázat segítségével ellenőrizhető (1. számú melléklet). Hogy teszteljük a Spearman-együttható jelentőségét? (n> 20 esetén) számítsa ki az értéket

és a Kendall-együttható jelentőségét tesztelni? (n>10 esetén) számítsa ki az értéket

ahol S = R + - R-, n a minta mérete.

Továbbá a szignifikancia szint beállítása, a tcr (?, K) kritikus értéke a Student-eloszlás kritikus pontjainak táblázatából és a számított értékből meghatározásra kerül, vagy azzal összehasonlításra kerül. Feltételezzük, hogy a szabadsági fokok száma k = n-2. Ha vagy> tcr, akkor a vagy értékek szignifikánsnak minősülnek.

Fechner-féle korrelációs együttható.

Végül meg kell említeni a kapcsolat elemi feszességi fokát jellemző Fechner-együtthatót, amelyet kis mennyiségű kezdeti információ esetén célszerű használni a kapcsolat tényének megállapítására. Számításának alapja az egyes variációs sorozatok változatainak számtani átlagától való eltérés irányának figyelembe vétele és ezen eltérések előjeleinek konzisztenciájának meghatározása két sorozat esetében, amelyek közötti összefüggést mérik.

Ezt az együtthatót a következő képlet határozza meg:

ahol na az egyes értékek számtani átlagától való eltérésére utaló jelek egybeesésének száma; nb - az eltérések száma.

A Fechner-együttható -1,0 között változhat<= Кф<= +1,0.

A rangkorreláció alkalmazott szempontjai. Mint már említettük, a rangkorrelációs együtthatók nemcsak a két rangjellemző közötti kapcsolat kvalitatív elemzésére használhatók, hanem a rang és a mennyiségi jellemzők közötti kapcsolat erősségének meghatározására is. Ebben az esetben a mennyiségi jellemző értékeit rendezik, és a megfelelő rangokat rendelik hozzájuk.

Számos olyan helyzet adódhat, amikor a rangkorrelációs együtthatók kiszámítása is célszerű két mennyiségi jellemző közötti kapcsolat erősségének meghatározásakor. Tehát az egyik (vagy mindkettő) eloszlásának a normál eloszlástól való jelentős eltérése esetén az r mintakorrelációs együttható szignifikanciaszintjének meghatározása hibássá válik, míg a rangegyütthatók? és? nem vonatkoznak rájuk ilyen korlátozások a jelentőség szintjének meghatározásakor.

Egy másik ilyen helyzet áll elő, amikor két mennyiségi jellemző közötti kapcsolat nemlineáris (de monoton). Ha a mintában kevés az objektumok száma, vagy ha a kapcsolat előjele fontos a kutató számára, akkor a korrelációs arány alkalmazása? itt talán nem megfelelő. A rangkorrelációs együttható számítása lehetővé teszi a jelzett nehézségek megkerülését.

Gyakorlati rész

Feladat 1. Korrelációs-regressziós elemzés

A probléma megfogalmazása és formalizálása:

Tapasztalati mintát adunk, amelyet a berendezések állapotáról (meghibásodásra) és a gyártott termékek számáról végzett megfigyelések sorozata alapján állítanak össze. A minta implicit módon jellemzi a kapcsolatot a meghibásodott berendezések mennyisége és a gyártott cikkek száma között. A minta jelentése szerint jól látható, hogy a legyártott termékeket az üzemben maradó berendezésen állítják elő, hiszen minél több %-a hibásodott meg, annál kevesebb a legyártott termék. Szükséges a minta korrelációs-regressziós függésének vizsgálata, azaz a függőség formájának megállapítása, a regressziós függvény értékelése (regresszióanalízis), valamint a valószínűségi változók közötti kapcsolat azonosítása és feszességének felmérése. (korrelációs elemzés). A korrelációelemzés további feladata az egyik változó regressziós egyenletének becslése a másikra. Ezenkívül előre kell jelezni a 30%-os berendezéshibával gyártott termékek számát.

Formalizáljuk a táblázatban a megadott mintát, a „Berendezés meghibásodás,%” adatot X-el, a „Termékszám” adatot Y-vel jelölve:

Kezdeti adatok. Asztal 1

A probléma fizikai jelentése szerint látható, hogy az Y gyártott termékek száma közvetlenül függ a berendezés meghibásodásának %-ától, azaz Y függésben van X-től. A regressziós analízis elvégzésekor szükséges Keressünk egy matematikai összefüggést (regressziót), amely összeköti X és Y értékeit. Ebben az esetben a regresszióanalízis a korrelációtól eltérően azt feltételezi, hogy az X érték független változóként vagy tényezőként működik, az Y érték - mint pl. tőle függő, vagy hatásos jel. Ezért szükséges egy megfelelő közgazdasági és matematikai modell szintetizálása, pl. határozzuk meg (keressük meg, válasszuk ki) az X és Y értékei közötti kapcsolatot jellemző Y = f (X) függvényt, amelynek segítségével előre megjósolható lesz Y értéke X = 30-nál. korrelációs-regressziós elemzéssel oldjuk meg.

A korrelációs-regressziós problémák megoldási módszereinek rövid áttekintése és a választott megoldási mód indoklása.

A regresszióelemzési módszereket az effektív tulajdonságot befolyásoló tényezők száma alapján egy- és többtényezősre osztjuk. Egyváltozós - a független tényezők száma = 1, azaz. Y = F (X)

többtényezős - a tényezők száma> 1, azaz.

A vizsgált függő változók (effektív indikátorok) száma szerint a regressziós problémák egy vagy több hatásos mutatószámmal rendelkező feladatokra is feloszthatók. Általánosságban elmondható, hogy sok hatékony tulajdonsággal rendelkező feladat írható:

A korrelációs-regressziós analízis módszere abból áll, hogy megtaláljuk a forma közelítő (közelítő) függésének paramétereit.

Mivel az adott feladatban csak egy független változó jelenik meg, vagyis csak egy, az eredményt befolyásoló tényezőtől való függést vizsgáljuk, ezért az egyirányú függőség vizsgálatát, vagy páros regressziót kell alkalmazni.

Ha csak egy tényező van, a függőséget a következőképpen határozzuk meg:

Egy adott regressziós egyenlet felírásának formája a faktor és az effektív mutató közötti statisztikai kapcsolatot megjelenítő függvény megválasztásától függ, és a következőket tartalmazza:

lineáris regresszió, formaegyenlet,

parabola, alakegyenlet

köbös, alakegyenlet

hiperbolikus, a forma egyenlete

féllogaritmikus, a forma egyenlete

exponenciális, a forma egyenlete

hatványtörvény, alakegyenlet.

A függvény megtalálása a regressziós egyenlet paramétereinek meghatározására és magának az egyenletnek a megbízhatóságának felmérésére redukálódik. A paraméterek meghatározásához használhatja a legkisebb négyzetek módszerét és a legkisebb modulus módszerét is.

Az első közülük az, hogy az Yi tapasztalati értékek eltérésének négyzetösszege a számított Yi átlagtól minimális.

A legkisebb modulus módszere abból áll, hogy minimalizáljuk az Yi tapasztalati értékek és a számított Yi átlagok különbségének modulusainak összegét.

A probléma megoldásához a legkisebb négyzetek módszerét választjuk, mivel ez a legegyszerűbb, és jó becsléseket ad a statisztikai tulajdonságok szempontjából.

A regresszióanalízis probléma megoldásának technológiája a legkisebb négyzetek módszerével.

A változók közötti függőség típusát (lineáris, másodfokú, köbös stb.) úgy határozhatjuk meg, hogy kiértékeljük y tényleges értékének a számítotttól való eltérését:

ahol - tapasztalati értékek, - közelítő függvény által számított értékek. Megbecsülve a Si értékét különböző függvényekhez, és kiválasztva közülük a legkisebbet, kiválasztunk egy közelítő függvényt.

A függvény típusát úgy határozzuk meg, hogy megtaláljuk az egyes függvényekre talált együtthatókat egy bizonyos egyenletrendszer megoldásaként:

lineáris regresszió, formaegyenlet, rendszer -

parabola, formaegyenlet, rendszer -

köb, formaegyenlet, rendszer -

A rendszer megoldása után megtaláljuk, melynek segítségével az analitikai függvény egy konkrét kifejezéséhez jutunk, amelynek birtokában megtaláljuk a számított értékeket. Továbbá minden adat rendelkezésre áll az S eltérés értékének becsléséhez és a minimum elemzéséhez.

Lineáris kapcsolat esetén az X faktor és az effektív Y mutató közötti kapcsolat szorosságát r korrelációs együttható formájában becsüljük meg:

A mutató átlagos értéke;

Átlagos faktorérték;

y a mutató kísérleti értéke;

x a faktor kísérleti értéke;

Szórás x-ben;

Szórás y-ban.

Ha a korrelációs együttható r = 0, akkor azt gondoljuk, hogy a tulajdonságok közötti kapcsolat jelentéktelen vagy hiányzik, ha r = 1, akkor nagyon magas funkcionális kapcsolat van a jellemzők között.

A Chaddock táblázat segítségével minőségileg felmérheti a jelek közötti korreláció szorosságát:

Chaddock asztal 2. táblázat.

Nemlineáris függőség esetén meghatározzuk a korrelációs arányt (0 1) és az R korrelációs indexet, amelyeket a következő függőségekből számítunk ki.

ahol az érték a mutató regressziós függéssel számított értéke.

A számítási pontosság becsléseként az átlagos relatív közelítési hiba értékét használjuk

Nagy pontossággal 0-12% tartományba esik.

A funkcionális függőség kiválasztásának értékeléséhez a determinációs együtthatót használjuk

A determinációs együttható a funkcionális modell kiválasztásának minőségének „általánosított” mérőszáma, mivel a faktoriális és a teljes variancia arányát, vagy inkább a faktoriális variancia összarányát fejezi ki.

Az R korrelációs index szignifikanciájának felmérésére Fisher-féle F-tesztet használunk. A kritérium tényleges értékét a következő képlet határozza meg:

ahol m a regressziós egyenlet paramétereinek száma, n a megfigyelések száma. Az értéket összehasonlítjuk a kritikus értékkel, amelyet az F-kritérium táblázat szerint határozunk meg, figyelembe véve az elfogadott szignifikancia szintet és a szabadságfokok számát ill. Ha, akkor az R korrelációs index értéke szignifikánsnak tekinthető.

A kiválasztott regressziós formához a regressziós egyenlet együtthatóit számítjuk ki. Az egyszerűség kedvéért a számítási eredményeket a következő struktúra táblázata tartalmazza (általában az oszlopok száma és megjelenése a regresszió típusától függően változik):

3. táblázat

A probléma megoldása.

Megfigyelések történtek a gazdasági jelenségről - a termékek kibocsátásának a berendezés meghibásodásának százalékától való függését illetően. Értékkészletet kapunk.

A kiválasztott értékeket az 1. táblázat tartalmazza.

Az adott mintára elkészítjük az empirikus függőség grafikonját (1. ábra)

A gráf típusa alapján meghatározzuk, hogy az analitikai függés lineáris függvényként ábrázolható:

Számítsuk ki a páronkénti korrelációs együtthatót az X és Y közötti kapcsolat értékeléséhez:

Építsünk egy segédtáblát:

4. táblázat

Megoldjuk az egyenletrendszert, hogy megtaláljuk az együtthatókat, és:

az első egyenletből, helyettesítve az értéket

a második egyenletbe a következőket kapjuk:

Találunk

Megkapjuk a regressziós egyenlet alakját:

9. A talált kapcsolat szorosságának értékelésére az r korrelációs együtthatót használjuk:

A Chaddock-tábla alapján megállapítottuk, hogy r = 0,90 esetén nagyon magas az összefüggés X és Y között, ezért a regressziós egyenlet megbízhatósága is nagy. A számítások pontosságának becsléséhez a közelítés átlagos relatív hibájának értékét használjuk:

Úgy gondoljuk, hogy az érték a regressziós egyenlet nagyfokú megbízhatóságát biztosítja.

X és Y közötti lineáris kapcsolat esetén a meghatározási index egyenlő az r korrelációs együttható négyzetével:. Ebből következően a teljes eltérés 81%-a az X faktorkarakterisztikában bekövetkezett változással magyarázható.

Az R korrelációs index szignifikanciájának felmérésére, amely lineáris kapcsolat esetén abszolút értékben egyenlő az r korrelációs együtthatóval, a Fisher-féle F-próbát alkalmazzuk. A tényleges értéket a következő képlet segítségével határozzuk meg:

ahol m a regressziós egyenlet paramétereinek száma, n a megfigyelések száma. Vagyis n = 5, m = 2.

Az elfogadott szignifikanciaszint = 0,05 és a szabadságfokok számát figyelembe véve megkapjuk a kritikus táblázatos értéket. Mivel az R korrelációs index értéke szignifikánsnak tekinthető.

Számítsuk ki a becsült Y értéket X = 30-nál:

Készítsük el a talált függvény grafikonját:

11. Határozza meg a korrelációs együttható hibáját a szórás értékével!

majd meghatározzuk a normalizált eltérés értékét

A > 2 arányból 95%-os valószínűséggel beszélhetünk a kapott korrelációs együttható szignifikanciájáról.

2. feladat. Lineáris optimalizálás

1.opció.

A régió fejlesztési tervében 3 olajmező üzembe helyezését tervezik, összesen 9 millió tonna kitermeléssel. Az első mezőn a termelés mennyisége legalább 1 millió tonna, a másodikon - 3 millió tonna, a harmadikon - 5 millió tonna. A termelékenység eléréséhez legalább 125 kutat kell fúrni. E terv megvalósítására 25 millió rubelt különítettek el. tőkebefektetések (K mutató) és 80 km vezeték (L mutató).

Meg kell határozni az optimális (maximális) kutak számát az egyes táblák tervezett termelékenységének biztosításához. A feladat kiinduló adatait a táblázat tartalmazza.

Kezdeti adatok

A problémafelvetés fentebb található.

Formalizáljuk a feladatban megadott feltételeket és megszorításokat. Ennek az optimalizálási feladatnak a megoldásának célja, hogy az egyes mezőkhöz optimális számú kút mellett megtaláljuk az olajtermelés maximális értékét, figyelembe véve a problémára vonatkozó meglévő korlátokat.

A célfüggvény a feladat követelményeinek megfelelően a következő formában lesz:

ahol az egyes mezőkben található kutak száma.

A feladatra vonatkozó meglévő korlátozások:

csőfektetési hossz:

kutak száma minden mezőben:

1 kút építési költsége:

A lineáris optimalizálási problémákat például a következő módszerekkel lehet megoldani:

Grafikusan

Simplex módszer

A grafikus módszer alkalmazása csak akkor kényelmes, ha lineáris optimalizálási feladatokat old meg két változóval. Nagyobb számú változó esetén algebrai apparátus használata szükséges. Tekintsünk egy általános módszert a lineáris optimalizálási problémák megoldására, az úgynevezett szimplex módszert.

A szimplex módszer a legtöbb optimalizálási probléma megoldására használt iteratív számítások tipikus példája. Ilyen iteratív eljárásokat veszünk figyelembe, amelyek működéskutatási modellek segítségével biztosítják a problémák megoldását.

Az optimalizálási feladat szimplex módszerrel történő megoldásához szükséges, hogy az Xi ismeretlenek száma nagyobb legyen, mint az egyenletek száma, azaz. egyenletrendszer

kielégíti az összefüggést m

A = egyenlő volt m-mel.

Jelöljük az A mátrix oszlopát as-nak, a szabad tagok oszlopát pedig as-nak

Az (1) rendszer alapmegoldása egy m ismeretlen halmaz, amely az (1) rendszer megoldása.

Röviden, a szimplex módszer algoritmusát a következőképpen írjuk le:

Az eredeti megszorítás egyenlőtlenségként írva, mint<= (=>) egyenlőségként ábrázolható, ha a megszorítás bal oldalához hozzáadjuk a reziduális változót (a bal oldali redundáns változót kivonva).

Például az eredeti kényszertől balra

maradványváltozót vezetünk be, aminek eredményeként az eredeti egyenlőtlenség egyenlővé válik

Ha az eredeti korlátozás határozza meg a cső áramlási sebességét, akkor a változót ennek az erőforrásnak a maradékaként vagy fel nem használt részeként kell értelmezni.

A célfüggvény maximalizálása megegyezik ugyanazon függvény minimalizálásával, ellenkező előjellel. Vagyis a mi esetünkben

egyenértékű

A következő formájú alapmegoldáshoz egy szimplex táblázatot állítunk össze:

Ebben a táblázatban jelezzük, hogy a probléma megoldása után ezekben a cellákban lesz egy alapmegoldás. - egy oszlopnak az egyik oszloppal való elosztásából származó hányadosok; - további szorzók az értékek nullázásához a táblázat feloldó oszlopához kapcsolódó celláiban. - a célfüggvény minimális értéke -Z, - az együtthatók értékei a célfüggvényben ismeretlenekkel.

Bármilyen pozitív érték megtalálható a jelentések között. Ha nem ez a helyzet, akkor a probléma megoldottnak tekintendő. A táblázat bármelyik oszlopa, amely benne van, ki van jelölve, ezt az oszlopot "megengedő" oszlopnak nevezik. Ha a feloldó oszlop elemei között nincsenek pozitív számok, akkor a probléma megoldhatatlan a célfüggvény korlátlansága miatt a megoldásai halmazán. Ha pozitív számok vannak a feloldó oszlopban, folytassa az 5. lépéssel.

Az oszlop tele van törtekkel, amelyek számlálójában az oszlop elemei, a nevezőben pedig a feloldó oszlop megfelelő elemei találhatók. Az összes érték közül a legkisebb van kiválasztva. A legkisebb eredményt adó sort "engedélyezés" sornak nevezzük. A feloldó vonal és a feloldó oszlop metszéspontjában egy felbontó elem található, amelyet valamilyen módon, például színnel kiemelünk.

Az első szimplex tábla alapján a következőket állítjuk össze, amelyben:

A sorvektort az oszlopvektorra cseréli

a megengedő sort felváltja a megengedő elemmel osztva ugyanaz a sor

a táblázat többi sorát e sor összege helyettesíti a feloldó sorral, megszorozva egy speciálisan kiválasztott járulékos tényezővel, hogy a feloldó oszlop cellájában 0 legyen.

Az új táblázattal rátérünk a 4. pontra.

A probléma megoldása.

A probléma megfogalmazása alapján a következő egyenlőtlenségi rendszert kapjuk:

és a célfüggvény

Az egyenlőtlenségrendszert egyenletrendszerré alakítjuk további változók bevezetésével:

Csökkentsük a célfüggvényt megfelelőjére:

Építsük meg az eredeti szimplex táblát:

Válasszunk megengedő oszlopot. Számítsuk ki az oszlopot:

Az értékeket beírjuk a táblázatba. Közülük a legkisebb = 10 esetén meghatározzuk a feloldó egyenest:. A feloldó egyenes és a feloldó oszlop metszéspontjában a feloldó elemet = 1. A táblázat részét további tényezőkkel töltjük fel, így: a feloldó sort ezekkel szorozva, hozzáadva a táblázat többi sorához, a feloldó oszlop elemeiben 0-t alkot.

Összeállítjuk a második szimplex táblázatot:

Fogjuk benne a feloldó oszlopot, kiszámítjuk az értékeket, beírjuk a táblázatba. Minimálisan megkapjuk a feloldó sort. A feloldó elem az 1. Keressen további tényezőket, töltse ki az oszlopokat.

Elkészítjük a következő szimplex táblázatot:

Hasonlóképpen megtaláljuk a feloldó oszlopot, a feloldó sort és a feloldó elemet = 2. Összeállítjuk a következő szimplex táblát:

Mivel a -Z sorban nincsenek pozitív értékek, ez a táblázat véges. Az első oszlop az ismeretlenek kívánt értékeit adja meg, pl. optimális alapmegoldás:

Ebben az esetben a célfüggvény értéke -Z = -8000, ami Zmax = 8000-nek felel meg. A probléma megoldva.

3. feladat Klaszterelemzés

A probléma megfogalmazása:

Objektumok felosztása a táblázatban megadott adatok alapján. A megoldási mód kiválasztását önállóan kell elvégezni, az adatfüggőségi grafikon felépítéséhez.

1.opció.

Kezdeti adatok

Az ilyen típusú problémák megoldási módszereinek áttekintése. A megoldási mód indoklása.

A klaszterelemzési feladatok megoldása a következő módszerekkel történik:

Az unió vagy fa klaszterezési módszert használják "különbözőség" vagy "objektumok közötti távolság" klaszterek kialakítására. Ezek a távolságok meghatározhatók egydimenziós vagy többdimenziós térben.

A kétirányú kombinálást (viszonylag ritkán) alkalmazzák olyan körülmények között, amikor az adatokat nem „objektumok” és „objektumok tulajdonságai”, hanem megfigyelések és változók szerint értelmezik. Mind a megfigyelések, mind a változók várhatóan hozzájárulnak az értelmes klaszterek észleléséhez.

K-módszer. Akkor használatos, ha már van hipotézis a klaszterek számával kapcsolatban. Megadhatja a rendszernek, hogy pontosan alkosson például három klasztert, hogy azok a lehető legkülönbözőbbek legyenek. Általában a K-közép módszer pontosan K különböző klasztert épít fel, amelyek egymástól a lehető legnagyobb távolságra helyezkednek el.

A távolságok mérésére a következő módok állnak rendelkezésre:

Euklideszi távolság. Ez a távolság legelterjedtebb típusa. Ez egyszerűen a geometriai távolság többdimenziós térben, és a következőképpen számítható ki:

Vegye figyelembe, hogy az euklideszi távolságot (és négyzetét) az eredeti, nem szabványosított adatokból számítják ki.

A várostömbök távolsága (Manhattan távolság). Ez a távolság egyszerűen a koordináta-különbségek átlaga. A legtöbb esetben ez a távolságmérés ugyanazokhoz az eredményekhez vezet, mint a közönséges euklideszi távolság esetében. Megjegyzendő azonban, hogy ennél a mértéknél az egyes nagy eltérések (outlierek) hatása csökken (mivel nem négyzetesek). A Manhattan távolságot a következő képlettel számítják ki:

Csebisev távolsága. Ez a távolság akkor lehet hasznos, ha két objektumot szeretne "különbözőként" definiálni, ha azok bármely koordinátában (bármelyik dimenzióban) különböznek. A Csebisev távolságot a következő képlettel számítják ki:

Hatalmi távolság. Néha az ember fokozatosan növelni vagy csökkenteni akarja egy olyan mérethez kapcsolódó súlyt, amelyhez a megfelelő objektumok nagyon eltérőek. Ez egy hatványtörvény távolság használatával érhető el. A hatványtörvény távolságát a következő képlettel számítjuk ki:

ahol r és p a felhasználó által meghatározott paraméterek. Néhány számítási példa bemutathatja, hogyan "működik" ez a mérték. A p paraméter az egyes koordináták különbségeinek fokozatos súlyozásáért, az r paraméter az objektumok közötti nagy távolságok progresszív súlyozásáért felelős. Ha mindkét paraméter - r és p egyenlő kettővel, akkor ez a távolság egybeesik az euklideszi távolsággal.

Egyet nem értés százaléka. Ezt a mértéket akkor használjuk, ha az adatok kategorikusak. Ezt a távolságot a következő képlettel számítjuk ki:

A probléma megoldásához az egyesítési módot (faszerű klaszterezés) választjuk, amely a legjobban megfelel a probléma feltételeinek és megfogalmazásának (az objektumok felosztása). Az egyesülési módszer viszont többféle kommunikációs szabályt használhat:

Egyetlen link (legközelebbi szomszéd módszer). Ebben a módszerben a két klaszter közötti távolságot a különböző klaszterekben lévő két legközelebbi objektum (legközelebbi szomszéd) távolsága határozza meg. Ez azt jelenti, hogy két klaszterben lévő bármely két objektum közelebb van egymáshoz, mint a megfelelő kapcsolati távolság. Ennek a szabálynak bizonyos értelemben össze kell fűznie az objektumokat, hogy klasztereket képezzenek, és a kapott klaszterek általában hosszú "láncok" legyenek.

Teljes kommunikáció (a legtávolabbi szomszédok módszere). Ebben a módszerben a klaszterek közötti távolságot a különböző klaszterekben (azaz a "legtávolabbi szomszédok") lévő bármely két jellemző közötti legnagyobb távolság határozza meg.

Számos más, ehhez hasonló klaszterezési módszer is létezik (pl. súlyozatlan párosítás, súlyozott párosítás stb.).

Megoldásmódszer technológia. Mutatók számítása.

Az első lépésben, amikor minden objektum egy külön klaszter, az objektumok közötti távolságokat a kiválasztott mérték határozza meg.

Mivel a feladat nem adja meg a jellemzők mértékegységeit, feltételezzük, hogy azok megegyeznek. Ezért nincs szükség a kiindulási adatok normalizálására, ezért azonnal folytatjuk a távolságmátrix kiszámítását.

A probléma megoldása.

Készítsünk egy függőségi grafikont a kezdeti adatok szerint (2. ábra)

Az objektumok közötti távolságnak a szokásos euklideszi távolságot vesszük. Akkor a képlet szerint:

ahol l - jelek; k a jellemzők száma, az 1 és 2 objektumok távolsága egyenlő:

Folytatjuk a fennmaradó távolságok kiszámítását:

A kapott értékekből készítsünk táblázatot:

A legkisebb távolság. Ez azt jelenti, hogy a 3., 6. és 5. elemeket egy klaszterbe egyesítjük. A következő táblázatot kapjuk:

A legkisebb távolság. A 3-as, 6-os, 5-ös és 4-es elemeket egy klaszterbe egyesítjük, így két klasztert tartalmazó táblázatot kapunk:

A 3. és 6. tétel közötti minimális távolság. Ez azt jelenti, hogy a 3. és 6. elem egy klaszterben van egyesítve. Kiválasztjuk a maximális távolságot az újonnan kialakított klaszter és a többi elem között. Például az 1. fürt és a 3.6 fürt közötti távolság max (13,34166, 13,60147) = 13,34166. Készítsük el a következő táblázatot:

Ebben a minimális távolság az 1-es és 2-es klaszterek közötti távolság. Az 1-et és a 2-t egy klaszterbe egyesítve kapjuk:

Így a „távoli szomszéd” módszerrel két klasztert kaptunk: 1,2 és 3,4,5,6, amelyek közötti távolság 13,60147.

A probléma megoldódott.

Alkalmazások. Problémamegoldás szoftvercsomagokkal (MS Excel 7.0)

A korrelációs és regressziós elemzés problémája.

A kiindulási adatokat beírjuk a táblázatba (1. ábra)

Válassza a "Szolgáltatás / Adatelemzés" menüt. A megjelenő ablakban válassza ki a "Regression" sort (2. ábra).

Állítsuk be a következő ablakban az X és Y beviteli intervallumokat, a megbízhatósági szint 95% lesz, a kimeneti adatok pedig egy külön lapra „Jelentőlap” kerülnek (3. ábra)

A számítás elvégzése után a "Jelentőlap" lapon megkapjuk a regresszióanalízis végső adatait:

Megjeleníti a közelítő függvény vagy "kiválasztási grafikon" pontdiagramját is:


A kiszámított értékeket és eltéréseket a táblázat „Előrejelzett Y” és „Egyenlegek” oszlopában mutatjuk be.

A kezdeti adatok és eltérések alapján egy maradék grafikont ábrázolunk:

Optimalizálási feladat


A kezdeti adatokat a következőképpen írjuk be:

Az X1, X2, X3 ismeretlen ismeretlenek a C9, D9, E9 cellákba kerülnek.

Az X1, X2, X3 célfüggvény-együtthatói rendre C7, D7, E7-be kerülnek.

Írja be a célfüggvényt a B11 cellába a következő képlet szerint: = C7 * C9 + D7 * D9 + E7 * E9.

Meglévő feladatkorlátozások

A csőfektetés hosszához:

hozzáadjuk a C5, D5, E5, F5, G5 cellákhoz

Az egyes mezőkben lévő kutak száma:

X3 Ј 100; hozzáadjuk a C8, D8, E8 cellákhoz.

1 db kút építésének költsége:

hozzáadjuk a C6, D6, E6, F6, G6 cellákhoz.

A C5 * C9 + D5 * D9 + E5 * E9 teljes hossz kiszámítására szolgáló képlet a B5 cellába, a C6 * C9 + D6 * D9 + E6 * E9 teljes költség kiszámításának képlete pedig a B6 cellába kerül.


A "Szolgáltatás / Megoldás keresése" menüben kiválasztjuk, megadjuk a megoldás keresésének paramétereit a kiindulási adatoknak megfelelően (4. ábra):

A "Paraméterek" gombbal állítsa be a következő paramétereket a megoldás megtalálásához (5. ábra):


A megoldás keresése után jelentést kapunk az eredményekről:

Microsoft Excel 8.0e eredményjelentés

Jelentés készült: 2002.11.17. 1:28:30

Célcella (maximum)

Eredmény

Teljes zsákmány

Módosítható cellák

Eredmény

A kutak száma

A kutak száma

A kutak száma

Korlátozások

Jelentése

Hossz

Összefüggő

Projekt költsége

nem rokon.

A kutak száma

nem rokon.

A kutak száma

Összefüggő

A kutak száma

Összefüggő

Az első táblázat a célcella kezdeti és végső (optimális) értékét mutatja, ahol a megoldandó probléma célfüggvénye került. A második táblázatban az optimalizálandó változók kezdeti és végső értékeit látjuk, amelyeket a módosított cellák tartalmaznak. Az eredményjelentés harmadik táblázata információkat tartalmaz a megszorításokról. Az "Érték" oszlop a szükséges erőforrások és az optimalizálandó változók optimális értékeit tartalmazza. A „Képlet” oszlop az elhasznált erőforrásokra vonatkozó korlátokat és az optimalizálandó változókat tartalmazza, hivatkozások formájában az ezeket az adatokat tartalmazó cellákra. Az „Állapot” oszlop határozza meg, hogy ezek vagy azok a megszorítások kapcsolódnak-e vagy nem. Itt a "kötöttek" az optimális megoldásban merev egyenlőségek formájában megvalósított kényszerek. Az erőforrás-korlátok „Különbség” oszlopa határozza meg a felhasznált erőforrások fennmaradó részét, azaz. a szükséges forrásmennyiség és elérhetőségük közötti különbség.

Hasonlóképpen, miután a „Fenntarthatósági jelentés” űrlapba felírtuk a megoldáskeresés eredményét, a következő táblázatokat kapjuk:

Microsoft Excel 8.0e rugalmassági jelentés

Munkalap: [Az optimalizálási feladat megoldása.xls] Az optimalizálási feladat megoldása

Jelentés készült: 2002.11.17. 1:35:16

Módosítható cellák

Megengedhető

Megengedhető

jelentése

ár

Együttható

Növekedés

Csökken

A kutak száma

A kutak száma

A kutak száma

Korlátozások

Korlátozás

Megengedhető

Megengedhető

jelentése

Jobb rész

Növekedés

Csökken

Hossz

Projekt költsége

A fenntarthatósági jelentés a módosítható (optimalizált) változókról és a modell megkötéseiről tartalmaz információkat. Ez az információ a lineáris problémák optimalizálására használt szimplex módszerhez kapcsolódik, amelyet fentebb a probléma megoldása szempontjából ismertettünk. Lehetővé teszi annak becslését, hogy a kapott optimális megoldás mennyire érzékeny a modell paramétereinek esetleges változásaira.

A jelentés első része a módosított cellákról tartalmaz információkat, amelyek a mezőkben lévő kutak számával kapcsolatos értékeket tartalmaznak. Az „Eredmény érték” oszlop az optimalizálandó változók optimális értékeit jelzi. A "Célegyüttható" oszlop tartalmazza a célfüggvény együtthatóinak értékeinek kezdeti adatait. A következő két oszlop ezen együtthatók megengedhető növelését és csökkentését szemlélteti a talált optimális megoldás megváltoztatása nélkül.

A fenntarthatósági jelentés második része az optimalizálandó változókra vonatkozó korlátokról tartalmaz információkat. Az első oszlop az optimális megoldás erőforrásigényét mutatja. A második a felhasznált erőforrástípusok árnyékárait tartalmazza. Az utolsó két oszlop a rendelkezésre álló erőforrások mennyiségének lehetséges növekedésére vagy csökkentésére vonatkozó adatokat tartalmazza.

Klaszterezési probléma.

A probléma megoldásának lépésenkénti módszerét fent adjuk meg. Az alábbi Excel táblázatok mutatják be a probléma megoldásának előrehaladását:

Legközelebbi szomszéd módszer

A klaszteranalízis feladatának megoldása - "LEGKÖZELBBI SZOMSZÉD MÓDSZERE"

Kezdeti adatok

ahol x1 a termékek térfogata;

х2 - a fő átlagos éves költsége

Ipari termelési eszközök

Távoli szomszéd módszer

A klaszteranalízis problémájának megoldása - "TÁVOLSÁGI SZOMSZÉD MÓDSZER"

Kezdeti adatok

ahol x1 a termékek térfogata;

х2 - a fő átlagos éves költsége

Ipari termelési eszközök

Szakértői értékelések benyújtása, előfeldolgozása

A gyakorlatban többféle értékelést alkalmaznak:

- jó minőségű (gyakran-ritkán, rosszabb-jobb, igen-nem),

- skálabecslések (50-75, 76-90, 91-120 stb. értéktartományok),

Pontszám adott intervallumból (2-től 5-ig, 1-10), egymástól független,

Rangsorolva (az objektumokat egy szakértő bizonyos sorrendbe rendezi, és mindegyikhez sorszámot rendel - rang),

Összehasonlító, az összehasonlítási módszerek egyikével kapott

szekvenciális összehasonlítási módszer

faktorok páronkénti összehasonlításának módszere.

A szakértői vélemények feldolgozásának következő lépésében értékelésre van szükség e vélemények következetességének mértéke.

A szakértőktől kapott becslések egy valószínűségi változónak tekinthetők, amelynek eloszlása ​​tükrözi a szakértők véleményét egy adott esemény (tényező) egy adott megválasztásának valószínűségéről. Ezért a szakértői becslések szórásának és konzisztenciájának elemzéséhez általánosított statisztikai jellemzőket használnak - átlagokat és szóródási mértékeket:

átlagos négyzetes hiba,

Változási tartomány min - max,

- variációs együttható V = átlagos négyzet eltérés / átlag aritmus. (bármilyen típusú értékelésre alkalmas)

V i = σ i / x i átl

Az árfolyamért hasonlósági intézkedések hanem vélemények minden pár szakértő többféle módszer használható:

asszociációs együtthatók, melynek segítségével figyelembe veszik az egyező és nem egyező válaszok számát,

következetlenségi együtthatók szakértői vélemények,

Mindezek a mérőszámok felhasználhatók két szakértő véleményének összehasonlítására, vagy az értékeléssorozatok kapcsolatának két alapon történő elemzésére.

Spearman pár rang korrelációs együtthatója:

ahol n a szakértők száma,

c k - az i-edik és a j-edik szakértő becslései közötti különbség az összes T tényezőre

A Kendall-féle rangkorrelációs együttható (konkordancia-együttható) átfogó értékelést ad az összes szakértő véleményének konzisztenciájáról az összes tényezőről, de csak azokban az esetekben, amikor rangbecslést használtak.

Bebizonyosodott, hogy az S értéke, amikor minden szakértő azonos becslést ad az összes tényezőre, maximális értéke egyenlő

ahol n a tényezők száma,

m a szakértők száma.

A konkordancia együtthatója egyenlő az aránnyal

sőt, ha W közel van 1-hez, akkor minden szakértő kellően konzisztens becsléseket adott, különben véleményük nem egyezik.

Az S kiszámításának képlete az alábbiakban látható:

ahol r ij az i-edik tényező j-edik szakértő általi rangbecslései,

r cf a teljes becslési mátrix átlagos rangja, és egyenlő

Ezért az S kiszámításának képlete a következő lehet:

Ha egy szakértő egyéni értékelései egybeesnek, és a feldolgozás során szabványosították, akkor egy másik képletet használnak a konkordancia együttható kiszámításához:



ahol a T j-t minden szakértőre számítják (abban az esetben, ha értékelését különböző objektumokra ismételték meg), figyelembe véve az ismétléseket a következő szabályok szerint:

ahol t j a j-edik szakértő egyenlő rangú csoportjainak száma, és

h k - a j-edik szakértő rokon rangjainak k-edik csoportjában egyenlő rangok száma.

PÉLDA. Hat tényező 5 szakértője válaszoljon a rangsorban a 3. táblázat szerint:

3. táblázat – Szakértők válaszai

Szakértők О1 О2 O3 О4 O5 O6 Szakértői rangok összege
E1
E2
E3
E4
E5

Tekintettel arra, hogy nem kaptunk szigorú rangsort (a szakértői értékelések megismétlődnek, és a rangsorok összege nem egyenlő), a becsléseket átalakítjuk, és megkapjuk a kapcsolódó rangsorokat (4. táblázat):

4. táblázat – A szakértői értékelések kapcsolódó rangsorai

Szakértők О1 О2 O3 О4 O5 O6 Szakértői rangok összege
E1 2,5 2,5
E2
E3 1,5 1,5 4,5 4,5
E4 2,5 2,5 4,5 4,5
E5 5,5 5,5
Az objektum rangsorainak összege 7,5 9,5 23,5 29,5

Most határozzuk meg a szakértői vélemények konzisztenciájának fokát a konkordancia együtthatójával. Mivel a rangok összefüggenek, a W-t a (**) képlet alapján számítjuk ki.

Ekkor r cf = 7 * 5/2 = 17,5

S = 10 2 +8 2 +4,5 2 +4,5 2 +6 2 +12 2 = 384,5

Folytassuk a W számításával. Ehhez külön számítjuk ki T j értékeit. A példában az értékelések speciálisan úgy vannak kiválasztva, hogy minden szakértő ismételt értékelést végezzen: az elsőnek kettő, a másodiknak három, a harmadiknak két csoportja két, a negyediknek pedig két azonos értékelése van. Ennélfogva:

T 1 = 2 3 - 2 = 6 T 5 = 6

T 2 = 3 3 - 3 = 24

Т 3 = 2 3 –2+ 2 3 –2 = 12 Т 4 = 12

Úgy látjuk, hogy a szakértői vélemények egyetértése meglehetősen nagy, és továbbléphetünk a tanulmány következő szakaszába - a szakértők által javasolt döntési alternatíva alátámasztására és elfogadására.

Ellenkező esetben vissza kell térnie a 4-8. lépéshez.

KENDALLAI RANK KORRELÁCIÓS EGYÜTTHEZ

Két valószínűségi változó (jellemző) függésének egyik mintamérője X ill Y, a mintaelemek rangsorolása alapján (X 1, Y x), .. ., (X n, Y n). K-től R-ig utal tehát arra rangú statisztikusokés a képlet határozza meg

ahol r i- Te ehhez a párhoz tartozol ( X, Y), egy Xraven-rajhoz i, S = 2N- (n-1) / 2, N azon mintaelemek száma, amelyekre egyidejűleg j> i ill. r j> r i... Mindig A To. To. R. függőség szelektív mértékeként. M. Kendall széles körben használta (M. Kendall, lásd).

K-től R-ig A K. a valószínűségi változók függetlenségének hipotézisének tesztelésére szolgál. Ha a függetlenségi hipotézis igaz, akkor E t = 0 és D t = 2 (2n + 5) / 9n (n-1). Kis mintaméret esetén az ellenőrzés statisztikai jellegű. a függetlenség hipotézise speciális táblázatok segítségével készül (lásd). n> 10 esetén a normál közelítést használjuk az m eloszlására: ha

akkor a függetlenség hipotézisét elvetik, ellenkező esetben elfogadják. Itt egy . - a szignifikancia szintje, u a / 2 a normál eloszlás százalékpontja. K-től R-ig Ugyanis, mint minden más, ezzel is kimutatható két minőségi jellemző függősége, ha csak a minta elemei ezekre a jellemzőkre tekintettel rendezhetők. Ha X, Y van egy közös normális a p korrelációs együtthatóval, akkor a kapcsolat K. és p. között. és a következő formában van:

Lásd még Spearman-féle rangkorreláció, Rank teszt.

Megvilágított.: Kendal M., Rangkorrelációk, ford. angolból, M., 1975; Van der Waerden B.L., Matematikai, ford. belőle., M., 1960; Bol'shev L.N., Smirnov N.V., Matematikai statisztikák táblázatai, Moszkva, 1965.

A. V. Prohorov.


Matematikai enciklopédia. - M .: Szovjet enciklopédia... I. M. Vinogradov. 1977-1985.

Nézze meg, mi az a "KENDALLA RANK KORRELÁCIÓS KONFERENCIA" más szótárakban:

    Angol. с hatékony, rangkorreláció Kendall; német Kendalls Rangkorrelationskoeffizient. Korrelációs együttható, amely meghatározza az összes objektumpár rendezettségének megfelelőségi fokát két változóban. Antinazi. Szociológiai Enciklopédia, 2009... Szociológiai Enciklopédia

    KENDALL RANKKORRELÁCIÓS EGYHATÓJA- Angol. hatékony, rangkorreláció Kendall; német Kendalls Rangkorrelationskoeffizient. Korrelációs együttható, amely meghatározza az összes objektumpár rendezésének megfelelőségi fokát két változóban ... Szociológiai Magyarázó Szótár

    Két valószínűségi változó (jellemzők) X és Y függésének mérőszáma a független megfigyelési eredmények (X1, Y1) rangsora alapján. ... ., (Xn, Yn). Ha X értékeinek sorai természetes sorrendben i = 1,. ... ., n és Ri a ... ... Matematika enciklopédiája

    Korrelációs együttható- (Korrelációs együttható) A korrelációs együttható két valószínűségi változó függésének statisztikai mutatója A korrelációs együttható meghatározása, a korrelációs együtthatók fajtái, a korrelációs együttható tulajdonságai, számítása és alkalmazása ... ... Befektetői enciklopédia

    A valószínűségi változók közötti kapcsolat, amely általában véve nem szigorúan funkcionális. A funkcionális függőségtől eltérően a K.-t általában akkor veszik figyelembe, ha az egyik mennyiség nemcsak ettől a másiktól függ, hanem ... ... Matematika enciklopédiája

    A korreláció (korrelációs függőség) két vagy több valószínűségi változó (vagy bizonyos elfogadható pontossággal annak tekinthető mennyiség) statisztikai kapcsolata. Ebben az esetben egy vagy ... ... Wikipédia értékeinek változásai

    Korreláció- (Korreláció) A korreláció két vagy több valószínűségi változó statisztikai kapcsolata. A korreláció fogalma, a korreláció típusai, korrelációs együttható, korrelációelemzés, árkorreláció, devizapárok korrelációja a Forex-en Tartalom ... ... Befektetői enciklopédia

    Általánosan elfogadott, hogy a S. eleje a m. Században. vagy ahogy szokták nevezni, a "kis n" statisztikáját a XX. század első évtizedébe tette W. Gosset munkája, amelyben a t-eloszlást helyezte el, a kapottak által feltételezve. a világ egy kicsit később...... Pszichológiai enciklopédia

    Maurice Kendall Sir Maurice George Kendall Születési idő: 1907. szeptember 6. (1907 09 06) Születési hely: Kettering, Egyesült Királyság Halálozás ideje ... Wikipédia

    Előrejelzés- (Előrejelzés) Az előrejelzés meghatározása, az előrejelzés feladatai és elvei Az előrejelzés meghatározása, az előrejelzés feladatai és elvei, az előrejelzés módszerei Tartalom Tartalom Meghatározás Az előrejelzés alapfogalmai Az előrejelzés feladatai és elvei ... ... Befektetői enciklopédia