Spīrmena, Kendala rindu, Fehnera koeficientu korelācijas koeficienti. Kendala un Spīrmena rangu korelācijas koeficienti Spīrmena un Spīrmena rangu korelācijas koeficienti

To izmanto, lai noteiktu attiecības starp kvantitatīviem vai kvalitatīviem rādītājiem, ja tos var sarindot. X indikatora vērtības tiek iestatītas augošā secībā un piešķirtas pakāpes. Y indikatora vērtības tiek sarindotas un tiek aprēķināts Kendall korelācijas koeficients:

kur S = PJ.

P liels ranga vērtība Y.

J- kopējais novērojumu skaits pēc pašreizējiem novērojumiem ar mazāks ranga vērtība Y. (vienādas pakāpes neskaitās!)

Ja pētītie dati atkārtojas (ar vienādām rindām), tad aprēķinos tiek izmantots Kendalas koriģētais korelācijas koeficients:

t- saistīto rindu skaits attiecīgi X un Y rindā.

19.Kam vajadzētu būt sākumpunktam, definējot pētījuma tēmu, objektu, priekšmetu, mērķi, uzdevumus un hipotēzi?

Pētījuma programmai, kā likums, ir divas sadaļas: metodiskā un procesuālā. Pirmajā ietilpst tēmas aktualitātes pamatojums, problēmas formulēšana, pētījuma objekta un priekšmeta, mērķu un uzdevumu formulēšana, pamatjēdzienu (kategoriskā aparāta) formulēšana, pētāmā objekta iepriekšēja sistemātiska analīze un darba hipotēzes izvirzīšana. Otrajā sadaļā ir atklāts stratēģiskais izpētes plāns, kā arī primāro datu vākšanas un analīzes plāns un pamatprocedūras.

Pirmkārt, izvēloties pētījuma tēmu, ir jāvadās pēc atbilstības. Atbilstības pamatojums ietver norādi par problēmas izpētes un risināšanas nepieciešamību un savlaicīgumu mācību un audzināšanas teorijas un prakses tālākai attīstībai. Aktuālā izpēte sniedz atbildi uz šī brīža aktuālākajiem jautājumiem, atspoguļo sabiedrības sociālo sakārtojumu līdz pedagoģijas zinātnei un atklāj būtiskākās praksē notiekošās pretrunas. Atbilstības kritērijs ir dinamisks, mobils, atkarīgs no laika, ņemot vērā konkrētus un specifiskus apstākļus. Vispārīgākajā formā atbilstība raksturo neatbilstības pakāpi starp pieprasījumu pēc zinātniskām idejām un praktiskiem ieteikumiem (lai apmierinātu konkrētu vajadzību) un priekšlikumiem, ko zinātne un prakse šobrīd var sniegt.

Pārliecinošākā pētījuma tēmu definējošā bāze ir sociālā kārtība, kas atspoguļo akūtākās, sabiedriski nozīmīgākās problēmas, kurām nepieciešami neatliekami risinājumi. Sociālā kārtība prasa konkrētas tēmas pamatojumu. Parasti tā ir zinātnes jautājuma izstrādātības pakāpes analīze.

Ja no pedagoģiskās prakses analīzes izriet sociālā kārtība, tad pati zinātniska problēma atrodas citā plaknē. Tas pauž galveno pretrunu, kas jāatrisina ar zinātnes līdzekļiem. Problēmas risinājums parasti ir pētījuma mērķis. Mērķis ir pārformulēta problēma.

Problēmas formulējums ietver objektu atlase pētījumiem. Tas var būt pedagoģisks process, pedagoģiskās realitātes joma vai kāda veida pedagoģiskā attieksme, kas satur pretrunas. Citiem vārdiem sakot, objekts var būt jebkas, kas tieši vai netieši satur pretrunu un rada problēmsituāciju. Objekts ir tas, uz ko tiek virzīts izziņas process. Studiju priekšmets - objekta daļa, puse. Tie ir nozīmīgākie no praktiskā vai teorētiskā viedokļa, objekta īpašības, aspekti, pazīmes, kas ir pakļautas tiešai izpētei.

Atbilstoši pētījuma, izpētes mērķim, objektam un priekšmetam uzdevumi, kuru mērķis parasti ir pārbaudīt hipotēzes. Pēdējais ir teorētiski pamatotu pieņēmumu kopums, kuru patiesums ir pakļauts pārbaudei.

Kritērijs zinātniskais jaunums var izmantot, lai novērtētu pabeigto studiju kvalitāti. Tas raksturo jaunus teorētiskos un praktiskos secinājumus, izglītības modeļus, tās struktūru un mehānismus, saturu, principus un tehnoloģijas, kas šajā brīdī nebija zināmi un netika fiksēti pedagoģiskajā literatūrā. Pētījuma novitātei var būt gan teorētiska, gan praktiska nozīme. Pētījuma teorētiskā vērtība slēpjas koncepcijas izveidē, hipotēzes iegūšanai, likumsakarībai, metodei, problēmas identificēšanas modelim, tendencei, virzienam. Pētījuma praktiskā nozīme slēpjas priekšlikumu, ieteikumu u.c. sagatavošanā. Jaunuma, teorētiskās un praktiskās nozīmes kritēriji mainās atkarībā no pētījuma veida, tie ir atkarīgi arī no jaunu zināšanu iegūšanas laika.

Ranga korelācijas koeficients raksturo nelineārās atkarības vispārējo raksturu: efektīvās pazīmes palielināšanās vai samazināšanās, palielinoties faktoram viens. Tas ir monotonu nelineāru attiecību stingrības rādītājs.

Pakalpojuma mērķis... Šis tiešsaistes kalkulators aprēķina Kendala ranga korelācijas koeficients pēc visām pamatformulām, kā arī tās nozīmīguma novērtējums.

Instrukcija. Norādiet datu apjomu (rindu skaitu). Iegūtais risinājums tiek saglabāts Word failā.

Kendala piedāvātais koeficients ir veidots, pamatojoties uz "vairāk-mazāk" tipa attiecībām, kuru derīgums tika noteikts, veidojot skalas.
Atlasīsim pāris objektus un salīdzināsim to rindas vienā un citā atribūtā. Ja pēc šī kritērija pakāpes veido tiešu secību (tas ir, naturālās rindas secību), tad pārim tiek piešķirts +1, ja pretēji, tad –1. Atlasītajam pārim tiek reizinātas atbilstošās plus-mīnus vienības (pēc atribūta X un pēc atribūta Y). Rezultāts acīmredzami +1; ja abu pazīmju pāra rangi atrodas vienā secībā, un –1, ja apgriezti.
Ja rangu kārtas visiem pāriem pēc abiem kritērijiem ir vienādas, tad visiem objektu pāriem piešķirto vienību summa ir maksimālā un ir vienāda ar pāru skaitu. Ja visu pāru rangu kārtas ir apgrieztas, tad –C 2 N. Vispārīgā gadījumā C 2 N = P + Q, kur P ir pozitīvo skaits un Q ir negatīvo skaits, kas piešķirts pāriem, salīdzinot to rangus pēc abiem kritērijiem.
Daudzumu sauc par Kendala koeficientu.
No formulas var redzēt, ka koeficients τ ir starpība starp objektu pāru proporciju, kurā secība ir vienāda abos kritērijos (attiecībā pret visu pāru skaitu), un objektu pāru proporciju, kurā kārtība nav vienāda.
Piemēram, koeficienta vērtība 0,60 nozīmē, ka 80% pāru objektu secība ir vienāda, bet 20% nav (80% + 20% = 100%; 0,80 - 0,20 = 0,60). Tie. τ var interpretēt kā atšķirību starp secību sakritības un nesakritības varbūtībām abās zīmēs nejauši izvēlētam objektu pārim.
Vispārīgā gadījumā τ (precīzāk, P vai Q) aprēķins pat N, kas ir 10, izrādās apgrūtinošs.
Parādīsim, kā vienkāršot aprēķinus.


Piemērs. Sakarību starp rūpnieciskās ražošanas apjomu un ieguldījumiem pamatlīdzekļos 10 reģionos vienā no Krievijas Federācijas federālajiem apgabaliem 2003. gadā raksturo šādi dati:


Aprēķiniet Spīrmena un Kendala ranga korelācijas koeficientus. Pārbaudiet to nozīmi pie α = 0,05. Noformulēt secinājumu par sakarību starp rūpnieciskās ražošanas apjomu un ieguldījumiem pamatlīdzekļos apskatāmajos Krievijas Federācijas reģionos.

Risinājums... Piešķirsim pakāpes atribūtam Y un faktoram X.


Sakārtosim datus pēc X.
Rindā Y pa labi no 3 ir 7 rindas, kas pārsniedz 3, tāpēc 3 ģenerēs vienumu 7 P.
Pa labi no 1 ir 8 pakāpes, kas pārsniedz 1 (tās ir 2, 4, 6, 9, 5, 10, 7, 8), t.i. 8 ievadīs P un tā tālāk. Rezultātā Р = 37 un, izmantojot formulas, mēs iegūstam:

XYrangs X, d xrangs Y, d yPJ
18.4 5.57 1 3 7 2
20.6 2.88 2 1 8 0
21.5 4.12 3 2 7 0
35.7 7.24 4 4 6 0
37.1 9.67 5 6 4 1
39.8 10.48 6 9 1 3
51.1 8.58 7 5 3 0
54.4 14.79 8 10 0 2
64.6 10.22 9 7 1 0
90.6 10.45 10 8 0 0
37 8


Pēc vienkāršotām formulām:




kur n ir izlases lielums; z kp ir divpusējā kritiskā apgabala kritiskais punkts, kas no Laplasa funkcijas tabulas atrodams ar vienādību Ф (z kp) = (1-α) / 2.
Ja | τ |< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - nulles hipotēze tiek noraidīta. Starp kvalitatīvajām pazīmēm pastāv būtiska rangu korelācija.
Atrast kritisko punktu z kp
Ф (z kp) = (1-α) / 2 = (1 - 0,05) / 2 = 0,475

Atradīsim kritisko punktu:

Tā kā τ> T kp - mēs noraidām nulles hipotēzi; rangu korelācija starp abu testu rezultātiem ir nozīmīga.

Piemērs. Pamatojoties uz datiem par pašu veikto būvniecības un uzstādīšanas darbu apjomu un darbinieku skaitu 10 būvniecības uzņēmumos vienā no Krievijas Federācijas pilsētām, nosakiet saistību starp šīm zīmēm, izmantojot Kendal koeficientu.

Risinājums atrodi ar kalkulatoru.
Piešķirsim pakāpes atribūtam Y un faktoram X.
Sakārtosim objektus tā, lai to X rindas attēlotu dabisku sēriju. Tā kā katram šīs sērijas pārim piešķirtie aprēķini ir pozitīvi, vērtības "+1", kas iekļautas P, ģenerēs tikai tie pāri, kuru rindas Y veido tiešu secību.
Tos ir viegli aprēķināt, secīgi salīdzinot katra Y rindā esošā objekta rangus ar tērauda objektiem.
Kendala koeficients.

Vispārīgā gadījumā τ (precīzāk, P vai Q) aprēķins pat N, kas ir 10, izrādās apgrūtinošs. Parādīsim, kā vienkāršot aprēķinus.

vai

Risinājums.
Sakārtosim datus pēc X.
Rindā Y pa labi no 2 ir 8 rindas, kas pārsniedz 2, tāpēc 2 ģenerēs vienumu 8 P.
Pa labi no 4 ir 6 pakāpes, kas pārsniedz 4 (tās ir 7, 5, 6, 8, 9, 10), t.i. 6 ievadīs P un tā tālāk. Rezultātā P = 29 un, izmantojot formulas, mēs iegūstam:

XYrangs X, d xrangs Y, d yPJ
38 292 1 2 8 1
50 302 2 4 6 2
52 366 3 7 3 4
54 312 4 5 4 2
59 359 5 6 3 2
61 398 6 8 2 2
66 401 7 9 1 2
70 298 8 3 1 1
71 283 9 1 1 0
73 413 10 10 0 0
29 16


Pēc vienkāršotām formulām:


Lai pārbaudītu nulles hipotēzi par Kendala vispārējā ranga korelācijas koeficienta vienādību ar nulli pie nozīmīguma līmeņa α ar konkurējošu hipotēzi H 1: τ ≠ 0, ir jāaprēķina kritiskais punkts:

kur n ir izlases lielums; z kp ir divpusējā kritiskā apgabala kritiskais punkts, kas no Laplasa funkcijas tabulas atrodams ar vienādību Ф (z kp) = (1 - α) / 2.
Ja | τ | T kp - nulles hipotēze tiek noraidīta. Starp kvalitatīvajām pazīmēm pastāv būtiska rangu korelācija.
Atrast kritisko punktu z kp
Ф (z kp) = (1 - α) / 2 = (1 - 0,05) / 2 = 0,475
Izmantojot Laplasa tabulu, mēs atrodam z kp = 1,96
Atradīsim kritisko punktu:

Kopš τ

Ekonomiskās un sociālās prakses vajadzības prasa procesu kvantitatīvā apraksta metožu izstrādi, kas ļauj precīzi reģistrēt ne tikai kvantitatīvos, bet arī kvalitatīvos faktorus. Ar nosacījumu, ka kvalitatīvo raksturlielumu vērtības var sakārtot vai sakārtot pēc raksturlieluma samazināšanās (pieaugšanas) pakāpes, ir iespējams novērtēt kvalitatīvo raksturlielumu attiecības ciešumu. Kvalitatīvs nozīmē pazīmi, kuru nevar precīzi izmērīt, bet tas ļauj salīdzināt objektus savā starpā un līdz ar to sakārtot tos kvalitātes dilstošā vai augošā secībā. Un reālais mērījumu saturs rangu skalās ir secība, kādā objekti tiek sakārtoti atbilstoši izmērītās pazīmes smaguma pakāpei.

Praktiskiem nolūkiem ļoti noderīga ir rangu korelācijas izmantošana. Piemēram, ja tiek konstatēta augsta ranga korelācija starp divām produktu kvalitatīvajām pazīmēm, tad pietiek ar preču kontroli tikai pēc vienas no pazīmēm, kas padara kontroli lētāku un ātrāku.

Kā piemēru var uzskatīt saiknes esamību starp vairāku uzņēmumu komerciālo produktu pieejamību un pārdošanas pieskaitāmajām izmaksām. 10 novērojumu laikā tika iegūta šāda tabula:

Sakārtosim X vērtības augošā secībā, katrai vērtībai piešķirot savu kārtas numuru (rangu):

Pa šo ceļu,

Izveidosim šādu tabulu, kurā ir ierakstīti pāri X un Y, kas iegūti novērojuma rezultātā ar to rindām:

Apzīmējot rangu atšķirību kā, mēs rakstām formulu Spīrmena izlases korelācijas koeficienta aprēķināšanai:

kur n ir novērojumu skaits, tas ir arī rindu pāru skaits.

Spīrmena koeficientam ir šādas īpašības:

Ja pastāv pilnīga tieša saikne starp kvalitatīvajām pazīmēm X un Y tādā nozīmē, ka objektu rindas sakrīt visām i vērtībām, tad Spīrmena izlases korelācijas koeficients ir 1. Patiešām, aizvietojot to formulā, mēs iegūstam 1.

Ja starp kvalitatīvajām pazīmēm X un Y pastāv pilnīga apgriezta sakarība tādā nozīmē, ka rangs atbilst rangam, tad Spīrmena izlases korelācijas koeficients ir -1.

Patiešām, ja

Aizvietojot vērtību Spīrmena korelācijas koeficienta formulā, iegūstam -1.

Ja starp kvalitatīvajām pazīmēm nav ne pilnīgas tiešas, ne pilnīgas atgriezeniskās saites, tad Spīrmena izlases korelācijas koeficients ir no -1 līdz 1, un, jo tuvāk 0 tā vērtība, jo mazāka ir saikne starp pazīmēm.

Saskaņā ar iepriekš minēto piemēru mēs atradīsim P vērtību, šim nolūkam mēs aizpildīsim tabulu ar vērtībām un:

Kendala izlases korelācijas koeficients. Jūs varat novērtēt saistību starp diviem kvalitatīviem raksturlielumiem, izmantojot Kendall ranga korelācijas koeficientu.

Lai n izmēra izlases objektu rindas ir vienādas:

pamatojoties uz X:

pamatojoties uz Y:. Pieņemsim, ka pa labi ir ierindas, lielas, pa labi ir rindas, lielas, pa labi ir ierindas, lielas. Ieviesīsim rindu summas apzīmējumu

Līdzīgi mēs ieviešam apzīmējumu kā pa labi esošo rindu skaita summu, bet mazāk.

Kendala izlases korelācijas koeficientu raksta pēc formulas:

Kur n ir izlases lielums.

Kendala koeficientam ir tādas pašas īpašības kā Spīrmena koeficientam:

Ja pastāv pilnīga tieša saikne starp kvalitatīvajām pazīmēm X un Y tādā nozīmē, ka objektu rindas sakrīt visām i vērtībām, tad Kendala izlases korelācijas koeficients ir 1. Patiešām, pa labi ir n-1 ierindas, lielas, tāpēc tādā pašā veidā nodibinām, ko. Tad. Un Kendalas koeficients ir:.

Ja starp kvalitatīvajām pazīmēm X un Y pastāv pilnīga apgriezta sakarība tādā nozīmē, ka rangs atbilst rangam, tad Kendala izlases korelācijas koeficients ir -1. Pa labi nav ierindas, tāpēc lielas. Tāpat. Aizvietojot vērtību R + = 0 Kendala koeficienta formulā, mēs iegūstam -1.

Ar pietiekami lielu izlases lielumu un rangu korelācijas koeficientu vērtībām, kas nav tuvu 1, notiek aptuvenā vienādība:

Vai Kendala koeficients sniedz konservatīvāku korelācijas novērtējumu nekā Spīrmena koeficients? (skaitliskā vērtība vienmēr ir mazāka par). Koeficienta aprēķināšanas laikā? mazāk darbietilpīgi nekā koeficienta aprēķināšana, pēdējo ir vieglāk pārrēķināt, ja sērijai pievieno jaunu terminu.

Būtiska koeficienta priekšrocība ir tā, ka ar to var noteikt daļējās rangu korelācijas koeficientu, kas ļauj novērtēt divu ranga pazīmju "tīrās" savstarpējās sakarības pakāpi, novēršot trešās ietekmes:

Ranga korelācijas koeficientu nozīme. Nosakot rangu korelācijas stiprumu, pamatojoties uz izlases datiem, ir jāapsver šāds jautājums: ar kādu ticamības pakāpi var paļauties uz secinājumu, ka pastāv korelācija vispārējā populācijā, ja noteikts izlases rangu korelācijas koeficients. iegūts. Citiem vārdiem sakot, novēroto rangu korelāciju nozīmīgums jāpārbauda, ​​pamatojoties uz hipotēzi, ka divi aplūkojamie rangi ir statistiski neatkarīgi.

Ar salīdzinoši lielu izlases lielumu n rangu korelācijas koeficientu nozīmīgumu var pārbaudīt, izmantojot normālā sadalījuma tabulu (pielikuma 1. tabula). Lai pārbaudītu Spīrmena koeficienta nozīmi? (ja n > 20) aprēķina vērtību

un pārbaudīt Kendall koeficienta nozīmi? (ja n > 10) aprēķina vērtību

kur S = R + - R-, n ir izlases lielums.

Tālāk tiek iestatīts nozīmības līmenis, no Studenta sadalījuma kritisko punktu tabulas un aprēķinātās vērtības tiek noteikta tcr (?, K) kritiskā vērtība vai tiek salīdzināta ar to. Tiek pieņemts, ka brīvības pakāpju skaits ir k = n-2. Ja vai> tcr, tad vērtības vai tiek uzskatītas par nozīmīgām.

Fehnera korelācijas koeficients.

Nobeigumā jāmin Fehnera koeficients, kas raksturo elementāru savienojuma hermētiskuma pakāpi, ko ieteicams izmantot savienojuma fakta konstatēšanai, ja ir neliels sākotnējās informācijas apjoms. Tā aprēķina pamatā ir katras variāciju sērijas variantu noviržu virziena no vidējā aritmētiskā ņemšana vērā un šo noviržu zīmju konsekvences noteikšana divām sērijām, starp kurām tiek mērīta attiecība.

Šo koeficientu nosaka pēc formulas:

kur na ir atsevišķu vērtību noviržu no to vidējā aritmētiskā lieluma pazīmju sakritību skaits; nb - attiecīgi neatbilstību skaits.

Fehnera koeficients var svārstīties no -1,0<= Кф<= +1,0.

Rangu korelācijas pielietotie aspekti. Kā jau minēts, rangu korelācijas koeficientus var izmantot ne tikai divu rangu pazīmju attiecības kvalitatīvai analīzei, bet arī ranga un kvantitatīvo pazīmju attiecības stipruma noteikšanai. Šajā gadījumā kvantitatīvā raksturlieluma vērtības tiek sakārtotas un tām tiek piešķirtas atbilstošās pakāpes.

Pastāv vairākas situācijas, kad rangu korelācijas koeficientu aprēķināšana ir ieteicama arī, nosakot attiecības stiprumu starp divām kvantitatīvām pazīmēm. Tātad ar būtisku viena no tām (vai abu) sadalījuma novirzi no normālā sadalījuma izlases korelācijas koeficienta r ​​nozīmīguma līmeņa noteikšana kļūst nepareiza, savukārt ranga koeficienti? un? uz tiem neattiecas šādi ierobežojumi, nosakot nozīmīguma līmeni.

Cita šāda veida situācija rodas, ja attiecības starp divām kvantitatīvām pazīmēm ir nelineāras (bet monotonas). Ja objektu skaits izlasē ir mazs vai ja pētniekam ir svarīga sakarības zīme, tad korelācijas koeficienta izmantošana? šeit var būt nepietiekami. Ranga korelācijas koeficienta aprēķins ļauj apiet norādītās grūtības.

Praktiskā daļa

1. uzdevums. Korelācijas-regresijas analīze

Problēmas paziņojums un formalizācija:

Tiek dots empīrisks paraugs, kas sastādīts, pamatojoties uz virkni novērojumu par iekārtu stāvokli (atteices gadījumā) un saražoto izstrādājumu skaitu. Paraugs netieši raksturo saistību starp bojāto iekārtu daudzumu un saražoto vienību skaitu. Pēc izlases jēgas ir skaidrs, ka saražotā produkcija tiek ražota uz iekārtām, kas paliek ekspluatācijā, jo jo vairāk% iekārtu sabojājusies, jo mazāk saražotās produkcijas. Nepieciešams veikt izlases izpēti korelācijas-regresijas atkarībai, tas ir, noteikt atkarības formu, novērtēt regresijas funkciju (regresijas analīze), kā arī noteikt sakarību starp nejaušajiem mainīgajiem un novērtēt tās blīvumu. (korelācijas analīze). Papildu korelācijas analīzes uzdevums ir novērtēt viena mainīgā regresijas vienādojumu citam. Turklāt ir nepieciešams prognozēt to produktu skaitu, kas ražoti ar 30% iekārtu bojājumu.

Formalizēsim doto paraugu tabulā, apzīmējot datus "Iekārtas atteice,%" ar X, datus "Produktu skaits" ar Y:

Sākotnējie dati. 1. tabula

Pēc problēmas fiziskās nozīmes redzams, ka saražoto produktu skaits Y ir tieši atkarīgs no iekārtu atteices %, tas ir, pastāv Y atkarība no X. Veicot regresijas analīzi, nepieciešams Atrodiet matemātisko sakarību (regresiju), kas savieno X un Y vērtības. Šajā gadījumā regresijas analīze, atšķirībā no korelācijas, pieņem, ka X vērtība darbojas kā neatkarīgs mainīgais vai faktors, Y vērtība - kā no tā atkarīga vai efektīva zīme. Tādējādi ir nepieciešams sintezēt adekvātu ekonomisko un matemātisku modeli, t.i. noteikt (atrast, atlasīt) funkciju Y = f (X), kas raksturo saistību starp X un Y vērtībām, ar kuras palīdzību būs iespējams paredzēt Y vērtību pie X = 30. Šo problēmu var atrisināts, izmantojot korelācijas-regresijas analīzi.

Īss pārskats par korelācijas-regresijas problēmu risināšanas metodēm un izvēlētās risināšanas metodes pamatojumu.

Regresijas analīzes metodes tiek iedalītas viena un vairāku faktoru, pamatojoties uz faktoru skaitu, kas ietekmē efektīvo pazīmi. Viendimensijas - neatkarīgo faktoru skaits = 1, t.i. Y = F (X)

daudzfaktoriāls - faktoru skaits> 1, t.i.

Atbilstoši pētāmo atkarīgo mainīgo (efektīvo rādītāju) skaitam regresijas problēmas var iedalīt arī uzdevumos ar vienu vai vairākiem efektīviem rādītājiem. Kopumā var uzrakstīt uzdevumu ar daudzām efektīvām funkcijām:

Korelācijas-regresijas analīzes metode sastāv no formas aproksimējošās (tuvinātās) atkarības parametru atrašanas.

Tā kā dotajā uzdevumā parādās tikai viens neatkarīgs mainīgais, tas ir, tiek pētīta atkarība tikai no viena rezultātu ietekmējošā faktora, ir jāpiemēro vienvirziena atkarības jeb pāru regresijas pētījums.

Ja ir tikai viens faktors, atkarību definē šādi:

Konkrēta regresijas vienādojuma rakstīšanas forma ir atkarīga no funkcijas izvēles, kas parāda statistisko sakarību starp faktoru un efektīvo rādītāju un ietver:

lineārā regresija, formas vienādojums,

parabolisks, formas vienādojums

kubisks, formas vienādojums

hiperbolisks, formas vienādojums

puslogaritmisks, formas vienādojums

eksponenciāls, formas vienādojums

spēka likums, formas vienādojums.

Funkcijas atrašana tiek reducēta uz regresijas vienādojuma parametru noteikšanu un paša vienādojuma ticamības novērtēšanu. Lai noteiktu parametrus, var izmantot gan mazāko kvadrātu metodi, gan mazākā moduļa metodi.

Pirmais no tiem ir tāds, ka empīrisko vērtību Yi noviržu kvadrātu summa no aprēķinātā vidējā Yi ir minimāla.

Mazākā moduļa metode ir moduļu summas samazināšana starp empīriskajām vērtībām Yi un aprēķināto vidējo Yi.

Problēmas risināšanai izvēlēsimies mazāko kvadrātu metodi, jo tā ir visvienkāršākā un sniedz labus aprēķinus statistisko īpašību ziņā.

Regresijas analīzes problēmas risināšanas tehnoloģija, izmantojot mazāko kvadrātu metodi.

Atkarības veidu (lineāro, kvadrātisko, kubisko utt.) starp mainīgajiem ir iespējams noteikt, novērtējot y faktiskās vērtības novirzi no aprēķinātās:

kur - empīriskās vērtības, - aprēķinātās vērtības pēc tuvināšanas funkcijas. Novērtējot Si vērtības dažādām funkcijām un izvēloties mazāko no tām, mēs izvēlamies aptuvenu funkciju.

Funkcijas veidu nosaka, atrodot koeficientus, kas atrodami katrai funkcijai kā noteiktas vienādojumu sistēmas risinājums:

lineārā regresija, formas vienādojums, sistēma -

parabolisks, formas vienādojums, sistēma -

kubisks, formas vienādojums, sistēma -

Atrisinot sistēmu, mēs atrodam, ar kuras palīdzību mēs nonākam pie konkrētas analītiskās funkcijas izteiksmes, ar kuru mēs atrodam aprēķinātās vērtības. Turklāt ir visi dati, lai atrastu novirzes vērtības S novērtējumu un analizētu minimumu.

Lineārai sakarībai mēs novērtējam attiecības tuvumu starp faktoru X un efektīvo rādītāju Y korelācijas koeficienta r ​​veidā:

Rādītāja vidējā vērtība;

Vidējā faktora vērtība;

y ir indikatora eksperimentālā vērtība;

x ir faktora eksperimentālā vērtība;

Standarta novirze x;

Standarta novirze y.

Ja korelācijas koeficients r = 0, tad tiek uzskatīts, ka saistība starp pazīmēm ir nenozīmīga vai tās nav, ja r = 1, tad starp pazīmēm pastāv ļoti augsta funkcionālā sakarība.

Izmantojot Chaddock tabulu, varat kvalitatīvi novērtēt zīmju korelācijas stingrību:

Chaddock tabula 2. tabula.

Nelineārai atkarībai tiek noteikts korelācijas koeficients (0 1) un korelācijas indekss R, ko aprēķina no sekojošām atkarībām.

kur vērtība ir rādītāja vērtība, kas aprēķināta pēc regresijas atkarības.

Kā aprēķinu precizitātes aplēsi mēs izmantojam vidējās relatīvās aproksimācijas kļūdas vērtību

Ar augstu precizitāti tas atrodas diapazonā no 0 līdz 12%.

Lai novērtētu funkcionālās atkarības izvēli, mēs izmantojam determinācijas koeficientu

Determinācijas koeficients tiek izmantots kā "vispārināts" funkcionālā modeļa izvēles kvalitātes mērs, jo tas izsaka attiecību starp faktoriālo un kopējo dispersiju vai drīzāk faktoriālās dispersijas daļu kopsummā.

Lai novērtētu korelācijas indeksa R nozīmīgumu, tiek izmantots Fišera F tests. Kritērija faktisko vērtību nosaka pēc formulas:

kur m ir regresijas vienādojuma parametru skaits, n ir novērojumu skaits. Vērtību salīdzina ar kritisko vērtību, kas noteikta pēc F kritērija tabulas, ņemot vērā pieņemto nozīmīguma līmeni un brīvības pakāpju skaitu un. Ja, tad korelācijas indeksa R vērtība tiek uzskatīta par nozīmīgu.

Izvēlētajai regresijas formai tiek aprēķināti regresijas vienādojuma koeficienti. Ērtības labad aprēķinu rezultāti ir iekļauti šādas struktūras tabulā (parasti kolonnu skaits un izskats mainās atkarībā no regresijas veida):

3. tabula

Problēmas risinājums.

Novērojumi tika veikti par ekonomisko fenomenu - produktu izlaišanas atkarību no iekārtu atteices procentiem. Tiek iegūta vērtību kopa.

Izvēlētās vērtības ir aprakstītas 1. tabulā.

Mēs izveidojam empīriskās atkarības grafiku dotajam paraugam (1. att.)

Pēc grafika veida mēs nosakām, ka analītisko atkarību var attēlot kā lineāru funkciju:

Aprēķināsim pāru korelācijas koeficientu, lai novērtētu saistību starp X un Y:

Izveidosim palīggaldu:

4. tabula

Mēs atrisinām vienādojumu sistēmu, lai atrastu koeficientus un:

no pirmā vienādojuma, aizstājot vērtību

otrajā vienādojumā mēs iegūstam:

Mēs atradām

Mēs iegūstam regresijas vienādojuma formu:

9. Lai novērtētu atrastās attiecības ciešumu, izmantojam korelācijas koeficientu r:

Saskaņā ar Chaddock tabulu mēs konstatējam, ka r = 0,90 sakarība starp X un Y ir ļoti augsta, tāpēc arī regresijas vienādojuma ticamība ir augsta. Lai novērtētu aprēķinu precizitāti, mēs izmantojam tuvinājuma vidējās relatīvās kļūdas vērtību:

Mēs uzskatām, ka vērtība nodrošina augstu regresijas vienādojuma ticamības pakāpi.

Lineārai sakarībai starp X un Y noteikšanas indekss ir vienāds ar korelācijas koeficienta r ​​kvadrātu:. Līdz ar to 81% no kopējās variācijas ir izskaidrojamas ar faktora raksturlieluma X izmaiņām.

Lai novērtētu korelācijas indeksa R nozīmīgumu, kas lineāras attiecības gadījumā absolūtā vērtībā ir vienāds ar korelācijas koeficientu r, tiek izmantots Fišera F-tests. Mēs nosakām faktisko vērtību, izmantojot formulu:

kur m ir regresijas vienādojuma parametru skaits, n ir novērojumu skaits. Tas ir, n = 5, m = 2.

Ņemot vērā pieņemto nozīmīguma līmeni = 0,05 un brīvības pakāpju skaitu, iegūstam kritisko tabulas vērtību. Tā kā korelācijas indeksa R vērtība tiek atzīta par nozīmīgu.

Aprēķināsim paredzamo vērtību Y pie X = 30:

Izveidosim atrastās funkcijas grafiku:

11. Noteikt korelācijas koeficienta kļūdu pēc standartnovirzes vērtības

un tad mēs nosakām normalizētās novirzes vērtību

No attiecības> 2 ar varbūtību 95%, var runāt par iegūtā korelācijas koeficienta nozīmīgumu.

2. uzdevums. Lineārā optimizācija

1. iespēja.

Reģiona attīstības plānā paredzēts nodot ekspluatācijā 3 naftas atradnes ar kopējo ražošanas apjomu 9 milj.t. Pirmajā laukā produkcijas apjoms ir vismaz 1 milj.t, otrajā - 3 milj.t, trešajā - 5 milj.t. Lai sasniegtu šo produktivitāti, nepieciešams izurbt vismaz 125 urbumus. Šī plāna īstenošanai ir atvēlēti 25 miljoni rubļu. kapitālieguldījumi (rādītājs K) un 80 km cauruļu (rādītājs L).

Nepieciešams noteikt optimālo (maksimālo) urbumu skaitu, lai nodrošinātu katra lauka plānoto ražīgumu. Sākotnējie dati par uzdevumu ir doti tabulā.

Sākotnējie dati

Problēmas izklāsts ir sniegts iepriekš.

Formalizēsim uzdevumā norādītos nosacījumus un ierobežojumus. Šīs optimizācijas problēmas risināšanas mērķis ir atrast maksimālo naftas ieguves vērtību ar optimālu urbumu skaitu katram laukam, ņemot vērā problēmas esošos ierobežojumus.

Mērķa funkcija atbilstoši uzdevuma prasībām būs šāda:

kur ir katra lauka aku skaits.

Esošie uzdevuma ierobežojumi:

cauruļu ieguldīšanas garums:

urbumu skaits katrā laukā:

1 urbuma būvniecības izmaksas:

Lineārās optimizācijas problēmas tiek atrisinātas, piemēram, ar šādām metodēm:

Grafiski

Vienkāršā metode

Grafiskās metodes izmantošana ir ērta tikai, risinot lineāras optimizācijas uzdevumus ar diviem mainīgajiem. Ja ir lielāks mainīgo lielumu skaits, ir nepieciešams izmantot algebrisko aparātu. Apsveriet vispārīgu metodi lineārās optimizācijas problēmu risināšanai, ko sauc par simplekso metodi.

Simpleksā metode ir tipisks iteratīvo aprēķinu piemērs, ko izmanto, lai atrisinātu lielāko daļu optimizācijas problēmu. Tiek aplūkotas šāda veida iteratīvas procedūras, kas nodrošina problēmu risināšanu ar operāciju izpētes modeļu palīdzību.

Lai atrisinātu optimizācijas uzdevumu, izmantojot simplekso metodi, ir nepieciešams, lai nezināmo Xi skaits būtu lielāks par vienādojumu skaitu, t.i. vienādojumu sistēma

apmierina attiecības m

A = bija vienāds ar m.

Apzīmēsim matricas A kolonnu kā un brīvo terminu kolonnu kā

Sistēmas (1) pamatrisinājums ir m nezināmo kopa, kas ir sistēmas (1) risinājums.

Īsumā vienkāršās metodes algoritms ir aprakstīts šādi:

Sākotnējais ierobežojums, kas rakstīts kā nevienlīdzība, piemēram,<= (=>) var attēlot kā vienlīdzību, ierobežojuma kreisajai pusei pievienojot atlikušo mainīgo (no kreisās puses atņemot lieko mainīgo).

Piemēram, pa kreisi no sākotnējā ierobežojuma

tiek ieviests atlikušais mainīgais, kā rezultātā sākotnējā nevienādība pārvēršas vienādībā

Ja sākotnējais ierobežojums nosaka caurules plūsmas ātrumu, tad mainīgais ir jāinterpretē kā šī resursa atlikums vai neizmantotā daļa.

Mērķa funkcijas palielināšana ir līdzvērtīga tās pašas funkcijas samazināšanai, ņemot vērā pretējo zīmi. Tas ir, mūsu gadījumā

līdzvērtīgs

Simpleksa tabula ir sastādīta šādas formas pamata risinājumam:

Šajā tabulā ir norādīts, ka pēc problēmas atrisināšanas šajās šūnās būs pamata risinājums. - koeficienti no kolonnas dalīšanas ar vienu no kolonnām; - papildu reizinātāji vērtību nullēšanai tabulas šūnās, kas saistītas ar atrisināšanas kolonnu. - mērķa funkcijas minimālā vērtība -Z, - koeficientu vērtības mērķa funkcijā ar nezināmajiem.

Starp nozīmēm ir atrodama jebkura pozitīva vērtība. Ja tas tā nav, problēma tiek uzskatīta par atrisinātu. Tiek atlasīta jebkura tabulas kolonna, kas tajā atrodas, šo kolonnu sauc par "atļaujošo". Ja starp atrisināmās kolonnas elementiem nav pozitīvu skaitļu, tad problēma ir neatrisināma mērķa funkcijas neierobežotības dēļ tās atrisinājumu kopā. Ja atrisināšanas kolonnā ir pozitīvi skaitļi, pārejiet uz 5. darbību.

Kolonna ir aizpildīta ar daļskaitļiem, kuru skaitītājā ir kolonnas elementi, bet saucējā - attiecīgie izšķirošās kolonnas elementi. Ir atlasīta mazākā no visām vērtībām. Līniju ar mazāko rezultātu sauc par "iespējošanas" līniju. Izšķirošās līnijas un izšķirošās kolonnas krustpunktā tiek atrasts izšķiršanas elements, kas tiek kaut kādā veidā izcelts, piemēram, ar krāsu.

Pamatojoties uz pirmo simpleksa tabulu, tiek apkopota šāda informācija, kurā:

Aizstāj rindas vektoru ar kolonnu vektoru

pieļaujamo līniju aizstāj ar to pašu līniju, kas dalīta ar pieļaujamo elementu

katra no pārējām tabulas rindiņām tiek aizstāta ar šīs rindas summu ar izšķirošo, reizinot ar speciāli izvēlētu papildu koeficientu, lai risināmās kolonnas šūnā iegūtu 0.

Ar jauno tabulu pārejam pie 4. punkta.

Problēmas risinājums.

Balstoties uz problēmas formulējumu, mums ir šāda nevienlīdzību sistēma:

un mērķa funkcija

Mēs pārveidojam nevienādību sistēmu vienādojumu sistēmā, ieviešot papildu mainīgos:

Samazināsim mērķa funkciju līdz tās ekvivalentam:

Izveidosim oriģinālo vienkāršā tabulu:

Izvēlēsimies pieļaujamo kolonnu. Aprēķināsim kolonnu:

Mēs ievadām vērtības tabulā. Mazākajam no tiem = 10, mēs nosakām izšķiršanas līniju:. Izšķirošās līnijas un izšķirošās kolonnas krustpunktā atrodam izšķiršanas elementu = 1. Tabulas daļu aizpildām ar papildu faktoriem, tā, ka: atrisināšanas rinda, kas reizināta ar tiem, pievienota pārējām tabulas rindām, veido 0 izšķirošās kolonnas elementos.

Mēs veidojam otro simpleksa tabulu:

Mēs ņemam tajā izšķirošo kolonnu, aprēķinām vērtības, ievadām tās tabulā. Līdz minimumam mēs iegūstam atrisināšanas līniju. Atrisināšanas elements būs 1. Atrodiet papildu faktorus, aizpildiet kolonnas.

Mēs izveidojam šādu simpleksa tabulu:

Līdzīgi mēs atrodam atrisināšanas kolonnu, atrisināšanas rindu un atrisināšanas elementu = 2. Mēs veidojam šādu simpleksa tabulu:

Tā kā rindā -Z nav pozitīvu vērtību, šī tabula ir ierobežota. Pirmajā kolonnā ir norādītas vēlamās nezināmo vērtības, t.i. optimālais pamata risinājums:

Šajā gadījumā mērķa funkcijas vērtība ir -Z = -8000, kas ir ekvivalenta Zmax = 8000. Problēma ir atrisināta.

3. uzdevums. Klasteru analīze

Problēmas formulējums:

Sadaliet objektus, pamatojoties uz tabulā norādītajiem datiem. Risinājuma metodes izvēle jāveic neatkarīgi, lai izveidotu datu atkarības grafiku.

1. iespēja.

Sākotnējie dati

Šāda veida problēmu risināšanas metožu apskats. Risinājuma metodes pamatojums.

Klasteru analīzes uzdevumus risina, izmantojot šādas metodes:

Apvienības vai koku klasterizācijas metode tiek izmantota, lai veidotu "atšķirības" vai "attāluma starp objektiem" kopas. Šos attālumus var definēt viendimensionālā vai daudzdimensiju telpā.

Divvirzienu kombinēšana tiek izmantota (salīdzinoši reti) apstākļos, kad dati tiek interpretēti nevis pēc "objektu" un "objektu īpašību", bet gan no novērojumiem un mainīgajiem. Paredzams, ka gan novērojumi, gan mainīgie veicinās nozīmīgu kopu noteikšanu vienlaikus.

K-nozīmē metode. Izmanto, ja jau pastāv hipotēze par klasteru skaitu. Sistēmai var likt precīzi veidot, piemēram, trīs klasterus, lai tie būtu pēc iespējas atšķirīgi. Kopumā K-means metode veido tieši K dažādus klasterus, kas atrodas pēc iespējas lielākajos attālumos viens no otra.

Ir šādi attāluma mērīšanas veidi:

Eiklīda attālums. Šis ir visizplatītākais attāluma veids. Tas ir vienkārši ģeometriskais attālums daudzdimensiju telpā, un to aprēķina šādi:

Ņemiet vērā, ka Eiklīda attālums (un tā kvadrāts) tiek aprēķināts no sākotnējiem, nevis standartizētiem datiem.

Pilsētas kvartālu attālums (Manhetenas distance). Šis attālums ir vienkārši koordinātu atšķirību vidējais lielums. Vairumā gadījumu šis attāluma mērījums rada tādus pašus rezultātus kā parastam Eiklīda attālumam. Tomēr ņemiet vērā, ka šim pasākumam atsevišķu lielo atšķirību (ārpus vērtību) ietekme samazinās (jo tās nav kvadrātā). Manhetenas attālumu aprēķina pēc formulas:

Čebiševa attālums. Šis attālums var būt noderīgs, ja vēlaties definēt divus objektus kā "atšķirīgus", ja tie atšķiras pēc vienas koordinātas (jebkuras dimensijas). Čebiševa attālumu aprēķina pēc formulas:

Spēka distance. Dažkārt gribas pakāpeniski palielināt vai samazināt svaru, kas saistīts ar dimensiju, kurai atbilstošie objekti ir ļoti atšķirīgi. To var panākt, izmantojot jaudas likuma attālumu. Jaudas likuma attālumu aprēķina pēc formulas:

kur r un p ir lietotāja definēti parametri. Daži aprēķinu piemēri var parādīt, kā šis pasākums "darbojas". Parametrs p ir atbildīgs par atsevišķu koordinātu atšķirību pakāpenisku svēršanu, parametrs r ir atbildīgs par pakāpenisku lielu attālumu starp objektiem svēršanu. Ja abi parametri - r un p ir vienādi ar diviem, tad šis attālums sakrīt ar Eiklīda attālumu.

Nesaskaņu procents. Šo rādītāju izmanto, ja dati ir kategoriski. Šo attālumu aprēķina pēc formulas:

Problēmas risināšanai mēs izvēlēsimies unifikācijas metodi (kokveida klasterizāciju) kā tādu, kas vislabāk atbilst problēmas nosacījumiem un formulējumam (lai sadalītu objektus). Savukārt savienības metodē var izmantot vairākus saziņas noteikumu variantus:

Viena saite (tuvākā kaimiņa metode). Šajā metodē attālumu starp diviem klasteriem nosaka attālums starp diviem tuvākajiem objektiem (tuvākajiem kaimiņiem) dažādos klasteros. Tas ir, jebkuri divi objekti divās klasteros atrodas tuvāk viens otram nekā atbilstošā saites attālums. Šim noteikumam savā ziņā ir jāsavieno objekti kopā, veidojot kopas, un iegūtie klasteri parasti ir garas "ķēdes".

Pilna komunikācija (vistālāko kaimiņu metode). Izmantojot šo metodi, attālumu starp klasteriem nosaka lielākais attālums starp jebkuriem diviem elementiem dažādās kopās (ti, "tālākajiem kaimiņiem").

Ir arī daudzas citas klasterizācijas metodes, piemēram, šīs (piemēram, nesvērtā savienošana pārī, svērtā savienošana pārī utt.).

Risinājuma metodes tehnoloģija. Rādītāju aprēķins.

Pirmajā solī, kad katrs objekts ir atsevišķs klasteris, attālumus starp šiem objektiem nosaka izvēlētais mērs.

Tā kā uzdevumā nav norādītas raksturlielumu mērvienības, tiek pieņemts, ka tās ir vienādas. Tāpēc nav nepieciešams normalizēt sākotnējos datus, tāpēc mēs nekavējoties pārejam pie attāluma matricas aprēķināšanas.

Problēmas risinājums.

Veidosim atkarības grafiku pēc sākotnējiem datiem (2. att.)

Mēs ņemsim parasto Eiklīda attālumu kā attālumu starp objektiem. Tad pēc formulas:

kur l - zīmes; k ir pazīmju skaits, attālums starp objektiem 1 un 2 ir vienāds ar:

Mēs turpinām aprēķināt atlikušos attālumus:

No iegūtajām vērtībām veidosim tabulu:

Mazākā distance. Tas nozīmē, ka mēs apvienojam elementus 3, 6 un 5 vienā klasterī. Mēs iegūstam šādu tabulu:

Mazākā distance. Elementi 3, 6, 5 un 4 ir apvienoti vienā klasterī. Mēs iegūstam divu klasteru tabulu:

Minimālais attālums starp 3. un 6. vienumiem ir. Tas nozīmē, ka elementi 3 un 6 ir apvienoti vienā klasterī. Mēs izvēlamies maksimālo attālumu starp jaunizveidoto kopu un pārējiem elementiem. Piemēram, attālums starp 1. kopu un 3.6. kopu ir maksimālais (13,34166, 13,60147) = 13,34166. Sastādām šādu tabulu:

Tajā minimālais attālums ir attālums starp klasteriem 1 un 2. Apvienojot 1 un 2 vienā klasterī, mēs iegūstam:

Tādējādi, izmantojot “tālā kaimiņa” metodi, tika iegūti divi klasteri: 1,2 un 3,4,5,6, attālums starp kuriem ir 13,60147.

Problēma ir atrisināta.

Lietojumprogrammas. Problēmu risināšana, izmantojot programmatūras pakotnes (MS Excel 7.0)

Korelācijas un regresijas analīzes problēma.

Tabulā ievadām sākotnējos datus (1. att.)

Atlasiet izvēlni "Pakalpojums / Datu analīze". Parādītajā logā atlasiet rindu "Regression" (2. att.).

Nākamajā logā iestatīsim X un Y ievades intervālus, ticamības līmenis būs 95%, un izvaddati tiks ievietoti atsevišķā lapā "Atskaites lapa" (3. att.)

Pēc aprēķina veikšanas mēs iegūstam regresijas analīzes galīgos datus uz lapas "Atskaites lapa":

Tas parāda arī tuvinātās funkcijas punktu diagrammu jeb "Atlases grafiku":


Aprēķinātās vērtības un novirzes ir parādītas tabulā attiecīgi kolonnās "Prognozētais Y" un "Atlikumi".

Pamatojoties uz sākotnējiem datiem un novirzēm, tiek uzzīmēts atlikuma grafiks:

Optimizācijas uzdevums


Sākotnējos datus ievadām šādi:

Nezināmie nezināmie X1, X2, X3 tiek ievadīti attiecīgi šūnās C9, D9, E9.

Mērķa funkcijas koeficienti X1, X2, X3 tiek ievadīti attiecīgi C7, D7, E7.

Ievadiet mērķa funkciju šūnā B11 pēc formulas: = C7 * C9 + D7 * D9 + E7 * E9.

Esošie uzdevumu ierobežojumi

Cauruļu ieguldīšanas garumam:

pievienojam šūnām C5, D5, E5, F5, G5

Aku skaits katrā laukā:

X3 Ј 100; mēs pievienojam šūnām C8, D8, E8.

1 urbuma izbūves izmaksas:

mēs pievienojam šūnām C6, D6, E6, F6, G6.

Kopējā garuma C5 * C9 + D5 * D9 + E5 * E9 aprēķināšanas formula tiek ievietota šūnā B5, kopējo izmaksu aprēķināšanas formula C6 * C9 + D6 * D9 + E6 * E9 ir ievietota šūnā B6.


Izvēlnē izvēlamies "Pakalpojums / Meklēt risinājumu", ievadām parametrus risinājuma atrašanai atbilstoši sākotnējiem datiem (4. att.):

Izmantojot pogu "Parametri", iestatiet šādus parametrus risinājuma atrašanai (5. att.):


Pēc risinājuma meklēšanas mēs saņemam ziņojumu par rezultātiem:

Microsoft Excel 8.0e rezultātu pārskats

Pārskats izveidots: 17.11.2002 1:28:30

Mērķa šūna (maksimums)

Rezultāts

Kopējais laupījums

Modificētas šūnas

Rezultāts

Aku skaits

Aku skaits

Aku skaits

Ierobežojumi

Nozīme

Garums

Saistīts

Projekta izmaksas

nav saistīti.

Aku skaits

nav saistīti.

Aku skaits

Saistīts

Aku skaits

Saistīts

Pirmajā tabulā ir parādīta mērķa šūnas sākotnējā un beigu (optimālā) vērtība, kurā tika ievietota risināmās problēmas mērķa funkcija. Otrajā tabulā redzamas optimizējamo mainīgo sākotnējās un beigu vērtības, kas atrodas modificētajās šūnās. Rezultātu pārskata trešajā tabulā ir informācija par ierobežojumiem. Kolonnā "Vērtība" ir norādītas nepieciešamo resursu un optimizējamo mainīgo optimālās vērtības. Kolonnā "Formula" ir ietverti patērēto resursu ierobežojumi un optimizējamie mainīgie, kas rakstīti kā atsauces uz šūnām, kurās ir šie dati. Kolonna "State" nosaka, vai šie vai šie ierobežojumi ir saistīti vai nesaistīti. Šeit "saistītie" ir ierobežojumi, kas tiek ieviesti optimālajā risinājumā stingru vienādību veidā. Ailē "Atšķirība" resursu ierobežojumiem tiek noteikts izmantoto resursu atlikums, t.i. starpība starp nepieciešamo resursu apjomu un to pieejamību.

Tāpat, ierakstot risinājuma meklēšanas rezultātu formā "Ilgtspējas ziņojums", saņemsim šādas tabulas:

Microsoft Excel 8.0e noturības pārskats

Darba lapa: [Optimizācijas problēmas risinājums.xls] Optimizācijas problēmas risinājums

Pārskats izveidots: 17.11.2002 1:35:16

Modificētas šūnas

Pieļaujams

Pieļaujams

nozīmē

cena

Koeficients

Palielināt

Samazināt

Aku skaits

Aku skaits

Aku skaits

Ierobežojumi

Ierobežojums

Pieļaujams

Pieļaujams

nozīmē

Labā daļa

Palielināt

Samazināt

Garums

Projekta izmaksas

Ilgtspējības pārskatā ir informācija par modificējamiem (optimizētiem) mainīgajiem un modeļa ierobežojumiem. Šī informācija ir saistīta ar lineāro problēmu optimizācijā izmantoto simplekso metodi, kas aprakstīta iepriekš saistībā ar problēmas risināšanu. Tas ļauj novērtēt, cik jutīgs ir iegūtais optimālais risinājums pret iespējamām modeļa parametru izmaiņām.

Pārskata pirmajā daļā ir informācija par modificētajām šūnām, kas satur vērtības par urbumu skaitu laukos. Kolonnā “Rezultātā iegūtā vērtība” ir norādītas optimizējamo mainīgo lielumu optimālās vērtības. Ailē "Mērķa koeficients" ir norādīti mērķa funkcijas koeficientu vērtību sākotnējie dati. Nākamās divas ailes ilustrē šo koeficientu pieļaujamo pieaugumu un samazinājumu, nemainot atrasto optimālo risinājumu.

Ilgtspējības ziņojuma otrajā daļā ir informācija par ierobežojumiem, kas noteikti optimizējamajiem mainīgajiem. Pirmajā kolonnā ir norādītas resursu prasības optimālajam risinājumam. Otrajā ir ietvertas izmantoto resursu veidu ēnu cenu vērtības. Pēdējās divās kolonnās ir dati par iespējamo pieejamo resursu apjoma pieaugumu vai samazinājumu.

Klasterizācijas problēma.

Soli pa solim metode problēmas risināšanai ir sniegta iepriekš. Šeit ir Excel tabulas, kas ilustrē problēmas risināšanas gaitu:

Tuvākā kaimiņa metode

Klasteranalīzes problēmas risināšana - "TUVĀKĀ KAIMIŅA METODE"

Sākotnējie dati

kur x1 ir produktu apjoms;

х2 - galvenās vidējās gada izmaksas

Rūpnieciskās ražošanas līdzekļi

Tālo kaimiņu metode

Klasteranalīzes problēmas risinājums - "DISTANCE NEIGHBOR METHOD"

Sākotnējie dati

kur x1 ir produktu apjoms;

х2 - galvenās vidējās gada izmaksas

Rūpnieciskās ražošanas līdzekļi

Ekspertu vērtējumu iesniegšana un pirmapstrāde

Praksē tiek izmantoti vairāki novērtējuma veidi:

- augstas kvalitātes (bieži-reti, sliktāk-labāk, jā-nē),

- mēroga aprēķini (vērtību diapazoni 50-75, 76-90, 91-120 utt.),

Rezultāts no noteiktā intervāla (no 2 līdz 5, 1 -10), savstarpēji neatkarīgi,

Sarindots (objektus eksperts sakārto noteiktā secībā, un katram tiek piešķirts sērijas numurs - rangs),

Salīdzinošs, iegūts ar kādu no salīdzināšanas metodēm

secīgās salīdzināšanas metode

faktoru pāru salīdzināšanas metode.

Nākamajā ekspertu atzinumu apstrādes posmā ir nepieciešams izvērtēt šo viedokļu konsekvences pakāpi.

No ekspertiem iegūtās aplēses var uzskatīt par nejaušu lielumu, kura sadalījums atspoguļo ekspertu viedokļus par konkrēta notikuma (faktora) izvēles iespējamību. Tāpēc, lai analizētu ekspertu aplēšu izkliedi un konsekvenci, tiek izmantoti vispārināti statistiskie raksturlielumi - vidējie un izkliedes mērījumi:

Vidējā kvadrāta kļūda,

Izmaiņu diapazons no min līdz max,

- variācijas koeficients V = vidējā kvadrātiskā novirze / vidējais aritms. (piemērots jebkura veida novērtējumam)

V i = σ i / x i vid

Par likmi līdzības pasākumi bet viedokļi katrs ekspertu pāris var izmantot dažādas metodes:

asociācijas koeficienti, ar kuras palīdzību tiek ņemts vērā atbilstošo un neatbilstošo atbilžu skaits,

nekonsekvences koeficienti ekspertu atzinumi,

Visus šos pasākumus var izmantot, lai salīdzinātu divu ekspertu viedokļus vai analizētu attiecības starp vērtējumu sērijām, pamatojoties uz diviem pamatiem.

Spīrmena pāra ranga korelācijas koeficients:

kur n ir ekspertu skaits,

c k - starpība starp i-tā un j-tā eksperta aplēsēm visiem T faktoriem

Kendala rangu korelācijas koeficients (konkordances koeficients) sniedz vispārēju novērtējumu visu ekspertu viedokļu konsekvencei par visiem faktoriem, bet tikai gadījumos, kad tika izmantotas rangu aplēses.

Ir pierādīts, ka S vērtībai, kad visi eksperti sniedz vienādus visu faktoru aprēķinus, ir maksimālā vērtība, kas vienāda ar

kur n ir faktoru skaits,

m ir ekspertu skaits.

Atbilstības koeficients ir vienāds ar attiecību

turklāt, ja W ir tuvu 1, tad visi eksperti ir devuši pietiekami konsekventus aprēķinus, pretējā gadījumā viņu viedokļi nesakrīt.

Formula S aprēķināšanai ir parādīta zemāk:

kur r ij ir j-tā eksperta i-tā faktora ranga aplēses,

r cf ir vidējais rangs visā aplēšu matricā un ir vienāds ar

Tāpēc S aprēķināšanas formula var būt šāda:

Ja viena eksperta individuālie vērtējumi sakrīt un apstrādes laikā tie tika standartizēti, tad atbilstības koeficienta aprēķināšanai tiek izmantota cita formula:



kur T j aprēķina katram ekspertam (gadījumā, ja viņa vērtējumi tika atkārtoti dažādiem objektiem), ņemot vērā atkārtojumus saskaņā ar šādiem noteikumiem:

kur t j ir vienādas pakāpes grupu skaits j-tajam ekspertam, un

h k - vienādu pakāpju skaits j-tā eksperta radniecīgo kārtu k-tajā grupā.

PIEMĒRS. Ļaujiet 5 ekspertiem par sešiem faktoriem atbildēt reitingā, kā parādīts 3. tabulā:

3. tabula. Ekspertu atbildes

Eksperti О1 О2 O3 О4 O5 O6 Pakāpju summa pēc eksperta
E1
E2
E3
E4
E5

Sakarā ar to, ka netika iegūts stingrs rangs (ekspertu vērtējumi tiek atkārtoti, un rindu summas nav vienādas), mēs pārveidosim aplēses un iegūsim atbilstošās pakāpes (4. tabula):

4. tabula. Ekspertu vērtējumu saistītās rindas

Eksperti О1 О2 O3 О4 O5 O6 Pakāpju summa pēc eksperta
E1 2,5 2,5
E2
E3 1,5 1,5 4,5 4,5
E4 2,5 2,5 4,5 4,5
E5 5,5 5,5
Objekta rindu summa 7,5 9,5 23,5 29,5

Tagad noteiksim ekspertu atzinumu konsekvences pakāpi, izmantojot atbilstības koeficientu. Tā kā rangi ir saistīti, mēs aprēķināsim W pēc formulas (**).

Tad r cf = 7 * 5/2 = 17,5

S = 10 2 +8 2 +4,5 2 +4,5 2 +6 2 +12 2 = 384,5

Turpināsim ar W aprēķiniem. Šim nolūkam mēs atsevišķi aprēķinām T j vērtības. Piemērā vērtējumi ir īpaši atlasīti tā, lai katram ekspertam būtu atkārtoti vērtējumi: pirmajam ir divi, otrajam trīs, trešajā – divas divu reitingu grupas, bet ceturtajam – divi identiski vērtējumi. Tātad:

T 1 = 2 3 - 2 = 6 T 5 = 6

T 2 = 3 3 - 3 = 24

Т 3 = 2 3 –2+ 2 3 –2 = 12 Т 4 = 12

Redzam, ka ekspertu viedokļu saskaņa ir diezgan liela un varam pāriet uz nākamo pētījuma posmu - ekspertu ieteiktā lēmuma alternatīvas pamatojumu un pieņemšanu.

Pretējā gadījumā jums ir jāatgriežas pie 4.–8. darbības.

KENDALLAS RANGA KORELĀCIJAS KOEFICIENTS

Viens no divu gadījuma lielumu (iezīmju) atkarības izlases mēriem X un Y, pamatojoties uz izlases vienumu ranžēšanu (X 1, Y x), .. ., (X n, Y n). K. līdz R. tātad attiecas uz ranga statistiķi un to nosaka pēc formulas

kur r i- Jūs piederat šim pārim ( X, Y), par Xraven baru i, S = 2N- (n-1) / 2, N ir to izlases elementu skaits, kuriem vienlaikus j> i un r j> r i... Ir vienmēr Kā selektīvs atkarības mērs No. To. R. to plaši izmantoja M. Kendals (M. Kendall, sk.).

K. līdz R. K. izmanto, lai pārbaudītu gadījuma lielumu neatkarības hipotēzi. Ja neatkarības hipotēze ir patiesa, tad E t = 0 un D t = 2 (2n + 5) / 9n (n-1). Ar nelielu izlases lielumu pārbaude ir statistiska. neatkarības hipotēze tiek izvirzīta, izmantojot īpašas tabulas (sk.). Ja n> 10, izmanto m sadalījuma normālo tuvinājumu: ja

tad neatkarības hipotēze tiek noraidīta, pretējā gadījumā tā tiek pieņemta. Šeit a . - nozīmīguma līmenis, u a / 2 ir normālā sadalījuma procentpunkts. K. līdz R. Jo, tāpat kā jebkuru citu, ar to var noteikt divu kvalitatīvu pazīmju atkarību, ja tikai parauga elementus var sakārtot attiecībā uz šīm pazīmēm. Ja X, Y ir kopīgs normāls ar korelācijas koeficientu p, tad attiecības starp K. līdz p. un ir šāda forma:

Skatīt arī Spīrmena ranga korelācija, ranga tests.

Lit.: Kendal M., Ranga korelācijas, trans. no angļu val., M., 1975; Van der Vērdens B.L., Matemātika, tulk. no tā., M., 1960; Bol'shev L.N., Smirnov N.V., Matemātiskās statistikas tabulas, Maskava, 1965.

A. V. Prohorovs.


Matemātikas enciklopēdija. - M .: Padomju enciklopēdija... I. M. Vinogradovs. 1977-1985.

Skatiet, kas ir "KENDALLAS RANKA KORRELĀCIJAS KOEFICIENTS" citās vārdnīcās:

    Angļu. с efektīva, rangu korelācija Kendall; vāciski Kendalls Rangkorrelationskoeffizient. Korelācijas koeficients, kas nosaka visu objektu pāru sakārtotības atbilstības pakāpi divos mainīgajos. Antinazi. Socioloģijas enciklopēdija, 2009... Socioloģijas enciklopēdija

    KENDALLA RANGA KORELĀCIJAS KOEFICIENTS- Angļu. efektīva, rangu korelācija Kendall; vāciski Kendalls Rangkorrelationskoeffizient. Korelācijas koeficients, kas nosaka visu objektu pāru secības atbilstības pakāpi divos mainīgajos... Socioloģijas skaidrojošā vārdnīca

    Divu gadījuma lielumu (iezīmju) X un Y atkarības mērs, pamatojoties uz neatkarīgo novērojumu rezultātu sakārtošanu (X1, Y1). ... ., (Xn, Yn). Ja X vērtību rindas atrodas dabiskā secībā i = 1,. ... ., n un Ri rangs Y, kas atbilst ... ... Matemātikas enciklopēdija

    Korelācijas koeficients- (Korelācijas koeficients) Korelācijas koeficients ir divu nejaušu lielumu atkarības statistiskais rādītājs Korelācijas koeficienta noteikšana, korelācijas koeficientu veidi, korelācijas koeficienta īpašības, aprēķins un pielietojums ... ... Investoru enciklopēdija

    Attiecības starp nejaušajiem mainīgajiem, kas, vispārīgi runājot, nav stingri funkcionālas. Atšķirībā no funkcionālās atkarības, K., kā likums, tiek uzskatīts, ja viens no daudzumiem ir atkarīgs ne tikai no šī otra, bet arī ... ... Matemātikas enciklopēdija

    Korelācija (korelācijas atkarība) ir divu vai vairāku gadījuma lielumu (vai lielumu, kurus var uzskatīt par tādiem ar zināmu pieņemamu precizitātes pakāpi) statistiska sakarība. Šajā gadījumā vienas vai ... ... Wikipedia vērtību izmaiņas

    Korelācija- (Korelācija) Korelācija ir divu vai vairāku nejaušu mainīgo statistiskā sakarība. Korelācijas jēdziens, korelācijas veidi, korelācijas koeficients, korelācijas analīze, cenu korelācija, valūtu pāru korelācija Forex saturā ... ... Investoru enciklopēdija

    Ir vispāratzīts, ka sākumā S. gadsimtā. jeb, kā mēdz saukt, "mazā n" statistika tika ievietota XX gadsimta pirmajā desmitgadē, publicējot V. Goseta darbu, kurā viņš ievietoja t sadalījumu, ko postulēja tie, kuri saņēma pasaule nedaudz vēlāk...... Psiholoģiskā enciklopēdija

    Moriss Kendels Sers Moriss Džordžs Kendels Dzimšanas datums: 1907. gada 6. septembris (1907 09 06) Dzimšanas vieta: Keteringa, Apvienotā Karaliste Miršanas datums ... Wikipedia

    Prognoze- (Prognoze) Prognozes definīcija, uzdevumi un prognozēšanas principi Prognozes definīcija, prognozēšanas uzdevumi un principi, prognozēšanas metodes Saturs Saturs Definīcija Prognozēšanas pamatjēdzieni Uzdevumi un prognozēšanas principi ... ... Investoru enciklopēdija