Koefisien korelasi Spearman, pangkat Kendall, koefisien Fechner. Koefisien korelasi peringkat Kendall dan Spearman Koefisien korelasi peringkat Spearman dan spearman

Ini digunakan untuk mengidentifikasi hubungan antara indikator kuantitatif atau kualitatif, jika mereka dapat diberi peringkat. Nilai indikator X diatur dalam urutan menaik dan peringkat yang ditetapkan. Nilai indikator Y diberi peringkat dan koefisien korelasi Kendall dihitung:

di mana S = PQ.

P besar nilai pangkat Y

Q- jumlah total pengamatan setelah pengamatan saat ini dengan lebih kecil nilai pangkat Y (peringkat yang sama tidak dihitung!)

Jika data yang dipelajari diulang (memiliki peringkat yang sama), maka koefisien korelasi yang dikoreksi Kendall digunakan dalam perhitungan:

T- jumlah peringkat terkait di baris X dan Y, masing-masing.

19.Apa yang harus menjadi titik awal ketika mendefinisikan tema, objek, subjek, tujuan, tujuan dan hipotesis penelitian?

Program penelitian, sebagai suatu peraturan, memiliki dua bagian: metodologis dan prosedural. Yang pertama meliputi membuktikan relevansi topik, merumuskan masalah, mendefinisikan objek dan subjek, tujuan dan sasaran penelitian, merumuskan konsep dasar (perangkat kategoris), analisis sistematis awal objek penelitian dan mengajukan hipotesis kerja. Bagian kedua mengungkapkan rencana penelitian strategis, serta rencana dan prosedur dasar untuk mengumpulkan dan menganalisis data primer.

Pertama-tama, ketika memilih topik penelitian, seseorang harus berangkat dari relevansi. Pembenaran relevansi termasuk indikasi kebutuhan dan ketepatan waktu studi dan pemecahan masalah untuk pengembangan lebih lanjut dari teori dan praktik pengajaran dan pengasuhan. Penelitian topikal memberikan jawaban atas pertanyaan paling mendesak saat ini, mencerminkan tatanan sosial masyarakat terhadap ilmu pedagogis, dan mengungkapkan kontradiksi terpenting yang terjadi dalam praktik. Kriteria relevansi adalah dinamis, mobile, tergantung pada waktu, dengan mempertimbangkan keadaan spesifik dan spesifik. Dalam bentuknya yang paling umum, relevansi mencirikan tingkat perbedaan antara permintaan akan ide-ide ilmiah dan rekomendasi praktis (untuk memenuhi kebutuhan tertentu) dan proposal yang dapat diberikan oleh sains dan praktik pada saat ini.

Dasar yang paling meyakinkan untuk mendefinisikan topik penelitian adalah tatanan sosial, yang mencerminkan masalah paling akut dan signifikan secara sosial yang membutuhkan solusi mendesak. Tatanan sosial membutuhkan pembuktian topik tertentu. Biasanya ini adalah analisis tingkat elaborasi suatu pertanyaan dalam sains.

Jika tatanan sosial mengikuti dari analisis praktik pedagogis, maka itu sendiri masalah ilmiah berada di pesawat yang berbeda. Ini mengungkapkan kontradiksi utama yang harus diselesaikan melalui sains. Solusi untuk masalah ini biasanya tujuan studi. Tujuannya adalah masalah yang dirumuskan kembali.

Kata-kata dari masalah memerlukan pemilihan objek riset. Ini bisa berupa proses pedagogis, area realitas pedagogis, atau semacam sikap pedagogis yang mengandung kontradiksi. Dengan kata lain, suatu objek dapat berupa apa saja yang secara eksplisit atau implisit mengandung kontradiksi dan menimbulkan situasi masalah. Objeknya adalah apa proses kognisi diarahkan. Subyek studi - bagian, sisi objek. Ini adalah yang paling signifikan dari sudut pandang praktis atau teoretis, sifat, aspek, fitur dari suatu objek yang tunduk pada studi langsung.

Sesuai dengan tujuan, objek dan subjek penelitian, penelitian tugas, yang, sebagai suatu peraturan, ditujukan untuk memeriksa hipotesis. Yang terakhir adalah seperangkat asumsi yang didasarkan pada teori, yang kebenarannya harus diverifikasi.

Kriteria kebaruan ilmiah dapat digunakan untuk menilai kualitas studi yang diselesaikan. Ini mencirikan kesimpulan teoretis dan praktis baru, pola pendidikan, struktur dan mekanismenya, konten, prinsip dan teknologinya, yang pada saat ini tidak diketahui dan tidak dicatat dalam literatur pedagogis. Kebaruan penelitian dapat memiliki signifikansi teoretis dan praktis. Nilai teoritis penelitian terletak pada penciptaan konsep, memperoleh hipotesis, keteraturan, metode, model untuk mengidentifikasi masalah, kecenderungan, arah. Signifikansi praktis dari penelitian ini terletak pada penyusunan proposal, rekomendasi, dll. Kriteria kebaruan, perubahan signifikansi teoritis dan praktis tergantung pada jenis penelitian, mereka juga tergantung pada waktu memperoleh pengetahuan baru.

Koefisien korelasi peringkat mencirikan sifat umum ketergantungan nonlinier: peningkatan atau penurunan sifat efektif dengan peningkatan faktor satu. Ini merupakan indikator ketatnya hubungan nonlinier monoton.

Tujuan layanan... Kalkulator online ini menghitung Koefisien korelasi peringkat Kendall menurut semua rumus dasar, serta penilaian signifikansinya.

Petunjuk. Menunjukkan jumlah data (jumlah baris). Solusi yang dihasilkan disimpan dalam file Word.

Koefisien yang diusulkan oleh Kendall dibangun atas dasar hubungan tipe "lebih-kurang", yang validitasnya ditetapkan ketika membangun skala.
Mari pilih beberapa objek dan bandingkan peringkatnya dalam satu atribut dan atribut lainnya. Jika, menurut kriteria ini, peringkat membentuk urutan langsung (yaitu, urutan deret alami), maka pasangan diberi +1, jika sebaliknya, maka -1. Untuk pasangan yang dipilih, unit plus - minus yang sesuai (menurut atribut X dan atribut Y) dikalikan. Hasilnya jelas +1; jika barisan pasangan dari kedua fitur terletak pada barisan yang sama, dan -1 jika terbalik.
Jika urutan peringkat adalah sama untuk semua pasangan menurut kedua kriteria, maka jumlah unit yang diberikan untuk semua pasangan objek adalah maksimum dan sama dengan jumlah pasangan. Jika urutan peringkat semua pasangan dibalik, maka –C 2 N. Dalam kasus umum, C 2 N = P + Q, di mana P adalah jumlah positif dan Q adalah jumlah negatif yang ditetapkan untuk pasangan ketika membandingkan peringkat mereka untuk kedua kriteria.
Besaran tersebut disebut koefisien Kendall.
Dari rumus tersebut dapat dilihat bahwa koefisien adalah selisih antara proporsi pasangan benda yang ordonya sama pada kedua kriteria (berkaitan dengan banyaknya semua pasangan) dan proporsi pasangan benda yang urutannya tidak sama.
Misalnya, nilai koefisien 0,60 berarti 80% pasangan memiliki urutan objek yang sama, sedangkan 20% tidak (80% + 20% = 100%; 0,80 - 0,20 = 0,60). Itu. dapat diartikan sebagai perbedaan antara probabilitas kebetulan dan non-kebetulan dari urutan di kedua tanda untuk sepasang objek yang dipilih secara acak.
Dalam kasus umum, perhitungan (lebih tepatnya, P atau Q) bahkan untuk N orde 10 ternyata rumit.
Mari tunjukkan cara menyederhanakan perhitungan.


Sebuah contoh. Hubungan antara volume produksi industri dan investasi dalam aset tetap di 10 wilayah di salah satu distrik federal Federasi Rusia pada tahun 2003 ditandai oleh data berikut:


Hitung koefisien korelasi rank Spearman dan Kendal. Periksa signifikansinya pada = 0,05. Merumuskan kesimpulan tentang hubungan antara volume produksi industri dan investasi dalam aset tetap di wilayah Federasi Rusia yang sedang dipertimbangkan.

Larutan... Mari kita tetapkan peringkat untuk atribut Y dan faktor X.


Mari kita urutkan data berdasarkan X.
Di baris Y di sebelah kanan 3 ada 7 peringkat yang melebihi 3, oleh karena itu, 3 akan menghasilkan suku 7 di P.
Di sebelah kanan 1 ada 8 peringkat melebihi 1 (ini adalah 2, 4, 6, 9, 5, 10, 7, 8), yaitu. 8 akan masuk P, dan seterusnya. Akibatnya, = 37 dan menggunakan rumus yang kita miliki:

xkamupangkat X, d xperingkat Y, d yPQ
18.4 5.57 1 3 7 2
20.6 2.88 2 1 8 0
21.5 4.12 3 2 7 0
35.7 7.24 4 4 6 0
37.1 9.67 5 6 4 1
39.8 10.48 6 9 1 3
51.1 8.58 7 5 3 0
54.4 14.79 8 10 0 2
64.6 10.22 9 7 1 0
90.6 10.45 10 8 0 0
37 8


Dengan rumus yang disederhanakan:




di mana n adalah ukuran sampel; z kp adalah titik kritis daerah kritis bilateral, yang didapat dari tabel fungsi Laplace dengan persamaan (z kp) = (1-α) / 2.
Jika | |< T kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если |τ| >T kp - hipotesis nol ditolak. Ada korelasi peringkat yang signifikan antara fitur kualitatif.
Cari titik kritis z kp
(z kp) = (1-α) / 2 = (1 - 0,05) / 2 = 0,475

Mari kita temukan titik kritisnya:

Karena > T kp - kami menolak hipotesis nol; korelasi peringkat antara skor pada dua tes adalah signifikan.

Sebuah contoh. Berdasarkan data volume pekerjaan konstruksi dan instalasi yang dilakukan sendiri dan jumlah karyawan di 10 perusahaan konstruksi di salah satu kota di Federasi Rusia, tentukan hubungan antara tanda-tanda ini menggunakan koefisien Kendal.

Larutan temukan dengan kalkulator.
Mari kita tetapkan peringkat untuk atribut Y dan faktor X.
Mari kita atur objek sehingga peringkat X mereka mewakili deret alami. Karena perkiraan yang ditetapkan untuk setiap pasangan dari seri ini adalah positif, nilai "+1" yang termasuk dalam P hanya akan dihasilkan oleh pasangan yang peringkatnya di Y membentuk urutan langsung.
Mereka mudah dihitung dengan membandingkan secara berurutan peringkat setiap objek di baris Y dengan yang baja.
Koefisien Kendall.

Dalam kasus umum, perhitungan (lebih tepatnya, P atau Q) bahkan untuk N orde 10 ternyata rumit. Mari tunjukkan cara menyederhanakan perhitungan.

atau

Larutan.
Mari kita urutkan data berdasarkan X.
Di baris Y di sebelah kanan 2 ada 8 peringkat yang melebihi 2, oleh karena itu, 2 akan menghasilkan suku 8 di P.
Di sebelah kanan 4 ada 6 peringkat melebihi 4 (ini adalah 7, 5, 6, 8, 9, 10), yaitu. 6 akan masuk P, dan seterusnya. Akibatnya, P = 29 dan menggunakan rumus yang kita miliki:

xkamupangkat X, d xperingkat Y, d yPQ
38 292 1 2 8 1
50 302 2 4 6 2
52 366 3 7 3 4
54 312 4 5 4 2
59 359 5 6 3 2
61 398 6 8 2 2
66 401 7 9 1 2
70 298 8 3 1 1
71 283 9 1 1 0
73 413 10 10 0 0
29 16


Dengan rumus yang disederhanakan:


Untuk menguji hipotesis nol tentang persamaan koefisien korelasi peringkat umum Kendall dengan nol pada tingkat signifikansi dengan hipotesis pesaing H 1: 0, perlu untuk menghitung titik kritis:

di mana n adalah ukuran sampel; z kp adalah titik kritis daerah kritis dua sisi, yang diperoleh dari tabel fungsi Laplace dengan persamaan (z kp) = (1 - ) / 2.
Jika | | T kp - hipotesis nol ditolak. Ada korelasi peringkat yang signifikan antara fitur kualitatif.
Cari titik kritis z kp
(z kp) = (1 - ) / 2 = (1 - 0,05) / 2 = 0,475
Menggunakan tabel Laplace, kami menemukan z kp = 1,96
Mari kita temukan titik kritisnya:

Sejak

Kebutuhan praktik ekonomi dan sosial memerlukan pengembangan metode untuk deskripsi kuantitatif proses yang memungkinkan pencatatan yang akurat tidak hanya faktor kuantitatif, tetapi juga faktor kualitatif. Asalkan nilai-nilai karakteristik kualitatif dapat diurutkan, atau diurutkan menurut derajat penurunan (peningkatan) karakteristik, dimungkinkan untuk menilai kedekatan hubungan antara karakteristik kualitatif. Kualitatif berarti fitur yang tidak dapat diukur secara akurat, tetapi memungkinkan Anda untuk membandingkan objek satu sama lain dan, oleh karena itu, mengaturnya dalam urutan penurunan atau peningkatan kualitas. Dan isi sebenarnya dari pengukuran dalam skala peringkat adalah urutan objek yang disusun menurut tingkat keparahan fitur yang diukur.

Untuk tujuan praktis, penggunaan korelasi peringkat sangat berguna. Misalnya, jika korelasi peringkat tinggi dibuat antara dua fitur kualitatif produk, maka cukup untuk mengontrol produk hanya dengan salah satu fitur, yang membuat kontrol lebih murah dan lebih cepat.

Sebagai contoh, kita dapat mempertimbangkan adanya hubungan antara ketersediaan produk komersial dari sejumlah perusahaan dan biaya overhead untuk penjualan. Selama 10 kali pengamatan, diperoleh tabel sebagai berikut:

Mari kita atur nilai X dalam urutan menaik, dengan setiap nilai menetapkan nomor urutnya (peringkat) untuk setiap nilai:

Dengan demikian,

Mari kita buat tabel berikut, di mana pasangan X dan Y ditulis, yang diperoleh dari pengamatan dengan peringkatnya:

Dengan menyatakan perbedaan peringkat sebagai, kami menulis rumus untuk menghitung koefisien korelasi sampel Spearman:

di mana n adalah jumlah pengamatan, itu juga jumlah pasangan peringkat.

Koefisien Spearman memiliki sifat sebagai berikut:

Jika ada hubungan langsung yang lengkap antara fitur kualitatif X dan Y dalam arti bahwa peringkat objek bertepatan untuk semua nilai i, maka koefisien korelasi sampel Spearman adalah 1. Memang, dengan mensubstitusikannya ke dalam rumus, kita dapatkan 1.

Jika ada hubungan terbalik lengkap antara fitur kualitatif X dan Y dalam arti bahwa peringkat sesuai dengan peringkat, maka koefisien korelasi sampel Spearman adalah -1.

Memang, jika

Mengganti nilai dalam rumus koefisien korelasi Spearman, kita mendapatkan -1.

Jika tidak ada umpan balik langsung atau umpan balik yang lengkap antara fitur kualitatif, maka koefisien korelasi sampel Spearman adalah antara -1 dan 1, dan semakin mendekati 0 nilainya, semakin sedikit hubungan antar fitur.

Sesuai dengan contoh di atas, kita akan menemukan nilai P, untuk ini kita akan melengkapi tabel dengan nilai dan:

Koefisien korelasi sampel Kendall. Anda dapat menilai hubungan antara dua karakteristik kualitatif menggunakan koefisien korelasi peringkat Kendall.

Biarkan peringkat objek sampel berukuran n sama:

atas dasar X:

atas dasar Y:. Mari kita asumsikan bahwa di sebelah kanan ada pangkat, besar, di kanan ada pangkat, besar, di kanan ada pangkat, besar. Mari kita perkenalkan notasi untuk jumlah pangkat

Demikian pula, kami memperkenalkan notasi sebagai jumlah dari jumlah peringkat yang terletak di sebelah kanan, tetapi lebih sedikit.

Koefisien korelasi sampel Kendall ditulis dengan rumus:

Dimana n adalah ukuran sampel.

Koefisien Kendall memiliki sifat yang sama dengan koefisien Spearman:

Jika ada hubungan langsung yang lengkap antara fitur kualitatif X dan Y dalam arti bahwa peringkat objek bertepatan untuk semua nilai i, maka koefisien korelasi sampel Kendall adalah 1. Memang, di sebelah kanan ada n-1 peringkat lebih besar, oleh karena itu, dengan cara yang sama kita menetapkan, apa. Kemudian. Dan koefisien Kendall adalah:.

Jika ada hubungan terbalik lengkap antara fitur kualitatif X dan Y dalam arti bahwa peringkat sesuai dengan peringkat, maka koefisien korelasi sampel Kendall adalah -1. Di sebelah kanan tidak ada barisan, oleh karena itu besar. Juga. Mengganti nilai R + = 0 dalam rumus koefisien Kendall, kita mendapatkan -1.

Dengan ukuran sampel yang cukup besar dan dengan nilai koefisien korelasi peringkat yang tidak mendekati 1, perkiraan kesetaraan terjadi:

Apakah koefisien Kendall memberikan perkiraan korelasi yang lebih konservatif daripada koefisien Spearman? (nilai numerik? selalu kurang dari). Saat menghitung koefisien? kurang melelahkan daripada menghitung koefisien, yang terakhir lebih mudah untuk menghitung ulang jika istilah baru ditambahkan ke seri.

Keuntungan penting dari koefisien adalah dapat digunakan untuk menentukan koefisien korelasi peringkat parsial, yang memungkinkan untuk menilai tingkat interkoneksi "murni" dari dua fitur peringkat, menghilangkan pengaruh yang ketiga:

Signifikansi koefisien korelasi peringkat. Ketika menentukan kekuatan korelasi peringkat berdasarkan data sampel, perlu untuk mempertimbangkan pertanyaan berikut: dengan tingkat keandalan apa seseorang dapat mengandalkan kesimpulan bahwa ada korelasi dalam populasi umum jika koefisien sampel tertentu dari korelasi peringkat adalah diperoleh. Dengan kata lain, signifikansi korelasi peringkat yang diamati harus diperiksa berdasarkan hipotesis bahwa dua peringkat yang dipertimbangkan secara statistik independen.

Dengan ukuran sampel n yang relatif besar, signifikansi koefisien korelasi peringkat dapat diperiksa menggunakan tabel distribusi normal (Lampiran Tabel 1). Untuk menguji signifikansi koefisien Spearman? (untuk n> 20) hitung nilainya

dan untuk menguji signifikansi koefisien Kendall? (untuk n> 10) hitung nilainya

di mana S = R + - R-, n adalah ukuran sampel.

Selanjutnya, tingkat signifikansi ?ditetapkan, nilai kritis tcr(?,K) ditentukan dari tabel titik-titik kritis distribusi Student dan nilai yang dihitung atau dibandingkan dengannya. Jumlah derajat kebebasan diasumsikan k = n-2. Jika or > tcr, maka nilainya atau dianggap signifikan.

Koefisien korelasi Fechner.

Akhirnya, kita harus menyebutkan koefisien Fechner, yang mencirikan tingkat dasar keketatan koneksi, yang disarankan untuk digunakan untuk menetapkan fakta koneksi ketika ada sejumlah kecil informasi awal. Dasar perhitungannya adalah dengan mempertimbangkan arah penyimpangan dari rata-rata aritmatika varian dari setiap seri variasi dan menentukan konsistensi tanda-tanda penyimpangan ini untuk dua seri, hubungan antara yang diukur.

Koefisien ini ditentukan oleh rumus:

di mana na adalah jumlah kebetulan tanda-tanda penyimpangan nilai individu dari rata-rata aritmatika mereka; nb - masing-masing jumlah ketidakcocokan.

Koefisien Fechner dapat bervariasi antara -1.0<= Кф<= +1,0.

Aspek terapan korelasi peringkat. Seperti yang telah disebutkan, koefisien korelasi peringkat dapat digunakan tidak hanya untuk analisis kualitatif hubungan antara dua fitur peringkat, tetapi juga dalam menentukan kekuatan hubungan antara peringkat dan fitur kuantitatif. Dalam hal ini, nilai-nilai karakteristik kuantitatif diurutkan dan peringkat yang sesuai diberikan padanya.

Ada sejumlah situasi ketika menghitung koefisien korelasi peringkat juga disarankan ketika menentukan kekuatan hubungan antara dua fitur kuantitatif. Jadi, dengan penyimpangan yang signifikan dari distribusi salah satu (atau keduanya) dari distribusi normal, penentuan tingkat signifikansi koefisien korelasi sampel r menjadi salah, sedangkan koefisien peringkat? dan? tidak tunduk pada pembatasan tersebut ketika menentukan tingkat signifikansi.

Situasi lain semacam ini muncul ketika hubungan antara dua fitur kuantitatif adalah nonlinier (tetapi monoton). Jika jumlah objek dalam sampel kecil atau jika tanda hubungan itu penting bagi peneliti, maka digunakan rasio korelasi? mungkin tidak memadai di sini. Perhitungan koefisien korelasi peringkat memungkinkan seseorang untuk mengatasi kesulitan yang ditunjukkan.

Bagian praktis

Tugas 1. Analisis korelasi-regresi

Pernyataan dan formalisasi masalah:

Sampel empiris diberikan, disusun berdasarkan serangkaian pengamatan keadaan peralatan (untuk kegagalan) dan jumlah produk yang diproduksi. Sampel secara implisit mencirikan hubungan antara jumlah peralatan yang gagal dan jumlah item yang diproduksi. Berdasarkan arti dari sampel tersebut, jelas bahwa produk yang diproduksi diproduksi pada peralatan yang tetap dalam pelayanan, karena semakin banyak% peralatan yang gagal, semakin sedikit produk yang diproduksi. Diperlukan studi sampel untuk ketergantungan korelasi-regresi, yaitu, untuk menetapkan bentuk ketergantungan, untuk mengevaluasi fungsi regresi (analisis regresi), serta untuk mengidentifikasi hubungan antara variabel acak dan menilai keketatannya. (analisis korelasi). Tugas tambahan dari analisis korelasi adalah untuk memperkirakan persamaan regresi dari satu variabel ke variabel lainnya. Selain itu, perlu untuk memprediksi jumlah produk yang diproduksi dengan kegagalan peralatan 30%.

Mari kita formalkan sampel yang diberikan dalam tabel, dengan menetapkan data "Kegagalan peralatan,%" sebagai X, data "Jumlah produk" sebagai Y:

Data awal. Tabel 1

Menurut arti fisik dari soal, dapat dilihat bahwa jumlah produk yang diproduksi Y secara langsung tergantung pada% kegagalan peralatan, yaitu ada ketergantungan Y pada X. Saat melakukan analisis regresi, diperlukan menemukan hubungan matematis (regresi) yang menghubungkan nilai-nilai X dan Y. Dalam hal ini, analisis regresi, dalam Berbeda dengan korelasi, diasumsikan bahwa nilai X bertindak sebagai variabel independen, atau faktor, nilai Y - sebagai tergantung padanya, atau tanda yang efektif. Oleh karena itu, diperlukan sintesis model ekonomi dan matematis yang memadai, yaitu tentukan (temukan, pilih) fungsi Y = f (X), yang mencirikan hubungan antara nilai X dan Y, yang dengannya dimungkinkan untuk memprediksi nilai Y pada X = 30. Masalah ini dapat diselesaikan dengan menggunakan analisis korelasi-regresi.

Tinjauan singkat tentang metode untuk memecahkan masalah korelasi-regresi dan alasan untuk metode solusi yang dipilih.

Metode analisis regresi dibagi menjadi satu dan multi-faktor berdasarkan jumlah faktor yang mempengaruhi sifat efektif. Univariat - jumlah faktor independen = 1, mis. Y = F (X)

multifaktorial - jumlah faktor> 1, mis.

Menurut jumlah variabel dependen yang diselidiki (indikator efektif), masalah regresi juga dapat dibagi menjadi tugas dengan satu atau banyak indikator efektif. Secara umum, tugas dengan banyak fitur efektif dapat ditulis:

Metode analisis korelasi-regresi terdiri dalam menemukan parameter dari ketergantungan pendekatan (perkiraan) dari bentuk

Karena hanya satu variabel independen yang muncul dalam masalah di atas, yaitu ketergantungan hanya pada satu faktor yang mempengaruhi hasil diselidiki, studi untuk ketergantungan satu arah, atau regresi berpasangan, harus diterapkan.

Jika hanya ada satu faktor, ketergantungan didefinisikan sebagai:

Bentuk penulisan persamaan regresi tertentu bergantung pada pilihan fungsi yang menampilkan hubungan statistik antara faktor dan indikator efektif dan mencakup hal-hal berikut:

regresi linier, persamaan bentuk,

parabola, persamaan bentuk

kubik, persamaan bentuk

hiperbolik, persamaan bentuk

semilogaritma, persamaan bentuk

eksponensial, persamaan bentuk

kekuasaan-hukum, persamaan bentuk.

Menemukan fungsi direduksi untuk menentukan parameter persamaan regresi dan menilai keandalan persamaan itu sendiri. Untuk menentukan parameter, Anda dapat menggunakan metode kuadrat terkecil dan metode modulus terkecil.

Yang pertama adalah bahwa jumlah kuadrat dari penyimpangan nilai empiris Yi dari yang dihitung berarti Yi minimal.

Metode modulus terkecil terdiri dari meminimalkan jumlah modulus dari perbedaan antara nilai empiris Yi dan rata-rata yang dihitung Yi.

Untuk memecahkan masalah, kami akan memilih metode kuadrat terkecil, karena ini adalah yang paling sederhana dan memberikan perkiraan yang baik dalam hal sifat statistik.

Teknologi pemecahan masalah analisis regresi menggunakan metode kuadrat terkecil.

Dimungkinkan untuk menentukan jenis ketergantungan (linier, kuadrat, kubik, dll.) antara variabel dengan mengevaluasi penyimpangan nilai aktual y dari yang dihitung:

di mana - nilai empiris, - nilai yang dihitung dengan fungsi perkiraan. Menaksir nilai Si untuk berbagai fungsi dan memilih yang terkecil, kami memilih fungsi aproksimasi.

Jenis fungsi ditentukan dengan mencari koefisien yang ditemukan untuk setiap fungsi sebagai solusi untuk sistem persamaan tertentu:

regresi linier, persamaan bentuk, sistem -

parabola, persamaan bentuk, sistem -

kubik, persamaan bentuk, sistem -

Setelah memecahkan sistem, kami menemukan, dengan bantuan yang kami sampai pada ekspresi spesifik dari fungsi analitik, yang mana, kami menemukan nilai yang dihitung. Selanjutnya, ada semua data untuk menemukan perkiraan nilai deviasi S dan menganalisis minimum.

Untuk hubungan linier, kami memperkirakan kedekatan hubungan antara faktor X dan indikator efektif Y dalam bentuk koefisien korelasi r:

Nilai rata-rata indikator;

Nilai faktor rata-rata;

y adalah nilai eksperimen indikator;

x adalah nilai eksperimen faktor;

Standar deviasi dalam x;

Standar deviasi di y.

Jika koefisien korelasi r = 0, maka diyakini hubungan antar fitur tidak signifikan atau tidak ada, jika r = 1, maka terdapat hubungan fungsional yang sangat tinggi antar fitur.

Dengan menggunakan tabel Chaddock, Anda dapat secara kualitatif menilai keketatan korelasi antara tanda-tanda:

Tabel Chaddock Tabel 2.

Untuk ketergantungan nonlinier, rasio korelasi (0 1) dan indeks korelasi R ditentukan, yang dihitung dari ketergantungan berikut.

dimana nilai adalah nilai indikator yang dihitung dengan regresi ketergantungan.

Sebagai perkiraan akurasi perhitungan, kami menggunakan nilai kesalahan perkiraan relatif rata-rata

Dengan akurasi yang tinggi, terletak pada kisaran 0-12%.

Untuk menilai pemilihan ketergantungan fungsional, kami menggunakan koefisien determinasi

Koefisien determinasi digunakan sebagai ukuran "umum" dari kualitas pemilihan model fungsional, karena menyatakan rasio antara varians faktorial dan total, atau lebih tepatnya bagian dari varians faktorial dalam total.

Untuk menilai signifikansi indeks korelasi R, digunakan uji F Fisher. Nilai aktual dari kriteria ditentukan oleh rumus:

di mana m adalah jumlah parameter persamaan regresi, n adalah jumlah pengamatan. Nilai tersebut dibandingkan dengan nilai kritis, yang ditentukan menurut tabel kriteria-F, dengan mempertimbangkan tingkat signifikansi yang diterima dan jumlah derajat kebebasan dan. Jika, maka nilai indeks korelasi R dianggap signifikan.

Untuk bentuk regresi yang dipilih, koefisien persamaan regresi dihitung. Untuk memudahkan, hasil perhitungan dimasukkan dalam tabel struktur berikut (secara umum, jumlah kolom dan tampilannya berubah tergantung pada jenis regresi):

Tabel 3

Solusi dari masalah.

Pengamatan dilakukan terhadap fenomena ekonomi - ketergantungan pelepasan produk pada persentase kegagalan peralatan. Satu set nilai diperoleh.

Nilai yang dipilih dijelaskan pada tabel 1.

Kami membangun grafik ketergantungan empiris untuk sampel yang diberikan (Gbr. 1)

Berdasarkan jenis grafik, kami menentukan bahwa ketergantungan analitik dapat direpresentasikan sebagai fungsi linier:

Mari kita hitung koefisien korelasi berpasangan untuk menilai hubungan antara X dan Y:

Mari kita buat tabel bantu:

Tabel 4

Kami memecahkan sistem persamaan untuk menemukan koefisien dan:

dari persamaan pertama, substitusikan nilai

ke persamaan kedua, kita mendapatkan:

Kami menemukan

Kami mendapatkan bentuk persamaan regresi:

9. Untuk menilai keketatan hubungan yang ditemukan, kami menggunakan koefisien korelasi r:

Menurut tabel Chaddock, kami menetapkan bahwa untuk r = 0,90 hubungan antara X dan Y sangat tinggi, oleh karena itu, keandalan persamaan regresi juga tinggi. Untuk memperkirakan keakuratan perhitungan, kami menggunakan nilai kesalahan relatif rata-rata dari pendekatan:

Kami percaya bahwa nilai tersebut memberikan tingkat keandalan yang tinggi dari persamaan regresi.

Untuk hubungan linier antara X dan Y, indeks determinasi sama dengan kuadrat dari koefisien korelasi r :. Akibatnya, 81% dari total variasi dijelaskan oleh perubahan karakteristik faktor X.

Untuk menilai signifikansi indeks korelasi R, yang dalam hal hubungan linier sama nilai absolutnya dengan koefisien korelasi r, digunakan uji F Fisher. Kami menentukan nilai sebenarnya menggunakan rumus:

di mana m adalah jumlah parameter persamaan regresi, n adalah jumlah pengamatan. Artinya, n = 5, m = 2.

Dengan mempertimbangkan tingkat signifikansi yang diterima = 0,05 dan jumlah derajat kebebasan, kami memperoleh nilai tabular kritis. Karena, nilai indeks korelasi R diakui signifikan.

Mari kita hitung nilai prediksi Y pada X = 30:

Mari kita buat grafik dari fungsi yang ditemukan:

11. Tentukan kesalahan koefisien korelasi dengan nilai standar deviasi

dan kemudian kami menentukan nilai deviasi yang dinormalisasi

Dari rasio > 2 dengan probabilitas 95%, kita dapat berbicara tentang signifikansi dari koefisien korelasi yang diperoleh.

Soal 2. Optimasi linier

Pilihan 1.

Rencana pengembangan kawasan itu diharapkan bisa mengoperasikan 3 lapangan minyak dengan total volume produksi 9 juta ton. Di lapangan pertama, volume produksi setidaknya 1 juta ton, di lapangan kedua - 3 juta ton, di lapangan ketiga - 5 juta ton. Untuk mencapai produktivitas tersebut, diperlukan pemboran minimal 125 sumur. Untuk implementasi rencana ini, 25 juta rubel telah dialokasikan. penanaman modal (indikator K) dan pipa sepanjang 80 km (indikator L).

Diperlukan penentuan jumlah sumur yang optimal (maksimum) untuk menjamin produktivitas yang direncanakan dari masing-masing lapangan. Data awal tentang tugas diberikan dalam tabel.

Data awal

Rumusan masalah diberikan di atas.

Mari kita memformalkan kondisi dan kendala yang ditentukan dalam masalah. Tujuan dari pemecahan masalah optimasi ini adalah untuk mencari nilai produksi minyak maksimum dengan jumlah sumur yang optimal untuk setiap lapangan, dengan memperhatikan kendala-kendala yang ada pada masalah tersebut.

Fungsi tujuan, sesuai dengan persyaratan tugas, akan berbentuk:

di mana adalah jumlah sumur untuk setiap bidang.

Pembatasan yang ada pada tugas untuk:

panjang peletakan pipa:

jumlah sumur di setiap bidang:

biaya konstruksi 1 sumur:

Masalah optimasi linier diselesaikan, misalnya, dengan metode berikut:

Secara grafis

Metode simpleks

Menggunakan metode grafis hanya nyaman ketika memecahkan masalah optimasi linier dengan dua variabel. Dengan jumlah variabel yang lebih banyak, penggunaan alat aljabar diperlukan. Pertimbangkan metode umum untuk memecahkan masalah optimasi linier yang disebut metode simpleks.

Metode simpleks adalah contoh khas dari perhitungan iteratif yang digunakan untuk menyelesaikan sebagian besar masalah optimasi. Prosedur iteratif semacam ini dipertimbangkan, yang memastikan solusi masalah dengan bantuan model riset operasi.

Untuk menyelesaikan masalah optimasi menggunakan metode simpleks, jumlah yang tidak diketahui Xi harus lebih besar dari jumlah persamaan, yaitu. sistem persamaan

memenuhi relasi m

A = sama dengan m.

Mari kita nyatakan kolom matriks A sebagai, dan kolom istilah bebas sebagai

Solusi dasar untuk sistem (1) adalah himpunan m yang tidak diketahui yang merupakan solusi untuk sistem (1).

Secara singkat, algoritma metode simpleks dijelaskan sebagai berikut:

Batasan asli ditulis sebagai pertidaksamaan seperti<= (=>) dapat direpresentasikan sebagai kesetaraan dengan menambahkan variabel residual ke sisi kiri kendala (mengurangi variabel redundan dari sisi kiri).

Misalnya, di sebelah kiri kendala asli

variabel residual diperkenalkan, sebagai akibatnya ketidaksetaraan asli berubah menjadi persamaan

Jika batasan asli menentukan laju aliran pipa, maka variabel harus ditafsirkan sebagai sisa, atau bagian yang tidak digunakan dari sumber daya ini.

Memaksimalkan fungsi tujuan sama dengan meminimalkan fungsi yang sama, diambil dengan tanda yang berlawanan. Artinya, dalam kasus kami

setara dengan

Tabel simpleks dikompilasi untuk solusi dasar dari bentuk berikut:

Dalam tabel ini, ditunjukkan bahwa setelah menyelesaikan masalah di sel-sel ini akan ada solusi dasar. - hasil bagi dari membagi kolom dengan salah satu kolom; - pengganda tambahan untuk memusatkan nilai dalam sel tabel yang terkait dengan kolom penyelesaian. - nilai min dari fungsi tujuan -Z, - nilai koefisien dalam fungsi tujuan dengan tidak diketahui.

Setiap nilai positif ditemukan di antara makna. Jika ini tidak terjadi, maka masalah dianggap selesai. Setiap kolom tabel yang ada di dalamnya dipilih, kolom ini disebut kolom "permisif". Jika tidak ada bilangan positif di antara elemen-elemen kolom penyelesaian, maka masalahnya tidak dapat diselesaikan karena tidak terbatasnya fungsi tujuan pada himpunan penyelesaiannya. Jika ada angka positif di kolom penyelesaian, lanjutkan ke langkah 5.

Kolom diisi dengan pecahan, di mana pembilangnya merupakan elemen kolom, dan di penyebut - elemen yang sesuai dari kolom penyelesaian. Yang terkecil dari semua nilai dipilih. Garis dengan hasil terkecil disebut garis "aktifkan". Di persimpangan garis penyelesaian dan kolom penyelesaian, elemen penyelesaian ditemukan, yang disorot dalam beberapa cara, misalnya, dengan warna.

Berdasarkan tabel simpleks pertama, berikut ini dikompilasi, di mana:

Mengganti vektor baris dengan vektor kolom

garis permisif diganti dengan garis yang sama dibagi dengan elemen permisif

masing-masing baris lain dari tabel diganti dengan jumlah baris ini dengan yang menyelesaikan, dikalikan dengan faktor tambahan yang dipilih secara khusus untuk mendapatkan 0 di sel kolom penyelesaian.

Dengan tabel baru, kita beralih ke poin 4.

Solusi dari masalah.

Berdasarkan rumusan masalah, kami memiliki sistem pertidaksamaan berikut:

dan fungsi tujuan

Kami mengubah sistem pertidaksamaan menjadi sistem persamaan dengan memasukkan variabel tambahan:

Mari kita kurangi fungsi tujuan menjadi ekuivalennya:

Mari kita buat tabel simpleks asli:

Mari kita pilih kolom permisif. Mari kita hitung kolomnya:

Kami memasukkan nilai ke dalam tabel. Untuk yang terkecil dari mereka = 10, kami menentukan garis penyelesaian :. Di persimpangan garis penyelesaian dan kolom penyelesaian, kami menemukan elemen penyelesaian = 1. Kami mengisi bagian tabel dengan faktor tambahan, sehingga: baris penyelesaian dikalikan dengan mereka, ditambahkan ke baris tabel lainnya, membentuk 0 dalam elemen-elemen kolom penyelesaian.

Kami membuat tabel simpleks kedua:

Kami mengambil kolom penyelesaian di dalamnya, menghitung nilainya, memasukkannya ke dalam tabel. Dengan minimum, kami mendapatkan garis penyelesaian. Elemen penyelesaiannya adalah 1. Temukan faktor tambahan, isi kolom.

Kami membuat tabel simpleks berikut:

Demikian pula, kami menemukan kolom penyelesaian, baris penyelesaian dan elemen penyelesaian = 2. Kami membangun tabel simpleks berikut:

Karena tidak ada nilai positif pada garis -Z, tabel ini terbatas. Kolom pertama memberikan nilai yang diinginkan dari yang tidak diketahui, mis. solusi dasar optimal:

Dalam hal ini, nilai fungsi tujuan adalah -Z = -8000, yang setara dengan Zmax = 8000. Masalah terpecahkan.

Tugas 3. Analisis klaster

Rumusan masalah:

Pisahkan objek berdasarkan data yang diberikan dalam tabel. Pemilihan metode solusi dilakukan secara mandiri, untuk membangun grafik ketergantungan data.

Pilihan 1.

Data awal

Tinjau metode untuk memecahkan masalah jenis ini. Justifikasi metode solusi.

Tugas analisis cluster diselesaikan dengan menggunakan metode berikut:

Metode union atau tree clustering digunakan untuk membentuk cluster “ketidaksamaan” atau “jarak antar objek”. Jarak ini dapat didefinisikan dalam ruang satu dimensi atau multi dimensi.

Penggabungan dua arah digunakan (relatif jarang) dalam keadaan di mana data ditafsirkan bukan dalam istilah "objek" dan "sifat objek", tetapi dalam hal pengamatan dan variabel. Pengamatan dan variabel keduanya diharapkan berkontribusi pada deteksi cluster yang bermakna pada saat yang bersamaan.

metode K-means. Digunakan bila sudah ada hipotesis mengenai jumlah cluster. Anda dapat memberi tahu sistem untuk membentuk dengan tepat, misalnya, tiga cluster sehingga mereka seberbeda mungkin. Secara umum, metode K-means membangun tepat K cluster berbeda yang terletak pada jarak terbesar yang mungkin satu sama lain.

Ada cara-cara berikut untuk mengukur jarak:

Jarak Euclidean. Ini adalah jenis jarak yang paling umum. Ini hanyalah jarak geometris dalam ruang multidimensi dan dihitung sebagai berikut:

Perhatikan bahwa jarak Euclidean (dan kuadratnya) dihitung dari data asli, bukan data standar.

Jarak blok kota (jarak Manhattan). Jarak ini hanyalah rata-rata dari perbedaan koordinat. Dalam kebanyakan kasus, ukuran jarak ini menghasilkan hasil yang sama seperti jarak Euclidean biasa. Namun, perhatikan bahwa untuk ukuran ini pengaruh perbedaan besar individu (pencilan) berkurang (karena tidak dikuadratkan). Jarak Manhattan dihitung menggunakan rumus:

Jarak Chebyshev. Jarak ini dapat berguna ketika Anda ingin mendefinisikan dua objek sebagai "berbeda" jika mereka berbeda dalam satu koordinat (satu dimensi mana pun). Jarak Chebyshev dihitung dengan rumus:

Jarak kekuasaan. Terkadang seseorang ingin menambah atau mengurangi berat secara progresif terkait dengan dimensi di mana objek terkait sangat berbeda. Hal ini dapat dicapai dengan menggunakan jarak kekuasaan hukum. Jarak kekuasaan-hukum dihitung dengan rumus:

di mana r dan p adalah parameter yang ditentukan pengguna. Beberapa contoh perhitungan dapat menunjukkan bagaimana ukuran ini "bekerja". Parameter p bertanggung jawab atas pembobotan bertahap dari perbedaan koordinat individu, parameter r bertanggung jawab atas pembobotan progresif jarak besar antar objek. Jika kedua parameter - r dan p, sama dengan dua, maka jarak ini bertepatan dengan jarak Euclidean.

Persentase ketidaksetujuan. Ukuran ini digunakan ketika data bersifat kategoris. Jarak ini dihitung dengan rumus:

Untuk mengatasi masalah tersebut, kita akan memilih metode unifikasi (tree-like clustering) sebagai salah satu yang paling sesuai dengan kondisi dan rumusan masalah (untuk membagi objek). Pada gilirannya, metode penyatuan dapat menggunakan beberapa varian aturan komunikasi:

Tautan tunggal (metode tetangga terdekat). Pada metode ini, jarak antara dua cluster ditentukan oleh jarak antara dua objek terdekat (nearest neighbor) pada cluster yang berbeda. Artinya, setiap dua objek dalam dua cluster lebih dekat satu sama lain daripada jarak tautan yang sesuai. Aturan ini seharusnya, dalam arti tertentu, merangkai objek bersama-sama untuk membentuk kelompok, dan kelompok yang dihasilkan cenderung menjadi "rantai" yang panjang.

Komunikasi penuh (metode tetangga paling jauh). Dalam metode ini, jarak antar cluster ditentukan oleh jarak terbesar antara dua fitur dalam cluster yang berbeda (yaitu, "tetangga terjauh").

Ada juga banyak metode pengelompokan lain seperti ini (misalnya, unweighted pairing, weighted pairing, dll.).

Teknologi metode solusi. Perhitungan indikator.

Pada langkah pertama, ketika setiap objek adalah cluster yang terpisah, jarak antara objek-objek ini ditentukan oleh ukuran yang dipilih.

Karena tugas tidak menentukan satuan ukuran untuk karakteristik, diasumsikan bahwa mereka adalah sama. Oleh karena itu, data awal tidak perlu dinormalisasi, maka langsung saja kita lanjutkan ke perhitungan matriks jarak.

Solusi dari masalah.

Mari kita buat grafik ketergantungan sesuai dengan data awal (Gbr. 2)

Kita akan mengambil jarak Euclidean biasa sebagai jarak antar objek. Kemudian menurut rumus:

di mana l - tanda; k adalah jumlah fitur, jarak antara objek 1 dan 2 sama dengan:

Kami terus menghitung jarak yang tersisa:

Mari kita buat tabel dari nilai yang diperoleh:

Jarak terkecil. Artinya kita menggabungkan elemen 3, 6 dan 5 menjadi satu cluster. Kami mendapatkan tabel berikut:

Jarak terkecil. Elemen 3, 6, 5 dan 4 digabungkan menjadi satu cluster, kita mendapatkan tabel dua cluster:

Jarak minimum antara item 3 dan 6 adalah. Artinya elemen 3 dan 6 digabungkan menjadi satu cluster. Kami memilih jarak maksimum antara cluster yang baru terbentuk dan elemen lainnya. Misalnya jarak antara cluster 1 dan cluster 3.6 adalah max (13.34166, 13.60147) = 13.34166. Mari kita buat tabel berikut:

Di dalamnya, jarak minimum adalah jarak antara cluster 1 dan 2. Menggabungkan 1 dan 2 menjadi satu cluster, kita mendapatkan:

Dengan demikian, dengan menggunakan metode "tetangga jauh", diperoleh dua cluster: 1,2 dan 3,4,5,6, jarak antara 13,60147.

Masalahnya sudah diatasi.

Aplikasi. Memecahkan masalah menggunakan paket perangkat lunak (MS Excel 7.0)

Masalah analisis korelasi dan regresi.

Kami memasukkan data awal ke dalam tabel (Gbr. 1)

Pilih menu “Layanan/Analisis Data”. Di jendela yang muncul, pilih baris "Regresi" (Gbr. 2).

Mari kita atur di jendela berikutnya interval input untuk X dan Y, tingkat keandalan akan menjadi 95%, dan data output akan ditempatkan pada lembar terpisah "Lembar Laporan" (Gbr. 3)

Setelah melakukan perhitungan, kami memperoleh data akhir dari analisis regresi pada lembar "Laporan":

Ini juga menampilkan plot titik dari fungsi perkiraan, atau "Grafik Seleksi":


Nilai dan deviasi yang dihitung masing-masing ditampilkan dalam tabel di kolom “Prediksi Y” dan “Saldo”.

Berdasarkan data awal dan penyimpangan, grafik residual diplot:

Tugas pengoptimalan


Kami memasukkan data awal sebagai berikut:

X1, X2, X3 yang tidak diketahui yang tidak diketahui dimasukkan ke dalam sel C9, D9, E9, masing-masing.

Koefisien fungsi tujuan untuk X1, X2, X3 masing-masing dimasukkan ke dalam C7, D7, E7.

Masukkan fungsi tujuan ke dalam sel B11 sebagai rumus: = C7 * C9 + D7 * D9 + E7 * E9.

Pembatasan tugas yang ada

Untuk panjang peletakan pipa:

kita tambahkan ke sel C5, D5, E5, F5, G5

Jumlah sumur di setiap lapangan:

X3 100; kita tambahkan ke sel C8, D8, E8.

Biaya pembangunan 1 sumur:

kita tambahkan ke sel C6, D6, E6, F6, G6.

Rumus untuk menghitung panjang total C5 * C9 + D5 * D9 + E5 * E9 ditempatkan di sel B5, rumus untuk menghitung total biaya C6 * C9 + D6 * D9 + E6 * E9 ditempatkan di sel B6.


Kami memilih di menu "Layanan / Pencarian solusi", kami memasukkan parameter untuk menemukan solusi sesuai dengan data awal (Gbr. 4):

Dengan menggunakan tombol "Parameter", atur parameter berikut untuk menemukan solusi (Gbr. 5):


Setelah mencari solusi, kami mendapatkan laporan hasil:

Laporan Hasil Microsoft Excel 8.0e

Laporan Dibuat: 17/11/2002 1:28:30

Sel Target (Maksimum)

Hasil

Total rampasan

Sel yang dapat dimodifikasi

Hasil

Jumlah sumur

Jumlah sumur

Jumlah sumur

Pembatasan

Arti

Panjang

Terkait

Biaya proyek

tidak berhubungan.

Jumlah sumur

tidak berhubungan.

Jumlah sumur

Terkait

Jumlah sumur

Terkait

Tabel pertama menunjukkan nilai awal dan akhir (optimal) dari sel target, di mana fungsi tujuan dari masalah yang sedang dipecahkan ditempatkan. Pada tabel kedua kita melihat nilai awal dan akhir dari variabel yang akan dioptimalkan, yang terkandung dalam sel yang dimodifikasi. Tabel ketiga dalam laporan hasil berisi informasi tentang kendala. Kolom "Nilai" berisi nilai optimal dari sumber daya yang diperlukan dan variabel yang akan dioptimalkan. Kolom "Formula" berisi batasan sumber daya yang dikonsumsi dan variabel yang akan dioptimalkan, ditulis dalam bentuk referensi ke sel yang berisi data ini. Kolom "Negara" menentukan apakah batasan ini atau itu terkait atau tidak terkait. Di sini "terikat" adalah kendala yang diterapkan dalam solusi optimal dalam bentuk persamaan yang kaku. Kolom "Perbedaan" untuk batasan sumber daya menentukan sisa sumber daya yang digunakan, mis. perbedaan antara jumlah sumber daya yang dibutuhkan dan ketersediaannya.

Demikian pula, setelah menuliskan hasil pencarian solusi dalam formulir "Laporan Keberlanjutan", kami akan menerima tabel berikut:

Laporan Ketahanan Microsoft Excel 8.0e

Lembar Kerja: [Solusi dari masalah optimasi.xls] Solusi dari masalah optimasi

Laporan Dibuat: 17/11/2002 1:35:16

Sel yang dapat dimodifikasi

Diizinkan

Diizinkan

arti

harga

Koefisien

Meningkatkan

Mengurangi

Jumlah sumur

Jumlah sumur

Jumlah sumur

Pembatasan

Keterbatasan

Diizinkan

Diizinkan

arti

Bagian kanan

Meningkatkan

Mengurangi

Panjang

Biaya proyek

Laporan keberlanjutan berisi informasi tentang variabel yang dapat dimodifikasi (dioptimalkan) dan batasan model. Informasi ini terkait dengan metode simpleks yang digunakan dalam optimasi masalah linier, yang dijelaskan di atas dalam hal pemecahan masalah. Ini memungkinkan Anda untuk memperkirakan seberapa sensitif solusi optimal yang diperoleh terhadap kemungkinan perubahan dalam parameter model.

Bagian pertama laporan berisi informasi tentang sel yang dimodifikasi yang berisi nilai tentang jumlah sumur di bidang. Kolom "Nilai yang dihasilkan" menunjukkan nilai optimal dari variabel yang akan dioptimalkan. Kolom "Koefisien target" berisi data awal nilai koefisien fungsi tujuan. Dua kolom berikutnya menggambarkan kenaikan dan penurunan yang diijinkan dari koefisien-koefisien ini tanpa mengubah solusi optimal yang ditemukan.

Bagian kedua dari laporan keberlanjutan berisi informasi tentang kendala yang dikenakan pada variabel yang dioptimalkan. Kolom pertama menunjukkan kebutuhan sumber daya untuk solusi optimal. Yang kedua berisi nilai-nilai harga bayangan untuk jenis sumber daya yang digunakan. Dua kolom terakhir berisi data tentang kemungkinan peningkatan atau penurunan jumlah sumber daya yang tersedia.

Masalah pengelompokan.

Metode langkah-demi-langkah untuk memecahkan masalah diberikan di atas. Berikut adalah tabel Excel yang menggambarkan kemajuan penyelesaian masalah:

Metode tetangga terdekat

Memecahkan masalah analisis cluster - "METODE TETANGGA TERDEKAT"

Data awal

di mana x1 adalah volume produk;

2 - biaya tahunan rata-rata utama

Aset produksi industri

Metode tetangga jauh

Solusi masalah analisis cluster - "METODE DISTANCE NEIGHBOR"

Data awal

di mana x1 adalah volume produk;

2 - biaya tahunan rata-rata utama

Aset produksi industri

Pengajuan dan pra-pemrosesan penilaian ahli

Dalam praktiknya, beberapa jenis penilaian digunakan:

- berkualitas tinggi (sering-jarang, lebih buruk-lebih baik, ya-tidak),

- perkiraan skala (rentang nilai 50-75, 76-90, 91-120, dll.),

Skor dari interval tertentu (dari 2 hingga 5, 1 -10), saling independen,

Peringkat (objek disusun oleh seorang ahli dalam urutan tertentu, dan masing-masing diberi nomor seri - pangkat),

Komparatif, diperoleh dengan salah satu metode perbandingan

metode perbandingan berurutan

metode perbandingan berpasangan faktor.

Pada langkah selanjutnya dalam memproses pendapat ahli, perlu dilakukan evaluasi tingkat konsistensi pendapat tersebut.

Perkiraan yang diperoleh dari para ahli dapat dianggap sebagai variabel acak, yang distribusinya mencerminkan pendapat para ahli tentang probabilitas pilihan tertentu dari suatu peristiwa (faktor). Oleh karena itu, untuk menganalisis penyebaran dan konsistensi perkiraan ahli, karakteristik statistik umum digunakan - rata-rata dan ukuran pencar:

Kesalahan kuadrat rata-rata,

Rentang variasi min - maks,

- koefisien variasi V = mean kuadrat deviasi / mean aritma. (cocok untuk semua jenis penilaian)

V i = i / x i rata-rata

Untuk tarif langkah-langkah kesamaan tapi opini setiap pasangan ahli berbagai metode dapat digunakan:

koefisien asosiasi, dengan bantuan yang memperhitungkan jumlah jawaban yang cocok dan tidak cocok,

koefisien inkonsistensi pendapat ahli,

Semua ukuran ini dapat digunakan baik untuk membandingkan pendapat dua ahli, atau untuk menganalisis hubungan antara serangkaian penilaian dengan dua alasan.

Koefisien korelasi peringkat pasangan Spearman:

di mana n adalah jumlah ahli,

c k - perbedaan antara estimasi ahli ke-i dan ke-j untuk semua faktor T

Koefisien korelasi peringkat Kendall (koefisien konkordansi) memberikan penilaian keseluruhan atas konsistensi pendapat semua ahli pada semua faktor, tetapi hanya untuk kasus di mana perkiraan peringkat digunakan.

Terbukti bahwa nilai S, ketika semua ahli memberikan estimasi yang sama untuk semua faktor, memiliki nilai maksimum yang sama dengan

di mana n adalah jumlah faktor,

m adalah jumlah ahli.

Koefisien konkordansi sama dengan rasio

apalagi, jika W mendekati 1, maka semua ahli telah memberikan perkiraan yang cukup konsisten, jika tidak, pendapat mereka tidak akan disetujui.

Rumus untuk menghitung S ditunjukkan di bawah ini:

di mana r ij adalah estimasi peringkat faktor ke-i oleh pakar ke-j,

r cf adalah peringkat rata-rata di seluruh matriks estimasi dan sama dengan

Dan karena itu rumus untuk menghitung S dapat berbentuk:

Jika penilaian individu dari satu ahli bertepatan, dan mereka dibuat standar selama pemrosesan, maka rumus yang berbeda digunakan untuk menghitung koefisien konkordansi:



dimana Tj dihitung untuk setiap ahli (dalam hal penilaiannya diulang untuk objek yang berbeda), dengan memperhatikan pengulangan menurut aturan berikut:

di mana t j adalah jumlah kelompok dengan peringkat yang sama untuk ahli ke-j, dan

h k - jumlah peringkat yang sama dalam grup ke-k dari peringkat terkait dari pakar ke-j.

CONTOH. Biarkan 5 ahli pada enam faktor menjawab dalam peringkat seperti yang ditunjukkan pada Tabel 3:

Tabel 3 - Jawaban para ahli

Pakar 1 2 O3 4 O5 O6 Jumlah peringkat menurut ahli
E1
E2
E3
E4
E5

Karena fakta bahwa tidak diperoleh peringkat yang ketat (penilaian dari para ahli diulang, dan jumlah peringkat tidak sama), kami akan mengubah perkiraan dan mendapatkan peringkat terkait (Tabel 4):

Tabel 4 - Peringkat terkait penilaian ahli

Pakar 1 2 O3 4 O5 O6 Jumlah peringkat menurut ahli
E1 2,5 2,5
E2
E3 1,5 1,5 4,5 4,5
E4 2,5 2,5 4,5 4,5
E5 5,5 5,5
Jumlah pangkat objek 7,5 9,5 23,5 29,5

Sekarang mari kita tentukan derajat konsistensi pendapat ahli dengan menggunakan koefisien konkordansi. Karena peringkat terkait, kami akan menghitung W dengan rumus (**).

Maka r cf = 7 * 5/2 = 17,5

S = 10 2 +8 2 +4.5 2 +4.5 2 +6 2 +12 2 = 384,5

Mari kita lanjutkan ke perhitungan W. Untuk ini, kami menghitung secara terpisah nilai T j. Dalam contoh, penilaian dipilih secara khusus sehingga setiap ahli memiliki penilaian berulang: yang pertama memiliki dua, yang kedua memiliki tiga, yang ketiga memiliki dua kelompok dengan dua peringkat, dan yang keempat memiliki dua peringkat yang identik. Karenanya:

T 1 = 2 3 - 2 = 6 T 5 = 6

T2 = 3 3 - 3 = 24

3 = 2 3 –2+ 2 3 –2 = 12 4 = 12

Kami melihat bahwa persetujuan pendapat para ahli cukup tinggi dan kami dapat melanjutkan ke tahap studi berikutnya - pembuktian dan adopsi alternatif keputusan yang direkomendasikan oleh para ahli.

Jika tidak, Anda harus kembali ke langkah 4-8.

KOEFISIEN KORELASI PERINGKAT KENDALLA

Salah satu ukuran sampel ketergantungan dua variabel acak (fitur) X dan Y, berdasarkan peringkat item sampel (X 1, Y x), .. ., (X n, Y n). K. sampai. R. untuk merujuk, oleh karena itu, untuk peringkat ahli statistik dan ditentukan oleh rumus

di mana r saya- U milik pasangan itu ( X, Y), untuk segerombolan Xraven i, S = 2N- (n-1) / 2, N adalah jumlah elemen sampel, yang secara bersamaan j> i dan r j> r i... Selalu Sebagai ukuran selektif ketergantungan To. To. R. to digunakan secara luas oleh M. Kendall (M. Kendall, lihat).

K. sampai. R. K. digunakan untuk menguji hipotesis independensi variabel acak. Jika hipotesis independensi benar, maka E t = 0 dan D t = 2 (2n + 5) / 9n (n-1). Dengan ukuran sampel yang kecil, pemeriksaannya bersifat statistik. hipotesis independensi dibuat dengan menggunakan tabel khusus (lihat). Untuk n> 10, pendekatan normal digunakan untuk distribusi m: jika

maka hipotesis independensi ditolak, jika tidak maka diterima. Di sini a . - tingkat signifikansi, u a / 2 adalah titik persentase dari distribusi normal. K. sampai. R. Karena, seperti yang lainnya, dapat digunakan untuk mendeteksi ketergantungan dua fitur kualitatif, jika hanya elemen sampel yang dapat dipesan sehubungan dengan fitur ini. Jika X, Y memiliki joint normal dengan koefisien korelasi p, maka hubungan antara K. to.p. ke.dan berbentuk:

Lihat juga Korelasi peringkat Spearman, Tes peringkat.

Lit.: Kendal M., Korelasi peringkat, trans. dari bahasa Inggris., M., 1975; Van der Waerden B.L., Matematika, trans. dari itu., M., 1960; Bol'shev L.N., Smirnov N.V., Tabel statistik matematika, Moskow, 1965.

A.V.Prokhorov.


Ensiklopedia Matematika. - M.: ensiklopedia Soviet... I.M.Vinogradov. 1977-1985.

Lihat apa itu "KENDALLA RANK CORRELATION COEFFICIENT" di kamus lain:

    Bahasa Inggris. efisien, korelasi peringkat Kendall; Jerman Kendalls Rangkorrelationskoeffizient. Koefisien korelasi, yang menentukan derajat korespondensi urutan semua pasangan objek dalam dua variabel. Antinazi. Ensiklopedia Sosiologi, 2009 ... Ensiklopedia Sosiologi

    KOEFISIEN KORELASI PERINGKAT KENDALL- Bahasa Inggris. efisien, korelasi peringkat Kendall; Jerman Kendalls Rangkorrelationskoeffizient. Koefisien korelasi, yang menentukan derajat korespondensi urutan semua pasangan objek dalam dua variabel ... Kamus Penjelasan Sosiologi

    Ukuran ketergantungan dua variabel acak (fitur) X dan Y, berdasarkan pemeringkatan hasil observasi independen (X1, Y1),. ... ., (Xn, Yn). Jika barisan nilai-nilai X terletak pada orde natural i = 1,. ... ., n, dan Ri pangkat Y yang sesuai dengan ... ... Ensiklopedia matematika

    Koefisien korelasi- (Koefisien korelasi) Koefisien korelasi adalah indikator statistik ketergantungan dua variabel acak Penentuan koefisien korelasi, jenis koefisien korelasi, sifat-sifat koefisien korelasi, perhitungan dan penerapan ... ... ensiklopedia investor

    Hubungan antara variabel acak, yang, secara umum, tidak sepenuhnya fungsional. Tidak seperti ketergantungan fungsional, K., sebagai suatu peraturan, dianggap ketika salah satu kuantitas tidak hanya bergantung pada yang lain ini, tetapi juga ... ... Ensiklopedia matematika

    Korelasi (ketergantungan korelasi) adalah hubungan statistik dari dua atau lebih variabel acak (atau kuantitas yang dapat dianggap demikian dengan tingkat akurasi yang dapat diterima). Dalam hal ini, perubahan nilai satu atau ... ... Wikipedia

    Korelasi- (Korelasi) Korelasi adalah hubungan statistik dari dua atau lebih variabel acak Konsep korelasi, jenis korelasi, koefisien korelasi, analisis korelasi, korelasi harga, korelasi pasangan mata uang pada Isi Forex ... ... ensiklopedia investor

    Secara umum diterima bahwa awal S. m. Century. atau, seperti yang sering disebut, statistik "n kecil", dimasukkan ke dalam dekade pertama abad XX oleh publikasi karya W. Gosset, di mana ia menempatkan distribusi t, didalilkan oleh mereka yang menerima dunia beberapa saat kemudian ... ... Ensiklopedia psikologi

    Maurice Kendall Sir Maurice George Kendall Tanggal lahir: 6 September 1907 (1907 09 06) Tempat lahir: Kettering, Inggris Tanggal kematian ... Wikipedia

    Ramalan cuaca- (Forecast) Pengertian prakiraan, tugas dan prinsip peramalan Pengertian prakiraan, tugas dan prinsip peramalan, metode peramalan Daftar Isi Isi Pengertian Konsep dasar peramalan Tugas dan prinsip peramalan ... ... ensiklopedia investor