Metode pemrosesan data analitik untuk pendukung keputusan. Pemrosesan data analitik online (OLAP)

3.4 Metode pengolahan data analitis

Agar gudang data yang ada memfasilitasi adopsi keputusan manajemen, informasi harus disajikan kepada analis dalam bentuk yang diperlukan, yaitu, ia harus mengembangkan alat untuk mengakses dan memproses data di gudang.

Sangat sering, sistem informasi dan analitis yang dibuat dengan harapan penggunaan langsung oleh pengambil keputusan sangat mudah digunakan, tetapi fungsinya sangat terbatas. Sistem statis seperti itu disebut Sistem Informasi Eksekutif (EIS). Mereka berisi banyak pertanyaan dan, karena cukup untuk tinjauan sehari-hari, tidak dapat menjawab semua pertanyaan yang mungkin muncul saat membuat keputusan. Hasil kerja sistem seperti itu, sebagai suatu peraturan, adalah laporan multi-halaman, setelah mempelajari dengan cermat, di mana analis memiliki serangkaian pertanyaan baru. Namun, setiap permintaan baru yang tidak diramalkan dalam desain sistem seperti itu pertama-tama harus dijelaskan secara formal, dikodekan oleh pemrogram, dan baru kemudian dieksekusi. Waktu tunggu dalam hal ini bisa berjam-jam dan berhari-hari, yang tidak selalu dapat diterima.

Pemrosesan analitik online... Atau On-Line Analytical Processing, OLAP adalah komponen kunci dari organisasi pergudangan data. Konsep OLAP dijelaskan pada tahun 1993 oleh Edgar Codd dan memiliki persyaratan berikut untuk aplikasi analisis multivariat:

- representasi data konseptual multidimensi, termasuk dukungan penuh untuk hierarki dan banyak hierarki (persyaratan utama OLAP);

- memberikan hasil analisis kepada pengguna dalam waktu yang wajar (biasanya tidak lebih dari 5 detik), bahkan dengan biaya analisis yang kurang rinci;

- kemampuan untuk melakukan analisis logis dan statistik, khas untuk aplikasi ini, dan menyimpannya dalam bentuk yang dapat diakses oleh pengguna akhir;

- akses multi-pengguna ke data dengan dukungan mekanisme penguncian yang sesuai dan sarana akses resmi;

- kemampuan untuk mengakses informasi apa pun yang diperlukan, terlepas dari volume dan lokasi penyimpanannya.

Sistem OLAP terdiri dari banyak komponen. Pada tingkat presentasi tertinggi, sistem mencakup sumber data, database multidimensi (MDB) yang menyediakan kemampuan untuk mengimplementasikan mesin pelaporan berdasarkan teknologi OLAP, server OLAP, dan klien. Sistem ini dibangun berdasarkan prinsip client-server dan menyediakan akses jarak jauh dan multi-pengguna ke server MDB.

Pertimbangkan komponen sistem OLAP.

Sumber. Sumber dalam sistem OLAP adalah server yang memasok data untuk analisis. Bergantung pada ruang lingkup penggunaan produk OLAP, sumbernya dapat berupa gudang data, basis data bawaan yang berisi data umum, kumpulan

tabel yang menggabungkan data keuangan, atau kombinasi di atas.

Penyimpanan data. Data mentah dikumpulkan dan disimpan dalam repositori yang dirancang sesuai dengan prinsip membangun gudang data. HD adalah database relasional (RDB). Tabel CD utama (tabel fakta) berisi nilai numerik dari indikator yang informasi statistiknya dikumpulkan.

Basis data multidimensi Penyimpanan data berfungsi sebagai penyedia informasi untuk database multidimensi, yang merupakan kumpulan objek. Kelas utama dari benda-benda ini adalah dimensi dan ukuran. Dimensi mencakup seperangkat nilai (parameter) yang digunakan untuk mengindeks data, misalnya, waktu, wilayah, jenis institusi, dll. Setiap dimensi diisi dengan nilai dari tabel dimensi yang sesuai dari gudang data. Himpunan pengukuran mendefinisikan ruang dari proses yang diselidiki. Ukuran adalah kubus data multidimensi (hiperkubus). Hypercube berisi data itu sendiri, serta jumlah agregat untuk dimensi yang merupakan bagian dari indikator. Indikator merupakan konten utama MDB dan diisi sesuai dengan tabel fakta. Sepanjang setiap sumbu hypercube, data dapat diatur dalam hierarki yang mewakili berbagai tingkat detail. Ini memungkinkan Anda untuk membuat dimensi hierarkis, yang akan digunakan untuk menggabungkan atau menelusuri presentasi data selama analisis data berikutnya. Contoh khas dari dimensi hierarkis adalah daftar objek teritorial yang dikelompokkan berdasarkan distrik, wilayah, distrik.

Server. Server OLAP adalah bagian yang diterapkan dari sistem OLAP. Komponen ini melakukan semua pekerjaan (tergantung pada model sistem), dan menyimpan sendiri semua informasi yang diberikan akses aktif. Arsitektur server diatur oleh berbagai konsep. Secara khusus, karakteristik fungsional utama produk OLAP adalah penggunaan MDB atau RDB untuk penyimpanan data.

Aplikasi klien.Data terstruktur sesuai dan disimpan di MDB tersedia untuk analisis menggunakan aplikasi klien. Pengguna mendapatkan kemampuan untuk mengakses data dari jarak jauh, merumuskan kueri kompleks, menghasilkan laporan, dan menerima subset data yang berubah-ubah. Memperoleh laporan direduksi menjadi pemilihan nilai pengukuran tertentu dan konstruksi bagian hypercube. Penampang ditentukan oleh nilai pengukuran yang dipilih. Data untuk dimensi lainnya diringkas.

OLAPpada klien dan pada server. Analisis data multidimensi dapat dilakukan dengan menggunakan berbagai alat, yang secara kondisional dapat dibagi menjadi alat OLAP klien dan server.

Alat klien OLAP (misalnya, Tabel Pivot di Excel 2000 dari Microsoft atau ProClarity dari Knosys) adalah aplikasi yang menghitung dan menampilkan data agregat. Dalam hal ini, data agregat itu sendiri terkandung dalam cache di dalam ruang alamat alat OLAP tersebut.

Jika data sumber terdapat dalam DBMS desktop, penghitungan data agregat dilakukan oleh alat OLAP itu sendiri. Jika sumber data asli adalah DBMS server, banyak alat OLAP klien mengirim kueri SQL ke server dan sebagai hasilnya menerima data agregat yang dihitung di server.

Biasanya, fungsionalitas OLAP diimplementasikan dalam alat pemrosesan data statistik dan di beberapa spreadsheet.

Banyak alat pengembangan berisi pustaka kelas atau komponen yang memungkinkan Anda membuat aplikasi yang mengimplementasikan fungsionalitas OLAP paling sederhana (seperti komponen Kubus Keputusan di Borland Delphi dan Borland C ++ Builder). Selain itu, banyak perusahaan menawarkan kontrol ActiveX dan perpustakaan lain yang menyediakan fungsionalitas serupa.

Alat OLAP klien digunakan, sebagai suatu peraturan, dengan sejumlah kecil dimensi (biasanya tidak lebih dari enam) dan sedikit variasi nilai untuk parameter ini - karena data agregat yang diperoleh harus sesuai dengan ruang alamat alat tersebut , dan jumlah mereka tumbuh secara eksponensial dengan peningkatan jumlah dimensi.

Banyak alat klien OLAP memungkinkan Anda untuk menyimpan konten cache dengan data agregat sebagai file agar tidak menghitung ulang. Namun, kesempatan ini sering digunakan untuk mengasingkan data agregat untuk tujuan mentransfernya ke organisasi lain atau untuk publikasi.

Gagasan menyimpan cache dengan data agregat dalam file dikembangkan lebih lanjut di alat server OLAP (misalnya, Oracle Express Server atau Microsoft OLAP Services), di mana menyimpan dan mengubah data agregat, serta memelihara penyimpanan yang berisi mereka , dilakukan oleh aplikasi atau proses terpisah yang disebut server OLAP. Aplikasi klien dapat meminta penyimpanan multidimensi tersebut dan menerima data tertentu sebagai tanggapan. Beberapa aplikasi klien juga dapat membuat repositori tersebut atau memperbaruinya sesuai dengan data sumber yang diubah.

Keuntungan menggunakan alat OLAP berbasis server dibandingkan dengan alat OLAP klien serupa dengan keuntungan menggunakan DBMS sisi server dibandingkan dengan alat desktop: dalam hal menggunakan alat berbasis server, perhitungan dan penyimpanan data agregat terjadi pada server, dan aplikasi klien hanya menerima hasil kueri kepada mereka, yang memungkinkan secara umum, mengurangi lalu lintas jaringan, waktu eksekusi kueri, dan persyaratan sumber daya untuk aplikasi klien.

3.5 Aspek teknis penyimpanan data multidimensi

Multidimensionalitas dalam aplikasi OLAP dapat dibagi menjadi tiga tingkatan:

1... Representasi data multidimensi- alat pengguna akhir yang menyediakan visualisasi multidimensi dan manipulasi data; lapisan MDI mengabstraksi dari struktur data fisik dan memperlakukan data sebagai multidimensi.

    Pemrosesan multidimensi- alat (bahasa) untuk merumuskan kueri multidimensi (bahasa SQL relasional tradisional ternyata tidak cocok di sini) dan prosesor yang dapat memproses dan menjalankan kueri semacam itu.

    Penyimpanan multidimensi- sarana organisasi fisik data, memastikan pelaksanaan kueri multidimensi yang efisien.

Dua level pertama adalah wajib di semua alat OLAP. Tingkat ketiga, meskipun tersebar luas, tidak diperlukan, karena data untuk tampilan multidimensi juga dapat diambil dari struktur relasional reguler. Pemroses kueri multidimensi, dalam hal ini, menerjemahkan kueri multidimensi menjadi kueri SQL yang dieksekusi oleh DBMS relasional.

Di gudang data mana pun - baik konvensional maupun multidimensi - bersama dengan data terperinci yang diambil dari sistem operasional, indikator agregat (indikator ringkasan) juga disimpan, seperti jumlah volume penjualan per bulan, berdasarkan kategori produk, dll. Agregat disimpan secara eksplisit untuk satu-satunya tujuan untuk mempercepat eksekusi kueri. Memang, di satu sisi, sebagai suatu peraturan, sejumlah besar data terakumulasi di gudang, dan di sisi lain, analis dalam banyak kasus tidak tertarik pada indikator yang terperinci, tetapi secara umum. Dan jika jutaan penjualan individu harus dijumlahkan setiap kali untuk menghitung penjualan tahunan, kecepatannya kemungkinan besar tidak dapat diterima. Oleh karena itu, saat memuat data ke dalam database multidimensi, semua indikator ringkasan atau sebagian darinya dihitung dan disimpan.

Namun, penggunaan data agregat penuh dengan kerugian. Kerugian utama adalah peningkatan jumlah informasi yang disimpan (saat menambahkan dimensi baru, jumlah data yang membentuk kubus tumbuh secara eksponensial) dan waktu yang diperlukan untuk memuatnya. Apalagi jumlah informasinya bisa meningkat puluhan bahkan ratusan kali lipat. Misalnya, dalam salah satu tes standar yang diterbitkan, jumlah agregat penuh untuk 10 MB data mentah membutuhkan 2,4 GB, yaitu data tumbuh 240 kali lipat!

Tingkat peningkatan volume data saat menghitung agregat tergantung pada jumlah dimensi dalam kubus dan struktur dimensi ini, yaitu, rasio jumlah "orang tua" dan "keturunan" pada tingkat dimensi yang berbeda. Untuk mengatasi masalah penyimpanan agregat, skema kompleks digunakan yang memungkinkan, saat menghitung jauh dari semua kemungkinan agregat, untuk mencapai peningkatan kinerja kueri yang signifikan.

Baik data awal dan agregat dapat disimpan baik di

relasional, atau dalam struktur multidimensi. Dalam hal ini, tiga cara menyimpan data multidimensi saat ini digunakan:

MOLAP (Multidimensional OLAP) - Sumber dan data agregat disimpan dalam database multidimensi. Menyimpan data dalam struktur multidimensi memungkinkan Anda untuk memanipulasi data sebagai larik multidimensi, sehingga kecepatan penghitungan nilai agregat sama untuk semua dimensi. Namun, dalam kasus ini, database multidimensi ternyata menjadi berlebihan, karena data multidimensi sepenuhnya berisi data relasional asli.

Sistem ini menyediakan siklus penuh pemrosesan OLAP. Mereka juga menyertakan, selain komponen server, antarmuka klien terintegrasi mereka sendiri, atau menggunakan program spreadsheet eksternal untuk berkomunikasi dengan pengguna.

ROLAP (OLAP Relasional) - data asli tetap berada dalam basis data relasional yang sama di tempat asalnya. Data agregat ditempatkan di tabel layanan yang dibuat khusus untuk penyimpanannya dalam database yang sama.

HOLAP (Hybrid OLAP) - data asli tetap berada dalam basis data relasional yang sama di tempat asalnya, dan data agregat disimpan dalam basis data multidimensi.

Beberapa alat OLAP mendukung penyimpanan data hanya dalam struktur relasional, beberapa hanya dalam struktur multidimensi. Namun, sebagian besar alat berbasis server OLAP modern mendukung ketiga metode penyimpanan data. Pilihan metode penyimpanan tergantung pada ukuran dan struktur data sumber, persyaratan untuk kecepatan eksekusi kueri, dan frekuensi pembaruan kubus OLAP.

3.6 Penambangan data (DataPertambangan)

Istilah Data Mining menunjukkan proses menemukan korelasi, tren dan hubungan melalui berbagai algoritma matematika dan statistik: pengelompokan, regresi dan analisis korelasi, dll untuk sistem pendukung keputusan. Dalam hal ini, akumulasi informasi secara otomatis digeneralisasikan ke informasi yang dapat dicirikan sebagai pengetahuan.

Teknologi Data Mining modern didasarkan pada konsep templat yang mencerminkan pola yang melekat pada subsampel data dan merupakan apa yang disebut pengetahuan tersembunyi.

Pencarian pola dilakukan dengan menggunakan metode yang tidak menggunakan asumsi apriori apapun tentang subsampel ini. Fitur penting dari Data Mining adalah pola yang dicari tidak standar dan tidak jelas. Dengan kata lain, alat Data Mining berbeda dari alat pemrosesan data statistik dan alat OLAP karena alih-alih memeriksa hubungan yang diasumsikan oleh pengguna terlebih dahulu.

antar data, berdasarkan data yang tersedia, mereka dapat secara mandiri menemukan hubungan tersebut, serta membangun hipotesis tentang sifatnya.

Secara umum, proses data mining terdiri dari tiga tahap:

    identifikasi pola (pencarian gratis);

    menggunakan pola yang terungkap untuk memprediksi nilai yang tidak diketahui (pemodelan prediktif);

    analisis pengecualian, yang dirancang untuk mengidentifikasi dan menafsirkan anomali dalam pola yang ditemukan.

Kadang-kadang, tahap antara verifikasi keandalan pola yang ditemukan antara penemuan dan penggunaannya (tahap validasi) dibedakan dengan jelas.

Ada lima jenis pola standar yang diidentifikasi oleh metode Data Mining:

1. Asosiasi memungkinkan Anda untuk memilih grup objek yang stabil di antaranya terdapat tautan yang ditentukan secara implisit. Frekuensi kemunculan item individu atau kelompok item, dinyatakan sebagai persentase, disebut prevalensi. Tingkat prevalensi yang rendah (kurang dari seperseribu persen) menunjukkan bahwa hubungan semacam itu tidak signifikan. Asosiasi ditulis dalam bentuk aturan: SEBUAH=> B, di mana TETAPI - kemasan, DI DALAM - konsekuensi. Untuk menentukan pentingnya setiap aturan asosiasi yang diperoleh, perlu untuk menghitung nilai yang disebut kepercayaan TETAPI Ke DI DALAM(atau hubungan A dan B). Keyakinan menunjukkan seberapa sering kapan TETAPI muncul DI DALAM. Misalnya, jika d (A / B)= 20%, artinya saat membeli produk TETAPI dalam setiap kasus kelima, barang juga dibeli DI DALAM.

Contoh tipikal penggunaan asosiasi adalah analisis struktur pembelian. Misalnya, ketika melakukan penelitian di supermarket, dapat dipastikan bahwa 65% dari mereka yang membeli keripik kentang juga mengonsumsi Coca-Cola, dan jika ada diskon untuk set seperti itu, Cola dibeli dalam 85% kasus. Hasil ini berharga dalam membentuk strategi pemasaran.

2. Urutan - itu adalah metode untuk mengidentifikasi asosiasi dalam waktu. Dalam hal ini, aturan didefinisikan yang menggambarkan kejadian berurutan dari kelompok peristiwa tertentu. Aturan-aturan ini penting untuk membuat skrip. Selain itu, mereka dapat digunakan, misalnya, untuk membentuk satu set tipikal penjualan sebelumnya yang mungkin memerlukan penjualan berikutnya dari produk tertentu.

3.Klasifikasi - alat generalisasi. Ini memungkinkan Anda untuk beralih dari mempertimbangkan objek tunggal ke konsep umum yang mencirikan beberapa set objek dan cukup untuk mengenali objek yang termasuk dalam set (kelas) ini. Inti dari proses pembentukan konsep adalah menemukan pola yang melekat pada kelas. Banyak fitur yang berbeda (atribut) digunakan untuk menggambarkan objek. Masalah pembentukan konsep berdasarkan deskripsi fitur dirumuskan oleh M.M. Bongart. Solusinya didasarkan pada penerapan dua prosedur dasar: pelatihan dan pengujian. Dalam prosedur pelatihan, aturan klasifikasi dibangun berdasarkan pemrosesan kumpulan objek pelatihan. Prosedur verifikasi (pemeriksaan) terdiri dari penggunaan aturan klasifikasi yang diperoleh untuk mengenali objek dari sampel (pemeriksaan) baru. Jika hasil tes ditemukan memuaskan, maka proses pembelajaran berakhir, jika tidak, aturan pengklasifikasian disempurnakan selama proses pembelajaran ulang.

4 pengelompokan Adalah distribusi informasi (rekaman) dari database ke dalam kelompok (cluster) atau segmen dengan penentuan simultan dari kelompok-kelompok tersebut. Berbeda dengan klasifikasi, di sini, untuk analisis, tidak diperlukan penetapan kelas terlebih dahulu.

5 peramalan deret waktu adalah alat untuk menentukan tren perubahan atribut objek yang dipertimbangkan dari waktu ke waktu. Analisis perilaku deret waktu memungkinkan untuk memprediksi nilai-nilai karakteristik yang dipelajari.

Untuk mengatasi masalah tersebut, berbagai metode dan algoritma Data Mining digunakan. Karena fakta bahwa Data Mining telah berkembang dan berkembang di persimpangan disiplin ilmu seperti statistik, teori informasi, pembelajaran mesin, teori basis data, sangat wajar jika sebagian besar algoritma dan metode Data Mining dikembangkan berdasarkan berbagai metode dari disiplin ilmu ini.

Dari berbagai macam metode data mining yang ada, dapat dibedakan sebagai berikut:

    analisis regresi, varians dan korelasi(diimplementasikan dalam sebagian besar paket statistik modern, khususnya, dalam produk perusahaan SAS Institute, StatSoft, dll.);

    metode analisis dalam bidang subjek tertentu, berdasarkan model empiris (sering digunakan, misalnya, dalam alat analisis keuangan yang murah);

    algoritma jaringan saraf- metode untuk mensimulasikan proses dan fenomena yang memungkinkan mereproduksi dependensi kompleks. Metode ini didasarkan pada penggunaan model otak biologis yang disederhanakan dan terdiri dari fakta bahwa parameter awal dianggap sebagai sinyal yang diubah sesuai dengan koneksi yang ada antara "neuron", dan respons seluruh jaringan terhadap data awal dianggap sebagai respon yang dihasilkan dari analisis. Dalam hal ini, koneksi dibuat menggunakan apa yang disebut pelatihan jaringan melalui sampel besar yang berisi data awal dan jawaban yang benar. Jaringan saraf banyak digunakan untuk memecahkan masalah klasifikasi;

    logika kabur digunakan untuk mengolah data dengan nilai kebenaran fuzzy yang dapat direpresentasikan oleh berbagai variabel linguistik. Representasi pengetahuan fuzzy banyak digunakan untuk memecahkan masalah klasifikasi dan peramalan, misalnya, dalam sistem XpertRule Miner (Attar Software Ltd., UK), serta di AIS, NeuFuz, dll.

    lead induktif memungkinkan Anda untuk mendapatkan generalisasi dari fakta yang disimpan dalam database. Dalam proses pembelajaran induktif, seorang spesialis yang menyediakan hipotesis mungkin dilibatkan. Ini disebut pembelajaran terawasi. Pencarian aturan generalisasi dapat dilakukan tanpa guru dengan secara otomatis menghasilkan hipotesis. Dalam perangkat lunak modern, sebagai aturan, kedua metode digabungkan, dan metode statistik digunakan untuk menguji hipotesis. Contoh sistem yang menggunakan lead induktif adalah XpertRule Miner yang dikembangkan oleh Attar Software Ltd. (Inggris Raya);

    penalaran berdasarkan kasus serupa(Metode tetangga terdekat) (Penalaran berbasis kasus - CBR) didasarkan pada pencarian dalam database untuk situasi yang deskripsinya serupa dalam sejumlah fitur dengan situasi tertentu. Prinsip analogi memungkinkan kita untuk mengasumsikan bahwa hasil dari situasi serupa juga akan dekat satu sama lain. Kerugian dari pendekatan ini adalah tidak menciptakan model atau aturan yang menggeneralisasi pengalaman sebelumnya. Selain itu, keandalan hasil keluaran tergantung pada kelengkapan deskripsi situasi, seperti dalam proses inferensi induktif. Contoh sistem yang menggunakan CBR adalah: KATE Tools (Acknosoft, Prancis), Pattern Recognition Workbench (Unica, USA);

    pohon keputusan- metode untuk menyusun tugas dalam bentuk grafik pohon, simpul yang sesuai dengan aturan produksi yang memungkinkan untuk mengklasifikasikan data atau menganalisis konsekuensi keputusan. Metode ini memberikan representasi visual dari sistem aturan klasifikasi, jika jumlahnya tidak terlalu banyak. Masalah sederhana diselesaikan dengan menggunakan metode ini jauh lebih cepat daripada menggunakan jaringan saraf. Untuk masalah yang kompleks dan untuk beberapa tipe data, pohon keputusan mungkin tidak sesuai. Selain itu, metode ini memiliki masalah signifikansi. Salah satu konsekuensi dari pengelompokan data hierarkis adalah tidak adanya sejumlah besar contoh pelatihan untuk banyak kasus khusus, dan oleh karena itu klasifikasi tidak dapat dianggap andal. Metode pohon keputusan diimplementasikan di banyak perangkat lunak, yaitu: 5.0 (RuleQuest, Australia), Clementine (Integral Solutions, UK), SIPINA (University of Lyon, France), IDIS (Information Discovery, USA);

    pemrograman evolusioner- pencarian dan pembuatan algoritma yang mengekspresikan saling ketergantungan data, berdasarkan pada algoritma yang ditentukan pada awalnya, dimodifikasi dalam proses pencarian; terkadang pencarian interdependensi dilakukan di antara semua jenis fungsi tertentu (misalnya, polinomial);

algoritma pencarian terbatas yang menghitung kombinasi kejadian logis sederhana dalam subkelompok data.

3.7 IntegrasiOLAPdanDataPertambangan

Pemrosesan analitik online (OLAP) dan penambangan data (Data Mining) adalah dua bagian dari proses pendukung keputusan. Namun, saat ini sebagian besar sistem OLAP hanya berfokus pada penyediaan akses ke data multidimensi, dan sebagian besar alat Data Mining yang bekerja di bidang pola berurusan dengan perspektif data satu dimensi. Untuk meningkatkan efisiensi pemrosesan data untuk sistem pendukung keputusan, kedua jenis analisis ini harus digabungkan.

Saat ini, istilah majemuk "OLAP Data Mining" (penambangan multidimensi) muncul untuk menunjukkan kombinasi semacam itu.

Ada tiga cara utama untuk membentuk "OLAP Data Mining":

    "Kubik lalu menambang". Kemampuan untuk melakukan analisis penambangan harus diberikan pada setiap hasil kueri ke representasi konseptual multidimensi, yaitu, pada setiap fragmen dari proyeksi apa pun dari hypercube indikator.

    Penambangan kemudian cubing. Seperti data yang diekstraksi dari repositori, hasil penambangan harus disajikan dalam bentuk hiperkubik untuk analisis multivariat berikutnya.

    "Cubing sambil menambang". Metode integrasi yang fleksibel ini memungkinkan Anda untuk secara otomatis mengaktifkan jenis mekanisme pemrosesan cerdas yang sama atas hasil setiap langkah analisis multivariat (transisi) antara tingkat generalisasi, ekstraksi fragmen baru dari hypercube, dll.).

    Astronomi untuk 11 kelas [Teks ... mereka bagaimana bagian keseluruhan sistem ... Asisten profesor ... Cheboksary, 2009. No.10.S. 44 -49 .... Penulis- penyusun: N. ... sinopsiskuliah, ...

  • Panduan belajar

    ... kuliah... Pelatihan kuliah matematika. Menulis ringkasankuliah kuliah... Penggunaan informasiteknologi ...

  • I k kondaurova dengan v lebedeva

    Panduan belajar

    ... kuliah... Pelatihan kuliah matematika. Menulis ringkasankuliah... Persiapan alat bantu visual. Teknik membaca kuliah... Penggunaan informasiteknologi ...

  • M MEDIA MONITORING Modernisasi pendidikan vokasi Maret - Agustus 2011

    Ringkasan

    ... 11 .08.2011 "Jiwa Mati-2" di RNIMU mereka ... 3,11 -3,44 ... ... publik kuliah pemimpin... Cheboksary... dan mencoret-coret sinopsis penonton - ... informasisistem dan teknologi. ... sistem pendidikan, kata Asisten profesor ... penyusun ... bagian dari meningkatkan nyata isi ...

Topik 6

SISTEM INFORMASI PERUSAHAAN UNTUK PENGOLAHAN INFORMASI EKONOMI

Konsep teknologi informasi perusahaan

Esensi dan pentingnya teknologi informasi perusahaan

Di antara berbagai program untuk bisnis, istilah "teknologi informasi dalam tata kelola perusahaan" secara tradisional dipahami sebagai "sistem otomasi manajemen terintegrasi". Nama lain mereka juga dikenal - sistem skala perusahaan, sistem informasi perusahaan (CIS), sistem manajemen perusahaan (atau terintegrasi) (KSU), sistem kontrol otomatis (ACS).

Sebagai aturan, sistem otomasi kontrol yang kompleks adalah solusi universal "dasar" yang cocok untuk berbagai jenis perusahaan, terutama manajemen keuangan, manajemen gudang, manajemen pembelian dan penjualan. Tetapi sistem yang sama ini sering kali memiliki solusi industri yang mencerminkan satu atau lainnya spesifik dan berisi dasar peraturan dan referensi yang sesuai.

Misalnya, solusi sistem SAP R / 3 untuk industri penerbangan mendukung akuntansi dan kontrol nomor seri semua suku cadang pesawat, masa pakainya, penggantian atau perbaikan terjadwal, yang memastikan tidak hanya keandalan produksi, tetapi juga keselamatan penumpang. .

Karena sistem manajemen yang kompleks difokuskan terutama pada perusahaan besar yang berisi struktur multidisiplin, mereka tidak hanya menawarkan serangkaian fungsi yang dikembangkan, tetapi juga menyediakan penyimpanan dan pemrosesan informasi dalam jumlah besar yang andal, menggunakan platform dan alat sistem yang kuat untuk pekerjaan multi-pengguna. . ..

Teknologi informasi modern, komunikasi dan Internet memungkinkan pemecahan masalah akses jarak jauh ke database tunggal, yang juga penting untuk tata kelola perusahaan.

Membangun konsep

Meskipun sebagian besar pengembang menyebut produk perangkat lunak mereka manajerial (perusahaan, gudang, keuangan, dll), pada dasarnya, hampir semua perangkat lunak yang digunakan dalam tata kelola perusahaan adalah pencatatan fakta dan dokumen kegiatan keuangan dan ekonomi, sistem akuntansi dengan kemampuan konstruksi laporan dan referensi di bagian yang diizinkan oleh fitur analitis. Artinya, informasi terstruktur dimasukkan ke dalam database. Struktur ini ditetapkan sampai tingkat tertentu oleh buku referensi yang saling berhubungan, pengklasifikasi, parameter dan bentuk dokumen standar. Menurut informasi yang tersedia di database, apa yang disebut "potong" adalah "dibangun", "ditarik keluar", "dikumpulkan" dengan cara instrumental. Setelah menerima laporan dan referensi, yang sering disebut laporan analitis, berdasarkan data tersebut, manajemen dapat mengambil keputusan. Ini adalah konsep tipikal dan teknologi tipikal untuk bekerja dengan sistem kelas yang bersangkutan.



Bukan kebetulan bahwa perbedaan dalam konten fungsional, solusi sistem, tujuan dan penggunaan perangkat lunak "manajemen", seperti "Galaxy", "BEST" dan "1C: Enterprise", serupa dalam prinsip-prinsip organisasi informasi, teknologi pembentukan dan pemrosesannya, serta metode interaksi dengan sistem.

Namun demikian, perusahaan, misalnya, OJSC Uralelectromed, mengajukan persyaratan yang begitu sulit dan beragam untuk alat tata kelola perusahaan sehingga menjadi perlu untuk membangunnya secara multi-level. Biasanya inti dari sistem, yang hanya berisi kode program, adalah yang utama. Elemen penting berikutnya secara konseptual adalah toolkit built-in dari sistem, yang memungkinkan, tanpa mengubah kode program, setidaknya untuk mengonfigurasinya di tempat kerja, melakukan operasi tertentu, memasukkan yang baru dan mengubah bentuk dokumen utama dan pelaporan yang ada, dan menggunakan cara lain untuk penyesuaian parametrik. Sistem yang lebih maju memiliki alat bawaan untuk membuat berbagai model perusahaan: informasi, organisasi, fungsional, dll. Dan, akhirnya, database itu sendiri.

Pemrosesan informasi analitis

Merencanakan kegiatan suatu perusahaan, memperoleh informasi operasional dan membuat keputusan yang benar berdasarkan analisisnya dikaitkan dengan pemrosesan data dalam jumlah besar. Laporan yang dihasilkan dalam sistem akuntansi perusahaan biasanya tidak fleksibel. Mereka tidak dapat "dipelintir", "diperluas" atau "diciutkan" untuk mendapatkan representasi data yang diinginkan, termasuk yang grafis. Semakin banyak "pemotongan" dan "pemotongan" yang dapat Anda lakukan, semakin realistis Anda dapat membayangkan gambaran perusahaan dan membuat keputusan terbaik tentang pengelolaan proses bisnis. Untuk tugas semacam ini, pemodelan matematika dan ekonomi, serta kinerja tinggi, diperlukan. Modul analitik tersedia di sistem "RepKo", yang lebih dikenal adalah sistem "Triumph-Analytica" ("PARUS" Corporation - "Torah Center"). Tampaknya sistem akuntansi membangun referensi di berbagai "bagian" berdasarkan informasi yang disimpan dalam database, mereka hanya mewakili apa adanya. Dan sistem analitis membangun informasi baru sesuai dengan parameter atau kriteria yang ditentukan, mengoptimalkannya untuk tujuan tertentu. Oleh karena itu, lebih sering Anda memerlukan alat khusus untuk melihat dan memvisualisasikan informasi, yaitu pemrosesan analitis online (OLAP). Ini menyediakan satu set sarana akses yang nyaman dan berkecepatan tinggi, melihat dan analisis multidimensi dari informasi yang terakumulasi dalam penyimpanan.

Teknologi OLAP digunakan untuk memodelkan situasi sesuai dengan skema "bagaimana jika ...", dan untuk menyusun berbagai laporan analitis. Ada produk perangkat lunak Barat khusus.

Biasanya, informasi dari sistem manajemen perusahaan ditransfer ke program khusus untuk pemrosesan data analitis. Banyak pengembang dalam negeri mencoba menyelesaikan masalah ini sendiri, misalnya, Nikos-Soft (sistem NS-2000), Cepheus (sistem manajemen perusahaan Etalon), KOMSOFT (KOMSOFT-STANDARD "2.0), dll.

6.4. Prospek untuk pengembangan dan penggunaan teknologi informasi perusahaan

Selain pengembangan dan penggunaan alat dan platform modern, serta alat sistem, pengembangan sistem perusahaan domestik mengandaikan kejenuhan fungsional mereka, terutama dalam hal produksi.

Terlepas dari semangat yang meluas untuk penerapan standar manajemen, para pemain terkemuka di pasar perangkat lunak domestik sedang mengembangkan solusi industri untuk berbagai jenis industri.

Ketakutan perusahaan untuk mengungkapkan "kerahasiaan" perkembangan mereka berkurang, yang membantu untuk mengkonsolidasikan upaya mereka untuk mengintegrasikan produk mereka, daripada mengembangkan segala sesuatu dari "a" ke "z" sendiri. Hari ini, tidak ada yang memiliki sumber daya yang cukup. Butuh waktu bertahun-tahun untuk memahami sebuah konsep baru, mengembangkan sebuah proyek dan sebuah sistem, yaitu sebuah sistem yang berubah kualitasnya tergantung apa yang ada di dalamnya. Selain itu, persyaratan untuk integrasi produk perangkat lunak juga diajukan oleh perusahaan yang ingin tetap "bekerja", sebagai aturan, khusus, sistem dan secara informasi menggabungkannya dengan yang baru diperoleh.

Integrasi juga diperlukan untuk produk dari produsen yang berbeda - atas nama menggabungkan solusi kompleks dengan spesialisasi:

- penganggaran, analisis keuangan dan ekonomi, layanan pelanggan, pemrosesan data analitis, dll.

Perlu dicatat bahwa bukan sistem kontrol itu sendiri yang lebih menjanjikan, tetapi alat sederhana dan universal untuk pembuatannya, yang ditujukan untuk perantara yang memenuhi syarat antara pengembang dan pengguna akhir. Sekarang fungsi-fungsi ini coba dilakukan oleh administrator dan analis sistem.

Jika alat seperti itu tersedia, solusi standar "siap pakai" untuk semua perusahaan di semua industri akan dibutuhkan.

Internet sebagai alat tambahan untuk pengembangan bisnis dapat digunakan secara efektif hanya dengan adanya sistem manajemen yang terintegrasi.

Meskipun teknologi informasi dan komunikasi modern, termasuk Internet, memungkinkan untuk mengatur persewaan perangkat lunak, terlalu dini untuk berbicara tentang prospek jangka pendek untuk menggunakan peluang seperti itu, terutama di negara kita. Dan bukan karena alasan kerahasiaan melainkan karena kurangnya ketertiban dan sarana komunikasi yang dapat diandalkan.

Upaya untuk menerapkan dan pengalaman dalam menggunakan, bahkan tidak secara penuh, teknologi informasi di perusahaan domestik telah membuktikan dalam praktik bahwa "kekacauan tidak dapat diotomatisasi." Reorganisasi awal bisnis dan perusahaan itu sendiri diperlukan, serta pembangunan peraturan (instruksi) manajemen. Sulit bagi karyawan perusahaan untuk mengatasi pekerjaan seperti itu sendiri. Apalagi mengingat faktor waktu dalam kondisi pasar. Oleh karena itu, praktik interaksi dengan perusahaan konsultan berkembang di mana-mana, yang membantu perusahaan dan mengajar karyawan mereka untuk "memperluas kemacetan", membangun proses bisnis utama, mengembangkan teknologi, membangun arus informasi, dll. Mengotomatiskan proses yang disederhanakan lebih mudah, lebih mudah, lebih murah, lebih cepat.

Setiap orang harus melakukan pekerjaannya. Seorang akuntan, penjaga toko, manajer penjualan, dan spesialis "subjek" lainnya tidak boleh memperbaiki bentuk formulir dokumen, memperluas kolom, atau mengubah tempatnya karena perubahan undang-undang atau skema bisnis. Oleh karena itu, pasar perangkat lunak secara bertahap berubah dari "produk" menjadi "layanan". Outsourcing mulai berkembang - transfer beberapa fungsi perusahaan ke spesialis perusahaan yang terlibat. Mereka terlibat dalam pemeliharaan peralatan, perangkat lunak sistem, modifikasi bagian sistem yang diterapkan (fungsional), dll.

Teknologi informasi dan layanan metodologis bagi pengguna dan konsumennya menjadi yang paling penting dan topikal dalam penggunaan sistem manajemen perusahaan.

8.3.1. Alat Pemrosesan Analitik On-Line (OLAP)

Pemrosesan Analitik On-Line - sarana pemrosesan analitik operasional (waktu nyata) dari informasi yang ditujukan untuk mendukung pengambilan keputusan dan membantu analis menjawab pertanyaan "Mengapa objek, lingkungan, dan hasil interaksinya seperti itu dan bukan yang lain?" Dalam hal ini, analis sendiri membentuk versi hubungan antara sekumpulan informasi dan memeriksanya berdasarkan data yang tersedia dalam database informasi terstruktur yang sesuai.

Sistem ERP ditandai dengan adanya komponen analitis sebagai bagian dari subsistem fungsional. Mereka memberikan pembentukan informasi analitis secara real time. Informasi ini adalah dasar untuk sebagian besar keputusan manajemen.

Teknologi OLAP menggunakan hypercubes - data terstruktur khusus (atau disebut OLAP cubes). Dalam struktur data hypercube, berikut ini dibedakan:

Tindakan - indikator kuantitatif (dasar-persyaratan) yang digunakan untuk menghasilkan ringkasan hasil statistik;

Dimensi - kategori deskriptif (atribut-atribut), dalam konteks ukuran yang dianalisis.

Dimensi hypercube ditentukan oleh jumlah dimensi untuk satu ukuran. Misalnya, hypercube PENJUALAN berisi data:

Dimensi: konsumen, tanggal operasi, kelompok barang, nomenklatur, modifikasi, paket, gudang, jenis pembayaran, jenis pengiriman, tarif, mata uang, organisasi, departemen, tanggung jawab, saluran distribusi, wilayah, kota;

Ukuran: kuantitas yang direncanakan, kuantitas aktual, jumlah yang direncanakan, jumlah aktual, pembayaran yang direncanakan, pembayaran aktual, saldo yang direncanakan, saldo aktual, harga jual, waktu pelaksanaan pesanan, jumlah pengembalian dana.

Hypercube semacam itu dimaksudkan untuk laporan analitis:

Klasifikasi konsumen menurut volume pembelian;

Klasifikasi barang yang dijual dengan metode ABC;

Analisis ketentuan pelaksanaan pesanan berbagai konsumen;

Analisis volume penjualan berdasarkan periode, barang dan kelompok barang, wilayah dan konsumen, departemen internal, manajer, dan saluran penjualan;

Prakiraan penyelesaian bersama dengan konsumen;

Analisis pengembalian barang dari konsumen; dll.

Laporan analitis dapat memiliki kombinasi dimensi dan ukuran yang sewenang-wenang, mereka digunakan untuk menganalisis keputusan manajemen. Pemrosesan analitik disediakan oleh alat instrumental dan bahasa. Dalam spreadsheet MS Excel yang tersedia untuk umum, teknologi informasi "Tabel Pivot" disajikan, data awal untuk pembuatannya adalah:

Daftar (database) MS Excel - tabel relasional;

Tabel pivot MS Excel lainnya;

Rentang konsolidasi sel MS Excel yang terletak di buku kerja yang sama atau berbeda;

Database relasional eksternal atau kubus OLAP, sumber data (file dalam format .dsn, .ode).

Untuk membuat tabel pivot berdasarkan database eksternal, gunakan driver ODBC, serta program MS Query. Tabel ringkasan untuk database MS Excel asli memiliki struktur berikut (Gbr. 8.3).

Tata letak tabel pivot memiliki struktur data berikut (Gbr. 8.4): dimensi - kode departemen, posisi; ukuran - pengalaman kerja, gaji dan bonus. Di bawah ini adalah tabel ringkasan. 8.2, yang memungkinkan Anda untuk menganalisis hubungan antara pengalaman kerja rata-rata dan gaji, pengalaman kerja rata-rata dan bonus, gaji dan bonus.

Tabel 8.2

Tabel Pivot untuk Analisis Tautan

Ujung meja. 8.2

Untuk melanjutkan analisis menggunakan tabel pivot, Anda dapat:

Tambahkan total baru (misalnya, gaji rata-rata, bonus rata-rata, dll.);

Gunakan pemfilteran catatan dan total tabel pivot (misalnya, dengan atribut "Gender", yang ditempatkan di tata letak di area * Halaman ");

Hitung indikator struktural (misalnya, distribusi dana upah dan dana bonus berdasarkan divisi - menggunakan pemrosesan tambahan tabel pivot, pembagian jumlah per kolom); dll.

Paket MS Office memungkinkan Anda untuk mempublikasikan data spreadsheet, termasuk tabel dan bagan pivot dalam format XTML.

Komponen Web Microsoft Office mendukung bekerja dengan data yang dipublikasikan di Internet Explorer, memungkinkan analisis lebih lanjut (perubahan dalam struktur data tabel pivot, penghitungan total ringkasan baru).

8.3.2. Alat Penambangan Data (DM)

Alat DM menyiratkan ekstraksi ("penggalian", "ekstraksi") data dan ditujukan untuk mengidentifikasi hubungan antara informasi yang disimpan dalam database digital perusahaan, yang dapat digunakan analis untuk membangun model yang mengukur tingkat pengaruh faktor minat. Selain itu, alat tersebut dapat berguna untuk membangun hipotesis tentang kemungkinan sifat hubungan informasi dalam database digital suatu perusahaan.

Teknologi Text Mining (TM) adalah seperangkat alat yang memungkinkan Anda menganalisis kumpulan besar informasi untuk mencari tren, pola, dan hubungan yang dapat membantu Anda membuat keputusan strategis.

Teknologi Image Mining (IM) berisi alat untuk pengenalan dan klasifikasi berbagai gambar visual yang disimpan dalam database perusahaan atau diperoleh sebagai hasil pencarian online dari sumber informasi eksternal.

Untuk memecahkan masalah pemrosesan dan penyimpanan semua data, pendekatan berikut digunakan:

1) pembuatan beberapa sistem cadangan atau satu sistem manajemen dokumen terdistribusi yang memungkinkan Anda untuk menyimpan data, tetapi memiliki akses lambat ke informasi yang disimpan atas permintaan pengguna;

2) pembangunan sistem Internet yang sangat fleksibel, tetapi tidak disesuaikan untuk pelaksanaan pencarian dan penyimpanan dokumen teks;

3) pengenalan portal Internet yang ditargetkan dengan baik untuk permintaan pengguna, tetapi tidak memiliki informasi deskriptif mengenai data teks yang dimuat ke dalamnya.

Sistem pemrosesan teks yang bebas dari masalah yang tercantum di atas dapat dibagi menjadi dua kategori: sistem analisis linguistik dan sistem analisis data teks.

Elemen utama dari teknologi Text Mining adalah:

Ringkasan;

Ekstraksi fitur

Kekelompokan

Klasifikasi

Menjawab pertanyaan (question answer);

pengindeksan tematik;

Cari berdasarkan kata kunci (keyword searching);

Penciptaan dan pemeliharaan taksonomi dan tesauri.

Produk perangkat lunak yang menerapkan teknologi Text Mining antara lain:

IBM Intelligent Miner for Text - satu set utilitas baris perintah individu, atau melompati; independen satu sama lain (penekanan utama adalah pada mekanisme data mining - pencarian informasi);

Oracle InterMedia Text - satu set terintegrasi ke dalam DBMS yang memungkinkan Anda bekerja paling efektif dengan permintaan pengguna (memungkinkan Anda bekerja dengan DBMS relasional modern dalam konteks pencarian multiguna yang kompleks dan analisis data teks);

Megaputer Text Analyst adalah satu set objek COM yang dibangun ke dalam program untuk menyelesaikan tugas-tugas Text Mining.

8.3.3. Teknologi informasi cerdas

Saat ini, di bidang otomatisasi kontrol, analisis informasi mendominasi pada tahap awal persiapan keputusan - memproses informasi utama, menguraikan situasi masalah, yang memungkinkan seseorang untuk mempelajari hanya bagian-bagian dan detail proses, dan bukan situasi secara keseluruhan. Untuk mengatasi kelemahan ini, seseorang harus belajar membangun basis pengetahuan dengan menggunakan pengalaman dari spesialis terbaik, serta menghasilkan pengetahuan yang hilang.

Penggunaan teknologi informasi di berbagai bidang aktivitas manusia, pertumbuhan volume informasi yang eksponensial dan kebutuhan untuk merespons dengan cepat dalam situasi apa pun membutuhkan pencarian cara yang memadai untuk memecahkan masalah yang muncul. Yang paling efektif di antaranya adalah cara intelektualisasi teknologi informasi.

Dibawah teknologi informasi cerdas(ITT) biasanya memahami teknologi informasi tersebut, yang menyediakan kemampuan berikut:

Kehadiran basis pengetahuan yang mencerminkan pengalaman orang-orang tertentu, kelompok, masyarakat, umat manusia secara keseluruhan, dalam memecahkan masalah kreatif di bidang kegiatan tertentu, secara tradisional dianggap sebagai hak prerogatif kecerdasan manusia (misalnya, tugas-tugas yang diformalkan dengan buruk seperti pengambilan keputusan , desain, ekstraksi makna, penjelasan, pelatihan, dll.);

Kehadiran model berpikir berdasarkan basis pengetahuan: aturan dan kesimpulan logis, argumentasi dan penalaran, pengenalan dan klasifikasi situasi, generalisasi dan pemahaman, dll .;

Kemampuan untuk membentuk keputusan yang cukup jelas berdasarkan data yang kabur, longgar, tidak lengkap, dan kurang ditentukan;

Kemampuan menjelaskan kesimpulan dan keputusan, yaitu adanya mekanisme penjelasan;

Kemampuan untuk belajar, melatih kembali dan karena itu berkembang.

Teknologi pencarian informal untuk pola tersembunyi dalam data dan informasi Knowledge Discovery (KD) didasarkan pada teknologi terbaru untuk pembentukan dan penataan gambar informasi objek, yang paling dekat dengan prinsip pemrosesan informasi oleh sistem cerdas.

Pendukung Keputusan (DS) teknologi informasi pendukung keputusan adalah cangkang ahli.

sistem atau sistem pakar khusus yang memungkinkan analis untuk menentukan hubungan dan hubungan antara struktur informasi dalam dasar informasi terstruktur perusahaan, serta untuk memprediksi kemungkinan hasil pengambilan keputusan.

tren perkembangan IIT. Sistem komunikasi dan komunikasi. Jaringan informasi global dan IIT secara radikal dapat mengubah pemahaman kita tentang perusahaan dan pekerjaan mental itu sendiri. Kehadiran karyawan di tempat kerja akan menjadi hampir tidak perlu. Orang dapat bekerja dari rumah dan berinteraksi satu sama lain sesuai kebutuhan melalui jaringan. Diketahui, misalnya, adalah pengalaman sukses menciptakan modifikasi baru pesawat Boeing-747 oleh tim spesialis terdistribusi yang berinteraksi melalui Internet. Lokasi peserta dalam pembangunan apa pun akan memainkan peran yang semakin kecil, tetapi pentingnya tingkat kualifikasi peserta akan meningkat. Alasan lain yang menentukan perkembangan pesat IIT terkait dengan kerumitan sistem komunikasi dan tugas-tugas yang diselesaikan berdasarkan mereka. Dibutuhkan tingkat "intelektualisasi" yang secara kualitatif baru dari produk perangkat lunak seperti sistem untuk menganalisis data yang heterogen dan tidak ketat, memastikan keamanan informasi, membuat keputusan dalam sistem terdistribusi, dll.

Pendidikan... Sudah hari ini, pembelajaran jarak jauh mulai memainkan peran penting dalam pendidikan, dan pengenalan IIT akan secara signifikan mengindividualisasikan proses ini sesuai dengan kebutuhan dan kemampuan setiap siswa.

Kehidupan sehari-hari... Informatisasi kehidupan sehari-hari sudah dimulai, tetapi dengan perkembangan IIT, pada dasarnya peluang baru akan muncul. Secara bertahap, semua fungsi baru akan ditransfer ke komputer: kontrol atas kesehatan pengguna, kontrol peralatan rumah tangga seperti pelembab udara, penyegar udara, pemanas, ionizers, pusat musik, diagnostik medis, dll. Dengan kata lain, sistem juga akan menjadi diagnosa keadaan seseorang dan rumahnya. Ruang informasi yang nyaman akan disediakan di tempat, di mana lingkungan informasi akan menjadi bagian dari lingkungan manusia.

Prospek untuk pengembangan IIT... Tampaknya saat ini IIT telah mendekati tahap baru yang fundamental dalam perkembangannya. Jadi, selama 10 tahun terakhir, kemampuan IIT telah berkembang secara signifikan karena pengembangan jenis model logis baru, munculnya model baru

mengeluarkan teori dan ide. Poin-poin penting dalam pengembangan IIT adalah:

Transisi dari inferensi logis ke model argumentasi dan penalaran;

Mencari pengetahuan yang relevan dan menghasilkan penjelasan;

Pemahaman dan sintesis teks;

Grafik kognitif, mis. presentasi pengetahuan secara grafis dan kiasan;

Sistem multi-agen;

Model jaringan cerdas;

Perhitungan berdasarkan logika fuzzy, jaringan syaraf tiruan, algoritma genetika, perhitungan probabilistik (diimplementasikan dalam berbagai kombinasi satu sama lain dan dengan sistem pakar);

Masalah meta-pengetahuan.

Sistem multi-agen telah menjadi paradigma baru untuk menciptakan IIT yang menjanjikan. Diasumsikan di sini bahwa agen adalah sistem intelektual independen yang memiliki sistem penetapan tujuan dan motivasinya sendiri, area tindakan dan tanggung jawabnya sendiri. Interaksi antar agen disediakan oleh sistem tingkat yang lebih tinggi - metaintelligence. Dalam sistem multi-agen, komunitas virtual agen cerdas dimodelkan - objek yang otonom, aktif, masuk ke dalam berbagai hubungan sosial - kerjasama dan kerjasama (persahabatan), kompetisi, kompetisi, permusuhan, dll. Aspek sosial dari pemecahan masalah modern adalah fitur mendasar dari kebaruan konseptual teknologi intelektual canggih - organisasi virtual, masyarakat virtual.

(?) Kontrol pertanyaan dan tugas

1. Berikan gambaran tentang perusahaan sebagai objek informasi. Apa indikator utama yang menjadi ciri pengembangan sistem manajemen perusahaan.

2. Daftar manajemen teknologi informasi terkemuka dari perusahaan industri.

3. Apa teknologi informasi utama pengembangan organisasi dan strategis perusahaan (korporasi).

4. Apa dasar dari standar manajemen strategis yang ditujukan untuk meningkatkan proses bisnis? Bagaimana perbandingan BPM dan BPI teknologi informasi?

5. Menentukan filosofi manajemen kualitas total (TQM). Bagaimana fase-fase pengembangan kualitas dan teknologi informasi terkait?

6. Sebutkan ketentuan utama pengembangan organisasi perusahaan, jelaskan tahapan manajemen strategis. Apa saja strategi kelompok?

7. Bagaimana model bisnis perusahaan dibuat? Apa pendekatan utama untuk menilai efektivitas model bisnis?

8. Apa yang dimaksud dengan balanced scorecard? Apa saja komponen utama BSC? Apa keterkaitan kelompok indikator BSC?

9. Buat daftar landasan metodologis untuk membuat sistem informasi. Apa itu pendekatan sistem?

10. Apa yang dimaksud dengan pendekatan informasi untuk pembentukan sistem dan teknologi informasi?

11. Bagaimana pendekatan strategis pembentukan sistem dan teknologi informasi?

12. Apa isi pendekatan berorientasi objek untuk menggambarkan perilaku agen di pasar? Berikan definisi objek, tunjukkan analog dari sistem agen.

13. Apa prinsip-prinsip metodologis untuk meningkatkan manajemen perusahaan berdasarkan teknologi informasi dan komunikasi? Apa tujuan TIK?

14. Memberikan definisi dokumen, aliran dokumen, aliran dokumen, sistem manajemen dokumen.

15. Bagaimana tata letak formulir dokumen dirancang? Beri nama zona dokumen, komposisi detailnya.

16. Apa teknologi informasi dasar dari sistem manajemen dokumen.

17. Apa yang dimaksud dengan sistem dokumentasi terpadu? Apa prinsip umum unifikasi?

18. Jelaskan dokumentasi organisasi dan administrasi, berikan contoh dokumen.

19. Apa saja persyaratan untuk sistem manajemen dokumen elektronik?

20. Apa yang dimaksud dengan sistem informasi perusahaan? Apa loop kontrol utama, komposisi modul fungsional.

21. Beri nama produk perangkat lunak yang Anda kenal untuk CIS. Berikan karakteristik komparatif mereka.

Sastra W

1. Kembali J., Moriarty S. Komunikasi pemasaran. Pendekatan terpadu. SPb.; Kharkov: Peter, 2001.

2. Brooking E. Modal intelektual. Kunci sukses di milenium baru. SPb.: Petrus, 2001.

3. Godin V.V., Korpev I.K. Manajemen sumber daya informasi. M.: INFRA-M, 1999.

4. Sistem informasi dan teknologi di bidang ekonomi: Buku teks. edisi ke-2, Tambah. dan direvisi / M.I. Semenov, I.T. Trubilin, V.I. Loiko, T.P. Baranovskaya; Ed. DI DAN. Loiko. Moskow: Keuangan dan Statistik, 2003.

5. Teknologi informasi dalam bisnis / Ed. M.Zheleny. SPb.: Petrus, 2002.

6. Kaplan Robert S., Norton David P. Balanced Scorecard. Dari strategi ke tindakan / Per. dari bahasa Inggris M.: CJSC "Olymp-Business", 2003.

7. Karagodin V.I., Karagodina BJI. Informasi sebagai dasar kehidupan. Dubna: Phoenix, 2000.

8. Karminsky AM., Nesterov PZ. Informatisasi bisnis. Moskow: Keuangan dan Statistik, 1997.

9. Likhacheva T.N. Teknologi informasi untuk melayani masyarakat informasi // Teknologi informasi baru dalam sistem ekonomi. M., 1999.

10. Ostreykovsky V.A. Teori sistem. M.: Sekolah Tinggi, 1997.

11. Piterkin S.V., Oladov N.A., Isaev D.V. Tepat pada waktunya untuk Rusia. Praktek menggunakan sistem ERP. edisi ke-2. M.: Penerbit Alpina, 2003.

12. Sokolov D.V. Pengantar teori komunikasi sosial: Buku teks. uang saku. SPb.: Penerbitan SP6GUP, 1996.

13. Trofimov V.Z., Tomilov V.Z. Teknologi informasi dan komunikasi dalam manajemen: Buku teks. uang saku. SPb.: Penerbitan SPbGUEF, 2002.

Untuk beberapa waktu sekarang, tingkat modern pengembangan perangkat keras dan perangkat lunak telah memungkinkan pemeliharaan database informasi operasional secara luas di berbagai tingkat manajemen. Dalam kegiatan mereka, perusahaan industri, perusahaan, struktur departemen, badan pemerintah dan administrasi telah mengumpulkan sejumlah besar data. Mereka menyimpan potensi besar dalam diri mereka untuk mengekstraksi informasi analitis yang berguna, atas dasar yang memungkinkan untuk mengidentifikasi tren tersembunyi, membangun strategi pengembangan, dan menemukan solusi baru.

Dalam beberapa tahun terakhir, sejumlah konsep baru untuk menyimpan dan menganalisis data perusahaan telah terbentuk di dunia:

1) Gudang Data, atau Gudang Data

2) Pemrosesan Analitik On-Line (OLAP)

3) Penambangan data - IAD (Penambangan Data)

Sistem pemrosesan data analitis OLAP adalah sistem pendukung keputusan yang berfokus pada pemenuhan kueri yang lebih kompleks yang memerlukan pemrosesan statistik dari data historis yang terakumulasi selama periode waktu tertentu. Mereka berfungsi untuk menyiapkan laporan bisnis tentang penjualan, pemasaran untuk tujuan manajemen, yang disebut Data Mining - penambangan data, mis. cara menganalisis informasi dalam database untuk menemukan anomali dan tren tanpa mencari tahu arti dari catatan.

Sistem analitik berdasarkan OLAP mencakup alat pemrosesan informasi berdasarkan metode kecerdasan buatan dan alat presentasi data grafis. Sistem ini ditentukan oleh sejumlah besar data historis, memungkinkan untuk mengekstrak informasi yang berarti darinya, mis. mendapatkan pengetahuan dari data.

Efisiensi pemrosesan dicapai melalui penggunaan teknologi multiprosesor yang kuat, metode analisis yang canggih, dan penyimpanan data khusus.

Database relasional menyimpan entitas dalam tabel terpisah, yang biasanya dinormalisasi dengan baik. Struktur ini nyaman untuk database operasional (sistem OLTP), tetapi kueri multi-tabel yang kompleks relatif lambat di dalamnya. Model yang lebih baik untuk query daripada modifikasi adalah database spasial.

Sistem OLAP mengambil snapshot dari database relasional dan menyusunnya menjadi model spasial untuk kueri. Waktu pemrosesan yang diklaim untuk kueri di OLAP adalah sekitar 0,1% dari kueri serupa dalam database relasional.

Struktur OLAP yang dibuat dari data operasional disebut kubus OLAP. Sebuah kubus dibuat dari menggabungkan tabel menggunakan skema bintang. Di tengah "bintang" adalah tabel fakta yang berisi fakta-fakta kunci yang akan ditanyakan. Beberapa tabel dimensi digabungkan ke tabel fakta. Tabel ini menunjukkan bagaimana data relasional teragregasi dapat dianalisis. Jumlah kemungkinan agregasi ditentukan oleh jumlah cara di mana data asli dapat ditampilkan secara hierarkis.

Kelas sistem yang diberikan (OLAP dan OLTP) didasarkan pada penggunaan DBMS, tetapi jenis kuerinya sangat berbeda. Mesin OLAP adalah salah satu metode analisis data yang paling populer saat ini. Ada dua pendekatan utama untuk memecahkan masalah ini. Yang pertama disebut Multidimensional OLAP (MOLAP) - implementasi mekanisme menggunakan database multidimensi di sisi server, dan yang kedua adalah Relational OLAP (ROLAP) - membangun kubus "on the fly" berdasarkan kueri SQL ke relasional DBMS. Masing-masing pendekatan ini memiliki kelebihan dan kekurangan. Skema umum sistem OLAP desktop dapat direpresentasikan pada Gambar.

Algoritma kerja adalah sebagai berikut:

1) memperoleh data berupa tabel datar atau hasil eksekusi query SQL;

2) menyimpan data dan mengubahnya menjadi kubus multidimensi;

3) menampilkan kubus yang dibangun menggunakan tabel silang atau diagram, dll.

Secara umum, jumlah tampilan yang berubah-ubah dapat dihubungkan ke satu kubus. Tampilan yang digunakan dalam sistem OLAP paling sering terdiri dari dua jenis: tab silang dan bagan.

Diagram bintang. Idenya adalah bahwa ada tabel untuk setiap dimensi, dan semua fakta ditempatkan dalam satu tabel, diindeks oleh beberapa kunci yang terdiri dari kunci dimensi individu. Setiap sinar dari skema bintang mendefinisikan, dalam terminologi Codd, arah konsolidasi data sepanjang dimensi yang sesuai.

Untuk masalah kompleks dengan dimensi bertingkat, masuk akal untuk beralih ke ekstensi skema bintang - skema konstelasi fakta dan skema kepingan salju. Dalam kasus ini, tabel fakta terpisah dibuat untuk kemungkinan kombinasi tingkat ringkasan dari dimensi yang berbeda. Hal ini memungkinkan kinerja yang lebih baik, tetapi sering menyebabkan redundansi data dan komplikasi yang signifikan dalam struktur database, yang berisi sejumlah besar tabel fakta.

diagram konstelasi

Pemrosesan data analitis - Ini adalah analisis data yang memerlukan dukungan metodologis yang tepat dan tingkat pelatihan spesialis tertentu.

Teknologi informasi modern memungkinkan untuk mengotomatisasi proses menganalisis akumulasi informasi utama, membangun model analitis, mendapatkan solusi yang sudah jadi dan menggunakannya dalam praktik. Persyaratan utama , yang disajikan untuk metode analisis, adalah efisiensi, kesederhanaan, otomatisme. Konsep ini mendasari dua teknologi modern: Data Mining dan Knowledge Discovery in Databases (KDD).

Penambangan Data - itu adalah proses menemukan dalam data mentah yang sebelumnya tidak diketahui, non-sepele, interpretasi pengetahuan yang berguna secara praktis dan dapat diakses yang diperlukan untuk membuat keputusan di berbagai bidang aktivitas manusia (definisi oleh G. Pyatetsky-Shapiro, salah satu pendiri arah ini) .

Teknologi Data Mining ditujukan untuk menemukan pola yang tidak jelas. Tahapan analisis data adalah:

  • 1) klasifikasi ( klasifikasi) - deteksi fitur yang mencirikan kelompok objek dari kumpulan data yang dipelajari - kelas. Metode solusi yang digunakan untuk masalah klasifikasi: metode tetangga terdekat ( tetangga terdekat) dan ^ '- tetangga terdekat ( k-tetangga terdekat) -, Jaringan Bayesian (jaringan Bayesian) -, induksi pohon keputusan; jaringan saraf (jaringan saraf) -,
  • 2) pengelompokan (kekelompokan)- memisahkan objek ke dalam kelompok, karena kelas objek awalnya tidak didefinisikan. Contoh metode untuk memecahkan masalah pengelompokan: peta Kohonen yang mengatur sendiri - jaringan saraf dengan pembelajaran tanpa pengawasan. Fitur penting dari peta ini adalah kemampuannya untuk menampilkan ruang fitur multidimensi pada bidang, menyajikan data dalam bentuk peta dua dimensi;
  • 3) asosiasi (asosiasi)- mengidentifikasi pola antara peristiwa terkait dalam dataset. Pola-pola ini terungkap bukan berdasarkan sifat-sifat objek yang dianalisis, tetapi antara beberapa peristiwa yang terjadi secara bersamaan, misalnya, algoritma Apriori;
  • 4) urutan (urutan), atau asosiasi berurutan (asosiasi berurutan),- mencari pola temporal antar transaksi, mis. keteraturan ditetapkan bukan di antara peristiwa-peristiwa yang terjadi secara bersamaan, tetapi antara peristiwa-peristiwa yang terhubung dalam waktu. Asosiasi adalah urutan dengan jeda waktu nol. Aturan pengurutan: setelah acara x setelah waktu tertentu, peristiwa Y akan terjadi;
  • 5) perkiraan (peramalan) - dibangun berdasarkan fitur data historis, mis. ada penilaian nilai yang dihilangkan atau nilai masa depan dari indikator numerik target. Metode statistik matematika, jaringan saraf, dll digunakan untuk memecahkan masalah peramalan;
  • 6) penentuan penyimpangan atau outlier (deteksi penyimpangan), analisis penyimpangan atau outlier - mendeteksi dan menganalisis data yang paling berbeda dari kumpulan data umum;
  • 7) penilaian (perkiraan)- memprediksi nilai berkelanjutan dari suatu fitur;
  • 8) analisis tautan (analisis tautan)- tugas menemukan dependensi dalam kumpulan data;
  • 9) visualisasi (visualisasi, penambangan grafik)- pembuatan gambar grafis dari data yang dianalisis. Metode grafis digunakan untuk menunjukkan adanya pola dalam data, misalnya penyajian data dalam dimensi 2D dan 3D;
  • 10) menyimpulkan ( ringkasan) - deskripsi kelompok objek tertentu dari kumpulan data yang dianalisis.

KDD adalah proses mengekstraksi pengetahuan yang berguna dari kumpulan data. Teknologi ini mencakup masalah: persiapan data, pemilihan fitur informatif, pembersihan data, penerapan metode Data Mining (DM), pasca-pemrosesan data dan interpretasi hasil.

Proses Penemuan Pengetahuan dalam Basis Data terdiri dari langkah-langkah berikut:

  • 1) pernyataan masalah - analisis tugas pengguna dan fitur area aplikasi, pemilihan serangkaian parameter input dan output;
  • 2) persiapan kumpulan data awal - pembuatan gudang data dan pengorganisasian skema untuk mengumpulkan dan memperbarui data;
  • 3) pra-pemrosesan data - berdasarkan penggunaan metode Data Mining, dari sudut pandang metode ini, data harus berkualitas tinggi dan benar;
  • 4) transformasi, normalisasi data - membawa informasi ke bentuk yang sesuai untuk analisis selanjutnya;
  • 5) Data Mining - analisis data otomatis berdasarkan penggunaan berbagai algoritme untuk menemukan pengetahuan (jaringan saraf, pohon keputusan, algoritme pengelompokan, membangun asosiasi, dll.);
  • 6) pasca-pemrosesan data - interpretasi hasil dan penerapan pengetahuan yang diperoleh dalam aplikasi bisnis.