Karar desteği için analitik veri işleme yöntemleri. Çevrimiçi analitik veri işleme (OLAP)

3.4 Analitik veri işleme yöntemleri

Mevcut veri ambarlarının yönetim kararlarının benimsenmesini kolaylaştırabilmesi için, bilginin analiste gerekli biçimde sunulması, yani ambardaki verilere erişmek ve işlemek için araçlar geliştirmiş olması gerekir.

Çoğu zaman, karar vericiler tarafından doğrudan kullanım beklentisiyle oluşturulan bilgi ve analitik sistemlerin kullanımı son derece kolaydır, ancak işlevsellik açısından ciddi şekilde sınırlıdır. Bu tür statik sistemlere Yönetici Bilgi Sistemleri (EIS) denir. Birçok soru içerirler ve günlük inceleme için yeterli olduklarından, karar verirken ortaya çıkabilecek tüm soruları yanıtlayamazlar. Böyle bir sistemin çalışmasının sonucu, kural olarak, dikkatli bir çalışmadan sonra analistin yeni bir dizi sorusu olduğu çok sayfalı raporlardır. Ancak, böyle bir sistemin tasarımında öngörülmeyen her yeni istek, önce resmi olarak tanımlanmalı, programcı tarafından kodlanmalı ve ancak daha sonra yürütülmelidir. Bu durumda bekleme süresi, her zaman kabul edilemez olan saatler ve günler olabilir.

Çevrimiçi analitik işleme... Veya Çevrimiçi Analitik İşleme, OLAP, veri ambarı organizasyonunun önemli bir bileşenidir. OLAP kavramı 1993 yılında Edgar Codd tarafından tanımlanmıştır ve çok değişkenli analiz uygulamaları için aşağıdaki gereksinimlere sahiptir:

- hiyerarşiler ve çoklu hiyerarşiler için tam destek (OLAP'ın temel gereksinimi) dahil olmak üzere verilerin çok boyutlu kavramsal gösterimi;

- kullanıcıya analiz sonuçlarını makul bir sürede (genellikle en fazla 5 saniye), hatta daha az detaylı bir analiz pahasına sağlamak;

- bu uygulama için tipik olan herhangi bir mantıksal ve istatistiksel analizi gerçekleştirme ve son kullanıcının erişebileceği bir biçimde kaydetme yeteneği;

- uygun kilitleme mekanizmalarının ve yetkili erişim araçlarının desteğiyle verilere çok kullanıcılı erişim;

- hacminden ve depolama konumundan bağımsız olarak gerekli herhangi bir bilgiye erişme yeteneği.

Bir OLAP sistemi birçok bileşenden oluşur. En üst düzeyde sunumda, sistem bir veri kaynağı, OLAP teknolojisine dayalı bir raporlama motoru, bir OLAP sunucusu ve bir istemci uygulama yeteneği sağlayan çok boyutlu bir veritabanı (MDB) içerir. Sistem, istemci-sunucu ilkesi üzerine kuruludur ve MDB sunucusuna uzaktan ve çok kullanıcılı erişim sağlar.

Bir OLAP sisteminin bileşenlerini düşünün.

Kaynaklar. OLAP sistemlerinde kaynak, analiz için verileri sağlayan sunucudur. OLAP ürününün kullanım kapsamına bağlı olarak, kaynak bir veri ambarı, genel verileri içeren devralınan bir veritabanı, bir dizi

finansal verileri veya yukarıdakilerin herhangi bir kombinasyonunu birleştiren tablolar.

Bilgi deposu. Ham veriler, veri ambarı oluşturma ilkelerine uygun olarak tasarlanmış bir havuzda toplanır ve saklanır. HD, ilişkisel bir veritabanıdır (RDB). Ana CD tablosu (olgu tablosu), istatistiksel bilgilerin toplandığı göstergelerin sayısal değerlerini içerir.

Çok boyutlu veritabanı Veri deposu, bir nesneler topluluğu olan çok boyutlu bir veritabanı için bilgi sağlayıcısı olarak hizmet eder. Bu nesnelerin ana sınıfları boyutlar ve ölçülerdir. Boyutlar, örneğin zaman, bölgeler, kurum türü vb. gibi verilerin endekslendiği değer kümelerini (parametreleri) içerir. Her boyut, veri ambarının ilgili boyut tablolarından değerlerle doldurulur. Ölçüm seti, araştırılan sürecin alanını tanımlar. Ölçüler çok boyutlu veri küpleridir (hiperküpler). Hiperküp, göstergenin parçası olan boyutların toplam miktarlarının yanı sıra verilerin kendisini de içerir. Göstergeler MDB'nin ana içeriğini oluşturur ve olgu tablosuna göre doldurulur. Hiperküpün her ekseni boyunca veriler, farklı ayrıntı düzeylerini temsil eden bir hiyerarşide düzenlenebilir. Bu, sonraki veri analizi sırasında veri sunumunu toplamak veya detaya inmek için kullanılacak hiyerarşik boyutlar oluşturmanıza olanak tanır. Hiyerarşik boyutun tipik bir örneği, bölgelere, bölgelere ve bölgelere göre gruplandırılmış bölgesel nesnelerin bir listesidir.

Sunucu. OLAP sunucusu, OLAP sisteminin uygulanan kısmıdır. Bu bileşen tüm işi (sistem modeline bağlı olarak) yapar ve aktif erişimin sağlandığı tüm bilgileri kendi içinde saklar. Sunucu mimarisi çeşitli kavramlar tarafından yönetilir. Özellikle OLAP ürünlerinin temel işlevsel özelliği, veri depolama için MDB veya RDB kullanılmasıdır.

İstemci uygulaması.Buna göre yapılandırılmış ve MDB'de saklanan veriler, istemci uygulaması kullanılarak analiz için kullanılabilir. Kullanıcı, verilere uzaktan erişme, karmaşık sorgular formüle etme, raporlar oluşturma ve keyfi veri alt kümelerini alma becerisine sahip olur. Bir rapor almak, belirli ölçüm değerlerinin seçimine ve hiperküpün bir bölümünün oluşturulmasına indirgenir. Kesit, seçilen ölçüm değerleri ile belirlenir. Geri kalan boyutlar için veriler özetlenmiştir.

OLAPistemcide ve sunucuda.Çok boyutlu veri analizi, koşullu olarak istemci ve sunucu OLAP araçlarına bölünebilen çeşitli araçlar kullanılarak gerçekleştirilebilir.

OLAP istemci araçları (örneğin, Microsoft'tan Excel 2000'deki Özet Tablolar veya Knosys'den ProClarity), toplu verileri hesaplayan ve görüntüleyen uygulamalardır. Bu durumda, toplu veriler, böyle bir OLAP aracının adres alanı içindeki önbellekte bulunur.

Kaynak veriler masaüstü VTYS'de yer alıyorsa, toplu verilerin hesaplanması OLAP aracının kendisi tarafından gerçekleştirilir. Orijinal verilerin kaynağı bir sunucu DBMS ise, istemci OLAP araçlarının çoğu sunucuya SQL sorguları gönderir ve sonuç olarak sunucuda hesaplanan toplu verileri alır.

Tipik olarak, OLAP işlevselliği istatistiksel veri işleme araçlarında ve bazı elektronik tablolarda uygulanır.

Birçok geliştirme aracı, en basit OLAP işlevselliğini uygulayan uygulamalar oluşturmanıza olanak tanıyan sınıf veya bileşen kitaplıkları içerir (Borland Delphi'deki Decision Cube bileşenleri ve Borland C ++ Builder gibi). Ayrıca birçok şirket, benzer işlevler sağlayan ActiveX denetimleri ve başka kitaplıklar sunar.

İstemci OLAP araçları, kural olarak, az sayıda boyutla (genellikle altıdan fazla olmayan) ve bu parametreler için az sayıda değerle kullanılır - çünkü elde edilen toplu veriler böyle bir aracın adres alanına sığmalıdır. ve boyutların sayısındaki artışla sayıları katlanarak artar.

Birçok OLAP istemci aracı, yeniden hesaplamamak için önbelleğin içeriğini toplu verilerle bir dosya olarak kaydetmenize izin verir. Ancak, bu fırsat genellikle toplu verileri başka kuruluşlara aktarmak veya yayınlamak amacıyla yabancılaştırmak için kullanılır.

Bir dosyada toplu veriler içeren bir önbellek depolama fikri, toplu verilerin kaydedildiği ve değiştirildiği ve bunları içeren depolamanın korunduğu sunucu OLAP araçlarında (örneğin, Oracle Express Server veya Microsoft OLAP Hizmetleri) daha da geliştirildi. , OLAP sunucusu adı verilen ayrı bir uygulama veya işlem tarafından gerçekleştirilir. İstemci uygulamaları böyle çok boyutlu bir depolama talep edebilir ve yanıt olarak belirli verileri alabilir. Bazı istemci uygulamaları da bu tür depolar oluşturabilir veya bunları değiştirilen kaynak verilere göre güncelleyebilir.

İstemci OLAP araçlarına kıyasla sunucu tabanlı OLAP araçlarını kullanmanın avantajları, masaüstü araçlarına kıyasla sunucu tarafı VTYS kullanmanın avantajlarına benzer: Sunucu tabanlı araçların kullanılması durumunda, toplu verilerin hesaplanması ve depolanması, ve istemci uygulaması yalnızca kendilerine yapılan sorguların sonuçlarını alır, bu da genel olarak ağ trafiğini, sorgu yürütme süresini ve istemci uygulaması için kaynak gereksinimlerini azaltmaya olanak tanır.

3.5 Çok boyutlu veri depolamanın teknik yönleri

OLAP uygulamalarında çok boyutluluk üç seviyeye ayrılabilir:

1... Çok boyutlu veri gösterimi- çok boyutlu görselleştirme ve veri işleme sağlayan son kullanıcı araçları; MDI katmanı, fiziksel veri yapısından soyutlar ve verileri çok boyutlu olarak ele alır.

Çok boyutlu işleme- çok boyutlu sorguları formüle etmek için bir araç (dil) (burada geleneksel ilişkisel SQL dilinin uygun olmadığı ortaya çıkıyor) ve böyle bir sorguyu işleyebilen ve yürütebilen bir işlemci.

Çok boyutlu depolama- çok boyutlu sorguların verimli bir şekilde yürütülmesini sağlayan verilerin fiziksel organizasyonu.

İlk iki seviye, tüm OLAP araçlarında zorunludur. Üçüncü seviye, yaygın olmasına rağmen gerekli değildir, çünkü çok boyutlu görünüm için veriler düzenli ilişkisel yapılardan da alınabilir. Bu durumda çok boyutlu sorgu işlemcisi, çok boyutlu sorguları ilişkisel VTYS tarafından yürütülen SQL sorgularına çevirir.

Herhangi bir veri ambarında - hem geleneksel hem de çok boyutlu - operasyonel sistemlerden alınan ayrıntılı verilerin yanı sıra, aya göre satış hacimlerinin toplamları, ürün kategorisi vb. gibi toplu göstergeler (toplam göstergeler) de depolanır. sorguların yürütülmesini hızlandırmanın tek amacı. Gerçekten de, bir yandan, bir kural olarak, depoda çok büyük miktarda veri birikir ve diğer yandan, analistler çoğu durumda ayrıntılı değil, genelleştirilmiş göstergelerle ilgilenir. Ve yıllık satışları hesaplamak için her seferinde milyonlarca bireysel satışın toplanması gerekseydi, hız büyük olasılıkla kabul edilemez olurdu. Bu nedenle, çok boyutlu bir veritabanına veri yüklerken, toplam göstergelerin tamamı veya bir kısmı hesaplanır ve kaydedilir.

Bununla birlikte, toplu verilerin kullanımı dezavantajlarla doludur. Başlıca dezavantajlar, depolanan bilgi miktarındaki artış (yeni boyutlar eklendiğinde, küpü oluşturan veri miktarı katlanarak artar) ve bunları yüklemek için gereken süredir. Üstelik bilgi miktarı onlarca hatta yüzlerce kat artabiliyor. Örneğin, yayınlanan standart testlerden birinde, 10 MB ham veri için tam toplam sayı 2,4 GB gerektirdi, yani veriler 240 kat arttı!

Toplamları hesaplarken veri hacminin artma derecesi, küpteki boyutların sayısına ve bu boyutların yapısına, yani boyutun farklı seviyelerindeki "ebeveynler" ve "torunlar" sayısının oranına bağlıdır. Toplamaları depolama problemini çözmek için, tüm olası toplamalardan uzakta hesaplarken, sorgu performansında önemli bir artış elde etmeyi sağlayan karmaşık şemalar kullanılır.

Hem ilk hem de toplu veriler şurada saklanabilir:

ilişkisel veya çok boyutlu yapılarda. Bu bağlamda, şu anda çok boyutlu verileri depolamanın üç yolu kullanılmaktadır:

MOLAP (Çok Boyutlu OLAP) - Kaynak ve toplu veriler çok boyutlu bir veritabanında depolanır. Verileri çok boyutlu yapılarda depolamak, verileri çok boyutlu bir dizi olarak manipüle etmenize olanak tanır, böylece toplam değerleri hesaplama hızı herhangi bir boyut için aynı olur. Ancak bu durumda, çok boyutlu veri tamamen orijinal ilişkisel veriyi içerdiğinden, çok boyutlu veri tabanı gereksiz hale gelir.

Bu sistemler tam bir OLAP işleme döngüsü sağlar. Sunucu bileşenine ek olarak, kendi entegre istemci arabirimlerini içerirler veya kullanıcı ile iletişim kurmak için harici elektronik tablo programlarını kullanırlar.

ROLAP (İlişkisel OLAP) - orijinal veriler, orijinal olarak bulunduğu yerde aynı ilişkisel veritabanında kalır. Toplu veriler, aynı veritabanında depolanmaları için özel olarak oluşturulmuş hizmet tablolarına yerleştirilir.

HOLAP (Hibrit OLAP) - orijinal veriler, orijinal olarak bulunduğu aynı ilişkisel veritabanında kalır ve toplu veriler çok boyutlu veritabanında depolanır.

Bazı OLAP araçları, verileri yalnızca ilişkisel yapılarda, bazıları ise yalnızca çok boyutlu yapılarda depolamayı destekler. Ancak, çoğu modern OLAP sunucusu tabanlı araç, veri depolamanın üç yöntemini de destekler. Depolama yönteminin seçimi, kaynak verilerin boyutuna ve yapısına, sorgu yürütme hızı gereksinimlerine ve OLAP küplerinin güncellenme sıklığına bağlıdır.

3.6 Veri madenciliği (Verimadencilik)

Veri Madenciliği terimi, çeşitli matematiksel ve istatistiksel algoritmalar aracılığıyla korelasyonları, eğilimleri ve ilişkileri bulma sürecini ifade eder: karar destek sistemleri için kümeleme, regresyon ve korelasyon analizi vb. Bu durumda, biriken bilgiler otomatik olarak bilgi olarak nitelendirilebilecek bilgilere genelleştirilir.

Modern Veri Madenciliği teknolojisi, veri alt örneklerinde bulunan kalıpları yansıtan ve sözde gizli bilgiyi oluşturan şablonlar kavramına dayanmaktadır.

Model araması, bu alt örneklerle ilgili herhangi bir a priori varsayım kullanmayan yöntemler kullanılarak gerçekleştirilir. Veri Madenciliğinin önemli bir özelliği, aranan modellerin standart olmaması ve açık olmamasıdır. Başka bir deyişle, Veri Madenciliği araçları, kullanıcılar tarafından varsayılan ilişkileri önceden kontrol etmek yerine, istatistiksel veri işleme araçlarından ve OLAP araçlarından farklıdır.

veriler arasında, mevcut verilere dayanarak, bu tür ilişkileri bağımsız olarak bulabilir ve doğaları hakkında hipotezler kurabilirler.

Genel olarak veri madenciliği süreci üç aşamadan oluşmaktadır.

kalıpları tanımlama (ücretsiz arama);

bilinmeyen değerleri tahmin etmek için ortaya çıkan kalıpları kullanma (tahmini modelleme);

bulunan kalıplardaki anormallikleri tanımlamak ve yorumlamak için tasarlanmış istisnaların analizi.

Bazen, bulunan kalıpların güvenilirliğini bulma ve kullanım arasında kontrol etmenin bir ara aşaması (doğrulama aşaması) açıkça ayırt edilir.

Veri Madenciliği yöntemleriyle tanımlanan beş standart model türü vardır:

1. Dernek arasında dolaylı olarak belirtilen bağlantıların bulunduğu kararlı nesne gruplarını seçmenize olanak tanır. Yüzde olarak ifade edilen tek bir öğenin veya öğe grubunun görülme sıklığına yaygınlık denir. Düşük bir yaygınlık oranı (yüzdenin binde birinden az), böyle bir ilişkinin anlamlı olmadığını gösterir. Dernekler kurallar şeklinde yazılır: A=> B, nerede A - paket, V - sonuç. Elde edilen her bir birliktelik kuralının önemini belirlemek için güven adı verilen bir değerin hesaplanması gerekir. A NS V(veya ilişki A ve B). Güven, ne sıklıkla A görünür V.örneğin, eğer (A / B)= %20, bu, bir ürün satın alırken A her beşinci durumda, mallar da satın alınır V.

Dernek kullanımının tipik bir örneği, satın alma yapısının analizidir. Örneğin bir süpermarkette araştırma yapılırken patates cipsi alanların %65'inin Coca-Cola da aldığı ve böyle bir set için indirim varsa %85'inde Cola satın alındığı tespit edilebilir. Bu sonuçlar pazarlama stratejilerinin şekillenmesinde değerlidir.

2. Sıra - çağrışımları zaman içinde tanımlamanın bir yöntemidir. Bu durumda, belirli olay gruplarının ardışık oluşumunu tanımlayan kurallar tanımlanır. Bu kurallar, komut dosyaları oluşturmak için gereklidir. Ek olarak, örneğin, belirli bir ürünün sonraki satışlarını gerektirebilecek tipik bir önceki satışlar dizisi oluşturmak için kullanılabilirler.

3. Sınıflandırma - genelleme aracı. Tekil nesneleri düşünmekten, bazı nesne kümelerini karakterize eden ve bu kümelere (sınıflara) ait nesneleri tanımak için yeterli olan genelleştirilmiş kavramlara geçmenizi sağlar. Kavram oluşturma sürecinin özü, sınıflara özgü örüntüler bulmaktır. Nesneleri tanımlamak için birçok farklı özellik (nitelik) kullanılır. Özellik tanımlarına dayalı kavram oluşturma problemi M.M. Bongart. Çözümü, iki temel prosedürün uygulanmasına dayanmaktadır: eğitim ve test. Eğitim prosedürlerinde, bir eğitim nesne setinin işlenmesine dayalı olarak bir sınıflandırma kuralı oluşturulur. Doğrulama (inceleme) prosedürü, nesneleri yeni bir (inceleme) örneğinden tanımak için elde edilen sınıflandırma kuralının kullanılmasından oluşur. Test sonuçları tatmin edici bulunursa, öğrenme süreci sona erer, aksi takdirde yeniden öğrenme sürecinde sınıflandırma kuralı rafine edilir.

4 kümeleme Bilgilerin (kayıtların) veri tabanından gruplara (kümelere) veya bu grupların eş zamanlı tespiti ile bölümlere dağıtılmasıdır. Sınıflandırmanın aksine, burada analiz için sınıfların ön ataması gerekli değildir.

5 zaman serisi tahmini zaman içinde incelenen nesnelerin niteliklerindeki değişikliklerin eğilimlerini belirlemek için bir araçtır. Zaman serilerinin davranışlarının analizi, incelenen özelliklerin değerlerini tahmin etmeyi mümkün kılar.

Bu tür problemleri çözmek için çeşitli Veri Madenciliği yöntemleri ve algoritmaları kullanılmaktadır. Veri Madenciliği, istatistik, bilgi teorisi, makine öğrenmesi, veritabanı teorisi gibi disiplinlerin kesişme noktasında geliştiği ve geliştiği için, çoğu Veri Madenciliği algoritma ve yönteminin bu disiplinlerden çeşitli yöntemlere dayalı olarak geliştirilmesi oldukça doğaldır.

Mevcut veri madenciliği yöntemlerinin çeşitliliğinden aşağıdakiler ayırt edilebilir:

regresyon, varyans ve korelasyon analizi(çoğu modern istatistik paketinde, özellikle SAS Institute, StatSoft, vb. şirketlerin ürünlerinde uygulanmaktadır);

analiz yöntemleri ampirik modellere dayalı belirli bir konu alanında (örneğin, pahalı olmayan finansal analiz araçlarında sıklıkla kullanılır);

sinir ağı algoritmaları- karmaşık bağımlılıkların yeniden üretilmesine izin veren süreçleri ve fenomenleri simüle etme yöntemi. Yöntem, biyolojik bir beynin basitleştirilmiş bir modelinin kullanımına dayanmaktadır ve ilk parametrelerin, "nöronlar" arasındaki mevcut bağlantılara göre dönüştürülen sinyaller ve tüm ağın yanıtı olarak kabul edilmesi gerçeğinden oluşur. ilk veriler, analizden kaynaklanan bir yanıt olarak kabul edilir. Bu durumda, hem ilk verileri hem de doğru cevapları içeren büyük bir örnek aracılığıyla ağ eğitimi adı verilen bağlantılar kullanılarak bağlantılar oluşturulur. Sinir ağları, sınıflandırma problemlerini çözmek için yaygın olarak kullanılmaktadır;

Bulanık mantıkçeşitli dilsel değişkenlerle temsil edilebilen bulanık doğruluk değerlerine sahip verileri işlemek için kullanılır. Bulanık bilgi gösterimi, örneğin XpertRule Miner sisteminde (Attar Software Ltd., İngiltere) ve ayrıca AIS, NeuFuz, vb.'de sınıflandırma ve tahmin problemlerini çözmek için yaygın olarak kullanılmaktadır.

endüktif kablolar veritabanında saklanan gerçeklerin genellemelerini elde etmenizi sağlar. Tümevarımsal öğrenme sürecinde, hipotezler sağlayan bir uzman yer alabilir. Buna denetimli öğrenme denir. Genelleme kuralları araştırması, otomatik olarak hipotezler üretilerek öğretmen olmadan da yapılabilir. Modern yazılımda, kural olarak, her iki yöntem birleştirilir ve hipotezleri test etmek için istatistiksel yöntemler kullanılır. Endüktif kablo kullanan bir sistem örneği, Attar Software Ltd. tarafından geliştirilen XpertRule Miner'dır. (Birleşik Krallık);

dayalı muhakeme benzer durumlar(“En yakın komşu” yöntemi) (Vaka temelli akıl yürütme - CBR), açıklamaları belirli bir duruma bir dizi özellik açısından benzer olan durumları bir veritabanında aramaya dayanır. Analoji ilkesi, benzer durumların sonuçlarının da birbirine yakın olacağını varsaymamızı sağlar. Bu yaklaşımın dezavantajı, önceki deneyimleri genelleştiren herhangi bir model veya kural oluşturmamasıdır. Ek olarak, çıktı sonuçlarının güvenilirliği, tümevarımsal çıkarım süreçlerinde olduğu gibi durumların tanımının eksiksizliğine bağlıdır. CBR kullanan sistem örnekleri şunlardır: KATE Tools (Acknosoft, Fransa), Pattern Recognition Workbench (Unica, ABD);

Karar ağaçları- köşeleri verileri sınıflandırmaya veya kararların sonuçlarını analiz etmeye izin veren üretim kurallarına karşılık gelen bir ağaç grafiği şeklinde bir görevi yapılandırma yöntemi. Bu yöntem, çok fazla değilse, sınıflandırma kuralları sisteminin görsel bir temsilini verir. Bu yöntemle basit problemler, sinir ağlarını kullanmaktan çok daha hızlı çözülür. Karmaşık problemler ve bazı veri türleri için karar ağaçları uygun olmayabilir. Ayrıca, bu yöntemin önemli bir sorunu vardır. Hiyerarşik veri kümelemenin sonuçlarından biri, birçok özel durum için çok sayıda eğitim örneğinin olmamasıdır ve bu nedenle sınıflandırma güvenilir olarak kabul edilemez. Karar ağacı yöntemleri birçok yazılım aracında uygulanmaktadır: С5.0 (RuleQuest, Avustralya), Clementine (Integral Solutions, İngiltere), SIPINA (Lyon Üniversitesi, Fransa), IDIS (Information Discovery, ABD);

evrimsel programlama- arama sürecinde değiştirilen, başlangıçta belirtilen algoritmaya dayalı olarak verilerin karşılıklı bağımlılığını ifade eden bir algoritmanın aranması ve oluşturulması; bazen karşılıklı bağımlılık arayışı, herhangi bir özel fonksiyon türü (örneğin, polinomlar) arasında gerçekleştirilir;

sınırlı arama algoritmaları veri alt gruplarındaki basit mantıksal olayların kombinasyonlarını hesaplayan.

3.7 EntegrasyonOLAPveVerimadencilik

Çevrimiçi analitik işleme (OLAP) ve veri madenciliği (Veri Madenciliği), karar destek sürecinin iki parçasıdır. Ancak günümüzde çoğu OLAP sistemi yalnızca çok boyutlu verilere erişim sağlamaya odaklanır ve kalıplar alanında çalışan Veri Madenciliği araçlarının çoğu tek boyutlu veri perspektifleriyle ilgilenir. Karar destek sistemleri için veri işleme verimliliğini artırmak için bu iki analiz türü birleştirilmelidir.

Halihazırda, böyle bir kombinasyonu belirtmek için "OLAP Veri Madenciliği" (çok boyutlu madencilik) birleşik bir terim bulunmaktadır.

"OLAP Veri Madenciliği" oluşturmanın üç ana yolu vardır:

"Küp sonra madencilik". Madencilik analizi yapma yeteneği, çok boyutlu bir kavramsal temsile yönelik bir sorgunun herhangi bir sonucu üzerinde, yani bir hiperküp göstergenin herhangi bir projeksiyonunun herhangi bir parçası üzerinde sağlanmalıdır.

Madencilik sonra küpleme. Bir depodan alınan veriler gibi, madencilik sonuçları sonraki çok değişkenli analiz için hiperkübik biçimde sunulmalıdır.

"Madencilik sırasında küpleme". Bu esnek entegrasyon yolu, genelleme seviyeleri arasında çok değişkenli analizin (geçiş) her adımının sonucu üzerinde aynı tür akıllı işleme mekanizmalarını otomatik olarak etkinleştirmenize, hiperküpün yeni bir parçasının çıkarılması, vb.).

için astronomi 11 sınıf [Metin ... onlara nasıl Bölüm bütün sistemler ... doçent ... Cheboksary, 2009. Sayı 10. S. 44 -49 .... Yazarlar- derleyiciler: N. ... özetlerdersler, ...

Çalışma Rehberi
... dersler... Hazırlık dersler matematik. yazı özetdersler dersler... kullanım bilgiteknolojiler ...
v lebedeva ile ben k kondaurova
Çalışma Rehberi
... dersler... Hazırlık dersler matematik. yazı özetdersler... Görsel yardımcıların hazırlanması. Okuma tekniği dersler... kullanım bilgiteknolojiler ...
M MEDYA İZLEME Mesleki eğitimin modernizasyonu Mart - Ağustos 2011
Özet
... 11 .08.2011 RNIMU'da "Ölü Ruhlar-2" onlara ... 3,11 -3,44 ... ... halka açık dersler liderler... Cheboksary... ve karalama özetler kitle - ... bilgisistemler ve teknolojiler. ... sistem eğitim, diyor doçent ... derleyiciler ... parçaları gerçek geliştirmek içerik ...

Konu 6

EKONOMİK BİLGİLERİN İŞLENMESİ İÇİN KURUMSAL BİLGİ SİSTEMLERİ

Kurumsal bilgi teknolojisi konsepti

Kurumsal bilgi teknolojisinin özü ve önemi

İş için çeşitli programlar arasında, "kurumsal yönetimde bilgi teknolojisi" terimi, geleneksel olarak "entegre yönetim otomasyon sistemleri" olarak anlaşılmaktadır. Diğer adları da bilinmektedir - kurumsal ölçekli sistemler, kurumsal bilgi sistemleri (CIS), kurumsal (veya entegre) yönetim sistemleri (KSU), otomatik kontrol sistemleri (ACS).

Kural olarak, karmaşık kontrol otomasyon sistemleri, başta finansal yönetim, depo yönetimi, satın alma ve satış yönetimi olmak üzere çeşitli işletme türleri için uygun "temel" evrensel çözümlerdir.Ancak bu aynı sistemler genellikle bir veya diğer özellikleri yansıtan ve bir içerik içeren endüstri çözümlerine sahiptir. uygun düzenleyici ve referans tabanı.

Örneğin, havacılık endüstrisi için SAP R / 3 sisteminin çözümü, tüm uçak parçalarının seri numaralarının, hizmet ömürlerinin, planlı değiştirme veya onarımın muhasebesini ve kontrolünü destekler, bu da yalnızca üretim güvenilirliğini değil, aynı zamanda güvenliğini de sağlar. yolcular.

Entegre yönetim sistemleri öncelikle çok disiplinli yapılar içeren büyük işletmelere odaklandığından, yalnızca gelişmiş bir dizi işlev sunmakla kalmaz, aynı zamanda çok kullanıcılı çalışma için güçlü platformlar ve sistem araçları kullanarak büyük miktarda bilginin güvenilir şekilde depolanmasını ve işlenmesini sağlar. ..

Modern bilgi teknolojileri, iletişim ve internet, kurumsal yönetişim için de önemli olan tek bir veritabanına uzaktan erişim sorunlarının çözülmesine olanak tanır.

Yapı konsepti

Çoğu geliştirici, yazılım ürünlerini yönetimsel olarak adlandırsa da (kurumsal, depo, finans vb.), özünde, kurumsal yönetimde kullanılan neredeyse tüm yazılım araçları, finansal ve ekonomik faaliyetlerin gerçeklerini ve belgelerini kaydetme, rapor oluşturma ve yetenek oluşturma yeteneğine sahip muhasebe sistemleridir. analitik özelliklerin izin verdiği bölümlerdeki referanslar. Yani, yapılandırılmış bilgi veritabanına girilir. Bu yapı, birbirine bağlı referans kitapları, sınıflandırıcılar, parametreler ve standart belgelerin formları tarafından bir dereceye kadar belirlenir. Veritabanında bulunan bilgilere göre, "kesme" olarak adlandırılan, enstrümantal yollarla "inşa edilir", "çıkarılır", "toplanır". Yönetim, bu tür verilere dayanarak, genellikle analitik raporlar olarak adlandırılan raporları ve referansları aldıktan sonra kararlar alabilir. Bu, söz konusu sınıfın sistemleriyle çalışmak için tipik konsept ve tipik teknolojidir.

"Galaktika", "BEST" ve "1C: Enterprise" gibi "yönetim" yazılımlarının işlevsel içeriği, sistem çözümleri, amacı ve kullanımı açısından sistemlerle etkileşim yöntemlerinin bu kadar farklı olması tesadüf değildir.

Bununla birlikte, örneğin OJSC “Uralelectromed” gibi işletmeler, kurumsal yönetim araçları için o kadar zorlu ve çeşitli gereksinimler ortaya koydular ki, bunları çok seviyeli bir temelde inşa etmek gerekli hale geldi. Genellikle sadece program kodlarını içeren sistemin çekirdeği, merkezi olanıdır. Kavramsal olarak önemli bir sonraki unsur, program kodlarını değiştirmeden en azından onu işyerlerinde yapılandırmaya, belirli işlemleri gerçekleştirmeye, yeni ve mevcut birincil ve raporlama formlarını değiştirmeye ve diğerlerini kullanmaya izin veren sistemin yerleşik araç takımıdır. parametrik ayarlama araçları. Daha gelişmiş sistemler, bir işletmenin çeşitli modellerini oluşturmak için yerleşik araçlara sahiptir: bilgi, organizasyonel, işlevsel vb. Ve son olarak, veritabanının kendisi.

Analitik bilgi işleme

Bir işletmenin faaliyetlerinin planlanması, operasyonel bilgilerin elde edilmesi ve analizine dayalı olarak doğru karar verilmesi, büyük miktarda verinin işlenmesi ile ilişkilidir. Kurumsal muhasebe sistemlerinde oluşturulan raporlar genellikle esnek değildir. Grafiksel olanlar da dahil olmak üzere istenen veri temsilini elde etmek için "döndürülemez", "genişletilemez" veya "daraltılamaz". Ne kadar çok “dilim” ve “kesik” yaparsanız, işletmenin resmini o kadar gerçekçi hayal edebilir ve iş süreçlerinin yönetimi konusunda en doğru kararı verebilirsiniz. Bu tür görevler için matematiksel ve ekonomik modellemenin yanı sıra yüksek performans gereklidir. Analitik modül "RepKo" sisteminde mevcuttur, daha iyi bilineni "Triumph-Analytica" sistemidir ("PARUS" Corporation - "Torah Center"). Muhasebe sistemleri, veritabanında depolanan bilgilere dayanarak çeşitli “bölümlerde” referanslar oluşturuyor gibi görünüyor, sadece olanı temsil ediyorlar. Ve analitik sistemler, belirli amaçlar için optimize ederek, belirli parametrelere veya kriterlere göre yeni bilgiler oluşturur. Bu nedenle, çevrimiçi analitik işleme (OLAP) olan bilgileri görüntülemek ve görselleştirmek için daha sık özel bir araca ihtiyacınız vardır. Depolamada biriken bilgilerin bir dizi uygun ve yüksek hızlı erişim, görüntüleme ve çok boyutlu analizini sağlar.

OLAP teknolojileri, bir durumu “eğer olursa…” şemasına göre modellemek ve çeşitli analitik raporları derlemek için kullanılır. Özel Batı yazılım ürünleri vardır.

Tipik olarak, kurumsal yönetim sistemlerinden gelen bilgiler, analitik veri işleme için özel programlara aktarılır. Birçok yerli geliştirici bu sorunları kendi başlarına çözmeye çalışır, örneğin Nikos-Soft (NS-2000 sistemi), Cepheus (Etalon kurumsal yönetim sistemi), KOMSOFT (KOMSOFT-STANDART "2.0), vb.

6.4. Kurumsal bilgi teknolojilerinin geliştirilmesi ve kullanımı için beklentiler

Modern araç ve platformların yanı sıra sistem araçlarının geliştirilmesi ve kullanılmasına ek olarak, yerli kurumsal sistemlerin geliştirilmesi, özellikle üretim açısından işlevsel doygunluklarını gerektirir.

Yönetim standartlarının uygulanmasına yönelik yaygın tutkuya rağmen, yerel yazılım pazarındaki lider oyuncular, çeşitli endüstri türleri için endüstri çözümleri geliştiriyorlar.

Firmaların geliştirmelerinin "gizliliğini" ortaya çıkarma korkularının azalması, "a"dan "z"ye her şeyi kendi başına geliştirmek yerine ürünlerini entegre etme çabalarını pekiştirmeye yardımcı oluyor. Bugün hiç kimse yeterli kaynağa sahip değil. Yeni bir kavramı kavramak, bir proje ve bir sistem yani içinde ne olduğuna göre niteliği değişen bir sistem geliştirmek yıllar alıyor. Ek olarak, yazılım ürünlerinin entegrasyonu gereksinimi, kural olarak, uzmanlaşmış, sistemler "çalışmaya" devam etmek ve bunları yeni edinilenlerle bilgisel olarak birleştirmek isteyen işletmeler tarafından da ortaya konmaktadır.

Farklı üreticilerin ürünleri için de entegrasyon gereklidir - karmaşık çözümleri özel çözümlerle birleştirmek adına:

- bütçeleme, mali ve ekonomik analiz, müşteri hizmetleri, analitik veri işleme, vb.

Kontrol sistemlerinin kendilerinin daha umut verici olmadığı, ancak geliştirici ile son kullanıcı arasında kalifiye aracılar için tasarlanmış, yaratılmaları için basit ve evrensel bir araç olduğu belirtilmelidir. Artık bu işlevler sistem yöneticileri ve analistler tarafından gerçekleştirilmeye çalışılıyor.

Böyle bir araç mevcutsa, tüm sektörlerdeki tüm işletmeler için "hazır" standart çözümler talep edilecektir.

İş geliştirme için ek bir araç olarak İnternet, yalnızca entegre bir yönetim sisteminin varlığında etkin bir şekilde kullanılabilir.

İnternet de dahil olmak üzere modern bilgi ve iletişim teknolojileri, yazılım kiralamayı organize etmeyi mümkün kılıyor olsa da, özellikle ülkemizde bu tür fırsatları kullanmanın yakın vadedeki olasılığı hakkında konuşmak için erken. Ve gizlilik nedenlerinden çok, düzen eksikliği ve güvenilir iletişim araçları nedeniyle değil.

Yerli işletmelerde bilgi teknolojilerini tam olarak olmasa da uygulama girişimleri ve deneyimler, uygulamada “kaosun otomatikleştirilemeyeceğini” kanıtlamıştır. İşletmenin ve işletmenin kendisinin bir ön yeniden düzenlenmesi ve ayrıca yönetim düzenlemelerinin (talimatlarının) inşası gereklidir. İşletme çalışanlarının bu tür işlerle kendi başlarına başa çıkması zordur. Özellikle piyasa koşullarındaki zaman faktörü göz önüne alındığında. Bu nedenle, şirketlere yardımcı olan ve çalışanlarına "darboğazları genişletmeyi", ana iş sürecini oluşturmayı, teknoloji geliştirmeyi, bilgi akışları oluşturmayı vb. öğreten danışmanlık şirketleri ile etkileşim uygulaması her yerde gelişmektedir. Kolaylaştırılmış bir süreci otomatikleştirmek daha kolay, daha kolay, daha ucuz ve daha hızlıdır.

Herkes işini yapmalı. Bir muhasebeci, mağaza görevlisi, satış müdürü ve diğer "konu" uzmanları, mevzuat veya iş planlarındaki değişiklikler nedeniyle belge biçimlerini iyileştirmemeli, sütunları genişletmemeli veya yerlerini değiştirmemelidir. Bu nedenle, yazılım pazarı yavaş yavaş bir "ürün"den "hizmet"e dönüşmektedir. Dış kaynak kullanımı gelişmeye başlar - işletmenin bazı işlevlerinin ilgili şirketlerin uzmanlarına devri. Ekipmanın bakımı, sistem yazılımı, sistemlerin uygulanan (işlevsel) bölümünün değiştirilmesi vb.

Kullanıcıları ve tüketicileri için bilgi teknolojisi ve metodolojik hizmetler, kurumsal yönetim sistemlerinin kullanımında en önemli ve alakalı hale geliyor.

8.3.1. Çevrimiçi Analitik İşleme (OLAP) Araçları

Çevrimiçi Analitik İşleme, karar vermeyi desteklemeyi ve analistlerin "Nesneler, ortamlar ve bunların etkileşimlerinin sonuçları neden diğerleri değil de böyle?" sorusunu yanıtlamasına yardımcı olmayı amaçlayan operasyonel (gerçek zamanlı) analitik işleme aracıdır. Bu durumda, analist kendisi bir dizi bilgi arasındaki ilişkinin versiyonlarını oluşturur ve bunları karşılık gelen yapılandırılmış bilgi veritabanlarındaki mevcut veriler temelinde kontrol eder.

ERP sistemleri, işlevsel alt sistemlerin bir parçası olarak analitik bileşenlerin varlığı ile karakterize edilir. Gerçek zamanlı olarak analitik bilgi oluşumunu sağlarlar. Bu bilgi, çoğu yönetim kararının temelidir.

OLAP teknolojileri hiperküpler - özel olarak yapılandırılmış veriler (diğer bir deyişle OLAP küpleri olarak adlandırılır) kullanır. Hiperküpün veri yapısında aşağıdakiler ayırt edilir:

Önlemler - özet istatistiksel sonuçlar oluşturmak için kullanılan nicel göstergeler (gereklilikler-temeller);

Boyutlar - ölçümlerin analiz edildiği bağlamda tanımlayıcı kategoriler (nitelikler-nitelikler).

Bir hiperküpün boyutu, bir ölçü için boyutların sayısıyla belirlenir. Örneğin, SATIŞ hiperküpü verileri içerir:

Boyutlar: tüketiciler, operasyon tarihleri, mal grupları, isimlendirme, modifikasyonlar, paketleme, depolar, ödeme türleri, sevkiyat türleri, oranlar, para birimi, kuruluşlar, departmanlar, sorumlu, dağıtım kanalları, bölgeler, şehirler;

Önlemler: planlanan miktar, gerçekleşen miktar, planlanan miktar, gerçekleşen miktar, planlanan ödemeler, gerçekleşen ödemeler, planlanan bakiye, gerçekleşen bakiye, satış fiyatı, sipariş yürütme süresi, geri ödeme tutarı.

Böyle bir hiperküp, analitik raporlar için tasarlanmıştır:

Tüketicilerin satın alma hacmine göre sınıflandırılması;

ABC yöntemiyle satılan malların sınıflandırılması;

Çeşitli tüketicilerin siparişlerinin yerine getirilme koşullarının analizi;

Satış hacimlerinin dönemlere, mallara ve mal gruplarına, bölgelere ve tüketicilere, iç departmanlara, yöneticilere ve satış kanallarına göre analizi;

Tüketicilerle karşılıklı yerleşim tahmini;

Tüketicilerden mal iadelerinin analizi; vesaire.

Analitik raporlar, keyfi bir boyut ve ölçü kombinasyonuna sahip olabilir, bunlar yönetim kararlarını analiz etmek için kullanılır. Analitik işleme, araçsal ve dilsel yollarla sağlanır. Herkese açık MS Excel elektronik tablosunda, bilgi teknolojisi "Pivot Tables" sunulmaktadır, bunların oluşturulması için ilk veriler şunlardır:

Liste (veritabanı) MS Excel - ilişkisel tablo;

Başka bir MS Excel pivot tablosu;

Aynı veya farklı çalışma kitaplarında bulunan birleştirilmiş MS Excel hücreleri aralığı;

Dış ilişkisel veritabanı veya OLAP küpü, veri kaynağı (.dsn, .ode biçimindeki dosyalar).

Harici veritabanlarına dayalı özet tablolar oluşturmak için MS Query programının yanı sıra ODBC sürücüleri de kullanılır. Orijinal MS Excel veri tabanının özet tablosu aşağıdaki yapıya sahiptir (Şekil 8.3).

Pivot tablonun düzeni aşağıdaki veri yapısına sahiptir (Şekil 8.4): boyutlar - bölüm kodu, konum; önlemler - iş deneyimi, maaş ve ikramiye. Aşağıda bir özet tablo bulunmaktadır. 8.2, ortalama iş tecrübesi ve maaş, ortalama iş tecrübesi ve ikramiye, maaş ve ikramiye arasındaki ilişkiyi analiz etmenizi sağlar.

Tablo 8.2

Bağlantı Analizi için Pivot Tablo

Masanın sonu. 8.2

Pivot tabloyu kullanarak analize devam etmek için şunları yapabilirsiniz:

Yeni toplamlar ekleyin (örneğin, ortalama maaş, ortalama ikramiye vb.);

Pivot tablonun kayıtlarını ve toplamlarını filtrelemeyi kullanın (örneğin, * Sayfa "alanındaki düzene yerleştirilen "Cinsiyet" niteliğine göre);

Yapısal göstergeleri hesaplayın (örneğin, maaşların ve ikramiye fonlarının bölümlere göre dağılımı - pivot tabloların ek işlenmesini, miktarın sütunlara göre paylarını kullanarak); vesaire.

MS Office paketi, pivot tablolar ve grafikler dahil olmak üzere elektronik tablo verilerini XTML formatında yayınlamanıza olanak tanır.

Microsoft Office Web Bileşenleri, Internet Explorer'da yayınlanan verilerle çalışmayı destekleyerek daha fazla analize olanak tanır (pivot tablonun veri yapısındaki değişiklikler, yeni özet toplamlarının hesaplanması).

8.3.2. Veri Madenciliği Araçları (DM)

DM araçları, verilerin çıkarılması ("kazı", "çıkarma") anlamına gelir ve analistin, faktörlerin etki derecesini ölçen modeller oluşturmak için kullanabileceği, işletmenin dijital veritabanlarında depolanan bilgiler arasındaki ilişkiyi tanımlamayı amaçlar. faiz. Ek olarak, bu tür araçlar, bir işletmenin dijital veri tabanlarındaki bilgi ilişkilerinin olası doğası hakkında hipotezler oluşturmak için faydalı olabilir.

Metin Madenciliği (TM) teknolojisi, stratejik kararlar almanıza yardımcı olabilecek eğilimleri, kalıpları ve ilişkileri araştırmak için büyük bilgi kümelerini analiz etmenize olanak tanıyan bir araçlar kümesidir.

Görüntü Madenciliği (IM) teknolojisi, şirket veritabanlarında saklanan veya harici bilgi kaynaklarından çevrimiçi arama sonucunda elde edilen çeşitli görsel görüntülerin tanınması ve sınıflandırılması için araçlar içerir.

Tüm verilerin işlenmesi ve saklanması sorunlarını çözmek için aşağıdaki yaklaşımlar kullanılır:

1) verileri kaydetmenize izin veren, ancak kullanıcının talebi üzerine saklanan bilgilere yavaş erişim sağlayan birkaç yedekleme sisteminin veya bir dağıtılmış belge yönetim sisteminin oluşturulması;

2) son derece esnek, ancak metin belgelerinin aranması ve saklanması için uyarlanmayan İnternet sistemlerinin inşası;

3) Kullanıcı isteklerine iyi hedeflenmiş, ancak bunlara yüklenen metin verileriyle ilgili açıklayıcı bilgilere sahip olmayan İnternet portallarının tanıtımı.

Yukarıda sıralanan sorunlardan arındırılmış metin işleme sistemleri iki kategoriye ayrılabilir: dilsel analiz sistemleri ve metin veri analiz sistemleri.

Metin Madenciliği teknolojisinin ana unsurları şunlardır:

Özetleme;

Özellik çıkarma

kümeleme

sınıflandırma

Soru cevaplama (soru cevaplama);

Tematik indeksleme;

Anahtar kelimelere göre arama (anahtar kelime arama);

Taksonomiler ve eş anlamlılar sözlüğünün oluşturulması ve bakımı.

Metin Madenciliği teknolojisini uygulayan yazılım ürünleri şunları içerir:

IBM Intelligent Miner for Text - bir dizi ayrı komut satırı yardımcı programı veya atlama; birbirinden bağımsız (ana vurgu veri madenciliği mekanizmalarıdır - bilgi alma);

Oracle InterMedia Text - kullanıcı istekleriyle en verimli şekilde çalışmanıza izin veren bir DBMS'ye entegre edilmiş bir set (metin verilerinin karmaşık çok amaçlı arama ve analizi bağlamında modern ilişkisel VTYS ile çalışmanıza izin verir);

Megaputer Text Analyst, Metin Madenciliği görevlerini çözmek için programa yerleştirilmiş bir dizi COM nesnesidir.

8.3.3. Akıllı bilgi teknolojisi

Bugün, kontrol otomasyonu alanında, kararların hazırlanmasının ön aşamasında bilgi analizi hakimdir - birincil bilgilerin işlenmesi, bir problem durumunun ayrıştırılması, kişinin bir bütün olarak durumu değil, süreçlerin yalnızca parçalarını ve ayrıntılarını öğrenmesine izin verir. Bu dezavantajın üstesinden gelmek için, en iyi uzmanların deneyimlerini kullanarak bilgi temelleri oluşturmayı ve aynı zamanda eksik bilgileri oluşturmayı öğrenmelisiniz.

Bilgi teknolojilerinin insan faaliyetinin çeşitli alanlarında kullanımı, bilgi hacimlerinin katlanarak büyümesi ve her durumda derhal yanıt verme ihtiyacı, ortaya çıkan sorunları çözmek için yeterli yolların aranmasını gerektirdi. Bunlardan en etkilisi bilgi teknolojilerinin entelektüelleştirilmesi yoludur.

Altında akıllı bilgi teknolojisi(ITT) genellikle aşağıdaki yetenekleri sağlayan bu tür bilgi teknolojilerini anlar:

Belirli faaliyet alanlarındaki yaratıcı problemleri çözmede belirli insanların, grupların, toplumların, bir bütün olarak insanlığın deneyimini yansıtan bilgi temellerinin varlığı, geleneksel olarak insan zekasının ayrıcalığı olarak kabul edilir (örneğin, karar verme gibi zayıf resmileştirilmiş görevler). , tasarım, anlam çıkarma, açıklama, eğitim vb.);

Bilgi temellerine dayalı düşünme modellerinin varlığı: kurallar ve mantıksal sonuçlar, tartışma ve akıl yürütme, durumların tanınması ve sınıflandırılması, genelleme ve anlama vb.;

Bulanık, gevşek, eksik, belirsiz verilere dayalı oldukça net kararlar verebilme;

Sonuçları ve kararları açıklama yeteneği, yani. bir açıklama mekanizmasının varlığı;

Öğrenme, yeniden eğitme ve dolayısıyla gelişme yeteneği.

Veri ve bilgide gizli kalıplar için gayri resmi arama teknolojileri Bilgi Keşfi (KD), akıllı sistemler tarafından bilgi işleme ilkelerine en yakın nesnelerin bilgi görüntülerinin oluşturulması ve yapılandırılması için en son teknolojilere dayanmaktadır.

Karar Destek (DS) karar destek bilgi teknolojisi bir uzman kabuğudur.

analistlerin, kurumun yapılandırılmış bilgileri temelinde bilgi yapıları arasındaki ilişkileri ve ilişkileri belirlemesini ve ayrıca karar vermenin olası sonuçlarını tahmin etmesini sağlayan sistemler veya özel uzman sistemler.

HTE geliştirme eğilimleri. İletişim ve iletişim sistemleri. Küresel bilgi ağları ve HTE, şirketlere ve zihinsel çalışmaya ilişkin anlayışımızı kökten değiştirebilir. İşyerinde çalışanların varlığı neredeyse gereksiz hale gelecektir. İnsanlar evden çalışabilir ve gerektiğinde ağlar aracılığıyla birbirleriyle etkileşime girebilir. Örneğin, İnternet üzerinden etkileşime giren dağıtılmış bir uzman ekibi tarafından Boeing-747 uçağının yeni bir modifikasyonunu yaratma konusundaki başarılı deneyim bilinmektedir. Herhangi bir gelişmede katılımcıların yeri daha küçük bir rol oynayacak, ancak katılımcıların yeterlilik düzeylerinin önemi artacaktır. HTE'nin hızlı gelişimini belirleyen bir diğer neden, iletişim sistemlerinin karmaşıklığı ve bunlar temelinde çözülen görevler ile ilişkilidir. Heterojen ve katı olmayan verileri analiz etme, bilgi güvenliğini sağlama, dağıtılmış sistemlerde kararlar alma vb.

Eğitim... Bugün, uzaktan eğitim eğitimde önemli bir rol oynamaya başlıyor ve HTE'nin tanıtılması bu süreci her öğrencinin ihtiyaç ve yeteneklerine göre önemli ölçüde kişiselleştirecek.

Gündelik Yaşam... Günlük yaşamın bilgilendirilmesi çoktan başladı, ancak HTE'nin gelişmesiyle birlikte temelde yeni fırsatlar ortaya çıkacak. Yavaş yavaş, tüm yeni işlevler bilgisayara aktarılacaktır: kullanıcının sağlığı üzerinde kontrol, nemlendiriciler, oda spreyleri, ısıtıcılar, iyonlaştırıcılar, müzik merkezleri, tıbbi teşhisler vb. gibi ev aletlerinin kontrolü. Başka bir deyişle, sistemler aynı zamanda bir kişinin ve evinin durumunun teşhis edicileri olacaktır. Bilgi ortamının insan ortamının bir parçası haline geleceği tesislerde konforlu bir bilgi alanı sağlanacaktır.

HTE'nin gelişimi için beklentiler... Şu anda HTE, gelişimlerinde temelde yeni bir aşamaya yaklaşmış görünüyor. Bu nedenle, son 10 yılda, yeni mantıksal model türlerinin geliştirilmesi, yeni modellerin ortaya çıkması nedeniyle HTE'nin yetenekleri önemli ölçüde genişledi.

teoriler ve kavramlar çıkar. HTE'nin geliştirilmesindeki kilit noktalar şunlardır:

Mantıksal çıkarımdan argümantasyon ve akıl yürütme modellerine geçiş;

İlgili bilgileri arayın ve açıklamalar oluşturun;

Metinleri anlama ve sentezleme;

Bilişsel grafikler, yani. bilginin grafik ve figüratif sunumu;

Çok etmenli sistemler;

Akıllı ağ modelleri;

Bulanık mantığa dayalı hesaplamalar, sinir ağları, genetik algoritmalar, olasılıksal hesaplamalar (birbirleriyle ve uzman sistemlerle çeşitli kombinasyonlarda gerçekleştirilir);

Meta bilgi sorunu.

Çok etmenli sistemler, gelecek vaat eden HTE'ler oluşturmak için yeni bir paradigma haline geldi. Burada bir ajanın, kendi hedef belirleme ve motivasyon sistemine, kendi eylem ve sorumluluk alanına sahip bağımsız bir entelektüel sistem olduğu varsayılmaktadır. Ajanlar arasındaki etkileşim, daha üst düzey bir sistem olan meta-zekâ ile sağlanır. Çok etmenli sistemlerde, sanal bir akıllı temsilci topluluğu modellenir - özerk, aktif, çeşitli sosyal ilişkilere giren nesneler - işbirliği ve işbirliği (arkadaşlık), rekabet, rekabet, düşmanlık vb. Modern sorunları çözmenin sosyal yönü, ileri entelektüel teknolojilerin - sanal organizasyonlar, sanal toplum - kavramsal yeniliğinin temel özelliğidir.

(?) Kontrol soruları ve görevleri

1. Bilgilendirme nesnesi olarak işletmenin bir tanımını verin. Kurumsal yönetim sisteminin gelişimini karakterize eden ana göstergeler nelerdir?

2. Sanayi işletmelerinin önde gelen bilgi teknolojileri yönetimini listeler.

3. İşletmelerin (şirketlerin) örgütsel ve stratejik gelişiminin ana bilgi teknolojileri nelerdir.

4. İş süreçlerini iyileştirmeyi amaçlayan stratejik yönetim standartlarının temelleri nelerdir? Bilgi teknolojisi BPM ve BPI oranı nedir?

5. Toplam kalite yönetimi (TKY) felsefesini tanımlar. Kalite ve bilgi teknolojisinin gelişim aşamaları nasıl ilişkilidir?

6. İşletmenin örgütsel gelişiminin ana hükümlerini adlandırın, stratejik yönetimin aşamalarını açıklayın. Grup stratejileri nelerdir?

7. İşletmenin iş modeli nasıl oluşturulur? Bir iş modelinin etkinliğini değerlendirmeye yönelik temel yaklaşımlar nelerdir?

8. Dengeli puan kartı nedir? BSC'nin ana bileşenleri nelerdir? BSC gösterge gruplarının karşılıklı ilişkileri nelerdir?

9. Bilgi sistemleri oluşturmak için metodolojik temelleri listeleyin. Sistem yaklaşımı nedir?

10. Bilgi sistemleri ve teknolojilerinin oluşumuna bilgisel bir yaklaşım nedir?

11. Bilgi sistemleri ve teknolojilerinin oluşumuna stratejik bir yaklaşım nedir?

12. Piyasadaki aracıların davranışlarını tanımlamaya yönelik nesne yönelimli yaklaşımın içeriği nedir? Nesnenin tanımını verin, etmen sistemlerinin analoglarını belirtin.

13. Bilgi ve iletişim teknolojilerine dayalı işletme yönetimini iyileştirmenin metodolojik ilkeleri nelerdir? ICT'nin amacı nedir?

14. Belge, belge akışı, belge akışı, belge yönetim sistemi tanımlarını verin.

15. Belge formunun düzeni nasıl tasarlanır? Belgenin bölgelerini, ayrıntılarının bileşimini adlandırın.

16. Doküman yönetim sisteminin temel bilgi teknolojileri nelerdir.

17. Birleşik bir dokümantasyon sistemi nedir? Birleşmenin genel ilkeleri nelerdir?

18. Örgütsel ve idari belgeleri tanımlayın, belge örnekleri sağlayın.

19. Elektronik belge yönetim sistemi için gereksinimler nelerdir?

20. Kurumsal bilgi sistemi nedir? Ana kontrol döngüleri nelerdir, fonksiyonel modüllerin bileşimi.

21. CIS için bildiğiniz yazılım ürünlerini adlandırın. Karşılaştırmalı özelliklerini veriniz.

W Edebiyat

1. İade J., Moriarty S. Pazarlama iletişimi. Entegre bir yaklaşım. SPb.; Harkov: Peter, 2001.

2. Brooking E. Entelektüel sermaye. Yeni binyılda başarının anahtarı. SPb.: Peter, 2001.

3. Godin V.V., Korpev I.K. Bilgi kaynakları yönetimi. M.: INFRA-M, 1999.

4. Ekonomide bilgi sistemleri ve teknolojileri: Ders kitabı. 2. baskı, Ekle. ve revize / M.I. Semenov, I.T. Trubilin, V.I. Loiko, T.P. Baranovskaya; Ed. VE. Loiko. Moskova: Finans ve İstatistik, 2003.

5. İş dünyasında bilgi teknolojisi / Ed. M. Zheleny. SPb.: Peter, 2002.

6. Kaplan Robert S., Norton David P. Dengeli Puan Kartı. Stratejiden eyleme / Per. İngilizceden M.: JSC "Olymp-Business", 2003.

7. Karagodin V.I., Karagodina BJI. Hayatın temeli olarak bilgi. Dubna: Phoenix, 2000.

8. Karminsky AM., Nesterov PZ. İş bilişimi. Moskova: Finans ve İstatistik, 1997.

9. Likhacheva T.N. Bilgi toplumunun hizmetinde bilgi teknolojileri // Ekonomik sistemlerde yeni bilgi teknolojileri. M., 1999.

10. Ostreykovsky V.A. Sistem teorisi. M.: Yüksek okul, 1997.

11. Piterkin S.V., Oladov N.A., Isaev D.V. Rusya için tam zamanında. ERP sistemlerini kullanma pratiği. 2. baskı. M.: Alpina Yayınevi, 2003.

12. Sokolov D.V. Sosyal iletişim teorisine giriş: Ders kitabı. ödenek. SPb.: Yayınevi SP6GUP, 1996.

13. Trofimov V.Z., Tomilov V.Z. Yönetimde bilgi ve iletişim teknolojileri: Ders kitabı. ödenek. SPb.: Yayınevi SPbGUEF, 2002.

Bir süredir, donanım ve yazılımın modern gelişim düzeyi, farklı yönetim düzeylerinde operasyonel bilgi veritabanlarının yaygın olarak bakımını mümkün kılmıştır. Faaliyetleri sırasında endüstriyel işletmeler, şirketler, departman yapıları, devlet kurumları ve idareler büyük miktarda veri biriktirmiştir. Gizli eğilimleri belirlemenin, bir geliştirme stratejisi oluşturmanın ve yeni çözümler bulmanın mümkün olduğu, yararlı analitik bilgileri çıkarmak için kendi içlerinde büyük bir potansiyel depolarlar.

Son yıllarda, dünyada kurumsal verileri depolamak ve analiz etmek için bir dizi yeni konsept şekillendi:

1) Veri Ambarı veya Veri Ambarı

2) Çevrimiçi Analitik İşleme (OLAP)

3) Veri madenciliği - IAD (Veri Madenciliği)

OLAP analitik veri işleme sistemleri, belirli bir süre boyunca biriken geçmiş verilerin istatistiksel olarak işlenmesini gerektiren daha karmaşık sorguları yerine getirmeye odaklanan karar destek sistemleridir. Satış, yönetim amaçlı pazarlama, Veri Madenciliği - veri madenciliği, yani. Kayıtların anlamını bulmadan anormallikleri ve eğilimleri bulmak için bir veritabanındaki bilgileri analiz etmenin bir yolu.

OLAP temelinde oluşturulan analitik sistemler, yapay zeka yöntemlerine dayalı bilgi işleme araçlarını ve grafiksel veri sunum araçlarını içerir. Bu sistemler, büyük miktarda tarihsel veri tarafından belirlenir ve bunlardan anlamlı bilgilerin çıkarılmasına izin verir, yani. verilerden bilgi edinin.

İşleme verimliliği, güçlü çok işlemcili teknoloji, gelişmiş analiz yöntemleri ve özel veri depoları kullanılarak elde edilir.

İlişkisel veritabanları, varlıkları genellikle iyi normalleştirilmiş ayrı tablolarda depolar. Bu yapı, operasyonel veritabanları (OLTP sistemleri) için uygundur, ancak karmaşık çoklu tablo sorguları içinde nispeten yavaştır. Değişiklik yerine sorgular için daha iyi bir model, uzamsal bir veritabanıdır.

OLAP sistemi, ilişkisel bir veritabanının anlık görüntüsünü alır ve onu sorgular için uzamsal bir modelde yapılandırır. OLAP'taki sorgular için talep edilen işlem süresi, ilişkisel bir veritabanındaki benzer sorguların yaklaşık %0,1'idir.

Operasyonel verilerden oluşturulan bir OLAP yapısına OLAP küpü denir. Bir yıldız şeması kullanılarak tabloların birleştirilmesinden bir küp oluşturulur. "Yıldız"ın merkezinde, sorgulanacak temel gerçekleri içeren bir olgu tablosu bulunur. Birden çok boyut tabloları olgu tablosuna birleştirilir. Bu tablolar, toplu ilişkisel verilerin nasıl analiz edilebileceğini gösterir. Olası toplamaların sayısı, orijinal verilerin hiyerarşik olarak görüntülenebileceği yolların sayısına göre belirlenir.

Verilen sistem sınıfları (OLAP ve OLTP) bir DBMS kullanımına dayanmaktadır, ancak sorgu türleri çok farklıdır. OLAP motoru, günümüzün en popüler veri analiz yöntemlerinden biridir. Bu sorunu çözmek için iki ana yaklaşım vardır. Bunlardan ilki Çok Boyutlu OLAP (MOLAP) - sunucu tarafında çok boyutlu bir veritabanı kullanarak mekanizmanın uygulanması ve ikincisi İlişkisel OLAP (ROLAP) - ilişkisel bir DBMS'ye SQL sorgularına dayalı "anında" küpler oluşturma. Bu yaklaşımların her birinin avantajları ve dezavantajları vardır. Masaüstü OLAP sisteminin genel şeması Şekil 2'de gösterilebilir.

Çalışma algoritması aşağıdaki gibidir:

1) düz bir tablo şeklinde veya bir SQL sorgusu yürütmenin sonucu olarak veri elde etmek;

2) verileri önbelleğe almak ve çok boyutlu bir kübe dönüştürmek;

3) oluşturulmuş küpü bir çapraz tablo veya diyagram vb. kullanarak görüntüleme.

Genel olarak, bir kübe isteğe bağlı sayıda ekran bağlanabilir. OLAP sistemlerinde kullanılan ekranlar genellikle iki türdür: çapraz tablolar ve grafikler.

Yıldız diyagramı. Buradaki fikir, her boyut için tabloların olması ve tüm gerçeklerin, bireysel boyutların anahtarlarından oluşan çoklu bir anahtar tarafından indekslenen tek bir tabloya yerleştirilmesidir. Codd terminolojisinde, yıldız şemasının her ışını, karşılık gelen boyut boyunca veri konsolidasyonunun yönünü tanımlar.

Çok seviyeli boyutlara sahip karmaşık problemlerde, yıldız şemasının uzantılarına - takımyıldız şeması ve kar tanesi şemasına - dönmek mantıklıdır. Bu durumlarda, farklı boyutlardaki özet düzeylerinin olası kombinasyonları için ayrı olgu tabloları oluşturulur. Bu, daha iyi performans sağlar, ancak genellikle veri fazlalığına ve çok sayıda olgu tablosu içeren veritabanının yapısında önemli komplikasyonlara yol açar.

takımyıldız diyagramı

Analitik veri işleme - Bu, uygun metodolojik destek ve belirli bir düzeyde uzman eğitimi gerektiren veri analizidir.

Modern bilgi teknolojileri, biriken birincil bilgileri analiz etme, analitik modeller oluşturma, hazır çözümler elde etme ve bunları pratikte kullanma süreçlerini otomatikleştirmeyi mümkün kılar. Ana gereksinimler Analiz yöntemlerine sunulan , verimlilik, basitlik, otomatizmdir. Bu kavram iki modern teknolojinin temelini oluşturur: Veri Madenciliği ve Veritabanlarında Bilgi Keşfi (KDD).

Veri madenciliği - daha önce bilinmeyen, önemsiz olmayan, pratik olarak faydalı ve insan faaliyetinin çeşitli alanlarında karar vermek için gerekli bilginin erişilebilir yorumunu ham verilerde keşfetme sürecidir (bu yönün kurucularından biri olan G. Pyatetsky-Shapiro'nun tanımı) .

Veri Madenciliği teknolojisi, açık olmayan kalıpları bulmayı amaçlar. Veri analizinin aşamaları şunlardır:

1) sınıflandırma ( sınıflandırma) - incelenen veri kümesinin nesne gruplarını karakterize eden özelliklerin tespiti - sınıflar. Sınıflandırma problemi için kullanılan çözüm yöntemleri: en yakın komşuluk yöntemleri ( en yakın komşu) ve ^ '- en yakın komşu ( k-en yakın komşu) -, Bayes ağları (Bayes ağları) -, karar ağaçlarının indüksiyonu; nöral ağlar (nöral ağlar) -,
2) kümeleme (kümeleme)- Nesne sınıfları başlangıçta tanımlanmadığından, nesneleri gruplara ayırma. Kümeleme problemini çözmek için bir yöntem örneği: kendi kendini organize eden Kohonen haritaları - denetimsiz öğrenmeye sahip bir sinir ağı. Bu haritaların önemli bir özelliği, verileri iki boyutlu bir harita biçiminde sunarak çok boyutlu özellik uzaylarını bir düzlemde gösterebilmeleridir;
3) dernek (dernekler)- veri kümesindeki ilgili olaylar arasındaki kalıpları belirleme. Bu modeller, analiz edilen nesnenin özelliklerine göre değil, aynı anda meydana gelen birkaç olay arasında, örneğin Apriori algoritması;
4) sıra (sıra), veya sıralı ilişkilendirme (sıralı ilişkilendirme),- işlemler arasındaki zamansal kalıpları arayın, ör. örüntüler aynı anda meydana gelen olaylar arasında değil, zamanla bağlantılı olaylar arasında kurulur. İlişkilendirme, zaman gecikmesi sıfır olan dizilerdir. Sıralama kuralı: olaydan sonra x belli bir süre sonra Y olayı gerçekleşecek;
5) tahmin (tahmin) - tarihsel verilerin özellikleri temelinde inşa edilmiştir, yani. hedef sayısal göstergelerin ihmal edilen veya gelecekteki değerlerinin bir değerlendirmesi vardır. Tahmin problemlerini çözmek için matematiksel istatistik yöntemleri, sinir ağları vb.
6) sapmaların veya aykırı değerlerin belirlenmesi (sapma tespiti), sapmaların veya aykırı değerlerin analizi - genel veri setinden en farklı olan verilerin tespiti ve analizi;
7) derecelendirme (tahmin)- bir özelliğin sürekli değerlerini tahmin etmek;
8) bağlantı analizi (bağlantı analizi)- bir veri kümesindeki bağımlılıkları bulma görevi;
9) görselleştirme (görselleştirme, grafik madenciliği)- analiz edilen verilerin grafik görüntüsünün oluşturulması. Verilerdeki kalıpların varlığını göstermek için grafik yöntemler kullanılır, örneğin verilerin 2B ve 3B boyutlarda sunulması;
10) özetlemek ( özetleme) - analiz edilen veri kümesinden belirli nesne gruplarının açıklaması.

KDD bir veri koleksiyonundan yararlı bilgiyi çıkarma sürecidir. Bu teknoloji şu konuları içerir: veri hazırlama, bilgilendirici özelliklerin seçimi, veri temizleme, Veri Madenciliği (DM) yöntemlerinin uygulanması, verilerin sonradan işlenmesi ve sonuçların yorumlanması.

Veritabanlarında Bilgi Keşfi süreci aşağıdaki adımlardan oluşur:

1) problem ifadesi - uygulama alanının kullanıcı görevlerinin ve özelliklerinin analizi, bir dizi girdi ve çıktı parametresinin seçimi;
2) ilk veri setinin hazırlanması - bir veri ambarının oluşturulması ve verilerin toplanması ve güncellenmesi için bir planın organizasyonu;
3) veri ön işleme - Veri Madenciliği yöntemlerinin kullanımına dayalı olarak, bu yöntem açısından veriler yüksek kalitede ve doğru olmalıdır;
4) verilerin dönüştürülmesi, normalleştirilmesi - bilgiyi sonraki analiz için uygun bir forma getirmek;
5) Veri Madenciliği - bilgi bulmak için çeşitli algoritmaların kullanımına dayalı otomatik veri analizi (sinir ağları, karar ağaçları, kümeleme algoritmaları, dernek kurma vb.);
6) verilerin sonradan işlenmesi - sonuçların yorumlanması ve iş uygulamalarında kazanılan bilgilerin uygulanması.