Analitikus adatfeldolgozási módszerek a döntéshozatalhoz. Online elemző adatfeldolgozás (OLAP)

3.4 Az analitikai adatfeldolgozás módszerei

Annak érdekében, hogy a meglévő adattárházak megkönnyítsék a menedzsment döntések elfogadását, az információkat a szükséges formában kell bemutatni az elemzőnek, vagyis ki kell dolgoznia a raktárban lévő adatokhoz való hozzáférés és feldolgozás eszközeit.

Nagyon gyakran a döntéshozók közvetlen használatának elvárásával létrehozott információs és elemző rendszerek rendkívül könnyen használhatóak, de funkcionalitásukban erősen korlátozottak. Az ilyen statikus rendszereket Executive Information Systems -nek (EIS) nevezik. Sok lekérdezést tartalmaznak, és elegendőek a mindennapi felülvizsgálathoz, és nem tudnak válaszolni minden olyan kérdésre, amely felmerülhet a döntések meghozatalakor. Az ilyen rendszer munkájának eredménye, általában, többoldalas jelentések, alapos tanulmányozás után, amelyek az elemző új kérdéssorozattal rendelkeznek. Mindazonáltal minden olyan új kérést, amelyet egy ilyen rendszer kialakításában nem láttak előre, hivatalosan le kell írni, kódolni kell a programozónak, és csak ezután kell végrehajtani. A várakozási idő ebben az esetben órák és napok lehet, ami nem mindig elfogadható.

Online elemző feldolgozás... Vagy az on-line analitikai feldolgozás, az OLAP az adattárolási szervezet kulcsfontosságú eleme. Az OLAP koncepciót 1993-ban írta le Edgar Codd, és a következő követelményekkel rendelkezik a többváltozós elemzési alkalmazásokhoz:

- az adatok többdimenziós koncepcionális ábrázolása, beleértve a hierarchiák és több hierarchia teljes támogatását (az OLAP egyik alapvető követelménye);

- a felhasználó rendelkezésére bocsátani az elemzési eredményeket ésszerű időn belül (általában legfeljebb 5 s), még kevésbé részletes elemzés árán is;

- képes bármilyen logikai és statisztikai elemzést elvégezni, amely erre az alkalmazásra jellemző, és elmentheti azt a végfelhasználó számára hozzáférhető formában;

- többfelhasználós hozzáférés az adatokhoz a megfelelő zárolási mechanizmusok és engedélyezett hozzáférési eszközök támogatásával;

- bármely szükséges információ elérésének képessége, annak mennyiségétől és tárolási helyétől függetlenül.

Az OLAP rendszer sok összetevőből áll. A bemutatás legmagasabb szintjén a rendszer tartalmaz egy adatforrást, egy többdimenziós adatbázist (MDB), amely lehetővé teszi az OLAP technológián alapuló jelentési motor, az OLAP szerver és az ügyfél megvalósítását. A rendszer az ügyfél-szerver elvre épül, és távoli és többfelhasználós hozzáférést biztosít az MDB szerverhez.

Tekintsük az OLAP rendszer összetevőit.

Források. Az OLAP rendszerek forrása az a szerver, amely az adatokat elemzésre szolgáltatja. A forrás az OLAP termék felhasználási körétől függően lehet adattárház, általános adatokat tartalmazó öröklött adatbázis, halmaz

pénzügyi adatokat kombináló táblázatok, vagy a fentiek bármely kombinációja.

Adattároló. A nyers adatokat az adattárházak építésének elveivel összhangban kialakított adattárban gyűjtik és tárolják. A HD egy relációs adatbázis (RDB). A fő CD -táblázat (ténytáblázat) tartalmazza azon mutatók számértékeit, amelyekhez statisztikai információkat gyűjtenek.

Többdimenziós adatbázis Az adattároló információszolgáltatóként szolgál egy többdimenziós adatbázishoz, amely objektumok gyűjteménye. Ezen objektumok fő osztályai a méretek és a mértékek. A dimenziók olyan értékek (paraméterek) halmazát tartalmazzák, amelyek alapján az adatokat indexelik, például az időt, a régiókat, az intézmény típusát stb. A méréshalmaz határozza meg a vizsgált folyamat területét. A mértékek többdimenziós adatkockák (hiperkockák). A hiperkocka magában foglalja az adatokat, valamint az indikátor részét képező dimenziók összesített összegeit. A mutatók képezik az MDB fő tartalmát, és a ténytábla szerint töltik ki. A hiperkocka minden tengelye mentén az adatok különböző részletezési szinteket képviselő hierarchiába rendezhetők. Ez lehetővé teszi, hogy hierarchikus dimenziókat hozzon létre, amelyeket a későbbi adatelemzés során az adatok bemutatására összesítenek vagy részleteznek. A hierarchikus dimenzió tipikus példája a területi objektumok körzetek, régiók, körzetek szerint csoportosított listája.

Szerver. Az OLAP szerver az OLAP rendszer alkalmazott része. Ez az összetevő elvégzi az összes munkát (a rendszermodelltől függően), és magában tárolja az összes olyan információt, amelyhez aktív hozzáférést biztosít. A szerver architektúráját különböző koncepciók szabályozzák. Különösen az OLAP termékek fő funkcionális jellemzője az MDB vagy RDB használata az adattároláshoz.

Ügyfél alkalmazás.A megfelelő módon strukturált és az MDB-ben tárolt adatok a kliens alkalmazás segítségével elemzésre állnak rendelkezésre. A felhasználó képessé válik az adatok távoli elérésére, összetett lekérdezések megfogalmazására, jelentések készítésére és tetszőleges adathalmazok fogadására. A jelentés megszerzése a konkrét mérési értékek kiválasztására és a hiperkocka egy részének felépítésére korlátozódik. A keresztmetszetet a kiválasztott mérési értékek határozzák meg. A többi dimenzió adatait összefoglaljuk.

OLAPa kliensen és a szerveren. A többdimenziós adatelemzés különféle eszközökkel elvégezhető, amelyek feltételesen kliens és szerver OLAP eszközökre oszthatók.

Az OLAP-klienseszközök (például a Microsoft Excel 2000-es kimutatástáblái vagy a Knosys ProClarity) olyan alkalmazások, amelyek összesített adatokat számítanak ki és jelenítenek meg. Ebben az esetben magukat az összesített adatokat az ilyen OLAP -eszköz címterében található gyorsítótár tartalmazza.

Ha a forrásadatokat az asztali DBMS tartalmazza, akkor az összesített adatok kiszámítását maga az OLAP eszköz végzi. Ha az eredeti adatok forrása egy szerver DBMS, akkor a kliens OLAP -eszközök közül sok SQL -lekérdezéseket küld a szervernek, és ennek eredményeként fogadja a szerveren kiszámított összesített adatokat.

Általában az OLAP funkciót a statisztikai adatfeldolgozó eszközökben és néhány táblázatban valósítják meg.

Sok fejlesztőeszköz osztályok vagy összetevők könyvtárát tartalmazza, amelyek lehetővé teszik a legegyszerűbb OLAP -funkciókat megvalósító alkalmazások létrehozását (például a Döntéskocka -összetevők a Borland Delphi -ben és a Borland C ++ Builderben). Ezenkívül sok vállalat kínál ActiveX-vezérlőket és más, hasonló funkciókat biztosító könyvtárakat.

A kliens OLAP -eszközöket általában kis dimenziószámmal (általában legfeljebb hat) és kis értékű értékekkel használják ezekhez a paraméterekhez - mivel a kapott összesített adatoknak bele kell illeszkedniük egy ilyen eszköz címterébe , és számuk a dimenziók számának növekedésével exponenciálisan nő.

Sok ügyfél OLAP eszköz lehetővé teszi, hogy a gyorsítótár tartalmát fájl formájában összesített adatokkal mentse, nehogy újraszámítsa őket. Ezt a lehetőséget azonban gyakran használják az összesített adatok elidegenítésére más szervezetek számára történő továbbítás vagy közzététel céljából.

Az összesített adatokat tartalmazó gyorsítótár fájlban való tárolásának ötletét tovább fejlesztették a szerver OLAP eszközeiben (például Oracle Express Server vagy Microsoft OLAP Services), amelyben az összesített adatok mentése és módosítása, valamint az azokat tartalmazó tároló fenntartása , külön OLAP szerver nevű alkalmazás vagy folyamat hajtja végre. Az ügyfélalkalmazások kérhetnek ilyen többdimenziós tárolást, és válaszul kaphatnak bizonyos adatokat. Egyes kliens alkalmazások is létrehozhatnak ilyen tárolókat, vagy frissíthetik azokat a megváltozott forrásadatoknak megfelelően.

A szerver-alapú OLAP-eszközök használatának előnyei az ügyfél-OLAP-eszközökhöz képest hasonlóak a kiszolgálóoldali DBMS-ek használatának előnyeivel az asztali eszközökhöz képest: szerver-alapú eszközök használata esetén az összesített adatok kiszámítása és tárolása a kiszolgálóra, és az ügyfélalkalmazás csak a lekérdezések eredményeit kapja meg hozzájuk, ami általában véve lehetővé teszi a hálózati forgalom, a lekérdezés végrehajtási idejének és az ügyfélalkalmazás erőforrásigényének csökkentését.

3.5 A többdimenziós adattárolás technikai vonatkozásai

Az OLAP -alkalmazások multidimenzionalitása három szintre osztható:

1... Többdimenziós adatábrázolás- végfelhasználói eszközök, amelyek többdimenziós vizualizációt és adatmanipulációt biztosítanak; az MDI réteg absztrahál a fizikai adatszerkezetből, és többdimenziósként kezeli az adatokat.

    Többdimenziós feldolgozás- eszköz (nyelv) a többdimenziós lekérdezések megfogalmazásához (a hagyományos relációs SQL nyelv itt alkalmatlannak bizonyul), és egy processzor, amely képes feldolgozni és végrehajtani egy ilyen lekérdezést.

    Többdimenziós tárolás- az adatok fizikai szervezésének eszközei, amelyek biztosítják a többdimenziós lekérdezések hatékony végrehajtását.

Az első két szint kötelező minden OLAP -eszközben. A harmadik szint, bár elterjedt, nem szükséges, mivel a többdimenziós nézet adatai a hétköznapi relációs struktúrákból is lekérhetők. A többdimenziós lekérdezés processzor ebben az esetben lefordítja a többdimenziós lekérdezéseket SQL lekérdezésekké, amelyeket a relációs DBMS hajt végre.

Bármely adattárházban - mind hagyományos, mind többdimenziós - az operációs rendszerekből lekért részletes adatokkal együtt összesített mutatókat (összefoglaló mutatókat) is tárolnak, például az értékesítési mennyiségek összegét havonta, termékkategóriánként stb. Az aggregátumokat kifejezetten tároljuk kizárólagos célja a lekérdezések végrehajtásának felgyorsítása. Valójában egyrészt általában nagyon nagy mennyiségű adat halmozódik fel a raktárban, másrészt az elemzőket a legtöbb esetben nem a részletes, hanem az általános mutatók érdeklik. És ha az éves eladások kiszámításához minden alkalommal több millió egyedi eladást kellene összesíteni, a sebesség valószínűleg elfogadhatatlan lenne. Ezért az adatok többdimenziós adatbázisba való betöltésekor minden összefoglaló mutatót vagy azok egy részét kiszámítja és elmenti.

Az összesített adatok használata azonban hátrányokkal jár. A fő hátrányok a tárolt információk mennyiségének növekedése (új dimenziók hozzáadásával exponenciálisan növekszik a kockát alkotó adatok mennyisége) és a betöltésükhöz szükséges idő. Sőt, az információ mennyisége akár tízszeresére, sőt akár százszorosára is nőhet. Például az egyik közzétett szabványos tesztben a 10 MB nyers adat teljes összesített számához 2,4 GB szükséges, vagyis az adatok 240 -szeresére nőttek!

Az adatmennyiség növekedése az aggregátumok kiszámításakor függ a kocka dimenzióinak számától és e dimenziók szerkezetétől, vagyis a „szülők” és „leszármazottak” számának arányától a dimenzió különböző szintjein. Az aggregátumok tárolásának problémájának megoldására olyan összetett sémákat használnak, amelyek lehetővé teszik, hogy az összes lehetséges aggregátumtól távol számítva jelentős mértékben növeljék a lekérdezési teljesítményt.

A kezdeti és az összesített adatok egyaránt tárolhatók

relációs, vagy többdimenziós struktúrákban. E tekintetben jelenleg három módszert alkalmaznak a többdimenziós adatok tárolására:

MOLAP (Többdimenziós OLAP) – A forrás- és összesített adatok egy többdimenziós adatbázisban tárolódnak. Az adatok többdimenziós struktúrákban való tárolása lehetővé teszi az adatok többdimenziós tömbként történő kezelését, így az összesített értékek kiszámításának sebessége bármelyik dimenziónál azonos. Ebben az esetben azonban a többdimenziós adatbázis redundánsnak bizonyul, mivel a többdimenziós adatok teljesen tartalmazzák az eredeti relációs adatokat.

Ezek a rendszerek teljes körű OLAP -feldolgozást biztosítanak. Ezek vagy a szerverkomponensen kívül saját integrált ügyfélinterfészt is tartalmaznak, vagy külső táblázatkezelő programokkal kommunikálnak a felhasználóval.

ROLAP (Relációs OLAP) - az eredeti adatok ugyanabban a relációs adatbázisban maradnak, ahol eredetileg találhatók. Az összesített adatokat a szolgáltatástáblákba helyezik, amelyeket kifejezetten ugyanabban az adatbázisban való tárolásukhoz hoztak létre.

HOLAP (Hibrid OLAP) - az eredeti adatok ugyanabban a relációs adatbázisban maradnak, ahol eredetileg találhatók, és az összesített adatokat a többdimenziós adatbázis tárolja.

Egyes OLAP -eszközök csak relációs struktúrákban támogatják az adatok tárolását, mások csak többdimenziós struktúrákban. A legtöbb modern OLAP szerver alapú eszköz azonban támogatja mindhárom adattárolási módot. A tárolási módszer megválasztása a forrásadatok méretétől és szerkezetétől, a lekérdezések végrehajtásának sebességétől és az OLAP -kockák frissítésének gyakoriságától függ.

3.6 Adatbányászat (AdatBányászati)

Az adatbányászat kifejezés az összefüggések, trendek és kapcsolatok megtalálásának folyamatát jelöli különféle matematikai és statisztikai algoritmusok segítségével: klaszterezés, regresszió- és korrelációelemzés stb. döntéstámogató rendszerek esetében. Ebben az esetben a felhalmozott információt automatikusan tudásként jellemezhető információvá általánosítják.

A modern adatbányászati ​​technológia a sablonok koncepcióján alapul, amelyek tükrözik az adatrészmintákban rejlő mintákat és alkotják az úgynevezett rejtett tudást.

A minták keresése olyan módszerekkel történik, amelyek nem használnak a priori feltételezéseket ezekről a részmintákról. Az adatbányászat egyik fontos jellemzője, hogy a keresett minták nem szabványosak és nem nyilvánvalóak. Más szóval, az adatbányászati ​​eszközök abban különböznek a statisztikai adatfeldolgozó eszközöktől és az OLAP -eszközöktől, hogy ahelyett, hogy előre ellenőriznék a felhasználók által feltételezett kapcsolatokat

az adatok között a rendelkezésre álló adatok alapján képesek önállóan megtalálni az ilyen kapcsolatokat, valamint hipotéziseket felállítani a természetükről.

Az adatbányászati ​​folyamat általában három szakaszból áll

    minták azonosítása (ingyenes keresés);

    a feltárt minták használata ismeretlen értékek előrejelzésére (prediktív modellezés);

    kivételek elemzése, amelynek célja a talált minták anomáliáinak azonosítása és értelmezése.

Néha egyértelműen megkülönböztethető a talált minták megbízhatóságának ellenőrzésének közti szakasza a megtalálás és a használat között (az érvényesítés szakasza).

Az adatbányászati ​​módszerekkel öt szabványos mintát különböztetünk meg:

1. Társulás lehetővé teszi az objektumok stabil csoportjainak kiválasztását, amelyek között implicit hivatkozások vannak. Az egyes elemek vagy elemcsoportok előfordulási gyakoriságát százalékban kifejezve prevalenciának nevezzük. Az alacsony előfordulási arány (kevesebb mint ezrelék) azt sugallja, hogy egy ilyen összefüggés nem jelentős. Az egyesületeket szabályok formájában írják fel: A=> B, ahol A - csomag, V - következmény. Az egyes kapott asszociációs szabályok fontosságának meghatározásához ki kell számítani a megbízhatóságnak nevezett értéket A Nak nek V(vagy kapcsolat A és B). A magabiztosság megmutatja, milyen gyakran mikor A Megjelenik V. Például, ha d (A / B)= 20%, ez azt jelenti, hogy termék vásárlásakor A minden ötödik esetben az árut is megvásárolják V.

A társulás használatának tipikus példája a vásárlások szerkezetének elemzése. Például egy szupermarketben végzett vizsgálat során megállapítható, hogy a burgonya chipset vásárlók 65% -a Coca-Colát is fogyaszt, és ha van kedvezmény egy ilyen készletre, akkor az esetek 85% -ában Cola-t vásárolnak. Ezek az eredmények értékesek a marketingstratégiák kialakításában.

2. Sorrend - ez az asszociációk időben történő azonosításának módszere. Ebben az esetben szabályokat határoznak meg, amelyek leírják bizonyos eseménycsoportok egymást követő előfordulását. Az ilyen szabályok elengedhetetlenek a forgatókönyvek készítéséhez. Ezenkívül felhasználhatók például egy tipikus előzetes értékesítési halmaz kialakítására, amely egy adott termék későbbi értékesítését vonhatja maga után.

3. Osztályozás - általánosító eszköz. Lehetővé teszi az egyes objektumok mérlegelésétől az általánosított fogalmak felé való elmozdulást, amelyek néhány objektumhalmazt jellemeznek, és elegendőek az ezekhez a halmazokhoz (osztályokhoz) tartozó objektumok felismeréséhez. A fogalomalkotási folyamat lényege, hogy megtaláljuk az osztályokban rejlő mintákat. Az objektumok leírására sok különböző jellemzőt (attribútumot) használnak. A jellemzőleírásokon alapuló fogalomalkotás problémáját M.M. Bongart. Megoldása két alapvető eljárás alkalmazásán alapul: képzés és tesztelés. A képzési eljárások során egy osztályozó szabály épül fel egy objektumok képzési halmazának feldolgozása alapján. Az ellenőrzési (vizsgálati) eljárás abból áll, hogy a kapott osztályozási szabályt használjuk az objektumok új (vizsgálati) mintából történő felismerésére. Ha a teszteredményeket kielégítőnek találják, akkor a tanulási folyamat véget ér, ellenkező esetben az osztályozási szabály az újratanulási folyamat során finomításra kerül.

4 klaszterezés Az adatbázisból származó információk (rekordok) csoportokba (klaszterekbe) vagy szegmensekbe történő felosztása, ezen csoportok egyidejű meghatározásával. Az osztályozással ellentétben itt az elemzéshez nincs szükség előzetes osztályok kiosztására.

5 idősoros előrejelzés egy eszköz a vizsgált objektumok attribútumainak időbeli változásának tendenciáinak meghatározására. Az idősorok viselkedésének elemzése lehetővé teszi a vizsgált jellemzők értékeinek előrejelzését.

Az ilyen problémák megoldásához különféle adatbányászati ​​módszereket és algoritmusokat használnak. Annak a ténynek köszönhetően, hogy az adatbányászat olyan tudományágak kereszteződésében fejlődött és fejlődik, mint a statisztika, az információelmélet, a gépi tanulás, az adatbáziselmélet, teljesen természetes, hogy a legtöbb adatbányászati ​​algoritmus és módszer ezen tudományágak különböző módszerei alapján készült.

A meglévő adatbányászati ​​módszerek sokféleségéből a következőket lehet megkülönböztetni:

    regressziós, variancia és korrelációs elemzés(a legtöbb modern statisztikai csomagban megvalósítva, különösen az SAS Institute, a StatSoft stb. termékeiben);

    elemzési módszerek egy adott tárgykörben, empirikus modellek alapján (gyakran használják például olcsó pénzügyi elemzési eszközökben);

    neurális hálózati algoritmusok- folyamatok és jelenségek szimulálására szolgáló módszer, amely lehetővé teszi összetett függőségek reprodukálását. A módszer egy biológiai agy egyszerűsített modelljének használatán alapul, és abból áll, hogy a kezdeti paramétereket olyan jeleknek tekintik, amelyek a "neuronok" közötti meglévő kapcsolatoknak megfelelően alakulnak át, és a teljes hálózat reakciója a kezdeti adatokat az elemzésből származó válasznak kell tekinteni. Ebben az esetben az úgynevezett hálózati tréning segítségével a kiindulási adatokat és a helyes válaszokat is tartalmazó nagy minta segítségével hozzuk létre a kapcsolatokat. A neurális hálózatokat széles körben használják osztályozási problémák megoldására;

    zavaros logika az adatok homályos igazságértékekkel történő feldolgozására szolgál, amelyeket különféle nyelvi változók képviselhetnek. A homályos tudásábrázolást széles körben használják osztályozási és előrejelzési problémák megoldására, például az XpertRule Miner rendszerben (Attar Software Ltd., Nagy -Britannia), valamint az AIS -ben, a NeuFuzban stb.

    induktív vezetékek lehetővé teszi az adatbázisban tárolt tények általánosítását. Az induktív tanulás folyamatában egy hipotéziseket szolgáltató szakember is részt vehet. Ezt hívják felügyelt tanulásnak. Az általánosítási szabályok keresése tanár nélkül is elvégezhető hipotézisek automatikus generálásával. A modern szoftverekben általában mindkét módszert kombinálják, és statisztikai módszereket használnak a hipotézisek tesztelésére. Az induktív vezetékeket használó rendszerre példa az Attar Software Ltd. által kifejlesztett XpertRule Miner. (Egyesült Királyság);

    alapján való érvelés hasonló esetek(„Legközelebbi szomszéd” módszer) (Esetalapú érvelés - CBR) azon alapul, hogy egy adatbázisban keresnek olyan helyzeteket, amelyek leírása számos jellemzőben hasonló az adott helyzethez. Az analógia elve lehetővé teszi, hogy feltételezzük, hogy a hasonló helyzetek eredményei is közel állnak egymáshoz. Ennek a megközelítésnek a hátránya, hogy nem hoz létre olyan modelleket vagy szabályokat, amelyek általánosítják a korábbi tapasztalatokat. Ezenkívül a kimeneti eredmények megbízhatósága a helyzetleírás teljességétől függ, mint az induktív következtetés folyamataiban. Példák a CBR -t használó rendszerekre: KATE Tools (Acknosoft, Franciaország), Pattern Recognition Workbench (Unica, USA);

    döntési fák- módszer egy feladat strukturálására fagráf formájában, amelynek csúcsai megfelelnek az adatok osztályozását vagy a döntések következményeinek elemzését lehetővé tevő termelési szabályoknak. Ez a módszer vizuálisan ábrázolja a szabályok osztályozási rendszerét, ha nem túl sok. Az egyszerű problémákat sokkal gyorsabban oldják meg ezzel a módszerrel, mint a neurális hálózatok használatával. Összetett problémák és bizonyos adattípusok esetén előfordulhat, hogy a döntési fák nem megfelelőek. Ezenkívül ennek a módszernek jelentős problémája is van. A hierarchikus adathalmazok egyik következménye, hogy sok speciális esetre nincs sok képzési példa, ezért az osztályozás nem tekinthető megbízhatónak. A döntési fa módszereit számos szoftver eszköz alkalmazza, nevezetesen: С5.0 (RuleQuest, Ausztrália), Clementine (Integral Solutions, Egyesült Királyság), SIPINA (Lyoni Egyetem, Franciaország), IDIS (Information Discovery, USA);

    evolúciós programozás- az adatok kölcsönös függőségét kifejező algoritmus keresése és előállítása az eredetileg meghatározott, a keresési folyamatban módosított algoritmus alapján; néha az interdependenciák keresését bármely meghatározott típusú függvény (például polinomok) között végzik;

korlátozott keresési algoritmusok amelyek egyszerű logikai események kombinációit számítják ki az adatcsoportokban.

3.7 IntegrációOLAPésAdatBányászati

Az online analitikai feldolgozás (OLAP) és az adatbányászat (Data Mining) a döntéstámogatási folyamat két része. Manapság azonban a legtöbb OLAP-rendszer csak a többdimenziós adatokhoz való hozzáférésre összpontosít, és a minták területén dolgozó legtöbb adatbányászati ​​eszköz egydimenziós adatszempontokkal foglalkozik. A döntéstámogató rendszerek adatfeldolgozásának hatékonyságának növelése érdekében ezt a kétféle elemzést kombinálni kell.

Jelenleg úgy tűnik, hogy az "OLAP Data Mining" (többdimenziós bányászat) összetett kifejezés egy ilyen kombinációt jelöl.

Az "OLAP Data Mining" létrehozásának három fő módja van:

    "Kockázás, majd bányászat". A bányászati ​​elemzés elvégzésének lehetőségét biztosítani kell egy többdimenziós fogalmi reprezentáció lekérdezésének bármely eredményén, azaz a mutatók hiperkocka bármely vetületének bármely töredékén.

    Bányászat, majd kockázás. A tárolóból kinyert adatokhoz hasonlóan a bányászati ​​eredményeket hiperkubikus formában kell bemutatni a későbbi többváltozós elemzéshez.

    "Kockázás bányászat közben". Ez a rugalmas integrációs módszer lehetővé teszi az azonos típusú intelligens feldolgozási mechanizmusok automatikus aktiválását az általánosítási szintek közötti többváltozós elemzés (átmenet) minden egyes lépése, a hiperkocka új töredékének kinyerése stb.

    Csillagászat 11 osztály [Szöveg ... őket hogyan rész az egész rendszerek ... egyetemi adjunktus ... Cheboksary, 2009. No. 10. S. 44 -49 .... Szerzői- fordítók: N... szinopszisokelőadások, ...

  • Tanulási útmutató

    ... előadások... Készítmény előadások matematika. Írás szinopsziselőadások előadások... Használat információtechnológiák ...

  • I k kondaurova v lebedevával

    Tanulási útmutató

    ... előadások... Készítmény előadások matematika. Írás szinopsziselőadások... Vizuális segédeszközök készítése. Olvasási technika előadások... Használat információtechnológiák ...

  • M MÉDIA MONITORING A szakképzés korszerűsítése 2011. március - augusztus

    Összefoglaló

    ... 11 .08.2011 "Dead Souls-2" az RNIMU-ban őket ... 3,11 -3,44 ... ... nyilvános előadások vezetők ... Cheboksary... és a firkálás szinopszisok közönség - ... információrendszerekés technológiák. ... rendszer oktatás - mondja egyetemi adjunktus ... fordítók ... alkatrészek valódi fokozása tartalom ...

6. téma

VÁLLALATI INFORMÁCIÓS RENDSZEREK GAZDASÁGI INFORMÁCIÓK FELDOLGOZÁSÁHOZ

Vállalati információs technológia koncepció

A vállalati információs technológia lényege és jelentősége

Az üzleti programok sokfélesége között az "információs technológia a vállalatirányításban" kifejezést hagyományosan "integrált menedzsment automatizálási rendszerek" -ként értelmezik. Más nevük is ismert - vállalati szintű rendszerek, vállalati információs rendszerek (CIS), vállalati (vagy integrált) irányítási rendszerek (KSU), automatizált vezérlőrendszerek (ACS).

A komplex vezérlés-automatizálási rendszerek általában „alap” univerzális megoldások, amelyek különféle típusú vállalkozások, elsősorban pénzügyi menedzsment, raktármenedzsment, beszerzési és értékesítési menedzsment számára alkalmasak, de ezekben a rendszerekben gyakran vannak olyan iparági megoldások, amelyek egy vagy másik sajátosságokat tükröznek, és tartalmaznak egy megfelelő szabályozási és referenciaalap.

Például az SAP R / 3 rendszer megoldása a légiközlekedési ipar számára támogatja az összes repülőgép -alkatrész sorozatszámának elszámolását és ellenőrzését, élettartamát, ütemezett cseréjét vagy javítását, ami nemcsak a gyártás megbízhatóságát, hanem az utasok biztonságát is biztosítja .

Mivel az integrált felügyeleti rendszerek elsősorban a multidiszciplináris struktúrákat tartalmazó nagyvállalatokra összpontosítanak, nemcsak fejlett funkciókat kínálnak, hanem nagy mennyiségű információ megbízható tárolását és feldolgozását is lehetővé teszik, hatékony platformok és rendszereszközök használatával a többfelhasználós munkához. ..

A modern információs technológiák, kommunikáció és az internet lehetővé teszik az egyetlen adatbázishoz való távoli hozzáféréssel kapcsolatos problémák megoldását, ami szintén fontos a vállalatirányítás szempontjából.

Koncepció építése

Bár a legtöbb fejlesztő szoftvertermékeit menedzsmentnek nevezi (vállalkozás, raktár, pénzügy stb.), Lényegében a vállalatirányításban használt szinte minden szoftver rögzíti a pénzügyi és gazdasági tevékenységek tényeit és dokumentumait, a számviteli rendszereket, és képes jelentéseket és referenciákat készíteni az elemzési jellemzők által megengedett szakaszokban. Vagyis a strukturált információk bekerülnek az adatbázisba. Ezt a struktúrát bizonyos mértékig összekapcsolt referenciakönyvek, osztályozók, paraméterek és szabványos dokumentumok formázzák. Az adatbázisban rendelkezésre álló információk szerint az úgynevezett "vágást" műszeres eszközökkel "építik", "húzzák ki", "gyűjtik". Miután az ilyen adatok alapján jelentéseket és referenciákat kapott, amelyeket gyakran elemző jelentéseknek neveznek, a vezetőség dönthet. Ez a tipikus koncepció és tipikus technológia a szóban forgó osztály rendszereivel való munkavégzéshez.



Nem véletlen, hogy a „menedzsment” szoftverek, mint például a „Galaxy”, „BEST” és „1C: Enterprise” funkcionális tartalmában, rendszermegoldásaiban, céljában és használatában ennyire eltérő információszervezési elvek, technológia kialakítása és feldolgozása, valamint a rendszerekkel való interakció módszerei.

Mindazonáltal a vállalatok, például az OJSC Uralelectromed olyan kemény és változatos követelményeket támasztanak a vállalatirányítási eszközökkel szemben, amelyek szükségessé teszik többszintű építését. Általában a mag a rendszer magja, amely csak programkódokat tartalmaz. A következő koncepcionálisan fontos elem a rendszer beépített eszközkészlete, amely lehetővé teszi a programkódok megváltoztatása nélkül legalább a munkahelyi konfigurálást, meghatározott műveletek elvégzését, az elsődleges és jelentési bizonylatok új formáinak bevitelét, megváltoztatását, a paraméteres beállítás egyéb módjai. A fejlettebb rendszerek beépített eszközökkel rendelkeznek a különböző vállalati modellek létrehozásához: információs, szervezeti, funkcionális stb. És végül maga az adatbázis.

Analitikai információfeldolgozás

A vállalkozás tevékenységeinek megtervezése, a működési információk megszerzése és az elemzés alapján a helyes döntés meghozatala nagy mennyiségű adat feldolgozásával jár. A vállalati számviteli rendszerekben készített jelentések általában nem rugalmasak. Ezeket nem lehet „elforgatni”, „kibontani” vagy „összecsukni” a kívánt adatábrázolás eléréséhez, beleértve a grafikus adatokat is. Minél több „kivágást” és „kivágást” tud végrehajtani, annál valósághűbben tudja elképzelni a vállalkozás képét, és meg tudja hozni a legjobb döntést az üzleti folyamatok irányításával kapcsolatban. Az ilyen jellegű feladatokhoz matematikai és gazdasági modellezésre, valamint nagy teljesítményre van szükség. Az elemző modul a "RepKo" rendszerben érhető el, ismertebb a "Triumph -Analytica" rendszer ("PARUS" Corporation - "Torah Center"). Úgy tűnik, hogy a számviteli rendszerek az adatbázisban tárolt információk alapján különböző „szakaszokba” építenek referenciákat, egyszerűen csak azt képviselik, ami van. Az elemző rendszerek pedig meghatározott paraméterek vagy kritériumok szerint építik fel az új információkat, és optimalizálják azokat meghatározott célokra. Ezért gyakrabban van szükség egy speciális eszközre az információk megtekintésére és megjelenítésére, amely az online analitikai feldolgozás (OLAP). Kényelmes és nagy sebességű eszközöket biztosít a tárolóban felhalmozott információk elérésére, megtekintésére és többdimenziós elemzésére.

Az OLAP -technológiákat arra használják, hogy a helyzetet a „mi lenne, ha…” séma szerint modellezzék, és különféle analitikai jelentéseket állítsanak össze. Vannak speciális nyugati szoftvertermékek.

Általában a vállalati irányítási rendszerekből származó információkat analitikus adatfeldolgozás céljából speciális programokba továbbítják. Sok hazai fejlesztő megpróbálja önállóan megoldani ezeket a problémákat, például a Nikos-Soft (NS-2000 rendszer), a Cepheus (Etalon vállalatirányítási rendszer), a KOMSOFT (KOMSOFT-STANDARD "2.0) stb.

6.4. A vállalati információs technológiák fejlesztésének és használatának kilátásai

A hazai eszközök és platformok, valamint rendszerszerszámok fejlesztése és használata mellett a hazai vállalati rendszerek fejlesztése feltételezi azok funkcionális telítettségét, különösen a gyártás tekintetében.

Az irányítási szabványok bevezetése iránti széles körben elterjedt szenvedély ellenére a hazai szoftverpiac vezető szereplői különféle iparágak számára fejlesztenek iparági megoldásokat.

A cégek félelmei, hogy felfedik fejlesztéseik "bizalmasságát", csökkennek, ami segít megszilárdítani termékeik integrálására irányuló erőfeszítéseiket, ahelyett, hogy mindent az "a" -tól a "z" -ig fejlesztene. Ma már senkinek nincs elég forrása. Évekbe telik egy új koncepció megértése, egy projekt és egy rendszer kidolgozása, nevezetesen egy olyan rendszer, amely megváltoztatja minőségét attól függően, hogy mi van benne. Ezenkívül a szoftvertermékek integrálására vonatkozó követelményeket azok a vállalkozások is előterjesztik, amelyek "működni" kívánnak, rendszerint speciális rendszerek, és információs módon kombinálják azokat az újonnan beszerzett rendszerekkel.

Integrációra van szükség a különböző gyártók termékeihez is - a komplex megoldások és a speciális:

- költségvetés, pénzügyi és gazdasági elemzés, ügyfélszolgálat, elemző adatfeldolgozás stb.

Meg kell jegyezni, hogy nem maguk a vezérlőrendszerek ígéretesebbek, hanem egyszerű és univerzális eszköz létrehozásukhoz, amelyet a fejlesztő és a végfelhasználó közötti képzett közvetítőknek szánnak. Ezeket a funkciókat most rendszergazdák és elemzők próbálják végrehajtani.

Ha rendelkezésre áll ilyen eszköz, akkor minden iparágban minden vállalat számára keresett lesz a "kész" szabványos megoldás.

Az internetet, mint az üzleti fejlődés kiegészítő eszközét, csak integrált irányítási rendszer jelenlétében lehet hatékonyan használni.

Bár a modern információs és kommunikációs technológiák, beleértve az internetet, lehetővé teszik a szoftverkölcsönzés megszervezését, korai beszélni az ilyen lehetőségek kihasználásának közeljövőbeli kilátásairól, különösen hazánkban. És nem annyira titoktartási okokból, mint inkább a rend és a megbízható kommunikációs eszközök hiánya miatt.

A hazai vállalatoknál az információtechnológiák végrehajtásának kísérletei és tapasztalatai, még ha nem is teljesen, bebizonyították a gyakorlatban, hogy "a káosz nem automatizálható". Szükséges a vállalkozás és a vállalkozás előzetes átszervezése, valamint a menedzsment előírásainak (utasításainak) kialakítása. A vállalkozás alkalmazottai számára nehéz megbirkózni az ilyen munkával. Különösen, ha figyelembe vesszük a piaci körülmények időfaktorát. Ezért mindenhol fejlődik a tanácsadó cégekkel való interakció gyakorlata, amely segíti a vállalkozásokat és megtanítja alkalmazottaikat a "szűk keresztmetszetek kiterjesztésére", a fő üzleti folyamat kialakítására, a technológia fejlesztésére, az információáramlás kialakítására stb. Egyszerűsített folyamat automatizálása egyszerűbb, egyszerűbb, olcsóbb, gyorsabb.

Mindenkinek el kell végeznie a munkáját. Egy könyvelőnek, raktárosnak, értékesítési vezetőnek és más "tárgyi" szakembereknek nem szabad javítaniuk a dokumentumok formáját, bővíteniük az oszlopokat, vagy változtatniuk a helyükön a jogszabályok vagy üzleti rendszerek változása miatt. Ezért a szoftverpiac fokozatosan átalakul „termékből” „szolgáltatássá”. Megkezdődik az outsourcing fejlődése - a vállalkozás egyes funkcióinak átadása az érintett cégek szakembereinek. Berendezések karbantartásával, rendszerszoftverrel, a rendszerek alkalmazott (funkcionális) részének módosításával stb.

Az informatika és a módszertani szolgáltatások felhasználóik és fogyasztóik számára válnak a vállalati irányítási rendszerek használatában a legfontosabbak és aktualitottabbá.

8.3.1. On-line analitikai feldolgozás (OLAP) eszközök

On-line analitikai feldolgozás-az információk operatív (valós idejű) analitikai feldolgozásának eszközei, amelyek támogatják a döntéshozatalt és segítenek az elemzőknek megválaszolni a kérdést: "Miért olyanok az objektumok, környezetek és kölcsönhatásuk eredményei, mint mások?" Ebben az esetben az elemző maga alakítja ki az információhalmaz kapcsolatának változatait, és azokat a megfelelő strukturált információs adatbázisokban rendelkezésre álló adatok alapján ellenőrzi.

Az ERP-rendszerekre jellemző az analitikai komponensek jelenléte a funkcionális alrendszerek részeként. Valós időben biztosítják az elemzési információk formálását. Ez az információ a legtöbb vezetői döntés alapja.

Az OLAP technológiák hiperkockákat használnak - speciálisan strukturált adatokat (más néven OLAP kockákat). A hiperkocka adatszerkezetében a következőket különböztetjük meg:

Mértékek - összefoglaló statisztikai eredmények előállításához használt mennyiségi mutatók (szükségletek -alapok);

Dimenziók - leíró kategóriák (attribútumok-attribútumok), amelyek keretében a méréseket elemzik.

A hiperkocka méretét az egy mérték dimenzióinak száma határozza meg. Például az SALES hiperkocka adatokat tartalmaz:

Méretek: fogyasztók, műveletek dátumai, árucsoportok, nómenklatúra, módosítások, csomagok, raktárak, fizetési módok, szállítmánytípusok, árfolyamok, pénznem, szervezetek, osztályok, felelős, forgalmazási csatornák, régiók, városok;

Intézkedések: tervezett mennyiség, tényleges mennyiség, tervezett összeg, tényleges összeg, tervezett kifizetések, tényleges kifizetések, tervezett egyenleg, tényleges egyenleg, eladási ár, megrendelés végrehajtási ideje, visszatérítési összeg.

Az ilyen hiperkocka elemzési jelentésekhez készült:

A fogyasztók osztályozása a vásárlások mennyisége szerint;

Az ABC módszerrel értékesített áruk osztályozása;

Különböző fogyasztók megrendelései teljesítési feltételeinek elemzése;

Az értékesítési mennyiségek elemzése időszakok, áruk és árucsoportok, régiók és fogyasztók, belső osztályok, vezetők és értékesítési csatornák szerint;

A fogyasztókkal való kölcsönös elszámolások előrejelzése;

A fogyasztóktól származó áruk visszaküldésének elemzése; stb.

Az elemző jelentések tetszőlegesen kombinálhatják a dimenziókat és az intézkedéseket, ezeket a vezetési döntések elemzésére használják. Az elemző feldolgozást hangszeres és nyelvi eszközök biztosítják. A nyilvánosan elérhető MS Excel táblázatban a "Pivot Tables" információtechnológia látható, létrehozásuk kezdeti adatai:

Lista (adatbázis) MS Excel - relációs táblázat;

Egy másik MS Excel pivot tábla;

Az azonos vagy különböző munkafüzetekben található MS Excel cellák összevont tartománya;

Külső relációs adatbázis vagy OLAP -kocka, adatforrás (.dsn, .ode formátumú fájlok).

Ha külső adatbázisokon alapuló pivot táblákat szeretne készíteni, használja az ODBC illesztőprogramokat, valamint az MS Query programot. Az eredeti MS Excel adatbázis összefoglaló táblázata a következő szerkezetű (8.3. Ábra).

A pivot tábla elrendezése a következő adatszerkezettel rendelkezik (8.4. ábra): méretek - osztálykód, pozíció; intézkedések - munkatapasztalat, fizetés és bónusz. Az alábbiakban egy összefoglaló táblázat található. 8.2, amely lehetővé teszi az átlagos munkatapasztalat és a fizetés, az átlagos munkatapasztalat és a prémiumok, a fizetés és a prémiumok közötti kapcsolat elemzését.

8.2. Táblázat

Pivot táblázat a linkek elemzéséhez

A táblázat vége. 8.2

Az elemzés folytatásához a pivot tábla segítségével a következőket teheti:

Új összegek hozzáadása (például átlagos fizetés, átlagos bónusz stb.);

Használja a pivot tábla rekordjainak és összegeinek szűrését (például a "Nem" attribútum alapján, amely az elrendezésben az * Oldal "területen található);

Számítsa ki a strukturális mutatókat (például a bérek és a bónuszalapok felosztása divíziók szerint - a pivot táblázatok további feldolgozásával, az oszloponkénti összegrészekkel); stb.

Az MS Office csomag lehetővé teszi táblázatok adatainak közzétételét, beleértve a pivot táblázatokat és diagramokat XTML formátumban.

A Microsoft Office Web Components támogatja az Internet Explorerben közzétett adatokkal való munkát, lehetővé téve a további elemzést (változások a pivot tábla adatstruktúrájában, új összegző összeg kiszámítása).

8.3.2. Adatbányászati ​​eszközök (DM)

A DM -eszközök az adatok kinyerését ("feltárását", "kinyerését") jelentik, és célja a vállalkozás digitális adatbázisaiban tárolt információk közötti kapcsolat azonosítása, amelyet az elemző felhasználhat olyan modellek készítéséhez, amelyek számszerűsítik a tényezők befolyásának mértékét érdeklődés. Ezen túlmenően az ilyen eszközök hasznosak lehetnek hipotézisek felállításában az információs kapcsolatok lehetséges természetéről egy vállalat digitális adatbázisaiban.

A Text Mining (TM) technológia olyan eszközkészlet, amely lehetővé teszi nagyszámú információ elemzését, olyan trendek, minták és kapcsolatok keresése érdekében, amelyek segíthetnek a stratégiai döntések meghozatalában.

Az Image Mining (IM) technológia a vállalat adatbázisaiban tárolt vagy külső információforrásokból történő online keresés eredményeként kapott különféle vizuális képek felismerésére és osztályozására szolgáló eszközöket tartalmaz.

Az összes adat feldolgozásával és tárolásával kapcsolatos problémák megoldásához a következő módszereket alkalmazzák:

1) több biztonsági mentési rendszer vagy egy elosztott dokumentumkezelő rendszer létrehozása, amelyek lehetővé teszik az adatok mentését, de a felhasználó kérésére lassan férnek hozzá a tárolt információkhoz;

2) olyan internetes rendszerek építése, amelyek rendkívül rugalmasak, de nem alkalmasak szöveges dokumentumok keresésére és tárolására;

3) olyan internetes portálok bevezetése, amelyek jól megcélozzák a felhasználói kéréseket, de nem rendelkeznek leíró információkkal a betöltött szöveges adatokról.

A fent felsorolt ​​problémáktól mentes szövegfeldolgozó rendszerek két kategóriába sorolhatók: nyelvi elemző rendszerek és szöveges adatelemző rendszerek.

A Text Mining technológia fő elemei a következők:

Összegzés;

Funkciókivonás

Klaszterezés

Osztályozás

Kérdések megválaszolása (kérdés megválaszolása);

Tematikus indexelés;

Keresés kulcsszavak alapján (kulcsszó keresés);

Taxonómiák és szinonimaszótárak létrehozása és fenntartása.

A Text Mining technológiát megvalósító szoftvertermékek a következők:

IBM Intelligent Miner for Text - egyedi parancssori segédprogramok vagy átugrások; egymástól függetlenek (a fő hangsúly az adatbányászati ​​mechanizmusokon van - információkeresés);

Oracle InterMedia Text - DBMS -be integrált készlet, amely lehetővé teszi a leghatékonyabban a felhasználói kérésekkel való munkát (lehetővé teszi a modern relációs DBMS -sel való munkát a szöveges adatok összetett többcélú keresésének és elemzésének keretében);

A Megaputer Text Analyst a programba épített COM objektumok halmaza szövegbányászati ​​feladatok megoldásához.

8.3.3. Intelligens információs technológia

Ma a vezérlés -automatizálás területén az információelemzés dominál a megoldások előkészítésének első szakaszában - az elsődleges információk feldolgozása, a problémás helyzet felbontása, amely lehetővé teszi, hogy csak a folyamatok töredékeit és részleteit ismerjük meg, és ne a helyzet egészét. Ennek a hátránynak a kiküszöbölése érdekében meg kell tanulni tudásbázisokat építeni a legjobb szakemberek tapasztalatai alapján, valamint meg kell teremteni a hiányzó tudást.

Az információs technológiák alkalmazása az emberi tevékenység különböző területein, az információs mennyiségek exponenciális növekedése és a gyors reagálás igénye minden helyzetben megkövetelte a felmerülő problémákra megfelelő megoldások keresését. A leghatékonyabb közülük az információs technológiák intellektualizációjának módja.

Alatt intelligens információs technológia(ITT) általában megérti az ilyen információtechnológiát, amely a következő képességeket biztosítja:

A tudásbázisok jelenléte, amelyek tükrözik az egyes emberek, csoportok, társadalmak, az egész emberiség tapasztalatait, bizonyos tevékenységi területek kreatív problémáinak megoldásában, hagyományosan az emberi intelligencia kiváltságának tekinthetők (például rosszul formalizált feladatok, például a döntéshozatal , tervezés, jelentéskivonás, magyarázat, képzés stb.);

A tudásbázisokon alapuló gondolkodási modellek jelenléte: szabályok és logikai következtetések, érvelés és érvelés, a helyzetek felismerése és osztályozása, általánosítás és megértés stb .;

Képesség meglehetősen világos döntések meghozatalára a homályos, laza, hiányos, nem meghatározott adatok alapján;

A következtetések és döntések megmagyarázásának képessége, azaz magyarázó mechanizmus jelenléte;

Képesség tanulni, átképződni és ezért fejlődni.

Az adatokban és információkban rejtett minták informális keresésének technológiái A Knowledge Discovery (KD) az objektumok információs képeinek kialakítására és strukturálására szolgáló legújabb technológián alapulnak, amely a legközelebb áll az intelligens rendszerek általi információfeldolgozás elvéhez.

A döntéstámogató (DS) döntéstámogató információs technológia szakértői héj.

olyan rendszerek vagy speciális szakértői rendszerek, amelyek lehetővé teszik az elemzők számára, hogy a vállalkozás strukturált információi alapján meghatározzák az információs struktúrák közötti kapcsolatokat és kapcsolatokat, valamint megjósolják a döntéshozatal lehetséges eredményeit.

IIT fejlesztési trendek. Kommunikációs és kommunikációs rendszerek. A globális információs hálózatok és az IIT radikálisan megváltoztathatják a vállalatokról és magáról a szellemi munkáról alkotott felfogásunkat. A munkavállalók jelenléte a munkahelyen szinte szükségtelenné válik. Az emberek otthonról dolgozhatnak, és szükség szerint kölcsönhatásba léphetnek egymással a hálózatokon keresztül. Ismert például az a sikeres tapasztalat, hogy a Boeing-747-es repülőgép új módosítását az Interneten keresztül kommunikáló szakemberek elosztott csapata készítette el. A fejlesztések résztvevőinek elhelyezkedése egyre kisebb szerepet fog játszani, de a résztvevők képzettségi szintjének fontossága növekedni fog. Az IIT rohamos fejlődését meghatározó másik ok a kommunikációs rendszerek és az ezek alapján megoldott feladatok bonyolultsága. Minőségileg új szintre került az "intellektualizáció" az olyan szoftvertermékeknél, mint a heterogén és nem szigorú adatok elemzésére szolgáló rendszerek, az információbiztonság biztosítása, az elosztott rendszerekben történő döntéshozatal stb.

Oktatás... Már ma a távoktatás kezd fontos szerepet játszani az oktatásban, és az IIT bevezetése jelentősen individualizálja ezt a folyamatot, minden tanuló igényeinek és képességeinek megfelelően.

Mindennapi élet... A mindennapi élet informatizálása már megkezdődött, de az IIT fejlődésével alapvetően új lehetőségek fognak megjelenni. Fokozatosan minden új funkció átkerül a számítógépre: a felhasználó egészségének ellenőrzése, a háztartási készülékek, például párásítók, légfrissítők, melegítők, ionizátorok, zenei központok, orvosi diagnosztika stb. Más szóval, a rendszerek az ember állapotának és otthonának diagnosztikusává is válnak. A helyiségekben kényelmes információs tér kerül kialakításra, ahol az információs környezet az emberi környezet részévé válik.

Az IIT fejlesztésének kilátásai... Úgy tűnik, hogy jelenleg az IIT fejlődésének alapvetően új szakaszához érkezett. Tehát az elmúlt 10 évben az IIT képességei jelentősen kibővültek az új típusú logikai modellek kifejlesztése és az új megjelenések miatt

elméleteket és fogalmakat. Az IIT fejlesztésének legfontosabb pontjai:

Átmenet a logikai következtetésből az érvelési és érvelési modellekbe;

Keressen releváns ismereteket és magyarázatokat;

Szövegek megértése és szintézise;

Kognitív grafika, i.e. a tudás grafikus és figurális bemutatása;

Multi-agent rendszerek;

Intelligens hálózati modellek;

Fuzzy logikán alapuló számítások, neurális hálózatok, genetikai algoritmusok, valószínűségszámítások (különböző kombinációkban egymással és szakértői rendszerekkel megvalósítva);

A meta-tudás problémája.

A többügynökös rendszerek új paradigmává váltak az ígéretes IIT-ek létrehozásában. Itt feltételezzük, hogy az ügynök független szellemi rendszer, amelynek megvan a maga célkitűzési és motivációs rendszere, saját cselekvési területe és felelőssége. Az ágensek közötti interakciót egy magasabb szintű rendszer – a metaiintelligencia – biztosítja. A multi -agent rendszerekben az intelligens ügynökök virtuális közösségét modellezik - az objektumok, amelyek autonómak, aktívak, különböző társadalmi kapcsolatokba lépnek - együttműködés és együttműködés (barátság), verseny, verseny, ellenségeskedés stb. A modern problémák megoldásának társadalmi vonatkozása a fejlett szellemi technológiák - virtuális szervezetek, virtuális társadalom - fogalmi újdonságának alapvető jellemzője.

(?) Ellenőrző kérdések és feladatok

1. Adjon leírást a vállalkozásról, mint az informatizálás tárgyáról! Melyek a fő mutatók, amelyek jellemzik a vállalatirányítási rendszer fejlődését.

2. Sorolja fel az ipari vállalkozások vezető informatikai menedzsmentjét!

3. Melyek a vállalatok (vállalatok) szervezeti és stratégiai fejlesztésének fő információs technológiái.

4. Melyek az üzleti folyamatok javítását célzó stratégiai menedzsment szabványainak alapjai? Mekkora az információtechnológia BPM és BPI aránya?

5. Határozza meg a teljes körű minőségirányítás (TQM) filozófiáját. Hogyan kapcsolódnak a minőség és az információs technológia fejlődésének fázisai?

6. Nevezze meg a vállalkozás szervezetfejlesztésének főbb rendelkezéseit, ismertesse a stratégiai menedzsment szakaszait! Mik a csoportstratégiák?

7. Hogyan jön létre a vállalkozás üzleti modellje? Melyek a fő megközelítések az üzleti modell hatékonyságának értékeléséhez?

8. Mi az a kiegyensúlyozott eredménymutató? Melyek a BSC fő összetevői? Milyen összefüggések vannak a BSC mutatók csoportjai között?

9. Sorolja fel az információs rendszerek létrehozásának módszertani alapjait! Mi a rendszerszemlélet?

10. Mi az információs megközelítés az információs rendszerek és technológiák kialakításában?

11. Mi az információs rendszerek és technológiák kialakításának stratégiai megközelítése?

12. Mi a tartalma az objektum-orientált megközelítésnek az ügynökök piaci viselkedésének leírására? Adja meg az objektum definícióját, adja meg az ügynökrendszerek analógjait.

13. Mik a módszertani elvek az információs és kommunikációs technológiákon alapuló vállalatirányítás fejlesztésére? Mi az IKT célja?

14. Adja meg a dokumentum, dokumentumfolyam, dokumentumfolyam, dokumentumkezelő rendszer definícióit.

15. Hogyan készül a dokumentuműrlap elrendezése? Nevezze meg a dokumentum zónáit, részleteik összetételét.

16. Melyek a dokumentumkezelő rendszer alapvető információs technológiái?

17. Mi az egységes dokumentációs rendszer? Melyek az egységesítés általános elvei?

18. Ismertesse a szervezeti és adminisztratív dokumentációt, adjon példákat a dokumentumokra.

19. Milyen követelmények vonatkoznak az elektronikus dokumentumkezelő rendszerre?

20. Mi a vállalati információs rendszer? Melyek a fő vezérlőhurkok, a funkcionális modulok összetétele.

21. Nevezze meg a FÁK számára ismert szoftvertermékeket. Adja meg összehasonlító jellemzőiket.

W Irodalom

1. Return J., Moriarty S. Marketingkommunikáció. Integrált megközelítés. SPb.; Harkov: Péter, 2001.

2. Brooking E. Szellemi tőke. A siker kulcsa az új évezredben. SPb.: Péter, 2001.

3. Godin V.V., Korpev I.K. Információs erőforrás menedzsment. M .: INFRA-M, 1999.

4. Információs rendszerek és technológiák a közgazdaságtanban: Tankönyv. 2. kiadás, Add. és felülvizsgálták / M.I. Semenov, I.T. Trubilin, V.I. Loiko, T.P. Baranovskaya; Szerk. IN ÉS. Loiko. Moszkva: Pénzügy és statisztika, 2003.

5. Informatika az üzleti életben / Szerk. M. Zheleny. SPb .: Péter, 2002.

6. Kaplan Robert S., Norton David P. Balanced Scorecard. A stratégiától a cselekvésig / Per. angolról M .: CJSC "Olymp-Business", 2003.

7. Karagodin V.I., Karagodina BJI. Az információ, mint az élet alapja. Dubna: Főnix, 2000.

8. Karminsky AM., Nesterov PZ. Üzleti informatizálás. Moszkva: Pénzügy és Statisztika, 1997.

9. Lihacseva T.N. Információs technológiák az információs társadalom szolgálatában // Új információs technológiák a gazdasági rendszerekben. M., 1999.

10. Ostreykovsky V.A. Rendszerelmélet. M.: Felsőiskola, 1997.

11. Piterkin S.V., Oladov N.A., Isaev D.V. Éppen Oroszország idején. Az ERP rendszerek használatának gyakorlata. 2. kiadás. M.: Alpina Kiadó, 2003.

12. Sokolov D.V. Bevezetés a társadalmi kommunikáció elméletébe: Tankönyv. juttatás. SPb.: SP6GUP Kiadó, 1996.

13. Trofimov V.Z., Tomilov V.Z. Információs és kommunikációs technológiák a menedzsmentben: Tankönyv. juttatás. Szentpétervár: A Szentpétervári Állami Gazdasági Egyetem Kiadója, 2002.

A hardver és szoftver modern fejlettségi szintje már egy ideje lehetővé teszi az operatív információkat tartalmazó adatbázisok széleskörű karbantartását a különböző irányítási szinteken. Tevékenységük során az iparvállalatok, a társaságok, a tanszéki struktúrák, a kormányzati szervek és a közigazgatások nagy mennyiségű adatot halmoztak fel. Önmagukban nagy lehetőségeket tárolnak a hasznos elemzési információk kinyerésében, amelyek alapján lehetséges a rejtett tendenciák azonosítása, fejlesztési stratégia felépítése és új megoldások megtalálása.

Az elmúlt években számos új koncepció alakult ki a világon a vállalati adatok tárolására és elemzésére:

1) Adattárak

2) On-line analitikai feldolgozás (OLAP)

3) Adatbányászat – IAD (Data Mining)

Az OLAP elemző adatfeldolgozó rendszerek olyan döntéstámogató rendszerek, amelyek összetett lekérdezések teljesítésére összpontosítanak, és amelyek megkövetelik egy bizonyos idő alatt felhalmozott történelmi adatok statisztikai feldolgozását. Üzleti jelentések készítésére szolgálnak az értékesítésről, a menedzsment célú marketingről, az úgynevezett Data Mining - adatbányászatról, azaz az adatbázisban található információk elemzésének módja anomáliák és tendenciák keresése érdekében, anélkül, hogy megtudnánk a rekordok jelentését.

Az OLAP -on alapuló elemző rendszerek közé tartoznak a mesterséges intelligencia módszerein alapuló információfeldolgozó eszközök és a grafikus adatmegjelenítési eszközök. Ezeket a rendszereket nagy mennyiségű történelmi adat határozza meg, lehetővé téve belőlük érdemi információk kinyerését, azaz tudást szerezni az adatokból.

A feldolgozás hatékonyságát nagy teljesítményű többprocesszoros technológia, kifinomult elemzési módszerek és speciális adattárolók használatával érik el.

A relációs adatbázisok külön táblákban tárolják az entitásokat, amelyek általában jól normalizáltak. Ez a szerkezet kényelmes az operációs adatbázisok (OLTP rendszerek) számára, de a bonyolult többtáblás lekérdezések viszonylag lassúak benne. A lekérdezések jobb modellje a módosítás helyett a térbeli adatbázis.

Az OLAP rendszer pillanatképet készít egy relációs adatbázisról, és a lekérdezések térbeli modelljévé strukturálja azt. Az OLAP -ban a lekérdezések feldolgozási ideje a relációs adatbázis hasonló lekérdezéseinek körülbelül 0,1% -a.

A működési adatokból létrehozott OLAP-struktúrát OLAP-kockának nevezzük. Egy kocka jön létre a táblák összekapcsolásából csillagséma használatával. A "csillag" közepén egy ténytábla található, amely a lekérdezendő legfontosabb tényeket tartalmazza. A ténytáblához több dimenziótábla kapcsolódik. Ezek a táblázatok bemutatják, hogyan elemezhetők az összesített relációs adatok. A lehetséges összesítések számát az határozza meg, hogy az eredeti adatok milyen módon jeleníthetők meg hierarchikusan.

Az adott rendszerosztályok (OLAP és OLTP) egy DBMS használatán alapulnak, de a lekérdezések típusai nagyon eltérőek. Az OLAP motor napjaink egyik legnépszerűbb adatelemzési módszere. Ennek a problémának a megoldására két fő megközelítés létezik. Az elsőt többdimenziós OLAP-nak (MOLAP) hívják - a mechanizmus megvalósítása többdimenziós adatbázis segítségével a szerver oldalon, a másodikat pedig Relációs OLAP-nak (ROLAP) - "menet közben" kockák építése SQL lekérdezések alapján egy relációs DBMS-hez. Ezen megközelítések mindegyikének vannak előnyei és hátrányai. Az asztali OLAP rendszer általános sémája az ábrán látható.

A munka algoritmusa a következő:

1) adatok beszerzése lapos táblázat formájában vagy SQL lekérdezés végrehajtásának eredménye;

2) az adatok gyorsítótárazása és többdimenziós kockává alakítása;

3) a felépített kocka megjelenítése kereszt táblázat vagy diagram segítségével, stb.

Általában tetszőleges számú kijelző csatlakoztatható egy kockához. Az OLAP rendszerekben használt kijelzők leggyakrabban kétféle típusúak: kereszttáblák és diagramok.

Csillag diagram. Az elképzelés az, hogy minden dimenzióhoz vannak táblázatok, és minden tény egy táblázatba kerül, az egyes dimenziók kulcsaiból álló többszörös kulccsal indexelve. A csillagséma minden egyes sugara – Codd terminológiája szerint – meghatározza az adatkonszolidáció irányát a megfelelő dimenzió mentén.

A többszintű méretekkel kapcsolatos összetett problémák esetén érdemes a csillag -séma kiterjesztésekhez fordulni - a tény konstellációs sémához és a hópehely -sémához. Ezekben az esetekben külön ténytáblázatokat hoznak létre a különböző dimenziók összegző szintjeinek lehetséges kombinációihoz. Ez jobb teljesítményt tesz lehetővé, de gyakran adatok redundanciájához és jelentős bonyodalmakhoz vezet az adatbázis szerkezetében, amely hatalmas számú ténytáblát tartalmaz.

csillagkép diagram

Analitikus adatfeldolgozás - Ez olyan adatelemzés, amely megfelelő módszertani támogatást és a szakemberek bizonyos szintű képzését igényli.

A modern információs technológiák lehetővé teszik a felhalmozott elsődleges információk elemzési folyamatainak automatizálását, elemzési modellek készítését, kész megoldások beszerzését és a gyakorlatban való felhasználását. A fő követelmények , amelyeket az elemzési módszerek bemutatnak, a hatékonyság, az egyszerűség, az automatizmus. Ez a koncepció két modern technológia alapja: az adatbányászat és a tudásfeltárás az adatbázisokban (KDD).

Adatbányászat - ez az a folyamat, amelynek során a nyers adatok között felfedezik a korábban ismeretlen, nem triviális, gyakorlatilag hasznos és hozzáférhető ismeretek értelmezését, amelyek szükségesek az emberi tevékenység különböző területein történő döntéshozatalhoz (G. Pyatetsky-Shapiro, ezen irány egyik alapítójának meghatározása) .

Az adatbányászati ​​technológia célja a nem nyilvánvaló minták megtalálása. Az adatelemzés szakaszai a következők:

  • 1) besorolás ( osztályozás) - a vizsgált adathalmaz - osztályok objektumcsoportjait jellemző jellemzők észlelése. Az osztályozási probléma megoldási módszerei: legközelebbi szomszédos módszerek ( legközelebbi szomszéd)és ^ '- a legközelebbi szomszéd ( k-legközelebbi szomszéd) -, Bayesi hálózatok (bayesi hálózatok) -, döntési fák indukciója; neurális hálózatok (neurális hálózatok) -,
  • 2) klaszterezés (csoportosítás)- az objektumok csoportokra bontása, mivel az objektumosztályok kezdetben nincsenek meghatározva. Példa a klaszterezési probléma megoldására: önszerveződő Kohonen térképek - egy neurális hálózat felügyelet nélküli tanulással. E térképek fontos jellemzője, hogy képesek egy síkon megjeleníteni a többdimenziós jellemzőtereket, kétdimenziós térkép formájában megjeleníteni az adatokat;
  • 3) egyesület (egyesületek)- minták azonosítása a kapcsolódó események között az adatkészletben. Ezeket a mintákat nem az elemzett objektum tulajdonságai alapján, hanem több, egyidejűleg bekövetkező esemény között tárják fel, például az Apriori algoritmus;
  • 4) sorrend (sorrend), vagy szekvenciális asszociáció (szekvenciális társítás),- időbeli minták keresése a tranzakciók között, azaz a szabályszerűségeket nem az egyidejűleg bekövetkező események, hanem az időben összefüggő események között állapítják meg. Az asszociáció nulla időeltolódású sorozatok. Sorrend: az esemény után x egy bizonyos idő elteltével az Y esemény bekövetkezik;
  • 5) előrejelzés (előrejelzés) - a történelmi adatok jellemzői alapján épül fel, azaz a célszámszerű indikátorok kihagyott vagy jövőbeli értékeit értékelik. A matematikai statisztika módszereit, neurális hálózatokat stb. Használnak az előrejelzési problémák megoldására;
  • 6) az eltérések vagy kiugró értékek meghatározása (eltérés észlelése), eltérések vagy kiugró értékek elemzése - az általános adatkészlettől leginkább eltérő adatok észlelése és elemzése;
  • 7) osztályozás (becslés)- egy tulajdonság folyamatos értékeinek előrejelzése;
  • 8) linkelemzés (link elemzés)- a függőségek megtalálásának feladata egy adathalmazban;
  • 9) vizualizáció (vizualizáció, gráfbányászat)- grafikus kép létrehozása az elemzett adatokból. Grafikus módszerekkel mutatják be a minták jelenlétét az adatokban, például az adatok 2D és 3D dimenziókban való megjelenítését;
  • 10) Összefoglalva ( összegzés) - meghatározott objektumcsoportok leírása az elemzett adatkészletből.

KDD az a folyamat, amellyel hasznos ismereteket nyerhetünk ki egy adatgyűjteményből. Ez a technológia a következő kérdéseket foglalja magában: adat-előkészítés, informatív funkciók kiválasztása, adattisztítás, Data Mining (DM) módszerek alkalmazása, adatok utófeldolgozása és az eredmények értelmezése.

A Tudásfeltárás az adatbázisokban folyamat a következő lépésekből áll:

  • 1) problémafelvetés - az alkalmazási terület felhasználói feladatainak és jellemzőinek elemzése, a bemeneti és kimeneti paraméterek készletének kiválasztása;
  • 2) a kezdeti adatkészlet előkészítése - adattárház létrehozása és az adatok gyűjtésére és frissítésére vonatkozó rendszer megszervezése;
  • 3) adat-előfeldolgozás - az adatbányászati ​​módszerek alkalmazása alapján, e módszer szempontjából az adatoknak jó minőségűnek és helyesnek kell lenniük;
  • 4) az adatok átalakítása, normalizálása - az információ későbbi elemzésre alkalmas formába hozása;
  • 5) Adatbányászat - automatikus adatelemzés, amely különböző algoritmusok használatán alapul a tudás megtalálása érdekében (neurális hálózatok, döntési fák, klaszterező algoritmusok, társítások létrehozása stb.);
  • 6) adatok utófeldolgozása - az eredmények értelmezése és a megszerzett ismeretek alkalmazása az üzleti alkalmazásokban.