Analüütilised andmetöötlusmeetodid otsuste toetamiseks. Online analüütiline andmetöötlus (OLAP)

3.4 Analüütilise andmetöötluse meetodid

Selleks, et olemasolevad andmelaod hõlbustaksid haldusotsuste vastuvõtmist, tuleb teave esitada analüütikule nõutaval kujul, st tal peab olema välja töötatud tööriistad laos andmetele juurdepääsuks ja töötlemiseks.

Väga sageli on teabe- ja analüüsisüsteemid, mis on loodud otsustajate otsese kasutamise ootusega, äärmiselt lihtsad, kuid nende funktsionaalsus on väga piiratud. Selliseid staatilisi süsteeme nimetatakse Executive Information Systems (EIS). Need sisaldavad palju päringuid ja on igapäevaseks läbivaatamiseks piisavad ning ei suuda vastata kõigile küsimustele, mis võivad otsuste tegemisel tekkida. Sellise süsteemi töö tulemus on reeglina mitmelehelised aruanded pärast hoolikat uurimist, mille analüütikul on uus küsimuste seeria. Kuid iga uus taotlus, mida sellise süsteemi kavandamisel ette ei nähta, tuleb esmalt ametlikult kirjeldada, programmeerija kodeerida ja alles seejärel täita. Ooteaeg võib sel juhul olla tunde ja päevi, mis pole alati vastuvõetav.

Online analüütiline töötlemine... Või on-line analüütiline töötlemine-OLAP on andmelao korraldamise põhikomponent. OLAP -kontseptsiooni kirjeldas 1993. aastal Edgar Codd ja sellel on mitmemõõtmelise analüüsi jaoks järgmised nõuded:

- andmete mitmemõõtmeline kontseptuaalne esitus, sealhulgas täielik toetus hierarhiatele ja mitmele hierarhiale (OLAP -i põhinõue);

- anda kasutajale analüüsitulemused mõistliku aja jooksul (tavaliselt mitte üle 5 sekundi), isegi vähem üksikasjaliku analüüsi hinnaga;

- võimalus teha selle rakenduse jaoks tüüpilisi loogilisi ja statistilisi analüüse ning salvestada need lõppkasutajale juurdepääsetaval kujul;

- mitme kasutaja juurdepääs andmetele sobivate lukustusmehhanismide ja volitatud juurdepääsuvahendite toel;

- võimalus juurde pääseda mis tahes vajalikule teabele, olenemata selle mahust ja salvestuskohast.

OLAP -süsteem koosneb paljudest komponentidest. Esitluse kõrgeimal tasemel sisaldab süsteem andmeallikat, mitmemõõtmelist andmebaasi (MDB), mis annab võimaluse rakendada OLAP -tehnoloogial põhinevat aruandlusmootorit, OLAP -serverit ja klienti. Süsteem on üles ehitatud kliendi-serveri põhimõttele ning pakub kaug- ja mitme kasutaja juurdepääsu MDB-serverile.

Mõelge OLAP -süsteemi komponentidele.

Allikad. OLAP -süsteemide allikas on server, mis pakub andmeid analüüsimiseks. Sõltuvalt OLAP -toote kasutusalast võib allikaks olla andmeladu, päritud andmebaas, mis sisaldab üldandmeid, komplekt

finantsandmeid ühendavaid tabeleid või ülaltoodud kombinatsioone.

Andmete salvestusruum. Toorandmeid kogutakse ja säilitatakse andmehoidlate ehitamise põhimõtete kohaselt kujundatud hoidlas. HD on relatsiooniline andmebaas (RDB). CD peamine tabel (faktitabel) sisaldab nende näitajate arvväärtusi, mille kohta statistilist teavet kogutakse.

Mitmemõõtmeline andmebaas Andmehoidla on teabe pakkuja mitmemõõtmelises andmebaasis, mis on objektide kogum. Nende objektide põhiklassid on mõõtmed ja mõõtmed. Mõõtmed hõlmavad väärtuste (parameetrite) kogumit, mille alusel andmeid indekseeritakse, näiteks aeg, piirkonnad, asutuse tüüp jne. Iga mõõde täidetakse andmelao vastavate dimensioonitabelite väärtustega. Mõõtmiste kogum määratleb uuritava protsessi ruumi. Mõõdud on mitmemõõtmelised andmekuubikud (hüperkuubikud). Hüperkuubik sisaldab andmeid ennast ja näitaja osaks olevate mõõtmete kogusummasid. Indikaatorid on MDB põhisisu ja need täidetakse vastavalt faktilisele tabelile. Hüperkuubi iga telje ääres saab andmeid korraldada hierarhias, mis esindab erinevaid detailsusastmeid. See võimaldab teil luua hierarhilisi mõõtmeid, mida kasutatakse andmete esitluse koondamiseks või uurimiseks järgneva andmeanalüüsi ajal. Tüüpiline näide hierarhilisest mõõtmest on territoriaalsete objektide loend, mis on rühmitatud linnaosade, piirkondade, linnaosade kaupa.

Server. OLAP -server on OLAP -süsteemi rakendatav osa. See komponent teeb kogu töö (olenevalt süsteemi mudelist) ja salvestab kogu teabe, millele aktiivne juurdepääs antakse. Serveri arhitektuuri juhivad erinevad kontseptsioonid. Eelkõige on OLAP -toodete peamine funktsionaalne omadus MDB või RDB kasutamine andmete salvestamiseks.

Kliendi rakendus Vastavalt struktureeritud ja MDB -sse salvestatud andmed on kliendirakenduse abil analüüsimiseks saadaval. Kasutaja saab võimaluse andmetele kaugjuurdepääsule, keeruliste päringute koostamisele, aruannete koostamisele ja andmete suvaliste alamhulkade vastuvõtmisele. Aruande saamine taandub konkreetsete mõõtmisväärtuste valimisele ja hüperkuubi sektsiooni ehitamisele. Ristlõige määratakse valitud mõõtmisväärtuste järgi. Ülejäänud mõõtmete andmed on kokku võetud.

OLAPkliendis ja serveris. Mitmemõõtmelist andmeanalüüsi saab läbi viia erinevate tööriistade abil, mida saab tinglikult jagada kliendi ja serveri OLAP -tööriistadeks.

OLAP -i klienditööriistad (näiteks Microsofti Excel 2000 liigendtabelid või Microsofti ProClarity) on rakendused, mis arvutavad ja kuvavad koondandmeid. Sellisel juhul sisalduvad koondandmed ise sellise OLAP -tööriista aadressiruumi vahemälus.

Kui lähteandmed sisalduvad töölaua DBMS -is, teeb koondandmete arvutamise OLAP -tööriist ise. Kui algandmete allikas on serveri DBMS, saadavad paljud kliendi OLAP -i tööriistad serverile SQL -päringuid ja selle tulemusel saavad serveris arvutatud koondandmed.

Tavaliselt rakendatakse OLAP -i funktsionaalsust statistilistes andmetöötlustööriistades ja mõnes arvutustabelis.

Paljud arendustööriistad sisaldavad klasside või komponentide teeke, mis võimaldavad teil luua lihtsamaid OLAP -funktsioone rakendavaid rakendusi (näiteks otsustuskuubiku komponendid Borland Delphis ja Borland C ++ Builderis). Lisaks pakuvad paljud ettevõtted ActiveX -juhtelemente ja muid teeke, mis pakuvad sarnast funktsionaalsust.

Kliendi OLAP -tööriistu kasutatakse reeglina väikese arvu mõõtmetega (tavaliselt mitte üle kuue) ja nende parameetrite väheste väärtustega - kuna saadud koondandmed peavad sobima sellise tööriista aadressiruumi ja nende arv kasvab mõõtmete arvu suurenemisega plahvatuslikult.

Paljud OLAP -i klienditööriistad võimaldavad salvestada vahemälu sisu koos koondandmetega failina, et mitte neid uuesti arvutada. Seda võimalust kasutatakse aga sageli koondandmete võõrandamiseks, et neid teistele organisatsioonidele edastada või avaldada.

Vahemälu koos koondandmetega faili salvestamise ideed arendati edasi serveri OLAP -i tööriistades (näiteks Oracle Express Server või Microsoft OLAP Services), kus koondandmete salvestamine ja muutmine ning neid sisaldava salvestusruumi säilitamine , teostab eraldi rakendus või protsess, mida nimetatakse OLAP -serveriks. Kliendirakendused saavad taotleda sellist mitmemõõtmelist salvestusruumi ja saada vastuseks teatud andmeid. Mõned kliendirakendused saavad ka selliseid hoidlaid luua või neid vastavalt muudetud lähteandmetele värskendada.

Serveripõhiste OLAP-tööriistade kasutamise eelised võrreldes kliendi OLAP-tööriistadega on sarnased serveripoolsete DBMS-ide kasutamise eelistega võrreldes lauaarvutitööriistadega: serveripõhiste tööriistade kasutamise korral toimub koondandmete arvutamine ja salvestamine server ja kliendirakendus saab neile ainult päringute tulemusi, mis võimaldab üldiselt vähendada võrguliiklust, päringu täitmise aega ja kliendirakenduse ressursivajadusi.

3.5 Mitmemõõtmelise andmete salvestamise tehnilised aspektid

Mitmemõõtmelisuse OLAP -rakendustes saab jagada kolmeks tasandiks:

1... Mitmemõõtmeline andmete esitus- lõppkasutaja tööriistad, mis pakuvad mitmemõõtmelist visualiseerimist ja andmetega manipuleerimist; MDI kiht võtab füüsilisest andmestruktuurist välja ja käsitleb andmeid mitmemõõtmelisena.

    Mitmemõõtmeline töötlemine- tööriist (keel) mitmemõõtmeliste päringute formuleerimiseks (traditsiooniline relatsiooniline SQL -keel osutub siin sobimatuks) ja protsessor, mis suudab sellist päringut töödelda ja täita.

    Mitmemõõtmeline salvestusruum- andmete füüsilise korraldamise vahendid, mis tagavad mitmemõõtmeliste päringute tõhusa täitmise.

Esimesed kaks taset on kohustuslikud kõikides OLAP -i tööriistades. Kolmas tasand, ehkki laialt levinud, ei ole nõutav, kuna mitmemõõtmelise vaate andmeid saab hankida ka tavalistest relatsioonistruktuuridest. Mitmemõõtmeline päringuprotsessor tõlgib sel juhul mitmemõõtmelised päringud SQL -päringuteks, mida täidab relatsiooniline DBMS.

Igas andmelaos - nii tavapärases kui ka mitmemõõtmelises - koos operatsioonisüsteemidest saadud üksikasjalike andmetega salvestatakse ka koondnäitajad (kokkuvõtlikud näitajad), näiteks müügimahtude summa kuude kaupa, tootekategooriate kaupa jne. Koondandmeid säilitatakse selgesõnaliselt ainus eesmärk on päringute täitmise kiirendamine. Tõepoolest, ühest küljest koguneb laos reeglina väga suur hulk andmeid ja teisest küljest on analüütikud enamikul juhtudel huvitatud mitte üksikasjalikest, vaid üldistatud näitajatest. Ja kui aastamüügi arvutamiseks tuleks iga kord kokku võtta miljonid üksikmüügid, oleks kiirus suure tõenäosusega vastuvõetamatu. Seetõttu arvutatakse andmete mitmemõõtmelisse andmebaasi laadimisel kõik kokkuvõtlikud näitajad või osa neist ja salvestatakse.

Koondandmete kasutamisel on aga puudusi. Peamised puudused on salvestatud teabe hulga suurenemine (uute mõõtmete lisamisel kasvab kuubiku moodustavate andmete hulk plahvatuslikult) ja nende laadimiseks kuluv aeg. Pealegi võib teabe hulk suureneda kümneid ja isegi sadu kordi. Näiteks ühes avaldatud standardtestides nõudis 10 MB algandmete täielik koondarv 2,4 GB, st andmed kasvasid 240 korda!

Andmete mahu suurenemine agregaatide arvutamisel sõltub kuubi mõõtmete arvust ja nende mõõtmete struktuurist, see tähendab vanemate ja järeltulijate arvu suhtest dimensiooni erinevatel tasanditel. Täitematerjalide salvestamise probleemi lahendamiseks kasutatakse keerukaid skeeme, mis võimaldavad kaugeltki kõigi võimalike agregaatide arvutamisel saavutada päringu jõudluse olulise tõusu.

Nii lähte- kui ka koondandmeid saab salvestada kas

relatsioonilistes või mitmemõõtmelistes struktuurides. Sellega seoses kasutatakse praegu mitmemõõtmeliste andmete salvestamiseks kolme võimalust:

MOLAP (Mitmemõõtmeline OLAP) - lähte- ja koondandmed salvestatakse mitmemõõtmelises andmebaasis. Andmete salvestamine mitmemõõtmelistes struktuurides võimaldab teil töödelda andmeid mitmemõõtmelise massiivina, nii et koondväärtuste arvutamise kiirus on kõigi mõõtmete puhul sama. Kuid sel juhul osutub mitmemõõtmeline andmebaas ülearuseks, kuna mitmemõõtmelised andmed sisaldavad täielikult algseid relatsiooniandmeid.

Need süsteemid pakuvad täielikku OLAP -i töötlemise tsüklit. Need sisaldavad kas lisaks serverikomponendile ka oma integreeritud kliendiliidest või kasutavad kasutajaga suhtlemiseks väliseid arvutustabeliprogramme.

ROLAP (Relatsiooniline OLAP) - algandmed jäävad samasse relatsiooniandmebaasi, kus need algselt asusid. Koondandmed paigutatakse teenindustabelitesse, mis on spetsiaalselt loodud nende salvestamiseks samas andmebaasis.

HOLAP (Hybrid OLAP) - algandmed jäävad samasse relatsiooniandmebaasi, kus need algselt asusid, ja koondandmed salvestatakse mitmemõõtmelises andmebaasis.

Mõned OLAP -i tööriistad toetavad andmete salvestamist ainult relatsioonistruktuurides, mõned ainult mitmemõõtmelistes struktuurides. Enamik kaasaegseid OLAP-i serveripõhiseid tööriistu toetab siiski kõiki kolme andmete salvestamise meetodit. Salvestusmeetodi valik sõltub lähteandmete suurusest ja struktuurist, päringute täitmise kiiruse nõuetest ja OLAP -kuupide värskendamise sagedusest.

3.6 Andmete kaevandamine (AndmedKaevandamine)

Mõiste Data Mining tähistab korrelatsioonide, suundumuste ja seoste leidmise protsessi erinevate matemaatiliste ja statistiliste algoritmide kaudu: otsuste tugisüsteemide klastrite moodustamine, regressioon ja korrelatsioonianalüüs jne. Sellisel juhul üldistatakse kogunenud teave automaatselt teabeks, mida saab iseloomustada teadmistena.

Kaasaegne andmete kaevandamise tehnoloogia põhineb mallide kontseptsioonil, mis peegeldab andmete alamproovidele omaseid mustreid ja moodustab nn varjatud teadmised.

Mustrite otsimisel kasutatakse meetodeid, mis ei kasuta nende alamproovide kohta a priori eeldusi. Andmekaevandamise oluline tunnus on otsitavate mustrite mittestandardne ja ilmselge puudumine. Teisisõnu, andmete kaevandamise tööriistad erinevad statistilistest andmetöötlustööriistadest ja OLAP -i tööriistadest selle poolest, et selle asemel, et kontrollida kasutajate eeldatud suhteid

andmete vahel suudavad nad olemasolevate andmete põhjal iseseisvalt selliseid suhteid leida, samuti püstitada hüpoteese nende olemuse kohta.

Üldiselt koosneb andmete kaevandamise protsess kolmest etapist

    mustrite tuvastamine (tasuta otsing);

    paljastatud mustrite kasutamine tundmatute väärtuste ennustamiseks (ennustav modelleerimine);

    erandite analüüs, mille eesmärk on tuvastada ja tõlgendada leitud mustrite kõrvalekaldeid.

Mõnikord eristatakse selgelt leitud mustrite usaldusväärsuse kontrollimise vaheetappi nende leidmise ja kasutamise vahel (valideerimise etapp).

Andmekaevandamismeetoditega on tuvastatud viis standardset mustritüüpi:

1. Assotsiatsioon võimaldab valida stabiilseid objektirühmi, mille vahel on kaudselt määratud lingid. Üksiku eseme või esemerühma esinemissagedust, väljendatuna protsentides, nimetatakse levimuseks. Madal levimus (alla tuhandiku protsendi) viitab sellele, et selline seos pole märkimisväärne. Ühendused on kirjutatud reeglite kujul: A=> B, kus AGA - pakett, SISSE - tagajärg. Iga saadud seose reegli olulisuse kindlakstegemiseks on vaja arvutada väärtus, mida nimetatakse usalduseks AGA To IN(või suhe A ja B). Usaldus näitab, kui tihti ja millal AGA ilmub IN. Näiteks kui d (A / B)= 20%, see tähendab, et toote ostmisel AGA igal viiendal juhul ostetakse ka kaup IN.

Tüüpiline näide assotsiatsiooni kasutamisest on ostude struktuuri analüüs. Näiteks supermarketis uuringut tehes saab kindlaks teha, et 65% kartulikrõpsude ostjatest võtavad ka Coca-Colat ja kui sellisele komplektile on allahindlus, ostetakse 85% juhtudest Colat. Need tulemused on väärtuslikud turundusstrateegiate kujundamisel.

2. Järjekord - see on meetod ühenduste õigeaegseks tuvastamiseks. Sel juhul on määratletud reeglid, mis kirjeldavad teatud sündmuste rühmade järjestikust esinemist. Need reeglid on skriptide koostamisel hädavajalikud. Lisaks saab neid kasutada näiteks tüüpilise eelneva müügi kogumi moodustamiseks, mis võib kaasa tuua konkreetse toote edasise müügi.

3. Klassifikatsioon - üldistamise tööriist. See võimaldab teil minna üksikute objektide kaalumisest üldistatud mõisteteni, mis iseloomustavad mõnda objektide kogumit ja on piisavad nendesse kogudesse (klassidesse) kuuluvate objektide äratundmiseks. Mõiste kujundamise protsessi olemus seisneb klassidele omaste mustrite leidmises. Objektide kirjeldamiseks kasutatakse palju erinevaid tunnuseid (atribuute). Tunnuste kirjeldustel põhineva kontseptsiooni moodustamise probleemi sõnastas M.M. Bongart. Selle lahendus põhineb kahe põhiprotseduuri rakendamisel: koolitus ja testimine. Koolitusprotseduurides koostatakse klassifitseerimisreegel, mis põhineb koolitusobjektide töötlemisel. Kontrollimise (uurimise) protseduur seisneb saadud klassifitseerimisreegli kasutamises objektide äratundmiseks uuest (uurimis) proovist. Kui testitulemused leitakse olevat rahuldavad, siis õppeprotsess lõpeb, vastasel juhul täpsustatakse klassifitseerimise reeglit ümberõppe käigus.

4 rühmitamine Kas teabe (kirjete) levitamine andmebaasist rühmadesse (klastritesse) või segmentidesse nende rühmade samaaegsel määramisel. Erinevalt klassifikatsioonist ei ole siin analüüsi jaoks vaja klasside eelnevat määramist.

5 aegrea prognoosimine on vahend vaadeldavate objektide atribuutide muutuste suundumuste kindlaksmääramiseks aja jooksul. Aegridade käitumise analüüs võimaldab ennustada uuritud tunnuste väärtusi.

Selliste probleemide lahendamiseks kasutatakse erinevaid andmekaevandamise meetodeid ja algoritme. Tulenevalt asjaolust, et andmekaevandamine on arenenud ja areneb selliste valdkondade nagu statistika, infoteooria, masinõpe, andmebaasiteooria ristumiskohas, on üsna loomulik, et enamik andmekaevandamise algoritme ja meetodeid töötati välja nende erialade erinevate meetodite põhjal.

Olemasolevate andmekaevandamismeetodite mitmekesisuse põhjal võib eristada järgmist:

    regressiooni, dispersiooni ja korrelatsiooni analüüs(rakendatud enamikes kaasaegsetes statistikapakettides, eriti ettevõtete SAS Institute, StatSoft jt toodetes);

    analüüsimeetodid konkreetses teemavaldkonnas, tuginedes empiirilistele mudelitele (kasutatakse sageli näiteks odavates finantsanalüüsi tööriistades);

    närvivõrgu algoritmid- meetod protsesside ja nähtuste simuleerimiseks, mis võimaldab reprodutseerida keerukaid sõltuvusi. Meetod põhineb bioloogilise aju lihtsustatud mudeli kasutamisel ja seisneb selles, et esialgseid parameetreid peetakse signaalideks, mis muundatakse vastavalt olemasolevatele "neuronite" vahelistele ühendustele, ning kogu võrgu reaktsioon lähteandmeid käsitletakse analüüsi tulemusena saadud vastusena. Sel juhul luuakse ühendused nn võrgukoolituse abil suure valimi abil, mis sisaldab nii lähteandmeid kui ka õigeid vastuseid. Närvivõrke kasutatakse laialdaselt klassifitseerimisprobleemide lahendamiseks;

    hägune loogika kasutatakse andmete töötlemiseks hägusate tõeväärtustega, mida võivad kujutada mitmesugused keelelised muutujad. Häguseid teadmiste esitusviise kasutatakse laialdaselt klassifitseerimis- ja prognoosimisprobleemide lahendamiseks, näiteks XpertRule Mineri süsteemis (Attar Software Ltd., Ühendkuningriik), aga ka AIS -is, NeuFuzis jne.

    induktiivjuhtmed võimaldab teil saada üldistusi andmebaasi salvestatud faktide kohta. Induktiivse õppimise protsessi võib kaasata hüpoteese esitav spetsialist. Seda nimetatakse juhendatud õppimiseks. Üldistusreeglite otsimist saab teha ilma õpetajata, automaatselt hüpoteese genereerides. Kaasaegses tarkvaras on reeglina mõlemad meetodid kombineeritud ja hüpoteeside kontrollimiseks kasutatakse statistilisi meetodeid. Induktiivjuhtmeid kasutava süsteemi näide on XpertRule Miner, mille on välja töötanud Attar Software Ltd. (Suurbritannia);

    põhjendus, mis põhineb sarnaseid juhtumeid(„Lähima naabri” meetod) (juhtumipõhine arutluskäik - CBR) põhineb andmebaasist olukordade otsimisel, mille kirjeldused on teatud tunnuste poolest sarnased antud olukorraga. Analoogiapõhimõte võimaldab eeldada, et sarnaste olukordade tulemused on ka üksteisele lähedal. Selle lähenemisviisi puuduseks on see, et see ei loo mingeid mudeleid ega reegleid, mis üldistaksid varasemaid kogemusi. Lisaks sõltub väljundi tulemuste usaldusväärsus olukordade kirjelduse täielikkusest, nagu induktiivse järeldamise protsessides. CBR -i kasutavad süsteemid on näiteks: KATE Tools (Acknosoft, Prantsusmaa), Pattern Recognition Workbench (Unica, USA);

    otsustuspuud- meetod ülesande struktureerimiseks puugraafiku kujul, mille tipud vastavad tootmisreeglitele, mis võimaldavad andmeid klassifitseerida või otsuste tagajärgi analüüsida. See meetod annab visuaalse ülevaate reeglite klassifitseerimise süsteemist, kui neid pole väga palju. Lihtsad probleemid lahendatakse seda meetodit kasutades palju kiiremini kui närvivõrkude kasutamisel. Keeruliste probleemide ja teatud andmetüüpide puhul ei pruugi otsustuspuud sobida. Lisaks on sellel meetodil oluline probleem. Üks hierarhilise andmete rühmitamise tagajärgi on paljude erijuhtumite jaoks hulga koolitusnäidete puudumine ja seetõttu ei saa klassifikatsiooni pidada usaldusväärseks. Otsustuspuu meetodeid rakendatakse paljudes tarkvaratööriistades, nimelt: С5.0 (RuleQuest, Austraalia), Clementine (Integral Solutions, UK), SIPINA (Lyoni ülikool, Prantsusmaa), IDIS (Information Discovery, USA);

    evolutsiooniline programmeerimine- andmete vastastikust sõltuvust väljendava algoritmi otsimine ja genereerimine, tuginedes algselt täpsustatud otsinguprotsessis muudetud algoritmile; mõnikord otsitakse vastastikuseid sõltuvusi mis tahes spetsiifiliste funktsioonide vahel (näiteks polünoomid);

piiratud otsingu algoritmid mis arvutavad lihtsate loogiliste sündmuste kombinatsioone andmete alarühmades.

3.7 IntegreerimineOLAPjaAndmedKaevandamine

Otsuste tugiprotsessi kaks osa on veebipõhine analüütiline töötlemine (OLAP) ja andmete kaevandamine (andmete kaevandamine). Kuid täna keskendub enamik OLAP-süsteeme ainult mitmemõõtmelistele andmetele juurdepääsu pakkumisele ja enamik andmete kaevandamise tööriistu, mis töötavad mustrite valdkonnas, tegelevad ühemõõtmeliste andmete perspektiividega. Otsuste tugisüsteemide andmetöötluse tõhustamiseks tuleks need kahte tüüpi analüüsid kombineerida.

Praegu näib sellist kombinatsiooni tähistavat liitmõiste "OLAP Data Mining" (mitmemõõtmeline kaevandamine).

"OLAP Data Mining" moodustamiseks on kolm peamist viisi:

    "Kuubamine ja kaevandamine". Kaevandamisanalüüsi tegemise võimalus tuleks anda mitmemõõtmelisele kontseptuaalsele esitusviisile, st indikaatorite hüperkuubi mis tahes projektsiooni mis tahes fragmendile.

    Kaevandamine ja kuubamine. Sarnaselt hoidlast saadud andmetele tuleb ka kaevandamistulemused esitada hüperkuubilisel kujul järgnevaks mitmemõõtmeliseks analüüsiks.

    "Kuubamine kaevandamise ajal". See paindlik integreerimisviis võimaldab teil automaatselt aktiveerida sama tüüpi intelligentsed töötlemismehhanismid mitme muutujaga analüüsi iga etapi (üleminek) tulemuste vahel üldistustasandite vahel, uue hüperkuubi fragmendi ekstraheerimine jne).

    Astronoomia jaoks 11 klass [Tekst ... neid kuidas osa tervik süsteemid ... dotsent ... Cheboksary, 2009. nr 10. S. 44 -49 .... Autorid- koostajad: N. ... konspektidloenguid, ...

  • Õpijuhend

    ... loenguid... Koolitus loenguid matemaatika. Kirjutamine konspektloenguid loenguid... Kasutamine teavettehnoloogiaid ...

  • I kondaurova s ​​v lebedeva

    Õpijuhend

    ... loenguid... Koolitus loenguid matemaatika. Kirjutamine konspektloenguid... Visuaalsete abivahendite ettevalmistamine. Lugemise tehnika loenguid... Kasutamine teavettehnoloogiaid ...

  • M MEDIA MONITORING Kutsehariduse kaasajastamine Märts - august 2011

    Kokkuvõte

    ... 11 .08.2011 "Surnud hinged-2" RNIMU-s neid ... 3,11 -3,44 ... ... avalik loenguid juhid ... Cheboksary... ja kritseldamine konspektid publik - ... teavetsüsteemid ja tehnoloogia. ... süsteem haridus, ütleb dotsent ... koostajad ... osad tõeline tegelik sisu ...

6. teema

ETTEVÕTLUSE INFOSÜSTEEMID MAJANDUSLIKU TEABE TÖÖTLEMISEKS

Ettevõtte infotehnoloogia kontseptsioon

Ettevõtte infotehnoloogia olemus ja tähendus

Ettevõtlusprogrammide hulgast mõistetakse mõistet „ettevõtte juhtimise infotehnoloogia” traditsiooniliselt kui „integreeritud juhtimise automatiseerimissüsteeme”. Nende teised nimed on samuti teada - ettevõtte ulatuses süsteemid, ettevõtte infosüsteemid (CIS), ettevõtte (või integreeritud) juhtimissüsteemid (KSU), automatiseeritud juhtimissüsteemid (ACS).

Reeglina on keerulised juhtimisautomaatikasüsteemid universaalsed põhilised lahendused, mis sobivad erinevat tüüpi ettevõtetele, eelkõige finantsjuhtimisele, varude haldamisele, ostu- ja müügijuhtimisele. Kuid samadel süsteemidel on sageli tööstusharu lahendused, mis kajastavad ühte või mitut muud spetsiifikat ja sisaldavad asjakohane regulatiivne ja võrdlusbaas.

Näiteks SAP R / 3 süsteemi lahendus lennundustööstusele toetab kõigi õhusõidukite osade seerianumbrite arvestust ja kontrolli, nende kasutusiga, kavandatud asendamist või remonti, mis tagab mitte ainult tootmise usaldusväärsuse, vaid ka reisijad.

Kuna integreeritud juhtimissüsteemid on peamiselt suunatud suurtele ettevõtetele, mis sisaldavad multidistsiplinaarseid struktuure, ei paku need mitte ainult väljatöötatud funktsioone, vaid pakuvad ka suure hulga teabe usaldusväärset salvestamist ja töötlemist, kasutades võimsaid platvorme ja süsteemitööriistu mitme kasutaja jaoks. ..

Kaasaegsed infotehnoloogiad, side ja Internet võimaldavad lahendada ühtse andmebaasi kaugjuurdepääsu probleeme, mis on samuti oluline ettevõtte juhtimise jaoks.

Ehita kontseptsioon

Kuigi enamik arendajaid nimetab oma tarkvaratooteid halduslikeks (ettevõte, ladu, rahandus jne), on sisuliselt peaaegu kõik ettevõtte juhtimisel kasutatavad tarkvaratööriistad finants- ja majandustegevuse fakte ja dokumente, raamatupidamissüsteeme koos aruannete koostamise ja viited analüütiliste tunnustega lubatud sektsioonides. See tähendab, et struktureeritud teave sisestatakse andmebaasi. Selle struktuuri määravad ühel või teisel määral omavahel ühendatud teatmikud, klassifikaatorid, standarddokumentide parameetrid ja vormid. Andmebaasis saadaoleva teabe kohaselt on nn "lõigatud" instrumentaalsete vahenditega "ehitatud", "välja tõmmatud", "kogutud". Olles saanud selliste andmete põhjal aruandeid ja viiteid, mida sageli nimetatakse analüütilisteks aruanneteks, saab juhtkond teha otsuseid. See on tüüpiline kontseptsioon ja tüüpiline tehnoloogia kõnealuse klassi süsteemidega töötamiseks.



Pole juhus, et funktsionaalse sisu, süsteemilahenduste, "haldustarkvara", nagu "Galaxy", "BEST" ja "1C: Enterprise" funktsionaalse sisu, süsteemilahenduste, otstarbe ja kasutamise poolest on need erinevad teabe korraldamise, tehnoloogia ja selle moodustamine ja töötlemine, samuti süsteemidega suhtlemise meetodid.

Sellele vaatamata esitasid ettevõtted, näiteks OJSC „Uralelectromed” ettevõtte juhtimistööriistadele nii karmid ja erinevad nõuded, et on vaja neid mitmetasandiliselt üles ehitada. Tavaliselt on tuum süsteemi tuum, mis sisaldab ainult programmikoode. Järgmine kontseptuaalselt oluline element on süsteemi sisseehitatud tööriistakomplekt, mis võimaldab ilma programmikoode muutmata vähemalt seda töökohal konfigureerida, konkreetseid toiminguid teha, sisestada uusi ja muuta esmaseid ja aruandlusdokumente ning kasutada muud parameetrilise reguleerimise vahendid. Täpsemates süsteemides on sisseehitatud tööriistad ettevõtte erinevate mudelite loomiseks: teave, organisatsiooniline, funktsionaalne jne. Ja lõpuks andmebaas ise.

Analüütilise teabe töötlemine

Ettevõtte tegevuse planeerimine, operatiivteabe hankimine ja selle analüüsi põhjal õige otsuse tegemine on seotud suurte andmemahtude töötlemisega. Ettevõtte raamatupidamissüsteemides koostatud aruanded ei ole tavaliselt paindlikud. Soovitud andmete, sealhulgas graafiliste andmete esitamiseks ei saa neid „väänata”, „laiendada” ega „ahendada”. Mida rohkem “kärpeid” ja “kärpeid” teha saate, seda realistlikumalt kujutate ette ettevõtte pilti ja teete äriprotsesside juhtimise osas parima otsuse. Seda tüüpi ülesannete täitmiseks on vaja matemaatilist ja majanduslikku modelleerimist ning kõrget tulemuslikkust. Analüütiline moodul on saadaval süsteemis "RepKo", tuntum on süsteem "Triumph -Analytica" ("PARUS" Corporation - "Toora keskus"). Näib, et raamatupidamissüsteemid koostavad andmebaasi salvestatud teabe põhjal viiteid erinevatesse „sektsioonidesse”, need esindavad lihtsalt seda, mis on. Ja analüüsisüsteemid loovad uut teavet vastavalt kindlaksmääratud parameetritele või kriteeriumidele, optimeerides seda konkreetsetel eesmärkidel. Seetõttu vajate sagedamini teabe vaatamiseks ja visualiseerimiseks spetsiaalset tööriista, milleks on online -analüütiline töötlemine (OLAP). See pakub mugavate ja kiirete vahendite kogumit juurdepääsuks, vaatamiseks ja mitmemõõtmeliseks analüüsiks salvestusruumi kogunenud teabele.

OLAP -tehnoloogiaid kasutatakse olukorra modelleerimiseks vastavalt skeemile „mis siis, kui…” ja mitmesuguste analüütiliste aruannete koostamiseks. Seal on spetsialiseerunud lääne tarkvaratooteid.

Tavaliselt edastatakse ettevõtte juhtimissüsteemidest saadud teave analüütiliseks andmetöötluseks spetsiaalsetesse programmidesse. Paljud kodumaised arendajad püüavad neid probleeme iseseisvalt lahendada, näiteks Nikos-Soft (süsteem NS-2000), Cepheus (ettevõtte juhtimissüsteem Etalon), KOMSOFT (KOMSOFT-STANDART "2.0) jne.

6.4. Ettevõtete infotehnoloogiate väljatöötamise ja kasutamise väljavaated

Lisaks kaasaegsete tööriistade ja platvormide ning süsteemivahendite väljatöötamisele ja kasutamisele eeldab kodumaiste korporatiivsüsteemide arendamine nende funktsionaalset küllastumist, eriti tootmise osas.

Hoolimata laialdastest kirgedest juhtimisstandardite rakendamise vastu, töötavad kodumaise tarkvaraturu juhtivad tegijad välja tööstuslahendusi erinevat tüüpi tööstusharudele.

Ettevõtete hirm oma arengute "konfidentsiaalsuse" avaldamise ees on vähenemas, mis aitab tugevdada nende jõupingutusi oma toodete integreerimiseks, selle asemel, et arendada kõike a -st "z" -ni. Täna pole kellelgi piisavalt ressursse. Uue kontseptsiooni mõistmiseks, projekti ja süsteemi väljatöötamiseks kulub aastaid, nimelt süsteemi, mis muudab selle kvaliteeti sõltuvalt sellest, mis selles sisaldub. Lisaks esitavad tarkvaratoodete integreerimise nõude ka ettevõtted, kes soovivad reeglina jätkata töötamist, spetsialiseerunud süsteeme ja kombineerida neid informatiivselt värskelt omandatud süsteemidega.

Integreerimine on vajalik ka erinevate tootjate toodete puhul - keeruliste lahenduste kombineerimisega spetsialiseeritud:

- eelarve koostamine, finants- ja majandusanalüüs, klienditeenindus, analüütiline andmetöötlus jne.

Tuleb märkida, et mitte juhtimissüsteemid ise ei ole paljutõotavamad, vaid lihtne ja universaalne tööriist nende loomiseks, mis on mõeldud kvalifitseeritud vahendajatele arendaja ja lõppkasutaja vahel. Nüüd üritavad neid funktsioone täita süsteemiadministraatorid ja analüütikud.

Kui selline tööriist on saadaval, on nõudlus kõigi tööstusharude kõigi ettevõtete jaoks "valmis" standardlahenduste järele.

Internetti kui täiendavat vahendit ettevõtte arendamiseks saab tõhusalt kasutada ainult integreeritud juhtimissüsteemi olemasolul.

Kuigi kaasaegsed info- ja kommunikatsioonitehnoloogiad, sealhulgas Internet, võimaldavad korraldada tarkvara rentimist, on ennatlik rääkida selliste võimaluste kasutamise lähiaja perspektiivist, eriti meie riigis. Ja mitte niivõrd konfidentsiaalsuse kaalutlustel, kuivõrd korra puudumise ja usaldusväärsete sidevahendite tõttu.

Katsed rakendada ja isegi mitte täielikult infotehnoloogia kasutamise katsed kodumaistes ettevõtetes on praktikas tõestanud, et "kaost ei saa automatiseerida". Ettevõtte ja ettevõtte enda ümberkorraldamine ning juhtimise regulatsioonide (juhiste) koostamine on vajalik. Ettevõtte töötajatel on raske sellise tööga iseseisvalt hakkama saada. Eriti arvestades ajafaktorit turutingimustes. Seetõttu areneb kõikjal välja konsultatsiooniettevõtetega suhtlemise praktika, mis aitab ettevõtetel ja õpetab oma töötajaid "laiendama kitsaskohti", rajama peamist äriprotsessi, arendama tehnoloogiat, ehitama infovooge jne. Lihtsustatud protsessi automatiseerimine on lihtsam, lihtsam, odavam ja kiirem.

Igaüks peab oma tööd tegema. Raamatupidaja, laopidaja, müügijuht ja muud "teema" spetsialistid ei peaks õigusaktide või äriskeemide muutmise tõttu parandama dokumentide vormide vormi, laiendama veerge ega vahetama oma kohti. Seetõttu on tarkvaraturg järk -järgult muutumas „tootest” „teenuseks”. Algama hakkab allhange - ettevõtte teatud funktsioonide üleandmine kaasatud ettevõtete spetsialistidele. Nad tegelevad seadmete, süsteemitarkvara hooldusega, süsteemide rakendatud (funktsionaalse) osa muutmisega jne.

Infotehnoloogia ja metoodilised teenused nende kasutajatele ja tarbijatele on muutumas ettevõtte juhtimissüsteemide kasutamisel kõige olulisemaks ja aktuaalsemaks.

8.3.1. On-line analüütilise töötlemise (OLAP) tööriistad

On-line analüütiline töötlemine on teabe operatiivse (reaalajas) analüütilise töötlemise vahend, mille eesmärk on toetada otsuste tegemist ja aidata analüütikutel vastata küsimusele "Miks on objektid, keskkonnad ja nende suhtlemise tulemused sellised ja mitte teised?" Sel juhul moodustab analüütik ise versioonid teabekomplekti vahelistest suhetest ja kontrollib neid vastavate struktureeritud teabe andmebaaside olemasolevate andmete alusel.

ERP -süsteeme iseloomustab analüütiliste komponentide olemasolu funktsionaalsete alamsüsteemide osana. Need pakuvad reaalajas analüütilise teabe moodustamist. See teave on enamiku juhtimisotsuste aluseks.

OLAP -tehnoloogiates kasutatakse hüperkuubikuid - spetsiaalselt struktureeritud andmeid (muidu nimetatakse neid OLAP -kuubikuteks). Hüperkuubi andmestruktuuris eristatakse järgmist:

Meetmed - statistiliste kokkuvõtlike tulemuste genereerimiseks kasutatavad kvantitatiivsed näitajad (rekvisiidid -alused);

Dimensioonid - kirjeldavad kategooriad (atribuudid -atribuudid), mille kontekstis mõõdikuid analüüsitakse.

Hüperkuubi mõõtmed määratakse ühe mõõtme mõõtmete arvu järgi. Näiteks hüperkuubik MÜÜK sisaldab järgmisi andmeid:

Mõõtmed: tarbijad, toimingute kuupäevad, kaubagrupid, nomenklatuur, muudatused, pakendid, laod, makseviisid, saadetise liigid, tariifid, valuuta, organisatsioonid, osakonnad, vastutavad, jaotuskanalid, piirkonnad, linnad;

Mõõdud: planeeritud kogus, tegelik kogus, planeeritud summa, tegelik summa, kavandatud maksed, tegelikud maksed, planeeritud saldo, tegelik saldo, müügihind, tellimuse täitmise aeg, tagasimakse summa.

Selline hüperkuubik on ette nähtud analüütilisteks aruanneteks:

Tarbijate klassifitseerimine ostude mahu järgi;

ABC meetodil müüdavate kaupade klassifikatsioon;

Erinevate tarbijate tellimuste täitmise tingimuste analüüs;

Müügimahtude analüüs perioodide, kaupade ja kaubagruppide, piirkondade ja tarbijate, siseosakondade, juhtide ja müügikanalite kaupa;

Tarbijatega vastastikuste arvelduste prognoos;

Tarbijatelt kaupade tagastamise analüüs; jne.

Analüütilistel aruannetel võib olla suvaline mõõtmete ja mõõtmete kombinatsioon, neid kasutatakse juhtimisotsuste analüüsimiseks. Analüütiline töötlemine toimub instrumentaalsete ja keeleliste vahenditega. Avalikult kättesaadavas MS Exceli arvutustabelis on esitatud infotehnoloogia "Pivot Tables", nende loomise lähteandmed on:

Nimekiri (andmebaas) MS Excel - relatsioonitabel;

Teine MS Exceli pöördetabel;

MS Exceli lahtrite koondvalik, mis asuvad samas või erinevates töövihikutes;

Väline relatsiooniline andmebaas või OLAP -kuup, andmeallikas (failid .dsn, .ode formaadis).

Pivot -tabelite koostamiseks väliste andmebaaside põhjal kasutage ODBC draivereid ja programmi MS Query. Esialgse MS Exceli andmebaasi koondtabelil on järgmine struktuur (joonis 8.3).

Pivot tabeli paigutusel on järgmine andmestruktuur (joonis 8.4): mõõtmed - osakonna kood, positsioon; meetmed - töökogemus, palk ja lisatasu. Allpool on kokkuvõtlik tabel. 8.2, mis võimaldab analüüsida keskmise töökogemuse ja palga, keskmise töökogemuse ja lisatasude, palga ja lisatasude suhet.

Tabel 8.2

Pivot tabel linkide analüüsiks

Tabeli lõpp. 8.2

Pöördtabeli abil analüüsi jätkamiseks saate teha järgmist.

Lisage uusi kogusummasid (näiteks keskmine palk, keskmine lisatasu jne);

Kasutage kirjete ja pöördtabeli kogusummade filtreerimist (näiteks atribuudi "Sugu" järgi, mis paigutatakse paigutusse * Lehekülg);

Arvutage struktuurinäitajad (näiteks palkade ja boonusfondide jaotus divisjonide kaupa - kasutades liigendtabelite täiendavat töötlemist, summa osad veergude kaupa); jne.

MS Office'i komplekt võimaldab teil avaldada arvutustabeli andmeid, sealhulgas XTML -vormingus pöördtabeleid ja diagramme.

Microsoft Office Web Components toetab Internet Exploreris avaldatud andmetega töötamist, võimaldades täiendavat analüüsi (muudatused liigendtabeli andmestruktuuris, uute kokkuvõtete arvutamine).

8.3.2. Andmekaevandustööriistad (DM)

DM -tööriistad hõlmavad andmete väljavõtmist ("väljakaevamine", "kaevandamine") ja nende eesmärk on tuvastada seos ettevõtte digitaalsetesse andmebaasidesse salvestatud teabe vahel, mida analüütik saab kasutada mudelite koostamiseks, mis kvantifitseerivad tegurite mõju. huvi. Lisaks võivad sellised tööriistad olla kasulikud hüpoteeside koostamiseks ettevõtte digitaalsete andmebaaside infosuhete võimaliku olemuse kohta.

Teksti kaevandamise (TM) tehnoloogia on tööriistakomplekt, mis võimaldab teil analüüsida suuri teabekogumeid, otsides suundumusi, mustreid ja suhteid, mis võivad aidata teil strateegilisi otsuseid teha.

Image Mining (IM) tehnoloogia sisaldab tööriistu erinevate ettevõtte andmebaasidesse salvestatud või välistest teabeallikatest veebipõhise otsingu tulemusel saadud visuaalsete piltide äratundmiseks ja klassifitseerimiseks.

Kõigi andmete töötlemise ja salvestamise probleemide lahendamiseks kasutatakse järgmisi lähenemisviise:

1) mitme varusüsteemi või ühe hajutatud dokumendihaldussüsteemi loomine, mis võimaldavad teil andmeid salvestada, kuid millel on kasutaja soovil aeglane juurdepääs salvestatud teabele;

2) väga paindlike, kuid mitte tekstidokumentide otsimiseks ja säilitamiseks kohandatud Interneti -süsteemide ehitamine;

3) Interneti-portaalide kasutuselevõtt, mis on hästi suunatud kasutajate soovidele, kuid millel puudub kirjeldav teave nendesse laaditud tekstiandmete kohta.

Eespool loetletud probleemidest vabad tekstitöötlussüsteemid võib jagada kahte kategooriasse: keeleanalüüsi süsteemid ja tekstiandmete analüüsisüsteemid.

Teksti kaevandamise tehnoloogia põhielemendid on järgmised:

Kokkuvõte;

Funktsioonide eraldamine

Klasterdamine

Klassifikatsioon

Küsimustele vastamine (küsimustele vastamine);

Temaatiline indekseerimine;

Otsi märksõnade järgi (märksõnaotsing);

Taksonoomiate ja tesauruste loomine ja säilitamine.

Tarkvaratooted, mis rakendavad teksti kaevandamise tehnoloogiat, hõlmavad järgmist:

IBM Intelligent Miner for Text - üksikute käsurea utiliitide komplekt või vahelejätmine; üksteisest sõltumatud (põhirõhk on andmete kaevandamise mehhanismidel - teabe otsimisel);

Oracle InterMedia Text - DBMS -i integreeritud komplekt, mis võimaldab teil kasutajate päringutega kõige tõhusamalt töötada (võimaldab töötada kaasaegsete relatsiooniliste DBMS -idega keeruliste mitmeotstarbeliste tekstiotsingute ja -analüüside kontekstis);

Megaputer Text Analyst on programmi integreeritud COM -objektide komplekt teksti kaevandamise ülesannete lahendamiseks.

8.3.3. Arukas infotehnoloogia

Tänapäeval domineerib juhtimise automatiseerimise valdkonnas teabe analüüs otsuste ettevalmistamise esialgses etapis - esmase teabe töötlemine, probleemolukorra lagundamine, mis võimaldab õppida ainult fragmentide ja protsesside üksikasju, mitte olukorda tervikuna. Sellest puudusest ülesaamiseks tuleb õppida parimate spetsialistide kogemusi kasutades teadmistebaase üles ehitama, samuti puuduvad teadmised genereerima.

Infotehnoloogiate kasutamine inimtegevuse erinevates valdkondades, infomahtude hüppeline kasv ja vajadus kiiresti reageerida igas olukorras nõudsid uute probleemide lahendamiseks sobivate võimaluste otsimist. Kõige tõhusam neist on infotehnoloogiate intellektuaalsuse viis.

All intelligentne infotehnoloogia(ITT) all mõistetakse tavaliselt sellist infotehnoloogiat, mis pakub järgmisi võimalusi:

Teadmistebaaside olemasolu, mis kajastavad konkreetsete inimeste, rühmade, ühiskondade, inimkonna kui terviku kogemusi loominguliste probleemide lahendamisel teatud tegevusvaldkondades, peetakse traditsiooniliselt inimese intelligentsuse eesõiguseks (näiteks sellised halvasti vormistatud ülesanded nagu otsuste tegemine) , kujundus, tähenduse ekstraheerimine, selgitamine, koolitus jne);

Teadmisbaasidel põhinevate mõtlemismudelite olemasolu: reeglid ja loogilised järeldused, argumenteerimine ja arutluskäik, olukordade äratundmine ja klassifitseerimine, üldistamine ja mõistmine jne;

Oskus langetada üsna selgeid otsuseid, mis põhinevad udustel, lahtistel, mittetäielikel, alamääratletud andmetel;

Oskus selgitada järeldusi ja otsuseid, s.t. selgitusmehhanismi olemasolu;

Võime õppida, ümber koolitada ja seetõttu areneda.

Andmete ja teabe varjatud mustrite mitteametliku otsimise tehnoloogiad Teadmiste avastamine (KD) põhineb uusimatel objektide teabepiltide kujundamise ja struktureerimise tehnoloogiatel, mis on kõige lähemal intelligentsete süsteemide andmetöötluse põhimõtetele.

Otsuste tugi (DS) otsuste toetamise infotehnoloogia on asjatundlik kest.

süsteemid või spetsiaalsed ekspertsüsteemid, mis võimaldavad analüütikutel ettevõtte struktureeritud teabe alusel kindlaks teha infostruktuuride vahelisi seoseid ja seoseid, samuti ennustada otsuste tegemise võimalikke tulemusi.

IIT arengusuunad. Side- ja sidesüsteemid.Ülemaailmsed infovõrgud ja IIT võivad radikaalselt muuta meie arusaama ettevõtetest ja vaimsest tööst endast. Töötajate kohalolek töökohal muutub peaaegu mittevajalikuks. Inimesed saavad töötada kodus ja suhelda üksteisega vastavalt vajadusele võrkude kaudu. Tuntud on näiteks edukas kogemus Boeing-747 lennuki uue modifikatsiooni loomisel hajutatud spetsialistide meeskonna poolt, kes suhtleb Interneti kaudu. Igas arengus osalejate asukoht mängib üha väiksemat rolli, kuid osalejate kvalifikatsiooni taseme tähtsus suureneb. Teine põhjus, mis määras IIT kiire arengu, on seotud sidesüsteemide keerukuse ja nende alusel lahendatud ülesannetega. See nõudis kvalitatiivselt uut "intellektuaalsuse" taset selliste tarkvaratoodete puhul, nagu süsteemid heterogeensete ja mitte rangete andmete analüüsimiseks, infoturbe tagamiseks, otsuste tegemiseks hajusüsteemides jne.

Haridus... Juba täna hakkab kaugõpe hariduses olulist rolli mängima ning IIT kasutuselevõtt individualiseerib seda protsessi oluliselt vastavalt iga õpilase vajadustele ja võimetele.

Igapäevane elu... Igapäevaelu informatiseerimine on juba alanud, kuid IIT arenguga tekivad põhimõtteliselt uued võimalused. Järk -järgult kantakse arvutisse üle kõik uued funktsioonid: kontroll kasutaja tervise üle, kodumasinate, näiteks niisutajate, õhuvärskendajate, küttekehade, ionisaatorite, muusikakeskuste, meditsiinilise diagnostika jms kontroll. Teisisõnu, süsteemidest saavad ka inimese seisundi ja tema kodu diagnostikud. Ruumidesse tagatakse mugav inforuum, kus infokeskkond muutub inimkeskkonna osaks.

IIT arendamise väljavaated... Tundub, et praegu on IIT jõudnud oma arengu põhimõtteliselt uuele etapile. Niisiis on viimase 10 aasta jooksul IIT võimalused märkimisväärselt laienenud uut tüüpi loogiliste mudelite väljatöötamise ja uute ilmnemise tõttu.

välja teooriad ja mõisted. IIT arendamise põhipunktid on järgmised:

Üleminek loogilisest järeldusest argumentatsiooni ja arutluse mudelitele;

Otsige asjakohaseid teadmisi ja looge selgitusi;

Tekstide mõistmine ja süntees;

Kognitiivne graafika, s.t. teadmiste graafiline ja kujundlik esitus;

Mitme agendiga süsteemid;

Intelligentse võrgu mudelid;

Arvutused, mis põhinevad hägusal loogikal, närvivõrkudel, geneetilistel algoritmidel, tõenäosusarvutustel (rakendatakse erinevates kombinatsioonides üksteisega ja ekspertsüsteemidega);

Meta-teadmiste probleem.

Mitme agendiga süsteemidest on saanud uus paradigma paljutõotavate IIT loomiseks. Siinkohal eeldatakse, et agent on iseseisev intellektuaalne süsteem, millel on oma eesmärkide seadmise ja motivatsiooni süsteem, oma tegevuspiirkond ja vastutus. Agentide vahelist suhtlust pakub kõrgema taseme süsteem - metaintelligents. Mitme agendiga süsteemides modelleeritakse virtuaalset arukate agentide kogukonda - objektid, mis on autonoomsed, aktiivsed, sõlmivad erinevaid sotsiaalseid suhteid - koostöö ja koostöö (sõprus), konkurents, konkurents, vaen jne. Kaasaegsete probleemide lahendamise sotsiaalne aspekt on arenenud intellektuaalsete tehnoloogiate - virtuaalsete organisatsioonide, virtuaalse ühiskonna - kontseptuaalse uudsuse põhijoon.

(?) Kontrollküsimused ja ülesanded

1. Kirjeldage ettevõtet kui informatsiooni objekti. Millised on peamised näitajad, mis iseloomustavad ettevõtte juhtimissüsteemi arengut?

2. Loetle tööstusettevõtete juhtiv infotehnoloogiahaldus.

3. Millised on ettevõtete (korporatsioonide) organisatsioonilise ja strateegilise arendamise peamised infotehnoloogiad.

4. Millele tuginevad äriprotsesside parandamisele suunatud strateegilise juhtimise standardid? Milline on infotehnoloogia BPM ja BPI suhe?

5. Määratlege totaalse kvaliteedijuhtimise (TQM) filosoofia. Kuidas on seotud kvaliteedi ja infotehnoloogia arenguetapid?

6. Nimetage ettevõtte organisatsioonilise arengu peamised sätted, kirjeldage strateegilise juhtimise etappe. Millised on rühma strateegiad?

7. Kuidas luuakse ettevõtte ärimudel? Millised on peamised lähenemisviisid ärimudeli tõhususe hindamiseks?

8. Mis on tasakaalustatud tulemuskaart? Millised on BSC põhikomponendid? Millised on BSC näitajate rühmade omavahelised seosed?

9. Loetlege infosüsteemide loomise metoodilised alused. Mis on süsteemne lähenemine?

10. Milline on informatiivne lähenemine infosüsteemide ja tehnoloogiate kujundamisel?

11. Milline on strateegiline lähenemine infosüsteemide ja tehnoloogiate kujundamisele?

12. Mis on objektikeskse lähenemisviisi sisu agentide käitumise kirjeldamisel turul? Andke objekti määratlus, märkige agendisüsteemide analoogid.

13. Millised on metoodilised põhimõtted info- ja kommunikatsioonitehnoloogial põhineva ettevõtte juhtimise parandamiseks? Mis on IKT eesmärk?

14. Andke dokumendi, dokumendivoo, dokumendivoo, dokumendihaldussüsteemi definitsioonid.

15. Kuidas on kujundatud dokumendivormi paigutus? Nimetage dokumendi tsoonid, nende andmete koostis.

16. Millised on dokumendihaldussüsteemi põhitehnoloogiad.

17. Mis on ühtne dokumenteerimissüsteem? Millised on ühinemise üldpõhimõtted?

18. Kirjeldage organisatsioonilist ja haldusdokumentatsiooni, tooge näiteid dokumentidest.

19. Millised on nõuded elektroonilisele dokumendihaldussüsteemile?

20. Mis on ettevõtte infosüsteem? Millised on peamised juhtimisahelad, funktsionaalsete moodulite koostis.

21. Nimetage teile SRÜ jaoks teadaolevad tarkvaratooted. Esitage nende võrdlevad omadused.

W Kirjandus

1. Tagasi J., Moriarty S. Turunduskommunikatsioon. Integreeritud lähenemine. SPb.; Harkov: Peeter, 2001.

2. Brooking E. Intellektuaalne kapital. Uue aastatuhande edu võti. SPb.: Peeter, 2001.

3. Godin V.V., Korpev I.K. Inforessursside haldamine. M.: INFRA-M, 1999.

4. Infosüsteemid ja tehnoloogiad majanduses: Õpik. 2. väljaanne, Lisa. ja muudetud / M.I. Semenov, I.T. Trubilin, V.I. Loiko, T.P. Baranovskaja; Ed. IN JA. Loiko. Moskva: rahandus ja statistika, 2003.

5. Infotehnoloogia ettevõtluses / Toim. M. Zheleny. SPb.: Peeter, 2002.

6. Kaplan Robert S., Norton David P. Tasakaalustatud tulemuskaart. Strateegiast tegevuseni / Per. inglise keelest M: CJSC "Olymp-Business", 2003.

7. Karagodin V.I., Karagodina BJI. Teave kui elu alus. Dubna: Phoenix, 2000.

8. Karminsky AM., Nesterov PZ. Äriinfo. Moskva: rahandus ja statistika, 1997.

9. Likhacheva T.N. Infotehnoloogiad infoühiskonna teenistuses // Uued infotehnoloogiad majandussüsteemides. M., 1999.

10. Ostreykovsky V.A. Süsteemiteooria. M.: Kõrgkool, 1997.

11. Piterkin S.V., Oladov N.A., Isaev D.V. Venemaa jaoks õigel ajal. ERP -süsteemide kasutamise praktika. 2. toim. M.: Kirjastus Alpina, 2003.

12. Sokolov D.V. Sissejuhatus sotsiaalse suhtluse teooriasse: Õpik. toetus. SPb.: Kirjastus SP6GUP, 1996.

13. Trofimov V.Z., Tomilov V.Z. Info- ja kommunikatsioonitehnoloogiad juhtimises: õpik. toetus. Peterburi: Peterburi Riikliku Majandusülikooli kirjastus, 2002.

Riistvara ja tarkvara kaasaegne arengutase on juba mõnda aega võimaldanud operatiivteabe andmebaaside laialdast haldamist erinevatel juhtimistasanditel. Tööstusettevõtted, ettevõtted, osakondade struktuurid, valitsusasutused ja haldusasutused on oma tegevuse käigus kogunud suuri andmemahtusid. Need sisaldavad endas suurt potentsiaali kasuliku analüütilise teabe hankimiseks, mille põhjal on võimalik tuvastada varjatud suundumusi, koostada arengustrateegia ja leida uusi lahendusi.

Viimastel aastatel on maailmas kujunenud mitmeid uusi kontseptsioone ettevõtte andmete säilitamiseks ja analüüsimiseks:

1) Andmelaod

2) On-line analüütiline töötlemine (OLAP)

3) Andmete kaevandamine - IAD (Data Mining)

OLAP -i analüütilised andmetöötlussüsteemid on otsuste tugisüsteemid, mis on keskendunud keerukamate päringute täitmisele, mis nõuavad teatud aja jooksul kogutud ajalooliste andmete statistilist töötlemist. Neid kasutatakse äriaruannete koostamiseks müügi, turunduse juhtimise eesmärgil, nn Data Mining - andmete kaevandamine, s.t. viis andmebaasis oleva teabe analüüsimiseks, et leida kõrvalekaldeid ja suundumusi ilma kirjete tähendust välja selgitamata.

OLAP -il põhinevad analüüsisüsteemid hõlmavad tehisintellekti meetoditel põhinevaid infotöötlustööriistu ja graafilisi andmete esitamise tööriistu. Need süsteemid on määratud suure hulga ajalooliste andmetega, võimaldades neist olulist teavet välja võtta, s.t. saada andmetest teadmisi.

Töötlemise tõhusus saavutatakse võimsa mitmeprotsessorilise tehnoloogia, keerukate analüüsimeetodite ja spetsiaalsete andmete salvestamise abil.

Relatsioonandmebaasid talletavad üksused eraldi tabelites, mis on tavaliselt hästi normaliseeritud. See struktuur on mugav operatiivsete andmebaaside (OLTP süsteemid) jaoks, kuid keerulised mitme tabeli päringud on selles suhteliselt aeglased. Parem päringute mudel kui muutmine on ruumiline andmebaas.

OLAP -süsteem teeb relatsiooniandmebaasi hetktõmmise ja struktureerib selle päringute ruumimudeliks. OLAP -i päringute väidetav töötlemisaeg on umbes 0,1% relatsiooniandmebaasi sarnastest päringutest.

Operatiivandmetest loodud OLAP -raamistikku nimetatakse OLAP -kuubikuks. Tabelite ühendamisel tähega skeemi abil luuakse kuup. "Tähe" keskel on faktitabel, mis sisaldab peamisi fakte, mida tuleb küsida. Faktitabeliga on ühendatud mitu dimensioonitabelit. Need tabelid näitavad, kuidas saab koondatud relatsiooniandmeid analüüsida. Võimalike koondamiste arvu määrab algviiside hierarhilise kuvamise viiside arv.

Antud süsteemiklassid (OLAP ja OLTP) põhinevad DBMS -i kasutamisel, kuid päringuliigid on väga erinevad. OLAP -mootor on tänapäeval üks populaarsemaid andmeanalüüsi meetodeid. Selle probleemi lahendamiseks on kaks peamist lähenemisviisi. Esimest neist nimetatakse mitmemõõtmeliseks OLAPiks (MOLAP) - mehhanismi rakendamiseks, kasutades serveripoolset mitmemõõtmelist andmebaasi, ja teine ​​on relatsiooniline OLAP (ROLAP) - kuubikute ehitamine "lennult", mis põhinevad SQL -päringutel relatsioonilisele DBMS. Igal neist lähenemisviisidest on eelised ja puudused. Töölaua OLAP -süsteemi üldist skeemi saab esitada joonisel fig.

Töö algoritm on järgmine:

1) andmete hankimine tasase tabeli kujul või SQL -päringu täitmise tulemus;

2) andmete salvestamine vahemällu ja teisendamine mitmemõõtmeliseks kuubiks;

3) konstrueeritud kuubi kuvamine risttabeli või diagrammi abil jne.

Üldiselt saab ühe kuubikuga ühendada suvalise arvu kuvasid. OLAP -süsteemides kasutatavad kuvarid on enamasti kahte tüüpi: risttabelid ja graafikud.

Tähe diagramm. Selle idee on see, et iga mõõtme jaoks on tabelid ja kõik faktid on paigutatud ühte tabelisse, mis on indekseeritud mitme võtme abil, mis koosneb üksikute mõõtmete võtmetest. Iga täheskeemi kiir määrab Coddi terminoloogias andmete koondamise suuna piki vastavat mõõdet.

Mitmetasandiliste mõõtmetega keeruliste probleemide korral on mõttekas pöörduda täheskeemi laienduste poole - tähtkujuskeem ja lumehelveskeem. Nendel juhtudel luuakse eraldi faktitabelid erinevate dimensioonide kokkuvõtvate tasandite võimalike kombinatsioonide jaoks. See võimaldab paremaid tulemusi, kuid põhjustab sageli andmete koondamist ja märkimisväärseid tüsistusi andmebaasi struktuuris, mis sisaldab tohutul hulgal faktitabeleid.

tähtkuju diagramm

Analüütiline andmetöötlus - See on andmete analüüs, mis nõuab asjakohast metoodilist tuge ja spetsialistide teatavat koolitust.

Kaasaegsed infotehnoloogiad võimaldavad automatiseerida kogunenud esmase teabe analüüsimise protsesse, koostada analüütilisi mudeleid, hankida valmislahendusi ja neid praktikas kasutada. Peamised nõuded , mida analüüsimeetoditele esitatakse, on tõhusus, lihtsus, automatism. Selle kontseptsiooni aluseks on kaks kaasaegset tehnoloogiat: andmekaevandamine ja teadmiste avastamine andmebaasides (KDD).

Andmete kaevandamine - see on protsess, mille käigus avastatakse lähteandmetes varem tundmatu, mitte-triviaalne, praktiliselt kasulik ja juurdepääsetav tõlgendus teadmistest, mis on vajalikud otsuste tegemiseks erinevates inimtegevuse valdkondades (G. Pyatetsky-Shapiro, selle suuna asutajate määratlus) .

Andmekaevandamistehnoloogia eesmärk on leida ebaselgeid mustreid. Andmeanalüüsi etapid on järgmised:

  • 1) klassifikatsioon ( klassifikatsioon) - tunnuste tuvastamine, mis iseloomustavad uuritud andmekogumi objektide rühmi - klassid. Lahendusmeetodid, mida kasutatakse klassifitseerimisprobleemi jaoks: lähima naabri meetodid ( lähim naaber) ja ^ ’- lähim naaber ( k -lähim naaber) -, Bayesi võrgud (Bayesi võrgud) -, otsustuspuude esilekutsumine; närvivõrgud (närvivõrgud) -,
  • 2) klastrite moodustamine (rühmitamine)- objektide jagamine rühmadesse, kuna objektiklassid pole esialgu määratletud. Näide klasteriprobleemi lahendamise meetodist: iseorganiseeruvad Kohoneni kaardid - järelevalveta õppimisega närvivõrk. Nende kaartide oluline omadus on nende võime kuvada tasapinnal mitmemõõtmelisi tunniruume, esitades andmed kahemõõtmelise kaardi kujul;
  • 3) ühendus (ühendused)- andmestiku seotud sündmuste vaheliste mustrite tuvastamine. Need mustrid ilmnevad mitte analüüsitava objekti omaduste põhjal, vaid mitme samaaegselt toimuva sündmuse vahel, näiteks Apriori algoritm;
  • 4) järjestus (järjestus), või järjestikune seos (järjestikune seos),- otsida ajalisi mustreid tehingute vahel, s.t. mustrid ei ole loodud samaaegselt toimuvate sündmuste vahel, vaid ajas ühendatud sündmuste vahel. Assotsiatsioon on järjestused, mille ajaline null on null. Järjestuse reegel: pärast sündmust X teatud aja möödudes toimub sündmus Y;
  • 5) prognoosimine (ennustamine) - on üles ehitatud ajalooliste andmete tunnuste alusel, s.t. hinnatakse sihtarvuliste näitajate väljajäetud või tulevasi väärtusi. Prognoosimisprobleemide lahendamiseks kasutatakse matemaatilise statistika meetodeid, närvivõrke jne.
  • 6) kõrvalekallete või kõrvalekallete määramine (kõrvalekallete tuvastamine), kõrvalekallete või kõrvalekallete analüüs - üldisest andmekogumist kõige erinevamate andmete avastamine ja analüüsimine;
  • 7) hindamine (hinnang)- objekti pidevate väärtuste ennustamine;
  • 8) linkide analüüs (linkide analüüs)- ülesanne leida andmestikust sõltuvused;
  • 9) visualiseerimine (visualiseerimine, graafiku kaevandamine)- analüüsitud andmetest graafilise pildi loomine. Graafilisi meetodeid kasutatakse andmete mustrite olemasolu näitamiseks, näiteks andmete esitamine 2D ja 3D mõõtmetes;
  • 10) Kokkuvõte ( kokkuvõte) - konkreetsete objektirühmade kirjeldus analüüsitud andmestikust.

KDD on protsess, mille käigus kogutakse andmekogust kasulikke teadmisi. See tehnoloogia hõlmab järgmisi küsimusi: andmete ettevalmistamine, informatiivsete funktsioonide valik, andmete puhastamine, andmekaevandamise (DM) meetodite rakendamine, andmete järeltöötlus ja tulemuste tõlgendamine.

Andmebaaside teadmiste avastamise protsess koosneb järgmistest sammudest.

  • 1) probleemilahendus - kasutajaülesannete ja rakendusvaldkonna funktsioonide analüüs, sisend- ja väljundparameetrite komplekti valimine;
  • 2) esialgse andmestiku koostamine - andmelao loomine ning andmete kogumise ja uuendamise skeemi korraldamine;
  • 3) andmete eeltöötlus - andmete kaevandamise meetodite kasutamise põhjal peavad selle meetodi seisukohast andmed olema kvaliteetsed ja õiged;
  • 4) andmete teisendamine, normaliseerimine - teabe viimine hilisemaks analüüsiks sobivasse vormi;
  • 5) Andmete kaevandamine - automaatne andmete analüüs, mis põhineb erinevate algoritmide kasutamisel teadmiste leidmiseks (närvivõrgud, otsustuspuud, klastrite algoritmid, assotsiatsioonide loomine jne);
  • 6) andmete järeltöötlus - tulemuste tõlgendamine ja ärirakendustes saadud teadmiste rakendamine.