Metode analitice de prelucrare a datelor pentru sprijinirea deciziilor. Prelucrarea datelor analitice online (OLAP)

3.4 Metode de prelucrare analitică a datelor

Pentru ca depozitele de date existente să faciliteze adoptarea deciziilor de gestionare, informațiile trebuie prezentate analistului în forma necesară, adică trebuie să fi dezvoltat instrumente pentru accesarea și prelucrarea datelor din depozit.

Foarte des, informațiile și sistemele analitice create cu așteptarea utilizării directe de către factorii de decizie sunt extrem de ușor de utilizat, dar sunt extrem de limitate ca funcționalitate. Astfel de sisteme statice se numesc Executive Information Systems (EIS). Acestea conțin multe întrebări și, fiind suficiente pentru examinarea zilnică, nu sunt în măsură să răspundă la toate întrebările care pot apărea atunci când se iau decizii. Rezultatul muncii unui astfel de sistem, de regulă, este rapoarte de mai multe pagini, după un studiu atent, pe care analistul le are o nouă serie de întrebări. Cu toate acestea, fiecare nouă cerere neprevăzută în proiectarea unui astfel de sistem trebuie mai întâi descrisă formal, codificată de programator și abia apoi executată. Timpul de așteptare în acest caz poate fi de ore și zile, ceea ce nu este întotdeauna acceptabil.

Procesare analitică online... Sau Prelucrare analitică on-line, OLAP este o componentă cheie a organizației de depozitare a datelor. Conceptul OLAP a fost descris în 1993 de Edgar Codd și are următoarele cerințe pentru aplicațiile de analiză multivariată:

- reprezentarea conceptuală multidimensională a datelor, inclusiv suport complet pentru ierarhii și ierarhii multiple (o cerință cheie a OLAP);

- furnizarea utilizatorului cu rezultatele analizei într-un timp rezonabil (de obicei, nu mai mult de 5 s), chiar cu prețul unei analize mai puțin detaliate;

- capacitatea de a efectua orice analiză logică și statistică, tipică pentru această aplicație, și de a o salva într-un formular accesibil utilizatorului final;

- acces multi-utilizator la date cu suport de mecanisme de blocare adecvate și mijloace de acces autorizate;

- capacitatea de a accesa orice informații necesare, indiferent de volumul și locația de stocare.

Un sistem OLAP constă din mai multe componente. La cel mai înalt nivel de prezentare, sistemul include o sursă de date, o bază de date multidimensională (MDB) care oferă posibilitatea de a implementa un motor de raportare bazat pe tehnologia OLAP, un server OLAP și un client. Sistemul este construit pe principiul client-server și oferă acces la distanță și multi-utilizator la serverul MDB.

Luați în considerare componentele unui sistem OLAP.

Surse. Sursa din sistemele OLAP este serverul care furnizează datele pentru analiză. În funcție de domeniul de utilizare al produsului OLAP, sursa poate fi un depozit de date, o bază de date moștenită care conține date generale, un set

tabele care combină date financiare sau orice combinație a celor de mai sus.

Magazin de date. Datele brute sunt colectate și stocate într-un depozit proiectat în conformitate cu principiile construirii depozitelor de date. HD este o bază de date relațională (RDB). Tabelul principal CD (tabelul de date) conține valorile numerice ale indicatorilor pentru care sunt colectate informații statistice.

Baza de date multidimensională Magazinul de date servește ca furnizor de informații pentru o bază de date multidimensională, care este o colecție de obiecte. Principalele clase ale acestor obiecte sunt dimensiunile și măsurile. Dimensiunile includ un set de valori (parametri) prin care datele sunt indexate, de exemplu, timpul, regiunile, tipul instituției etc. Fiecare dimensiune este umplută cu valori din tabelele de dimensiuni corespunzătoare din depozitul de date. Setul de măsurători definește spațiul procesului investigat. Măsurile sunt cuburi de date multidimensionale (hipercuburi). Hipercubul conține datele în sine, precum și sumele agregate pentru dimensiunile care fac parte din indicator. Indicatorii constituie conținutul principal al MDB și sunt completați conform tabelului de date. De-a lungul fiecărei axe a hipercubului, datele pot fi organizate într-o ierarhie reprezentând diferite niveluri de detaliu. Acest lucru vă permite să creați dimensiuni ierarhice, care vor fi utilizate pentru a agrega sau descrie prezentarea datelor în timpul analizei ulterioare a datelor. Un exemplu tipic de dimensiune ierarhică este o listă de obiecte teritoriale grupate pe districte, regiuni, districte.

Server. Serverul OLAP este partea aplicată a sistemului OLAP. Această componentă face toată treaba (în funcție de modelul sistemului) și stochează în sine toate informațiile la care este oferit accesul activ. Arhitectura serverului este guvernată de diferite concepte. În special, principala caracteristică funcțională a produselor OLAP este utilizarea MDB sau RDB pentru stocarea datelor.

Cerere client.Datele structurate corespunzător și stocate în MDB sunt disponibile pentru analiză utilizând aplicația client. Utilizatorul are posibilitatea de a accesa de la distanță datele, de a formula interogări complexe, de a genera rapoarte și de a primi subseturi de date arbitrare. Obținerea unui raport se reduce la selectarea valorilor de măsurare specifice și la construirea unei secțiuni a hipercubului. Secțiunea transversală este determinată de valorile de măsurare selectate. Datele pentru restul dimensiunilor sunt rezumate.

OLAPpe client și pe server. Analiza multidimensională a datelor poate fi realizată folosind diverse instrumente, care pot fi împărțite condiționat în instrumente OLAP client și server.

Instrumentele client OLAP (de exemplu, Pivot Tables în Excel 2000 de la Microsoft sau ProClarity de la Knosys) sunt aplicații care calculează și afișează date agregate. În acest caz, datele agregate în sine sunt conținute în memoria cache din spațiul de adresă al unui astfel de instrument OLAP.

Dacă datele sursă sunt conținute în SGBD-ul desktop, calculul datelor agregate este efectuat chiar de instrumentul OLAP. Dacă sursa datelor originale este un SGBD de server, multe dintre instrumentele OLAP client trimit interogări SQL către server și, ca rezultat, primesc datele agregate calculate pe server.

De obicei, funcționalitatea OLAP este implementată în instrumentele de procesare a datelor statistice și în unele foi de calcul.

Multe instrumente de dezvoltare conțin biblioteci de clase sau componente care vă permit să creați aplicații care implementează cea mai simplă funcționalitate OLAP (cum ar fi componentele Cube Decizie în Borland Delphi și Borland C ++ Builder). În plus, multe companii oferă controale ActiveX și alte biblioteci care oferă funcționalități similare.

Instrumentele client OLAP sunt utilizate, de regulă, cu un număr mic de dimensiuni (de obicei nu mai mult de șase) și o mică varietate de valori pentru acești parametri - deoarece datele agregate obținute trebuie să se încadreze în spațiul de adrese al unui astfel de instrument , iar numărul lor crește exponențial odată cu creșterea numărului de dimensiuni.

Multe instrumente OLAP client vă permit să salvați conținutul cache-ului cu date agregate sub formă de fișier pentru a nu le recalcula. Cu toate acestea, această oportunitate este adesea utilizată pentru a înstrăina datele agregate în scopul transferării acestora către alte organizații sau pentru publicare.

Ideea stocării unui cache cu date agregate într-un fișier a fost dezvoltată în continuare în instrumentele OLAP de server (de exemplu, Oracle Express Server sau Microsoft OLAP Services), în care salvarea și modificarea datelor agregate, precum și menținerea stocării care le conține , sunt efectuate de o aplicație sau proces separat numit server OLAP. Aplicațiile clientului pot solicita o astfel de stocare multidimensională și pot primi anumite date ca răspuns. Unele aplicații client pot, de asemenea, să creeze astfel de depozite sau să le actualizeze în funcție de datele sursă modificate.

Avantajele utilizării instrumentelor OLAP bazate pe server comparativ cu instrumentele OLAP client sunt similare cu avantajele utilizării DBMS-urilor de server comparativ cu instrumentele desktop: în cazul utilizării instrumentelor bazate pe server, calculul și stocarea datelor agregate are loc pe server, iar aplicația client primește doar rezultatele interogărilor către acestea, ceea ce permite, în general, să reducă traficul de rețea, timpul de execuție a interogării și cerințele de resurse pentru aplicația client.

3.5 Aspecte tehnice ale stocării datelor multidimensionale

Multidimensionalitatea în aplicațiile OLAP poate fi împărțită în trei niveluri:

1... Reprezentarea datelor multidimensionale- instrumente pentru utilizatorii finali care oferă vizualizare multidimensională și manipulare a datelor; stratul MDI abstractizează din structura fizică a datelor și tratează datele ca fiind multidimensionale.

    Prelucrare multidimensională- un mijloc (limbaj) pentru formularea interogărilor multidimensionale (limbajul SQL relațional tradițional se dovedește a fi inadecvat aici) și un procesor care poate procesa și executa o astfel de interogare.

    Depozitare multidimensională- mijloace de organizare fizică a datelor, asigurând executarea eficientă a interogărilor multidimensionale.

Primele două niveluri sunt obligatorii în toate instrumentele OLAP. Al treilea nivel, deși răspândit, nu este necesar, deoarece datele pentru viziunea multidimensională pot fi preluate și din structurile relaționale regulate. Procesorul de interogare multidimensională, în acest caz, traduce interogările multidimensionale în interogări SQL care sunt executate de SGBD relațional.

În orice depozit de date - atât convențional, cât și multidimensional - împreună cu datele detaliate preluate din sistemele operaționale, sunt stocate, de asemenea, indicatori agregați (indicatori rezumativi), cum ar fi suma volumelor de vânzări pe lună, pe categorii de produse etc. Agregatele sunt stocate în mod explicit pentru singurul scop de a accelera interogările. Într-adevăr, pe de o parte, de regulă, o cantitate foarte mare de date se acumulează în depozit, iar pe de altă parte, analiștii, în majoritatea cazurilor, sunt interesați nu de indicatori detaliați, ci de indicatori generalizați. Și dacă milioane de vânzări individuale ar trebui să fie însumate de fiecare dată pentru a calcula vânzările anuale, viteza ar fi cel mai probabil inacceptabilă. Prin urmare, atunci când încărcați date într-o bază de date multidimensională, toți indicatorii rezumat sau o parte din aceștia sunt calculați și salvați.

Cu toate acestea, utilizarea datelor agregate este plină de dezavantaje. Principalele dezavantaje sunt creșterea cantității de informații stocate (când se adaugă noi dimensiuni, cantitatea de date care alcătuiește cubul crește exponențial) și timpul necesar pentru încărcarea acestora. Mai mult, cantitatea de informații poate crește de zeci și chiar de sute de ori. De exemplu, într-unul dintre testele standard publicate, un număr total agregat pentru 10 MB de date brute a necesitat 2,4 GB, adică datele au crescut de 240 de ori!

Gradul în care crește volumul de date la calcularea agregatelor depinde de numărul de dimensiuni din cub și de structura acestor dimensiuni, adică de raportul numărului de „părinți” și „descendenți” la diferite niveluri ale dimensiunii. Pentru a rezolva problema stocării agregatelor, se utilizează scheme complexe care permit, atunci când se calculează departe de toate agregatele posibile, să se obțină o creștere semnificativă a performanței interogării.

Atât datele inițiale, cât și cele agregate pot fi stocate fie în

relațional sau în structuri multidimensionale. În acest sens, sunt utilizate în prezent trei moduri de stocare a datelor multidimensionale:

MOLAP (OLAP multidimensional) - Sursa și datele agregate sunt stocate într-o bază de date multidimensională. Stocarea datelor în structuri multidimensionale vă permite să manipulați datele ca o matrice multidimensională, astfel încât viteza de calcul a valorilor agregate să fie aceeași pentru oricare dintre dimensiuni. Cu toate acestea, în acest caz, baza de date multidimensională se dovedește a fi redundantă, deoarece datele multidimensionale conțin complet datele relaționale originale.

Aceste sisteme oferă un ciclu complet de procesare OLAP. Acestea fie includ, pe lângă componenta server, propria lor interfață client integrată, fie utilizează programe de calcul tabelar extern pentru a comunica cu utilizatorul.

ROLAP (OLAP relațional) - datele originale rămân în aceeași bază de date relațională în care au fost localizate inițial. Datele agregate sunt plasate în tabele de servicii special create pentru stocarea lor în aceeași bază de date.

HOLAP (OLAP hibrid) - datele originale rămân în aceeași bază de date relațională în care au fost localizate inițial, iar datele agregate sunt stocate în baza de date multidimensională.

Unele instrumente OLAP acceptă stocarea datelor numai în structuri relaționale, unele doar în structuri multidimensionale. Cu toate acestea, majoritatea instrumentelor OLAP moderne bazate pe server acceptă toate cele trei metode de stocare a datelor. Alegerea metodei de stocare depinde de dimensiunea și structura datelor sursă, cerințele pentru viteza de execuție a interogărilor și frecvența actualizării cuburilor OLAP.

3.6 Exploatarea datelor (DateMinerit)

Termenul Data Mining denotă procesul de găsire a corelațiilor, tendințelor și relațiilor prin diferiți algoritmi matematici și statistici: grupare, regresie și analiza corelației etc. pentru sistemele de sprijinire a deciziilor. În acest caz, informațiile acumulate sunt automat generalizate la informații care pot fi caracterizate ca cunoștințe.

Tehnologia modernă de exploatare a datelor se bazează pe conceptul de șabloane care reflectă tiparele inerente sub-eșantioanelor de date și constituie așa-numita cunoaștere ascunsă.

Căutarea modelelor se realizează folosind metode care nu utilizează nicio ipoteză a priori despre aceste submostre. O caracteristică importantă a mineritului de date este non-standardul și non-claritatea modelelor căutate. Cu alte cuvinte, instrumentele de Data Mining diferă de instrumentele de procesare a datelor statistice și instrumentele OLAP prin faptul că, în loc să verifice în prealabil relațiile asumate de utilizatori

între date, pe baza datelor disponibile, ei sunt capabili să găsească în mod independent astfel de relații, precum și să construiască ipoteze despre natura lor.

În general, procesul de extragere a datelor constă în trei etape

    identificarea tiparelor (căutare gratuită);

    utilizarea modelelor dezvăluite pentru a prezice valori necunoscute (modelare predictivă);

    analiza excepțiilor, concepută pentru a identifica și interpreta anomalii în tiparele găsite.

Uneori, se distinge clar o etapă intermediară de verificare a fiabilității modelelor găsite între găsirea și utilizarea acestora (etapa validării).

Există cinci tipuri standard de modele identificate prin metodele de extragere a datelor:

1. Asociere vă permite să selectați grupuri stabile de obiecte între care există linkuri specificate implicit. Frecvența apariției unui articol individual sau a unui grup de articole, exprimată în procente, se numește prevalență. O rată de prevalență scăzută (mai puțin de o miime de procent) sugerează că o astfel de asociere nu este semnificativă. Asociațiile sunt scrise sub formă de reguli: A=> B, Unde DAR - pachet, IN - consecinţă. Pentru a determina importanța fiecărei reguli de asociere obținute, este necesar să se calculeze valoarea, care se numește încredere DAR La ÎN(sau relație A și B).Încrederea arată cât de des când DAR apare ÎN. De exemplu, dacă d (A / B)= 20%, aceasta înseamnă că atunci când cumpărați un produs DARîn fiecare al cincilea caz, bunurile sunt, de asemenea, achiziționate ÎN.

Un exemplu tipic de utilizare a asociației este analiza structurii achizițiilor. De exemplu, atunci când se efectuează un studiu într-un supermarket, se poate stabili că 65% dintre cei care au cumpărat chipsuri de cartofi iau și Coca-Cola, iar dacă există o reducere pentru un astfel de set, Cola este cumpărat în 85% din cazuri. Aceste rezultate sunt valoroase în conturarea strategiilor de marketing.

2. Secvență - este o metodă de identificare a asociațiilor în timp. În acest caz, sunt definite reguli care descriu apariția secvențială a anumitor grupuri de evenimente. Aceste reguli sunt esențiale pentru construirea scripturilor. În plus, ele pot fi utilizate, de exemplu, pentru a forma un set tipic de vânzări anterioare care pot implica vânzări ulterioare ale unui anumit produs.

3. Clasificare - instrument de generalizare. Vă permite să treceți de la luarea în considerare a obiectelor individuale la concepte generalizate care caracterizează unele seturi de obiecte și sunt suficiente pentru recunoașterea obiectelor aparținând acestor seturi (clase). Esența procesului de formare a conceptului este de a găsi modele inerente claselor. Multe caracteristici (atribute) diferite sunt folosite pentru a descrie obiecte. Problema formării conceptului pe baza descrierilor de caracteristici a fost formulată de M.M. Bongart. Soluția sa se bazează pe aplicarea a două proceduri de bază: instruire și testare. În procedurile de antrenament, se construiește o regulă de clasificare pe baza procesării unui set de obiecte de antrenament. Procedura de verificare (examinare) constă în utilizarea regulii de clasificare obținute pentru recunoașterea obiectelor dintr-un eșantion nou (examinare). Dacă rezultatele testului sunt satisfăcătoare, atunci procesul de învățare se încheie, altfel regula de clasificare este rafinată în timpul procesului de reînvățare.

4 grupare Este distribuirea informațiilor (înregistrări) din baza de date în grupuri (clustere) sau segmente cu determinarea simultană a acestor grupuri. Spre deosebire de clasificare, aici, pentru analiză, nu este necesară nicio atribuire preliminară de clase.

5 prognoze de serii cronologice este un instrument pentru determinarea tendințelor schimbărilor în atributele obiectelor avute în vedere în timp. Analiza comportamentului seriilor temporale face posibilă prezicerea valorilor caracteristicilor studiate.

Pentru a rezolva astfel de probleme, sunt utilizate diverse metode și algoritmi de Data Mining. Datorită faptului că Data Mining s-a dezvoltat și se dezvoltă la intersecția unor discipline precum statistica, teoria informației, învățarea automată, teoria bazelor de date, este destul de firesc ca majoritatea algoritmilor și metodelor de Data Mining să fie dezvoltate pe baza diferitelor metode din aceste discipline.

Din varietatea metodelor existente de extragere a datelor, se pot distinge următoarele:

    analiza de regresie, varianță și corelație(implementat în majoritatea pachetelor statistice moderne, în special în produsele companiilor SAS Institute, StatSoft etc.);

    metode de analizăîntr-un domeniu specific, bazat pe modele empirice (adesea utilizate, de exemplu, în instrumente de analiză financiară ieftine);

    algoritmi de rețea neuronală- o metodă de simulare a proceselor și fenomenelor care permite reproducerea dependențelor complexe. Metoda se bazează pe utilizarea unui model simplificat al unui creier biologic și constă în faptul că parametrii inițiali sunt considerați ca semnale care sunt transformate în conformitate cu conexiunile existente între „neuroni” și răspunsul întregii rețele la datele inițiale sunt considerate ca un răspuns rezultat din analiză. În acest caz, conexiunile sunt create folosind așa-numita instruire în rețea prin intermediul unui eșantion mare care conține atât datele inițiale, cât și răspunsurile corecte. Rețelele neuronale sunt utilizate pe scară largă pentru rezolvarea problemelor de clasificare;

    logica fuzzy este folosit pentru a procesa date cu valori de adevăr neclare care pot fi reprezentate de o varietate de variabile lingvistice. Reprezentarea cunoștințelor fuzzy este utilizată pe scară largă pentru rezolvarea problemelor de clasificare și prognoză, de exemplu, în sistemul XpertRule Miner (Attar Software Ltd., Marea Britanie), precum și în AIS, NeuFuz etc.

    conduce inductiv vă permit să obțineți generalizări ale faptelor stocate în baza de date. În procesul de învățare inductivă, poate fi implicat un specialist care furnizează ipoteze. Aceasta se numește învățare supravegheată. Căutarea regulilor de generalizare poate fi efectuată fără un profesor prin generarea automată de ipoteze. În software-ul modern, de regulă, ambele metode sunt combinate, iar metodele statistice sunt utilizate pentru a testa ipotezele. Un exemplu de sistem care utilizează conductori inductivi este XpertRule Miner dezvoltat de Attar Software Ltd. (Marea Britanie);

    raționament bazat pe cazuri similare(Metoda „Cel mai apropiat vecin”) (Raționamentul bazat pe cazuri - CBR) se bazează pe căutarea într-o bază de date pentru situații ale căror descrieri sunt similare într-o serie de caracteristici unei situații date. Principiul analogiei ne permite să presupunem că rezultatele unor situații similare vor fi, de asemenea, apropiate unele de altele. Dezavantajul acestei abordări este că nu creează niciun model sau regulă care să generalizeze experiența anterioară. În plus, fiabilitatea rezultatelor obținute depinde de completitudinea descrierii situațiilor, ca și în procesele de inferență inductivă. Exemple de sisteme care utilizează CBR sunt: ​​KATE Tools (Acknosoft, Franța), Pattern Recognition Workbench (Unica, SUA);

    copaci de decizie- o metodă de structurare a unei sarcini sub forma unui grafic arborescent, ale cărui vârfuri corespund regulilor de producție care permit clasificarea datelor sau analiza consecințelor deciziilor. Această metodă oferă o reprezentare vizuală a sistemului de clasificare a regulilor, dacă nu sunt foarte multe dintre ele. Problemele simple sunt rezolvate folosind această metodă mult mai rapid decât folosind rețelele neuronale. Pentru probleme complexe și pentru unele tipuri de date, arborii de decizie pot să nu fie corespunzători. În plus, această metodă are o problemă de semnificație. Una dintre consecințele grupării ierarhice de date este absența unui număr mare de exemple de instruire pentru multe cazuri speciale și, prin urmare, clasificarea nu poate fi considerată fiabilă. Metodele arborelui decizional sunt implementate în multe instrumente software, și anume: С5.0 (RuleQuest, Australia), Clementine (Integral Solutions, UK), SIPINA (Universitatea din Lyon, Franța), IDIS (Information Discovery, SUA);

    programare evolutivă- căutarea și generarea unui algoritm care exprimă interdependența datelor, pe baza algoritmului specificat inițial, modificat în procesul de căutare; uneori căutarea interdependențelor se efectuează între orice tipuri specifice de funcții (de exemplu, polinoame);

algoritmi de căutare limitați care calculează combinații de evenimente logice simple în subgrupuri de date.

3.7 IntegrareOLAPșiDateMinerit

Procesarea analitică online (OLAP) și extragerea datelor (Data Mining) sunt două părți ale procesului de sprijinire a deciziilor. Cu toate acestea, astăzi majoritatea sistemelor OLAP se concentrează doar pe furnizarea accesului la date multidimensionale, iar majoritatea instrumentelor de Data Mining care lucrează în domeniul tiparelor se ocupă de perspective de date unidimensionale. Pentru a crește eficiența procesării datelor pentru sistemele de sprijinire a deciziilor, aceste două tipuri de analize ar trebui combinate.

În prezent, termenul compus „OLAP Data Mining” (minerit multidimensional) pare să denumească o astfel de combinație.

Există trei moduri principale de a forma „OLAP Data Mining”:

    „Cubing apoi mining”. Capacitatea de a efectua analize miniere ar trebui să fie furnizată pentru orice rezultat al unei interogări către o reprezentare conceptuală multidimensională, adică pentru orice fragment al oricărei proiecții a unui hipercub de indicatori.

    Exploatarea minieră apoi cubularea. La fel ca datele preluate dintr-un depozit, rezultatele miniere trebuie prezentate sub formă hipercubică pentru analiza multivariată ulterioară.

    „Cubarea în timp ce se exploatează”. Această metodă flexibilă de integrare vă permite să activați automat același tip de mecanisme de procesare inteligente în rezultatul fiecărei etape de analiză multivariantă (tranziție) între nivelurile de generalizare, extragerea unui nou fragment de hipercub etc.).

    Astronomia pentru 11 clasă [Text ... lor Cum parteîntregul sisteme ... profesor asistent ... Cheboksary, 2009. Nr. 10. S. 44 -49 .... Autori- compilatoare: N. ... sinopseleprelegeri, ...

  • Ghid de studiu

    ... prelegeri... Instruire prelegeri matematică. Scris rezumatprelegeri prelegeri... Utilizare informațietehnologii ...

  • I k kondaurova cu v lebedeva

    Ghid de studiu

    ... prelegeri... Instruire prelegeri matematică. Scris rezumatprelegeri... Pregătirea ajutoarelor vizuale. Tehnica de citire prelegeri... Utilizare informațietehnologii ...

  • MONITORIZAREA M MEDIILOR Modernizarea învățământului profesional martie - august 2011

    rezumat

    ... 11 .08.2011 „Dead Souls-2” în RNIMU lor ... 3,11 -3,44 ... ... public prelegeri lideri ... Cheboksary... și mâzgălit sinopsele public - ... informațiesistemeși tehnologie. ... sistem educație, spune profesor asistent ... compilatoare ... părți dinîmbunătățirea reală conţinut ...

Subiectul 6

SISTEME DE INFORMAȚII CORPORATIVE PENTRU PRELUCRAREA INFORMAȚIILOR ECONOMICE

Conceptul tehnologiei informației corporative

Esența și semnificația tehnologiei informației corporative

Printre varietatea de programe destinate afacerilor, termenul „tehnologia informației în guvernanța corporativă” este în mod tradițional înțeles ca „sisteme integrate de automatizare a managementului”. Sunt cunoscute și celelalte denumiri ale acestora - sisteme la scară de întreprindere, sisteme de informații corporative (CIS), sisteme de management corporative (sau integrate) (KSU), sisteme de control automat (ACS).

De regulă, sistemele complexe de automatizare a controlului sunt soluții universale „de bază” potrivite pentru diferite tipuri de întreprinderi, în primul rând gestionarea financiară, gestionarea stocurilor, achiziționarea și gestionarea vânzărilor. o bază de reglementare și de referință adecvată.

De exemplu, soluția sistemului SAP R / 3 pentru industria aeronautică sprijină contabilitatea și controlul numerelor de serie ale tuturor pieselor aeronavei, durata de viață a acestora, înlocuirea sau reparația planificată, care asigură nu numai fiabilitatea producției, ci și siguranța pasagerilor.

Deoarece sistemele de management integrate sunt axate în primul rând pe întreprinderile mari care conțin structuri multidisciplinare, ele oferă nu numai un set dezvoltat de funcții, ci oferă și stocare și procesare fiabilă a unor cantități mari de informații, folosind platforme puternice și instrumente de sistem pentru munca multi-utilizator. ..

Tehnologiile informaționale moderne, comunicațiile și internetul permit rezolvarea problemelor de acces la distanță la o singură bază de date, care este, de asemenea, importantă pentru guvernanța corporativă.

Construiți conceptul

Deși majoritatea dezvoltatorilor își numesc produsele software manageriale (întreprindere, depozit, finanțe etc.), în esență, aproape toate instrumentele software utilizate în guvernanța corporativă înregistrează fapte și documente ale activităților financiare și economice, sisteme de contabilitate cu capacitatea de a construi rapoarte și referințe în secțiunile permise de caracteristicile analitice. Adică, informațiile structurate sunt introduse în baza de date. Această structură este stabilită într-un grad sau altul prin cărți de referință interconectate, clasificatori, parametri și forme de documente standard. Conform informațiilor disponibile în baza de date, așa-numita „tăietură” este „construită”, „scoasă”, „colectată” prin mijloace instrumentale. După ce a primit rapoarte și referințe, numite adesea rapoarte analitice, pe baza acestor date, conducerea poate lua decizii. Acesta este conceptul tipic și tehnologia tipică pentru lucrul cu sistemele clasei în cauză.



Nu este o coincidență faptul că atât de diferite în ceea ce privește conținutul funcțional, soluțiile de sistem, scopul și utilizarea software-ului de "gestionare", cum ar fi metodele de interacțiune cu sistemele "Galaktika", "BEST" și "1C: Enterprise".

Cu toate acestea, întreprinderile, de exemplu, OJSC Uralelectromed, propun cerințe atât de dure și variate pentru instrumentele de guvernanță corporativă, încât devine necesar să le construim pe mai multe niveluri. De obicei, nucleul este nucleul sistemului, care conține doar coduri de program. Următorul element important din punct de vedere conceptual este setul de instrumente încorporat al sistemului, care permite, fără a modifica codurile programului, cel puțin să îl configurați la locurile de muncă, să efectuați operațiuni specifice, să introduceți noi și să modificați formele existente de documente primare și de raportare și să utilizați alte mijloace de ajustare parametrică. Sistemele mai avansate au instrumente încorporate pentru crearea diferitelor modele ale unei întreprinderi: informații, organizaționale, funcționale etc. Și, în cele din urmă, baza de date în sine.

Prelucrarea analitică a informațiilor

Planificarea activităților unei întreprinderi, obținerea de informații operaționale și luarea deciziei corecte pe baza analizei sale este asociată cu prelucrarea unor cantități mari de date. Rapoartele generate în sistemele de contabilitate corporativă nu sunt de obicei flexibile. Nu pot fi „rotite”, „extinse” sau „prăbușite” pentru a obține reprezentarea datelor dorite, inclusiv cele grafice. Cu cât puteți face mai multe „felii” și „tăieturi”, cu atât vă puteți imagina imaginea întreprinderii și puteți lua cea mai bună decizie în ceea ce privește gestionarea proceselor de afaceri. Pentru acest tip de sarcini, sunt necesare modelări matematice și economice, precum și performanțe ridicate. Modulul analitic este disponibil în sistemul „RepKo”, cel mai cunoscut este sistemul „Triumph-Analytica” („PARUS” Corporation - „Torah Center”). S-ar părea că sistemele de contabilitate construiesc referințe în diferite „secțiuni” pe baza informațiilor stocate în baza de date, ele reprezintă pur și simplu ceea ce este. Și sistemele analitice construiesc informații noi conform parametrilor sau criteriilor specificate, optimizându-le în scopuri specifice. Prin urmare, mai des aveți nevoie de un instrument special pentru vizualizarea și vizualizarea informațiilor, care este procesarea analitică online (OLAP). Acesta oferă un set de mijloace convenabile și de mare viteză de acces, vizualizare și analiză multidimensională a informațiilor acumulate în stocare.

Tehnologiile OLAP sunt utilizate pentru a modela o situație în conformitate cu schema „ce se întâmplă dacă ...” și pentru a compila o varietate de rapoarte analitice. Există produse software occidentale specializate.

De obicei, informațiile din sistemele de management corporativ sunt transferate către programe specializate pentru prelucrarea analitică a datelor. Mulți dezvoltatori interni încearcă să rezolve singuri aceste probleme, de exemplu, Nikos-Soft (sistemul NS-2000), Cepheus (sistemul de management corporativ Etalon), KOMSOFT (KOMSOFT-STANDART "2.0) etc.

6.4. Perspective pentru dezvoltarea și utilizarea tehnologiilor informaționale corporative

Pe lângă dezvoltarea și utilizarea instrumentelor și platformelor moderne, precum și a instrumentelor de sistem, dezvoltarea sistemelor corporative interne presupune saturația lor funcțională, în special în ceea ce privește producția.

În ciuda pasiunii pe scară largă pentru implementarea standardelor de management, principalii jucători de pe piața internă de software dezvoltă soluții industriale pentru diferite tipuri de industrii.

Temerile firmelor de a dezvălui „confidențialitatea” dezvoltărilor lor se diminuează, ceea ce ajută la consolidarea eforturilor lor de a-și integra produsele, mai degrabă decât să dezvolte totul de la „a” la „z” pe cont propriu. Astăzi, nimeni nu are resurse suficiente. Este nevoie de ani pentru a înțelege un concept nou, a dezvolta un proiect și un sistem, și anume un sistem care își schimbă calitatea în funcție de ceea ce este în el. În plus, cerința de integrare a produselor software este prezentată și de întreprinderile care doresc să continue să „funcționeze”, de regulă, sistemele specializate și le combină informațional cu cele nou achiziționate.

Integrarea este necesară și pentru produsele de la diferiți producători - în numele combinării soluțiilor complexe cu cele specializate:

- bugetare, analize financiare și economice, servicii pentru clienți, prelucrare analitică a datelor etc.

Trebuie remarcat faptul că nu sistemele de control în sine sunt mai promițătoare, ci un instrument simplu și universal pentru crearea lor, destinat intermediarilor calificați între dezvoltator și utilizatorul final. Acum aceste funcții încearcă să fie îndeplinite de administratorii de sistem și de analiști.

Dacă un astfel de instrument este disponibil, vor fi solicitate soluții standard „gata preparate” pentru toate întreprinderile din toate industriile.

Internetul ca instrument suplimentar pentru dezvoltarea afacerii poate fi utilizat în mod eficient numai în prezența unui sistem de management integrat.

Deși tehnologiile moderne de informare și comunicare, inclusiv Internetul, permit organizarea închirierii de software, este prematur să vorbim despre perspectiva pe termen scurt a utilizării unor astfel de oportunități, în special în țara noastră. Și nu atât din motive de confidențialitate, cât din cauza lipsei de ordine și a mijloacelor de comunicare fiabile.

Încercările de implementare și experiență în utilizarea, chiar și nu în totalitate, a tehnologiilor informaționale la întreprinderile interne au dovedit în practică că „haosul nu poate fi automatizat”. Este necesară o reorganizare preliminară a afacerii și a întreprinderii în sine, precum și construirea de reglementări (instrucțiuni) de conducere. Este dificil pentru angajații întreprinderii să facă față acestor lucrări pe cont propriu. Mai ales având în vedere factorul timp în condițiile pieței. Prin urmare, practica interacțiunii cu companiile de consultanță se dezvoltă peste tot, care ajută întreprinderile și își învață angajații să „extindă blocajele”, să stabilească principalul proces de afaceri, să dezvolte tehnologie, să construiască fluxuri de informații etc. Automatizarea unui proces simplificat este mai ușor, mai ușor, mai ieftin, mai rapid.

Fiecare trebuie să-și facă treaba. Un contabil, un magazioner, un manager de vânzări și alți specialiști „subiecți” nu ar trebui să îmbunătățească forma formularelor de documente, să extindă coloanele sau să își schimbe locul din cauza modificărilor legislației sau schemelor de afaceri. Prin urmare, piața software-ului se transformă treptat dintr-un „produs” în unul „de serviciu”. Externalizarea începe să se dezvolte - transferul unor funcții ale întreprinderii către specialiștii companiilor implicate. Aceștia sunt angajați în întreținerea echipamentelor, software-ului sistemului, modificarea părții aplicate (funcționale) a sistemelor etc.

Tehnologia informației și serviciile metodologice pentru utilizatorii și consumatorii lor devin cele mai importante și de actualitate în utilizarea sistemelor de management corporativ.

8.3.1. Instrumente de procesare analitică on-line (OLAP)

Prelucrarea analitică on-line este un mijloc de procesare analitică operațională (în timp real) a informațiilor care vizează sprijinirea procesului decizional și ajutarea analiștilor să răspundă la întrebarea „De ce sunt obiectele, mediile și rezultatele interacțiunii lor și nu altele?” În acest caz, analistul însuși formează versiuni ale relației dintre un set de informații și le verifică pe baza datelor disponibile în bazele de date corespunzătoare de informații structurate.

Sistemele ERP se caracterizează prin prezența componentelor analitice ca parte a subsistemelor funcționale. Ele oferă formarea informațiilor analitice în timp real. Aceste informații stau la baza majorității deciziilor de management.

Tehnologiile OLAP folosesc hipercuburi - date structurate special (altfel numite cuburi OLAP). În structura de date a hipercubului, se disting următoarele:

Măsuri - indicatori cantitativi (cerințe-baze) utilizate pentru a genera rezultate statistice sumare;

Dimensiuni - categorii descriptive (atribute-atribute), în contextul cărora se analizează măsurile.

Dimensiunea unui hipercub este determinată de numărul de dimensiuni pentru o măsură. De exemplu, hypercube SALES conține date:

Dimensiuni: consumatori, date de operațiuni, grupuri de mărfuri, nomenclatură, modificări, ambalare, depozite, tipuri de plată, tipuri de transport, tarife, monedă, organizații, departamente, responsabili, canale de distribuție, regiuni, orașe;

Măsuri: cantitatea planificată, cantitatea reală, suma planificată, suma reală, plățile planificate, plățile reale, soldul planificat, soldul real, prețul de vânzare, timpul de executare a comenzii, suma rambursării.

Un astfel de hipercub este destinat rapoartelor analitice:

Clasificarea consumatorilor în funcție de volumul achizițiilor;

Clasificarea mărfurilor vândute prin metoda ABC;

Analiza termenilor de executare a comenzilor diferiților consumatori;

Analiza volumelor de vânzări pe perioade, bunuri și grupuri de bunuri, regiuni și consumatori, departamente interne, manageri și canale de vânzare;

Prognoza decontărilor reciproce cu consumatorii;

Analiza returnării bunurilor de la consumatori; etc.

Rapoartele analitice pot avea o combinație arbitrară de dimensiuni și măsuri, ele sunt utilizate pentru a analiza deciziile de management. Prelucrarea analitică este asigurată prin mijloace instrumentale și lingvistice. În foaia de calcul MS Excel, accesibilă publicului, este prezentată tehnologia informației „Pivot Tables”, datele inițiale pentru crearea lor sunt:

Listă (bază de date) MS Excel - tabel relațional;

Un alt tabel pivot MS Excel;

Gama consolidată de celule MS Excel situate în aceleași cărți de lucru sau diferite;

Baza de date relațională externă sau cub OLAP, sursă de date (fișiere în format .dsn, .ode).

Pentru a construi tabele pivot bazate pe baze de date externe, sunt utilizate driverele ODBC, precum și programul MS Query. Tabelul rezumat pentru baza de date originală MS Excel are următoarea structură (Fig. 8.3).

Aspectul tabelului pivot are următoarea structură de date (Fig. 8.4): dimensiuni - cod departament, poziție; măsuri - experiență de muncă, salariu și bonus. Mai jos este un tabel rezumat. 8.2, care vă permite să analizați relația dintre experiența medie de muncă și salariu, experiența medie de lucru și bonusuri, salariu și bonusuri.

Tabelul 8.2

Tabel pivot pentru analiza legăturilor

Sfârșitul mesei. 8.2

Pentru a continua analiza folosind tabelul pivot, puteți:

Adăugați noi totaluri (de exemplu, salariu mediu, bonus mediu etc.);

Utilizați filtrarea înregistrărilor și a totalelor tabelului pivot (de exemplu, prin atributul „Sex”, care este plasat în aspectul din zona * Pagină);

Calculați indicatorii structurali (de exemplu, distribuirea fondurilor salariale și a fondurilor bonus pe divizii - utilizând prelucrarea suplimentară a tabelelor pivot, cotele din sumă pe coloane); etc.

Suita MS Office vă permite să publicați date din foi de calcul, inclusiv tabele pivot și diagrame în format XTML.

Microsoft Office Web Components acceptă lucrul cu datele publicate în Internet Explorer, permițând analize suplimentare (modificări în structura datelor din tabelul pivot, calcularea noilor totale sumare).

8.3.2. Instrumente de extragere a datelor (DM)

Instrumentele DM implică extragerea („excavarea”, „extragerea”) datelor și vizează identificarea relației dintre informațiile stocate în bazele de date digitale ale întreprinderii, pe care analistul le poate folosi pentru a construi modele care să cuantifice gradul de influență al factorilor de interes. În plus, astfel de instrumente pot fi utile pentru construirea de ipoteze cu privire la natura posibilă a relațiilor de informații în bazele de date digitale ale unei întreprinderi.

Tehnologia Text Mining (TM) este un set de instrumente care vă permite să analizați seturi mari de informații în căutarea tendințelor, tiparelor și relațiilor care vă pot ajuta să luați decizii strategice.

Tehnologia Image Mining (IM) conține instrumente pentru recunoașterea și clasificarea diferitelor imagini vizuale stocate în bazele de date ale companiei sau obținute ca urmare a unei căutări online din surse de informații externe.

Pentru a rezolva problemele procesării și stocării tuturor datelor, sunt utilizate următoarele abordări:

1) crearea mai multor sisteme de rezervă sau a unui sistem de gestionare a documentelor distribuite care vă permit să salvați date, dar să aveți acces lent la informațiile stocate la cererea utilizatorului;

2) construirea de sisteme de Internet care sunt extrem de flexibile, dar nu adaptate pentru implementarea căutării și stocării documentelor text;

3) introducerea de portaluri de internet care sunt bine direcționate către solicitările utilizatorilor, dar care nu au informații descriptive cu privire la datele text încărcate în ele.

Sistemele de procesare a textului libere de problemele enumerate mai sus pot fi împărțite în două categorii: sisteme de analiză lingvistică și sisteme de analiză a datelor de text.

Principalele elemente ale tehnologiei Text Mining sunt:

Rezumare;

Extragerea caracteristicilor

Clustering

Clasificare

Răspuns la întrebări (răspuns la întrebare);

Indexare tematică;

Căutare după cuvinte cheie (căutare cuvinte cheie);

Crearea și menținerea taxonomiilor și a tezaurilor.

Produsele software care implementează tehnologia Text Mining includ:

IBM Intelligent Miner for Text - un set de utilități individuale din linie de comandă sau omite; independente unele de altele (accentul principal se pune pe mecanismele de extragere a datelor - regăsirea informațiilor);

Oracle InterMedia Text - un set integrat într-un SGBD care vă permite să lucrați cel mai eficient cu cererile utilizatorilor (vă permite să lucrați cu SGBD relaționale moderne în contextul căutării complexe și al analizei datelor text)

Megaputer Text Analyst este un set de obiecte COM încorporate în program pentru rezolvarea sarcinilor Text Mining.

8.3.3. Tehnologia informației inteligente

Astăzi, în domeniul automatizării controlului, analiza informațiilor domină în etapa preliminară a pregătirii deciziilor - procesarea informațiilor primare, descompunerea unei situații problematice, care permite să se învețe doar fragmente și detalii ale proceselor, și nu situația în ansamblu. Pentru a depăși acest dezavantaj, trebuie să învățați să construiți baze de cunoștințe folosind experiența celor mai buni specialiști, precum și să generați cunoștințele care lipsesc.

Utilizarea tehnologiilor informaționale în diferite sfere ale activității umane, creșterea exponențială a volumelor de informații și necesitatea de a răspunde prompt în orice situație au necesitat căutarea unor soluții adecvate la problemele emergente. Cea mai eficientă dintre ele este modul de intelectualizare a tehnologiilor informaționale.

Sub tehnologia informației inteligente(ITT) înțeleg de obicei o astfel de tehnologie informațională, care oferă următoarele capacități:

Prezența bazelor de cunoaștere care reflectă experiența anumitor persoane, grupuri, societăți, umanitatea în ansamblu, în rezolvarea problemelor creative din anumite domenii de activitate, considerată în mod tradițional prerogativa inteligenței umane (de exemplu, sarcini atât de slab formalizate ca luarea deciziilor , proiectare, extragere a semnificațiilor, explicație, instruire etc.);

Prezența modelelor de gândire bazate pe baze de cunoaștere: reguli și concluzii logice, argumentare și raționament, recunoaștere și clasificare a situațiilor, generalizare și înțelegere etc .;

Abilitatea de a lua decizii destul de clare pe baza datelor neclare, libere, incomplete, nedeterminate;

Capacitatea de a explica concluziile și deciziile, adică prezența unui mecanism de explicație;

Abilitatea de a învăța, recalifica și, prin urmare, să se dezvolte.

Tehnologiile de căutare informală a tiparelor ascunse în date și informații Discovery Knowledge (KD) se bazează pe cele mai noi tehnologii pentru formarea și structurarea imaginilor informaționale ale obiectelor, care este cel mai apropiat de principiile procesării informațiilor de către sisteme inteligente.

Tehnologia informațională de asistență pentru decizie (DS) este un shell expert.

sisteme sau sisteme expert specializate care permit analiștilor să determine relațiile și relațiile dintre structurile informaționale în bazele informațiilor structurate ale întreprinderii, precum și să prezică posibilele rezultate ale luării deciziilor.

Tendințele de dezvoltare IIT. Sisteme de comunicare și comunicare. Rețelele globale de informații și IIT pot schimba radical înțelegerea noastră asupra companiilor și a muncii mentale în sine. Prezența angajaților la locul de muncă va deveni aproape inutilă. Oamenii pot lucra de acasă și pot interacționa între ei, după cum este necesar, prin intermediul rețelelor. Cunoscută, de exemplu, este experiența de succes a creării unei noi modificări a aeronavei Boeing-747 de către o echipă distribuită de specialiști care interacționează prin internet. Locația participanților la orice dezvoltare va juca un rol din ce în ce mai mic, dar importanța nivelului calificărilor participanților va crește. Un alt motiv care a determinat dezvoltarea rapidă a IIT este asociat cu complicarea sistemelor de comunicații și a sarcinilor rezolvate pe baza acestora. A fost nevoie de un nivel calitativ nou de „intelectualizare” a unor astfel de produse software ca sisteme de analiză a datelor eterogene și nestricte, asigurarea securității informațiilor, luarea deciziilor în sistemele distribuite etc.

Educaţie... În prezent, învățarea la distanță începe să joace un rol important în educație, iar introducerea IIT va individualiza semnificativ acest proces în conformitate cu nevoile și abilitățile fiecărui elev.

Viata de zi cu zi... Informatizarea vieții de zi cu zi a început deja, dar odată cu dezvoltarea IIT, vor apărea fundamental noi oportunități. Treptat, toate noile funcții vor fi transferate pe computer: control asupra stării de sănătate a utilizatorului, controlul aparatelor de uz casnic precum umidificatoare, odorizante de aer, încălzitoare, ionizatoare, centre de muzică, diagnostice medicale etc. Cu alte cuvinte, sistemele vor deveni, de asemenea, diagnostice ale stării unei persoane și ale casei sale. Un spațiu de informare confortabil va fi asigurat în incintă, unde mediul informațional va deveni o parte a mediului uman.

Perspective pentru dezvoltarea IIT... Se pare că în prezent IIT a abordat o etapă fundamental nouă în dezvoltarea lor. Deci, în ultimii 10 ani, capacitățile IIT s-au extins semnificativ datorită dezvoltării de noi tipuri de modele logice, apariției de noi

teorii și concepte. Punctele cheie în dezvoltarea IIT sunt:

Trecerea de la inferența logică la modele de argumentare și raționament;

Căutați cunoștințe relevante și generați explicații;

Înțelegerea și sinteza textelor;

Grafică cognitivă, adică prezentarea grafică și figurativă a cunoștințelor;

Sisteme multi-agent;

Modele inteligente de rețea;

Calcule bazate pe logică fuzzy, rețele neuronale, algoritmi genetici, calcule probabilistice (implementate în diverse combinații între ele și cu sisteme expert);

Problema meta-cunoașterii.

Sistemele multi-agent au devenit o nouă paradigmă pentru crearea IIT-urilor promițătoare. Aici se presupune că un agent este un sistem intelectual independent care are propriul sistem de stabilire a obiectivelor și motivație, propriul său domeniu de acțiune și responsabilitate. Interacțiunea dintre agenți este asigurată de un sistem de nivel superior - metainteligența. În sistemele multi-agent, se modelează o comunitate virtuală de agenți inteligenți - obiecte care sunt autonome, active, intră în diverse relații sociale - cooperare și cooperare (prietenie), concurență, concurență, dușmănie etc. Aspectul social al rezolvării problemelor moderne este caracteristica fundamentală a noutății conceptuale a tehnologiilor intelectuale avansate - organizații virtuale, societate virtuală.

(?) Controlează întrebările și sarcinile

1. Faceți o descriere a întreprinderii ca obiect de informatizare. Care sunt principalii indicatori care caracterizează dezvoltarea sistemului de management al întreprinderii.

2. Enumerați conducerea tehnologiei informaționale a întreprinderilor industriale.

3. Care sunt principalele tehnologii informaționale de dezvoltare organizațională și strategică a întreprinderilor (corporațiilor).

4. Care sunt bazele standardelor de management strategic care vizează îmbunătățirea proceselor de afaceri? Care este raportul dintre tehnologia informației BPM și BPI?

5. Definiți filosofia managementului calității totale (TQM). Cum sunt legate fazele de dezvoltare a calității și a tehnologiei informației?

6. Numiți principalele prevederi ale dezvoltării organizaționale a întreprinderii, descrieți etapele managementului strategic. Care sunt strategiile de grup?

7. Cum este creat modelul de afaceri al întreprinderii? Care sunt principalele abordări pentru evaluarea eficienței unui model de afaceri?

8. Ce este un scorecard echilibrat? Care sunt principalele componente ale BSC? Care sunt relațiile dintre grupurile de indicatori BSC?

9. Enumerați bazele metodologice pentru crearea sistemelor informaționale. Ce este o abordare sistemică?

10. Care este o abordare informațională a formării sistemelor și tehnologiilor informaționale?

11. Care este o abordare strategică a formării sistemelor și tehnologiilor informaționale?

12. Care este conținutul abordării orientate pe obiecte pentru a descrie comportamentul agenților pe piață? Dați definiția obiectului, indicați analogii sistemelor de agenți.

13. Care sunt principiile metodologice pentru îmbunătățirea managementului întreprinderii bazat pe tehnologiile informației și comunicațiilor? Care este scopul TIC?

14. Oferiți definițiile unui document, flux de documente, flux de documente, sistem de gestionare a documentelor.

15. Cum este proiectat aspectul formularului de document? Denumiți zonele documentului, compoziția detaliilor acestora.

16. Care sunt tehnologiile informaționale de bază ale sistemului de gestionare a documentelor.

17. Ce este un sistem de documentare unificat? Care sunt principiile generale ale unificării?

18. Descrieți documentația organizațională și administrativă, furnizați exemple de documente.

19. Ce cerințe ar trebui să îndeplinească un sistem electronic de gestionare a documentelor?

20. Ce este un sistem de informații corporative? Care sunt principalele bucle de control, compoziția modulelor funcționale.

21. Denumiți produsele software cunoscute de dvs. pentru CSI. Oferiți caracteristicile lor comparative.

W Literatură

1. Return J., Moriarty S. Comunicări de marketing. O abordare integrată. SPb.; Harkov: Peter, 2001.

2. Brooking E. Capitalul intelectual. Cheia succesului în noul mileniu. SPb.: Peter, 2001.

3. Godin V.V., Korpev I.K. Managementul resurselor informaționale. M.: INFRA-M, 1999.

4. Sisteme și tehnologii informaționale în economie: Manual. Ediția a II-a, Adăugare. și revizuit / M.I. Semenov, I.T. Trubilin, V.I. Loiko, T.P. Baranovskaya; Ed. IN SI. Loiko. Moscova: finanțe și statistici, 2003.

5. Tehnologia informației în afaceri / Ed. M. Zheleny. SPb.: Peter, 2002.

6. Kaplan Robert S., Norton David P. Balanced Scorecard. De la strategie la acțiune / Per. din engleza M.: CJSC „Olymp-Business”, 2003.

7. Karagodin V.I., Karagodina BJI. Informația ca bază a vieții. Dubna: Phoenix, 2000.

8. Karminsky AM., Nesterov PZ. Informatizarea afacerilor. Moscova: finanțe și statistici, 1997.

9. Likhacheva T.N. Tehnologii informaționale în serviciul societății informaționale // Noi tehnologii informaționale în sistemele economice. M., 1999.

10. Ostreykovsky V.A. Teoria sistemelor. M.: Școală superioară, 1997.

11. Piterkin S.V., Oladov N.A., Isaev D.V. Chiar la timp pentru Rusia. Practica utilizării sistemelor ERP. A 2-a ed. M.: Alpina Publisher, 2003.

12. Sokolov D.V. Introducere în teoria comunicării sociale: Manual. alocație. SPb.: Editura SP6GUP, 1996.

13. Trofimov V.Z., Tomilov V.Z. Tehnologiile informației și comunicațiilor în management: Manual. alocație. Sankt Petersburg: Editura Universității de Stat din Economie din Sankt Petersburg, 2002.

De ceva timp, nivelul modern de dezvoltare a hardware-ului și software-ului a făcut posibilă întreținerea pe scară largă a bazelor de date cu informații operaționale la diferite niveluri de management. Pe parcursul activităților lor, întreprinderile industriale, corporațiile, structurile departamentale, organismele guvernamentale și administrațiile au acumulat cantități mari de date. Acestea stochează în sine un mare potențial de extragere a informațiilor analitice utile, pe baza cărora este posibil să se identifice tendințele ascunse, să construiască o strategie de dezvoltare și să găsească noi soluții.

În ultimii ani, o serie de concepte noi pentru stocarea și analiza datelor corporative au prins contur în lume:

1) Depozite de date sau Depozite de date

2) Procesare analitică on-line (OLAP)

3) Data mining - IAD (Data Mining)

Sistemele de prelucrare a datelor analitice OLAP sunt sisteme de susținere a deciziilor axate pe îndeplinirea unor interogări mai complexe care necesită prelucrarea statistică a datelor istorice acumulate pe o anumită perioadă de timp. Acestea servesc la pregătirea rapoartelor de afaceri privind vânzările, marketingul în scopuri de management, așa-numita Data Mining - data mining, adică un mod de a analiza informațiile dintr-o bază de date pentru a găsi anomalii și tendințe fără a afla semnificația înregistrărilor.

Sistemele analitice bazate pe OLAP includ instrumente de procesare a informațiilor bazate pe metode de inteligență artificială și instrumente grafice de prezentare a datelor. Aceste sisteme sunt determinate de un volum mare de date istorice, permițând extragerea de informații semnificative din ele, adică obține cunoștințe din date.

Eficiența procesării este obținută prin utilizarea unei tehnologii puternice multiprocesor, metode de analiză sofisticate și stocări de date specializate.

Bazele de date relaționale stochează entități în tabele separate, care sunt de obicei bine normalizate. Această structură este convenabilă pentru bazele de date operaționale (sisteme OLTP), dar interogările complexe pe mai multe tabele sunt relativ lente. Un model mai bun pentru interogări decât de modificare este o bază de date spațială.

Sistemul OLAP face un instantaneu al unei baze de date relaționale și o structurează într-un model spațial pentru interogări. Timpul de procesare revendicat pentru interogări în OLAP este de aproximativ 0,1% din interogări similare într-o bază de date relațională.

Un cadru OLAP creat din date operaționale se numește cub OLAP. Un cub este creat din îmbinarea tabelelor folosind o schemă stea. În centrul „stelei” se află un tabel de date care conține faptele cheie care trebuie interogate. Tabelele cu mai multe dimensiuni sunt unite cu tabelul de date. Aceste tabele arată cum pot fi analizate datele relaționale agregate. Numărul de agregări posibile este determinat de numărul de moduri în care datele originale pot fi afișate ierarhic.

Clasele date de sisteme (OLAP și OLTP) se bazează pe utilizarea unui SGBD, dar tipurile de interogări sunt foarte diferite. Motorul OLAP este una dintre cele mai populare metode de analiză a datelor de astăzi. Există două abordări principale pentru rezolvarea acestei probleme. Primul dintre ele se numește OLAP multidimensional (MOLAP) - implementarea mecanismului utilizând o bază de date multidimensională pe partea serverului, iar al doilea OLAP relațional (ROLAP) - construirea de cuburi „din mers” pe baza interogărilor SQL către un SGBD relațional. Fiecare dintre aceste abordări are avantaje și dezavantaje. Schema generală a sistemului OLAP de birou poate fi reprezentată în Fig.

Algoritmul de lucru este după cum urmează:

1) obținerea datelor sub forma unui tabel plat sau a rezultatului executării unei interogări SQL;

2) stocarea în cache a datelor și convertirea acestora într-un cub multidimensional;

3) afișarea cubului construit folosind o masă transversală sau o diagramă etc.

În general, un număr arbitrar de afișaje poate fi conectat la un cub. Afișajele utilizate în sistemele OLAP sunt cel mai adesea de două tipuri: diagrame și diagrame.

Diagrama stelelor. Ideea sa este că există tabele pentru fiecare dimensiune și toate faptele sunt plasate într-un singur tabel, indexat de o cheie multiplă formată din cheile dimensiunilor individuale. Fiecare rază a schemei stelare definește, în terminologia lui Codd, direcția consolidării datelor de-a lungul dimensiunii corespunzătoare.

Pentru probleme complexe cu dimensiuni pe mai multe niveluri, este logic să apelăm la extensiile schemei stelare - schema constelației de fapt și schema fulgului de zăpadă. În aceste cazuri, sunt create tabele de fapt separate pentru combinații posibile de niveluri rezumative de diferite dimensiuni. Acest lucru permite o performanță mai bună, dar duce adesea la redundanță a datelor și la complicații semnificative în structura bazei de date, care conține un număr mare de tabele de date.

diagrama constelației

Prelucrarea analitică a datelor - Aceasta este analiza datelor care necesită suport metodologic adecvat și un anumit nivel de pregătire a specialiștilor.

Tehnologiile informaționale moderne permit automatizarea proceselor de analiză a informațiilor primare acumulate, construirea de modele analitice, obținerea de soluții gata făcute și utilizarea acestora în practică. Principalele cerințe , care sunt prezentate metodelor de analiză, sunt eficiența, simplitatea, automatismul. Acest concept stă la baza a două tehnologii moderne: Data Mining și Knowledge Discovery in Database (KDD).

Data Mining - este procesul de descoperire în date brute necunoscute anterior, non-banale, practic utile și accesibile interpretării cunoștințelor necesare pentru luarea deciziilor în diferite sfere ale activității umane (definiție de G. Pyatetsky-Shapiro, unul dintre fondatorii acestei direcții) .

Tehnologia Data Mining are drept scop găsirea de tipare neevidente. Etapele analizei datelor sunt:

  • 1) clasificare ( clasificare) - detectarea caracteristicilor care caracterizează grupuri de obiecte din setul de date studiat - clase. Metode de soluție utilizate pentru problema clasificării: metode de vecinătate mai apropiate ( cel mai apropiat vecin)și ^ ’- cel mai apropiat vecin ( k-cel mai apropiat vecin) -, Rețele bayesiene (Rețele bayesiene) -, inducerea arborilor de decizie; rețele neuronale (rețele neuronale) -,
  • 2) grupare (grupare)- împărțirea obiectelor în grupuri, deoarece clasele de obiecte nu sunt definite inițial. Un exemplu de metodă pentru rezolvarea problemei de grupare: hărțile Kohonen auto-organizate - o rețea neuronală cu învățare nesupravegheată. O caracteristică importantă a acestor hărți este capacitatea lor de a afișa spații de caracteristici multidimensionale pe un plan, prezentând date sub forma unei hărți bidimensionale;
  • 3) asociere (asociațiile)- identificarea tiparelor dintre evenimentele conexe din setul de date. Aceste tipare sunt dezvăluite nu pe baza proprietăților obiectului analizat, ci între mai multe evenimente care apar simultan, de exemplu, algoritmul Apriori;
  • 4) secvență (secvenţă), sau asociere secvențială (asociere secvențială),- căutarea modelelor temporale între tranzacții, adică tiparele sunt stabilite nu între evenimente simultane, ci între evenimente conectate în timp. Asocierea este secvențe cu un decalaj de timp zero. Regula de secvențiere: după eveniment X după un anumit timp, va avea loc evenimentul Y;
  • 5) prognoză (prognoză) - este construit pe baza caracteristicilor datelor istorice, adică există o evaluare a valorilor omise sau viitoare ale indicatorilor numerici țintă. Metodele de statistici matematice, rețelele neuronale etc. sunt utilizate pentru rezolvarea problemelor de prognozare;
  • 6) determinarea abaterilor sau valorilor aberante (detectarea deviației), analiza abaterilor sau valorilor aberante - detectarea și analizarea datelor care sunt cele mai diferite de setul general de date;
  • 7) notare (estimare)- prezicerea valorilor continue ale unei caracteristici;
  • 8) analiza legăturilor (analiză link)- sarcina de a găsi dependențe într-un set de date;
  • 9) vizualizare (vizualizare, extragerea graficelor)- crearea unei imagini grafice a datelor analizate. Metodele grafice sunt utilizate pentru a arăta prezența modelelor în date, de exemplu, prezentarea datelor în dimensiuni 2D și 3D;
  • 10) însumând ( rezumare) - descrierea grupurilor specifice de obiecte din setul de date analizat.

KDD este procesul de extragere a cunoștințelor utile dintr-o colecție de date. Această tehnologie include probleme: pregătirea datelor, selectarea caracteristicilor informative, curățarea datelor, aplicarea metodelor de Data Mining (DM), procesarea ulterioară a datelor și interpretarea rezultatelor.

Procesul de descoperire a cunoștințelor în bazele de date constă din următorii pași:

  • 1) enunț de problemă - analiza sarcinilor și caracteristicilor utilizatorului din zona aplicației, selectarea unui set de parametri de intrare și ieșire;
  • 2) pregătirea setului de date inițial - crearea unui depozit de date și organizarea unei scheme de colectare și actualizare a datelor;
  • 3) preprocesarea datelor - pe baza utilizării metodelor Data Mining, din punctul de vedere al acestei metode, datele trebuie să fie de înaltă calitate și corecte;
  • 4) transformarea, normalizarea datelor - aducerea informațiilor într-un formular adecvat pentru analiza ulterioară;
  • 5) Data Mining - analiza automată a datelor bazată pe utilizarea diferiților algoritmi pentru găsirea cunoștințelor (rețele neuronale, arbori de decizie, algoritmi de grupare, stabilirea asociațiilor etc.);
  • 6) postprocesarea datelor - interpretarea rezultatelor și aplicarea cunoștințelor acumulate în aplicațiile de afaceri.