Analītiskās datu apstrādes metodes lēmumu atbalstam. Analītiskā datu apstrāde tiešsaistē (OLAP)

3.4. Analītisko datu apstrādes metodes

Lai esošās datu noliktavas atvieglotu vadības lēmumu pieņemšanu, informācija ir jāiesniedz analītiķim vajadzīgajā formā, tas ir, viņam ir jāizstrādā rīki, lai piekļūtu un apstrādātu datus noliktavā.

Ļoti bieži informācijas un analītiskās sistēmas, kas izveidotas, gaidot lēmumu pieņēmēju tiešu izmantošanu, ir ārkārtīgi viegli lietojamas, taču to funkcionalitāte ir stipri ierobežota. Šādas statiskas sistēmas sauc par Executive Information Systems (EIS). Tajos ir daudz vaicājumu, un, pietiekoši ikdienas pārskatīšanai, tie nespēj atbildēt uz visiem jautājumiem, kas var rasties, pieņemot lēmumus. Šādas sistēmas darba rezultāts, kā likums, ir vairāku lappušu ziņojumi pēc rūpīgas izpētes, kuriem analītiķim ir jauna jautājumu sērija. Tomēr katrs jauns pieprasījums, kas nav paredzēts šādas sistēmas projektēšanā, vispirms ir oficiāli jāapraksta, programmētājs kodē un tikai pēc tam izpilda. Gaidīšanas laiks šajā gadījumā var būt stundas un dienas, kas ne vienmēr ir pieņemami.

Analītiskā apstrāde tiešsaistē... Vai tiešsaistes analītiskā apstrāde-OLAP ir galvenā datu noliktavas organizācijas sastāvdaļa. OLAP koncepciju 1993. gadā aprakstīja Edgars Kods, un tai ir šādas prasības daudzfaktoru analīzes lietojumprogrammām:

- daudzdimensionāla konceptuāla datu attēlošana, ieskaitot pilnīgu hierarhiju un vairāku hierarhiju atbalstu (OLAP galvenā prasība);

- nodrošināt lietotājam analīzes rezultātus saprātīgā laikā (parasti ne vairāk kā 5 s), pat par mazāk detalizētas analīzes cenu;

- spēja veikt jebkuru loģisku un statistisku analīzi, kas raksturīga šai lietojumprogrammai, un saglabāt to galalietotājam pieejamā formā;

- daudzu lietotāju piekļuve datiem, izmantojot atbilstošus bloķēšanas mehānismus un atļautos piekļuves līdzekļus;

- iespēja piekļūt vajadzīgajai informācijai neatkarīgi no tās apjoma un uzglabāšanas vietas.

OLAP sistēma sastāv no daudziem komponentiem. Visaugstākajā prezentācijas līmenī sistēma ietver datu avotu, daudzdimensionālu datu bāzi (MDB), kas nodrošina iespēju ieviest ziņošanas sistēmu, kuras pamatā ir OLAP tehnoloģija, OLAP serveri un klientu. Sistēma ir veidota pēc klienta-servera principa un nodrošina attālinātu un vairāku lietotāju piekļuvi MDB serverim.

Apsveriet OLAP sistēmas komponentus.

Avoti. Avots OLAP sistēmās ir serveris, kas piegādā datus analīzei. Atkarībā no OLAP produkta izmantošanas jomas avots var būt datu noliktava, iedzimta datubāze, kas satur vispārīgus datus, kopa

tabulas, kurās apvienoti finanšu dati, vai jebkura iepriekš minēto kombinācija.

Datu krātuve. Neapstrādāti dati tiek apkopoti un uzglabāti repozitorijā, kas izveidots saskaņā ar datu noliktavu veidošanas principiem. HD ir relāciju datu bāze (RDB). Galvenajā CD tabulā (faktu tabulā) ir to rādītāju skaitliskās vērtības, par kurām tiek vākta statistiskā informācija.

Daudzdimensiju datu bāze Datu krātuve kalpo kā informācijas sniedzējs daudzdimensiju datu bāzei, kas ir objektu kolekcija. Šo objektu galvenās klases ir izmēri un mēri. Izmēri ietver vērtību (parametru) kopumu, pēc kura tiek indeksēti dati, piemēram, laiks, reģioni, iestādes veids utt. Katra dimensija ir aizpildīta ar vērtībām no atbilstošajām datu noliktavas dimensiju tabulām. Mērījumu kopums nosaka pētāmā procesa telpu. Pasākumi ir daudzdimensiju datu kubi (hiperkubi). Hiperkubā ir ietverti paši dati, kā arī rādītāju apkopotās summas. Indikatori veido MDB galveno saturu un tiek aizpildīti saskaņā ar faktu tabulu. Katrā hiperkuba asī datus var sakārtot hierarhijā, kas atspoguļo dažādus detalizācijas līmeņus. Tas ļauj izveidot hierarhiskas dimensijas, kuras tiks izmantotas, lai apkopotu vai izpētītu datu noformējumu turpmākās datu analīzes laikā. Tipisks hierarhiskas dimensijas piemērs ir teritoriālo objektu saraksts, kas sagrupēts pēc rajoniem, reģioniem, rajoniem.

Serveris. OLAP serveris ir OLAP sistēmas lietotā daļa. Šis komponents veic visu darbu (atkarībā no sistēmas modeļa) un saglabā visu informāciju, kurai tiek nodrošināta aktīva piekļuve. Servera arhitektūru regulē dažādi jēdzieni. Jo īpaši OLAP produktu galvenā funkcionālā īpašība ir MDB vai RDB izmantošana datu glabāšanai.

Klienta lietojumprogramma Atbilstoši strukturēti un MDB saglabāti dati ir pieejami analīzei, izmantojot klienta lietojumprogrammu. Lietotājs iegūst iespēju attālināti piekļūt datiem, formulēt sarežģītus vaicājumus, ģenerēt pārskatus un saņemt patvaļīgas datu apakškopas. Pārskata iegūšana tiek samazināta līdz konkrētu mērījumu vērtību izvēlei un hiperkuba sadaļas izveidošanai. Šķērsgriezumu nosaka izvēlētās mērījumu vērtības. Pārējo dimensiju dati ir apkopoti.

OLAPklientā un serverī. Daudzdimensiju datu analīzi var veikt, izmantojot dažādus rīkus, kurus nosacīti var iedalīt klienta un servera OLAP rīkos.

OLAP klienta rīki (piemēram, Microsoft Pivot tabulas programmā Excel 2000 vai ProClarity no Knosys) ir lietojumprogrammas, kas aprēķina un parāda apkopotos datus. Šajā gadījumā apkopotie dati ir ietverti kešatmiņā šāda OLAP rīka adrešu telpā.

Ja avota dati ir iekļauti darbvirsmas DBVS, apkopoto datu aprēķinu veic pats OLAP rīks. Ja sākotnējo datu avots ir servera DBVS, daudzi klienta OLAP rīki nosūta serverim SQL vaicājumus un rezultātā saņem serverī aprēķinātos apkopotos datus.

Parasti OLAP funkcionalitāte tiek ieviesta statistikas datu apstrādes rīkos un dažās izklājlapās.

Daudzos izstrādes rīkos ir klašu vai komponentu bibliotēkas, kas ļauj izveidot lietojumprogrammas, kas ievieš visvienkāršāko OLAP funkcionalitāti (piemēram, lēmumu kuba komponenti Borland Delphi un Borland C ++ Builder). Turklāt daudzi uzņēmumi piedāvā ActiveX vadīklas un citas bibliotēkas, kas nodrošina līdzīgu funkcionalitāti.

Klienta OLAP rīki parasti tiek izmantoti ar nelielu izmēru skaitu (parasti ne vairāk kā seši) un nelielu šo parametru vērtību dažādību - jo iegūtajiem apkopotajiem datiem ir jāiekļaujas šāda rīka adrešu telpā. , un to skaits pieaug eksponenciāli, palielinoties dimensiju skaitam.

Daudzi OLAP klientu rīki ļauj saglabāt kešatmiņas saturu ar apkopotiem datiem kā failu, lai tos nepārrēķinātu. Tomēr šo iespēju bieži izmanto, lai atsavinātu apkopotos datus nolūkā tos nodot citām organizācijām vai publicēt.

Ideja saglabāt kešatmiņu ar apkopotiem datiem failā tika tālāk attīstīta servera OLAP rīkos (piemēram, Oracle Express Server vai Microsoft OLAP Services), kurā saglabāti un mainīti apkopotie dati, kā arī saglabāta krātuve, kurā tie atrodas , veic atsevišķa lietojumprogramma vai process, ko sauc par OLAP serveri. Klientu lietojumprogrammas var pieprasīt šādu daudzdimensiju krātuvi un atbildē saņemt noteiktus datus. Dažas klientu lietojumprogrammas var arī izveidot šādas krātuves vai atjaunināt tās atbilstoši mainītajiem avota datiem.

Servera OLAP rīku izmantošanas priekšrocības salīdzinājumā ar klienta OLAP rīkiem ir līdzīgas priekšrocībām, ko sniedz servera puses DBVS izmantošana, salīdzinot ar darbvirsmas rīkiem: ja izmanto serveru rīkus, apkopoto datu aprēķināšana un glabāšana notiek serveris, un klienta lietojumprogramma saņem tikai viņiem veikto vaicājumu rezultātus, kas kopumā ļauj samazināt tīkla trafiku, vaicājumu izpildes laiku un klienta lietojumprogrammas resursu prasības.

3.5. Daudzdimensiju datu glabāšanas tehniskie aspekti

Daudzdimensionalitāti OLAP lietojumprogrammās var iedalīt trīs līmeņos:

1... Daudzdimensiju datu attēlojums- galalietotāju rīki, kas nodrošina daudzdimensionālu vizualizāciju un datu apstrādi; MDI slānis abstrahējas no fiziskās datu struktūras un apstrādā datus kā daudzdimensionālus.

    Daudzdimensiju apstrāde- rīks (valoda) daudzdimensionālu vaicājumu formulēšanai (tradicionālā relāciju SQL valoda šeit izrādās nepiemērota) un procesors, kas var apstrādāt un izpildīt šādu vaicājumu.

    Daudzdimensiju uzglabāšana- datu fiziskas organizēšanas līdzekļi, kas nodrošina efektīvu daudzdimensiju vaicājumu izpildi.

Pirmie divi līmeņi ir obligāti visos OLAP rīkos. Trešais līmenis, lai arī plaši izplatīts, nav nepieciešams, jo daudzdimensiju skata datus var iegūt arī no regulārām relāciju struktūrām. Daudzdimensiju vaicājumu procesors šajā gadījumā daudzdimensionālos vaicājumus pārvērš SQL vaicājumos, kurus izpilda relāciju DBVS.

Jebkurā datu noliktavā - gan tradicionālā, gan daudzdimensionālā - kopā ar detalizētiem datiem, kas iegūti no operētājsistēmām, tiek saglabāti arī apkopoti rādītāji (kopsavilkuma rādītāji), piemēram, pārdošanas apjomu summa pa mēnešiem, pēc produktu kategorijas utt. vienīgais mērķis ir paātrināt vaicājumu izpildi. Patiešām, no vienas puses, noliktavā parasti tiek uzkrāts ļoti liels datu apjoms, un, no otras puses, analītiķi vairumā gadījumu ir ieinteresēti nevis detalizētos, bet vispārinātos rādītājos. Un, ja katru reizi, lai aprēķinātu gada pārdošanas apjomus, būtu jāapkopo miljoniem individuālo pārdošanas apjomu, ātrums, visticamāk, būtu nepieņemams. Tāpēc, ielādējot datus daudzdimensionālā datu bāzē, tiek aprēķināti un saglabāti visi kopsavilkuma rādītāji vai daļa no tiem.

Tomēr apkopotu datu izmantošana ir saistīta ar trūkumiem. Galvenie trūkumi ir uzglabātās informācijas apjoma palielināšanās (pievienojot jaunas dimensijas, datu apjoms, kas veido kubu, pieaug eksponenciāli) un laiks, kas nepieciešams to ielādēšanai. Turklāt informācijas apjoms var palielināties desmitiem un pat simtiem reižu. Piemēram, vienā no publicētajiem standarta testiem pilnam 10 MB neapstrādātu datu kopējam skaitam bija nepieciešami 2,4 GB, t.i., dati pieauga 240 reizes!

Datu apjoma palielināšanās pakāpe, aprēķinot apkopotos rādītājus, ir atkarīga no izmēru skaita kubā un šo dimensiju struktūras, tas ir, no “vecāku” un “pēcnācēju” skaita attiecības dažādos dimensijas līmeņos. Lai atrisinātu agregātu uzglabāšanas problēmu, tiek izmantotas sarežģītas shēmas, kas ļauj, aprēķinot tālu no visiem iespējamiem agregātiem, panākt ievērojamu vaicājumu veiktspējas pieaugumu.

Gan sākotnējos, gan apkopotos datus var saglabāt vai nu

relāciju vai daudzdimensiju struktūrās. Šajā sakarā pašlaik tiek izmantoti trīs daudzdimensiju datu glabāšanas veidi:

MOLAP (Daudzdimensiju OLAP) - avota un apkopotie dati tiek glabāti daudzdimensiju datu bāzē. Datu glabāšana daudzdimensiju struktūrās ļauj apstrādāt datus kā daudzdimensiju masīvu, lai kopvērtību aprēķināšanas ātrums būtu vienāds jebkurai dimensijai. Tomēr šajā gadījumā daudzdimensiju datu bāze izrādās lieka, jo daudzdimensionālie dati pilnībā satur sākotnējos relāciju datus.

Šīs sistēmas nodrošina pilnu OLAP apstrādes ciklu. Tie vai nu papildus servera komponentam ietver savu integrēto klienta saskarni, vai arī izmanto ārējās izklājlapu programmas, lai sazinātos ar lietotāju.

ROLAP (Relāciju OLAP) - sākotnējie dati paliek tajā pašā relāciju datu bāzē, kur tie sākotnēji atradās. Apkopotie dati tiek ievietoti pakalpojumu tabulās, kas īpaši izveidotas to glabāšanai tajā pašā datu bāzē.

HOLAP (Hybrid OLAP) - sākotnējie dati paliek tajā pašā relāciju datu bāzē, kur tie sākotnēji atradās, un apkopotie dati tiek glabāti daudzdimensiju datu bāzē.

Daži OLAP rīki atbalsta datu glabāšanu tikai relāciju struktūrās, daži - tikai daudzdimensiju struktūrās. Tomēr lielākā daļa mūsdienu OLAP serveru rīku atbalsta visas trīs datu glabāšanas metodes. Uzglabāšanas metodes izvēle ir atkarīga no avota datu lieluma un struktūras, prasībām attiecībā uz vaicājumu izpildes ātrumu un OLAP kubu atjaunināšanas biežumu.

3.6. Datu ieguve (DatiKalnrūpniecība)

Termins Datu ieguve apzīmē korelāciju, tendenču un attiecību atrašanas procesu, izmantojot dažādus matemātiskus un statistiskus algoritmus: lēmumu atbalsta sistēmu klasterizāciju, regresijas un korelācijas analīzi utt. Šajā gadījumā uzkrātā informācija tiek automātiski vispārināta līdz informācijai, ko var raksturot kā zināšanas.

Mūsdienu datu ieguves tehnoloģijas pamatā ir veidņu koncepcija, kas atspoguļo datu apakšparaugiem raksturīgos modeļus un veido tā saucamās slēptās zināšanas.

Modeļu meklēšana tiek veikta, izmantojot metodes, kurās par šiem apakšparaugiem netiek izmantoti a priori pieņēmumi. Svarīga datu ieguves iezīme ir meklēto modeļu nestandarta un nepārprotamība. Citiem vārdiem sakot, datu ieguves rīki atšķiras no statistikas datu apstrādes rīkiem un OLAP rīkiem ar to, ka tā vietā, lai pārbaudītu lietotāju iepriekš pieņemtās attiecības

starp datiem, pamatojoties uz pieejamajiem datiem, viņi spēj patstāvīgi atrast šādas attiecības, kā arī veidot hipotēzes par to būtību.

Kopumā datu ieguves process sastāv no trim posmiem

    modeļu identificēšana (bezmaksas meklēšana);

    atklāto modeļu izmantošana, lai prognozētu nezināmas vērtības (prognozējošā modelēšana);

    izņēmumu analīze, kuras mērķis ir identificēt un interpretēt konstatēto modeļu anomālijas.

Dažreiz ir skaidri nošķirts atrasto modeļu ticamības pārbaudes starpposms starp to atrašanu un izmantošanu (validācijas posms).

Ir pieci standarta modeļu veidi, kas identificēti ar datu ieguves metodēm:

1. Asociācijaļauj izvēlēties stabilas objektu grupas, starp kurām ir netieši norādītas saites. Atsevišķas preces vai vienību grupas parādīšanās biežumu, kas izteikts procentos, sauc par izplatību. Zems izplatības līmenis (mazāk nekā viena tūkstošdaļa procenta) liecina, ka šāda saistība nav nozīmīga. Asociācijas ir uzrakstītas noteikumu veidā: A=> B, kur BET - iepakojums, IN - sekas. Lai noteiktu katra iegūtā asociācijas noteikuma nozīmi, ir jāaprēķina vērtība, ko sauc par ticamību BET Uz IN(vai attiecības A un B). Pārliecība parāda, cik bieži un kad BET parādās IN. Piemēram, ja d (A / B)= 20%, tas nozīmē, ka, pērkot preci BET katrā piektajā gadījumā tiek iegādātas arī preces IN.

Tipisks asociācijas izmantošanas piemērs ir pirkumu struktūras analīze. Piemēram, veicot pētījumu lielveikalā, var konstatēt, ka 65% kartupeļu čipsu pircēju lieto arī Coca-Cola, un, ja šādam komplektam ir atlaide, Cola tiek iegādāta 85% gadījumu. Šie rezultāti ir vērtīgi, veidojot mārketinga stratēģijas.

2. Secība - tā ir metode, kā savlaicīgi identificēt asociācijas. Šajā gadījumā tiek definēti noteikumi, kas apraksta noteiktu notikumu grupu secīgu parādīšanos. Šie noteikumi ir būtiski skriptu veidošanai. Turklāt tos var izmantot, piemēram, lai izveidotu tipisku iepriekšējas pārdošanas kopumu, kas var ietvert turpmāku konkrēta produkta pārdošanu.

3. Klasifikācija - vispārināšanas rīks. Tas ļauj pāriet no atsevišķu objektu izskatīšanas līdz vispārinātiem jēdzieniem, kas raksturo dažas objektu kopas un ir pietiekami, lai atpazītu šajās kopās (klasēs) esošos objektus. Jēdziena veidošanas procesa būtība ir atrast klasēm raksturīgus modeļus. Objektu aprakstīšanai tiek izmantotas daudzas dažādas pazīmes (atribūti). Uz pazīmju aprakstiem balstītas koncepcijas veidošanas problēmu formulēja M.M. Bongart. Tās risinājums ir balstīts uz divu pamatprocedūru piemērošanu: apmācību un testēšanu. Apmācības procedūrās tiek veidots klasifikācijas noteikums, pamatojoties uz mācību objektu kopuma apstrādi. Verifikācijas (pārbaudes) procedūra sastāv no iegūtā klasifikācijas noteikuma izmantošanas objektu atpazīšanai no jauna (pārbaudes) parauga. Ja tiek konstatēts, ka testa rezultāti ir apmierinoši, tad mācību process beidzas, pretējā gadījumā klasifikācijas noteikums tiek precizēts pārmācīšanās procesā.

4 klasterizācija Vai informācijas (ierakstu) izplatīšana no datu bāzes grupās (kopās) vai segmentos, vienlaicīgi nosakot šīs grupas. Atšķirībā no klasifikācijas, šeit analīzei nav nepieciešama iepriekšēja klašu piešķiršana.

5 laika rindu prognozēšana ir instruments, lai noteiktu apskatāmo objektu atribūtu izmaiņu tendences laika gaitā. Laika rindu uzvedības analīze ļauj prognozēt pētīto īpašību vērtības.

Lai atrisinātu šādas problēmas, tiek izmantotas dažādas datu ieguves metodes un algoritmi. Sakarā ar to, ka datu ieguve ir attīstījusies un attīstās tādu disciplīnu krustojumā kā statistika, informācijas teorija, mašīnmācīšanās, datu bāzes teorija, ir pilnīgi dabiski, ka lielākā daļa datu ieguves algoritmu un metožu tika izstrādātas, pamatojoties uz dažādām šo disciplīnu metodēm.

No esošajām datu ieguves metodēm var atšķirt sekojošo:

    regresijas, dispersijas un korelācijas analīze(ieviesta vismodernākajās statistikas paketēs, jo īpaši uzņēmumu SAS Institute, StatSoft u.c. produktos);

    analīzes metodes noteiktā mācību jomā, pamatojoties uz empīriskiem modeļiem (bieži izmanto, piemēram, lētos finanšu analīzes rīkos);

    neironu tīkla algoritmi- procesu un parādību simulācijas metode, kas ļauj reproducēt sarežģītas atkarības. Metode ir balstīta uz vienkāršota bioloģisko smadzeņu modeļa izmantošanu un sastāv no tā, ka sākotnējie parametri tiek uzskatīti par signāliem, kas tiek pārveidoti saskaņā ar esošajiem savienojumiem starp "neironiem", un visa tīkla reakcija uz sākotnējie dati tiek uzskatīti par analīzes rezultātu. Šajā gadījumā savienojumi tiek veidoti, izmantojot tā saukto tīkla apmācību, izmantojot lielu paraugu, kurā ir gan sākotnējie dati, gan pareizās atbildes. Neironu tīklus plaši izmanto klasifikācijas problēmu risināšanai;

    neskaidra loģika tiek izmantots, lai apstrādātu datus ar izplūdušām patiesības vērtībām, kuras var attēlot ar dažādiem lingvistiskiem mainīgajiem. Neskaidru zināšanu attēlojums tiek plaši izmantots klasifikācijas un prognozēšanas problēmu risināšanai, piemēram, XpertRule Miner sistēmā (Attar Software Ltd., Lielbritānija), kā arī AIS, NeuFuz u.c.

    induktīvie vadiļauj iegūt datu bāzē saglabāto faktu vispārinājumus. Induktīvās mācīšanās procesā var tikt iesaistīts speciālists, kurš sniedz hipotēzes. To sauc par uzraudzītu mācīšanos. Vispārināšanas noteikumu meklēšanu var veikt bez skolotāja, automātiski ģenerējot hipotēzes. Mūsdienu programmatūrā parasti abas metodes tiek apvienotas, un hipotēžu pārbaudei tiek izmantotas statistikas metodes. Sistēmas piemērs, kurā tiek izmantoti induktīvie vadi, ir XpertRule Miner, ko izstrādājusi Attar Software Ltd. (Lielbritānija);

    argumentācija, kuras pamatā ir līdzīgi gadījumi(“Tuvākā kaimiņa” metode) (uz gadījumiem balstīta argumentācija - CBR) ir balstīta uz to, ka datu bāzē tiek meklētas situācijas, kuru apraksti pēc vairākām pazīmēm ir līdzīgi konkrētai situācijai. Analoģijas princips ļauj pieņemt, ka līdzīgu situāciju rezultāti būs arī tuvu viens otram. Šīs pieejas trūkums ir tāds, ka tā nerada modeļus vai noteikumus, kas vispārina iepriekšējo pieredzi. Turklāt izvades rezultātu ticamība ir atkarīga no situāciju aprakstīšanas pilnīguma, tāpat kā induktīvās secināšanas procesos. CBR izmantojošo sistēmu piemēri ir: KATE Tools (Acknosoft, Francija), Pattern Recognition Workbench (Unica, ASV);

    lēmumu koki- metode uzdevuma strukturēšanai koka grafika veidā, kura virsotnes atbilst ražošanas noteikumiem, kas ļauj klasificēt datus vai analizēt lēmumu sekas. Šī metode sniedz vizuālu noteikumu klasifikācijas sistēmas attēlojumu, ja to nav ļoti daudz. Vienkāršas problēmas tiek atrisinātas, izmantojot šo metodi daudz ātrāk nekā izmantojot neironu tīklus. Sarežģītu problēmu gadījumā un dažiem datu veidiem lēmumu koki var nebūt piemēroti. Turklāt šai metodei ir būtiska problēma. Viena no hierarhiskās datu klasterizācijas sekām ir daudzu mācību piemēru trūkums daudziem īpašiem gadījumiem, un tāpēc klasifikāciju nevar uzskatīt par uzticamu. Lēmumu koku metodes tiek ieviestas daudzos programmatūras rīkos, proti: С5.0 (RuleQuest, Austrālija), Clementine (Integral Solutions, Lielbritānija), SIPINA (Lionas Universitāte, Francija), IDIS (Information Discovery, ASV);

    evolucionārā programmēšana- algoritma meklēšana un ģenerēšana, kas izsaka datu savstarpējo atkarību, pamatojoties uz sākotnēji noteikto meklēšanas procesā modificēto algoritmu; dažreiz savstarpējo atkarību meklēšana tiek veikta starp jebkādiem īpašiem funkciju veidiem (piemēram, polinomi);

ierobežoti meklēšanas algoritmi kas aprēķina vienkāršu loģisku notikumu kombinācijas datu apakšgrupās.

3.7. IntegrācijaOLAPunDatiKalnrūpniecība

Tiešsaistes analītiskā apstrāde (OLAP) un datu ieguve (datu ieguve) ir divas lēmumu atbalsta procesa daļas. Tomēr šodien lielākā daļa OLAP sistēmu koncentrējas tikai uz piekļuves nodrošināšanu daudzdimensionāliem datiem, un lielākā daļa datu ieguves rīku, kas darbojas modeļu jomā, attiecas uz viendimensiju datu perspektīvām. Lai palielinātu lēmumu apstrādes sistēmu datu apstrādes efektivitāti, šie divi analīzes veidi ir jāapvieno.

Pašlaik saliktais termins "OLAP datu ieguve" (daudzdimensiju ieguve), šķiet, apzīmē šādu kombināciju.

Ir trīs galvenie veidi, kā izveidot OLAP datu ieguvi:

    "Kubēšana, tad ieguve". Iespēja veikt ieguves analīzi būtu jānodrošina par jebkuru vaicājuma rezultātu daudzdimensiju konceptuālam attēlojumam, tas ir, jebkuram rādītāju hiperkuba projekcijas jebkuram fragmentam.

    Kalnrūpniecība, tad kubicēšana. Tāpat kā dati, kas iegūti no krātuves, ieguves rezultāti ir jāuzrāda hiperkubiskā formā turpmākai daudzfaktoru analīzei.

    "Kubēšana ieguves laikā". Šī elastīgā integrācijas metode ļauj automātiski aktivizēt tāda paša veida viedos apstrādes mehānismus katra daudzfaktoru analīzes (pārejas) soļa rezultātā starp vispārināšanas līmeņiem, jauna hiperkuba fragmenta iegūšanu utt.).

    Astronomija priekš 11 klase [Teksts ... viņusdaļa viss sistēmas ... docents ... Čeboksari, 2009. Nr. 10. S. 44 -49 .... Autori- kompilatori: N. ... konspektilekcijas, ...

  • Mācību ceļvedis

    ... lekcijas... Apmācība lekcijas matemātika. Rakstīšana konspektslekcijas lekcijas... Lietošana informācijutehnoloģijas ...

  • I k kondaurova ar v lebedeva

    Mācību ceļvedis

    ... lekcijas... Apmācība lekcijas matemātika. Rakstīšana konspektslekcijas... Vizuālo līdzekļu sagatavošana. Lasīšanas tehnika lekcijas... Lietošana informācijutehnoloģijas ...

  • M MEDIA MONITORING Profesionālās izglītības modernizācija 2011. gada marts - augusts

    Kopsavilkums

    ... 11 .08.2011 "Dead Souls-2" RNIMU viņus ... 3,11 -3,44 ... ... publiski lekcijas vadītāji ... Čeboksari... un skribelēšanu konspekti auditorija - ... informācijusistēmas un tehnoloģija. ... sistēma izglītība, saka docents ... kompilatori ... daļas uzlabojot reālo saturu ...

6. tēma

KORPORATĪVĀS INFORMĀCIJAS SISTĒMAS EKONOMISKĀS INFORMĀCIJAS APSTRĀDEI

Korporatīvo informācijas tehnoloģiju koncepcija

Korporatīvo informācijas tehnoloģiju būtība un nozīme

Starp dažādām uzņēmējdarbības programmām termins "informācijas tehnoloģijas korporatīvajā pārvaldībā" tradicionāli tiek saprasts kā "integrētas vadības automatizācijas sistēmas". Ir zināmi arī citi to nosaukumi - uzņēmuma mēroga sistēmas, korporatīvās informācijas sistēmas (CIS), korporatīvās (vai integrētās) vadības sistēmas (KSU), automatizētās vadības sistēmas (ACS).

Parasti sarežģītas vadības automatizācijas sistēmas ir “pamata” universāli risinājumi, kas piemēroti dažāda veida uzņēmumiem, galvenokārt finanšu vadībai, noliktavu vadībai, pirkumu un pārdošanas vadībai. Taču šīm pašām sistēmām bieži ir nozares risinājumi, kas atspoguļo vienu vai otru specifiku un satur atbilstošu normatīvo un atsauces bāzi.

Piemēram, SAP R / 3 sistēmas risinājums aviācijas nozarei atbalsta visu lidmašīnu detaļu sērijas numuru uzskaiti un kontroli, to kalpošanas laiku, plānoto nomaiņu vai remontu, kas nodrošina ne tikai ražošanas uzticamību, bet arī pasažieru drošību .

Tā kā sarežģītas pārvaldības sistēmas galvenokārt ir vērstas uz lieliem uzņēmumiem, kuros ir daudznozaru struktūras, tās ne tikai piedāvā izstrādātu funkciju kopumu, bet arī nodrošina uzticamu liela apjoma informācijas uzglabāšanu un apstrādi, izmantojot jaudīgas platformas un sistēmas rīkus vairāku lietotāju darbam. ..

Mūsdienu informācijas tehnoloģijas, sakari un internets ļauj atrisināt problēmas, kas saistītas ar attālinātu piekļuvi vienai datu bāzei, kas ir svarīgi arī korporatīvajai pārvaldībai.

Veidot koncepciju

Lai gan lielākā daļa izstrādātāju savus programmatūras produktus sauc par pārvaldības (uzņēmums, noliktava, finanses utt.), Būtībā gandrīz visi korporatīvajā pārvaldībā izmantotie programmatūras rīki ir finanšu un saimnieciskās darbības faktu un dokumentu reģistrēšana, grāmatvedības sistēmas ar iespēju veidot pārskatus un atsauces sadaļās, ko atļauj analītiskās pazīmes. Tas ir, strukturēta informācija tiek ievadīta datu bāzē. Šo struktūru vienā vai otrā pakāpē nosaka savstarpēji saistītas atsauces grāmatas, klasifikatori, standarta dokumentu parametri un formas. Saskaņā ar datubāzē pieejamo informāciju tā sauktais "griezums" tiek "uzbūvēts", "izvilkts", "savākts" ar instrumentāliem līdzekļiem. Saņemot ziņojumus un atsauces, ko bieži sauc par analītiskiem ziņojumiem, vadība var pieņemt lēmumus. Šī ir tipiska koncepcija un tipiska tehnoloģija darbam ar attiecīgās klases sistēmām.



Nav nejaušība, ka tik atšķirīgs funkcionālais saturs, sistēmas risinājumi, "pārvaldības" programmatūras, piemēram, "Galaxy", "BEST" un "1C: Enterprise", mērķis ir līdzīgi informācijas organizēšanas principos, tās veidošanās un apstrāde, kā arī mijiedarbības metodes ar sistēmām.

Tomēr uzņēmumi, piemēram, OJSC Uralelectromed, korporatīvās pārvaldības instrumentiem izvirzīja tik stingras un atšķirīgas prasības, ka ir nepieciešams tos veidot uz daudzlīmeņu pamata. Parasti sistēmas kodols, kurā ir tikai programmu kodi, ir centrālais. Nākamais konceptuāli svarīgais elements ir sistēmas iebūvētais rīku komplekts, kas ļauj, nemainot programmu kodus, vismaz to konfigurēt darba vietās, veikt īpašas darbības, ievadīt jaunas un mainīt esošās primāro un pārskatu dokumentu formas un izmantot citi parametru pielāgošanas līdzekļi. Uzlabotākās sistēmās ir iebūvēti rīki, lai izveidotu dažādus uzņēmuma modeļus: informāciju, organizatorisku, funkcionālu utt. Un, visbeidzot, pati datu bāze.

Analītiskās informācijas apstrāde

Uzņēmuma darbību plānošana, operatīvās informācijas iegūšana un pareiza lēmuma pieņemšana, pamatojoties uz tā analīzi, ir saistīta ar liela datu apjoma apstrādi. Uzņēmumu grāmatvedības sistēmās ģenerētie pārskati parasti nav elastīgi. Tos nevar “savīt”, “izvērst” vai “sakļaut”, lai iegūtu vēlamo datu attēlojumu, ieskaitot grafiskos. Jo vairāk “samazinājumu” un “samazinājumu” varat veikt, jo reālāk jūs varat iedomāties uzņēmuma ainu un pieņemt labāko lēmumu par biznesa procesu vadību. Šāda veida uzdevumiem ir nepieciešama matemātiskā un ekonomiskā modelēšana, kā arī augsta veiktspēja. Analītiskais modulis ir pieejams "RepKo" sistēmā, labāk pazīstama ir "Triumph -Analytica" sistēma ("PARUS" korporācija - "Toras centrs"). Šķiet, ka grāmatvedības sistēmas veido atsauces dažādās “sadaļās”, pamatojoties uz datu bāzē saglabāto informāciju, tās vienkārši attēlo to, kas ir. Un analītiskās sistēmas veido jaunu informāciju saskaņā ar noteiktiem parametriem vai kritērijiem, optimizējot to konkrētiem mērķiem. Tāpēc biežāk informācijas apskatei un vizualizēšanai ir nepieciešams īpašs rīks, kas ir tiešsaistes analītiskā apstrāde (OLAP). Tas nodrošina ērtu un ātru līdzekļu kopumu, lai piekļūtu, apskatītu un daudzdimensionālu krātuvē uzkrāto informāciju.

OLAP tehnoloģijas tiek izmantotas, lai modelētu situāciju saskaņā ar shēmu “kā būtu, ja būtu…” un apkopotu dažādus analītiskus ziņojumus. Ir specializēti Rietumu programmatūras produkti.

Parasti informācija no korporatīvajām vadības sistēmām tiek pārsūtīta uz specializētām programmām analītiskai datu apstrādei. Daudzi vietējie izstrādātāji mēģina atrisināt šīs problēmas patstāvīgi, piemēram, Nikos-Soft (sistēma NS-2000), Cepheus (uzņēmuma vadības sistēma Etalon), KOMSOFT (KOMSOFT-STANDARD "2.0) utt.

6.4. Korporatīvo informācijas tehnoloģiju attīstības un izmantošanas perspektīvas

Papildus mūsdienu rīku un platformu, kā arī sistēmas rīku izstrādei un izmantošanai, vietējo korporatīvo sistēmu attīstība paredz to funkcionālo piesātinājumu, it īpaši ražošanas ziņā.

Neskatoties uz plaši izplatīto aizraušanos ar vadības standartu ieviešanu, vadošie spēlētāji vietējā programmatūras tirgū izstrādā nozares risinājumus dažāda veida nozarēm.

Uzņēmumu bailes atklāt savas attīstības "konfidencialitāti" mazinās, kas palīdz nostiprināt to centienus integrēt savus produktus, nevis attīstīt visu, sākot no "a" līdz "z". Mūsdienās nevienam nepietiek līdzekļu. Ir vajadzīgi gadi, lai izprastu jaunu koncepciju, izstrādātu projektu un sistēmu, proti, sistēmu, kas maina savu kvalitāti atkarībā no tā, kas tajā ir. Turklāt prasību par programmatūras produktu integrāciju izvirza arī uzņēmumi, kas vēlas turpināt strādāt, parasti specializētas sistēmas un informatīvi apvienot tās ar jauniegūtajām.

Integrācija ir nepieciešama arī dažādu ražotāju produktiem - komplekso risinājumu apvienošanas vārdā ar specializētu:

- budžeta veidošana, finanšu un ekonomiskā analīze, klientu apkalpošana, analītiskā datu apstrāde utt.

Jāatzīmē, ka ne pašas kontroles sistēmas ir daudzsološākas, bet gan vienkāršs un universāls rīks to radīšanai, kas paredzēts kvalificētiem starpniekiem starp izstrādātāju un galalietotāju. Tagad šīs funkcijas cenšas veikt sistēmas administratori un analītiķi.

Ja šāds rīks ir pieejams, "gatavi" standarta risinājumi visiem uzņēmumiem visās nozarēs būs pieprasīti.

Internets kā papildu instruments biznesa attīstībai var tikt efektīvi izmantots tikai integrētas vadības sistēmas klātbūtnē.

Lai gan mūsdienu informācijas un komunikācijas tehnoloģijas, tostarp internets, ļauj organizēt programmatūras nomu, ir pāragri runāt par šādu iespēju izmantošanas īstermiņa perspektīvu, īpaši mūsu valstī. Un ne tik daudz konfidencialitātes apsvērumu dēļ, cik kārtības un uzticamu saziņas līdzekļu trūkuma dēļ.

Mēģinājumi ieviest un pat izmantot informāciju, pat ne pilnā apjomā, vietējos uzņēmumos ir praksē pierādījuši, ka "haosu nevar automatizēt". Nepieciešama iepriekšēja uzņēmuma un paša uzņēmuma reorganizācija, kā arī vadības noteikumu (instrukciju) izstrāde. Uzņēmuma darbiniekiem ir grūti pašiem tikt galā ar šādu darbu. Īpaši ņemot vērā laika faktoru tirgus apstākļos. Tāpēc mijiedarbības prakse ar konsultāciju uzņēmumiem attīstās visur, kas palīdz uzņēmumiem un māca saviem darbiniekiem "paplašināt vājās vietas", izveidot galveno biznesa procesu, attīstīt tehnoloģijas, veidot informācijas plūsmas utt. Racionalizēta procesa automatizācija ir vieglāka, vieglāka, lētāka un ātrāka.

Ikvienam ir jādara savs darbs. Grāmatvedim, noliktavas turētājam, pārdošanas vadītājam un citiem "priekšmetu" speciālistiem nevajadzētu uzlabot dokumentu formu formu, paplašināt slejas vai mainīt savas vietas likumdošanas vai uzņēmējdarbības shēmu izmaiņu dēļ. Tāpēc programmatūras tirgus pakāpeniski pārveidojas no "produkta" par "pakalpojumu". Sāk attīstīties ārpakalpojumi - dažu uzņēmuma funkciju nodošana iesaistīto uzņēmumu speciālistiem. Viņi nodarbojas ar iekārtu, sistēmas programmatūras apkopi, sistēmu lietišķās (funkcionālās) daļas pārveidošanu utt.

Informācijas tehnoloģijas un metodiskie pakalpojumi to lietotājiem un patērētājiem kļūst par vissvarīgāko un aktuālāko korporatīvās vadības sistēmu izmantošanā.

8.3.1. Tiešsaistes analītiskās apstrādes (OLAP) rīki

Tiešsaistes analītiskā apstrāde-informācijas operatīvā (reālā laika) analītiskā apstrāde, lai atbalstītu lēmumu pieņemšanu un palīdzētu analītiķiem atbildēt uz jautājumu "Kāpēc objekti, vide un to mijiedarbības rezultāti ir tādi, nevis citi?" Šajā gadījumā analītiķis pats veido informācijas kopuma attiecību versijas un pārbauda tās, pamatojoties uz pieejamajiem datiem attiecīgajās strukturētās informācijas datubāzēs.

ERP sistēmas raksturo analītisko komponentu klātbūtne funkcionālo apakšsistēmu ietvaros. Tie nodrošina analītiskās informācijas veidošanos reālā laikā. Šī informācija ir pamats lielākajai daļai vadības lēmumu.

OLAP tehnoloģijās tiek izmantoti hiperkubi - īpaši strukturēti dati (citādi saukti par OLAP kubiem). Hiperkuba datu struktūrā izšķir sekojošo:

Pasākumi - kvantitatīvie rādītāji (rekvizīti -bāzes), ko izmanto statistikas rezultātu apkopojuma ģenerēšanai;

Izmēri - aprakstošas ​​kategorijas (atribūti -atribūti), kuru kontekstā tiek analizēti pasākumi.

Hiperkuba izmēru nosaka pēc mērījumu skaita vienam mērījumam. Piemēram, hiperkubs SALES satur šādus datus:

Izmēri: patērētāji, darbību datumi, preču grupas, nomenklatūra, izmaiņas, iepakojumi, noliktavas, maksājuma veidi, sūtījuma veidi, likmes, valūta, organizācijas, nodaļas, atbildīgie, izplatīšanas kanāli, reģioni, pilsētas;

Pasākumi: plānotais daudzums, faktiskais daudzums, plānotā summa, faktiskā summa, plānotie maksājumi, faktiskie maksājumi, plānotais atlikums, faktiskais atlikums, pārdošanas cena, pasūtījuma izpildes laiks, atmaksas summa.

Šāds hiperkubs ir paredzēts analītiskiem ziņojumiem:

Patērētāju klasifikācija pēc pirkumu apjoma;

Pārdoto preču klasifikācija pēc ABC metodes;

Dažādu patērētāju pasūtījumu izpildes noteikumu analīze;

Pārdošanas apjomu analīze pa periodiem, precēm un preču grupām, reģioniem un patērētājiem, iekšējām nodaļām, vadītājiem un pārdošanas kanāliem;

Savstarpēju norēķinu ar patērētājiem prognoze;

Preču atgriešanas no patērētājiem analīze; utt.

Analītiskajiem ziņojumiem var būt patvaļīga dimensiju un pasākumu kombinācija, tos izmanto vadības lēmumu analīzei. Analītisko apstrādi nodrošina instrumentālie un valodas rīki. Publiski pieejamajā MS Excel izklājlapā ir parādīta informācijas tehnoloģija "Pivot Tables", sākotnējie dati to izveidei:

Saraksts (datu bāze) MS Excel - relāciju tabula;

Vēl viena MS Excel rakurstabula;

Konsolidēts MS Excel šūnu klāsts, kas atrodas vienā vai dažādās darbgrāmatās;

Ārējā relāciju datu bāze vai OLAP kubs, datu avots (faili .dsn, .ode formātā).

Lai izveidotu rakurstabulas, pamatojoties uz ārējām datu bāzēm, izmantojiet ODBC draiverus, kā arī MS Query programmu. Oriģinālās MS Excel datu bāzes kopsavilkuma tabulai ir šāda struktūra (8.3. Att.).

Pivot tabulas izkārtojumam ir šāda datu struktūra (8.4. Attēls): izmēri - nodaļas kods, pozīcija; mēri - darba pieredze, alga un prēmija. Zemāk ir kopsavilkuma tabula. 8.2, kas ļauj analizēt attiecības starp vidējo darba pieredzi un algu, vidējo darba pieredzi un piemaksām, algu un prēmijām.

8.2. Tabula

Pivot tabula saišu analīzei

Tabulas beigas. 8.2

Lai turpinātu analīzi, izmantojot rakurstabulu, varat:

Pievienojiet jaunas kopsummas (piemēram, vidējā alga, vidējā prēmija utt.);

Izmantojiet rakurstabulas ierakstu un kopsummu filtrēšanu (piemēram, pēc atribūta "Dzimums", kas ir ievietots izkārtojumā apgabalā * Lapa);

Aprēķināt strukturālos rādītājus (piemēram, algu fondu un prēmiju fondu sadalījums pa nodaļām - izmantojot papildu pivot tabulu apstrādi, summas daļas pa kolonnām); utt.

MS Office komplekts ļauj publicēt izklājlapu datus, tostarp rakurstabulas un diagrammas XTML formātā.

Microsoft Office Web Components atbalsta darbu ar publicētajiem datiem pārlūkprogrammā Internet Explorer, ļaujot veikt turpmāku analīzi (izmaiņas rakurstabulas datu struktūrā, jaunu kopsavilkumu kopsummu aprēķināšana).

8.3.2. Datu ieguves rīki (DM)

DM rīki nozīmē datu ieguvi ("izrakšanu", "izvilkšanu"), un to mērķis ir noteikt saistību starp uzņēmuma digitālajās datu bāzēs saglabāto informāciju, ko analītiķis var izmantot, lai izveidotu modeļus, kas kvantitatīvi nosaka faktoru ietekmes pakāpi. interese. Turklāt šādi rīki var būt noderīgi, veidojot hipotēzes par informācijas attiecību iespējamo raksturu uzņēmuma digitālajās datu bāzēs.

Teksta ieguves (TM) tehnoloģija ir rīku kopums, kas ļauj analizēt lielas informācijas kopas, meklējot tendences, modeļus un attiecības, kas var palīdzēt pieņemt stratēģiskus lēmumus.

Attēlu ieguves (IM) tehnoloģija satur rīkus dažādu vizuālu attēlu atpazīšanai un klasificēšanai, kas tiek glabāti uzņēmuma datu bāzēs vai iegūti, veicot tiešsaistes meklēšanu no ārējiem informācijas avotiem.

Lai atrisinātu visu datu apstrādes un uzglabāšanas problēmas, tiek izmantotas šādas pieejas:

1) vairāku rezerves sistēmu vai vienas izplatītas dokumentu pārvaldības sistēmas izveide, kas ļauj saglabāt datus, bet pēc lietotāja pieprasījuma lēni piekļūt uzglabātajai informācijai;

2) tādu interneta sistēmu izveide, kuras ir ļoti elastīgas, bet nav pielāgotas teksta dokumentu meklēšanai un glabāšanai;

3) tādu interneta portālu ieviešana, kas ir labi orientēti uz lietotāju pieprasījumiem, bet kuriem nav aprakstošas ​​informācijas par tajos ielādētajiem teksta datiem.

Teksta apstrādes sistēmas, kurās nav iepriekš uzskaitīto problēmu, var iedalīt divās kategorijās: lingvistiskās analīzes sistēmas un teksta datu analīzes sistēmas.

Teksta ieguves tehnoloģijas galvenie elementi ir:

Kopsavilkums;

Funkciju ieguve

Klasterizācija

Klasifikācija

Atbildot uz jautājumiem (atbildot uz jautājumiem);

Tematiskā indeksācija;

Meklēšana pēc atslēgvārdiem (atslēgvārdu meklēšana);

Taksonomiju un tēzauru izveide un uzturēšana.

Programmatūras produkti, kas ievieš teksta ieguves tehnoloģiju, ietver:

IBM Intelligent Miner for Text - atsevišķu komandrindas utilītu kopa vai izlaišana; neatkarīgi viens no otra (galvenais uzsvars tiek likts uz datu ieguves mehānismiem - informācijas iegūšanu);

Oracle InterMedia Text - DBVS integrēts komplekts, kas ļauj visefektīvāk strādāt ar lietotāju pieprasījumiem (ļauj strādāt ar modernām relāciju DBVS sarežģītas daudzfunkcionālas teksta datu meklēšanas un analīzes kontekstā);

Megaputer Text Analyst ir COM objektu kopums, kas iebūvēts programmā teksta ieguves uzdevumu risināšanai.

8.3.3. Inteliģentas informācijas tehnoloģijas

Mūsdienās vadības automatizācijas jomā informācijas sagatavošana dominē sākotnējā lēmumu sagatavošanas stadijā - primārās informācijas apstrāde, problēmas situācijas sadalīšana, kas ļauj uzzināt tikai procesu fragmentus un detaļas, nevis situāciju kopumā. Lai pārvarētu šo trūkumu, jāiemācās veidot zināšanu bāzes, izmantojot labāko speciālistu pieredzi, kā arī jāveido trūkstošās zināšanas.

Informācijas tehnoloģiju izmantošana dažādās cilvēka darbības jomās, informācijas apjomu eksponenciālais pieaugums un nepieciešamība ātri reaģēt jebkurā situācijā prasīja meklēt atbilstošus veidus, kā atrisināt radušās problēmas. Visefektīvākais no tiem ir informācijas tehnoloģiju intelektualizācijas veids.

Zem inteliģentas informācijas tehnoloģijas(ITT) parasti saprot šādas informācijas tehnoloģijas, kas nodrošina šādas iespējas:

Zināšanu bāzu klātbūtne, kas atspoguļo konkrētu cilvēku, grupu, sabiedrību, cilvēces pieredzi, radošu problēmu risināšanā noteiktās darbības jomās, tradicionāli tiek uzskatīta par cilvēka intelekta prerogatīvu (piemēram, tādi slikti formalizēti uzdevumi kā lēmumu pieņemšana) , dizains, nozīmes ieguve, skaidrojums, apmācība utt.);

Uz zināšanu bāzēm balstītu domāšanas modeļu klātbūtne: noteikumi un loģiski secinājumi, argumentācija un spriešana, situāciju atpazīšana un klasificēšana, vispārināšana un izpratne u.c .;

Spēja pieņemt diezgan skaidrus lēmumus, pamatojoties uz izplūdušiem, vaļīgiem, nepilnīgiem, nepietiekami noteiktiem datiem;

Spēja izskaidrot secinājumus un lēmumus, t.i. paskaidrojuma mehānisma klātbūtne;

Spēja mācīties, pārkvalificēties un tāpēc attīstīties.

Datu un informācijas slēpto modeļu neformālas meklēšanas tehnoloģijas Zināšanu atklāšana (KD) balstās uz jaunākajām tehnoloģijām objektu informācijas attēlu veidošanai un strukturēšanai, kas ir vistuvāk viedo sistēmu informācijas apstrādes principiem.

Lēmumu atbalsta (DS) lēmumu atbalsta informācijas tehnoloģija ir ekspertu apvalks.

sistēmas vai specializētas ekspertu sistēmas, kas ļauj analītiķiem, pamatojoties uz uzņēmuma strukturēto informāciju, noteikt attiecības un attiecības starp informācijas struktūrām, kā arī paredzēt iespējamos lēmumu pieņemšanas rezultātus.

IIT attīstības tendences. Sakaru un sakaru sistēmas. Globālie informācijas tīkli un IIT var radikāli mainīt mūsu izpratni par uzņēmumiem un pašu garīgo darbu. Darbinieku klātbūtne darba vietā kļūs gandrīz nevajadzīga. Cilvēki var strādāt no mājām un pēc vajadzības sadarboties, izmantojot tīklus. Zināms, piemēram, veiksmīgā pieredze, veidojot jaunu Boeing-747 lidmašīnas modifikāciju, ko veic izplatīta speciālistu komanda, kas mijiedarbojas, izmantojot internetu. Jebkuras attīstības dalībnieku atrašanās vietai būs arvien mazāka loma, bet dalībnieku kvalifikācijas līmeņa nozīme pieaugs. Vēl viens iemesls, kas noteica straujo IIT attīstību, ir saistīts ar sakaru sistēmu sarežģījumiem un uz to pamata risinātajiem uzdevumiem. Tas prasīja kvalitatīvi jaunu “intelektualizācijas” līmeni tādiem programmatūras produktiem kā sistēmas neviendabīgu un stingru datu analīzei, informācijas drošības nodrošināšanai, lēmumu pieņemšanai izplatītās sistēmās utt.

Izglītība... Jau šodien tālmācībai sāk būt svarīga loma izglītībā, un IIT ieviešana ievērojami individualizēs šo procesu atbilstoši katra skolēna vajadzībām un spējām.

Ikdiena... Ikdienas informatizācija jau ir sākusies, bet, attīstoties IIT, parādīsies principiāli jaunas iespējas. Pamazām visas jaunās funkcijas tiks pārnestas uz datoru: kontrole pār lietotāja veselību, sadzīves tehnikas, piemēram, gaisa mitrinātāju, gaisa atsvaidzinātāju, sildītāju, jonizatoru, mūzikas centru, medicīniskās diagnostikas u.c. Citiem vārdiem sakot, sistēmas kļūs arī par cilvēka stāvokļa un viņa mājas diagnostiku. Telpās tiks nodrošināta ērta informācijas telpa, kurā informācijas vide kļūs par cilvēka vides sastāvdaļu.

IIT attīstības perspektīvas... Šķiet, ka patlaban IIT ir pietuvojušies principiāli jaunam savas attīstības posmam. Tātad pēdējo 10 gadu laikā IIT iespējas ir ievērojami paplašinājušās, pateicoties jauna veida loģisko modeļu izstrādei, jaunu

teorijas un idejas. Galvenie punkti IIT attīstībā ir:

Pāreja no loģiskā secinājuma uz argumentācijas un spriešanas modeļiem;

Meklēt atbilstošas ​​zināšanas un ģenerēt paskaidrojumus;

Tekstu izpratne un sintēze;

Kognitīvā grafika, t.i. grafiska un figurāla zināšanu prezentācija;

Daudzu aģentu sistēmas;

Inteliģentie tīkla modeļi;

Aprēķini, kuru pamatā ir neskaidra loģika, neironu tīkli, ģenētiskie algoritmi, varbūtības aprēķini (tiek īstenoti dažādās kombinācijās savā starpā un ar ekspertu sistēmām);

Meta zināšanu problēma.

Daudzaģentu sistēmas ir kļuvušas par jaunu paradigmu daudzsološu IIT radīšanai. Šeit tiek pieņemts, ka aģents ir neatkarīga intelektuāla sistēma, kurai ir sava mērķu noteikšanas un motivācijas sistēma, sava darbības joma un atbildība. Mijiedarbību starp aģentiem nodrošina augstāka līmeņa sistēma - metainteliģence. Daudzaģentu sistēmās tiek modelēta inteliģentu aģentu virtuāla kopiena - objekti, kas ir autonomi, aktīvi, nonāk dažādās sociālās attiecībās - sadarbība un sadarbība (draudzība), konkurence, konkurence, naids utt. Mūsdienu problēmu risināšanas sociālais aspekts ir progresīvo intelektuālo tehnoloģiju - virtuālo organizāciju, virtuālās sabiedrības - konceptuālā novitātes pamatiezīme.

(?) Kontroles jautājumi un uzdevumi

1. Sniedziet uzņēmuma aprakstu kā informatizācijas objektu. Kādi ir galvenie rādītāji, kas raksturo uzņēmuma vadības sistēmas attīstību.

2. Uzskaitiet vadošo rūpniecības uzņēmumu informācijas tehnoloģiju pārvaldību.

3. Kādas ir uzņēmumu (korporāciju) organizatoriskās un stratēģiskās attīstības galvenās informācijas tehnoloģijas.

4. Kādi ir stratēģiskās vadības standartu pamati, kuru mērķis ir uzlabot biznesa procesus? Kāda ir informācijas tehnoloģiju BPM un BPI attiecība?

5. Definējiet pilnīgas kvalitātes vadības (TQM) filozofiju. Kā ir saistīti kvalitātes un informācijas tehnoloģiju attīstības posmi?

6. Nosauciet uzņēmuma organizatoriskās attīstības galvenos noteikumus, aprakstiet stratēģiskās vadības posmus. Kādas ir grupas stratēģijas?

7. Kā tiek veidots uzņēmuma biznesa modelis? Kādas ir galvenās pieejas uzņēmējdarbības modeļa efektivitātes novērtēšanai?

8. Kas ir līdzsvarota rādītāju karte? Kādas ir BSC galvenās sastāvdaļas? Kādas ir BSC rādītāju grupu savstarpējās attiecības?

9. Uzskaitiet metodiskos pamatus informācijas sistēmu izveidei. Kas ir sistēmiska pieeja?

10. Kāda ir informatīva pieeja informācijas sistēmu un tehnoloģiju veidošanai?

11. Kāda ir stratēģiska pieeja informācijas sistēmu un tehnoloģiju veidošanai?

12. Kāds ir objektorientētās pieejas saturs, lai aprakstītu aģentu uzvedību tirgū? Sniedziet objekta definīciju, norādiet aģentu sistēmu analogus.

13. Kādi ir metodiskie principi, kā uzlabot informācijas pārvaldību, pamatojoties uz uzņēmuma vadību? Kāds ir IKT mērķis?

14. Sniedziet dokumenta, dokumentu plūsmas, dokumentu plūsmas, dokumentu pārvaldības sistēmas definīcijas.

15. Kā tiek veidots dokumenta veidlapas izkārtojums? Nosauciet dokumenta zonas, to detaļu sastāvu.

16. Kādas ir dokumentu pārvaldības sistēmas pamatinformācijas tehnoloģijas.

17. Kas ir vienota dokumentācijas sistēma? Kādi ir vispārējie apvienošanās principi?

18. Aprakstiet organizatorisko un administratīvo dokumentāciju, sniedziet dokumentu piemērus.

19. Kādas ir prasības elektroniskai dokumentu pārvaldības sistēmai?

20. Kas ir korporatīvā informācijas sistēma? Kādas ir galvenās vadības cilpas, funkcionālo moduļu sastāvs.

21. Nosauciet jums zināmos programmatūras produktus NVS. Norādiet to salīdzinošās īpašības.

W Literatūra

1. Atgriezties J., Moriarty S. Mārketinga komunikācijas. Integrēta pieeja. SPb.; Harkova: Pēteris, 2001.

2. Brūkings E. Intelektuālais kapitāls. Panākumu atslēga jaunajā tūkstošgadē. SPb.: Pēteris, 2001.

3. Godins V.V., Korpevs I.K. Informācijas resursu pārvaldība. M.: INFRA-M, 1999.

4. Informācijas sistēmas un tehnoloģijas ekonomikā: mācību grāmata. 2. izdev., Pievienot. un pārskatīts / M.I. Semenovs, I.T. Trubilins, V.I. Loiko, T.P. Baranovskaja; Ed. IN UN. Loiko. Maskava: finanses un statistika, 2003.

5. Informācijas tehnoloģijas biznesā / Red. M. Zheleny. SPb.: Pēteris, 2002.

6. Kaplan Robert S., Norton David P. Balanced Scorecard. No stratēģijas līdz darbībai / Per. no angļu valodas M.: CJSC "Olymp-Business", 2003.

7. Karagodins V.I., Karagodina BJI. Informācija kā dzīves pamats. Dubna: Fīniksa, 2000.

8. Karminsky AM., Nesterov PZ. Uzņēmējdarbības informatizācija. Maskava: finanses un statistika, 1997.

9. Likhačeva T.N. Informācijas tehnoloģijas informācijas sabiedrības dienestā // Jaunas informācijas tehnoloģijas ekonomiskajās sistēmās. M., 1999.

10. Ostreykovsky V.A. Sistēmu teorija. M.: Augstskola, 1997.

11. Piterkins S.V., Oladovs N.A., Isajevs D.V. Krievijai tieši laikā. ERP sistēmu izmantošanas prakse. 2. izdev. M .: Izdevniecība Alpina, 2003.

12. Sokolovs D.V. Ievads sociālās komunikācijas teorijā: mācību grāmata. pabalsts. SPb.: Izdevniecība SP6GUP, 1996.

13. Trofimovs V.Z., Tomilovs V.Z. Informācijas un komunikācijas tehnoloģijas vadībā: mācību grāmata. pabalsts. SPb.: Izdevniecība SPbGUEF, 2002.

Jau kādu laiku mūsdienu aparatūras un programmatūras attīstības līmenis ir ļāvis plaši pārvaldīt operatīvās informācijas datubāzes dažādos pārvaldības līmeņos. Savas darbības laikā rūpniecības uzņēmumi, korporācijas, departamentu struktūras, valdības struktūras un administrācijas ir uzkrājušas lielu datu apjomu. Tie sevī glabā lielu potenciālu noderīgas analītiskās informācijas iegūšanai, uz kuras pamata ir iespējams noteikt slēptās tendences, izveidot attīstības stratēģiju un atrast jaunus risinājumus.

Pēdējos gados pasaulē ir izveidojušās vairākas jaunas koncepcijas korporatīvo datu glabāšanai un analīzei:

1) Datu noliktavas vai datu noliktava

2) tiešsaistes analītiskā apstrāde (OLAP)

3) Datu ieguve - IAD (datu ieguve)

OLAP analītiskās datu apstrādes sistēmas ir lēmumu atbalsta sistēmas, kas vērstas uz sarežģītāku vaicājumu izpildi, kam nepieciešama statistiska vēsturisko datu apstrāde, kas uzkrāta noteiktā laika periodā. Tie kalpo biznesa pārskatu sagatavošanai par pārdošanu, mārketingu vadības nolūkos, tā saukto datu ieguvi - datu ieguvi, t.i. veids, kā analizēt informāciju datu bāzē, lai atrastu anomālijas un tendences, neuzzinot ierakstu nozīmi.

Analītiskās sistēmas, kuru pamatā ir OLAP, ietver informācijas apstrādes rīkus, kuru pamatā ir mākslīgā intelekta metodes, un grafisko datu prezentācijas rīkus. Šīs sistēmas nosaka liels vēsturisko datu apjoms, ļaujot no tām iegūt nozīmīgu informāciju, t.i. iegūt zināšanas no datiem.

Apstrādes efektivitāte tiek sasniegta, izmantojot jaudīgu daudzprocesoru tehnoloģiju, sarežģītas analīzes metodes un specializētas datu krātuves.

Relāciju datu bāzes saglabā entītijas atsevišķās tabulās, kuras parasti ir labi normalizētas. Šī struktūra ir ērta operatīvām datu bāzēm (OLTP sistēmām), taču sarežģīti vairāku tabulu vaicājumi tajā ir salīdzinoši lēni. Labāks vaicājumu modelis, nevis modifikācija, ir telpiskā datu bāze.

OLAP sistēma uzņem relāciju datu bāzes momentuzņēmumu un strukturē to vaicājumu telpiskajā modelī. Pieprasītais vaicājumu apstrādes laiks OLAP ir aptuveni 0,1% no līdzīgiem vaicājumiem relāciju datu bāzē.

OLAP struktūru, kas izveidota no darbības datiem, sauc par OLAP kubu. Kubs tiek izveidots, savienojot tabulas, izmantojot zvaigžņu shēmu. "Zvaigznes" centrā ir faktu tabula, kas satur galvenos vaicājamos faktus. Faktu tabulai ir pievienotas vairākas dimensiju tabulas. Šīs tabulas parāda, kā var analizēt apkopotos relāciju datus. Iespējamo apkopojumu skaitu nosaka to veidu skaits, kā sākotnējos datus var parādīt hierarhiski.

Dotās sistēmu klases (OLAP un OLTP) ir balstītas uz DBVS izmantošanu, taču vaicājumu veidi ir ļoti atšķirīgi. OLAP dzinējs šodien ir viena no populārākajām datu analīzes metodēm. Šīs problēmas risināšanai ir divas galvenās pieejas. Pirmo no tiem sauc par daudzdimensiju OLAP (MOLAP) - mehānisma ieviešanu, izmantojot daudzdimensiju datu bāzi servera pusē, un otro sauc par relāciju OLAP (ROLAP) - kubu veidošanu "uz lidojuma", pamatojoties uz SQL vaicājumiem uz relāciju DBVS. Katrai no šīm metodēm ir priekšrocības un trūkumi. Darbvirsmas OLAP sistēmas vispārējo shēmu var attēlot attēlā.

Darba algoritms ir šāds:

1) datu iegūšana plakanas tabulas veidā vai SQL vaicājuma izpildes rezultāts;

2) kešatmiņā saglabātos datus un pārvērst tos daudzdimensiju kubā;

3) konstruētā kuba attēlošana, izmantojot šķērstabulu vai diagrammu utt.

Kopumā vienam kubam var pievienot patvaļīgu skaitu displeju. OLAP sistēmās izmantotie displeji visbiežāk ir divu veidu: šķērstabulas un diagrammas.

Zvaigžņu diagramma. Tās ideja ir tāda, ka katrai dimensijai ir tabulas, un visi fakti ir ievietoti vienā tabulā, indeksēti ar vairākkārtēju atslēgu, kas sastāv no atsevišķu dimensiju atslēgām. Katrs zvaigznes shēmas stars Codd terminoloģijā nosaka datu konsolidācijas virzienu pa atbilstošo dimensiju.

Sarežģītu problēmu gadījumā ar daudzlīmeņu izmēriem ir lietderīgi pievērsties zvaigžņu shēmas paplašinājumiem - faktu konstelācijas shēmai un sniegpārsliņu shēmai. Šādos gadījumos tiek izveidotas atsevišķas faktu tabulas dažādu dimensiju kopsavilkuma līmeņu iespējamām kombinācijām. Tas ļauj uzlabot veiktspēju, bet bieži vien rada datu dublēšanos un ievērojamus sarežģījumus datu bāzes struktūrā, kurā ir milzīgs faktu tabulu skaits.

zvaigznāju diagramma

Analītiskā datu apstrāde - Šī ir datu analīze, kurai nepieciešams atbilstošs metodiskais atbalsts un noteikts speciālistu apmācības līmenis.

Mūsdienu informācijas tehnoloģijas ļauj automatizēt uzkrātās primārās informācijas analīzes procesus, veidot analītiskus modeļus, iegūt gatavus risinājumus un tos izmantot praksē. Galvenās prasības , kas tiek prezentētas analīzes metodēm, ir efektivitāte, vienkāršība, automātisms. Šī koncepcija ir divu mūsdienu tehnoloģiju pamatā: datu ieguve un zināšanu atklāšana datubāzēs (KDD).

Datu ieguve - tas ir process, lai neapstrādātos datos atklātu iepriekš nezināmu, ne-triviālu, praktiski noderīgu un pieejamu zināšanu interpretāciju, kas nepieciešama lēmumu pieņemšanai dažādās cilvēka darbības jomās (viena no šī virziena dibinātājiem-G. Pjaetskis-Šapiro definīcija). .

Datu ieguves tehnoloģijas mērķis ir atrast nepārprotamus modeļus. Datu analīzes posmi ir šādi:

  • 1) klasifikācija ( klasifikācija) - pazīmju noteikšana, kas raksturo pētāmās datu kopas objektu grupas - klases. Klasifikācijas problēmai izmantotās risinājuma metodes: tuvākā kaimiņa metodes ( tuvākais kaimiņš) un ^ ’- tuvākais kaimiņš ( k -tuvākais kaimiņš) -, Bayesian tīkli (Bajesa tīkli) -, lēmuma koku indukcija; neironu tīkli (neironu tīkli) -,
  • 2) klasterizācija (grupēšana)- objektu sadalīšana grupās, jo objektu klases sākotnēji nav definētas. Klasterizācijas problēmas risināšanas metodes piemērs: pašorganizējošās Kohonena kartes - neironu tīkls ar neuzraudzītu mācīšanos. Šo karšu svarīga iezīme ir to spēja plaknē attēlot daudzdimensionālas pazīmju telpas, uzrādot datus divdimensiju kartes veidā;
  • 3) asociācija (asociācijas)- identificēt modeļus starp saistītiem notikumiem datu kopā. Šie modeļi tiek atklāti nevis, pamatojoties uz analizētā objekta īpašībām, bet starp vairākiem notikumiem, kas notiek vienlaicīgi, piemēram, Apriori algoritms;
  • 4) secība (secība), vai secīga asociācija (secīga asociācija),- meklēt laika modeļus starp darījumiem, t.i. likumsakarības tiek noteiktas nevis starp vienlaicīgi notiekošiem notikumiem, bet starp notikumiem, kas saistīti laikā. Asociācija ir secības ar laika nobīdi nulle. Secības noteikums: pēc notikuma X pēc noteikta laika notiks notikums Y;
  • 5) prognozēšana (prognozēšana) - ir veidota, pamatojoties uz vēsturisko datu pazīmēm, t.i. ir mērķa skaitlisko rādītāju izlaisto vai nākotnes vērtību novērtējums. Prognozēšanas problēmu risināšanai tiek izmantotas matemātiskās statistikas metodes, neironu tīkli u.c.
  • 6) noviržu vai noviržu noteikšana (novirzes noteikšana), noviržu vai noviržu analīze - tādu datu noteikšana un analīze, kas visvairāk atšķiras no vispārējā datu kopuma;
  • 7) vērtēšana (novērtējums)- objekta nepārtrauktu vērtību prognozēšana;
  • 8) saišu analīze (saišu analīze)- uzdevums atrast atkarības datu kopā;
  • 9) vizualizācija (vizualizācija, grafiku ieguve)- analizēto datu grafiskā attēla izveidošana. Grafiskās metodes tiek izmantotas, lai parādītu modeļos datu klātbūtni, piemēram, datu prezentācija 2D un 3D dimensijās;
  • 10) Rezumējot ( kopsavilkums) - konkrētu objektu grupu apraksts no analizētās datu kopas.

KDD ir noderīgu zināšanu iegūšanas process no datu kolekcijas. Šī tehnoloģija ietver jautājumus: datu sagatavošana, informatīvo funkciju izvēle, datu tīrīšana, datu ieguves (DM) metožu pielietošana, datu pēcapstrāde un rezultātu interpretācija.

Zināšanu atklāšanas process datu bāzēs sastāv no šādām darbībām:

  • 1) problēmas izklāsts - lietotāja uzdevumu un lietojumprogrammas apgabala funkciju analīze, ievades un izvades parametru kopuma izvēle;
  • 2) sākotnējo datu kopas sagatavošana - datu noliktavas izveide un datu vākšanas un atjaunināšanas shēmas organizēšana;
  • 3) datu priekšapstrāde - pamatojoties uz datu ieguves metožu izmantošanu, no šīs metodes viedokļa datiem jābūt kvalitatīviem un pareiziem;
  • 4) datu pārveidošana, normalizēšana - informācijas novietošana tādā formā, kas piemērota turpmākai analīzei;
  • 5) Datu ieguve - automātiska datu analīze, kuras pamatā ir dažādu zināšanu atrašanas algoritmu izmantošana (neironu tīkli, lēmumu koki, klasteru algoritmi, asociāciju izveide utt.);
  • 6) datu pēcapstrāde - rezultātu interpretācija un iegūto zināšanu pielietošana biznesa lietojumos.