ანალიტიკური მონაცემების დამუშავების გზები გადაწყვეტილების მხარდაჭერისთვის. ონლაინ ანალიტიკური დამუშავება (OLAP)

3.4 მონაცემთა ანალიტიკური დამუშავების მეთოდები

იმისათვის, რომ არსებულმა მონაცემთა საწყობებმა ხელი შეუწყონ მენეჯმენტის გადაწყვეტილებების მიღებას, ინფორმაცია ანალიტიკოსს უნდა წარუდგინოს სწორი ფორმით, ანუ მას უნდა ჰქონდეს შემუშავებული ინსტრუმენტები საწყობიდან მონაცემების წვდომისა და დამუშავებისთვის.

ძალიან ხშირად, გადაწყვეტილების მიმღები პირების მიერ პირდაპირი გამოყენებისთვის შექმნილი საინფორმაციო და ანალიტიკური სისტემები ძალზედ მარტივი გამოსაყენებელია, მაგრამ ფუნქციონალურად მკვეთრად შეზღუდული. ასეთ სტატიკურ სისტემებს ეწოდება აღმასრულებელი საინფორმაციო სისტემები (ISS), ან აღმასრულებელი საინფორმაციო სისტემები (EIS). ისინი შეიცავს უამრავ მოთხოვნას და მიუხედავად იმისა, რომ საკმარისია ყოველდღიური განხილვისთვის, არ შეუძლიათ უპასუხონ ყველა კითხვას, რომელიც შეიძლება წარმოიშვას გადაწყვეტილების მიღებისას. ასეთი სისტემის მუშაობის შედეგი, როგორც წესი, არის მრავალგვერდიანი ანგარიშები, გულდასმით შესწავლის შემდეგ, რომელთა ანალიტიკოსს კითხვების ახალი სერია აქვს. თუმცა, ყოველი ახალი მოთხოვნა, რომელიც არ არის გათვალისწინებული ასეთი სისტემის შექმნისას, ჯერ ოფიციალურად უნდა იყოს აღწერილი, კოდირებული პროგრამისტის მიერ და მხოლოდ ამის შემდეგ შესრულდეს. ლოდინის დრო ამ შემთხვევაში შეიძლება იყოს საათები და დღეები, რაც ყოველთვის არ არის მისაღები.

ონლაინ ანალიტიკური დამუშავება. ან On-Line ანალიტიკური დამუშავება, OLAP არის მონაცემთა საწყობების ორგანიზების ძირითადი კომპონენტი. OLAP-ის კონცეფცია აღწერილი იქნა 1993 წელს ედგარ კოდის მიერ და აქვს შემდეგი მოთხოვნები მრავალგანზომილებიანი ანალიზისთვის:

– მონაცემთა მრავალგანზომილებიანი კონცეპტუალური წარმოდგენა, მათ შორის იერარქიებისა და მრავალჯერადი იერარქიების სრული მხარდაჭერა (OLAP-ის ძირითადი მოთხოვნა);

– მომხმარებლისთვის ანალიზის შედეგების მიწოდება მისაღებ დროში (ჩვეულებრივ არა უმეტეს 5 წმ), თუნდაც ნაკლებად დეტალური ანალიზის ფასად;

– მოცემული აპლიკაციისთვის დამახასიათებელი ნებისმიერი ლოგიკური და სტატისტიკური ანალიზის ჩატარების და საბოლოო მომხმარებლისთვის მისაწვდომ ფორმაში შენახვის შესაძლებლობა;

– მრავალ მომხმარებლის წვდომა მონაცემებზე შესაბამისი ჩაკეტვის მექანიზმებისა და ავტორიზებული წვდომის ხელსაწყოების მხარდაჭერით;

- ნებისმიერი საჭირო ინფორმაციის წვდომის შესაძლებლობა, მიუხედავად მისი მოცულობისა და შენახვის ადგილისა.

OLAP სისტემა შედგება მრავალი კომპონენტისგან. პრეზენტაციის უმაღლეს დონეზე, სისტემა მოიცავს მონაცემთა წყაროს, მრავალგანზომილებიან მონაცემთა ბაზას (MDB), რომელიც უზრუნველყოფს OLAP საანგარიშო ძრავის, OLAP სერვერის და კლიენტის დანერგვის შესაძლებლობას. სისტემა აგებულია კლიენტ-სერვერის პრინციპზე და უზრუნველყოფს დისტანციურ და მრავალ მომხმარებლის წვდომას MDB სერვერზე.

განვიხილოთ OLAP სისტემის კომპონენტები.

წყაროები. OLAP სისტემებში წყარო არის სერვერი, რომელიც აწვდის მონაცემებს ანალიზისთვის. OLAP პროდუქტის გამოყენების სფეროდან გამომდინარე, წყარო შეიძლება იყოს მონაცემთა საწყობი, მემკვიდრეობითი მონაცემთა ბაზა, რომელიც შეიცავს ზოგად მონაცემებს, კომპლექტს.

ცხრილები, რომლებიც აერთიანებს ფინანსურ მონაცემებს ან ზემოაღნიშნულის ნებისმიერ კომბინაციას.

მონაცემთა შენახვა. საწყისი მონაცემები გროვდება და მოთავსებულია მონაცემთა საწყობების მშენებლობის პრინციპების შესაბამისად შექმნილ საწყობში. CD არის რელაციური მონაცემთა ბაზა (RDB). ძირითადი მონაცემთა ცხრილი (ფაქტების ცხრილი) შეიცავს ინდიკატორების რიცხვითი მნიშვნელობებს, რომლებისთვისაც გროვდება სტატისტიკური ინფორმაცია.

მრავალგანზომილებიანი მონაცემთა ბაზამონაცემთა მაღაზია ემსახურება როგორც ინფორმაციის მიმწოდებელს მრავალგანზომილებიანი მონაცემთა ბაზისთვის, რომელიც წარმოადგენს ობიექტების კრებულს. ამ ობიექტების ძირითადი კლასებია ზომები და ინდიკატორები. ზომები მოიცავს მნიშვნელობების კომპლექტს (პარამეტრებს), რომლებითაც ხდება მონაცემების ინდექსირება, მაგალითად, დრო, რეგიონები, დაწესებულების ტიპი და ა.შ. თითოეული განზომილება ივსება მნიშვნელობებით მონაცემთა საწყობის ზომების შესაბამისი ცხრილებიდან. გაზომვების ნაკრები განსაზღვრავს შესასწავლი პროცესის სივრცეს. მეტრიკა არის მრავალგანზომილებიანი მონაცემთა კუბურები (ჰიპერკუბები). ჰიპერკუბი შეიცავს თავად მონაცემებს, ისევე როგორც ინდიკატორის შემადგენელი ზომების საერთო ჯამებს. ინდიკატორები შეადგენენ MDB-ის ძირითად შინაარსს და ივსება ფაქტების ცხრილის შესაბამისად. ჰიპერკუბის თითოეული ღერძის გასწვრივ, მონაცემები შეიძლება იყოს ორგანიზებული იერარქიაში, რომელიც წარმოადგენს დეტალების სხვადასხვა დონეს. ეს საშუალებას გაძლევთ შექმნათ იერარქიული განზომილებები, რომლის მიხედვითაც, შემდგომი მონაცემთა ანალიზის დროს, განხორციელდება მონაცემთა პრეზენტაციის აგრეგაცია ან დახვეწა. იერარქიული განზომილების ტიპიური მაგალითია ტერიტორიული ობიექტების სია დაჯგუფებული რაიონების, რეგიონების, რაიონების მიხედვით.

სერვერი. OLAP სისტემის აპლიკაციის ნაწილია OLAP სერვერი. ეს კომპონენტი ასრულებს ყველა სამუშაოს (დამოკიდებულია სისტემის მოდელზე) და ინახავს ყველა ინფორმაციას, რომელზეც აქტიურად არის წვდომა. სერვერის არქიტექტურა იმართება სხვადასხვა კონცეფციებით. კერძოდ, OLAP პროდუქტების მთავარი ფუნქციური მახასიათებელია MDB ან RDB გამოყენება მონაცემთა შესანახად.

კლიენტის აპლიკაცია.შესაბამისად სტრუქტურირებული და MDB-ში შენახული მონაცემები ხელმისაწვდომია ანალიზისთვის კლიენტის აპლიკაციის გამოყენებით. მომხმარებელი იღებს მონაცემებზე დისტანციურად წვდომის, რთული მოთხოვნების ფორმულირების, მოხსენებების გენერირების და მონაცემთა თვითნებური ქვეჯგუფების მოპოვების შესაძლებლობას. ანგარიშის მიღება დამოკიდებულია კონკრეტული გაზომვის მნიშვნელობების არჩევაზე და ჰიპერკუბის მონაკვეთის აგებაზე. ჯვარი მონაკვეთი განისაზღვრება შერჩეული გაზომვის მნიშვნელობებით. დანარჩენი გაზომვების მონაცემები შეჯამებულია.

OLAPკლიენტზე და სერვერზე.მონაცემთა მრავალგანზომილებიანი ანალიზი შეიძლება განხორციელდეს სხვადასხვა ხელსაწყოების გამოყენებით, რომლებიც პირობითად შეიძლება დაიყოს კლიენტისა და სერვერის OLAP ინსტრუმენტებად.

კლიენტის მხარის OLAP ინსტრუმენტები (როგორიცაა Microsoft-ის Pivot Tables Excel 2000-ში ან Knosys-ის ProClarity) არის აპლიკაციები, რომლებიც გამოთვლიან მთლიან მონაცემებს და აჩვენებს მათ. ამავდროულად, მთლიანი მონაცემები თავისთავად შეიცავს ქეშში ასეთი OLAP ხელსაწყოს მისამართების სივრცეში.

თუ წყაროს მონაცემები შეიცავს დესკტოპის DBMS-ში, მთლიანი მონაცემების გაანგარიშება ხორციელდება თავად OLAP ინსტრუმენტის მიერ. თუ საწყისი მონაცემების წყაროა სერვერის DBMS, კლიენტის OLAP-ის მრავალი ინსტრუმენტი სერვერს უგზავნის SQL შეკითხვებს და, შედეგად, იღებს სერვერზე გამოთვლილ მთლიან მონაცემებს.

როგორც წესი, OLAP ფუნქციონირება ხორციელდება სტატისტიკური მონაცემების დამუშავების ინსტრუმენტებში და ზოგიერთ ცხრილებში.

განვითარების მრავალი ინსტრუმენტი შეიცავს კლასის ან კომპონენტის ბიბლიოთეკებს, რომლებიც საშუალებას გაძლევთ შექმნათ აპლიკაციები, რომლებიც განახორციელებენ უმარტივეს OLAP ფუნქციებს (როგორიცაა Decision Cube კომპონენტები Borland Delphi-ში და Borland C++ Builder-ში). გარდა ამისა, ბევრი კომპანია გვთავაზობს ActiveX კონტროლს და სხვა ბიბლიოთეკებს, რომლებიც უზრუნველყოფენ მსგავს ფუნქციონირებას.

კლიენტის OLAP ინსტრუმენტები გამოიყენება, როგორც წესი, მცირე რაოდენობის განზომილებებით (ჩვეულებრივ არაუმეტეს ექვსზე) და ამ პარამეტრების მნიშვნელობების მცირე მრავალფეროვნებით - ვინაიდან შედეგად მიღებული მონაცემები უნდა შეესაბამებოდეს მისამართთა სივრცეს. ინსტრუმენტი და მათი რიცხვი ექსპონენტურად იზრდება განზომილებების რაოდენობის მატებასთან ერთად.

OLAP კლიენტის მრავალი ინსტრუმენტი საშუალებას გაძლევთ შეინახოთ მთლიანი მონაცემთა ქეშის შიგთავსი ფაილად, რათა მათი ხელახალი გამოთვლა არ დაგჭირდეთ. თუმცა, ეს შესაძლებლობა ხშირად გამოიყენება საერთო მონაცემების გასასხვისებლად, რათა გადაიტანონ ისინი სხვა ორგანიზაციებში ან გამოქვეყნებისთვის.

ფაილში მთლიანი მონაცემებით ქეშის შენახვის იდეა შემდგომ განვითარდა სერვერის მხარეს OLAP ინსტრუმენტებში (მაგალითად, Oracle Express Server ან Microsoft OLAP Services), რომელშიც ხდება მთლიანი მონაცემების შენახვა და შეცვლა, ასევე შენახვა. მათ შემცველი შენახვა ხორციელდება ცალკე აპლიკაციით ან პროცესით, რომელსაც ეწოდება OLAP სერვერი. კლიენტის აპლიკაციებს შეუძლიათ მოითხოვონ ასეთი მრავალგანზომილებიანი საცავი და მიიღონ გარკვეული მონაცემები საპასუხოდ. ზოგიერთ კლიენტის აპლიკაციამ შეიძლება შექმნას ასეთი მაღაზიები ან განაახლოს ისინი შეცვლილი წყაროს მონაცემების მიხედვით.

სერვერის OLAP ინსტრუმენტების გამოყენების უპირატესობები კლიენტის OLAP ინსტრუმენტებთან შედარებით, მსგავსია სერვერის DBMS გამოყენების უპირატესობებთან შედარებით დესკტოპთან შედარებით: სერვერის ხელსაწყოების გამოყენების შემთხვევაში, მთლიანი მონაცემების გაანგარიშება და შენახვა ხდება სერვერზე და კლიენტის აპლიკაციაში. იღებს მხოლოდ მათ მიმართ შეკითხვის შედეგებს, რაც საშუალებას იძლევა ზოგადად შეამციროს ქსელის ტრაფიკი, მოთხოვნის შესრულების დრო და კლიენტის აპლიკაციის მიერ მოხმარებული რესურსების მოთხოვნები.

3.5 მრავალგანზომილებიანი მონაცემთა შენახვის ტექნიკური ასპექტები

მრავალგანზომილებიანი OLAP აპლიკაციებში შეიძლება დაიყოს სამ დონედ:

1. მონაცემთა მრავალგანზომილებიანი ხედი– საბოლოო მომხმარებლის ინსტრუმენტები, რომლებიც უზრუნველყოფენ მრავალგანზომილებიან ვიზუალიზაციას და მონაცემთა მანიპულირებას; მრავალგანზომილებიანი წარმოდგენის ფენა აბსტრაქტებს მონაცემთა ფიზიკური სტრუქტურიდან და განიხილავს მონაცემებს, როგორც მრავალგანზომილებიანს.

    მრავალგანზომილებიანი დამუშავება- ინსტრუმენტი (ენა) მრავალგანზომილებიანი მოთხოვნების ფორმულირებისთვის (ტრადიციული რელაციური SQL ენა აქ შეუფერებელია) და პროცესორი, რომელსაც შეუძლია დამუშავდეს და შეასრულოს ასეთი შეკითხვა.

    მრავალგანზომილებიანი საცავი– მონაცემთა ფიზიკური ორგანიზაციის საშუალებები, რომლებიც უზრუნველყოფენ მრავალგანზომილებიანი მოთხოვნების ეფექტურ შესრულებას.

პირველი ორი დონე სავალდებულოა ყველა OLAP ინსტრუმენტში. მესამე დონე, მიუხედავად იმისა, რომ ფართოდ გამოიყენება, არ არის საჭირო, რადგან მრავალგანზომილებიანი წარმოდგენის მონაცემების მიღება ასევე შესაძლებელია ჩვეულებრივი რელაციური სტრუქტურებიდან. მრავალგანზომილებიანი შეკითხვის პროცესორი, ამ შემთხვევაში, თარგმნის მრავალგანზომილებიან შეკითხვებს SQL შეკითხვებად, რომლებიც შესრულებულია რელაციური DBMS-ით.

ნებისმიერ მონაცემთა საწყობში - როგორც ჩვეულებრივი, ასევე მრავალგანზომილებიანი - ოპერატიული სისტემებიდან ამოღებულ დეტალურ მონაცემებთან ერთად, ასევე ინახება აგრეგირებული ინდიკატორები (მთლიანი ინდიკატორები), როგორიცაა გაყიდვების მოცულობების ჯამები თვეების მიხედვით, პროდუქტის კატეგორიების მიხედვით და ა.შ. ერთადერთი მიზანია დააჩქაროს შეკითხვის შესრულება. ყოველივე ამის შემდეგ, ერთის მხრივ, როგორც წესი, ძალიან დიდი რაოდენობით მონაცემები გროვდება საცავში, ხოლო მეორეს მხრივ, ანალიტიკოსები უმეტეს შემთხვევაში დაინტერესებულნი არიან არა დეტალური, არამედ განზოგადებული მაჩვენებლებით. და თუ მილიონობით ინდივიდუალური გაყიდვები ყოველ ჯერზე უნდა შეჯამებულიყო წელიწადში გაყიდვების ოდენობის გამოსათვლელად, სიჩქარე დიდი ალბათობით მიუღებელი იქნებოდა. ამიტომ, მონაცემთა მრავალგანზომილებიან მონაცემთა ბაზაში ჩატვირთვისას, ყველა ჯამური ინდიკატორი ან მათი ნაწილი გამოითვლება და ინახება.

თუმცა, აგრეგირებული მონაცემების გამოყენება სავსეა უარყოფითი მხარეებით. მთავარი მინუსი არის შენახული ინფორმაციის მოცულობის ზრდა (ახალი განზომილებების დამატებისას, კუბის შემადგენელი მონაცემების რაოდენობა ექსპონენტურად იზრდება) და მათი ჩატვირთვის დრო. უფრო მეტიც, ინფორმაციის მოცულობა შეიძლება გაიზარდოს ათობით და თუნდაც ასეულჯერ. მაგალითად, ერთ-ერთ გამოქვეყნებულ სტანდარტულ ტესტში, სრული აგრეგაციის რაოდენობა 10 მბ ნედლი მონაცემებისთვის საჭიროებდა 2.4 გბ-ს, ანუ მონაცემები გაიზარდა 240-ჯერ!

მონაცემების რაოდენობის გაზრდის ხარისხი აგრეგატების გაანგარიშებისას დამოკიდებულია კუბის ზომების რაოდენობაზე და ამ ზომების სტრუქტურაზე, ანუ განზომილების სხვადასხვა დონეზე "მშობლების" და "შვილების" რაოდენობის თანაფარდობაზე. აგრეგატების შენახვის პრობლემის გადასაჭრელად გამოიყენება რთული სქემები, რომლებიც საშუალებას იძლევა, ყველა შესაძლო აგრეგატისგან შორს გაანგარიშებისას, მივაღწიოთ შეკითხვის შესრულების შესრულების მნიშვნელოვან ზრდას.

როგორც ნედლეული, ისე მთლიანი მონაცემების შენახვა შესაძლებელია ორივეში

მიმართებით, ან მრავალგანზომილებიან სტრუქტურებში. ამასთან დაკავშირებით, ამჟამად გამოიყენება მრავალგანზომილებიანი მონაცემების შენახვის სამი მეთოდი:

MOLAP (მრავალგანზომილებიანი OLAP) - წყარო და მთლიანი მონაცემები ინახება მრავალგანზომილებიან მონაცემთა ბაზაში. მონაცემთა შენახვა მრავალგანზომილებიან სტრუქტურებში საშუალებას გაძლევთ მანიპულირება მოახდინოთ მონაცემებით, როგორც მრავალგანზომილებიანი მასივი, ისე, რომ საერთო მნიშვნელობების გამოთვლის სიჩქარე ერთნაირი იყოს ნებისმიერი განზომილებისთვის. თუმცა, ამ შემთხვევაში, მრავალგანზომილებიანი მონაცემთა ბაზა ზედმეტია, რადგან მრავალგანზომილებიანი მონაცემები მთლიანად შეიცავს თავდაპირველ რელაციურ მონაცემებს.

ეს სისტემები უზრუნველყოფენ OLAP დამუშავების სრულ ციკლს. ისინი ან მოიცავს სერვერის კომპონენტის გარდა, საკუთარ ინტეგრირებულ კლიენტის ინტერფეისს, ან იყენებენ გარე ცხრილების პროგრამებს მომხმარებელთან კომუნიკაციისთვის.

ROLAP (რელაციური OLAP) - თავდაპირველი მონაცემები რჩება იმავე რელაციურ მონაცემთა ბაზაში, სადაც ის თავდაპირველად იყო განთავსებული. მთლიანი მონაცემები მოთავსებულია მომსახურების ცხრილებში, რომლებიც სპეციალურად შეიქმნა მათი შესანახად იმავე მონაცემთა ბაზაში.

ჰოლაპი (ჰიბრიდული OLAP) - თავდაპირველი მონაცემები რჩება იმავე რელაციურ მონაცემთა ბაზაში, სადაც ის თავდაპირველად ცხოვრობდა, ხოლო მთლიანი მონაცემები ინახება მრავალგანზომილებიან მონაცემთა ბაზაში.

ზოგიერთი OLAP ინსტრუმენტი მხარს უჭერს მონაცემთა შენახვას მხოლოდ რელაციურ სტრუქტურებში, ზოგი კი მხოლოდ მრავალგანზომილებიან სტრუქტურებში. თუმცა, ყველაზე თანამედროვე OLAP სერვერის ხელსაწყოები მხარს უჭერენ მონაცემთა შენახვის სამივე მეთოდს. შენახვის მეთოდის არჩევანი დამოკიდებულია წყაროს მონაცემების მოცულობასა და სტრუქტურაზე, მოთხოვნების შესრულების სიჩქარეზე და OLAP კუბების განახლების სიხშირეზე.

3.6 მონაცემთა მოპოვება (მონაცემებიმაინინგი)

ტერმინი მონაცემთა მოპოვება გულისხმობს კორელაციების, ტენდენციების და ურთიერთობების ძიების პროცესს სხვადასხვა მათემატიკური და სტატისტიკური ალგორითმების მეშვეობით: კლასტერირება, რეგრესია და კორელაციის ანალიზი და ა.შ. გადაწყვეტილების მხარდაჭერის სისტემებისთვის. ამავდროულად, დაგროვილი ინფორმაცია ავტომატურად განზოგადდება ინფორმაციაზე, რომელიც შეიძლება დახასიათდეს როგორც ცოდნა.

მონაცემთა მოპოვების თანამედროვე ტექნოლოგიის საფუძველია შაბლონების კონცეფცია, რომელიც ასახავს მონაცემთა ქვენიმუშებში თანდაყოლილ შაბლონებს და წარმოადგენს ეგრეთ წოდებულ ფარულ ცოდნას.

შაბლონები იძებნება მეთოდებით, რომლებიც არ იყენებენ აპრიორულ ვარაუდებს ამ ქვენიმუშების შესახებ. მონაცემთა მოპოვების მნიშვნელოვანი მახასიათებელია მოძიებული შაბლონების არასტანდარტული და არააშკარაობა. სხვა სიტყვებით რომ ვთქვათ, მონაცემთა მოპოვების ინსტრუმენტები განსხვავდება სტატისტიკური მონაცემების დამუშავების ინსტრუმენტებისგან და OLAP ინსტრუმენტებისგან იმით, რომ იმის ნაცვლად, რომ შეამოწმონ ის ურთიერთობები, რომლებსაც მომხმარებლები ვარაუდობენ.

მონაცემებს შორის, არსებულ მონაცემებზე დაყრდნობით, შეუძლიათ დამოუკიდებლად იპოვონ ასეთი ურთიერთობები, ასევე შექმნან ჰიპოთეზა მათი ბუნების შესახებ.

ზოგადად, მონაცემთა მოპოვების პროცესი (Data Mining) შედგება სამი ეტაპისგან

    შაბლონების იდენტიფიკაცია (უფასო ძებნა);

    გამოვლენილი შაბლონების გამოყენება უცნობი მნიშვნელობების პროგნოზირებისთვის (პროგნოზირებადი მოდელირება);

    გამონაკლისის ანალიზი, შექმნილია აღმოჩენილ შაბლონებში ანომალიების იდენტიფიცირებისა და ინტერპრეტაციისთვის.

ზოგჯერ, ცალსახად არის გამოყოფილი შაბლონების სანდოობის შემოწმების შუალედური ეტაპი მათ აღმოჩენასა და გამოყენებას შორის (დამოწმების ეტაპი).

არსებობს ხუთი სტანდარტული ტიპის შაბლონები, რომლებიც იდენტიფიცირებულია მონაცემთა მოპოვების მეთოდებით:

1.ასოციაციასაშუალებას გაძლევთ აირჩიოთ ობიექტების სტაბილური ჯგუფები, რომელთა შორის არის იმპლიციტურად განსაზღვრული ბმულები. ერთი ნივთის ან ჯგუფის ნივთების გაჩენის სიხშირეს, გამოხატული პროცენტულად, ეწოდება პრევალენტობა. გავრცელების დაბალი მაჩვენებელი (პროცენტის მეათასედზე ნაკლები) ვარაუდობს, რომ ასეთი ასოციაცია არ არის მნიშვნელოვანი. ასოციაციები იწერება წესების მიხედვით: => , სად A -პაკეტი, V -შედეგი. თითოეული მიღებული ასოციაციის წესის მნიშვნელობის დასადგენად, აუცილებელია გამოვთვალოთ მნიშვნელობა, რომელსაც ეწოდება ნდობა რომ (ან ურთიერთობა A და B).ნდობა აჩვენებს რამდენად ხშირად როდის ჩნდება ვ.მაგალითად, თუ d(A/B)\u003d 20%, ეს ნიშნავს, რომ პროდუქტის ყიდვისას ყოველ მეხუთე შემთხვევაში პროდუქციის შეძენაც ხდება ვ.

ასოციაციის გამოყენების ტიპიური მაგალითია შესყიდვების სტრუქტურის ანალიზი. მაგალითად, სუპერმარკეტში კვლევის ჩატარებისას აღმოაჩენთ, რომ მათ, ვინც კარტოფილის ჩიფსები იყიდა, 65% იღებს კოკა-კოლას და თუ ფასდაკლება აქვს ასეთ კომპლექტზე, კოლას ყიდულობს 85%-ში. ასეთი შედეგები ღირებულია მარკეტინგული სტრატეგიების ფორმირებაში.

2. თანმიმდევრულობა - ეს არის დროთა განმავლობაში ასოციაციების იდენტიფიცირების მეთოდი. ამ შემთხვევაში, დადგენილია წესები, რომლებიც აღწერს მოვლენების გარკვეული ჯგუფების თანმიმდევრულ მოვლენებს. ასეთი წესები აუცილებელია სცენარების აგებისთვის. გარდა ამისა, ისინი შეიძლება გამოყენებულ იქნას, მაგალითად, წინა გაყიდვების ტიპიური ნაკრების შესაქმნელად, რამაც შეიძლება გამოიწვიოს კონკრეტული პროდუქტის შემდგომი გაყიდვები.

3.კლასიფიკაცია - განზოგადების ინსტრუმენტი. ის საშუალებას გაძლევთ გადახვიდეთ ცალკეული ობიექტების განხილვიდან განზოგადებულ ცნებებზე, რომლებიც ახასიათებენ ობიექტების ზოგიერთ კოლექციას და საკმარისია ამ კოლექციების (კლასების) კუთვნილი ობიექტების ამოცნობისთვის. კონცეფციების ჩამოყალიბების პროცესის არსი არის კლასებში თანდაყოლილი შაბლონების პოვნა. მრავალი განსხვავებული თვისება (ატრიბუტი) გამოიყენება ობიექტების აღსაწერად. ინდიკატური აღწერების მიხედვით კონცეფციის ფორმირების პრობლემა ჩამოაყალიბა მ.მ. ბონგარტი. მისი გადაწყვეტა ემყარება ორი ძირითადი პროცედურის გამოყენებას: სწავლებას და გადამოწმებას. სასწავლო პროცედურებში აგებულია კლასიფიკაციის წესი ობიექტების სასწავლო ნაკრების დამუშავების საფუძველზე. გადამოწმების პროცედურა (გამოკვლევა) მოიცავს მიღებული კლასიფიკაციის წესის გამოყენებას ობიექტების ახალი (გამოკვლევის) ნიმუშიდან ამოცნობისთვის. თუ ტესტის შედეგები დამაკმაყოფილებელი აღმოჩნდა, მაშინ სასწავლო პროცესი მთავრდება, წინააღმდეგ შემთხვევაში განმეორებითი სწავლის პროცესში იხვეწება კლასიფიკაციის წესი.

4. კლასტერირება - ეს არის ინფორმაციის (ჩანაწერების) განაწილება მონაცემთა ბაზიდან ჯგუფებად (კლასტერებად) ან სეგმენტებად ამ ჯგუფების ერთდროული განსაზღვრებით. კლასიფიკაციისგან განსხვავებით, აქ ანალიზი არ საჭიროებს კლასების წინასწარ დაზუსტებას.

5. დროის სერიების პროგნოზირება არის ინსტრუმენტი განსახილველი ობიექტების ატრიბუტების ტენდენციების განსაზღვრისათვის დროთა განმავლობაში. დროის სერიების ქცევის ანალიზი საშუალებას გაძლევთ წინასწარ განსაზღვროთ შესწავლილი მახასიათებლების მნიშვნელობები.

ასეთი პრობლემების გადასაჭრელად გამოიყენება მონაცემთა მოპოვების სხვადასხვა მეთოდები და ალგორითმები. იმის გათვალისწინებით, რომ მონაცემთა მოპოვება განვითარდა და ვითარდება ისეთი დისციპლინების კვეთაზე, როგორიცაა სტატისტიკა, ინფორმაციის თეორია, მანქანათმცოდნეობა, მონაცემთა ბაზის თეორია, სავსებით ბუნებრივია, რომ მონაცემთა მოპოვების ალგორითმებისა და მეთოდების უმეტესობა შემუშავდა ამ დისციპლინების სხვადასხვა მეთოდებზე დაყრდნობით. დისციპლინები.

მონაცემთა მოპოვების არსებული მეთოდების მრავალფეროვნებიდან შეიძლება განვასხვავოთ შემდეგი:

    რეგრესიის, დისპერსიისა და კორელაციის ანალიზი(დანერგილი უმეტეს თანამედროვე სტატისტიკურ პაკეტებში, კერძოდ, SAS Institute-ის, StatSoft-ის და ა.შ. პროდუქტებში);

    ანალიზის მეთოდებიკონკრეტულ საგნობრივ სფეროში, ემპირიულ მოდელებზე დაფუძნებული (ხშირად გამოიყენება, მაგალითად, იაფი ფინანსური ანალიზის ინსტრუმენტებში);

    ნერვული ქსელის ალგორითმები- პროცესებისა და ფენომენების იმიტაციის მეთოდი, რომელიც საშუალებას გაძლევთ განახორციელოთ რთული დამოკიდებულებების რეპროდუცირება. მეთოდი ეფუძნება ბიოლოგიური ტვინის გამარტივებული მოდელის გამოყენებას და მდგომარეობს იმაში, რომ საწყისი პარამეტრები განიხილება, როგორც სიგნალები, რომლებიც გარდაიქმნება "ნეირონებს" შორის არსებული კავშირებისა და მთელი ქსელის პასუხის შესაბამისად. საწყის მონაცემებზე განიხილება ანალიზის შედეგად მიღებული პასუხი. ბმულები ამ შემთხვევაში იქმნება ეგრეთ წოდებული ქსელური სწავლის გამოყენებით დიდი ნიმუშის საშუალებით, რომელიც შეიცავს როგორც ორიგინალურ მონაცემებს, ასევე სწორ პასუხებს. ნერვული ქსელები ფართოდ გამოიყენება კლასიფიკაციის პრობლემების გადასაჭრელად;

    ბუნდოვანი ლოგიკაგამოიყენება მონაცემების დასამუშავებლად ბუნდოვანი ჭეშმარიტების მნიშვნელობებით, რომლებიც შეიძლება წარმოდგენილი იყოს სხვადასხვა ენობრივი ცვლადით. ბუნდოვანი ცოდნის წარმოდგენა ფართოდ გამოიყენება კლასიფიკაციისა და პროგნოზირების პრობლემების გადასაჭრელად, მაგალითად, XpertRule Miner სისტემაში (Attar Software Ltd., დიდი ბრიტანეთი), ასევე AIS-ში, NeuFuz-ში და ა.შ.;

    ინდუქციური დასკვნებისაშუალებას გაძლევთ მიიღოთ მონაცემთა ბაზაში შენახული ფაქტების განზოგადება. ინდუქციური სწავლების პროცესში შეიძლება მონაწილეობა მიიღოს ჰიპოთეზების მომწოდებელ სპეციალისტს. ამ მეთოდს ზედამხედველობითი სწავლება ეწოდება. განზოგადების წესების ძიება შეიძლება განხორციელდეს მასწავლებლის გარეშე ჰიპოთეზების ავტომატურად გენერირებით. თანამედროვე პროგრამულ ინსტრუმენტებში, როგორც წესი, ორივე მეთოდი კომბინირებულია და ჰიპოთეზების შესამოწმებლად გამოიყენება სტატისტიკური მეთოდები. სისტემის მაგალითი, რომელიც იყენებს ინდუქციურ მილებს, არის XpertRule Miner, რომელიც შემუშავებულია Attar Software Ltd-ის მიერ. (Დიდი ბრიტანეთი);

    მსჯელობა ეფუძნება მსგავსი შემთხვევები(„უახლოესი მეზობლის“ მეთოდი) (Case-based მსჯელობა - CBR) ეფუძნება სიტუაციების მონაცემთა ბაზაში ძიებას, რომელთა აღწერილობები მთელი რიგი მახასიათებლებით მსგავსია მოცემულ სიტუაციასთან. ანალოგიის პრინციპი ვარაუდობს, რომ მსგავსი სიტუაციების შედეგები ასევე ახლოს იქნება ერთმანეთთან. ამ მიდგომის მინუსი ის არის, რომ ის არ ქმნის მოდელებს ან წესებს, რომლებიც განაზოგადებენ წინა გამოცდილებას. გარდა ამისა, დასკვნის შედეგების სანდოობა დამოკიდებულია სიტუაციების აღწერის სისრულეზე, როგორც ინდუქციური დასკვნის პროცესებში. CBR-ის გამოყენებით სისტემების მაგალითებია: KATE Tools (Acknosoft, საფრანგეთი), Pattern Recognition Workbench (Unica, აშშ);

    გადაწყვეტილების ხეები- პრობლემის სტრუქტურირების მეთოდი ხის გრაფიკის სახით, რომლის წვეროები შეესაბამება წარმოების წესებს, რომლებიც საშუალებას იძლევა მონაცემთა კლასიფიკაცია ან გადაწყვეტილებების შედეგების ანალიზი. ეს მეთოდი იძლევა კლასიფიკაციის წესების სისტემის ვიზუალურ წარმოდგენას, თუ ისინი არც თუ ისე ბევრია. მარტივი ამოცანები ამ მეთოდით წყდება ბევრად უფრო სწრაფად, ვიდრე ნერვული ქსელების გამოყენებით. რთული პრობლემებისთვის და ზოგიერთი ტიპის მონაცემებისთვის, გადაწყვეტილების ხეები შეიძლება არ იყოს შესაბამისი. გარდა ამისა, ამ მეთოდს ახასიათებს მნიშვნელობის პრობლემა. მონაცემთა იერარქიული კლასტერიზაციის ერთ-ერთი შედეგია მრავალი განსაკუთრებული შემთხვევისთვის სასწავლო მაგალითების არარსებობა და, შესაბამისად, კლასიფიკაცია არ შეიძლება ჩაითვალოს საიმედოდ. გადაწყვეტილების ხის მეთოდები დანერგილია ბევრ პროგრამულ ინსტრუმენტში, კერძოდ: C5.0 (RuleQuest, ავსტრალია), Clementine (Integral Solutions, დიდი ბრიტანეთი), SIPINA (ლიონის უნივერსიტეტი, საფრანგეთი), IDIS (Information Discovery, აშშ);

    ევოლუციური პროგრამირება– ალგორითმის ძიება და გენერირება, რომელიც გამოხატავს მონაცემთა ურთიერთდამოკიდებულებას, თავდაპირველად მითითებულ ალგორითმზე დაყრდნობით, შეცვლილი ძიების პროცესში; ხანდახან ურთიერთდამოკიდებულებების ძიება ხორციელდება ნებისმიერი გარკვეული ტიპის ფუნქციებს შორის (მაგალითად, პოლინომები);

შეზღუდული ძიების ალგორითმები, მარტივი ლოგიკური მოვლენების კომბინაციების გამოთვლა მონაცემთა ქვეჯგუფებში.

3.7 ინტეგრაციაOLAPდამონაცემებიმაინინგი

ონლაინ ანალიტიკური დამუშავება (OLAP) და მონაცემთა მოპოვება (Data Mining) გადაწყვეტილების მხარდაჭერის პროცესის ორი კომპონენტია. თუმცა, დღეს OLAP სისტემების უმეტესობა ორიენტირებულია მხოლოდ მრავალგანზომილებიან მონაცემებზე წვდომის უზრუნველყოფაზე, ხოლო მონაცემთა მოპოვების ინსტრუმენტების უმეტესობა, რომლებიც მუშაობენ შაბლონების სფეროში, ეხება ერთგანზომილებიან მონაცემთა პერსპექტივებს. გადაწყვეტილების მხარდაჭერის სისტემებისთვის მონაცემთა დამუშავების ეფექტურობის გასაზრდელად, ამ ორი ტიპის ანალიზი უნდა გაერთიანდეს.

რთული ტერმინი "OLAP მონაცემთა მოპოვება" (მრავალგანზომილებიანი მონაცემთა მოპოვება) ახლა ჩნდება ასეთ კომბინაციაზე.

„OLAP მონაცემთა მოპოვების“ ფორმირების სამი ძირითადი გზა არსებობს:

    კუბირება, შემდეგ მოპოვება. ინტელექტუალური ანალიზის განხორციელების შესაძლებლობა უნდა იყოს უზრუნველყოფილი შეკითხვის ნებისმიერ შედეგზე მრავალგანზომილებიან კონცეპტუალურ წარმოდგენაზე, ანუ ინდიკატორთა ჰიპერკუბის ნებისმიერი პროექციის ნებისმიერ ფრაგმენტზე.

    მოპოვება შემდეგ კუბური. საწყობიდან მოპოვებული მონაცემების მსგავსად, მაინინგის შედეგები წარმოდგენილი უნდა იყოს ჰიპერკუბურ ფორმაში შემდგომი მრავალგანზომილებიანი ანალიზისთვის.

    კუბირება მაინინგის დროს. ეს მოქნილი ინტეგრაციის მეთოდი საშუალებას გაძლევთ ავტომატურად გაააქტიუროთ იგივე ტიპის ინტელექტუალური დამუშავების მექანიზმები მრავალგანზომილებიანი ანალიზის (გადასვლის) ყოველი ნაბიჯის შედეგზე განზოგადების დონეებს შორის, ახალი ჰიპერკუბის ფრაგმენტის ამოღება და ა.შ.

    ასტრონომიისთვის 11 კლასი [ტექსტი... მათროგორ ნაწილიყველა სისტემები ... ასისტენტ - პროფესორი ... ჩებოქსარი, 2009. No 10. ს. 44 -49 .... ავტორები - შემდგენლები: N.... რეფერატებილექციები, ...

  • სასწავლო დამხმარე საშუალება

    ... ლექციები. ტრენინგი ლექციებიმათემატიკა. Წერა აბსტრაქტულილექციები ლექციები. გამოყენება ინფორმაციატექნოლოგიები ...

  • მათემატიკის მომავალი მასწავლებლის კვლევითი საქმიანობა დაწყებითი მათემატიკაში შემოქმედებითი ამოცანები და მისი სწავლების მეთოდები ი კ კონდაუროვა ს ვ ლებედევი

    სასწავლო დამხმარე საშუალება

    ... ლექციები. ტრენინგი ლექციებიმათემატიკა. Წერა აბსტრაქტულილექციები. ვიზუალური საშუალებების მომზადება. კითხვის ტექნიკა ლექციები. გამოყენება ინფორმაციატექნოლოგიები ...

  • მონიტორინგის მედია პროფესიული განათლების მოდერნიზაცია 2011 წლის მარტი - აგვისტო

    Შემაჯამებელი

    ... 11 .08.2011 "მკვდარი სულები-2" RNIMU-ში მათ ... 3,11 -3,44 . ... საჯარო ლექციებილიდერები... ჩებოქსარი... და ნაწერი რეფერატებიაუდიტორია - ... საინფორმაციოსისტემებიდა ტექნოლოგიები. ... სისტემაგანათლება, ამბობს ასისტენტ - პროფესორი ... შემდგენლები ... ნაწილებირეალური შინაარსი ...

თემა 6

კორპორატიული საინფორმაციო სისტემები ეკონომიკური ინფორმაციის დასამუშავებლად

კორპორატიული საინფორმაციო ტექნოლოგიების კონცეფცია

კორპორატიული საინფორმაციო ტექნოლოგიების არსი და მნიშვნელობა

ბიზნესის მრავალფეროვან პროგრამებს შორის, ტერმინი „ინფორმაციული ტექნოლოგია კორპორატიულ მმართველობაში“ ტრადიციულად გაგებულია, როგორც „კომპლექსური მართვის ავტომატიზაციის სისტემები“. ცნობილია მათი სხვა სახელებიც - საწარმოს მასშტაბით სისტემები, კორპორატიული საინფორმაციო სისტემები (CIS), კორპორატიული (ან რთული) კონტროლის სისტემები (CCS), ავტომატური კონტროლის სისტემები (ACS).

როგორც წესი, კომპლექსური მართვის ავტომატიზაციის სისტემები არის "ძირითადი" უნივერსალური გადაწყვეტილებები, რომლებიც შესაფერისია სხვადასხვა ტიპის საწარმოებისთვის. უპირველეს ყოვლისა, ეს ეხება ფინანსურ მენეჯმენტს, ინვენტარის მართვას, შესყიდვებისა და გაყიდვების მენეჯმენტს. მაგრამ იმავე სისტემებს ხშირად აქვთ ინდუსტრიული გადაწყვეტილებები, რომლებიც ასახავს ერთ ან მეტი სხვა სპეციფიკა და შეიცავს შესაბამის მარეგულირებელ და საცნობარო ბაზას.

მაგალითად, SAP R/3 სისტემის გადაწყვეტა საავიაციო ინდუსტრიისთვის მხარს უჭერს ყველა თვითმფრინავის ნაწილების სერიული ქარხნის ნომრების აღრიცხვას და კონტროლს, მათი მომსახურების ვადის, დაგეგმილ ჩანაცვლებას ან შეკეთებას, რაც უზრუნველყოფს არა მხოლოდ წარმოების საიმედოობას, არამედ მგზავრების უსაფრთხოებას.

ვინაიდან რთული კონტროლის სისტემები ძირითადად ორიენტირებულია მრავალპროფილიანი სტრუქტურების შემცველ დიდ საწარმოებზე, ისინი არა მხოლოდ გვთავაზობენ ფუნქციების განვითარებულ კომპლექტს, არამედ უზრუნველყოფენ დიდი რაოდენობით ინფორმაციის საიმედო შენახვას და დამუშავებას, მძლავრი პლატფორმებისა და სისტემური ინსტრუმენტების გამოყენებით მრავალ მომხმარებლის მუშაობისთვის. .

თანამედროვე საინფორმაციო ტექნოლოგიები, კომუნიკაციები და ინტერნეტი საშუალებას იძლევა გადაჭრას ერთიან მონაცემთა ბაზაზე დისტანციური წვდომის პრობლემები, რაც ასევე აქტუალურია კორპორატიული მმართველობისთვის.

შენობის კონცეფცია

მიუხედავად იმისა, რომ დეველოპერების უმეტესობა თავის პროგრამულ პროდუქტებს მენეჯმენტს უწოდებს (საწარმო, საწყობი, ფინანსები და ა. მოხსენებები და ცნობები სექციებში, დასაშვებია ანალიტიკური ნიშნებით. ანუ სტრუქტურირებული ინფორმაცია შედის მონაცემთა ბაზაში. ეს სტრუქტურა გარკვეულწილად ჩამოყალიბებულია საცნობარო წიგნებით, კლასიფიკატორებით, პარამეტრებით და სტანდარტული დოკუმენტების ფორმებით, რომლებიც ურთიერთდაკავშირებულია. მონაცემთა ბაზაში არსებული ინფორმაციის მიხედვით, ე.წ. „დაჭრა“ იარაღებით „აშენდება“, „დახაზულია“, „აწყობილია“. ასეთ მონაცემებზე დაფუძნებული მოხსენებებისა და სერთიფიკატების მიღების შემდეგ, რომელსაც ხშირად ანალიტიკურს უწოდებენ, მენეჯმენტს შეუძლია გადაწყვეტილების მიღება. ეს არის ტიპიური კონცეფცია და ტიპიური ტექნოლოგია განსახილველი კლასის სისტემებთან მუშაობისთვის.



შემთხვევითი არ არის, რომ ასეთი „მართვის“ პროგრამული უზრუნველყოფა, რომელიც განსხვავდება ფუნქციონალური, სისტემური გადაწყვეტილებების, მიზნისა და გამოყენების თვალსაზრისით, როგორიცაა „Galaktika“, „BEST“ და „1C: Enterprise“, მსგავსია პრინციპების თვალსაზრისით. ინფორმაციის ორგანიზება, მისი ფორმირებისა და დამუშავების ტექნოლოგია, აგრეთვე სისტემებთან ურთიერთქმედების მეთოდები.

მიუხედავად ამისა, საწარმოებმა, მაგალითად, OAO Uralelektromed, წამოაყენეს ისეთი მკაცრი და მრავალფეროვანი მოთხოვნები კორპორატიული მართვის ინსტრუმენტებისთვის, რომ აუცილებელი ხდება მათი აშენება მრავალ დონის საფუძველზე. როგორც წესი, ბირთვი არის სისტემის ბირთვი, რომელიც შეიცავს მხოლოდ პროგრამის კოდებს. შემდეგი კონცეპტუალურად მნიშვნელოვანი ელემენტია სისტემის ჩაშენებული ხელსაწყოების ნაკრები, რომელიც საშუალებას იძლევა, პროგრამის კოდების შეცვლის გარეშე, მინიმუმ კონფიგურაცია მოახდინოს სამუშაო ადგილზე, განახორციელოს კონკრეტული ოპერაციები, შეიტანოს ახალი და შეცვალოს პირველადი და საანგარიშო დოკუმენტების არსებული ფორმები და გამოიყენეთ სხვა პარამეტრული პარამეტრები. უფრო განვითარებულ სისტემებს აქვთ ჩაშენებული ინსტრუმენტები სხვადასხვა საწარმოს მოდელების შესაქმნელად: საინფორმაციო, ორგანიზაციული, ფუნქციონალური და ა.შ. და ბოლოს, თავად მონაცემთა ბაზა.

ინფორმაციის ანალიტიკური დამუშავება

საწარმოს საქმიანობის დაგეგმვა, ოპერატიული ინფორმაციის მოპოვება და მისი ანალიზის საფუძველზე სწორი გადაწყვეტილების მიღება დაკავშირებულია დიდი მოცულობის მონაცემების დამუშავებასთან. საბუღალტრო კორპორატიული მართვის სისტემებში გენერირებული ანგარიშები, როგორც წესი, არ არის მოქნილი. მათი „დაგრეხვა“, „გაფართოვება“ ან „ჩამოქცევა“ შეუძლებელია მონაცემთა სასურველი წარმოდგენის მისაღებად, გრაფიკული წარმოდგენის ჩათვლით. რაც უფრო მეტი "დაჭრა" და "დაჭრა" შეგიძლიათ, მით უფრო რეალისტური წარმოიდგინეთ საწარმოს საქმიანობის სურათი და მიიღეთ საუკეთესო გადაწყვეტილება ბიზნეს პროცესების მართვაზე. ასეთი ამოცანები მოითხოვს მათემატიკურ და ეკონომიკურ მოდელირებას, ასევე მაღალ სიჩქარეს. ანალიტიკური მოდული ხელმისაწვდომია "RepCo" სისტემაში, უფრო ცნობილია "Triumph-Analytics" სისტემა (კორპორაცია "PARUS" - "Tora Center"). როგორც ჩანს, სააღრიცხვო სისტემები აშენებენ სერთიფიკატებს სხვადასხვა „სექციებში“ მონაცემთა ბაზაში შენახული ინფორმაციის მიხედვით, ისინი უბრალოდ წარმოადგენენ იმას, რაც არის. და ანალიტიკური სისტემები აშენებენ ახალ ინფორმაციას განსაზღვრული პარამეტრების ან კრიტერიუმების მიხედვით, ოპტიმიზაციას უკეთებენ მას კონკრეტული მიზნებისთვის. ამიტომ, ხშირად საჭიროა ინფორმაციის ნახვისა და ვიზუალიზაციის სპეციალური ინსტრუმენტი, რომელიც არის „ონლაინ მონაცემთა ანალიზი“ (OLAP - ონლაინ ანალიტიკური დამუშავება). ის უზრუნველყოფს მოსახერხებელი და სწრაფი ინსტრუმენტების კომპლექტს საცავში დაგროვილი ინფორმაციის წვდომის, ნახვისა და მრავალგანზომილებიანი ანალიზისთვის.

OLAP-ტექნოლოგიები გამოიყენება სიტუაციის მოდელირებისთვის სქემის მიხედვით „რა მოხდება, თუ…“, სხვადასხვა ანალიტიკური ანგარიშების შედგენისთვის. არსებობს სპეციალიზებული დასავლური პროგრამული პროდუქტები.

როგორც წესი, ინფორმაცია კორპორატიული მართვის სისტემებიდან გადადის ანალიტიკური მონაცემთა დამუშავების სპეციალიზებულ პროგრამებზე. ბევრი ადგილობრივი დეველოპერი ცდილობს ამ პრობლემების დამოუკიდებლად გადაჭრას, მაგალითად, კომპანიები Nikos-Soft (NS-2000 სისტემა), Cepheus (კორპორატიული მართვის სისტემა Etalon), COMSOFT (პროგრამულ-მეთოდური და ხელსაწყოების კომპლექსი COMSOFT-STANDARD "2.0) და სხვა.

6.4. კორპორატიული საინფორმაციო ტექნოლოგიების განვითარებისა და გამოყენების პერსპექტივები

გარდა თანამედროვე ხელსაწყოებისა და პლატფორმების, ასევე სისტემური ხელსაწყოების შემუშავებისა და გამოყენებისა, შიდა კორპორატიული სისტემების განვითარება მოიცავს მათ ფუნქციურ გაჯერებას, განსაკუთრებით წარმოების თვალსაზრისით.

მენეჯმენტის სტანდარტების დანერგვისადმი ფართო ენთუზიაზმის მიუხედავად, შიდა პროგრამული უზრუნველყოფის ბაზრის წამყვანი მოთამაშეები ავითარებენ ინდუსტრიულ გადაწყვეტილებებს სხვადასხვა ტიპის ინდუსტრიებისთვის.

მცირდება ფირმების შიში, გახსნან თავიანთი განვითარების „კონფიდენციალურობა“, რაც ხელს უწყობს მათი პროდუქციის ინტეგრაციის მცდელობების კონსოლიდაციას, ვიდრე ყველაფრის დამოუკიდებლად განვითარებას „ა“-დან „ზ“-მდე. დღეს არავის აქვს საკმარისი რესურსი. წლები სჭირდება ახალი კონცეფციის გააზრებას, პროექტის და სისტემის შემუშავებას, კერძოდ, სისტემას, რომელიც ცვლის თავის ხარისხს იმისდა მიხედვით, თუ რას შეიცავს. გარდა ამისა, პროგრამული პროდუქტების ინტეგრირების მოთხოვნას აყენებენ საწარმოებიც, რომლებსაც სურთ „მუშაობის“ შენარჩუნება, როგორც წესი, სპეციალიზებული სისტემები და ინფორმაციულად დააკავშირონ ისინი ახლად შეძენილთან.

ინტეგრაცია ასევე საჭიროა სხვადასხვა მწარმოებლის პროდუქტებისთვის - კომპლექსური გადაწყვეტილებების სპეციალიზებულთან შერწყმის სახელით:

– ბიუჯეტირება, ფინანსური და ეკონომიკური ანალიზი, მომხმარებლის მომსახურება, ანალიტიკური მონაცემთა დამუშავება და ა.შ.

უნდა აღინიშნოს, რომ ეს არ არის თავად კონტროლის სისტემები, რომლებიც უფრო პერსპექტიულია, არამედ მათი შექმნის მარტივი და უნივერსალური ინსტრუმენტი, რომელიც განკუთვნილია კვალიფიციური შუამავლებისთვის დეველოპერსა და საბოლოო მომხმარებელს შორის. ახლა სისტემის ადმინისტრატორები და ანალიტიკოსები ცდილობენ შეასრულონ ეს ფუნქციები.

თუ ასეთი ინსტრუმენტი ხელმისაწვდომია, მოთხოვნადი იქნება ყველა ინდუსტრიის ყველა საწარმოსთვის "მზა" სტანდარტული გადაწყვეტილებები.

ინტერნეტი, როგორც დამატებითი ინსტრუმენტი ბიზნესის განვითარებისთვის, ეფექტურია მხოლოდ იმ შემთხვევაში, თუ არსებობს მართვის ინტეგრირებული სისტემა.

მიუხედავად იმისა, რომ თანამედროვე საინფორმაციო და საკომუნიკაციო ტექნოლოგიები, მათ შორის ინტერნეტი, შესაძლებელს ხდის პროგრამული უზრუნველყოფის გაქირავების ორგანიზებას, ნაადრევია საუბარი ასეთი შესაძლებლობების მოკლევადიან გამოყენებაზე, განსაკუთრებით ჩვენს ქვეყანაში. და არა იმდენად კონფიდენციალურობის გამო, არამედ წესრიგისა და კომუნიკაციის საიმედო საშუალებების ნაკლებობის გამო.

შიდა საწარმოებში ინფორმაციული ტექნოლოგიების გამოცდილების, თუნდაც არა სრულად, გამოცდილების დანერგვისა და გამოყენების მცდელობამ პრაქტიკაში დაამტკიცა, რომ „ქაოსის ავტომატიზაცია შეუძლებელია“. აუცილებელია ბიზნესისა და თავად საწარმოს წინასწარი რეორგანიზაცია, ასევე მენეჯმენტის რეგულაციების (ინსტრუქციების) მშენებლობა. საწარმოს თანამშრომლებს უჭირთ დამოუკიდებლად გაუმკლავდნენ ასეთ სამუშაოს. განსაკუთრებით ბაზრის პირობებში დროის ფაქტორის გათვალისწინებით. აქედან გამომდინარე, ყველგან ვითარდება საკონსულტაციო კომპანიებთან ურთიერთობის პრაქტიკა, რომელიც ეხმარება საწარმოებს და ასწავლის მათ თანამშრომლებს „გაფართოვდეს ბოსტნეულები“, ჩამოაყალიბონ ძირითადი ბიზნეს პროცესი, განავითარონ ტექნოლოგიები, შექმნან საინფორმაციო ნაკადები და ა.შ. დადგენილი პროცესის ავტომატიზაცია უფრო მარტივი, მარტივი, იაფი, სწრაფია.

ყველამ თავისი საქმე უნდა აკეთოს. ბუღალტერმა, მაღაზიის მეპატრონემ, გაყიდვების მენეჯერმა და სხვა „საგნის“ სპეციალისტებმა არ უნდა გააუმჯობესონ დოკუმენტის ფორმები, არ უნდა გაანაწილონ სვეტები ან შეცვალონ მათი ადგილები კანონმდებლობის ან ბიზნეს შაბლონების ცვლილების გამო. ამიტომ, პროგრამული უზრუნველყოფის ბაზარი თანდათან „სასურსათოდან“ „მომსახურების“ ბაზარზე გადადის. იწყებს განვითარებას აუთსორსინგი - საწარმოს ზოგიერთი ფუნქციის გადაცემა ჩართული კომპანიების სპეციალისტებზე. ისინი ეწევიან აღჭურვილობის მოვლას, სისტემურ პროგრამულ უზრუნველყოფას, სისტემების გამოყენებული (ფუნქციონალური) ნაწილის მოდიფიკაციას და ა.შ.

კორპორატიული მართვის სისტემების გამოყენებისას ყველაზე მნიშვნელოვანი და აქტუალურია საინფორმაციო ტექნოლოგიები და მეთოდოლოგიური მომსახურება მათი მომხმარებლებისა და მომხმარებლებისთვის.

8.3.1. On-Line ანალიტიკური დამუშავების (OLAP) ინსტრუმენტები

On-Line ანალიტიკური დამუშავება - ინფორმაციის ოპერატიული (რეალურ დროში) ანალიტიკური დამუშავების საშუალება, რომელიც მიზნად ისახავს გადაწყვეტილების მხარდაჭერას და ეხმარება ანალიტიკოსებს უპასუხონ კითხვას "რატომ არის ობიექტები, გარემო და მათი ურთიერთქმედების შედეგები ასეთი და არა სხვა?". ამავდროულად, ანალიტიკოსი თავად აყალიბებს ინფორმაციის ერთობლიობას შორის ურთიერთობის ვერსიებს და ამოწმებს მათ შესაბამისი სტრუქტურირებული ინფორმაციის მონაცემთა ბაზებში არსებული მონაცემების საფუძველზე.

ERP სისტემები ხასიათდება ანალიტიკური კომპონენტების არსებობით, როგორც ფუნქციური ქვესისტემების ნაწილი. ისინი უზრუნველყოფენ ანალიტიკური ინფორმაციის ფორმირებას რეალურ დროში. ეს ინფორმაცია არის მენეჯმენტის გადაწყვეტილებების უმეტესობის საფუძველი.

OLAP ტექნოლოგიები იყენებენ ჰიპერკუბებს - სპეციალურად სტრუქტურირებულ მონაცემებს (სხვაგვარად უწოდებენ OLAP კუბებს). ჰიპერკუბის მონაცემთა სტრუქტურაში არის:

ღონისძიებები - რაოდენობრივი ინდიკატორები (დეტალები-ბაზები), რომლებიც გამოიყენება შემაჯამებელი სტატისტიკური შედეგების ფორმირებისთვის;

განზომილებები - აღწერითი კატეგორიები (დეტალები-მახასიათებლები), რომლის კონტექსტში გაანალიზებულია ზომები.

ჰიპერკუბის განზომილება განისაზღვრება ერთი ზომის განზომილებების რაოდენობით. მაგალითად, SALES ჰიპერკუბი შეიცავს მონაცემებს:

გაზომვები: მომხმარებლები, ოპერაციების თარიღები, საქონლის ჯგუფები, ნომენკლატურა, მოდიფიკაციები, შეფუთვა, საწყობები, გადახდის სახეები, გადაზიდვის სახეები, ტარიფები, ვალუტა, ორგანიზაციები, განყოფილებები, პასუხისმგებელი, სადისტრიბუციო არხები, რეგიონები, ქალაქები;

ზომები: დაგეგმილი რაოდენობა, ფაქტობრივი რაოდენობა, დაგეგმილი თანხა, ფაქტობრივი თანხა, დაგეგმილი გადახდები, ფაქტობრივი გადახდები, დაგეგმილი ბალანსი, ფაქტობრივი ბალანსი, გაყიდვის ფასი, შეკვეთის შესრულების დრო, თანხის დაბრუნების თანხა.

ასეთი ჰიპერკუბი განკუთვნილია ანალიტიკური მოხსენებებისთვის:

მომხმარებელთა კლასიფიკაცია შესყიდვების მოცულობის მიხედვით;

გაყიდული საქონლის კლასიფიკაცია ABC მეთოდის მიხედვით;

სხვადასხვა მომხმარებლის შეკვეთების შესრულების ვადების ანალიზი;

გაყიდვების მოცულობის ანალიზი პერიოდების, პროდუქტებისა და პროდუქტების ჯგუფების, რეგიონებისა და მომხმარებლების, შიდა განყოფილებების, მენეჯერებისა და განაწილების არხების მიხედვით;

მომხმარებლებთან ორმხრივი ანგარიშსწორების პროგნოზი;

მომხმარებლებისგან საქონლის დაბრუნების ანალიზი; და ა.შ.

ანალიტიკურ ანგარიშებს შეიძლება ჰქონდეს განზომილებებისა და ზომების თვითნებური კომბინაცია; ისინი გამოიყენება მენეჯმენტის გადაწყვეტილებების გასაანალიზებლად. ანალიტიკური დამუშავება ხორციელდება ინსტრუმენტული და ენობრივი საშუალებებით. საინფორმაციო ტექნოლოგიები "Pivot Tables" წარმოდგენილია MS Excel-ის საჯარო ცხრილებში, მათი შექმნის საწყისი მონაცემებია:

სია (მონაცემთა ბაზა) MS Excel - ურთიერთობითი ცხრილი;

კიდევ ერთი MS Excel PivotTable;

MS Excel უჯრედების გაერთიანებული დიაპაზონი, რომლებიც განთავსებულია იმავე ან სხვადასხვა სამუშაო წიგნებში;

გარე რელაციური მონაცემთა ბაზა ან OLAP კუბი, მონაცემთა წყარო (.dsn, .ode ფორმატის ფაილები).

გარე მონაცემთა ბაზებზე დაფუძნებული საყრდენი ცხრილების შესაქმნელად გამოიყენება ODBC დრაივერები, ასევე MS Query პროგრამა. წყაროს MS Excel მონაცემთა ბაზის კრებსითი ცხრილი აქვს შემდეგი სტრუქტურა (ნახ. 8.3).

საყრდენი ცხრილის განლაგებას აქვს შემდეგი მონაცემთა სტრუქტურა (ნახ. 8.4): ზომები - განყოფილების კოდი, პოზიცია; ზომები - სტაჟი, ხელფასი და პრემია. ქვემოთ მოცემულია შემაჯამებელი ცხრილი. 8.2, რომელიც საშუალებას გაძლევთ გაანალიზოთ ურთიერთობა საშუალო სამუშაო გამოცდილებასა და ხელფასს, საშუალო სამუშაო გამოცდილებასა და პრემიებს, ხელფასსა და პრემიებს შორის.

ცხრილი 8.2

საყრდენი ცხრილი ბმულის ანალიზისთვის

მაგიდის დასასრული. 8.2

ანალიზის გასაგრძელებლად კრებსითი ცხრილის გამოყენებით, შეგიძლიათ:

დაამატეთ ახალი ჯამები (მაგალითად, საშუალო ხელფასი, საშუალო ბონუს თანხა და ა.შ.);

გამოიყენეთ კრებსითი ცხრილის ჩანაწერებისა და ჯამების ფილტრაცია (მაგალითად, "სქესის" საფუძველზე, რომელიც განთავსებულია განლაგებაში ზონაში * გვერდი ");

სტრუქტურული ინდიკატორების გამოთვლა (მაგალითად, სახელფასო სახსრებისა და ბონუს ფონდის განაწილება დეპარტამენტების მიხედვით - დამატებითი დამუშავების ხელსაწყოების გამოყენებით კრებსითი ცხრილებისთვის, თანხის წილი სვეტების მიხედვით); და ა.შ.

MS Office პროგრამების კომპლექტი საშუალებას გაძლევთ გამოაქვეყნოთ ცხრილების მონაცემები, კრებსითი ცხრილებისა და სქემების ჩათვლით, XTML ფორმატში.

Microsoft Office Web Components მხარს უჭერს გამოქვეყნებულ მონაცემებთან მუშაობას Internet Explorer-ის გარემოში, უწყვეტი ანალიზის უზრუნველსაყოფად (ცვლილებები კრებსითი ცხრილის მონაცემთა სტრუქტურაში, ახალი შემაჯამებელი ჯამების გამოთვლა).

8.3.2. მონაცემთა მოპოვების (DM) ინსტრუმენტები

DM ინსტრუმენტები მოიცავს მონაცემების მოპოვებას („თხრა“, „მაინინგი“) და მიზნად ისახავს საწარმოს ციფრულ მონაცემთა ბაზებში შენახულ ინფორმაციას შორის ურთიერთობის იდენტიფიცირებას, რომელიც ანალიტიკოსს შეუძლია გამოიყენოს მოდელების შესაქმნელად, რომლებიც საშუალებას აძლევს მას განსაზღვროს ფაქტორების გავლენის ხარისხი. ინტერესი მისთვის. გარდა ამისა, ასეთი ინსტრუმენტები შეიძლება სასარგებლო იყოს ციფრული საწარმოთა მონაცემთა ბაზებში ინფორმაციული ურთიერთობების შესაძლო ბუნების შესახებ ჰიპოთეზების შესაქმნელად.

ტექსტის მოპოვება (TM) ტექნოლოგია არის ინსტრუმენტების ნაკრები, რომელიც საშუალებას გაძლევთ გაანალიზოთ ინფორმაციის დიდი ნაკრები ტენდენციების, შაბლონებისა და ურთიერთობების ძიებაში, რაც დაგეხმარებათ სტრატეგიული გადაწყვეტილებების მიღებაში.

Image Mining (IM) ტექნოლოგია შეიცავს საწარმოთა მონაცემთა ბაზებში შენახული ან გარე ინფორმაციის წყაროებიდან ონლაინ ძიების შედეგად მიღებული სხვადასხვა ვიზუალური სურათების ამოცნობისა და კლასიფიკაციის ინსტრუმენტებს.

ყველა მონაცემის დამუშავებისა და შენახვის პრობლემების გადასაჭრელად გამოიყენება შემდეგი მიდგომები:

1) რამდენიმე სარეზერვო სისტემის შექმნა ან ერთი განაწილებული სამუშაო პროცესის სისტემა, რომელიც საშუალებას გაძლევთ შეინახოთ მონაცემები, მაგრამ გქონდეთ ნელი წვდომა შენახულ ინფორმაციაზე მომხმარებლის მოთხოვნით;

2) უაღრესად მოქნილი, მაგრამ არ არის ადაპტირებული ტექსტური დოკუმენტების ძიებისა და შენახვის განხორციელებასთან დაკავშირებული ინტერნეტ სისტემების შექმნა;

3) ინტერნეტ პორტალების დანერგვა, რომლებიც კარგად არის ორიენტირებული მომხმარებლის მოთხოვნებზე, მაგრამ არ გააჩნიათ აღწერილობითი ინფორმაცია მათში ჩატვირთული ტექსტური მონაცემების შესახებ.

ტექსტის ინფორმაციის დამუშავების სისტემები, რომლებიც თავისუფალია ზემოთ ჩამოთვლილი პრობლემებისგან, შეიძლება დაიყოს ორ კატეგორიად: ლინგვისტური ანალიზის სისტემები და ტექსტის მონაცემთა ანალიზის სისტემები.

ტექსტის მოპოვების ტექნოლოგიის ძირითადი ელემენტებია:

შეჯამება;

თემატური ძიება (მხატვრული მოპოვება);

კლასტერირება;

კლასიფიკაცია (კლასიფიკაცია);

თხოვნებზე პასუხის გაცემა (კითხვის პასუხის გაცემა);

თემატური ინდექსირება;

ძიება საკვანძო სიტყვებით (საკვანძო სიტყვების ძიება);

ოფტაქსონომიის (ოფტაქსონომიების) და თეზაურის (თეზაური) შექმნა და შენარჩუნება.

პროგრამული პროდუქტები, რომლებიც ახორციელებენ ტექსტის მოპოვების ტექნოლოგიას, მოიცავს:

IBM Intelligent Miner for Text - ცალკეული კომუნალური პროგრამების ნაკრები, რომელიც გაშვებულია ბრძანების ხაზიდან ან სკრიპტებიდან; ერთმანეთისგან დამოუკიდებლად (მთავარი აქცენტი კეთდება მონაცემთა მოპოვების მექანიზმებზე – ინფორმაციის მოძიებაზე);

Oracle InterMedia Text - კომპლექტი ინტეგრირებული DBMS-ში, რომელიც საშუალებას გაძლევთ ყველაზე ეფექტურად იმუშაოთ მომხმარებლის მოთხოვნებთან (საშუალებას გაძლევთ იმუშაოთ თანამედროვე რელაციურ DBMS-თან რთული მრავალფუნქციური ძიების და ტექსტური მონაცემების ანალიზის კონტექსტში);

Megaputer Text Analyst არის COM პროგრამაში ჩაშენებული ობიექტების ნაკრები, რომელიც შექმნილია ტექსტის მოპოვების პრობლემების გადასაჭრელად.

8.3.3. ინტელექტუალური საინფორმაციო ტექნოლოგიები

დღეს, მენეჯმენტის ავტომატიზაციის სფეროში, ინფორმაციის ანალიზი დომინირებს გადაწყვეტილების მომზადების წინასწარ ეტაპზე - პირველადი ინფორმაციის დამუშავება, პრობლემური სიტუაციის დაშლა, რაც შესაძლებელს ხდის მხოლოდ პროცესების ფრაგმენტებისა და დეტალების სწავლას და არა სიტუაციის, როგორც მთლიანი. ამ ხარვეზის დასაძლევად აუცილებელია ვისწავლოთ თუ როგორ უნდა ავაშენოთ ცოდნის ბაზები საუკეთესო სპეციალისტების გამოცდილების გამოყენებით, ასევე გამომუშავებული ცოდნის გამომუშავება.

საინფორმაციო ტექნოლოგიების გამოყენება ადამიანის საქმიანობის სხვადასხვა სფეროში, ინფორმაციის მოცულობის ექსპონენციალური ზრდა და ნებისმიერ სიტუაციაში სწრაფი რეაგირების აუცილებლობა მოითხოვდა წარმოშობილი პრობლემების გადაჭრის ადეკვატური გზების ძიებას. მათგან ყველაზე ეფექტური საინფორმაციო ტექნოლოგიების ინტელექტუალიზაციის გზაა.

ქვეშ ინტელექტუალური საინფორმაციო ტექნოლოგიები(ITT) ჩვეულებრივ ესმის ისეთ საინფორმაციო ტექნოლოგიებს, რომლებიც უზრუნველყოფენ შემდეგ მახასიათებლებს:

ცოდნის ბაზების არსებობა, რომელიც ასახავს კონკრეტული ადამიანების, ჯგუფების, საზოგადოებების, მთლიანად კაცობრიობის გამოცდილებას, საქმიანობის გარკვეულ სფეროებში შემოქმედებითი პრობლემების გადაჭრისას, ტრადიციულად განიხილება ადამიანის ინტელექტის პრეროგატივად (მაგალითად, ისეთი ცუდად ფორმალიზებული ამოცანები, როგორიცაა გადაწყვეტილება. დამზადება, დიზაინი, მნიშვნელობის ამოღება, ახსნა, სწავლება და ა.შ.);

ცოდნის საფუძვლებზე დაფუძნებული აზროვნების მოდელების არსებობა: წესები და ლოგიკური დასკვნები, არგუმენტირება და მსჯელობა, სიტუაციების ამოცნობა და კლასიფიკაცია, განზოგადება და გაგება და ა.შ.;

ბუნდოვან, არამკაცრ, არასრულ, განუსაზღვრელ მონაცემებზე დაფუძნებული საკმაოდ მკაფიო გადაწყვეტილებების ჩამოყალიბების უნარი;

დასკვნებისა და გადაწყვეტილებების ახსნის უნარი, ე.ი. ახსნის მექანიზმის არსებობა;

სწავლის, გადამზადების და, შესაბამისად, განვითარების უნარი.

მონაცემთა და ინფორმაციის ფარული შაბლონების არაფორმალიზებული ძიების ტექნოლოგიები ცოდნის აღმოჩენა (KD) ეფუძნება უახლეს ტექნოლოგიებს ობიექტების საინფორმაციო გამოსახულების ფორმირებისა და სტრუქტურისთვის, რაც ყველაზე ახლოს არის ინტელექტუალური სისტემების მიერ ინფორმაციის დამუშავების პრინციპებთან.

გადაწყვეტილების მხარდაჭერის (DS) გადაწყვეტილების მხარდაჭერის საინფორმაციო ტექნოლოგიები ექსპერტის ჭურვია

სისტემები ან სპეციალიზებული საექსპერტო სისტემები, რომლებიც ანალიტიკოსებს საშუალებას აძლევს განსაზღვრონ საწარმოს სტრუქტურირებულ საინფორმაციო ბაზებში საინფორმაციო სტრუქტურებს შორის კავშირები და ურთიერთობები, ასევე იწინასწარმეტყველონ გადაწყვეტილების მიღების შესაძლო შედეგები.

IIT განვითარების ტენდენციები. კომუნიკაციისა და კომუნიკაციების სისტემები.გლობალურ საინფორმაციო ქსელებს და IIT-ს შეუძლია ფუნდამენტურად შეცვალოს ჩვენი აზროვნება კომპანიებზე და თავად ცოდნის მუშაობაზე. სამუშაო ადგილზე თანამშრომლების ყოფნა თითქმის არასაჭირო გახდება. ადამიანებს შეუძლიათ სახლიდან იმუშაონ და საჭიროების შემთხვევაში დაუკავშირდნენ ერთმანეთს ქსელების საშუალებით. ცნობილია, მაგალითად, წარმატებული გამოცდილება Boeing 747 თვითმფრინავის ახალი მოდიფიკაციის შექმნის შესახებ, სპეციალისტთა განაწილებული გუნდის მიერ, რომლებიც ურთიერთობენ ინტერნეტით. ნებისმიერ განვითარებაში მონაწილეთა მდებარეობა სულ უფრო მცირე როლს შეასრულებს, მაგრამ მონაწილეთა უნარების დონის მნიშვნელობა გაიზრდება. კიდევ ერთი მიზეზი, რამაც განსაზღვრა IIT-ის სწრაფი განვითარება, უკავშირდება საკომუნიკაციო სისტემების გართულებას და მათ საფუძველზე გადაწყვეტილ ამოცანებს. საჭირო იყო ისეთი პროგრამული პროდუქტების „ინტელექტუალიზაციის“ თვისობრივად ახალი დონე, როგორიცაა ჰეტეროგენული და არა მკაცრი მონაცემების ანალიზის სისტემები, ინფორმაციის უსაფრთხოების უზრუნველყოფა, განაწილებულ სისტემებში გადაწყვეტილებების შემუშავება და ა.შ.

Განათლება. უკვე დღეს დისტანციური სწავლება იწყებს მნიშვნელოვანი როლის შესრულებას განათლებაში და IIT-ის დანერგვა მნიშვნელოვნად მოახდენს ამ პროცესის ინდივიდუალიზაციას თითოეული მოსწავლის საჭიროებებისა და შესაძლებლობების შესაბამისად.

ცხოვრება. ყოველდღიური ცხოვრების ინფორმატიზაცია უკვე დაწყებულია, მაგრამ IIT-ის განვითარებასთან ერთად ფუნდამენტურად ახალი შესაძლებლობები გამოჩნდება. თანდათან უფრო და უფრო მეტი ახალი ფუნქცია გადაეცემა კომპიუტერს: მომხმარებლის ჯანმრთელობაზე კონტროლი, საყოფაცხოვრებო ტექნიკის კონტროლი, როგორიცაა დამატენიანებლები, ჰაერის გამაგრილებელი, გამათბობლები, იონიზატორები, მუსიკალური ცენტრები, სამედიცინო დიაგნოსტიკა და ა.შ. სხვა სიტყვებით რომ ვთქვათ, სისტემები ასევე გახდებიან ადამიანისა და მისი სახლის მდგომარეობის დიაგნოსტიკი. შენობაში მოეწყობა კომფორტული საინფორმაციო სივრცე, სადაც საინფორმაციო გარემო გახდება ადამიანის გარემოს ნაწილი.

IIT-ის განვითარების პერსპექტივები. როგორც ჩანს, ამჟამად IIT მიუახლოვდა განვითარების ფუნდამენტურად ახალ ეტაპს. ასე რომ, ბოლო 10 წლის განმავლობაში, IIT-ის შესაძლებლობები მნიშვნელოვნად გაფართოვდა ახალი ტიპის ლოგიკური მოდელების შემუშავების, ახალის გაჩენის გამო.

vyh თეორიები და იდეები. IIT-ის განვითარების ძირითადი პუნქტებია:

ლოგიკური დასკვნისგან გადასვლა არგუმენტაციისა და მსჯელობის მოდელებზე;

შესაბამისი ცოდნის ძიება და განმარტებების გენერირება;

ტექსტების გააზრება და სინთეზი;

შემეცნებითი გრაფიკა, ე.ი. ცოდნის გრაფიკული და ფიგურალური წარმოდგენა;

მრავალ აგენტური სისტემები;

ინტელექტუალური ქსელის მოდელები;

გამოთვლები დაფუძნებული ფაზურ ლოგიკაზე, ნერვულ ქსელებზე, გენეტიკურ ალგორითმებზე, ალბათურ გამოთვლებზე (განხორციელებული სხვადასხვა კომბინაციით ერთმანეთთან და საექსპერტო სისტემებთან);

მეტა ცოდნის პრობლემა.

მრავალ აგენტური სისტემები გახდა ახალი პარადიგმა პერსპექტიული IIT-ების შესაქმნელად. აქ ვარაუდობენ, რომ აგენტი არის დამოუკიდებელი ინტელექტუალური სისტემა, რომელსაც აქვს მიზნების დასახვისა და მოტივაციის საკუთარი სისტემა, საკუთარი მოქმედების სფერო და პასუხისმგებლობა. აგენტებს შორის ურთიერთქმედება უზრუნველყოფილია უმაღლესი დონის სისტემით - მეტა-ინტელიგენცია. მრავალ აგენტურ სისტემებში მოდელირებულია ინტელექტუალური აგენტების ვირტუალური საზოგადოება - ობიექტები, რომლებიც არიან ავტონომიური, აქტიური, შედიან სხვადასხვა სოციალურ ურთიერთობებში - თანამშრომლობა და თანამშრომლობა (მეგობრობა), კონკურენცია, კონკურენცია, მტრობა და ა.შ. თანამედროვე პრობლემების გადაჭრის სოციალური ასპექტი არის მოწინავე ინტელექტუალური ტექნოლოგიების - ვირტუალური ორგანიზაციების, ვირტუალური საზოგადოების კონცეპტუალური სიახლის ფუნდამენტური მახასიათებელი.

(?) აკონტროლეთ კითხვები და ამოცანები

1. მიეცით საწარმოს, როგორც ინფორმატიზაციის ობიექტის აღწერა. რა არის ძირითადი ინდიკატორები, რომლებიც ახასიათებს საწარმოს მართვის სისტემის განვითარებას.

2. ჩამოთვალეთ სამრეწველო საწარმოების მართვის წამყვანი საინფორმაციო ტექნოლოგიები.

3. დაასახელეთ საწარმოების (კორპორაციების) ორგანიზაციული და სტრატეგიული განვითარების ძირითადი საინფორმაციო ტექნოლოგიები.

4. რა არის სტრატეგიული მენეჯმენტის სტანდარტების საფუძვლები, რომლებიც მიმართულია ბიზნეს პროცესების გაუმჯობესებაზე? როგორია ინფორმაციული ტექნოლოგიების BPM და BPI თანაფარდობა?

5. განსაზღვრეთ ტოტალური ხარისხის მართვის (TQM) ფილოსოფია. როგორ არის დაკავშირებული ხარისხის განვითარებისა და საინფორმაციო ტექნოლოგიების ფაზები?

6. დაასახელეთ საწარმოს ორგანიზაციული განვითარების ძირითადი დებულებები, აღწერეთ სტრატეგიული მენეჯმენტის ეტაპები. დაასახელეთ ჯგუფის სტრატეგიები.

7. როგორ იქმნება საწარმოს ბიზნეს მოდელი? რა არის ძირითადი მიდგომები ბიზნეს მოდელის ეფექტურობის შესაფასებლად.

8. რა არის დაბალანსებული ქულა? დაასახელეთ SSP-ის ძირითადი კომპონენტები. რა კავშირებია BSC ინდიკატორების ჯგუფებს შორის?

9. ჩამოთვალეთ საინფორმაციო სისტემების შექმნის მეთოდოლოგიური საფუძვლები. რა არის სისტემური მიდგომა?

10. როგორია ინფორმაციული მიდგომა საინფორმაციო სისტემებისა და ტექნოლოგიების ფორმირების მიმართ?

11. როგორია სტრატეგიული მიდგომა საინფორმაციო სისტემებისა და ტექნოლოგიების ფორმირებაში?

12. რა შინაარსი აქვს ობიექტზე ორიენტირებული მიდგომას ბაზარზე აგენტების ქცევის აღწერისას? მიეცით ობიექტის განმარტება, მიუთითეთ აგენტური სისტემების ანალოგები.

13. როგორია საინფორმაციო და საკომუნიკაციო ტექნოლოგიებზე დაფუძნებული საწარმოს მენეჯმენტის გაუმჯობესების მეთოდოლოგიური პრინციპები? რა არის ისტ-ის მიზანი?

14. მიეცით დოკუმენტის, დოკუმენტის მიმდინარეობის, სამუშაო პროცესის, დოკუმენტების მართვის სისტემის განმარტებები.

15. როგორ არის შექმნილი დოკუმენტის ფორმის განლაგება? დაასახელეთ დოკუმენტის ზონები, მათი დეტალების შემადგენლობა.

16. დაასახელეთ დოკუმენტაციის მართვის სისტემის ძირითადი საინფორმაციო ტექნოლოგიები.

17. რა არის ერთიანი დოკუმენტაციის სისტემა? რა არის გაერთიანების ზოგადი პრინციპები?

18. აღწერეთ ორგანიზაციული და ადმინისტრაციული დოკუმენტაცია, მოიყვანეთ დოკუმენტების მაგალითები.

19. რა მოთხოვნებს უნდა აკმაყოფილებდეს ელექტრონული დოკუმენტების მართვის სისტემა?

20. რა არის კორპორატიული საინფორმაციო სისტემა? დაასახელეთ ძირითადი საკონტროლო მარყუჟები, ფუნქციური მოდულების შემადგენლობა.

21. დაასახელეთ თქვენთვის ცნობილი დსთ-ს პროგრამული პროდუქტები. მიეცით მათ შედარებითი აღწერა.

შ ლიტერატურა

1. Vernet J., Moriarty S. მარკეტინგული კომუნიკაციები. Კომპლექსური მიდგომა. პეტერბურგი; ხარკოვი: პეტრე, 2001 წ.

2. ბრუკინგი ე. ინტელექტუალური კაპიტალი. წარმატების გასაღები ახალ ათასწლეულში. პეტერბურგი: პეტრე, 2001 წ.

3. გოდინი V.V., Korpev I.K. საინფორმაციო რესურსების მართვა. M.: INFRA-M, 1999 წ.

4. საინფორმაციო სისტემები და ტექნოლოგიები ეკონომიკაში: სახელმძღვანელო. მე-2 გამოცემა, დაამატეთ. და გადამუშავდა. / მ.ი. სემენოვი, ი.ტ. ტრუბილინი, ვ.ი. ლოიკო, თ.პ. ბარანოვსკაია; რედ. ში და. ლოიკო. მ.: ფინანსები და სტატისტიკა, 2003 წ.

5. საინფორმაციო ტექნოლოგიები ბიზნესში / რედ. მ.ჟელენი. პეტერბურგი: პეტრე, 2002 წ.

6. კაპლან რობერტ ს., ნორტონ დევიდ პ. დაბალანსებული ანგარიში. სტრატეგიიდან მოქმედებამდე / პერ. ინგლისურიდან. მ.: სს "ოლიმპი-ბიზნესი", 2003 წ.

7. Karagodin V.I., Karagodina BJI. ინფორმაცია არის ცხოვრების საფუძველი. დუბნა: ფენიქსი, 2000 წ.

8. კარმინსკი AM., Nesterov PZ. ბიზნეს ინფორმატიზაცია. მ.: ფინანსები და სტატისტიკა, 1997 წ.

9. ლიხაჩევა თ.ნ. საინფორმაციო ტექნოლოგიები საინფორმაციო საზოგადოების სამსახურში // ახალი საინფორმაციო ტექნოლოგიები ეკონომიკურ სისტემებში. მ., 1999 წ.

10. ოსტრეიკოვსკი ვ.ა. სისტემების თეორია. მოსკოვი: უმაღლესი სკოლა, 1997 წ.

11. პიტერკინი ს.ვ., ოლადოვი ნ.ა., ისაევი დ.ვ. ზუსტად რუსეთისთვის. ERP სისტემების გამოყენების პრაქტიკა. მე-2 გამოცემა. მოსკოვი: ალპინა გამომცემელი, 2003 წ.

12. სოკოლოვი დ.ვ. სოციალური კომუნიკაციის თეორიის შესავალი: პროკ. შემწეობა. პეტერბურგი: გამომცემლობა SP6GUP, 1996 წ.

13. ტროფიმოვი ვ.ზ., ტომილოვი ვ.ზ. საინფორმაციო და საკომუნიკაციო ტექნოლოგიები მენეჯმენტში: პროკ. შემწეობა. პეტერბურგი: SPbGUEF, 2002 წ.

ტექნიკისა და პროგრამული უზრუნველყოფის განვითარების ამჟამინდელმა დონემ უკვე გარკვეული დროა შესაძლებელი გახადა ოპერატიული ინფორმაციის მონაცემთა ბაზების შენარჩუნება მენეჯმენტის სხვადასხვა დონეზე. სამრეწველო საწარმოებმა, კორპორაციებმა, უწყებრივი სტრუქტურებმა, საჯარო ხელისუფლებამ და ადმინისტრაციამ თავიანთი საქმიანობის განმავლობაში დიდი რაოდენობით მონაცემები დააგროვეს. ისინი შეიცავს სასარგებლო ანალიტიკური ინფორმაციის მოპოვების დიდ პოტენციალს, რომლის საფუძველზეც შეგიძლიათ ფარული ტენდენციების იდენტიფიცირება, განვითარების სტრატეგიის შექმნა და ახალი გადაწყვეტილებების პოვნა.

ბოლო წლებში მსოფლიოში ჩამოყალიბდა კორპორატიული მონაცემების შენახვისა და ანალიზის არაერთი ახალი კონცეფცია:

1) მონაცემთა საწყობები, ან მონაცემთა საწყობები (მონაცემთა საწყობი)

2) ონლაინ ანალიტიკური დამუშავება (On-Line Analytical Processing, OLAP)

3) მონაცემთა მოპოვება - IAD (Data Mining)

OLAP ანალიტიკური მონაცემთა დამუშავების სისტემები არის გადაწყვეტილების მხარდაჭერის სისტემები, რომლებიც ორიენტირებულია უფრო რთული მოთხოვნების შესრულებაზე, რომლებიც საჭიროებენ გარკვეული პერიოდის განმავლობაში დაგროვილი ისტორიული მონაცემების სტატისტიკურ დამუშავებას. ისინი ემსახურებიან გაყიდვების შესახებ ბიზნეს ანგარიშების მომზადებას, მარკეტინგის მენეჯმენტის მიზნებისთვის, ე.წ. Data Mining - მონაცემთა მაინინგს, ე.ი. მონაცემთა ბაზაში ინფორმაციის ანალიზის გზა ანომალიებისა და ტენდენციების მოსაძებნად ჩანაწერების სემანტიკური მნიშვნელობის გაცნობის გარეშე.

OLAP-ის ბაზაზე აგებული ანალიტიკური სისტემები მოიცავს ინფორმაციის დამუშავების ინსტრუმენტებს ხელოვნური ინტელექტის მეთოდებზე და მონაცემთა გრაფიკული წარმოდგენის ინსტრუმენტებზე. ეს სისტემები განისაზღვრება დიდი რაოდენობით ისტორიული მონაცემებით, რაც საშუალებას გაძლევთ მიიღოთ მნიშვნელოვანი ინფორმაცია მათგან, ე.ი. მიიღეთ ცოდნა მონაცემებიდან.

დამუშავების ეფექტურობა მიიღწევა მძლავრი მულტიპროცესორული ტექნოლოგიის, ანალიზის რთული მეთოდების, მონაცემთა სპეციალიზებული შენახვის საშუალებით.

რელატიური მონაცემთა ბაზები ინახავს ერთეულებს ცალკეულ ცხრილებში, რომლებიც ჩვეულებრივ კარგად არის ნორმალიზებული. ეს სტრუქტურა მოსახერხებელია ოპერატიული მონაცემთა ბაზებისთვის (OLTP სისტემები), მაგრამ რთული მრავალ ცხრილის მოთხოვნები მასში შედარებით ნელია. შეკითხვის უკეთესი მოდელი, ვიდრე შესწორება, არის სივრცითი მონაცემთა ბაზა.

OLAP სისტემა იღებს რელაციური მონაცემთა ბაზის სურათს და აყალიბებს მას მოთხოვნების სივრცულ მოდელად. მოთხოვნათა დამუშავების დრო OLAP-ში არის მსგავსი მოთხოვნების დაახლოებით 0.1% ურთიერთობით მონაცემთა ბაზაში.

წარმოების მონაცემებიდან შექმნილ OLAP სტრუქტურას OLAP კუბი ეწოდება. კუბი იქმნება ცხრილების შეერთებისგან ვარსკვლავის სქემის გამოყენებით. "ვარსკვლავის" ცენტრში არის ფაქტების ცხრილი, რომელიც შეიცავს ძირითად ფაქტებს, რომლებზეც კეთდება შეკითხვები. ფაქტების ცხრილს მიმაგრებულია მრავალი ცხრილი ზომებით. ეს ცხრილები გვიჩვენებს, თუ როგორ შეიძლება მოხდეს აგრეგირებული რელაციური მონაცემების ანალიზი. შესაძლო აგრეგაციების რაოდენობა განისაზღვრება იმ გზებით, რომლებითაც შესაძლებელია ორიგინალური მონაცემების იერარქიულად ჩვენება.

სისტემების მოცემული კლასები (OLAP და OLTP) დაფუძნებულია DBMS-ის გამოყენებაზე, მაგრამ მოთხოვნების ტიპები ძალიან განსხვავებულია. OLAP მექანიზმი დღეს მონაცემთა ანალიზის ერთ-ერთი ყველაზე პოპულარული მეთოდია. ამ პრობლემის მოგვარების ორი ძირითადი მიდგომა არსებობს. პირველ მათგანს ჰქვია Multidimensional OLAP (MOLAP) - მექანიზმის განხორციელება სერვერის მხარეს მრავალგანზომილებიანი მონაცემთა ბაზის გამოყენებით, ხოლო მეორე Relational OLAP (ROLAP) - კუბების აგება SQL მოთხოვნების საფუძველზე რელატიურ DBMS-ზე. თითოეულ ამ მიდგომას აქვს თავისი დადებითი და უარყოფითი მხარეები. დესკტოპის OLAP სისტემის ზოგადი სქემა შეიძლება წარმოდგენილი იყოს ნახ.

მუშაობის ალგორითმი შემდეგია:

1) მონაცემების მოპოვება ბრტყელი ცხრილის ან SQL მოთხოვნის შესრულების შედეგის სახით;

2) მონაცემების ქეშირება და მათი გადაყვანა მრავალგანზომილებიან კუბად;

3) აგებული კუბის ჩვენება ჯვარედინი ჩანართის ან სქემის გამოყენებით და ა.შ.

ზოგადად, რუკების თვითნებური რაოდენობა შეიძლება დაუკავშირდეს ერთ კუბს. OLAP სისტემებში გამოყენებული დისპლეები ყველაზე ხშირად ორი ტიპისაა: ჯვარედინი ცხრილები და დიაგრამები.

ვარსკვლავის დიაგრამა. მისი იდეა მდგომარეობს იმაში, რომ არსებობს ცხრილები თითოეული განზომილებისთვის და ყველა ფაქტი მოთავსებულია ერთ ცხრილში, ინდექსირებულია რამდენიმე კლავიშით, რომელიც შედგება ცალკეული განზომილების კლავიშებისგან. ვარსკვლავის სქემის თითოეული სხივი კოდის ტერმინოლოგიით ადგენს მონაცემთა კონსოლიდაციის მიმართულებას შესაბამისი განზომილების გასწვრივ.

კომპლექსურ ამოცანებში მრავალდონიანი გაზომვებით, აზრი აქვს მივმართოთ ვარსკვლავის სქემის გაფართოებას - თანავარსკვლავედის სქემას (ფაქტების თანავარსკვლავედის სქემა) და ფიფქის სქემას (ფიფქიის სქემა). ამ შემთხვევებში იქმნება ცალკეული ფაქტების ცხრილები სხვადასხვა განზომილების შემაჯამებელი დონის შესაძლო კომბინაციებისთვის. ეს იძლევა უკეთესი შესრულების საშუალებას, მაგრამ ხშირად იწვევს ზედმეტ მონაცემებს და მნიშვნელოვან სირთულეს მონაცემთა ბაზის სტრუქტურაში, რომელიც შეიცავს უამრავ ფაქტების ცხრილებს.

თანავარსკვლავედის დიაგრამა

ანალიტიკური მონაცემთა დამუშავება - ეს არის მონაცემთა ანალიზი, რომელიც საჭიროებს შესაბამის მეთოდოლოგიურ მხარდაჭერას და სპეციალისტის მომზადებას გარკვეულ დონეს.

თანამედროვე საინფორმაციო ტექნოლოგიები შესაძლებელს ხდის დაგროვილი პირველადი ინფორმაციის ანალიზის პროცესების ავტომატიზაციას, ანალიტიკური მოდელების აგებას, მზა გადაწყვეტილებების მოპოვებას და მათ პრაქტიკაში გამოყენებას. ძირითადი მოთხოვნები რომლებიც გამოიყენება ანალიზის მეთოდებზე არის ეფექტურობა, სიმარტივე, ავტომატიზმი. ეს კონცეფცია ემყარება ორ თანამედროვე ტექნოლოგიას: მონაცემთა მოპოვება და ცოდნის აღმოჩენა მონაცემთა ბაზებში (KDD).

Მონაცემების მოპოვება - ეს არის მანამდე უცნობი, არატრივიალური, პრაქტიკულად გამოსადეგი და ხელმისაწვდომი ცოდნის ინტერპრეტაციისთვის, რომელიც აუცილებელია ადამიანის საქმიანობის სხვადასხვა სფეროში გადაწყვეტილების მიღებისთვის (განმარტება გ. პიატეცკი-შაპიროს, ამის ერთ-ერთი დამაარსებლის გ. პიატეცკი-შაპიროს მიერ) აღმოჩენის პროცესი. მიმართულება).

მონაცემთა მოპოვების ტექნოლოგია მიზნად ისახავს არა აშკარა შაბლონების პოვნას. მონაცემთა ანალიზის ეტაპებია:

  • 1) კლასიფიკაცია ( კლასიფიკაცია) - ნიშნების გამოვლენა, რომლებიც ახასიათებს შესასწავლი მონაცემთა ნაკრების ობიექტების ჯგუფებს - კლასებს. კლასიფიკაციის პრობლემის გადაჭრის მეთოდები: უახლოესი მეზობელი მეთოდები ( უახლოესი მეზობელი)და ^'- უახლოესი მეზობელი ( კ-უახლოესი მეზობელი)-,ბაიესის ქსელები (ბაიესის ქსელები)-,გადაწყვეტილების ხეების ინდუქცია; ნეირონული ქსელები (ნეირონული ქსელები)-,
  • 2) კლასტერირება (კლასტერიზაცია)- ობიექტების ჯგუფებად დაყოფა, რადგან ობიექტების კლასები თავდაპირველად არ არის განსაზღვრული. კლასტერული პრობლემის გადაჭრის მეთოდის მაგალითი: Kohonen-ის რუქების თვითორგანიზება - ნერვული ქსელი უკონტროლო სწავლით. ამ რუკების მნიშვნელოვანი მახასიათებელია მათი შესაძლებლობა, დააფიქსირონ მრავალგანზომილებიანი ფუნქციური სივრცეები სიბრტყეზე, მონაცემების ორგანზომილებიანი რუკის სახით წარმოჩენა;
  • 3) ასოციაცია (ასოციაციები)- მონაცემთა ნაკრებში დაკავშირებულ მოვლენებს შორის შაბლონების იდენტიფიცირება. ეს შაბლონები ვლინდება არა გაანალიზებული ობიექტის თვისებების საფუძველზე, არამედ რამდენიმე მოვლენას შორის, რომლებიც ერთდროულად ხდება, მაგალითად, აპრიორის ალგორითმი;
  • 4) თანმიმდევრობა (თანმიმდევრობა),ან სერიული ასოციაცია (თანმიმდევრული ასოციაცია),- მოძებნეთ დროითი შაბლონები ტრანზაქციებს შორის, ე.ი. შაბლონები იქმნება არა ერთდროულად მომხდარ მოვლენებს შორის, არამედ დროში დაკავშირებულ მოვლენებს შორის. ასოციაცია არის თანმიმდევრობა ნულის ტოლი დროის შუალედით. თანმიმდევრობის წესი: ღონისძიების შემდეგ X გარკვეული დროის შემდეგ მოხდება Y მოვლენა;
  • 5) პროგნოზირება (პროგნოზირება) - ეფუძნება ისტორიული მონაცემების თავისებურებებს, ე.ი. ფასდება მიზნობრივი რიცხვითი ინდიკატორების გამოტოვებული ან მომავალი მნიშვნელობები. პროგნოზირების ამოცანების გადასაჭრელად გამოიყენება მათემატიკური სტატისტიკის მეთოდები, ნერვული ქსელები და ა.შ.
  • 6) გადახრებისა და ამოკვეთების განსაზღვრა (გადახრის გამოვლენა),გადახრების ან შორეულობის ანალიზი - მონაცემების გამოვლენა და ანალიზი, რომელიც ყველაზე მეტად განსხვავდება მონაცემთა ზოგადი ნაკრებისგან;
  • 7) შეფასება (შეფასება)- უწყვეტი მახასიათებლების მნიშვნელობების პროგნოზირება;
  • 8) ბმული ანალიზი (ლინკის ანალიზი)- მონაცემთა ნაკრების დამოკიდებულების პოვნის ამოცანა;
  • 9) ვიზუალიზაცია (ვიზუალიზაცია, გრაფიკის მოპოვება)- გაანალიზებული მონაცემების გრაფიკული გამოსახულების შექმნა. გრაფიკული მეთოდები გამოიყენება მონაცემების შაბლონების არსებობის საჩვენებლად, მაგალითად, მონაცემების პრეზენტაცია 2D და 3D განზომილებაში;
  • 10) შეჯამება ( შეჯამება) - ობიექტების კონკრეტული ჯგუფების აღწერა გაანალიზებული მონაცემთა ნაკრებიდან.

KDD არის მონაცემთა კოლექციიდან სასარგებლო ცოდნის მოპოვების პროცესი. ეს ტექნოლოგია მოიცავს შემდეგ საკითხებს: მონაცემთა მომზადება, ინფორმაციული მახასიათებლების შერჩევა, მონაცემთა გაწმენდა, მონაცემთა მოპოვების (DM) მეთოდების გამოყენება, მონაცემთა შემდგომი დამუშავება და შედეგების ინტერპრეტაცია.

მონაცემთა ბაზებში ცოდნის აღმოჩენის პროცესი შედგება შემდეგი ნაბიჯებისგან:

  • 1) პრობლემის განცხადება - მომხმარებლის ამოცანებისა და აპლიკაციის არეალის მახასიათებლების ანალიზი, შეყვანისა და გამომავალი პარამეტრების ნაკრების შერჩევა;
  • 2) საწყისი მონაცემთა ნაკრების მომზადება - მონაცემთა საწყობის შექმნა და მონაცემთა შეგროვებისა და განახლების სქემის ორგანიზება;
  • 3) მონაცემთა წინასწარი დამუშავება - მონაცემთა მოპოვების მეთოდების გამოყენებაზე დაყრდნობით, ამ მეთოდის თვალსაზრისით, მონაცემები უნდა იყოს მაღალი ხარისხის და სწორი;
  • 4) ტრანსფორმაცია, მონაცემთა ნორმალიზაცია - ინფორმაციის მიტანა შემდგომი ანალიზისთვის შესაფერის ფორმამდე;
  • 5) მონაცემთა მოპოვება - მონაცემთა ავტომატური ანალიზი, რომელიც დაფუძნებულია ცოდნის მოსაპოვებლად სხვადასხვა ალგორითმების გამოყენებაზე (ნერვული ქსელები, გადაწყვეტილების ხეები, კლასტერული ალგორითმები, ასოციაციები და ა.შ.);
  • 6) მონაცემთა შემდგომი დამუშავება - შედეგების ინტერპრეტაცია და მიღებული ცოდნის გამოყენება ბიზნეს აპლიკაციებში.