Pregătirea datelor în procesul minier de date este. Tehnologia minieră a datelor

Minierea de date este împărțită în două grupe mari pe principiul de a lucra cu datele de învățare sursă. În această clasificare nivelul superior Determinată pe baza faptului dacă datele sunt salvate după mineritul de date sau sunt distilate pentru utilizarea ulterioară.

1. Utilizarea directă a datelor sau salvarea datelor.

În acest caz, datele inițiale sunt stocate într-o formă detaliată evidentă și sunt utilizate direct la etape și / sau analiza excepțiilor. Problema acestui grup de metode - atunci când este utilizată, poate fi dificil să analizăm bazele de date ultra-ridicate.

Metode ale acestui grup: analiza clusterului, cea mai apropiată metodă vecină, metoda vecinului K-cel mai apropiat, raționamentul prin analogie.

2. Detectarea și utilizarea formalizării legi, sau Șabloane de distilare.

Cu tehnologie templatele de distilare Un eșantion (șablon) de informații este extras din datele sursă și este transformat în unele structuri formale, tipul de care depinde de metoda minieră de date utilizată. Acest proces este efectuat în scenă. căutare gratuită., la primul grup de metode, această etapă este absentă în principiu. În etape modelarea prognosticului și analiza excepțiilor Rezultatele etapei sunt utilizate căutare gratuită., ele sunt semnificativ mai compacte în bazele de date înșiși. Reamintim că desenele acestor modele pot fi interpretate analist sau ineptly ("cutii negre").

Metode ale acestui grup: Metode logice; Metode de vizualizare; Metode de tabel încrucișat; Metode bazate pe ecuații.

Metode logice sau metode de inducție logică includ: cereri și analize fuzzy; reguli simbolice; Copaci de soluții; Algoritmi genetici.

Metodele acestui grup sunt probabil cele mai interpretate - ele desenează modelele găsite, în majoritatea cazurilor, într-o formă destul de transparentă din punctul de vedere al utilizatorului. Regulile obținute pot include variabilele continue și discrete. Trebuie remarcat faptul că copacii de soluții pot fi ușor convertite la seturi de reguli simbolice prin generarea unei reguli de-a lungul căii de la rădăcina copacului la el textul terminalului. Copacii de soluții și reguli sunt de fapt căi diferite Soluții de o sarcină și diferă numai în capacitățile lor. În plus, punerea în aplicare a normelor este efectuată de algoritmi mai lenți decât inducerea deciziilor copacii.

Metode de fila transfrontalieră: agenți, rețea BAIEC (încredere), vizualizare încrucișată. Ultima metodă nu răspunde la una dintre proprietățile de exploatare a datelor - Căutare independentă legi Sistem analitic. Cu toate acestea, furnizarea de informații sub formă de transfer asigură punerea în aplicare a principalei sarcini de exploatare a datelor - căutarea de șabloane, astfel încât această metodă poate fi, de asemenea, considerată una dintre metodele miniere de date.

Metode bazate pe ecuații.

Metodele acestui grup exprimă modelele identificate sub formă de expresii matematice - ecuații. Prin urmare, ele pot funcționa numai cu variabile numerice, iar variabilele altor tipuri trebuie să fie codificate în consecință. Acest lucru limitează într-o oarecare măsură utilizarea metodelor acestui grup, acestea sunt utilizate pe scară largă în rezolvarea diferitelor sarcini, în special sarcinile de prognoză.

Principalele metode ale acestui grup: metode statistice și rețele neuronale

Metodele statistice sunt utilizate cel mai adesea pentru a rezolva sarcinile de prognoză. Există multe metode de analiză statistică a datelor, printre care, de exemplu, analiza de corelare-regresie, corelarea seriei dinamicii, identificarea tendințelor seriei dinamice, analiza armonică.

O altă clasificare împărtășește toate soiurile de metode miniere de date în două grupe: metode statistice și cibernetice. Această schemă de separare se bazează pe diferite abordări ale învățării. modele matematice.

Trebuie remarcat faptul că există două abordări de atribuire a metodelor statistice pentru mineritul de date. Primul dintre aceștia se opune metodelor statistice și mineritului de date, susținătorii săi consideră metode statistice clasice la o direcție separată de analiză a datelor. Conform celei de-a doua abordări, metodele de analiză statistică fac parte din exploatarea datelor metalice matematice. Cele mai multe surse de renume aderă la a doua abordare.

În această clasificare distinge două grupuri de metode:

  • metode statistice bazate pe utilizarea experienței acumulate medii, care se reflectă în datele retrospective;
  • metode cibernetice care includ multe abordări matematice eterogene.

Lipsa unei astfel de clasificări: atât statistice, cât și algoritmii cibernetici, într-un fel sau se bazează altfel pe compararea experienței statistice cu rezultatele monitorizării situației actuale.

Avantajul unei astfel de clasificări este confortul său de interpretare - este utilizat în descrierea mijloacelor matematice de abordare modernă la extragerea cunoștințelor de la marginea observațiilor sursă (operaționale și retrospectivă), adică. În sarcinile miniere de date.

Luați în considerare în detaliu grupurile de mai sus.

Metode statistice Mining de date

Aceste metode sunt patru secțiuni interdependente:

  • analiza preliminară a naturii datelor statistice (inspecția ipotezei staționarității, normalității, independenței, uniformității, evaluării tipului de funcții de distribuție, parametrilor acestuia etc.);
  • detectarea conexiunilor I. legi (analiza de regresie liniară și neliniară, analiza corelației etc.);
  • analiza statistică multidimensională (analiză discriminantă liniară și neliniară, analiza clusterului, analiza componentelor, analiza factorilor si etc.);
  • modele dinamice și un prognostic bazat pe serii de timp.

Arsenalul de date privind metodele statistice miniere este clasificat pentru patru grupe de metode:

  1. Analiza descriptivă și descrierea datelor sursă.
  2. Analiza relației (analiza de corelare și regresie, analiza factorilor, analiza dispersiei.).
  3. Analiza statistică multidimensională (analiza componentelor, analiza discriminantă, analiza regresiei multidimensionale, corelațiile canonice etc.).
  4. Analiza seriei temporare ( modele dinamice și prognoză).

Metode cibernetice Mineri de date

A doua direcție a mineritului de date este o mulțime de abordări, ideea de matematică pe calculator și utilizarea teoriei inteligenței artificiale.

Mineritul de date) și pe o analiză de explorare "grosieră" care constituie baza procesării operaționale analitice (prelucrarea analitică online, OLAP), în timp ce una dintre principalele prevederi ale mineritului de date - căutați non-evident legi. Instrumentele miniere de date pot găsi astfel de regularități independent și, de asemenea, construi în mod independent ipoteze despre relații. Deoarece formularea unei ipoteze în raport cu dependențele este cea mai mare sarcina dificilaAvantajul mineritului de date în comparație cu alte metode de analiză este evident.

Majoritatea metodelor statistice de identificare a interconexiunilor din date utilizează conceptul de masă pe eșantion, ceea ce duce la operațiuni asupra valorilor inexistente, în timp ce exploatarea datelor funcționează cu valori reale.

OLAP este mai potrivit pentru înțelegerea datelor retrospective, exploatarea datelor se bazează pe date retrospective pentru a obține răspunsuri la întrebările despre viitor.

Perspectivele tehnologiei miniere de date

Potențialul minierului de date dă "lumină verde" pentru a extinde frontierele aplicației tehnologiei. În ceea ce privește perspectivele miniere de date, sunt posibile următoarele instrucțiuni de dezvoltare:

  • alocarea tipurilor de domenii subiecte cu efectivul corespunzător, a cărei formalizare va facilita soluția sarcinilor miniere corespunzătoare aparținând acestor zone;
  • crearea de limbi oficiale și instrumente logice prin care argumentele vor fi formalizate, iar automatizarea va fi instrumentul de soluționare a sarcinilor miniere a datelor în anumite domenii;
  • crearea metodelor de extracție a datelor care sunt capabile nu numai să extragă aceste modele, ci și să formeze anumite teorii bazate pe date empirice;
  • depășind întârzierea esențială a posibilităților instrumente Mineri de date din realizările teoretice în acest domeniu.

Dacă luați în considerare viitorul minierului de date pe termen scurt, este evident că dezvoltarea acestei tehnologii este cea mai direcționată către domeniile legate de afacere.

Pe termen scurt, produsele miniere de date pot fi la fel de obișnuite și necesare e-mail, de exemplu, utilizat de utilizatori pentru a căuta cele mai multe preturi mici Pe un anumit produs sau cele mai ieftine bilete.

Pe termen lung, viitorul minierului de date este cu adevărat interesant - poate fi o căutare a agenților intelectuali ca noi tipuri de tratare a diferitelor boli și o nouă înțelegere a naturii universului.

Cu toate acestea, extracția de date este în sine și un potențial pericol - la urma urmei, o cantitate tot mai mare de informații devine disponibilă prin rețeaua mondială, inclusiv informații private, iar tot mai multe cunoștințe sunt posibile pentru a obține de la ea:

Nu cu mult timp în urmă, cel mai mare magazin online "Amazon" a fost în centrul scandalului despre brevetul primit de el "Metode și sisteme de a ajuta utilizatorii atunci când cumpără bunuri", care nu este altceva decât un alt produs minier de date destinat colectării personale personale Datele despre vizitatorii magazinului. Noua tehnică vă permite să preziceți cererile viitoare pe baza achizițiilor, precum și să trageți concluziile despre scopul lor. Scopul acestei tehnici este ceea ce a fost menționat mai sus - obținerea cât mai posibilă mai mult Informații despre clienți, inclusiv natura privată (sex, vârstă, preferințe etc.). Astfel, sunt colectate date despre confidențialitatea cumpărătorilor magazinelor, precum și membrii familiilor lor, inclusiv copiii. Acesta din urmă este interzis de legislația multor țări - colectarea de informații despre minori este posibilă numai cu permisiunea părinților.

Studiile remarcă faptul că există atât soluții de succes care utilizează exploatarea datelor și experiența nereușită a utilizării acestei tehnologii. Zonele în care utilizarea tehnologiei miniere a datelor este probabil să aibă succes, au astfel de caracteristici:

  • necesită soluții bazate pe cunoaștere;
  • au un mediu în schimbare;
  • au date accesibile, suficiente și semnificative;
  • oferiți dividende mari din soluțiile potrivite.

Abordările existente ale analizei

Pentru o lungă perioadă de timp, disciplina minieră a datelor nu a fost recunoscută ca o zonă independentă de date completă de analiză a datelor, uneori se numește "backyard-uri statistice" (Pregibon, 1997).

Până în prezent, au fost determinate mai multe puncte de vedere asupra mineritului de date. Suporterii unuia dintre ei consideră Mirage, distrag atenția din analiza clasică

Ce este mineritul de date

orfelinația oricărei întreprinderi moderne conține, de obicei, un set de tabele care stochează înregistrări despre anumite fapte sau obiecte (de exemplu, despre bunuri, vânzări, clienți, conturi). De regulă, fiecare intrare într-un tabel similar descrie un anumit obiect sau un fapt. De exemplu, o înregistrare în tabelul de vânzări reflectă faptul că un astfel de produs este vândut unui astfel de client, atunci ceva de genul unui manager, și cu mare, nimic altceva decât aceste informații nu conține. Cu toate acestea, numărul total de astfel de înregistrări acumulate de mai mulți ani poate fi o sursă de informații suplimentare, mult mai valoroase, care nu pot fi obținute pe baza unei înregistrări speciale, și anume informații despre modele, tendințe sau interdependențe între orice date. Exemple de astfel de informații sunt informații despre modul în care vânzarea unui anumit produs depinde în ziua săptămânii, timpul zilei sau sezonului, care categoriile de cumpărători achiziționează cel mai adesea unul sau alt produs, care parte din cumpărătorii unui anumit Produsul achiziționează un alt produs specific, care categorie de clienți nu oferă cel mai adesea un împrumut în timp.

Aceste informații sunt utilizate în mod obișnuit în prezicerea, planificarea strategică, analiza riscurilor, iar valoarea sa pentru întreprindere este foarte mare. Aparent, prin urmare, procesul de căutare și a obținut numele minier de date (miniere în limba engleză înseamnă "miniere miniere", iar căutarea regulațiilor într-un set imens de date reale este cu adevărat asemănătoare cu aceasta). Termenul de exploatare a datelor nu denotă atât o tehnologie specifică ca proces de găsire a corelațiilor, tendințelor, relațiilor și modelelor prin diverse algoritmi matematici și statistici: gruparea, crearea de sub-descoperire, regresie și analiza de corelare. Scopul acestei căutări este de a prezenta date sub forma unor procese de afaceri clar reflectorizante, precum și construirea unui model, cu care puteți prezice procesele, critice pentru planificarea afacerilor (de exemplu, dinamica cererii pentru anumite bunuri sau servicii sau dependența dobândirii lor de la orice caracteristici ale consumatorilor).

Rețineți că tradiționalul matematică Statistici, pentru o lungă perioadă de timp, instrumentul principal de analiză a datelor, precum și instrumentele operaționale de prelucrare a datelor analitice (procesarea analitică online, OLAP), pe care am scris-o în mod repetat (vezi materialele de pe acest subiect pe CD-ul nostru), nu pot fi întotdeauna cu succes aplicată pentru a rezolva astfel de sarcini. În mod tipic, metodele statistice și OLAP sunt utilizate pentru a verifica ipoteze formulate în avans. Cu toate acestea, este adesea că formularea ipotezei este tocmai cea mai dificilă sarcină în implementarea analizei de afaceri pentru luarea deciziilor ulterioare, deoarece departe de toate modelele din date sunt evidente dintr-o privire.

De bază tehnologie moderna Minierea de date este conceptul de șabloane care reflectă modelele inerente în fișele tehnice. Căutarea șabloanelor se face prin metode care nu utilizează niciun fel de ipoteze priori despre aceste subsoluri. Dacă, cu analiza statistică sau atunci când utilizați OLAP, probleme de tip "Care sunt numărul mediu de conturi neplătite cu clienții acestui serviciu?", Utilizarea de minerit de date, de regulă, implică răspunsuri la tip "Există un tipic Categoria clienților care nu plătesc pentru conturi? ". În același timp, răspunsul la cea de-a doua întrebare asigură adesea o abordare mai nontrivială a politicilor de marketing și a organizării muncii cu clienții.

O caracteristică importantă a mineritului de date este non-standard și ne-vizibilitatea șabloanelor dorite. Cu alte cuvinte, instrumentele miniere de date diferă de instrumentele statistice ale datelor și de instrumentele OLAP în faptul că, în loc să testeze în pretins de utilizatori de interdependență, aceștia sunt capabili să găsească astfel de interdependenți independenți și să construiască ipoteze despre caracterul lor.

Trebuie remarcat faptul că utilizarea instrumentelor miniere de date nu exclude utilizarea instrumentelor statistice și a fondurilor OLAP, deoarece rezultatele procesării datelor care utilizează acesta din urmă, ca regulă, contribuie la o mai bună înțelegere a naturii modelelor care ar trebui să fie să fie căutat.

Datele sursă pentru mineritul de date

Aplicarea mineritului de date este justificată dacă există o cantitate suficient de mare de date, în mod ideal în depozitul de date proiectat corect (de fapt, stocurile de date în sine sunt, de obicei, create pentru a rezolva sarcinile de analiză și prognoză asociate cu sprijinul decizional). Pe principiile de construire a repositorii, am scris și mai mult de o dată; Materialele corespunzătoare pot fi găsite pe CD-ul nostru, deci nu ne vom opri pe această problemă. Vă reamintim doar că datele din depozitare sunt un set completat, unul pentru întreaga întreprindere și vă permite să restaurați imaginea activităților sale în orice moment. De asemenea, menționăm că structura datelor de stocare este proiectată astfel încât executarea solicitărilor la acesta să fie utilizată cât mai eficient posibil. Cu toate acestea, există instrumente miniere de date care sunt capabile să caute modele, corelații și tendințe nu numai în depozitele de date, ci și în cuburile OLAP, adică în seturile de date statistice pre-procesate.

Tipurile de modele detectate prin metode miniere de date

v.A. Dyuku a anunțat cinci tipuri standard de modele detectate prin metode miniere de date:

Asociația este o mare probabilitate de comunicare a evenimentelor unul cu celălalt (de exemplu, un produs este adesea achiziționat împreună cu altul);

Secvența este probabilitatea ridicată a evenimentelor legate de lanț (de exemplu, într-o anumită perioadă după achiziționarea unui produs va fi dobândită cu un grad ridicat de probabilitate);

Clasificarea - există semne care caracterizează grupul la care unul sau alt eveniment sau un obiect (de obicei, pe baza unei analize a evenimentelor deja clasificate, sunt formulate unele reguli);

Clusteringul este un model similar cu clasificarea și diferă de faptul că grupurile în sine nu sunt specificate - acestea sunt detectate automat în timpul procesării datelor;

Modelele temporare - prezența șabloanelor în dinamica comportamentului anumitor date (un exemplu tipic - oscilațiile sezoniere ale cererii pentru anumite bunuri sau servicii) utilizate pentru a prezice.

Metode de cercetare de date în mineritul de date

el este dragut! un numar mare de O varietate de metode de cercetare de date. Pe baza clasificării de mai sus propuse de V.A. Dyuk, printre care puteți aloca:

Analiza de regresie, dispersie și corelare (implementată în majoritatea pachetelor statistice moderne, în special în produsele companiilor SAS Institute, StatSoft, etc.);

Metode de analiză Într-o zonă specifică bazată pe modele empirice (adesea aplicabile, de exemplu, în fondurile cu costuri reduse ale analizei financiare);

Algoritmi de rețea neuronală, ideea căreia se bazează pe efectele țesutului nervos și se află în faptul că parametrii inițiali sunt considerați ca semnale convertite în conformitate cu relațiile existente dintre "neuroni" și ca răspuns, care Este rezultatul analizei, este considerat de răspunsul întregii rețele la datele inițiale. Comunicațiile în acest caz sunt create utilizând așa-numitele formare de rețea prin eșantionarea unei cantități mari care conțin atât datele sursă, cât și răspunsurile corecte;

Algoritmii sunt alegerea unui analog apropiat al datelor sursă din datele istorice existente. Numită și metoda "cea mai apropiată vecină";

Copacii de soluții - o structură ierarhică bazată pe setul de întrebări care implică răspunsul "da" sau "nu"; cu toate că aceasta metoda Prelucrarea datelor departe de a găsi întotdeauna perfect modelele existente, este destul de frecvent utilizat în prezicerea sistemelor datorită vizibilității răspunsului primit;

Modelele de cluster (uneori numite și modele de segmentare) sunt utilizate pentru a combina evenimente similare în grupuri pe baza unor valori similare ale mai multor câmpuri din setul de date; De asemenea, foarte popular atunci când creează sisteme de predicție;

Algoritmi de integritate limitată, calcularea frecvențelor combinațiilor de evenimente logice simple în subgrupurile de date;

Programare evolutivă - căutarea și generarea algoritmului care exprimă interdependența datelor pe baza algoritmului specificat inițial modificat în timpul căutării; Uneori căutarea interdependențelor se desfășoară între orice tipuri specifice de funcții (de exemplu, polinomii).

Citiți mai multe despre acești și alți algoritmi de miniere de date, precum și despre mijloacele lor, puteți citi în cartea "Mineritul de date: curs de pregatire"V.A. DOOKY și A.P. Samolenko, emis de Editura Peter în 2001. Astăzi este una dintre puținele cărți din limba rusă asupra problemei.

Producătorii de conducere de date Ming

resting de date miniere, cum ar fi majoritatea fondurilor de informații de afaceri, aparțin în mod tradițional unor instrumente software scumpe - prețul unor dintre ele atinge câteva zeci de mii de dolari. Prin urmare, până în prezent, principalii consumatori ai acestei tehnologii au fost bănci, societăți financiare și de asigurări, întreprinderi comerciale majore și au fost luate în considerare principalele sarcini care necesită utilizarea minelor de date, evaluarea riscurilor de credit și de asigurare și a politicilor de marketing. planuri tarifare și alte principii de a lucra cu clienții. În ultimii ani, situația a suferit anumite modificări: pe piață software. Au existat unelte miniere de date relativ ieftine de la mai mulți producători, ceea ce a făcut ca această tehnologie să fie disponibilă pentru întreprinderile mici și mijlocii, fără a se gândi anterior la asta.

Instrumentele moderne de informații de afaceri includ generatoare de rapoarte, instrumente de analiză a datelor, instrumente de dezvoltare bi-soluții (platforme bi) și așa-numitele întreprinderi BI Suites - Analiză de analiză și instrumente de procesare a datelor care vă permit să efectuați un set de date referitoare la analiza datelor și Crearea de rapoarte și adesea include un instrument integrat de bi-instrumente și instrumente de dezvoltare bi-aplicații. Acesta din urmă, de regulă, conțin în compoziția și mijloacele de a construi rapoarte și fonduri OLAP și adesea - și mineritul de date.

Potrivit analiștilor Grupului Gartner, liderii de pe piață pentru analizarea și prelucrarea scalelor de date ale întreprinderii sunt companii de obiecte de afaceri, Cognos, constructori de informații și revendică conducerea Microsoft și Oracle (figura 1). În ceea ce privește dezvoltarea bi-soluții, principalii solicitanți de leadership în acest domeniu sunt Institutul Microsoft și SAS (figura 2).

Rețineți că fondurile Microsoft de Business Intelligence se referă la produse relativ ieftine disponibile pentru o gamă largă de companii. De aceea vom lua în considerare câteva aspecte practice ale aplicării minelor de date cu privire la exemplul produselor acestei companii în părțile ulterioare ale acestui articol.

Literatură:

1. DUKE V.A. Mineri de date - Analiza inteligentă a datelor. - http://www.olap.ru/basic/dm2.asp.

2. Duke V.A., Samoilenko a.P. Mineri de date: curs de instruire. - SPB: Peter, 2001.

3. B. DE VILLE. Microsoft de date Microsoft. Digital Press, 2001.

Exploatarea datelor (mineritul de date)

Mineritul de date este un proces de metodologie și detecție în matrice de date mari acumulate în sisteme de informare Companiile, necunoscute anterior, netriviale, practic utile și accesibile la interpretarea cunoștințelor necesare pentru luarea deciziilor în diferite domenii ale activității umane. Minierea de date este unul dintre pașii unei descoperiri de cunoștințe mai mari în metodologia bazelor de date.

Cunoștințele descoperite în procesul de extragere a datelor ar trebui să fie necunoscuți și necunoscuți anterior. Nontrivialitatea presupune că astfel de cunoștințe nu pot fi detectate prin analize vizuale simple. Ei trebuie să descrie relația dintre proprietățile obiectelor de afaceri, să prezică valorile unor semne bazate pe altele etc. Cunoștințele găsite trebuie să fie aplicabile obiectelor noi.

Utilitatea practică a cunoașterii se datorează posibilității utilizării lor în procesul de susținere a adoptării deciziilor de gestionare și a îmbunătățirii activităților companiei.

Cunoștințele trebuie prezentate în forma care este de înțeles pentru utilizatorii care nu au o pregătire matematică specială. De exemplu, desenele logice "Dacă, atunci" sunt mai ușor de perceput de o persoană. Mai mult, astfel de reguli pot fi utilizate în diverse DBMS ca și înregistrări SQL. În cazul în care cunoștințele învățate sunt opace pentru utilizator, trebuie să existe o metodă post-procesare care să le permită să le aducă într-o formă interpretabilă.

Miningul de date nu este unul, ci un număr mare de diverse metode Detectarea cunoștințelor. Toate sarcinile rezolvate de metodele miniere de date pot fi împărțite în șase tipuri:

Minierea de date este mediidisciplinară, deoarece include elemente de metode numerice, statistici matematice și teoria probabilității, teoria informațiilor și logica matematică, inteligența artificială și învățarea mașinilor.

Sarcinile analizei de afaceri sunt formulate în moduri diferite, dar soluția celor mai multe dintre ele se reduce la una sau la o altă sarcină minieră de date sau la combinația lor. De exemplu, evaluarea riscurilor este soluția problemei de regresie sau clasificare, segmentare a pieței - gruparea, promovarea cererii - reguli asociative. De fapt, sarcinile miniere de date sunt elemente din care puteți "colecta" soluția celor mai reale sarcini de afaceri.

Pentru a rezolva obiectele descrise mai sus, se utilizează diferite metode și algoritmi de extragere a datelor. Datorită faptului că minarea de date sa dezvoltat și se dezvoltă la o intersecție a disciplinelor, cum ar fi statisticile matematice, teoria informației, învățarea mașinilor și bazele de date, este destul de natural că majoritatea algoritmilor și metodelor miniere de date au fost dezvoltate pe baza diferitelor metode din aceste discipline. De exemplu, algoritmul de clustering K-înseamnă a fost împrumutat din statistici.

Trimiteți-vă munca bună în baza de cunoștințe este simplă. Utilizați formularul de mai jos

Elevii, studenți absolvenți, tineri oameni de știință care folosesc baza de cunoștințe în studiile și munca lor vă vor fi foarte recunoscători.

Documente similare

    Descriere funcționalitate Tehnologii miniere de date ca procese necunoscute de detectare a datelor. Studiul sistemelor de ieșire reguli asociative și mecanismele algoritmilor de rețea neuronală. O descriere a algoritmilor de clustering și utilizarea minelor de date.

    examinare, adăugată 06/14/2013

    Elemente de bază pentru clustering. Folosind mineritul de date ca o modalitate de a "detecta cunoștințele în bazele de date". Selectarea algoritmilor de clustering. Obținerea datelor din depozitul bazei de date a atelierului de distanță. Clustering studenți și sarcini.

    lucrări de curs, a fost adăugată 07/10/2017

    Îmbunătățirea tehnologiilor de înregistrare și stocare a datelor. Specificitatea cerințelor moderne pentru prelucrarea datelor informaționale. Conceptul de șabloane care reflectă fragmente de relații multidimensionale în date se bazează pe tehnologia minieră modernă a datelor.

    examinare, adăugată 02.09.2010

    Mineri de date, istoricul dezvoltării de date miniere și descoperire a cunoștințelor. Elemente tehnologice și metode de exploatare a datelor. Pași în descoperirea cunoașterii. Schimbarea și detectarea deviației. Disciplinele asociate, recuperarea informațiilor și extragerea textului.

    raport, a adăugat 06/16/2012

    Mineritul de date ca proces de susținere a deciziilor bazat pe căutarea în aceste modele ascunse (șabloane de informații). Regularitățile și etapele sale de implementare, istoria dezvoltării acestei tehnologii, evaluarea avantajelor și dezavantajelor, posibilitățile.

    eseu, a adăugat 12/17/2014

    Clasificarea sarcinilor Datamaninginging. Crearea de rapoarte și rezultate. Posibilitățile de date Miner în statistica. Sarcina de clasificare, grupare și regresie. STATISTICA ANALIZA DE MINER MINER. Sarcinile esenței Căutați reguli asociative. Analiza predictorilor de supraviețuire.

    lucrări de curs, a fost adăugată 19.05.2011

    Direcții de perspectivă Analiza datelor: Analiza informațiilor text, analiza inteligentă a datelor. Analiza informațiilor structurate stocate în baze de date. Procesul de analiză a documentelor text. Caracteristici ale datelor de pre-procesare.

    rezumat, a adăugat 13.02.2014

    Clasificarea sarcinilor miniere de date. Sarcina de a clustering și de a căuta reguli asociative. Definiția unei clase de obiect prin proprietățile și caracteristicile sale. Găsirea dependențelor frecvente între obiecte sau evenimente. Prelucrarea datelor operaționale analitice.

    examinare, a adăugat 01/13/2013