Data Mining vs. Depozitarea datelor
Procesul de exploatare a datelor se referă la o ramură a științei informaticii care se ocupă cu extragerea modelelor din seturi de date mari. Aceste seturi sunt apoi combinate folosind metode statistice și inteligență artificială. Mineritul de date în afacerile moderne este responsabil de transformarea datelor brute în surse de inteligență artificială. Datele sunt manipulate și astfel sunt capabile să ofere decizii fiabile care pot fi folosite în luarea deciziilor. Acest lucru oferă întreprinderilor un avantaj față de concurență, dat fiind faptul că au seturi de date care pot fi folosite pentru a furniza informații. Explorarea datelor este, de asemenea, utilizată de organizații în practici de profilare, inclusiv marketing, descoperirea științifică de supraveghere și detectarea fraudei.
Există alți termeni obișnuiți care ar putea fi asociați minelor de date, cum ar fi pescuitul de date, dragarea datelor sau chiar sincronizarea datelor. Toate acestea indică variații diferite ale minelor de date care sunt folosite în eșantionarea seturilor mici de date care pot fi prea mici pentru a produce inferențe statistice. Acestea sunt, totuși, esențiale pentru a evidenția valabilitatea datelor în uz și pot fi folosite pentru a crea o ipoteză atunci când așteaptă cu nerăbdare să ajungă la o anumită populație de date.
Un depozit de date, pe de altă parte, este un termen care descrie un sistem dintr-o organizație care este utilizat în colectarea de date. Aceste date colectate de un depozit de date sunt cele furnizate de sistemele tranzacționale, cum ar fi factura, înregistrările achizițiilor sau chiar înregistrările de credite. Înregistrările de date sunt preluate din punctele individuale ale creației și sunt reunite sub un singur acoperiș care este depozitul de date. Aceste date sunt apoi raportate și raportarea este efectuată într-o manieră agregată pentru a ajuta utilizatorii informațiilor de afaceri să ia decizii valide. Depozitul de date care funcționează eficient necesită sursa de date, o bază de date și un instrument de raportare.
Prin urmare, se poate spune că un depozit de date este o bază de date care este utilizată în scopurile specifice de raportare a datelor analizate. Aceste date provin din diferitele sisteme care au fost supuse rapoartelor.
Pentru a-și îndeplini funcția, depozitul de date menține funcții în trei straturi distincte. Acestea includ stadializarea, integrarea și accesul. În procesul de etapizare, datele brute sunt stocate de dezvoltatori pentru unicul scop de analiză și suport. Stratul de integrare este utilizat pentru integrarea datelor și pentru a avea un nivel de abstractizare de la utilizatorii datelor. În cele din urmă, nivelul de acces este important în obținerea datelor de la diferiți utilizatori de date.
Atât extracția de date cât și stocarea datelor pot fi denumite instrumente care sunt utilizate pentru colectarea de informații de business. Principala diferență dintre cele două este modul în care se colectează informațiile de business. Se poate spune, prin urmare, că datele care au fost bine depozitate sunt destul de ușor de utilizat și, prin urmare, se pot folosi. Astfel, depozitul de date este responsabil pentru facilitarea procesării activității de extragere a datelor în toate datele relevante care trebuie să fie extrase într-o locație centrală, mai degrabă decât atunci când datele miniere trebuie să continue să caute date în locații diferite. Acest lucru contribuie la economisirea timpului petrecut în exploatarea datelor și a resurselor utilizate în minerit.
rezumat
Extracția datelor este procesul de extragere a datelor din seturi de date mari.
Stocarea datelor este procesul de îmbinare a tuturor datelor relevante împreună.
Atât extracția de date cât și stocarea datelor sunt instrumente de colectare a informațiilor de afaceri.
Exploatarea datelor este specifică în colectarea datelor.
Stocarea datelor este un instrument de economisire a timpului și de îmbunătățire a eficienței prin aducerea datelor dintr-o locație diferită din diferite zone ale organizației.
Depozitul de date are trei straturi, și anume stadializarea, integrarea și accesul.