diferența cheie între RDBMS și Hadoop este faptul că RDBMS stochează date structurate, în timp ce Hadoop stochează date structurate, semi-structurate și nestructurate.
RDBMS este un sistem de gestionare a bazelor de date bazat pe modelul relațional. Hadoop este un software pentru stocarea datelor și rularea aplicațiilor pe grupuri de hardware de mărfuri.
1. Prezentare generală și diferență cheie
2. Ce este RDBMS?
3. Ce este Hadoop
4. Comparație de la o parte la alta - RDBMS vs Hadoop în formă tabulară
5. rezumat
RDBMS reprezintă sistemul relațional de gestionare a bazelor de date bazat pe modelul relațional. În RDBMS, tabelele sunt utilizate pentru a stoca date, iar cheile și indexurile ajută la conectarea tabelelor. Un tabel este o colecție de elemente de date și ele sunt entități. Conține rânduri și coloane. Rândurile reprezintă o singură intrare în tabel. Coloanele reprezintă atributele.
De exemplu, baza de date privind vânzările poate avea entități de clienți și produse. Clientul poate avea atribute precum customer_id, nume, adresa, phone_no. Elementul poate avea atribute, cum ar fi product_id, nume etc. Cheia primară a tabelului clientului este client_id în timp ce cheia primară a tabelului de produse este product_id. Plasarea produsului_id în tabelul de clienți ca o cheie străină leagă aceste două entități. De asemenea, tabelele sunt legate una de cealaltă. Acestea asigură integritatea datelor, normalizarea și multe altele. Puține dintre RDBMS-urile comune sunt MySQL, MSSQL și Oracle. Ei folosesc SQL pentru interogare.
Hadoop este un framework open source al lui Apache scris în Java. Acesta ajută la stocarea și procesarea unei cantități mari de date între clustere de computere utilizând modele simple de programare. Obiectivul principal al Hadoop este de a stoca și prelucra datele mari, care se referă la o cantitate mare de date complexe. Procesul Hadoop, care este capacitatea de a procesa un volum de date într-o anumită perioadă de timp, este ridicat.
Există patru module în arhitectura Hadoop. Acestea sunt frecvente Hadoop, YARN, Hadoop Distributed File System (HDFS) și Hadoop MapReduce. Modulul comun conține bibliotecile și utilitățile Java. De asemenea, are fisiere pentru a incepe Hadoop. Hadoop YARN efectuează programarea de locuri de muncă și gestionarea resurselor cluster.
În plus, sistemul de distribuire a fișierelor Hadoop (HDFS) este sistemul de stocare Hadoop. Utilizează arhitectura master-slave. Nodul Master este numeleNode și gestionează meta datele sistemului de fișiere. Alte computere sunt noduri slave sau Noduri de date. Ele stochează datele reale. Pe de altă parte, Hadoop MapReduce face calculul distribuit. Are algoritmi de procesare a datelor. În HDFS, nodul Master are un tracker de locuri de muncă. Aceasta rulează hărți pentru a reduce locurile de muncă pe nodurile slave. Există un Task Tracker pentru fiecare nod slave pentru a finaliza procesarea datelor și pentru a trimite rezultatul înapoi la nodul principal. În ansamblu, Hadoop oferă stocarea masivă a datelor cu o putere de procesare ridicată.
RDBMS vs Hadoop | |
RDBMS este un software de sistem pentru crearea și gestionarea bazelor de date bazate pe modelul relațional. | Hadoop este o colecție de software open source care conectează mai multe computere pentru a rezolva probleme care implică o cantitate mare de date și de calcul. |
Varietatea datelor | |
RDBMS stochează date structurate. | Hadoop stochează date structurate, semi-structurate și nestructurate. |
Stocare a datelor | |
RDBMS stochează cantitatea medie de date. | Hadoop stochează o cantitate mare de date decât RDBMS. |
Viteză | |
În RDBMS, citirile sunt rapide. | În Hadoop, citește și scrie sunt rapide. |
scalabilitate | |
RDBMS are scalabilitate verticală. | Hadoop are scalabilitate orizontală. |
Hardware | |
RDBMS utilizează servere high-end. | Hadoop folosește hardware de marfă. |
tranzitată | |
Transmiterea RDBMS este mai mare. | Procesul Hadoop este mai mic. |
Acest articol a discutat diferența dintre RDBMS și Hadoop. Diferența cheie dintre RDBMS și Hadoop este că RDBMS stochează date structurate, în timp ce Hadoop stochează date structurate, semi-structurate și nestructurate.
1. Punct de instruire. "Concepte SQL RDBMS". , Tutoriale punct, 8 ianuarie 2018. Disponibil aici
2.Tutoriale punct. "Tutorial Hadoop". , Tutoriale punct, 8 ianuarie 2018. Disponibil aici
1.'8552968000 'de Intel Free Press (CC BY-SA 2.0) prin intermediul Flickr