GZIP vs BZIP2
GNU zip (cunoscut și ca GZIP) este o aplicație software cu scopul de a comprima fișiere. Acesta a fost inițial destinat să înlocuiască programul de compresie folosit în sistemele inițiale Unix - pentru a fi utilizat în proiectul GNU (un proiect software gratuit).
BZIP2 este un algoritm de compresie a datelor fără pierderi fără pierderi - în esență, o clasă de algoritmi de comprimare a datelor care face posibil ca datele originale ale unui fișier comprimat să fie complet reconstruite din datele comprimate.
GZIP se bazează pe un algoritm cunoscut sub numele de DEFLATE. Acesta este, de asemenea, un algoritm de comprimare a datelor fără pierderi. Utilizează atât algoritmul LZ77, cât și codarea Huffman. În esență, GZIP se referă la formatul de fișier cu același nume. Acest format este un antet de 10 octeți care conține un număr magic (ceea ce înseamnă o valoare numerică sau de text care nu se modifică niciodată și se utilizează pentru a indica un format sau un protocol de fișier, o valoare numerică nenumită care nu se modifică niciodată sau valori distincte care nu pot fi confundate pentru orice altceva), anteturi suplimentare care pot sau nu pot fi efectiv necesare (numele original al fișierului, de exemplu), un corp care conține o încărcătură utilă comprimată DEFLATE (care este datele pe care antetele o poartă) și un subsol de 8 octeți care conține o sumă de control CRC-32, precum și lungimea reală a datelor necomprimate originale.
Există o varietate de tehnici de compresie pe care le folosește formatul BZIP2, care sunt stivuite una peste alta în mai multe straturi. Acestea apar într-o ordine foarte distinctă: codificarea lungimii de execuție (care este orice secvență de patru până la 255 simboluri duplicat care este înlocuită de primele patru simboluri și o lungime de codare care se repetă între 0 și 251), transformarea Burrows-Wheeler care este blocul de tip reversibil care formează chiar nucleul BZIP2), Mută în față (lăsă dimensiunea blocului prelucrat nealterat), Codificare lungă de rulare (care constă din lungi fire de simboluri - de obicei, zerouri - care în mod constant se repetă în ieșire și se înlocuiește atât cu simbolul, cât și cu o succesiune de două coduri), codificarea Huffman (care este un proces care înlocuiește simbolurile lungimii fixe ale octeților de 8 biți cu codurile de lungime în schimbare), codificarea Multiple Hoffman mai multe tabele Hoffman de dimensiune identică), codificarea Unary base 1, codarea Delta și matricea de biți Sparse.
Rezumat:
1. GZIP este o aplicație gratuită folosită pentru a comprima fișiere; BZIP2 este un algoritm de compresie a datelor fără pierderi fără pierderi care permite recuperarea datelor originale ale unui fișier comprimat.
2. GZIP constă dintr-un antet de 10 octeți, anteturi opționale, un corp și un subsol de 8 octeți; BZIP2 este format din nu mai puțin de nouă straturi de tehnici de compresie.