HTML la XML: Extinderea limbajului de marcare
O mare majoritate a oamenilor care se află în industria calculatoarelor știu ce înseamnă HTML (Hypertext Markup Language). Acesta a fost în jur de foarte mult timp și a fost utilizat în mod extensiv în designul paginii web, care, deși este deja rar să vedeți pagini web scrise exclusiv în HTML, este considerat drept cunoaștere de bază pentru întregul proces de creare a paginilor web.
XML (Extensible Markup Language), pe de altă parte este o tehnologie mai recentă și mult mai puțin cunoscută comparativ cu HTML. XML a fost creat în 1996 de către un grup de 11 persoane ca adaptare a SGML (Standard Generalized Markup Language) pentru utilizarea pe World Wide Web. XML este un limbaj de markup mai structurat și mai strict comparativ cu HTML, care permite utilizatorilor să creeze propriile definiții și coduri modulate. A fost făcută pentru a crea o specificație standardizată pentru crearea de limbi personalizate de marcare, care sunt acum cunoscute sub numele de dialecte XML. S-ar putea să nu fie imediat evident, dar limbile de marcare personalizate, cum ar fi HTML, RSS și Atom, au fost construite din XML ca metodă de creștere a utilizabilității internetului.
Deoarece XML a fost adaptat de la SGML, acesta conține o mulțime de cod și tehnici originale de la SGML, cum ar fi stricta lui și o așa-numită bine formată. Caracteristici care se extind chiar și la descendenții XML. Anumite reguli ar trebui să fie întotdeauna luate în considerare atunci când se creează un cod care se bazează pe XML. Există chiar o declarație bine formată, cu fiecare document, pentru a preciza ce tip de document este și la ce reguli ar trebui să se bazeze prelucrarea. Acest lucru este foarte diferit față de codarea foarte relaxată utilizată în HTML.
Când procesați o pagină HTML, ați avea un anumit rezultat, indiferent de ce a fost introdus. Procesorul HTML încearcă să înțeleagă ce a fost în document și face o ieșire pe care o consideră cea mai bună reprezentare a datelor de intrare. Acest lucru nu este adevărat vine la XML. XML utilizează un mecanism de gestionare a erorilor, care este considerat "draconian". Ori de câte ori procesorul XML întâlnește ceva pe care nu îl poate înțelege, ci doar creează un raport de eroare și întrerupe procesarea fișierului. Acest lucru vă lasă cu o casetă de eroare și fără rezultat, spre deosebire de HTML.
Pentru a le pune în perspectivă, HTML este un limbaj de marcare utilizat pentru a afișa rapid și ușor o anumită metodă de ieșire. Nu se referă la corectitudinea intrării și doar încearcă să creeze o ieșire bazată pe fișierul de intrare. XML, pe de altă parte, este un limbaj de markup foarte strict, care nu este de obicei folosit pentru a crea conținut. Utilizarea sa principală este ca o unealtă pentru crearea altor limbi de marcare care creează conținutul necesar.