Accueil |

Extensible markup language

            


XML (eXtensible Markup Language ou langage de balisage extensible) est un standard du World Wide Web Consortium qui sert de base pour créer des langages balisés spécialisés; c'est un « méta langage Â». Il est suffisamment général pour que les langages basés sur XML, appelés aussi dialectes XML, puissent être utilisés pour décrire toutes sortes de données et de textes. Il s'agit donc partiellement d'un format de fichier.

Sommaire
1 Objectifs et utilité
2 Fonctionnement
3 Règles fondamentales
4 Utilisations actuelles
5 Technologies en relation avec XML
6 Technologies dérivées de XML
7 Voir aussi
8 Liens externes

Objectifs et utilité

L'objectif initial de XML était de faciliter le partage de textes et d'informations structurés, par exemple au travers de l'internet, en séparant le contenu (les données) du contenant (la présentation des données). Il constitue une simplification de SGML bien qu'il inclue des améliorations quant à  la portabilité, notamment grace à  l'intrégration de Unicode.

Les dialectes XML (XSLT, XML Schema, XHTML, RDF, SOAP, SMIL, MathML, SVG) sont décrits de façon formelle : une structure de données simple est définie avec une DTD (Document Type Definition), une structure de données détaillée est définie avec un XML Schema ou tout autre DSDL.

Il existe des outils (qui peuvent être gratuits ou libres) permettant la manipulation de ces définitions — Processeurs XML. La disponibilité d'une syntaxe standard et d'outils de manipulation réduit significativement le coà»t du cycle de développement, permettant à  des programmes de modifier et de valider, sans connaissances préalables, des documents écrits dans ces langages. En effet, avant le succès d'un langage généraliste de description de données tel que XML, les concepteurs de logiciels avaient pour habitude de définir leurs propres formats de fichiers ou leurs propres langages pour partager les données entre programmes. Ceci nécessitait de concevoir et de programmer des analyseurs syntaxiques dédiés.

Fonctionnement

Un fichier XML est un fichier texte. L'encodage des caractères est défini dans la première déclaration du document. Par défaut il s'agit de UTF-8, une transcription binaire particulière de Unicode, format diffèrant peu de l'ASCII (sur-ensemble).

Le fichier XML est structuré en « éléments Â» à  l'aide de « balises Â» qui marquent le début et la fin de chaque élément. Les éléments peuvent contenir du texte et éventuellement d'autres éléments (le mot « élément Â» est donc trompeur). L'ensemble des données du document XML est contenu dans un élément unique appelé « racine Â», élément qui contient tous les autres éléments.

Outre les éléments et le contenu des éléments, on trouve aussi dans un document XML:

Règles fondamentales

L'efficacité de XML dépend fortement des normes strictes qui régissent sa structure. Pour être considéré comme un document XML, un document doit être « bien formé Â», c'est-à -dire qu'il doit être conforme aux règles suivantes :

Il est à  noter que XML est sensible à  la casse. Par exemple, "" est une paire bien formée alors que "" n'en est pas une.

Contrairement au HTML, les balises XML indiquent ce que signifient les données et non la façon de les afficher (du moins par principe, chaque langage basé sur XML est libre de le suivre ou non).

Quand un document XML est bien formé et conforme à  la DTD auquel il est associé, ce document est qualifié de valide.

Un document XML peut être associé à  des feuilles de style XSLT, feuilles qui permettent de générer de nouveaux documents contenants des informations provenant du document XML. Il est ainsi possible de générer des fichiers XML ayant une structure différente du document initial (transformation), mais aussi d'autres documents : requêtes SQL, pages HTML, etc. Un document XML peut aussi être affiché par certains navigateurs Web (par exemple Internet Explorer ou Mozilla) en utilisant une feuille de style CSS.

Utilisations actuelles

Le succès de XML s'explique aussi par la définition d'interfaces de programmation (API) standard pour les processeurs XML. Les API les plus largement utilisées sont :

Ces API sont les plus utilisées mais d'autres API existent, comme JDOM et dom4J pour Java

Le format des fichiers d'OpenOffice.org (suite bureautique distribuée en logiciel libre) est basé sur XML. Une grande partie de l'interface du navigateur Mozilla est construite avec des langages utilisant XML.

Technologies en relation avec XML

Technologies dérivées de XML

Voir aussi


Liens externes