XML français

De EduTech Wiki
Aller à la navigation Aller à la recherche

XML en français

Introduction

Cet article fournit une vue d'ensemble courte et plutôt non technique de XML. Voir aussi la catégorie XML pour tous les sujets liés au XML (nombreux) ou les liens de suivi dans cette vue d'ensemble.


Buts d'apprentissage

  • Comprendre le rôle du XML dans l'informatique
  • Etre capable d'identifier les principaux rôles et langages XML créés pour le Web

Conditions préalables

  • aucun

Prochaines étapes

Définition de XML

  • 'XML' signifie "Langage de balisage étendu". XML est un formalisme qui permet de définir toutes sortes de langages qui décrivent un large éventail de «contenus d'informations» (par exemple des pages Web, des graphiques vectoriels, des langages de programmation). En termes techniques, ces langages sont appelés «applications XML» ou «vocabulaires XML».
  • XML est conçu comme un texte persistant modifiable et lisible à la machine pour les données, mais il peut être lu (un peu) par les humains. XML est un formalisme ou un méta-langage. Un tel métalangage ne doit pas être confondu avec HTML, un langage pour décrire la structure des pages Web. XHTML, par exemple, est l'une des milliers d'applications XML existantes.

Voir aussi: Éditer le tutoriel XML

Histoire

  • XML est un sous-ensemble du Langage de balisage généralisé standardisé '(SGML). SGML a été utilisé pour définir le HTML, alors que XHTML est défini avec XML (C'est pourquoi les tags vides ne sont plus autorisés dans XHTML). D'un autre côté, HTML5 n'est ni basé sur SMGL ni sur XML.
  • Depuis lors, des centaines de langages XML ont été définis et quelques dizaines sont populaires et en production. Le fameux Big Picture de Ken Sall n'en énumère que quelques-uns, par ex. aucune des nombreuses IMS normes d'apprentissage en ligne n'est mentionnée.

Normes XML et Web

Actuellement, il existe des centaines de langages XML plus ou moins populaires. Dans le domaine plus restreint des standards Web, il y en a moins et nous présenterons sous peu les plus importants que les non-programmeurs comme les développeurs de contenu ou les concepteurs de sites Web devraient connaître.

XML pour un contenu Web plus riche

Initialement, XML a été pensé pour redéfinir la façon dont les contenus sont livrés. Après qu'il s'est avéré que XHTML n'a été (presque) jamais utilisé comme XML, par ex. sous la forme HTML combinée avec d'autres contenus XML. Cette vision «XML» du HTML existe toujours dans l'esprit de certaines personnes, mais la mort de XHTML 2 met un terme provisoire à cela. Le courant dominant actuel, représenté par HTML5, est un modèle centré sur les applications informatiques, c'est-à-dire que le HTML est considéré comme une plate-forme de diffusion de contenu interactif et non comme un format de document.

L'image ci-dessous montre l'idée que les documents web pourraient être composés de plusieurs composants: Dans le cas de HTML, il y a du HTML + CSS, dans le cas de HTML5 il y a du HTML + SVG intégré et du MATHML + CSS. Dans le cas de XHTML 1 ou XHTML 5, un document peut inclure n'importe quel autre langage XML, à condition que ceux-ci soient identifiés par ce que l'on appelle des espaces de noms. Bien qu'il ne soit plus populaire, nous avons également inclus SGML dans l'image, puisqu'il est la «mère» de tous les langages de balisage basés sur les balises.

Fichier:Xml-document.png
HTML ou contenu Web XML ... créé il y a plusieurs années ( DKS)

Juste pour être sûr: La mort de XHTML ne signifie nullement que XML n'est pas utilisé sur Internet. C'est juste mort comme format de page Web. D'autres formats comme SVG (vector graphics), MathML (formule mathématique), RSS (syndication de contenu) sont très utilisés aujourd'hui et le seront dans le futur.

XML comme base pour le futur Web sémantique

Le web sémantique est essentiellement défini par le cadre RDF. Alors que RDF lui-même est utilisé dans certaines régions (par exemple les formalismes métadonnées), le projet global web sémantique semble être quelque peu bloqué, à l'exception des fusées occasionnelles. Le Web 2.0 était censé être sémantique mais le Web 2.0 est devenu tout le contraire, c'est-à-dire qu'il est basé sur de simples micro-formats. Puis c'est devenu le web 3. Puis l'initiative antisémantique HTML 5 est devenue dominante et le «web sémantique» reste une «petite île» d'intérêt et d'applications.

  • Topic Maps (norme ISO) utilisé pour organiser des collections de ressources sous la forme d'un réseau sémantique (de sorte que vous ne trouvez pas seulement les arbres, mais il y a une "carte" de la forêt.
  • RDF est un langage utilisé pour décrire les relations entre les objets et il peut être utilisé pour ajouter des "métadonnées" décrivant le contenu d'une ressource.
  • OWL ("Web Ontology Language", créé avec RDF), est un formalisme qui permet la description des relations entre les choses. Il y a un lien conceptuel avec Syndication des nouvelles et le web social
  • Au cours des 15 dernières années, l'internet a fait l'objet d'un profond changement dans l'organisation de ses «espaces d'information».

XML pour machine à machine à parler

Il existe plusieurs protocoles pour l'interaction machine-à-machine comme SOAP et XML-RPC. Voir l'article service web pour plus de détails.

En outre, nous pouvons identifier:

  • Des moteurs de recherche spécialisés qui extraient le contenu de divers documents XML;
  • Des formats comme RSS ou FOAF qui sont destinés à aider à organiser des espaces d'information en réseau, comme la syndication de contenu;
    • RSS (sous ses différentes formes) permet l'échange automatique de "titres" et de "résumés" entre portails et weblogs.
    • FOAF (et d'autres formats) sont utilisés pour définir des profils d'individus qui sont ensuite utilisés pour organiser des réseaux sociaux en ligne.

XML comme formalisme pour définir des "grammaires"

Dans une perspective plus générale, XML est actuellement l'une des normes les plus populaires pour définir différents types de structures de données. On pourrait définir trois types:

  1. Accessoires XML (par exemple XML Schema)
  2. * Étendre les capacités spécifiées en XML
  3. * Destiné à un usage large et général
  4. Transducteurs XML (par exemple XSLT)
  5. * Convertit les données d'entrée XML en sortie
  6. * Associé à un modèle de traitement

Applications #XML au sens étroit (par exemple XHTML)

  1. * Définir des grammaires, des contraintes pour une classe de données XML
  2. * Destiné à un domaine d'application spécifique aussi varié que le traitement de texte, l'e-learning, la banque, le multimédia, la traduction. Des exemples bien connus sont les contenus Microsoft Office (par exemple les fichiers .docx) ou les fichiers Adobe Flash * .fla. Ces fichiers sont en fait des fichiers zip composés d'une série de documents XML. Décompressez sur ceux-ci et vous pouvez voir.

Quelques concepts XML techniques

Un document XML peut faire référence à un fichier physique, une entrée de base de données, un flux de données. En d'autres termes, techniquement parlant, un document XML est une sorte de "texte" délimité défini comme une chaîne et qui a un balisage XML à l'intérieur.


Bien-être

Un document XML est bien formé si et seulement si:

Il y a une déclaration XML appropriée au début
  • Le document commence par une déclaration XML qui inclut un numéro de version (actuellement 1.0).

<source lang = "XML"> <? xml version = "1.0"?> </ source>

Cette déclaration peut également contenir des informations encoding. Par défaut, l'encodage estUTUTF-8):

<source lang = "XML"> <? xml version = "1.0" encoding = "UTF-8"?> </ source>

Les documents XML sont hiérarchiques, c'est-à-dire que chaque élément doit se trouver à l'intérieur d'un autre élément (à l'exception du premier, le marqueur racine).

  • begin-tags et end-tags qui correspondent
  • Aucun tag ne se croisant comme

<source lang = "XML"> ... ... </ i> .... </ b> </ source>

  • Il doit y avoir une seule racine
    • Il ne peut apparaître qu'une seule fois et ne peut pas être utilisé dans d'autres éléments
Autres caractéristiques
  • XML est sensible à la casse, "LI" est 'not' "li" par exemple
  • Les étiquettes "vides" doivent être à fermeture automatique, par ex.

<source lang = "XML">
</ source>

  • Les valeurs d'attribut sont indiquées

<source lang = "XML"> <a href="http://tecfa.unige.ch:8080/xml.html"> </ source>

  • Caractères spéciaux: <, &,>, et '. Utilisez à la place (et qui inclut les URL!):

<source lang = "XML"> & amp; & amp; & amp; & aquot; & apos; </ source>


Valide

Un document XML est dit valide s'il se conforme à une sorte de grammaire appelée aussi schéma. Une grammaire XML décrit formellement une application XML (ou un vocabulaire ou un langage).

Les plus populaires sont dans cet ordre:

Les applications XML en plus des DTD peuvent inclure d'autres contraintes. Certaines applications XML peuvent inclure des langages qui ne sont pas basés sur XML (par exemple CSS ou XPath).

Les grammaires les plus populaires sont les DTD. Ci-dessous, nous incluons juste une image d'une petite grammaire (lisez les détails dans tutoriel DTD

DTD simple