DTD

De EduTech Wiki
Aller à la navigation Aller à la recherche

Définition

Document Type Definition (DTD) est un langage de schéma pour SGML et XML. Une DTD représente une structure/grammaire. Elle définit les entités, les éléments et leurs contenus ainsi que les attributs des éléments. Elle définit l'ordre dans lequel les éléments doivent être insérés, leurs emboîtements mais également les conditions d'utilisation d'un élément (par exemple, s'il est obligatoire ou facultatif).

Une DTD peut être incluse dans un document XML :

                   <!DOCTYPE name SYSTEM "travaux.dtd" [déclaration]> 
                        * name          = nom du type de document
                        * SYSTEM ".dtd" = référence vers un fichier DTD qui contient tout ou une partie de la DTD.
                        * [déclaration] = DTD interne au xml. Cette partie peut contenir la totalité de la DTD
                                           ou seulement une partie.

La DTD peut également être externe au document XML et être référencée :

                         <!DOCTYPE nom_du_type_de_docmuent SYSTEM "fichierDTD.dtd">

La validité d’un document XML est au regard de la DTD qu’il référence ou qu’il inclut. On parlera alors de document XML valide. Un document doit être conforme aux spécifications définies dans la DTD qui lui est associée afin qu'il puisse être traité pour l'affichage.

Voir aussi: Tutoriel_DTD

Qu'est-ce que fait une DTD

  • Elle définit les éléments qui peuvent et/ou doivent être utilisés à l'intérieur d'un document. Il est obligatoire d'utiliser les éléments qui sont définis au préalable et pas d'autres. La DTD crée donc une sorte de dictionnaire pour les fichiers qu'elle l'utilisera.

Contenu d'une DTD

Les DTD sont composées d'entités, d'éléments et de leur contenu, et des attributs des éléments. Il est fortement conseillé de commenter les DTD pour qu'elles puissent être comprises et qu'elles soient reproductibles.

Les entités

  • Il s'agit d'un couple : nom, valeur
  • Il existe des entités internes. Elles ont des valeurs de chaînes de caractères et sont utilisées comme moyen d’abréviation. ex: &amp ; (amp, &) (&amp est le caractère HTML pour représenter '&'
  • Les entités externes de type XML sont utilisées pour segmenter un document.
  • Déclaration : < !ENTITY nom « valeur »>
  • Exemple entité externe :
                        <!DOCTYPE livre [
                        <!ENTITY chapitre-1 SYSTEM "./chap1.xml">   les 2 entités séparent le livre
                        <!ENTITY chapitre-2 SYSTEM "./chap2.xml">
                        ]>
                        <livre>
                           &chapitre-1;                             code XML utilisant les entités
                           &chapitre-2;
                        </livre>


Les éléments

  • Déclaration des éléments : < !ELEMENT nom modèle>
             nom = nom de l'élément
             modèle = définit le type du contenu de l'élément

Contenu d'un élément: Chaque élément doit être défini par un contenu pour qu'il soit utilisable. Différents contenus différents sont possibles:

  • Un ou plusieurs éléments "enfants": pour le décrire, il suffit de donner leur nom entre parenthèse. Ex :<!ELEMENT livre (titre)>
  • Des données libres (chaîne de caractères) : définit avec #PCDATA. Ex : <!ELEMENT nom (#PCDATA)>
  • Un mélange d'éléments "enfants" et de données est également possible : Ex : <!ELEMENT commentaire ( ul | #PCDATA)>
  • Éléments vides

Si l'ordre dans lequel il faut insérer les éléments est important, il faut les séparer avec des virgules ',' sinon il faut les séparer avec des barres verticales '|'.

Multiplicité des fils : Pour définir les spécificités propres aux éléments, il convient d'ajouter les signes suivants:

  • fils = l'élément ne doit être inséré qu'une et une seule fois
  • fils? = l'élément est facultatif mais s'il est présent il ne doit l'être qu'une seule fois (0 ou 1 fois)
  • fils* = l'élément est une option et peut être utilisé 0, 1 ou plusieurs fois
  • fils+ = l'élément doit être inséré au moins 1 fois sans limite maximale
  • (fils, fille)* = les éléments peuvent être regroupés dans des parenthèses pour éviter la répétition.

Les attributs

La déclaration : < !ATTLIST element (attribut type default)>

  • element : correspond au nom de l'élément qui contient l'attribut
  • attribut : correspond au nom de l'attribut
  • type : type de l'attribut soit CDATA (chaine de caractère) soit une entité
  • default: contient des indications sur la valeur par défaut de l'attribut. Cette valeur peut être : #required (valeur obligatoire), #implied (optionnel) ou #fixed (l'attribut est une constante)

Exemple de document valide

Vous pouvez trouver des validateurs de DTD sur le web, par exemple [1].

Par exemple, le document XML suivant est valide selon la DTD définie plus bas.

  
     <?xml version="1.0" encoding="UTF-8"?>
     <!DOCTYPE liste_personnes SYSTEM "exemple.dtd">
     <personnes>
      <individu sexe="femme">
       <nom>
        <prenom>Jane</prenom>
        <deuxieme_n>Jean</deuxieme_n>
        <n_famille>Doe</n_famille>
        <n_jeunefille></n_jeunefille>
     </nom>
    </individu>
   <personnes>
  

DTD correspondante:

  
   <!ELEMENT personnes (individu*)> // une ou plusieurs personnes doivent apparaître dans cette liste
   <!ELEMENT individu (nom)> // l'élément individu doit avoir un seul élément nom
   <!ATTLIST individu  sexe CDATA #REQUIRED> //l'élément personne doit avoir un attribut sexe
   <!ELEMENT nom (prenom, deuxieme_n?, n_famille, n_jeunefille?)> //le deuxième nom et le nom de jeune fille 
                                                                    sont optionnels
   <!ELEMENT prenom (#PCDATA)>
   <!ELEMENT deuxieme_n (#PCDATA)>
   <!ELEMENT n_famille (#PCDATA)>
   <!ELEMENT n_jeunefille (#PCDATA)>
 

Différence entre DTD, HTML et CSS

La DTD et le code XML décrivent le contenu et ses expressions syntaxique. Il s'agit d'un langage descriptif. Ils ne permettent pas de décrire la forme ou le style contrairement au code [[HTML | HTML] ou XHTML qui fournissent des options de formatage.

Le style et le format du document est défini lors du traitement grâce au CSS ou XSLT.


Des logiciels d'interprétation peuvent être utilisés pour transformer le document "structuré" en différents formats y compris des pages web en HTML (hypertext markup language) ou directement en XML (extensible markup language).

Voir le Tutoriel_DTD pour plus de détails.

Alternatives

  • XML Schema - un standard W3C
  • Relax NG - un langage de schéma plus facile et plus intuitif par rapport à l'XML

Utilisation des DTD dans l'éducation

turri0

Les DTD et les autres langages de schéma se prêtent particulièrement bien à certaines activités d'enseignement et à des scénarios pédagogiques qui impliquent la construction individuelle ou en collaboration des représentations de la connaissance et des besoins, de la création d'ontologies ou la définition de rubriques.

Par exemple, le département d'Anglais de l'University of Georgia a demandé à ses étudiants en rédaction de créer, en collaborant entre eux, leurs propres DTD à partir de patrons décrivant les composants et les critères d'évaluation pour différents genres littéraires comme l'écriture argumentative, narrative ou encore l'exposé.

Les langages pour la modélisation dans le cadre de l'éducation sont plutôt définis avec Relax NG ou XML Schema.

References