Epub

De EduTech Wiki
Aller à la navigation Aller à la recherche

Cet article est une ébauche à compléter. Une ébauche est une entrée ayant un contenu (très) maigre et qui a donc besoin d'un auteur.

logo Epub

Définition

Wikipédia :

"EPUB (acronyme de « electronic publication » ou « publication électronique », parfois noté ePub, EPub ou epub) est un format ouvert standardisé pour les livres numériques. Proposé par l'International Digital Publishing Forum (IDPF)1, ces fichiers ont l'extension .epub. EPUB est conçu pour faciliter la mise en page du contenu, le texte affiché étant ajusté pour le type d'appareil de lecture. Il est également conçu comme le seul format pouvant à la fois satisfaire les éditeurs pour leurs besoins internes et la distribution. Ce format englobe le standard Open eBook2."

EPUB repose sur XHTML et XML, et utilise les feuilles de style CSS. Le tout est compressé dans une archive .zip unique. Les métadonnées sont définies selon la norme Dublin Core.

Format de Epub 2

Le format ePub est défini avec Relax NG mais repose sur d'autres standards aussi.

Vue générale

Les spécifications ePub 2.0 viennent en trois parties:

(1) La publication ouverte de la structure (OPS) - 09/11/07
  • La publication ouverte 2.0 (OPS) est un standard basé sur XML pour la création de publications numériques. Les contenus peuvent être marqués soit avec un sous-ensemble de XHTML ou Daisy DTBook.
  • L' ouverture du packaging du format (OPF) 2.0 décrit la structure d'un Epub en XML
(2) L'ouverture du conteneur du format - 10/27/06
  • Le Format OPS de conteneurs 1.0 (OCF) est une norme basée sur le zip utilisée pour encapsuler les composants de publication pour le transfert et le téléchargement.

Les contenus ePub peuvent être contrôlée par des DRM, mais il ne doit pas ...

ePub 2.01 utilise les formats suivants:

  • Open Publication Structure (OPS) 2.0.1
  • Open Packaging Format (OPF) 2.0.1
  • Open Container Format (OCF) 2.0.1

Le conteneur et le packaging

Le fichier * .epub zip par exemple:

Si nous créons une version e-pub de cette page nous obtenons un fichier appelé xxx.epub. Ce fichier epub * est un fichier zip OCF. Voici la structure:

edutechwiki_epub.epub (the zip file)
META-INF folder
container.xml
OPS folder
fonts folder (includes ttf fonts used)
content1.xhtml
content.opf
style.css
image_name1
image_name2
....
Mimetype

Ce genre de structure de packaging suit une philosophie tout à fait similaire au standard IMS Content Packaging. Un fichier zip contient un fichier XML central (content.opf) qui comprend la définition de l'organisation (la «colonne vertébrale», Angl. "spine") et les métadonnées. Il inclut alors tous les atouts nécessaires pour le rendu.

Le "Mimetype", c'est à dire le contenu du 'Mimetype' , est 'application / epub + zip' .

Décrivons maintenant certains de ses fichiers:

Open Packaging Format (OPF)

Le fichier 'content.opf' décrit et organise les différents éléments de contenu du paquet epub. Il fournit également des métadonnées de la publication, les mécanismes de repli lorsque les extensions non prises en charge sont utilisées, et une table des matières.

Par exemple un contenu fait avec un convertisseur en ligne automatique pour cette page ressemble à ceci:

<?xml version='1.0' encoding='UTF-8'?>
<package xmlns:dc="http://purl.org/dc/elements/1.1/"
         xmlns="http://www.idpf.org/2007/opf" version="2.0" unique-identifier="bookid">
  <metadata>
    <dc:title>EPub</dc:title>
    <dc:identifier id="bookid">web2fb2_200904221954_3347363837</dc:identifier>
    <dc:language>En</dc:language>
    <dc:creator>Daniel K. Schneider</dc:creator>
    <dc:type>reference</dc:type>
  </metadata>
  <manifest>
    <item id="css" href="style.css" media-type="text/css"/>
    <item id="content1" href="content1.xhtml" media-type="application/xhtml+xml"/>
    <item id="i0ced13f269" href="i0ced13f269" media-type="image/png"/>
    <item id="ib166f0f69c" href="ib166f0f69c" media-type="image/png"/>
    <item id="i7fa52f212a" href="i7fa52f212a" media-type="image/png"/>
    <item id="i33954a4ae2" href="i33954a4ae2" media-type="image/png"/>
    <item id="i8be224f209" href="i8be224f209" media-type="image/png"/>
  </manifest>
  <spine>
    <itemref idref="content1"/>
  </spine>
</package>
(1) The manifest

This manifest (like in IMS content packaging) must include all files that are part of the publication in any order. It must have a structure like this according to the specification. I.e. each item must have an id, an href to a resource and a media-type. In addition, one can define fall-back elements. (comme dans IMS contenu du packaging) doit inclure 'tous les fichiers' qui font partie de la publication dans n'importe quel ordre. Il doit avoir une structure conformément à la spécification. C'est à dire que chaque élément doit avoir un identifiant, un href lié à une ressource et un type de média. En outre, on peut définir des éléments de repli.

 <manifest>
        <item id="intro" href="introduction.html"
                media-type="application/xhtml+xml" />
        <item id="c1" href="chapter-1.html"
                media-type="application/xhtml+xml" />
        <item id="c2" href="chapter-2.html"
                media-type=application/xhtml+xml" />
        <item id="toc" href="contents.xml"
                media-type="application/xhtml+xml"
                fallback="fall1"  />
        <item id="oview" href="arch.png"
                media-type="image/png" />
        <item id="fall1" fallback="fall2"
                href="SomeDoc.pdf"
                media-type="application/pdf" />
 </manifest>
(2) La section de la colonne vertébrale

“Suivant le manifeste, il doit y avoir un et un seul élément de la colonne vertébrale, qui contient un ou plusieurs éléments itemref. Chaque itemref fait référence à un document contenu OPS désigné dans le manifeste. L'ordre des éléments itemref organise le contenu des documents associés (OPS) dans l'ordre de lecture linéaire de la publication.” (ouvert packaging Format (OPF) spécification 2.0). Cette 'colonne vertébrale' (qu'on pourrait traduire par le terme «parties») peut inclure trois différents types de fichiers:

  • XHTML
  • XML (le vôtre, ce est ce qu'ils appellent hors ligne XML
  • DTBook

Les éléments de la colonne vertébrale se réfèrent à des ressources définies dans le manifeste et peuvent inclure une table des matières. Par exemple, un exemple simple ressemblerait à ceci:

<manifest>
     <item id="intro"
           href="intro.html"
           media-type="application/xhtml+xml" />
     <item id="chap1"
           href="chap1.html"
           media-type="application/xhtml+xml" />
     <item id="chap2"
           href="chap2.dtb"
           media-type="application/x-dtbook+xml" />
     <item id="chap3"
           href="chap3.html"
           media-type="application/xhtml+xml" />
     <item id="f1"
           href="fig1.jpg"
           media-type="image/jpeg" />

     <!--  ...... other multimedia assets here .... -->

     <item id="toc_item"
           href="toc.ncx"
           media-type="application/x-dtbncx+xml" />
</manifest>

<spine toc="toc_item">
     <itemref idref="intro" />
     <itemref idref="chap1" />
     <itemref idref="chap2" />
     <itemref idref="chap3" />
</spine>
(3) La section des métadonnées

The metadata are defined using Dublin Core plus possible user-defined tags. Some of these metadata are mandatory, i.e. title, identifier and language.

Les métadonnées sont définies en utilisant Dublin Core avec des tags possibles définies par l'utilisateur. Certaines de ces métadonnées sont 'obligatoires' , c'est-à-dire le titre, l'identifiant et la langue.

Autres remarques

Les fichiers XHTML peuvent comprendre divers formats, par exemple les images binaires, SVG et XML en ligne. Tous ces formats peuvent être stylisés avec un sous-ensemble de CSS2.

Cet ouverture du packaging du format (OPF) 2,0 v0.9871.0 est défini comme un schéma RELAX NG.

Fichiers META-INF dans le package epub

Tous conteneurs OCF valides 'doivent' comprendre un répertoire appelé META-INF au niveau du système de fichier racine. Ce répertoire contient les fichiers spécifiés ci-dessous qui décrivent le contenu, les métadonnées, les signatures, le chiffrement, les droits et d'autres renseignements concernant la publication contenue. (OCF 1.0 de la spécification, récupéré 19h17, le 22 Avril 2009 (UTC)).


Le 'container.xml' fichier décrit dans un cas simple où trouver le fichier content.opf. Dans notre exemple simple, il ressemble à ceci:

<?xml version="1.0"?>
<container version="1.0" xmlns="urn:oasis:names:tc:opendocument:xmlns:container">
  <rootfiles>
    <rootfile full-path="OEBPS/content.opf" media-type="application/oebps-package+xml"/>
  </rootfiles>
</container>

Un autre exemple tiré de l'émission OCF 1.0 spécification que l'on pourrait inclure un fichier PDF alternative, pour exemple:

<?xml version="1.0"?>
<container version="1.0" xmlns="urn:oasis:names:tc:opendocument:xmlns:container">
  <rootfiles>
    <rootfile full-path="OEBPS/My Crazy Life.opf"
     media-type="application/oebps-package+xml" />
    <rootfile full-path="PDF/My Crazy Life.pdf"
     media-type="application/pdf" />
  </rootfiles>
</container>

En plus de container.xml, il peut y avoir cinq autres fichiers:

  • manifest.xml
  • metadata.xml
  • signatures.xml
  • encryption.xml
  • rights.xml

The formal specification of these files in META-INF is done with a little Relax NG schema:

  • There is one rule for container (see the examples above).
  • One rule for signatures and that includes the xmldsig-core-schema.rng Schema
  • One rule for encryption that also refers to extenal *.rng Schemas.

La spécification formelle de ces fichiers dans META-INF est fait avec un peu le schéma Relax NG :

  • Il ya une règle pour contenant (voir les exemples ci-dessus).
  • Une règle pour signatures et qui comprend la xmldsig-core-schema.rng Schema
  • Une règle pour chiffrement qui se réfère également aux schémas externe *.rng.

Les modules XHTML utilisés dans l'OPS

Suite de ce point à traduire, voir l'article original sur EduTechWiki anglais : ici

Comparaison entre ePub et PDF

Pourquoi utiliser le format ePub alors que le PDF est plus répandu ?

Voici quelques points de comparaison entre le ePub et le PDF:

  • le format ePub est un format ouvert standardisé.
  • les PDF sont bien plus utilisés que les ePub.
  • les documents ePub s'adaptent au support (taille/type de police, etc.) alors que les PDF sont des images statiques (mise en page fixe).
  • il existe des outils annoter les PDF alors qu'il n'existe pas d'outils pour le Epub (au niveau des liseuses ou players)
  • le format ePub est basé sur des spécifications existantes (XHTML, HTML5, CSS, XML, etc.)

Source: Blog de lisaleger

Logiciels

Edition

  • La Poule ou l'oeuf édition en ligne de fichiers ePub (entre autres). Lutèce d'Or 2008 dans la catégorie "Meilleur projet d'innovation et de développement Libre réalisé"
  • Jutoh, commercial, $39. La version démo contient une pub et elle est limitée à 20 documents.

Conversion de document vers Epub

  • Calibre est une solution tout en un pour vos Ebooks. Gratuit, open source, et multi-platforme fonctionne bien sous Linux, OS X et Windows.Calibre. Vous pouvez par exemple produire un fichier ou un dossier HTML avec eXe, puis l'importer ou encore écrire un texte en Word.
  • Alinea. Alkinea is a simple yet highly effective free software to convert books from OpenOffice (or LibreOffice) to Kindle and ePub. (libre)
  • Atlantis Word Processor convertit n'importe quel document vers EPUB. Supporte multilevel TOCs, font embedding, and batch conversion.
  • eCub (produit mort) de Julian Smart: EPUB and MobiPocket ebook createur, simple à utiliser.
  • Pandoc: Pandoc est un convertisseur de document universel. C'est le couteau suisse de la conversion. Il permet, entre autres, de convertir des fichiers html en epub. Bien qu'il ne fonctionne que via la ligne de commande, il est simple à utiliser et très flexible. Voir la documentation pour une liste complète des commandes et options.

Convertisseur en ligne

  • Ebook.online-convert.com site web pour convertir des fichiers à EPUB. Il est possible de charger les documents, indiquez l'URL de fichier ou bien sélectionnez un fichier dans l'espace de stockage (dropbox et google docs). Ce convertisseur ePub prend en charge une grande variété de formats, par exemple PDF, MOBI, LIT, LRF, DOC, HTML à EPUB et bien plus encore.

Discussion autour du format Epub

L'acceptation générale des ebooks a conduit de nombreuses entreprises à sauter dans le train numérique avec l'introduction de leurs propres lecteurs eBook. Cependant, l'offre de la plupart de ces établissements n'avait alors pas de norme unifiée. L'avènement de EPUB a été un effort dans la bonne direction visant à établir une norme pour la publication numérique, le format pouvant être utilisé dans une variété de dispositifs.

Le format est ouvert et a actuellement le vent en poupe. Il connait un essor considérable depuis le succès des tablettes numériques. L'un des nombreux avantages de ce format (par rapport à d'autres formats portables comme le PDF) est la mise en page adaptable à la largeur de la liseuse (sur un petit écran on va pouvoir augmenter la taille des caractères sans avoir besoin de jouer avec un ascenseur horizontal par exemple).

Avantage Epub

  • Standard Unifié.
  • Format ouvert: Contrairement à certains autres formats ebook populaires; EPUB est un outil standard ouvert qui signifie qu'il peut être utilisé par presque tout le monde; d'auteurs individuels aux grands éditeurs, sans le risque d'être poursuivi en justice ou de payer des frais importants.
  • Gouvernance indépendante: le format est régi de manière indépendante, ce qui signifie qu'il n'y a pas de d'entreprise attendant de bénéficier du succès de ce format. En outre, le format n'est pas rattaché à un produit commercial spécifique. Ainsi, un fichier créé avec EPUB peut être utilisé sur une pléthore d'appareils.
  • Adaptation du texte à l'écran : EPUB à une fonction unique qui permet de redimensionner les livres à la taille de l'écran sur lequel est consulté l'information. Si vous utilisez un écran tablette 10,1 pouces ou un écran de 3,5 pouces de téléphone cellulaire, vous serez capable de lire un livre électronique qui a été publié par l'utilisation d'EPUB.
  • Compatibilité: EPUB repose sur XHTML et XML, et peut être utilisé avec une variété de logiciels. En outre, les plates-formes qui utilisent déjà XML peuvent facilement être transférés à l'EPUB. Un autre avantage est que EPUB est livré dans un fichier zip unique, dans lequel une archive est créé pour stocker les fichiers de l'organisation et le contenu d'un ebook.


Inconvénient Epub

  • Avoir des connaissances techniques minimum. Être familier avec la syntaxe de XML et XHTML et avoir besoin de savoir comment créer une feuille de style CSS pour créer des fichiers valides.
  • Avoir un logiciel de lecture dédié au format ePub.

Liens externes

Officiel

Autres

EduTechWiki