Epub
Cet article est une ébauche à compléter. Une ébauche est une entrée ayant un contenu (très) maigre et qui a donc besoin d'un auteur.
Définition
Wikipédia :
- "EPUB (acronyme de « electronic publication » ou « publication électronique », parfois noté ePub, EPub ou epub) est un format ouvert standardisé pour les livres numériques. Proposé par l'International Digital Publishing Forum (IDPF)1, ces fichiers ont l'extension .epub. EPUB est conçu pour faciliter la mise en page du contenu, le texte affiché étant ajusté pour le type d'appareil de lecture. Il est également conçu comme le seul format pouvant à la fois satisfaire les éditeurs pour leurs besoins internes et la distribution. Ce format englobe le standard Open eBook2."
EPUB repose sur XHTML et XML, et utilise les feuilles de style css. Le tout est compressé dans une archive .zip unique. les métadonnées sont définie selon la norme Dublin Core
Format
Le format ePub est défini avec Relax NG mais se repose sur d'autres standards aussi.
Vue générale
Les spécifications ePub 2.0 viennent en trois parties:
- (1) La publication ouverte de la structure (OPS) - 09/11/07
- La publication ouverte 2.0 (OPS) est un standard basé sur XML pour la création de publications numériques. Les contenus peuvent être marqués soit avec un sous-ensemble de XHTML ou Daisy DTBook.
- L' ouverture du packaging du format (OPF) 2.0 décrit la structure d'un Epub en XML
- (2) L'ouverture du conteneur du format - 10/27/06
- Le Format OPS de conteneurs 1.0 (OCF) est une norme basée sur le zip utilisé pour encapsuler les composants de publication pour le transfert et le téléchargement.
Le contenu ePub peuvent être contrôlée par des DRM, mais il ne doit pas ...
ePub 2.01 utilise les formats suivants:
- Open Publication Structure (OPS) 2.0.1
- Open Packaging Format (OPF) 2.0.1
- Open Container Format (OCF) 2.0.1
Le conteneur et le packaging
Le fichier * .epub zip par exemple:
Si nous créons une version e-pub de cette page nous obtenons un fichier appelé xxx.epub. Ce fichier epub * est un fichier zip OCF. Voici la structure:
- edutechwiki_epub.epub (the zip file)
- META-INF folder
- container.xml
- OPS folder
- fonts folder (includes ttf fonts used)
- content1.xhtml
- content.opf
- style.css
- image_name1
- image_name2
- ....
- Mimetype
- META-INF folder
That kind of packaging structure follows quite a similar philosophy as the IMS Content Packaging standard. I.e. a zip file includes a central xml file (content.opf) that includes the definition of organization (the "spine") and the metadata. It then includes all the assets needed for rendering.
Ce genre de structure de packaging suit une philosophie tout à fait similaire au standard IMS Content Packaging. Un fichier zip contient un fichier xml central (content.opf) qui comprend la définition de l'organisation (la «colonne vertébrale») et les métadonnées. Il inclue alors tous les atouts nécessaires pour le rendu.
Le "Mimetype", c'est à dire le contenu du 'Mimetype' est 'application / epub + zip' .
Décrivons maintenant certains de ses fichiers:
L'ouverture du Packaging du format (OPF)
Fichier 'content.opf' décrit et organise les différents éléments de contenu du paquet epub. Il fournit également des métadonnées de la publication, les mécanismes de repli lorsque les extensions non prises en charge sont utilisées, et une table des matières.
Par exemple un exemple fait avec un convertisseur en ligne automatique pour cette page ressemble à ceci:
<?xml version='1.0' encoding='UTF-8'?>
<package xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns="http://www.idpf.org/2007/opf" version="2.0" unique-identifier="bookid">
<metadata>
<dc:title>EPub</dc:title>
<dc:identifier id="bookid">web2fb2_200904221954_3347363837</dc:identifier>
<dc:language>En</dc:language>
<dc:creator>Daniel K. Schneider</dc:creator>
<dc:type>reference</dc:type>
</metadata>
<manifest>
<item id="css" href="style.css" media-type="text/css"/>
<item id="content1" href="content1.xhtml" media-type="application/xhtml+xml"/>
<item id="i0ced13f269" href="i0ced13f269" media-type="image/png"/>
<item id="ib166f0f69c" href="ib166f0f69c" media-type="image/png"/>
<item id="i7fa52f212a" href="i7fa52f212a" media-type="image/png"/>
<item id="i33954a4ae2" href="i33954a4ae2" media-type="image/png"/>
<item id="i8be224f209" href="i8be224f209" media-type="image/png"/>
</manifest>
<spine>
<itemref idref="content1"/>
</spine>
</package>
- (1) The manifest
This manifest (like in IMS content packaging) must include all files that are part of the publication in any order. It must have a structure like this according to the specification. I.e. each item must have an id, an href to a resource and a media-type. In addition, one can define fall-back elements. (comme dans IMS contenu du packaging) doit inclure 'tous les fichiers' qui font partie de la publication dans ne importe quel ordre. Il doit avoir une structure comme ceci conformément à la spécification. C'est à dire que chaque élément doit avoir un identifiant, un href lié à une ressource et un type de média. En outre, on peut définir des éléments de repli.
<manifest>
<item id="intro" href="introduction.html"
media-type="application/xhtml+xml" />
<item id="c1" href="chapter-1.html"
media-type="application/xhtml+xml" />
<item id="c2" href="chapter-2.html"
media-type=application/xhtml+xml" />
<item id="toc" href="contents.xml"
media-type="application/xhtml+xml"
fallback="fall1" />
<item id="oview" href="arch.png"
media-type="image/png" />
<item id="fall1" fallback="fall2"
href="SomeDoc.pdf"
media-type="application/pdf" />
</manifest>
- (2) La section de la colonne vertébrale
“Suivant le manifeste, il doit y avoir un et un seul élément de la colonne vertébrale, qui contient un ou plusieurs éléments itemref. Chaque itemref fait référence à un document contenu OPS désigné dans le manifeste. L'ordre des éléments itemref organise le contenu des documents associés (OPS) dans l'ordre de lecture linéaire de la publication.” (ouvert packaging Format (OPF) spécification 2.0). Cette 'colonne vertébrale' (qu'on pourrait traduire par le terme «parties») peut inclure trois différents types de fichiers:
- XHTML
- XML (le vôtre, ce est ce qu'ils appellent hors ligne XML
- DTBook
Les éléments de la colonne vertébrale se réfèrent à des ressources définies dans le manifeste et peuvent inclure une table des matières. Par exemple, un exemple simple ressemblerait à ceci:
<manifest>
<item id="intro"
href="intro.html"
media-type="application/xhtml+xml" />
<item id="chap1"
href="chap1.html"
media-type="application/xhtml+xml" />
<item id="chap2"
href="chap2.dtb"
media-type="application/x-dtbook+xml" />
<item id="chap3"
href="chap3.html"
media-type="application/xhtml+xml" />
<item id="f1"
href="fig1.jpg"
media-type="image/jpeg" />
<!-- ...... other multimedia assets here .... -->
<item id="toc_item"
href="toc.ncx"
media-type="application/x-dtbncx+xml" />
</manifest>
<spine toc="toc_item">
<itemref idref="intro" />
<itemref idref="chap1" />
<itemref idref="chap2" />
<itemref idref="chap3" />
</spine>
- (3) La section des métadonnées
The metadata are defined using Dublin Core plus possible user-defined tags. Some of these metadata are mandatory, i.e. title, identifier and language.
Les métadonnées sont définies en utilisant Dublin Core avec des tags possibles définies par l'utilisateur. Certaines de ces métadonnées sont 'obligatoires' , c'est-à-dire le titre, l'identifiant et la langue.
- Autres remarques
Les fichiers XHTML peuvent comprendre divers formats, par exemple les images binaires, SVG et XML en ligne. Tous ces formats peuvent être stylisés avec un sous-ensemble de CSS2.
Cet ouverture du packaging du format (OPF) 2,0 v0.9871.0 est défini comme un schéma RELAX NG.
Fichiers META-INF dans le package epub
Tous conteneurs OCF valident 'doit' comprendre un répertoire appelé META-INF au niveau du système de fichier conteneur racine. Ce répertoire contient les fichiers spécifiés ci-dessous qui décrivent le contenu, les métadonnées, les signatures, le chiffrement, les droits et d'autres renseignements concernant la publication contenue. (OCF 1.0 de la spécification, récupéré 19h17, le 22 Avril 2009 (UTC)).
Le 'container.xml' fichier décrit dans un cas simple où trouver le fichier content.opf. Dans notre exemple simple, il ressemble à ceci:
<?xml version="1.0"?>
<container version="1.0" xmlns="urn:oasis:names:tc:opendocument:xmlns:container">
<rootfiles>
<rootfile full-path="OEBPS/content.opf" media-type="application/oebps-package+xml"/>
</rootfiles>
</container>
Un autre exemple tiré de l'émission OCF 1.0 spécification que l'on pourrait inclure un fichier PDF alternative, pour exemple:
<?xml version="1.0"?>
<container version="1.0" xmlns="urn:oasis:names:tc:opendocument:xmlns:container">
<rootfiles>
<rootfile full-path="OEBPS/My Crazy Life.opf"
media-type="application/oebps-package+xml" />
<rootfile full-path="PDF/My Crazy Life.pdf"
media-type="application/pdf" />
</rootfiles>
</container>
En plus de container.xml, il peut y avoir cinq autres fichiers:
- manifest.xml
- metadata.xml
- signatures.xml
- encryption.xml
- rights.xml
The formal specification of these files in META-INF is done with a little Relax NG schema:
- There is one rule for container (see the examples above).
- One rule for signatures and that includes the xmldsig-core-schema.rng Schema
- One rule for encryption that also refers to extenal *.rng Schemas.
La spécification formelle de ces fichiers dans META-INF est fait avec un peu le schéma Relax NG :
- Il ya une règle pour contenant (voir les exemples ci-dessus).
- Une règle pour signatures et qui comprend la xmldsig-core-schema.rng Schema
- Une règle pour chiffrement qui se réfère également aux schémas externe *.rng.
Les modules XHTML utilisés dans l'OPS
Suite de ce point à traduire, voir l'article original sur EduTechWiki anglais : ici
Comparaison entre ePub et PDF
Pourquoi utiliser le format ePub alors que le PDF est plus répandu ?
Voici quelques points de comparaison entre le ePub et le PDF:
- le format ePub est un format ouvert standardisé.
- les PDF sont bien plus utilisés que les ePub.
- les documents ePub s'adaptent au support (taille/type de police, etc.) alors que les PDF sont des images statiques (mise en page fixe).
- il est possible d'annoter les PDF alors qu'il n'existe pas de fonction d'édition pour les ePub.
- le format ePub est basé sur des spécifications existantes (XHTML, etc.)
Source: Blog de lisaleger
Logiciels
Edition
- Sigil semble être le meilleur éditeur gratuit. http://code.google.com/p/sigil/
- La Poule ou l'oeuf édition en ligne de fichiers ePub (entre autres). Lutèce d'Or 2008 dans la catégorie "Meilleur projet d'innovation et de développement Libre réalisé"
- Jutoh, commercial, $39. La version démo contient une pub et elle est limitée à 20 documents.
Conversion de document vers Epub
- Calibre est une solution tout en un pour vos Ebooks. Gratuit, open source, et multi-platforme fonctionne bien sous Linux, OS X et Windows.Calibre. Vous pouvez par exemple produire un fichier ou un dossier HTML avec eXe, puis l'importer ou encore écrire un texte en Word.
- Atlantis Word Processor convertit n'importe quel document vers EPUB. Supporte multilevel TOCs, font embedding, and batch conversion.
- eCub (produit mort) de Julian Smart: EPUB and MobiPocket ebook createur, simple à utiliser.
Convertisseur en ligne
- Web2FB2 page web pour convertir F3B and EPUB. (testé mai 2012).
Discussion autour du format Epub
L'acceptation générale des ebooks à conduit de nombreuses entreprises à sauter dans le train numérique avec l'introduction de leurs lecteurs propre eBook. Cependant, l'offre de la plupart de ces établissements n'avait alors pas de norme unifiée. L'avènement de EPUB a été un effort dans la bonne direction visant à établir une norme pour la publication numérique, le format pouvant être utilisé dans une variété de dispositifs.
Le format est ouvert et a actuellement le vent en poupe. Il connait un essor considérable depuis le succès des tablettes numériques. L'un des nombreux avantages de ce format (par rapport à d'autres formats portables comme le PDF) est la mise en page adaptable à la largeur de la liseuse (sur un petit écran on va pouvoir augmenter la taille des caractères sans avoir besoin de jouer avec un ascenseur horizontal par exemple).
Avantage Epub
- Standard Unifiée.
- Format ouvert: Contrairement à certains autres formats ebook populaire; EPUB est un outil standard ouvert qui signifie qu'il peut être utilisé par presque tout le monde; d'auteurs individuels aux grands éditeurs, sans le risque d'être poursuivi en justice ou de payer des frais importants.
- Gouvernance indépendante: le format est régi de manière indépendante, ce qui signifie qu'il n'y a pas de d'entreprise attendant de bénéficier du succès de ce format. En outre, le format n'est pas rattaché à un produit commmercial spécifique. Ainsi, un fichier créé avec EPUB peut être utilisé sur une pléthore d'appareils.
- Adaptation du texte à l'écran : EPUB à une fonction unique qui permet de redimensionner les livres à la taille de l'écran sur lequel est consulté l'information. Si vous utilisez un écran tablette 10,1 pouces ou un écran de 3,5 pouces de téléphone cellulaire, vous serez capable de lire un livre électronique qui a été publié par l'utilisation d'EPUB.
- Compatibilité: EPUB repose sur XHTML et XML, et peut être utilisé avec une variété de logiciels. En outre, les plates-formes qui utilisent déjà XML peuvent facilement être transférés à l'EPUB. Un autre avantage est que EPUB est livré dans un fichier zip unique, dans lequel une archive est créée pour stocker les fichiers de l'organisation et le contenu d'un ebook.
Inconvénient Epub
- Avoir des connaissances techniques minimum. Etre intime avec la syntaxe de XML et XHTML et avoir besoin de savoir comment créer une feuille de style CSS pour créer des fichiers valides.