XML dans les traitements de texte

Cet article de Patrick Peccatte arrive à point nommé…
XML et les formats de traitement de texte et de mise en page, octobre 2006.

Dès 1994, certaines de nos interventions en entreprise visaient le développement des compétences des « auteurs de l’entreprise, aux « fonctions évoluées du traitement de texte et à la production de documents structurés » ; nous les initions alors « aux évolutions documentaires et plus particulièrement au concept de bibliothèque électronique ». Dans la foulée en 1996, se mettaient en place des modèles de documents (rapports, compte-rendus d’expérimentation, de réunion, points de décision…) pour assister les auteurs ou leurs assistant(e)s  à la production de documents avec l’objectif de mettre en cohérence cette production, et d’intégrer automatiquement ces éléments de données (on ne disait pas métadonnées à cette époque) dans des bases de gestion et recherche documentaires (objectif atteint).
Mais tout cela avec les moyens du bord : les macros et modèles des logiciels de traitement de texte, un ou deux scripts…Les outils SGML étaient réservés à l’édition, la grande Edition.

Puis XML, en 1998, est arrivé.

En 2002, XML a fait son entrée dans les traitements de texte avec ODF (Open Document Format) d’Open Office. ODF est depuis Mai 2006 une norme ISO. Quant au format de Microsoft, OpenXML, il sera présent dans la suite Office 2007. Nous voici donc en présence de deux formats faisant la même chose, mais en concurrence …
Parallèlement, des DTD ou des schémas « métiers » se sont créés, prenant une place importante dans certains environnement comme NewsML dans le milieu de la presse ou la TEI pour les textes électroniques dans le milieu universitaire. On peut également citer le
projet ERELE, Etudes et Rapports Electroniques de l’Equipement du
Ministère de l’Equipement.

Toutes ces questions assez techniques, sont difficiles à suivre.
C’est dans ce contexte que Patrick Peccatte de Soft Experience a conduit une étude pour l’Ifra dont les résultats seront diffusés sur CampusXML. Il nous livre ici une analyse, spécialisée mais de lecture facile, qui aborde à la fois l’évolution – hier, aujourd’hui et dans la conclusion, l’avenir proche – des caractéristiques XML des traitements de texte Word et OpenOffice ainsi que celles des logiciels de mise en page (InDesign et Xpress).
Ce travail est conduit suivant deux axes forts : 
– l’ouverture vers XML de ces produits : de l’export à partir d’un format tiers comme RTF des convertisseurs XML (niveau 1) jusqu’au format XML natif publié et standardisé (niveau 9 du tableau)
–  le degré de structuration XML..
Cet article (de 16 pages) est orienté édition et presse professionnelles, le secteur de prédilection de Mr Peccatte, mais si vous êtes concerné par les formats (structure) des documents numériques et leur développement, vous ne pouvez qu’être intéressé par cet article.

Autre ressource : Le Blogue Formats-Ouverts
ERELE > Harmonisation de la production, de la diffusion et de la conservation des Études et Rapports ÉLectroniques de l’Équipement (ÉRÉLÉ), du Ministère de l’Équipement, des Transports, du Logement, du Tourisme et de la Mer
– Le schéma directeur de l’administration électronique 2006-2010 Liste des initiatives,
Plan d’action de l’Administration électronique (P2AE) 2004-2007, Actualisation 2005

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s