NewsCodes de l’IPTC

L'IPTC (International Press Telecommunications Council) a défini depuis 1979, un format standardisé pour l'échange et le stockage des métadonnées (titre, auteur, agence, copyright, etc.) relatives aux images de presse : l'IPTC Core. Aujourd'hui on parle volontiers d'une Famille de standards G2.

Ce dispositif évolue régulièrement tant sur le plan technique (du format IIM, à XMP, portage RDF) que sur le plan du(des) modèle(s) de base et des vocabulaires contrôlés associés. Une des dernières évolutions est le développement d'une version rNews pour les articles de presse exposés sur le Web an suivant le format de Schema.org.

NewsCodes IPTC

Sur le site, le visualisateur sur le site IPTC

Lire la suite

Libérer les Revues et les données de la recherche

Après les thèses, un autre sujet que j’affectionne tout particulièrement : les revues.

Je souhaitais vous parler depuis 2 ans (!), d’IPOL : une revue scientifique numérique dans le domaine du traitement et de l’analyse d’image numérique qui propose à ses lecteurs de tester en ligne les algorithmes exposés dans les articles et de capitaliser ces données d’expériences.

J’avais rencontrée au Frédoc 2011 (IST en Europe) sur Bordeaux une collègue qui m’avait présenté avec enthousiasme, cette revue numérique innovante développée dans son environnement de travail. Et je vois que Frédoc 2013 sur les données de la recherche, ont été l’occasion d’en faire une présentation à la communauté – je m’en réjouis.

Cette revue associe :

  1. une revue composée d’articles – c’est donc bien une revue !
  2. des données de la recherche, testés ;
  3. les archives des expériences réalisés.

Lire la suite

Libérer les Thèses

Je rebondis ici sur l'initiative lancée par Alexandre Monnin concernant  sa thèse (chapitre 1…) en version HTML à commenter sur Philoweb.org, en reprenant un extrait d'un texte écrit dans le cadre du cours INRIA 2008.

Un dispositif (CommentPress sous wordpress) pour échanger avec l'auteur….

Quelques mots au préalable sur cette initiave. Alexandre Monnin (sur Facebook) vous propose de réfléchir par la pratique à partir de sa thèse (sur theses.fr), à des  formats et des nouvelles pratiques  "OpenScience" (co-production, commentaires,…) pour les thèses et les mémoires. Et une invitation hackyourphd pour travailler ce 13 décembre en soirée sur Paris.

La thématique que j'aborde ici (structuration pour  l'accès et la découverte) est différente de celle de Philoweb (science ouverte), mais elle la rejoint : il s'agit en premier lieu d'ouvrir (formats) puis de structurer les thèses pour en permettre des usages multiples. Ces thèses que je trouve bien engoncées dans leurs enveloppes pdfiennes, parfois fermées à double tour (pas de possibilité de faire des commentaires) ou sans sommaire dynamique ….

Lire la suite

Référentiels, donnée et métiers de l’information et du document – une fin d’année 2013 prolifique à l’ADBS

Après l'annonce d'une journée d'étude ADBS le mardi 26 novembre (Paris) – "Du thésaurus aux référentiels terminologiques", riche en témoignages, voici le Dossier du nouveau numéro de Documentaliste  consacré aux métiers de l’information et la « donnée » coordonné par Dominique Cotte d'Ourouk.

La première partie de ce dossier porte sur les enjeux de la gestion des données ; la deuxième partie sur les conséquences et les rôles que peuvent jouer les professionnels de l'infodoc.

Vaste sujet abordé à travers 16 papiers pour 13 auteur(e)s (sommaire).

Voilà un dernier trimestre 2013 riche d'évènements à l'ADBS.


Lire la suite

Le concept « France » à travers 4 thésaurus

La structure conceptuelle des thésaurus – et plus largement des systèmes d'organisation de concepts (classification, schémas de métadonnées,…) – donne à voir une vision particulière de la réalité qu'ils représentent.

J'avais précédemment abordé cette question avec la représentation du concept "bois" dans plusieurs vocabulaires contrôlés. Aujourd'hui nous passons en revue le concept géographique de la France à travers 4 vocabulaires : le "Multilingual Thesaurus of Nations", le thésaurus Eurovoc,  Rameau et le vocabulaire de l'INSEE.

Aucun jugement ici sur ces différents outils, mais simplement une occasion de rappeler l'obligation qui nous est faite d'étudier précisément le contexte d'usage des vocabulaires (et leur histoire) pour comprendre les modèles sous-jacents, avant de travailler sur des alignements. La dernière partie du billet évoque la modélisation et l'encodage aux couleurs du Web. 

1.  Voici un (bon vieux) thésaurus modélisé selon les règles des années 1970.
2. Multilingual Thesaurus of Nations : les pays et leurs relations
3. Eurovoc : les pays s'inscrivent dans des divisions politiques et économiques
4. Rameau : la France, un pays en Europe
5. INSEE : la France en détail
6. Modéliser pour les machines : rdf et skos

Lire la suite

Interopérabilité et information gouvernementale – Quand l’UE rencontre le W3C avec les vocabulaires ADMS et DCAT

Deux constats :

  • Des masses de données et des flux tendus   => impossible donc d'envisager des recherches d'info et des sélections au sein des résultats "à la main". un  accès direct au contenu de la "bonne" ressource sans intervention humaine devient indispensable ;
  • Des données dans les nuages  => des manipulations doivent être possibles "à distance" et "hors de chez nous". Tout repose sur l'interopérabilité des systèmes, techniques et sémantique.

Je vous propose aujourd'hui (mai 2013) un aperçu de deux vocabulaires encore en chantier, utilisés dans le cadre de la valorisation de l'information gouvernementale* proposés par l'Union européenne avec comme visée d'optimiser la circulation de cette information et faciliter leur exposition.

Un billet (un peu long) en 4 parties :

  1. L'Union européenne (UE) et l'interopérabilité – une histoire ancienne qui aboutit au programme actuel ISA
    (Interoperability Solutions for European Public Administrations)
  2. L'UE et l'information gouvernementale avec  Semic.eu (Semantic Interop. Community) et ADMS (Asset Description Metadata
    Schema)
  3. Le W3C et l'information gouvernementale avec (entre autre) le vocabulaire DCAT (Data Catalog Vocabulary)
  4. enfin des exemples articulant 1+2+3

* je
préfère utiliser le terme d'information gouvernementale comme les canadiens, trouvant le terme "information administrative" trop ambigu (surtout si on quitte le territoire strictement de la France), des entreprises pouvant aussi produire de l'information administrative. Un autre terme mais plus long, utilisable : information de l'administration publique
ou info administrative du gouvernement ?.

Lire la suite

Thésaurus et autres schémas de concepts : documents normatifs

Liste des normes ou documents normatifs, quels que soient leur état et leurs origines, concernant les thésaurus, plus globalement les vocabulaires contrôlés et les index.
Création : le 18 août 2005. Dernière mise à jour : août 2014
Mise à  jour : 20 Novembre 2005 ; 15 Avril 2006 ; 10 Novembre 2007, août 2008; ocotbre 2009; août 2010 ; mars 2013 ; août 2014


  1. Normes sur les thésaurus et autres schémas de concepts
  2. Schémas XML et autres outils associés
  3. Normes nationales sur les thésaurus
  4. Autres normes en proximité

Lire la suite

Google nous parle des origines de l’internet en Europe avec le Mondaneum

<Ajout Juillet 2013, La Tour Eiffel croquée par la googlemania(en anglais) – http://www.google.com/culturalinstitute/collection/tour-eiffel>

 

Fin 2012, j'avais raté cet "évènement" : l'institut culturel de google !

Le site de cet institut culturel propose  (oct2012) 6 millions d'archives sur l'histoire du XXème siècle, en partenariat avec 17 musées et instituts du monde entier, “un environnement en ligne interactif et riche en iconographies, qui retrace de manière originale différents faits culturels marquants de notre histoire."

Un des derniers projets à voir de toute urgence…

 1895-2013 – Les origines de l'internet en Europe avec le Mondaneum et Paul Otlet/Henri Lafontaine.

Organisation-de-la-doc-Mundaneum-Otlet--
Panneau de l'Encyclopaedia Universalis Mundaneum présentant la pyramide de l'organisation de la documentation, depuis le livre jusqu'à l'Atlas le plus haut niveau de l'organisation, [sd].

J'ai adoré.

Publication de la norme ISO 25964-2(2013) sur l’interopérabilité entre vocabulaire pour la recherche documentaire

Cette partie 2 de la norme ISO 25964 fait suite à la publication en 2011 de la partie 1 sur les thésaurus. Elle est entièrement nouvelle puisqu'elle traite de l'interopérabilité entre vocabulaires.

Vous pouvez donc maintenant l'acheter sur le site de l'ISO pour 196FrsCH soit environ 160 euros (pour 99pages, le prix à la page augmente…), toujours le même tarif sur support numérique et papier ….


ISO 25964-2:2013 – Information et documentation — Thésaurus et interopérabilité avec d'autres vocabulaires — Partie 2: Interopérabilité avec d'autres vocabulaires.
http://www.iso.org/iso/fr/catalogue_detail.htm?csnumber=53658

Cette partie de la norme ISO 25964 est applicable aux thésaurus et à d'autres types de vocabulaire couramment utilisés pour la recherche d'information. Elle décrit, compare et met en lumière les éléments et caractéristiques de vocabulaires lorsque ceux-ci sont impliqués dans des procesus d'interopérabilité. La norme donne des recommandations pour la mise en place et la maintenance des correspondances entre plusieurs thésaurus, ou entre des thésaurus et d'autres types de vocabulaires (traduction personnelle).

[This part of ISO 25964 is applicable to thesauri and other types of vocabulary that are commonly used for information retrieval. It describes, compares and contrasts the elements and features of these vocabularies that are implicated when interoperability is needed. It gives recommendations for the establishment and maintenance of mappings between multiple thesauri, or between thesauri and other types of vocabularies.]

Je vous renvoie pour le moment, à la brève présentation faite début 2012 faite lors de la publication de l'enquête publique ISO
http://dossierdoc.typepad.com/descripteurs/2012/01/iso-25964-2-interoperabilite.html

Michèle Hudon a publié en français, fin 2012 un article dans "Bibliothèques et Documentation", sur la norme dans son ensemble. (rien en ligne; à consulter en Bibliothèque).

Hudon, Michèle. ISO25964 : pour le développement, la gestion et l’interopérabilité des langages documentaires. Documentation et bibliothèques 58, 3 (2012) : 130-140.

Un livre blanc serait peut être utile à la Communauté françcophone …?

Bibliographie (2012) – http://dossierdoc.typepad.com/descripteurs/2012/06/bibliographie-recente-normalisation-des-thesaurus.html

ISO 25964-1 : Le Livre blanc est sorti

Le mois de janvier tire à sa fin, mais il est encore temps de vous souhaiter une bonne et heureuse année 2013.


Avec un cadeau très professionnel pour ce millésime 2013


Le Livre blanc sur la norme ISO 25964-1 Thésaurus

qui, après moults péripéties, sort ce jour même sur le site de l’Afnor.
Disparu du radar de l’Afnor. Le voici (pdf).
http://www.bivi.fonctions-documentaires.afnor.org/livres-blancs/livre-blanc-sur-la-norme-iso-25964-1-thesaurus-pour-la-recherche-documentaire-parue-en-version-anglaise-en-aout-2011

« L’objectif de ce livre blanc est de fournir une vue synthétique de la norme à l’attention de professionnels ayant déjà une connaissance des outils d’organisation [de l’information]. Il identifie les points saillants de la norme et précise, quand c’est important pour la communauté francophone, leur caractère obligatoire. »

Un cadeau de la part de :
Hélène Zysman, Sylvie Dalbin, Nathalie Yakovleff, a
vec l’intense et précieuse collaboration de François Feyler, Roselyne Bloch, Michèle Lénard et Katell Briatte.

Un travail de sélection et d’explicitation aboutissant à un ouvrage certes technique mais qui, nous l’espérons, sera utile à la collectivité et utilisé par le plus grand nombre. Et vous donnera envie d’aller voir la norme elle-même, un travail de longue haleine porté par un collectif à la fois au sein de l’ISO (TC46/SC9/WG8) et de l’Afnor (CG46/CN357/GE10 – voir annexe 5 du Livre blanc).

L’Afnor annonçant qu’il ne peut mettre sur sa plateforme qu’un seul format – ce sera donc le pdf en ligne. Nous vous offrons ici le fichier au format odt (ISO25964-1-Livre-blanc-Janvier-2013-vFinale en odt) pour pouvoir récupérer plus aisément les données dont vous auriez besoin.

N’hésitez pas à nous faire des retours de son utilisation, des difficultés mais aussi des avantages de ce document !

Et dans peu de temps, je vous parlerai de la partie 2 de la norme ISO 25964 sur l’interopérabilité entre vocabulaires, qui sort très bientôt.

PS :je me rends compte avec stupeur que l’Afnor affuble ces livres blancs et celui-ci en particulier, d’un droit de reproduction interdit. C’est déjà bien ennuyeux que les normes ne soient pas ouvertes, mais ce livre blanc !?. J’espère que ce n’est qu’une routine. En tous les cas, cette version de janvier 2013 au format odt est réexploitable.