Le concept « France » à travers 4 thésaurus

La structure conceptuelle des thésaurus – et plus largement des systèmes d'organisation de concepts (classification, schémas de métadonnées,…) – donne à voir une vision particulière de la réalité qu'ils représentent.

J'avais précédemment abordé cette question avec la représentation du concept "bois" dans plusieurs vocabulaires contrôlés. Aujourd'hui nous passons en revue le concept géographique de la France à travers 4 vocabulaires : le "Multilingual Thesaurus of Nations", le thésaurus Eurovoc,  Rameau et le vocabulaire de l'INSEE.

Aucun jugement ici sur ces différents outils, mais simplement une occasion de rappeler l'obligation qui nous est faite d'étudier précisément le contexte d'usage des vocabulaires (et leur histoire) pour comprendre les modèles sous-jacents, avant de travailler sur des alignements. La dernière partie du billet évoque la modélisation et l'encodage aux couleurs du Web. 

1.  Voici un (bon vieux) thésaurus modélisé selon les règles des années 1970.
2. Multilingual Thesaurus of Nations : les pays et leurs relations
3. Eurovoc : les pays s'inscrivent dans des divisions politiques et économiques
4. Rameau : la France, un pays en Europe
5. INSEE : la France en détail
6. Modéliser pour les machines : rdf et skos

Lire la suite

Publicités

Interopérabilité et information gouvernementale – Quand l’UE rencontre le W3C avec les vocabulaires ADMS et DCAT

Deux constats :

  • Des masses de données et des flux tendus   => impossible donc d'envisager des recherches d'info et des sélections au sein des résultats "à la main". un  accès direct au contenu de la "bonne" ressource sans intervention humaine devient indispensable ;
  • Des données dans les nuages  => des manipulations doivent être possibles "à distance" et "hors de chez nous". Tout repose sur l'interopérabilité des systèmes, techniques et sémantique.

Je vous propose aujourd'hui (mai 2013) un aperçu de deux vocabulaires encore en chantier, utilisés dans le cadre de la valorisation de l'information gouvernementale* proposés par l'Union européenne avec comme visée d'optimiser la circulation de cette information et faciliter leur exposition.

Un billet (un peu long) en 4 parties :

  1. L'Union européenne (UE) et l'interopérabilité – une histoire ancienne qui aboutit au programme actuel ISA
    (Interoperability Solutions for European Public Administrations)
  2. L'UE et l'information gouvernementale avec  Semic.eu (Semantic Interop. Community) et ADMS (Asset Description Metadata
    Schema)
  3. Le W3C et l'information gouvernementale avec (entre autre) le vocabulaire DCAT (Data Catalog Vocabulary)
  4. enfin des exemples articulant 1+2+3

* je
préfère utiliser le terme d'information gouvernementale comme les canadiens, trouvant le terme "information administrative" trop ambigu (surtout si on quitte le territoire strictement de la France), des entreprises pouvant aussi produire de l'information administrative. Un autre terme mais plus long, utilisable : information de l'administration publique
ou info administrative du gouvernement ?.

Lire la suite

Thésaurus et autres schémas de concepts : documents normatifs

Liste des normes ou documents normatifs, quels que soient leur état et leurs origines, concernant les thésaurus, plus globalement les vocabulaires contrôlés et les index.
Création : le 18 août 2005. Dernière mise à jour : août 2014
Mise à  jour : 20 Novembre 2005 ; 15 Avril 2006 ; 10 Novembre 2007, août 2008; ocotbre 2009; août 2010 ; mars 2013 ; août 2014


  1. Normes sur les thésaurus et autres schémas de concepts
  2. Schémas XML et autres outils associés
  3. Normes nationales sur les thésaurus
  4. Autres normes en proximité

Lire la suite

Google nous parle des origines de l’internet en Europe avec le Mondaneum

<Ajout Juillet 2013, La Tour Eiffel croquée par la googlemania(en anglais) – http://www.google.com/culturalinstitute/collection/tour-eiffel>

 

Fin 2012, j'avais raté cet "évènement" : l'institut culturel de google !

Le site de cet institut culturel propose  (oct2012) 6 millions d'archives sur l'histoire du XXème siècle, en partenariat avec 17 musées et instituts du monde entier, “un environnement en ligne interactif et riche en iconographies, qui retrace de manière originale différents faits culturels marquants de notre histoire."

Un des derniers projets à voir de toute urgence…

 1895-2013 – Les origines de l'internet en Europe avec le Mondaneum et Paul Otlet/Henri Lafontaine.

Organisation-de-la-doc-Mundaneum-Otlet--
Panneau de l'Encyclopaedia Universalis Mundaneum présentant la pyramide de l'organisation de la documentation, depuis le livre jusqu'à l'Atlas le plus haut niveau de l'organisation, [sd].

J'ai adoré.

Publication de la norme ISO 25964-2(2013) sur l’interopérabilité entre vocabulaire pour la recherche documentaire

Cette partie 2 de la norme ISO 25964 fait suite à la publication en 2011 de la partie 1 sur les thésaurus. Elle est entièrement nouvelle puisqu'elle traite de l'interopérabilité entre vocabulaires.

Vous pouvez donc maintenant l'acheter sur le site de l'ISO pour 196FrsCH soit environ 160 euros (pour 99pages, le prix à la page augmente…), toujours le même tarif sur support numérique et papier ….


ISO 25964-2:2013 – Information et documentation — Thésaurus et interopérabilité avec d'autres vocabulaires — Partie 2: Interopérabilité avec d'autres vocabulaires.
http://www.iso.org/iso/fr/catalogue_detail.htm?csnumber=53658

Cette partie de la norme ISO 25964 est applicable aux thésaurus et à d'autres types de vocabulaire couramment utilisés pour la recherche d'information. Elle décrit, compare et met en lumière les éléments et caractéristiques de vocabulaires lorsque ceux-ci sont impliqués dans des procesus d'interopérabilité. La norme donne des recommandations pour la mise en place et la maintenance des correspondances entre plusieurs thésaurus, ou entre des thésaurus et d'autres types de vocabulaires (traduction personnelle).

[This part of ISO 25964 is applicable to thesauri and other types of vocabulary that are commonly used for information retrieval. It describes, compares and contrasts the elements and features of these vocabularies that are implicated when interoperability is needed. It gives recommendations for the establishment and maintenance of mappings between multiple thesauri, or between thesauri and other types of vocabularies.]

Je vous renvoie pour le moment, à la brève présentation faite début 2012 faite lors de la publication de l'enquête publique ISO
http://dossierdoc.typepad.com/descripteurs/2012/01/iso-25964-2-interoperabilite.html

Michèle Hudon a publié en français, fin 2012 un article dans "Bibliothèques et Documentation", sur la norme dans son ensemble. (rien en ligne; à consulter en Bibliothèque).

Hudon, Michèle. ISO25964 : pour le développement, la gestion et l’interopérabilité des langages documentaires. Documentation et bibliothèques 58, 3 (2012) : 130-140.

Un livre blanc serait peut être utile à la Communauté françcophone …?

Bibliographie (2012) – http://dossierdoc.typepad.com/descripteurs/2012/06/bibliographie-recente-normalisation-des-thesaurus.html

ISO 25964-1 : Le Livre blanc est sorti

Le mois de janvier tire à sa fin, mais il est encore temps de vous souhaiter une bonne et heureuse année 2013.


Avec un cadeau très professionnel pour ce millésime 2013


Le Livre blanc sur la norme ISO 25964-1 Thésaurus

qui, après moults péripéties, sort ce jour même sur le site de l’Afnor.
Disparu du radar de l’Afnor. Le voici (pdf).
http://www.bivi.fonctions-documentaires.afnor.org/livres-blancs/livre-blanc-sur-la-norme-iso-25964-1-thesaurus-pour-la-recherche-documentaire-parue-en-version-anglaise-en-aout-2011

« L’objectif de ce livre blanc est de fournir une vue synthétique de la norme à l’attention de professionnels ayant déjà une connaissance des outils d’organisation [de l’information]. Il identifie les points saillants de la norme et précise, quand c’est important pour la communauté francophone, leur caractère obligatoire. »

Un cadeau de la part de :
Hélène Zysman, Sylvie Dalbin, Nathalie Yakovleff, a
vec l’intense et précieuse collaboration de François Feyler, Roselyne Bloch, Michèle Lénard et Katell Briatte.

Un travail de sélection et d’explicitation aboutissant à un ouvrage certes technique mais qui, nous l’espérons, sera utile à la collectivité et utilisé par le plus grand nombre. Et vous donnera envie d’aller voir la norme elle-même, un travail de longue haleine porté par un collectif à la fois au sein de l’ISO (TC46/SC9/WG8) et de l’Afnor (CG46/CN357/GE10 – voir annexe 5 du Livre blanc).

L’Afnor annonçant qu’il ne peut mettre sur sa plateforme qu’un seul format – ce sera donc le pdf en ligne. Nous vous offrons ici le fichier au format odt (ISO25964-1-Livre-blanc-Janvier-2013-vFinale en odt) pour pouvoir récupérer plus aisément les données dont vous auriez besoin.

N’hésitez pas à nous faire des retours de son utilisation, des difficultés mais aussi des avantages de ce document !

Et dans peu de temps, je vous parlerai de la partie 2 de la norme ISO 25964 sur l’interopérabilité entre vocabulaires, qui sort très bientôt.

PS :je me rends compte avec stupeur que l’Afnor affuble ces livres blancs et celui-ci en particulier, d’un droit de reproduction interdit. C’est déjà bien ennuyeux que les normes ne soient pas ouvertes, mais ce livre blanc !?. J’espère que ce n’est qu’une routine. En tous les cas, cette version de janvier 2013 au format odt est réexploitable. 

Métadonnées en SHS – DDI (Data Documentation Initiative)

Depuis ma petite incursion en 2008 (séminaire Inria, Métadonnées), je n'avais pas reparlé de ce vocabulaire : DDI (sur fr.wikipedia), un autre schéma de "métadonnées de la publication scientifique" et professionnelle qu'il nous faudrait bien maîtriser aussi. Pourtant le schéma lui-même et son déploiement ont bien évolué. 

Ce projet de schéma est partie d'un premier constat largement partagé par les producteurs d'enquêtes : les enquêtes, et de façon plus générale les données économiques et sociales, sont à la fois peu accessibles et insuffisamment utilisées en regard des efforts consentis à leur production et acquisition.

A ce constat initial est venu s'ajouter le phénomène plus général des "datas" : l'exploitation dans nos environnements complexes et mobiles par des publics élargis de ces matériaux de base que sont les données brutes (raw materials) va au-delà des analyses et synthèses produites par les auteurs des données. 
Des catalogues d'enquêtes (références + documentation + données) se sont déployés [1]. 
Exemple d'une documentation d'enquête au format DDI

Exemple d'une documentation d'enquête au format DDI

Lire la suite