Libérer les métadonnées. 2. Facette et Delicious

Facette (écrit en français?) est une application d'organisation par facettes des tags de Delicious.

Le contexte

Cette application sur Delicious exploite l'outil Exhibit du MIT développé dans le cadre du projet SIMILE (Semantic Interoperability of Metadata and Information in unLike Environments). SIMILE a déjà été présenté dès 2006 par Christophe Le Bot ou C.Fauré, entre autres websemanticiens francophones. L'applicatif Timeline est certainement l'outil, issu de ce projet, le plus connu.
Exhibit est quant à lui un cadre d'applications de publication de pages Web interactives. L'utilisation pendant quelques semaines de l'application fournit de nombreuses pistes de réflexion.

Résultat : un tableau de bord pour exploiter le "répertoire" Delicious

Tout d'abord le résultat (résultats en ligne) : un véritable tableau de bord de mes signets sous Delicious, s'appuyant sur une catégorisation des mots-clés (à gauche de l'écran), fonction qui donne son nom à l'application, sur un index de l'ensemble des mots-clés produits (droite de l'écran) et offrant une recherche directe bien plus efficace que sur Delicious.

FacetteMIT-ex2.002

Etudions l'arrière du décors

Les résultats sont exportables, ici au format RDF/XML, ce qui nous permet d'étudier de plus près, les données … format ouvert oblige.

FacetteMIT-ex1.001


Mais comment sont produits ces tags enrichis ?
Ce type d'index de mots-clés associés à leurs catégories d'indexation peut être produit en sortie des systèmes documentaires habituels pour être exploité par un applicatif adhoc type Exhibit ou un moteur d'indexation et de recherche.

Sous Delicious, Facette vous propose de basculer sur une interface … d'indexation !

Facette1

Au fil de l'eau, on obtient des tags Delicious avec un look particulier …

Facette2

Que nous apporte cette application ? Que peut-on en dire ?

  • Structurer la représentation des ressources est très utile ! Certes.
    • Mais ce n'est pas tant la phase d'indexation structurée ici qui me semble intéressante que l'application en aval – Exhibit (exposition) – qui permet de produire dynamiquement cette interface de recherche riche.

    • Un intérêt toutefois à l'application amont (la phase d'indexation) : elle montre tout ce qui peut être fait avec des métadonnées libérées- ici des données structurées stockées sous Delicious.

    • La question reste bien sûr la phase "d'attribution d'une étiquette".
      Après une période de démarrage que je qualifierais de très douloureuse ;-), j'ai atteint aujourd'hui une phase de croisière. Je n'utilise plus l'outil d'annotation du MIT (qui ne fonctionne pas trop bien : ne mémorisant pas mes propositions, je me retrouve régulièrement avec une page vierge, et des catégories … anglosaxonnes …). Par contre, mes tags sont maintenant assez riches sous ce formatage pour rendre cette tâche acceptable sous Delicious directement. Et cette liste m'aide à … réfléchir ! Petit travail intellectuel très profitable assisté par la machine à l'inverse de la logique documentaire.
Facette3
  • Ces fonctionnalités sont-elles exploitables réellement dans des systèmes d'indexation sociale ?

Il me semble que cela ne peut s'imaginer que si le premier niveau de description ("catalogage" + "indexation sujet") est totalement ou partiellement, déjà intégré à la ressource. L'annotation réalisée par l'utilisateur est alors tellement orientée par son usage que cela semble tout à fait naturel : en tant qu'utilisatrice, il m'est plus facile d'indexer "ma" métadonnée "Exemple", que le sujet global de la ressource. Si j'élabore un dossier documentaire sur les "ressources pédagogiques en ligne", il m'est plus facile de tagger des références par rapport à cette thmatique, lorsqu'elles sont préalablement enrichies.

  • Quelles "facettes" ? Quelle schéma de métadonnées ? Quelle sémantique pour les tags ?
    • La question de la sémantique des catégories de tags reste entière, mais je vois poindre le CommonTag, une toute nouvelle spécification que Bernard Vatant de Mondeca nous présente.
    • Mais il ne s'agit pas toutefois d'imposer "une" structure unique, mais de permettre l'exploitation de différents
      schémas de métadonnées liés aux usages autour de collections mises à
      disposition. Par exemple j'avais besoin de distinguer "nature
      d'information" de "type d'objet", "exemple" ou "norme", le "domaine
      couvert" et le "sujet". Bref une structure adhoc. Sur ce plan,
      l'exploitation de Delicious est très parlant.

(Désolée pour celles qui en ont marre de Delicious)

Autres ressources

  • Un autre papier sur Facette par ReadWriteWeb au début de l'année.
  • Pour la notion de facette, se reporter aux travaux de Jacques Maniez. Par exemple : "Des classifications aux thésaurus :
    Du bon usage des facettes", Documentaliste – Sciences de l’information, 1999, vol. 36, n° 4-5 (non accessible en ligne), qui "plaide […] pour un usage plus rigoureux du terme et de l’outil [classification à facettes), qui fasse clairement le partage entre la classification des concepts et le classement des sujets.
Publicités

Publics Libérés au Musée McCord !

Libérée 😉 c’est l’impression que j’ai eu en utilisant ce musée numérique.

Voici un « dossier documentaire » que je me suis constitué sur mon sujet du moment : les équipements sportifs avant la période récente d’industrialisation, de professionnalisation !

Facilité d’indexer – les fameux tags – en fonction de ses besoins, c’est-à-dire ici « indexation d’usage des ressources», création de dossiers personnalisés, ordonnancement des documents dans le dossier, possibilités d’annotations….
Le nuage des tags collectifs est pour bientôt, me dit le webmestre. Et plein d’autres possibilités …
L’ensemble des « circuits publics »
(terme employé pour les « dossiers » établis par le Grand public) sont
mis à la disposition de tous (si on le souhaite, puisqu’on peut aussi
opter pour un dossier privé

Mccordespaceperso

Un service absolument indispensable pour les fonds – de Musées et
d’Archives en particulier- dont l’indexation, lorsqu’elle existe, se
fait au « thème principal » comme ici avec Architecture, Bâtiment….
L’indexation, orientée par les besoins des utilisateurs (users
needs-centered indexing), donne un éclairage particulier. Ne peut on
voir cela comme un enrichissement ? C’est le pari du Musée McCord.

Bien sûr les fonctions maintenant traditionnelles sur ce type de site
existent : des circuits, des outils pédagogiques. Et d’autres encore
ont plus particulièrement aimé … le jeu !  Pourquoi les sites des bibliothèques de lecture publique sont-ils si sérieux ?

oooOoo

Ajout – Informations organisationnelles, techniques et financières sur cette extension au site McCord – http://www.pro.rcip-chin.gc.ca/sommaire-summary/mccord_sociales-mccord_social-fra.jsp

Mariage entre ancien et nouveau, Web2 et mémoire

Voici un projet digne d’intérêt qui allie travail de mémoire, travail documentaire, partage et collaboration (Web2) et enfin n’oublions pas, correspondance entre jeux de métadonnées ! Tout un programme !

PhotosNormandie sur Flickr  et   Présentation du groupe

[petites corrections apportées à la première version, grâce à un lecteur du dimanche matin!]
374560382_c404c9e098
Présentation du projet  – Un habitant de La Haye du Puits, mais qui ? 

Pour le travail de mémoire : proposer des photographies libres de droit sur la Bataille de Normandie, dans un format « professionnel » tant sur le plan photographique (haute définition) que sur le plan documentaire (légende corrigée et enrichie). Ce fonds est constitué à partir de 2330 photos extraites du site ArchivesNormandie. La majorité de ces photos sont issues des archives américaines et canadiennes.

Pour le travail documentaire : améliorer la qualité de la légende sur les plans du contrôle des données (des erreurs ont été relevées par des connaisseurs) et de la précision des lieux, des matériels, des évènements ou des personnes (beaucoup de photos ne sont que peu renseignées).

Pour le collaboratif Web2 : qualifier et enrichir les légendes par un travail collaboratif de toutes les personnes intéressées via Flickr. Un groupe de discussion adossé au dossier Flickr est ouvert à tous (l’inscription est très facile). Comme le montre la copie d’écran ci-après, des échanges fructueux ont lieu entre les participants, preuves à l’appui ! Ce travail collaboratif est validé par un administrateur éditorial, Michel Le Querrec (fortement impliqué dans la vie du site « Débarquement.com), qui a le dernier mot. Une fois la nouvelle légende acceptée, celle-ci est modifiée sur la photo originale par l’administrateur technique, Patrick Peccatte, puis la photo avec sa nouvelle légende est rechargée dans le dossier en remplacement de la première photo, Flickr ne permettant pas le rechargement des seules métadonnées. Les échanges entre contributeurs sont mémorisés dans l’espace « groupe de discussion » jusqu’au remplacement d’une photo avec sa légende complétée à la suite de la discussion. D’après les administrateurs, le sujet circonscrit et spécialisé, et la validation par un petit groupe de spécialistes constituent une barrière aux risques de dérives.

Test

Pour la mise en correspondance (mapping) des métadonnées : des photos enrichies initialement avec des métadonnées IPTC (schéma de métadonnées « presse » évoluant vers IPTCCore le NewsML) et XMP d’Adobe, basculées dans le format simplifié Flickr au moment du chargement de la photo, avec un résultat plus conforme avec le jeu IPTC qu’avec XMP.
Pour tout savoir sur les métadonnées, en particulier celles embarquées dans les fichiers informatiques, un seul site : Patrick Peccatte de Soft Experience, par ailleurs  co-initiateur et administrateur technique de ce projet.
Muet sur son site sur le sujet de l’import de métadonnées, Flickr semble être le seul à proposer cette fonction, avec le tableau de correspondance suivant :

  • Object Name (IPTC 5 = référence originale de la photo) > Title Flickr
  • Caption (IPTC 120=description de la photo) > Description Flickr
  • Les champs Keywords (IPTC 25), City (IPTC 90=nom de la ville où la photo a été prise), Province/State (IPTC 95=nom du département où la photo a été prise), Country Name (IPTC 101) sont récupérés en tags dans Flickr
  • Copyright (IPTC 116) >> Copyright Flickr (en fait, Flickr semble plutôt faire l’impasse sur ces données).

Pour poursuivre dans le registre technique, l’abonnement au service Pro de Flickr d’un prix très modeste (25$=19€), permet entre autre le stockage en haute résolution des photographies et la conseration des métadonnées IPTC et XMP. Pour participer au projet, il n’est cependant nécessaire que d’ouvrir un compte gratuit sur Flickr.

Vous mettez un fonds de photos à « nettoyer » à la disposition d’une équipe petite (pour le moment) mais enthousiaste, regroupant des connaisseurs en histoire, des amoureux de la Normandie et des spécialistes de l’informatique photographique, le tout immergé dans un terreau d’ardeur, de militantisme et de professionnalisme, et le tour est joué. Certes, d’après un des administrateurs, le temps et les manipulations ont été sous-évaluées. Un cas classique.

Je verrais très bien un prolongement à caractère plus social à un tel projet.
Car s’il faut ici se tourner vers les « anciens », les seuls à même d’apporter leurs connaissances des lieux, personnes et évènements, et tout leur cœur à l’étude de ces photos d’époque, je les vois mal se ruer tous ensemble sur Flickr. Les Ateliers d’informatique qui s’adressent à ces publics, en général tournés sur les courriels et discussions en ligne avec les petits-enfants ou les recherches généalogiques, trouvent-là un nouveau sujet motivant, en tous les cas sûrement pour les habitants de cette région de France. Et sans aller jusqu’à pousser les seniors à manipuler eux-même ces engins électroniques, les intervenants auprès de ces publics pourraient efficacement utiliser ces matériaux au cours de leurs animations : regarder des photos plein écran, c’est appréciable !

Un projet pour la Normandie …  qui reste bien sûr à monter de toute pièce.

Merci à Patrick Peccatte pour sa disponibilité.