Listes contrôlées, thésaurus, taxonomie et ontologie (article, 2009)

Présentation simple et claire de ces outils terminologiques, dans le papier écrit par Jean Delahousse de Mondeca, dans le numéro 2 de Knowledge Mag de mars 2009 (sommaire),fraîchement sorti.

En quelques mots :
1- des listes de mots qui représentent en général des entités nommées : noms d'entreprises, de produits, de molécules, de personnes…
2- le thésaurus, c'est -à dire des noms communs organisés entre eux par des relations hiérarchiques, associatives ou d'équivalence (pour faire simple) . Le thésaurus de descripteurs sans ses "listes annexes" (voir 1-)
3- les taxonomies vues comme des classifications
4- les ontologies, un ensemble de mots contrôlés (1 ou 2), organisés (2) qui peut avoir une valeur de classes (3) ! Mais en dehors du périmètre conceptuel qui diffère, la représentation de chacune des entrées de l'ontologie est précisée par des attributs, et les relations sont bien plus riches que celles existant au sein des thésaurus de descripteurs traditionnels.
La 2ème partie de l'article exposent les usages de toutes ces terminologies, bien plus larges que strictement l'indexation pour la recherche. Sur ce point aussi, les approches devraient changer…

Et après ces quelques pages sur les référentiels terminologiques, n'hésitez pas à vous plonger dans le numéro complet (et plus globalement le site !) :
Au hasard de ma lecture : une mise en place du couplage ontologie/terminologie (touristique) à la  Saône et Loire par Joël Nogier et François Rouze (une application d'ITM de Mondeca), une superbe cartographie des outils de mise en scène et de visualisation de l'information  et  le KM mix par Denis Meingnan. Ainsi qu'une présentation de "MindUp, vers une réconciliation de l’email et du travail collaboratif ?" et un « Panorama des outils 2.0 au service de la veille » par Gilles Balmisse.

Juste à changer : la méta "titre" du papier de Delahousse, daté de 2008, qui perturbe mes outils web 2.0 ;-).

Publicités

Libérer les métadonnées ! 2. Localisation géographique.

Nous poursuivons la libéralisation des métadonnées de leur
notice catalographique où nous les avions confinées.
Après les "dates", prenons justement de la
distance avec la métadonnée "localisation", que je limiterai ici à la localisation
terrestre.

L’exemple est tiré d’un catalogue très classique de romans.Je sais, je sais : malheureusement, ce type
de métadonnée ne nous est justement pas proposé dans les catalogues de bibliothèques,
alors que cela nous est indispensable ;-)

Je ne rentrerais pas dans les débats sur l’indexation
des Romans
(autre dossier) (où se passe l'histoire?), ou de l’utilisation des lieux de
naissance des auteurs (origine culturelle de l’auteur?) dans les catalogues
bibliographiques. Je ne parlerai pas non plus du mélange fait entre ces deux
natures de « localisation " : si vous
tombez sur l’inspecteur Wallander par la donnée « suédois (auteur) »
qui justement enquête à Riga en Lettonie (lieu où se déroule l’histoire), c’est
à une présentation de la vie lettonaise et non suédoise que vous serez convié….
 
Voici donc une jolie carte établie par Bibliosurf, notre
bibliothécaire préféré
qui …. indexe les documents(entretien de B.Strainchamps) par leur localisation.  Un vrai documentaliste qui se met à indexer tout type de document;-)

Un index genre/pays (Patientez un peu que les marqueurs s'affichent), pratique et pédagogique, des Guides de lecture (roman, roman policier, livre de cuisine,..), plus sympathique qu'un index alphabétique.


Double-cliquez sur
l'image ou aller sur Flickr

Bibliosurf-indexcarto


Un autre exemple: des fiches touristiques avec une géolocalisation des résultats de la recherche.
Double-cliquez sur
l'image ou aller sur Flickr

Nievres-geolocalisation2

Services web pour la géolocalisation

* Geonames -  http://www.geonames.org
GEONAMES une base de données géographiques, billet de juin
2007

* GoogleMaps http://code.google.com/intl/ja/apis/maps/

* Données géographiques au format RDF de l’INSEE

* Citons aussi Géoportail de l'IGN qui propose une visualisation des données, mais nonl'exploitation (type mashup) de ces mêmes données. En tous les cas pas simplement.

 

Cartos de sites, artistiques

L’applet en ligne, AHAREF, développée par un artiste suisse, Marcel Salathe, offre une représentation graphique des sites basée sur l’utilisation des balises.

Légende : bleu> pour les liens (balise A); rouge> pour les tableaux (balises TABLE, TR, TD) ; vert >pour les balises DIV (structure du document HTML) ; violet > pour les images (balise IMG) – jaune: pour les formulaires (balises FORM, INPUT, TEXTAREA, SELECT, OPTION) ; orange>pour les retours à la ligne et tabulations (balises BR, P, and BLOCKQUOTE) ; noir >la balise HTML, le nœud racine  – gris> toutes les autres balises

Je vous poste quelques copies
d’écrans, mais il est préférable de faire tourner l’engin directement en
ligne en cliquant sur les liens des noms de site.

Il ne faut pas chercher de sémantique derrière ces représentations graphiques de sites, mais plutôt un amusement.
Quoi que parfois, …

Ce blog

Cartodescripteurs

Le site d’Apple France

Cartoapple

Véridique pour le site de Microsoft, qui existe pourtant bien dans la réalité 😉

Cartomicrosoft

http://www.aharef.info/static/htmlgraph/

Tagger pour la Library of Congress

Il y a un an (déjà !), je vous parlais des annotations d’un collectifs "normands" faites sur des photos de Normandie,
[Des nouvelles du front ! 33 membres sur Flickr ont mis à jour 2977
légendes de ces photographies ; au 01 janvier 2008, 360 000
visualisations ont été effectuées]

Puis plus récemment, je vous parlais des Utilisateurs libérés du Musée McCord

Je poursuis ici avec ces pratiques d’annotations par les internautes avec le projet de la Library of Congress avec Flickr.

Et que font les internautes des photos proposées par la Library of Congress ? Analyse des traces laissées par les internautes sur une photographie du "classeur" 1930s-1940s (traduction française de Galerie ?)  …

S’ENTHOUSIASMER
De très nombreux messages pour donner son sentiment sur les photos

SE SOUVENIR
Les natifs s’expriment  ; un afficionado/a de la photographie évoque son vieux Pentax]

APPRENDRE

Ici quelqu’un s’étonne de voir de la couleur pour une photo de 1913.
Quelqu’un d’autre lui signale avec amusement, qu’il s’agit de la date de naissance du photographe, la date de la photo étant 1943…. 

Voilà une leçon à la "maîtrise à l’information" qui profite à tous !  2 jours après, quelqu’un reconnaît qu’il s’était posé la question…

SE DOCUMENTER
D’autres posent des questions sur le photographe

STOCKER/CONSERVER
Plusieurs personnes ont conservé cette photo dans leurs favoris

ENRICHIR et ANNOTER
Quelqu’un d’autre rajoute un lien sur une biographie du photographe (qui se trouve sur un autre site US.
Quelques mots-clés ont été ajoutés, décrivant le paysage lui-même (blue sky, silo).

Il faut dire que tout comme pour le Musée McCord, la notice de la LC est assez sobre 😉 pour que l’on puisse sans problème envisager de l’enrichir.

Je vois aussi qu’il y a des francophones…

Et tout comme sur le portail de McCord, on peut annoter une portion de la photo] [passer la souris sur la photo]

Mais ne manquerait-il pas quelque chose : par exemple, un lien vers une carte pour nous dire exactement où c’est, parce que l’Etat de NY, c’est grand. Chose faite

QUE DIRE ?

Un fourmillement d’activités autour d’une photo, mise en ligne le 08 Janvier 2008 et déjà vue 6 814 fois !
Plus qu’un projet de redocumentarisation (je crois plus à l’organisation du projet "Normandie" pour cet objectif), c’est un réel projet d’animation et de valorisation du patrimoine !

Info repérée sur Nicomo

Outils de recherche et de navigation : Montague Institute

Montague Institute est depuis 1992 une référence pour tout ce qui touche aux services d’information dans les Entreprises.

A la fois organisme de formation (pour les directions et les professionnels de l’infodoc), service d’information et de recherche sur les domaines des métadonnées et des taxonomies, Montague Institute propose depuis 1998, une « Knowledge base publishing » qui mélait (à l’époque) des données du web, des productions plus traditionnelles et des données issues de base de données.  Cette base éditoriale a évolué en 2003 vers un système éditorial plus complet intégré à leur dispositif de formation : naissait alors le Knowledge Base Editor’s Digest, incorporant également des commentaires d’articles par des spécialistes,  toujours accompagné d’un index A-Z.

En 2005, Montague Institute décide d’outiller cette ressource, et de la partager avec une société que l’institut a initié et soutient : Society of
Knowledge Base Publishers, créé en 1998 par l’institut dont les membres sont des entreprises ou organismes à but non lucratifs, des agences gouvernementales…. Cette nouvelle plateforme, Montague Information Technology (MontagueInfoTech),  est personnalisable pour les clients de l’institut et les membres de l’association (je n’ai pas pu le tester : je ne suis pas (encore) membre).

Sont ainsi accessibles : des textes issus de la foire-aux-questions (et réponses), les articles de leur revue ainsi qu’une sélection de pages du site web, des commentaires, des messages (sélectionnés) de la liste de diffusion, les programmes de formation… : il s’agit certes d’une base d’information et de documents. Mais l’outillage (index, thesaurus, références croisées) proposé optimise considérablement l’exploitation des informations au delà des documents.

Les cordonniers ne sont donc pas toujours les plus mal chaussés !

J’apprécie le fait que pour toutes les ressources, un minimum d’information reste accessible à tous publics, la plupart des articles de fond n’étant accessible dans leur totalité qu’aux abonnés, of course. Par exemple, cet article sur les 10 mythes des taxonomies (Ten Taxonomies Myths) de 2002.

Intéressant aussi de pouvoir étudier  un écran de leur système de gestion des référentiels.
Chaque « terme » a un identifiant avec des dates de création et de mise à jour clairement indiquée, ainsi que les documents qui lui sont assignés dans le système. il y a également des liens crées entre chaque terme et des termes voire des requêtes (External queries) externes. La norme étendue ….

Quelques précisions sur cette rubrique Index.

<Cliquez sur l’image pour l’agrandir>

Montagueinstituteterms

La rubrique Index propose :
– un index Société, un index Personne, une liste des
Questions-Réponses,
– un index thématique sur 2 niveaux (Subjects)

<Cliquez sur l’image pour l’agrandir>

Montagueindexsujet

– associé à un thésaurus (définition, terme générique, spécifique,
associés)

<Cliquez sur l’image pour l’agrandir>

Montaguethesaurus

et une recherche sur un index A-Z intégrant le tout.

<Cliquez sur l’image pour l’agrandir>

Montagueindexaz

 

 

Thésaurus du réseau européen du patrimoine (HEREIN)

« système terminologique relatif aux politiques nationales [des
différents pays de l’UE] concernant le
patrimoine architectural et archéologique au sens défini par les
Conventions de Grenade (octobre 1985) et de La Vallette (janvier 1992) »

Un thésaurus dédié exclusivement à la recherche au sein d’un corpus
particulier de documents multilingues sur les politiques
nationales des Pays de l’UE. Les documents ne sont pas indexés avec ce vocabulaire ; celui-ci sert exclusivement à interroger de façon transversale, les textes nationaux dans leur intégralité et dans chacune des langues.

Localisation

http://www.european-heritage.net/sdx/herein/thesaurus/consult.xsp

Consultable de façon autonome (indépendamment de l’interrogation d’une
banque de données)

Site du Réseau européen du patrimoine :

http://www.european-heritage.net/sdx/herein/thesaurus/introduction.xsp

Editeur

Réseau européen du patrimoine
(système permanent d’information regroupant au sein du Conseil de
l’Europe les services gouvernementaux européens responsables de la
protection du patrimoine)

Correspondant en France : France Ministère de la Culture et de la Communication,
Direction de l’Architecture et du Patrimoine

Mise à jour

Essentiellement sur les versions linguistiques, les définitions et les notes historiques

Quelques données
chiffrées

Domaines thématiques : 9

Champs sémantiques : –

Descripteurs : environ 500 termes (dans chacune des langues)

Non-descripteurs : –

Relations – à compléter

Multilingue : 8 langues (allemand, anglais,
bulgare, espagnol, français, hongrois, polonais, slovène)

A venir : 23 langues à terme

Facettes
(Domaines)

1    Agents (organisations and people), Organismes et
intervenants, Agentes (colectivos e individuales)

2    Heritage Category, Catégories de biens culturels,
Tipos de bienes

       biens culturels, espaces,
intérêt patrimonial, patrimoine

3    Documentation, Systèmes de
documentation, Documentacion

       documentation,
inventaires, listes des biens protégés

4    Legal systems, Système
légal, Sistema legal

       instruments légaux, Outils
d’aménagement, gestion du patrimoine, propriété, délits

5    Interventions,
Interventions, Intervenciones

       types d’intervention,
politique d’intervention, programmes d’intervention, outils
d’intervention

6    Professional training,
skills and qualifications, Formation, métiers, compétences, Formacion y
cualificacion

7    Access and Interpretation, Communication et
sensibilisation, Comunicacion y sensibilizacion

8    Economic and Financial systems, Système économique
et financier, Aspectos económico – financieros

9    Broad concepts, Concepts généraux, Conceptos
generales

Concepts généraux liés au
patrimoine, par exemple archéologie.

Interface
d’interrogation

http://www.european-heritage.net/sdx/herein/national_heritage/search.xsp?action=thesaurus

Herein


Voici la résultat d’une requête : « espaces boisés »
Requête : espaces
boises (sites naturels sites tis sites peuplement sites arch ologiques
prot secteurs sauvegard prot paysages urbains paysages culturels zones
int historique zones arch ologiques lieux couverte ensembles arch
ologiques parcs jardins ruraux sites arch ologiques sites parcs arch
ologiques serves naturelles parcs naturels gionaux parcs naturels
nationaux zones naturelles int cologique floristique faunistique zones
protection patrimoine architectural urbain paysager emprises fonci res
abords bois jardins historiques centres villes historiques champs
bataille sites pave ensembles historiques sites patrimoine mondial
sites prot ume ter letek obmo ja espacios areas gebieden podru ja
obszary)

Langue(s) : N’importe quelle langue

Pays : N’importe quel pays

Ma Campagne Electorale ….

Nous parlons bien des candidats à la présidentielles 2007, mais il ne s’agit que d’une campagne de tests de leurs sites !

Ces sites, d’une durée de vie courte, ont déjà été étudiés sous plusieurs
angles, et je vous renverrais donc vers d’autres blogues pour:

Mais ne trouvez-vous pas qu’il manque un billet sur …. l’organisation
des sites sous l’angle de l’information et de la communication

!

Je vous propose donc de regarder comment une des sources d’information centrale (le programme)
est exposée sur les sites web des candidats, et ce qu’ils offrent aux
citoyens-internautes pour s’informer et échanger.

Bien sûr, comme outil d’information et de communication, un site web dépend :

– des choix en termes de stratégie
de communication
: les spécialistes de la communication sont ici
très présents et en filigrane on peut distinguer ceux qui
ont compris que les dimensions « infodoc » ou « échanges avec les lecteurs
» deviennent importants, ceux qui restent (toujours) ancrés sur le côté
« brochure » bien léchée mais fermée, et ceux, très rares, qui sont
devenus tri-encéphales : communication-documentation-webmestre.

– des moyens dégagés en
matière de communication, et du niveau de « professionnalisme » qui a pu
être mis en œuvre. Ceci est d’autant plus vrai pour un site d’une durée
de vie très courte et/ou pour des candidats qui savent qu’ils ne seront pas défrayés (sous la barre des 5%).

Et comme tout système d’information, la conception et la construction
du site vont dépendre pour partie du nombre d’utilisateurs potentiels,
actifs ou au moins présents (un billet sur « DADVSI» sur le site bayrou
a été commenté par 66 internautes mais il a été lu 16.944 fois), et
bien sûr de la diversité et du volume des informations et documents que
l’on souhaite rassembler et mettre à disposition.

Sur ce point, je me suis focalisée exclusivement sur le programme
et les forums
.

Méthode :

– Dépouillement des 12 sites et de leurs blogues compagnons entre les
09 et 10 avril 2007. A noter que le site de José Bové que j’avais
analysé, n’existe plus
(josebove2007.org); il est redirigé vers une autre adresse où je
n’arrive pas à trouver le programme.

– Inscription sur quelques forums pour tester les fonctionnalités
proposées (Bové, Bayrou, Royal, Sarkosy, Villiers) avec mon pseudo
habituel Dalb et mon adresse électronique (SylvieATD@aol.com). Les
forums sont ceux proposés par les candidats sur leur site ou leur
blogue. Ce travail a été réalisé avec un souci d’honnêteté vis-à-vis
des autres participants aux forums et des candidats.
D’ici peu je vais
me désinscrire de la plupart de ces forums.

Je vous livre ici une synthèse de cette étude
en trois parties :

1. Le site et la place du programme ou projet

2. Le programme, un document numérique structuré
accessible sur le site

3. Des outils à disposition des lecteurs

Bien sûr, il peut y avoir des erreurs ou oublis – non
intentionnels, croyez-le bien.

N’hésitez pas à me les signaler.

Attention : les sites signalés dans ce billet seront quasiment fermés jusqu’à lundi 23 avril matin.

Lire la suite