Le TAG – Thésaurus de l’activité gouvernementale du Québec : retour d’expérience

Annonce octobre 2014 :  Mai 2012 – Je vous avais parlé du TAG (Thésaurus de l’activité gouvernementale) du Québec. Octobre 2014 : diffusion au format skos de ce thésaurus : http://www.thesaurus.gouv.qc.ca/tag/consultation/oa.do.
Adresse de déchargement direct – http://www.thesaurus.gouv.qc.ca/tag/tag_skos.xml

Lire la suite

Thésaurus et autres schémas de concepts : documents normatifs

Liste des normes ou documents normatifs, quels que soient leur état et leurs origines, concernant les thésaurus, plus globalement les vocabulaires contrôlés et les index.
Création : le 18 août 2005. Dernière mise à jour : août 2014
Mise à  jour : 20 Novembre 2005 ; 15 Avril 2006 ; 10 Novembre 2007, août 2008; ocotbre 2009; août 2010 ; mars 2013 ; août 2014


  1. Normes sur les thésaurus et autres schémas de concepts
  2. Schémas XML et autres outils associés
  3. Normes nationales sur les thésaurus
  4. Autres normes en proximité

Lire la suite

Partie 2 de la norme ISO 25964 sur l’interopérabilité – consultable en ligne

Comme pour la partie 1, le BSI (UK) vous propose de consulter et surtout de commenter, sur sa plateforme de documents en projets, la Partie 2 de la norme des thésaurus pour la recherche concernant l’interopérabilité entre vocabulaires contrôlés.

Une fois sur le site :

  • Faire une recherche rapide « 25964 »; vous tombez sur le projet…
  • Cliquez alors sur Draft Details, puis Read Draft.
  • Le système vous demande alors de vous vous connecter.
    Si vous n’avez pas pris encore un compte, n’héistez pas : le BSI ne vous demande qu’une adresse électronique (pour laisser des commentaires, c’est préférable).

Plus encore que pour la partie 1, cette partie 2 (présentation rapide sur Descripteurs) peut être lue sélectivement. Si vous êtes intéressé par : les classifications (dont celles utilisées en RM), les vedettes matières ou plutôt les ontologies ou les terminologies, il y en a pour tous les goûts !

N’hésitez pas !

Site du BSI –  http://drafts.bsigroup.com/    Draft review

> Logiciels pour vocabulaires orientés « organisation et recherche »


Regroupements de différents billets sur le thème des logiciels pour vocabulaires dédiés à la recherche d’information
Création : 27 Janvier 2010. Mis-à-jour: août 2014
Voir aussi sur Descripteurs – Logiciels de création et maintenance de thésaurus (2016) 


Par vocabulaires, nous nous limitons ici aux thésaurus et autres répertoires de concepts/termes utilisés dans des dispositifs informationnels et documentaires. Ce sont :

  • des listes de concepts
  • organisés entre eux par différents types de relations (hiérarchiques, associatives, équivalence, ou plus spécialisées : cause/conséquence, historique,…)
  • caractérisés par différents attributs spécifiques à la catégorie de concepts (date de création pour des noms d’organismes, lieu pour la localisation d’un monument, appartenance à un ou plusieurs domaines d’activité …),
  • représentés en général par des termes ou des notations

Un autre terme rencontré est celui de référentiel ou référentiel terminologique (https://www.diigo.com/user/dalbin/Dalbin%28nom%29%20r%C3%A9f%C3%A9rentiel-termino%28sujet%29).

Des logiciels ou applications en ligne couvrent cinq grandes familles de fonctions dédiées à ces vocabulaires :

  1. Concevoir un vocabulaire ;
  2. Aligner des vocabulaires entre eux ;
  3. Gérer un ou plusieurs vocabulaires ;
  4. Exploiter (en recherche) un vocabulaire ;
  5. Communiquer un vocabulaire.

A ces fonctionnalités liées aux vocabulaires, certains produits offrent des modules de gestion du travail en équipes (workflow, collaboratif).

En France traditionnellement (depuis 30 ans), la gestion informatisée des thésaurus s’effectue au moyen d’un module particulier des logiciels documentaires. Ces modules ne sont pas utilisables de façon autonome, et leur coût d’acquisition ne se comprend que dans le cadre du développement d’une application documentaire (base documentaire, catalogue, portail). Ces « modules de gestion de thésaurus » couvrent des fonctions de gestion d’un vocabulaire déjà construit (étape 3) et d’exploitation (étape 4) dans le cadre d’une application documentaire particulière.

Les fonctions d’assistance aux étapes de conception (étape 1) et celles propres à la communication de ces ressources terminologiques (étape 5) sont respectivement très faibles ; et pour les fonctions d’édition/communication limitées; celles d’alignement (étape 2), plus récentes sont inexistantes ou font l’objet d’une offre de services dédiée.

Le monde anglo-saxon (UK, USA, mais aussi AUS) a toujours eu un marché de progiciels de gestion de thésaurus spécialisés utilisables de façon autonome. Les termes employés en anglais sont : « Thesaurus management software » ou « Software for building and editing thesaurus ». Ces applications sont centrées sur des fonctions d’aide à la conception ou au réengineering de vocabulaires (étape 1), leur gestion dans le temps indépendamment de leurs usages (étape 2), leur communication sous de multiples formes ce qui supposent des fonctions d’import/export et d’éditions variées. La souplesse fonctionnelle (typage des relations, personnalisation) permettent d’initier des activités d’alignement « simples » entre vocabulaires. Ce type d’outils spécialisés existaient également dans le monde germanique. Aujourd’hui, ce type d’outil est également exploité en France.

=> Sur Descripteurs – Logiciels de création et maintenance de thésaurus (2014)

L’appellation « Taxonomy Management Software » rend compte de l’évolution fonctionnelle vers un élargissement des types de vocabulaires pris en compte et vers une extension pour certaines offres à des automates pour des fonctions de catégorisation ou d’extraction automatiques d’entités par exemple.

Des standards ou normes existent pour concevoir les thésaurus (Norme ISO 25964-1) et les exploiter sur le Web (SKOS).

Les évolutions les plus récentes conduisent à une articulation ou une transformation de ces vocabulaires de nature essentiellement terminologique à des vocabulaires partagés et structurés de façon formelle (ontologies informatiques), des transformations adaptées d’une part au web (web de donnée et web sémantique) et aux applications ouvertes et interopérables (sortir des silos). Nous pouvons citer comme exemple public le travail réalisé au Ministère de la Culture et de la Communicationhttp://data.culture.fr/thesaurus/.

Thésaurus EuroVoc : retour d’expérience

Nous avons présenté dans un précédent billet, le nouveau site de diffusion du thésaurus EuroVoc de l'Union Européenne.

Nous laissons la parole ici à Christine LAABOUDI-SPOIDEN qui travaille depuis 6 ans au sein de l'équipe en charge de ce thésaurus et qui a particulièrement oeuvré pour ces nouveaux développements.

ACTU : Conférence EuroVoc et Web Sémantique, les 18 et 19 novembre 2010 (Luxembourg)
Seminaire EuroVoc Novembre 2010

[Quelles ont été vos motivations pour modéliser le thésaurus suivant SKOS ?]

En 2007, l’Office des publications a commandité deux études : l'une sur les différents systèmes de gestion de thésaurus, l’autre sur la faisabilité d’interopérer Eurovoc et d’autre thesauri. En même temps, nous avons fait de la « veille »  sur les tendances dans le monde des thésaurus et constaté les changements chez AgroVoc et Gemet notamment.

Lire la suite

EuroVoc : du changement

Thésaurus EuroVoc : Porte d'entrée sur le site EuroVoc est le thésaurus de l'Union Européenne utilisé par plusieurs institutions, dont le Parlement européen, le Conseil de l'UE et le Conseil de l'Europe.
Ce nouveau site de consultation du thésaurus multilingue EuroVoc fait suite à la dernière révision réalisée en 2008 (éd.4.3), révision qui modifiait en profondeur deux domaines – géographie (domaine 72) et organisations internationales (domaine 76). 

Je vous propose deux billets sur le thésaurus EuroVoc : ce premier  billet porte sur le travail de modélisation (SKOS) réalisé et un deuxième billet est consacré à un retour d'expérience de Christine LAABOUDI-SPOIDEN, responsable du thésaurus au sein de l'UE.

Les 21 domaines du thésaurus EuroVoc couvrent les centres d'intérêt de l'Union Européenne
vie politique, relations internationales, communautés européennes, droit, vie économique, échanges économiques et commerciaux, finances, questions sociales, éducation et communication, sciences, entreprise et concurrence, emploi et travail, transports, environnement, agriculture, sylviculture et pêche, agroalimentaire, production, technologie et recherche, énergie, industrie ainsi que deux listes de noms propres: géographie et organisations internationales.

Versions linguistiques : toutes les langues officielles de l'UE (soit 22 à ce jour) sont couvertes, ainsi que le croate et le serbe. Un lien conduit vers d'autres versions linguistiques hébergées à l'extérieur : le russe et deux langues régionales (catalan et basque).

Droit : Les mentions juridiques sont bien précisées, avec une grande liberté d'utilisation de ces données, offertes sous réserve que figure la mention «© Union européenne, 2010, http://eurovoc.europa.eu/». Une pratique bien utile, que d'autres administrateurs de vocabulaires pourraient appliquer.

Lire la suite

Guide du Getty sur les vocabulaires contrôlés

Le Getty vient (2010) d’éditer une version fortement remaniée de leur guide sur les vocabulaires contrôlés.

Ce nouveau guide – en version électronique et papier – présente les enjeux, les caractéristiques et les usages des vocabulaires contrôlés en recherche et indexation, dans le domaine du « patrimoine culturel et artistique ». 

Lire la suite

Consulter et commenter en ligne le projet ISO DIS 25964-1 sur les thésaurus

The English people impress me (Les Anglais m'impressionnent) !

Le BSI – British Standard Institution, nous propose le projet de norme ISO DSI 25964-1 sur les thésaurus, en ligne sous la forme d'un document manipulable, à partir de la table des matières qui est – selon les règles de l'ISO -finement structurée. 

En fait, ce document numérique structuré est accessible sur le site du BSI entièrement dédié depuis 2008, aux projets de norme, consultables et commentables en ligne.

Ceci nous/vous permet : 

– de lire la norme !

– d'étudier les commentaires des autres

– de commenter

Le support pdf ou papier du projet de norme est disponible au BSI pour les non-membres (faut-il être anglais ? je le ne pense pas) à environ 40 euros, au lieu de 65 euros sur le site de l'ISO.

La clôture des commentaires est prévue pour le 28/02/2009 (la fin de la période officielle est fin mars), ceci pour laisser le temps au groupe anglais de traiter ces informations…. et de sélectionner dans ce corpus ce qu'ils feront remonter comme "British Comments".

Je vais également exploiter cette plateforme…. De plus en tant que responsable du groupe français pour ce projet de norme, j'utiliserai également les commentaires diffusés pour enrichir les commentaires français.

N'hésitez donc pas.

PS : le site ISO 25964 sur le NISOhttp://www.niso.org/schemas/iso25964/

Ajout du 25/12/2009

Présentation du projet de norme ISO DIS 25964-1 sur les thésaurus pour la recherche et les points communs ou de divergences avec la norme NF 47-100:1981
http://www.slideshare.net/Dalb/presentation-du-projet-de-norme-iso-dis-259641-sur-les-thsaurus

Parution de la norme ISO DIS 25964 (thésaurus)

MAJ de Janvier 2012

ISO 25964-2 – Thésaurus et interopérabilité avec d’autres vocabulaires – DIS – Enquête publique 

MAJ de Décembre 2011

ISO 25964-1(2011) – Thésaurus pour la recherche documentaire » : publication août 2011 

 


MAJ de Mars 2011

N’attendons pas la publication officielle de la norme ISO – qui semble s’éterniser, et commençons à travailler sur le fond.
  • Un atelier à l’ADBS sur la norme ISO 25964-1 sur les thésaurus présenté par Hélène Zysman et Hélène Rabault, le 15 février 2011 (sur slideshare)
  • Une présentation de cette norme à l’attention d’éditeurs de logiciels (sur slideshare)

 


    MAJ de Janvier 2011

    Le document de norme en projet FDIS a été approuvé pour publication le 23/12/2010.

    Nous attendons donc sa publication prochaine en tant que norme ISO 25964-1 – Thesauri and interoperability with other vocabularies: Thesaurus for information retrieval, en anglais donc. Nous essayons de produire une version en Français (les bonnes volontés sont très attendues…).

    Et je le voie seulement maintenant que le titre sur le site de l’ISO n’a pas été traduit en français comme le groupe d’expert l’avait demandé !! Oh les joie de l’ISO/Afnor !!


    MAJ de Juillet 2010 

    Après une phase de commentaires publics, le projet est en phase DIS – Draft Int. Standard.http://www.iso.org/iso/iso_catalogue/catalogue_ics/catalogue_detail_ics.htm?ics1=01&ics2=140&ics3=20&csnumber=53657

    La deuxième partie de ce projet de norme est en cours de production.Part 2: Interoperability with other vocabularies


     MAJ du 29/12/2009
    Présentation du projet de norme ISO DIS 25964-1 sur les thésaurus pour la recherche et des points de convergence/divergence avec la norme NF 47-100:1981http://www.slideshare.net/Dalb/presentation-du-projet-de-norme-iso-dis-259641-sur-les-thsaurus

    Mise à jour 20 Novembre 2009
    Norme en anglais en ligne (après simple inscription sur le site du BSI) : http://drafts.bsigroup.com/?i=517  [Fermé fin mars 2010]
    Autres documents en français sur Delicious


    Après SKOS en août 2009 qui est devenue une recommandation du W3C, voici venir la norme ISO DIS 25964-1 sur les thésaurus.
    Pas de doublon, mais deux documents à caractère normatif qui se complètent. D’ailleurs, beaucoup au sein du Groupe ISO sur les thésaurus ont également participé aux réflexions et échanges sur SKOS.

    La norme ISO DIS 25964-1 vient remplacer deux (très) anciennes normes, l’une sur les thésaurus monolingues (ISO 2788:1986) et l’autre sur les thésaurus multilingues (ISO 5964:1986).

    ISO DIS 25964-1 
    – Information and documentation — Thesauri and interoperability with other vocabularies — Part 1: Thesauri for information retrieval
    – Information et documentation – Thésaurus et interopérabilité avec d’autres vocabulaires — Partie 1: Thésaurus pour la recherche documentaire

    Nous avons 5 mois (jusqu’en mars 2010) pour commenter.

    Et pour vous appâter, le sommaire de ce document :

    Introduction viii
    1 Scope 1
    2 Definitions 1
    3 Symbols, abbreviations and other conventions 10
    4 Thesaurus overview and objectives 13
    5 Concepts and their scope in a thesaurus 15
    6 Thesaurus terms 18
    7 Complex concepts 31
    8 The equivalence relationship, in a monolingual context 37
    9 Equivalence across languages 41
    10 Relationships between concepts 48
    11 Facet analysis 58
    12 Presentation and layout 60
    13 Managing thesaurus construction and maintenance 78
    14 Guidelines for thesaurus management software 88
    15 Data model 93
    16 Integration of thesauri with the applications that use them 106
    17 Exchange formats 109
    18 Protocols 110
    Annex A (informative)  Examples of displays found in published thesauri 112
    Annex B (informative)  XML Schema for data exchange 130
    Bibliography 131
    Index 135

     

    Pour les professionnels (et les formateurs) des changements importants, un peu plus encore pour ceux qui utilisaient la norme NF Z 47-100:1981 : distinction formalisée entre concepts et termes, enrichissement des types de relations, facette, ….Cette version, à la suite de la norme américaine sur les thésaurus de 2005, intègre des recommandations concernant les logiciels de gestion et l’intégration de thésaurus dans des applications.
    Le modèle de données constitue une bonne source de travail pour les développeurs (ne pas hésiter à diffuser largement). Mais ce chapitre est également un bon outil de travail pour les professionnels pour comprendre les évolutions. Enfin le schéma XML n’est pas encore testé et n’est pas encore proposé dans le DIS.

    Je rappelle que ce document ne constitue que la première partie de la norme, qui sera complétée par une deuxième partie sur l’interopérabilité avec d’autres thésaurus. Nous venons de démarrer ces travaux…

    Le groupe français qui travaille sur cette norme prépare un document de communication sur la norme.

    Mais n’hésitez pas à en faire l’acquisition (pour la somme de 65€ ou 98 F suisses sur le site de l’ISO), et à le commenter, même de façon partielle.
    A suivre.