Partie 2 de la norme ISO 25964 sur l’interopérabilité – consultable en ligne

Comme pour la partie 1, le BSI (UK) vous propose de consulter et surtout de commenter, sur sa plateforme de documents en projets, la Partie 2 de la norme des thésaurus pour la recherche concernant l'interopérabilité entre vocabulaires contrôlés.

Une fois sur le site :

  • Faire une recherche rapide "25964"; vous tombez sur le projet…
  • Cliquez alors sur Draft Details, puis Read Draft.
  • Le système vous demande alors de vous vous connecter.
    Si vous n'avez pas pris encore un compte, n'héistez pas : le BSI ne vous demande qu'une adresse électronique (pour laisser des commentaires, c'est préférable).

Plus encore que pour la partie 1, cette partie 2 (présentation rapide sur Descripteurs) peut être lue sélectivement. Si vous êtes intéressé par : les classifications (dont celles utilisées en RM), les vedettes matières ou plutôt les ontologies ou les terminologies, il y en a pour tous les goûts !

N'hésitez pas !

Site du BSI –  http://drafts.bsigroup.com/    Draft review

Publicités

Guide du Getty sur les vocabulaires contrôlés

Le Getty vient (2010) d’éditer une version fortement remaniée de leur guide sur les vocabulaires contrôlés.

Ce nouveau guide – en version électronique et papier – présente les enjeux, les caractéristiques et les usages des vocabulaires contrôlés en recherche et indexation, dans le domaine du « patrimoine culturel et artistique ». 

Lire la suite

Optimiser l’accès à l’information, une opportunité pour les langages documentaires ?

Après un numéro spécial de la revue Documentaliste SI au début de l’année, l’ADBS poursuit sa réflexion sur la place des vocabulaires contrôlés dans l’accès à l’information et organise une Journée d’étude le 20 septembre 2007
(Paris) sur ce sujet.

Edito : « Si l’accès à l’information est aujourd’hui dominé par les moteurs de
recherche statistiques aux algorithmes toujours plus sophistiqués, la
navigation au travers d’interface guidée n’a-t-elle pas également une
place de choix.

Comment les utilisateurs de systèmes documentaires cherchent-ils
l’information ? Peut-on dresser une typologie selon les publics ?
Trouvent-ils facilement ? La pratique quotidienne d’Internet de ces
dernières années nous permet aujourd’hui d’effectuer un panorama des
usages, des pratiques et des outils mis en œuvre dans la recherche
d’information.

Faut-il continuer à indexer des ressources documentaires et à
produire des thésaurus ? Quelle est la place de l’utilisation du
langage naturel ? Quelle est celle des accès classificatoires ?

Quel rôle doivent ou peuvent tenir les vocabulaires contrôlés dans ce
contexte où chaque élément d’information (métadonnées, texte
intégral, et bientôt l’image elle-même) devient un point d’entrée pertinent ?

Cette journée apour objectif de repérer les modalitésde recherche
mises en œuvre par les différents types d’utilisateurs et de délivrer
quelques éléments clés aux professionnels afin de les aider à
positionner et à enrichir leurs offres d’accès à l’information. »

Infos sur la journée

Programme : http://www.adbs.fr/uploads/journees/5554_fr.php

Bulletin d’inscription :

Vient de paraître. Numéro spécial Documentaliste sur les vocabulaires contrôlés

« Pour nourrir le débat entre tenants de l’obsolescence des langages
documentaires et militants de leur extrême actualité, la revue
Documentaliste – Sciences de l’information propose un numéro thématique
sur les langages documentaires et les outils linguistiques de
traitement de l’information. » (JM Rauzier).

Une alternance d’approches théoriques et d’exemples d’applications…
Il est possible de faire l’acquisition de ce numéro en dehors de l’abonnement à la revue.
[ http://www.adbs.fr/site/publications/ouvrages/)

Langages documentaires et outils linguistiques : principes, usages, perspectives », numéro thématique de la revue Documentaliste – Sciences de l’information. Revue Documentaliste – Sciences de l’information – Volume 44 : n° 1 / février 2007

Éditorial – Actualité des langages documentaires
Jean-Michel Rauzier, rédacteur en chef, p.1

Introduction – Rupture ou continuité ? Jacques Maniez, p.12-16

Première partie – La représentation des contenus p.17

  • Les langages documentaires : un panorama, quelques remarques critiques et un essai de bilan, Bruno Menon, p.18-28
  • Utilisation du thésaurus MeSH dans le site CISMeF, Gaétan Kerdelhué, p.29
  • Technologies linguistiques et modes de représentation de l’information textuelle, Stéphane Chaudiron, p.30-39
  • Outils de recherche et analyse sémantique : le portail de BNP Paribas. Propos recueillis auprès de Michel Bernardini et mis en forme par Florence Gicquel, p.40-41
  • Thésaurus et informatique documentaires : partenaires de toujours ?, Sylvie Dalbin, p.42-55
  • Un outil de catégorisation automatique : l’exemple de Total. Propos recueillis auprès d’Aline Duru et mis en forme par Florence Gicquel, p.56-57
  • Indexation collaborative et folksonomies. Élie Francis et Odile Quesnel, p.58-63
  • Un glossaire peut cacher une ontologie… : l’expérience de Lafarge. Propos recueillis auprès de Lafarge et mis en forme par Florence Gicquel, p.64

Deuxième partie – Normes, standards et interopérabilité. p.65

  • Les normes de conception, gestion et maintenance de thésaurus : évolutions récentes et perspectives. Par le groupe Langages documentaires de l’ADBS, p.66-74
  • SKOS, un langage de représentation de schémas de concepts. Michèle Lénart, p.75
  • Thésaurus et informatique documentaires : des Noces d’Or. Sylvie Dalbin, p.76-80
  • Les ontologies : antécédents, aspects techniques et limites. Jacques Chaumier, p.81-83
  • De la compatibilité à l’interopérabilité en matière de repérage d’information pertinente : problématique et exemple d’OTAREN. François Feyler, p.84-92
  • Des outils d’indexation variés pour alimenter en réseau une base de données : l’exemple de la BDSP. Marie-Édith Vignon, p.93-95

Et dans la rubrique « Les nouveautés : Notes de lecture», l’analyses de 3 ouvrages (p.96-114) :

  • Terminologie et accès  à l’information. Sous la direction de Widad Mustafa El Hadi. Paris : Hermès Science Publications : Lavoisier, 2006. – 262 p. –(Traité des  sciences et techniques de l’information).  – ISBN 2-7462-1295-1 ;
  • Compréhension des langues et interaction, Sous la direction de Gérard Sabah. Paris : Hermès Science Publications :  Lavoisier, 2006. – 400p. – (Traité IC2, série Cognition  et traitement de l’information).  – ISBN 2-7462-1256-0
  • Sémantique et traitement automatique du langage naturel. Sous la direction de Patrice  Enjalbert.  Paris : Hermès Science Publications :  Lavoisier, 2005. – 410 p. – (Traité IC2, série  Cognition et traitement de l’information). – ISBN 2-7462-1126-2

La nouvelle norme américaine sur les vocabulaires contrôlés (NISO Z39.19-200x)

La proposition d’évolution de la norme sur les thésaurus faite par la NISO (National Information Standards Organization) a été approuvée en Juillet 2005 par l’ANSI (American National Standards Institute).
Elle est encore en accès libre (et gratuit) sur le site de la NISO avant publication officielle (elle sera alors payante ;-).

La NISO  « repère, développe, maintien et publie des normes techniques
pour le management de l’information dans un environnement évolutif et
toujours plus numérique qu’est le notre (libre traduction de About NISO) ». NISO représente les USA auprès de l’ISO/TC46 (Information & documentation).
Bref un regroupement professionnel autonome par rapport à la structure officielle de normalisation.

Une vaste étude avait été engagée dès 1999 au sein de l’ANSI. Les résultats montraient  qu’un simple « toilettage » de la norme n’était pas suffisant. D’où des changements importants :

  • D’abord sur le territoire de la norme : du thésaurus, on passe à une prise en charge des vocabulaires contrôlés, c’est-à-dire des thésaurus mais aussi des lexiques, listes de synonymes et taxonomies, les règles portant sur les termes étant considérés comme identiques pour ces différents vocabulaires. D’où le titre de la nouvelle norme Z39.19 : « Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies ».
  • Rigueur et précision dans la présentation du coeur de la norme (les termes, leurs relations);
  • Officialisation, sous la forme d’une notation spécifique, des relations partitives (TGP/TSP) et d’instance (TSI/TGI).
  • Une prise en compte de la diversité des publics : gestionnaire/éditeur ou utilisateur final, et de celle des supports (papier, écran, Web) pour la présentation des vocabulaires.
  • Les questions liées à l’interopérabilité fait l’objet d’un chapitre autonome.
  • Un autre chapitre traite de la construction et de la maintenance des vocabulaires contrôlés. Ce dernier inclut une liste de fonctionnalités que devraient posséder les outils informatiques de gestion des langages.

Complétée par de nombreux exemples (qui ne sont pas officiellement inclus dans la norme) et rédigée avec un souci de clarification voire pédagogique, la norme ainsi enrichie, totalise…. 188 pages.
Bonne lecture !

Sujets, concepts et classes : des distinctions fondamentales

Pour localiser ce billet : http://purl.oclc.org/NET/ATD/001

Il existe trois grandes familles de vocabulaires contrôlés utilisés pour l’indexation et l’accès à l’information qu’il convient de bien distinguer : listes de sujets, thésaurus et plan de classification.

Nous proposons dans cette fiche synthétique de traiter, à partir de la notion de « sujet documentaire », des fondements de ces langages : les « sujets » d’une liste de sujets, les « concepts » d’un thésaurus et les « classes » d’un plan de classification….

Lire la suite

Vocabulaires documentaires contrôlés et thésaurus

Nous nous intéressons, sur ce site, aux vocabulaires documentaires et plus particulièrement aux thésaurus.

Cela mérite quelques petites précisions …

  • un vocabulaire est constitué d’un ensemble de termes définis au sein / pour un groupe, une communauté de pratique, une organisation…, pour un usage et un contexte précis.
  • Ce vocabulaire est documentaire : c’est un outil de représentation et d’accès à l’information. Un vocabulaire documentaire n’est pas destiné à fournir des définitions ou des synonymes linguistiques (c’est le rôle d’un dictionnaire ou d’un glossaire). Selon la famille de vocabulaires documentaires utilisés (lexique, plan de classement, taxonomie ou thésaurus), les modes d’accès proposés à l’utilisateur diffèrent.
  • Il est dit contrôlé car chacun des termes choisis couvre un sens précis, univoque qui doit être utilisé pour un usage particulier. Ces vocabulaires sont utilisés pour contrôler la description des objets documentaires en amont, et l’accès à l’information en aval, même si pour ce dernier cas, il existe des moyens pour rendre transparent l’usage de thésaurus aux différents profils d’utilisateurs,
  • Le thésaurus que nous appellerons thésaurus documentaire est un vocabulaire, outil d’accès à l’information, offrant deux caractéristiques particulières : les termes sont utilisables en coordination entre eux au moment de la requête ;  ces termes sont liés entre eux par différents types de relations offrant ainsi un maillage utilisable à l’indexation et à la recherche.