Zthes, profil Z39.50 pour la navigation dans un thésaurus


Zthes est un profil Z39.50 qui permet de naviguer et de sélectionner des
termes au sein d’un thésaurus. Ce profil définit un modèle abstrait pour représenter les termes du
thésaurus utilisables dans une recherche sous la forme d’une DTD XML Zthes, ainsi que les moyens pour
implémenter ce modèle.
Nous présentons brièvement les finalités de Z39.50 et de ses profils, ainsi que le profil Zthes. Un
extrait d’un thésaurus présenté selon la DTD Zthes est exposé à la fin de
la note.


Les profils Z39.50

La norme ANSI/NISO Z39.50 définit un protocole permettant à
deux serveurs de communiquer entre eux pour formuler une recherche,
extraire des informations et les présenter.
Ce protocole définit
une base de données « abstraite » et un ensemble de fonctions à
réaliser sur celle-ci : rechercher et extraire des données, consulter
des index ou un thésaurus,…

Dans ce cadre, des profils, applications particulières autour de Z39.50, se sont développés.
Un
profil identifie un jeu de normes de base ainsi que les options et les
paramètres appropriés nécessaires à un contexte donné : recherche,
sélection dans un index,…

Des références sur le sujet :

Un exemple dans un autre secteur
Le profil GEO Z39.50
permet d’incorporer la norme de contenu de métadonnées géospatiales
numériques du FGDC (Federal Geographic Data Committee – USA).

Le profil Zthes
Z39.50 ?

Zthes est un profil Z39.50 qui concerne la navigation dans des
thésaurus, ceux-ci suivant la norme ISO 2788 et peuvent être bilingues.

Le profil définit un modèle abstrait pour représenter les termes du
thésaurus utilisables dans une recherche, ainsi que les moyens pour
implémenter ce modèle avec le protocole Z3950 et des suggestions pour
être utilisé avec d’autres formats ou protocoles.

Modélisation et représentation des termes du thésaurus : Zthes

Le thésaurus est considéré ici comme une base de données. Chacun des
termes du thésaurus, y compris les non-descripteurs, constitue un
enregistrement de cette base.
La structure de représentation des termes du thésaurus suit un modèle
commun qui inclut les métadonnées associées à la norme internationale
ISO 2788 (et ISO 5864 pour le bilinguisme) tels que terme, type de terme,
relations,…, et des métadonnées spécifiques à l’application : base
cible, champ concerné, occurrence du terme dans la base cible.
La présentation des termes peut suivre deux formats : complets ou
courts, suivant en cela les propositions pour les ensembles de données
proposées par Z39.50.

Remarque

  • Comme dans n’importe quelle base de données, chaque
    enregistrement est identifié par un identifiant, en général un numéro
    unique. Ce principe n’est que très rarement mis en œuvre dans les
    logiciels de gestion de thésaurus.
  • Tous les termes y compris les non-descripteurs étant identifiés, il existe une métadonnée termType
    qui permet de les distinguer précisémment : PT pour terme préférentiel
    (descripteur); ND pour non-préférentiel (non-descripteur) ; NL pour
    relais virtuel.

Requêtes possibles

En exploitant ce double protocole
(Zthes et Z3950), il est possible de répondre à de nombreuses requêtes
qui correspondent dans ce contexte à des services Zthes :

  • recherche à partir d’un identifiant ou d’un terme (chaîne de caractères) ;
  • trouver des mots dans les enregistrements ;
  • trouver les termes spécifiques d’un terme donné ;
  • trouver les termes génériques d’un terme donné ;
  • trouver les termes associé d’un concept donné ;
  • trouver le terme préférentiel d’un concept donné ;
  • trouver les termes non-préférentiels d’un concept donné ;
  • trouver des termes associés d’un concept donné ;
  • trouver des équivalents linguistiques d’un terme donné

Prise en compte des technologies des Services Web : Zthes for SWR

Le protocole Zthes a été défini en 1999, époque déjà ancienne pour le monde du Web ! 
Zthes
a été récemment redéfini en prenant en compte le développement des
Services Web, en particulier les SRW (Search/Retireval Web service).

Evolutions fonctionnelles de Zthes

Ces évolutions visent :

  • la prise en compte des versions
  • la prise en compte de la combinaison de termes pour représenter un
    concept complexe (extraction de charbon EM charbon + extraction minière)
  • l’utilisation de termes considérés comme appropriés comme point de départ d’une navigation.
  • des termes dont les notes contiennent des mots spécifiques
  • des termes dans une langue spécifique


Présence dans les logiciels

Il existe très peu de logiciels spécialisés, documentaires voire de
gestion de thésaurus, qui proposent à l’export des données, le format
Zthes.
Nous avons repéré Idesia d’Archimed et Cognatrix de LGOSystems.
Beaucoup d’autres produits proposent des exports XML, mais sans DTD associée.

Cette liste est bien sûr à affiner.

En conclusion

Nous venons de voir un schéma de modélisation de thésaurus pour un
usage et un contexte précis : la récupération de termes dans le cadre
d’une recherche documentaire Z39.50. 

Ce schéma Zthes doit être appréhendé parallèlement d’une part à
l’évolution des normes sur les thésaurus (une nouvelle norme NISO/ANSI
sur les vocabulaires contrôlés a été validée en juillet 2005), et d’autre part les travaux du Web sémantique en particulier SKOS qui travaillent sur la modélisation RDF des thésaurus.

Ressources


Un exemple Zthes

Etabli à partir de quelques termes issus du thésaurus sur la
Discrimination raciale, Service d’information antiracisme (ARIS),
février 2005.

Attention : Le gras apparaissant sur certains termes et codes a été rajouté par  l’auteur et ne fait pas parti du modèle.

<Zthes>   
– <term>
   <termId>ATD0000001</termId>
   <termName>Discrimination</termName>
   <termType>PT</termType>
-<termNote>
La
discrimination implique tout acte ou conduite qui nie à certains
individus l’égalité de traitement par rapport à d’autres individus
parce qu’ils appartiennent à un groupe particulier de la société. »
(Secrétaire général des Nations Unies, Les principaux types et les
principales causes de discrimination, publication des Nations Unies, n°
de vente 49, XIV.3.)
</termNote>
   <termCreatedDate>2004-07-20</termCreatedDate>
   <termCreatedBy>SD</termCreatedBy>
   <termModifiedDate>2004-11-22T14:13:52.0</termModifiedDate>
   <termModifiedBy>SD</termModifiedBy>
-<relation>
   <relationType>UF</relationType>
   <termId ATD0000002</termId>
   <termName>groupes désavantagés</termName>
   <termType>ND</termType>
</relation>
-<relation>
   <relationType>UF</relationType>
   <termId>ATD0000003</termId>
   <termName>intolérance</termName>
   <termType>ND</termType>
</relation>
–    <relation>
   <relationType>RT</relationType>
   <termId>ATD0000025</termId>
   <termName>préférence</termName>
   <termType>PT</termType>
</relation>
-<relation>
   <relationType>NT</relationType>
   <termId>ATD0000006</termId>
   <termName>discrimination ethnique</termName>
   <termType>PT</termType>
</relation>
-<relation>
   <relationType>NT</relationType>
   <termId>ATD0000035</termId>
   <termName>exclusion</termName>
   <termType>PT</termType>
</relation>
-<term>
   <termId> ATD0000035</termId>
   <termName>exclusion</termName>
   <termType>PT</termType>
   <termCreatedDate>2004-07-20</termCreatedDate>
   <termCreatedBy>SD</termCreatedBy>
   <termModifiedDate>2004-11-26T14:13:52.0</termModifiedDate>
   <termModifiedBy>SD</termModifiedBy>
</relation>
-<relation>
   <relationType>UF</relationType>
   <termId>ATD0000036</termId>
   <termName>marginalisation</termName>
   <termType>ND</termType>
</relation>
-<relation>
   <relationType>BT</relationType>
   <termId> ATD0000001</termId>
   <termName>Discrimination</termName>
   <termType>PT</termType>
</relation>
…..
 

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s