Le Web sémantique à iExpo 2009

La session "Web sémantique" organisée par l'ADBS,
pilotée par  Véronique MESGUICH (Directrice de l'Infothèque/Léonard de Vinci) fut riche et de très haute qualité ! Un public nombreux, à l'écoute,
attentif. Un régal… je ne regrette pas le prix un peu
élevé 😉 de cette demi
journée.

Les transparents
sont en ligne sur le site iExpo
. Malheureusement le basculement en
pdf
(beurk !) nous fait perdre toute la dynamique des excellentes présentations concoctées par les
orateurs.

1. Nathalie AUSSENAC-GILLES,
chargée
de recherches à l'IRIT-
Université Paul Sabatier de
Toulouse ouvre le bal
avec un "Eclairage général sur le web sémantique".
Nathalie Aussenac nous a
habitué à des exposés à l'attention du
"grand public" (enfin, pas de chercheurs spécialisés, mais un peu au parfum tout de même) de grande qualité.

J'ai extrait de son intervention deux planches
particulièrement intéressante sur
le plan pédagogique.

[Apparté : L'IRIT organise les 8èmes Rencontres
Internationales Terminologie
et Intelligence Artificielle à Toulouse (France), le 18-20
novembre 2009 –
http://www.irit.fr/TIA09/index.html

Sur cette première planche : les noeuds et les relation du "Web aujourd'hui"
sont de nature identiques : ils sont a-sémantiques. Le Web sémantique se propose d'ajouter et donc de
distinguer noeuds et relations.

Aussenac-web1-webS

On voit donc apparaitre des ontologies qui apportent ce niveau de
sémantique qui fait défaut aujourd'hui.

Les différences avec des systèmes d'organisation de
connaissances tels que
les taxonomies ou les thésaurus sont sur ces deux planches visibles.[A mon avis, le A_pour_rôle doit être dans le schéma sur les ontologies ?]

Aussenac-relation-thesaurus

Aussenac-relation-ontologie

En dehors de ce niveau de structuration (étiquette, classe et
instance),
l'ontologie est beaucoup plus formalisée et permet le développement de
relations spécifiques (entre une
personne et un sujet, on établit une relation "connaît").
Ce qui permet
d'appliquer des traitements et des contrôles.

[Dalb – Distinguer labels / étiquettes, classes et instances (nos
fameuses listes annexes !) constitue un élément-clé des
dispositifs sémantiques. Bien
que déjà présentent dans la norme ISO de thésaurus (mais pas
la norme FR), ces
distinctions ont été peu mises en oeuvre. Mais elles vont être renforcées dans
la nouvelle norme (ISO DIS 25964) qui devrait paraître cette fin
d'année.
Préparons-nous !]

[Dalb – Même si les thésaurus (spécialisés) se développent dans des domaines (des spécialités), l'objectif des thésaurus étaient de gommer les points de vue autour des concepts (culturels, linguistiques). Le "flou" dans les relations permettait des regroupements que l'on estime (estimait) suffisant pour un objectif de recherche de "documents". Dans le contexte de l'accès à l'information dans des corpus de documents numériques, il est important de passer à un autre type d'outil sémantiquement plus formalisé…. D'où ces ontologies…].

Le temps de parole de N. Aussenac était déjà dépassé et
l'intervention s'est terminée en citant les
travaux actuels sur l'annotation sémantique des corpus (de
texte) et
l'exposition des données avec Linked Data. Le
support ppt de Nathalie Aussenac (pdf)


2. Bruno
Menon
maître de conférences associé à
l'Université Paris 8, aborde
dans cette deuxième intervention, les "nouvelles
compétences professionnelles
liées aux outils sémantiques (pdf)
"
.

L'auteur s'appuie sur une mise en correspondance entre les compétences mises en oeuvre dans le cadre d'un système
d'information documentaire et plusieurs sources présentant les
compétences des professionnels de l'infodoc, en particulier "LA"
fiche ROME
et surtout l'Euroréférentiel
des compétences des profs de l'infodoc
. Ce dernier est organisé en 33
domaines de compétence répartis en 4 principaux groupes :
Groupe I – Information, Groupe T – Technologies, Groupe C –
Communication, Groupe M – Management.
Bruno Menon propose d'étudier les compétences nécessaires pour
trois modèles déclinés à partir d'un schéma de système d'information
générique qu'il distingue en fonction de la nature des médiations et du nombre d'interfaces.

Menon-schema-generique

  • le modèle "classique"
    fait la part belle à l'intermédiation humaine
    impliquant des expertises professionnelles. Ce qui se traduit par un
    poids important accordé au groupe de compétences I –
    Information
  • le modèle "moderne"
    supprime la médiation humaine !, une seule interface entre le
    back-office et l'utilisateur, l'expertise se trouvant dans le
    système et chez l'utilisateur. Ce qui se traduit par un poids
    important accordé au groupe de compétences T –
    Technologies
  • le modèle "post-moderne"
    du Web sémantique, réintroduit des niveaux
    d'intermédiation. Des compétences du groupe I –
    Information sont à nouveau convoquées
    , compétences
    à rapprochées du domaine Gestion des contenus et des
    connaissances(I04) et Analyse et représentation de l’information
    (I06). Avec des absences en particulier celles liées aux "ressources sémantique".

Menon2009

B. Menon – "Dans chacun des modèles
évoqués, des formes de ressources «
sémantiques »
(langages documentaires / dictionnaires,
ressources TAL / Ontologie) peuvent être mobilisées.
Ces ressources doivent être créées et
gérées ….
Par des professionnels de l’info-doc ??

Bruno Menon poursuit sa réflexion sur les hypothèses et les routes
possibles pour les professionnels de l'infodoc et le web sémantique.

[Dalb : depuis plusieurs mois déjà une fiche
adhoc sur le thème  des "systèmes de représentation de domaines" est proposée, mais régulièrement
retoquée par le groupe en charge de l'évolution de cet
Euroréférentiel ! Mais si les professionnels de l'infodoc ne
sont pas tojours placés sur le devant de la scène pour les compétences et activités sur les ressources sémantiques – en
particulier sur les ontologies – , ils participent fortement à ces systèmes, et l'absence total d'un domaine de compétences
dédié aux ressources sémantiques risque de nous
éloigner irrémédiablement de ces développements. Qu'en pensez vous ? ]

3 Jean Delahousse, pdg de Mondeca
a souhaité rebondir sur les propos de Bruno Menon plutôt
que de suivre le fil de sa présentation !
Une très bonne chose pour nous tous : en partant de
l'expérience de Mondeca chez un client, il a souhaité
exposer les compétences et les fonctions qui ont
été nécessaires au développement du projet :

Contexte : un éditeur
1 – Orchestrer  des ressources terminologiques
2 – Aider les experts du "domaine" à formuler, formaliser
le dispositif sémantique
3 – Modérer (principe des candidats descripteurs)
4 – IHM : développer l'accès à l'information par profils
5 – Mapping entre vocabulaires (alignement de vocabulaires)

[Dalb : Des fonctions sommes toutes "classiques" de pilotage,
gestion et contrôle de vocabulaires et d'appui aux experts ("faire accoucher les experts"). Ce ne
sont donc pas ces catégories de compétences qui sont
nouvelles, mais le contexte. Celui-ci est assez nouveau (variété des utilisateurs, contraintes d'usages, forme des ressources…) pour que la mise en
oeuvre de ces compétences en soit modifiée].

L'intervention de Jean Delahousse s'est poursuivie par la
présentation de plusieurs expériences que vous pouvez
voir sur le document
de présentation (pdf)
.

4. La dernière présentation par Tayeb Merabti, doctorant, participant à l'équipe CISMEF du CHU de Rouen (que
l'on ne présente plus !!) et au LITIS portait sur l'intégration
d’outils sémantiques dans le
portail Cismef.

Le changement stratégique du dispositif documentaire a rendu nécessaire ce travail de fédération et d'intégration de familles d'outils sémantiques indispensables. En effet, CISMEF a décidé en 2005 de quitter l'univers mono-terminologique (MeSH) et de basculer dans un univers multi terminologique. Pour aller
vers la construction d'un serveur multi-terminologique de Santé
(SMTS), supporté par les outils de Mondeca et regroupant les
vocabulaires suivants :

Smts cismef

[Un travail qui devrait se développer parallèlement à l'évolution des types de ressources et de la variété des natures d'information qui nécessitent donc des outils sémantiques variés donc certains sont des nomenclatures "officielles".]

Des traitements automatiques multi-terminologiques et de multiples
services en perspective. Très beau projet. Excellente
présentation … et dans les temps, comme l'a souligné un
précédent orateur 😉

On attend iExpo 2010 de pied ferme !

Laisser un commentaire