Outils sémantiques – linguistiques

Répertoire d’outils – Mise à jour : 30 Avril 2012 ; 12 nov.2012; En cours de mise à jour (fin 2018)

  1. Plateformes linguistiques (TALN)
  2. Résumeurs  automatiques
    1. Produits commerciaux ou applications en ligne 
    2. Systèmes « R&D »
    3. Produits non accessibles
  3. Ressources bibliographiques
    1. Généralités
    2. Résumé automatique

Des solutions embarquant de la linguistique comme celles proposées par Erli(1) dès 1977, ou des produits comme SPIRIT (1979-80) ou Cora (1983)  ont été utilisés assez tôt en recherche documentaire (y compris sur « mainframe »). Des tests à l’époque portait aussi sur l’indexation (semi)automatique en vue de diminuer les coûts et délais de cette activité (article, 1989, pdf).  Puis dès la fin des années 1990 sont apparues des solutions pour résumer automatiquement un document puis plusieurs documents (voir les billets (1) et (2) sur ce site).

Aujourd’hui les offres, intégrant ces technologies sémantiques (statistiques, linguistiques) devenues matures, se multiplient et les applications pourraient et devraient se déployer plus fortement. se sont développées dans toutes les directions…

Cette liste proposée ici regroupe quelques outils disponibles sur le marché français, sans aucune prétention à l’exhaustivité, ainsi que quelques ressources bibliographiques. En particulier reste à revoir certains usages précis : la textométrie, la recherche d’information (moteur),…

Lire la suite

Publicités

Outils de recherche et de navigation : Montague Institute

Montague Institute est depuis 1992 une référence pour tout ce qui touche aux services d’information dans les Entreprises.

A la fois organisme de formation (pour les directions et les professionnels de l’infodoc), service d’information et de recherche sur les domaines des métadonnées et des taxonomies, Montague Institute propose depuis 1998, une « Knowledge base publishing » qui mélait (à l’époque) des données du web, des productions plus traditionnelles et des données issues de base de données.  Cette base éditoriale a évolué en 2003 vers un système éditorial plus complet intégré à leur dispositif de formation : naissait alors le Knowledge Base Editor’s Digest, incorporant également des commentaires d’articles par des spécialistes,  toujours accompagné d’un index A-Z.

En 2005, Montague Institute décide d’outiller cette ressource, et de la partager avec une société que l’institut a initié et soutient : Society of
Knowledge Base Publishers, créé en 1998 par l’institut dont les membres sont des entreprises ou organismes à but non lucratifs, des agences gouvernementales…. Cette nouvelle plateforme, Montague Information Technology (MontagueInfoTech),  est personnalisable pour les clients de l’institut et les membres de l’association (je n’ai pas pu le tester : je ne suis pas (encore) membre).

Sont ainsi accessibles : des textes issus de la foire-aux-questions (et réponses), les articles de leur revue ainsi qu’une sélection de pages du site web, des commentaires, des messages (sélectionnés) de la liste de diffusion, les programmes de formation… : il s’agit certes d’une base d’information et de documents. Mais l’outillage (index, thesaurus, références croisées) proposé optimise considérablement l’exploitation des informations au delà des documents.

Les cordonniers ne sont donc pas toujours les plus mal chaussés !

J’apprécie le fait que pour toutes les ressources, un minimum d’information reste accessible à tous publics, la plupart des articles de fond n’étant accessible dans leur totalité qu’aux abonnés, of course. Par exemple, cet article sur les 10 mythes des taxonomies (Ten Taxonomies Myths) de 2002.

Intéressant aussi de pouvoir étudier  un écran de leur système de gestion des référentiels.
Chaque « terme » a un identifiant avec des dates de création et de mise à jour clairement indiquée, ainsi que les documents qui lui sont assignés dans le système. il y a également des liens crées entre chaque terme et des termes voire des requêtes (External queries) externes. La norme étendue ….

Quelques précisions sur cette rubrique Index.

<Cliquez sur l’image pour l’agrandir>

Montagueinstituteterms

La rubrique Index propose :
– un index Société, un index Personne, une liste des
Questions-Réponses,
– un index thématique sur 2 niveaux (Subjects)

<Cliquez sur l’image pour l’agrandir>

Montagueindexsujet

– associé à un thésaurus (définition, terme générique, spécifique,
associés)

<Cliquez sur l’image pour l’agrandir>

Montaguethesaurus

et une recherche sur un index A-Z intégrant le tout.

<Cliquez sur l’image pour l’agrandir>

Montagueindexaz