Le TAG – Thésaurus de l’activité gouvernementale du Québec : retour d’expérience

Annonce octobre 2014 :  Mai 2012 – Je vous avais parlé du TAG (Thésaurus de l'activité gouvernementale) du Québec. Octobre 2014 : diffusion au format skos de ce thésaurus : http://www.thesaurus.gouv.qc.ca/tag/consultation/oa.do.
            Adresse de déchargement direct – http://www.thesaurus.gouv.qc.ca/tag/tag_skos.xml

Lire la suite

La Télévision dans le Web – LinkedTV

Raphaël Troncy nous exposait en 2005 dans la revue Documentation de l’ADBS, les applications des technologies du web sémantique aux documents audiovisuels.  10 ans plus tard, poursuivant ses travaux sur ces thématiques au sein d’Eurecom, voici venu le temps des réalisations et des démonstrations concrètes : d’une présentation générale en 2005 de ces technologies et des scénarios envisageables, nous voici donc avec une plateforme basée sur une ontologie informatique et appuyée par des traitements automatiques d’extraction d’entités nommées, permettant d’exploiter des ressources audiovisuelles sur le web.

Lire la suite

De retour de WebSem Pro 2012

Les présentations de SemWebPro 2012 sont en ligne – séminaire et ateliers.

Merci aux organisateurs et aux participants pour cette excellente journée.

Mes prises de note sur la première journée de conférence du 2 mai.

Lire la suite

> Outils sémantiques – linguistiques

Répertoire d’outils – Mise à jour : 30 Avril 2012 ; 12 nov.2012

 

  1. Plateformes linguistiques (TALN)
  2. Résumeurs  automatiques
    1. Produits commerciaux ou applications en ligne 
    2. Systèmes « R&D »
    3. Produits non accessibles
  3. Indexeurs automatiques
  4. Ressources bibliographiques
    1. Généralités
    2. Résumé automatique

Des solutions comme celles proposés par Erli dès 1977, ou des produits comme SPIRIT (1979-80) ou Cora (1983)  ont été utilisés assez tôt en recherche documentaire (y compris sur « mainframe »). Des tests à l’époque portait aussi sur l’indexation (semi)automatique en vue de diminuer les coûts et délais de cette activité (article sur Lexinet, 1989, pdf).  Puis dès la fin des années 1990 sont apparues des solutions pour résumer automatiquement un document puis plusieurs documents (voir les billets (1) et (2) sur ce site).

Aujourd’hui les offres, intégrant ces technologies sémantiques (statistiques, linguistiques) devenues matures, se multiplient et les applications pourraient et devraient se déployer plus fortement.

Cette liste proposée ici regroupe quelques outils disponibles sur le marché français, sans aucune prétention à l’exhaustivité, ainsi que quelques ressources bibliographiques. 

 


Plateformes linguistiques (TALN)

(MAJ – 10 mai 2012)

Des plateformes offrent des solutions génériques et des outils de personnalisation (aucune recherche d’exhaustivité dans cette énumération) :

Il existe aussi différentes  solutions orientées par type de ressources et/ou usage particulier.
Par exemple pour le traitement des courriels, Noopsis – http://www.noopsis.fr/ ou OWI (http://www.owi-tech.com/).

Répertoires 

 

Résumeurs  automatiques

(MAJ – 10 mai 2012; 12 novembre 2012)

N’hésitez pas à réaliser des tests, avec par exemple le démonstrateur d’Essential-Mining

Produits commerciaux ou applications en ligne 

Des offres plus globales intègrent des fonctions de génération automatique de résumé comme Nstein ou laplateforme GATE (outil SUMMA résumeur).

 

Systèmes « R&D« 

Produits non accessibles

 

Indexeurs automatiques

(à suivre)

 

Ressources bibliographiques

Généralités

Résumé automatique

Le TAG, le thésaurus de l’activité gouvernementale du Québec

Note : Billet complémentaire (Témoignage et SKOS)

Les actions du gouvernement du Québec en vue de se doter de politiques et d'outils communs pour administrer et valoriser l'information produite dans le cadre de ses activités est déjà ancienne. Un premier "Chantier en ingénierie documentaire" avait été initié en 1997. 

Plusieurs actions (projets) se sont succédées, prenant appui sur les résultats des travaux précédents (je suis admirative…). Le dispositif prend en charge les multiples facettes de cette problématique documentaire. Tout est exposé sur le site des Services gouvernementaux, à la rubrique  Administration électronique et plus particulièrement Gestion intégrée des documents, formulation prisée par les québecois. 

Ce chantier d'ingéniérie documentaire (de longue haleine) se poursuit avec par exemple une publication en 2010 sur les   "Orientations pour la gestion documentaire des courriels au gouvernement du Québec (datée de janvier 2009).

Dans le document de référence CRGGID  de 2004 en ligne (pdf), se trouve une annexe assez précise concernant l'une des 12 recommandations et qui porte sur le Thésaurus de l'activité gouvernementale : le TAG.

Thésaurus de l'activité gouvernementale (p.143)
Recommandation 3: Le thésaurus de l'activité gouvernementale (TAG) semble être un concept rassembleur et fédérateur d'efforts au sein de l'appareil gouvernemental. Il faut poursuivre le  développement, le déploiement et l'intégration de cet outil qui sensibilise de façon très concrète et éloquente aux problématiques de gestion de l'information et de contrôle du vocabulaire.

Lire la suite

SemWeb Pro 2012

SemWeb Pro 2012, c'est une journée de conférence (02 mai 2012) et une journée de tutoriels (03 Mai 2012) sur Paris (FIAP), pour faire se rencontrer les professionnels du Web Sémantique, à savoir :

  • les praticiens des systèmes d'info-doc/connaissances souhaitant faire évoluer leurs environnements techniques et/ou chef de projet (et pas que des informaticiens) – un public totalement oublié dans la présentation de ces journées !!  Alors que la 1ère journée, en particulier, leur est totalement ouverte selon moi…
  • les membres de la communauté scientifique
  • les industriels ayant mis ou désireux de mettre en œuvre ces nouvelles techniques.

Je suis enchantée de voir un programme riche en retours d'expérience (première journée) avec bien sûr les inconditionnels (DBPedia, BPI et 2 papiers rien que pour la Bnf !), mais surtout des présentations qui montrent que les applications se déploient dans tous les environnements de travail :

  • Linked Enterprise Data : les données au cœur de l’entreprise ! (F.Lacroix), ce qui va dans le sens du papier rédigé fin 2011 sur le web sémantique/de données dans l'entreprise (numéro spécial de Documentaliste), 
  • L'entrepôt RDF développé à Supelec (UNT) - http://semunt.supelec.fr/portal/
  • La description des gammes d'automobiles de Renault

2 présentations plus techniques mais qui concernent tout le monde : 

  • en amont des processus  d'accès : un projet Apache, Stanbol, d'automatisation de la création de liens entre les données (basé sur OpenNLP)
  • en aval des processus d'accès ;  un outil de visualisation des graphes, Protovis (http://mbostock.github.com/protovis/

La table ronde qui se déroule la première journée sera consacrée à "L'open data peut-il se passer du web sémantique ?".

Les tutoriels me semblent également très bien couvrir les besoins. Ce sera l'année schema.org apparemment (on en reparlera à i-expo2012).

Le programme: http://www.semweb.pro/conference/semwebpro2012

Merci aux organisateurs !

Ingénierie sémantique et sociale – séminaire IRI-MuseoWeb du 11 mars 2012

Comment les musées peuvent articuler leurs collections avec des plateformes contributives ? 

Telle était la question posée aux intervenants pour cette 5ème séance 2011/2012 de MuséoWeb. Une suite plus technique que la séance du 12 Février 2012 (sur ce blogue), qui rebondit sur l'apport de Wikipédia/DBpédia.

N'hésitez pas à vous ballader dans la vidéo twittée. J'utilise cette vidéo annotée pour compléter ma prise de note, parfois déficiente…. Comme dans la vraie vie, des infos "sérieuses" (dont certaines n'avaient pas été tracées par ma plume) et des tranches de rigolades. Je suis admirative de ceux qui arrivent, sur le vif et en quelques mots, à rebondir sur des propos ou des situations.  

On aura le temps d'aborder Polemic Tweet à la prochaine séance, mais pendant que j'y suis — sur PolemicTweet en situation de lecture des tweets : il me manque un "sommaire" pour passer d'un intervenant/sujet à un autre sans être obligé de faire diffuser la vidéo. (d'ailleurs la vidéo, je n'ai pas réussi à la faire fonctionner) - http://polemictweet.com/2011-2012-museo-ingenierie/client.php. 

Dans le désordre par rapport à l'ordre de passage.

Lire la suite