Schema.org et bib.schema.org

Schema.org propose d'intégrer des microdonnées dans le code source HTML, celles-ci étant pleinement exploitées par les moteurs de recherche pour améliorer leur "compréhension" de la requête, puis pondérer et filtrer les résultats d'une recherche. Nous en avions parlé ici même en 2011, puis en 2012.

Ecran-bib.schema.orgOCLC en travaillant sur l'intégration des éléments de données de schema.org dans ses entrepôts en a étonné plus d'un ! Mais cela fait plus de 184 millions de données ouvertes sur le web et exploitable par les moteurs.

Ce travail a conduit d'abord à bibliograph.net, puis aujourd'hui (mai 2015) au déploiement de bib.schema.org, comme extension de schema.org dans le cadre du du Schema Bib Extend Community Group du W3C (le wiki du groupe).

 

Le principe des extensions à schema.org, adopté en mai 2015, ajoute des propriétés et/ou des sous-classes au corps du schéma. Cette extension (version 1.1. sortie en sept. 2015) propose pour l'instant un travail pour :  Audiobook, Thesis, ComicStory, and workTranslation.

OCLC/bibliograph.net. Un exemple 'Carnets de notes sur le Mexique, Cartier-Bresson Henri) – http://experiment.worldcat.org/oclc/12097471.nt

DCMI propose une conférence web sur ce thème le 18 novembre 2015 – http://dublincore.org/resources/training/#2015wallis.

Débat à Londres : le thésaurus a-t-il encore sa place dans les systèmes modernes de recherche d’information ?

(note diffusée en février 2015)

Nos amis britanniques (ISKO UK) concoctent des évènements sur les thésaurus, à la fois dans la bonne humeur et le sérieuxISKO UK 2015. Que ferait-on sans eux et eux sans nous dans l'Union européenne 🙂
(sur ce sujet politique, écoutons plutôt Pauline Schnapper -  http://bit.ly/1KPSVKp)

Ce 19 février 2015, ISKO UK avait organisé une conférence-débat autour d'une motion et d'un vote.

  • La motion : "Les thésaurus traditionnels n'ont plus leur place dans les systèmes modernes de recherche d'information ».
  • Le Vote : La motion a été rejetée par des tonnerres d'applaudissements 😉

Pour plus de détails, vous pouvez écouter l’enregistrement  (enregistrement mp3)

humour britannique à 10:58 rires ;
12:10 Pour la motion et contre les thésaurus (il y en a quand même !)
12:17 Contre la motion et pour les thésaurus.

Judi Vernau (consultante) a réalisé une synthèse de ces débat. Vous pouvez lire la version en anglais ou une traduction rapide qui pourrait être améliorée

 

 

ISO 25964-1 : Le Livre blanc est sorti

Le mois de janvier tire à sa fin, mais il est encore temps de vous souhaiter une bonne et heureuse année 2013.


Avec un cadeau très professionnel pour ce millésime 2013


Le Livre blanc sur la norme ISO 25964-1 Thésaurus

qui, après moults péripéties, sort ce jour même sur le site de l’Afnor.
Disparu du radar de l’Afnor. Le voici (pdf).
http://www.bivi.fonctions-documentaires.afnor.org/livres-blancs/livre-blanc-sur-la-norme-iso-25964-1-thesaurus-pour-la-recherche-documentaire-parue-en-version-anglaise-en-aout-2011

« L’objectif de ce livre blanc est de fournir une vue synthétique de la norme à l’attention de professionnels ayant déjà une connaissance des outils d’organisation [de l’information]. Il identifie les points saillants de la norme et précise, quand c’est important pour la communauté francophone, leur caractère obligatoire. »

Un cadeau de la part de :
Hélène Zysman, Sylvie Dalbin, Nathalie Yakovleff, a
vec l’intense et précieuse collaboration de François Feyler, Roselyne Bloch, Michèle Lénard et Katell Briatte.

Un travail de sélection et d’explicitation aboutissant à un ouvrage certes technique mais qui, nous l’espérons, sera utile à la collectivité et utilisé par le plus grand nombre. Et vous donnera envie d’aller voir la norme elle-même, un travail de longue haleine porté par un collectif à la fois au sein de l’ISO (TC46/SC9/WG8) et de l’Afnor (CG46/CN357/GE10 – voir annexe 5 du Livre blanc).

L’Afnor annonçant qu’il ne peut mettre sur sa plateforme qu’un seul format – ce sera donc le pdf en ligne. Nous vous offrons ici le fichier au format odt (ISO25964-1-Livre-blanc-Janvier-2013-vFinale en odt) pour pouvoir récupérer plus aisément les données dont vous auriez besoin.

N’hésitez pas à nous faire des retours de son utilisation, des difficultés mais aussi des avantages de ce document !

Et dans peu de temps, je vous parlerai de la partie 2 de la norme ISO 25964 sur l’interopérabilité entre vocabulaires, qui sort très bientôt.

PS :je me rends compte avec stupeur que l’Afnor affuble ces livres blancs et celui-ci en particulier, d’un droit de reproduction interdit. C’est déjà bien ennuyeux que les normes ne soient pas ouvertes, mais ce livre blanc !?. J’espère que ce n’est qu’une routine. En tous les cas, cette version de janvier 2013 au format odt est réexploitable. 

Dispositif d’accès à l’information et évolution des thésaurus – le cas de Popline

POPLINE est une banque de données bibliographiques sur la population, la santé de la reproduction et la planification familiale créée en 1970 (infos sur le site de l'Ined). C'est aussi le nom du thésaurus utilisé pour l'indexation du contenu des ressources documentaires spécialisées qui y sont référencées – aujourd'hui au nombre de 370 000.

Depuis 2001, POPLINE est maintenue dans le cadre du projet "Knowledge for Health" (K4Health) Project à l'Ecole de Santé publique Johns Hopkins Bloomberg (wikipedia), soutenu financièrement par l'USAID (Agence des États-Unis pour le développement international).

Ce dispositif vient de vivre une transformation importante : le thésaurus toujours consultable de façon autonome, est surtout valorisé à travers un nouveau mode d'accès dits par "sujets". Ces «sujets » correspondent à des requêtes préprogrammées, les fameux "profil de recherche" et services de DSI (diffusion sélective de l'information) auxquels peut s'abonner un utilisateur connecté. 

Popline. Taxonomie de sujets

Popline – une branche de la taxonomie de sujets

Lire la suite

Actualité des moteurs et schema.org – i-Expo 2012

Je vous avais fait une présentation sur ce blogue de Schema.org, le profil d'application de Google, Bing et Yahoo! en décembre 2011. Je  viens de faire une autre présentation de Schema.org à i-Expo à l'atelier sur l'actualité des moteurs de recherche, atelier rondement mené par Serge Courrier, et merci aux organisateurs.

 

J'en profite pour vous faire un rapide retour des trois autres interventions de cet atelier : Les défis de la recherche sémantique à l'heure du big data par François Bourdoncle (Exalead), les moteurs de recommandation par Damien Poirier (Université d'orléans) et les "outils de découverte" (Discovery Tools) de André Danzy (Couperin). 

Lire la suite

De retour de WebSem Pro 2012

Les présentations de SemWebPro 2012 sont en ligne – séminaire et ateliers.

Merci aux organisateurs et aux participants pour cette excellente journée.

Mes prises de note sur la première journée de conférence du 2 mai.

Lire la suite

SemWeb Pro 2012

SemWeb Pro 2012, c'est une journée de conférence (02 mai 2012) et une journée de tutoriels (03 Mai 2012) sur Paris (FIAP), pour faire se rencontrer les professionnels du Web Sémantique, à savoir :

  • les praticiens des systèmes d'info-doc/connaissances souhaitant faire évoluer leurs environnements techniques et/ou chef de projet (et pas que des informaticiens) – un public totalement oublié dans la présentation de ces journées !!  Alors que la 1ère journée, en particulier, leur est totalement ouverte selon moi…
  • les membres de la communauté scientifique
  • les industriels ayant mis ou désireux de mettre en œuvre ces nouvelles techniques.

Je suis enchantée de voir un programme riche en retours d'expérience (première journée) avec bien sûr les inconditionnels (DBPedia, BPI et 2 papiers rien que pour la Bnf !), mais surtout des présentations qui montrent que les applications se déploient dans tous les environnements de travail :

  • Linked Enterprise Data : les données au cœur de l’entreprise ! (F.Lacroix), ce qui va dans le sens du papier rédigé fin 2011 sur le web sémantique/de données dans l'entreprise (numéro spécial de Documentaliste), 
  • L'entrepôt RDF développé à Supelec (UNT) - http://semunt.supelec.fr/portal/
  • La description des gammes d'automobiles de Renault

2 présentations plus techniques mais qui concernent tout le monde : 

  • en amont des processus  d'accès : un projet Apache, Stanbol, d'automatisation de la création de liens entre les données (basé sur OpenNLP)
  • en aval des processus d'accès ;  un outil de visualisation des graphes, Protovis (http://mbostock.github.com/protovis/

La table ronde qui se déroule la première journée sera consacrée à "L'open data peut-il se passer du web sémantique ?".

Les tutoriels me semblent également très bien couvrir les besoins. Ce sera l'année schema.org apparemment (on en reparlera à i-expo2012).

Le programme: http://www.semweb.pro/conference/semwebpro2012

Merci aux organisateurs !