Secteur de l’éducation et de la formation – schémas de métadonnées et vocabulaires

MLR ITLET ISO 19788 Part 5 - Pedagogical elementsL’objectif de tout schéma de métadonnées standardisés est de favoriser (=simplifier) la circulation, d’optimiser la réexploitation de l’information, et au-delà de valoriser les ressources représentées et décrites à travers ces schémas.
Dans le secteur éducatif, le nom du LOM (learning object metadata – wikipedia) apparaît tout de suite. Il faut dire que ce schéma de description des ressources pédagogiques est très utilisé au niveau mondial depuis déjà 20 ans : le portail Educasource structuré autour du LOM a été créé en 1996 (wikipedia)…. et un schéma français existe depuis 2006 (je vous en parlais en 2010).  Puis un autre schéma pour décrire les programmes de formation s’est alors déployé, … ou plutôt plusieurs schémas. Moins connus,  les enjeux de ces schémas à l’ère de la formation tout au long de la vie sont tout aussi structurants. Citons :

Lire la suite

Publicité

DebatesCore, sémantiser les débats publics

Ecran-debatspublics1-Capture d’écran 2015-10-29 à 06.15.08 En se penchant sur les outils de structuration et d'organisation de l’information, et en particulier les schémas de métadonnées, cela permet d’aborder de multiples sujets. Ici un sujet qui me tient à cœur : participer aux décisions publiques via "des consultations et des débats", en présence ou à distance.
Le vocabulaire que je vous présente aujourd'hui, DebatesCore est un schéma de métadonnées qui permet de capturer cette connaissance sur les débats, leur contexte et les résultats.

1. Quelques mots sur ce contexte et sur le projet
2. Présentation de DebatesCore
3. Comment l'information circule ?
4. Quelques mots sur les plateformes

 

 

Lire la suite

Schema.org et bib.schema.org

Schema.org propose d'intégrer des microdonnées dans le code source HTML, celles-ci étant pleinement exploitées par les moteurs de recherche pour améliorer leur "compréhension" de la requête, puis pondérer et filtrer les résultats d'une recherche. Nous en avions parlé ici même en 2011, puis en 2012.

Ecran-bib.schema.orgOCLC en travaillant sur l'intégration des éléments de données de schema.org dans ses entrepôts en a étonné plus d'un ! Mais cela fait plus de 184 millions de données ouvertes sur le web et exploitable par les moteurs.

Ce travail a conduit d'abord à bibliograph.net, puis aujourd'hui (mai 2015) au déploiement de bib.schema.org, comme extension de schema.org dans le cadre du du Schema Bib Extend Community Group du W3C (le wiki du groupe).

 

Le principe des extensions à schema.org, adopté en mai 2015, ajoute des propriétés et/ou des sous-classes au corps du schéma. Cette extension (version 1.1. sortie en sept. 2015) propose pour l'instant un travail pour :  Audiobook, Thesis, ComicStory, and workTranslation.

OCLC/bibliograph.net. Un exemple 'Carnets de notes sur le Mexique, Cartier-Bresson Henri) – http://experiment.worldcat.org/oclc/12097471.nt

DCMI propose une conférence web sur ce thème le 18 novembre 2015 – http://dublincore.org/resources/training/#2015wallis.

Référentiels dans le secteur R&D en France : à l’honneur aux Journées Couperin

La journée Couperin du 3 Juillet 2015 sur Paris visait à « l’échelle nationale de réunir autour d’une même table les organismes acteurs pour discuter ensemble référentiels, découvrir les réalisations des uns et des autres dans ce domaine [….] en vue d’ »amorcer ou renforcer les collaborations … via l’angle des référentiels ».
C’était aussi le point de vue pris pour la Journée d’étude BnF / AFNOR CG46 de 2008 sur les référentiels.
Couperin 2015 – Programme et présentations en ligne – – http://jref2015.sciencesconf.org/
Qui dit recherche & développement et IST dit :

Lire la suite

La Télévision dans le Web – LinkedTV

Raphaël Troncy nous exposait en 2005 dans la revue Documentation de l’ADBS, les applications des technologies du web sémantique aux documents audiovisuels.  10 ans plus tard, poursuivant ses travaux sur ces thématiques au sein d’Eurecom, voici venu le temps des réalisations et des démonstrations concrètes : d’une présentation générale en 2005 de ces technologies et des scénarios envisageables, nous voici donc avec une plateforme basée sur une ontologie informatique et appuyée par des traitements automatiques d’extraction d’entités nommées, permettant d’exploiter des ressources audiovisuelles sur le web.

Lire la suite

JATS (Journal Article Tag Suite) pour les articles de revues

Mise à jour Janvier 2016 – ANSI/NISO Z39.96:2015 – nouvelle version 1.1. de Novembre 2015. En cours de dépôt sur le site http://jats.niso.org/


 

La norme américaine JATS (Journal Article Tag Suite) ANSI/NISO Z39.96:2012 est un vocabulaire XML composé d'un ensemble de métadonnées XML. Ce vocabulaire permet de représenter la structure et pour partie le contenu d'un article de revue, ainsi que d'autres types de matériaux que l'on trouve traditionnellement dans les revues comme les lettres, les éditoriaux ou les revues d'ouvrages.

Son histoire débute en 2002 au NCBI (National Center for Biotechnology Information, Wikipedia) de la NLM (National Library of Medicine). Cet organisme met alors en oeuvre une "suite de tags" (Tag Suite) pour représenter des articles de revues. La norme américaine JATS publiée en 2012 correspond à la version 3 (2008) du Tag Suite du NCBI, à quelques changements mineurs près.

Il faut noter que cette version 3.0 constitue une évolution majeure par rapport à la version précédente, non compatible par ailleurs avec les versions précédentes. La v4 est en projet (2014).
 
Le site officiel de la norme sur le site du NISO http://jats.niso.org/
 

Lire la suite

Surveillance généralisée près de chez nous

Le 11 Février prochain est prévue une journée d’action contre la surveillance généralisée, en l’honneur d’Aaron Swarz et de la disparition de SOPA.  L'enjeu de cette action : reprendre en main le contrôle de notre vie privée

Ma contribution : Voici une petite image,  pas pour nous rassurer mais pour nous ouvrir les yeux. Cela va du métro ou vélib, à des champs éléctromagnétiques (!) ou des caméras vidéos…mais aussi les statistiques du quartier, le salaire moyen,…. Et mon identité, que j'ai caché ici mais que ce robot a immédiatement trouvé.

Pour avoir une carte près de chez vous, avec en sus une musique de fond apocalyptique, c'est par là  (Paris sur WatchDogs). 

Sch-wearedata.watchdogs.com---2013-10-05 à 22.28.48

Certains auraient tendance à réagir en utilisant une application comme Hide par ce même WatchDogs pour crypter ses données (et non je ne joue pas au jeu d'Ubisoft).

 

Référentiels, donnée et métiers de l’information et du document – une fin d’année 2013 prolifique à l’ADBS

Après l'annonce d'une journée d'étude ADBS le mardi 26 novembre (Paris) – "Du thésaurus aux référentiels terminologiques", riche en témoignages, voici le Dossier du nouveau numéro de Documentaliste  consacré aux métiers de l’information et la « donnée » coordonné par Dominique Cotte d'Ourouk.

La première partie de ce dossier porte sur les enjeux de la gestion des données ; la deuxième partie sur les conséquences et les rôles que peuvent jouer les professionnels de l'infodoc.

Vaste sujet abordé à travers 16 papiers pour 13 auteur(e)s (sommaire).

Voilà un dernier trimestre 2013 riche d'évènements à l'ADBS.


Lire la suite

DCMI passe sous le giron de l’ASIS&T en 2013

DCMI, l'initiative de métadonnées du Dublin Core, jusque-là société à responsabilité limitée installée à Singapour[1] cesse ses activités sous ce statut et devient un "simple" projet hébergé par l'ASIS&T (Association for Information Science and Technology).[2] [3]-Brochure en français].

L'ASIS&T en profite pour changer officiellement de nom en 2013 tout en gardant le même sigle – de "American Society of Information Science and Technology", elle devient "Association for Information Science and Technology" avec un nouveau slogan : Information Association for the Information Age.

Je suppose que ce sont des raisons économiques et/ou organisationnelles qui poussent à ce choix ?
Avez-vous des informations sur ces changements ?
Qu'en pensez vous ?
Ceux qui participent aux réunions/conférences DCMI doivent être au courant ?

Quelques mots sur l'ASIS&T

L'ASIS&T a été créée en 1937 sous le nom d'ADI pour American Documentation Institute, dans la lignée de la FID (Fédération Internationale pour l'information et la Documentation), la structure créée par Otlet et Lafontaine en 1895.

Encore une association américaine qui devient internationale. Et l'intégration du projet DCMI va donner un poids plus important à cette association.

J'en profite pour recommander vivement la lecture des publications de l'ASIS&T et en particulier le Bulletin (en ligne) de l'ASIS&T. Ce mois-ci "informatique de santé" et un papier de Marjorie Hlava d'Access Innovations sur les coulisses des taxonomies (vocabulaires contrôlés et structurés) de vos bases de données ou sites web ([5] Using a Taxonomy for Your Database or Website: A Look behind the Scenes de Marjorie M.K. Hlava).

[1] http://dublincore.org/about-us/
[2] http://www.asis.org/news/DCMI_announcement.html
[3] http://www.asis.org/docs/asist_fra.pdf
[4] Bull ASIST – http://asis.org/bulletin.html
[5] http://www.asis.org/Bulletin/Jun-13/JunJul13_Hlava.html

Toujours jeune avec la RATP ?

La qualité des données des bases de données – un phénomène très ancien (erreurs des copistes) qui ne fait que s'amplifier avec les années, les volumes aujourd'hui massifs (Big Data) ainsi que les usages, directs et plus encore indirects (réutilisation extensive des données).

Histoire vécue.

 Carte navigo raymondeJ'ai perdu ma carte Navigo/Velib (je suis parisienne…). Le fonctionnement des systèmes d'information de la RATP a bien
évolué : en 2000 (avec la carte Navigo de l'époque), cela m'avait pris 3
semaines ; ce matin, en 2 mn,  j'avais une nouvelle carte.

En fait pas exactement 2 mn, car cela a pris 5 mn pour me retrouver dans la base de données…

Premier point : Avec mon nom (unique occurrence nom+prénom sur Paris), je voyais l'agente de la RAPT hésiter. Elle avait avec ce nom quelque chose d'approchant mais avec une date de naissance incroyable … 11/11/11.  2011 impossible, et 1911, cela semblait improbable tout de même !

Ma date de naissance s'est probablement "perdue" à la faveur d'un changement de système informatique.

Deuxième point : Une fois résolue ce qui semblait une "erreur de saisie par mon collègue", mais toujours hésitante sur l'unique fiche qui s'affichait sous ses yeux, elle finit par me demander "Est-ce bien
vous, là ?" en me retournant l'écran sous les yeux.

Carte navigo pimpanteEt oui, c'est bien moi … au début des années 1980, la photo de ma première carte Orange ! Impossible à quiconque qui ne m'a pas connue à l'époque de faire un rapprochement entre cette carte et son possesseur…

Je croyais que la photo servait justement à contrôler que celui qui se servait de la carte était bien le propriétaire de ladite carte…

Enfin, mon ancienne carte est redevenue ma nouvelle carte. Effectivement une copie de carte 😉

Je reste une jeune fille pour la RATP -la date de naissance a été modifé mais pas la photographie, ce qui peut faire plaisir sauf si au prochain contrôle, on me dit que j'ai volé la carte à quelqu'un !

 

Des données bancales… ce qui n'est pas sans conséquence sur les activités que je qualifie de directes comme ici produire une "copie" de la carte, mais bien sûr pour toutes les activités de réutilisation des données, c'est-à-dire à d'autres fins que celles pour lesquelles elles étaient détenues dans la base source ("carte interactive du métro en fonction du trafic 2011, Datapublics").

Ahhh, la qualité de données et les activités de gestion que cela suppose -  vaste question. "Il est temps de prendre soin de vos données"…et pas uniquement parce que vous exposez vos données dans le web.

Un traitement (automatique) sur les dates de naissance des cartes "vivantes" supérieures à 95 ans, et un processus de renouvellement de la photo (numérique) tous les 10 ou 15 ans… éventuellement en offrant à l'usager un contrôle périodique sur c(s)es informations. Pas trop compliqué non ?

 

Sur cette question de qualité dans le temps des bases de données (ici
administratives, déclaratives), je vous conseille de suivre Isabelle
Boydens – blogue
; un article en pdf 2006 ou I.Boydens sur Isidore)