Projet de loi pour une République numérique – consultation publique

MAJ – 1er Octobre 2015

La presse s’en fait l’écho : le projet de loi pour une « République numérique » (secrétaire d’état Axelle Lemaire sur nosdéputes.fr) est soumis à une consultation publique avant son envoi au conseil d’Etat et son adoption en conseil des ministres.

Nous avons 3 semaines pour réfléchir collectivement. Il est également possible de donner plus simplement, son accord sur chacun des points qui nous semblent importants.

Et  certains se sont lancé à donner leur avis :

Lire la suite

HTML5 : officialisation en date du 28 octobre 2014

Dans la rubrique, Interressons-nous aux usagers – clients des dispositifs d’information, voici HTML5.

En 2008, je vous informais de la sortie d’une première version de travail d’HTML 5 et des débats qui secouait les communautés concernées…. La recommandation officielle du W3C vient de sortir, deux ans après en avoir présenté la définition complète et 17 ans après la version HTML 4.0. de 1997. Comme quoi tout n’est pas si rapide dans le monde du Web…

Et toujours la même question qui se pose :  jusqu’où aller dans l’apprentissage de cette « langue » ? Lire la suite

Des formes éditoriales composites : les revues françaises de chimie (1800-2010)

Retour en arrière pour mieux évaluer le présent et le futur !

Cet article sur les revues de chimie entre 1800 et 2010, résulte d’une étude menée dans le cadre des séminaires de recherche de Valérie Tesnière à l’EHESS sur l’histoire des pratiques et politiques éditoriales. Ces travaux ont conduit à la publication d’un double numéro spécial de Revue de Synthèse (2014, n°2-3) dans lequel s’insère cet article.

Dalbin, Sylvie. 2014. « Des formes éditoriales composites : les revues françaises de chimie ». Revue de Synthèse. 135 (2-3) 221‑238.
PURL (blogue) : http://purl.oclc.org/NET/ATD/002    DOI:10.1007/s11873-014-0254-y (Editeur)
Données de l’étude – http://purl.oclc.org/NET/ATD/003

Télédécharger la notice zotero/RIS
Télédécharger l’article en pdf

Résumé – « Des formes éditoriales composites : les revues Françaises de chimie (1800-2010) »
Une étude menée sur un corpus de revues françaises de chimie entre 1800 et 2010 rend compte de la pertinence de la revue comme mode de communication privilégié, confortant les résultats de l’enquête générale présentée dans ce numéro. La revue dans le cas d’espèce apparaît comme un support matériel regroupant dans un « pot commun » une grande variété de catégorie d’informations, transférées au fil du temps vers des plateformes numériques en développement depuis la fin du 20ème siècle.

Abstract – « Composite editorial contents in French Chemical Journals (1800-2010) »
This study of a corpus of French chemistry journals between 1800 and 2010 shows the relevance of the journal as the primary mode of communication, confirming the results of the general survey presented in this issue. However, a study of their contents is questioning the apparent unity of this phenomenon: the journal appears as a physical medium consisting in a common container (« pot commun » including a wide range of information categories transferred over time to digital platforms in development since the end of the 20th century.

Lire la suite

La Télévision dans le Web – LinkedTV

Raphaël Troncy nous exposait en 2005 dans la revue Documentation de l’ADBS, les applications des technologies du web sémantique aux documents audiovisuels.  10 ans plus tard, poursuivant ses travaux sur ces thématiques au sein d’Eurecom, voici venu le temps des réalisations et des démonstrations concrètes : d’une présentation générale en 2005 de ces technologies et des scénarios envisageables, nous voici donc avec une plateforme basée sur une ontologie informatique et appuyée par des traitements automatiques d’extraction d’entités nommées, permettant d’exploiter des ressources audiovisuelles sur le web.

Lire la suite

JATS (Journal Article Tag Suite) pour les articles de revues

Mise à jour Janvier 2016 – ANSI/NISO Z39.96:2015 – nouvelle version 1.1. de Novembre 2015. En cours de dépôt sur le site http://jats.niso.org/


 

La norme américaine JATS (Journal Article Tag Suite) ANSI/NISO Z39.96:2012 est un vocabulaire XML composé d'un ensemble de métadonnées XML. Ce vocabulaire permet de représenter la structure et pour partie le contenu d'un article de revue, ainsi que d'autres types de matériaux que l'on trouve traditionnellement dans les revues comme les lettres, les éditoriaux ou les revues d'ouvrages.

Son histoire débute en 2002 au NCBI (National Center for Biotechnology Information, Wikipedia) de la NLM (National Library of Medicine). Cet organisme met alors en oeuvre une "suite de tags" (Tag Suite) pour représenter des articles de revues. La norme américaine JATS publiée en 2012 correspond à la version 3 (2008) du Tag Suite du NCBI, à quelques changements mineurs près.

Il faut noter que cette version 3.0 constitue une évolution majeure par rapport à la version précédente, non compatible par ailleurs avec les versions précédentes. La v4 est en projet (2014).
 
Le site officiel de la norme sur le site du NISO http://jats.niso.org/
 

Lire la suite

Libérer les Revues et les données de la recherche

Après les thèses, un autre sujet que j’affectionne tout particulièrement : les revues.

Je souhaitais vous parler depuis 2 ans (!), d’IPOL : une revue scientifique numérique dans le domaine du traitement et de l’analyse d’image numérique qui propose à ses lecteurs de tester en ligne les algorithmes exposés dans les articles et de capitaliser ces données d’expériences.

J’avais rencontrée au Frédoc 2011 (IST en Europe) sur Bordeaux une collègue qui m’avait présenté avec enthousiasme, cette revue numérique innovante développée dans son environnement de travail. Et je vois que Frédoc 2013 sur les données de la recherche, ont été l’occasion d’en faire une présentation à la communauté – je m’en réjouis.

Cette revue associe :

  1. une revue composée d’articles – c’est donc bien une revue !
  2. des données de la recherche, testés ;
  3. les archives des expériences réalisés.

Lire la suite

Libérer les Thèses

Je rebondis ici sur l'initiative lancée par Alexandre Monnin concernant  sa thèse (chapitre 1…) en version HTML à commenter sur Philoweb.org, en reprenant un extrait d'un texte écrit dans le cadre du cours INRIA 2008.

Un dispositif (CommentPress sous wordpress) pour échanger avec l'auteur….

Quelques mots au préalable sur cette initiave. Alexandre Monnin (sur Facebook) vous propose de réfléchir par la pratique à partir de sa thèse (sur theses.fr), à des  formats et des nouvelles pratiques  "OpenScience" (co-production, commentaires,…) pour les thèses et les mémoires. Et une invitation hackyourphd pour travailler ce 13 décembre en soirée sur Paris.

La thématique que j'aborde ici (structuration pour  l'accès et la découverte) est différente de celle de Philoweb (science ouverte), mais elle la rejoint : il s'agit en premier lieu d'ouvrir (formats) puis de structurer les thèses pour en permettre des usages multiples. Ces thèses que je trouve bien engoncées dans leurs enveloppes pdfiennes, parfois fermées à double tour (pas de possibilité de faire des commentaires) ou sans sommaire dynamique ….

Lire la suite

Villes en Biens Communs 2013 : hier et demain

<lundi 14 octobre – Les photographes présents ont publié un très bel album photos sur flickr >

Villes en Biens communs bat son plein. Des manifestations ont déjà eu lieu sur toute la francophonie – Certains en parlent. Et une grande variété d' évènements vous attendent.

Je vois déjà sur le net, un retour de la copy party brestoise et de la conférence de Lionel Maurel, manifestation organisée ce samedi 12 octobre par le réseau des bibliothèques municipales et le réseau des documentalistes brestois Doc@Brest auquelle participe la Région ADBS Bretagne.

 

VBC Paris 12 Octobre 2013 Sur Paris, ce samedi 12 octobre, une Rencontre ouverte (type barcamp) s'est tenue au Lieu-dit.

Une ambiance studieuse et chaleureuse.

Nous avions en soutien Sylvia et ses étudiants en design, cartographiant les échanges et travaillant sur un projet de glossaire  multimédia des biens communs. Nous avions déjà rencontré Sylvia avec d'autres étudiants, aux Entretiens du Nouveau Monde Industriel (ENMI), l'an passé.

Lire la suite

Toujours jeune avec la RATP ?

La qualité des données des bases de données – un phénomène très ancien (erreurs des copistes) qui ne fait que s'amplifier avec les années, les volumes aujourd'hui massifs (Big Data) ainsi que les usages, directs et plus encore indirects (réutilisation extensive des données).

Histoire vécue.

 Carte navigo raymondeJ'ai perdu ma carte Navigo/Velib (je suis parisienne…). Le fonctionnement des systèmes d'information de la RATP a bien
évolué : en 2000 (avec la carte Navigo de l'époque), cela m'avait pris 3
semaines ; ce matin, en 2 mn,  j'avais une nouvelle carte.

En fait pas exactement 2 mn, car cela a pris 5 mn pour me retrouver dans la base de données…

Premier point : Avec mon nom (unique occurrence nom+prénom sur Paris), je voyais l'agente de la RAPT hésiter. Elle avait avec ce nom quelque chose d'approchant mais avec une date de naissance incroyable … 11/11/11.  2011 impossible, et 1911, cela semblait improbable tout de même !

Ma date de naissance s'est probablement "perdue" à la faveur d'un changement de système informatique.

Deuxième point : Une fois résolue ce qui semblait une "erreur de saisie par mon collègue", mais toujours hésitante sur l'unique fiche qui s'affichait sous ses yeux, elle finit par me demander "Est-ce bien
vous, là ?" en me retournant l'écran sous les yeux.

Carte navigo pimpanteEt oui, c'est bien moi … au début des années 1980, la photo de ma première carte Orange ! Impossible à quiconque qui ne m'a pas connue à l'époque de faire un rapprochement entre cette carte et son possesseur…

Je croyais que la photo servait justement à contrôler que celui qui se servait de la carte était bien le propriétaire de ladite carte…

Enfin, mon ancienne carte est redevenue ma nouvelle carte. Effectivement une copie de carte 😉

Je reste une jeune fille pour la RATP -la date de naissance a été modifé mais pas la photographie, ce qui peut faire plaisir sauf si au prochain contrôle, on me dit que j'ai volé la carte à quelqu'un !

 

Des données bancales… ce qui n'est pas sans conséquence sur les activités que je qualifie de directes comme ici produire une "copie" de la carte, mais bien sûr pour toutes les activités de réutilisation des données, c'est-à-dire à d'autres fins que celles pour lesquelles elles étaient détenues dans la base source ("carte interactive du métro en fonction du trafic 2011, Datapublics").

Ahhh, la qualité de données et les activités de gestion que cela suppose -  vaste question. "Il est temps de prendre soin de vos données"…et pas uniquement parce que vous exposez vos données dans le web.

Un traitement (automatique) sur les dates de naissance des cartes "vivantes" supérieures à 95 ans, et un processus de renouvellement de la photo (numérique) tous les 10 ou 15 ans… éventuellement en offrant à l'usager un contrôle périodique sur c(s)es informations. Pas trop compliqué non ?

 

Sur cette question de qualité dans le temps des bases de données (ici
administratives, déclaratives), je vous conseille de suivre Isabelle
Boydens – blogue
; un article en pdf 2006 ou I.Boydens sur Isidore)

 

Métadonnées – des écosystèmes par domaines

Les vocabulaires (schémas de métadonnées) par domaines  ou disciplines constituent un de mes sujets de prédilection. Cela fait de nombreuses années déjà que j'attire l'attention de la profession "infodoc" dans son ensemble sur le déploiement de ces outils de représentation des connaissances et la nécessité, si ce n'est de maîtriser, a minima d'avoir une bonne connaissance et compréhension dans son domaine de spécialité, de ces vocabulaires … de spécialités.

Cela devient même des ressources à répertorier !

Pour sensibiliser et donner des pistes, j'avais ainsi initié en 2006 un répertoire des vocabulaires normalisés (pdf). Un outil plutôt pédagogique qui ne pouvait entrer en concurrence avec les répertoires (registres) existants ou à venir…  

Aujourd'hui il existe de très (trop?) nombreux répertoires de vocabulaires… Ceux-ci peuvent avoir une orientation "technique" comme le répertoire LOV (linked open vocabularies) développé par PY Vanderbussche et B.Vatant, ou celui de Tireme dans la documentation numérique

Arrivent (enfin) des présentations de ces vocabulaires par domaines, par  écosystèmes comme j'aime à les présenter. Un point de vue déjà abordé par exemple dans le cadre d'INRIA 2008, pour l'écosystème Education-formation. On peut également citer l'écosystème "IPTC" pour l'environnement "médias d'actualité", un ensemble cohérent de schémas de métadonnées et de "taxonomies" (codes ou vocabulaires contrôlés" associés), qui peut se décliner par exemple pour le sport (SportML).

La récente rubrique(*) "Disciplinary Metadata" de Digital Curation Centre (**) témoigne de cette ouverture. On y retrouve bien sûr pour la "discipline" SHS le vocabulaire DDI, dont je vous parlais en novembre 2012. Cette organisation du site renforce l'approche "domaine/métier/spécialité", qui au lieu de se limiter aux vocabulaires produits par et pour le secteur "bibliothèques-archives-musées" (porté par exemple par la structure normative ISO TC46), s'ouvre également aux vocabulaires qui organisent les connaissances danset qui soutiennent l'information quel que soit son support (en suivant la structure normative ISO – tous les secteurs).

Le tout nouveau secteur Taxonomies et Métadonnées porté par des adhérents de l'adbs (100 inscrits en 2 mois) en partenariat avec les autres groupes sectoriels de l'ADBS devraient offrir des opportunités pour débattre de ces sujets…

A suivre donc,….

Quelques sources locales

(*) Via EchosDoc – http://www.echosdoc.net/2013/03/disciplinary-metadata/

(**) DCC = Digital Curation Center = regroupement d'universités du Royaume-Uni traitant les questions de curation, c'est à dire de "maintenance, préservation et valorisation des données numériques de la recherche tout au long de son cycle de vie" (http://www.dcc.ac.uk/digital-curation/what-digital-curation).