Services de Dépôts et de Publication en Libre Accès – DINI

Je profite de la publication en français du référentiel utilisé pour la certification allemande de plateformes d'archives ouverts scientifiques – DINI, pour aborder (brièvement) la question des plateformes d'archives ouvertes et de leur évaluation, plateforme dont je ne parle jamais sur ce blogue – excepté en 2009 pour des questions d'accès et de doublons et en 2011 lors de l'examen de l'interface de recherche ISIDORE.

Un projet venu d'Allemagne

Des bibliothèques universitaires, centres de calculs et services audiovisuel et multimédia d'universités allemandes ont créés en 2001 une association, DINI (Deutsche Initiative für NetzwerkInformation = Initiative Allemande pour l’information en Réseau) qui fonctionne comme un forum de discussion et de partage d’expériences sur le développement et l’environnement des TIC.

Un des projets de DINI concerne la certification des plateformes des "Services de Dépôts et de Publication en Libre Accès", terme retenu pour la version française pour "Dokumenten- und Publikationsservice" en allemand ou en anglais "Document and Publication Services" (un 2ème billet pour discuter de ce choix terminologique)

L'objectif visé est aussi de valoriser le mouvement de libre accès grâce à la qualité des services offerts et au sérieux des processus d'administration.

Qui dit certification, dit référentiel sur lequel appuyer l'évaluation du système pour l'obtention du certificat. Comme toujours, ces référentiels peuvent aussi être utilisés en dehors du processus de certification, pour créer ou améliorer une plateforme, et même pour argumenter d'une demande de moyens pour répondre à certains critères. C'est donc un guide qui peut profiter à tous et sur ce plan, ce document peut être largement utilisé (autoévaluation).

Le processus de certification et l'ensemble de la documentation sont disponibles sur le site du DINI. La dernière version date de 2010. Et cette version française devrait faciliter la prise en main de cet outil par la communauté francophone.

Merci à Joachim Schöpfel pour avoir initié et conduit ce projet de traduction et aux collègues allemands qui ont fait tout le travail éditorial.

(Un a parte: de jolis identifiants n'est-ce pas ? Les Allemands (la BN allemande) ont choisi me semble-t-il les URN ; en France, la Bnf a choisi le système d'identifiants pérennes ARK).

Système de certification et référentiel DINI

Proposé initialement en 2003, la version 3 de 2010 prend en compte l'ensemble des services que peut proposer un dispositif de collecte et mise à disposition de documents, et non uniquement le mécanisme lié à au protocole OAI-PMH. Ce projet de certification réfère plutôt à un écosystème étendu, visant à répondre aux besoins des utilisateurs – auteurs, éditeurs, utilisateurs finaux) et aux différentes contraintes (qualité, économie, alignement aux normes ou standards existants, interopérabilité).

Je ne vais pas reprendre bien sûr la liste de ces critères – voir en fin de ce billet, un encart synthétique. Je pointe ici quelques éléments qui me paraissent mériter que l'on s'y attarde.

Une approche en trois niveaux

Le certificat distingue formellement trois niveaux de recommandations dont seulement le premier niveau est obligatoire (Conditions minimales). D'autres critères font partie de la catégorie « Recommandations complémentaires », ce qui constitue une bonne formule pour permettre au plus grand nombre d'initier une démarche qualité, sans diminuer les exigences. Une bonne partie du référentiel propose des exemples et des modèles pour expliquer et illustrer les différents critères.

Il faut noter que certaines exigences (pas toujours traduites dans la version française) portent sur l'usage d'une réglementation ou d'un vocabulaire contrôlé utilisé en Allemagne.

Un périmètre qui dépasse largement le protocole OAI-PMH

Le suivi strict des spécifications du protocole OAI-PMH, par ailleurs clairement présenté dans ce document, est largement complété et/ou précisé.

Le projet  de protocole OAI-PMH a été initié en 1999 dans un environnement scientifique très spécialisé. De mon point de vue il a été perçu essentiellement comme un manifeste pour le libre associé à un mécanisme technique d'auto-archivage et de moissonnage. Les questions liées à la situation documentaire actuelle – volumes importants, pratiques de dépôt très variées, approche pluri-disciplinaire, pratiques des utilisateurs finaux, réutilisation des données, … – ne pouvaient être intégrées au projet initial. Celles-ci imposent aujourd'hui que l'on y apporte quelques réponses. Ces réponses se présentent souvent dans ce référentiel sous la forme de "recommandations" (i.e. élargissement des types d'indexation ou d'enrichissement documentaire), mais parfois aussi comme « conditions minimales » – i.e. précisions sur les éléments Dublin Core (note1), …. 

Un autre axe d'extension porte sur une meilleure prise en compte des utilisateurs en aval. Le projet OAI reste centré sur le dépôt (sécurisé) de documents par les auteurs et leur mise à disposition sur une plateforme ouverte. Mais sont ajoutées ici, sous la forme (pour le moment?) de recommandations, de fonctions utiles à ceux qui utilisent, comme l'export direct par exemple. Je ne pense pas qu'il faille aller plus loin sur les fonctionnalités utilisateurs, à moins de créer un certificat à double axe : dépôt/publication et exploitation/réutilisation (la notion d' « exploitation/réutilisation » par des utilisateurs renvoie à des fonctionnalités enrichies par rapport celle d' « accès »). J'avais évoqué cette question lors de l'examen d'ISIDORE en 2011.

On pourrait parler pour ce référentiel, de  "profil d'application" (note2) d'OAI-PMH à ce nouvel environnement (recommandations supplémentaires) et au contexte allemand (références à des normes juridiques allemandes).

Une ouverture vers des "éditeurs commerciaux"

Le système prend en compte des demandes d'établissements privés, et non uniquement des institutions publiques (universtaires ou laboratoires). Ceci peut démontrer deux choses : qu'OAI-PMH et le mouvement du libre accès dépassent les frontières traditionnelles du "commercial/non commercial", et que ce référentiel en étendant le périmètre de ce qui est certifié à un "service de communication" peut devenir un outil global de management de la qualité. 

Une certification par des pairs

Le processus de certification repose sur une évaluation par des pairs appartenant au réseau DINI. L'organisation du référentiel et la précision des critères facilitent grandement cette évaluation de conformité.

Notons également que les frais sont vraiment minimes – de 50€ (pour une institution membre) à 250€ (pour un établissement commercial non membre). 

Un glossaire trilingue

Il pourra être intéressant de produire (de façon autonome), le glossaire aligné dans les trois langues. Un sous-produit de ce référentiel à venir…

Quoi dire en conclusion de ce bref aperçu du projet ?

Si vous suivez les conditions minimales, vous assurez un service certes classique, mais avec brio !

Surtout, ceux qui cherchent à utiliser votre plateforme, pour déposer ou surtout pour réutiliser les données présentes, sauront qu'ils peuvent trouver aisément les outils nécessaires (documentation ou données techniques et juridiques). De plus, il y a tant de sources et ressources que l'on ne peut connaître toutes celles qui pourraient vous être utiles un jour. Il y a donc une délégation auprès du DINI (un tiers de confiance !) et à ce système de certification, la preuve de la qualité de la plateforme (qualité technique mais aussi documentaire et juridique) à laquelle vous pouvez dès lors faire référence. 

Si vous optez pour les recommandations complémentaires (résumé, exports directs des métadonnées, indexation spécialisée,…), vous avez une plateforme avec des services orientés utilisateurs finaux enrichis. Une cible à moyen terme peut être. On pourra d'ailleurs suivre avec intérêt le passage probables de certaines de ces "Recommandations" en "Conditions minimales"…

Et le Web de Données Liées ? Ce Web se construit ici grâce à la présence comme conditions minimales (3 critère pour les URI) d'un identifiant pérenne sous la forme d'une URN (ou d'un DOI) et sont exportables sous la forme d'une URL opérationnelle.

Pour plus d'information (en français)

Note1 – Le protocole OAI préconise que les métadonnées soient fournies en format Dublin Core simplifié mais ne précise ni le contenu ni la structure interne des différents éléments.

Note2 – L’objectif d’un profil d’application est "d'adapter ou de combiner des schémas de métadonnées existants afin d'obtenir un nouveau schéma conçu pour un environnement particulier tout en gardant l'interopérabilité avec le ou les schémas de base. Cette adaptation peut inclure la définition d’éléments de métadonnées locaux importants pour une communauté particulière mais qui ne le sont pas dans un contexte plus large" (à partir de : Duval, E., Hodgins, W., Sutton, S., Wiebel, S. L., 2002. Metadata Principals and Practicalities. D-Lib Magazine (http://www.dlib.org/dlib/april02/weibel/04weibel.html). 

  1. Sur l'histoire, la structure de l'association, les services proposés et le système de certification, je vous renvois à un article (à paraître) : Vers une normalisation des archives ouvertes. Le certificat DINI  BBF, 2012, Vol. 57, No. 5 (à venir), par Joachim Schöpfel et Uwe Müller. Mais il faudra attendre un peu : l'article est prévu pour le n°5/2012 et nous en sommes (mai 2012) seulement au n°3/2012….
  2. Archives ouvertes : recommandations pour l'édition universitaire allemande, D. Frochot, 24 mai 2012 –  http://www.les-infostrateges.com/actu/12051442/archives-ouvertes-recommandations-pour-l-edition-universitaire-allemande

==============================================================

Liste des critères du certificat DINI

1. Visibilité du site

4 critères visant à faciliter le repérage de l'AO : place au sein des sites des établissements, référencement.

2. Charte

8 critères visant à prouver que la plateforme suit les principes du mouvement AO, et à documenter la politique vis à vis des différents acteurs (institution, auteurs, éditeurs) et de l'ensemble des services (documents, mise à disposition, conservation) et du fonctionnement technique. Une marque de la transparence à laquelle doit se conformer l'AO.

3. Aides aux auteurs et éditeurs

4 critères qui adressent les besoins (généraux) des éditeurs et des auteurs.

4. Aspects juridiques

10 critères liés à toute question d'ordre juridique – la relation entre auteurs, éditeurs et établissements gestionnaires, les droits de stockage, de signalement, de copie et de conservation vers d'autres formats, rôle de l'ayant-droit, action en cas de litiges, tierce partie, suivi de la loi allemande, statut légal des documents.

5. Sécurité de l’information

Le référentiel fait explicitement référence aux Critères Communs de la norme  ISO/IEC 15408. Et je me demandais si tout le monde dans les universités (allemandes ? françaises ? …) ou autres types d'établissement développant des AO, suivaient ces règles ?

5.1. Système technique

8 critères visant la continuité de services : responsable, procédure, documentation d'administration et de maintenance du site.

Le premier critère (M.5-1 Le système d’information du site est intégré dans le dispositif de sécurité de l’établissement) m'étonne un peu parce que pour atteindre un haut niveau de qualité sur ce plan, l'établissement pourrait trouver d'autres solutions, justement externe à l'établissement. Je suppose que cela veut dire que la politique est alignée à celle de l'établissement ?.

5.2. Traitement des documents

Ces 5 critères tournent autour des identifiants pérennes, puis de la gestion des modifications de documents – 2 critères considérés comme des critères techniques.

Parmi les recommandations, je note une contrainte technique sur le serveur du site à l'adresse de l'Utilisateur pour le transfert  des données (protocole SSL et certificat de confiance). Est-ce possible partout ?

6. Indexation et interfaces

6.1. Indexation

Le minimum syndical est proposé, avec toutefois une liste contrôlée pour les types de documents. Je note qu'il est bien stipulé que s'il est nécessaire de suivre le schéma DC, le stockage des données peut s'en éloigner (ne pas remettre en cause systématiquement les systèmes existants).

Trois critères dans les Recommandations complémentaires intègrent un enrichissement via soit une indexation avec des vocabulaires très spécialisés ou en anglais, soit des synthèses ou résumés. C'est à ce seul niveau que des spécificités disciplinaires peuvent apparaître car le système repose sur des normes et procédures partagées indépendamment du contexte scientifique (p.8).

6.2. Interfaces de métadonnées

2 critères, l'un sur l'interface Web aux utilisateurs et l'autre sur l'interface OAI.

Cette dernière – correspondant à la norme OAI version 2.0 – est détaillée dans l'Annexe A. Les 16 pages de l'Annexe A se structurent en une première partie qui reprend les spécifications du protocole OAI-PMH (et les recommandations du réseau DINI) ; deux autres parties apportent des spécifications supplémentaires d'une part sur la définition de la structure des ensembles de données et d'autre part sur le contenu des différents éléments du Dublin Core. Ces deux séries de critères supplémentaires assurent de « mettre en oeuvre des services de qualité à partir du moissonnage des données (p.35) ».

Quelques conditions ou recommandations sont ici formulées pour l’application du Dublin Core à l’interface OAI (par exemple, présence en conditions minimales de creator, title, date, type et identifier), Les recommandations complémentaires proposent d'offrir les métadonnées sous d'autres formats, d'autoriser les export directs (p.26) – les afficionados de Zotero ou équivalent seront ravis), des listes de liens pour les moteurs ou des accès via d'autres interface (SRU/W,…).

7. Statistiques d’utilisation

Ces 4 critères couvrent en particulier les questions de protection des utilisateurs finaux (fichiers log, robot, information au public). Parmi les recommandations complémentaires, citons l'usage de normes recommandées par le DINI comme Counter.

8. Archivage pérenne

La durée minimale et des copies sans technique de protection sont les 2 critères intégrés aux conditions minimales. 

=============================================================== 

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s