La qualité des données des bases de données – un phénomène très ancien (erreurs des copistes) qui ne fait que s'amplifier avec les années, les volumes aujourd'hui massifs (Big Data) ainsi que les usages, directs et plus encore indirects (réutilisation extensive des données).
Histoire vécue.
J'ai perdu ma carte Navigo/Velib (je suis parisienne…). Le fonctionnement des systèmes d'information de la RATP a bien
évolué : en 2000 (avec la carte Navigo de l'époque), cela m'avait pris 3
semaines ; ce matin, en 2 mn, j'avais une nouvelle carte.
En fait pas exactement 2 mn, car cela a pris 5 mn pour me retrouver dans la base de données…
Premier point : Avec mon nom (unique occurrence nom+prénom sur Paris), je voyais l'agente de la RAPT hésiter. Elle avait avec ce nom quelque chose d'approchant mais avec une date de naissance incroyable … 11/11/11. 2011 impossible, et 1911, cela semblait improbable tout de même !
Ma date de naissance s'est probablement "perdue" à la faveur d'un changement de système informatique.
Deuxième point : Une fois résolue ce qui semblait une "erreur de saisie par mon collègue", mais toujours hésitante sur l'unique fiche qui s'affichait sous ses yeux, elle finit par me demander "Est-ce bien
vous, là ?" en me retournant l'écran sous les yeux.
Et oui, c'est bien moi … au début des années 1980, la photo de ma première carte Orange ! Impossible à quiconque qui ne m'a pas connue à l'époque de faire un rapprochement entre cette carte et son possesseur…
Je croyais que la photo servait justement à contrôler que celui qui se servait de la carte était bien le propriétaire de ladite carte…
Enfin, mon ancienne carte est redevenue ma nouvelle carte. Effectivement une copie de carte 😉
Je reste une jeune fille pour la RATP -la date de naissance a été modifé mais pas la photographie, ce qui peut faire plaisir sauf si au prochain contrôle, on me dit que j'ai volé la carte à quelqu'un !
Des données bancales… ce qui n'est pas sans conséquence sur les activités que je qualifie de directes comme ici produire une "copie" de la carte, mais bien sûr pour toutes les activités de réutilisation des données, c'est-à-dire à d'autres fins que celles pour lesquelles elles étaient détenues dans la base source ("carte interactive du métro en fonction du trafic 2011, Datapublics").
Ahhh, la qualité de données et les activités de gestion que cela suppose - vaste question. "Il est temps de prendre soin de vos données"…et pas uniquement parce que vous exposez vos données dans le web.
Un traitement (automatique) sur les dates de naissance des cartes "vivantes" supérieures à 95 ans, et un processus de renouvellement de la photo (numérique) tous les 10 ou 15 ans… éventuellement en offrant à l'usager un contrôle périodique sur c(s)es informations. Pas trop compliqué non ?
Sur cette question de qualité dans le temps des bases de données (ici
administratives, déclaratives), je vous conseille de suivre Isabelle
Boydens – blogue ; un article en pdf 2006 ou I.Boydens sur Isidore)
WordPress:
J’aime chargement…