Traitement et visualisation des données : la révolution Hans Rosling et Gapminder

hansRosling-gapminder.pngUne révolution dans le monde de la (re)présentation du monde à travers les données et leur visualisation. Hans Rosling, le logiciel gapminder et la fondation du même monde.

Hans Rosling, scientifique et très grand vulgarisateur, vient de nous quitter. Triste nouvelle.

Sa présentation sur TED en 2006 (en FR) où j’ai découvert l’homme, ce fabuleux outil et les principes (éthiques) autour du traitement des données avec comme objectif :  faire sens.

Mais aussi (en slow english) sur la chaîne youtube ou le site de Gapminder:
https://www.youtube.com/channel/UCMbmqUMqzerMSM48pGYMYsg
http://www.gapminder.org/videos/dont-panic-the-facts-about-population/

Publicité

Libérer les Revues et les données de la recherche

Après les thèses, un autre sujet que j’affectionne tout particulièrement : les revues.

Je souhaitais vous parler depuis 2 ans (!), d’IPOL : une revue scientifique numérique dans le domaine du traitement et de l’analyse d’image numérique qui propose à ses lecteurs de tester en ligne les algorithmes exposés dans les articles et de capitaliser ces données d’expériences.

J’avais rencontrée au Frédoc 2011 (IST en Europe) sur Bordeaux une collègue qui m’avait présenté avec enthousiasme, cette revue numérique innovante développée dans son environnement de travail. Et je vois que Frédoc 2013 sur les données de la recherche, ont été l’occasion d’en faire une présentation à la communauté – je m’en réjouis.

Cette revue associe :

  1. une revue composée d’articles – c’est donc bien une revue !
  2. des données de la recherche, testés ;
  3. les archives des expériences réalisés.

Lire la suite

Dispositif d’accès à l’information et évolution des thésaurus – le cas de Popline

POPLINE est une banque de données bibliographiques sur la population, la santé de la reproduction et la planification familiale créée en 1970 (infos sur le site de l'Ined). C'est aussi le nom du thésaurus utilisé pour l'indexation du contenu des ressources documentaires spécialisées qui y sont référencées – aujourd'hui au nombre de 370 000.

Depuis 2001, POPLINE est maintenue dans le cadre du projet "Knowledge for Health" (K4Health) Project à l'Ecole de Santé publique Johns Hopkins Bloomberg (wikipedia), soutenu financièrement par l'USAID (Agence des États-Unis pour le développement international).

Ce dispositif vient de vivre une transformation importante : le thésaurus toujours consultable de façon autonome, est surtout valorisé à travers un nouveau mode d'accès dits par "sujets". Ces «sujets » correspondent à des requêtes préprogrammées, les fameux "profil de recherche" et services de DSI (diffusion sélective de l'information) auxquels peut s'abonner un utilisateur connecté. 

Popline. Taxonomie de sujets

Popline – une branche de la taxonomie de sujets

Lire la suite

Editeur / visualiseur graphique de thésaurus

OpenVocabs est un éditeur-visualiseur de thésaurus…qui va bientôt disparaître. Quel dommage.

Visualisation-Th-RisquesTechno-

http://openvocabs.org/vocabularies/th-risques-technos-test/

L'éditeur Web permet de construire un vocabulaire contrôlé comme une structure hiérarchique arborescente mais graphiquement sous la forme d'une roue – ce qui permet de mieux repérer des concepts/termes éloignés les uns des autres…. Des limites toutefois au volume de données manipulées. 

Il propose également un service pour la gestion et le stockage de vocabulaires, et intègre la capacité d'importer des vocabulaires existants à partir d'excel ou SKOS, et d'exporter des fichiers SKOS.  Un deuxième module sous la forme d'une appliquette (!) pour google chrome permet d'indexer taguer  annoter des ressources avec ce vocabulaire.

J'ai mis 2 minutes pour charger le thésaurus Risques (désolée je n'ai pas demandé l'autorisation d'utiliser ce (petit) vocabulaire "Risques" très spécialisé que je trouve très bien). Mais je n'ai pas réussi par contre à utiliser l'outil d'annotation.

Quant à la navigation et la visualisation dans le thésaurus … je vous laisse découvrir….

Lire la suite

Lire sur écran

La lecture sur écran, plus agréable (et efficace) qu'il y a une 10aine d'années, reste encore laborieuse : entre les besoins et contraintes des lecteurs d'un côté, les difficultés technico-ergonomiques pour les éditeurs de logiciels de l'autres, les (très mauvaises) pratiques des éditeurs des contenus (professionnels ou non(, je suppose qu'il nous faudra encore quelques années de tatonnements… Ma dernière expérience en date du jour : un PDF (beurk !) … sur 2 pages, inutilisable/illisible, mais payé !

Et je ne vous parle pas des DRM : pour ma part j'ai pris la décision de ne plus acheter du tout d'ouvvrages/documents avec DRM – il y a tant à lire que je ne serais pas perdante. Côté professionnel, cela me fera lire de l'anglais car, l'avez-vous remarqué, les ouvrages FR sont avec DRM, les ouvrages en anglais (dans mon domaine au moins) sont très fréquemment sans DRM.(plusieurs ouvrages sur html sans DRM). Idem pour la fiction. Un éditeur/diffuseur québecois uniquement sans DRM (il ne le dit pas assez).  Bien sûr on trouve des livres techniques en FR sans DRM – mais c'est une traduction d'un livre EN – ceci pouvant expliquer cela. Mes connaissances sur HTML5 se feront en français mais par des auteurs anglais … Mais a priori, cela bouge un peu dans le monde culturel français : les Editions de Minuit ou les Editions Métaillé suivent le pas…Une bonne chose.

Je trouve assez scandaleux curieux que la plupart des éditeurs/diffuseurs ne nous annoncent pas la couleur (ex chez Numilog, le même ouvrage à la Fnac. . Mais si d''autres éditeurs sont plus attentifs en nous présentant la mention "sans DRM" comm ePagine, il faudrait annoncer le pendant pour les livres "AVEC DRM"- et associer un filtre en recherche pour ne pas perdre du temps à chercher des titres en ayant ce critère de tri comme le fait ePagine. Car "epub" tout seul ne suffit pas à clarifier la situation, et j'avoue ne pas avoir confiance … Mais cela avance. A force de dire ouvertement que l'on n'achètera pas de livre avec DRM, peut-être que les choses vont bouger ?

Toutes ces bagarres pour quoi faire ? pour pouvoir lire des bouquins et d'autres types de documents (articles, brochures,…) avec mon application de lecture préférée, et non pas l'application d'adobe (ou d'apple). En l'occurrence mon navigateur/epubReader sur l'ordinateur, et Stanza sur l'iphone (hors connexion).

Je surveille ces outils depuis bon nombres d'années. Vu le nombre de personnes qui me demande des informations sur le sujet, voici quelques éléments sur mon retour d'expérience. D'abord quelques critères pour choisir une application, puis quelques logiciels (pour le format epub).

 

Stanza-iphone-application-example            Stanza-20080824-104600

1. Critères de sélection d'une application de lecture sur écran

Plateforme matérielle

  • Ordinateurs (Mac / PC / Linux), 
  • Mobile (iPhone, Android), 
  • Tablette (ipad, motorola,…) 
  • Liseuse (Kindle, Google iRiver Story HD, Sony, Kobo,…)

Personnellement j'opte clairement pour un matériel qui serve aussi à autre chose que seulement à lire. Pas de multiplication de machine, donc portable (le même travail / personnel) et iphone.

Application logicielle

Les liseuses intègrent une application spécifique pour lire les livres numériques. Pour les autres matériels, des applications logicielles vous sont proposées par les fabricants. Mais vous pouvez aussi choisir votre propre application (y compris avec iphone), ce qui peut être intéressant dans le cas où vous avez plusieurs matériels : un ordinateur et un mobile ou une tablette, et que vous souhaitez poursuivre votre lecture indifféremment sur l’un ou l’autre – bien que ceci ne soit pas encore très fluide …

Remarque sur ces applications : le site de l’application peut être en anglais, mais le logiciel en Français.

Fichiers manipulés

Un livre électronique s'utilise pour la plupart sous la forme d’un fichier que vous récupérez, plus ou moins laborieusement surtout s'il y a des DRM.

Ces fichiers ont des formats variés : 

  • Formats ouverts du Web : html, epub (correspond à un html compressé) -> et bientôt HTML 5 et epub 3
  • Formats fermés d'adobe : acsm (correspondant au epub avec DRM) qui vous oblige à faire allégeance à ADOBE, et pdf (pour moi le format est fermé à la lecture !)
  • Les formats propriétaires utilisés par les liseuses : prc ou pdb pour Palm, .azw pour Kindle, .lrf ou .lrx pour les Sony,.lit pour Microsoft Reader….
  • Autres formats utilisables avec des outils bureautiques  : odt, rtf, txt
Sachez qu'un outil comme Calibre vous permet de passer d'un format à un autre (en "perdant" suivant les formats et le sens de la conversion, des possibilités).

Gratuit / Payant

La plupart sont des applications gratuites, mais si vous êtes un gros utilisateur de l’application, n'hésitez pas à apporter votre contribution financière pour co-financer sa maintenance.

Autonome / Associé à un espace de stockage en ligne

Certains outils (matériels ou logiciels) nécessite une inscription (généralement gratuitement) sur un site pour acheter et gérer les livres achetés / lus.

Un avantage est que cela vous permet, au cas où vous auriez un problème avec votre application ou votre matériel (vous perdez votre mobile par exemple) de récupérer vos documents …. Je ne parle pas ici de l'AppStore que je suis obligée d''utiliser pour récupérer des applications et que je me refuse d'utiliser pour l'achat d'ouvrages, mais de site comme celui d'eReader par exemple ou d'éditeurs/diffuseurs comme ePagine qui regroupe plusieurs libraires.

J'avoue avoir beaucoup de mal à utiliser ces centres commerciaux ou plutôt ces supermarchés puisqu'il n'y a qu'une seule caisse, mais je peux comprendre que cela arrange beaucoup de personnes. Mon besoin se situe plutôt au niveau d'un outil de lecture et d'annotation quel que soit l'objet à lire et quelle que soit la source (éditeur).

Fonctionnalités proposées – Ergonomie

Nous nous limitons dans ce billet à répertorier des applications qui vous permettent de lire des livres numériques au sens compris actuellement c'est-à-dire une pâle copie du livre papier. Car nous espérons bien que bientôt nous pourrons découvrir, prendre plaisir, s'instruire, …. avec des livres d'un autre genre et mieux adaptés à la lecture sur écran.

Mais en restant au niveau du livre numérique actuel, vous pouvez déjà avoir besoin d’autres fonctions que celle du remplacement du support papier.

En premier lieu la satisfaction de pouvoir modifier la taille, la police, la luminosité et/ou le fond du support ! C'est pour moi la fonction essentielle : ma lecture en matinée et celle en soirée ne présentent pas les mêmes exigences… Puis peuvent venir des besoins : pour lire des documents à des moments et des lieux différents (applications/matériels différentes) tout en conservant les informations d'usage, pour gérer sa bibliothèque, pour se donner une idée du degré d'avancement de la lecture, pour partager ou mutualiser ses ouvrages, pour annoter au cours de la lecture et conserver / mutualiser ses annotations, …. Bref, disons que le chantier démarre ….

Une des fonctionnalités que je trouve extraordinaire, testée sur l'application eReader - application malheureusement limitée au format Palm (pbd), est le défilement automatique du texte. La vitesse proposée en standard me convient bien …et cela évite d'avoir à faire le geste de changement de pages ! Vous l'aurez compris : je n'ai jamais vraiment porté attention au toucher et à l'odeur du papier …

Des progrès restent à faire mais les applications actuelles sont déjà assez intéressantes pour se lancer avec plaisir – surtout sur les mobiles où très clairement des designers/ergonomes sont intervenus ! Du coup, je lis beaucoup plus souvent sur … mon iphone que sur sur le portable !

 

2. Quelques applications pour lire sur écran

Stanza (*)

– application multiplateforme : windows/mac, iphone/iPod; epub/pdf sans DRM ; la version pour mobile me convient bien, mais je n'utilise pas la version ordinateur
www.lexcycle.com/

Calibre (*)

– application multiplateforme : windows/mac, iphone/iPod ;  mult-formats sans DRM.
– prise en main légèrement plus complexe, mais des fonctions avancées de gestion des documents numériques eux-mêmes (dont une gestion de métadonnées bien souvent absentes, partielles voire erronées !) et la conversion d’un format de fichier vers un autre (epub, pdf, …)
http://calibre-ebook.com

FBReader

– Multiplateforme sauf iphone/ipad;  epub sans DRM ; fonctionnalités réduites
-  http://www.fbreader.org/

eReader(*)

– multiplateformes, pour fichier pbd (Palm) - ergonomie avancée
http://www.ereader.com/ereader/software/product/15008_pro_mac.htm

Adobe Digital Editions

– Multiplateforme ; Mac/Windows - - format .acsm (epub avec DRM) et pdf
http://www.adobe.com/fr/products/digitaleditions/

ePagine

– iPhone/iPad uniquement; epub, epub DRM (je suppose) et pdf ; gestion de ses achats auprès de différentes librairies.
http://itunes.apple.com/us/app/epagine-reader/id393153110?mt=8

Votre navigateur et les modules d’extension

Le navigateur et html !

Bien sûr le plus simple serait de faire un travail éditorial directement et simplement en html (et très bientôt html5 ?), utilisable avec votre navigateur. J'utilise souvent l'astuce "Lecteur" avec le navigateur Safari pour des textes à lire (en séquentiel) pas toujours bien exposés sur le Web…

Lecture-facile-ecran-avec Lecteur-Capture-2011-09

 

Le navigateur est aussi directement utilisable si l'édition est de qualité  (la forge Framabook).
Ici nous n'en sommes qu'au début de ce qu'il est possible de faire.

Lecture-facile-edition-de-qualite-avec poule-oeuf-Capture-2011-09

 

Sinon vous prenez une appliquette(widget) pour lire des livres/documents en epub, vous avez :

EPUBReader (*) sous Firefox

– lecture d’epub sans DRM -  https://addons.mozilla.org/fr/firefox/addon/epubreader/

Lecture-epubreaderCapture-2011-09

eBook Reader pour Opera

– lecture d’epub sans DRM. Application fonctionnellement intéressante mais qui curieusement se lance via Opéra mais s'ouvre dans une fenêtre en dehors du navigateur.
http://widgets.opera.com/widget/15552/

Des services en ligne

Vous chargez votre fichier/document pour le lire de n’importe où à partir d’un simple navigateur.

Bookworm <en>

– Avec inscription ; http://bookworm.oreilly.com/

Magic Scroll.net <en> (*)

– Sans inscription; http://www.magicscroll.net/

Autres

Mobipocket Reader

– Windows / PalmOS / Symbian / Blackberry
http://www.mobipocket.com/en/DownloadSoft/ProductDetailsReader.asp

WebReader de La Poule et L'Oeuf

– Mac/Windows/Linux, ePUB et HTML ; éditeur/lecteur de livre/applicatif
http://www.lescomplexes.com/blog/?p=68

Sur Macintosh

– Scarlett : epub sans DRM, payant (environ 7€
– Ehon : epub sans DRM et pdf, payant (15€) (http://itunes.apple.com/fr/app/ehon/id402485111?mt=12&affId=1627795)

Sous Ubuntu

http://doc.ubuntu-fr.org/epub

OpenBerg Lector 5

– sous Firefox  (ne fonctionne pas avec la version 6) ; lecture d’epub sans DRM
https://addons.mozilla.org/en-US/firefox/addon/openberg-lector-5/

Pour aller plus loin

(1) Liste des matériels de liseuses compatibles epub sur eBouquin (2009) http://www.ebouquin.fr/2009/08/17/la-liste-des-17-readers-compatible-epub/

(2) Billets sur des applications de lecture (2011)
Lecteurs epub – http://www.jedisaber.com/ebooks/readers.asp
Logiciels de lecture et création de livre électronique
Quel logiciel choisir pour lire un livre numérique, Bouquineo, février 2011 **
Transférer un ebook perso sur son iphone/ipod touch, 2009

(3) ePUB - http://fr.wikipedia.org/wiki/EPUB_(format) (page mise à jour le 05/03/2011)

(4) Vous avez acheté un livre soi-disant epub mais vous avez récupéré chez votre commerçant, un fichier “acsm” c’est-à-dire avec DRM. Vous ne pouvez donc pas le lire avec votre application préférée. Voici comment retirer le DRM de votre epub (il faut s’y connaître un peu tout de même …)
http://altura.free.fr/spip.php?article45
http://nokto.net/post/2010/11/15/Comment-retirer-facilement-les-DRM-d-un-livre-num%C3%A9rique-au-format-ePub
http://www.ebouquin.fr/2010/11/23/comment-retirer-les-drm-dun-livre-au-format-epub/

(5) Dossiers/articles
– Eduscol / Educnet – http://eduscol.education.fr/dossier/lecture-sur-ecran 
– NetEmploi - http://www.netemploi.fr/2011/06/introduction-a-la-lecture-sur-ecran-dossier-de-ressources-reseau-ratice-loire/ 
– La lecture écran. André Tricot. 2011. http://www.slideshare.net/BD47/andr-tricot-la-lecture-cran 

(6) Faire sauter les DRM
http://korben.info//epubee-drm-removal-plus-de-drm-sur-les-epub.html&#160;

Libérer les métadonnées. 2. Facette et Delicious

Facette (écrit en français?) est une application d'organisation par facettes des tags de Delicious.

Le contexte

Cette application sur Delicious exploite l'outil Exhibit du MIT développé dans le cadre du projet SIMILE (Semantic Interoperability of Metadata and Information in unLike Environments). SIMILE a déjà été présenté dès 2006 par Christophe Le Bot ou C.Fauré, entre autres websemanticiens francophones. L'applicatif Timeline est certainement l'outil, issu de ce projet, le plus connu.
Exhibit est quant à lui un cadre d'applications de publication de pages Web interactives. L'utilisation pendant quelques semaines de l'application fournit de nombreuses pistes de réflexion.

Résultat : un tableau de bord pour exploiter le "répertoire" Delicious

Tout d'abord le résultat (résultats en ligne) : un véritable tableau de bord de mes signets sous Delicious, s'appuyant sur une catégorisation des mots-clés (à gauche de l'écran), fonction qui donne son nom à l'application, sur un index de l'ensemble des mots-clés produits (droite de l'écran) et offrant une recherche directe bien plus efficace que sur Delicious.

FacetteMIT-ex2.002

Etudions l'arrière du décors

Les résultats sont exportables, ici au format RDF/XML, ce qui nous permet d'étudier de plus près, les données … format ouvert oblige.

FacetteMIT-ex1.001


Mais comment sont produits ces tags enrichis ?
Ce type d'index de mots-clés associés à leurs catégories d'indexation peut être produit en sortie des systèmes documentaires habituels pour être exploité par un applicatif adhoc type Exhibit ou un moteur d'indexation et de recherche.

Sous Delicious, Facette vous propose de basculer sur une interface … d'indexation !

Facette1

Au fil de l'eau, on obtient des tags Delicious avec un look particulier …

Facette2

Que nous apporte cette application ? Que peut-on en dire ?

  • Structurer la représentation des ressources est très utile ! Certes.
    • Mais ce n'est pas tant la phase d'indexation structurée ici qui me semble intéressante que l'application en aval – Exhibit (exposition) – qui permet de produire dynamiquement cette interface de recherche riche.

    • Un intérêt toutefois à l'application amont (la phase d'indexation) : elle montre tout ce qui peut être fait avec des métadonnées libérées- ici des données structurées stockées sous Delicious.

    • La question reste bien sûr la phase "d'attribution d'une étiquette".
      Après une période de démarrage que je qualifierais de très douloureuse ;-), j'ai atteint aujourd'hui une phase de croisière. Je n'utilise plus l'outil d'annotation du MIT (qui ne fonctionne pas trop bien : ne mémorisant pas mes propositions, je me retrouve régulièrement avec une page vierge, et des catégories … anglosaxonnes …). Par contre, mes tags sont maintenant assez riches sous ce formatage pour rendre cette tâche acceptable sous Delicious directement. Et cette liste m'aide à … réfléchir ! Petit travail intellectuel très profitable assisté par la machine à l'inverse de la logique documentaire.
Facette3
  • Ces fonctionnalités sont-elles exploitables réellement dans des systèmes d'indexation sociale ?

Il me semble que cela ne peut s'imaginer que si le premier niveau de description ("catalogage" + "indexation sujet") est totalement ou partiellement, déjà intégré à la ressource. L'annotation réalisée par l'utilisateur est alors tellement orientée par son usage que cela semble tout à fait naturel : en tant qu'utilisatrice, il m'est plus facile d'indexer "ma" métadonnée "Exemple", que le sujet global de la ressource. Si j'élabore un dossier documentaire sur les "ressources pédagogiques en ligne", il m'est plus facile de tagger des références par rapport à cette thmatique, lorsqu'elles sont préalablement enrichies.

  • Quelles "facettes" ? Quelle schéma de métadonnées ? Quelle sémantique pour les tags ?
    • La question de la sémantique des catégories de tags reste entière, mais je vois poindre le CommonTag, une toute nouvelle spécification que Bernard Vatant de Mondeca nous présente.
    • Mais il ne s'agit pas toutefois d'imposer "une" structure unique, mais de permettre l'exploitation de différents
      schémas de métadonnées liés aux usages autour de collections mises à
      disposition. Par exemple j'avais besoin de distinguer "nature
      d'information" de "type d'objet", "exemple" ou "norme", le "domaine
      couvert" et le "sujet". Bref une structure adhoc. Sur ce plan,
      l'exploitation de Delicious est très parlant.

(Désolée pour celles qui en ont marre de Delicious)

Autres ressources

  • Un autre papier sur Facette par ReadWriteWeb au début de l'année.
  • Pour la notion de facette, se reporter aux travaux de Jacques Maniez. Par exemple : "Des classifications aux thésaurus :
    Du bon usage des facettes", Documentaliste – Sciences de l’information, 1999, vol. 36, n° 4-5 (non accessible en ligne), qui "plaide […] pour un usage plus rigoureux du terme et de l’outil [classification à facettes), qui fasse clairement le partage entre la classification des concepts et le classement des sujets.

Une semaine sur un PC …

… pour cause de café renversé sur mon portable Mac!

Bascule rapide des données utiles. 

Rapide ! … "tous les cordonniers ne sont pas mal chaussés"

  • format ouvert de la messagerie (Thunderbird) et protocole IMAP pour mon fournisseur (données accessibles en ligne)
  • Cloud compuding/SAAS, bref en éloignant une grande part de mes outils de production personnelle mais aussi des productions elles-mêmes, de ma tasse à café 😉
  • une clef usb (je ne retrouve pas le câble éthernet…)  des archives courantes et intermédiaires à la date J-1 !!

Mais aie, aie, aie, l'ergonomie !

Ma "productivité personnelle" chute tout d'un coup. Je ne vais pas vous embêtez avec mes post-its (numériques), ma colorisation des dossiers,…. Je ne citerais que l'insupportable fonction de recherche sous Windows. Des délais insupportables, des réponses non organisées… Impossible d'envisager même une semaine avec çà …

N'hésitez pas, vous qui êtes sur PC (et sans Intranet digne de ce nom … il y en a encore beaucoup …) : prenez un outil dédié.
Beaucoup de solutions sont accessibles, et pour cause étant donnée la fonction de base proposée sur l'OS.
Citons :  Copernic, Google Desktop, même Windows s'est senti obligé de faire quelque chose, … Vous pouvez aller sur Outils Froids pour plus d'information sur les moteurs locaux.

J'ai jeté mon dévolu sur Exalead Desktop, le clone du moteur Web pour PC (et uniquement pour PC Windows) qui existe aussi en version professionnelle pour les intranets. Ici la version poste de travail individuel (gratuite).
Il faut bien sûr laisser du temps à la machine pour indexer, avant de pouvoir faire quelques tests.

Je ne dirais rien sur la diversité des types de fichiers ou de sources manipulables. Je montrerais plutôt l''organisation des résultats qui libère les métadonnées, … ! Puisque vous pouvez naviguer à partir de ceux-ci… Enfin de ceux que l'on peut proposer comme dénominateur commun à tout document/fichier sur son poste de travail.

Exalead-standalone

Et ainsi proposer ce même type d'ergonomie (pas nécessairement cet outil bien sûr).
Pour prendre un exemple de catalogue de bibliothèque (avec des données très homogènes et pas d'exploitation de données non structurées), voici Ariane 2.0. de l'Université de Laval.

  • Des fonctions en plus – trier les résultats au sein d'une catégorie de métadonnées,
  • et des fonctions en moins – personnaliser le choix des catégories de métadonnées et leur ordre.

 Ariane2-UnivLaval

Une semaine plus tard, retour sur ma machine sans encombre…

L'envie de tester autre chose que l'outil Spotlight du Mac, pour voir. Test ce coup-ci de Google Desktop… Ecran classique. Efficace, très rapide (avec une longue indexation du disque). Personnellement, je préfère l'organisation et le tableau de bord d''Exalead.

Googledesktop

On a parfois des difficultés à savoir où l'on se trouve. Ici, ailleurs… Si vous ne prêtez pas attention, vous basculer sur une recherche Web….L'écran ici montre l'URL de Google Fr, et les données de ma machine comme premiers résultats.

Google2

Tout documentaliste devrait à un moment ou à un autre, tester cet outil ne serait ce que
pour comprendre pourquoi les utilisateurs … ne veulent plus venir sur d'autres types d'interfaces.

En tous les cas, de bons outils pédagogiques à mettre entre toutes les
mains de vos stagiaires.

Listes contrôlées, thésaurus, taxonomie et ontologie (article, 2009)

Présentation simple et claire de ces outils terminologiques, dans le papier écrit par Jean Delahousse de Mondeca, dans le numéro 2 de Knowledge Mag de mars 2009 (sommaire),fraîchement sorti.

En quelques mots :
1- des listes de mots qui représentent en général des entités nommées : noms d'entreprises, de produits, de molécules, de personnes…
2- le thésaurus, c'est -à dire des noms communs organisés entre eux par des relations hiérarchiques, associatives ou d'équivalence (pour faire simple) . Le thésaurus de descripteurs sans ses "listes annexes" (voir 1-)
3- les taxonomies vues comme des classifications
4- les ontologies, un ensemble de mots contrôlés (1 ou 2), organisés (2) qui peut avoir une valeur de classes (3) ! Mais en dehors du périmètre conceptuel qui diffère, la représentation de chacune des entrées de l'ontologie est précisée par des attributs, et les relations sont bien plus riches que celles existant au sein des thésaurus de descripteurs traditionnels.
La 2ème partie de l'article exposent les usages de toutes ces terminologies, bien plus larges que strictement l'indexation pour la recherche. Sur ce point aussi, les approches devraient changer…

Et après ces quelques pages sur les référentiels terminologiques, n'hésitez pas à vous plonger dans le numéro complet (et plus globalement le site !) :
Au hasard de ma lecture : une mise en place du couplage ontologie/terminologie (touristique) à la  Saône et Loire par Joël Nogier et François Rouze (une application d'ITM de Mondeca), une superbe cartographie des outils de mise en scène et de visualisation de l'information  et  le KM mix par Denis Meingnan. Ainsi qu'une présentation de "MindUp, vers une réconciliation de l’email et du travail collaboratif ?" et un « Panorama des outils 2.0 au service de la veille » par Gilles Balmisse.

Juste à changer : la méta "titre" du papier de Delahousse, daté de 2008, qui perturbe mes outils web 2.0 ;-).

Libérer les métadonnées ! 2. Localisation géographique.

Nous poursuivons la libéralisation des métadonnées de leur
notice catalographique où nous les avions confinées.
Après les "dates", prenons justement de la
distance avec la métadonnée "localisation", que je limiterai ici à la localisation
terrestre.

L’exemple est tiré d’un catalogue très classique de romans.Je sais, je sais : malheureusement, ce type
de métadonnée ne nous est justement pas proposé dans les catalogues de bibliothèques,
alors que cela nous est indispensable ;-)

Je ne rentrerais pas dans les débats sur l’indexation
des Romans
(autre dossier) (où se passe l'histoire?), ou de l’utilisation des lieux de
naissance des auteurs (origine culturelle de l’auteur?) dans les catalogues
bibliographiques. Je ne parlerai pas non plus du mélange fait entre ces deux
natures de « localisation " : si vous
tombez sur l’inspecteur Wallander par la donnée « suédois (auteur) »
qui justement enquête à Riga en Lettonie (lieu où se déroule l’histoire), c’est
à une présentation de la vie lettonaise et non suédoise que vous serez convié….
 
Voici donc une jolie carte établie par Bibliosurf, notre
bibliothécaire préféré
qui …. indexe les documents(entretien de B.Strainchamps) par leur localisation.  Un vrai documentaliste qui se met à indexer tout type de document;-)

Un index genre/pays (Patientez un peu que les marqueurs s'affichent), pratique et pédagogique, des Guides de lecture (roman, roman policier, livre de cuisine,..), plus sympathique qu'un index alphabétique.


Double-cliquez sur
l'image ou aller sur Flickr

Bibliosurf-indexcarto


Un autre exemple: des fiches touristiques avec une géolocalisation des résultats de la recherche.
Double-cliquez sur
l'image ou aller sur Flickr

Nievres-geolocalisation2

Services web pour la géolocalisation

* Geonames -  http://www.geonames.org
GEONAMES une base de données géographiques, billet de juin
2007

* GoogleMaps http://code.google.com/intl/ja/apis/maps/

* Données géographiques au format RDF de l’INSEE

* Citons aussi Géoportail de l'IGN qui propose une visualisation des données, mais nonl'exploitation (type mashup) de ces mêmes données. En tous les cas pas simplement.

 

Cartos de sites, artistiques

L’applet en ligne, AHAREF, développée par un artiste suisse, Marcel Salathe, offre une représentation graphique des sites basée sur l’utilisation des balises.

Légende : bleu> pour les liens (balise A); rouge> pour les tableaux (balises TABLE, TR, TD) ; vert >pour les balises DIV (structure du document HTML) ; violet > pour les images (balise IMG) – jaune: pour les formulaires (balises FORM, INPUT, TEXTAREA, SELECT, OPTION) ; orange>pour les retours à la ligne et tabulations (balises BR, P, and BLOCKQUOTE) ; noir >la balise HTML, le nœud racine  – gris> toutes les autres balises

Je vous poste quelques copies
d’écrans, mais il est préférable de faire tourner l’engin directement en
ligne en cliquant sur les liens des noms de site.

Il ne faut pas chercher de sémantique derrière ces représentations graphiques de sites, mais plutôt un amusement.
Quoi que parfois, …

Ce blog

Cartodescripteurs

Le site d’Apple France

Cartoapple

Véridique pour le site de Microsoft, qui existe pourtant bien dans la réalité 😉

Cartomicrosoft

http://www.aharef.info/static/htmlgraph/