Les tags se hiérarchisent…

Deux auteurs d’InfoLab, laboratoire de l’Université de
standford, travaillent sur la hiérarchisation des annotations sur les
folksommies, bref des tags.
Les auteurs expose dans un article, l’algorithme développé et présente deux exemples à partir de
:
Delicious : 19 000 objets traités, soit environ 61000 tags distincts sur
252 000 annotations par 85000 utilisateurs
– et CiteULike : 452 000
objets, 41500 tags pour 157000 annotations par 5 700 utilisateurs

Quelques mots sur ce travail :
> 1 utilisateurs / 1 objet / Plusieurs tags
> il n’y a aucune structure prédéfinie au sein des tags.
> traitements : agrégation de tags au sein de vecteurs de tags en fonction des occurrences d’utilisation d’un tag pour un objet ; calcul de similarité entre les tags, construction du graph de similarité.

Exemple sur Del.ic.ious

Ceux qui baignent dans le monde de la fouille de texte (text mining) connaissent bien sûr depuis longtemps ce principe d’exploitation des « mots-clés » ou d’autres métadonnées associés à un objet documentaire, pour la production de graphes donnant une représentation d’un corpus de données. Avec la possibilité de naviguer dans ce graphe.

Trois petites remarques :
– Sur Delicious, les « auteurs » pris en compte à un moment donné dans le traitement (je n’ai pas compris comment cette donnée était vraiment prise en compte), ne sont pas les auteurs des documents référencés comme c’est le cas dans CiteULike, mais ceux qui ont fait le référencement. Quel est l’impact réel sur les résultats ?
– il s’agit bien ici – comme pour les cartographies de corpus dans les systèmes de fouille de texte ou text mining – d’élaborer un (méta)système dynamique de recherche/navigation à partir des données existantes dans le corpus (donc a posteriori). A bien distinguer des méta-systèmes autonomes comme les thésaurus ou plus globalement ce que l’on appelle les vocabulaires contrôlés (a priori).
– Bien sûr, on pourrait transformer ce résultat en outil… d’indexation. Ce que certains dans les méandres des blogues semblent regretter et vouloir faire (« Stratégie pour les tags")

En trois-quatre ans, nous sommes partis de textes, vierges de toute métadonnée, puis progressivement nous sommes passés à quelques tags spontanément attribués par des lecteurs ou auteurs sans contrainte (Delicious), puis aux clusters de Flickr et aux « facettes de tags » de facetious, … et maintenant à la hiérarchie des tags….
C’est l’évolution perpétuelle !

Publicités

2 réflexions sur “Les tags se hiérarchisent…

  1. Empyrée 16 mai 2006 / 22 h 35 min

    Stratégie pour les tags

    Initialement publié le 13 février 2006 à 10:48:35
    J?utilise beaucoup les tags sur DotClear depuis que c?est possible. Je pense même, à la lecture de certains commentaires, qu?ils vont remplacer les catégories (d?autant plus que les…

    J'aime

  2. Jérôme 30 juin 2006 / 0 h 50 min

    J’ai toujours regretté quelques défauts dans l’utilisation des tags par les système de folksonomie ou de taxonomie:
    – l’ utilisation d’identifiants qui dépendent fortement de notre culture, sans pour autant préciser par une définition le sens que l’on attache à cette classification. Si les effets sont limités quand le classement est effectué par un petit groupe, dès qu’un article est classé par un très grand nombre de personnes il y a multiplication de tags et dispersion.
    – l’absence de relations entre identifiants pour constituer des ‘domaines’, des hiérarchies, ou des synonymies par exemple. Cela permettrai de constituer une sorte de thesaurus spontané et améliorerai le classement des articles.
    Apparemment je ne suis pas le seul.

    J'aime

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s