Mots clés saisis par les internautes

OneStat, société de mesure d’audience, annonce les résultats de son baromètre concernant le nombre de « mots » saisis pour une requête sur les moteurs de recherche.

Sur ce premier tableau, l’étude des chiffres depuis 2003 (*1) montre une baisse constante des requêtes constituées d’un seul « mot », passant de 24,76% à 11,43% pour 2006.

Keyword_annee

Un aspect intéressant de ce dernier baromètre est la présence de statistiques par langue.

Keywordlangue

Nous avons seulement extrait les chiffres pour l’anglais, le français et l’allemand. Ceux-ci sont très sensiblement différents pour ces trois langues avec 28,89 % pour un mot et 40,04% pour deux mots pour l’Allemand.
Cela montre simplement que les langues fonctionnent de façon différente, ce que beaucoup oublient …
avec des langues synthétiques comme l’allemand (*2) grâce à des opérations morphologiques et des langues analytiques par constructions syntaxiques comme le français.

Et cela change les statistiques et surtout modifie la lecture de ces baromètres.

Quelques exemples :

– le mot le plus long :

  • en français : Anticonstitutionnellement (25 lettres)
  • en allemand : Rindfleischetikettierungsüberwachungsaufgabenübertragungsgeset
    (« loi sur le transfert des obligations de surveillance de l’étiquetage de la viande bovine et de la désignation des bovins » (mot officiel – dans un texte de loi, de 63 lettres)

– technique de conversion des déchets (3) = Abfallumwandlungsmethode (1)
– réduction du temps de travail (3) = Arbeitszeitverkürzung (1) = reduction of working time (3)
– première phase du championnat (3) = Hinrunde (1)
– location de voiture (2) = Wagenvermietung (1)
– partenaires sociaux (2) = Sozialpartner (1)
– conditions de travail (2)= Arbeitsbedingungen (1)
– centrale de chauffage alimentée par des déchets ( !) = waste-fed heating plant = Müllheizwerk (1)
– accord de libre-échange (2) = Freihandelsabkommen (1) = free-trade agreement
– usine de traitement des déchets (3) = Abfallbehandlungsanlage (1)
– position (de) hors-jeu (2) = Abseitsstellung (1)

Des chiffres donc différents pour ce qui concerne le nombre de mots d’une requête.
Mais bien sûr des contraintes et des résultats également différents dans la recherche sur les moteurs ….

  • condition travail canicule (508 000 / Google.fr) ou « conditions de travail » canicule (93000)
  • Arbeitsbedingungen Hitze (96000 / Google.de)

Une étude comparée franco-germanique des mots de la Constitution – qui reste à venir 🙂 – serait vraiment intéressante : un autre regard sur la constitution ?

Note
*1 Impossible de re)trouver des données équivalentes pour les années précédent 2003.
*2 Les coûts de traduction en allemand s’évalue à la ligne et non au mot.

Sources
L’article du 25/07/2006 sur JDN
Les données sur le site de OneStat.com
Constitution européenne (http://europa.eu/constitution/fr/lstoc3_fr.htm )
Les thésaurus Gemet ou Eurovoc, ainsi que le glossaire bilingue du football de l’Office franco-allemand pour la jeunesse (http://www.ofaj.org/).

Publicités

Le mot-clé


Note sur la notion de mot-clé pour la recherche d’information.

Création : le 17 septembre 2005
Mise à jour : le 19 septembre 2005


A la question posée  « quelle(s) compétence(s) doit posséder un utilisateur ayant un besoin d’information et souhaitant formuler une question à un système documentaire », un collègue terrain annonçait durant un stage de formation de formateur auprès de bibliothécaires et documentalistes : «les utilisateurs du Centre en fait ne savent pas ce que veut dire mot-clé ».

Voilà une compétence rarement formulée et pourtant si essentielle !

Le sens attribué par les documentalistes se rapporte souvent à l’indexation des documents :

« Terme choisi généralement dans le titre ou le texte d’un document
pour en caractériser le contenu et en permettre la recherche. Il
constitue un point d’accès. Il est à distinguer d’un descripteur, qui
est un terme normalisé dans un thésaurus. (Vocabulaire de la
Documentation, ADBS Editions, 2004)

« Keyword : significant term found in a document, in its title or in an
abstract, which identifies subject content » (in Concice dictionary of
Library and Information Science, Stella Keenan, Bowker Saur, 1996)

Mais, formulée selon le point de vue de l’utilisateur dans une phase de recherche :
« C’est à partir des termes porteurs du sens requis (les mots clés) que la question est posée » (*, p.152)

Ce n’est donc pas seulement « taper quelques mots » !!

Mais comment faire pour choisir ce ou ces mots qui serviront de clé(s) ?
Comment éliminer les intrus ? (*)
Et comment faire pour acquérir cette compétence ?

Le Web et les moteurs de recherche ont modifié le contexte et les exigences de la recherche d’information, et si les méthodes à employer sont différentes de celles édictées dans les règles professionnelles (champs contrôlés d’une base de références bibliographiques), elles ne le sont qu’en partie seulement.

En effet, l’étape initiale qui consiste à réfléchir et identifier les mots-clés distinctifs par rapport à son besoin d’information, reste identique et normalement indépendante de la 2ème étape manipulatoire qui porte sur le choix définitif du ou des termes utilisés pour le système informatique.
Les précisions apportées dans un article de la Commission Français et Informatique** sur les difficultés liées à la 1ère étape en pédagogie et sur la notion de mot-clés, sont éloquentes et très intéressantes.

Quant à l’étape suivante de sélection des « bons » termes vis-à-vis du système, favoriser l’apprentissage des compétences nécessaires à un usage intelligent de chacun de ces dispositifs me semble plus efficace, plutôt que d’imposer à tout prix un modèle unique de recherche d’information : celui de la base bibliographique, comme semble le suggérer Marc Duval dans son article sur les mots clés***.

Entre autres, la compétence de fouille dans un lot résultat s’appuyant sur les outils de catégorisation proposés me semble tout aussi intéressante à acquérir, que la compétence de sélection d’un « bon » mot clé, ou (pire?) celles liées aux syntaxes et ergonomie variées pour formuler la question, mis en œuvre dans les systèmes documentaires informatisés.
Des compétences techniques, manipulatoires comme le suggère Mr Fondin dans son dernier article sur le sujet****, plutôt que des compétences liées à la signification (« le mot-clé concentre le sens »**)

Les pratiques liées aux outils du Web vont se développer ; l’Internet/Intranet mobilise d’importantes « masses et flux » d’usagers et d’usages. Aussi me semblerait-il plus judicieux que les professionnels de l’infodoc intègrent positivement dans les projets de formation mais aussi de conception des dispositifs documentaires, ces modèles ou des modèles dérivés, en faisant la promotion du mot-clé, indispensable dans les 2 modèles de recherche.

SD
—–
* L’analyse documentaire, Suzanne Waller, ADBS Editions, 1999
**  La notion de « mot-clé » et sa difficile application pédagogique, Commission Français et Informatique, [2000], http://users.skynet.be/ameurant/francinfo/motcle/motcle.html
*** Le mot-clé, Marc Duval, Dernière mise à jour 2002-01-08, http://www.dsi-info.ca/mot-cle.html
**** La formation à la recherche d’information : préoccupation citoyenne ou vision obsolète?, Hubert Fondin, Revue Esquisse, p.16-25, http://www.aquitaine.iufm.fr/recherche/esquisse/pdf/esquisse43.pdf