Mots clés saisis par les internautes

OneStat, société de mesure d’audience, annonce les résultats de son baromètre concernant le nombre de « mots » saisis pour une requête sur les moteurs de recherche.

Sur ce premier tableau, l’étude des chiffres depuis 2003 (*1) montre une baisse constante des requêtes constituées d’un seul « mot », passant de 24,76% à 11,43% pour 2006.

Keyword_annee

Un aspect intéressant de ce dernier baromètre est la présence de statistiques par langue.

Keywordlangue

Nous avons seulement extrait les chiffres pour l’anglais, le français et l’allemand. Ceux-ci sont très sensiblement différents pour ces trois langues avec 28,89 % pour un mot et 40,04% pour deux mots pour l’Allemand.
Cela montre simplement que les langues fonctionnent de façon différente, ce que beaucoup oublient …
avec des langues synthétiques comme l’allemand (*2) grâce à des opérations morphologiques et des langues analytiques par constructions syntaxiques comme le français.

Et cela change les statistiques et surtout modifie la lecture de ces baromètres.

Quelques exemples :

– le mot le plus long :

  • en français : Anticonstitutionnellement (25 lettres)
  • en allemand : Rindfleischetikettierungsüberwachungsaufgabenübertragungsgeset
    (« loi sur le transfert des obligations de surveillance de l’étiquetage de la viande bovine et de la désignation des bovins » (mot officiel – dans un texte de loi, de 63 lettres)

– technique de conversion des déchets (3) = Abfallumwandlungsmethode (1)
– réduction du temps de travail (3) = Arbeitszeitverkürzung (1) = reduction of working time (3)
– première phase du championnat (3) = Hinrunde (1)
– location de voiture (2) = Wagenvermietung (1)
– partenaires sociaux (2) = Sozialpartner (1)
– conditions de travail (2)= Arbeitsbedingungen (1)
– centrale de chauffage alimentée par des déchets ( !) = waste-fed heating plant = Müllheizwerk (1)
– accord de libre-échange (2) = Freihandelsabkommen (1) = free-trade agreement
– usine de traitement des déchets (3) = Abfallbehandlungsanlage (1)
– position (de) hors-jeu (2) = Abseitsstellung (1)

Des chiffres donc différents pour ce qui concerne le nombre de mots d’une requête.
Mais bien sûr des contraintes et des résultats également différents dans la recherche sur les moteurs ….

  • condition travail canicule (508 000 / Google.fr) ou « conditions de travail » canicule (93000)
  • Arbeitsbedingungen Hitze (96000 / Google.de)

Une étude comparée franco-germanique des mots de la Constitution – qui reste à venir 🙂 – serait vraiment intéressante : un autre regard sur la constitution ?

Note
*1 Impossible de re)trouver des données équivalentes pour les années précédent 2003.
*2 Les coûts de traduction en allemand s’évalue à la ligne et non au mot.

Sources
L’article du 25/07/2006 sur JDN
Les données sur le site de OneStat.com
Constitution européenne (http://europa.eu/constitution/fr/lstoc3_fr.htm )
Les thésaurus Gemet ou Eurovoc, ainsi que le glossaire bilingue du football de l’Office franco-allemand pour la jeunesse (http://www.ofaj.org/).

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s