Le prisme Technorati et la réalité

Publié le :

David Sifry, patron de Technorati, vient de publier les derniers chiffres de la blogosphere. Loic Le Meur, actionnaire de Technorati, s'inquiète de la position du français dans tout ça (tiens, je note qu'il ne mentionne pas "l'oubli" de quelques 5,9M de skyblogs dans l'index de Technorati dans son billet en anglais).

Je crois que Loic-actionnaire devrait poser quelques questions à David Sifry. Pour ceux qui ne sont pas à l'aise avec l'anglais, mon argumentaire est le suivant :

  • Technorati est incapable de détecter automatiquement la langue d'un billet (tous les principaux moteurs de recherche savent le faire automatiquement, même la Google Mini qui coûte 2000 euros le fait) Ah si, ils s'y essayent avec languid, mais David Sifry dit lui-même que ça doit être amélioré.
  • Il faut suivre un processus long et compliqué pour déclarer la langue principale de son blog : 1) s'inscrire sur Technorati et remplir un profil, 2) déclarer son blog, 3) déclarer la "langue principale" du blog. Il y a plusieurs problèmes avec cette approche :
    • D'une part c'est manuel donc beaucoup ne le font pas,
    • c'est entièrement en anglais, donc exit ceux qui ne parlent pas la langue (c'est, comment dire, idiot très dommage quand on prétend vouloir donner des chiffres sur les langues étrangères de commencer à ne sonder que ceux qui parlent anglais,
    • ensuite ça ne fonctionne pas ! J'ai déclaré trois fois le français aujourd'hui, ma préférence n'est jamais prise en compte (bug ?),
    • et enfin ce choix implique qu'un blog n'a qu'une seule langue, donc out ceux qui bloguent en plusieurs langues.
    Pour info, c'est la raison principale qui fait que le dernier classement des 100 premiers blogs français fait par Technorati/Edelmann est complètement faux.
  • David Sifry admet lui-même que certains chiffres sont des intuitions personnelles, et qu'ils ne savent pas précisément séparer les blogs de spammers des autres.
  • Il y a un certain nombre de sites qui ne sont pas des blogs mais qui apparaissent dans l'index comme des blogs, avec classement et liens (la preuve, je me suis toujours demandé ce que site faisait là, et l'info de mise à jour est fausse).
  • A contrario, "l'oubli" de Skyblog élimine une part non négligeable de la francosphère (inutile de gloser sur la pertinence de leur contenu, c'est un critère qui n'a pas à entrer en ligne de compte pour Technorati).
  • Je pense que Technorati ne va pas au-delà de la page d'accueil des blogs indexés, du moins pour calculer les liens et le classement. Dommage quand on index des blogs, dont la majorité du contenu est dans leurs archives. J'aimerais qu'on me prouve le contraire.

Autant j'applaudis le travail que fait David avec ses rapports réguliers, et je respecte les gens de Technorati, autant je trouve qu'ils devraient faire un meilleur effort de transparence sur leurs méthodes. Il faut en permanence lire entre les lignes.

Il serait donc temps qu'on arrête de prendre ce qu'ils disent pour argent comptant, il y a à mon avis une sérieuse marge entre le prisme Technorati et la réalité.