Pourquoi les moteurs de recherche aiment les blogs ?
Par Tizel le mardi 27 septembre 2005, 14:17 -
Blogowebsphère
- Lien permanent
Pourquoi certains blogs sont trés bien référencés malgré le fait que leurs auteurs ne se sont pas préoccupé de leur promotion ?
On ne peut plus faire de recherche sans finir par tomber sur un blog. Ce mode d'expression à permis à tout un chacun de se créer son univers sur la toile, de donner son avis, sans pour autant avoir la moindre conaissance technique. Des blogs, il y en a des millions (14,2 millions selon ZDNet.fr) et il s'en crée chaque jour de nouveaux (80.000 selon ZDNet.fr).
Ce phénomène de masse (et de mode ?) explique en partie l'afflu de pages blogs dans les résultats de recherche. Mais pas uniquement. La nature même du blog et l'organisation des blogueurs explique parfois leur aptitude a bien être référencés.
Nous allons prendre deux exemples pour illustrer mes propos : les skyblogs (des blogs d'adolescents essentiellement composé de photographies) et les blogs du journal LeMonde (dont Olivier est un adepte).
Si on considére le seul effet de masse, les Skyblogs devraient s'imisser dans tous les résultats de recherche. C'est largement le plus important hébergeur de blogs en France avec pret de 3 millions de blogs à son actif. Helas, leur qualitée laisse souvent à désirer (langage SMS, abondance de photos sans texte...). Les blogs du "monde" sont beaucoup moins nombreux, mais plus fournis, avec des textes en abondance, parfois quelques (trop ?) rares illustrations.
Les Skyblogs sont donc plus difficiles à référencer pour un moteur de recherche qui, rappelons le, référence essentiellement du texte. C'est là la raison principale qui fait que les blogs bien écrits se référencent bien : ils fournissent des mots à se mettre sous la dent pour les moteurs de recherche. Les photos mises sur les Skyblogs peuvent être magnifiques, mais les moteurs sont aveugles et bien plus sensibles au sens des mots qu'à la magnificence des couleurs.
Les blogs sont, en moyenne, plus souvent mis à jour que des sites traditionels où les auteurs attendent d'avoir des articles consistants pour mettre en ligne leurs pages. Avec le format blog, un auteur peut mettre en ligne un texte de 15 pages, mais aussi une courte réfléxion de deux lignes, et ce, trés rapidement...
Les blogs s'organisent en petite communautées qui se sitent entre eux. Certaines communautées sont assez fermées: dans les Skyblogs, les auteurs lient les sites de leurs amis, de leur bande. D'autres, sont beaucoup plus ouvertes : dans le monde, les auteurs lient leurs sites favoris, mais également les sites de leurs sources (d'autres auteurs, d'autres sites, d'autres blogs) sans pour autant revendiquer de lien retour. Cela contribue à la popularité de certains blogs (souvent cités) et au brassage de liens qui viennent gonfler la pertinence de l'algorithme des moteurs de recherche (qui se basent pour la plupart sur le nombre de liens pointant vers une page pour en évaluer la pertinence).
Commentaires
et pourquoi on indexerait pas les images par leur contenu? (euh si M. google veut m'embaucher, je suis d'accord pour bosser dessus!!)
Peut etre que les moteurs de recherche ne se sont pas adaptés aux mutations du net:
Le net est passé de l'état de vitrines pour les chercheurs à l'état de linker de gens en passant par l'e-commerces (et ses chimères) ...et ça y est, on arrive à l'interactivité, la vraie... youhou (oupa)
les blogs sont sur la toile ce que sont les tortues de Floride dans nos rivières française... Cette espèce nouvelle très dynamique cannibalise les activités des internautes sur le net et cela se répercute sur l'indexation des moteurs de recherche. Reste à voir si la tortue de floride (pardon les blogs) est néfaste pour l'espèce indigène, la cistude.
Merci pour ton commentaire :)
Pour indexer les images par leur contenu, il faudrait un moteur qui soit capable de reconnaitre le contenu de l'image. Vaste problème : comment distinguer une balle jaune d'un canari ? Pour l'instant, l'indexation des images est basée sur les paramètres suivants (l'ordre dépendant du moteur de recherche considéré) :
- Le nom de l'image
- Le contenu des balises alt et title associé à l'image
- Le texte (ou contexte) qui entoure la page (sur un site animalier, on a plus de chances de voir un canari jaune qu'une babale - sauf à considérer que c'est le jouet d'un toutou nommé séraphin).
Je sais qu'il y avait des chercheurs de l'INRIA qui avaient travaillé sur la detections d'images pornographiques (pour être asssocié à un logiciel de protection des mineurs : www.01net.com/article/131... ). Ils ont fondé une société : www.ltutech.com/ .
Un autre obstacle pour l'instant est sans doute les calculs requis pour mettre en place ce genre de moteurs : analyser une image doit demander beaucoup plus de calcul qu'indexer une page.