Recherche : Google dope son moteur à la “caffeine”

Discussion dans 'High tec' créé par mejihad, 11 Juin 2010.

  1. mejihad

    mejihad ... بوكرش و ودادي على

    J'aime reçus:
    230
    Points:
    63
    [​IMG]



    Google vient d'apporter une mise à jour majeure dans son moteur. Sous le nom de code "Caffeine" se cache un nouveau modèle d'indexation du web censé mêler qualité et fraicheur des résultats.


    Malgré sa diversification plutôt réussie dans un grand nombre de domaines (vidéo, mobilité…), Google n’en a pas pour autant oublié son cœur de métier historique qu’est la recherche en ligne.
    Au fil des ans, son moteur d’indexation du Web semblait ne plus correspondre aux attentes des internautes.
    Et pour cause, il suffisait de rechercher un avis sur un produit pour être noyé sous une pléthore de liens inutiles (comparateur de prix notamment).
    Google a donc entrepris de refondre sa technologie d’indexation sous le nom de code “Caffeine”.
    Testé une première fois en 2009, ce nouveau modèle entend prendre en compte avant tout la notion de fraicheur des résultats.
    En effet, avec l’essor des réseaux sociaux et la publication de contenus (vidéos, articles…), le moteur de recherche se devait d’être plus réactif dans son indexation.
    C’est désormais chose faite avec la mise en production officielle de Caffeine qui propose “50% de résultats plus frais”, selon Carrie Grimes, en qualité de Software Engineer, dans une contribution sur le blog officiel de Google.

    Comment ça marche ?


    Ce changement est sans doute l’un des plus importants pour le moteur d’indexation de Google.
    Comme le montre une image publiée sur le blog de Google (reprise ci-dessous), l’actuel moteur est basé sur un modèle en couches dans lequel chacune d’entre elles cible un type de contenu particulier. Les couches se mettent à jour séparément les unes des autres.
    Mais pour qu’une telle mise à jour s’effectue, Google avait besoin d’analyser l’intégralité du Web (la fameuse Google Dance).
    Désormais, l’indexation fonctionne selon une fragmentation du Web en petites “cellules” qui sont analysées de façon quasi-permanente.
    Et le résultat est particulièrement visible puisque les nouvelles entrées sont présentées plus rapidement aux utilisateurs qui effectuent une requête.
    Caffeine tire pleinement parti du réseau mondial de centres de données géants de Google.
    Et pour cause, la base de données représente un volume de 100 000 Téraoctets auxquels viennent s’ajouter plusieurs To chaque jour.
    Selon Google, il faudrait 625 000 iPod avec un disque dur de 160 Go pour contenir toutes les données.
    D’autres nouveautés seront présentées dans les mois à venir.

    [​IMG]

    source
     

Partager cette page