PCDestroy. Index du Forum
PCDestroy.
Comunauté Informatique & Graphique.
 
PCDestroy. Index du ForumFAQRechercherS’enregistrerConnexion

:: Les technologies utilisées par Google.Search ::

 
Poster un nouveau sujet   Répondre au sujet    PCDestroy. Index du Forum -> Informatique. -> Ressources Informatiques
Sujet précédent :: Sujet suivant  
Auteur Message
Lucius
Administrateur

Hors ligne

Inscrit le: 27 Jan 2008
Messages: 362
Masculin XP Métamorphose Firefox
Age: 17

MessagePosté le: Ven 15 Aoû - 20:17 (2008)    Sujet du message: Les technologies utilisées par Google.Search Répondre en citant

mit Singhal vient de vulgariser sur le blog officiel de Google les principales technologies utilisées par le leader de la recherche sur Internet. Pour résumer, il les a classées en 3 grandes catégories représentant les défis auxquels tout moteur de recherche est confronté : comprendre de quoi parlent les pages web, comprendre les requêtes tapées par les internautes, comprendre les intentions des internautes eux-mêmes.

Analyse des pages web

Google a beaucoup travaillé sur son système de crawl et d'indexation, afin d'arriver à avoir un index à la fois très grand et récemment mis à jour ("frais" comme ils disent). Google dit également s'être amélioré dans la compréhension des concepts abordés sur les pages web, même si certains mots-clés n'y figurent pas. On sait que cela peut venir de l'analyse du profil du netlinking des pages (et du site). Cela peut venir également de nombreuses autres analyses, que l'ingénieur de Google ne détaille pas ici bien entendu. Google peut très bien par exemple déterminer le lieu géographique associé à un site (si c'est pertinent) et positionner ses pages en bonne place parmi les résultats sur des requêtes incluant ce lieu, même s'il ne figure pas dans le texte de la page.

Amit Singhal indique aussi que l'algorithme de Google fait la part entre les mots importants et ceux qui le sont moins. La fraîcheur des informations d'une page est également mesurée...

Analyse des requêtes

Quand ils tapent leurs requêtes, les internautes ne font pas toujours bien attention aux mots qu'ils emploient. Parfois, leur formulation n'est pas la meilleure, et Google doit s'en sortir malgré tout pour comprendre ce que l'internaute cherche vraiment. On a tous vu que quand on fait une faute de frappe, Google nous suggère une correction. L'exemple donné dans l'article concerne Kofi Annan : si on cherche [kofee annan], Google nous demande si ce n'est pas plutôt [kofi annan] que nous cherchons...

Un des points clés dans la compréhension des requêtes est l'étude des synonymes. En réalité, Google modifie parfois la requête de l'internaute afin de lui retourner des résultats plus pertinents. L'algorithme de Google exploite aussi énormément les entités nommées et les abréviations en tous genres. Par exemple, il sait bien que dans la requête [Dr Zhivago], Dr signifie Docteur, tandis que dans la requête [Rodeo Dr], Dr signifie Drive.

Parfois le système de Google exploite l'algorithme maison d'identification des concepts. Par exemple un internaute qui tape la requête [new york times square church] ne s'intéresse pas aux articles du journal du New York Times, mais à l'église de Times Square à New York.

Toutes ces analyses de la requêtes sont faites dans toutes les langues gérées par Google, avec les subtilités de chacune...

Analyse des internautes qui font les recherches

Le dernier point-clé réside dans l'analyse des internautes eux-mêmes, en plus de leur requête. L'idée est d'arriver à mieux comprendre ce qu'ils ont en tête quand ils font leurs recherches. Un des points essentiels est la prise en compte du pays dans lequel se trouve l'internaute (et/ou de l'interface de Google qu'il utilise : google.fr ? google.com ? google.be ? etc.). Une même requête doit être traitée de façon différente par Google selon ces cas de figure. Amit Singhal prend un exemple pour les francophones : un Français qui tape [Côte d'Or] cherche a priori des informations sur le département du même nom, tandis qu'un Belge (ou un français gourmand) s'intéresse plutôt à la marque de chocolat du même nom.

Évidemment, Google a également développé tout l'aspect personnalisation, en tenant compte de l'historique des requêtes de l'internaute. Un internaute qui cherche des informations sur [jaguar] aura des résultats sur la marque de voiture de luxe s'il a déjà fait de nombreuses requêtes dans ce domaine, plutôt sur l'animal. La personnalisation n'est vraiment possible que pour les membres qui font leurs recherches sur Google tout en étant connecté avec leur compte Google, avec l'historique des recherches activé.

Source :
http://www.webrankinfo.com/actualites/200807-technologies-utilisees-par-goo…

Un article du NewYorkTimes :
http://www.nytimes.com/2007/06/03/business/yourmoney/03google.html?_r=2&amp…

Une traduction de cet article sur MoteurNews.com
http://www.moteurs-news.com/blog/index.php/2007/06/04/118-algorithme-de-goo…
______________________________________

Couleur Modérateur / Couleur Joueur
Revenir en haut
MSN
Publicité






MessagePosté le: Ven 15 Aoû - 20:17 (2008)    Sujet du message: Publicité

PublicitéSupprimer les publicités ?
Revenir en haut
Montrer les messages depuis:   
Poster un nouveau sujet   Répondre au sujet    PCDestroy. Index du Forum -> Informatique. -> Ressources Informatiques Toutes les heures sont au format GMT + 1 Heure
Page 1 sur 1

 
Sauter vers:  

Index | creer un forum | Forum gratuit d’entraide | Annuaire des forums gratuits | Signaler une violation | Conditions générales d'utilisation
WorkStation[electro] © theme by larme d'ange 2006
Powered by phpBB © 2001, 2005 phpBB Group
Traduction par : phpBB-fr.com