Dudu Posté 23 Juin 2005 Posté 23 Juin 2005 Il est quand même capable de beaucoup mieux ! Google images est une illustration impressionnante des capacités d'analyse de ce moteur. Il suffit de voir ce que cet outil est capable de trouver pour se poser tout un tas de questions. Pas vraiment Ce que dis Jeanluc colle parfaitement à GoogleImages également: "on en est vraiment encore à la recherche stricte des mots tapés au clavier."Seulement, le cas de GoogleImages est particulier car il tient compte des mots placés à coté de l'image. D'où certains résultats
zapman Posté 23 Juin 2005 Posté 23 Juin 2005 Ca s'appelle une analyse contextuelle et c'est beaucoup moins évident à réaliser que tu ne semble le penser. Ramener des résultats de cette façon, c'est à la portée de n'importe quel programmeur, mais ramener de BONS résultats, c'est une autre paire de manches. J'ai déjà essayé de réaliser des programmes de ce type et je t'assure que parvenir à la finesse (même relative) de Google Image est une performance formidable. Il est clair que les gars qui ont fait ça ont une sacrée expérience dans ce type de boulot... je me demande d'où ils sortent ces compétences
Dudu Posté 23 Juin 2005 Posté 23 Juin 2005 Que ce soit difficile à réaliser ou non, je vais peut-être paraître provocateur mais c'est le problème de Google, pas le mien Pour en revenir au sujet, on reste sur une recherche de mots précisément donnés par l'internaute. Si je tape "president" dans GoogleImages et que je tombe sur "chirac.jpg", c'est parce que le mot que j'ai demandé ("président") est situé pas très loin de la photo. Or, si je ne m'abuse, la réflexion lancée par Magicoyo parlait plutôt de recherches par concept, d'extensions singulier-pluriel etc etc.. ce que GoogleImages ne sait pas faire En revanche, dans les labos Google, on avait vu récemment un service qui permettait de trier les résultats par champ sémantique ("marguerite" en ne cherchant que dans le domaine "fleur" par exemple.. en s'évitant ainsi Marguerite Duras, Fernandel, etc.) Mais pour l'instant, c'est resté à l'état de version ß je crois
zapman Posté 23 Juin 2005 Posté 23 Juin 2005 Je vais avoir l'air d'insister, mais ce que fait Google image n'est pas "simple". Un exemple : trouvé sur la recherche "voiture" - Nom de l'image : c063518.jpg - La page collectionscanada ne contient pas le mot voiture, ni dans le texte ni dans les balises - Cette image est présentée sur la première page des résultats de recherche. - D'autres images telles que celle-ci : sont également présentes sur la même page mais ne figure pas dans les résultats - La page appartient à un site en langue anglaise En tant qu'humain, nous pouvons aisément constater qu'il s'agit d'une voiture. Ce qui est fort, c'est qu'un ordinateur arrive à cette conclusion. Comment a-t-il associé cette image au mot voiture ? On peut supposer qu'il existe quelque part un lien comportant le mot voiture et pointant vers l'adresse de la page, mais aucune recherche ne m'a permis de découvrir un lien de ce genre. On trouve par contre dans la page d'origine, juste en-dessous de l'image, la légende "Vehicle and chauffeur, Laurier House, November 1914." et on peut supposer que Google a simplement traduit le mot vehicle en voiture. Il retrouve d'ailleurs la même image sur les termes "chauffeur" (en page 5) et sur "Laurier House" (en page 1), ce qui acrédite fortement l'hypothèse de prise en compte de la légende. Conclusions : - Google tient compte de la proximité du texte avec l'image : les autres images ne figurent pas dans les résultats et cette image n'est pas retouvée sur les termes des autres légendes d'image. Cette notion de "proximité" n'est pas aussi évidente pour une machine qu'elle peut l'être pour un humain. - Il sait faire l'équivalence entre les termes de différentes langues (ce qui semble pourtant plus complexe que de considérer l'équivalence de "voiture" et "voitures" ! ) - Malgré les conditions un peu "limites" de ce cas de figure, les concepteurs de ce système sont assez sûrs d'eux pour faire figurer un résultat obtenu de cette façon sur la première page. Tout ça n'est donc ni trés clair, ni simple, ni évident. Evidemment, il arrive à Google de présenter des résultats débiles, mais dans l'ensemble, ça tient sacrément la route et, je me répète, ça témoigne d'une belle maîtrise de l'analyse de contenu... qui reste évidemment un peu mystérieuse quand on creuse la question. Il ne s'agit ici que d'un exemple. Je ne vais pas écrire un livre sur ce thème mais j'ai pu constater à maintes reprises que sa façon de procéder n'a rien de simple ou simpliste. Le fait que le problème singulier/pluriel ne soit pas ou peu géré (car il l'est parfois) est sans doute lié à certaines difficultés dont nous n'avons même pas idée. Je n'en déduis pas pour autant que les techniques de Google manquent de sophistication ou de puissance.
thick Posté 23 Juin 2005 Posté 23 Juin 2005 Anonymus a lancé une perche, mais personne ne la saisit. En fait, pour rester simpliste, il me semble que Google se débrouille pas mal, mais tant qu'il ne comprendra pas ce qu'il lit ou ce qu'il affiche ça restera basique. Le programme Adsense utilise déjà la sémantique appliquée (même s'il y a des ratées) et des moteurs expérimentaux comme Exalead nous font une belle démonstration. Je ne sais pas pouquoi un moteur majeur ne se lance pas dans l'aventure dès à présent (le coût sans doute), mais, à mon humble avis, c'est dans cette voie que la recherche d'information doit évoluer.
Dudu Posté 24 Juin 2005 Posté 24 Juin 2005 zapman: je m'incline Cela dit, on peut aussi imaginer une pluie de backlins avec le terme "voiture". Nulle part sur la page de whitehouse.gov ne sont mentionnés les termes "miserable" et "failure", et pourtant.. (j'essaie de sauver la face )
Dudu Posté 26 Juin 2005 Posté 26 Juin 2005 Ta réponse m'invite à un tout petit off-topic Très étrange que de grosses entités (l'Elysée, la Maison Blanche, diverses firmes commerciales, etc.) aient fait l'objet de googlebombings tout à fait opérationnels, tandis que le coup du 'navigateur obsolète' n'a finalement jamais pri Le seul cas dans lequel çà marche, c'est en précisant "site:www.microsoft.com" (super!) Que ce soit sur Google, Yahoo, ... ou MSN () Quelques billets suffisent à éviter l'affront ?
Sujets conseillés
Veuillez vous connecter pour commenter
Vous pourrez laisser un commentaire après vous êtes connecté.
Connectez-vous maintenant