Patrick 'Zener' Brunet wrote:
Et si vous essayez d'affiner la recherche en ajoutant un mot-clé tel que
étude ou statistique, vous allez perdre tous les bons hits qui utiliseraient
un synonyme.
Les moteurs de recherche actuels étendent la recherche à des synonymes.
C'est pourquoi je proposais plus haut un autre système de classement.
Il faut bien comprendre que la recherche en mode plein texte ne fera pas
mieux tant que l'IA ne permettra pas de réellement modéliser la sémantique
du texte à indexer, avec un niveau de recul pour en comprendre la motivation
(voire un autre pour évaluer la qualité selon cet objectif deviné).
Ce qui, vu les masses de documents à indexer, n'est pas raisonnable dans un avenir "proche" (entendez par là dans les 3 ou 4 ans qui viennent, au minimum). On met plusieurs secondes à parser des phrases bien formées, et avec un taux d'erreur non négligeable, et sans même s'intéresser à la sémantique mais simplement à avoir une idée de l'organisation de la phrase. Parser une page web en entier prend raisonnablement au moins une minute (pour une page assez courte), imaginez la vitesse d'indexation du web que l'on pourrait avoir aujourd'hui dans un moteur de recherche qui ferait ça ?