Icône En Bref

ChatGPT Search: OpenAI ouvre le modèle de recherche à LLM

Vous trouvez qu'on "ne trouve plus rien avec Google" ? Laissez ChatGPT chercher à votre place !

Il y a un peu plus de trois mois, OpenAI présentait son "prototype temporaire" de système de recherche dopé au LLM, SearchGPT. Depuis, de l'eau a coulé sous les ponts et pendant ce temps, la firme désormais valorisée à 157 milliards de dollars a pu affiner son modèle... et au passage lui trouver un nouveau petit nom, puisqu'on parlera désormais de "ChatGPT Search", sans doute pour mieux profiter de l'immense popularité dont jouit la marque "ChatGPT". Désormais considéré comme suffisamment mature, il s'apprête donc à rejoindre la famille ChatGPT et devient disponible de manière permanente, comme l'a annoncé OpenAI le 31 octobre dernier.

Une limite importante toutefois : ChatGPT Search n'est pas (encore) accessible aux utilisateurs gratuits ; il est réservé à ceux qui payent via ChatGPT Team ou ChatGPT Plus, ainsi qu'aux personnes inscrits à la liste d'attente pour tester SearchGPT. Viendront ensuite dans les prochaines semaines les abonnés Entreprise et Edu. Les utilisateurs gratuits devront patienter un peu, probablement jusqu'à 2025, puisqu'OpenAI prévoit un déploiement pour ces derniers "dans les mois à venir".

Mais au fait, qu'est-ce que ce ChatGPT Search ? Contrairement à ce que l'on peut penser, ce n'est pas un simple LLM qui génère du contenu en fonction de ce qu'il a appris en crawlant le web. En fait, ChatGPT Search ne se base pas sur son propre apprentissage des faits. Ce qu'il a appris, c'est à faire une recherche web et à synthétiser les informations qu'il a tiré des premiers liens rencontrés, comme le fait déjà Bing Search avec Copilot, mais de manière probablement un peu plus poussée.

Cela a l'avantage de réduire fortement les hallucinations et la tendance à raconter d'immenses bobards à base de liens et données imaginaires avec un aplomb stupéfiant, puisque les informations proviennent presque directement d'une recherche effectuée en temps réel suite à votre demande. Mais attention, cela ne veut pas dire que le résultat sera parfait et qu'il faudra lui faire confiance aveugle. Car en matière de synthétisation des données, les LLM n'ont pas vraiment prouvé leur excellence.  En effet, une étude menée par l'Australian Securities and Investments Commission et publiée en mai dernier a constaté que, pour les tâches de résumé et de synthétisation des données, les LLM faisaient nettement moins bien qu'un humain, avec une tendance à passer à côté d'informations importantes, à manquer de nuance et à produire des résumés très (trop) génériques.

Une étude à relativiser toutefois puisqu'elle est basée sur LLaMa2-70B, un modèle aujourd'hui largement dépassé. Reste que lorsque l'on s'essaye à une recherche assistée par IA encore aujourd'hui via Bing avec Copilot par exemple, les résultats ne sont pas forcément d'un très grand intérêt : l'IA prend les premiers résultats trouvés dans le moteur de recherche et fait un résumé rapide de leur contenu, souvent en se basant sur le titre ou le début de la page... en pratique, la valeur ajoutée se limite souvent à reformuler la question pour le moteur de recherche. Pour le reste, vous ferez souvent tout aussi bien, et aussi vite ou presque, en cherchant vous-même.

ChatGPT Search ne s'annonce donc pas comme une technologie miracle, mais nul doute qu'elle saura trouver son public chez ceux qui ont du mal à manier les moteurs de recherche avec aisance, se plaignent de ne jamais trouver réponse à leur question dans Google, ou apprécient de pouvoir dialoguer avec leur moteur de recherche. Cerise sur le gâteau, via ses partenariats avec diverts organes de presse, ChatGPT Search a accès à un certain nombre d'articles placés derrière un paywall et permettra donc d'obtenir des résultats, ou du moins des résumés de résultats, auquel vous n'auriez pas pu accéder en temps normal à moins d'être abonné au journal.

Restent deux questions :

  • ChatGPT Search faisant ses recherches dans l'index de Bing, les résultats seront-ils à la hauteur d'un Google, dont l'index reste à ce jour sans rival ?
  • Le modèle d'OpenAI saura-t-elle éviter l'écueil observé via Google Gemini, qui ressort sans l'once d'un recul critique des réponses trolls ou erronées glanées sur des sites comme reddit, avec lequel OpenAI a justement conclu un partenariat ?

Réponse, sans doute, dans quelques mois, le temps d'avoir un peu de recul sur cette nouvelle technologie.

Écrit le :

Par :

everydai