Bataille des chatbots : comment GPT-4 se compare-t-il à Bard ?

Par

4 avril 2023

305

Nostress Media Ltd

OpenAI et Google, soutenus par Microsoft, ont tous deux lancé des chatbots basés sur l’intelligence artificielle ces dernières semaines. Leurs moteurs de conversation respectifs – ChatGPT Plus et Bard – diffèrent dans la façon dont ils répondent aux requêtes complexes, ingèrent du texte et proposent des réponses créatives.

Les chatbots sont formés pour générer leurs réponses à l’aide de données écrites provenant d’Internet, comme les millions de mots écrits sur des sites Web tels que Wikipedia, des livres et d’autres documents, pour prédire le mot suivant probable dans une phrase. Cela leur permet de donner des réponses étrangement plausibles qui imitent la parole humaine.

Nostress Media Ltd

OpenAI et Google ont été opaques sur la façon dont leurs modèles ont été construits. Cependant, il est probable que leurs données et objectifs de formation soient distincts.

Bard est formé spécifiquement pour s’engager dans un dialogue naturel, tandis que l’objectif de GPT-4 est de générer des réponses approfondies sur un large éventail de sujets. GPT-4 est également déconnecté d’Internet et n’a connaissance des événements que jusqu’en septembre 2021. Bard peut apparemment apporter des résultats de recherche Google, bien que cela ne semble pas améliorer la qualité de ses réponses.

Nous voulions tester davantage la capacité des chatbots, en les engageant sur des tâches qui se rapprochent de la créativité, du flair et de l’imagination. Voici les résultats – et comment les experts humains du Financial Times les ont évalués.

Bard ne nous a pas permis de saisir toute l’histoire d’un coup, il était donc naturellement désavantagé. C’était son résumé en prenant le texte de la première moitié de l’histoire de FT.

C’est un aperçu assez impressionnant [by GPT-4]. La seule erreur là-dedans est qu’il devrait y avoir 5 000 000 000 $ d’actifs « sous gestion » – mais cela n’était pas clair dans l’article original, donc c’est excusable.

La réponse de Bard, bien que précise, semble plus stéréotypée et guindée que la première. Il y a aussi une répétition du paragraphe d’introduction comme résumé.

L’IA peut-elle choisir le prochain gagnant du marché boursier ?
Nous avons transmis aux deux chatbots les règles du concours annuel de sélection de titres du FT. Les participants doivent choisir cinq actions du monde entier et prendre une position longue ou courte – en pariant que les actions augmenteront ou baisseront. Le gagnant est la personne qui génère le rendement global le plus élevé sur son portefeuille. Nous avons demandé aux bots de prédire pour 2023, mais GPT-4 a déclaré qu’il avait un seuil de connaissances de septembre 2021, tandis que le seuil de Bard est inconnu. Voici comment ils ont fait.

Robin Wigglesworth, rédacteur en chef d’Alphaville, écrit :

GPT-4 et Bard ont tous deux choisi des portefeuilles assez similaires : des actions technologiques en grande partie de premier ordre qui avaient déjà pour la plupart bien performé en septembre 2021 – présentant une tendance très humaine à sauter sur les gagnants.

Les deux ont choisi Tesla, Amazon et Microsoft. Bard a trahi un préjugé domestique en choisissant son fabricant Alphabet en plus d’Apple, tandis que GPT-4 s’est révélé comme un jockey dynamique en choisissant le chaud grésillant Nvidia et le fabricant de vaccins Covid-19 Moderna.

Les principaux résultats – un rendement de 74,4% en 2021 pour GPT-4 et 40,5% pour Bard – semblent donc bons. Mais si nous ne regardons que les résultats du moment où ils ont été cueillis et de la fin de l’année, leurs gains tombent à 16,3 % et 21,1 %, respectivement.

Robin Wigglesworth, rédacteur en chef d’Alphaville, écrit :

Source: www.ft.com

Nostress Media Ltd