Les assistants virtuels ont mis plus d’une décennie pour devenir indispensables. Mais ils ont été gênés par une conception maladroite et des erreurs de calcul, laissant la place aux chatbots pour se développer.
Un mardi pluvieux à San Francisco, les dirigeants d’Apple sont montés sur scène dans un auditorium bondé pour dévoiler l’iPhone de cinquième génération. Le téléphone, qui semblait identique à la version précédente, comportait une nouvelle fonctionnalité dont le public s’est rapidement fait l’écho : Siri, un assistant virtuel.
Scott Forstall, alors responsable des logiciels d’Apple, a appuyé sur un bouton de l’iPhone pour invoquer Siri et l’a poussé avec des questions. À sa demande, Siri a vérifié l’heure à Paris (« 20h16 », a répondu Siri), a défini le mot « mitose » (« Division cellulaire dans laquelle le noyau se divise en noyaux contenant le même nombre de chromosomes », a-t-il déclaré) et a dressé une liste de 14 restaurants grecs très bien notés, dont cinq à Palo Alto, en Californie.
« J’ai été dans l’A.I. domaine depuis longtemps, et cela me souffle encore », a déclaré M. Forstall.
C’était il y a 12 ans. Depuis lors, les gens sont loin d’être époustouflés par Siri et les assistants concurrents alimentés par l’intelligence artificielle, comme Alexa d’Amazon et Google Assistant. La technologie est restée en grande partie stagnante et les assistants parlants sont devenus la cible de blagues, notamment dans un sketch «Saturday Night Live» de 2018 mettant en vedette un haut-parleur intelligent pour les personnes âgées.
Le monde de la technologie jaillit désormais d’un autre type d’assistant virtuel : les chatbots. Ces bots alimentés par l’IA, tels que ChatGPT et le nouveau ChatGPT Plus de la société de San Francisco OpenAI, peuvent improviser des réponses aux questions tapées dans une boîte de discussion avec empressement. Les gens ont utilisé ChatGPT pour gérer des tâches complexes comme le codage de logiciels, la rédaction de propositions commerciales et l’écriture de fiction.
Et ChatGPT, qui utilise A.I. deviner quel mot vient ensuite, s’améliore rapidement. Il y a quelques mois, il ne pouvait pas écrire un véritable haïku ; maintenant, il peut le faire avec brio. Mardi, OpenAI a dévoilé sa nouvelle génération A.I. moteur, GPT-4, qui alimente ChatGPT.
L’excitation suscitée par les chatbots illustre comment Siri, Alexa et d’autres assistants vocaux – qui suscitaient autrefois un enthousiasme similaire – ont gaspillé leur avance dans l’I.A. course.
Au cours de la dernière décennie, les produits ont rencontré des obstacles. Siri a rencontré des obstacles technologiques, y compris un code maladroit qui a mis des semaines à se mettre à jour avec les fonctionnalités de base, a déclaré John Burkey, un ancien ingénieur d’Apple qui a travaillé sur l’assistant. Amazon et Google ont mal calculé la manière dont les assistants vocaux seraient utilisés, ce qui les a amenés à investir dans des domaines dotés d’une technologie rarement rentable, ont déclaré d’anciens employés. Lorsque ces expériences ont échoué, l’enthousiasme pour la technologie a diminué dans les entreprises, ont-ils déclaré.
Les assistants vocaux sont « stupides comme un roc », a déclaré Satya Nadella, directeur général de Microsoft, dans une interview ce mois-ci avec le Financial Times, déclarant que la nouvelle A.I. ouvrirait la voie. Microsoft a travaillé en étroite collaboration avec OpenAI, investissant 13 milliards de dollars dans la start-up et intégrant sa technologie dans le moteur de recherche Bing, ainsi que dans d’autres produits.
Apple a refusé de commenter Siri. Google a déclaré qu’il s’était engagé à fournir un excellent assistant virtuel pour aider les gens sur leur téléphone et à l’intérieur de leur maison et de leur voiture ; la société teste séparément un chatbot appelé Bard. Amazon a déclaré avoir constaté une augmentation de 30% de l’engagement des clients dans le monde avec Alexa au cours de l’année dernière et qu’il était optimiste quant à sa mission de créer une intelligence artificielle de classe mondiale.
Les assistants et les chatbots sont basés sur différentes saveurs d’I.A. Les chatbots sont alimentés par ce que l’on appelle de grands modèles de langage, qui sont des systèmes formés pour reconnaître et générer du texte basé sur d’énormes ensembles de données extraits du Web. Ils peuvent alors suggérer des mots pour compléter une phrase.
En revanche, Siri, Alexa et Google Assistant sont essentiellement ce que l’on appelle des systèmes de commande et de contrôle. Ceux-ci peuvent comprendre une liste finie de questions et de demandes comme « Quel temps fait-il à New York ? » ou « Allumez les lumières de la chambre ». Si un utilisateur demande à l’assistant virtuel de faire quelque chose qui n’est pas dans son code, le bot dit simplement qu’il ne peut pas aider.
Siri avait également une conception encombrante qui rendait l’ajout de nouvelles fonctionnalités fastidieux, a déclaré M. Burkey, qui s’est vu confier la tâche d’améliorer Siri en 2014. La base de données de Siri contient une gigantesque liste de mots, y compris les noms d’artistes musicaux et de lieux. comme des restaurants, dans près de deux douzaines de langues.
Cela en a fait «une grosse boule de neige», a-t-il déclaré. Si quelqu’un voulait ajouter un mot à la base de données de Siri, il a ajouté, « il va dans une grosse pile. »
Ainsi, des mises à jour apparemment simples, comme l’ajout de nouvelles phrases à l’ensemble de données, nécessiteraient la reconstruction de l’intégralité de la base de données, ce qui pourrait prendre jusqu’à six semaines, a déclaré M. Burkey. L’ajout de fonctionnalités plus complexes comme de nouveaux outils de recherche pourrait prendre près d’un an. Cela signifiait qu’il n’y avait aucun moyen pour Siri de devenir un assistant créatif comme ChatGPT, a-t-il déclaré.
Alexa et Google Assistant s’appuyaient sur une technologie similaire à celle de Siri, mais les entreprises avaient du mal à générer des revenus significatifs avec les assistants, ont déclaré d’anciens responsables d’Amazon et de Google. (En revanche, Apple a utilisé avec succès Siri pour attirer les acheteurs vers ses iPhones.)
Après qu’Amazon a lancé l’Echo, un haut-parleur intelligent alimenté par Alexa, en 2014, la société espérait que le produit l’aiderait à augmenter les ventes de sa boutique en ligne en permettant aux consommateurs de parler à Alexa pour passer des commandes, a déclaré un ancien dirigeant d’Amazon impliqué avec Alexa. Mais alors que les gens s’amusaient à jouer avec la capacité d’Alexa à répondre aux invites météorologiques et à régler des alarmes, peu ont demandé à Alexa de commander des articles, a-t-il ajouté.
Amazon a peut-être surinvesti dans la fabrication de nouveaux types de matériel, comme les réveils et les micro-ondes désormais abandonnés qui fonctionnaient avec Alexa, qui se vendaient au prix coûtant ou en dessous, a déclaré l’ancien dirigeant.
La société a également sous-investi dans la création d’un écosystème permettant aux utilisateurs d’étendre facilement les capacités d’Alexa, comme Apple l’avait fait avec son App Store, ce qui a contribué à susciter l’intérêt pour l’iPhone, a déclaré la personne. Alors qu’Amazon proposait un magasin de « compétences » pour permettre à Alexa de contrôler des accessoires tiers comme des interrupteurs d’éclairage, il était difficile pour les gens de trouver et de configurer des compétences pour les haut-parleurs, contrairement à l’expérience sans friction du téléchargement d’applications mobiles à partir des magasins d’applications.
« Nous n’avons jamais eu ce moment App Store pour les assistants », a déclaré Carolina Milanesi, analyste des technologies grand public pour la société de recherche Creative Strategies, qui était consultante pour Amazon.
À la fin de l’année dernière, la division Amazon travaillant sur Alexa était une cible majeure des 18 000 licenciements de l’entreprise, et un certain nombre de hauts dirigeants d’Alexa ont quitté l’entreprise.
Kinley Pearsall, une porte-parole d’Amazon, a déclaré qu’Alexa était bien plus qu’un assistant vocal, et « nous sommes plus optimistes que jamais quant à cette mission ».
Les ratés d’Amazon avec Alexa ont peut-être égaré Google, a déclaré un ancien responsable qui travaillait sur Google Assistant. Les ingénieurs de Google ont passé des années à expérimenter son assistant pour imiter ce qu’Alexa pouvait faire, notamment en concevant des haut-parleurs intelligents et des écrans de tablette à commande vocale pour contrôler les accessoires domestiques tels que les thermostats et les interrupteurs d’éclairage. La société a ensuite intégré des publicités dans ces produits pour la maison, qui ne sont pas devenus une source majeure de revenus.
Au fil du temps, Google s’est rendu compte que la plupart des gens n’utilisaient l’assistant vocal que pour un nombre limité de tâches simples, telles que démarrer des minuteries et jouer de la musique, a déclaré l’ancien responsable. En 2020, lorsque Prabhakar Raghavan, un cadre de Google, a repris Google Assistant, son groupe a recentré le compagnon virtuel en tant que fonctionnalité phare pour les smartphones Android.
En janvier, lorsque la société mère de Google a licencié 12 000 employés, l’équipe travaillant sur les systèmes d’exploitation pour les appareils domestiques a perdu 16 % de ses ingénieurs.
De nombreuses grandes entreprises technologiques se précipitent maintenant pour proposer des réponses à ChatGPT. Au siège d’Apple le mois dernier, la société a tenu son rapport annuel sur l’I.A. Summit, un événement interne permettant aux employés de découvrir son grand modèle linguistique et d’autres technologies d’I.A. outils, ont déclaré deux personnes qui ont été informées du programme. De nombreux ingénieurs, y compris des membres de l’équipe Siri, ont testé chaque semaine des concepts générateurs de langage, ont déclaré les gens.
Mardi, Google a également annoncé qu’il publierait bientôt une IA générative. des outils pour aider les entreprises, les gouvernements et les développeurs de logiciels à créer des applications avec des chatbots intégrés et à intégrer la technologie sous-jacente dans leurs systèmes.
Dans le futur, les technologies des chatbots et des assistants vocaux vont converger, A.I. ont dit les experts. Cela signifie que les gens pourront contrôler les chatbots avec la parole, et ceux qui utilisent les produits Apple, Amazon et Google pourront demander aux assistants virtuels de les aider dans leur travail, pas seulement des tâches comme vérifier la météo.
« Ces produits n’ont jamais fonctionné dans le passé parce que nous n’avons jamais eu de capacités de dialogue au niveau humain », a déclaré Aravind Srinivas, fondateur de Perplexity, un A.I. start-up qui propose un moteur de recherche alimenté par chatbot. « Maintenant, nous le faisons. »
Source: www.nytimes.com/