(Photo: 123RF)
Un texte de Christian Beltrami, consultant en créativité assistée par IA qui a travaillé avec Lewis Hamilton et Lang Lang, entre autres. Il est concepteur du balado de fiction «Hors Champ» sur Ohdio
COURRIER DES LECTEURS. Imaginez tenter de transposer l'essence même d'un entrepreneur en code informatique le temps d'un week-end. C'est précisément ce que Yohei Nakajima a accompli. En commençant par définir un objectif, établir une liste de tâches, puis en exécutant et priorisant continuellement ces tâches, son prototype a commencé à reproduire le processus de réflexion stratégique d'un fondateur. Lorsqu'il lui a donné l'instruction de lancer une start-up de santé mobile, le programme IA s'est plongé dans une exploration approfondie, élaborant des modèles d'affaires, des stratégies de recrutement et des recherches sur les concurrents. Une vidéo présentant cette IA à l'œuvre, nommée Baby-AGI, est devenue virale, récoltant un million d'impressions et suscitant la curiosité quant à ses capacités. Fait remarquable, la base de ce programme qui émule en quelque sorte un homme d’affaires n'était que de 105 lignes de code.
Un agent en intelligence artificielle (IA) est un logiciel exploitant les modèles de langage (tel GPT-4) afin d'atteindre un objectif via l'élaboration d'un plan et en dirigeant sa mise en œuvre. Selon un article récent du New York Times, de nombreux chercheurs estiment que ces agents pourraient devenir bien plus sophistiqués et remplacer la grande majorité des employés de bureau.
Tout comme Yohei Nakajim, une équipe chez Nvidia a rapidement réalisé que la technologie derrière ChatGPT pouvait accomplir beaucoup plus. Elle a lancé son propre agent, Voyager, dans l’univers de Minecraft et celui-ci «a appris à nager, à cueillir des plantes, à chasser le cochon, à extraire de l'or et à construire des maisons.»
Flairant le potentiel commercial, la start-up Imbue a pris le relais en créant Avalon, un Minecraft open source «sur stéroïde» puisque 100 fois plus rapide, conçu avec l’objectif d’orienter la recherche vers les capacités de planification et de prise de décision. Ceci a mené à une exploration dans des environnements réels tels que les ordinateurs personnels ou les éditeurs de code. C’est que selon les chercheurs d’Imbue, inspirés par la révolution informatique du Xerox PARC, le potentiel de nos outils de travail n'est pas pleinement exploité. Nos interactions quotidiennes avec ces machines sont souvent répétitives, faisant de l'ordinateur un obstacle plutôt qu'un allié. D'où l’intérêt pour les agents IA, capables de nous comprendre et de nous assister dans le monde numérique, car ils peuvent également générer du code informatique.
«Le mot le plus important ici est "code"», a déclaré le Dr Fan de Nvidia au Times. «Car le code peut agir.» Les agents IA utilisent des applications et des sites web en accédant à des API, qui sont un ensemble de règles permettant la communication avec d'autres services en ligne. Ou d’autres agents IA…. En effet, ces derniers peuvent interagir comme une équipe (ou comme une famille selon Imbue), certains étant optimisés pour poser des questions tandis que d'autres évaluent les situations.
L’entrepreneur Jason Zhou illustre sur sa chaîne YouTube cette collaboration par un exemple concret: une interaction entre un directeur marketing et un PDG. Les deux, incarnés par des agents IA, brainstorment des idées pour une campagne. Après une série d'échanges, une idée est sélectionnée: un quiz interactif destiné à tester les connaissances des utilisateurs sur le développement de produits IA. Cette idée est ensuite transmise à un autre agent spécialisé pour la création de publications sur les réseaux sociaux.
Nous nous dirigeons vers une transformation radicale de notre paysage professionnel. Ces agents, combinant autonomie, flexibilité et capacité à collaborer, offrent une vision d'un futur où les équipes ne sont plus uniquement humaines. Les multiagents IA permettent de s'imaginer de nouveaux modes de fonctionnement, d'innovation et de concurrence des entreprises.
Et cette innovation disruptive ne cesse de surprendre. L’équipe Nvidia a trouvé une application tout aussi impressionnante aux agents IA: entraîner les robots.
L’agent IA Eureka élabore des codes logiciels pour renforcer l'apprentissage des robots sans avoir besoin de consignes spécifiques ou de modèles prédéfinis. Il résume les données clés des résultats de formation et guide le modèle de langage pour améliorer la génération de fonctions de récompense, permettant ainsi à l'IA de s'améliorer elle-même.
Les codes d’Eureka surpassent ceux rédigés par des experts humains dans plus de 80% des tâches, résultant en une amélioration de performance de plus de 50% pour les robots. Il a ainsi formé une main robotique à réaliser des tours de rotation rapide de stylo, équivalant pour la première fois à la compétence humaine.
Les agents IA seront bientôt omniprésents, interagissant avec nous dans chaque dimension de notre quotidien. L’annonce d’OpenAI cette semaine démontre à quel point ce futur est ici, aujourd’hui, et accessible à tous.
Il est en effet maintenant possible de se créer des assistants IA personnalisés directement dans l'application ChatGPT pour vos tâches spécifiques sans écrire la moindre ligne de code. Fournissez des données sur mesure et de la documentation pertinente, entraînez-le à exceller dans certaines tâches et il ne vous reste qu’à choisir le type d’assistant que vous souhaitez: un consultant spécialisé en négociation de contrats dans le domaine de la construction, un coach d’écriture expert sur un sujet précis vous accompagnant à chaque étape vers la publication de votre prochain livre ou simplement un assistant culinaire connaissant toutes les préférences alimentaires de votre famille.
Ces GPTs ne sont pas sans failles, car ils inventent/hallucinent parfois des faits. Mais ils demeurent très puissants et utiles, car spécialisés dans la résolution de problèmes spécifiques. Ces assistants ne constituent pas encore des agents autonomes. Mais lors de leur introduction, OpenAI a clairement indiqué que ce n'était que le début et que ces assistants allaient pouvoir interagir dans notre monde, devenant ainsi des agents.
Il est facile d’imaginer les risques, surtout si l’on prend en compte que Nvidia prédit que les modèles d'IA seront UN MILLION DE FOIS PLUS puissants que ChatGPT d’ici 10 ans… Ilya Sutskever, le chef scientifique d'OpenAI, affirme « qu’il est difficile pour l’intelligence humaine de comprendre ce que cela signifie réellement. »