Google présente Gemini 2.0, la nouvelle version de son IA qui lui permettra de développer des agents IA. Ces agents pourront prendre le contrôle de Google Chrome pour réaliser des actions à votre place, comme rechercher le contact d’une entreprise, ou rechercher un article à commander en ligne.
0 𝕏
© Vantage_DS / Shutterstock.com 𝕏
Gemini, l’IA générative de Google, ne cesse d’évoluer. Aujourd’hui, celle-ci rivalise déjà avec ChatGPT et est capable de comprendre de nombreux formats, en plus des textes, grâce à ses capacités multimodales. Mais la prochaine étape, dans le développement de Gemini, permettra à Google de proposer des “agents IA” qui permettront aux utilisateurs de Chrome de gagner encore plus de temps.
Dans un communiqué publié cette semaine, Google présente Gemini 2.0. Disponible en version test, celui-ci est encore en développement. Et l’une de ses principales nouveautés est qu’il permettra à la firme de proposer des agents IA qui seront capables de réaliser des actions sur internet à la place de l’utilisateur.
S’abonner à Presse-citron
En s’appuyant sur les nouvelles capacités de Gemini 2.0, Google a développé un prototype baptisé Mariner, qui est capable de prendre le contrôle de Google Chrome pour réaliser des actions en ligne pour l’utilisateur, dans le but de faire gagner du temps. Dans la vidéo ci-dessous, Google donne une liste d’entreprises à Mariner et demande à l’IA de rechercher les contacts de celles-ci. Mariner prend ensuite le contrôle de Google Chrome et effectue les recherches à la place de l’utilisateur pour, à la fin, produire la liste de contacts demandée. Pendant tout le processus, Mariner détaille en temps réel les actions qu’il effectue ainsi que son raisonnement.
Une autre vidéo postée par Google suggère que, grâce à l’agent IA, il sera possible de confier une recherche à Gemini, pour un type de produit spécifique, puis d’ajouter le produit recherché dans un site de e-commerce.
200% Deposit Bonus up to €3,000 180% First Deposit Bonus up to $20,000Mais pour le moment, il ne s’agit pas encore d’un produit fini. “Le projet Mariner est un prototype de recherche précoce construit avec Gemini 2.0 qui explore l’avenir de l’interaction homme-agent, en commençant par votre navigateur. En tant que prototype de recherche, il est capable de comprendre et de raisonner à travers les informations de l’écran de votre navigateur, y compris les pixels et les éléments web tels que le texte, le code, les images et les formulaires, puis d’utiliser ces informations via une extension Chrome expérimentale pour effectuer des tâches à votre place”, explique la firme.
Celle-ci admet néanmoins que, pour le moment, l’IA peut produire des résultats incorrects ou prendre trop de temps à réaliser certaines tâches. Mais Google est confiant que les performances de son IA s’amélioreront dans le temps. Pour le moment, le projet Mariner n’est proposé qu’à un groupe de testeurs, via une extension Chrome. Sinon, Google a aussi développé des agents similaires pour les développeurs pour automatiser des tâches dans le flux de travail des codeurs.
Google continue aussi de développer le projet Astra, qu’il a présenté lors de sa conférence I/O au mois de mai. Pour rappel, Astra est un assistant qui utilise la caméra d’un smartphone ou de lunettes connectées pour observer l’environnement de l’utilisateur et répondre à des questions liées à cet environnement. La nouvelle version de cet assistant s’appuie sur Gemini 2.0, ce qui permet d’améliorer les performances. Par exemple, grâce à Gemini 2.0, Astra améliore ses compétences linguistiques.
Le futur assistant peut aussi fonctionner de pair avec Google Search, Google Lens ou Google Maps, pour être encore plus utile. Et grâce aux performances de Gemini 2.0, celui-ci a également une plus faible latence. Google explique qu’il continue de développer Astra afin de proposer cet assistant visuel sur l’application mobile Gemini, et sur les lunettes connectées.
Pour le moment, on ne sait pas quand Google nous permettra d’utiliser ses agents IA. Et celui-ci n’indique pas quand le projet Astra sera disponible. En revanche, si vous voulez un avant-goût de la prochaine génération d’IA de la firme, vous pouvez commencer à utiliser Gemini 2.0 Flash dès aujourd’hui. Il suffit d’aller sur le chatbot de Google, et de sélectionner ce nouveau modèle.
“Outre la prise en charge des entrées multimodales telles que les images, la vidéo et l’audio, Flash 2.0 prend désormais en charge les sorties multimodales telles que les images générées en mode natif mélangées à du texte et à de l’audio multilingue orientable de type texte-parole (TTS). Il peut également appeler en mode natif des outils tels que Google Search, l’exécution de code ainsi que des fonctions tierces définies par l’utilisateur”, indique la firme.
M162.5 avis
[ ]
The 14-year-old targeted the Brussels mosque. MAXPPP - Leyla Vidal At just 14 years old,…
Selon Trump "si le prix du pétrole était plus bas, la guerre en Ukraine serait…
The 14-year-old targeted the Brussels mosque. MAXPPP - Leyla Vidal At just 14 years old,…
Selon Trump "si le prix du pétrole était plus bas, la guerre en Ukraine serait…
The coaches of Indiana and San Antonio humorously returned to the eventful bus journey between…
Les Biterrois, deuxièmes du classement, reçoivent Colomiers ce vendredi soir au stade Raoul-Barrière. Midi Libre…