Google a lancé Gemini 2.0, son modèle d'intelligence artificielle générative le plus avancé à ce jour, marquant le passage de la recherche d'informations à une IA « agentique » orientée vers l'action des systèmes capables de penser, de planifier et d'agir au nom des utilisateurs. Sundar Pichai, directeur général de la société mère de Google, Alphabet, a déclaré que Gemini 2.0 est le « modèle d'IA le plus performant de l'entreprise à ce jour » et rapproche l'entreprise de son objectif de construire un « assistant universel ». Contrairement à son prédécesseur, Gemini 1.0, qui se concentrait sur l’organisation et la compréhension des informations, Gemini 2.0 introduit « l’IA agentique ». Les IA agentiques sont des systèmes capables de prendre des initiatives, de prendre des décisions et d'effectuer des actions au nom des utilisateurs, guidés par la contribution et la supervision humaines. Une IA agentique pourrait automatiquement réserver un hôtel, suggérer des activités, faire des réservations pour le dîner et fournir un planning, le tout en fonction des préférences passées des utilisateurs. « Au cours de l’année dernière, nous avons investi dans le développement de modèles plus agentsiques, ce qui signifie qu’ils peuvent mieux comprendre le monde qui vous entoure, réfléchir à plusieurs étapes à l’avance et agir en votre nom, sous votre supervision », a déclaré Pichai. Cette approche permet à l'IA de prendre des décisions, d'exécuter des instructions en plusieurs étapes et d'utiliser des outils tels que Google Search, Lens et Maps. Elle peut générer des sorties multimodales, telles que du texte, des images et de l'audio, et s'intégrer aux autres produits de l'entreprise comme Project Astra, un assistant IA universel, et Project Mariner, un gestionnaire de tâches basé sur un navigateur, a déclaré Google.
Des millions de développeurs utilisent désormais Gemini, aidant l'entreprise à améliorer ses produits : Search, YouTube, Android, Chrome, Google Play, Gmail et Google Maps, qui sont utilisés ensemble par environ 2 milliards d'utilisateurs dans le monde, a ajouté Pichai. Anciennement connu sous le nom de Bard, Gemini est conçu pour aider les utilisateurs dans diverses tâches, des interactions conversationnelles aux projets créatifs. Il s'appuie sur des technologies avancées d'apprentissage automatique et de traitement du langage naturel, ce qui en fait un concurrent direct de plateformes telles que ChatGPT d'OpenAI et Copilot de Microsoft. Ce mois-ci marque également un an depuis que Google a lancé son modèle d'IA Gemini 1.0 en décembre, en réponse directe à ChatGPT soutenu par Microsoft.
Mercredi, Google a également lancé une fonctionnalité appelée Deep Research, qui utilise des capacités de raisonnement avancées et de contexte long pour agir comme un assistant de recherche. Elle sera utile pour traiter des sujets complexes et rédiger de longs rapports pour le compte des utilisateurs, a déclaré Pichai. Sundar Pichai, directeur général de Google, a déclaré que Gemini 2.0 était le modèle d'IA le plus performant de l'entreprise à ce jour. Gemini 2.0 Flash, une version testable de Gemini 2, a été mise à disposition des développeurs il y a quelques semaines pour créer et tester des applications et recueillir les premiers retours. À partir de mercredi, les utilisateurs de Gemini du monde entier pourront accéder à une version de Flash 2.0 adaptée au chat en la sélectionnant dans le menu modèle des navigateurs de bureau et mobiles. Elle sera également bientôt disponible dans l'application mobile Gemini. Demis Hassabis, directeur général de Google DeepMind, un laboratoire de recherche en IA qui construit des systèmes capables de raisonner, d'apprendre et de résoudre des problèmes complexes, a déclaré que la société étendrait Gemini 2.0 à davantage de produits Google l'année prochaine. « Notre objectif est de mettre nos modèles entre les mains des gens de manière sûre et rapide », a-t-il ajouté. Dans un deuxième temps, l'entreprise intégrera Gemini 2.0 dans Google AI Overviews pour traiter des sujets plus complexes et des questions à plusieurs étapes, notamment des équations mathématiques avancées et du codage. Elle a commencé des tests limités cette semaine et le déploiera plus largement au début de l'année prochaine. Lancés en mai, les aperçus IA sont des résumés générés par l'IA qui apparaissent en haut des résultats de recherche, fournissant des informations supplémentaires sur des requêtes complexes.
