Gemini Enterprise Agent Platform (ex-Vertex AI) : le guide de la plateforme agentique de Google Cloud



Si vous cherchez « Vertex AI Agent Builder », sachez d’abord une chose : le produit a changé de nom. Depuis Google Cloud Next 2026, Vertex AI est devenu Gemini Enterprise Agent Platform, une refonte qui regroupe sous un même toit tout ce qu’il faut pour construire, déployer, gouverner et optimiser des agents IA d’entreprise. Ce guide explique ce qu’est cette plateforme, comment elle s’organise, et pour quel profil d’équipe elle a du sens.
Il s’inscrit dans notre cluster sur les plateformes d’agents IA pour grandes entreprises. Nous traitons ici la plateforme managée de Google Cloud. Le framework de développement open source qui l’accompagne, le Google ADK, fait l’objet d’un article dédié au sein de notre cluster sur les frameworks, et le modèle Gemini lui-même est couvert dans notre guide complet de Gemini.
En bref
- Vertex AI a été renommé Gemini Enterprise Agent Platform par Google en avril 2026 ; les deux noms coexistent encore pendant la transition.
- La plateforme s’organise autour de quatre piliers : construire, mettre à l’échelle, gouverner, optimiser.
- Elle propose deux voies de construction : Agent Studio (low-code, visuel) pour prototyper, et le Google ADK (code-first) pour la production.
- Son catalogue Model Garden donne accès à plus de 200 modèles, dont Gemini, Claude et des modèles ouverts, sans verrouiller le choix.
- C’est une plateforme pour équipes techniques sur Google Cloud, avec une vraie profondeur d’observabilité et de gouvernance, au prix d’une dépendance à l’écosystème Google.
- Pour structurer un projet de déploiement, découvrez notre formation aux agents IA en entreprise.
Commençons par lever la confusion de nom, parce qu’elle est récente et source de malentendus. Vertex AI était la plateforme unifiée de Google Cloud pour le machine learning et l’IA générative. Le 22 avril 2026, à Google Cloud Next, Google l’a renommée Gemini Enterprise Agent Platform et l’a réorganisée autour de l’agentique.
La raison invoquée par Google est intéressante : Vertex AI avait été conçu pour l’ingénierie lourde des débuts de l’IA générative, quand il fallait surtout entraîner et déployer des modèles. Le problème de 2026 est différent : gérer des agents qui interagissent à travers plusieurs systèmes, souvent sans garde-fous de sécurité et de gouvernance. Le rebrand traduit ce déplacement, du « construire un modèle » au « gouverner une flotte d’agents ».
Concrètement, toute la puissance de Vertex AI reste là, sous un nouveau nom et une nouvelle organisation. Les anciens services ont été renommés : ce qu’on appelait Agent Engine devient Deployments, Vertex AI Search devient simplement Search. Pour une équipe qui connaissait Vertex AI, ce sont surtout les menus qui changent ; les briques techniques restent familières. Pendant la transition, garder « Vertex AI » en tête reste utile, car la documentation et les recherches mélangent encore les deux appellations.
L’architecture de Gemini Enterprise Agent Platform se résume en quatre verbes que Google met en avant : construire, mettre à l’échelle, gouverner, optimiser. Cette structure est la meilleure grille de lecture de la plateforme.
Le pilier construire fournit l’intelligence et la connectivité. C’est là qu’on retrouve les deux voies de développement, le catalogue de modèles, la bibliothèque d’agents préfabriqués (Agent Garden), les serveurs MCP et les moteurs de RAG. Le pilier mettre à l’échelle apporte le runtime managé, capable de faire tourner des agents qui maintiennent leur état pendant plusieurs jours, avec une mémoire persistante. Le pilier gouverner établit le contrôle centralisé : chaque agent a une identité traçable, l’accès aux outils est centralisé, et des politiques de sécurité s’appliquent, y compris aux agents venus de l’écosystème partenaire. Le pilier optimiser garantit la qualité par la simulation, l’évaluation et l’observabilité, avec la capacité de tracer visuellement le raisonnement de chaque agent et de déboguer les incidents.
La distinction la plus utile à comprendre pour une équipe est celle des deux voies de construction. Elles répondent à des profils différents.
Agent Studio est l’environnement low-code : un canevas visuel pour découvrir les modèles, travailler les prompts et concevoir des agents sans écrire de code. C’est l’outil du prototypage rapide, accessible à un product manager ou à un profil métier. Le Google ADK est le framework code-first, disponible en plusieurs langages, qui donne un contrôle fin sur le comportement de l’agent, l’usage des outils et l’orchestration multi-agent. Le schéma d’usage typique : on prototype dans Agent Studio, puis on bascule vers l’ADK pour la production.
Cette dualité est précisément la frontière entre cet article et notre guide du framework. Ici, nous parlons de la plateforme managée qui héberge, déploie et gouverne. Pour le détail du framework de développement lui-même, sa philosophie d’ouverture et ses langages, reportez-vous à notre article sur le Google ADK. Les deux se complètent : l’ADK est le kit, Gemini Enterprise Agent Platform est l’usine.
Au-delà de ces deux voies, la plateforme apporte une bibliothèque d’agents préfabriqués (Agent Garden), des modèles de cas d’usage courants, un registre de serveurs MCP managés (par exemple pour BigQuery ou pour des API transformées en serveurs MCP personnalisés), et des moteurs de RAG pour ancrer les réponses dans vos données. L’objectif affiché est de raccourcir le chemin du prototype à l’agent prêt pour la production.
Un point distingue la plateforme de Google de certains concurrents : Model Garden donne accès à plus de 200 modèles. On y trouve les modèles Gemini de Google, mais aussi Claude d’Anthropic (Opus, Sonnet et Haiku y sont des citoyens de première classe depuis Cloud Next 2026), Llama de Meta et les modèles ouverts Gemma. L’ADK étant agnostique au modèle, vous pouvez changer de modèle sans réécrire votre agent.
Cet argument d’ouverture est réel sur la surface, mais il mérite une nuance que nous développons dans notre analyse du framework Google : l’ouverture sur le choix du modèle coexiste avec une dépendance forte à l’infrastructure Google Cloud pour le reste. Vous pouvez varier les modèles, mais le runtime, la mémoire, la gouvernance et l’observabilité restent dans l’univers Google. C’est le compromis classique du bundle hyperscaler : un seul produit à intégrer au lieu de cinq, contre une dépendance accrue.
Gemini Enterprise Agent Platform vise une organisation précise : une entreprise déjà sur Google Cloud, avec des équipes techniques capables d’exploiter la profondeur de la plateforme. Le passage par l’ADK pour la production, l’intégration native à BigQuery pour les données, l’usage du runtime managé pour des agents de longue durée supposent une vraie maturité technique. Ce n’est pas une plateforme de premier agent pour une PME sans équipe data.
Pour une organisation sur Google Cloud, en revanche, la proposition est cohérente : un environnement de bout en bout, du prototype à la production gouvernée, avec un catalogue de modèles ouvert et une observabilité poussée. Pour une organisation qui n’est pas sur Google Cloud, l’effort d’adoption de tout l’écosystème change l’équation, exactement comme pour les autres plateformes enterprise. C’est le même raisonnement de fond que celui exposé dans notre guide comparatif des plateformes enterprise : la plateforme naturelle est celle de votre écosystème existant.
Pour une organisation européenne, deux éléments méritent attention. Côté gouvernance, la plateforme intègre des mécanismes pensés pour la flotte d’agents : identité par agent, registre centralisé des outils, passerelle d’application des politiques, et défense au moment de l’exécution. C’est une réponse directe au problème des agents qui agissent sans garde-fous, que nous décrivons dans notre check-list avant de créer un agent.
Côté souveraineté, Google Cloud propose des régions européennes, dont Paris, et des dispositifs de localisation des données ainsi qu’un addendum de traitement aligné sur le RGPD. La vigilance des autorités européennes sur les transferts vers les filiales américaines reste néanmoins un sujet à instruire, comme nous le notons dans notre guide de Gemini. Pour un projet en secteur régulé, ce point se traite en amont, pas après le déploiement.
Google met en avant l’échelle atteinte : plus de 6 000 milliards de tokens traités chaque mois par les modèles Gemini via l’ADK, et un fonds de 750 millions de dollars destiné à l’écosystème partenaire. Le positionnement assumé est celui du bundle complet face à des concurrents plus spécialisés : là où certains couvrent le runtime et la mémoire mais laissent la gouvernance à des tiers, Google parie sur un catalogue de modèles étendu, un runtime dédié, la mémoire, la sécurité et une place de marché réunis. C’est la force et le risque de l’approche : un produit unique à intégrer, contre une dépendance qui peut devenir excessive. Le vrai test sera la capacité du runtime à garder des coûts prévisibles sur les workflows de plusieurs jours, la catégorie la plus difficile à tarifer.
Tirer parti d’une plateforme de cette profondeur demande de comprendre l’architecture agentique, la distinction entre prototypage low-code et production code-first, et les enjeux de gouvernance et d’observabilité d’une flotte d’agents. Proactive Academy propose une formation aux agents IA et à leur déploiement en entreprise qui couvre la démarche du cadrage à la mise en production, transposable aux grandes plateformes du marché. La formation s’adapte à votre contexte, en intra ou en inter-entreprises, et est éligible aux financements OPCO.
Le produit existe, mais sous un nouveau nom : Gemini Enterprise Agent Platform, depuis Google Cloud Next en avril 2026. Les briques techniques de Vertex AI restent présentes, réorganisées autour de l’agentique, avec certains services renommés. Pendant la transition, les deux appellations coexistent dans la documentation et les recherches.
La plateforme est l’environnement managé de bout en bout : elle héberge, déploie, gouverne et observe les agents. Le Google ADK est le framework de développement code-first qui sert à construire les agents, utilisable y compris avec des modèles non-Google. On prototype souvent en Agent Studio (low-code), on développe les agents complexes en ADK, puis on les déploie sur la plateforme. Nous détaillons le framework dans notre article dédié au Google ADK.
Oui. Le catalogue Model Garden donne accès à plus de 200 modèles, dont Claude d’Anthropic, Llama de Meta et les modèles ouverts Gemma, en plus des Gemini de Google. Le framework étant agnostique au modèle, on peut changer de modèle sans réécrire l’agent. L’ouverture porte sur les modèles ; le reste de la pile (runtime, mémoire, gouvernance) reste dans l’écosystème Google Cloud.
En pratique, oui. La plateforme est profondément intégrée à Google Cloud (BigQuery, infrastructure, sécurité). Une organisation qui n’est pas sur Google Cloud devrait adopter l’écosystème, ce qui change l’équation économique. C’est le même constat que pour les autres plateformes enterprise : la plateforme naturelle est celle de votre socle existant.
Partiellement. Agent Studio, l’interface low-code, permet à des profils métier de prototyper des agents simples sans coder. Mais la valeur de la plateforme se révèle en production, via l’ADK, le runtime managé et l’intégration data, ce qui suppose une équipe technique. Pour un premier agent sans équipe data, des plateformes plus accessibles conviennent mieux, comme celles de notre panorama no-code.
Par trois mécanismes : une identité traçable attribuée à chaque agent, un registre centralisé qui contrôle l’accès aux outils, et une passerelle qui applique les politiques de sécurité, y compris aux agents issus de partenaires. S’y ajoutent des outils de simulation, d’évaluation et d’observabilité pour tracer le raisonnement et déboguer. C’est l’un des points forts de la plateforme face à des concurrents qui laissent la gouvernance à des tiers.
Gemini Enterprise Agent Platform, l’ex-Vertex AI, est la réponse de Google Cloud à la question de l’agentique enterprise : un environnement unifié qui couvre tout le cycle de vie, du prototype low-code à la production gouvernée, avec un catalogue de modèles ouvert et une observabilité de premier plan. Sa force est la profondeur et l’intégration ; sa limite est la dépendance à Google Cloud et la maturité technique qu’elle suppose. Comme pour toute plateforme enterprise, elle s’impose surtout si Google Cloud est déjà votre socle. Pour la situer face à Agentforce, Copilot Studio et watsonx, consultez notre guide comparatif des plateformes enterprise, et pour structurer votre montée en compétence, notre formation aux agents IA vous accompagne.
Laisser un commentaire