Gemini Deep Research et Deep Research Max : automatiser une veille (app et API)



Une veille concurrentielle qui prenait une demi-journée se boucle aujourd’hui en cinq à dix minutes, sources citées comprises. C’est la promesse de Gemini Deep Research, l’agent de recherche autonome de Google qui planifie, cherche dans des dizaines à des centaines de sources, et produit un rapport structuré avec citations. Depuis le 21 avril 2026, cette capacité existe aussi via une API (l’Interactions API), avec deux agents distincts : un standard et un « Max » taillé pour les pipelines de veille à grande échelle. Ce guide explique comment utiliser Deep Research dans l’app, ce que change l’accès par API, les coûts réels par tâche, et où se situe la frontière avec un véritable agent IA autonome.
Cet article complète notre guide complet de Google Gemini (C3-pilier) et notre comparatif des plans Gemini (C3-1). Pour organiser vos sources de recherche en amont, voir Notebooks in Gemini (C3-5) et le guide NotebookLM (C3-2).
En bref
- Deep Research est l’agent de recherche autonome de Gemini : il planifie, navigue des dizaines à des centaines de sources, et produit un rapport multi-pages cité.
- Étape de planification : avant toute recherche, Deep Research propose un plan que vous pouvez modifier ou valider. C’est sa signature.
- Vitesse 2026 : 5 à 10 minutes par rapport (contre 15-20 min au lancement), 25+ langues, modèle Gemini 3.1 Pro.
- API depuis le 21 avril 2026 : deux agents via l’Interactions API. Le standard (~2 $/tâche, 80 recherches web) et Deep Research Max (~5 $/tâche, 160 recherches web).
- Limites par plan : 5 rapports/mois en gratuit, quotas étendus en AI Pro et Ultra. L’API est réservée aux tiers payants.
- Pour intégrer la veille IA dans vos process métier, voir notre parcours de formation à l’automatisation de la veille avec l’IA.
Introduit fin 2024 dans l’app Gemini, Deep Research est un agent de recherche qui mène des investigations autonomes sur de nombreuses sources pour produire des rapports cités. Comme le résume Singularity Moments, contrairement à un chatbot classique qui répond de mémoire, Deep Research cherche réellement sur le web (des dizaines à des centaines de sources), synthétise l’information, et produit un rapport structuré avec citations, comparable à ce qu’un chercheur humain produirait en plusieurs heures.
Sa caractéristique distinctive est l’étape de planification. Avant de lire la moindre source, Deep Research expose un plan de recherche (« je vais étudier X, puis Y, puis Z ») et vous demande de le confirmer ou de le modifier. Vous gardez le contrôle de la direction, l’IA fait le travail de fond.
Trois évolutions majeures depuis le lancement, documentées par Singularity Moments :
D’abord, la vitesse : les exécutions de 2026 se bouclent en 5 à 10 minutes, contre 15 à 20 minutes au lancement. Ensuite, le multilingue : production de rapports dans plus de 25 langues, avec récupération des sources dans la langue cible. Enfin, la qualité des sources : un filtrage amélioré privilégie les sources faisant autorité (sites gouvernementaux, académiques, publications établies) plutôt que le contenu de fermes à SEO.
Le moteur a aussi changé : Deep Research tourne désormais sur Gemini 3.1 Pro, un modèle de raisonnement étendu qui réfléchit en interne avant de produire sa sortie, ce qui améliore nettement la qualité de synthèse sur les sujets complexes.
Le workflow dans l’app Gemini, détaillé par le support officiel Gemini Apps, se déroule en quatre temps.
Étape 1 : le prompt et les sources. Saisissez votre sujet. Par défaut, Gemini inclut Google Search comme source. Selon votre plan, vous pouvez ajouter votre Gmail, votre Drive, des fichiers uploadés (PDF, images) et des notebooks NotebookLM. Point de vigilance du support officiel : la fonction n’est pas disponible si vous incluez des services Google Workspace comme Gmail et Drive comme source dans certaines configurations, à vérifier selon votre compte.
Étape 2 : le plan de recherche. Gemini génère un plan. Cliquez sur « Edit plan » pour l’ajuster avant de lancer, ou « Start research » pour valider tel quel.
Étape 3 : l’exécution autonome. Comptez 5 à 10 minutes, plus pour les sujets complexes. La recherche tourne en arrière-plan : vous pouvez quitter le chat, Gemini vous notifie quand le rapport est prêt (à côté du fil sur le web, par notification sur mobile).
Étape 4 : le rapport cité. Vous obtenez un rapport multi-pages structuré avec citations. Vous pouvez le transformer en visuels interactifs, quiz et autres formats dans Canvas. Avec un plan Google AI Ultra, les rapports peuvent inclure des animations, graphiques, diagrammes et simulateurs interactifs.
C’est la nouveauté structurante de 2026. Google a lancé une API développeur pour Deep Research le 21 avril 2026, via l’Interactions API (et non l’endpoint classique generate_content). Cette API permet d’appeler l’agent directement depuis votre code, pas seulement depuis les surfaces Google.
Selon Philipp Schmid, l’agent planifie, cherche et synthétise des tâches de recherche de long horizon de façon autonome, en s’exécutant en arrière-plan (mode asynchrone). Le workflow API reprend la logique de l’app : un mode collaborative_planning permet d’affiner le plan, puis un passage à collaborative_planning=False déclenche l’exécution du rapport. À noter, un piège documenté : il faut explicitement basculer ce drapeau sur la dernière étape, un simple « vas-y » ne déclenche pas la génération.
L’API supporte aussi les serveurs MCP (Model Context Protocol) pour brancher des sources de données privées, avec authentification no-auth, bearer token ou OAuth. C’est ce qui ouvre la porte aux pipelines de veille connectés à vos propres bases.
Deux agents ont été lancés le 21 avril 2026, d’après TokenCost :
| Critère | Deep Research standard | Deep Research Max |
|---|---|---|
| Identifiant | deep-research-preview-04-2026 | deep-research-max-preview-04-2026 |
| Recherches web | ~80 par tâche | ~160 par tâche |
| Tokens (entrée / sortie) | ~250K / 60K | ~900K / 80K |
| Durée | 5-15 min | Plus long, conçu pour le batch |
| Coût indicatif | ~2 $/tâche | ~5 $/tâche |
| Cible | Veille standard | Pipelines nocturnes, couverture maximale |
Les deux tournent sur Gemini 3.1 Pro, aux tarifs standards (2 $/1M tokens en entrée, 12 $/1M en sortie), sans surcoût sur la couche agent. Le grounding Google Search est activé par défaut, ce qui ajoute 1,12 à 2,24 $ de coût de recherche par tâche (80 à 160 requêtes à 14 $/1000). Le caching implicite couvre 50 à 70 % des tokens d’entrée, ce qui maintient l’inférence abordable dans la boucle agentique.
Sur le benchmark BrowseComp (capacité à trouver une information difficile à localiser par navigation web persistante), Gemini 3.1 Pro score 85,9 %, soit 1,9 point au-dessus de Claude Opus 4.6 (84,0 %) et nettement au-dessus de GPT-5.2 (65,8 %). Pour un agent de recherche dont toute la valeur est de trouver des choses sur le web, c’est un indicateur qui compte.
Selon Build Fast with AI, Deep Research Max vise clairement la finance institutionnelle : Google collabore avec FactSet, S&P Global et PitchBook pour l’intégration de données financières. Si vous construisez des pipelines nocturnes traitant des dizaines de rapports complexes par nuit, Max justifie son surcoût.
Côté app, d’après Suprmind et Felloai, les quotas en mai 2026 sont les suivants :
| Plan | Deep Research | Modèle pour rapports |
|---|---|---|
| Gratuit | 5 rapports/mois | Thinking |
| AI Plus (7,99 $) | Quota étendu | Thinking + Pro limité |
| AI Pro (19,99 $) | Quota généreux | Gemini 3.1 Pro (meilleure qualité) |
| AI Ultra (99,99 $+) | Quota maximal + visuels animés | Gemini 3.1 Pro + Deep Think |
Tous les plans incluent Deep Research, mais la qualité monte avec le plan : les utilisateurs AI Pro et Ultra génèrent des rapports avec Gemini 3.1 Pro pour une meilleure synthèse, et seul Ultra débloque les visuels animés. Pour le détail complet des plans, voir notre comparatif Gemini gratuit, AI Pro et AI Ultra (C3-1).
Côté API, point important : depuis le 1er avril 2026, Google a retiré tous les modèles Pro du tier gratuit. Deep Research par API est donc réservé aux tiers payants. Pour démarrer, il faut une clé API Gemini depuis Google AI Studio et le SDK Python google-genai.
Le cas d’école : « Recherche les produits qui concurrencent directement [Produit A], en comparant fonctionnalités, prix et sentiment utilisateur ». Deep Research navigue le web, produit un rapport structuré et cité, et l’import en un clic ajoute le rapport et toutes ses sources dans un notebook. Pour capitaliser dans la durée, combinez avec Notebooks in Gemini (C3-5) afin que la veille s’accumule dans un espace projet persistant.
Un cabinet ou un service conformité peut lancer une veille hebdomadaire sur l’évolution d’un cadre réglementaire (AI Act, RGPD, normes sectorielles), avec un filtrage qui privilégie les sources gouvernementales et académiques. Le rapport cité permet de remonter à la source officielle. Pour l’approche juridique en LLM généraliste, voir Claude pour juristes et avocats (C2-9).
C’est la cible explicite de Deep Research Max, avec les intégrations FactSet, S&P Global et PitchBook. Un analyste peut automatiser une note de marché quotidienne via l’API, en mode batch nocturne, avec couverture maximale de sources.
Uploadez vos PDF (rapports, livres blancs, documents internes), Deep Research les combine avec les données web publiques pour une analyse complète. Le résultat se transforme en quiz ou visuels dans Canvas. Cette logique rejoint celle de NotebookLM, détaillée dans notre guide NotebookLM (C3-2), mais Deep Research ajoute la couverture web temps réel.
Pour une organisation qui veut industrialiser, l’Interactions API avec serveurs MCP permet de brancher Deep Research sur vos bases internes et de programmer des rapports récurrents. C’est le passage de l’usage manuel ponctuel à la veille systématique intégrée aux process.
Deux points à intégrer avant un déploiement professionnel.
Sur la résidence et l’usage des données, les règles dépendent du plan : sur les surfaces grand public, l’hébergement n’est pas garanti en Europe ; pour les corpus sensibles, l’arbitrage doit être documenté avec votre DPO, comme pour l’ensemble de l’écosystème Google détaillé dans notre guide Gemini Google Workspace (C3-4).
Sur les limites pratiques : Deep Research reste un assistant de synthèse, pas une source d’autorité. Il faut vérifier les citations sur les sujets à fort enjeu, car même un filtrage amélioré des sources ne garantit pas l’exactitude de chaque affirmation. Le coût API monte vite en usage intensif (le grounding Search à lui seul ajoute 1 à 2 $ par tâche), ce qui impose un suivi budgétaire pour les pipelines à fort volume.
💡 Un cas limite intéressant : Deep Research est qualifié d’« agent » par Google, et c’est en partie justifié, puisqu’il planifie, exécute en plusieurs étapes et s’exécute en arrière-plan de façon autonome. Mais il reste cantonné à une tâche : produire un rapport de recherche. Il ne pilote pas votre messagerie, ne réserve rien, n’exécute pas d’actions transactionnelles sur d’autres applications. Les agents IA pleinement autonomes (qui agissent sur votre pile d’outils, enchaînent des actions transactionnelles et opèrent en continu comme Gemini Spark ou Gemini Agent) relèvent d’une autre catégorie. Pour comprendre cette distinction, voir notre cocon Agents IA et la formation associée.
Oui, dans une limite de 5 rapports par mois sur le plan gratuit, générés avec le modèle Thinking. Les plans AI Plus, Pro et Ultra étendent le quota et débloquent Gemini 3.1 Pro pour une meilleure qualité de synthèse. Seul Ultra ajoute les visuels animés dans les rapports. L’accès par API, lui, est réservé aux tiers payants depuis le 1er avril 2026.
En 2026, comptez 5 à 10 minutes pour un rapport standard, davantage pour les sujets complexes. C’est deux fois plus rapide qu’au lancement (15-20 minutes). La recherche tourne en arrière-plan : vous pouvez quitter le chat et recevoir une notification quand le rapport est prêt.
Le standard (deep-research-preview-04-2026) effectue environ 80 recherches web par tâche pour ~2 $. Le Max (deep-research-max-preview-04-2026) en fait environ 160 pour une couverture maximale, à ~5 $ par tâche. Max est conçu pour les pipelines nocturnes en mode batch et vise la finance institutionnelle (intégrations FactSet, S&P Global, PitchBook). Les deux passent par l’Interactions API et tournent sur Gemini 3.1 Pro.
Officiellement 1 à 3 $ par tâche pour le standard, mais ce chiffre est incomplet : le grounding Google Search (activé par défaut) ajoute à lui seul 1,12 à 2,24 $ par tâche selon le nombre de requêtes. En pratique, comptez environ 2 $ pour le standard et 5 $ pour le Max, sachant que le caching implicite couvre 50 à 70 % des tokens d’entrée.
Oui. Dans l’app, vous pouvez uploader des PDF et images, et ajouter des notebooks NotebookLM ainsi que (selon votre plan) Gmail et Drive comme sources, en complément de Google Search. Par API, les serveurs MCP permettent de brancher vos bases de données privées avec authentification.
Il accélère fortement la recherche, mais reste un assistant de synthèse. Le filtrage 2026 privilégie les sources faisant autorité (gouvernementales, académiques, publications établies), mais il faut vérifier les citations sur les sujets à fort enjeu avant de fonder une décision sur le rapport. Le contrôle humain reste indispensable.
En 2026, plus de 25 langues, avec récupération des sources dans la langue cible. Le français est pris en charge. Vous pouvez préciser la langue de sortie dans votre prompt.
Deep Research fait passer la veille d’une tâche manuelle de plusieurs heures à un rapport cité produit en quelques minutes. Dans l’app, son étape de planification garde l’humain aux commandes tout en automatisant le travail de fond. Par API depuis avril 2026, les agents standard et Max ouvrent l’industrialisation : pipelines de veille récurrents, branchement sur vos bases via MCP, couverture maximale pour la finance institutionnelle. Les angles morts restent la vérification des citations sur les sujets sensibles, le coût API en usage intensif, et le cadrage RGPD selon le plan. Comme toujours, l’outil ne remplace pas le jugement : il libère le temps de recherche pour le consacrer à l’analyse. C’est le périmètre de notre accompagnement à l’intégration de la veille IA dans les process métier.

28 mai 2026
Intelligence Artificielle – IA


28 mai 2026
Intelligence Artificielle – IA


28 mai 2026
Intelligence Artificielle – IA

Laisser un commentaire