NotebookLM Audio Overview : créer un podcast à partir d’un PDF en français



500 000 mots de transcriptions orales de la NASA chargées dans NotebookLM Audio Overview, un seul prompt d’une ligne, et dix heures de recherche manuelle qui deviennent vingt secondes d’analyse vocale. C’est ce qu’obtient régulièrement Steven Johnson, directeur produit de NotebookLM chez Google. Cinq millions d’utilisateurs actifs par mois en avril 2026 utilisent désormais cette fonction Audio Overview pour transformer leurs PDF, articles ou transcriptions en podcasts à écouter dans les transports. Ce guide explique pas à pas comment générer votre premier Audio Overview en français, comment le personnaliser, et comment éviter les trois pièges classiques.
Cet article est un tutoriel ciblé sur la fonction Audio Overview. Pour la vue d’ensemble de l’outil avec ses neuf modules Studio (Mind Map, Quiz, Slides…), voir notre guide complet NotebookLM (C3-2). Pour le contexte stratégique de l’écosystème Google AI, voir le guide Google Gemini (C3-pilier) et le comparatif des plans Gemini (C3-1).
En bref
- Audio Overview transforme vos sources NotebookLM en podcast de deux voix IA (ou une seule selon le format).
- Quatre formats disponibles : Deep Dive (par défaut, 15-20 min), Brief (1-2 min), Critique (revue critique), Debate (débat contradictoire).
- Disponible en français depuis avril 2025, dans plus de 80 langues. Workflow de génération identique à l’anglais.
- Génération gratuite : 3 Audio Overviews par jour en plan Standard, 20 par jour en plan Pro.
- Limitation 2026 : les variations de longueur (Shorter / Longer) ne sont disponibles qu’en anglais. En français, vous obtenez la longueur Default.
- Pour transformer votre bibliothèque pédagogique en série de podcasts utilisables en formation, voir notre parcours pratique de production de supports IA en français.
L’Audio Overview est la fonction qui a fait connaître NotebookLM au grand public. Lancée en septembre 2024 en anglais sous le nom commercial Deep Dive, elle génère une conversation audio entre deux voix IA qui discutent du contenu que vous avez fourni. Le résultat ressemble à un podcast : intonations naturelles, relances, exemples, transitions. Sauf que le contenu provient strictement de vos sources, pas des connaissances générales de l’IA.
Deux changements majeurs ont eu lieu courant 2025 et début 2026.
Élargissement aux langues. L’Audio Overview est disponible en français depuis le 29 avril 2025 selon le blog Google France, puis étendu à plus de 80 langues en septembre 2025. Les voix françaises sont synthétiques mais l’articulation et l’intonation rivalisent avec une production humaine sur des écoutes courtes.
Multiplication des formats. À partir de fin 2025, Google a ajouté trois formats supplémentaires au Deep Dive d’origine : Brief (1 à 2 minutes), Critique (revue critique) et Debate (débat contradictoire). Un cinquième format Lecture (cours magistral de 30 minutes par une voix unique) est en test depuis décembre 2025 selon Times of AI et n’a pas encore été déployé publiquement à la date de cet article.
Voici le détail des quatre formats officiels selon la documentation Google support :
| Format | Durée | Voix | Cas d’usage |
|---|---|---|---|
| Deep Dive (par défaut) | 15-20 min | 2 voix qui dialoguent | Découvrir un sujet à fond, écoute en transports |
| Brief | 1-2 min | 1 voix unique | Pitch ou rappel express |
| Critique | 5-10 min | 2 voix critiques | Revue d’un essai, d’un livre blanc, d’un document de design |
| Debate | 8-12 min | 2 voix opposées | Faire émerger les contre-arguments d’une thèse |
Le workflow officiel Google se déroule entièrement dans le panneau Studio, à droite de l’interface notebooklm.google.com. Une condition : vous devez avoir un accès en édition au notebook (vous êtes le propriétaire ou un collaborateur en édition).
svgCréez un notebook ou ouvrez un existant. Cliquez sur Ajouter des sources en haut à gauche. NotebookLM accepte PDF, Google Docs, Google Slides, fichiers audio (MP3, WAV), vidéos YouTube via leur URL, pages web via leur URL, et fichiers texte ou Markdown. Pour un premier Audio Overview, deux à cinq sources bien ciblées valent mieux qu’une vingtaine de documents disparates.
Dans le panneau Studio à droite, cliquez sur Audio Overview. Une fenêtre de génération apparaît avec un sélecteur de format. Par défaut, c’est Deep Dive. Pour les autres formats, cliquez sur le menu déroulant.
Cliquez sur le sélecteur de langue et choisissez Français. À la date de cet article, selon le blog Google France, 80 langues sont disponibles dont le français. La langue choisie influence la voix des hôtes IA.
Trois options apparaissent : Shorter, Default, Longer. Attention : selon la documentation officielle Google, les variations de longueur ne sont disponibles qu’en anglais. En français et dans les autres langues, seule l’option Default est active. C’est l’une des trois limites pratiques à intégrer à vos workflows.
C’est l’étape qui sépare un Audio Overview correct d’un Audio Overview vraiment utile. Le champ Customize accepte un prompt en langage naturel. Vous y précisez le public, l’angle, le niveau d’expertise attendu, les sections à mettre en avant. Voir la section suivante pour quatre exemples copier-coller.
Si votre notebook contient dix sources mais que l’Audio Overview ne doit en couvrir que trois, décochez les sept autres dans le panneau de gauche. NotebookLM ne s’appuiera que sur les sources cochées au moment de la génération.
Cliquez sur Générer. La génération prend en général deux à cinq minutes, parfois plus pour un Deep Dive avec un gros corpus. Bonne nouvelle : la génération se fait en arrière-plan. Vous pouvez continuer à chater avec vos sources, générer d’autres éléments Studio, ou même naviguer sur d’autres onglets pendant que NotebookLM fabrique votre audio.
Une fois prête, l’écoute se lance directement depuis le panneau Studio. Vous pouvez ajuster la vitesse de lecture (x1, x1.25, x1.5, x2) via le bouton More. Donnez votre feedback avec les pouces haut ou bas (cela aide Google à améliorer la qualité, mais ne modifie pas l’audio en cours). Si le résultat ne convient pas, regénérez avec un prompt customize affiné. Pour voir le prompt système utilisé lors d’une génération, cliquez sur les trois points à côté de l’audio puis sur View custom prompt.
L’Audio Overview peut être partagé via un lien public ou téléchargé en MP3. L’app mobile iOS et Android permet de l’écouter en arrière-plan, hors connexion une fois téléchargé.
Le prompt customize est l’élément le plus sous-utilisé de l’Audio Overview. Voici quatre formulations testées en mission par nos formateurs, à adapter aux crochets.
Génère un résumé audio en français de format Deep Dive qui présente les concepts clés de [thème] comme si vous expliquiez à des [public cible : managers / RH / commerciaux / etc.] qui n’ont aucune connaissance préalable du sujet. Utilisez des analogies concrètes du monde du travail. Mettez en avant les trois points à retenir absolument et les deux pièges les plus fréquents. Ne pas mentionner les sources techniques par leur nom.
Générez un Audio Overview en français de format Brief (court) qui présente notre livre blanc [titre] sous l’angle des bénéfices business pour un dirigeant de PME. Citez deux chiffres clés et un cas concret. Concluez sur l’appel à l’action : « pour aller plus loin, téléchargez le livre blanc complet ». Ton dynamique, voix orientée vente sans agressivité.
Génère un Audio Overview en français de format Critique sur ces documents juridiques [PDF jurisprudence / projet de contrat / note interne]. Pointez les zones de risque, les clauses ambiguës et les écarts par rapport aux bonnes pratiques sectorielles. Restez factuel et précis. Citez les articles de loi ou les arrêts mentionnés dans les sources. Pas d’avis subjectif sans appui textuel.
Génère un Audio Overview en français de format Debate à partir de cette littérature [N papiers]. Les deux hôtes prennent des positions opposées : l’un défend la thèse principale du corpus, l’autre cherche les angles morts méthodologiques, les contre-études et les limites externes des résultats. Ton académique mais accessible. Concluez sur trois pistes de recherche complémentaires.
Pour aller plus loin sur le travail rédactionnel long en LLM généraliste, voir aussi nos prompts Claude pour la rédaction longue.
Le français de l’Audio Overview est de bonne facture, mais quelques réflexes améliorent encore le rendu, surtout sur des termes techniques anglais glissés dans des sources françaises.
Technique 1 : Forcer la prononciation des acronymes en français. Ajoutez à votre prompt customize : « Prononcer tous les acronymes en français : SEO se dit « esse-eu-o », IA se dit « i-a », RGPD se dit « erre-gé-pé-dé » ». Sans cette instruction, l’IA peut alterner entre prononciation anglaise et française.
Technique 2 : Donner un cadre de registre. Le français de NotebookLM bascule parfois en registre soutenu artificiel. Ajoutez : « Registre professionnel mais conversationnel, comme à l’oral devant des collègues, sans tournures académiques. Tutoiement entre les hôtes. »
Technique 3 : Tester avec Brief avant Deep Dive. Pour un nouveau corpus, lancez d’abord un Audio Overview au format Brief (1-2 min). Vous validez en deux minutes si la voix, l’angle et le niveau d’expertise vous conviennent. Vous regénérez ensuite en Deep Dive avec un prompt customize affiné. Économie de 15 minutes de génération et de quotas (chaque Audio Overview consomme un crédit jour).
Notre équipe utilise NotebookLM Audio Overview pour transformer chacun de nos modules de formation en podcast de 12 à 15 minutes. Workflow : importer le PDF du déroulé, importer 2 à 3 articles de référence sur le sujet, customize prompt « explique à des managers non spécialistes, mets en avant les 3 points à retenir et les pièges fréquents ». Format Deep Dive en français. Le podcast est ensuite envoyé aux apprenants une semaine avant la session pour ancrer les fondamentaux. Le détail des workflows formateurs sortira dans notre article NotebookLM pour les formateurs (C3-10), avec l’angle Qualiopi et financement OPCO.
Un livre blanc de 50 pages → un Audio Overview Brief (2 min) pour LinkedIn Audio + un Audio Overview Deep Dive (15 min) pour un podcast hébergé sur Spotify + une version Critique pour challenger en interne avant publication. Trois formats, un seul corpus, deux heures de travail au total au lieu de deux jours de production audio classique. Le détail des stratégies de découpe multi-formats relève aussi de notre guide NotebookLM complet.
Le cas est documenté par Steven Johnson, directeur produit NotebookLM. Charger un manuel + des slides de cours + des transcriptions de conférences sur un sujet. Customize prompt « format révisions d’examen, hiérarchise les notions essentielles, donne des mnémoniques pour chaque concept clé ». Écoute en mobilité dans les jours qui précèdent l’épreuve.
Trois limites doivent être intégrées dans vos workflows.
Quotas journaliers stricts. Le plan Standard gratuit permet 3 Audio Overviews par jour. Le plan AI Pro à 19,99 $/mois monte à 20 par jour. Au-delà, il faut soit attendre 24h (le compteur est sur fenêtre glissante, pas reset minuit), soit basculer sur un compte Ultra. Pour le détail des plans, voir notre comparatif Gemini gratuit, AI Pro et AI Ultra (C3-1).
Pas de variation de longueur hors anglais. Comme indiqué étape 2.1, Shorter et Longer sont réservés à l’anglais. En français, vous avez la longueur Default. Le seul levier reste le prompt customize : préciser « audio court de 5 minutes maximum » ou « audio long de 25 minutes ».
Voix figées par format. Vous ne choisissez pas la voix individuelle des hôtes. La paire de voix est définie par le format choisi et la langue. Une voix anglophone britannique est annoncée pour 2026 selon un post X officiel de décembre 2025, pas encore disponible à la date de cet article.
💡 À ne pas confondre avec un agent IA : NotebookLM Audio Overview génère un seul podcast à partir d’un seul jeu de sources, à votre demande explicite. Il ne planifie pas une série de podcasts, ne se déclenche pas tout seul, ne va pas chercher de nouvelles sources sur le web. Pour découvrir les agents IA autonomes (qui exécutent plusieurs étapes en chaîne sans intervention humaine), voir notre cocon Agents IA et la formation associée.
Oui, en plan Standard avec un quota de 3 générations par jour (Audio + Video Overview confondus). Le plan AI Pro à 19,99 $/mois monte à 20 par jour. Le plan Ultra démarre à 99,99 $/mois pour environ 50 par jour. Aucune option payante à l’unité.
Comptez 2 à 5 minutes pour un Deep Dive de 15-20 minutes en français à partir d’un corpus de 5 sources de taille moyenne. Plus le corpus est volumineux, plus la génération est longue. La génération tourne en arrière-plan, vous pouvez continuer à travailler.
Oui. Une fois la génération terminée, un bouton de téléchargement est disponible dans le panneau Studio. Le fichier est au format MP3 et peut être hébergé sur n’importe quelle plateforme de podcasting (Spotify, Apple Podcasts, hébergement interne).
Oui, ce sont des voix IA générées en temps réel. La qualité d’articulation est élevée mais reste imparfaite sur certains termes techniques anglais glissés dans un texte français. Les trois techniques de la section « accent français impeccable » corrigent l’essentiel des cas.
Chaque regénération consomme un crédit du quota journalier. Si vous avez 3 crédits gratuits par jour et que vous regénérez trois fois pour affiner le prompt, vous avez épuisé votre quota et devrez attendre 24h ou passer en plan payant.
Non. NotebookLM ne propose pas d’édition manuelle de l’audio. Si une partie ne convient pas, il faut regénérer avec un prompt customize affiné, ou monter l’audio dans un logiciel externe (Audacity, Adobe Audition) après téléchargement.
Pour découvrir un sujet à fond, Deep Dive. Pour un pitch ou un rappel rapide, Brief. Pour challenger un document avant publication, Critique. Pour faire émerger des contre-arguments à une thèse, Debate. En cas de doute, lancez d’abord un Brief pour valider l’angle, puis basculez en Deep Dive avec un prompt affiné.
L’Audio Overview est aujourd’hui le moyen le plus rapide de transformer un corpus écrit en support audio diffusable. Trois minutes de configuration, deux à cinq minutes de génération, et vous avez entre 1 et 20 minutes d’audio prêt à partager. La courbe d’apprentissage est de quelques générations seulement pour calibrer ses prompts customize. Pour un formateur, un communicant, un juriste ou un chercheur qui produit régulièrement du contenu, le retour sur investissement du plan gratuit est immédiat. L’enjeu suivant est l’industrialisation à l’échelle d’une organisation : c’est exactement le périmètre de notre accompagnement projet IA pour transformer une bibliothèque pédagogique en série de podcasts.

26 mai 2026
Intelligence Artificielle – IA


26 mai 2026
Intelligence Artificielle – IA


26 mai 2026
Intelligence Artificielle – IA

Laisser un commentaire