Passer au contenu

Google lance en France son outil IA secret qui transforme vos documents en podcasts

L’intrigante application de prise de notes dopée à l’IA de Google s’améliore encore et peut désormais générer des podcasts à partir de vos documents. Cette fonctionnalité impressionnante de NotebookLM est maintenant disponible en français.

Google continue d’enrichir son écosystème d’intelligence artificielle en annonçant une nouveauté majeure pour son outil NotebookLM. La fonctionnalité Résumé audio (ou Audio Overviews en anglais) est à présent disponible en français et dans plus de 50 autres langues. Ce service permet de transformer n’importe quelle source de documents, qu’il s’agisse de vidéos, de PDF, de textes ou autres, en une conversation audio de type podcast.

Résumé audio : l’outil bluffant de Google est disponible en français

Déjà adoptée dans les pays anglophones, la fonction Résumé Audio se distingue dans NotebookLM par sa capacité à créer des résumés audio à partir de documents. Grâce à l’intégration audio native de Gemini, l’outil peut simuler une conversation entre deux intelligences artificielles qui discutent du sujet de vos documents. La génération des résumés prend seulement quelques minutes et le résultat est bluffant.

Pour générer un podcast avec deux IA, l’utilisateur doit simplement se rendre sur notebooklm.google, ajouter des sources (PDF, notes, vidéos YouTube…) puis choisir Résumé Audio. Les résumés audio sont générés par défaut dans la langue préférée de son compte Google, mais il est possible de sélectionner la langue de sortie souhaitée dans la nouvelle option dédiée (Paramètres > Langue de sortie).

L’ambition de Google ? la fin des barrières linguistiques

L’annonce du 29 avril marque une étape importante avec l’expansion à plus de 50 langues, dont le français. La firme de Mountain View explique vouloir éliminer les barrières linguistiques et rendre l’information plus accessible. Google avait déjà étendu l’accès de NotebookLM à plus de 200 pays l’année dernière et donne des exemples d’utilisation : un enseignant pourrait, par exemple, partager des documents en différentes langues, et les élèves pourraient générer un résumé audio dans leur propre langue.

Mais au fait, c’est quoi NotebookLM ?

Lancé il y a près d’un an, NotebookLM est un service d’IA développé par Google pour aider à la compilation de documents et de données. Moins connu que d’autres services, il s’avère particulièrement utile pour les chercheurs, les journalistes, les écrivains, les étudiants ou les académiciens. L’outil a été conçu pour comprendre les documents sur lesquels l’utilisateur travaille, comme son projet de recherche, afin d’interagir de manière pertinente. Il aide à trouver des idées, comprendre, avoir une vue d’ensemble à partir de ses propres matériaux, et est capable de synthétiser des recherches, accompagner des analyses, recouper des éléments et répondre à des questions, peu importe le format des sources.

Si NotebookLM surprend, c’est aussi parce que son créateur, Steven Johnson, n’a pas vraiment le profil habituel. Il s’agit d’un auteur de quatorze ouvrages, passionné de technologie, que Google a débauché pour développer ce service.

Cette technologie, générant une conversation entre une voix masculine et une voix féminine imitant les intonations humaines, représente un défi colossal pour Google dans son ambition d’éliminer les barrières linguistiques. Elle ouvre de nouvelles perspectives pour l’apprentissage multilingue et pourrait potentiellement changer la manière dont on aborde les sujets compliqués. Pour l’heure, Google invite les utilisateurs à tester la fonctionnalité et à partager leurs retours, notamment via Discord.

Alors que les résumés audio restent pour l’instant une exclusivité de NotebookLM, leur potentiel est immense. Ils pourraient particulièrement plaire aux amateurs de podcasts cherchant une nouvelle manière d’absorber l’information, en transformant n’importe quelle question ou document en une conversation virtuelle écoutable n’importe où.

Pourquoi Google a mis du temps à proposer cette fonction en français ?

L’arrivée du français a demandé un travail spécifique, comme l’avait expliqué Steven Johnson à nos confrères et consœurs de Numerama et Tech&Co. Notre langue était compliquée à appréhender pour cette fonctionnalité et la volonté de la firme d’obtenir un rendu audio crédible. Le modèle d’IA a été entraîné sur plus de 200 heures d’enregistrements en studio avec deux personnes discutant pour capter les intonations, les réactions et la manière de se couper la parole, propre à une conversation naturelle.

Notebook Lm Langue Francais
© Capture d’écran / JournalduGeek.com

« Chaque langue s’interrompt différemment », explique Steven Johnson, soulignant l’importance d’adapter le modèle pour chaque langue afin d’obtenir une « magie d’une conversation fluide et naturelle ». Pour l’instant, la version française présente d’ailleurs une différence principale par rapport à la version anglophone : il n’est pas encore possible d’interrompre le podcast pour poser des questions aux IA et faire évoluer la discussion. Cette capacité à interagir en temps réel est pourtant une fonctionnalité appréciée de la version anglaise.

🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.

Mode