Les utilisateurs de l’application Gemini peuvent désormais importer des fichiers audio (MP3, M4A, WAV, etc.) directement dans une conversation. Cette fonction, disponible sur Android, iOS et le web, répond à ce que Google décrit comme la demande numéro un des utilisateurs.
Des fichiers audio enfin pris en charge
La limite dépend du type d’abonnement : jusqu’à 10 minutes d’audio pour les comptes gratuits, et jusqu’à trois heures pour les abonnés AI Pro ou AI Ultra. L’outil peut être utilisé pour des transcriptions ou pour analyser des contenus sonores, de la même manière que Gemini traitait déjà la vidéo.
Cette nouveauté complète un éventail plus large de formats déjà pris en charge :
- Vidéo : jusqu’à 5 minutes pour les utilisateurs gratuits, 1 heure pour les abonnés, avec une taille maximale de 2 Go.
- Autres fichiers : jusqu’à 100 Mo.
- Dossiers de code ou dépôts GitHub : jusqu’à 5.000 fichiers, dans la limite de 100 Mo.
- Fichiers ZIP : jusqu’à 10 fichiers inclus.
- Chaque session de Gemini peut accepter un maximum de 10 fichiers.
L’actualité Gemini ne se limite pas à l’audio. Google a également annoncé l’arrivée de cinq nouvelles langues dans le mode IA de son moteur de recherche : hindi, indonésien, japonais, coréen et portugais brésilien. L’objectif est de permettre à davantage d’internautes de poser des questions complexes dans leur langue et de bénéficier d’une exploration enrichie du web. Hélas, le français n’est toujours pas au rendez-vous !
De son côté, NotebookLM, l’outil d’aide à l’étude et à la rédaction, gagne de nouvelles options de rapports. Il peut désormais produire des documents au format de guides d’étude, de billets de blog, de fiches de révision ou de quiz. Le tout dans plus de 80 langues, en fonction des fichiers importés par l’utilisateur. Selon Google, la mise à jour devrait être disponible pour tout le monde maintenant.
Ces annonces font partie d’une série de mises à jour rapides pour enrichir l’écosystème Gemini. Ces dernières semaines, l’IA de Google a inauguré la mémoire des préférences utilisateur, l’accès élargi à l’outil vidéo Vids pour les comptes gratuits, ou encore de nouvelles capacités de création dans Google Photos avec Veo 3.
Avec l’intégration de l’audio dans Gemini et l’extension linguistique de la recherche, Google veut rendre son IA plus utile et aussi plus universelle au-delà de la seule langue anglaise. Et en misant sur NotebookLM, la firme cherche aussi à s’installer durablement dans le quotidien des étudiants, des chercheurs et des créateurs de contenu.
🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.