Passer au contenu

Gemini monte à bord et regarde par le pare-brise

Google expérimente une nouvelle fonction de Gemini capable de répondre à des questions sur ce que voit la caméra frontale d’une voiture. La démonstration a eu lieu dans une Volvo EX60, pas encore commercialisée, avec la promesse que l’IA ne regarde pas la route en continu. Elle n’ouvre les yeux que quand on le lui demande.

Google veut donner un peu plus de sens de l’observation à Gemini. Après le smartphone, où l’assistant peut déjà analyser ce que filme la caméra avec Gemini Live, l’entreprise a montré une version pensée pour la voiture. Cette fois, plus besoin de dégainer son téléphone : c’est la caméra frontale du véhicule qui sert d’yeux à l’IA.

« Gemini, c’est quoi ce bâtiment ? »

La démonstration a été réalisée par Sameer Samat, président d’Android chez Google, lors d’un échange avec Logan Kilpatrick, responsable produit de Google AI Studio. Le tout se passait dans une Volvo EX60, un modèle qui n’a pas encore commencé sa carrière commerciale. La voiture utilise « Google built-in », autrement dit Android Automotive avec les services du moteur de recherche directement intégrés au véhicule.

Le principe est simple : le conducteur invoque Gemini, pose une question sur ce qu’il voit à travers le pare-brise, et l’assistant récupère temporairement le flux de la caméra frontale pour répondre. « Nous voulions voir ce qui se passerait si Gemini pouvait voir le monde pendant que vous conduisez », a expliqué Sameer Samat.

Pendant la démonstration, l’IA a été sollicitée autour du campus de Google à Mountain View. Gemini a reconnu plusieurs points d’intérêt locaux, décrit des éléments d’une toiture solaire installée près d’un campus, et donné des informations sur un amphithéâtre tout proche.

L’idée est plutôt pratique. En voyage, Gemini pourrait par exemple aider à comprendre un panneau dans une langue étrangère, identifier un monument ou donner quelques informations sur un bâtiment croisé en route. Bref, faire autre chose que répéter des directions à suivre.

Google marche toutefois sur un terrain sensible : celui de la confidentialité. Sameer Samat a insisté sur le fait que Gemini n’accède pas en permanence à la caméra. Le flux vidéo n’est transmis qu’après une demande explicite. « Ensuite, la caméra fournit ce flux à Gemini, il répond à la question, puis il revient à un état où il ne peut plus voir », a-t-il résumé.

La fonction n’est pas encore prête pour les concessions. La démonstration montrait un délai assez visible entre la question et la réponse. Gemini doit se connecter à la caméra, analyser l’image, chercher les informations utiles, puis répondre par la voix via le système d’infodivertissement. Contrairement à Gemini Live sur smartphone, aucun retour vidéo n’apparaissait à l’écran.

Autre limite : cette intégration semble réservée à Android Automotive, le système embarqué directement dans la voiture. Google n’a pas donné de calendrier, ni confirmé les modèles compatibles. Volvo et Polestar, déjà très proches de l’écosystème Google, pourraient logiquement faire partie des premiers servis.

🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.

Mode