Vall-E : après ChatGPT, cette nouvelle IA imite n'importe quelle voix (et c'est inquiétant)

Vall-E : après ChatGPT, cette nouvelle IA imite n’importe quelle voix (et c’est inquiétant)

Cette IA imaginée par Microsoft peut imiter n’importe quelle voix avec un échantillon sonore de 3 secondes.

Après les IA capables de rédiger des textes et des devoirs de Master dans n’importe quel style à la manière de ChatGPT, le nouvel outil de Microsoft permet de simuler une voix humaine. Avec un simple échantillon audio de 3 secondes, l’outil assure être capable de préserver à la fois le ton et l’émotion du locuteur original, pour un rendu plus vrai que nature.

Entraîné sur 60 000 heures de parole en langue anglaise, ce nouveau robot nommé Vall-E peut se targuer d’avoir reçu une formation militaire : à ce jour assure Microsoft, il s’agit de l’intelligence artificielle la plus aboutie du marché. Spécialisé dans la synthèse vocale et le Text-to-Speech, l’outil permet surtout de “synthétiser une parole personnalisée de haute qualité avec seulement un enregistrement de 3 secondes d’un locuteur inconnu comme guide acoustique“. Une capacité d’apprentissage impressionnante, qui induit bon nombre de promesses techniques, mais aussi certains questionnements éthiques.

Des deepfake encore plus réalistes

L’IA sait déjà imiter des visages plus vrais que nature. Avec ce nouvel outil, elle sera bientôt capable de synthétiser n’importe quelle voix, à fortiori s’il s’agit d’une personnalité publique, dont l’image est logiquement plus exposée sur le web. De quoi révolutionner certains procédés cinématographiques, en ramenant par exemple à la vie certains acteurs et actrices décédés. L’IA n’en est plus à un miracle près, puisqu’elle avait déjà redonné un coup de fouet à l’acteur Harison Ford sur le dernier volet d’Indiana Jones.

Plus inquiétant, toutefois, la technologie derrière Vall-E pourrait aussi améliorer drastiquement la qualité des deepfakes, cette technologie qui permet de plaquer un visage sur un autre. En volant le visage et la voix d’une victime, il deviendra bien plus difficile pour le grand public de discerner le vrai du faux.

Pour le moment, Vall-E fonctionne uniquement en anglais, et n’est pas accessible au grand public. Il est toutefois possible de voir l’outil en action sur sa page dédiée GitHub, avec des exemples réalisés à des fins de recherches. Le robot possède encore quelques défauts, notamment au niveau de la retranscription audio. Reste que le résultat a de quoi impressionner, d’autant plus que Microsoft n’en est qu’aux prémices de ses recherches.

🟣 Pour ne manquer aucune news sur le Journal du Geek, suivez-nous sur Google et sur notre canal WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.

1 commentaire

Ducatevo dit :

17 janvier 2023 à 11:56

C’est génial…. ou pas !!!
Voilà que ces IA font surface et la seule chose que l’on peut lire sur ces IA, c’est : des étudiants ont utilisé une IA pour tricher…. des pseudos artistes ont utilisé des IA pour participer à un concours d’art….. des IA vont remplacer le travail des humains….. et maintenant des IA inquiètent car elles sont capables d’imiter n’importe quelle voix et la première chose à laquelle on pense, c’est le côté malsain !!!
Voilà donc résumé tout ce dont est capable l’homme : utiliser ces technos pour le pire !!!! C’est magnifique… La nature humaine est désespérante…
Après, on se demande pourquoi tout part en vrille dans cette société de fous, en perdition constante.
Ben voilà, une preuve de plus….
Comme disait Corbin, l’homme est capable du meilleur comme du pire, mais c’est vraiment dans le pire qu’il est le meilleur…… Ça se vérifie une fois de plus…..
Dramatiquement dramatique….

Répondre

Les commentaires sont fermés.