ChatGPT parle, chante, imite... et vous répond en temps réel. OpenAI a laissé quelques personnes tester son mode vocal avancé, et c'est une révolution. Oui, j'ose le terme.
L'advanced Voice Mode de ChatGPT est entre les mains d'une poignée de chanceux
En mai 2024, Open AI présentait au grand public l'Advanced Voice Mode. Pour rappel, cet Advanced Voice Mode, qu'on pourrait appeler "mode vocal avancé" dans la langue de Molière est une fonctionnalité qui permet d'interagir avec ChatGPT de manière plus naturelle et intuitive, en utilisant simplement votre voix. Au lieu de taper vos requêtes, vous pouvez parler à l'IA et celle-ci vous répondra en temps réel, comme si vous échangiez avec une vraie personne.
Quand OpenAI a fait la démo de ce mode vocal avancé, le monde entier a été bluffé. Dans les démos, on entendait l'IA changer d'intonnation, ajuster son débit de parole, détecter les émotions humaines, chanter... bref, c'était assez dingue. Mais il ne s'agissait que de vidéos de démo réalisées par l'entreprise derrière ChatGPT, pas de véritables tests de terrain.
Et bien sachez que le 30 juillet 2024, il y a tout pile une semaine, OpenAI a enfin rendu accessible le mode vocal avancé pour une poignée de testeurs abonnés à ChatGPT Plus. Quelques uns de ces chanceux se sont filmés en train de tester le truc, et c'est assez dingue. Voici notre petite sélection maison des nouvelles fonctionnalités.
1 - Une voix vraiment naturelle et modulable à l'envie
La première chose marquante avec le mode vocal avancé, c'est le fait que la voix de ChatGPT peut vraiment être modulée à votre guise. Vous pouvez à peu près tout demander. Par exemple, sur internet, on voit des vidéos de l'IA qui s'exprime avec différents accents anglais ou même en filtrant sa voix pour imiter un pilote d'avion qui parle à travers un haut-parleur un peu pourri. Parce que oui, ChatGPT peut imiter à peu près n'importe quelle façon de parler. Si vous voulez discuter avec Homer Simpson ou un vampire, c'est complètement possible.
9. Speak like an airline pilot on intercompic.twitter.com/OXOlyYSJjw
— Min Choi (@minchoi) July 31, 2024
2 - ChatGPT Advanced Voice est plus qu'une voix !
Et si je vous disais que la nouvelle voix de ChatGPT était... plus qu'une voix ? Par là, je veux dire que l'IA peut non seulement parler, chanter ou même faire du beatbox comme n'importe quelle voix humaine, mais, en plus de tout ça, elle peut générer des bruitages. Et ça, c'est dingue. On voit par exemple pas mal tourner une vidéo dans laquelle l'intelligence artificielle raconte une histoire de SF, avec tout un tas de sons ambiants. Pendant une scène qui se déroule sous la pluie par exemple, vous entendez les gouttes d'eau tomber.
— OpenTools (@opentoolsai) August 5, 2024
3 - Un cas d'usage vraiment pratique : la traduction
Ok mais alors tout ça, ça sert à quoi ? Parce que je vous vois venir, je sais bien que beaucoup de personnes pensent que cette feature est un gadget avec lequel on fera joujou trois jours avant de l'oublier. Et bien, moi, je ne le pense pas. Pourquoi ? Parce que certaines applications me semblent hyper pratiques au quotidien. Par exemple, l'IA peut être utilisée pour apprendre ou traduire une langue de façon révolutionnaire. Si pour votre boulot vous devez échanger avec un client chinois, et bah il suffira d'un téléphone posé entre vous pour que vous ayez un interprète de premier ordre. Un peu plus geek, j'ai vu passer la vidéo d'une personne qui utilise l'IA pour traduire son jeu Pokémon japonais pendant qu'elle joue !
7. Real-time Japanese translation with visionpic.twitter.com/bMhTLD8Fjs
— Min Choi (@minchoi) July 31, 2024
4 - Les yeux de l'IA
Ah oui, j'avais oublié de vous parler de ça. En plus de donner une voix à son IA, OpenAI lui a aussi donné des yeux. Et ça aussi, ça peut vous changer la vie. Là on vient de voir quelqu'un qui fait une traduction de jeu Pokémon, mais il y a des vidéos de personnes qui filment leur frigo pour demander des idées de recette ou bien qui filment la gamelle de leur chaton pour demander à l'IA s'il est normal qu'il mange aussi peu. Et ça, c'est pas grand chose, il suffit de réfléchir 2 minutes pour trouver de nouvelles façons hyper pratiques d'utiliser cette fonctionnalité.
It's only been a day since OpenAI dropped ChatGPT Advanced Voice Mode
— Min Choi (@minchoi) July 31, 2024
And people are already doing crazy things with it.
10 wild examples:
1. Super helpful friend with visionpic.twitter.com/YsQiubWO6Y
Le mode vocal avancé de ChatGPT : bientôt en France pour le grand public ?
Les cas d'usages sont presque infinis. La fonctionnalité n'est dispo que depuis une semaine à un groupe restreint de personnes, mais on a déjà trouvé des dizaines voire des centaines d'autres vidéos bluffantes. Je vous le dis : faire cette petite sélection n'a pas été facile ! Terminons en disant qu'on a déjà entendu le mode vocal avancé parler français, alors la fonctionnalité ne devrait pas tarder à être déployée massivement, notamment chez nous.
Vous noterez que ce papier a été rédigé avec un ton très oralisé. C'est normal, il s'agit de la version écrite d'un script vidéo pour le Daily Tech du 7/08/2024, publié sur les réseaux sociaux de JV.