Amazon travaille actuellement sur une technologie qui devrait permettre, à terme, à l’assistant vocal Alexa d’imiter la voix humaine. Y compris quand il s’agit de celle d’une personne décédée. Une fausse bonne idée ?
L’édition 2022 de la conférence Amazon re:MARS se déroule en ce moment à Las Vegas. Durant cet événement, dont le billet d’entrée coûte 1499 dollars, Amazon donne la parole à de nombreux experts en technologies pour parler de ce que le futur nous réserve sur le sujet. Évidemment, des ingénieurs de l’entreprise sont également au rendez-vous pour présenter ce que Amazon prépare du côté de ses propres produits et services.
C’est dans cette optique que Rohit Prasad, vice-président senior en charge du développe de l’assistant vocal Alexa, est monté sur scène. Il y a fait une démonstration impressionnante, en permettant à l’intelligence artificielle d’imiter une voix humaine en se basant sur une sélection d’extraits audio originaux. En ayant en sa « possession » environ une minute d’enregistrement, Alexa a ainsi pu parler longuement avec une voix très proche de celle qu’elle devait imiter.
Une mise en scène dérangeante
Pour illustrer le potentiel de cette technologie, Amazon a choisi de mettre en scène une situation très particulière : celle de la perte d’un être cher. La voix synthétisée par Alexa est celle d’une grand-mère décédée. L’assistant vocal, après l’avoir analysée et reproduite, se sert alors de cette voix de synthèse, proche de celle de la personne disparue, pour lire une histoire à son petit-fils et ainsi l’aider à s’endormir.
La prouesse technique est évidente : « cela a nécessité de trouver des solutions pour apprendre à reproduire une voix de haute qualité avec moins d’une minute d’enregistrement, contre des heures habituellement nécessaires en studio », résume Rohit Prasad. Pour lui, l’objectif est atteint : « Nous vivons incontestablement l’âge d’or de l’intelligence artificielle, où nos rêves et notre science-fiction deviennent réalité. »
Pour autant, faire revivre un défunt à travers une voix synthétique peut tout de même se présenter comme une possibilité déroutante, voire dérangeante. On peut se questionner sur les limites d’un tel procédé : peut-on faire dire n’importe quoi à un mort ? Est-ce que cela ne risque pas d’empêcher les vivants de faire leur deuil ? Pour Amazon, « Bien que l’IA ne puisse pas éliminer la douleur liée à la perte d’un être cher, elle peut certainement entretenir le souvenir ». Chacun se fera son propre avis sur le sujet.
Un outil puissant, qui n’est pas sans risque
Pour l’heure, Amazon n’a donné aucune information concernant le déploiement potentiel de cette fonctionnalité au sein de ses appareils Echo. Il est possible que cela n’arrive pas avant de longues années ou que cette technologie soit proposée uniquement dans un cadre professionnel.
Aux questions purement éthiques viennent se frotter des problématiques de sécurité et de légalité : comment empêcher une telle fonctionnalité d’être utilisée à mauvais escient, par exemple pour des usurpations d’identité ou pour manipuler le discours d’une personne, à la manière des deep fake ? Ce sont autant de problématiques auxquelles Amazon va devoir se confronter si l’entreprise désire aller plus loin dans ce domaine : la performance technologique en elle-même ne suffit pas lorsque l’on touche à quelque chose d’aussi personnel que la voix d’un être humain.