ElevenLabs révolutionne le sound design des jeux vidéo avec son IA Text to Sound. Un remplacement de l’humain dans le JV ? C’est en tout cas ce que l’on peut redouter, tout autant qu’une plus grande richesse de sons.
Une technologie avec un gros potentiel
ElevenLabs, déjà reconnu pour sa technologie révolutionnaire de synthèse vocale, annonce aujourd'hui le lancement de son nouvel outil basé sur l'intelligence artificielle : Text to Sound. Ce générateur d'effets sonores promet de transformer radicalement la manière dont les développeurs de jeux vidéo conçoivent et produisent les paysages sonores de leurs créations.
Text to Sound permet ainsi de générer des effets sonores, des pistes instrumentales courtes, des ambiances sonores et même une grande variété de voix de personnages, le tout à partir d'une simple description textuelle. Les possibilités créatives offertes par cet outil sont immenses pour l'industrie du jeu vidéo, qui pourra désormais créer des sons sur mesure, adaptés à chaque univers et à chaque situation de jeu.
Pour entraîner son modèle d'IA, ElevenLabs s'est associé à Shutterstock, une plateforme d’image, de son et de vidéo sous licence qui propose des contenus de qualité. Grâce à cette collaboration, ElevenLabs a pu accéder à la vaste bibliothèque audio de Shutterstock, riche de millions de pistes sonores licenciées, pour développer un outil capable de générer des sons d'une qualité et d'une grande diversité.
Une immersion absolue dans le jeu vidéo
L'outil est ainsi capable de générer des explosions, aux bruits de pas, en passant par les ambiances naturelles et les sons futuristes. Les développeurs de jeux vidéo pourront ainsi donner vie à leurs visions les plus ambitieuses, sans se limiter aux bibliothèques sonores existantes, souvent coûteuses et pas toujours adaptées à la situation.
Cette technologie ouvre de nouvelles perspectives pour le sound design des jeux vidéo. Les développeurs pourront désormais créer des sons uniques et personnalisés pour chaque personnage, chaque arme, chaque environnement, renforçant ainsi l'immersion et l'expérience de jeu des joueurs.
Mais cela pose tout de même question. Déjà cela prend le boulot de personne dédiée au sound design. Si cela est utile pour un petit studio avec un budget limité, cela fonctionne aussi pour un gros studio avec de gros budgets.
Sans oublier l’aspect créatif. L’IA crée du contenu à partir de contenu existant. Peut-on atteindre une limite créative par ce biais-là ? Est-ce qu'on ne va pas finir par tourner en rond ? C’est autant de questions qui n’ont pas de réponse aujourd’hui.
Text to Sound est ainsi disponible dès maintenant pour tous les utilisateurs d'ElevenLabs. La version gratuite permet de générer jusqu'à 22 secondes de son à partir d'une description textuelle, tandis que les versions payantes offrent des fonctionnalités supplémentaires, telles que la possibilité d'utiliser les clips audio générés à des fins commerciales.
Un avenir pour les développeurs de jeux vidéo qui pose question. Entre bonne et mauvaise nouvelle pour le monde du JV.