Voice Engine : un cloneur de voix épatant signé Open AI ?

Choses à Savoir TECH - En podkast av Choses à Savoir

Kategorier:

Décidément, on n’arrête plus OpenAI… Après ChatGPT, puis la génération de vidéo avec son tout nouvel outil Sora, le leader de l’intelligence artificielle annonce avoir créé un modèle capable de générer et même d'imiter des voix. La plateforme, baptisée Voice Engine, ne demande rien d’exceptionnel en termes de commande. Il suffit simplement de décrire à l’écrit les consignes que vous souhaitez voir appliquer par l’IA, et le résultat à obtenir. Ensuite, ajouter un échantillon audio de seulement 15 secondes pour générer une voix naturelle qui se rapproche de très près de celle de l'orateur d'origine. OpenAI promet que son outil est capable de créer je cite « des voix émouvantes et réalistes », et cela en moins de deux ans puisque l'entreprise indique avoir entamé le développement de Voice Engine à la fin de l'année 2022. Open AI précise aussi que le modèle alimente déjà les voix prédéfinies dans son API de synthèse vocale ainsi que ChatGPT Voice.Comme pour le générateur de vidéo Sora, OpenAI se veut prudente quant au déploiement de Voice Engine, je cite « en raison du potentiel d'utilisation abusive de la voix synthétique ». La fonctionnalité n'est donc pas disponible auprès du grand public actuellement et la société n'est d'ailleurs pas certaine aujourd'hui de lancer à terme une version accessible à tous, qu'elle soit gratuite ou payante. Parmi les différentes applications possibles, la capacité du service à générer des voix naturelles et chargées d'émotions s'est montrée bien utile pour l'entreprise de technologie éducative Age of Learning, qui a eu recours à Voice Engine pour générer du contenu voix off préscénarisé. Autre aspect important : la traduction de contenus, notamment de vidéos et de podcasts, permettant aux entreprises et aux créateurs de toucher un public beaucoup plus large, voir même mondial. Sur ce point, OpenAI précise que Voice Engine préserve l'accent du locuteur d'origine lorsqu'il est utilisé pour la traduction. Générer une voix en anglais à partir de l'échantillon audio d'un orateur français produit par exemple une voix anglaise avec un accent français. Reste à voir si, à défaut d’être proposé au grand public, Voice Engine sera mis à disposition d’autres entreprises et organisations. Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Visit the podcast's native language site