Historique de l'événement (2 versions)(ID:218791)
(nS)
Version 2 moog (14/07/2023 14:41:05)
Une intelligence artificielle est capable de reproduire une voix après 3 secondes d'écoute.
Catégories:
Microsoft (-)
Intelligence artificielle (-)
Voix (-)
IA générative (-)
Les exemples disponibles sont épatants : le timbre, le ton, les émotions et même l'environnement sonore (par exemple un son de conversation téléphonique), tout se retrouve dans la voix synthétisée par l'intelligence artificielle. Si trois secondes suffisent pour reproduire une voix, plus l'extrait sonore fourni à VALL-E est riche et long, plus la reproduction sera fidèle. L'intelligence artificielle a été entrainée grâce à 60.000 heures de données vocales en anglais (notamment via le catalogue de livres audio LibriVox). Cet outil Text To Speech (transformation d'un texte écrit en contenu audi
![[fr]](pics/flags/fr.gif)
218 825
événements