Détail de l'événement(ID:218791)
(nS)
Une intelligence artificielle est capable de reproduire une voix après 3 secondes d'écoute.
Chronologies associées avec cet événement:
Chronologie Microsoft
Chronologie Intelligence artificielle
Chronologie Voix
Chronologie IA générative
Les exemples disponibles sont épatants : le timbre, le ton, les émotions et même l'environnement sonore (par exemple un son de conversation téléphonique), tout se retrouve dans la voix synthétisée par l'intelligence artificielle. Si trois secondes suffisent pour reproduire une voix, plus l'extrait sonore fourni à VALL-E est riche et long, plus la reproduction sera fidèle. L'intelligence artificielle a été entrainée grâce à 60.000 heures de données vocales en anglais (notamment via le catalogue de livres audio LibriVox). Cet outil Text To Speech (transformation d'un texte écrit en contenu audi
215 785
événements