Lo scopo principale è creare una pipeline di doppiaggio generativo che mantenga il timbro originale degli speaker, traducendo e ricostruendo l’audio in un’altra lingua con sincronizzazione labiale di base.
La tesi comprende diarizzazione e trascrizione del parlato, traduzione, allineamento tempo-fonema e rendering finale con TTS.
Argomento principale: AI/ML, IA generativa, ASR, TTS neurale, Speech Translation.
Corso di studio e requisiti candidato: Informatica, Ingegneria Informatica. Solida base in Python e ML, librerie PyTorch/TensorFlow; gradite competenze su dataset audio.
Sede tirocinio: Napoli e Milano.