Multilingual and Multi-Speaker Generative Dubbing

Kineton Srl -
Napoli, Campania

Candidatura rapida

Dettagli della posizione

Tirocinio formativo/stage
2 ore fa

Qualifiche

Python

Descrizione completa della posizione

Lo scopo principale è creare una pipeline di doppiaggio generativo che mantenga il timbro originale degli speaker, traducendo e ricostruendo l’audio in un’altra lingua con sincronizzazione labiale di base.

La tesi comprende diarizzazione e trascrizione del parlato, traduzione, allineamento tempo-fonema e rendering finale con TTS.

Argomento principale: AI/ML, IA generativa, ASR, TTS neurale, Speech Translation.

Corso di studio e requisiti candidato: Informatica, Ingegneria Informatica. Solida base in Python e ML, librerie PyTorch/TensorFlow; gradite competenze su dataset audio.

Sede tirocinio: Napoli e Milano.

___________

The main goal is to create a generative dubbing pipeline that maintains the original speaker’s timbre, translating and reconstructing the audio in another language with basic lip synchronisation.

The thesis includes speech diarization and transcription, translation, time- phoneme alignment, and final rendering with TTS.

Main Topic: AI/ML, Generative AI, ASR, Neural TTS, Speech Translation.

Course of Study and Candidate Requirements: Computer Science or Computer Engineering. Solid foundation in Python and ML, PyTorch/TensorFlow libraries; skills with audio datasets are a plus.

Internship Location: Naples and Milan.

Candidatura rapida

Strumenti per chi cerca lavoro

Strumenti Aziende

Visualizza

Resta in contatto