Cosa ti proponiamo
La direzione AI & Advanced Analytics è alla ricerca di un Junior Foundation AI Engineer da inserire nel team di sviluppo che si occuperà delle prossime versioni del nostro foundation LLM EngGPT, attualmente in forte espansione. Il ruolo è centrato sul training di modelli AI from scratch: dalla preparazione dei dati, al design delle architetture, fino allo sviluppo, esecuzione e valutazione delle pipeline di training, con una collaborazione costante con i team di delivery che utilizzano EngGPT nei diversi contesti applicativi
Quali saranno le tue attività e responsabilità?
-
Definire e gestire i dataset di training attraverso attività di data curation
-
Progettare e iterare sulle architetture del modello, conducendo ablation studies per guidare le scelte progettuali
-
Sviluppare, eseguire e monitorare le pipeline di training
-
Valutare le performance del modello e guidare i cicli di miglioramento
-
Definire e ottimizzare le modalità di serving del modello
-
Supportare i team di delivery nell'utilizzo del modello nei diversi contesti applicativi
-
Collaborare con i team di delivery per raccogliere feedback operativi
-
Monitorare continuamente lo stato dell'arte e integrare le innovazioni della ricerca
Qualifiche e competenze richieste
-
Recente laurea in discipline correlate come Informatica, Ingegneria o discipline scientifiche quantitative (es. Fisica, Matematica, Statistica)
-
Solida conoscenza della teoria dei modelli generativi e LLM
-
Conoscenza dello stato dell'arte delle principali fasi e tecniche di training dei modelli linguistici, tra cui pre-training, adattamento al contesto lungo, Supervised Fine-Tuning (SFT), Direct Preference Optimization (DPO), Reinforcement Learning from Human Feedback (RLHF), Reinforcement Learning from Verifiable Rewards (RLVR), Model Merging e Model Pruning
-
Esperienza in Python e nelle principali librerie per il training di modelli LLM (es. Hugging Face, TRL, Accelerate, PEFT, ..)
-
Capacità di gestione e processamento di dati su larga scala
-
Esperienza nel training di modelli LLM e familiarità con le relative modalità di serving
-
Esperienza nell'uso di sistemi di versionamento del codice (es. Git)
-
Attitudine alle attività di ricerca e analisi
-
Buon livello di inglese (B2)
Competenze aggiuntive preferenziali:
-
Master, Dottorato o comunque specializzazione in ambito Data Science
-
Conoscenza di ambienti HPC e job scheduler (es. SLURM) per la gestione di workload di training distribuito
-
Familiarità con framework per il training distribuito su larga scala (es. Megatron, DeepSpeed)
-
Conoscenza dei framework core di training (es. PyTorch, Triton, CUDA, NCCL)
-
Esperienza nell'uso di tecnologie cloud IaaS su almeno uno dei principali hyperscaler (AWS, Azure, Google Cloud Platform), con familiarità con workflow su ambienti cloud con accesso a GPU
-
Conoscenza di framework e best practice per il serving LLM in Production (es. vLLM, LLMOps, Pachyderm, ...)
Cosa cerchiamo nelle nostre persone?
Ambizione, nel perseguire grandi obiettivi e nell'investire sul miglioramento continuo;
Proattività, nell’anticipare e affrontare le sfide con iniziativa;
Trasparenza, nel comunicare apertamente e fornire feedback costruttivi;
Motivazione a migliorare e a crescere insieme agli altri, manifestando apertura al confronto per favorire la crescita collettiva e il raggiungimento degli obiettivi comuni.
Inquadramento e retribuzione
-
CCNL Metalmeccanico
-
Livello: B1
-
Contratto: Tempo Indeterminato
-
RAL: a partire da € 30.814,29
-
Benefit: buoni pasto, welfare aziendale, smart working, assicurazione sanitaria e formazione
Invia la tua candidatura e raccontaci come puoi fare la differenza.
Sede di inserimento
Milano | Torino
L’annuncio è rivolto a tutti i candidati, senza distinzione di sesso, nel rispetto del Codice delle pari opportunità di cui al D.Lgs. 198/2006 e ss.mm.ii.