L’evoluzione dei modelli di Deep Learning richiede hardware sempre più performanti e ottimizzazioni specifiche per garantire l’inferenza in tempo reale. L’obiettivo del lavoro di tesi consiste nel confrontare le performance di tre diverse architetture hardware: NVIDIA Jetson Orin AGX, NVIDIA Jetson Thor AGX e una piattaforma server basata su Intel Xeon + GPU NVIDIA L4. Per la valutazione sarà utilizzato un modello di object detection allo stato dell’arte e computazionalmente oneroso, come YOLOv11x. Tale modello dovrà essere ottimizzato per ciascun hardware di riferimento utilizzando la libreria TensorRT per massimizzare il throughput e minimizzare la latenza.
Le attività previste includono:
- Studio delle architetture hardware selezionate e dell’ecosistema software NVIDIA TensorRT.
- Ottimizzazione e deployment del modello di object detection sulle tre piattaforme.
- Esecuzione di benchmark approfonditi focalizzati sulla variazione del batch size: verranno condotti test con Batch Size = 1 per valutare la latenza pura (scenari real-time) e con Batch Size superiori per misurare il massimo throughput e la scalabilità del sistema.
- Analisi comparativa dei risultati (FPS, latenza, consumo energetico) per identificare i punti di forza e i limiti delle configurazioni Edge rispetto a quelle Server.
Argomento principale: Visione Artificiale / Edge AI
Corso di studio e requisiti candidato:
- Laurea Magistrale in Ingegneria Informatica, Ingegneria dell’Automazione o discipline affini.
- Il candidato ideale dovrebbe possedere buone competenze in Python/C++, conoscenze di Deep Learning e familiarità con l’ambiente Linux.
Sede: Napoli