Conoscenza approfondita ed esperienza concreta nell’utilizzo di modelli e tecniche di Machine Learning rispetto a problemi di regressione, classificazione, clustering, dimensionality reduction. Padronanza degli algoritmi relativi, quali ad esempio GLM, SVM, Decision tree, RF, XGboost e tecniche di regolarizzazione.
Conoscenza approfondita ed esperienza concreta nell’utilizzo delle soluzioni, modelli e pipeline state-of-the-art in ambito NLP.
Conoscenza approfondita ed esperienza concreta nell’utilizzo di modelli e tecniche di Deep Learning. Padronanza delle architetture neurali più comuni (ANN, CNN, RNN) e del loro funzionamento.
Conoscenza nell’utilizzo di metodologie e tecniche statistiche derivanti dall’approccio inferenziale e bayesiano. Padronanza delle comuni metodologie statistiche inferenziali (p-values, intervalli di confidenza) e conoscenza dell’approccio e dei modelli bayesiani (regressioni bayesiane, reti bayesiane, EM, reti neurali bayesiane)
Conoscenza approfondita ed esperienza concreta di almeno 4-5 anni nell’utilizzo del linguaggio Python. Nello specifico: creazione di moduli e pacchetti, programmazione orientata agli oggetti, definizione e scrittura di test unitari
Conoscenza approfondita ed esperienza concreta di almeno 4-5 anni nell’utilizzo delle principali librerie Python utilizzate nell’ambito della data science. Nello specifico: Pandas, Numpy, Matplotlib, Scikit-learn, XGBoost o LightGBM, Statsmodels, Transformers, Huggingface, Spacy, NLTK, OpenAI, Tensorflow/Keras o Pytorch
Conoscenza approfondita ed esperienza concreta nell’utilizzo di database relazionali (PostgreSQL, MySQL) e NoSQL (MongoDB)
Conoscenza approfondita ed esperienza concreta nell’utilizzo del linguaggio SQL.
Conoscenza del sistema di versionamento GIT ed esperienza nello sviluppo software in modalità MLOps o DevOps. Esperienza nello sviluppo di pipelines CI/CD.
Esperienza concreta nell’utilizzo dell’architettura Cloud AWS e principali servizi annessi rispetto al comune sviluppo della pipeline di data science (e.g. S3, Lambda, ECR, Athena, EC2)
Conoscenza di base di ambienti containerizzati su tecnologia Docker
Conoscenza della metodologia Agile e dei principali strumenti per la gestione dell’agile sprint (Jira).
Preferibile una esperienza di base nello sviluppo software in modalità MLOps o DevOps. Esperienza base nello sviluppo di pipelines CI/CD.