NTWK, azienda italiana operante nella ricerca e selezione del personale, si occupa di soddisfare le necessità dei clienti offrendo servizi personalizzati.
Per azienda cliente, si ricerca Data Engineer – Big Data & GCP
Cosa farai
-
Progettare e sviluppare pipeline di elaborazione dati batch e streaming con Apache Beam e Apache Spark su Google Cloud Dataproc.
-
Modellare, ottimizzare e interrogare dataset di grandi dimensioni su BigQuery, con attenzione a costi e performance.
-
Lavorare con BigQuery Studio per esplorazione dati, sviluppo di notebook analitici e collaborazione con i team di Data Science e Analytics.
-
Integrare sorgenti dati eterogenee (database relazionali, API, event stream) nelle pipeline GCP.
-
Monitorare la qualità dei dati, implementare test e alert sulle pipeline in produzione.
-
Collaborare con il team di Data Science per rendere i dati disponibili, affidabili e ben documentati.
-
Contribuire alla definizione degli standard di data engineering del team: naming convention, data catalog, lineage.
Esperienza richiesta: 2 – 4 anni.
Skill richieste
-
Apache Beam/Spark – Sviluppo pipeline – livello intermedio
-
Google Cloud Dataproc – Cluster, job, tuning – livello intermedio
-
BigQuery – SQL avanzato, ottimizzazione – livello intermedio/avanzato
-
Big Query Studio – Notebook, esplorazione – livello base/intermedio
-
Python – pipeline e scripting – livello intermedio
-
SQL avanzato – Window fn, CTE, ottimiz.- livello intermedio
-
Git/CI-CD – Workflow collaborativo – livello intermedio
Nice to have
-
Esperienza con Google Cloud Dataflow (pipeline Beam fully managed).
-
Conoscenza di orchestratori di pipeline: Apache Airflow / Cloud Composer.
-
Nozioni di data modeling: schema star/snowflake, data vault.
-
Certificazione Google Cloud Professional Data Engineer (o percorso in corso).
Cosa si offre
-
RAL ~30.000 €
-
Contratto a tempo indeterminato (CCNL Commercio).
-
Mensa aziendale
-
Piano di crescita professionale.
Sede di lavoro: Catania