Schema ad alto livello (Diagramma generale)

🎯 Obiettivo

Questa sezione fornisce una panoramica ad alto livello del funzionamento della repository, mostrando come gli script Python ETL si inseriscono nell’ecosistema aziendale.
L’intento è offrire una mappa visiva semplice per comprendere:

da dove arrivano i dati,
come vengono trasformati e caricati,
dove finiscono,
come vengono monitorati.

🔄 Flusso generale dei dati

Sorgenti esterne
- Portali web aziendali o di terze parti
- API (es. Jotform, DKV, Kanban, Business Central)
- File Excel/CSV provenienti da OneDrive o Dropbox
Repository ETL (oggetto di questo libro)
- Ogni file Python corrisponde a uno script ETL indipendente
- Gli script eseguono estrazione, pulizia, trasformazione e caricamento
Orchestrazione (vedi libro Ansible)
- Gli script sono schedulati ed eseguiti in maniera automatizzata
- I dettagli di configurazione, deploy e gestione dei job sono documentati nel libro dedicato ad Ansible
Data Warehouse (vedi capitolo Data warehouse del libro Architetura dei Dati)
- Gli script aggiornano tabelle e viste del DWH aziendale
- La documentazione completa di schemi, viste e metadati è disponibile nel libro capitolo "Data warehouse".
Logging & Monitoring (vedi libro Grafana)
- Gli esiti delle esecuzioni ETL vengono inviati a Grafana
- Dashboard e alert sono gestiti dal libro dedicato a Grafana

Schema ad alto livello (Diagramma generale)

🎯 Obiettivo

🔄 Flusso generale dei dati

📊 Diagramma semplificato