Schema ad alto livello (Diagramma generale)
Questa sezione fornisce una panoramica ad alto livello del funzionamento della repository, mostrando come gli script Python ETL si inseriscono nell’ecosistema aziendale.
L’intento è offrire una mappa visiva semplice per comprendere:
-
da dove arrivano i dati,
-
come vengono trasformati e caricati,
-
dove finiscono,
-
come vengono monitorati.
🔄 Flusso generale dei dati
-
Sorgenti esterne
-
Portali web aziendali o di terze parti
-
API (es. Jotform, DKV, Kanban, Business Central)
-
File Excel/CSV provenienti da OneDrive o Dropbox
-
-
Repository ETL (oggetto di questo libro)
-
Ogni file Python corrisponde a uno script ETL indipendente
-
Gli script eseguono estrazione, pulizia, trasformazione e caricamento
-
-
Orchestrazione (vedi libro Ansible)
-
Gli script sono schedulati ed eseguiti in maniera automatizzata
-
I dettagli di configurazione, deploy e gestione dei job sono documentati nel libro dedicato ad Ansible
-
-
Data Warehouse (vedi capitolo Data warehouse del libro Architetura dei Dati)
-
Gli script aggiornano tabelle e viste del DWH aziendale
-
La documentazione completa di schemi, viste e metadati è disponibile nel libro capitolo "Data warehouse".
-
-
Logging & Monitoring (vedi libro Grafana)
-
Gli esiti delle esecuzioni ETL vengono inviati a Grafana
-
Dashboard e alert sono gestiti dal libro dedicato a Grafana
-
No Comments