Skip to main content

Schema ad alto livello (Diagramma generale)

🎯 Obiettivo

Questa sezione fornisce una panoramica ad alto livello del funzionamento della repository, mostrando come gli script Python ETL si inseriscono nell’ecosistema aziendale.
L’intento è offrire una mappa visiva semplice per comprendere:

  • da dove arrivano i dati,

  • come vengono trasformati e caricati,

  • dove finiscono,

  • come vengono monitorati.


🔄 Flusso generale dei dati

  1. Sorgenti esterne

    • Portali web aziendali o di terze parti

    • API (es. Jotform, DKV, Kanban, Business Central)

    • File Excel/CSV provenienti da OneDrive o Dropbox

  2. Repository ETL (oggetto di questo libro)

    • Ogni file Python corrisponde a uno script ETL indipendente

    • Gli script eseguono estrazione, pulizia, trasformazione e caricamento

  3. Orchestrazione (vedi libro Ansible)

    • Gli script sono schedulati ed eseguiti in maniera automatizzata

    • I dettagli di configurazione, deploy e gestione dei job sono documentati nel libro dedicato ad Ansible

  4. Data Warehouse (vedi capitolo Data warehouse del libro Architetura dei Dati)

    • Gli script aggiornano tabelle e viste del DWH aziendale

    • La documentazione completa di schemi, viste e metadati è disponibile nel libro  capitolo "Data warehouse".

  5. Logging & Monitoring (vedi libro Grafana)

    • Gli esiti delle esecuzioni ETL vengono inviati a Grafana

    • Dashboard e alert sono gestiti dal libro dedicato a Grafana

 

📊 Diagramma semplificato