Origine del termine
Il termine ETL è la sigla inglese dell’espressione “Extract, Transform, Load”.
Cosa significa ETL
Extract, Transform, Load (ETL) è un’espressione in lingua inglese che si riferisce al processo di estrazione, trasformazione e caricamento dei dati in un sistema di sintesi (data warehouse, data mart, big data ecc…).
Fonte: Wikipedia
In pratica esso consiste in un processo di raccolta dei dati a partire da un numero illimitato di sorgenti e della loro successiva organizzazione e centralizzazione in un unico repository.
Il processo ETL è molto importante perché per molti anni le aziende si sono affidate ad esso per ottenere una visione consolidata dei dati al fine di essere guidata a migliori decisioni aziendali.
Attualmente questo metodo di integrazione dei dati a partire da più sistemi e più fonti è ancora un elemento fondamentale tra gli strumenti di integrazione dei dati delle imprese.
Fasi del processo ETL
Fasi per portare dati provenienti da più fonti in un database centralizzato:
- Estrazione: Si estraggono i dati dalla fonte originale, sia che si tratti di un altro database o di un’applicazione;
- Trasformazione: Si modificano i dati, ripulendoli, duplicandoli, combinandoli e preparandoli per il caricamento;
- Caricamento: Si caricano i dati nel database di destinazione.
Vantaggi del processo ETL
- Semplicità;
- Efficienza;
- Alte prestazioni;
- Funzioni di pulizia avanzate;
- Basato sulla GUI (Graphical User Interface);
- Adatto a regole e trasformazioni complesse.