Studio Synthesis

crm, BI, opensource, web marketing, sicurezza, etc

Cos’e’ un DataWarehouse

leave a comment »

Secondo di una serie di articoli di carattere divulgativo sulla Business Intelligence, a cura della dottoressa Elena Poli, pubblicati per celebrare l’accordo di partnership tra Studio Synthesis e Pentaho – azienda statunitense leader mondiale nell’ambito delle soluzioni software BI opensource

Cosa è DataWarehouse

Le crescenti esigenze conoscitive del management aziendale trovano risposta nella creazione di un “magazzino dei dati”, DataWarehouse appunto, in cui convergono i flussi informativi provenienti dalle diverse fonti di dati.

Il DataWarehouse (DW) si presenta, secondo la definizione di William H. Inmon, come una raccolta di dati di supporto ai processi decisionali integrata, orientata al soggetto, che varia nel tempo e non volatile.

Requisito fondamentale di un DW è l’integrazione dei dati provenienti dalle diverse fonti interne all’azienda ma anche esterne.

La qualifica di raccolta dati “orientata al soggetto” fa riferimento alla caratteristica per cui il DW è orientato a temi specifici dell’azienda piuttosto che alle applicazioni o alle funzioni così da produrre dati che abbiano una struttura in grado di favorire la produzione di informazioni.

I dati risultano così modellati in modo da consentire una visione multidimensionale degli stessi.

L’intervallo temporale di riferimento dei dati è il più esteso possibile in modo da consentire il monitoraggio di un fenomeno da un punto di vista intertemporale.

I dati immagazzinati sono quindi dati “storicizzati” e si richiede pertanto un flusso di immagazzinamento periodico continuo per ritenere la raccolta di dati sufficientemente aggiornata (il DW varia nel tempo). Infine, proprio perché in un determinato momento il DW è statico i dati devono essere non modificabili (non volatilità), il DW consente pertanto accessi in sola lettura.

Si ritiene che la costruzione di un DW porti con sé alcune problematiche tecniche e operative che colui che progetta il DW in un’azienda non deve trascurare:

  • l’esigenza di una approfondita conoscenza del sistema informativo aziendale in modo da creare un flusso esaustivo di informazioni, comprese quelle relative a periodi temporali conclusi (che possono pertanto provenire da altre fonti, ad esempio altri software oppure documenti cartacei);
  • la comprensione dei fenomeni da analizzare deve essere profonda così da suggerire eventuali fonti di dati esterne da integrare con i flussi informativi aziendali e trasformazioni dei dati;
  • l’integrità dei dati deve essere garantita. Un momento ragionato di validazione dei dati, precedente e propedeutico alla costruzione del DW, è senz’altro da ritenersi consigliabile in modo da gestire ed eventualmente sanare alla fonte eventuali problemi di valori mancanti o incongruenze;
  • i dati devono essere confrontabili e congruenti, perché univocamente identificabili sulla base di criteri di classificazione quali il tempo di riferimento, il cliente o il prodotto.

Written by cbeschi

27 giugno 2008 a 1:22 PM

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger cliccano Mi Piace per questo: