Proseguiamo le riflessioni avviate nel post precedente su come le società di consulenza attive nei settori della Business Intelligence e Data Analytics possono operare per accompagnare le Organizzazioni Sanitarie nel realizzare, e soprattutto gestire nel tempo, quanto previsto dal PNRR.
A livello assolutamente generale, i passaggi fondamentali sono 2:
La strutturazione di una base informativa integrata
L’elaborazione delle informazioni attraverso Business Intelligence e Data Analytics.
In questo post intendiamo suggerire alcune riflessioni sul primo punto: come organizzare la grande quantità di informazioni già in possesso delle Aziende, o che saranno acquisite dai sistemi informativi delle nuove realizzazioni, in modo da massimizzarne l’utilità.
Come si vede, non si parla di nuovi sviluppi software, ma solo di valorizzazione degli investimenti già effettuati, nella logica di non utilizzare i dati solo a fini puramente gestionali, ma di sfruttare al massimo la loro potenzialità di generare informazioni elaborate a sostegno dei processi decisionali.
Per fare ciò, dobbiamo organizzare le informazioni nel modo migliore e soprattutto ottimizzare il rapporto costi/benefici di questa operazione. La prima cosa che viene in mente in casi come questo è predisporre un Data Warehouse con tutti i dati disponibili, per poi operare su di esso. Ma non è detto che questa sia sempre la scelta migliore. Certo, se l’Azienda ne possiede già uno, completo e ben strutturato, il problema non si pone. Ma nell’ambito delle Organizzazioni Sanitarie ciò rappresenta l’eccezione, non la regola. E se lo si deve realizzare da zero, bisogna tener conto che un Data Warehouse richiede una rigorosa strutturazione dei dati prima del loro immagazzinamento, processo particolarmente complesso (e costoso !) perché va fatto a monte e deve riguardare tutte le informazioni, a prescindere dal loro successivo, possibile utilizzo.
Può quindi essere più utile pensare ad una soluzione di tipo “Data Lake”, e cioè predisporre un repository, eventualmente anche distribuito su macchine diverse, ma logicamente unitario, in grado di acquisire dati strutturati e non strutturati, sia in formato nativo, sia pre-consolidati, per consentire la loro successiva elaborazione nella maniera più flessibile.
Semplificando un po’, possiamo dire che un Data Lake è una sorta di Data Warehouse “un po’ meno strutturato”, in cui però possiamo sempre reperire ed incrociare le informazioni che ci interessano, non sulla base di un’organizzazione rigida definita a monte, ma in funzione delle analisi che intendiamo effettuare.
Usando un minimo di tecnicismo in più, diciamo che un Data Lake ci consente la configurazione flessibile di diversi modelli di dati, sula base di query che vengono definite ad hoc su ciò che vogliamo leggere (modello “on-read”), mentre un Data Warehouse ha un approccio ai modelli più rigido, basato in sostanza su come i dati sono stati scritti (modello “on-write”).
Infine, le due soluzioni non sono equivalenti da un punto di vista economico. Strutturare un Data Warehouse è un processo lungo e decisamente costoso, richiedendo a monte una completa analisi delle informazioni di cui si dispone, e soprattutto di cosa vogliamo ottenere da esse. Se nel corso del tempo le esigenze si modificano, anche solo perché ne vengono alla luce di nuove - fatto frequentissimo nelle Organizzazioni Sanitarie -, è necessario rimettere mano all’intera struttura, con tempi e costi in genere molto elevati.
Un Data Lake, invece, consente di immagazzinare dati eventualmente anche in formato nativo, delegando poi alle query dei sistemi di Business Intelligence la loro estrazione ed analisi, sulla base delle esigenze che via via emergono. In sostanza, dal maggiore livello di astrazione che si ottiene, deriva una consistente riduzione dei costi: “si paga solo per ciò che si usa effettivamente”.
L’esperienza di BI Health in questo settore ci porta quindi a suggerire soluzioni di tipo Data Lake, laddove le Aziende non siano già dotate di un Data Warehouse completo e strutturato. L’efficientamento che ne deriverà, combinando minori costi con maggiore flessibilità operativa, consentirà ai manager ai diversi livelli di disporre delle risorse economiche e tecnologiche in grado di supportarli nei loro processi decisionali, volti a perseguire l’obiettivo fondamentale di aumentare la qualità dei servizi forniti, senza compromettere la sostenibilità del sistema.