Negli ultimi due decenni, i dati sono diventati una risorsa inestimabile per le aziende, rivaleggiando con risorse tradizionali come l’infrastruttura fisica, la tecnologia, la proprietà intellettuale e il capitale umano. Per alcune delle aziende di maggior valore al mondo, i dati costituiscono il fulcro del loro modello di business.
La portata della produzione e trasmissione dei dati è cresciuta in modo esponenziale. Forbes riporta che la produzione globale di dati è aumentata da 2 zettabyte nel 2010 a 44 ZB nel 2020, con proiezioni che supereranno i 180 ZB entro il 2025: una crescita sbalorditiva del 9.000% in soli 15 anni, in parte guidata dall’intelligenza artificiale.
Tuttavia, i dati grezzi da soli non equivalgono a informazioni fruibili. I dati non elaborati possono sopraffare gli utenti, ostacolandone potenzialmente la comprensione. Le informazioni, ossia i dati elaborati, organizzati e consumabili, generano insight che portano ad azioni e alla generazione di valore.
Questo articolo condivide la mia esperienza nell’analisi dei dati e nell’implementazione di strumenti digitali, concentrandosi sullo sfruttamento dei “Big Data” per creare informazioni strategiche. Queste informazioni hanno consentito agli utenti di sfruttare le opportunità commerciali, identificare aree di risparmio sui costi e accedere a utili informazioni di benchmarking. I nostri progetti spesso incorporavano l’automazione, ottenendo risparmi di tempo e guadagni di efficienza. Evidenzierò le principali sfide che abbiamo affrontato e le nostre soluzioni, sottolineando le fasi iniziali del progetto in cui le decisioni hanno l’impatto più significativo.
Le principali aree di interesse includono:
- Quantificazione dei benefici
- Il rischio di spostamento dell’ambito
- Affrontare le sfide con i dati PDF
- Considerazioni sulla fase di progettazione e sulle prestazioni
Nelle grandi organizzazioni, la disponibilità e l’accessibilità dei dati spesso pongono sfide significative, soprattutto quando si combinano dati provenienti da più sistemi. La maggior parte dei miei progetti mirava a creare un set di dati unificato e armonizzato per analisi self-service e dashboard approfonditi. Abbiamo utilizzato metodologie agili per mantenere una chiara supervisione dei progressi e dei colli di bottiglia, garantendo la responsabilità di ciascun membro del team.
Il ciclo di vita tipico dei progetti dati comprende le fasi di definizione dell’ambito, progettazione, sviluppo, implementazione e sostegno. Durante la definizione dell’ambito, il proprietario del prodotto collabora strettamente con l’organizzazione cliente/utente finale per cogliere le esigenze generali, i tipi di dati desiderati e gli approfondimenti, i requisiti e le funzionalità.
Quantificazione dei benefici
Un elemento cruciale della fase di definizione dell’ambito è il caso di beneficio, in cui quantifichiamo il valore potenziale della soluzione. Nella mia esperienza, questo passaggio si rivela spesso impegnativo, in particolare quando si stima il valore degli approfondimenti analitici. Ho scoperto che, sebbene calcolare i vantaggi dell’automazione, come il risparmio di tempo, sia relativamente semplice, gli utenti hanno difficoltà a stimare il valore degli insight, soprattutto quando hanno a che fare con dati precedentemente non disponibili.
In un progetto fondamentale, abbiamo affrontato questa sfida a testa alta. Stavamo sviluppando un modello di dati per fornire informazioni più approfondite sui contratti logistici. Durante la fase di scoping, abbiamo faticato a quantificare i potenziali benefici. È stato solo quando abbiamo scoperto un recente incidente che abbiamo trovato la nostra risposta.
Pochi mesi prima, il cliente aveva scoperto che stava pagando più del dovuto per un gasdotto specifico. La struttura del contratto, con diversi flussi volumetrici che determinano tariffe variabili, aveva portato a un utilizzo non ottimale e a costi eccessivi. Regolando i flussi di volume, sono riusciti a ridurre significativamente i costi unitari. Questo esempio del mondo reale si è rivelato prezioso nel nostro processo di quantificazione dei benefici.
Abbiamo utilizzato questo incidente per dimostrare come il nostro modello di dati avrebbe potuto:
- Identificato il problema in anticipo, risparmiando potenzialmente mesi di pagamenti in eccesso
- Fornito un monitoraggio continuo per prevenire problemi simili in futuro
- Offerto approfondimenti per ottimizzare le portate in tutti i contratti
Questo esempio concreto non solo ci ha aiutato a quantificare i benefici, ma ha anche elevato la priorità del progetto presso il senior management, garantendoci i finanziamenti di cui avevamo bisogno. È stata una lezione cruciale sul potere di utilizzare eventi recenti e tangibili per illustrare il potenziale valore.
Tuttavia, non tutti i progetti presentano esempi così chiari. In questi casi, ho sviluppato approcci alternativi:
- Benchmarking: confrontiamo le prestazioni del dipartimento con quelle di altri dipartimenti o concorrenti, identificando le prestazioni migliori della categoria e quantificando il valore del raggiungimento di quel livello.
- Miglioramento percentuale: stimiamo un miglioramento percentuale conservativo delle entrate o dei costi complessivi del dipartimento risultanti dal modello. Anche una piccola percentuale può tradursi in un valore significativo nelle grandi organizzazioni.
Indipendentemente dal metodo, ho imparato l’importanza di definire criteri di successo chiari e misurabili. Ora stabiliamo sempre come verranno misurati i benefici dopo l’implementazione. Questa pratica non solo facilita una rivalutazione più semplice, ma garantisce anche la responsabilità per la decisione di implementazione della soluzione digitale.
Un’altra lezione preziosa è arrivata da una fonte inaspettata. In diversi progetti abbiamo scoperto “clienti secondari”: dipartimenti o team che avrebbero potuto trarre vantaggio dal nostro modello dati ma che non rientravano nell’ambito originale. In un caso, un modello progettato per il team logistico si è rivelato prezioso per il dipartimento finanziario nelle attività di definizione del budget e delle previsioni.
Questa esperienza mi ha insegnato a gettare una rete più ampia nella definizione della base clienti. Ora guardiamo regolarmente oltre il dipartimento richiedente durante la fase di definizione dell’ambito. Questo approccio ha spesso aumentato i vantaggi e le priorità complessive del progetto, trasformando talvolta un progetto marginale in un’iniziativa indispensabile.
Queste esperienze sottolineano una visione fondamentale: nelle grandi organizzazioni, più utenti in aree diverse spesso sono alle prese con problemi simili senza rendersene conto. Identificando tempestivamente queste sinergie, possiamo creare soluzioni più complete e preziose e costruire casi più solidi per l’implementazione.
Il rischio di spostamento dell’ambito
Se da un lato l’ampliamento della base di clienti aumenta l’impatto del modello, dall’altro aumenta anche il rischio di spostamento dell’ambito. Ciò si verifica quando un progetto cerca di accogliere troppe parti interessate, promettendo funzionalità eccessive o eccessivamente complesse, compromettendo potenzialmente budget e tempistiche. Il proprietario del prodotto e il team devono comprendere chiaramente le proprie risorse e le capacità di consegna realistiche entro i tempi concordati.
Per mitigare questo rischio:
- Anticipare alcuni lavori di progettazione durante la fase di definizione dell’ambito.
- Valutare se i nuovi requisiti possono essere soddisfatti con le fonti dati esistenti o se è necessario acquisirne di nuove.
- Definire aspettative chiare e realistiche con la gestione del cliente in merito all’ambito e alla fattibilità.
- Crea un modello manuale del prodotto finale durante la definizione dell’ambito per chiarire i requisiti dell’origine dati e offrire agli utenti finali un’anteprima tangibile del risultato.
- Utilizza sottoinsiemi di dati effettivi nei modelli anziché dati fittizi, poiché gli utenti si relazionano meglio con le informazioni familiari.
Le sfide legate ai dati PDF
Diversi progetti hanno evidenziato le sfide nell’acquisizione dei dati PDF. Gli utenti spesso richiedevano dettagli di fatture ed estratti conto di fornitori di terze parti non disponibili nei nostri sistemi finanziari. Mentre i team di contabilità in genere prenotano versioni riepilogative, gli utenti avevano bisogno dei dettagli delle voci per l’analisi.
L’estrazione dei dati dai PDF richiede la definizione di regole e logica per ciascun elemento di dati, uno sforzo sostanziale che vale solo per più PDF con strutture simili. Tuttavia, quando si ha a che fare con documenti provenienti da migliaia di fornitori con formati diversi che possono cambiare nel tempo, lo sviluppo di regole di mappatura diventa un compito immenso.
Prima di includere l’estrazione PDF nell’ambito di un progetto, ora richiedo una conoscenza approfondita dei documenti coinvolti e mi assicuro che l’organizzazione dell’utente finale copra pienamente le sfide associate. Questo approccio ha spesso portato alla ridefinizione dell’ambito del progetto, poiché i benefici potrebbero non giustificare i costi e potrebbero esistere mezzi alternativi per ottenere le informazioni desiderate.
Considerazioni sulla fase di progettazione e sulle prestazioni
La fase di progettazione prevede l’analisi degli elementi con ambito, l’identificazione delle fonti di dati, la valutazione dei metodi ottimali di interfaccia dei dati, la definizione delle fasi di curation e calcolo e la documentazione del modello di dati complessivo. Comprende anche decisioni sull’hosting dei modelli di dati, sulle applicazioni software per il trasferimento e la visualizzazione dei dati, sui modelli di sicurezza e sulla frequenza del flusso di dati. I requisiti di progettazione chiave includono in genere granularità dei dati, affidabilità, flessibilità, accessibilità, automazione e prestazioni/velocità.
Le prestazioni sono cruciali, poiché gli utenti si aspettano risposte quasi in tempo reale. I modelli lenti, indipendentemente dalle loro intuizioni, spesso vedono un uso limitato. I metodi comuni di miglioramento delle prestazioni includono la materializzazione del set di dati finale per evitare calcoli basati sulla cache. Anche la scelta dello strumento di visualizzazione influisce in modo significativo sulle prestazioni. Testare vari strumenti durante la fase di progettazione e cronometrare ciascuna fase del modello aiuta a orientare la selezione degli strumenti. La scelta dello strumento può influenzare la progettazione, poiché ciascuno strumento ha strutture dati preferite, sebbene la strategia aziendale e le considerazioni sui costi possano in definitiva guidare la decisione.
Tendenze future
Le tendenze emergenti stanno rimodellando il panorama dell’analisi dei dati. Gli strumenti di preparazione e analisi dei dati ora consentono ai non sviluppatori di creare modelli di dati utilizzando interfacce grafiche intuitive con funzionalità di trascinamento della selezione. Gli utenti possono simulare e visualizzare ogni passaggio, consentendo la risoluzione dei problemi al volo. Questa democratizzazione della modellazione dei dati estende la tendenza dell’analisi self-service, consentendo agli utenti di creare i propri modelli di dati.
Sebbene esistano limiti alla complessità dei prodotti dati creati dagli utenti finali e le organizzazioni possano ancora preferire set di dati aziendali amministrati centralmente per dati ampiamente utilizzati, questi strumenti stanno espandendo le capacità di modellazione dei dati oltre i professionisti IT.
Un’esperienza personale illustra l’impatto di questa tendenza: durante la fase di definizione dell’ambito di un progetto, di fronte alla potenziale perdita di uno sviluppatore, siamo passati da un modello programmato in SQL ad Alteryx. Il proprietario del prodotto ha creato con successo il modello dati con un supporto IT minimo, migliorando sia le proprie competenze tecniche che la soddisfazione lavorativa.
La socializzazione della creazione di strumenti analitici complessi offre vantaggi significativi. Le aziende dovrebbero prendere in considerazione la possibilità di fornire programmi di formazione per massimizzare il valore di queste applicazioni. Inoltre, gli assistenti IA possono suggerire o eseguire il debug del codice, accelerando ulteriormente l’adozione di questi strumenti. Questo cambiamento potrebbe trasformare ogni dipendente in un professionista dei dati, estraendo il massimo valore dai dati aziendali senza un ampio supporto IT.
Sblocca il valore dei dati
Il processo decisionale basato sui dati sta vivendo una rapida crescita in tutti i settori. Per sbloccare il valore dei dati, è necessario trasformarli in informazioni strutturate e fruibili. I progetti di analisi dei dati mirano a consolidare i dati provenienti da varie fonti in un set di dati centralizzato e armonizzato pronto per il consumo da parte dell’utente finale.
Questi progetti comprendono diverse fasi – definizione dell’ambito, progettazione, costruzione, implementazione e sostegno – ciascuna con sfide e opportunità uniche. La fase di definizione dell’ambito è particolarmente critica, poiché le decisioni prese qui hanno un profondo impatto sull’intero ciclo di vita del progetto.
Il modello tradizionale di affidamento a sviluppatori IT dedicati si sta evolvendo con l’avvento di strumenti di preparazione e analisi dei dati di facile utilizzo, integrati da assistenti IA. Questa evoluzione riduce gli ostacoli alla costruzione di modelli analitici, consentendo a una gamma più ampia di utenti finali di partecipare al processo. In definitiva, questa democratizzazione dell’analisi dei dati amplificherà ulteriormente il suo impatto sul processo decisionale aziendale, guidando l’innovazione e l’efficienza in tutte le organizzazioni.