ANALYTICS
Veeral Desai, Tim Fountaine, Kayvan Rowshankish
Giugno 2022
Harry Campbell
Tutte le aziende sono consapevoli del potere dei dati, ma quasi nessuna riesce a sfruttare fino in fondo le loro potenzialità. Il problema è che gli investimenti sui dati devono produrre valore in tempi ravvicinati e allo stesso tempo gettare le basi per il rapido sviluppo di utilizzi futuri, mentre le tecnologie in questo campo evolvono in modi imprevedibili, emergono nuovi tipi di dati e il volume dei dati continua ad aumentare.
Le esperienze di due aziende di livello globale dimostrano quanto siano inefficaci le strategie messe in campo attualmente per gestire queste sfide. La prima di queste due aziende, una grande banca dell’area Asia-Pacifico, aveva adottato l’approccio “big bang”, dando per scontato che fosse possibile conciliare in un colpo solo le esigenze di qualsiasi team di sviluppo analitico e di qualsiasi utilizzatore finale dei dati. Aveva lanciato un imponente programma per realizzare delle pipeline che consentissero di estrarre tutti i dati dei suoi sistemi, ripulirli e aggregarli in un “data lake” (un serbatoio di dati non strutturati, in formato nativo) sul cloud, senza perdere troppo tempo prima per allineare le sue iniziative alle esigenze commerciali. Dopo aver dedicato quasi tre anni alla creazione di una nuova piattaforma, la banca ha scoperto che solo una parte degli utilizzatori, per esempio quelli che cercano dati storici grezzi per analisi ad hoc, riusciva a usarla senza problemi. Inoltre, le necessità architettoniche fondamentali di molte potenziali applicazioni, come feed di dati in tempo reale per offerte personalizzate ai clienti, erano state trascurate, con il risultato che il programma generava poco valore per l’azienda.
La seconda azienda, una grande banca nordamericana, aveva istruito i suoi team ad attingere alle fonti dati e ai sistemi esistenti per conto proprio e poi mettere insieme le eventuali tecnologie aggiuntive necessarie per le diverse esigenze commerciali. I team sono riusciti a creare valore risolvendo sfide come il miglioramento della segmentazione dei clienti per i canali digitali e creando le condizioni per una rendicontazione efficace del rischio. Ma il risultato complessivo è stato un coacervo di pipeline dati personalizzate, difficili da adattare ad altri scopi. Ogni team doveva partire da zero e questo rendeva enormemente più lento e più costoso ogni sforzo di trasformazione digitale.
Ma se la strategia monolitica non funziona e quella dal basso neanche, qual è l’approccio giusto per i dati?
Noi abbiamo scoperto che le aziende ottengono risultati migliori quando trattano i dati come un prodotto. Quando una società sviluppa un prodotto commerciale, normalmente cerca di creare un’offerta che possa dare risposta alle necessità del maggior numero di utenti possibile, per massimizzare le vendite. Questo spesso significa sviluppare un prodotto di base che possa essere personalizzato per i diversi utenti. È quello che fanno i produttori automobilistici quando consentono ai clienti di aggiungere tutta una serie di opzioni speciali – sedili in pelle, vetri fumé, dispositivi antifurto e così via – al modello standard. Allo stesso modo, le app digitali spesso lasciano agli utenti la possibilità di personalizzare l’interfaccia (configurazioni, colori, contenuti visualizzati) o offrono piani e strutture di prezzo diversi per le diverse necessità degli utenti.
Con il passare del tempo, le aziende potenziano i loro prodotti, aggiungendo nuove caratteristiche (modifiche del motore che consentono di risparmiare carburante in un’automobile o una nuova funzionalità in un’applicazione) e propongono offerte completamente nuove in reazione a feedback degli utenti, valutazioni della performance e cambiamenti del mercato. E intanto che fanno tutto questo, le aziende cercano costantemente di accrescere l’efficienza della produzione. Ogni volta che possono, riutilizzano processi, macchinari e componenti esistenti. (I produttori automobilistici usano un telaio comune su macchine diversissime, per esempio, e gli sviluppatori di app riutilizzano blocchi di codice.) Trattare i dati più o meno nello stesso modo aiuta le aziende a barcamenarsi fra l’esigenza di usarli per produrre valore nell’immediato e l’esigenza di preparare le condizioni per ricavarne più valore in futuro.
Nel nostro lavoro abbiamo visto che le aziende che trattano i dati come un prodotto possono diminuire il tempo necessario per applicarli a nuovi casi d’uso di qualcosa come il 90%, ridurre il costo totale di possesso (tecnologia, sviluppo e manutenzione) anche del 30% e limitare gli oneri legati alla gestione dei rischi e dei dati. Nelle pagine che seguono descriveremo quali sono le caratteristiche di un prodotto dati e delineeremo le pratiche migliori per costruirne uno.
CHE COS’È UN PRODOTTO DATI?
Un prodotto dati fornisce un insieme di dati di elevata qualità e pronti per essere utilizzati, facilmente accessibili per i membri di un’organizzazione e utilizzabili per affrontare sfide commerciali di vario genere. Potrebbe, per esempio, offrire visuali a 360° dei clienti, inclusi tutti i dettagli che le diverse unità e i diversi sistemi di un’azienda raccolgono su di loro: comportamenti d’acquisto sul sito e nei negozi fisici, informazioni demografiche, metodi di pagamento, interazioni con il servizio clienti e altro ancora. Oppure potrebbe offrire visuali a 360° dei dipendenti o di un canale, come le filiali di una banca. Un altro prodotto potrebbe consentire “gemelli digitali”, usando i dati per replicare virtualmente l’operatività di beni o processi del mondo reale, come per esempio componenti chiave di macchinari o un’intera linea di produzione di una fabbrica.
Considerando l’ampia varietà di applicazioni possibili, i prodotti dati possono generare ritorni economici impressionanti. In una grande banca nazionale, un prodotto dati sulla clientela è stato applicato a quasi 60 casi d’uso, dall’attribuzione di punteggi di rischio di credito in tempo reale a chatbot che rispondono alle domande dei clienti (su più canali). Queste applicazioni hanno già garantito 60 milioni di dollari di entrate aggiuntive ed eliminato 40 milioni di dollari di perdite ogni anno. E quando il prodotto viene applicato a nuovi casi d’uso, il suo impatto continua a crescere.
I prodotti dati si basano sugli archivi dati operativi esistenti, come data warehouse (serbatoi di dati strutturati) e data lake. (Si veda il riquadro “Consumo tradizionale di dati contro modello del prodotto dati”.) I team che li usano non devono sprecare tempo a cercare i dati, elaborarli nel formato giusto e costruire insiemi di dati personalizzati e pipeline di dati (che a lungo andare creano un pasticcio architettonico e problemi di governance).
Ogni prodotto dati supporta “consumatori” di dati con esigenze difformi, più o meno come un prodotto software supporta utenti che lavorano su computer con sistemi operativi differenti. Questi consumatori sono sistemi, non persone, e il nostro lavoro sembra indicare che le organizzazioni di regola hanno cinque tipologie. Noi le chiamiamo “archetipi di consumo”, perché descrivono per cosa vengono usati i dati. Ecco questi archetipi di consumo:
1 Applicazioni digitali. Richiedono dati specifici che vengono ripuliti, archiviati nel formato necessario (magari come singoli messaggi in uno specifico evento o come tabella di record in un data mart, un’area di archiviazione dati orientata su un argomento, una funzione aziendale o un team) ed erogati con una frequenza prestabilita. Per esempio, una app digitale che traccia la posizione di un veicolo avrà bisogno di avere accesso in tempo reale a un evento generato da dati GPS o a dati rilevati da sensori. Una app di marketing progettata per estrapolare tendenze dai comportamenti di navigazione dei clienti avrà bisogno di poter accedere su richiesta a grandi volumi di dati di log sul web (spesso definiti dati “batch”) da un data mart.
2 Sistemi avanzati di analytics. Anche in questo caso è necessario che i dati vengano ripuliti ed erogati con una frequenza prestabilita, ma devono essere progettati in modo da permettere a sistemi di apprendimento automatico e intelligenza artificiale, come motori di simulazione e ottimizzazione, di elaborarli.
3 Sistemi di reportistica. Necessitano di dati fortemente governati (dati con definizioni chiare e gestiti attentamente per tenere conto della qualità, della sicurezza e delle variazioni) da aggregare a livello base ed erogare previa revisione per essere utilizzati su interfacce o per attività normative e di controllo conformità. Normalmente, i dati devono essere erogati in batch, ma le aziende avanzano sempre di più verso modelli fai-da-te e aggiornamenti infragiornalieri che includono feed in tempo reale.
4 Spazi di sperimentazione. Consentono l’analisi esplorativa ad hoc di una combinazione di dati grezzi e aggregati. Gli esperti e gli ingegneri di dati li usano spesso per scavare nei dati e scoprire nuovi possibili casi d’uso.
5 Sistemi di condivisione di dati esterni. Devono rispettare politiche stringenti e accordi sul posizionamento dei dati e il modo in cui vengono gestiti e protetti. Le banche usano questi sistemi per condividere fra loro informazioni sulle frodi, per esempio, e le società di commercio al dettaglio per condividere dati con i fornitori nella speranza di migliorare le catene logistiche.
Ogni archetipo di consumo richiede tecnologie differenti per l’archiviazione, la lavorazione e la consegna dei dati, e impone di assemblare queste tecnologie in una forma specifica, che è essenzialmente un prototipo architettonico di come incastrare fra loro le tecnologie necessarie. Per esempio, nel caso degli spazi di sperimentazione lo schema includerebbe con ogni probabilità tecnologie che consentano di creare un ambiente fai-da-te multiutente a disposizione degli ingegneri di dati di tutta l’azienda. Per un sistema di analitica avanzato che usa dati in tempo reale, potrebbe includere tecnologie per lavorare grossi volumi di dati non strutturati.
Come un mattoncino Lego, un prodotto dati congegnato per supportare uno o più di questi archetipi di consumo può facilmente essere incastrato con tutte le applicazioni commerciali desiderate.
Prendiamo il caso di una compagnia mineraria che aveva creato un prodotto dati che forniva in tempo reale feed di dati GPS sul minerale, il trasporto e la posizione camion. Era stato disegnato in modo da supportare tutti gli archetipi tranne la condivisione di dati esterni per il suo primo caso d’uso (migliorare le rese della lavorazione del minerale): la compagnia si è resa conto ben presto che il prodotto aveva utilizzi che andavano ben al di là. Una volta che il prodotto è stato reso accessibile a tutta l’organizzazione, diversi impiegati intraprendenti l’hanno immediatamente usato per eliminare colli di bottiglia nel sistema di trasporto della miniera. Nel giro di appena tre giorni, hanno costruito il prototipo di uno strumento per agevolare le decisioni su dove inviare i camion che ha ridotto i tempi di coda e le emissioni di anidride carbonica. Se avessero dovuto elaborare i dati partendo da zero, avrebbero impiegato quasi tre mesi.
Quando la notizia ha cominciato a girare, dipendenti interessati ad altre problematiche riguardanti i camion, come la sicurezza, la manutenzione e la programmazione dei turni di lavoro dei guidatori, hanno attinto ai dati per trovare risposte a interrogativi spinosi e costruire soluzioni in grado di generare ricavi che prima sarebbero state impossibili.
GESTIRE E SVILUPPARE PRODOTTI DATI
Che vendano berline, software o scarpe da ginnastica, la maggior parte delle imprese ha responsabili di prodotto interni che si occupano di condurre ricerche sulle esigenze di mercato, sviluppare roadmap delle funzionalità del prodotto e progettare e vendere con profitto i prodotti.
Allo stesso modo, ogni prodotto dati dovrebbe avere un responsabile di prodotto designato con il compito di mettere insieme un team di esperti per costruire, supportare e migliorare il prodotto nel tempo. Sia il responsabile di prodotto che gli esperti dovrebbero far parte di un data utility group all’interno di un’unità aziendale. Di regola, questi gruppi includono ingegneri dei dati, architetti dei dati, esperti di modellizzazione dei dati, ingegneri di piattaforme dati ed esperti di SRE (site reliability engineering). Grazie al fatto di essere incorporati alle unità aziendali, i team dei prodotti dati ottengono rapido accesso agli esperti dell’azienda sulla materia in questione e all’assistenza di cui hanno bisogno per quanto riguarda l’operatività, il processo, gli aspetti legali e i rischi, e in questo modo riescono a sviluppare prodotti dati utili e conformi. Inoltre, in questo modo i team sono in collegamento diretto con i feedback degli utenti, che li aiutano a migliorare costantemente i loro prodotti e individuare nuovi utilizzi. La prima versione del prodotto dati sulla clientela della banca nazionale, per esempio, era focalizzata sui profili demografici dei clienti e le informazioni sulle transazioni. Le versioni successive includevano dati sulle interazioni con i clienti e sui clienti potenziali, e questo attirò un numero molto maggiore di utilizzatori di dati e fornì supporto ai team che stavano sviluppando altre applicazioni. I risparmi e i ricavi incrementali realizzati dai primi utilizzatori del prodotto dati hanno finanziato le fasi successive, creando un modello d’impresa sostenibile.
Un’azienda ha bisogno anche di un centro di eccellenza per supportare i team di prodotto e fissare i criteri e le pratiche migliori per costruire prodotti dati in tutta l’organizzazione. Per esempio, le modalità con cui i team sono tenuti a documentare la provenienza dei dati, rivedere il loro utilizzo e misurarne la qualità, e i criteri per disegnare i modelli di archetipo di consumo che dovranno essere utilizzati dai team di prodotto dati devono essere definiti a livello centrale. Questo approccio può eliminare la complessità e gli sprechi. Inoltre, le direttive impartite dal centro possono essere una risorsa per talenti specialistici o esperti di dati quando c’è bisogno di loro negli utility group o nei team focalizzati sui casi d’uso commerciali specifici. Per esempio, in una società di servizi di telecomunicazioni con cui abbiamo lavorato, gli esperti di visione artificiale, che sono pochi ma spesso richiesti, lavorano nelle funzioni centrali e vengono mandati nelle varie unità aziendali su richiesta.
Molte aziende hanno già una parte o tutti i talenti necessari per costruire i loro utility group e i loro centri di eccellenza, ma molte altre dovranno infoltire il loro pool di esperti in certi ambiti, in particolare per quanto riguarda gli ingegneri dei dati in grado di ripulire, trasformare e aggregare dati per l’analisi e l’esplorazione.
È quello che ha dovuto fare, per citare un esempio specifico, la compagnia mineraria, che ha dovuto portare il suo staff di ingegneri dei dati da 3 a 40 persone. Per colmare questa lacuna così importante, i vertici dell’azienda hanno adottato un approccio graduale: prima hanno assoldato società esterne per affidargli il lavoro immediato; quindi hanno avviato uno sforzo di reclutamento ad ampio raggio, organizzando eventi di networking, pubblicando articoli su LinkedIn, aggiornando le competenze degli ingegneri software già sul libro paga e sviluppando programmi di stage con college e università locali. Per ridurre il ricambio di personale, hanno creato una “gilda” di ingegneri dei dati per aiutarli a costruire le loro competenze e condividere le pratiche migliori. La società ha anche disegnato piani individualizzati per queste figure professionali, per fare in modo che potessero contare su un percorso di crescita chiaro dopo il loro ingresso in azienda.
TRACCIAMENTO DELLA PERFORMANCE E DELLA QUALITÀ
Per capire se un prodotto commerciale è un successo, le organizzazioni vanno a guardare barometri come vendite, fidelizzazione, coinvolgimento e soddisfazione della clientela e redditività. I prodotti dati possono essere valutati con parametri adeguati, come il numero di utenti mensili attivi, il numero di applicazioni in tutta l’azienda e il ritorno dell’investimento per casi d’uso.
La società di telecomunicazioni ha tracciato l’impatto del suo primo prodotto dati (che forniva informazioni esaustive su attrezzature fondamentali della rete cellulare) in 150 casi d’uso, fra cui sistemi decisionali per investimenti, sistemi di pianificazione di scenari e motori di ottimizzazione della rete. In totale, avrebbero prodotto centinaia di milioni di dollari tra risparmi sui costi e nuovi introiti nel giro di tre anni. La società calcola che nei primi dieci anni i casi d’uso avranno un impatto finanziario cumulativo di 5 miliardi di dollari, con un rendimento molte volte superiore all’investimento iniziale.
E così come i produttori usano abitualmente test della qualità o ispezioni delle linee di produzione per accertarsi che i loro prodotti funzionino come promesso, quelli che gestiscono prodotti dati possono prendere misure per assicurare la qualità dei dati delle loro offerte. Per fare questa cosa devono gestire in modo rigoroso le definizioni (stabilendo in linea di massima, per esempio, se i dati sui clienti devono includere solo i clienti attivi o anche gli ex clienti e i clienti potenziali), la disponibilità e i controlli sull’accesso ai dati. Devono anche lavorare a stretto contatto con i dipendenti che gestiscono i sistemi di fonti di dati o hanno la responsabilità dell’integrità dei dati. (Questi ultimi sono chiamati a volte data steward).
La qualità può risentirne, per esempio, quando gli stessi dati vengono intercettati in modi diversi su sistemi diversi, traducendosi in una duplicazione delle voci. Era uno dei rischi che si correva nel caso del prodotto dati sulla clientela della banca nazionale. Il responsabile prodotto lavorò con gli steward dei vari serbatoi di dati e applicazioni dell’azienda per istituire un identificativo univoco per ogni cliente. In questo modo, i dati sui clienti potevano essere integrati senza problemi a qualsiasi caso d’uso o qualsiasi prodotto dati collegato. Il responsabile di prodotto collaborò anche con il centro di eccellenza per sviluppare i criteri e le politiche che governano i dati sui clienti in tutta l’impresa e per monitorare la compliance, tutte cose che facilitavano il riutilizzo del prodotto dati e al tempo stesso permettevano di costruire fiducia presso gli utilizzatori.
DA DOVE COMINCIARE
Gli alti dirigenti chiedono spesso quali prodotti dati e archetipi di consumo possono ottenere il ritorno maggiore e più rapido sull’investimento. La risposta è diversa per ogni organizzazione.
Per trovare il giusto approccio per la propria azienda, i manager devono valutare la fattibilità e il valore potenziale dei casi d’uso in ogni ambito imprenditoriale (potrebbe essere un processo aziendale fondamentale, un percorso cliente o percorso dipendente, una funzione) e raggrupparli prima in base ai prodotti dati di cui hanno bisogno e poi in base agli archetipi di consumo coinvolti. Categorizzare i casi d’uso come questi aiuta i leader a sequenziare più efficientemente il lavoro e ottenere un ritorno più rapido sull’investimento. Per esempio, possono finire per promuovere alcuni casi d’uso di minor valore, se sfruttano i prodotti dati e gli archetipi di consumo dei casi d’uso di maggior valore.
Per i dirigenti della banca nazionale, questo approccio ha richiamato l’attenzione su diverse priorità. Innanzitutto, si è visto che un prodotto dati sulla clientela che supportava i loro casi d’uso più importanti per la gestione delle frodi e il marketing poteva generare un valore enorme. Poi sono state individuate le tipologie di dati che il prodotto doveva raccogliere per prime. Alcuni di questi casi d’uso richiedevano identificativi cliente e dati di riferimento basilari (per esempio dati demografici o di segmentazione), mentre altri richiedevano dati comportamentali completi sui clienti. La banca si è accorta anche che i due archetipi di consumo che doveva perseguire per primi erano uno spazio di sperimentazione e un’analitica avanzata, che combinati insieme potevano supportare buona parte dei casi d’uso prioritari dell’azienda per quanto riguarda le frodi e il marketing.
Le decisioni sui prodotti dati spesso implicano compromessi fra impatto, fattibilità e velocità. Idealmente, i prodotti target iniziali e gli archetipi di consumo saranno immediatamente applicabili a casi d’uso di alto valore e una lunga pipeline di altri, come il prodotto dati della società di servizi di telecomunicazioni per la sua attrezzatura per reti cellulari.
Tuttavia, considerazioni di fattibilità possono indurre un’azienda a correggere il suo approccio. Per esempio, può avere senso concentrare gli sforzi prima di tutto in un’area dell’organizzazione che ha competenza sui dati e un certo peso sui prodotti dati, anche se non è lì che risiedono le opportunità maggiori. Abbiamo visto all’opera questo meccanismo nel caso della compagnia mineraria, che inizialmente aveva scelto di sviluppare due prodotti che supportavano il suo impianto di trattamento dei minerali, dove erano già stati sperimentati con successo alcuni casi d’uso, la dirigenza era entusiasta e voleva provarne altri, il team aveva un mucchio di dati già pronti con cui lavorare e poteva chiedere aiuto a esperti che avevano una profonda conoscenza della materia.
La maggior parte dei leader oggi si impegna al massimo per trasformare i dati in una fonte di vantaggio competitivo. Ma queste iniziative possono rapidamente fare cilecca se le organizzazioni non si preoccupano di assicurarsi che il lavoro che fanno oggi possa essere riutilizzato domani. Le aziende che gestiscono i loro dati come un prodotto si troveranno ad avere un vantaggio di mercato importante negli anni a venire, grazie agli incrementi di velocità e flessibilità e le nuove opportunità che quell’approccio può aprire.
Veeral Desai è senior expert dell’ufficio di Sydney della Quantum Black, AI della McKinsey & Company. Tim Fountaine è un senior partner dell’ufficio di Sydney della McKinsey & Company. Kayvaun Rowshankish è un senior partner dell’ufficio di New York della McKinsey & Company.
