Aprile 2020

L’intelligenza artificiale contro questa pandemia, e la prossima

Theos Evgeniou, David R. Hardoon, Anton Ovchinnikov

23 Aprile 2020

Negli ultimi mesi il mondo ha vissuto una serie di epidemie di Covid-19 che hanno generalmente seguito lo stesso percorso: una fase iniziale con poche infezioni e risposta limitata, seguita da un decollo della famosa curva epidemica accompagnata da un blocco a livello nazionale per appiattire la curva.  Poi, una volta che la curva ha raggiunto il picco, i Governi devono affrontare quella che il presidente Trump ha definito “la più grande decisione” della sua vita: quando e come gestire il termine della fase di isolamento sociale.

Durante tutta la pandemia, grande enfasi è stata posta sulla condivisione (o sulla mancanza) di informazioni critiche tra i diversi Paesi - in particolare dalla Cina - sulla diffusione della malattia.  Al contrario, si è detto relativamente poco su come Covid-19 avrebbe potuto essere gestito meglio sfruttando le tecnologie avanzate dei dati che hanno trasformato le aziende negli ultimi 20 anni. In questo articolo si discute di un modo in cui i Governi potrebbero sfruttare queste tecnologie per gestire una futura pandemia - e forse anche le fasi di chiusura di quella attuale.

Il potere della previsione personalizzata

Un approccio alternativo che i responsabili politici possono considerare di aggiungere nel loro mix di azioni per combattere Covid-19 si basa sulla tecnologia della previsione personalizzata, che ha trasformato molti settori negli ultimi 20 anni. Utilizzando le tecnologie del machine learning e dell’intelligenza artificiale (IA), le aziende basate sui dati (dalla “Big Tech” ai servizi finanziari, ai viaggi, alle assicurazioni, alla vendita al dettaglio e ai media) forniscono raccomandazioni personalizzate su cosa acquistare e gestiscono prezzi, rischi, crediti e mutui personalizzati utilizzando i dati che hanno raccolto sui loro clienti.

In un recente articolo di HBR, ad esempio, Ming Zeng, ex chief strategy officer di Alibaba, ha descritto come Ant Financial, la divisione che gestisce i prestiti per le piccole imprese della sua società, può valutare i richiedenti di prestiti in tempo reale analizzando i dati delle loro transazioni e delle comunicazioni sulle piattaforme di e-commerce di Alibaba. Nel frattempo, aziende come Netflix valutano le scelte e le caratteristiche passate dei consumatori per fare previsioni su cosa guarderanno dopo.

Lo stesso approccio potrebbe funzionare per le pandemie - e anche per le prossime azioni su Covid-19. Utilizzando molteplici fonti di dati, i modelli di machine learning verrebbero addestrati per misurare il rischio clinico di un individuo di subire gravi esiti (se infettato da Covid): qual è la probabilità che possa avere bisogno di cure intensive, per le quali le risorse sono limitate? Quant’è probabile un esito fatale? I dati potrebbero includere le storie mediche di base degli individui (per Covid-19, la gravità dei sintomi sembra aumentare con l’età e con la presenza di co-morbidità come il diabete o l’ipertensione) così come altri dati, come la composizione della famiglia. Ad esempio, un individuo giovane e sano (che altrimenti potrebbe essere classificato come “a basso rischio”) potrebbe essere classificato come “ad alto rischio” se vive con persone anziane o malate che probabilmente avrebbero bisogno di cure intensive in caso di infezione.

Queste previsioni di rischio clinico potrebbero poi essere utilizzate per personalizzare le politiche e l’allocazione delle risorse a livello di individuo/famiglia, tenendo conto in modo appropriato delle responsabilità e dei rischi medici standard. Potrebbero, ad esempio, consentirci di mirare al distanziamento sociale e alla protezione per coloro che hanno punteggi di rischio clinico elevati, consentendo al tempo stesso a coloro che hanno punteggi bassi di vivere più o meno normalmente. I criteri per l’assegnazione degli individui a gruppi ad alto o basso rischio dovrebbero, naturalmente, essere determinati, considerando anche le risorse disponibili, i rischi di responsabilità medica e altri fattori di rischio, ma gli approcci della scienza dei dati per questo sono standard e utilizzati in numerose applicazioni.

Un approccio personalizzato ha molteplici vantaggi. Può aiutare a costruire l’immunità del gregge con una mortalità più bassa e veloce. Permetterebbe anche una migliore - e più equa - allocazione delle risorse, per esempio di attrezzature mediche scarse (come kit di prova, maschere protettive e letti d’ospedale) o di altre risorse.

Le strategie di de-confinamento nelle fasi successive di una pandemia - un prossimo passo fondamentale per Covid-19 nella maggior parte dei Paesi - possono beneficiarne in modo simile. Decidere con quali persone avviare il processo di fine del confinamento è, per natura, un problema di classificazione simile ai problemi di classificazione familiari alla maggior parte delle aziende che si occupano di dati.  Alcuni Governi si stanno già avvicinando al de-confinamento utilizzando l’età come fattore indicativo del rischio, una classificazione relativamente grezza che potenzialmente manca nel caso di altri individui ad alto rischio (come l’esempio sopra citato dei giovani sani che vivono con gli anziani).

L’esecuzione di una classificazione basata su dati e modelli di previsione dell’IA potrebbe portare a decisioni di de-confinamento che sono sicure a livello di comunità e molto meno costose per l’individuo e l’economia. Sappiamo che una caratteristica chiave di Covid-19 è che ha un tasso di trasmissione eccezionalmente alto, ma anche sintomi gravi o tassi di mortalità relativamente bassi. I dati indicano che forse più del 90% delle persone infette sono asintomatiche o presentano sintomi lievi quando sono infette.

In teoria, con una previsione affidabile di chi sia questo 90% potremmo de-confinare tutti questi individui. Anche se si infettassero l’un l’altro, non presenterebbero sintomi gravi e non travolgerebbero il sistema medico né morirebbero. Queste persone a basso rischio clinico del 90% potrebbero anche aiutare il rapido accumulo di un’elevata immunità del gregge, e a quel punto anche il restante 10% potrebbe essere de-confinato.

Se un punteggio di previsione si rivelasse errato, le conseguenze sarebbero limitate alle persone “più sicure” che sono state rilasciate per la prima volta dal confinamento. Potrebbero essere gestiti con le risorse mediche disponibili, che non verrebbero assorbite eccessivamente se si dovesse trattare il restante 10% o più di persone ad alto rischio che rimangono confinate. In pratica, naturalmente, introdurremmo il de-confinamento in modo più graduale, partendo prima dai gruppi a più basso rischio clinico e costruendo nel tempo l’immunità di gregge.

Naturalmente non abbiamo modelli perfetti di previsione del rischio clinico, così come non abbiamo sistemi di triage ospedaliero perfetti o modelli perfetti di previsione dei default creditizio. Tuttavia, questo non ferma l’erogazione di credito a molte aziende e individui che, con strumenti di valutazione del merito di credito abbastanza buoni, per lo più non sono inadempienti. La posta in gioco in questo caso è significativamente più alta di quella di un’inadempienza di un prestito, quindi dobbiamo rendere i modelli il più robusti possibile. Ma questo non significa che non dovremmo considerare di utilizzarli.

A differenza dei test medici che sono scarsi, costosi e lenti da implementare, questo approccio alla personalizzazione digitale dei dati clinici può essere applicato rapidamente ed è facile da scalare. Potrebbe consentire, con i giusti modelli, un de-confinamento più sicuro a un ritmo molto più rapido rispetto alle attuali best practice di Covid-19, in base alle quali chiunque sia infetto e i suoi contatti rimarrebbero in isolamento, anche se a basso rischio. 

Ottenere i dati

Attualmente, i dati necessari per valutare il rischio clinico di un individuo che contrae un determinato virus non sono facilmente accessibili. I Governi possono certamente aumentare la raccolta di dati sanitari nazionali creando o diffondendo cartelle cliniche elettroniche più complete, ma il valore di queste può essere limitato in quanto ci vorrebbe del tempo prima che emergano modelli ricavati dai dati storici delle cartelle cliniche e dall’impatto di un virus sulle sue vittime.

In un contesto di una pandemia che potrebbe colpire rapidamente milioni di persone a livello globale, un approccio migliore potrebbe essere quello di creare e condividere un modello di previsione "addestrato" utilizzando i dati di un’epidemia iniziale.  Un set di dati con decine di migliaia di individui gravemente colpiti (quelli che richiedono una terapia intensiva), bilanciato con molti altri relativamente meno colpiti (quelli che presentano sintomi lievi), è abbastanza ampio da consentire un certo livello di previsione personalizzata, la cui qualità migliora con l’aggiunta di un maggior numero di dati.

Una volta che un modello è in funzione, può essere condiviso per aiutare altre città e persino Paesi nelle prime fasi della diffusione, perché i dati biologici e fisiologici principali che stanno alla base delle cartelle cliniche delle persone non variano molto (tutti invecchiano, e il diabete a Wuhan è lo stesso del diabete a Roma o Baltimora). Se un virus colpisce due Paesi le cui popolazioni si assomigliano, è probabile che i risultati siano simili.  In questo caso, i due Paesi potrebbero utilizzare lo stesso modello di previsione senza dover condividere le cartelle cliniche reali che sono andate ad addestrare il modello. Naturalmente i modelli di dati tra i vari Paesi possono variare a causa, per esempio, della demografia (il Giappone ha più anziani che il Messico) e delle differenze culturali o di stile di vita (i nonni italiani possono essere più coinvolti nella cura dei bambini rispetto a quelli tedeschi), ma gli analisti dei dati possono rielaborare il modello per adattarsi a queste variazioni se i dati sono stati raccolti secondo uno standard o un protocollo comunemente sviluppato.

Si pensi a come questo avrebbe potuto funzionare per Covid-19: quando il Coronavirus è emerso a Wuhan, i dati erano inizialmente inesistenti, rendendo impossibile la personalizzazione basata sul modello.  A quel punto, l’approccio di blocco aveva un senso: chiudere le città, implementare un totale distanziamento sociale e monitorare da vicino, senza fare grandi eccezioni. Questo ovviamente ha contribuito a contenere la malattia, ma ha anche creato l’opportunità per il Governo cinese di raccogliere tutti i dati disponibili per creare i modelli di previsione del rischio clinico che avrebbe poi potuto condividere con altri Paesi, che a loro volta avrebbero potuto aggiungere i propri dati per migliorare ulteriormente il modello. 

La sfida della privacy

L’attuazione delle innovazioni tecnologiche, tuttavia, richiederà dei cambiamenti politici. Le politiche esistenti che riguardano la privacy dei dati e la sicurezza informatica, e le loro rispettive e diverse interpretazioni nei vari Paesi, proibiranno in larga misura il tipo di approccio personalizzato alla gestione delle pandemie che stiamo sostenendo.

Ciò è dovuto in gran parte al fatto che le politiche attuali non distinguono tra i dati di input (utilizzati per addestrare un modello), i modelli di previsione stessi, e i “dati di output” (previsioni del modello addestrato). Quando una policy, implicitamente o esplicitamente, proibisce la condivisione dei dati o richiede che i dati siano memorizzati su server all’interno di un Paese, essa copre tutto ciò che può essere legalmente interpretato come dati, compresi i modelli e i loro parametri.

Esortiamo pertanto i responsabili politici a considerare la possibilità di distinguere tra la condivisione dei modelli e la condivisione dei dati. Incoraggiamo inoltre i Governi nazionali a concordare un protocollo per determinare quando i dati possono essere condivisi. Ad esempio, una dichiarazione dell’OMS o dell’ONU secondo cui un determinato focolaio qualificato come pandemia potrebbe servire da stimolo per sospendere le normali leggi sulla privacy per consentire la condivisione di dati anonimi.

Durante tali periodi, molte persone potrebbero essere disposte a fornire eccezionalmente e temporaneamente i propri dati, attraverso canali appropriati e sicuri, per l’elaborazione di modelli che possano guidare le decisioni politiche con importanti conseguenze sulla vita e sull’economia. Se ciò dovesse accadere, c’è molto che la moderna scienza dei dati e l’intelligenza artificiale potrebbero fare per mitigare le ricadute di questa pandemia e per prepararci a limitare l’impatto della prossima.

Theos Evgeniou è professore di Scienze delle decisioni e gestione della tecnologia all’INSEAD.

David R. Hardoon è Senior Advisor per i dati e l’intelligenza artificiale presso UnionBank Filippine ed ex Chief Data Officer della Monetary Authority di Singapore. È membro di facoltà in visita presso la Singapore Management University, l’Università Nazionale di Singapore e l’University College di Londra.

Anton Ovchinnikov è Distinguished Professor e Scotiabank Scholar of Customer Analytics presso la Smith School of Business, Queen’s University, Canada, e Visiting Professor presso l’INSEAD.

Lascia il tuo commento

Condividi le tue opinioni su Hbr Italia

Caratteri rimanenti: 2500

Temi più seguiti