Ottobre 2020

Come vincere con il machine learning

E come recuperare il terreno perduto se siete in ritardo.

Ajay Agrawal, Joshua Gans, Avi Goldfarb

Ottobre 2020

Come vincere con il machine learning

Il decennio scorso ha portato con sé grandissimi progressi in una stimolante dimensione dell’intelligenza artificiale – il machine learning, o apprendimento delle macchine. Questa tecnica, che prende input di dati e li trasforma in previsioni, ha permesso a colossi come Amazon, Apple, Facebook e Google di migliorare enormemente i loro prodotti. Ha anche spinto un gran numero di start-up a lanciare nuovi prodotti e nuove piattaforme, a volte addirittura in competizione con Big Tech.

Considerate BenchSci, un’azienda di Toronto che mira ad accelerare il processo di sviluppo dei farmaci. Il suo obiettivo è rendere più facile per i ricercatori trovare il proverbiale ago nel pagliaio – ossia reperire le informazioni più critiche incorporate nei database interni delle case farmaceutiche o perse nel vasto oceano della letteratura scientifica. Per portare un nuovo farmaco potenziale alla sperimentazione clinica, i ricercatori devono effettuare test assai costosi, anche in termini di tempo. BenchSci si è resa conto che se ne potevano condurre di meno – e con maggior successo – traendo indicazioni più analitiche dal gigantesco numero di esperimenti già effettuati.

Ha scoperto in effetti che se avessero sfruttato un machine learning per leggere, classificare e poi presentare le indicazioni estratte dalla ricerca scientifica, i ricercatori avrebbero potuto dimezzare il numero di esperimenti normalmente necessari per portare un nuovo farmaco potenziale alla fase di sperimentazione clinica. Più specificamente, avrebbero potuto usare la tecnologia per identificare i reagenti biologici giusti – sostanze essenziali per influenzare e misurare l’attività delle proteine. Identificarli setacciando la letteratura anziché riscoprirli ripartendo da zero contribuisce a ridurre sensibilmente il tempo che occorre per produrre nuove molecole potenzialmente terapeutiche. Ciò genera risparmi potenziali per oltre 17 miliardi di dollari all’anno il che, in un settore nel quale i ritorni sull’R&S si sono ridotti al lumicino, potrebbe letteralmente trasformare il mercato. Inoltre, si potrebbero salvare molte vite lanciando più rapidamente sul mercato nuovi farmaci.

Il fatto più rilevante è che BenchSci, nel suo ambito specialistico, sta facendo qualcosa di molto simile a ciò che ha fatto Google per l’intera Rete: usare l’apprendimento delle macchine per conquistare la leadership incontrastata tra i motori di ricerca. Così come Google può aiutarvi a scoprire come riparare la lavastoviglie e farvi risparmiare una lunga ricerca in biblioteca o un costoso intervento tecnico esterno, BenchSci aiuta i ricercatori a identificare un reagente appropriato senza incorrere nei disagi o nelle spese che si accompagnano a una ricerca o a una sperimentazione eccessiva. In precedenza, i farmacologi usavano Google o PubMed per passare al setaccio la letteratura (un processo che durava giorni), poi leggevano tutti i testi selezionati (il che richiedeva altri giorni), dopodiché ordinavano e sperimentavano da tre a sei reagenti prima di sceglierne uno (nell’arco di settimane). Adesso passano in rassegna BenchSci in pochi minuti e poi ordinano e sperimentano da uno a tre reagenti prima di sceglierne uno (facendo meno test in meno settimane).

Molte aziende stanno già lavorando con l’intelligenza artificiale (IA) e sanno quali sono le azioni pratiche da intraprendere per integrarle nelle loro attività operative e sfruttarne il potere. Ma a un certo punto, queste aziende dovranno porsi un interrogativo più ampio: come sfruttare il machine learning per creare un fossato difendibile intorno al business – cioè creare qualcosa che i concorrenti non possano imitare facilmente? Nel caso di BenchSci, per esempio, il suo successo iniziale spingerà Google a farle concorrenza? E in tal caso, come farà a conservare la propria leadership?

Nell’articolo spieghiamo come le aziende che entrano nei rispettivi settori con un prodotto o con un servizio supportato dall’IA possano sviluppare un vantaggio competitivo sostenibile e innalzare barriere all’ingresso dei ritardatari. Osserviamo che spesso agire rapidamente può essere un grosso beneficio, ma non sempre definitivo. Come vedremo, gli utilizzatori successivi della nuova tecnologia possono ancora fare progressi – o quantomeno recuperare almeno in parte il terreno perduto – trovando una nicchia in cui posizionarsi.

 

FARE PREVISIONI CON L’IA

Le imprese usano l’apprendimento delle macchine per identificare andamenti e poi fare previsioni – su ciò che attirerà i clienti, migliorerà le operations o contribuirà ad accrescere la qualità di un prodotto. Prima di poter costruire una strategia intorno a queste previsioni, tuttavia, dovete capire quali sono gli input necessari per il processo previsionale, i problemi da affrontare per ottenerli, e il ruolo del feedback nello sviluppo di un algoritmo in grado di generare previsioni più attendibili con il passare del tempo.

Una previsione, nel contesto del machine learning, è un output informativo che deriva dall’inserimento di alcuni dati e dall’esecuzione di un algoritmo. Per esempio, quando sforna una previsione sulla rotta migliore da seguire per spostarsi dal punto A al punto B, la vostra app di navigazione su un dispositivo mobile usa dati di input sulle condizioni del traffico, sui limiti di velocità, sul tracciato e su altri fattori. Viene poi utilizzato un algoritmo per la selezione della strada più veloce e del tempo che occorre per percorrerla.

Il problema principale di qualunque processo previsionale è che i dati iniziali – gli input di cui avete bisogno per cominciare a ottenere risultati ragionevoli – vanno creati (ingaggiando, mettiamo, esperti per la classificazione delle informazioni) o ricavati da fonti preesistenti (per esempio, le cartelle cliniche). Alcuni tipi di dati si possono acquisire facilmente da fonti pubbliche (pensate alle informazioni sul tempo e alle mappe stradali). I consumatori potrebbero anche fornire volentieri dati personali, se ne percepiscono un beneficio. Gli utilizzatori di FitBit e Apple Watch, per esempio, consentono alle aziende produttrici di raccogliere dati sul loro livello di esercizio fisico, sulle calorie ingerite e così via tramite dispositivi che indossano, per gestirne la salute e la forma fisica.

Ottenere dati iniziali per facilitare le previsioni può essere, tuttavia, difficile se richiede la cooperazione di un gran numero di individui che non traggono alcun beneficio diretto dal fornirli.  Per esempio, un’app di navigazione può raccogliere dati sulle condizioni del traffico seguendo gli spostamenti degli utilizzatori e ricevendone gli input. Ciò le permette di identificare probabili punti di intasamento del traffico e di avvisare altri utenti che si stanno avvicinando a essi. Ma gli automobilisti già bloccati in coda traggono un beneficio a dir poco limitato dalla partecipazione al processo, e potrebbero non gradire l’idea che l’app sappia dove si trovano in un dato momento (e che possa registrare, almeno in teoria, i loro spostamenti). Se gli automobilisti fermi in coda si rifiutano di mettere in comune i propri dati o spengono i propri geolocalizzatori, la capacità dell’app di avvisare gli utilizzatori dei problemi in atto nel traffico verrà compromessa.

Un’altra criticità potrebbe essere l’esigenza di aggiornare periodicamente i dati di addestramento. Questo non è sempre un problema; non lo sarà se il contesto di base in cui è stata effettuata la previsione rimane costante. La radiologia, per esempio, analizza la fisiologia umana, che in linea generale resta inalterata da una persona all’altra e rimane costante nel tempo. Perciò, da un certo punto in avanti, il valore marginale di un’informazione addizionale inserita nel database di addestramento è prossimo a zero. Ma in altri casi, gli algoritmi andranno aggiornati frequentemente con dati completamente nuovi che riflettono i cambiamenti intervenuti nell’ambiente sottostante. Con le app di navigazione, per esempio, nuovi percorsi o nuove rotatorie, la ridenominazione di strade e altri cambiamenti analoghi renderanno le previsioni dell’app meno accurate nel tempo, se non vengono aggiornate le mappe utilizzate per l’addestramento.

In molti casi, gli algoritmi si possono migliorare continuamente tramite l’uso di dati di feedback, ottenuti sovrapponendo i risultati effettivi ai dati di input che hanno generato le relative previsioni. Questo strumento è particolarmente utile quando ci può essere uno scostamento sensibile all’interno di confini chiaramente definiti. Per esempio, quando il vostro telefonino usa una vostra immagine a fini di sicurezza, vuol dire che l’avete addestrato a riconoscervi. Ma il vostro viso può cambiare significativamente. Potreste mettervi o togliervi gli occhiali. Potreste cambiare taglio di capelli, truccarvi, ingrassare o dimagrire. Di conseguenza, la previsione che vi identifica coi vostri dati anagrafici potrebbe diventare meno affidabile se il telefonino si affida unicamente ai dati iniziali di addestramento. Ma in realtà il dispositivo aggiorna il suo algoritmo usando tutte le immagini che gli fornite ogni volta che lo sbloccate.

Creare questi circuiti di feedback è tutt’altro che semplice in contesti dinamici e dove il feedback non si può categorizzare e ottenere facilmente. I dati di feedback per l’app di riconoscimento facciale dello smartphone, per esempio, creano previsioni più attendibili se l’unica persona che immette questi dati è il proprietario dell’apparecchio. Se altre persone gli assomigliano abbastanza da poter entrare nel telefono e continuare a usarlo, la previsione generata dallo smartphone che identifica l’utilizzatore con il proprietario diventa inaffidabile.

Può essere pericolosamente facile anche introdurre dei pregiudizi nell’apprendimento delle macchine, specie se c’è in gioco una pluralità di fattori. Supponete che una finanziaria impieghi un processo supportato dall’IA per valutare il rischio di affidamento di coloro che chiedono un prestito – un processo che tiene conto del loro livello di reddito, dei posti di lavoro occupati, delle caratteristiche demografiche, eccetera. Se i dati di addestramento dell’algoritmo discriminano a danno di un certo gruppo – per esempio, le persone di colore – il circuito di feedback perpetuerà o addirittura accentuerà quel pregiudizio, rendendo sempre più probabile che le domande dei candidati di colore vengano respinte. Il feedback è quasi impossibile da incorporare stabilmente in un algoritmo senza parametri accuratamente definiti e fonti affidabili, scevre da pregiudizi.

 

COSTRUIRE UN VANTAGGIO COMPETITIVO NELLA PREVISIONE

Per tanti aspetti, costruire un business sostenibile nel machine learning è molto simile a costruire un business sostenibile in qualunque altro settore. Dovete andare sul mercato con un prodotto vendibile, ritagliarvi una posizione difendibile e creare seri ostacoli ai possibili imitatori. La possibilità di fare effettivamente tutto questo dipende dalle risposte che darete a tre domande.

 

 1. Avete abbastanza dati per l’addestramento? All’esordio sul mercato, una macchina da previsioni deve generare previsioni abbastanza buone da essere commercialmente sostenibili. La definizione pratica di “abbastanza buono” potrebbe essere fissata dalla normativa (per esempio, un’IA per le diagnosi mediche deve soddisfare standard pubblici), dall’utilizzabilità (un chatbot deve mettere le persone che chiamano in condizione di rispondere alla macchina anziché attendere un operatore umano del call center) o dalla concorrenza (un’azienda che vuole entrare nel mercato dei motori di ricerca deve avere un certo livello di accuratezza previsionale per competere con Google). Una barriera all’ingresso, perciò, è la quantità di tempo e di lavoro necessaria per creare o acquisire dati di addestramento sufficienti a generare previsioni abbastanza buone.

La barriera può essere elevata. Prendete il caso della radiologia, dove una macchina da previsioni dev’essere misurabilmente migliore di esseri umani altamente qualificati per poterle affidare la vita delle persone. Ciò fa supporre che la prima azienda in grado di costruire un’IA generalmente applicabile in radiologia (ossia in grado di leggere qualunque immagine scannerizzata) avrà inizialmente poca concorrenza, perché il successo presuppone un certo quantitativo di dati. Ma il vantaggio iniziale potrebbe avere vita breve se il mercato sta crescendo rapidamente, perché in un mercato in rapida crescita il ritorno economico dell’accesso a dati di addestramento sarà probabilmente abbastanza cospicuo da attrarre diverse grandi aziende dalla capacità finanziaria pressoché illimitata.

L’implicazione, naturalmente, è che anche i requisiti di immissione dei dati, come tanti altri fabbisogni specifici, sono soggetti a economie di scala. I mercati ad alta crescita attraggono investimenti e con il tempo questa attrattività alza la soglia di ingresso per il prossimo nuovo entrante (e obbliga tutti i player già attivi nel settore a spendere di più nello sviluppo o nella commercializzazione dei loro prodotti). Ne deriva che più sono i dati su cui potete addestrare le vostre macchine, più grosso è l’ostacolo per chiunque arrivi dopo di voi; il che ci porta alla seconda domanda.

 

2. Quanto sono veloci i vostri circuiti di feedback? Le macchine da previsione sfruttano quello che è sempre stato il vantaggio specifico degli esseri umani – la capacità di apprendere. Se possono incorporare dati di feedback, poi possono imparare dai risultati e migliorare la qualità della previsione successiva.

L’entità di questo vantaggio, tuttavia, dipende dal tempo che ci vuole per ottenere il feedback. Con una scansione radiologica, quando occorre un’autopsia per stabilire se un algoritmo per il machine learning ha previsto correttamente il cancro, il feedback sarà lento e, pur avendo un vantaggio iniziale nella raccolta e nella lettura delle scansioni, l’azienda avrà una capacità di apprendimento limitata e quindi faticherà a conservare il suo vantaggio. Per contro, se i dati di feedback si possono generare subito dopo aver ottenuto la previsione, allora un vantaggio iniziale si tradurrà in un vantaggio protratto nel tempo, perché di lì a poco la dimensione minima efficiente sarà irraggiungibile anche per le più grandi aziende.

Nel 2009, quando Microsoft ha lanciato il motore di ricerca Bing, il progetto aveva il pieno appoggio dell’azienda. Microsoft ci ha investito miliardi di dollari. Eppure, più di dieci anni dopo, la quota di mercato di Bing resta molto al di sotto di quella di Google, sia per volumi di ricerca sia per ricavi pubblicitari. Una delle ragioni per cui Bing non è riuscito a colmare il divario è il circuito di feedback. Nella ricerca, il tempo che intercorre tra la previsione (la messa a disposizione di una pagina che presenta vari link in risposta a una query) e il feedback (il click dell’utilizzatore su uno dei link) è breve - di solito pochi secondi. In altre parole, il circuito di feedback è veloce ed efficace.

Quando Bing è entrato nel mercato, Google gestiva già da oltre un decennio un motore di ricerca basato sull’IA, aiutando milioni di utilizzatori ed effettuando miliardi di ricerche al giorno. Tutte le volte che un utilizzatore digitava una query, Google gli forniva una previsione dei link più pertinenti, tra cui poteva scegliere i migliori, consentendo all’azienda di aggiornare il suo modello previsionale. Ciò permetteva un apprendimento costante, grazie a uno spazio di ricerca in continua espansione. Con tutti quei dati di addestramento forniti da un grandissimo numero di utenti, Google poteva identificare nuovi eventi e nuovi trend più rapidamente di Bing. Alla fine, il circuito rapido di feedback, combinato con altri fattori – il continuo investimento di Google in enormi strutture di processazione dei dati e i costi reali o percepiti del passaggio a un altro motore di ricerca – rendeva incolmabile il ritardo di Bing. Altri motori di ricerca che miravano a competere con Google e Bing non sono mai nemmeno partiti.

 

3. Quanto sono buone le vostre previsioni? Il successo di qualunque prodotto dipende in ultima analisi da ciò che si ottiene in cambio di ciò che si paga. Se i consumatori si vedono offrire due prodotti simili allo stesso prezzo, finiranno quasi sempre per scegliere quello che ritengono di qualità migliore.

La qualità delle previsioni, come abbiamo già osservato, è spesso facile da misurare. In radiologia, nei motori di ricerca, nella pubblicità e in tanti altri contesti, le aziende possono progettare IA con un solo, chiaro, indicatore di qualità: l’accuratezza. Come in altri settori, i prodotti di più alta qualità beneficiano di una domanda più elevata. I prodotti basati sull’IA sono diversi dagli altri, tuttavia, perché per quasi tutti gli altri una qualità migliore costa di più e i produttori di beni di qualità inferiore sopravvivono usando materiali meno cari o processi meno costosi, per poi applicare prezzi più bassi. Questa strategia non è applicabile nel contesto dell’IA. Poiché l’IA è governata da un software, una previsione di bassa qualità costa esattamente quanto una previsione di alta qualità, rendendo irrealistico il ribasso dei prezzi. E se la previsione migliore ha lo stesso prezzo della peggiore, non c’è ragione per acquistare la seconda.

Per Google, questo è un altro fattore che spiega perché la sua supremazia nella ricerca potrebbe essere inattaccabile. Le previsioni dei concorrenti appaiono spesso molto simili a quelle di Google. Digitate la parola “meteo” su Google o su Bing e i risultati saranno più o meno gli stessi – le previsioni usciranno per prime. Ma se digitate una parola meno comune, potrebbero emergere delle differenze. Se digitate, mettiamo, “disruption”, la prima pagina di Bing mostrerà di solito definizioni tratte dal vocabolario, mentre Google fornisce sia definizioni sia link che rimandano a studi e ricerche sull’innovazione disgregante. Anche se Bing può dare la stessa performance di Google per alcune ricerche di testo, per altre è meno accurata nel prevedere ciò che stanno cercando i consumatori. E ci sono pochissime altre categorie, per non dire nessuna, in cui Bing è considerato generalmente superiore.

 

RECUPERARE TERRENO

La conclusione è che, nell’IA, chi fa la prima mossa può costruire un vantaggio competitivo fondato sulle economie di scala se i circuiti di feedback sono rapidi e la qualità della performance è indiscutibile. Ma cosa significa tutto questo per chi arriva in ritardo? Le tre domande contengono indicazioni che prefigurano già due modi in cui un ritardatario può ritagliarsi uno spazio nel mercato. Gli aspiranti competitor non devono necessariamente scegliere tra questi due approcci; possono provarli entrambi.

Identificate e acquisite fonti alternative di dati. In alcuni mercati degli strumenti previsionali, ci potrebbero essere bacini di possibili dati di addestramento che gli incumbent non hanno ancora recepito. Tornando all’esempio della radiologia, decine di migliaia di medici leggono migliaia di scansioni all’anno; vale a dire che sono disponibili centinaia di milioni (se non addirittura di miliardi) di nuovi data point.

I primi entranti otterranno dati di addestramento da alcune centinaia di radiologi: naturalmente, man mano che il loro software viene utilizzato in quel campo, il numero di scansioni e l’entità del feedback incorporato nel loro database cresceranno enormemente, ma i miliardi di scansioni analizzate e verificate in precedenza danno ai ritardatari la possibilità di recuperare terreno, a condizione che siano in grado di aggregare le scansioni e di analizzarle nel loro insieme. In questo caso, potrebbero riuscire a sviluppare un’IA che genera previsioni abbastanza buone da andare sul mercato, dopodiché trarrebbero anch’essi beneficio dal feedback.

I ritardatari potrebbero prendere in considerazione anche l’ipotesi di addestrare un’IA usando dati ricavati da patologie o autopsie anziché da diagnosi “umane”. Questa strategia consentirebbe loro di raggiungere prima la soglia di qualità (perché biopsie e autopsie sono più definitive delle scansioni radiografiche), anche se il circuito di feedback successivo sarebbe più lento.

In alternativa, anziché tentare di scoprire fonti di dati di addestramento ancora non sfruttate, i ritardatari potrebbero cercare nuovi fonti di feedback che supportino un apprendimento più rapido rispetto a quelle usate attualmente dagli incumbent. (BenchSci è il tipico esempio di un’azienda che lo ha fatto con successo). Arrivando per primo con un’offerta innovativa di dati di feedback che si rendono disponibili in tempi più brevi, il nuovo competitor può poi imparare dalle azioni e dalle scelte dei suoi utilizzatori per migliorare il prodotto. Ma nei mercati in cui i circuiti di feedback sono già piuttosto rapidi e gli incumbent operano su vasta scala, le opportunità di applicazione di questo approccio sarebbero relativamente limitate. E un feedback significativamente più veloce innescherebbe verosimilmente una disgregazione delle pratiche correnti, per cui in realtà i nuovi entranti non competerebbero con aziende consolidate, ma le soppianterebbero.

Differenziate la previsione. Un’altra tattica che può aiutare i ritardatari a diventare competitivi è ridefinire ciò che rende “migliore” una previsione, anche se solo per alcuni clienti. In radiologia, per esempio, una strategia di questo tipo si potrebbe mettere in atto se c’è una domanda di mercato per altri tipi di previsioni. I primi entranti hanno quasi certamente addestrato i propri algoritmi con dati provenienti da una sola rete ospedaliera, da un solo tipo di hardware o da un solo Paese. Usando dati di addestramento (e poi dati di feedback) provenienti da un’altra rete ospedaliera o da un altro Paese, il nuovo arrivato potrebbe customizzare la propria IA per quel segmento di utilizzatori, se è sufficientemente differenziato. Se, mettiamo, gli americani delle metropoli e i cinesi delle campagne tendono ad avere condizioni di salute diverse, allora una macchina da previsioni costruita per sottoporre a diagnosi uno di questi due macro-gruppi potrebbe non essere altrettanto accurata nelle diagnosi dell’altro gruppo.

Anche lo sviluppo di previsioni sulla base di dati che prevengono da un determinato tipo di hardware potrebbe offrire un’opportunità commerciale, se quel modello di business si traduce in costi più bassi o in una maggiore accessibilità per i clienti. Molte delle IA oggi impiegate per la radiologia attingono dati dalle macchine a raggi X, dagli scanner e dalle apparecchiature a ultrasuoni più largamente usati, che sono fabbricati da GE, Siemens e altri produttori di lunga esperienza nel settore. Ma se gli algoritmi vengono applicati a dati generati da altre macchine, le previsioni che ne derivano potrebbero essere meno accurate. Di conseguenza, un concorrente in ritardo potrebbe trovare una nicchia offrendo un prodotto tagliato su misura per quegli altri macchinari – che le strutture sanitarie potrebbero trovare attraente se è meno costoso da acquistare o da usare, o risponde ai bisogni di una clientela specifica.

 

IL POTENZIALE DELLE MACCHINE da previsione è immenso ed è indubbio che i colossi dell’alta tecnologia partano avvantaggiati. Ma vale la pena di ricordare che le previsioni sono simili a prodotti ad alta precisione, sapientemente adattati a finalità e contesti specifici. Se potete differenziare anche solo un po’ le finalità e i contesti, potete creare uno spazio difendibile per il vostro prodotto. Anche se il diavolo sta nei dettagli del modo in cui raccogliete e usate i dati, in quei dettagli sta anche la vostra salvezza.

Ciò nonostante, la vera chiave per competere vittoriosamente con Big Tech in settori alimentati da macchine intelligenti si trova in una domanda a cui può rispondere solo un essere umano: cosa volete prevedere? Naturalmente, identificare le risposte non è facile. Ci vogliono una profonda conoscenza e un’analisi dettagliata del valore potenziale di previsioni specifiche, nonché dei prodotti e dei servizi in cui sono incorporate. Non c’è dunque da sorprendersi se il principale finanziatore esterno di BenchSci non era uno dei tanti investitori tecnologici locali del Canada, ma Gradient Ventures, una società di venture capital focalizzata sull’IA che appartiene a Google.

Ajay Agrawal è professore di Enterpreneurship and Innovation presso la Rotman School of Management della University of Toronto, e il fondatore del Creative Destruction Lab.

Joshua Gans è professore di Technical Innovation and Entrepreneurship della Rotman e chief economist del Creative Destruction Lab,

Avi Goldfarb è professore di Artificial Intelligence and Healthcare della Rotman e chief data scientist del Creative Destruction Lab.

Insieme, i tre autori hanno scritto Prediction Machines: The Simple Economics of Artificial Intelligence (Harvard Business Reiew Press, 2018).

Commenta scrivi/Scopri i commenti

Condividi le tue opinioni su Hbr Italia

Caratteri rimanenti: 400

2 / 3

Free articles left

Abbonati!