STRATEGIA
Atin Gupta, Geoffrey G. Parker
Marzo 2023
HBR Staff/SeventyFour/Getty Images
L’IA generativa è un modello di intelligenza artificiale che, se addestrato su enormi dataset, è in grado di generare testo, immagini, audio e video prevedendo la parola o il pixel successivo. L’input più semplice (chiamato prompt) per l’intelligenza artificiale generativa è una descrizione di testo. Sulla base di tale descrizione, un trasformatore generativo preaddestrato (GPT) può scrivere un paragrafo o un modello testo-immagine: Stable Diffusion può creare un’immagine, MusicLM può creare musica e Imagen Video può creare un video. Questa tecnologia democratizzerà tutti i tipi di creazione di contenuti. Per la creazione di video potrebbe livellare il campo di gioco più di quanto non abbiano già fatto gli smartphone e le piattaforme di social video. Inoltre, cambierà radicalmente l’industria di questi contenuti.
Consideriamo Netflix, TikTok e YouTube, le star di questo settore. Sebbene ognuna di esse sia unica in termini di tipologia di contenuti e modello di business, tutte e tre le piattaforme operano incentivando i creatori a sviluppare contenuti coinvolgenti, abbinando i contenuti giusti ai consumatori giusti e identificando i contenuti che generano coinvolgimento. Ognuno di questi elementi si basa sull’altro per creare un volano che ha aiutato tutte e tre le piattaforme a guadagnare spettatori velocemente. Ma questo volano sta iniziando a perdere slancio. L’intelligenza artificiale generativa peggiorerà i loro problemi creando una nuova catena di valore per la creazione di contenuti video.
Perché Netflix, Tiktok e YouTube sono in difficoltà
Netflix, TikTok e YouTube hanno ottenuto buoni risultati grazie alla loro capacità di determinare la rilevanza e il coinvolgimento dei contenuti. Tutti dispongono di enormi quantità di dati su chi guarda cosa e come. Nonostante il loro successo, la determinazione del “cosa” presenta ancora due serie sfide:
Estrarre caratteristiche utili e precise. Se un video viene commissionato (come accade a Netflix), le categorie in cui rientra sono note: genere, cast, durata, ecc. Ma si tratta di etichette ampie e talvolta soggettive, il che rende difficile per un algoritmo imparare da esse. Naturalmente, molte caratteristiche del video possono essere specificate; la sceneggiatura, l’elenco delle riprese e altre caratteristiche della produzione sono note con precisione. Tuttavia, i tentativi di utilizzare questi dati portano all’estremo opposto: possono esserci troppe informazioni per descrivere un solo video.
Superare le barriere alla creazione. La produzione di contenuti chiusi in stile hollywoodiano è costosa e lenta. Netflix ha speso 17 miliardi di dollari per i contenuti nel 2022. Il co-CEO di Netflix Greg Peters ha dichiarato: “Ma se diamo al pubblico un Mercoledì (prodotto originale Netflix) ogni settimana, se forniamo un Glass Onion (film originale Netflix) ogni settimana, recupereremo la stragrande maggioranza di quegli spettatori”. È chiaro che con il loro attuale modello di produzione non possono ancora offrire un Mercoledì (una rivisitazione moderna, popolare e ad alto budget de La famiglia Addams) ogni settimana.
Il modello alternativo è la creazione di contenuti aperti e generati dagli utenti utilizzata da TikTok e YouTube. Sebbene sia relativamente economico e veloce, richiede la definizione di incentivi che bilancino tre obiettivi (a volte contrastanti): 1) trattenere i creatori più influenti, 2) motivare i nuovi creatori e 3) mantenere e far crescere la base di spettatori. Poiché le piattaforme in questo spazio cercano di generare un volume sufficiente di contenuti coinvolgenti da un numero relativamente piccolo di creatori popolari, stanno scatenando guerre di incentivi. Ad esempio, TikTok si sarebbe impegnato nell’“heating” per promuovere manualmente i video. YouTube Shorts, nel frattempo, ha abbassato l’asticella dei guadagni per i creatori: bastano 1.000 abbonati invece dei 100.000 follower richiesti da TikTok.
Queste due sfide spiegano in parte il fallimento della piattaforma di streaming Quibi, che ha avuto vita breve. Quibi ha combinato le debolezze di tutte e tre in un’unica piattaforma. Ha scommesso sul sistema di produzione chiuso, in stile hollywoodiano, assumendo creatori e attori costosi. Invece di potenziare i singoli creatori, come hanno fatto YouTube e TikTok, Quibi ha puntato su creatori e attori di marca. In cambio, ha ottenuto contenuti scadenti (probabilmente di secondo livello) che non funzionavano. Questo perché ha puntato sui Millennials e sulla Gen Z, ma senza promuovere i creatori di queste fasce d’età. Inoltre, sorprendentemente, non ha usato l’intelligenza artificiale per determinare quali contenuti produrre (anche se ha usato l’intelligenza artificiale per consigliare agli spettatori cosa guardare).
Nessuna piattaforma guidata dall’uomo ha ancora superato queste due sfide. Tuttavia, una soluzione potrebbe esistere. L’intelligenza artificiale generativa cambierà il tipo di contenuti video da produrre, il modo in cui produrli e a chi mostrarli, dando vita a un tipo completamente nuovo di piattaforma abilitata dall’intelligenza artificiale.
Verso la piattaforma generativa
Immaginate questo scenario. Un creatore inserisce questa descrizione testuale: due persone sono sedute in un caffè Art Déco. Fuori nevica. Uno dei due addenta uno spicchio di formaggio svizzero e osserva: “Sono creativamente stitico!”.
Un video iperrealistico, in live action (con audio) viene generato quasi istantaneamente e mostrato a miliardi di spettatori. Non solo sappiamo chi ha guardato per quanto tempo, chi ha saltato quali parti, i like, le condivisioni, i commenti, le ricerche e tutte le discussioni fuori piattaforma sul video, ma conosciamo anche l’esatto input utilizzato per creare quel video. In un colpo solo, questo scenario supera le due sfide delle piattaforme video esistenti. Fornisce una descrizione molto più precisa del video (la richiesta di testo in ingresso) e abbassa notevolmente le barriere alla creazione (è semplice come digitare la propria immaginazione). Non c’è bisogno di ricorrere al CapCut e nemmeno agli attori.
Sembra una magia – e in effetti non esiste ancora – ma è solo un insieme di tre programmi di intelligenza artificiale già ben sviluppati. L’IA #1 genera il video sulla base del testo inserito. L’IA #2 abbina il video agli spettatori giusti. L’IA #3 utilizza il coinvolgimento risultante per guidare i creatori su cosa realizzare successivamente. Una versione più primitiva di questo modello di produzione sta già producendo contenuti, forse la più conosciuta è la sitcom parodia di Seinfeld “Nothing, Forever”, che utilizza l’IA generativa per creare la sceneggiatura e ha quasi 100.000 follower.
La piattaforma video guidata dall’intelligenza artificiale generativa riduce le barriere alla creazione di valore, guidando i creatori su ciò che determina il coinvolgimento e mostrando contenuti pertinenti agli spettatori. Allo stesso tempo, la riduzione delle barriere e il miglioramento della guida consentono ai creatori di aumentare il valore che possono creare al di fuori dell’azienda. Inoltre, grazie all’attrito quasi nullo su entrambi i fronti tra la creazione e la visione di contenuti rilevanti, i creatori sono anche spettatori e viceversa. Il confine è ancora più labile se lo spettatore digita una ricerca e il testo inserito diventa lo spunto per un nuovo video.
L’impatto economico sarà enorme. Tradizionalmente, una piccola percentuale di contenuti molto popolari su una piattaforma ha compensato una grande percentuale di contenuti meno popolari. Una piattaforma di intelligenza artificiale generativa aumenterà il successo dei contenuti popolari, perché i creatori saranno potenziati dall’aiuto di raccomandazioni algoritmiche su cosa fare dopo. Allo stesso tempo, le barriere molto più basse alla creazione miglioreranno la redditività dei contenuti rimanenti.
Come si adatteranno le principali piattaforme storiche? Tra le tre, Netflix è quella più legata al suo modello di business e probabilmente avrà difficoltà a cambiare radicalmente. Ha resistito a lungo a un modello supportato da annunci pubblicitari e solo di recente si è mossa in questa direzione. TikTok è il più vicino a una piattaforma di intelligenza artificiale generativa in termini di modello di business, capacità e flessibilità, ma è stato sottoposto a controlli normativi negli Stati Uniti. YouTube si trova in una posizione favorevole, poiché ha cercato di competere introducendo gli Shorts e migliorando gli incentivi per i creatori. Inoltre, può contare sul supporto delle capacità di intelligenza artificiale di Google. Tuttavia, Google ha già dimostrato di essere lento a muoversi commercialmente nello spazio dell’IA generativa.
Questi erano solo i titoli di testa
La recente accelerazione dei progressi tecnici e della consapevolezza dell’IA generativa è stata a dir poco sbalorditiva. Certo, non disponiamo ancora della tecnologia per generare video iperrealistici e in live action da un input testuale, e la disponibilità di tale tecnologia è fondamentale per realizzare la nuova piattaforma.
Anche quando sarà disponibile, gli input testuali potrebbero spesso non essere in grado di fornire una definizione sufficientemente precisa del video ed è probabile che la piattaforma generi una molteplicità di video simili, ma non identici, che emergono quando i creatori-spettatori compongono testi simili. E man mano che la piattaforma apprende le chiavi per generare contenuti coinvolgenti, come verrà gestito il conflitto di interessi tra la piattaforma e i creatori? Come farà la piattaforma a prevenire i deep fake non autorizzati e l’inevitabile propaganda e falsa informazione che ne deriverà?
Nonostante queste riserve, è molto probabile che l’IA generativa alimenterà nuove piattaforme di contenuti video che sostituiranno o almeno integreranno le attuali incarnazioni di Netflix, YouTube e TikTok. La tecnologia dell’intelligenza artificiale generativa non sarà utilizzata solo per creare contenuti, ma anche per alimentare le dinamiche della piattaforma tra la piattaforma, i creatori e i consumatori. È quasi superfluo dire che tutto questo non è esente da incertezze tecnologiche e rischi etici. Naturalmente, il video è solo uno dei settori in cui ci aspettiamo di assistere a questo rapido cambiamento. Molti altri settori creativi dell’arte, della musica e della parola scritta sono destinati a cambiamenti radicali e a nuove opportunità di business per coloro che sono in grado di vedere ciò che è maturo per la disruption, o per coloro che vogliono sfruttare l’IA generativa per proteggere il proprio territorio.
Atin Gupta è vicepresidente di Noodle.ai, una società di consulenza per la gestione della catena di fornitura. Geoffrey G. Parker (gparker@dartmouth.edu) è professore di Ingegneria al Dartmouth College e ricercatore presso l’Initiative on the Digital Economy del MIT. È coautore di Platform Revolution (W.W. Norton & Company, 2016).
Leggi Hbr Italia
anche su tablet e computer
Newsletter