L’intelligenza artificiale generativa (generative AI) sta avendo un impatto sempre più dirompente, sia nel contesto enterprise che nell’immaginario mainstream, grazie alla sua capacità di creare contenuti multimediali di qualità in tempi estremamente rapidi, anche da parte di utenti comuni, senza conoscenze tecniche approfondite. Quando si parla di generative AI si va ben oltre il semplice fatto tecnologico, in quanto le sue applicazioni promettono di assisterci costantemente sia nel lavoro che nella vita sociale, offrendoci potenzialità fino a poco tempo fa nemmeno immaginabili.
Come vedremo, la generative AI non rappresenta una novità in senso assoluto nel panorama dell’intelligenza artificiale, in quanto le prime applicazioni risalgono ai chatbot degli anni Sessanta, ma è soltanto negli ultimi dieci anni, grazie all’introduzione delle GAN (generative adversarial network) che si è letteralmente aperta una nuova era, con la capacità di creare immagini, video e audio incredibilmente realistici.
Oltre alle capacità puramente creative, oggi la generative AI è in grado di contribuire con assistenti AI in grado di sviluppare un enorme valore aggiunto a partire dai dati aziendali. Si tratta in ogni caso di applicazioni in molti casi ancora in fase di early adoption, che necessitano di notevoli competenze in fase di implementazione nei processi e integrazione nei sistemi esistenti.
Il potenziale della generative AI è enorme, ma occorre soprattutto saper riconoscere le tecnologie e le applicazioni in grado di portare davvero efficienza e innovazione nei processi, filtrando soluzioni esclusivamente viziate dall’hype mediatico, ma ancora troppo acerbe per produrre risultati apprezzabili.
Grazie alla comprovata esperienza di Moxoff, vediamo cos’è la generative AI, come funziona e quali sono le sue principali applicazioni oggi in azienda.
Che cos’è la Generative AI
Secondo la definizione offerta da Gartner, la generative AI, o intelligenza artificiale generativa, è una: “Tecnologia dirompente in grado di generare artefatti che in precedenza si basavano sulla creatività dell’uomo, garantendo risultativi innovativi privi di quei pregiudizi tipici dell’esperienza umana e dei suoi processi di pensiero”. Gartner sottolinea altresì come: “I leader IT a livello globale devono utilizzare una governance appropriata per sfruttare il suo straordinario potenziale creativo”.
La generative AI viene utilizzata sia per creare rapidamente nuovi contenuti di testo, audio e video a partire da una semplice richiesta (prompt), sia per automatizzare e rendere più efficienti attività a basso valore aggiunto, in modo che l’uomo possa concentrarsi nello specifico su attività più strategiche per il business. Questo vale soprattutto quando si tratta di intervenire su grandi numeriche di dati in procedure ripetitive.
Come nasce la Generative AI
Il primo episodio associabile all’intelligenza artificiale generativa è con ogni probabilità il primordiale chatbot ELIZA, sviluppato nel lontano 1961 da Joseph Weizenbaum. Si trattava di un software dotato di funzionalità che gli permettevano semplici interazioni con gli umani, basate sul linguaggio naturale.
Nei primi anni Settanta, Seppo Linnainmaa introduce il concetto di retropropagazione, un processo che sarebbe diventato fondamentale nel training delle reti neurali profonde (deep learning) su cui tuttora si basano molte applicazioni di intelligenza artificiale generativa.
Nel 1979, Kunihiko Fukushima ha pubblicato i suoi studi sul Neocognitron, tuttora riconosciuta come la prima rete neurale profonda, utilizzata per il riconoscimento visivo della scrittura mano scritta, con la possibilità di regolare i pesi tra le varie connessioni neurali. Nel 1986, David Rumelhard riprende il concetto di retropropagazione per definire un nuovo sistema di training per le reti neurali, inaugurando una nuova fortunata stagione per le tecniche basate sul deep learning. Nel 1989 il celebre Yann LeCun utilizza un sistema di reti neurali basate su un algoritmo di retropropagazione per sviluppare un’applicazione in grado di riconoscere i codici postali scritti a mano.
La storia dell’intelligenza artificiale è un lungo alternarsi tra estati e inverni. Il suo potenziale è noto da decenni, ma si deve arrivare agli anni Duemila per assistere alle prime vere affermazioni a livello mainstream. Ciò è avvenuto grazie al progresso delle tecnologie computazionali e all’avvento del cloud computing, in grado di rendere disponibili ad un pubblico ampio nuovi ecosistemi di sviluppo e soprattutto le straordinarie risorse di calcolo di cui i sistemi AI necessitano per il training.
La generative AI come la intendiamo oggi è una disciplina piuttosto recente, che trova i propri natali soltanto nel 2014, con l’arrivo delle GAN (generative adversarial network). Un notevole impulso al deep learning e alla generative AI in senso ampio si deve allo sviluppo di GPU (graphic processing unit) sempre più potenti nel calcolo in parallelo richiesto dagli algoritmi in fase di training. Originariamente concepite per il gaming PC, le GPU diventano l’hardware di riferimento per la AI, insieme alle più recenti NPU (neural processing unit) che hanno dato il via dell’era degli AI PC, sgravando CPU e GPU nel calcolo dei task brevi e frequenti richiesti dalle applicazioni basate sull’intelligenza artificiale.
Oltre alle GAN vengono introdotti i transformer ed altre tecniche capaci di funzionalità generative utili ad una varietà sempre maggiore di ambiti applicativi. Nel novembre del 2022 OpenAI ha presentato ChatGPT, l’applicazione che ha messo l’intelligenza artificiale al centro dei riflettori della scena mondiale, grazie alle sue straordinarie capacità nell’effettuare ricerche e creare contenuti testuali e visuali, in tempi molto rapidi, e alla portata di tutti. Il resto è la storia dei nostri giorni.
Come funziona la Generative AI
Le applicazioni di intelligenza artificiale generativa rientrano in gran parte nella cosiddetta AI multimodale, in quanto utilizzano un prompt che può contenere testi, immagini e video, a cui garantiscono una risposta anch’essa basata su contenuti multimediali.
La generative AI è ormai parte integrante di moltissime applicazioni consumer, che utilizziamo ogni giorno in maniera spesso inconsapevole, ad esempio sui nostri smartphone. In ambito enterprise, come vedremo, la generative AI può ottimizzare e rendere più efficienti i processi aziendali in moltissimi contesti applicativi. Vediamo alcuni degli elementi fondamentali che caratterizzano il suo funzionamento.
Algoritmi e modelli
I modelli di Intelligenza Artificiale Generativa combinano vari algoritmi per rappresentare ed elaborare i dati disponibili. Per la creazione di contenuti, ad esempio impiegano diverse tecniche di linguaggio naturale (natural language processing), che consentono di generare contenuti testuali credibili sia a livello di argomenti che di tono della narrazione, al punto da risultare indistinguibili rispetto alla scrittura umana.
Dal 2014 ad oggi sono stati sviluppati vari modelli di AI generativa, utilizzati in vari ambiti applicativi. I più significativi sono le GAN, i VAE e i transformer.
GAN (generative adversarial network)
Le GAN utilizzano due reti neurali utilizzate in maniera antagonista: un discriminatore, sviluppato per distinguere i dati sintetici da quelli reali, e un generatore, che crea dati sintetici cercando di emulare la realtà, fino al punto in cui il discriminatore non è più in grado di evidenziare alcuna differenza.
VAE (autoencoder variazionali)
Gli autoencoders sono modelli che imparano a codificare i dati in un formato compresso e poi a decodificarli per ricostruire l’input originale. Grazie a questa caratteristica, i VAE trovano largo impiego in applicazioni come la riduzione del rumore nelle immagini, o la creazione di immagini basate su alcune caratteristiche chiave delle immagini utilizzate durante il training del modello.
Transformer
I transformer vengono utilizzati soprattutto per creare i modelli di fondazione (foundation model) e i modelli di linguaggio di grandi dimensioni (LLM. Large language models). Tra i primi esempi di notevole impatto possiamo citare il modello GPT (generative pre-trained transfomer) di OpenAI, nel momento in cui scriviamo evoluto alla versione GPT-4o il modello alla base di ChatGPT, Meta Llama, Mistral 7B e molti altri, tra cui una notevole varietà di LLM open source. Si tratta di modelli che utilizzano meccanismi di attenzione per pesare l’importanza dei contenuti, permettendo ad esempio la generazione di sequenze di testo coerenti e contestualmente appropriate.
Processo di addestramento
Il processo di training di un modello di generative AI è generalmente riconducibile al contesto del deep learning, e prevede una serie di fasi di riferimento:
- Collezione dei dati (data collection)
- Pre-elaborazione (pre-processing)
- Selezione dell’architettura
- Pre-training
- Tuning
- Ottimizzazione
- Deployment
Ottimizzazione e miglioramento continuo
La generative AI utilizza logiche di apprendimento automatico per migliorare la propria conoscenza ed elaborare risultati in maniera sempre più efficiente nel tempo, in vari contesti applicativi.
Tra le tecniche di ottimizzazione più diffuse ritroviamo la messa a punto, basata sul perfezionare il modello fornendo continuamente dati etichettati relativi a domande e risposte corrette, e l’apprendimento per rinforzo, in cui l’uomo interviene valutando i risultati del modello e inserendo nuovi valori per ottenere maggiore precisione o rilevanza.
Esistono inoltre tecniche come la RAG (retrieval-augmented generation) che consentono di inserire dati contestuali direttamente nel prompt per ottenere risposte coerenti senza dover necessariamente procedere con il re-training del modello.
I vantaggi della Generative AI
Una corretta e consapevole implementazione della generative AI nei processi aziendali consente di ottenere un’ampia gamma di vantaggi, tra cui un drastico incremento dell’efficienza operativa e la capacità di personalizzare su larga scala un’incredibile varietà di contenuti.
Efficienza operativa
La generative AI offre un contributo essenziale nella generazione di nuovi contenuti a supporto dei processi creativi, accelerando soprattutto le fasi concettuali del progetto. Particolarmente utile è la capacità di generare molte versioni draft a partire da un unico prompt.
L’intelligenza artificiale generativa è inoltre molto efficace nel supporto decisionale. La sua capacità di analisi predittiva su grandi insiemi di dati consente di creare insight e ipotesi di raccomandazione utili a prendere decisioni più informate e consapevoli, in quanto basate su dati contestuali oggettivi.
Le applicazioni AI sono inoltre affidabili ed operative 24/7, e permettono una disponibilità continua specie in applicazioni come i chatbot per il customer care.
Personalizzazione su larga scala
La generative AI consente di personalizzare l’esperienza in varie applicazioni, come nel caso dei sistemi di raccomandazione, che analizzano le preferenze e le interazioni degli utenti per suggerire opzioni d’acquisto in tempo reale, generando un livello di coinvolgimento ottimale nel processo di acquisto. Logiche analoghe vengono utilizzate nel digital marketing per offrire esperienze altamente personalizzate ai clienti, generando configurazioni di prodotto personalizzate a partire dalle loro preferenze, o inviando messaggi specifici per ciascun target.
Oltre al marketing e alle vendite, la generative AI offre un supporto decisivo anche nell’ambito del customer care, grazie a chatbot capaci di gestire richieste di assistenza clienti in modo più naturale e efficace rispetto ai sistemi tradizionali, per fornire risposte personalizzate e assistenza in tempo reale senza l’esigenza di una costante interazione umana.
Molteplici casi d’uso
La generative AI viene utilizzata con successo per la creazione di un’ampia varietà di contenuti multimediali.
- Testo: i modelli generativi basati sui transformer sono capaci di generare istruzioni, documenti tecnici, brochure, e-mail e creare contenuti per siti, blog e altri strumenti di marketing digitale. La generative AI può automatizzare i processi di scrittura ripetitivi e a basso valore aggiunto, come la sommarizzazione e la meta descrizione delle pagine web.
- Immagini e video: applicazioni come Midjourney, DALL-E e Stable Diffusion ci hanno mostrato l’incredibile potenziale creativo della generative AI anche nella produzione visiva, con la capacità di generare immagini realistiche, surreali, concettuali, caratterizzate da uno stile specifico per ottenere in tempi molto rapidi concept a partire da un semplice prompt testuale.
- Voce, suono e musica: la generative AI eccelle quando si tratta di sintetizzare contenuti vocali e suoni, per creare applicazioni incredibilmente realistiche a supporto di chatbot, assistenti virtuali, oltre a narrare audiolibri e comporre musica a partire dai sample utilizzati per il training del modello.
- Codice software: la generative AI viene utilizzata dagli sviluppatori per la scrittura di codice, tradurre i contenuti di vari linguaggi di programmazione e riassumere le funzionalità del codice stesso, ai fini di ridurre drasticamente il time-to-market delle applicazioni.
- Dati sintetici (synthetic data): i modelli di generative AI possono generare dati sintetici, sulla base di un training basato su dati reali o sintetici. In ambito farmacologico, questa capacità consente ai drug designer di creare strutture molecolari con le proprietà fornite via prompt.
Le sfide della Generative AI
Il potenziale dirompente dell’intelligenza artificiale generativa implica necessariamente una serie di criticità da affrontare, a livello etico, tecnologico e normativo.
Problemi etici (deepfake, fake news, etc)
Le GAN consentono la generazione di contenuti deepfake, utilizzati ad esempio dai cybercriminali per impersonare in modo fraudolento le persone reali, coinvolgendoli in attività illecite. Se utilizzata con intenzioni malevole, la generative AI può avere impatti decisamente negativi per la collettività. È dunque necessario saper riconoscere e soprattutto mitigare gli effetti nocivi di questa nuova generazione di minacce informatiche.
Appare inoltre fondamentale supervisionare l’operato dei modelli AI, per scongiurare risultati discriminatori, razzisti o in qualche modo in grado di violare i diritti fondamentali dell’uomo. Per evitare che i modelli restituiscano degli output distorti, occorre garantire dati di training diversificati, oltre a stabilire policy e linee guida basate su una concreta applicazione dei principi di responsible AI.
Qualità e bias dei dati
Quando il training contiene dati di bassa qualità, poco pertinenti al contesto o insufficienti a descrivere il contesto stesso, le applicazioni basate su AI generativa possono generare risultati verosimili ma di per sé scorrette, fuorvianti o in ogni caso poco coerenti. Tale problema è noto come allucinazioni.
Per limitare gli effetti nocivi delle allucinazioni, gli sviluppatori tendono ad inserire nel modello una serie di “guardrail”, che lo indirizzano soltanto a ricercare nei dati ritenuti sufficientemente rilevanti o affidabili. Fondamentali, in questo contesto, le fasi di ottimizzazione e miglioramento continuo del modello, come la messa a punto e l’apprendimento per rinforzo.
Regolamentazioni e normative
I modelli di AI generativa presentano le tipiche problematiche della black box dell’intelligenza artificiale, con tutto ciò che ne consegue a livello di spiegabilità dei risultati. Occorre pertanto implementare processi di Explainable AI capaci di assicurare il necessario livello di fiducia nei confronti dei sistemi predittivi.
Un altro problema è costituito dai diritti intellettuali dei dati utilizzati in fase di training, come dimostra il recente procedimento per violazione di copyright attuato dal New York Times nei confronti di OpenAI.
È altresì necessario prestare attenzione ai dati proprietari che si condividono durante l’utilizzo di LLM pubblici, che possono reimpiegare tali dati per rendere più efficiente il modello stesso, a vantaggio della concorrenza. Tale evenienza può costituire una violazione delle normative sulla privacy, di normative specifiche di settore o accordi di carattere privatistico.
Oltre al rispetto del GDPR, in vigore dal 2018, le organizzazioni dovranno a breve confrontarsi anche con i disposti del AI ACT, il Regolamento Europeo per l’Intelligenza Artificiale, che impone procedure e misure di trasparenza specifiche per ogni livello di rischio.
Applicazioni della Generative AI
L’intelligenza artificiale generativa viene oggi impiegata con successo in vari contesti applicativi.
Creazione di contenuti
La generative AI supporta la creazione dei contenuti sotto vari aspetti:
- Generazione automatica dei contenuti: LLM e modelli multimodali possono creare automaticamente contenuti per l’utilizzo professionale, ottimizzando le risorse necessarie alla loro produzione.
- Qualità elevata: la conoscenza acquisita grazie al training basato su enormi quantità di dati consentono ai LLM di generare risultati molto pertinenti rispetto al tema trattato, associando informazioni provenienti da una quantità di fonti di gran lunga superiore rispetto a quelle consultabili da un singolo uomo.
- Personalizzazione della comunicazione: le tecnologie cognitive consentono ai modelli di generative AI di personalizzare il tono e lo stile della comunicazione, adattandosi a vari contesti applicativi, che prevedono contenuti più o meno formali.
Progettazione e design
L’intelligenza artificiale generativa è alla base del generative design, un nuovo paradigma progettuale che consente di generare risultati per obiettivi, anzichè per forma, come avviene nei sistemi tradizionali. Sulla base di un training che contiene informazioni su tutte le caratteristiche e i vincoli da rispettare (materiali, normative, dimensioni ecc.), un software dotato di funzionalità AI parte da una forma nota per proporre una serie di ipotesi progettuali. È il caso dell’ottimizzazione formale, che consente di ottenere un prodotto dotato di analoghe capacità meccaniche utilizzando minori quantità di materiale rispetto ai sistemi tradizionali.
Settore industriale
La generative AI viene utilizzata per un’ampia gamma di applicazioni in ambito manufacturing, per ridurre il time-to-market, abilitare sistemi di digital twin, applicazioni di manutenzione predittiva, supporto decisionale e altre funzionalità capaci di ottimizzare e rendere più efficienti i processi produttivi. La generative AI è impiegata anche nell’ambito dell’ottimizzazione logistica e dell’efficientamento della supply chain.
Gestione delle risorse umane
La generative AI supporta vari processi in ambito HR. I suoi algoritmi possono accelerare e rendere più efficiente il processo di recruiting, ricercando, analizzando e categorizzando grandi quantità di curriculum, provenienti da varie fonti, identificando i candidati dotati dei requisiti e delle competenze necessarie per soddisfare una determinata job application.
La generative AI offre un contributo molto utile anche nella valutazione delle performance e nello sviluppo di percorsi di formazione personalizzati, sulla base degli obiettivi di ciascun dipendente, contribuendo ad una migliore employee satisfaction.
Tecnologie complementari alla Generative AI
La generative AI agisce in maniera sinergica e complementare con altre tecnologie emergenti, come il machine learning, il cloud computing e la computer vision.
Machine Learning
Machine learning e generative AI sono molto spesso complementari. Un assistente AI può ad esempio automatizzare la creazione di bozze di risposta alle e-mail ricevute. Ma non avrebbe di cui agire se non vi fosse a monte l’operato di un tool per classificare i documenti basato sul machine learning.
Cloud Computing
La AI generativa comporta in molti casi un’esigenza di modernizzare l’infrastruttura IT. Tale circostanza agevole l’adozione del cloud, sia per le applicazioni AI based, che in termini più generali per soddisfare tutti i carichi di lavoro previsti. Le aziende sviluppano pertanto un approccio cloud native, variando il modo in cui sviluppano e distribuiscono il software.
Il cloud computing consente ad esempio di usufruire delle principali applicazioni di AI multimodale, in cloud pubblico. Secondo una recente ricerca di Maximize Market Research, il mercato cloud native dovrebbe arrivare a generare un volume d’affari globale di circa 2300 miliardi di dollari entro il 2029.
Computer Vision
Tra le tecniche di intelligenza artificiale utilizzate in maniera sinergica con la generative AI va senza dubbio segnalata la computer vision, che utilizza funzioni di pattern recognition per riconoscere ad esempio gli oggetti presenti nelle immagini. La computer vision è alla base di applicazioni come riconoscimento facciale, controllo qualità dei prodotti, diagnostica medica e moderazione contenuti non conformi (es. violazioni di copyright).
Moxoff e Generative AI
Moxoff utilizza modelli di intelligenza artificiale generativa per apprendere pattern e relazioni tra i dati, utilizzando l’apprendimento supervisionato per creare nuovi output.
Oltre alle tecnologie e alle competenze tecniche di cui le aziende necessitano per implementare la generative AI nei loro processi, Moxoff è in grado di garantire la piena conformità a tutte le normative vigenti, scongiurando i rischi dovuti alle possibili violazioni di copyright o altre infrazioni derivanti da un utilizzo scorretto dei dati acquisiti per il training dei modelli di intelligenza artificiale generativa.
Le organizzazioni devono inoltre prepararsi all’entrata in vigore dell’AI ACT, che prevede nuovi obblighi in funzione del livello di rischio legato alle proprie attività.
Il contributo di Moxoff appare inoltre fondamentale quando le aziende scelgono di adottare soluzioni di AI privata, spesso implementate a partire da un LLM open source, che richiede un elevato livello di personalizzazione, ai fini di generare un asset fruibile e in grado di aumentare la propria efficienza e il proprio valore nel tempo.