Machine Learning: cos’è e come funziona



  1. Che cos’è il Machine Learning
  2. Quando è nato il termine machine learning?
  3. Machine Learning e Deep Learning
  4. Tipologie di Machine Learning
  5. Come funziona il Machine Learning
  6. I vantaggi del Machine Learning
  7. Le sfide del Machine Learning
  8. Applicazioni del Machine Learning
  9. Moxoff e Machine Learning

 

Il machine learning (ML) rappresenta con ogni probabilità la sottobranca dell’intelligenza artificiale più popolare e diffusa, sia in ambito consumer che nel contesto enterprise.
Altrimenti noto come apprendimento automatico, il ML è ormai da molti anni utilizzato in moltissimi ambiti applicativi e i recenti progressi computazionali, unitamente alla crescente offerta di servizi AI in cloud computing ha contribuito alla sua definitiva consacrazione, democratizzando la portata applicativa anche nel contesto delle PMI, inizialmente escluse da un entry level troppo elevato.
Attraverso l’esperienza di Moxoff, che da molti anni accompagna decine di aziende italiane nel loro AI Journey, vediamo in cosa consiste il machine learning, come funziona, quali sono le sue applicazioni principali e le sfide che bisogna affrontare quando si decide di adottarlo per innovare in maniera sostanziale i propri processi. 

Che cos’è il Machine Learning

Il machine learning è una tecnica di intelligenza artificiale che consente agli elaboratori informatici di apprendere dai dati per prendere decisioni informate. Le applicazioni ML non sono programmate per eseguire un singolo task in maniera deterministica, ma vengono addestrate con set di dati coerenti con un determinato contesto, per consentire agli algoritmi di apprendere come si svolge un determinato evento, di riconoscerne i pattern e arrivare ad offrire soluzioni pertinenti ai problemi da risolvere.
Il machine learning è un’attività multidisciplinare che coinvolge statistica, computer science e data science, con l’obiettivo di creare modelli in grado di migliorare la loro efficacia nel tempo, grazie al training di quantità e varietà di dati sempre più significative. Per tali ragioni, l’efficacia di un sistema ML non può prescindere da una elevata data quality, ai fini di scongiurare bias e risultati poco attendibili, se non addirittura fuorvianti.

Quando è nato il termine machine learning?

Il termine machine learning è comparso per la prima volta nella letteratura scientifica nel 1959, per mano di Arthur Samuel, ricercatore IBM e pioniere nel campo dell’intelligenza artificiale e del gaming. Nello stesso periodo inizia a diffondersi la definizione di computer ad apprendimento autonomo (self-teaching).
Il machine learning, almeno nella sua definizione concettuale risale agli anni 40 del Novecento, mentre le implementazioni attualmente riconoscibili sono databili a partire dagli anni 90. Una vera e propria maturazione del ML è avvenuta soltanto di recente, grazie a sistemi computazionali più performanti, in parte disponibili in cloud, che hanno consentito di svolgere più facilmente i complessi calcoli richiesti dai suoi algoritmi, consentendo al ML e ad altre tecniche AI di diffondere rapidamente la propria portata applicativa.
Tra le figure più autorevoli nella storia del machine learning, oltre al già citato Samuel, vanno certamente annoverati il pioniere Frank Rosenblatt, inventore del percettrone (1958), da cui sono derivate le reti neurali; Geoffrey Hinton, Yoshua Bengio e Yann LeCun, i cosiddetti “padrini della AI”, a cui si deve un contributo fondamentale nel deep learning, tra gli anni ‘80 e ‘90. In tempi più recenti riteniamo opportuno segnalare la fondamentale figura di Andrew Ng, soprattutto per quanto riguarda la democratizzazione delle conoscenze relative all’intelligenza artificiale e alle sue applicazioni.

Machine Learning e Deep Learning

Nell’ambito dell’intelligenza artificiale si sente spesso parlare di machine learning e deep learning (DL). Ma in cosa differiscono? Perché vengono utilizzate due definizioni quando concettualmente si tratta di tecniche piuttosto simili?
Per focalizzare il concetto è opportuno considerare il deep learning quale un subset del machine learning, che a sua volta rappresenta un subset dell’intelligenza artificiale in senso ampio. Il DL basa il proprio funzionamento sulle reti neurali profonde, algoritmi ispirati al funzionamento del cervello umano.
Il deep learning è particolarmente indicato per risolvere problemi generalizzati, che richiedono la comprensione di grandi quantità di dati non strutturati: riconoscimento di immagini, linguaggio naturale, generazione di testo e immagini, ecc.
Il machine learning appare più specifico nell’approccio e include metodi che non si basano soltanto sulle reti neurali. Il ML è preferibile quando il problema da risolvere è più specifico, richiedendo meno quantità e varietà di dati da correlare, oltre ad una maggiore trasparenza e spiegabilità.

Tipologie di Machine Learning

Le principali tipologie di machine learning si differenziano sulla base del processo di training: apprendimento supervisionato, apprendimento non supervisionato e apprendimento per rinforzo.

Apprendimento supervisionato

Il modello di machine learning viene addestrato per riconoscere e ricondurre i dati (input) a classi predefinite (output). Tale metodo richiede dati etichettati per il training, in quanto gli output devono essere noti a priori. I principali algoritmi utilizzati per l’apprendimento supervisionato sono gli algoritmi di classificazione e gli algoritmi di regressione.

Apprendimento non supervisionato

Nel caso dell’apprendimento non supervisionato, non si dispone di dati etichettati, ma si utilizzano tecniche come le analisi di clustering e le analisi associative per modellare i dati creando gruppi omogenei sulla base delle loro caratteristiche, in base a concetti come la similarità o la distanza, anche se non si conoscono a priori gli output attesi.

Apprendimento per rinforzo

Particolarmente utilizzato nell’ambito del deep learning, l’apprendimento per rinforzo prevede una serie di step sequenziali, in cui l’analisi dipende sia dalle caratteristiche dei dati utilizzati per il training che dallo stato attuale del sistema. Tali condizioni consentono all’algoritmo di fare una previsione che andrà costituire lo stato attuale per il ciclo successivo. Ogni ciclo prevede un rinforzo, un segnale numerico di ricompensa, utile a incoraggiare il sistema a ricercare le condizioni più favorevoli. In caso contrario, si procede con una penalizzazione.

Come funziona il Machine Learning

Il machine learning rappresenta una disciplina molto complessa e variegata, basti pensare che ad oggi la letteratura scientifica riconosce oltre cento algoritmi, entro cui scegliere il più adatto per sviluppare ogni singola applicazione.
Le competenze certificate e la comprovabile esperienza sul campo di Moxoff consentono di muoversi consapevolmente in questo mare di soluzioni, per valorizzare al meglio il proprio patrimonio di dati, grazie alle analisi predittive basate su tecniche di machine learning.
Le principali fasi di un processo ML prevedono: raccolta dei dati, preparazione dei dati, addestramento del modello, valutazione del modello, ottimizzazione del modello e implementazione finale.

Raccolta dei dati

Il processo di data gathering prevede la selezione delle fonti da cui acquisire i dati secondo criteri che dipendono dagli obiettivi analitici, prima ancora di entrare nel merito di valutare i data set esistenti, tra cui quelli già utilizzati nei precedenti cicli di training. A prescindere dall’utilizzo di un data set interno o esterno, è opportuno valutare la loro tipologia e la coerenza con le finalità analitiche previste.

Preparazione dei dati

Il processo di data preparation prevede a sua volta varie fasi, oltre alla già citata raccolta dei dati:

        1. Data discovery (scoperta e profilazione)
        2. Data cleaning (pulizia)
        3. Data transformation (trasformazione)
        4. Data structuring (strutturazione)
        5. Data enrichment (arricchimento)

I dati vengono preparati utilizzando piattaforme software dedicate e resi disponibili alle applicazioni analitiche attraverso specifici sistemi di gestione (es. database, data warehouse, data lake, ecc.)

Addestramento del modello

Dopo aver scelto l’algoritmo più indicato per svolgere il processo analitico, si procede con la fase di addestramento vera e propria, in cui l’algoritmo stesso elabora i dati del training set per elaborare un modello previsionale.

Valutazione del modello

Una volta che l’algoritmo di ML prescelto, opportunamente personalizzato, ha elaborato il modello previsionale è fondamentale valutare la sua accuratezza. Esistono varie modalità di valutazione, ma in generale viene utilizzato un data set di test (test set), differente rispetto al data set utilizzato in fase di apprendimento.
A seguito dell’elaborazione si valuta se le risposte esatte sono superiori o inferiori rispetto ad una soglia prefissata. Nel caso in cui i risultati si rivelassero deludenti, si procede con un re-training e si effettua una nuova valutazione.

Ottimizzazione e tuning

L’ottimizzazione dei modelli di machine learning ha quale obiettivo il progressivo miglioramento dell’accuratezza previsionale, a fronte di un impiego sempre più moderato di risorse. Un modello efficiente consente di risparmiare tempo e risorse computazionali preziose, anche nell’ottica di soddisfare criteri di sostenibilità (ESG), oltre che di performance.
Esistono varie tecniche per eseguire l’ottimizzazione dei modelli ML, tra cui: feature engineering, ottimizzazione degli iperparametri (Grid, Bayesiana, ecc.), regolarizzazione (L1, L2, Elastic Net, ecc.) e compressione dei modelli (Pruning, Quantizzazione, ecc.).
In questo contesto sono sempre più diffuse le tecniche di autoML (automated machine learning), che, come suggerisce la definizione stessa, consentono di automatizzare tutte le fasi di un processo ML: dalla selezione del modello, al pre-processing, fino alla sua ottimizzazione.

Implementazione

Quando il modello ML viene ritenuto soddisfacente e adeguato nel soddisfare i risultati analitici, viene distribuito in produzione, con una fase di implementazione nei processi aziendali. In seguito alla prima distribuzione è fondamentale il costante monitoraggio delle prestazioni del modello, per scongiurare problematiche (bias, deviazioni, ecc.) e procedere al suo aggiornamento quando vengono resi disponibili nuovi dati di training.
Tra i vari metodi di implementazione ritroviamo MLOps (machine learning operations), un approccio collaborativo multidisciplinare, in parte ispirato a DevOps, che mira a snellire il processo che porta i modelli ML in produzione, oltre a facilitare le fasi di gestione e monitoraggio.

I vantaggi del Machine Learning

Nell’era del digitale, i dati costituiscono la principale materia prima di cui le organizzazioni dispongono per supportare i loro obiettivi di business. In questo contesto, il machine learning rappresenta un processo fondamentale per estrarre, attraverso l’analisi, il valore informativo dai dati e valorizzarlo nel migliore dei modi in funzione delle esigenze aziendali.
Il machine learning contribuisce a digitalizzare la conoscenza ottenibile dai dati, mettendo a sistema l’esperienza e consolidando le procedure in atto, oltre ad abilitare nuove opportunità di business. Tra i vantaggi più comuni ottenibili grazie al ML è possibile citare l’automazione dei processi, il miglioramento dei processi decisionali e la personalizzazione dei contenuti per marketing e comunicazione.

Automazione dei processi

Il ML e la RPA (robotic process automation) contribuiscono ad automatizzare molte attività ripetitive, a basso valore aggiunto, liberando le risorse umane per attività più strategiche, riducendo contestualmente gli errori, a tutto vantaggio della produttività. Un esempio ricorrente è costituito dalla gestione documentale. Il ML permette inoltre di correlare dati di varia natura, provenienti da varie fonti, individuando aspetti che altrimenti rimarrebbero ignoti e che possono essere valorizzati in termini di efficienza e precisione nell’esecuzione dei processi.

Miglioramento delle decisioni

Le analisi descrittive e predittive basate sul machine learning consentono di estrarre valore informativo dai dati disponibili, producendo insight e report utili a rendere più informate e consapevoli le decisioni di business. Alcune applicazioni, soprattutto in ambito industriale, consentono di automatizzare le decisioni sul campo, ad esempio in sinergia con tecnologie di robotica collaborativa.

Personalizzazione

L’analisi comportamentale degli utenti e le previsioni relative alla domanda di mercato consentono alle applicazioni ML di supportare marketing e vendite nella personalizzazione delle campagne, ai fini di intercettare in maniera puntuale le esigenze dei consumatori ed ottenere maggiori conversioni.

Le sfide del Machine Learning

L’intelligenza artificiale è puntualmente al centro di un dibattito sulle criticità comportate dalla sua adozione, in merito ad aspetti quali etica, privacy dei dati, possibili discriminazioni e ricadute negative in termini occupazionali. In parte giustificate, questi argomenti riguardano da vicino anche il machine learning.

Sfide etiche e privacy

Le più recenti sfide in ambito normativo, come ci conferma l’AI Act, si soffermano con una frequenza sempre maggiore sugli aspetti etici legati all’adozione dell’intelligenza artificiale nei vari ambiti che prevedono l’attività dell’uomo. Una delle maggiori preoccupazioni è rivolta alla privacy dei dati acquisiti dai sistemi ML per svolgere i processi analitici. La AI ha un profondo impatto sulla vita delle persone e non dovrebbe prescindere da un approccio etico, finalizzato a produrre vantaggi per la collettività.

Rischi di bias e discriminazione

Le applicazioni ML dipendono strettamente dalla qualità e dai contenuti dei dati utilizzati durante le fasi di apprendimento. Se i dati si rivelano di bassa qualità o poco pertinenti con il contesto da analizzare, i risultati possono essere condizionati da bias o vere e proprie discriminazioni.
La dimostrazione pratica deriva da alcuni casi in cui non sono stati erogati mutui, in quanto le analisi dei sistemi ML hanno giudicato non meritevoli alcuni candidati, a causa di alcuni standard penalizzanti, riferibili delle loro origini, nonostante avessero parametri economici assolutamente adeguati ad ottenere quanto richiesto.

Impatto su occupazione e competenze professionali

Le applicazioni ML possono di fatto sostituire l’uomo in moltissime mansioni, creando esuberi e costringendo in ogni caso a processi di upskilling e reskilling. Il mondo del lavoro è destinato a cambiare per sempre, ma a fronte di evidenti minacce occupazionali, il machine learning sta creando enormi opportunità per chi possiede le competenze necessarie per il suo sviluppo. Chi vedrà minacciata la propria professionalità dalle AI dovrà necessariamente rimettersi in discussione, come è avvenuto nel corso di tutte le principali rivoluzioni industriali della storia.

Applicazioni del Machine Learning

Il machine learning viene utilizzato con successo ormai in tutti gli ambiti di business. A titolo esemplificativo citiamo alcuni tra gli esempi più significativi.

Settore sanitario

Le tecniche di machine vision e machine learning consentono applicazioni in radiologia molto accurate, in grado vedere laddove l’occhio umano non potrebbe mai arrivare, per effettuare diagnosi precoci, scongiurando al tempo stesso i falsi positivi.
Il ML è utilizzato anche per personalizzare le terapie dei pazienti, analizzando un gran numero di cartelle cliniche, opportunamente anonimizzate, per individuare il trattamento più indicato per risolvere la patologia.

Finanza

Le analisi predittive consentono di effettuare previsioni sull’andamento dei mercati azionari, oltre a valutare i rischi. La tecnologia ML viene infatti utilizzata in finanza per supportare le decisioni di investimento, identificando i rischi in base ai dati storici e statistici. Il ML può anche essere utilizzato per valutare i possibili risultati e sviluppare strategie di gestione del rischio.
Il ML e i sistemi di machine vision sono molto utilizzati anche nell’ambito della fraud detection nei POS e nelle transazioni online.

Automazione industriale

Il ML è ampiamente utilizzato nel contesto della smart factory, soprattutto per automatizzare e rendere più efficienti i processi esistenti, oltre ad abilitarne di nuovi. Tra le applicazioni più diffuse ritroviamo la manutenzione predittiva, che consente di intervenire soltanto quando effettivamente necessario, abbattendo sensibilmente i costi rispetto alla tradizionale manutenzione preventiva, minimizzando al tempo stesso i rischi di downtime dei sistemi produttivi.

Moxoff e Machine Learning

Nonostante oggi si parli molto di machine learning e data science, non esistono sul mercato soluzioni pronte all’uso, in grado di risolvere qualsiasi esigenza di business. Ogni organizzazione vanta la propria storia, il proprio contesto, i propri obiettivi di business, che vanno analizzati nel dettaglio per trovare la risposta più pertinente, a cominciare dalla scelta delle tecnologie ML da utilizzare.
Il machine learning è un termine che sottintende decine e decine di possibili approcci e tecniche, che vanno conosciute nel dettaglio, per individuare i modelli più efficaci in ciascun contesto applicativo.
Moxoff vanta comprovabili competenze nell’ambito dei big data, dell’intelligenza artificiale e del machine learning, oltre ad una profonda esperienza pratica nel creare modelli personalizzati, in grado di rendere più efficiente qualsiasi processo aziendale, in maniera totalmente allineata con gli obiettivi di business.

Contattaci per ricevere ulteriori informazioni