Computer Vision: Definizione, Vantaggi e Applicazioni



  1. Che cos’è la Computer Vision
  2. L’evoluzione della Computer Vision
  3. Come funziona la Computer Vision
  4. I vantaggi della Computer Vision
  5. Le sfide della Computer Vision
  6. Applicazioni della Computer Vision
  7. Tecnologie complementari alla Machine Vision
  8. Moxoff e Computer Vision

La computer vision è una delle tecniche di intelligenza artificiale più affascinanti e complesse, sin dalla sua ispirazione, quella di vedere il mondo come farebbe l’occhio umano, neuralmente connesso al cervello biologico.
Se l’AI rappresenta il cervello, la visione artificiale può essere associata all’attività dell’occhio e alle sue funzioni fondamentali, che consentono di vedere e comprendere i fenomeni del mondo reale. In altri termini, la computer vision consente ai sistemi artificiali di osservare e interpretare il contesto analizzato, ispirandosi a ciò che l’uomo farebbe nelle medesime circostanze.
La computer vision è una disciplina complessa, che coinvolge studi e ricerche interdisciplinari, anche nell’ambito dell’intelligenza artificiale stessa, dove entrano in gioco machine learning, deep learning, reti neurali convoluzionali (CNN) e molte altre tecniche.
Attraverso l’esperienza di Moxoff vediamo cos’è la computer vision, come funziona e quali sono i vantaggi che attualmente si possono cogliere grazie alla sua consapevole implementazione nei processi aziendali.

Che cos’è la Computer Vision

Secondo la definizione offerta da Gartner, la computer vision è “un insieme di tecnologie che consiste nel catturare, elaborare e analizzare le immagini e i video del mondo reale per estrarre informazioni rivelanti e contestuali dal mondo fisico”.
La computer vision utilizza dispositivi, dati e algoritmi per analizzare in maniera molto più rapida e accurata ciò che farebbe l’occhio umano, cercando di offrire un’interpretazione simile. Per tali ragioni la visione artificiale viene utilizzata per affiancare quella umana soprattutto nei contesti a forte automazione, dove si tratta di vedere laddove l’occhio biologico non può arrivare. Ad esempio, analizzare processi, ispezionare prodotti o verificare le funzionalità degli asset di produzione, arrivando a rilevare anomalie impercettibili per l’uomo.
La computer vision vanta applicazioni in moltissimi ambiti ed è alla base di funzioni ormai nell’immaginario quotidiano, come il riconoscimento testuale (OCR), il riconoscimento facciale o la stessa realtà aumentata.

L’evoluzione della Computer Vision

Gli albori della visione artificiale sono da ricercare negli anni Cinquanta, quando alcuni neurofisiologi iniziarono a sottoporre immagini all’attenzione degli animali, per comprendere quale fosse la loro reazione a livello cerebrale.
Negli anni Sessanta vennero elaborate le prime tecnologie di scansione digitali e gli studi nell’ambito dell’intelligenza artificiale iniziarono ad occuparsi del problema della visione, arrivando ad elaborare, nel corso del decennio successivo, le prime applicazioni OCR (optical character recognition) per riconoscere e digitalizzare la scrittura autografa, utilizzando delle reti neurali.
Negli anni Ottanta, il neuroscienziato David Marr ha tradotto il funzionamento gerarchico della vista in algoritmi capaci di rilevare automaticamente i bordi di un oggetto e le sue forme elementari. In quegli anni veniva elaborato il Neocognitron, la prima rete neurale convoluzionale (CNN), che avrebbe dato il via alla computer vision di nuova generazione.
Dopo il grande inverno dell’intelligenza artificiale, negli anni 2000 iniziarono a fare la loro comparsa le applicazioni che tuttora utilizziamo, come il riconoscimento facciale, oltre a definire metodi di standardizzazione per l’etichettatura dei dati visivi.
Negli anni 2010, le reti neurali convoluzionali sono state rese nel contesto sempre più efficienti ed accurate nelle loro previsioni, riducendo i rischi di errore nel riconoscimento delle immagini a valori percentuali accettabili anche in un contesto di produzione.

Come funziona la Computer Vision

Come accennato, la visione artificiale utilizza dati digitali e tecniche di intelligenza artificiale, tra cui machine learning e deep learning, per riprodurre il funzionamento della visione umana. Gli algoritmi delle applicazioni di computer vision vengono addestrati grazie a data set di dati visivi di grandi dimensioni e apprendono come classificare, identificare, tracciare gli oggetti in un determinato contesto.

Analisi delle immagini

Il processo di analisi delle immagini sfrutta le tecniche di pattern recognition. L’immagine acquisita viene interpretata grazie al confronto con modelli di riferimento, precedentemente noti, rilevando ad esempio condizioni anomale che possono corrispondere ad un difetto qualitativo di un prodotto, ad un tentativo di frode o ad un possibile principio di patologia nelle indagini radiologiche.
Grazie all’apprendimento automatico, i sistemi di pattern recognition elaborano nel tempo una quantità sempre maggiore di immagini, migliorando progressivamente il loro livello di accuratezza, soddisfando in maniera sempre più affidabile le richieste applicative.

Funzioni fondamentali

Le funzioni fondamentali di un sistema di computer vision consistono nella classificazione, nell’identificazione e nel tracciamento degli oggetti.

  1. Classificazione degli oggetti (object classification): il sistema classifica gli oggetti presenti nell’immagine secondo categorie predefinite, per individuare, ad esempio, quanti fiori ci sono in un’immagine raffigurante un paesaggio.
  2. Identificazione degli oggetti (object identification): il sistema identifica gli oggetti presenti nell’immagine, per distinguere i loro dettagli significativi, come i lineamenti delle persone.
  3. Tracciamento degli oggetti (object tracking): il sistema analizza una traccia video per seguire la posizione di un determinato oggetto lungo una timeline.

Intelligenza artificiale

Nel contesto interdisciplinare che la caratterizza, occorre evidenziare come la computer vision di moderna generazione adotti un approccio differente rispetto ai metodi statistici per l’analisi delle immagini, utilizzando tecniche di deep learning basate sull’apprendimento automatico mediante reti neurali, in grado di ottenere molta più conoscenza dalle immagini rispetto ai sistemi tradizionali. Uno dei principali vantaggi dell’apprendimento automatico consiste nella capacità di valorizzare sempre di più il lavoro di analisi svolto sulle immagini, utilizzando gli output come parte dell’input del loop successivo, ai fini di migliorare l’accuratezza previsionale del modello.

I vantaggi della Computer Vision

Se implementata in maniera corretta e consapevole, la computer vision consente alle aziende di ottenere importanti vantaggi sotto tutti i punti di vista.

Miglioramento dell’efficienza operativa

In sinergia con altre tecniche AI, la computer vision permette l’automazione di attività tradizionalmente svolte in maniera manuale, come lo smistamento e l’imballaggio nei magazzini e nei centri di distribuzione, consentendo tempi di elaborazione più rapidi, riducendo la necessità di manodopera umana a basso valore aggiunto, sostituita da sistemi robotici.

Riduzione dei costi e incremento della produttività

La computer vision è in grado di automatizzare molti processi rendendoli più sostenibili dal punto di vista economico, aumentando nel contesto i livelli di produttività. Si pensi alla capacità di riconoscere il testo, alla base di applicazioni di gestione documentale o traduzione simultanea, o di riconoscere oggetti e persone nel contesto dei social media.

Maggiore sicurezza e qualità dei prodotti

La computer vision consente di migliorare la sicurezza sotto vari aspetti, si pensi alle sue applicazioni nell’ambito della videosorveglianza urbana nelle smart city. Tali sistemi sono in grado di monitorare lo spazio pubblico rilevando problemi di sicurezza, attivando automaticamente procedure di emergenza. Nel contesto della guida autonoma, la computer vision consente, tra le altre cose, di riconoscere gli ostacoli presenti lungo il percorso.
La computer vision viene utilizzata anche nell’ambito del controllo di qualità in produzione, grazie alla sua capacità di rilevare eventuali anomalie rispetto alle condizioni standard. Un elevato livello qualitativo si traduce molto spesso in una maggior soddisfazione del cliente e in un incremento della reputazione del brand.

Le sfide della Computer Vision

Trattandosi di una tecnologia relativamente recente, la computer vision porta inevitabilmente con sé alcune sfide inedite, a cui occorrerà trovare nel tempo un’adeguata soluzione.

Problemi di privacy

Le immagini acquisite dai sistemi di computer vision che ritraggono l’identità delle persone sono inevitabilmente soggette alla disciplina dei dati personali e alle considerazioni sui diritti fondamentali dell’uomo, come peraltro previsto, per quanto riguarda la giurisdizione europea, dal recente AI Act, che classifica molte applicazioni come “a rischio elevato”.
La conservazione e il trattamento dei dati acquisiti sono inoltre normate dal GDPR e possono essere rilevanti anche le disposizioni contenute nelle specifiche normative di settore, come avviene in ambito sanitario e finanziario.
Una delle principali problematiche è inoltre legata alle tecnologie deepfake, che consentono di sostituire con facilità l’identità delle persone reali, impersonandole in pratiche fraudolente, procedure di ricatto e altre attività cybercriminali.

Limitazioni tecniche e nella precisione

Per quanto i moderni sistemi AI siano sempre più affidabili, non è possibile escludere la possibilità di errore, dovuta ad esempio all’analisi di dati di bassa qualità o poco coerenti con il contesto da analizzare. Per la visione artificiale valgono pertanto le considerazioni generiche in merito all’intelligenza artificiale, che auspicano la stretta sorveglianza umana soprattutto nel contesto delle operazioni più critiche.

Alti costi di setup

Un sistema di computer vision efficiente comprende componenti hardware e software dai costi spesso non trascurabili, e non vanno sottovalutate le competenze necessarie per sviluppare, configurare e mantenere i modelli AI, affinché possano generare valore nel tempo. Costi significativi possono derivare anche dall’integrazione delle nuove applicazioni AI con i sistemi esistenti, soprattutto nel contesto della produzione industriale.

Applicazioni della Computer Vision

La computer vision viene molto spesso utilizzata in sinergia con altre tecniche di intelligenza artificiale, in qualsiasi ambito di business.

Industria manifatturiera

La computer vision viene utilizzata nel contesto industriale per svolgere numerose operazioni, che spaziano dal monitoraggio dell’efficienza dei sistemi di produzione, alla manutenzione predittiva e al controllo della qualità dei prodotti, giusto per citare alcune delle applicazioni più diffuse.

Veicoli autonomi e sistemi di trasporto

La computer vision trova ampio spazio sui veicoli a guida autonoma, per svolgere processi quali il rilevamento degli ostacoli, il mantenimento del percorso e il riconoscimento dei segnali stradali.

Sanità e diagnosi mediche

La visione artificiale viene utilizzata nella radiologia medica per effettuare indagini diagnostiche molto più accurate rispetto ai sistemi tradizionali, grazie alla capacità di vedere laddove anche l’occhio del medico più esperto non riuscirebbe mai ad arrivare, per evidenti limiti biologici. Grazie ai sistemi di visione artificiale è oggi possibile migliorare sensibilmente la diagnosi precoce di molte patologie, limitando al tempo stesso i falsi positivi.

Sicurezza pubblica e sorveglianza

La visione artificiale viene utilizzata nei sistemi di sorveglianza per rilevare e tracciare persone o veicoli, oltre a riconoscere volti o dispositivi di riconoscimento, specie nei luoghi a traffico elevato, come stadi, stazioni e aeroporti, ai fini di prevenire azioni criminali o attacchi terroristici.

Industria alimentare

La computer vision è largamente utilizzata nell’ambito dell’agricoltura di precisione, per ottimizzare e rendere più sostenibili i processi di irrigazione e fertilizzazione delle colture. Un caso esemplare è rappresentato dall’impiego di droni dotati di tecnologie di visione artificiale, che consentono di monitorare, su aree molto vaste, la salute delle colture (es. rilevamento parassiti) e le condizioni generali del terreno.

Tecnologie complementari alla Machine Vision

La computer vision è una tecnica di intelligenza artificiale che viene impiegata in un contesto interdisciplinare, coinvolgendo altre tecnologie molto rilevanti nel contesto della trasformazione digitale delle aziende.

Sensori IoT

I sistemi di visione artificiale analizzano spesso dati acquisiti dai sistemi IoT, che si tratti di apparecchi per la videosorveglianza o delle camere ad elevata precisione dei sistemi di controllo qualità della produzione industriale.

Reti Neurali Convoluzionali (CNN)

La computer vision utilizza da un lato il machine learning, con algoritmi che permettono al sistema informatico di apprendere dai dati visivi, dall’altro una rete neurale convoluzionale (CNN) che scompone le immagini in pixel, associando loro un significato (es. mediante tag).
Il termine convoluzione si riferisce all’operazione matematica che permette di fondere l’informazione visiva ottenuta dalla rete processando pixel vicini tra loro, questa operazione aggrega le informazioni e permette quindi di ottenere il processamento totale dell’immagine. Come le applicazioni di deep learning, le CNN lavorano in maniera iterativa per migliorare progressivamente i risultati ottenuti.

Cloud Computing e Edge Computing

In moltissimi contesti applicativi, le applicazioni basate sulla visione artificiale si interfacciano direttamente con le architetture cloud e edge. Una pipeline molto comune nella factory 4.0 prevede un sensore IoT che acquisisce un’immagine, la invia ad un dispositivo edge dotato di funzioni di computer vision per la pre-elaborazione, propedeutica all’invio in cloud qualora si rendessero necessarie l’archiviazione a lungo termine o analisi più approfondite.

Moxoff e Computer Vision

La domanda di soluzioni di computer vision non è mai stata così elevata come in questo particolare periodo storico, in cui le aziende stanno innovando i propri processi, affrontando un percorso di profonda trasformazione digitale.
La computer vision è in grado di innovare i processi tradizionali e abilitare nuove opportunità di business. Si tratta di una disciplina per natura complessa e interdisciplinare, che comporta conoscenze ed esperienze concrete, nel saper utilizzare uno stack di tecnologie per trovare la risposta più funzionale alle esigenze di business.
Grazie ad una pluriennale esperienza al fianco di decine di aziende italiane nell’ambito della AI adoption, Moxoff è in grado offrire consulenze, servizi e applicazioni in grado di soddisfare qualsiasi obiettivo aziendale, sulla base di un approccio collaborativo che mira ad analizzare i processi per individuare le soluzioni di computer vision più adatte nel contesto specifico.
Una volta definita la strada da seguire, Moxoff si occupa di garantire che ogni aspetto del progetto di computer vision rimanga strettamente allineato con gli obiettivi aziendali previsti, sia nel breve che nel lungo termine, a partire da una dettagliata roadmap di implementazione e integrazione nei sistemi esistenti.

Contattaci per ricevere maggior informazioni