2. Computer Vision
Cos'è?
È un campo dell’intelligenza artificiale che permette ai
computer e ai sistemi di ricavare informazioni significative
da immagini digitali, video e altri input visivi.
Abilita i computer ad emulare la visione umana, inclusa la
capacità di apprendere, di eseguire inferenze e di prendere
decisioni sulla base dell’input visuale.
Cosa studia?
L'analisi effettuata è finalizzata a scoprire cosa è presente nella scene e dove.
3. Computer Vision
Da cosa si differenzia?
Riconoscimento di pattern: estrazione,
identificazione, classificazione di
caratteristiche nelle immagini
Elaborazione di immagini: miglioramento,
restauro e compressione di immagini
Computer Vision ≠ Pattern Recognition
Computer Vision ≠ Image Processing
4. Computer Vision
CV di basso livello
Processi tipicamente paralleli,
spazialmente uniformi e
relativamente indipendenti dal
problema e dalla conoscenza a
priori.
Porta un miglioramento
dell'immagine iniziale.
CV di alto livello
Processi applicati a una porzione
dell'immagine. Dipendono
dall'obbiettivo e dalla conoscenza a
propri.
Si occupa dell'individuazione di forme
e relazioni spaziali, di riconoscimento e
classificazione di oggetti.
CV di medio livello
È una fase intermedia che può
essere vista come "analisi
dell'immagine".
Sfruttando processi di
segmentazione, registrazione e
accoppiamento, fornisce in output
le "features".
immagine features comprensione
5. Computer Vision
Come funziona?
Nella CV vengono utilizzate reti neurali convoluzionali (CNN) oppure le reti neurali ricorrenti (RNN) nel
deep learning.
CNN: cos'è? Per CNN si intende una classe di reti neurali artificiali che usano strati convoluzionali per
filtrare gli input. L'operazione di convoluzione combina i dati in input con un kernel di convoluzione. Il
kernel di convoluzione viene modificato in base ai parametri appresi per trovare la migliore feature per
il task.
CNN o ANN?
Le CNN si basano sulle ANN, sull’idea degli strati di neuroni
artificiali che trasportano le informazioni e sui pesi. A differenza
di esse i livelli di una CNN hanno i neuroni disposti in tre
dimensioni: larghezza, altezza e profondità.
I livelli nascosti (hidden layers), sono una combinazione di
livelli di convoluzione, livelli di pooling e i tradizionali livelli delle reti neurali (fully connected layer).
6. Computer Vision
Esempi pratici?
✔ Gestione dei magazzini
✔ Controllo qualità
✔ Guida autonoma
✔ OCR
✔ HTR: handwritten recognition
✔ Riconoscimento facciale