computer vision

Rete Metodologie didattiche innovative
Artiﬁcial Intelligence Based
#brAIn
PESCARA
Matteo Di Ciano

Computer Vision
Cos'è?
È un campo dell’intelligenza artificiale che permette ai
computer e ai sistemi di ricavare informazioni significative
da immagini digitali, video e altri input visivi.
Abilita i computer ad emulare la visione umana, inclusa la
capacità di apprendere, di eseguire inferenze e di prendere
decisioni sulla base dell’input visuale.
Cosa studia?
L'analisi effettuata è finalizzata a scoprire cosa è presente nella scene e dove.

Computer Vision
Da cosa si differenzia?
Riconoscimento di pattern: estrazione,
identiﬁcazione, classiﬁcazione di
caratteristiche nelle immagini
Elaborazione di immagini: miglioramento,
restauro e compressione di immagini
Computer Vision ≠ Pattern Recognition
Computer Vision ≠ Image Processing

Computer Vision
CV di basso livello
Processi tipicamente paralleli,
spazialmente uniformi e
relativamente indipendenti dal
problema e dalla conoscenza a
priori.
Porta un miglioramento
dell'immagine iniziale.
CV di alto livello
Processi applicati a una porzione
dell'immagine. Dipendono
dall'obbiettivo e dalla conoscenza a
propri.
Si occupa dell'individuazione di forme
e relazioni spaziali, di riconoscimento e
classiﬁcazione di oggetti.
CV di medio livello
È una fase intermedia che può
essere vista come "analisi
dell'immagine".
Sfruttando processi di
segmentazione, registrazione e
accoppiamento, fornisce in output
le "features".
immagine features comprensione

Computer Vision
Come funziona?
Nella CV vengono utilizzate reti neurali convoluzionali (CNN) oppure le reti neurali ricorrenti (RNN) nel
deep learning.
CNN: cos'è? Per CNN si intende una classe di reti neurali artificiali che usano strati convoluzionali per
filtrare gli input. L'operazione di convoluzione combina i dati in input con un kernel di convoluzione. Il
kernel di convoluzione viene modificato in base ai parametri appresi per trovare la migliore feature per
il task.
CNN o ANN?
Le CNN si basano sulle ANN, sull’idea degli strati di neuroni
artificiali che trasportano le informazioni e sui pesi. A differenza
di esse i livelli di una CNN hanno i neuroni disposti in tre
dimensioni: larghezza, altezza e profondità.
I livelli nascosti (hidden layers), sono una combinazione di
livelli di convoluzione, livelli di pooling e i tradizionali livelli delle reti neurali (fully connected layer).

Computer Vision
Esempi pratici?
✔ Gestione dei magazzini
✔ Controllo qualità
✔ Guida autonoma
✔ OCR
✔ HTR: handwritten recognition
✔ Riconoscimento facciale

computer vision

Recommandé

Recommandé

Contenu connexe

Plus de Matteo Di Ciano

Plus de Matteo Di Ciano (10)

computer vision