2. Objetivos
Los participantes irán adquiriendo
conocimientos sobre la materia de visión en
color para luego aplicarlos en una
competencia. Irán aprendiendo cómo hacer
que sus robots sean capaces de
desenvolverse en espacios con marcas de
colores.
Preparado para Campus Party México 2009 2
5. Visión Computacional (1/2)
Es la ciencia y la tecnología de las
máquinas que ven.
Como una disciplina científica, la visión por
computadora trata con la teoría de
construir sistemas artificiales que obtienen
información a partir de imágenes.
Preparado para Campus Party México 2009 5
6. Visión Computacional (2/2)
Los datos de imágenes pueden tomar
muchas formas, como imágenes
capturadas, secuencias de video, vistas de
múltiples cámaras, o datos
multidimensionales de fuentes diversas.
La visión por computadora estudia y
describe los sistemas de visión artificial
que son implementados en software y/o
hardware.
Preparado para Campus Party México 2009 6
7. Áreas de Trabajo en Visión
Procesamiento Análisis de Visión por Detección de
de Imágenes Imágenes Computadora Formas
Análisis por Reconocimiento Entendimiento
Segmentación
Color de Patrones de Escenas
Detección de Seguimiento de Servo‐control Reconstrucción
Movimiento Objetos Visual 3D
Navegación
Basada en …
Visión
Preparado para Campus Party México 2009 7
8. Cámaras Digitales
Dispositivos que permiten el registro de un
aspecto 2D del mundo en el que vivimos.
Pueden registrar el mundo en diferentes
calidades (resoluciones y fidelidades) .
Más resolución implica un mayor detalle, pero no
necesariamente más calidad.
Pueden registrar el mundo según diferentes
aspectos.
Capturan de manera típica imágenes de intensidad
luminosa, pero pueden proporcionarnos también otros
tipos de imágenes, como profundidad, etc.
Preparado para Campus Party México 2009 8
10. La Imagen Digital
Una imagen continua es aproximada por un arreglo discreto de valores.
f (x, y)
⎡ f (0, 0) f (0,1) … f (0, N − 1) ⎤
⎢ ⎥
… f (1, N − 1)
f (x, y) = ⎢ ⎥
f (1, 0) f (1,1)
⎢ ⎥
⎢ ⎥
⎢ f (M − 1, 0)
⎣
f (M − 1,1) f (M − 1, N − 1) ⎥
⎦
A esta matriz se le conoce como imagen digital y a cada uno de los MxN valores
se le denomina píxel ( contracción de picture element) o pel.
Cada uno de los valores refleja una intensidad de la variable registrada por el
dispositivo de captura asociado con un objeto dentro de la escena.
Preparado para Campus Party México 2009
R. E. Sánchez Yáñez / Universidad de Guanajuato FIMEE
10
13. Muestreo
Preparado para Campus Party México 2009 13
14. Cuantificación
Preparado para Campus Party México 2009 14
15. Herramientas para Visión
Computacional
Fuera de línea
Software de creación sintética de imágenes.
Software de procesamiento y análisis de imagen.
En línea
Manejadores de dispositivos de captura.
Librerías de manejo de imágenes.
Entornos personalizados de programación.
Preparado para Campus Party México 2009 15
17. Procesamiento de Imágenes
En la mayoría de las aplicaciones de visión por
computadora, el fin último es extraer
importantes características a partir de datos
de imágenes; características de las cuales, a
su vez una computadora puede proporcionar
ya sea una descripción, una interpretación o
el entendimiento de la escena.
En las operaciones de procesamiento de
imágenes generalmente se tiene como salida
otra imagen, realizando tareas como
restauración, mejoramiento o codificación.
Preparado para Campus Party México 2009 17
19. Procesamiento de Imágenes
Procesos puntuales
Operaciones que modifican cada píxel de una
imagen según un proceso que considera
únicamente el píxel correspondiente en la imagen
de entrada.
Procesos de área
Operaciones que calculan propiedades de un píxel
a partir de una cierta vecindad.
Preparado para Campus Party México 2009 19
20. Procesos Puntuales
Operaciones que modifican cada píxel de una
imagen según un proceso que considera
únicamente el píxel correspondiente en la
imagen de entrada.
Ejemplos de procesos puntuales
Negativo de una imagen.
Cambio de espacio de color de una imagen.
Umbralización.
Preparado para Campus Party México 2009 20
22. Negativo de Imágenes (2/2)
Si f (x, y) es la imagen original y
F(x, y) el negativo de la imagen:
∀x, y ∈{0, M − 1} × {0, N − 1}
F(x, y) = Imax − f (x, y)
El valor de I max es el máximo valor de la
intensidad capturado por el dispositivo de entrada.
Típicamente 255.
Preparado para Campus Party México 2009 22
24. Umbralización
Esta es una operación que tiene como
objetivo separar el fondo de una imagen de la
figura u objeto de interés a partir de la
utilización de dos niveles de intensidad. Uno
para el fondo y otro para el objeto.
Preparado para Campus Party México 2009 24
25. Umbralización
Si r = f (x, y) es la imagen original,
s = g(x, y) es la imagen procesada
y t es un umbral de separación:
⎧
⎪ 0 Si 0 < r ≤ t
r=⎨
⎪ L − 1 Si t < r ≤ L − 1
⎩
Donde L - 1 es la intensidad máxima del formato imagen.
Preparado para Campus Party México 2009 25
28. Histograma de una imagen
Un histograma se define como una gráfica de
distribución de frecuencia de ocurrencia de
cada color en la imagen y es un indicativo de
la concentración de pixeles contra la
brillantez.
El histograma se usa generalmente de forma
normalizada (esto es como una función de
probabilidad). El histograma es una función
discreta de una imagen.
Preparado para Campus Party México 2009 28
31. Procesos de área
Operaciones que modifican cada píxel
utilizando la información contenida en una
vecindad centrada en el píxel de interés de
una imagen según un proceso determinado.
Ejemplos de procesos puntuales
Filtrado de mediana.
Filtrado espacial.
Detección de bordes.
Preparado para Campus Party México 2009 31
32. Media de una Vecindad
Es un método de suavizado empleado para eliminar ruido
aditivo de una imagen.
Generalmente se usa una ventana V de NxN píxeles
alrededor del píxel central (x,y).
El valor de intensidad del píxel en la imagen procesada es
el promedio de los píxeles en V.
Preparado para Campus Party México 2009 32
34. Mediana de una Vecindad
Se usa para preservar la información de los
bordes de la imagen.
En este procesamiento, los valores de
intensidad de los píxeles de una vecindad V
alrededor del punto (x,y) son ordenados y la
mediana (el valor central de los datos) es
tomada como resultado en la imagen de
salida.
Preparado para Campus Party México 2009 34
37. Frecuencia Espacial (1/2)
• La frecuencia espacial se define como la tasa
de cambio de la brillantez de los pixeles (la
intensidad) dividida por la distancia sobre la
cual ocurre el cambio, teniendo componentes
en ambas direcciones de la imagen.
• Una imagen con frecuencia espacial alta
contiene grandes cambios de intensidad en
pixeles cercanos; mientras que una con baja
frecuencia espacial, tiene áreas extensas con
intensidad constante.
Preparado para Campus Party México 2009 37
38. Frecuencia Espacial (2/2)
• La frecuencia espacial nos indica qué tan
cerca (en ambas direcciones) se repiten
patrones de intensidad en la imagen.
• Considerando la información de frecuencia
espacial, los procesos de área pueden
operar como filtros para remover o resaltar
componentes de frecuencia específicos.
Preparado para Campus Party México 2009 38
49. Vectores de Características
Definiendo un conjunto de características (mediciones
de atributos) como
x1 = área
x2 = perímetro
:
xd = atributo d-ésimo
podemos pensar en nuestro conjunto de atributos (patrón)
como un vector de características (feature vector) x, en
donde x es un vector columna d-dimensional.
Preparado para Campus Party México 2009 49
50. Vectores como Puntos
De la misma forma, podemos considerar este patrón
como un punto en un espacio de características d-
dimensional.
Esta representación abstracta puede hacerse para un
objeto o para un evento.
Preparado para Campus Party México 2009 50
55. Espacios (Modelos) de Color
Espacios de Color
Generalmente 3 componentes.
RGB
CIELab
Utilidad dependiente de la
aplicación específica.
CIELuv
HSI
…
Una transformación simple
Componentes R,G,B Otro espacio de color
Preparado para Campus Party México 2009 55