Uso de6-d vision en la deteccion de riesgos de colision automovilisticos
1. 1
Uso de 6D-Vision en la detección de riesgos de
colisión automovilísticos.
Escobar H. Jorge, Universidad Politécnica Salesiana.
jescobarh@est.ups.edu.ec
dimensiones), en base a estos datos una computadora puede
Abstract—This paper discusses the project "6D-vision" and realizar una advertencia al conductor, o como ya se está
how is used in the automotive industry for the prevention of car realizando en campos de prueba, una modificación del curso
accidents by stereoscopic detection of objects, analyzes the del vehículo evitando el incidente.
principle on which to base the concept of 6D vision and explains
the mainly points at which the project works when analyzing
images in real time. El mecanismo estereoscópico de captura de imagen permite
que las tomas se realicen en tres dimensiones, de esta forma se
Index Terms- 6D vision, Optical Flow, Stereo Vision. puede disponer de la profundidad a la que se encuentran los
objetos respecto a la fuente.
1 INTRODUCCIÓN Para procesar la información se realiza un muestreo (10000
puntos por imagen o incluso más) de forma que se puede llegar
a predecir con total efectividad la posición de un punto dentro
E n la búsqueda de minimizar los accidentes de tránsito
relativos al tiempo de respuesta que una persona tiene al
volante, los investigadores Dr. Uwe Franke, Dr. Stefan Gehrig
de los siguientes 0.5 segundos.
y Dr. Clemens Rabe de la compañía alemana Daimler AG El tiempo necesario para que una persona que conduce
(propietaria de marcas como Mercedes-Benz, Maybach y durante condiciones apropiadas reaccione ante un riesgo de
Smart) trabajan en un proyecto llamado “6D-vision”, este colisión es de aproximadamente 500 milisegundos, mientras
proyecto busca mediante la utilización de cámaras el reconocer que el tiempo de reacción de un sistema de visión 6D es de
posibles riesgos al momento en que el auto se encuentra aproximadamente 200 milisegundos, a esto se le debe sumar el
desplazándose, estos riesgos podrían ser peatones ciclistas o hecho de que el ojo humano no se percata de lo que sucede en
bien otros vehículos; el sistema no solamente identifica objetos la totalidad de su campo visual sino que a diferencia de la
sino q también realiza una predicción del desplazamiento que cámara suele enfocarse en una zona más pequeña.
pudiese desarrollar uno de ellos en las cercanías, de forma que
cualquier incidente pueda ser evitado o en el peor de los casos 3 VISIÓN ESTEREOSCÓPICA
minimizar los resultados adversos.
La visión estereoscópica (Stereo Vision) se basa en dos
La principal ventaja del un sistema como este se presenta en cámaras situadas una a la derecha y otra a la izquierda del
situaciones adversas de manejo, tales como entornos urbanos vehículo pero a una misma altura (similar a un par de ojos), lo
congestionados y cuando se presentan situaciones que se obtiene son dos imágenes con ligeras diferencia debido
climatológicas desfavorables, situaciones en las que los a las posiciones de las cámaras, esta diferencia se conoce
tiempos de respuesta de una persona no solo se ven reducidos como disparidad y es lo que mediante el uso de algoritmos nos
sino que también pueden producir reacciones indeseadas. permite calcular la profundidad a la que se encuentra un
objeto, puesto a que esta diferencia es menor mientras más
2 VISIÓN EN 6D lejos se encuentra de las cámaras.
Para comprender más claramente el concepto de visión en Los investigadores de Daimler utilizan un algoritmo
seis dimensiones podemos partir de un escenario de riesgo en estereoscópico llamado "Semi-Global Matching" (SGM) el
el cual nos encontramos ante un eventual choque, para poder cual utiliza la disparidad entre imágenes vecinas, por lo tanto,
tomar cualquier decisión con el fin de evitarlo es necesario realiza un paso de optimización para determinar la
conocer la ubicación del objeto respecto a nosotros (estas profundidad. Este algoritmo determina la profundidad de casi
serian las primeras tres dimensiones) y la magnitud dirección y todos los puntos de imagen en la escena con total precisión.
sentido con que se está desplazando (serian las otras tres
2. 2
5 ESTIMACIÓN DE MOVIMIENTO PROPIO (EGO-MOTION).
La estimación de movimiento de un sistema de cámaras que
se encuentra dentro de un vehículo resulta ser un problema a
resolver al momento de realizar la digitalización de los datos
capturados, pues en un trayecto se pueden presentar cambios
bruscos en los ejes de rotación y traslación del automóvil
debido a caminos en mal estado (baches) o deslizamientos que
se puedan producir, estos cambios en los ejes del vehículo
representan un cambio en los ejes de las cámaras (pues se
encuentran unidas a este) y se traducen en errores de
percepción, pues se estima un movimiento que no es propio de
los objetos distantes sino de las cámaras.
Gracias a que hoy en día existen sensores de velocidad y
rotación (incluso en el eje de la altura), se puede estimar de
Fig 1. Vista estereoscópica. Se puede apreciar la diferencia entre las 2 tomas
realizado por un conjunto estereoscópico; imagen superior, cámara izquierda; forma precisa el movimiento del automóvil en todos sus ejes,
imagen inferior, cámara derecha. (http://www.6d- 6D-vision utiliza una rutina muy eficiente (desarrollada por
vision.com/home/stereovision) Hernan Badino miembro investigador) que trabaja con los
datos obtenidos por los sensores y la elección de unos pocos
El algoritmo ha sido optimizado y desarrollado con el fin de puntos estacionarios en el campo visual de esta forma se
mantener un nivel de alto rendimiento por la noche y en determina con fiabilidad cuando se trata de un movimiento
condiciones meteorológicas adversas. En 2008, en la primera propio o externo.
prueba en tiempo real del algoritmo SGM se logro procesar las De esta forma se consolidan los puntos estáticos, y aquellos
imágenes estereoscópicas 25 veces por segundo. Con esta errores que se presenten pueden ser minimizados mediante
implementación, cualquier objeto de hasta 50 metros de mecanismos de filtrado de datos.
distancia se podía detectar y medir. Si se tiene en cuenta que la
capacidad de visión estéreo humana está entre 10-12m, se 6 RECONOCIMIENTO Y EVASIÓN DE RIESGOS.
percibe una gran ayuda al detectar riesgos.
Para reconocer cualquier riesgo los investigadores de
Daimler trabajan determinando el riesgo de choque con cada
4 FLUJO ÓPTICO.
punto del objeto que se aproxima, de tal forma que se puede
predecir un choque antes de que la totalidad del cuerpo sea
visible, a diferencia de otros métodos que primero identifican
la totalidad del cuerpo y luego predicen su movimiento este
método realiza la predicción de un punto y el conjunto de
todos estos puntos va formando el cuerpo que deseamos
evadir.
Fig 2. Flujo óptico. Vectores de desplazamiento de vehículos en una curva
cerrada. (http://www.6d-vision.com/home/optischerfluss)
La percepción de movimiento de los objetos alrededor del
vehículo es crucial para el concepto de 6D-Vision, por ello
resulta necesario analizar con precisión y velocidad el llamado
flujo óptico (Optical Flow), pues este representa el
desplazamiento que tiene cada punto o pixel durante una
secuencia de imágenes, el principal problema resultante del
cálculo del flujo óptico se da en que alrededor del vehículo y
en zonas como curvas los desplazamientos que se dan resultan
más grandes, por lo se debió perfeccionar el algoritmo de tal
forma que dichos desplazamientos puedan ser computados en
tiempos relativamente bajos, a un bajo costo, con una alta
velocidad del vehículo e incluso en condiciones climatológicas
adversas, se logro con esto crear un sistema que indica los
vectores de desplazamiento del cuerpo a base de colores,
indicando los colores más cálidos (el rojo por ejemplo) la
cercanía del objeto, y los más fríos (verde o azul) que el objeto Fig 3. Predicción de desplazamiento. Vectores de desplazamiento de un
vehículo que aparece abruptamente. (http://www.6d-vision.com/home/4)
se encuentra más lejano.
3. 3
Utilizando el mecanismo de visualización se logro determinar posible riesgo en 0.2 segundos y a lo largo de todo el campo
una escala básica en la que el color rojo representa un choque visual de la cámara, es decir, se tiene un tiempo de
inminente, el amarillo un posible riesgo y el verde ninguna identificación de riesgos menor y con una capacidad visual
posibilidad de choque. más elevada, esto abre un campo muy amplio en la asistencia
al conductor.
El modelado de objetos se realiza por agrupación de vectores
de desplazamiento conforme el cuerpo se acerca al vehículo, Entre las medidas que se presentan para evitar una posible
para objetos como autos y ciclistas resulta necesario filtrar la colisión no solo se encuentra el uso de un freno de emergencia,
información con el objetivo de poder determinar condiciones sino también la posibilidad de realizar una maniobra de giro
críticas y no críticas de choque pues estas son dependientes de rápido, que permite seguir en movimiento para no provocar
la velocidad, rotación e incluso la masa propia de cada uno, lo una colisión con los autos que se localizan posteriores al
cual va a variar la intensidad de la respuesta que el sistema nuestro.
presente al momento de tomar una decisión evasiva.
6.1 RECONOCIMIENTO DE PEATONES.
El sistema debe prever posibles giros inesperados q pueden
convertir las condiciones normales de manejo en condiciones Cuando el sistema de asistencia reconoce un objeto este busca
de choque inminente. establecer si es un peatón o no lo es, este filtrado de
información debe realizarse pues no solo se corre el riesgo de
provocar un daño mayor (este no se encuentra dentro de
ningún vehículo que pueda ayudarle a soportar el impacto),
sino también para poder establecer la estrategia adecuada en
función de la ubicación y velocidad (como ya se dijo antes uno
de las opciones en las que se trabaja es la de girar y esquivar al
individuo y no solo frenar)
Con este propósito lo que se hace es utilizar “clasificadores”
(emparejadores de formas) los cuales son entrenados con
varios ejemplos de peatones. Esta técnica es similar a la que se
utiliza al tratar de distinguir las señales de tránsito, sin
embargo el estándar de las señales de tránsito se encuentra
mejor definido que el de las personas; la identificación de
peatones presenta dificultades por los cambios que estas
presentan, entre otros tenemos:
Todos los peatones visten de distinta manera, por lo
que las formas que presentan varían.
Dependiendo de la velocidad con que se mueva una
persona y la dirección en que esta está mirando y
moviéndose, la forma en la que se la perciba
cambiará.
En algunas zonas los peatones se encuentran
Fig 4. Prueba de maniobra evasiva. Maniobra evasiva automática accionada cubiertos por otros objetos por lo que es necesario
por un sistema 6D-Vision. (http://www.youtube.com/watch?v=MrNV
kiiKDUo&feature=player_embedded) que el sistema se encuentre en la capacidad de
reconocer una parte visible de un peatón.
La mayoría de los accidentes de tránsito que se presentan en
Si existe varias personas se encuentran agrupadas,
las ciudades se pudiesen evitar si el conductor mirase justo en
esta formación puede producir una clasificación
el momento preciso en la dirección indicada, sin embargo el
errónea.
ojo humano solo logra enfocarse en una pequeña área del total
de su campo visual, esto se compensa realizando cambios
constantes y rápidos en la dirección en la que
observamos(cerca de 2 cambios por segundo), dejando una
gran área ciega durante tiempos cortos incluso para el
conductor más atento (no se diga para quienes realizan más de
una actividad al volate); el sistema 6D-Vision detecta un
4. 4
Los miembros del grupo de investigación de Daimler la identificación de las señales de tránsito, incluso en palabras
consideraron la información provista por los métodos estéreo del mismo Franke (investigador del proyecto) “queremos que
de adquisición de datos para lograr mejorar la funcionalidad entienda lo que sucede si un ciclista hace una señal con el
de los clasificadores antes mencionados, esta suma de modelos brazo izquierdo. Ése es el gran desafío para el futuro”.
de peatones y datos en tiempo real de velocidad y tamaño
mejora considerablemente la distinción de personas. Otras grandes empresas de la industria automotor cuentan
En la imagen a continuación se muestra un ejemplo, mientras también con sistemas de asistencia al conductor, por ejemplo
que la imagen del clasificador de pareo muestra una forma más Audi, Ford, Skoda y Mazda ya han construido autos que
difusa, aquella en la que se sobrepondrán los datos de realizan las maniobras al estacionar un vehículo, dejando al
velocidad y sentido resulta más distinguible. conductor únicamente la responsabilidad de aplicar la
aceleración necesaria al auto, estos sistemas incluso eligen el
lugar apropiado para estacionarse y si el vehículo se mueve a
una velocidad muy alta el sistema se desactiva; evidentemente
estos sistemas representan una gran ayuda al conductor, sin
embargo no vienen instalados en todos los vehículos que se
construyen además del elevado costo que tendrían aquellos en
los que se planea instalar estos sistemas.
Pese a tantas ventajas existen ciertos problemas retrasan
proyectos de este tipo, y es que dada la necesidad del
procesamiento de tanta información es necesaria la
optimización de los procesos lo máximo posible, eso incluye
en gran medida el espacio utilizado, y la energía que se
consume, siendo estos los principales inconvenientes con los
que se han encontrado los investigadores (no todos los autos
en el mercado no presentas los mismos espacios que los
utilizados en la investigación), no podemos olvidar que se trata
Fig 5. (Izq.) peatón visto mediante la percepción estereoscópica, (der.) el de una industria que busca dar confort y bienestar, y
mismo peatón identificado por el algoritmo clasificador. (http://www.6d- sobreponer la tecnología podría repercutir en las ganancias de
vision.com/aktuelle-forschung/pedestrian-recognition)
la empresa.
Los algoritmos de flujo óptico pueden potenciar aun mas a los
clasificadores, pero resulta necesario trabajar también en la BIBLIOGRAFÍA
predicción de si un peatón va a cruzar o no, un hecho que C. Rabe, U. Franke, S. Gehrig: “6D-Vision”, página oficial del proyecto,
Disponible en: http://www.6d-vision.com/
puede ir incluso más allá de la técnica (cayendo en el campo
del comportamiento humano) pero que también es analizado H. Hirschmüller: "Accurate and Efficient Stereo Processing by Semi-
por los investigadores. Global Matching and Mutual Information", in Proceedings of the IEEE
Conference on Computer Vision and Pattern Recognition, 20-26 June 2005,
San Diego, CA, USA, Volume 2, pp. 807-814. Disponible en:
7 CONCLUSIONES http://www.robotic.dlr.de/fileadmin/robotic/hirschmu/cvpr05hh.pdf
C. Rabe, U. Franke, S. Gehrig: “Fast detection of moving objects in
Proyectos como 6D-Vision representan un gran avance en el complex scenarios”, IEEE Intelligent Vehicles Symposium IV 2007, Istanbul
campo de la industria automotriz y el procesamiento de Disponible en: http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber
imágenes, no solo tiene como objeto el ser una herramienta de =4290147
apoyo para el conductor sino que también busca salvar vidas al
T. Müller, J. Rannacher, C. Rabe, U. Franke: „Feature- and Depth-
poder tomar la decisión en casos de riesgos inminentes en los Supported Modified Total Variation Optical Flow for 3D Motion Field
que la persona que se encuentra manejando puede Estimation in Real Scenes", IEEE CVPR 2011, Colorado Springs, 20.-25.Juni
simplemente no saber cómo actuar. 2011; Disponible en: http://www.6d-vision.de/9-
literatur/mueller_cvpr11/mueller11_cvpr11.pdf?attredirects=0&d=1
A pesar de que aun no se encuentra equipado en ningún auto,
el proyecto avanza con ganas de expandirse mas allá de lo Escobar H. Jorge Estudiante de Ingeniería Electrónica de la Universidad
Politécnica Salesiana, ingreso en el año 2009; graduado como bachiller
alcanzado hasta la fecha, pues aunque de momento solo se técnico industrial en electricidad en el Colegio Técnico Salesiano, En la
trabaja con el punto de vista del conductor es decir el ángulo ciudad de Cuenca en la provincia del Azuay, En Ecuador en el año 2006.
frontal de visión (entre los 50°), este busca ampliar la zona de
análisis de forma que se cubra la totalidad del vehículo (es
decir 360°) tratando de evitar colisiones laterales o
posteriores; otro de los aspectos en los que se aspira llegar es a