miércoles, 11 de febrero de 2009

Hinz, Stefan: Detection and Counting of Cars in Aerial Images

Este paper permite el conteo de automóviles desde imágenes aéreas por medio de una comparación en base a un modelo jerárquico 3D que permite identificar figuras geométricas representativas del auto a diferentes escalas de detalle. Color del auto, del parabrisas y de la sombra del mismo se consideran como características radiométricas.

Con respecto a los modelos basados en apariencia se trabajan dos grandes clasificaciones:

  • Modelo implícito
Se crea por medio de imágenes de ejemplos de autos, los cuales tienen textura o un valor en escala de grises y proporcionan estadísticas que conforman vectores. Ya que son obtenidos los vectores, se buscan en todas las regiones de la imagen para compararlas con las de los modelos y así ubicarlos.

  • Modelo explícito
Se cuenta con un modelo 2D o 3D como puede ser una caja o un armazón del automóvil y se compara en la imagen para indicar que el auto se encuentra en la escena.

El documento propone hacer uso de un modelo explícito dado que cuando se realiza la búsqueda de características y vectores estadísticos, muchas veces las estadísticas pueden ser confundidas debido a cambios de luz dentro de la escena. Más complejo aún es que necesita de datos de entrenamiento para poder realizar la búsqueda, lo que implica que probablemente imágenes futuras no tengan la misma forma que el modelo estadístico establecido en primer instancia.

También es propuesto que dado que los automóviles son pequeños se requiere de un modelo bien detallado para evitar que haya confusiones con objetos similares.


Lo que se hace es realizar una obtención de ciertos descriptores que ayudan a comparar el objeto dentro de la imagen con los modelos que se encuentran definidos. Uno de los parámetros que podemos encontrar es la obtención de distancias (ancho, largo del auto).Las distancias son obtenidas por medio de las sombras que proyecta el automóvil y por el color opaco que sobresale del parabrisas cuando el automóvil es de color claro.

La propuesta que hace este algoritmo es que es adaptativo a ciertas condiciones. Por ejemplo, si queremos identificar en donde es que termina el toldo del auto encontrando donde es que inicia el parabrisas, puede presentarse un problema cuando un automóvil es oscuro. Sin embargo, tenemos entendido de imágenes claras cual es la dirección del Sol (debido a la sombra proyectada), por lo que es más fácil poder identificar ciertos parámetros.

Aunque se cuenta con la característica de dirección de la sombra, el detectar un auto en específico requeriría de que el sistema tuviera identificados muchos modelos. Para evitar esto, se plantea un modelo jerárquico de automóviles.

Este modelo jerárquico representa a un automóvil de acuerdo al modelo con el que guarda mayor parecido. De esta forma se pueden identificar diferentes tipos de automóviles.


Para detectar el automóvil se usa una búsqueda del modelo a lo largo de toda la imagen. Esto se hace debido a que es más fácil hallar todo un modelo bien estructurado que a encontrar ciertas características que pudieran darnos pista de nuestro objeto. Además, poder hallar características de un auto es muy dificil debido a las irregularidades que estos pueden tener.


Pasos del algoritmo para detección


  • Hallar los pixeles del borde y calcular la dirección del borde
  • Proyectar el modelo en la dirección que tiene el borde
  • Medir color en la región de piso
  • Adaptar el modelo de cada característica dependiendo de la posición, orientación, color y dirección del sol
  • Medir craacterísticas de la imagen: amplitud de los bordes, soporte de cada modelo de bordes, dirección del modelo, color, oscuridad de sombras
  • Calcular el parecido comparando valores medidos con los esperados
  • Decidir si es un auto o no
Entre las mejoras hechas al algoritmo se encuentran
  • Almacenar los modelos en una base de datos dado que la dirección del sol casi no varía
  • Se elimina el ruido y se proyecta el modelo solo si no ha pasado un umbral si se ha eliminado ruido.
  • Limita los cálculos a cierto número de iteraciones
  • Restringe las áreas de búsqueda de automóviles

Resultados


  • Se puede ver que con imágenes de alta resolución y sin ninguna preclasificación manual se pudo llevar a cabo la identificación de los automóviles.
  • Casi todos los autos de pasajeros se detectaro pero no fue así para todas las vans o camiones pequeños debido a que su forma no era muy similar a la de los modelos.
  • Algunas sombras de edificios causaron confusión en el algoritmo, por lo que es necesario definir las regiones donde se ve que las sombras de los edificios pueden afectar la iluminación de una carretera

No hay comentarios: