Tecnología

mar
27

Evaluando técnicas para búsquedas por vista parcial en objetos 3D

Posteado a las 27 de Marzo de 2013 - 16:38 2 comentarios
Envía tu comentario
X

* Campos obligatorios

  1. Digita los número de la imagen y haz clic en el botón Enviar

  2. AVISO: Los comentarios son responsabilidad de sus autores y no representan la opinión de Terra. Está prohibido incluir comentarios que violen la ley, la moral, las buenas costumbres y derechos de terceros. Terra podrá retirar, sin previo aviso, comentarios que no respeten los criterios impuestos en este aviso o que estén fuera del tema de la noticia comentada.

Por Benjamin Bustos, académico Departamento Ciencias de la Computación, FCFM, Universidad de Chile.

Recientemente en el grupo de investigación KDW+PRISMA, perteneciente al DCC, realizamos una competencia en el marco del Shape Retrieval Contest 2013 (SHREC’13), llamada “SHREC 2013 Track: Large-Scale Partial Shape Retrieval Track Using Simulated Range Images” sobre búsqueda parcial de objetos 3D. El objetivo de esta competencia, en la cual participaron grupos de investigación de todo el mundo, era buscar en una colección de objetos 3D (modelados como una malla de triángulos) aquel objeto que correspondiera a una cierta vista parcial de dicho objeto de la colección.

Intuitivamente, esto correspondería a “sacarle una foto 3D” a algún objeto de la vida real y luego, sólo usando esta información parcial (no se escanea el objeto completo, sólo se dispone de la vista tomada con la “foto”), buscar en la colección el mismo objeto que fue escaneado en 3D y digitalizado. Para esta competencia, simulamos las vistas parciales a partir de los objetos 3D ya digitalizados. En el futuro, esperamos contar con un escáner 3D (estamos construyendo un prototipo como parte de una Tesis de Magíster) que nos permita obtener los datos directamente del objeto real.

El equipo organizador de esta competencia, está compuesto por Iván Sipirán (alumno de Doctorado del DCC), Rafael Meruane (alumno de Magíster del DCC), nuestro colaborador internacional en el área 3D Tobias Schreck, de la Universidad de Konstanz en Alemania, y quien les escribe.

Proceso de obtención de las vistas parciales simuladas. Se puede observar que las vistas simuladas son ruidosas, contienen agujeros, imperfecciones, etc.



























Inicialmente se registraron diez equipos internacionales, incluyendo nuestro grupo de investigación KDW+PRISMA. Sin embargo, durante el desarrollo de la competencia varios de los equipos nos informaron que estaban teniendo serios problemas para obtener resultados, los que se relacionaban con el tamaño de la colección de datos (simplemente eran demasiados objetos 3D, por lo que sus algoritmos no alcanzarían a terminar de procesar las consultas a tiempo) y con el procesamiento de las vistas parciales simuladas de los objetos 3D (sus algoritmos fallaban con estos datos, posiblemente indicando problemas de robustez en sus algoritmos o implementaciones). Al finalizar el track sólo dos equipos, uno con investigadores de la Universidad de Texas y el Fraunhofer Institute en Singapur, y nuestro equipo KDW+PRISMA, enviaron resultados para ser evaluados.

Como conclusión de la evaluación, los aspectos más relevantes se relacionan con la eficiencia y la robustez de los algoritmos que se están desarrollando en la actualidad. La mayoría de los equipos no logró enviar resultados porque les habría tomado demasiado tiempo procesar los datos, y eso que la cantidad de búsquedas a realizar era de menos de 10.000 sobre un conjunto de 360 objetos 3D. Esto da luces sobre la complejidad del problema, por lo que se está haciendo muy necesario investigar cómo aplicar técnicas eficientes de búsqueda si se quiere escalar a conjuntos de datos con millones de objetos 3D. Por otra parte, las implementaciones actuales de los equipos participantes tuvieron problemas con las vistas simuladas, que resultaron ser objetos 3D complejos con mucho ruido e imperfecciones. Esto indica que es necesario desarrollar técnicas que sean capaces de analizar estos objetos en forma robusta a pesar del ruido o imperfecciones que tengan. Además esperamos que pronto se hagan comunes escáneres 3D portátiles que podrían generar las vistas parciales 3D en objetos reales. Todos los resultados de esta competencia y su evaluación serán presentados prontamente en el Eurographics Workshop on 3D Object Retrieval.

Finalmente, si está interesado en leer más detalles sobre esta competencia y ver la colección de objetos 3D, puede visitar nuestra página Web http://dataset.dcc.uchile.cl/ donde encontrará toda la información necesaria. Puede revisar la ayuda en línea para encontrar instrucciones de cómo activar WebGL en su navegador y así poder mirar en línea la colección de datos 3D utilizada en esta competencia.

Comentarios

2 comentarios Comentario
Visualizando 1-2 de 2
  1. Benjamin Posteado: 3 de Abril de 2013 a las 7:47

    @Alejandro C.: 1. Los algoritmos de búsqueda debiesen poder buscar cualquier vista parcial del objeto 3D (no necesariamente alineada con los ejes de coordenadas). 2. Esta investigación no está orientada específicamente a imágenes, incluso las vistas parciales son modelos 3D, por lo que sus resultados no son directamente aplicables al escenario que mencionas. De todas formas, si uno quisiera aplicarlo para búsquedas en la Web habría que fijar la representación de los modelos 3D (si se utiliza nube de puntos, o malla geométrica, o alguna otra), dependiendo de esto se podría determinar la estructura de los archivos.

  2. Alejandro C. Posteado: 1 de Abril de 2013 a las 15:22

    Estimado profesor, muy buen artículo. Aprovecho de felicitar al DCC por esta investigación que sin duda entregará importantes avances en lo que es Informática Aplicada.
    Aprovecho de realizarle dos preguntas en mi afán de conocer más de esta investigación:

    1. En los ejemplos de Imágenes presentadas en los DataSet, todos se muestran con un eje (X,Y,Z) igual a Cero. Es decir, necesitaría capturar la imagen desde arriba, abajo, izq. derecha, atrás, adelante con exactamente 90° perpendicular al objeto de captura? Podría buscar imágenes donde la tupla (X,Y,Z) tenga valores no nulos en todas sus coordenadas?

    2.Si los resultados de su investigación se llevaran a campos de aplicación actuales (como p.ej la búsqueda de imágenes a través de un Motor de Búsqueda), implicaría un cambio en la estructura del archivo contenedor de la imagen? El archivo imagino debería llevar un valor (X,Y,Z) por cada pixel y/o unidad de significancia de la imagen. Eso sin contar los atributos propios de búsqueda de imágenes (como las etiquetas de Geolocalización y los Timestamp de captura, por ejemplo)

Visualizando 1-2 de 2
Comentario