Estás leyendo la publicación: Investigadores de ETH Zurich y Microsoft proponen ‘LaMAR’, un nuevo punto de referencia para localización y mapeo para realidad aumentada
La realidad aumentada (AR) está en camino de convertirse en parte de nuestra vida diaria. Podemos definirlo como colocar un objeto virtual en el mundo real y asegurarnos de que conserve su ubicación y forma a lo largo del tiempo hasta que se elimine de la escena. Estos escenarios requieren que los dispositivos AR determinen correctamente su posición de 6 grados de libertad en cualquier momento para superponer constantemente el material virtual en el entorno real con precisión a nivel de píxeles.
La localización visual y el mapeo se han estudiado intensamente en el dominio de la visión artificial. Sin embargo, su aplicación a AR puede ser complicada y presenta desafíos únicos.
Uno de estos desafíos tiene que ver con los dispositivos que usamos para ver contenido AR. En su mayoría, usamos teléfonos móviles o dispositivos específicos de AR como HoloLens de Microsoft. Estos dispositivos están equipados con múltiples cámaras y sensores adicionales, lo que dificulta mapear y localizar el contenido AR utilizando métodos propuestos para configuraciones de una sola cámara.
Además, seguimos patrones únicos de movimiento de la mano o la cabeza cuando usamos nuestros dispositivos para ver contenido AR. Los sistemas de seguimiento en tiempo real en el dispositivo proporcionan flujos de sensores posicionados espacialmente, lo que significa que están relacionados entre sí en las dimensiones de profundidad, ancho y altura. Sin embargo, en muchos escenarios de AR, los objetos pueden cambiar con el tiempo y es posible que sea necesario rastrear el objeto más allá del rastreo local. Por lo tanto, el sistema de seguimiento AR debe ser robusto frente a cambios temporales en apariencia y estructuras.
El otro desafío es sobre los datos del sensor temporal. A menudo, hay muchos datos diferentes que provienen de los sensores, y el dispositivo que usamos debe poder dar sentido a todos esos datos rápidamente. Esto es crucial porque si el dispositivo no puede mantenerse al día con los datos, no será una buena experiencia para la persona que lo usa.
Finalmente, a medida que más personas adopten AR, habrá más oportunidades para preparar mapas a gran escala de fuentes múltiples utilizando datos de varios dispositivos. Sin embargo, esto no será sencillo ya que se deben abordar ciertos desafíos, como garantizar algoritmos sólidos y preservar la privacidad.
A pesar de todos estos desafíos en el dominio AR, la investigación académica actual está impulsada principalmente por puntos de referencia que no abordan ninguno de los desafíos antes mencionados. Aquí es donde entra en juego LaMAR. LaMAR está aquí para proporcionar un punto de referencia sólido y realista para los estudios AR que se centran en la localización y el mapeo. LaMAR tiene tres contribuciones principales.
La primera contribución es presentar un conjunto de datos a gran escala capturado con dispositivos AR en varios contextos, incluido un edificio histórico, un edificio de oficinas de varios pisos y una sección del centro de la ciudad. El conjunto de datos contiene escenas interiores y exteriores con iluminación y cambios semánticos, así como objetos dinámicos. Los datos se capturan utilizando dispositivos portátiles como iPad y dispositivos montados en la cabeza como HoloLens durante un período de un año.
La segunda contribución es proporcionar una tubería para producir trayectorias AR reales automáticas y precisas contra escaneos láser 3D a gran escala. Esta canalización puede manejar datos de fuentes múltiples de dispositivos heterogéneos, lo que hace posible ampliar el conjunto de datos con más datos y diferentes tipos de dispositivos.
Finalmente, se presenta una evaluación detallada de las técnicas de localización y mapeo en el dominio AR. Durante estas evaluaciones se brindan nuevos conocimientos para futuras direcciones de investigación.
Este fue un breve resumen de LaMAR, el nuevo benchmarking para localización y mapeo de AR. Puede encontrar más información en los enlaces a continuación si está interesado en obtener más información al respecto.
Este artículo está escrito como un artículo de resumen de investigación por el personal de Marktechpost basado en el trabajo de investigación ‘LaMAR: Benchmarking Localización y Mapeo para Realidad Aumentada‘. Todo el crédito de esta investigación es para los investigadores de este proyecto. Revisar la papel, código y proyecto.
Por favor no olvides unirte Nuestro subreddit de ML
Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools