Estás leyendo la publicación: Conozca DeepLSD: un detector de línea genérico que combina la solidez del aprendizaje profundo con la precisión de los detectores hechos a mano
En los entornos que han creado los humanos, los segmentos de línea son comunes y transmiten de manera eficiente la estructura de la imagen subyacente. Complementan muy bien los puntos característicos debido a su rango espacial y presencia, incluso en áreas sin textura. Por lo tanto, las características de la línea se han empleado en varias tareas de visión, incluida la reconstrucción 3D, la estructura a partir del movimiento (SfM), la localización y el mapeo simultáneos, la localización visual, el seguimiento, la estimación del punto de fuga, etc. Se necesita un detector confiable y preciso para extraer la línea. características de las imágenes para todas estas aplicaciones. El detector de segmento de línea (LSD) es un ejemplo de una heurística hecha a mano que se utiliza para extraer segmentos de línea de un gradiente de imagen. Debido a su dependencia de las características diminutas de la imagen, estas técnicas son rápidas y precisas.
Sin embargo, es posible que necesiten más resiliencia en circunstancias difíciles, como una iluminación tenue, si el gradiente visual es caótico. Además, no tienen en cuenta la información de toda la escena e identificarán cualquier grupo de píxeles con una orientación de gradiente similar, incluso si contiene líneas ruidosas o aburridas. Las redes profundas han abierto recientemente nuevas formas de abordar estos problemas. Los enfoques profundos de estructura alámbrica, que buscan inferir la estructura lineal de las imágenes interiores, son responsables del renacimiento de las técnicas de detección de líneas. Desde entonces, se han desarrollado detectores de segmento de línea profunda más generales, como detectores de línea conjunta y descriptores. Estas técnicas tienen el potencial de aprender de imágenes difíciles y volverse más sólidas cuando los métodos más tradicionales se quedan cortos.
También pueden codificar algún contexto visual y diferenciar entre líneas ruidosas y significativas, ya que necesitan un campo receptivo amplio para administrar la amplitud de los segmentos de línea en una imagen. Sin embargo, la mayoría de estas técnicas están totalmente supervisadas y el conjunto de datos Wireframe es el único conjunto de datos que contiene líneas de verdad del terreno. Este conjunto de datos, que se creó por primera vez para el análisis de estructura alámbrica, está sesgado hacia las líneas estructurales y solo está disponible para escenarios de interior. Por lo tanto, como se muestra en la figura anterior, hay mejores conjuntos de entrenamiento para detectores de línea generales. Además, los sensores profundos contemporáneos aún necesitan superar los algoritmos hechos a mano en fotos simples debido a su falta de precisión, al igual que los puntos característicos.
Debido a la fragmentación de la línea y al bloqueo parcial, puede resultar complicado localizar los extremos de la línea con precisión. Por lo tanto, numerosos programas que usan líneas toman en cuenta líneas ilimitadas y no tienen en cuenta los puntos finales. Con base en esta evaluación, sugieren en este estudio preservar lo mejor de ambos mundos: analizar la imagen usando aprendizaje profundo para eliminar características extrañas, luego detectar los segmentos de línea usando técnicas manuales. Así, mantienen las ventajas de la comprensión profunda, como abstraer la imagen y aumentar la resistencia a la luz y al ruido, conservando la precisión de los enfoques tradicionales. Lograron lograr este objetivo al adoptar las estrategias de dos técnicas anteriores que usaban una representación dual de segmentos de línea con campos de atracción.
Este último demuestra representaciones continuas, ideales para el aprendizaje profundo, como entrada para detectores de línea convencionales. Proponen arrancar los enfoques actuales para producir una verdad de tierra falsa de alta calidad en lugar de usar líneas de verdad de tierra, como en el caso de los dos métodos anteriores, para entrenar su campo de atracción de línea. Como resultado, como demuestran en sus estudios, su red puede entrenarse en cualquier conjunto de datos y adaptarse a ciertas aplicaciones. También sugieren una técnica de optimización única para mejorar los segmentos de línea que se han encontrado. Esta mejora se basa en los puntos de fuga que se optimizaron junto con los detalles, así como el campo de atracción que produjo la red propuesta.
Este ajuste se puede utilizar para aumentar significativamente la precisión de su predicción y mejorar el rendimiento de otros detectores de líneas profundas. En conclusión, sugieren realizar las siguientes contribuciones:
• Describen una estrategia de optimización que puede mejorar los segmentos de línea y los puntos de fuga al mismo tiempo. Sugieren una técnica para arrancar detectores de corriente para construir campos de atracción de línea de verdad en tierra en cualquier imagen.
• Al combinar la solidez de los enfoques de aprendizaje profundo con la precisión de los métodos artesanales en una sola canalización
• Establecieron un nuevo récord en varias tareas posteriores que requieren segmentos de línea. Esta optimización se puede utilizar como un refinamiento independiente para mejorar la precisión de cualquier detector de línea profunda existente. La implementación del código está disponible en GitHub.