Estás leyendo la publicación: Un nuevo punto de referencia de inteligencia artificial (IA) llamado DeepPrivacy2 proporciona anonimización realista de rostros humanos y todo el cuerpo
Muchas aplicaciones requieren recopilar información de identificación personal, lo que hace que la recopilación y el almacenamiento de imágenes sean algo común. La legislación promulgada recientemente en muchas jurisdicciones dificulta la adquisición de dichos datos sin anonimización o autorización individual.
Las imágenes borrosas son un método común de anonimización de imágenes tradicional. Pero distorsiona gravemente los datos, haciéndolos inútiles para otros fines. Los modelos generativos ahora pueden generar rostros realistas adecuados para una situación específica, lo que ha llevado a la introducción de la anonimización realista. Aunque los enfoques actuales apuntan a ocultar la identidad de una persona, solo logran hacer que sus rostros sean irreconocibles para los identificadores primarios y secundarios.
Utilizando correspondencias densas de píxel a superficie derivadas de incrustaciones de superficie continua (CSE), las GAN guiadas por superficie (SG-GAN) ofrecen una GAN de anonimización de cuerpo completo. Sin embargo, este enfoque es propenso a las aberraciones visuales que degradan la calidad de la imagen. Según los investigadores, el conjunto de datos es una modificación de COCO que comprende 40.000 figuras humanas, razón por la cual la calidad visual es deficiente. La segmentación CSE utilizada para la anonimización tampoco tiene en cuenta el cabello u otros accesorios corporales; por lo tanto, la persona anonimizada frecuentemente los “usa” sin embargo. Además, SG-GAN no logra anonimizar a muchas personas, ya que el detector CSE generalmente pasa por alto a las personas que están fuera de cámara.
Un nuevo estudio de la Universidad Noruega de Ciencia y Tecnología amplía las GAN guiadas por superficie para abordar la baja calidad visual y la anonimización insuficiente provocada por una segmentación inadecuada. Presentan el conjunto de datos Flickr Diverse Humans (FDH), un subconjunto del conjunto de datos YFCC100M, que contiene 1,5 millones de fotos de seres humanos en diversos entornos. Demuestran que la mayor calidad visual de las figuras humanas creadas resulta directamente del conjunto de datos más grande. Como segundo paso, ofrecen un marco de anonimización único que utiliza una combinación de detecciones entre modalidades para impulsar la segmentación y detección de figuras humanas.
Los investigadores han utilizado anonimizadores separados en su marco para:
- Figuras humanas detectadas por estimación de pose densa
- Figuras humanas que el CSE no detecta
- Todas las demás caras
El enfoque propuesto utiliza un GAN de pintura básico para cada clase, entrenado con métodos convencionales para GAN. Los resultados del estudio muestran que la GAN propuesta puede producir identidades diversificadas y de alta calidad con ajustes de modelado mínimos adaptados al trabajo. Aplicaron su GAN para la anonimización de rostros en un conjunto de datos revisado de Flickr Diverse Faces (FDF). Debido a que el GAN no se basa en la guía de posición, puede anonimizar a las personas incluso cuando la información de la pose es difícil de detectar, mejorando significativamente los métodos anteriores de anonimización de rostros.
El equipo también demuestra que el generador basado en estilos puede usar técnicas de GAN incondicionales para ubicar direcciones semánticamente relevantes a nivel mundial en el espacio latente de GAN. Por lo tanto, la canalización de anonimización sugerida ahora puede aceptar ediciones de atributos basadas en orientación textual.
DeepPrivacy2 supera todos los enfoques de anonimización realistas de última generación en términos de calidad de imagen y garantías de anonimización. La precisión de la síntesis de DeepPrivacy2 se ha verificado mediante análisis tanto cualitativos como cuantitativos. Dado que no existe un punto de referencia aceptado contra los métodos de anonimización, el equipo compara sus resultados con el método de anonimización facial ampliamente utilizado DeepPrivacy y los de las GAN guiadas por superficie para la anonimización de todo el cuerpo (SG-GAN). El conjunto de datos FDH se usa para entrenar el generador de anonimización de cuerpo completo, mientras que el conjunto de datos FDF256 se usa para entrenar el generador de anonimización facial; el conjunto de datos FDF256 es una versión actualizada del FDF. Además, también incorporan datos de evaluación de Market1501, Cityscapes y COCO.
Para una amplia gama de escenas, poses y superposiciones, los resultados muestran que DeepPrivacy2 produce figuras de alta calidad. El generador de cuerpo completo incondicional, que no emplea CSE, revela que también es necesario para la anonimización de alta calidad con sus brazos y piernas poco naturales.
El equipo espera que su marco de código abierto sirva como un recurso valioso para las organizaciones y las personas que necesitan anonimización mientras mantienen la calidad de la imagen, particularmente aquellos que trabajan en el campo de la visión por computadora.