Salesforce AI Research propone un marco ‘Grabar después de leer’ para la privacidad de datos donde las muestras de datos de usuario se eliminan inmediatamente después de que se procesan

Estás leyendo la publicación: Salesforce AI Research propone un marco ‘Grabar después de leer’ para la privacidad de datos donde las muestras de datos de usuario se eliminan inmediatamente después de que se procesan

Con la llegada de la pandemia, Internet se ha convertido en una parte aún más integral de la existencia diaria de todos. Debido a la interconexión de nuestras vidas modernas, ahora es extremadamente difícil ocultar la huella digital de uno al eliminar fotos antiguas, publicaciones en redes sociales y tweets de la nube.

El derecho a la privacidad por encima de la conveniencia ha sido un tema de discusión, y los sistemas de recomendación que extraen activamente los datos de los usuarios en busca de algoritmos basados ​​en datos han avivado el fuego. El derecho al olvido (RTBF) es una protección bienvenida que permite a las personas exigir que las empresas borren sus registros. Recientemente, han surgido varias propuestas, principalmente centradas en el marco de aprendizaje federado, que tiene como objetivo garantizar la privacidad en el aprendizaje profundo. Dado que los datos confidenciales solo se guardan en un subconjunto de nodos, las actualizaciones asincrónicas en muchos nodos son posibles con el aprendizaje federado. Sin embargo, una nueva investigación muestra que el método de uso compartido de gradientes utilizado en modelos distribuidos puede filtrar datos de entrenamiento confidenciales.

Investigadores de la Universidad de Maryland y Salesforce afirman que no almacenar datos confidenciales es la práctica más segura en su trabajo reciente, “Grabar después de leer: Adaptación en línea para transmisión de datos entre dominios”.

🔥 Recomendado:  La guía definitiva de video en vivo de Instagram para empresas

Desafortunadamente, el cambio de distribución de datos públicos (el dominio de origen) a datos de usuarios privados (el dominio de destino) actualmente no se tiene en cuenta en ninguno de los marcos de aprendizaje en línea existentes, lo que les impide satisfacer esta demanda. Como solución, sugieren un paradigma para la adaptación de dominios en línea en el que los datos de transmisión modificados del dominio de destino se descartan rápidamente. A pesar de que parece ser una configuración extendida de adaptación de dominio no supervisado (UDA), el desafío no se puede realizar simplemente poniendo en línea los métodos UDA fuera de línea.

Dado que hay escasez de datos en el dominio de destino, la tarea de UDA en línea requiere enfoques innovadores. Para empezar, el escenario de transmisión en línea no puede darse el lujo de brindar las ricas combinaciones de mini lotes de dominios cruzados en los que se basan los algoritmos UDA fuera de línea convencionales para la adaptación. En particular, muchos enfoques basados ​​en la confrontación dentro de un dominio dado se basan en un mecanismo de confrontación de recocido lento que exige discernir una gran cantidad de pares fuente-objetivo para efectuar la adaptación necesaria.

Su enfoque para la adaptación de dominios en línea se basa en el arranque entre dominios, lo que les permite abordar directamente la dificultad más fundamental de la tarea en línea. La diversidad de los datos entre dominios aumenta con cada consulta en línea al arrancar el dominio de origen para crear permutaciones únicas con la consulta de destino actual. Capacitan a un grupo de estudiantes autónomos para mantener las distinciones entre ellos y aprovechar al máximo las diferentes permutaciones. Combinan la experiencia de los alumnos haciendo que intercambien sus pseudoetiquetas predichas en la consulta de destino actual para supervisar conjuntamente la capacitación en el dominio de destino. Sin embargo, no se les permite intercambiar pesos para preservar sus diferencias. Al promediar el conocimiento de todos los alumnos, podrían hacer un pronóstico más preciso de la consulta de destino actual. Lo llaman CroBoDo “Bootstrapping entre dominios para la adaptación de dominios en línea”.

🔥 Recomendado:  Cómo iniciar una línea de cuidado de la piel: la guía definitiva para 2023

Prueban el método en diferentes puntos de referencia, como el punto de referencia canónico de UDA VisDA-C [59], el punto de referencia de imágenes médicas COVID-DA y el subconjunto Camelyon del punto de referencia de cambio de distribución masiva WILDS. El hallazgo revela que el enfoque propuesto supera los enfoques UDA de última generación adecuados para el entorno basado en la web en todos los puntos de referencia. Además, esta estrategia proporciona resultados competitivos en el contexto fuera de línea sin requerir la reutilización de ninguna muestra objetivo. El rendimiento de su solución sencilla está a la par con el de un entorno fuera de línea, por lo que es una buena opción incluso si solo le preocupa ahorrar tiempo.

Este artículo está escrito como un artículo de resumen de investigación por el personal de Marktechpost basado en el trabajo de investigación ‘Grabar después de leer: Adaptación en línea para transmisión de datos entre dominios‘. Todo el crédito de esta investigación es para los investigadores de este proyecto. Revisar la papel, código y artículo de referencia.

Por favor no olvides unirte Nuestro subreddit de ML

Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools