El nuevo DarkBert AI fue entrenado usando datos de la web oscura de piratas informáticos y ciberdelincuentes

Estás leyendo la publicación: El nuevo DarkBert AI fue entrenado usando datos de la web oscura de piratas informáticos y ciberdelincuentes

Tras el éxito de OpenAI ChatGPTde Microsoft Chat de Bing y Bardo de Googlelos investigadores han creado un nuevo modelo de IA con un giro mucho más oscuro.

Mientras que los modelos de lenguaje extenso (LLM) que impulsan ChatGPT y Google Bard se entrenaron con datos de la web abierta, DarkBERT se entrenó exclusivamente con datos de la web oscura. Sí, leíste bien, este nuevo modelo de IA se entrenó con datos de piratas informáticos, ciberdelincuentes y otros estafadores.

Un equipo de investigadores de Corea del Sur ha publicado un papel (PDF) que detalla cómo hicieron DarkBERT usando datos del red tor, que a menudo se usa para acceder a la dark web. Al rastrear la web oscura y luego filtrar los datos sin procesar, pudieron crear una base de datos de la web oscura que usaron para entrenar DarkBERT.

Sorprendentemente, DarkBERT ya logró superar a otros grandes modelos de lenguaje a pesar de haber sido entrenado con datos de un lugar muy poco probable.

Dando nueva vida a una antigua arquitectura de IA

Aunque DarkBERT es un nuevo modelo de IA, en realidad se basa en la arquitectura RoBERTa, que es un enfoque de IA desarrollado en 2019 por investigadores de Facebook según nuestro sitio hermano. Hardware de Tom.

en un trabajo de investigación Al detallar el funcionamiento interno de RoBERTa, Meta AI explica que es un “método sólidamente optimizado para preentrenar sistemas de procesamiento de lenguaje natural (NLP)” que mejora BERT (Representaciones de codificador bidireccional de transformadores), que fue lanzado por Google en 2018. Como el gigante de las búsquedas hizo que BERT fuera de código abierto, los investigadores de Facebook pudieron mejorar su desempeño en un estudio de replicación.

🔥 Recomendado:  Los investigadores de Deepmind AI presentan 'DeepNash', un agente autónomo entrenado con aprendizaje de refuerzo multiagente sin modelo que aprende a jugar el juego de Stratego en Expert...

Gracias al método optimizado de Facebook, lanzó RoBERTa, que pudo producir resultados de última generación en el punto de referencia de PNL de Evaluación general de comprensión del lenguaje (GLUE).

Ahora, sin embargo, los investigadores de Corea del Sur detrás de DarkBERT han demostrado que RoBERTa puede hacer aún más, ya que no estaba bien entrenado cuando se lanzó inicialmente. Al alimentar los datos de RoBERTa de la web oscura en el transcurso de casi 16 días en dos conjuntos de datos (uno sin procesar y el otro preprocesado), los investigadores pudieron crear DarkBERT.

Afortunadamente, los investigadores no tienen planes de lanzar DarkBERT al público. Sin embargo, están aceptando solicitudes con fines académicos de acuerdo con dexerto. Aún así, es probable que DarkBERT proporcione a las fuerzas del orden y a los investigadores una comprensión mucho mejor de la web oscura en su conjunto.

Cómo mantenerse seguro al usar chatbots de IA

Al igual que con cualquier otro software o servicio en línea, debe tener cuidado al usar chatbots de IA, ya que podría contraer una infección de malware de aplicaciones falsas de ChatGPT o incluso exponer datos confidenciales como empleados en Samsung recientemente lo hizo.

Esta es la razón por la que desea asegurarse de que realmente va al sitio web correcto cuando utiliza estos populares chatbots de IA. Si está buscando una aplicación ChatGPT, Bing Chat o Google Bard, aún no encontrará una, ya que OpenAI, Microsoft y Google aún no han lanzado aplicaciones oficiales para sus chatbots de IA.

Del mismo modo, no desea hacer clic en ningún enlace en correos electrónicos sospechosos que afirmen llevarlo a un chatbot de IA o que lo ayuden a obtener acceso de inmediato. Los estafadores son muy conscientes de la locura actual de los chatbots de IA y se están aprovechando de ella en sus ataques en este momento. Al mismo tiempo, también se deben evitar los anuncios sobre chatbots de IA, ya que los ciberdelincuentes a menudo abusan de Google Ads y otros servicios publicitarios para llevar a los usuarios desprevenidos a sitios de phishing.

🔥 Recomendado:  La guía definitiva sobre cómo hacer SEO en su sitio web de viajes

Para una protección adicional al experimentar con chatbots de IA, debe usar el mejor software antivirus con tu PC, el mejor antivirus para Mac con tu Mac y uno de los mejores aplicaciones antivirus para Android en su teléfono inteligente. De esta manera, si un enlace a un chatbot de IA conduce a malware, su antivirus lo detectará primero antes de que sus dispositivos se infecten.

DarkBERT podría representar el futuro de los modelos de IA que se entrenan en un área específica para hacerlos mucho más especializados. Dada su popularidad hasta el momento, no nos sorprendería ver modelos de IA similares desarrollados de esta manera en el futuro.

Las mejores ofertas de servicios antivirus de hoy