Los investigadores de AWS desarrollaron una biblioteca de incrustación de gráficos de conocimiento denominada biblioteca de incrustación de conocimientos de gráficos profundos (DGL-KE) basada en la biblioteca de gráficos profundos (DGL)

Estás leyendo la publicación: Los investigadores de AWS desarrollaron una biblioteca de incrustación de gráficos de conocimiento denominada biblioteca de incrustación de conocimientos de gráficos profundos (DGL-KE) basada en la biblioteca de gráficos profundos (DGL)

Las estructuras de datos llamadas gráficos de conocimiento (KG) se utilizan para contener datos sobre varias entidades (representadas como nodos) y sus relaciones (como bordes). La integración de gráficos de conocimiento informático es un enfoque que se usa con frecuencia al realizar varias tareas de aprendizaje automático. AWS ha desarrollado recientemente The Deep Graph Knowledge Embedding Library (DGL-KE), una biblioteca de integración de gráficos de conocimiento basada en Deep Graph Library (DGL). Este kit de herramientas de alto rendimiento, fácil de usar y escalable para aprender incrustaciones de gráficos de conocimientos extensos tiene una variedad de modelos estándar que los desarrolladores pueden usar. El kit de herramientas DGL-KE se puede ejecutar en CPU, GPU y máquinas de clúster con modelos populares como TransE, TransR, etc. Trumid ha hecho un uso sustancial de esta biblioteca para crear plataformas de aprendizaje automático de vanguardia para el comercio de crédito. La empresa ha creado una plataforma de comercio en línea donde los usuarios pueden comprar, vender y comunicarse con otros usuarios. Trumid requiere un sistema ML para brindar una experiencia comercial personalizada al modelar las preferencias e intereses de los usuarios de su plataforma debido a un aumento en la red de usuarios.

Para proporcionar a los usuarios una experiencia comercial más rápida y personalizada, esto garantiza que se les proporcione la información y los conocimientos más pertinentes. Para ayudar al equipo de estrategia de datos e inteligencia artificial de Trumid, se contrató a AWS Machine Learning Solutions Lab para desarrollar una canalización integral que consiste en la preparación de datos, el entrenamiento de modelos y el proceso de inferencia basado en un modelo de red neuronal creado con DGL-KE. Un gráfico ofrece una forma natural de representar esta complejidad del mundo real con la información integrada en la relación entre entidades, ya que el comercio de bonos puede considerarse como una red de interacciones entre compradores y vendedores que abarca numerosos tipos de bonos.

🔥 Recomendado:  Uso del debate multiagente para mejorar el razonamiento y la precisión fáctica de los modelos de lenguaje extenso (LLM)

Debido a las características del conjunto de datos, los algoritmos de aprendizaje automático de gráficos se ajustan mejor al entrenamiento de enlaces que los algoritmos de aprendizaje automático convencionales. Un método de ML de gráficos aprende de un conjunto de datos de gráficos que incluye información sobre nodos individuales, bordes y otros atributos, a diferencia de un algoritmo de ML típico, que utiliza datos estructurados tabulares. El tamaño de la negociación, el período, el emisor, la tasa, los valores de los cupones, las ofertas de compra y venta, el tipo de protocolo de negociación y las señales de interés son características del conjunto de datos utilizado por Trumid y AWS. Estos datos se utilizan para crear gráficos interactivos entre comerciantes, bonos y emisores, y se crea un modelo de aprendizaje automático de gráficos para pronosticar las interacciones en el futuro. La preparación de los datos es la primera etapa en la tubería de recomendación. Los datos comerciales se representan como un gráfico con nodos y bordes escritos, donde los nodos son comerciantes o bonos y los bordes son relaciones.

DGL-KE es una buena opción para los gráficos de conocimiento porque solo contienen nodos y relaciones. Los datos mantenidos en un gráfico de conocimiento se expresan con frecuencia en tripletes: cabeza, relación y cola ([h, r, t]), donde las caras y las cruces son entidades, y la unión también se conoce como una declaración. Conocimiento Las representaciones de baja dimensión de los elementos y las relaciones en un gráfico de conocimiento se denominan incrustaciones de gráficos. El área clave donde divergen los modelos populares de KGE es en la función de puntuación. Esta función calcula la separación entre cosas relacionadas que están asociadas. Mientras que otros elementos no conectados se distribuyen por el espacio vectorial, las entidades conectadas por una relación están cerca unas de otras.

🔥 Recomendado:  El modelo de difusión eDiffi de NVIDIA permite "pintar con palabras" y más

DGL-KE ahora admite tres actividades: capacitación, evaluación de integración e inferencia. El modelo de incrustación TransE fue entrenado para esta aplicación específica. Para la predicción, se ha utilizado la igualdad que agrega la incorporación del nodo de origen y la incorporación de la relación para proporcionar la incorporación del nodo de destino como resultado. Los bonos más cercanos a la incrustación resultante son el nodo de destino, la incrustación de relación es la incrustación comercial reciente y la incrustación del nodo de origen es la incrustación del comerciante. Los 100 puntajes más altos para cada comerciante se calculan utilizando este método, que se prueba para calcular puntajes para todas las posibles relaciones comerciales recientes. La solución está disponible en producción como un script único para el procesamiento de SageMaker. Esto es factible porque los tres procesos de preparación de datos, entrenamiento de modelos y predicción son interdependientes. DGL-KE está hecho para el aprendizaje a gran escala. Con millones de nodos y miles de millones de aristas, presenta varias mejoras únicas que aceleran el entrenamiento en gráficos de conocimiento. En comparación con los otros métodos, esta implementación aumenta el recuerdo medio (el porcentaje de transacciones reales pronosticado por el recomendador, promediado entre todos los operadores) en un 80 % en todos los tipos de operaciones.

enlace GitHub | Artículo de referencia

Por favor no olvides unirte Nuestro subreddit de ML

Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools