Estás leyendo la publicación: Las últimas investigaciones sobre aprendizaje automático en Amazon proponen DAEMON, un nuevo marco basado en redes neuronales gráficas para la recomendación de productos relacionados
Una aplicación principal de aprendizaje automático en la actualidad son los sistemas de recomendación para tiendas de comercio electrónico como Amazon. Los clientes pueden ahorrar tiempo y tener experiencias de compra más satisfactorias cuando las empresas pueden sugerir productos relacionados en función de su compra, por ejemplo, una funda de teléfono que coincida con el teléfono comprado recientemente por un cliente. Recientemente, algunos investigadores de Amazon crearon un método novedoso para sugerir productos relacionados utilizando gráficos dirigidos y redes neuronales de gráficos. El equipo comenzó a implementar este modelo en producción después de que se presentara el estudio en la Conferencia Europea sobre Aprendizaje Automático (ECML) de este año. Al comparar las predicciones del modelo con las compras conjuntas de clientes reales utilizando dos métricas de rendimiento, HitRate y el rango recíproco medio, el equipo demostró que su método superó las líneas de base de última generación entre un 30 % y un 160 %.
La dificultad fundamental con el empleo de redes neuronales gráficas (GNN) para la recomendación de productos relacionados es que existen relaciones asimétricas entre los elementos. En el mundo real, tiene más sentido sugerir una funda de teléfono a alguien que compra un teléfono nuevo que sugerir un teléfono a alguien que compra una funda. Se puede usar un borde dirigido en un gráfico para representar este tipo de relación. Sin embargo, es difícil que las representaciones vectoriales creadas por GNN reflejen completamente esta direccionalidad.
El equipo abordó este problema creando dos incorporaciones para cada nodo de red: una que describe su función como objetivo de una sugerencia de producto relacionado y otra que describe su función como productor de una recomendación de producto relacionado. Además, introducen una nueva función de pérdida que motiva a los modelos de recomendación de productos relacionados (RPR) a elegir elementos a lo largo de los bordes del gráfico de salida y los disuade de recomendar productos a lo largo de los bordes de entrada. El GNN aborda el problema del arranque en frío, o cómo contabilizar los productos que se acaban de agregar al catálogo, ya que acepta los metadatos del producto y la estructura del gráfico como entradas. Por último, pero no menos importante, los investigadores proporcionaron una técnica de aumento de datos que ayuda a superar el problema del sesgo de selección, que resulta de las diferencias en la forma en que se presentan los datos.
Al profundizar más en la construcción del gráfico, los investigadores aclararon que en su gráfico de productos, los nodos representan productos individuales y los datos de los nodos se componen de información sobre esos productos, como el nombre, el tipo y la descripción. Los bordes direccionales del gráfico se agregaron utilizando datos de compra conjunta o información sobre qué productos se compran juntos con frecuencia. Estos bordes pueden ser unidireccionales, como en el caso de dos productos que son accesorios entre sí, o bidireccionales, como en el caso de dos productos que se compran conjuntamente, pero ninguno depende del otro.
Sin embargo, esta estrategia plantea la posibilidad de modelar el sesgo de selección. Cuando los clientes eligen un producto sobre otro porque han estado más expuestos a él, surge el sesgo de selección. Esta red también tiene bordes bidireccionales que provienen de datos de vista conjunta o información sobre qué productos se ven con frecuencia juntos bajo una sola consulta de producto para reducir ese riesgo. Por lo tanto, el gráfico de productos tiene dos tipos diferentes de bordes: bordes que significan similitud y bordes que significan compras conjuntas. En esencia, los datos de vista conjunta ayudan en la identificación de productos que son comparables entre sí.
La creación de incrustaciones de origen y de destino separadas es el componente fundamental del modelo. El GNN crea una incrustación para cada nodo en el gráfico del producto que incluye detalles sobre el entorno inmediato de ese nodo. Ha utilizado incrustaciones de dos saltos, que tienen en cuenta los datos tanto de los vecinos cercanos de un nodo como de los vecinos de esos vecinos. La incorporación de origen tiene en cuenta las relaciones de similitud de un nodo, no solo sus vínculos de compras conjuntas salientes, mientras que la incorporación de destino solo considera las asociaciones de compras conjuntas entrantes. La GNN tiene varias capas y cada capa genera nuevas representaciones de nodos después de consumir las representaciones de nodos creadas por la capa inferior. Las incrustaciones de origen y destino son idénticas en la primera capa porque las representaciones son solo los metadatos del producto. Sin embargo, las incrustaciones de origen y destino comienzan a divergir en la segunda capa. La incorporación de destino de cada nodo considera tanto las incorporaciones de destino de nodos similares como las incorporaciones de origen de los nodos con los que tiene relaciones de compra conjunta entrantes.
Los investigadores entrenaron a la GNN de una manera autosupervisada utilizando aprendizaje contrastivo, que separa la incrustación de un nodo dado y un nodo no conectado elegido al azar mientras separa la incrustación de un nodo dado y aquellos que comparten bordes con él. Un término de la función de pérdida refuerza aún más la asimetría de las incrustaciones de origen y destino. Una vez que se ha entrenado la GNN, se encuentran los k nodos en el espacio de incrustación más cercano al nodo de origen para elegir los k bienes mejor relacionados para proponer. Los investigadores utilizaron la tasa de aciertos y el rango recíproco medio para las 5, 10 y 20 sugerencias principales en dos conjuntos de datos separados para 12 pruebas para comparar su enfoque con sus dos predecesores de mejor desempeño. El equipo concluyó que su enfoque superó constantemente los puntos de referencia, con frecuencia por un amplio margen.
Este artículo está escrito como un artículo de resumen de investigación por el personal de Marktechpost basado en el trabajo de investigación ‘Recomendar productos relacionados usando redes neuronales gráficas en gráficos dirigidos‘. Todo el crédito de esta investigación es para los investigadores de este proyecto. Revisar la papel y artículo de referencia.
Por favor no olvides unirte Nuestro subreddit de ML
Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools