Estás leyendo la publicación: Entrevista: La ciencia detrás de la búsqueda de Brandwatch con Aykut Firat
La función de búsqueda, la última de Brandwatch, viene repleta de funciones bastante impresionantes.
Al igual que una búsqueda en Google, los usuarios pueden comenzar a escribir la entidad que desean buscar (ya sea una marca, una persona, un evento, etc.) y Brandwatch sugerirá automáticamente búsquedas potenciales.
Estaba hipnotizado cuando lo probé por primera vez. Como alguien que ha pasado cientos de horas escribiendo consultas, pude ver instantáneamente la enorme cantidad de tiempo que esto nos ahorraría a mí y a nuestros clientes.
Quería saber más sobre la ciencia detrás de esta gran actualización, así que fui a hablar con el cerebro detrás de ella: el científico jefe de datos de Brandwatch, Aykut Firat. Aquí está nuestra discusión:
Comencemos contigo, Aykut, ¿cuál es tu experiencia?
Actualmente soy el científico jefe de datos en Brandwatch. Trabajo en problemas de procesamiento de imágenes y PNL utilizando técnicas de aprendizaje profundo. Anteriormente, trabajé en nuevas empresas centradas en la integración de información inteligente, la computación evolutiva y la IA, incluida una que cofundé con mi asesor durante mi doctorado en el MIT.
La búsqueda usa algo llamado desambiguación de entidades. ¿Qué es?
La desambiguación de entidades extrae entidades en el texto y las vincula a entidades en una base de conocimiento inequívoca. En nuestro caso esta base de conocimiento es Wikipedia.
Esencialmente, nos permite dar sentido a los miles de millones de conversaciones diferentes que ocurren en línea y agruparlas en entidades. Por cierto, una entidad puede ser cualquier cosa, desde una marca, una persona o un evento, hasta un tema amplio como el ciclismo o la ciberseguridad.
¿Qué problema resuelve la desambiguación de entidades?
La búsqueda de conceptos ambiguos en Brandwatch es difícil. Cuando busca la empresa Apple, también puede obtener resultados no deseados, como los relacionados con la tarta de manzana. Con la desambiguación de entidades, solo recopilamos las entidades que desea al reducir o eliminar los resultados no deseados.
¿Y cómo funciona realmente la desambiguación de entidades?
Desde la perspectiva del usuario, es tan simple como elegir la entidad de interés de una lista y obtendrá los resultados.
Técnicamente, por nuestra parte tiene cuatro componentes principales:
- Extrae las palabras y frases que pueden apuntar a entidades en unidades de texto
- Usando el contexto del texto, asocie estas palabras y frases con características
- Asociar entidades de una base de conocimiento con características contextuales
- Y relacionarlos con una búsqueda
¿Podría dar un ejemplo de ello en acción?
Considera esta mención:
Identificamos Blackberry y Apple como palabras de interés que apuntan a entidades en Wikipedia. Para un ser humano, la “seguridad” y la “experiencia del usuario” dan pistas sobre el contexto de esta declaración.
Del mismo modo, nuestro motor de eliminación de ambigüedades basado en inteligencia artificial pendiente de patente extrae automáticamente el significado más allá de lo que aparece en el texto dado. Entonces, nuestra IA reconocerá que la palabra “slam dunk” está asociada con “Michael Jordan”, incluso si los dos términos no se mencionan en la misma publicación.
Si está buscando Apple, la empresa o el teléfono de Apple, la entidad almacenada y las funciones de texto de entrada probablemente coincidirán y, como resultado, se devolverá el texto anterior.
Entonces, ¿podría argumentar que es una mejora en la escritura normal de consultas?
En la escritura de consultas normal, a menudo intenta agregar contexto con términos adicionales como (Teléfono O iPhone O Mac O …). Este proceso es muy tenue, incompleto y, a veces, imposible.
Por ejemplo, una preposición común como “a” o un posesivo “mi” puede diferenciar entre las entidades de lugar y automóvil como en “Me gusta conducir a Malibú” frente a “Me gusta conducir mi Malibú”. A la mayoría de nosotros nos cuesta incluir términos como este al escribir una Consulta, pero con la Búsqueda, la IA inteligente lo hace por usted.
En muchos casos, esto supondrá una gran mejora con respecto a la escritura normal de consultas, ya que probablemente coincidirá con más elementos y con mayor precisión en comparación con una consulta creada por humanos.
¿Qué deben tener en cuenta los usuarios al usar la Búsqueda?
Hay algunas cosas que los usuarios deben tener en cuenta. La búsqueda es una innovación completamente nueva de Brandwatch y aún se está trabajando en ella. Esto significa que debe esperar una serie de actualizaciones en un futuro cercano, pero tampoco espere que sea perfecto de inmediato. La búsqueda funciona mejor para algunas entidades que para otras.
Si hay dos marcas similares a las que se hace referencia con la misma palabra, por ejemplo, el sistema puede cometer más errores. Cuando los contextos de los significados en competencia son más distantes, los resultados serán más precisos. También es importante tener en cuenta que, a partir de hoy, la eliminación de ambigüedades de la entidad de búsqueda se basa en el idioma inglés.
Y finalmente, ¿qué sigue para la Búsqueda?
Estamos trabajando arduamente para proporcionar actualizaciones. Las grandes cosas que estamos viendo en este momento incluyen llevar la desambiguación de entidades a más idiomas además del inglés.
Gracias a Aykut por tomarse el tiempo de hablar con el equipo del blog.
Si desea probar Search out for yourself, haga clic aquí para solicitar una demostración. Si ya es cliente, el acceso a la Búsqueda está disponible ahora sin costo adicional.