Las 5 principales aplicaciones del mundo real para el procesamiento del lenguaje natural: hacia la IA

Estás leyendo la publicación: Las 5 principales aplicaciones del mundo real para el procesamiento del lenguaje natural: hacia la IA

Publicado originalmente en Hacia la IA, la empresa líder mundial en noticias y medios de IA y tecnología. Si está creando un producto o servicio relacionado con la IA, lo invitamos a considerar convertirse en patrocinador de la IA. En Hacia la IA, ayudamos a escalar las empresas emergentes de IA y tecnología. Permítanos ayudarlo a dar rienda suelta a su tecnología a las masas.

Las tecnologías emergentes han facilitado enormemente nuestra vida diaria. Por ejemplo, cuando te estás preparando la cena pero quieres llamar a tu mamá para obtener la receta secreta, no tienes que dejar de hacer lo que estás haciendo y marcar el número para hacer la llamada telefónica. En cambio, todo lo que necesita hacer es simplemente hablar: “Oye, Siri, llama a mamá”. Y tu iPhone automáticamente hace la llamada por ti.

La aplicación es bastante simple, pero la tecnología detrás de ella podría ser sofisticada. La magia que hace posible el escenario antes mencionado es el procesamiento del lenguaje natural (NLP). La PNL es mucho más que un pilar para construir Siri. También puede potenciar muchas otras aplicaciones infundidas con IA en el mundo real.

Este artículo primero explica qué es la PNL y luego pasa a presentar cinco aplicaciones de la PNL en el mundo real.

¿Qué es la PNL?

Desde chatbots hasta Siri, desde agentes de soporte virtual hasta gráficos de conocimiento, la aplicación y el uso de NLP son omnipresentes en nuestra vida diaria. PNL significa “procesamiento del lenguaje natural”. En pocas palabras, la PNL es la capacidad de una máquina para comprender el lenguaje humano. Es el puente que permite a los humanos interactuar y comunicarse directamente con las máquinas. La PNL es un subcampo de la inteligencia artificial (IA) y, en palabras de Bill Gates, “la PNL es la perla de la corona de la IA”.

Con el tamaño del mercado en constante expansión de la PNL, innumerables empresas están invirtiendo fuertemente en esta industria y sus líneas de productos varían. Se pueden construir muchos sistemas diferentes pero específicos para diversas tareas y necesidades aprovechando el poder de la PNL.

Las cinco aplicaciones de PNL del mundo real

Las aplicaciones del mundo real más populares, emocionantes y florecientes de NLP incluyen: interfaz de usuario conversacional, evaluación de la calidad de las llamadas con tecnología de IA, llamadas salientes inteligentes, operadores de llamadas con tecnología de IA y gráficos de conocimiento, por nombrar algunas.

Chatbots en comercio electrónico

Hace más de cinco años, Amazon ya se dio cuenta del beneficio potencial de aplicar NLP a sus canales de atención al cliente. En aquel entonces, cuando los clientes tenían problemas con sus pedidos de productos, la única forma en que podían recurrir era llamando a los agentes de servicio al cliente. Sin embargo, lo que pudieron obtener del otro lado del teléfono fue ““ la mayor parte del tiempo. Afortunadamente, Amazon se dio cuenta de inmediato del efecto dañino que esto podría tener en su imagen de marca y trató de crear chatbots.

Hoy en día, cuando desea obtener rápidamente, por ejemplo, un reembolso en línea, ¡hay una manera mucho más conveniente! Todo lo que necesita hacer es activar el chatbot del servicio de atención al cliente de Amazon, escribir la información de su pedido y realizar una solicitud de reembolso. El chatbot interactúa y responde de la misma manera que lo hace un ser humano real. Además de los chatbots que se ocupan de la experiencia del cliente posventa, los chatbots también ofrecen consultoría previa a la venta. Si tiene alguna pregunta sobre el producto que va a comprar, simplemente puede chatear con un bot y obtener las respuestas.

Con la aparición de nuevos conceptos como el metaverso, la PNL puede hacer más que potenciar los chatbots de IA. Los avatares para atención al cliente en el metaverso se basan en la tecnología NLP. Ofrecer a los clientes experiencias de chat más realistas.

🔥 Recomendado:  Conozca FlexGen: un motor de generación de alto rendimiento para ejecutar modelos de lenguaje grande (LLM) con memoria de GPU limitada

Interfaz de usuario conversacional

Otra aplicación más moderna y prometedora son los sistemas interactivos. Muchas empresas reconocidas están apostando fuerte por CUI (interfaz de usuario conversacional). CUI es el término general para describir aquellas interfaces de usuario para computadoras que pueden simular conversaciones con seres humanos reales.

Las CUI más comunes en nuestra vida cotidiana son Siri de Apple, Cortana de Microsoft, Asistente de Google de Google, Alexa de Amazon, etc.

Además, los CUI también se pueden integrar en los automóviles, especialmente en los EV (vehículos eléctricos). NIO, un fabricante de automóviles dedicado al diseño y desarrollo de vehículos eléctricos, lanzó su propio conjunto de CUI llamado NOMI en 2018. Visualmente, las CUI en los automóviles pueden funcionar de la misma manera que Siri. Los conductores pueden concentrarse en conducir el automóvil mientras le piden a la CUI que ajuste la temperatura del aire acondicionado, reproduzca una canción, bloquee las ventanas/puertas, lleve a los conductores a la estación de servicio más cercana, etc.

El algoritmo detrás

A pesar de todos los sofisticados algoritmos de los que se han jactado los medios técnicos, una de las formas más fundamentales de construir un chatbot es construir y organizar pares de preguntas frecuentes (o más directamente, pares de preguntas y respuestas) y usar algoritmos NLP para averiguar si el usuario consulta coincide con cualquiera de su base de conocimientos de preguntas frecuentes. Un ejemplo simple de preguntas frecuentes sería así:

Ahora que este par de preguntas frecuentes ya está almacenado en su sistema NLP, el usuario ahora puede simplemente hacer una pregunta similar, por ejemplo: “¡café, por favor!”. Si su algoritmo es lo suficientemente inteligente, se dará cuenta de que “café, por favor” se parece mucho a “¿Puedo tomar un poco de café?” y generará la respuesta correspondiente “No, prefiero tener algunas costillas”. Y así se hacen las cosas.

Durante mucho tiempo, los algoritmos de búsqueda de preguntas frecuentes se basan únicamente en la indexación invertida. En este caso, primero se tokeniza la oración original y se colocan tokens y documentos en sistemas como ElasticSearch, que utiliza un índice invertido para la indexación y algoritmos como TF-IDF o BM25 para la puntuación.

Este algoritmo funciona igual de bien hasta que llega la era del aprendizaje profundo. Uno de los problemas más importantes con el algoritmo anterior es que ni la tokenización ni la indexación invertida tienen en cuenta la semántica de las oraciones. Por ejemplo, en el ejemplo anterior, los usuarios podrían decir “¿Puedo tomar una taza de capuchino?”. Ahora, con la tokenización y la indexación invertida, existe una gran posibilidad de que el sistema no reconozca “café” y “una taza de capuchino” como lo mismo y, por lo tanto, no entienda la oración. Los ingenieros de IA tienen que hacer muchas soluciones para este tipo de problemas.

Pero las cosas mejoraron mucho con el aprendizaje profundo. Con modelos preentrenados como BERT y canalizaciones como Remolcadorpodemos codificar fácilmente todas las oraciones en vectores y almacenarlas en una base de datos de vectores, por ejemplo, Milvusy simplemente calcule la distancia del vector para descubrir las similitudes semánticas de las oraciones.

Control de calidad de llamadas impulsado por IA

Los call centers son indispensables para muchas grandes empresas que se preocupan por la experiencia del cliente. Para detectar mejor los problemas y mejorar la calidad de las llamadas, es necesaria una evaluación. Sin embargo, el problema es que los centros de llamadas de las grandes empresas multinacionales reciben una gran cantidad de llamadas entrantes por día. Por lo tanto, es poco práctico escuchar cada una de las millones de llamadas y hacer la evaluación. La mayoría de las veces, cuando escucha “para mejorar nuestro servicio, esta llamada podría grabarse”. desde el otro extremo del teléfono, no significa necesariamente que se verificará la calidad del servicio de su llamada. De hecho, incluso en las grandes organizaciones, el personal de control de calidad solo reproduciría y verificaría manualmente entre el 2 % y el 3 % de las llamadas.

Aquí es donde la PNL puede ayudar. Un motor de control de calidad de llamadas impulsado por IA y NLP puede detectar automáticamente los problemas en las llamadas y puede manejar volúmenes masivos de llamadas en un período de tiempo relativamente corto. El motor ayuda a detectar si el operador de la llamada usa las oraciones iniciales y finales adecuadas, y evita la jerga prohibida y las palabras tabú en la llamada. Esto aumentaría fácilmente la tasa de revisión del 2% al 3% al 100%, con incluso menos mano de obra y otros costos.

🔥 Recomendado:  Ciclo de vida del problema de aprendizaje automático: escritura para principiantes: hacia la IA

Con un servicio típico de control de calidad de llamadas impulsado por IA, los usuarios primero deben cargar las grabaciones de llamadas en el servicio. Luego, se utiliza la tecnología de reconocimiento automático de voz (ASR) para transcribir los archivos de audio en textos. Todos los textos se vectorizan posteriormente utilizando modelos de aprendizaje profundo y posteriormente se almacenan en una base de datos vectorial. El servicio compara la similitud entre los vectores de texto y los vectores generados a partir de un determinado conjunto de criterios, como vectores de palabras tabú y vectores de oraciones iniciales y finales deseadas. Con una búsqueda eficiente de similitud de vectores, el manejo de grandes volúmenes de grabaciones de llamadas puede ser mucho más preciso y consumir menos tiempo.

Llamadas salientes inteligentes

Lo crea o no, ¡algunas de las llamadas telefónicas que recibe no son de humanos! Lo más probable es que sea un robot hablando desde el otro lado de la llamada. Para reducir los costos operativos, algunas empresas podrían aprovechar las llamadas telefónicas de IA para marketing propósitos y mucho más. Google lanzó Google Duplex en 2018, un sistema que puede realizar conversaciones entre humanos y computadoras y realizar tareas del mundo real por teléfono. El mecanismo detrás de las llamadas telefónicas de IA es más o menos el mismo que el de los chatbots.

En otros casos, es posible que también haya escuchado algo como esto en el teléfono:

o en los últimos años, algo como (con un fuerte acento de robot):

Esto se conoce como respuesta de voz interactiva (IVR). Es un sistema telefónico automatizado que interactúa con las personas que llaman y funciona en función de las respuestas y acciones de las personas que llaman. Por lo general, a las personas que llaman se les ofrecen algunas opciones a través de un menú. Y luego su elección decidirá cómo actúa el sistema de llamadas telefónicas. Si la solicitud del usuario es demasiado compleja, el sistema puede enrutar a las personas que llaman a un agente humano. Esto puede reducir en gran medida los costos laborales y ahorrar tiempo a las empresas.

Las intenciones suelen ser muy útiles cuando se trata de llamadas como estas. Una intención es un grupo de oraciones o dialectos que representan una determinada intención del usuario. Por ejemplo, “pronóstico del tiempo” puede ser una intención, y esta intención se puede desencadenar con diferentes oraciones. Vea la imagen de un ejemplo de Google Dialogflow a continuación. Las intenciones se pueden organizar juntas para lograr conversaciones complicadas interactivas entre humanos y computadoras. Como reservar un restaurante, pedir un billete de avión, etc.

Operadores de llamadas con tecnología de IA

Al adoptar la tecnología de NLP, las empresas pueden llevar los servicios de operación de llamadas al siguiente nivel. Convencionalmente, los operadores de llamadas necesitan consultar un manual profesional de cien páginas para atender cada llamada de los clientes y resolver cada uno de los problemas de los usuarios caso por caso. Este proceso consume mucho tiempo y la mayor parte del tiempo no puede satisfacer a los llamantes con soluciones deseables. Sin embargo, con un centro de llamadas impulsado por IA, atender las llamadas de los clientes puede ser cómodo y eficiente.

Cuando un cliente marca, el sistema busca inmediatamente al cliente y su información de pedido en la base de datos para que el operador de llamadas pueda tener una idea general del caso, como la edad del cliente, su estado civil, las cosas que ha comprado en el pasado, etc. Durante la conversación, todo el chat se grabará con un registro de chat en vivo que se muestra en la pantalla (gracias al Reconocimiento automático de voz en vivo). Además, cuando un cliente hace una pregunta difícil o comienza a quejarse, la máquina lo detectará automáticamente, buscará en la base de datos de IA y le dirá cuál es la mejor manera de responder. Con un modelo de aprendizaje profundo decente, su servicio siempre podría dar a su cliente más del 99 % de respuestas correctas a sus preguntas y siempre puede manejar las quejas de los clientes con las palabras más adecuadas.

🔥 Recomendado:  Cómo usar Amazon Brand Analytics de la MANERA CORRECTA

Gráfico de conocimiento

Un gráfico de conocimiento es un gráfico basado en información que consta de nodos, bordes y etiquetas. Donde un nodo (o un vértice) suele representar una entidad. Puede ser una persona, un lugar, un artículo o un evento. Los bordes son las líneas que conectan los nodos. También hay etiquetas que significan la conexión o relación entre un par de nodos. A continuación se muestra un ejemplo típico de gráfico de conocimiento:

Los datos sin procesar para construir un gráfico de conocimiento pueden provenir de varias fuentes: documentos no estructurados, datos semiestructurados y conocimiento estructurado. Se deben aplicar varios algoritmos a estos datos para extraer entidades (nodos) y la relación entre entidades (bordes). Para nombrar algunos, uno necesita hacer reconocimiento de entidades, extracción de relaciones, minería de etiquetas, vinculación de entidades. Para crear un gráfico de conocimiento con datos en documentos, por ejemplo, primero debemos usar canalizaciones de aprendizaje profundo para generar incrustaciones y almacenarlas en una base de datos vectorial.

Una vez que se construye el gráfico de conocimiento, puede verlo como el pilar subyacente para muchas aplicaciones más específicas, como motores de búsqueda inteligentes, sistemas de preguntas y respuestas, sistemas de recomendación, anuncios y más.

Nota final

Este artículo presenta las cinco principales aplicaciones de PNL del mundo real. Aprovechar la PNL en su negocio puede reducir en gran medida los costos operativos y mejorar la experiencia del usuario. Por supuesto, además de las cinco aplicaciones presentadas en este artículo, NLP puede facilitar más escenarios comerciales, incluidos análisis de redes sociales, traducción, análisis de sentimientos, resumen de reuniones y más.

También hay un montón de conceptos de NLP+, o más generalmente, AI+ que se están volviendo cada vez más populares en estos años. Por ejemplo, con AI + RPA (Automatización robótica de procesos). Puede crear fácilmente flujos de trabajo inteligentes que completen los flujos de trabajo automáticamente, como un flujo de trabajo de reembolso de gastos en el que solo necesita cargar su recibo, y AI + RPA hará el resto por usted. También hay AI + OCR, donde solo necesita tomar una foto de, digamos, un contrato, y AI le dirá si hay un error en su contrato, digamos, el número de teléfono de una empresa no coincide con el número que se muestra en Búsqueda de Google.

Como ya conoce las cinco principales aplicaciones de la PNL, también puede conocer las 7 modelos básicos de NLP que pueden potenciar su aplicación ML.


Las 5 principales aplicaciones del mundo real para el procesamiento del lenguaje natural se publicaron originalmente en Hacia la IA en Medium, donde las personas continúan la conversación destacando y respondiendo a esta historia.

Publicado a través de Hacia la IA