Estás leyendo la publicación: Búsqueda de vectores: optimización para la mente humana con aprendizaje automático
Hemos estado hablando con profesionales e innovadores de la industria de búsquedas sobre los desafíos persistentes, las oportunidades de tendencias y las tecnologías que las personas y las empresas usan para mantenerse relevantes en los resultados de búsqueda competitivos.
Una tendencia que impulsa avances masivos en la tecnología de búsqueda es el cambio de palabras clave a datos que representan mejor el significado de la consulta y lo que se sabe al respecto.
La búsqueda de palabras clave ha estado impulsando el descubrimiento de contenido desde 1230 d.C. Fue entonces cuando el cardenal y comentarista bíblico francés, el cardenal Hugh de St Cher, completó el primer índice conocido en la historia.
La búsqueda vectorial marca un cambio importante de este método tradicional de recuperación de información a un futuro en el que todos los datos complejos que conforman los activos de contenido modernos pueden ponerse a trabajar.
Entonces, ¿qué necesitas saber al respecto en este momento?
Nos acercamos a Libertad de Edoexjefe del laboratorio de inteligencia artificial de Amazon y ahora director ejecutivo de Pinecone, para obtener una introducción a la búsqueda de vectores y por qué es posible que desee tener las tecnologías asociadas en su radar.
Le preguntamos a Libertad:
- ¿Cómo redefinirá la búsqueda vectorial la búsqueda tradicional de palabras clave?
- ¿Cómo le explicaría la búsqueda de vectores a un niño de 5 años?
- ¿Cuáles son algunos de los desafíos a los que se enfrentó al utilizar algoritmos de aprendizaje automático para los clientes de Amazon Web Services (AWS) y cómo los superó?
- ¿Qué es Pinecone y qué hace?
- ¿Qué sugerencias o consejos tiene para los principiantes de SEO que recién ingresan al mundo de ML e AI?
Comencemos con esto: ¿por qué el procesamiento del lenguaje natural (NLP) es tan importante para el futuro del SEO y cómo pueden prepararse los especialistas en marketing para lo que sigue?
Hemos quemado los barcos de la búsqueda de palabras clave
Libertad Edo: “Así como los SEO dominaron el algoritmo PageRank, ahora necesitan saber sobre PNL para tener éxito y vencer a la competencia.
Sin embargo, a diferencia de PageRank, el campo de la PNL está creciendo rápidamente y cuenta con miles de colaboradores.
Requerirá más esfuerzo que seguir a Matt Cutts (de Google) en Twitter y rastrear los cambios SERP.
Afortunadamente, aunque la PNL es un tema más complicado, no está envuelto en misterio como lo está PageRank.
Gran parte del trabajo sobre PNL se está haciendo de forma abierta, con abundantes y gratuitos trabajos de investigación, software de código abierto y sin costo alguno. cursos online de PNL.
Una cosa está clara sobre la PNL: llegó para quedarse.
Está lejos de ser perfecto, pero está mejorando rápidamente, y las grandes empresas de tecnología han quemado las naves de búsqueda de palabras clave y no hay vuelta atrás”.
La búsqueda de vectores nos permite buscar de la forma en que hablamos
¿Cómo redefinirá la búsqueda vectorial la búsqueda tradicional de palabras clave?
Libertad Edo: “Búsqueda de vectores no redefine la búsqueda de palabras clave; lo reemplaza toda la tela.
En lugar de trabajar con palabras clave, y sus sinónimos y errores ortográficos, la búsqueda vectorial funciona con incrustaciones de vectores.
Eso es un dato que representa el significado de la frase de búsqueda junto con otra información conocida sobre la consulta o el usuario.
(Para un ser humano, la incrustación de vectores es irreconocible y solo parece una larga serie de números).
Esta representación de la frase de búsqueda y el usuario se usa luego para clasificar colecciones masivas de incrustaciones que representan otro contenido y preferencias del usuario para encontrar el resultado más relevante.
Desde la perspectiva del usuario, esto significa que puede buscar la forma en que habla.
Ya no necesitan aprender las peculiaridades y sintaxis de los motores de búsqueda.
Desde la perspectiva del SEO, esto significa que realmente pueden enfocarse en temas y temas sin preocuparse por palabras clave precisas”.
→
¿Cómo le explicaría la búsqueda de vectores a un niño de 5 años?
Libertad Edo: “Nuestro artículo explicando Conceptos básicos de búsqueda de vectores se acerca.
La versión ELI5, tal como la he practicado con mi propia familia, es esta: si digo ‘comida italiana’, podrías pensar en pizza o pasta.
Has aprendido que esas cosas están relacionadas porque recuerdas haber comido pizza en un restaurante italiano o haber aprendido que la pasta es popular en Italia.
Pero una computadora nunca aprendió eso. Entonces, la frase ‘comida italiana’ significa exactamente eso y no contiene información para decir que está relacionada con la pasta o la pizza.
Entonces, cuando le pido a una computadora que busque un ‘restaurante italiano’, podría dejar de lado las pizzerías.
El aprendizaje automático es una forma de ayudar a las computadoras a comprender el significado de lo que decimos o escribimos.
Y la búsqueda vectorial es una forma en que esas computadoras buscan en todo lo que saben, basándose en el significado y no en palabras exactas.
Así que ahora, si le pido a la computadora que me recomiende un lugar italiano, podría sugerirme tu pizzería favorita tal como lo harías tú.
Las organizaciones finalmente pueden enfocarse en crear y organizar contenido para humanos.
Hay muchos miles de científicos e ingenieros que trabajan incansablemente para hacer que ML y NLP se parezcan a la mente humana.
¿De verdad quieres ir en contra de eso? La estrategia ganadora para SEO es optimizar para la mente humana”.
→
Superar los desafíos en el aprendizaje automático
¿Cuáles son algunos de los desafíos a los que se enfrentó al utilizar algoritmos de aprendizaje automático para los clientes de Amazon Web Services (AWS) y cómo los superó?
Libertad Edo: “No puedo hablar sobre proyectos o desafíos específicos de AWS. Puedo decir más ampliamente, desde mi experiencia, vi que los algoritmos ML ya no son los cuellos de botella.
Sin duda, están lejos de ser perfectos y hay mucho trabajo por hacer, pero ese trabajo se está realizando a una velocidad vertiginosa.
El siguiente desafío consiste en ejecutar esos algoritmos a la escala necesaria para respaldar los productos de consumo y las aplicaciones empresariales.
Esas representaciones que mencioné anteriormente, incrustaciones de vectores, son computacionalmente costosas de buscar.
Un índice de solo 1 millón de elementos (incrustaciones de vectores) ya requiere un software especializado junto con un ajuste cuidadoso; un índice de 100 millones de artículos requiere software e infraestructura especializados; un índice de 1B o más artículos requiere que sea Google o Amazon.
(Aparte, esta es la razón por la que inicié Pinecone: para facilitar que los equipos de ingeniería agreguen la búsqueda vectorial a sus aplicaciones).
¿Qué es la piña?
¿Qué es Pinecone y qué hace?
Libertad Edo: Hoy en día, Pinecone facilita a los ingenieros la creación de búsquedas vectoriales rápidas, frescas y filtradas en sus aplicaciones.
Brinda a los equipos de ingeniería la infraestructura de búsqueda necesaria para ejecutar la búsqueda de vectores a escala, todo empaquetado en un servicio administrado con una API sencilla.
(Hemos descartado los números de versión porque los lanzamientos llegan rápido y porque, como servicio administrado, los usuarios siempre obtienen la última versión y no necesitan preocuparse por las actualizaciones).
Trabajar con algoritmos es extremadamente divertido y los desafíos valen absolutamente la pena.
Con la búsqueda vectorial, estamos en la intersección de algoritmos de vanguardia, arquitecturas de bases de datos y aplicaciones sin servidor.
Y podemos ver a nuestros clientes aplicar esta tecnología a productos que están revolucionando las aplicaciones empresariales y de consumo, como la búsqueda semántica, los sistemas de recomendación, la seguridad de TI, los dispositivos portátiles, la visión por computadora y más.
→
Primeros pasos en ML e IA
¿Qué sugerencias o consejos tiene para los principiantes de SEO que recién ingresan a los mundos de ML e AI?
Libertad Edo: “No se sienta intimidado. Incluso los investigadores más brillantes en este campo están ‘descifrando cosas’.
Aprender sobre AI/ML más allá de los artículos de nivel superficial lo convertirá en un mejor profesional de SEO, y hay muchos recursos gratuitos que lo ayudarán a hacerlo.
Para aquellos interesados en carreras en este campo, actualmente estamos contratación en todos los equipos: ingeniería, investigación, éxito del cliente, ventas, marketing y operaciones.
Más recursos: