Estás leyendo la publicación: La mayoría de los BPOS de anotación de datos están perdiendo el punto en medio de la ola GPT LLMS: hacia la IA
Publicado originalmente en Hacia la IA.
¡La anotación de humanos en el circuito se reducirá a un esfuerzo de revisión mínimo guiado por IA!
Hay mucha expectación en torno a lo que la IA puede hacer. En medio de la exageración, está ocurriendo un resultado incremental real que está aumentando la productividad.
Personalmente, debido a ChatGPT y otra LLMpuedo hacer las siguientes cosas
- Escriba código rápidamente con el copiloto de GitHub
- Tome sugerencias de contenido e incluso reformule mi contenido mejor y más rápido, lo que me permite gastar mi energía en pensar en lugar de escribir o tácticas de contenido y estructurar o incluso tratar de corregir la gramática.
- Prepare mejores respuestas a los correos electrónicos y chats de acuerdo con la persona prevista, como la ubicación geográfica, el idioma, el comportamiento anterior e incluso, a veces, las situaciones.
Permítanme compartir algunos ejemplos.
Edtech Chegg se desploma en la advertencia de ingresos ya que ChatGPT amenaza el crecimiento
2 de mayo (Reuters) – ¿Cuál es el costo de los estudiantes que usan ChatGPT para la tarea? Para el proveedor de servicios educativos de EE. UU. Chegg…
www.reuters.com
El auge de la IA es un sueño y una pesadilla para los trabajadores del Sur Global | Contexto
Las regulaciones laborales laxas y los salarios bajos son la norma para los trabajadores de anotación de datos en las naciones más pobres, pero muchos no tienen…
www.contexto.noticias
ChatGPT viene por los trabajos terribles, al menos
Los modelos de aprendizaje automático pueden hacer que el procesamiento de contenido y el saneamiento de datos funcionen mejor y de forma más económica que las personas…
www.theregister.com
La automatización genera economías de escala y funciona de manera opuesta a la economía de la subcontratación a los países en desarrollo, mientras que la velocidad hace que la automatización sea aún más lucrativa y la subcontratación no puede proporcionar el mismo nivel de calidad.
Sin embargo, si tanto los humanos en el circuito como la automatización están casados de tal manera que cada uno se empaqueta de tal manera que aproveche las fortalezas de cada uno, entonces puede convertirse en la ventaja competitiva clave.
¿Qué humanos en el bucle en la anotación de datos pueden hacer mejor ahora?
- Ofrezca la experiencia que la automatización aún debe aprender o donde no tiene sentido económico capacitar a la IA al mismo tiempo que considera el impacto ambiental.
- Los trabajadores humanos pueden aportar un nivel de matiz y contexto a las tareas de etiquetado de datos que pueden ser difíciles de replicar para la IA, especialmente en situaciones en las que los datos son complejos o ambiguos.
- Los trabajadores humanos pueden adaptarse más fácilmente a circunstancias cambiantes o situaciones inesperadas, mientras que la IA puede tener dificultades cuando se enfrenta a datos nuevos o inesperados.
¿Qué automatización en la anotación de datos puede hacer mejor ahora?
- Anote grandes tipos de anotaciones, especialmente clasificación y moderación de contenido como primera opinión.
- Un porcentaje significativo del trabajo manual de anotación de datos para NLP y visión por computadora y otros tipos de IA no competirá con los costos que ofrece la automatización por el mismo nivel de calidad decente suficiente para reducir la dependencia del ser humano en el circuito.
- La automatización puede ayudar a estandarizar el proceso de anotación, asegurando que todos los datos se etiqueten de manera consistente y reduciendo el potencial de error humano o sesgo. Esto puede ser particularmente importante en industrias como la atención médica o las finanzas, donde la precisión y la consistencia son fundamentales.
- La automatización se puede utilizar para identificar y señalar posibles problemas o anomalías en los datos, lo que permite a los trabajadores humanos centrar sus esfuerzos en resolver estos problemas en lugar de dedicar tiempo a tareas rutinarias. Esto puede ayudar a mejorar la calidad general de los datos y reducir el riesgo de errores o inconsistencias.
¿Qué empresas de herramientas deberían hacer más?
Las empresas enfocadas en la automatización y su aplicación deben continuar invirtiendo más en esto y aumentar la velocidad de la evolución de la nueva tecnología todos los días y enfocarse en innovar la experiencia del usuario y permitir un mejor consumo de la tecnología y la I + D, posiblemente de las siguientes maneras:-
- Labelbox, Labellerr, CVAT, Scale AI, Appen y otros son líderes en el espacio de anotación de datos y continúan innovando en áreas como control de calidad, entrenamiento de modelos y seguridad de datos.
- aprovechar tecnologías emergentes como blockchain y el aprendizaje federado para mejorar la privacidad y seguridad de los datos, y explorar nuevas aplicaciones de automatización en campos como vehículos autónomos, robótica y ciudades inteligentes.
- Asociarse con otras empresas del ecosistema, como proveedores de la nube (AWS, GCP, Azure y locales) y plataformas de herramientas, para crear soluciones integrales que puedan optimizar el proceso de anotación de datos y hacerlo más accesible para un gama más amplia de industrias y casos de uso.
¿Qué BPO de anotación de datos deberían hacer más?
- Invertir en talento puede ayudar a las empresas a mantenerse a la vanguardia en lo que respecta a las tecnologías emergentes y las mejores prácticas en la anotación de datos. Por contratación de trabajadores calificados que están al día con los últimos desarrollos en el campo, las empresas pueden asegurarse de que sus procesos de anotación estén optimizados para lograr eficiencia y precisión.
- El talento también puede desempeñar un papel crucial a la hora de identificar y abordar posibles sesgos o errores en el proceso de anotación. Al contar con un equipo diverso de expertos con diferentes perspectivas y experiencias, las empresas pueden asegurarse de que sus datos se etiqueten de manera justa y coherente y que cualquier problema se identifique y resuelva rápidamente.
- Además de invertir en talento, las empresas también deben centrarse en crear un cultura de aprendizaje continuo y mejora Al alentar a los empleados a mantenerse actualizados sobre los últimos desarrollos en el campo y brindar oportunidades de capacitación y desarrollo profesional, las empresas pueden garantizar que sus procesos de anotación evolucionen y mejoren constantemente con el tiempo.
¡Finalmente, la pregunta más importante!
¿Cómo debería ser un flujo de trabajo de preparación de datos de IA de última generación?
Sin embargo, ya está allí con nuestra nueva tecnología LabelGPT
- Gestión de datos — El equipo de IA conecta sus datos de NLP y visión artificial desde la nube (por ejemplo, S3, API, GCS, Azure blob store) y administra los conjuntos de datos a través de interfaces de administración de datos.
- Marcar datos erróneos — Debido a que el sistema ya tendrá conjuntos de datos anotados y conocimiento y modelos previos, sugerirá qué datos son ruidosos e inválidos según el caso de uso de IA en segundos y minutos. Esto, si se proporciona al gran ejército de trabajadores subcontratados, requeriría una gran cantidad de esfuerzo y tiempo y aún perdería el contexto.
- Pre-etiquetado — Además, realizará el etiquetado previo de acuerdo con las indicaciones o los casos de uso mencionados. Hasta ahora, una parte importante de la oferta de los BPO era esta parte y ahora se reduce a nada en la mayoría de los casos de uso, como la moderación de contenido, la anotación de recibos, las etiquetas NER, la clasificación de documentos, el conteo de personas, la vigilancia, etc.
. - Control de calidad de datos guiados — Luego, un sistema generará análisis y flujo de trabajo guiado donde realmente requiere asistencia humana o escenarios en los que no está seguro.
- Cree modelos de IA de referencia — Esta capacidad de revisión inteligente se deja a un volumen tan pequeño que tiene un equipo interno con mejor contexto y los datos que residen internamente se vuelven mucho más viables que subcontratar el trabajo mientras se permite el acceso a personas externas y aún menos contexto. Mientras tanto, los equipos de IA pueden comenzar a crear modelos mientras exploran la subcontratación de los datos difíciles o no etiquetados pendientes.
- Subcontratar solo si es necesario donde importa — Ahora, finalmente, posiblemente quede entre un 5% y un 10% de los datos donde el sistema no sabe dónde está mal o escenarios en los que no está seguro y un circuito de retroalimentación de los clientes donde está yendo mal. Estos son los casos que requieren una revisión y podrían conducir a la creación de un requisito humano en el circuito.
El panorama de la anotación de datos está cambiando a un ritmo vertiginoso, con tecnologías disruptivas como GPT-3 y otros modelos de lenguaje extenso (LLM) que hacen sentir su presencia. Si bien el papel de las empresas de BPO en la anotación de datos se está reduciendo rápidamente, la automatización está dando un paso al frente y asumiendo una mayor parte de la carga de trabajo. Según las estimaciones, la automatización ahora puede manejar hasta el 90 % del trabajo de anotación de datos, lo que deja a los BPO con un exiguo 10 %.
Los humanos en el circuito siguen desempeñando un papel crucial para lograr los más altos niveles de precisión y calidad en la anotación de datos. Las empresas de herramientas deben centrarse en desarrollar una mejor tecnología que combine las fortalezas de los humanos y la automatización para crear un poderoso enfoque híbrido. Al aprovechar la velocidad y la eficiencia de la automatización con el toque humano, este modelo puede ofrecer los mejores resultados posibles.
Para mantenerse al día con los rápidos cambios en la industria, los BPO y las plataformas de motores de datos deben colaborar y ofrecer IA como servicio. La falta de adaptación a estos cambios puede resultar en quedarse atrás en el progreso de la industria. Invertir en talento y mantenerse a la vanguardia mediante la incorporación de las últimas tecnologías es la clave del éxito.
Con la estrategia y el enfoque correctos, las empresas pueden mantenerse a la vanguardia en el juego de anotación de datos y lograr posibilidades ilimitadas. Es importante abordar las limitaciones actuales y en evolución de la tecnología mientras se innova y colabora para crear un futuro mejor para la anotación de datos.
¡Mi último pensamiento sobre esto!
Como líder en la anotación de datos de IA, debe tener en cuenta que un cambio de juego como etiquetagpt no es una herramienta más en el mercado.
Ofrece mucho más que una simple anotación de datos básicos, por lo que es una opción ideal para los BPO que buscan aumentar sus ingresos hasta 10 veces o retener a sus clientes.
No tiene mucho sentido que los BPO inviertan en crear una herramienta desde cero cuando la colaboración o la asociación estratégica pueden ofrecer una forma más eficiente y competitiva de avanzar.
vamos a conectarnos LinkedIn mientras escribo aspectos interesantes y nuevos en la preparación de datos de visión por computadora, operaciones de datos, canalizaciones de datos, etc., y estoy feliz de conversar sobre lo mismo.
Publicado a través de Hacia la IA