▷ ¿Qué es el sesgo inductivo?

Estás leyendo la publicación: ¿Qué es el sesgo inductivo? – Hacia la IA

Publicado originalmente en Hacia la IA, la empresa líder mundial en noticias y medios de IA y tecnología. Si está creando un producto o servicio relacionado con la IA, lo invitamos a considerar convertirse en patrocinador de la IA. En Hacia la IA, ayudamos a escalar las empresas emergentes de IA y tecnología. Permítanos ayudarlo a dar rienda suelta a su tecnología a las masas.

¿Es bueno hacer suposiciones para un modelo de entrenamiento?

El sesgo inductivo (también conocido como sesgo de aprendizaje) de un algoritmo de aprendizaje es un conjunto de suposiciones que el alumno usa para predecir salidas de entradas dadas que no ha encontrado – Wikipedia

En el ámbito del aprendizaje automático y la inteligencia artificial, existen muchos sesgos como el sesgo de selección, el sesgo de sobregeneralización, el sesgo de muestreo, etc. En este artículo, vamos a hablar sobre el sesgo inductivo, sin el cual el aprendizaje no sería posible. En un conjunto de datos, para obtener información o predecir resultados, debemos saber qué estamos buscando. Deberíamos hacer algunas suposiciones sobre los datos en sí para hacer posible el aprendizaje, esto se conoce como sesgo inductivo.

Primero veremos un ejemplo para comprender la intuición detrás del sesgo inductivo.

La figura anterior ilustra los puntos de datos que pertenecen a un conjunto de datos, donde el punto rojo pertenece al conjunto de entrenamiento y el punto verde es el punto de prueba. Esta es una clasificación binaria de si un punto en el eje x pertenece a la clase “-1” o a la clase “1” según la característica que se muestra en el eje x. Considere que nuestro espacio de datos consta de 100 puntos de datos.

Ahora, para encontrar la etiqueta para el punto verde, si no conocemos ninguna información sobre esta etiqueta y no pudimos hacer suposiciones, nos quedarán 2¹⁰⁰ funciones que generarán la etiqueta para el punto verde. Incluso si somos capaces de eliminar funciones que no satisfacen nuestro conjunto de entrenamiento, aún nos quedarán 2⁹¹ funciones, la mitad de las cuales habría predicho “-1” como etiqueta y la otra mitad habría predicho “1” como la etiqueta. Si asumimos que la función objetivo debe ser una constante 1 o una constante 0, luego de observar las muestras de entrenamiento podemos decir que la función objetivo debe ser una constante 1.

En el escenario anterior, hemos observado los dos extremos, uno donde no hay sesgo inductivo, por lo que el aprendizaje no es posible, y el otro donde hay un fuerte sesgo inductivo, por lo que pudimos llegar a la conclusión con menos cantidad de datos de entrenamiento. Pero en los escenarios del mundo real estaremos en el medio, tendremos un sesgo inductivo junto con un conjunto de datos de entrenamiento más grande.

En los escenarios de aprendizaje automático del mundo real, tenemos que encontrar un buen espacio funcional para la hipótesis de una aplicación particular. Por ejemplo, cuando se nos proporciona un conjunto de datos para una regresión o clasificación, en función de la comprensión que tenemos sobre los datos de entrenamiento, deberíamos poder seleccionar modelos que corregirán el modelo de los datos proporcionados. Estas suposiciones se conocen como sesgo inductivo.

Para dar un ejemplo más práctico, en un tren un ingeniero, un científico y un matemático van a Escocia y ven una oveja negra, inmediatamente el ingeniero dice que todas las ovejas en Escocia son negras, pero el físico contradice diciendo que no algunas las ovejas en Escocia son negras. Molesto por estas conversaciones, el matemático dice que hay al menos una oveja en Escocia que es al menos negra de un lado. Cada una de estas personas representa un nivel diferente de sesgo inductivo, que he mencionado en el primer ejemplo, el ingeniero tiene un sesgo inductivo fuerte, mientras que el matemático no tiene sesgo inductivo, mientras que el científico tiene un sesgo inductivo. La pregunta es quién crees que tiene razón si no tienes ninguna idea sobre las ovejas en Escocia.

“Incluso después de la observación de la conjunción frecuente o constante de objetos, no tenemos razón para sacar ninguna inferencia sobre ningún objeto más allá de los que hemos tenido experiencia”. -Hume

En el aprendizaje automático violamos la declaración de Hume porque estamos generalizando los patrones que observamos sobre los datos de entrenamiento también a los datos de prueba, esto se conoce como sesgo inductivo. Entonces, sin el sesgo inductivo, el aprendizaje no será posible.

Es posible que algunos de ustedes ya hayan oído hablar del teorema No Free Lunch, que establece que

“si todas las funciones verdaderas son igualmente probables, entonces ningún algoritmo de aprendizaje es mejor que otro”

Eso significa que si no tenemos ninguna suposición con respecto a los datos que tenemos que modelar, entonces no podemos seleccionar la mejor función de destino.

¿Qué es el sesgo inductivo? se publicó originalmente en Hacia la IA en Medium, donde las personas continúan la conversación destacando y respondiendo a esta historia.

Publicado a través de Hacia la IA

¿Qué es el sesgo inductivo? – Hacia la IA

¿Es bueno hacer suposiciones para un modelo de entrenamiento?

Otros temas interesantes: