Cómo aproximar los resultados de su conjunto de muestras (regla empírica… – Hacia la IA

Estás leyendo la publicación: Cómo aproximar los resultados de su conjunto de muestras (regla empírica… – Hacia la IA

Publicado originalmente en Hacia la IA, la empresa líder mundial en noticias y medios de IA y tecnología. Si está creando un producto o servicio relacionado con la IA, lo invitamos a considerar convertirse en patrocinador de la IA. En Hacia la IA, ayudamos a escalar las empresas emergentes de IA y tecnología. Permítanos ayudarlo a dar rienda suelta a su tecnología a las masas.

La regla empírica es un instrumento poderoso para capturar la distribución de sus observaciones dentro del conjunto de datos. Sin embargo, no es la única forma de hacerlo, especialmente cuando su conjunto de datos no se distribuye normalmente.

Índice:
1. Descripción del problema
2. Revisar estadísticas
3. Regla empírica
4. Teorema de Chebyshev

Descripción del problema

Imagine que tiene 60 estudiantes en la clase de matemáticas y ha monitoreado el tiempo de cuánto les toma a los estudiantes terminar un ejercicio.
Obtienes los siguientes resultados. Promedio: 7′, Varianza: 5′
Nos encantaría saber cuál es el número máximo de alumnos que dedican más de 15′ a un ejercicio.

Revisar estadísticas

Antes de ir a la solución, hagamos un resumen rápido de las nociones estadísticas básicas. El promedio se calcula siguiendo la siguiente fórmula.

El promedio toma la suma de todas las observaciones en el conjunto de datos y la divide por el número de observaciones

La varianza muestra la dispersión de las observaciones alrededor de la media. Toma la suma de la observación única y la diferencia de la media (promedio) elevada al cuadrado y la divide por el número de observaciones.

🔥 Recomendado:  Este boletín de IA es todo lo que necesita #27 – Hacia la IA

Para el siguiente paso, necesitaremos un Desviación Estándar. Que es simplemente una raíz cuadrada de la varianza.

Regla empírica

Si tenemos un conjunto de datos distribuido normalmente, podemos aplicar la regla empírica (a veces también llamada regla 3 sigma, debido al signo griego sigma que define la desviación estándar) para conocer la probabilidad de que ocurran las observaciones que se encuentran dentro de un cierto rango de el conjunto de datos

La regla empírica dice:
El 68% de las observaciones se encuentran dentro del rango de 1 desviación estándar de la media.
El 95% de las observaciones se encuentran dentro de un rango de 2 desviaciones estándar de la media.
El 99,7% de las observaciones se encuentran dentro de un rango de desviación estándar de 3 de la media.

Dado que nuestro problema no nos dice explícitamente, la distribución es normal. No podemos estar seguros con la regla empírica. En este caso, podemos utilizar el teorema de probabilidad de Chebyshev.

Teorema de Chebyshev

Si el conjunto de datos no tiene una distribución normal, no significa que no podamos tener una aproximación de la distribución de las observaciones dentro del conjunto de datos.
La fórmula de Chebyshev establece:

Donde k denota cuantas desviaciones estándar tenemos de la distancia entre los rangos de interés.
En nuestro caso. La desviación estándar va a ser 2,24 (raíz cuadrada de 5)

La ecuación para encontrar cuántas ecuaciones estándar se necesitan para capturar el área antes de 15′ es
15=7+k(2.24)
k(2.24)=8
k=3,57

Se necesitan 3,57 desviaciones estándar de la media para llegar a 15′. Ahora tenemos todas las entradas para calcular el porcentaje en el rango entre +- 3.57 de la media.

🔥 Recomendado:  10 consejos sobre cómo impulsar las ventas de comercio electrónico

1– 1/3,5⁷² = 0,92 * 100
y para encontrar el número máximo de estudiantes que van más allá de 15′ es 0.07*60. = ~4 estudiantes.

Conclusión

Gracias por su atención. Espero que hayas disfrutado este artículo. Para cualquier consulta o crítica, no dude en dejar un comentario.


Cómo aproximar los resultados de su conjunto de muestra (regla empírica frente a la fórmula de Chebyshev) se publicó originalmente en Hacia la IA en Medium, donde las personas continúan la conversación destacando y respondiendo a esta historia.

Publicado a través de Hacia la IA