Análisis de datos ordinales en SAS: Poisson y binomios negativos… – Hacia la IA

Estás leyendo la publicación: Análisis de datos ordinales en SAS: Poisson y binomios negativos… – Hacia la IA

Publicado originalmente en Hacia la IA, la empresa líder mundial en noticias y medios de IA y tecnología. Si está creando un producto o servicio relacionado con la IA, lo invitamos a considerar convertirse en patrocinador de la IA. En Hacia la IA, ayudamos a escalar las empresas emergentes de IA y tecnología. Permítanos ayudarlo a dar rienda suelta a su tecnología a las masas.

Análisis de datos ordinales en SAS: Poisson y distribución binomial negativa

Esta publicación es una extensión de una publicación introductoria sobre el uso PROC GLIMMIX en SAS. Ya mostré cómo analizar datos ordinales usando el distribución multinomialy el distribución binaria, binomial y beta. En esta publicación, usaré la distribución de Poisson de la que tengo publicado anteriormente también. Esta publicación ampliará esas publicaciones analizando el mismo conjunto de datos: puntajes de diarrea medidos en cerdos a lo largo del tiempo. Aquí, la diarrea se mide subjetivamente mediante un sistema de puntuación ordinal.

Por lo tanto, esta publicación será bastante breve y debe verse más como una extensión de la anterior. PROC GLIMMIX publicaciones A continuación, verá un gráfico de datos de conteo superpuestos con distribuciones ajustadas. Dos de las distribuciones más conocidas y utilizadas son Poisson y Negative-Binomial, de las cuales la última es más flexible. Esto se debe a que el modelo binomial negativo es una mezcla de dos distribuciones: la distribución de Poisson y la distribución gamma.

Como puede ver en el diagrama a continuación, el binomio negativo puede ajustarse mejor a los datos, pero sobreestimará el número de ceros. Cuando se trata de conteos, esos ceros pueden ser problemáticos, lo que ha llevado a la aplicación de modelos inflados a cero, que no discutiré aquí.

🔥 Recomendado:  Cuatro razones por las que los editores deberían preocuparse por los datos de Zero-Party

Por definición, los datos de conteo son una tasa que normalmente sigue una distribución de Poisson. Aquí, en este ejemplo, contamos la cantidad de diarrea en todo el período de tiempo. Esto significa que, para una escala ordinal, necesitamos dicotomizarla. De lo contrario, no tenemos los ‘eventos’ necesarios para modelar la tasa.

Usando la distribución binomial, debe especificar un denominador (Y) y un denominador (N). Con la distribución de Poisson, debe especificar un denominador (Y) y una variable de compensación (N). La compensación debe estar en la escala logarítmica. Esta compensación es muy importante: le da a la tasa la otra métrica que necesita para ser una tasa.

Esto se puede ver utilizando la siguiente tabla. La elección de no incluir heces como sin diarrea o sin falta tiene un efecto en la tasa, ya que la compensación cambia. Esto es normal ya que el denominador también cambia.

En la publicación introductoria, ya mencioné el peligro de dispersión excesiva que es común cuando se usa la distribución de Poisson.. Esto se debe a que la distribución de Poisson es una distribución de un solo parámetro: la media es igual a la varianza.

Ahora, veamos cómo se ve un binomio negativo en los datos. Dado que el análisis de Poisson ya mostró una ausencia de sobredispersión, estoy seguro de que el Binomial Negativo detectará lo mismo. Por lo tanto, podemos ir directamente al análisis en sí.

Usemos un conjunto de datos diferente en el que sabemos que los datos están más separados.

En resumen, los modelos de distribución de Poisson cuentan datos. Para analizar la diarrea utilizando la distribución de Poisson, puede utilizar el conjunto de datos en el formato utilizado para la distribución binomial. Dado que los modelos de Poisson a tasa, debe incluir una variable de compensación, que es el denominador en la ecuación. Usando el Poisson, siempre debe tener cuidado con sobredispersión Un buen reemplazo para la distribución de Poisson es la Binomial Negativo distribución

🔥 Recomendado:  Comprensión de la desidentificación de datos y sus aplicaciones


Análisis de datos ordinales en SAS: la distribución binomial negativa y de Poisson se publicó originalmente en Towards AI en Medium, donde las personas continúan la conversación resaltando y respondiendo a esta historia.

Publicado a través de Hacia la IA