Un intento de conocer los resultados reales de las elecciones parlamentarias de Rusia de 2021… – Hacia la IA

Estás leyendo la publicación: Un intento de conocer los resultados reales de las elecciones parlamentarias de Rusia de 2021… – Hacia la IA

Publicado originalmente en Hacia la IA, la empresa líder mundial en noticias y medios de IA y tecnología. Si está creando un producto o servicio relacionado con la IA, lo invitamos a considerar convertirse en patrocinador de la IA. En Hacia la IA, ayudamos a escalar las empresas emergentes de IA y tecnología. Permítanos ayudarlo a dar rienda suelta a su tecnología a las masas.

Aprendizaje automático

El partido “Rusia Unida” tiene la mayoría de los escaños en la “Duma” del parlamento ruso desde 2003. En 2021, el partido gobernante obtuvo una victoria decisiva una vez más a pesar de que los ciudadanos rusos no han visto crecer sus ingresos durante más de 10 años. ¿Pero fue tan decisivo? Como a menudo, cuando los asuntos se relacionan con la política, uno puede encontrar fácilmente muchos argumentos convincentes que prueban opiniones completamente opuestas. En tales situaciones, siempre es útil investigar los datos sin procesar. En este artículo, examinaremos los resultados de las elecciones al parlamento ruso de 2021 utilizando herramientas conocidas y confiables como pandas, matplotlib, plotly y sci-kit-learn. Simularemos dos tipos de fraude: asignación de personal de boletas y registro incorrecto de votos. En función de los resultados de la simulación, enseñaremos un modelo de regresión logística y dejaremos que juzgue si ocurrió algún fraude electoral durante las elecciones de 2021. Al final, crearemos una tabla y un mapa que indicarán las regiones de Rusia donde hay problemas con el registro adecuado de los resultados electorales. son más probables.

Primero, describamos algunos de los principios básicos del proceso de votación en Rusia, que son importantes en el contexto de este artículo. Las elecciones en Rusia no son organizadas por el estado, sino por comisiones electorales independientes. Estas comisiones están formadas por personas que tienen intereses multidireccionales. En total, en las elecciones federales se suelen formar unas 96.000 mesas de votación y, en consecuencia, comisiones. De 1000 a 2000 personas que viven en un área compacta pueden votar en una mesa de votación de tamaño mediano. Casi cualquier ciudadano de Rusia puede convertirse en miembro de la comisión y organizar elecciones. La forma más fácil es inscribirse para trabajar en una comisión electoral cercana al lugar de residencia.

¿Qué intereses representan los miembros de las comisiones electorales? En primer lugar, los intereses de los diversos partidos políticos que participan en las elecciones. Entonces, por ejemplo, en muchas comisiones, encontrará representantes de los dos partidos más grandes en Rusia en el momento de escribir este artículo: “Rusia Unida” (UR) y “Partido Comunista de la Federación Rusa” (CPRF). Además, en las comisiones, puede encontrar ciudadanos comunes que consideran una tarea importante organizar elecciones de alta calidad y están dispuestos a sacrificar una cantidad significativa de su tiempo personal para esto. Existen organizaciones sin fines de lucro que tratan de coordinar las actividades de dichos ciudadanos. Por ejemplo, el movimiento público de toda Rusia para la protección de los derechos de los votantes “Golos”, fue acusado de financiación extranjera y etiquetado como agente extranjero un mes antes de las elecciones, en agosto de 2021. En teoría, todas estas fuerzas multidireccionales deberían equilibrarse entre sí. otros y asegurar la calidad del conteo de votos. En muchas áreas, esto es exactamente lo que sucede. Por ejemplo, en la mayoría de los colegios electorales fuera de línea en Moscú, esta condición se cumplió en las últimas elecciones y la victoria, por un pequeño margen, la obtuvo el Partido Comunista de la Federación Rusa.

🔥 Recomendado:  Revisión de Fetch Rewards: ¿Es una forma legítima de ganar tarjetas de regalo?

Sin embargo, para que un grupo de personas cubra todos los colegios electorales con sus representantes, se necesitan al menos tres personas por sitio. En una pandemia, la duración de la votación se incrementó a tres días, lo que triplicó la cantidad de horas-hombre requeridas. Es decir, cada uno de los partidos debía estar representado por unas 300.000 personas, que tendrían que trabajar unas 30 horas cada uno. Es decir, se trata de 9 millones de horas-hombre. Con un salario promedio en Rusia de 5 dólares por hora en 2021, se necesitaron más de 45 millones de dólares solo para controlar el correcto conteo de votos. Los recursos de los grupos de personas que organizan las elecciones no son iguales. Incluso el presupuesto oficial de Rusia Unida fue de 128 millones de dólares en 2020, mientras que el presupuesto oficial del Partido Comunista de Rusia fue de solo 17 millones. Rusia Unida es el único partido que tiene un presupuesto suficiente para cubrir todos los colegios electorales con suficientes de sus representantes. Por lo tanto, hay áreas donde las elecciones son organizadas por representantes del partido gobernante solamente. No sorprende que en tales mesas de votación la calidad del registro de los resultados electorales pueda reducirse significativamente.

En las elecciones de 2021 se permitió la participación de 14 partidos. Sin embargo, grandes grupos de personas no tenían a ninguno de sus representantes registrados en las boletas porque a muchos políticos opositores conocidos no se les permitía participar en las elecciones. Muchos votantes podrían elegir al Partido Comunista en tales circunstancias como protesta porque es el mayor partido de oposición en Rusia. Este año en muchas mesas electorales CPRF y UR obtuvieron resultados cercanos y es muy conveniente comparar los resultados de los dos partidos.

Los resultados de las elecciones son información abierta que está disponible en el sitio de la comisión central de votación de Rusia. En este estudio, utilizaremos versiones analizadas y traducidas de los resultados del archivo ‘stations.csv’. Este archivo y el código fuente están alojados en GitHub. Carguemos los datos:

#%% Cargar datos
importar pandas como pd
estaciones = pd.read_csv(‘data/edata_eng.csv’, index_col=0)

El conjunto de datos consta de información sobre los resultados de las elecciones en 96307 mesas de votación. En la investigación posterior, no consideraremos estaciones con un electorado de menos de cien votantes para excluir resultados impulsados ​​por artefactos de números pequeños:

estaciones = estaciones[stations[‘total_voters’]>100]

En el conjunto de datos, también hay mesas de votación con resultados muy improbables, donde Rusia Unida casi no obtiene votos, mientras que algún otro partido menor obtiene resultados abrumadores. Como en la mesa de votación número 1521 en la república de Daguestán. Allí de 1650 personas que vinieron a la estación 1617 votaron por el “Partido Verde” y nadie votó por Rusia Unida. Obviamente, se trata de resultados mal registrados involuntariamente. Filtraremos dichas estaciones considerando solo las estaciones donde hay más de 5 votos para Rusia Unida:

estaciones = estaciones[stations[‘ur’]>5]

Además, filtraremos las estaciones de votación en línea que se introdujeron este año en Moscú. Este año se formaron estaciones de votación en línea muy grandes. El electorado de cada estación en línea supera los 100000, mientras que no hay estaciones fuera de línea con un electorado superior a 5000. Esta y otras razones dificultan la comparación de los resultados en las estaciones en línea y fuera de línea.

estaciones = estaciones[stations[‘total_voters’]<10000]

Estos filtros reducen el número de mesas de votación a 92018.

🔥 Recomendado:  La mejor guía para anuncios publicitarios móviles 2023

La mejor manera de comenzar a analizar datos es visualizarlos:

Esta figura muestra el porcentaje de Rusia Unida y el Partido Comunista en el eje y en función de la participación electoral en el eje x. Cada par de puntos representa una de las 92018 mesas de votación. A veces, tal complot se llama ‘huella digital electoral'[1]. Se pueden ver dos grupos en la parcela. El núcleo denso, donde el Partido Comunista y Rusia Unida tienen resultados muy parecidos: muchos puntos rojos y azules se superponen. Y dos colas en mayor participación. A medida que aumenta la participación, el resultado de Rusia Unida aumenta en las historias, mientras que el resultado del Partido Comunista disminuye. La Comisión Central de Votación no encontró nada sospechoso en tales resultados y los hizo oficiales. Sin embargo, por lo general, en las elecciones, las huellas dactilares en las democracias maduras están ausentes. Después de un examen minucioso de la parcela en alta concurrencia, se puede descubrir una estructura de cuadrícula. Esto podría ser evidencia de errores en el registro de votos. Los humanos tienen una tendencia natural a que les gusten los números redondos y es más probable que generen resultados redondos. Muchas mesas de votación con resultados redondos se verían como una cuadrícula en una huella digital electoral.[2,3]

Es más probable que el equilibrio en las comisiones de votación se produzca en áreas densamente pobladas porque es más fácil para los partidos opuestos encontrar suficientes representantes para cubrir todas las mesas de votación.

Examinemos la huella digital electoral que se pudo observar en los colegios electorales a cinco kilómetros de distancia de los centros de 43 grandes ciudades de Rusia. Los resultados de las elecciones de estas estaciones se pueden encontrar en el archivo ‘cities_ok_eng.csv’:

estaciones_ciudades = pd.read_csv(‘data/cities_ok_eng.csv’, index_col=0)

Este subconjunto de los resultados de las elecciones de 2021 contiene información sobre los resultados de las elecciones en 6602 mesas de votación donde pudieron votar más de 12 millones de personas. En la siguiente figura hay una huella digital de elección para el subconjunto.

No hay un grupo de “cruces” en este subconjunto de resultados electorales. Veamos qué sucede si asignamos papeletas a las estaciones de votación de la ciudad seleccionadas al azar con un ciclo simple:

estaciones_ciudad = estaciones_ciudad.muestra(frac=1)
estaciones_de_ciudad[‘fraud’] = Falso

yo = 0
ur_percent = city_stations[‘ur’].sum()/city_stations[‘voted’].suma()
para índice, fila en city_stations.itarrows():
si ur_porcentaje < 0,47:
total_votantes = fila[‘total_voters’]
votado = fila[‘voted’]
max_fraud = total_voters – votado
min_fraude = max_fraud*0.05
número = int(uniforme(min_fraud, max_fraud))
city_stations.loc[index, ‘ur’] = fila[‘ur’] + numero
city_stations.loc[index, ‘voted’] = fila[‘voted’] + numero
city_stations.loc[index,’fraud’] = Verdadero
ur_percent = city_stations[‘ur’].sum()/city_stations[‘voted’].suma()

estaciones_de_ciudad[‘turnout’] = ciudad_estaciones[‘voted’]/city_stations[‘total_voters’]
estaciones_de_ciudad[‘ur_percent’] = ciudad_estaciones[‘ur’]/city_stations[‘voted’]
estaciones_de_ciudad[‘cprf_percent’] = ciudad_estaciones[‘cprf’]/city_stations[‘voted’]

En la figura, los resultados de Rusia Unida se limitan al 80 por ciento. Registremos incorrectamente los resultados en algunas mesas de votación con este ciclo simple:

#%% Registro erróneo de votos hasta 49.8
city_stations_change = city_stations[~city_stations[‘fraud’]]
para índice, fila en city_stations_change.itarrows():
si ur_porcentaje < 0.4982:
total_votantes = fila[‘total_voters’]
random_voted = int(uniforme(total_voters * 0.8, total_voters))
votado = votado al azar
random_er = int(uniforme(random_voted * 0.8, random_voted))
city_stations.loc[index, ‘voted’] = votado
city_stations.loc[index, ‘ur’] = int(random_er)
city_stations.loc[index, ‘cprf’] = int((random_voted – random_er)*0.3)
city_stations.loc[index, ‘fraud’] = Verdadero
ur_percent = city_stations[‘ur’].sum() / city_stations[‘voted’].suma()

estaciones_de_ciudad[‘turnout’] = ciudad_estaciones[‘voted’]/city_stations[‘total_voters’]
estaciones_de_ciudad[‘ur_percent’] = ciudad_estaciones[‘ur’]/city_stations[‘voted’]
estaciones_de_ciudad[‘cprf_percent’] = ciudad_estaciones[‘cprf’]/city_stations[‘voted’]

En la medida en que marcamos estaciones con falsificaciones agregando la columna ‘fraude’ al marco de datos, podemos distinguir fácilmente entre estaciones sin fraude:

Y con fraude:

También podemos entrenar un modelo que será capaz de predecir si hubo un fraude en una mesa de votación en particular:

#%% Enseñar el modelo de regresión logística en las estaciones de la ciudad
de sklearn.pipeline canal de importación
de sklearn.preprocessing importar StandardScaler
de sklearn.linear_model import LogisticRegressionCV
tubería = tubería ([(“scale”, StandardScaler()), (“model”, LogisticRegressionCV())])
tubería.get_params()
X = ciudad_estaciones[[‘ur’,’cprf’, ‘voted’,’total_voters’]]
y = ciudad_estaciones[‘fraud’]
tubo.ajuste(X, y)

🔥 Recomendado:  La Autoridad de Mercados y Competencia del Reino Unido lanza una revisión de los modelos de IA a medida que aumentan los esfuerzos de regulación del gobierno

Ahora apliquemos el modelo al conjunto de datos inicial con información sobre los resultados de las elecciones en todos los colegios electorales de Rusia:

#%% Aplicar modelo a todas las estaciones
estaciones[‘turnout’] = estaciones[‘voted’]/estaciones[‘total_voters’]
estaciones[‘ur_percent’] = estaciones[‘ur’]/estaciones[‘voted’]
estaciones[‘cprf_percent’] = estaciones[‘cprf’]/estaciones[‘voted’]
Xx = estaciones[[‘ur’,’cprf’, ‘voted’,’total_voters’]]
predicción = pipe.predict(Xx)
predicción
estaciones[‘prediction’] = predicción

La modelo sospecha que en 40219 mesas electorales hubo fraude:

Pero hay donde 51799 estaciones donde las elecciones fueron justas:

Si asumimos que el resultado promedio en las estaciones con fraude fue el mismo que en las estaciones sin fraude, podemos calcular una cantidad de boletas que tuvieron que ser atendidas para lograr un resultado del 49.9 por ciento:

estaciones_ok = estaciones[stations[‘prediction’] == Falso]
estaciones_fraude = estaciones[stations[‘prediction’] == Verdadero]
ur_true = estaciones_ok[‘ur’].sum()/estaciones_ok[‘voted’].suma()
ur_fraud = estaciones_fraude[‘ur’].sum()/stations_fraud[‘voted’].suma()
ronda(estaciones_fraude[‘voted’].sum()*ur_true/ur_fraud)
12993185

El número de papeletas llenas se acerca a los 13 millones según la predicción del modelo. El conocido analista electoral Sergey Shpilkin sugirió que alrededor de 14 millones de los votos oficiales de Rusia Unida fueron fraudulentos.[4]

También podemos ahora presentar una tabla con los resultados de la investigación para cada región. En la tabla, representamos un parámetro llamado “Disponibilidad”. Este parámetro muestra el porcentaje de la población de una región que tiene acceso a mesas de votación con buena calidad de registro de resultados electorales:

Si agregamos la función de disponibilidad a cada mesa de votación, podemos visualizar la información de la mesa en un mapa:

Conclusión:

  • · Como resultado de la simulación de fraude electoral, aparece un nuevo clúster en la huella electoral del subconjunto de resultados electorales de las grandes ciudades. El grupo tiene mucho en común con el grupo de “colas” de huellas dactilares electorales de todas las mesas de votación en Rusia.
  • · El modelo de regresión logística entrenado en fraude electoral simulado sugiere que la mayoría de las mesas de votación en el grupo de colas de los resultados del parlamento de 2021 tenían boletas llenas o errores en el registro de votos.
  • · El modelo predijo que alrededor de 13 millones de votos fueron falsificados a favor del partido Rusia Unida.
  • · Es posible que la mayoría de la población de las regiones del sur de Rusia no disponga de mesas de votación con un registro de resultados adecuado.

[1] Thurner S., Klimek P. El análisis forense electoral de las elecciones de Rusia 2021 indica estadísticamente un fraude electoral masivo(2021), Resumen de políticas de CSH

[2] Kobak D, Shpilkin S, Pshenichnikov MS, Porcentajes enteros como huellas dactilares de falsificación electoral(2016), Anales de Estadística Aplicada

[3] Kobak D, Shpilkin S, Pshenichnikov MS, Huellas estadísticas del fraude electoral? (2016), Importancia (Sociedad Real)

[4] Cordell J, Los estadísticos afirman que la mitad de los votos a favor del Kremlin en las elecciones a la Duma fueron falsos(2021), Los tiempos de Moscú


Un intento de conocer los resultados reales de las elecciones parlamentarias de Rusia de 2021 utilizando el aprendizaje automático. se publicó originalmente en Hacia la IA en Medium, donde las personas continúan la conversación destacando y respondiendo a esta historia.

Publicado a través de Hacia la IA