Hogar Bases de datos Uso de algoritmos para predecir elecciones: una conversación con drew linzer

Uso de algoritmos para predecir elecciones: una conversación con drew linzer

Anonim

Drew presentará en la Big Data Innovation Summit, el 30 y 31 de enero en Las Vegas: http://analytics.theiegroup.com/bigdata-lasvegas, junto con oradores de Obama para América, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs y muchos más.


Enlace de registro: http://bit.ly/Zs3wms


Esta entrevista fue realizada por George Hill y publicada en la Big Data Innovation Magazine.


¿Qué tipo de reacción ha habido ante tus predicciones?


La mayor parte de la reacción se ha centrado en la diferencia de precisión entre aquellos de nosotros que estudiamos las encuestas de opinión pública, y las predicciones de "instinto" de expertos y comentaristas populares. El día de las elecciones, los analistas de datos como yo, Nate Silver (New York Times FiveThirtyEight blog), Simon Jackman (Universidad de Stanford y Huffington Post) y Sam Wang (Princeton Election Consortium) colocaron las posibilidades de reelección de Obama en más del 90%, y previeron correctamente 332 votos electorales para Obama como el resultado más probable. Mientras tanto, expertos como Karl Rove, George Will y Steve Forbes dijeron que Romney iba a ganar, y en algunos casos, fácilmente. Esto ha llevado a hablar de una "victoria para los cuantos" que espero lleven a futuras elecciones.


¿Cómo evalúa el algoritmo utilizado en sus predicciones?


Mi modelo de pronóstico estimó los resultados del voto estatal y el voto electoral final, todos los días de la campaña, a partir de junio. Quería que la evaluación de estos pronósticos fuera lo más justa y objetiva posible, y que no me dejara margen de maniobra si estaban equivocados. Entonces, aproximadamente un mes antes de las elecciones, publiqué en mi sitio web un conjunto de ocho criterios de evaluación que usaría una vez que se conocieran los resultados. Al final resultó que, el modelo funcionó perfectamente. Predijo durante el verano que Obama ganaría todos sus estados de 2008 menos Indiana y Carolina del Norte, y apenas se movió de esa predicción incluso después de que el apoyo a Obama subiera en septiembre, luego se hundió después del primer debate presidencial.


La cantidad de datos utilizados en esta campaña tanto por analistas independientes como por equipos de campaña ha sido enorme, ¿qué tipo de implicaciones tiene esto para el uso de datos en 2016?


La campaña de 2012 demostró que múltiples y diversas fuentes de información cuantitativa pueden ser gestionadas, confiadas y aplicadas con éxito hacia una variedad de fines. Nosotros, los de afuera, pudimos predecir el resultado de las elecciones con mucha anticipación. Dentro de las campañas, se hicieron grandes avances en la focalización de votantes, el seguimiento de opiniones, la recaudación de fondos y la participación electoral. Ahora que sabemos que estos métodos pueden funcionar, creo que no hay vuelta atrás. Espero que los reporteros y los comentaristas de campaña tomen mucho más en serio la agregación de encuestas en 2016. Y aunque Obama y los demócratas actualmente parecen tener una ventaja en la tecnología de campaña, me sorprendería si los republicanos no se pusieran al día rápidamente.


¿Crees que el éxito de esta campaña basada en datos ha significado que los gerentes de campaña ahora deben ser analistas y también estrategas?


Es posible que los gerentes de campaña no necesiten ser analistas, pero deberían tener una mayor apreciación de cómo los datos y la tecnología pueden aprovecharse en su beneficio. Las campañas siempre han utilizado la investigación de encuestas para formular estrategias y medir el sentimiento de los votantes. Pero ahora hay una gama de otras herramientas poderosas disponibles: sitios web de redes sociales, bases de datos de votantes, teléfonos inteligentes móviles y marketing por correo electrónico, por nombrar solo algunos. Y eso se suma a los avances recientes en metodologías de encuestas y modelos de opinión estadística. Actualmente hay mucha innovación en la política de campaña estadounidense.


Se las arregló para predecir los resultados de las elecciones con 6 meses de anticipación, ¿cuál cree que es el plazo máximo realista para predecir con precisión un resultado utilizando sus técnicas analíticas?


Aproximadamente cuatro o cinco meses son tan lejanos como la ciencia nos permite ir ahora mismo; y eso incluso lo empuja un poco. Antes de eso, las encuestas simplemente no son lo suficientemente informativas sobre el resultado final: demasiadas personas están indecisas o no han comenzado a prestar atención a la campaña. Los factores históricos económicos y políticos que se ha demostrado que se correlacionan con los resultados electorales también comienzan a perder su poder predictivo una vez que superamos el rango de aproximadamente 4-5 meses. Afortunadamente, eso todavía le da a las campañas mucho tiempo para trazar estrategias y tomar decisiones sobre cómo asignar sus recursos.

Uso de algoritmos para predecir elecciones: una conversación con drew linzer