Una presentación fascinante de Kate Crawford, investigadora principal de Microsoft Research, en la Conferencia Strata 2013 analiza más de cerca los grandes datos y lo que significa, explorando algunas de las que Crawford llama "ilusiones algorítmicas" y las limitaciones de las soluciones de datos a gran escala. que se están adoptando en muchas partes del mundo de los negocios.
Usando una analogía fundamental con una ilusión óptica que involucra a un gato girando, Crawford argumenta que si bien el big data es esencial para muchas aplicaciones comerciales, hay más de una forma de interpretar muchos de los resultados de los conjuntos de datos que pueden parecer objetivos para los tomadores de decisiones humanos. .
"Las cosas se pueden ver de manera diferente", dijo Crawford, citando un artículo en el que ella y el coautor David Boyd reflexionan sobre algunos principios importantes del uso de big data, incluyendo lo que Crawford llama "mitología" o la creencia de que big data trae la verdad absoluta. y objetivismo a un proyecto. Los líderes, dijo, a menudo asocian directamente los grandes datos con una vista panorámica objetiva, mientras ignoran lo que ella llamó las tres limitaciones o consideraciones fundamentales que pueden afectar esta objetividad en formas clave: sesgo, señal y escala.
Comenzando con un sesgo, Crawford utiliza ejemplos de inundaciones en Australia y los Estados Unidos para mostrar que los grandes datos no siempre coinciden con la realidad en la calle. Ella se vincula con el segundo principio, la señal, que ilustra aún más cómo los conjuntos de datos pueden reflejar realidades ocultas que pueden sesgar en gran medida los resultados. Como ejemplo, Crawford citó los múltiples tipos de mapas mundiales que se han desarrollado en un intento de mostrar una visión objetiva del tamaño relativo de los continentes y las naciones.
"Los mapas no son neutrales", dijo Crawford. "Estamos tomando decisiones cada vez que decidimos representar nuestros datos".
Para ilustrar aún más el principio, Crawford utiliza el ejemplo de una aplicación que informa los baches en Boston a los funcionarios de la ciudad, sugiriendo que este tipo de aplicaciones que funcionan en teléfonos inteligentes y dispositivos móviles pueden terminar haciendo que los informes generales se parezcan mucho a los mapas del censo que indican la edad relativa e ingresos en una ciudad o municipio.
"Corremos el riesgo de afianzar aún más los tipos particulares de inequidad social", dijo Crawford, señalando a aquellos que pueden quedar fuera de un conjunto de datos grandes debido a las diferencias en el uso de la tecnología.
"¿Qué sucede si vives a la sombra de grandes conjuntos de datos?" ella dijo.
Además, Crawford también habla sobre investigaciones de años atrás que cuestionaron si la información de alto nivel siempre representa datos más granulares y si un "panorama objetivo" siempre funciona como una representación más precisa que los datos en una escala más pequeña. Crawford también pide a los oyentes que piensen no solo en big data, sino también en "datos con profundidad". Con esto, se refiere a datos que realmente guían a los lectores hacia la realidad objetiva, en lugar de pasar por alto detalles con un enfoque más global que, si bien es más fácil de entender, puede omitir elementos clave de lo que realmente existe.