artículo no publicado

Cambridge Analytica y los alcances de la ciencia de datos

Una de las preguntas que quedan después del escándalo de Cambridge Analytica es si mediante los datos y las campañas implementadas a partir de estos, se puede modificar el comportamiento humano.

“Podríamos agregar cierto valor a las campañas de México”, decía ufano Alexander Nix, exCEO de la empresa Cambridge Analytica, en una entrevista a Vice durante su visita a México en abril de 2017. Se podría suponer que su presencia estuvo motivada por las posibles oportunidades de negocio con la ciencia de datos, así como el valor cognitivo y empresarial de su compañía, con la cual hasta el año pasado —de acuerdo con la misma entrevista— ganó 31 elecciones y perdió solo una. Entre las ganadoras estaban nada menos que el Brexit y la presidencia de Donald Trump.

Unos once meses después, Nix fue despedido. The Observer, The Guardian y The New York Times, gracias a datos entregados por el informante Christopher Wylie, dieron cuenta del robo de 50 millones de perfiles de Facebook para manipular las emociones de los electores en Estados Unidos en lo que parece una trama propia de un capítulo de la serie Black Mirror. Por si fuera poco, Canal 4 de Gran Bretaña realizó una entrevista encubierta en la que el ahora exCEO develó a un supuesto enviado del gobierno de Sri Lanka, que Cambridge Analytica contrata a mujeres para armar escándalos a los candidatos adversarios, fabrica sitios web falsos, implementa campañas de desinformación, entre otras inescrupulosas prácticas.

Este escándalo mediático poco favor le hace a la ciencia de datos, uno de los conocimientos especializados más relevantes de los últimos años y que ha sido producto de la avasalladora digitalización. Imaginemos todos los datos que recogen los aeropuertos del mundo, las imágenes de las cámaras de vigilancia de una ciudad y las interacciones de las redes sociales —una de las principales fuentes del denominado Big Data—; se trata del nuevo oro de la economía con el que consultoras, como Cambridge Analytica, prometen ganar elecciones en un claro sobredimensionamiento de sus posibilidades científicas. Se extraen los datos, se modelan algoritmos, se analiza la personalidad de acuerdo con el perfil en una red social y se envían mensajes con puntería quirúrgica para manipular conductas. Parece una receta mágica, de no ser porque los votantes somos más complejos que lo que dice nuestro perfil de Facebook. El Big Data no significa muchos datos, sino un tipo de ensamblaje de estos.

Los datos que se obtienen de teléfonos móviles, redes sociales o sitios como Netflix son claro ejemplo de Big Data propicio para ser analizado para muy diversos propósitos. Los datos de geolocalización que se capturan a través de teléfonos móviles puede ayudar a mapear epidemias. Global Pulse, un fabuloso proyecto de Big Data de la ONU, estima mediante búsquedas en Google los flujos migratorios y complementa estadísticas nacionales; se trata de uno de entre muchos otros proyectos humanitarios. En estudios económicos es posible realizar proyecciones bursátiles y detectar la inflación al rastrear los precios, como lo hace el proyecto The Billion Prices Project del Tecnológico de Massachusetts.

Sin embargo, en la trama que mantiene actualmente a Facebook contra la pared, 50 millones de perfiles de ciudadanos estadounidenses fueron extraídos de la red social por un tercero, el académico Aleksandr Kogan, quien trabajó en 2014 para la consultora. Kogan, mediante una app, que supuestamente predecía la personalidad de los usuarios, obtuvo los datos a través de los comunes tests rápidos, aparentemente inofensivos, que solemos contestar en la red social. Si usted es de los que responde cuestionarios como: ¿Qué Pokémon eres? o ¿A qué artista de Hollywood te pareces? usted se divirtió, pero sus ejecutores lo hicieron más al coleccionar sus datos. Los datos recogidos por Kogan fueron usados por Cambridge Analytica para dirigir campañas en favor de Trump, pero ¿la ciencia de datos puede manipular a los electores y hacer ganar a un candidato?

La pregunta es si mediante los datos de Facebook se pueden implementar campañas dirigidas que modifiquen el comportamiento humano. Hay poco consenso sobre la fiabilidad de los datos de redes sociales para proyectar resultados electorales como lo ha demostrado el investigador de la Universidad de Oviedo Daniel Gayo Avello en uno de los artículos científicos más citados por la investigación de estos temas. Twitter es la red más analizada en este sentido y el consenso es que no es una red representativa del electorado trátese de cualquier democracia. Además, podríamos catalogar a esta red como replicante, pues la opinión es detonada por pocos usuarios y se disemina con base en réplicas (retuits).

La psicología ha realizado experimentos como el de Michael Kosinski y su famoso test en el que mediante un algoritmo correlaciona datos de nuestro historial en redes sociales con tipos de personalidad y conductas. Es un experimento innovador que podría ser aplicado a algunos casos de manera exitosa pero no está exento de fallas. Según su algoritmo, yo soy un hombre joven; no soy ni lo uno ni lo otro.

En tanto, la sociología política desde los tiempos de la radio y la televisión señala que los públicos nos son hojas en blanco y que la decisión electoral depende de un sin fin de factores sociales y psicológicos como para atribuir a los medios o a los contenidos en Facebook un poder escalofriante. En lo que sí hay consenso es en el reforzamiento de creencias políticas: quienes simpatizaban con Trump habrán reforzado su afinidad preexistente gracias a la propaganda focalizada que llegó a sus muros.

Los fenómenos sociopolíticos son poco predecibles dice el investigador de la Universidad de California Martin Hilbert en coincidencia con otros investigadores como el profesor alemán Andreas Jungherr, pues aseguran que están sometidos a la contingencia y a una gran cantidad de variables poco controlables. Otro tema controversial es el de la validez y veracidad de los datos así como la forma como fueron recabados, tópico abordado por otros investigadores multicitados en la literatura especializada como Danah Boyd y Kate Crawford.

Estos límites no obstan para reconocer el valor de la ciencia de datos para acciones humanitarias, económicas y de salud pública, de las cuales hay evidencias exitosas, pero por ahora las conductas políticas parecen mucho más complejas de lo que se piensa, como para dar por hecho su efectividad.

No hay laboratorio universitario, organismo mundial ni industria que no invierta esfuerzos humanos y millonarias cifras para construir el conocimiento especializado que requiere la sociedad de este siglo, aunque por ahora nada ofrezca certezas absolutas de que los grandes datos nos conducirán a un mundo de decisiones precisas y, sobre todo, que beneficien a la humanidad. Lo realmente preocupante en este episodio tecnológico es el manejo poco escrupuloso de los datos en manos de Facebook. Basta ver sus pérdidas en la bolsa y la reacción de la Comisión Federal de Comercio de Estados Unidos que amenaza con tomar medidas para proteger a los datos de millones consumidores. Facebook deberá invertir en los próximos años sumas millonarias en inteligencia artificial, no solo para capitalizar la energía social como lo ha hecho hasta ahora, sino para proteger a sus usuarios del mal uso de su información; sobre todo deberá endurecer sus políticas de compartición de datos con terceros, además de colaborar con otras empresas y gobiernos para de manera colaborativa contribuir a frenar el problema.

Mientras tanto, la discusión tecnocientífica continúa y se concentra en obtener evidencias para poder afirmar que los datos ayudan a predecir fenómenos complejos, entre estos políticos, pero también ya empieza a enfocarse en las consecuencias humanas de la datificación en la que sobran anécdotas y falta mesura, responsabilidad y transparencia.