Big Data: ¿Es posible confiar en Twitter para saber cómo pensamos los chilenos?

bdbd

Expertos detallan las limitaciones de realizar un estudio en base a una red social "manipulable", y explican las fallas de metodología del informe del Gobierno.


"Hay mucha influencia extranjera que incentiva la violencia". Con estas palabras, la Ministra de la Segegob Karla Rubilar defendió el polémico informe de Big Data del Gobierno relacionado al estallido social del 18 de octubre. El mismo donde se afirma, a partir de la actividad en Twitter, que la violencia en las manifestaciones es generada desde el extranjero.

El informe de 112 páginas -que aún no se conoce abiertamente-, se basa en cinco millones de autores únicos que han generado 60 millones de comentarios, siendo en su mayoría jóvenes que cuestionan al Gobierno por las violaciones a los Derechos Humanos, critican la cobertura de los medios y además son "aficionados al K-Pop".

Pero, ¿Qué es el Big Data? ¿Es posible generar estas conclusiones sólo por publicaciones en Twitter?

"En términos generales, Big Data se refiere a grandes volúmenes de datos administrativos o creados con otros fines para hacer análisis, como datos de posicionamiento global, operaciones en los inventarios de una empresa, transacciones de clientes y otros. Básicamente es una palabra amplia que se usa para indicar todos estos datos operacionales que se usan para fines analíticos, aunque su uso primordial sea operacional", explica César Hidalgo, académico de la Universidad de Harvard y ex MIT.

"Este informe lo que hace es muy común: separar los temas en 'burbujas', y lo que uno puede hacer con estas redes de comunicación es aislar cada uno de estos grupos, identificarlos y tratar de encontrar cosas comunes con características, demografía y si tuitean sobre un tema específico. Eso permite segmentarlos de forma similar a la segmentación de mercado", señala.

Hidalgo indica que hoy este análisis se hace a mucho mayor escala, ya que ayuda a inferir características o grupos que quizá no estaban considerados, y sirve para encontrar subgrupos donde enfocar la atención.

Quizá para entenderlo mejor, podemos retroceder al Chile de años 70, cuando se realizó la primera prueba de un Big Data en el país.

Big Data a la chilena

Octubre de 1972. Un paro de 50 mil camioneros buscaba frenar algunas reformas gubernamentales que pensaban, dañaría la alicaída productividad del país. Sin embargo, para la administración del presidente Salvador Allende sólo se trataba de un intento más por desestabilizar a su gobierno.

Dentro de la crisis, surgió una oportunidad: Con los pocos camioneros "leales" al Gobierno, se generó la idea de probar un proyecto cibernético revolucionario, que tuvo como objetivo centralizar el funcionamiento de la economía, tal como una "internet" incipiente que analizaba los datos a gran escala en una red de comunicaciones entre empresas y el gobierno.

Así nació el programa Synco o Cybersyn, un sistema precario pero entusiasta que utilizó una red de teletipos instalados en las empresas estatales a lo largo del país, conectados a una computadora central que procesa la información para coordinarla y ayudar a crear planes para mejorar la producción, tal como el "Big Data" que conocemos hoy, 47 años después.

Con cerca de un año de construcción, la oficina central se ubicó en el Palacio de La Moneda. Una gigantesca computadora IBM 360 adornaba el diseño futurista en una sala hexagonal llamada "Opsroom", que contaba con varias pantallas configurables y sillas con controles interactivos para su control. Algo no visto hasta ese entonces.

Entre octubre y noviembre de ese año, la "red" tuvo su prueba en aquél paro de camioneros. A través de Synco, el gobierno coordinó, orientó y optimizó la producción en torno a los pocos camiones disponibles.

El proyecto, funcional y listo para su puesta en marcha, tuvo un abrupto final el 11 de septiembre de 1973. El centro de control fue destruido, la idea nunca se aplicó y quedó en el olvido, abortando uno de los proyectos más avanzados de la época a nivel mundial. La historia posterior lo llamaría "la Internet de Allende", y de ella salieron libros y hasta la idea para una película que nunca se realizó.

Como un dato que refleja la trascendencia del proyecto, recién tres años después se realizaría la primera conexión entre los computadores de Stanford y UCLA, marcando el nacimiento de ARPANET. Lo mismo que hoy conocemos como Internet.

https://www.latercera.com/la-tercera-domingo/noticia/big-data-del-gobierno-los-detalles-del-informe-estallido-social-entrego-la-fiscalia/947967/

"Poco serio"

Según las estadísticas, a mediados de 2019 existían 139 millones de usuarios activos de Twitter a nivel mundial, con un 5% de las cuentas identificadas como bots, spam o perfiles falsos. Y aunque el número aún es pequeño en Chile y más en relación a los 1.600 millones de usuarios de Facebook, las posibilidades que entrega la plataforma a nivel de herramientas de análisis de usuarios, sigue siendo importante.

Sin embargo, expertos señalan que a nivel de Big Data, esta información es sólo eso. Información. Y considerando eso, muchos señalan sus dudas con la posibilidad de generar un informe tan concluyente como el presentado por el Gobierno a la Fiscalía, donde se habla de la influencia extranjera en el movimiento social.

"Uno no puede sólo tomar la información de las redes sociales para decir que hay influencia extranjera, debido a que es muy fácil manipular esta información", afirma Bárbara Poblete, Doctora en Computación y experta en análisis de redes sociales.

"He visto varios intentos de hacer pensar que existe influencia extranjera. No lo puedo descartar a futuro, pero no lo hemos podido corroborar en nuestros datos. Es muy fácil falsear la información que aparece en Twitter", añade Poblete, quien también es profesora de la Universidad de Chile e investigadora del Instituto Milenio en Fundamentos de los Datos (IMFD).

La experta admite que llamó su atención que, en lo que se conoce del informe, se mencionaran ubicaciones específicas de los usuarios de la red social. "Para saber la ubicación de alguien en Twitter debes haber autorizado que se comparta, y si no se autoriza no apareces. Normalmente es muy poca la gente que da permisos para ello, por lo mismo me llama la atención que exista gente que esté declarando su ubicación tan abiertamente".

"No sé qué tan concluyente ha sido el gobierno", precisa César Hidalgo. ""No se pueden usar datos de Twitter para hacer diferencias sobre la población, pero sí se pueden usar diferencias sobre Twitter usando datos de la misma red social", agrega.

"Es una plataforma con gente de importancia; por un lado no se pueden hacer conclusiones sobre la población, pero sí es un subconjunto que igualmente es de interés. En Chile tiene un millón de usuarios políticamente activos, empoderados digitalmente, y se pueden sacar conclusiones sobre quiénes participan en Twitter, los grupos existentes y cómo están conectados entre ellos", sostiene.

Bárbara Poblete señala que en general en las manipulaciones extranjeras -por ejemplo EE.UU.- se opera de forma totalmente contraria, y la idea en ese caso es declarar la ubicación en el país que se está queriendo influir.

"Todos los 'trolls' rusos publicaban su ubicación en EE.UU. y se preocupaban de tuitear o publicar en Facebook a las horas en que la gente en ese país estaba despierta. Trabajaban en otro horario y usaban el lenguaje estadounidense tratando de parecer lo menos extranjeros posible", afirma.

"Las cuentas extranjeras que vimos eran medios de comunicación, o figuras políticas que comentan como lo hace cualquier persona. En base a eso, declarar que existe influencia extranjera me parece poco serio", concluye.

Sensores sociales

"Twitter es válido dependiendo para qué se quiera usar", asegura Bárbara Poblete. "Si es un informe de inteligencia, se recolecta de muchas fuentes abiertas, aparte de la misma red social, como estudios, periódicos, foros de opinión, etc. pero no se llama 'inteligencia' hasta que alguien no verifica que estas cosas se traduzcan en el mundo físico. Mientras tanto es sólo información".

"Acá no hay que tener un título para analizar redes sociales. Cualquier persona lo puede hacer", asevera.

Además, la experta admite su temor por la forma en que se toma una red social como Twitter: "Me preocupa que esto pueda ser tratado como una fuente absoluta de información. Extraer tendencias no significa que sea cierto en el mundo real, porque a través de las redes sociales se puede inventar lo que uno quiera; poder manipular las elecciones de un país, o también podría hacer creer que se están manipulando las elecciones de un país. Hay que ser muy cuidadoso", comenta.

Ariel Jeria, Gerente General de la agencia Rompecabeza Digital, señala que "si bien se pueden extraer una gran cantidad de datos que podrían ser interesantes desde Twitter, hay que considerar que es una plataforma que no cuenta con las características ni rigurosidad que entrega el Big Data. Hay presencia de bots, posiciones políticas muy polarizadas y un público muy determinado, por lo que sirve para tener un margen de referencia, pero no se podría tomar como un referente determinante para extraer conclusiones por parte de un Gobierno".

"Ahora bien, respecto a otras redes sociales, sí puede tener algo más de importancia porque Twitter destaca por ser un lugar donde la gente va a opinar con más conocimiento de causa en relación a Facebook o Instagram, pero en contra tiene que no está tan presente en un público menor a 25 años y tampoco está dentro de las tres redes sociales en Chile y el mundo con mayor penetración y uso", añade.

De acuerdo a Poblete, en Twitter vemos un segmento muy específico de la población, ya que los jóvenes no están en esa red social, y los usuarios son en general periodistas, sociólogos y de un nivel educacional alto. Incluso, puede que este mismo perfil de personas esté manifestando su opinión en otra red social. "Creo que existe una idea que analizar las redes sociales es una panacea", sentencia.

"Cuando hablamos de redes sociales en Chile hablamos de Twitter porque los datos son de acceso fácil. Estudiamos Twitter no porque creamos que es la mejor red social, sino porque los datos son abiertos", cuenta.

El estallido

Bárbara Poblete también entrega detalles sobre la petición del Gobierno sobre la posibilidad de encontrar incentivos a la movilización desde el extranjero, afirmando que más que hacer un estudio, buscaban confirmar una tesis.

"Si te están pidiendo una confirmación nos crea un problema, porque estás induciendo al sesgo de confirmación. Yo puedo confirmar prácticamente cualquier cosa que yo quiera, y encontrar evidencias lo que quiera; es información muy manipulable", explica.

"Nosotros habíamos estudiado datos del estallido social porque nos dedicamos a las crisis y los desastres naturales, pero no habíamos podido encontrar algo que se asemejara a lo que ellos insinuaban que querían encontrar. Les dijimos que este tipo de análisis no sirve para lo que nos pedían, y que nos parecía peligroso que se utilizara para ello", agrega.

"Ellos (el Gobierno) lo iban a encontrar; y sino, iba a existir alguien que lo quisiera vender. Hay muchas personas que lo pueden hacer. Y así ocurrió", cuenta.

"Nosotros como Instituto Milenio tenemos el mandato de colaborar con el Gobierno y siempre hemos tenido esa disposición, pero con ese tipo de colaboración aconsejamos no hacerlo. Si hubiese sido útil, probablemente se habría hecho", añade.

En cuanto a la posibilidad de prever el estallido, Poblete es enfática: "No. Si bien se podía apreciar un descontento, las redes sociales son incendiarias y las opiniones muy polarizadas. Es difícil saber cuándo esta polarización se va a traducir al mundo real".

"Fue súper imprevisto", concluye.

Comenta

Por favor, inicia sesión en La Tercera para acceder a los comentarios.