Elon Musk tiene los datos de Twitter, pero obtener respuestas sobre las cuentas de spam puede ser más difícil

Elon Musk dijo que su acuerdo para comprar Twitter no seguiría adelante a menos que pudiera ver los datos necesarios para evaluar las afirmaciones de la empresa sobre cuántos de sus usuarios son cuentas falsas. Foto: Dado Ruvic/ Reuters

El multimillonario tiene acceso a la cadena de tuits de la compañía, pero los especialistas en datos dicen que analizarla no es fácil. Musk ha dicho que el acuerdo para comprar Twitter no se llevaría a cabo a menos que pudiera ver esos antecedentes para evaluar las afirmaciones de la empresa sobre cuántos de sus usuarios son spam o cuentas falsas.


Elon Musk ha conseguido acceder a los datos de Twitter Inc. que dijo que eran necesarios para completar su adquisición de 44.000 millones de dólares, pero los científicos de datos y los especialistas dudan que el flujo proporcione las respuestas concluyentes que busca sobre el número de cuentas falsas en la plataforma.

Después de algunas idas y venidas legales entre las dos partes, Twitter proporcionó en las últimas semanas al empresario datos históricos de tuits y acceso a su llamada “manguera de incendios” de tuits, según fuentes relacionadas con el asunto. Esta cadena muestra la totalidad de los tuits -la gente publica cientos de millones de veces al día en la plataforma, según la compañía- casi en tiempo real.

El acceso de Musk a esos datos podría allanar el camino para completar la compra. Ha dicho que el acuerdo no se llevaría a cabo a menos que pudiera ver esos datos para evaluar las afirmaciones de la empresa sobre cuántos de sus usuarios son spam o cuentas falsas. Twitter lleva mucho tiempo estimando que el spam o las cuentas falsas representan menos del 5% de sus usuarios activos diarios monetizables, que recientemente ha cifrado en 229 millones. Musk, por su parte, ha señalado que cree que la cifra podría estar más cerca del 20%.

La naturaleza de los datos de la manguera de incendios -tanto su volumen como sus limitaciones- hace difícil el que Musk o cualquier otra persona pueda llegar a conclusiones claras en un corto período de tiempo que demuestren si las propias estimaciones de Twitter sobre las cuentas falsas y de spam son exactas o no, dicen los analistas de datos y los especialistas en redes sociales. Y cualquier estimación podría ser difícil de comparar con las que Twitter ha hecho públicas, porque la aplicación tiene un protocolo único para determinar dichas cuentas, explicaron.

La manguera de incendios de Twitter es “sólo una cadena pública de tuits” que contiene una cantidad tan grande de datos finitos que no es práctico analizarla para el spam, declaró Micah Schaffer, un consultor para las empresas de redes sociales en cuestiones de confianza y seguridad, que anteriormente trabajó en YouTube y Snap Inc.

Ponerlo a disposición de Musk es “más bien un tipo de cosa de callarse y marcharse, que una concesión importante”, aseguró Schaffer. Twitter ha guiado al accionista a través de su proceso para calcular los usuarios diarios monetizables, comentó una de las personas relacionadas con el asunto.

Musk dijo el mes pasado, semanas después de acordar la compra de Twitter, que la adquisición estaba “temporalmente en suspenso” debido a las preocupaciones sobre las cuentas falsas, lo que llevó a algunos observadores a especular que estaba tratando de renegociar o huir del acuerdo.

A principios de este mes el jefe de Tesla Inc. amenazó con poner fin al acuerdo si Twitter no le proporcionaba todos los datos que había solicitado. En respuesta, Twitter dijo que “seguirá compartiendo información de forma cooperativa con Musk”.

Los expertos en datos afirman que el análisis de la cadena de tuits requerirá recursos como la potencia de cálculo, la infraestructura y la experiencia. FOTO: JEFF CHIU/ ASSOCIATED PRESS

A su vez, las personas que han estudiado los datos de Twitter comentaron que digerirlos de manera oportuna es un reto, debido al volumen de antecedentes recibidos y la cantidad de recursos necesarios para analizarlos, es decir, la potencia de cálculo, la infraestructura y la experiencia. Alrededor de una docena de empresas han pagado por el acceso a la cadena de tuits a lo largo de los años, dijo una fuente relacionada con el tema.

“La empresa promedio se estaría ahogando en los datos”, declaró Rahul Telang, profesor de sistemas de información en el Heinz College de la Universidad Carnegie Mellon. Musk no ha dicho cómo llevará a cabo su análisis, aunque como la persona más rica del mundo, tiene los recursos para contratar suficientes analistas de datos para hacer el trabajo en el plazo de un mes, agregó.

Con la manguera de incendios de Twitter, Musk podría encontrar algunos casos de comportamiento que podrían apuntar a cuentas falsas o de spam, como cuando una cuenta publica más tuits de los que un humano podría publicar en un período corto, señaló Tamer Hassan, director ejecutivo de Human Security Inc., que se especializa en la prevención de ataques de bots y fraudes en línea. Pero estos hallazgos también podrían incluir tuits automatizados que difunden información útil o entretenida, añadió, como alertas meteorológicas o fotos de animales bonitos. También podría pasar desapercibido el comportamiento sofisticado de los bots, que se asemejan a los humanos, comentó.

Al mismo tiempo, la manguera de incendios de Twitter, o cadena de tuits, no incluye cierta información que podría ayudar a confirmar si las cuentas específicas son humanos individuales, como sus direcciones IP, números de teléfono y otros datos privados.

Si Musk presenta su propia estimación de cuentas de spam, es probable que no se pueda comparar con la propia estimación de Twitter.

La red social ha dicho que su número se basa en múltiples revisiones humanas de miles de cuentas muestreadas al azar, junto con los datos de los usuarios que no revela.

Musk “tendría que replicar su proceso de alguna manera, para cuestionar de forma creíble su comportamiento”, advirtió Schaffer, el consultor de redes sociales.

Las limitaciones de los datos de la manguera de incendios podrían afectar significativamente el cómo se calculan los porcentajes de usuarios. La cadena no proporciona datos sobre los usuarios que se conectan a la plataforma para leer tuits ajenos, lo que probablemente constituye una parte importante de los usuarios de la plataforma, sostuvo John Kelly, director general de la empresa de análisis de redes sociales Graphika Inc. Esto significa que no puede utilizarse para calcular el total con el que comparar cualquier número estimado de cuentas falsas.

“Es insuficiente para evaluar la proporción de usuarios diarios monetizables de las plataformas que no son humanos”, agregó Kelly.

Asimismo, Twitter y Musk también tendrían que ponerse de acuerdo sobre lo que constituye una cuenta falsa o de spam, dijo J. Nathan Matias, profesor adjunto de comunicación en la Universidad de Cornell que investiga las redes sociales y otras plataformas tecnológicas. No hay una definición universal de esos términos y las empresas no suelen compartir sus definiciones porque esa información podría utilizarse para eludir las protecciones, comentó.

“Si Musk y su equipo deciden que quieren encontrar resultados diferentes a los de Twitter, les será muy fácil hacerlo”, aseguró Matias. “Pero cualquier número de otros podría disputar las definiciones de Musk y sus equipos también, porque no hay un estándar”, añadió.

Debido a la cantidad de datos y las diversas formas en que se pueden cortar, una divergencia en las cifras de bots entre Musk y Twitter no sería inusual o sorprendente, señalaron los especialistas en datos, pero puede no ser suficiente para cambiar el curso del acuerdo o sus términos.

“Va a ser muy difícil conseguir el nivel de seguridad que permitiría a Musk establecer una posición defendible para tomar una acción diferente”, concluyó Carey O’Connor Kolaja, director ejecutivo de la empresa de verificación de identidad Au10Tix Ltd.

Comenta

Por favor, inicia sesión en La Tercera para acceder a los comentarios.