Esta columna, además, fue escrita por Cristián Dagnino, economista.

Probablemente más de alguno ha leído acerca de las posibilidades y virtudes del Big Data y Machine Learning (ML) sin entender exactamente de qué se tratan. Básicamente son algoritmos desarrollados en los últimos años para trabajar con enormes bases de datos y que se han aplicado con éxito en el mundo empresarial para fines tan diversos como conocer las preferencias de consumidores habituales, estimar el efecto de promociones o mejorar el control de gestión al encontrar fallas sistemáticas en operaciones, entre otros. Asimismo, en el ámbito de las políticas públicas estos algoritmos se usan, por ejemplo, para focalizar políticas sociales, predecir niveles  de contaminación y tomar medidas preventivas o estimar la demanda de servicios de salud para así contar con el personal adecuado.

El ML tiene como objetivo principal mejorar la predicción de variables a través de métodos estadísticos complejos. Imaginemos que quiero saber cómo responderán los votantes a la visita de un candidato. Primero, se usan los datos de elecciones pasadas para estimar un modelo. Con ese modelo se predicen las posibles reacciones de los votantes: ¿Aumentará el número de votantes?,  ¿Cuáles son las características de estos potenciales votantes?, ¿Qué candidato será el beneficiario de esos votos en un determinado sector?

El ML se la juega 100% en acertar a esas predicciones y sus aplicaciones se reconocen como éxitos o fracasos dependiendo casi exclusivamente de la exactitud de dichas predicciones. Es, por lo tanto, una herramienta que tiene un objetivo limitado, pero, por lo mismo, puede resultar muy poderosa.

Esto último da cuenta de un enorme desafío que hoy enfrentamos economistas y gente interesada en políticas públicas: encontrar puntos de encuentro entre ML y la ciencia económica. Nos parece que los diferentes objetivos de la economía y el ML hacen que tengan distintas fortalezas y, por eso, hay muchas oportunidades para complementarse.

La economía, como toda ciencia social, tiene objetivos más complejos y difíciles de definir que el ML. Podemos decir que intenta entender algunos aspectos del comportamiento humano y de los mercados con la mayor generalidad posible. Es frecuente hacer un análisis empírico de una industria específica y durante un período de tiempo acotado, pero siempre intentando ilustrar o entender un principio más universal. La economía no está preocupada de la predicción, sino de la explicación. Por eso es tan habitual entre economistas el cliché de diferenciar la causalidad de la simple correlación.

¿Importa la capacidad predictiva en economía? Sí y no. Los modelos y el análisis empírico son juzgados por otros criterios. Por ejemplo, muchos ejercicios –como las estimaciones de demanda- tratan de encontrar el efecto causal entre una variable y otra, aunque eso implique reducir la capacidad de ajuste (o de predicción) del modelo. Sin embargo, un análisis más certero en sus predicciones resultará más creíble, ya que es un signo de que el análisis ha logrado capturar aspectos relevantes de la realidad.

¿Cuál es el aporte de la economía al ML? Nos parece que el ML puede transformarse a veces en una caja negra difícil de interpretar. Si lo importante es lograr la mejor predicción -e iluminar o entender el comportamiento subyacente se vuelve secundario-, el resultado puede ser difícil de comunicar a la gente que toma decisiones. Nuestra experiencia conversando con gente que toma decisiones es que en muchas empresas el análisis de datos y la elección de estrategias están disociadas; los modelos y algoritmos entregan predicciones y sugerencias puntuales, pero no entregan intuición a la gente a cargo de diseñar y ejecutar estrategias de largo plazo. La economía en estos casos puede interpretar los problemas con la teoría económica y volver más comunicables los supuestos y modelos usados por el ML.

Por otro lado, el ML puede entregar poder predictivo y mejorar la toma de decisiones que ahora se hacen sólo intuitivamente, como puede ser la elección de modelos. Actualmente se están haciendo esfuerzos interesantes en aplicar técnicas de ML a la evaluación de impacto de programas o intervenciones (por ejemplo, Susan Athey lo sugiere para construir contrafactuales). También ha sido usado para ayudar a elegir modelos para estimar la demanda de productos, un ejercicio empírico que tiene mucha tradición en economía. Queda mucho por hacer en la búsqueda de temas y formas en las que economía y ML pueden colaborar. Seguramente será un tema relevante -tanto en la academia como en la práctica- durante los próximos años, del que vale la pena estar atentos.