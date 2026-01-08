Los avances de la inteligencia artificial (IA) no solo están redefiniendo el mundo del trabajo y la investigación científica, sino que comienzan a tensionar uno de los pilares tradicionales del sistema educativo: las pruebas estandarizadas de acceso a la universidad.

Aunque la intención no es medir los exámenes de admisión, sino que los motores de IA, este ejercicio funciona como un doble experimento que deja en evidencia qué tan avanzadas están ante las preguntas que año a año permite el ingreso de miles de jóvenes a la educación superior.

Un estudio técnico fue realizado por el Ph.D. in Computer Science y profesor de la U. de Valparaíso, Jonathan Vásquez, y por el MBA de la U. de Harvard y profesor de la Escuela de Negocios de la U. Adolfo Ibáñez, Sebastián Cisterna. Los investigadores aplicaron las pruebas oficiales de la PAES 2026 a distintos modelos de IA y el ejercicio permitió simular a qué carreras habría podido acceder cada sistema.

Imagen: Reuters. Dado Ruvic

Según dicen los responsables de este ejercicio, ChatGPT ya no corre solo: Gemini la superó y el modelo chino de código abierto, DeepSeek, irrumpió al demostrar que puede competir con una fracción muy reducida del costo de sus competidores.

Google se consolidó con el mejor desempeño global, al promediar cerca de 950 puntos entre sus modelos Gemini 3 Flash y Pro. El modelo más destacado fue Gemini 3 Flash, que alcanzó puntaje máximo (1.000 puntos) en cinco pruebas: Historia y Ciencias Sociales, Biología, Física, Competencia Lectora y Competencia Matemática 1. Además, obtuvo un promedio general de 957,38 puntos, superando incluso a su versión Pro.

Aunque la diferencia entre ambos no es estadísticamente significativa, el resultado muestra que los modelos más ligeros y optimizados están alcanzando un nivel de madurez inesperado.

En contraste, todos los modelos alcanzaron un 100% de precisión en Historia y Ciencias Sociales, un logro que en 2025 parecía excepcional y que hoy se ha transformado en estándar. De haberse tratado de postulantes reales, Gemini 3 Flash y Pro habrían podido ingresar a cualquier carrera de cualquier universidad del país, marcando un hito inédito en este tipo de evaluaciones.

ChatGPT. Imagen de referencia.

Un escalón más abajo aparece Gemini 3 Pro, también de Google, que si bien no alcanza el rendimiento máximo de su versión Flash, registra puntajes suficientemente altos para acceder a la mayoría de las carreras de alta exigencia académica. Según la simulación, este modelo habría tenido opciones reales en Ingeniería Civil, Bioingeniería, Química y Farmacia, Enfermería y Derecho, aunque podría quedar más justo en carreras con cortes extremos como Medicina en las universidades más competitivas.

En el caso de GPT-5.2 Extended Reasoning, el modelo avanzado de OpenAI enfocado en razonamiento profundo, los resultados lo posicionan en un rango alto, pero algo más irregular. Su desempeño sólido en Lenguaje, Ciencias e Historia le habría permitido acceder sin dificultad a carreras como Periodismo, Psicología, Sociología, Ciencia Política y Pedagogías, además de ingenierías y licenciaturas científicas en universidades con puntajes de corte medio-alto. Sin embargo, su rendimiento más bajo en Matemática M2 lo dejaría en desventaja frente a Gemini en áreas de ingeniería o ciencias exactas de mayor complejidad.

Por su parte, GPT-5.2 Instant, diseñado para respuestas rápidas, muestra un perfil más equilibrado pero menos sobresaliente. De acuerdo con la simulación, este modelo habría quedado bien posicionado para carreras de ciencias sociales, educación, administración, trabajo social y algunas ingenierías de menor exigencia matemática, sin alcanzar, eso sí, los puntajes necesarios para las carreras más selectivas del sistema.

A su vez, compararon dos tipos de modo de estas IA generativas: una que funciona a menos velocidad, procesamiento y con menos recursos; versus otra versión que “razona más”. La expectativa, comenta Cisterna, es que siempre tenga mejores resultados el modelo que razona más. Pero en este caso no fue así.

El avance de DeepSeek

El modelo chino se posicionó como el gran ganador en términos de costos, al ofrecer un desempeño altamente competitivo a una fracción del precio de sus principales competidores. En sus versiones rápidas, resulta hasta 14 veces más barato que GPT-5.2, mientras que en sus versiones orientadas al razonamiento el ahorro alcanza un factor de 30.

Pese a eso, DeepSeek todavía presenta una brecha académica frente a sus competidores occidentales. Aun así, su puntaje promedio —en torno a los 880 puntos— le permitiría ingresar a un amplio abanico de programas universitarios, como Pedagogía, Enfermería, Kinesiología, Administración Pública, Geografía y carreras técnicas universitarias, aunque quedaría fuera de las opciones con mayores barreras de entrada, como Medicina o Ingeniería Civil en las universidades más demandadas.

Foto: Reuters

Más allá de la anécdota, los responsables de este estudio dicen que esto plantea interrogantes de fondo sobre la naturaleza de las pruebas de selección y su capacidad para medir habilidades exclusivamente humanas. Estas simulaciones no implican que las IAs “estudien” o “aprendan” como una persona, dicen, sino que optimizan respuestas a partir de enormes volúmenes de datos previos. Aun así, el hecho de que varios modelos superen sin dificultad los puntajes de corte universitarios introduce un nuevo elemento en el debate sobre evaluación, mérito y formación académica en la era de la automatización.

La pregunta ya no es solo qué carrera habría podido estudiar una inteligencia artificial, sino qué tan bien las actuales métricas de selección reflejan las competencias que se esperan de los futuros profesionales humanos en un escenario donde la IA será, cada vez más, un actor permanente.