Por qué OpenAI revirtió su actualización de GPT-4o (y por qué afirmaron que era excesivamente “aduladora”)

Desde la firma dedicada a la inteligencia artificial generativa optaron por revertir una reciente actualización y detallaron una serie de medidas que están tomando para mejorar y ampliar sus sistemas.

Por

30 ABRIL 2025

Por qué OpenAI revirtió su actualización de GPT-4o (y por qué afirmaron que era excesivamente “aduladora”). Foto: referencial.

Twitter Facebook Whatsapp LinkedIn Email

El martes 29 de abril, OpenAI informó que decidió revertir una actualización de GPT-4o que recientemente implementó ChatGPT.

La firma de inteligencia artificial (IA) publicó un comunicado en el que detalló que “ahora se usa una versión anterior con un comportamiento más equilibrado”.

“La actualización que eliminamos era excesivamente halagadora o agradable, a menudo descrita como aduladora”, explicaron en una entrada de su blog oficial.

Y agregaron: “Estamos probando activamente nuevas soluciones para abordar este problema”.

“Estamos revisando cómo recopilamos e incorporamos los comentarios para priorizar la satisfacción del usuario a largo plazo e introduciendo más funciones de personalización, brindando a los usuarios un mayor control sobre el comportamiento de ChatGPT”.

Por qué OpenAI decidió revertir su actualización de GPT-4o

Desde la compañía liderada por Sam Altman informaron que la actualización que se implementó la semana pasada en GPT-4o contó con distintos ajustes para mejorar la personalidad predeterminada del modelo, para que así sea más intuitivo y eficiente en distintas tareas.

“Al configurar el comportamiento del modelo, partimos de los principios básicos y las instrucciones descritas en nuestra Especificación del Modelo. También enseñamos a nuestros modelos cómo aplicar estos principios incorporando señales de usuario, como comentarios positivos o negativos, en las respuestas de ChatGPT”.

Sin embargo, explicaron, en la actualización se centraron “demasiado en los comentarios a corto plazo” y no consideraron completamente cómo evolucionan las interacciones de los usuarios con ChatGPT con el paso del tiempo.

El resultado fue que GPT‑4o “se inclinó hacia respuestas demasiado comprensivas, pero poco sinceras”.

Enfatizaron que se trata de un aspecto relevante, ya que “la personalidad predeterminada de ChatGPT afecta profundamente la forma en que lo experimentas y confías en él”.

“Las interacciones aduladoras pueden ser incómodas, inquietantes y causar angustia. No logramos la meta y estamos trabajando para mejorarla”, reconocieron desde la compañía dedicada a la IA generativa.

Respecto a cómo están abordando la situación, precisaron que además de revertir la actualización están tomando una serie de medidas, con el objetivo de “realinear el comportamiento del modelo”.

Aseguraron que están “refinando las técnicas de entrenamiento principales y las indicaciones del sistema para evitar explícitamente la adulación”.

También están “construyendo más barreras para aumentar la honestidad y la transparencia: principios de nuestra Especificación del Modelo”.

“(Estamos) ampliando las formas para que más usuarios prueben y brinden retroalimentación directa antes de la implementación”.

“Continuando ampliando nuestras evaluaciones, basándonos en la Especificación del Modelo y nuestra investigación continua, para ayudar a identificar problemas más allá de la adulación en el futuro”.

De la misma manera, manifestaron: “Creemos que los usuarios deberían tener más control sobre el comportamiento de ChatGPT y, siempre que sea seguro y factible, realizar ajustes si no están de acuerdo con el comportamiento predeterminado”.

“Hoy en día, los usuarios pueden dar instrucciones específicas al modelo para configurar su comportamiento con funciones como instrucciones personalizadas. También estamos desarrollando nuevas y más sencillas maneras para que los usuarios lo hagan. Por ejemplo, podrán dar retroalimentación en tiempo real para influir directamente en sus interacciones y elegir entre múltiples personalidades predeterminadas”, prometieron.

Junto con ello, afirmaron que están buscando nuevas maneras de incorporar “una retroalimentación más amplia y democrática en los comportamientos predeterminados de ChatGPT”.

“Esperamos que sus comentarios nos ayuden a reflejar mejor los diversos valores culturales de todo el mundo y a comprender cómo desean que ChatGPT evolucione, no solo interacción a interacción, sino con el tiempo”.