La startup de 9 meses que desafía a los gigantes de Silicon Valley

Microsoft anuncia su asociación con la empresa parisina Mistral, dirigida por Arthur Mensch, de 31 años.

Por

Sam Schechner de The Wall Street Journal

27 FEBRERO 2024

Arthur Mensch fundó su empresa de inteligencia artificial hace menos de un año. Foto: EDOUARD JACQUINET/ THE WALL STREET JOURNAL.

Twitter Facebook Whatsapp LinkedIn Email

PARÍS- El año pasado por estas fechas, Arthur Mensch tenía 30 años, aún trabajaba en una unidad de Google aquí, y la inteligencia artificial (IA) acababa de empezar a despegar en la conciencia pública como algo más que ciencia ficción.

Desde entonces, la llamada IA generativa, capaz de conversar -y posiblemente razonar- como los humanos, se ha convertido en el avance tecnológico más sonado de las últimas décadas. Y la empresa por la cual Mensch abandonó Google para fundar, que tiene ahora nueve meses de vida, está valorada en algo más de US$ 2.000 millones.

La velocidad del cambio refleja el frenesí -y el miedo- que rodea los esfuerzos por construir y comercializar sistemas avanzados de IA.

La startup de Mensch, llamada Mistral AI, desafía la idea convencional de que los ganadores de la carrera de la IA saldrán de entre los gigantes estadounidenses de la industria tecnológica. Mensch, que fundó la empresa con dos amigos de la escuela de ingeniería, no cree que sea esencial una escala enorme, ni que Estados Unidos vaya a dominar necesariamente.

“Siempre he lamentado que no hubiera Big Tech en Europa”, aseguró Mensch, de 31 años, en la oficina de Mistral AI en París. “Creo que esta es nuestra oportunidad de convertirnos en una”.

La empresa de Mensch, que ha recaudado algo más de US$ 500 millones de inversores como Andreessen Horowitz, sigue siendo diminuta en comparación con los Goliat del sector. OpenAI, respaldada por Microsoft y Google, está invirtiendo miles de millones de dólares en el entrenamiento de los últimos sistemas de IA, aprovechando su acceso a los chips informáticos especializados necesarios para construir dichos sistemas y los abultados balances necesarios para pagar la electricidad que consumen esos chips.

Mistral, que toma su nombre de un fuerte viento que sopla en Francia, se basa en parte en la idea de que gran parte de ese dinero se está malgastando.

Mensch, que empezó en el mundo académico, ha dedicado gran parte de su vida a averiguar cómo hacer más eficientes la IA y los sistemas de aprendizaje automático. A principios del año pasado, unió fuerzas con los cofundadores Timothée Lacroix, de 32 años, y Guillaume Lample, de 33, que entonces trabajaban en el laboratorio de inteligencia artificial de Meta Platforms en París.

Juntos, apuestan por que su pequeño equipo pueda superar a los titanes de Silicon Valley encontrando formas más eficientes de construir y desplegar sistemas de IA. Y quieren hacerlo, en parte, regalando muchos de sus sistemas de IA como software de código abierto.

“Queremos ser la empresa más rentable del mundo de la inteligencia artificial”, afirmó Mensch. “Esa es nuestra razón de ser”, agregó.

El lunes, Mistral presentó un nuevo modelo de IA, llamado Mistral Large, que, según Mensch, puede realizar algunas tareas de razonamiento de forma comparable a GPT-4, el modelo de lenguaje más avanzado de OpenAI hasta la fecha, y Gemini Ultra, el nuevo modelo de Google.

Mensch aseguró que el entrenamiento de su nuevo modelo costó menos de 20 millones de euros, el equivalente a unos US$ 22 millones. En cambio, el director ejecutivo de OpenAI, Sam Altman, declaró el año pasado, tras el lanzamiento de GPT-4, que entrenar a los modelos más grandes de su empresa costaba “mucho más”, entre US$50 millones y US$ 100 millones.

El sector está tomando nota. Mistral ha despertado el interés de clientes corporativos e inversores, entre ellos Microsoft, que el mismo lunes anunció la incorporación del nuevo modelo de Mistral como opción para desarrolladores en su servicio en la nube Azure. Como parte del acuerdo plurianual, Microsoft tomará una pequeña participación en la empresa.

Mistral también se ha asociado y ha vendido pequeñas participaciones a otras empresas, como la compañía de software empresarial Salesforce y Nvidia, fabricante de las unidades de procesamiento gráfico (GPU) más potentes utilizadas para crear sistemas de IA como los de Mistral.

Según Brian Bondy, cofundador y director de tecnología de Brave Software, la empresa utiliza por defecto un modelo gratuito de código abierto de Mistral para impulsar su chatbot de navegador web. La empresa considera que la calidad es comparable a la de los modelos patentados, y el enfoque de código abierto de Mistral también permite a Brave controlar el modelo localmente.

Eric Boyd, vicepresidente corporativo de la plataforma de IA de Microsoft, sostuvo que Mistral supone una interesante prueba de hasta dónde puede llevar la ingeniería inteligente a los sistemas de IA. “¿Adónde más se puede llegar?”, preguntó. “Eso está por ver”, señaló.

Alto, con un espeso nido de pelo oscuro, Mensch no parece ni actúa como un director ejecutivo friki de la tecnología. Sus amigos y colegas dicen de él que no tarda en bromear con una cerveza. También atleta, terminó el maratón de París en menos de 3½ horas meses antes de concluir su tesis doctoral en 2018.

Mensch lleva mucho tiempo a caballo entre la actividad académica y la empresarial. Creció en los suburbios al oeste de París, hijo de una madre profesora de física y un padre con un pequeño negocio de tecnología.

El futuro CEO asistió a algunas de las mejores escuelas de matemáticas y aprendizaje automático de Francia. Sus asesores describieron a un estudiante que se lanzaba con entusiasmo a los proyectos y los dominaba aunque tuviera poca experiencia.

“Me gustan las nuevas experiencias”, dijo Mensch. “Me aburro muy rápido”, añadió.

Una de las líneas maestras ha sido intentar hacer las cosas más eficientes. En su doctorado, Mensch trabajó en el desarrollo de un programa informático para analizar imágenes cerebrales tridimensionales a partir de un sistema de resonancia magnética funcional, de modo que pudiera procesar millones de imágenes y cartografiar las redes cerebrales responsables de cosas como las matemáticas y los rostros.

A finales de 2020, Mensch se incorporó a la unidad de IA de Google, entonces llamada DeepMind, donde trabajó en el equipo que creaba los llamados grandes modelos lingüísticos, el tipo de sistema de IA que más tarde impulsaría ChatGPT. En 2022, fue uno de los principales autores de un artículo sobre un nuevo modelo de IA llamado Chinchilla, que cambió la comprensión del campo de la relación entre el tamaño de un modelo de IA, la cantidad de datos que se utilizan para construirlo y lo bien que funciona, conocidas como leyes de escalado de IA.

“Quién mejor que una de las personas que ayudó a definir las leyes de escalado para desafiar la comprensión del mundo”, dijo Sarah Guo, una de las primeras inversoras en Mistral a través de su empresa de capital de riesgo, Conviction.

A medida que la carrera por la IA se intensificaba en 2022, Mensch se mostró decepcionado por el hecho de que los grandes laboratorios privados de IA empezaran a publicar menos artículos sobre grandes modelos lingüísticos y a compartir menos información con la comunidad investigadora en general. Una vez que se lanzó ChatGPT, hubo una carrera dentro de Google para igualarlo. Mensch dice que pasó de trabajar en un equipo de 10 personas a 30, y luego a 70.

“Creo que me fui justo antes de que se volviera demasiado burocrático para mí”, indicó Mensch. “No quería construir tecnología opaca desde dentro de las grandes tecnológicas”, manifestó.

El documento de presentación inicial de Mistral a los inversores la pasada primavera denunciaba la formación de un “oligopolio” liderado por empresas estadounidenses que vendían modelos patentados.

Desde el principio, Mensch ejerció presión sobre los responsables políticos franceses, incluido el presidente Emmanuel Macron, en contra de ciertos elementos de la nueva Ley de Inteligencia Artificial de la Unión Europea, que Mensch advirtió podría frenar a las empresas y, en su opinión, no haría nada para que la IA fuera más segura. Tras los cambios introducidos en el texto en Bruselas, será una carga manejable para Mistral, sostuvo Mensch, aunque piensa que la ley debería haberse mantenido centrada en cómo se utiliza la IA, en lugar de regular también la tecnología subyacente.

Para Mensch y sus cofundadores, publicar sus sistemas iniciales de IA como código abierto que cualquiera pudiera utilizar o adaptar gratuitamente era un principio importante. También era una forma de llamar la atención de desarrolladores y clientes potenciales deseosos de tener más control sobre la IA que utilizan. Los modelos más avanzados de Mistral, incluido el presentado el lunes, no son de código abierto.

“Obviamente, es un delicado equilibrio entre crear un modelo de negocio y mantener nuestros valores de código abierto”, aseguró Mensch. “Queremos inventar cosas nuevas, arquitecturas nuevas, y aun así queremos tener algo que vender de más a nuestros clientes”.