Las empresas de código abierto comparten su IA de forma gratuita. ¿Podrán acabar con el dominio de OpenAI?

Mistral AI, Hugging Face y otras apuestan por plantar cara a OpenAI y a las grandes empresas tecnológicas haciendo que su tecnología sea de código abierto, pero esto podría conllevar más riesgos que recompensas. OpenAI representaba casi el 80% del mercado mundial de IA generativa en 2023, según una estimación de la empresa de estudios de mercado Valuates Reports.

Por

Belle Lin de The Wall Street Journal

22 MARZO 2024

THOMAS R. LECHLEITER/THE WALL STREET JOURNAL

Twitter Facebook Whatsapp LinkedIn Email

A medida que el mercado de modelos de inteligencia artificial (IA) se consolida en torno a Microsoft, OpenAI y un puñado de otros sistemas y actores propietarios, algunas empresas se proponen competir ofreciendo gratuitamente sus modelos de IA.

El enfoque de código abierto, consistente en distribuir libremente tecnología para que el público la utilice, comparta y modifique, ayudó a crear la Internet moderna, la computación en nube y las empresas multimillonarias. No hay garantías de que vaya a funcionar con los modelos lingüísticos de código abierto, pero algunos de los principales actores de la tecnología apuestan por que les ayude a reducir el dominio de OpenAI.

OpenAI representaba casi el 80% del mercado mundial de IA generativa en 2023, según una estimación de la empresa de estudios de mercado Valuates Reports.

Elon Musk anunció la semana pasada que su startup xAI abrirá su chatbot Grok, que no ha despertado tanto interés como ChatGPT de OpenAI o Claude de Anthropic. Meta Platforms lanzó el año pasado su modelo de código abierto Llama 2, intensificando la competencia entre modelos privados y de código abierto. Google lanzó en febrero sus modelos de código abierto Gemma, aunque también vende el acceso a sus ofertas Gemini, más potentes.

Muchas startups de IA también apuestan por el código abierto, y algunas de las mejor financiadas son Mistral AI, Hugging Face, Runway ML, Together AI, Writer, Cerebras y Databricks.

Los modelos de IA de código abierto atraen a las empresas porque ofrecen la posibilidad de utilizar grandes modelos lingüísticos sin tener que pagar ni compartir datos con un proveedor como Microsoft. Y como se comparten para su disección pública, los modelos de código abierto suelen incluir su funcionamiento interno, que las empresas pueden utilizar para construir sus propios modelos.

Pero las empresas de IA se enfrentan a una serie de retos: los costos iniciales necesarios para entrenar sus modelos, que pueden ascender a cientos de millones de dólares, la concesión de licencias de sus tecnologías y el mantenimiento de la lealtad de los desarrolladores independientes que impulsaron sus tecnologías a la popularidad.

Una vuelta al modelo freemium del código abierto

Las empresas de software de código abierto han ganado dinero tradicionalmente cobrando por servicios que facilitan el uso de sus tecnologías a las empresas, afirmó Joseph Jacks, fundador de OSS Capital, una firma de capital riesgo que financia nuevas compañías de código abierto. Este enfoque ha reportado dividendos a empresas como MongoDB, que vende una versión empresarial de su base de datos de código abierto.

Las empresas de IA de código abierto afirman que también pueden obtener beneficios vendiendo servicios y aplicaciones de nivel empresarial sobre sus modelos abiertos, apostando por la disposición de las firmas a pagar por funciones y soporte empresariales, aplicaciones listas para usar como chatbots, y la comodidad de subcontratar el trabajo a compañías de IA para que construyan modelos personalizados para ellas.

Los modelos de IA por sí solos son inútiles para las empresas, lo que da a compañías como Databricks la oportunidad de vender capacidades que les ayuden a utilizarlos, explicó Ali Ghodsi, cofundador y CEO de la empresa. El nuevo grupo de IA de Databricks ha publicado modelos abiertos y ayuda a las compañías a crear modelos de bajo costo con datos propios.

Otra estrategia consiste en crear una colección de modelos de IA, algunos gratuitos y otros más potentes de pago.

La empresa francesa de IA Mistral AI, anunció el mes pasado una asociación con Microsoft y un sistema de IA propio más potente por el que los clientes deben pagar. Sus modelos gratuitos, considerados avanzados, son menos sofisticados que los de pago.

Otras firmas muy conocidas, como Stability AI, que creó el popular modelo de generación de imágenes de código abierto Stable Diffusion junto con la empresa de IA Runway ML, empezaron a cobrar una cuota de suscripción por el uso comercial de algunos de sus modelos avanzados en diciembre. La suscripción también incluye funciones comerciales, según un representante.

Aun así, no es fácil que el código abierto sea rentable. El vendedor de muebles en línea Wayfair utilizó Stable Diffusion para crear una herramienta de diseño de interiores que ayuda a los clientes a generar imágenes de sus casas con nueva decoración, sostuvo la directora de tecnología, Fiona Tan. Pero la empresa utiliza una versión del modelo que es gratuita para uso comercial.

Del mismo modo, la startup de inteligencia artificial Writer, con sede en San Francisco, ha publicado modelos lingüísticos de código abierto y de propiedad exclusiva destinados a ayudar a las empresas a redactar contenidos. Sus modelos abiertos son menos potentes que los de pago, de acuerdo a May Habib, cofundadora y directora ejecutiva de Writer.

Sim Simeonov, director de tecnología de la empresa de servicios de tecnología sanitaria y marketing Real Chemistry, aseguró que no se trata de elegir entre modelos abiertos o cerrados de proveedores como Writer, sino de elegir la tecnología que satisfaga las necesidades técnicas, jurídicas y empresariales de una compañía.

El efecto ecosistema

Según PitchBook, la financiación mundial de capital riesgo para empresas de IA de código abierto pasó de US$ 900 millones en 2022 a US$ 2.900 millones el año pasado. Esto se debe, en parte, a que los inversores se sienten atraídos por el hecho de que las empresas de código abierto pueden innovar rápidamente a través de las legiones de desarrolladores independientes que atraen, explicó Jon Turow, socio de Madrona Venture Group.

Cerebras, una empresa de chips que ha recaudado US$ 750 millones, gana dinero vendiendo chips de IA y servicios de creación de modelos. Desarrolla modelos de código abierto no porque sean rentables, sino porque pueden ayudar a atraer a los desarrolladores, señaló el cofundador y director ejecutivo, Andrew Feldman.

El código abierto también ayuda a crear una plataforma o ecosistema de software y servicios para la tecnología, que otras startups pueden vender.

Entre ellas, Together AI recaudó este mes US$ 106 millones de Salesforce Ventures y otros inversores, valorando la empresa en US$ 1.250 millones. La startup ha lanzado sus propios modelos abiertos, pero principalmente vende herramientas que hacen más barato y rápido para las empresas el uso de modelos de código abierto desarrollados por otros, dijo el cofundador y CEO, Vipul Ved Prakash.

Hugging Face, que ha recaudado casi US$ 400 millones de gigantes tecnológicos como Alphabet y Nvidia, ayudó a desarrollar los modelos de código abierto BLOOM y StarCoder. Sin embargo, en lugar de centrarse en el desarrollo de modelos, la startup vende potencia de cálculo y soporte empresarial para otros modelos abiertos y su plataforma de código abierto para compartir modelos, detalló Jeff Boudier, jefe de producto de Hugging Face.

“Los modelos abiertos tienden a crear un ecosistema, mientras que los modelos cerrados sólo tienden a encontrar clientes”, comentó. “Eso multiplica por diez, por cien”, añadió.

Territorio desconocido

A diferencia del software de código abierto que se desarrolló hace décadas, la comercialización de la IA de código abierto es “un territorio muy inexplorado”, indicó Boudier.

En primer lugar, los modelos de IA requieren más capital que el software. Grandes empresas tecnológicas como Microsoft y Alphabet tienen los bolsillos llenos para comprar unidades de procesamiento gráfico (GPU) de Nvidia y dedicar miles de millones a desarrollar su IA.

Otro reto es la dificultad de trasladar las licencias de software, que se diseñaron para código informático, a los modelos de IA, que constan de parámetros numéricos o “pesos”, datos de entrenamiento y otros componentes, en su mayoría considerados “matemáticos”, según Mark Shuttleworth, fundador y CEO de Canonical, empresa que vende servicios comerciales para la tecnología de código abierto Ubuntu.

Aunque se están haciendo esfuerzos, todavía no existe una definición estándar o un conjunto de licencias para la IA de código abierto. Algunas firmas han optado por publicar sólo algunos elementos de sus modelos de IA, lo que limita su utilidad técnica para otros.

Por ejemplo, empresas como Meta llaman a sus modelos código abierto, pero restringen su uso, de acuerdo a Lawrence Lessig, profesor de la Facultad de Derecho de Harvard que estudia tecnología y política. La licencia comunitaria de Llama 2 permite a los desarrolladores utilizarla comercialmente, pero exige pedir permiso a Meta para usarla en un producto con más de 700 millones de usuarios mensuales. Un representante de Meta declaró que el enfoque abierto de la empresa tiene por objeto ayudar a las empresas y desarrolladores con recursos limitados a acceder a la IA, y permite a la comunidad de la IA “avanzar en el estado del arte de la seguridad y el rendimiento general de los modelos, equilibrando al mismo tiempo las cuestiones de responsabilidad”.

Hasta ahora, la concesión de licencias ha impedido que algunas empresas abrieran sus modelos de IA, explicó Shuttleworth. “Una vez que tienes una licencia que mucha gente entiende”, agregó, “hay una amplia comprensión de lo que podemos hacer que no se va a quitar”.