Mayor velocidad, capacidad y seguridad: cómo serán las nuevas IA generativas

Adam Selipsky, CEO de AWS, en la keynote del re:Invent 2023. Foto: Noah Berger

En el evento realizado en Las Vegas, Estados Unidos, los diferentes líderes de Amazon Web Services presentaron nuevos modelos de aplicaciones con IA generativa, que permiten procesar grandes cantidades de datos y menores tiempos de entrenamiento, además de otros anuncios. “Estoy convencido de que va a ser transformador”, señaló Adam Selipsky, CEO de AWS.


A cada minuto circulan cientos de personas por los pasillos del hotel The Venetian, en Las Vegas, y se oye un murmullo incesante de conversaciones en una cantidad incalculable de idiomas. Un sinnúmero de nacionalidades, profesiones e intereses repletan los distintos salones de este y otros hoteles de la ciudad norteamericana con un propósito: aprender todo –o lo que más se pueda– sobre el impacto que está teniendo la Inteligencia Artificial generativa en las empresas.

El epicentro está en el re:Invent 2023, el evento anual de Amazon Web Services (AWS) que reúne a la comunidad global de la nube para anunciar nuevas características, servicios y mejoras en su plataforma. Allí, más de 50 mil personas se reparten en las distintas actividades –más otras 300 mil que siguen la agenda de forma virtual– que se realizan para aprender de las más de dos mil sesiones técnicas, conferencias y discusiones relacionadas a la IA generativa y la nube.

No es antojadizo: la IA generativa ha avanzado a pasos agigantados tanto en el ámbito empresarial como en el personal durante los últimos años y ha revolucionado las distintas áreas de trabajo. Actualmente la lista de soluciones que están a la mano es larguísima: gracias a una indicación, en segundos se pueden crear textos, videos, imágenes de alta calidad o aplicaciones.

Ahora, con los cimientos de esta poderosa tecnología, el siguiente hito en el horizonte es poder ofrecer mejores prestaciones, especialmente gracias a las oportunidades que ofrece la combinación con la tecnología de la nube. En ese contexto, AWS anunció relevantes anuncios en esa dirección.

Una de las grandes novedades que se presentaron en la conferencia fue Amazon Q, asistente de IA generativa que tiene gran capacidad para ayudar a profesionales de TI y de negocios.

Actualmente, las empresas se están transformando gracias a la innovación que les permite acelerar la IA. Por lo mismo, una de las grandes novedades que se presentaron fue Amazon Q, un asistente de IA generativa desarrollada por AWS que fue diseñada específicamente para entornos laborales y empresariales y que tiene una gran capacidad para ayudar a desarrolladores, profesionales de TI y de negocios.

“Podrás chatear, generar contenido y ejecutar acciones, todo ello con el conocimiento y comprensión de tus sistemas, repositorios de datos, operativa y, por supuesto, con una seguridad y privacidad sólidas como una roca. Estoy convencido de que va a ser transformador. Esperamos que montones de diferentes tipos de gente hagan diferentes tipos de tareas beneficiándose de Q”, señaló Adam Selipsky, CEO de AWS.

Amazon Q tiene la capacidad de facilitar respuestas rápidas y realizar acciones, pues está capacitado para comprender y operar dentro de todos los sistemas de AWS, actuando como un guía para identificar cuáles herramientas pueden ser las más apropiadas y útiles según la necesidad, y también de la empresa en la que opera. Es decir, puede hacer recomendaciones y soluciones para casi cualquier necesidad, pero dependiendo de las autorizaciones que tiene el usuario en la organización.

Imágenes de IA con calidad de estudio

“Amazon Q es un experto en AWS, en patrones de arquitecturas, buenas prácticas, soluciones y peticiones. Puedes preguntarle cómo construir una aplicación web y cuáles son las opciones para sacarle provecho. Puedes pedirle instrucciones paso a paso y enlaces útiles”, agregó el CEO de AWS.

Además, explicó que esta herramienta es ideal para desarrolladores, ya que también permite actualizar los viejos códigos de programación automáticamente e ir mejorando las prácticas de seguridad.

Otra de las herramientas potentes que se presentaron en re:Invent 2023 fue Titan Image Generator, una herramienta que los desarrolladores pueden aprovechar para crear sus propios generadores de imágenes basados en el modelo. Esta herramienta puede crear imágenes realistas con calidad de estudio a partir de un texto.

Una de las últimas joyas de AWS es Amazon Bedrock. Este servicio, lanzado en octubre pasado, está diseñado para facilitar la construcción y escalado de aplicaciones de IA generativa.

Si bien no es la primera herramienta que lo consigue, la novedad es que cuenta con barreras de seguridad integradas: las imágenes generadas contarán con una marca de agua invisible, que permitirá identificar que fue generada con IA, evitando que se presten para crear fake news.

También hubo actualizaciones en una de las últimas joyas de la compañía: Amazon Bedrock. Este servicio, lanzado en octubre pasado, está diseñado para facilitar la construcción y escalado de aplicaciones de IA generativa. Los usuarios de Bedrock tienen una cantidad enorme de opciones de modelos para construir y escalar aplicaciones de IA generativas, que incluyen modelos de lenguaje y modelos de base de Anthropic, Cohere, Meta y Stability AI.

Estos modelos de aprendizaje automático pre-entrenados en grandes cantidades de datos, incluyendo texto e imágenes, están diseñados para facilitar una rápida innovación en varios sectores.

Con la incorporación de nuevas capacidades como la evaluación de modelos y bases de conocimiento, Amazon Bedrock facilita la construcción de aplicaciones de IA generativa que utilizan datos propios para ofrecer respuestas personalizadas y actualizadas. Además, con herramientas como Agents for Amazon Bedrock, los clientes pueden habilitar aplicaciones de IA generativa para planificar y realizar una amplia variedad de tareas empresariales de forma segura y privada.

Mayor potencia y velocidad

Por otro lado, también se hicieron algunos anuncios relevantes respecto de almacenamiento, velocidad y computación. Por ejemplo, se lanzó Amazon S3 Express One Zone, una clase de almacenamiento de alto rendimiento dentro de Amazon Simple Storage Service (S3), que está diseñada específicamente para aplicaciones críticas que requieren acceso a datos con latencias de milisegundos de un solo dígito.

Esta herramienta puede mejorar las velocidades de acceso a datos en hasta 10 veces y reducir los costos de solicitud en un 50% en comparación con la clase de almacenamiento S3 Standard.

También fue anunciado Graviton4, un chip diseñado para entrenamiento de modelos de IA y machine learning (ML), que ofrece un rendimiento mejorado y una mayor eficiencia energética en comparación con sus predecesores. Estos chips son especialmente adecuados para entrenar modelos de IA y ML a gran escala, permitiendo a los usuarios entrenar modelos de lenguaje grandes con billones de parámetros de manera más rápida y eficiente en términos de energía.

En la ocasión también se presentó Graviton4, un chip diseñado para entrenamiento de modelos de IA y machine learning (ML), que ofrece un rendimiento mejorado y una mayor eficiencia energética.

No solo eso, pues gracias a la alianza con NVIDIA se está avanzando hacia la supercomputación. Esto, porque AWS será el primer proveedor de la nube en ofrecer la supercomputación de IA con el NVIDIA Grace Hopper Superchip y la escalabilidad AWS UltraCluster, lo que permitirá a los clientes escalar a miles de superchips para entrenamiento de IA y modelos de lenguaje a gran escala.

“NVIDIA y AWS están colaborando en toda la pila informática, abarcando la infraestructura de IA, bibliotecas de aceleración, modelos básicos y servicios de IA generativa”, dijo el CEO de NVIDIA, Jensen Huang.

Ambas compañías, además, están colaborando en el diseño del supercomputador de IA alimentado por GPU más rápido del mundo, el Proyecto Ceiba, con el GH200 NVL32 y la interconexión Amazon EFA. Este supercomputador será utilizado por el equipo de investigación y desarrollo de Nvidia para avanzar en IA en áreas como modelos de lenguaje, gráficos y simulación, biología digital, robótica, automóviles autónomos, y más.

“Nuestra apuesta es por la computación acelerada en inteligencia artificial generativa”, señaló Huang. “Ceiba van a ser 16,384 GPUs conectadas en una supercomputadora IA gigante. Esto es absolutamente increíble. Podremos reducir el tiempo de entrenamiento de los modelos de lenguaje más grandes, la próxima generación de MOEs, estos modelos de mezcla de expertos extremadamente grandes, y poder entrenarlos en solo la mitad del tiempo. Básicamente reduciendo el costo de entrenamiento en solo un año a la mitad”, agregó el fundador de Nvidia.

Comenta

Por favor, inicia sesión en La Tercera para acceder a los comentarios.

La disrupción digital es aquella transformación radical y profunda de los modelos de negocio de una empresa. Es un proceso muy beneficioso, pero no es sencillo. En esta entrevista, Juan José de la Torre, CEO de Raven y especialista en disrupción, explica los fundamentos de este proceso y cómo abordarlo.