desarrolladores

IBM presenta Granite 3.0: modelos de IA para las empresas

IBM dio a conocer el lanzamiento de su familia de modelos de IA más avanzada hasta la fecha, Granite 3.0. La tercera generación de modelos de lenguaje Granite puede superar o igualar el rendimiento de modelos de tamaño similar de proveedores líderes en muchas pruebas de referencia académicas y del sector, demostrando rendimiento, transparencia y seguridad, aseguró el fabricante.

Explicó que los modelos Granite se publican bajo la licencia permisiva Apache 2.0, lo que los hace únicos por la combinación de rendimiento, flexibilidad y autonomía para los clientes empresariales y la comunidad en general.

La familia Granite 3.0 incluye:

  • Propósito general/Lenguaje: Granite 3.0 8B-Instruct, Granite 3.0 2B-Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
  • Barreras de protección y seguridad: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
  • Mixture of Experts (MoE): Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base, Granite 3.0 1B A400M Base

Los modelos de lenguaje 8B y 2B están diseñados como «caballos de batalla» para la IA empresarial, ofreciendo rendimiento y rentabilidad en tareas como la regeneración aumentada de recuperación (RAG), clasificación, resumen, extracción de entidades y uso de herramientas. Estos modelos compactos y versátiles están diseñados para ajustarse con precisión a los datos empresariales e integrarse a la perfección en cualquier entorno empresarial o flujo de trabajo, especificó la compañía.

De acuerdo con IBM el lanzamiento de Granite 3.0 reafirma su compromiso con la creación de transparencia, la seguridad y la confianza en los productos de IA. Como punto fundamental, ofrece una indemnización de propiedad intelectual (IP) para todos los modelos Granite en watsonx.ai, lo que permite a los clientes empresariales tener mayor confianza al combinar sus datos con estos modelos.

Subiendo la barra: Pruebas de Granite 3.0

En las tareas empresariales básicas de RAG, uso de herramientas y tareas en el ámbito de la ciberseguridad, el modelo Granite 3.0 8B Instruct muestra un rendimiento superior de media en comparación con los modelos de código abierto de tamaño similar de Mistral y Meta, indicó IBM.

Los modelos Granite 3.0 se han estrenado con más de 12 billones de tokens de datos a partir de 12 lenguajes naturales y 116 lenguajes de programación diferentes, utilizando un novedoso método de entrenamiento en dos fases, que aprovecha los resultados de varios miles de experimentos diseñados para optimizar la calidad y la selección de datos y los parámetros de entrenamiento. Para finales de año, se espera que los modelos lingüísticos 8B y 2B también incluyan soporte para una ventana de contexto extendida de 128K y capacidades de comprensión multimodal de documentos.

Granite Guardian 3.0: la nueva era de la IA responsable

Como parte de este lanzamiento, IBM también ha presentado una nueva familia de modelos Guardian que permiten a los desarrolladores de aplicaciones implementar barreras de seguridad mediante la comprobación de los avisos al usuario y las respuestas LLM para detectar una variedad de riesgos. Los modelos 3.0 8B y 2B ofrecen el conjunto más completo de capacidades de detección de riesgos y daños disponibles actualmente en el mercado, a decir de IBM.

Además de las dimensiones de daño, como prejuicios sociales, odio, toxicidad, blasfemia, violencia, técnicas de jailbreak etcétera, estos modelos también proporcionan una serie de comprobaciones específicas de RAG, como el fundamento, la relevancia del contexto y la relevancia de la respuesta.

Aunque los modelos Guardian se derivan de los correspondientes modelos de lenguaje Granite, pueden utilizarse para implementar medidas de seguridad junto a cualquier modelo de IA, ya sea abierto o propietario, complementó la marca.

De asistentes a agentes: haciendo realidad el futuro de la IA empresarial

Asimismo, IBM presentó la próxima versión de watsonx Code Assistant, basada en los modelos de código Granite, para ofrecer asistencia de programación de uso general en lenguajes como C, C++, Go, Java y Python, con capacidades de modernización de aplicaciones para Enterprise Java Applications  . Ahora también se puede acceder a las funciones de código de Granite a través de una extensión de Visual Studio Code, IBM Granite.Code.

Disponibilidad

Toda la suite de modelos Granite 3.0 y los modelos actualizados series temporales están disponibles para su descarga en Hugging Face bajo la licencia permisiva Apache 2.0. Las variantes instructivas de los nuevos modelos lingüísticos 3.0 8B y 2B y los modelos Guardian 3.0 están disponibles para uso comercial en la plataforma watsonx. A su vez, estará disponible una selección de modelos 3.0 como microservicios Nvidia NIM y a través de las integraciones Vertex AI Model Garden de Google Cloud con Hugging Face, informó el fabricante.

Detalles de Granite y la estrategia de IA empresarial de IBM aquí.

[email protected]

WhatsApp eSemanal 55 7360 5651

También te puede interesar:

IBM revela innovaciones para acelerar la IA en sistemas mainframe Z de próxima generación

La oportunidad transformadora de la IA en los empleos de las TIC

Datos: El Combustible Vital y el Pilar que Impulsa la Inteligencia Artificial

 

Publicaciones relacionadas

Botón volver arriba
Share via
Copy link
Powered by Social Snap