
Red Hat y AWS buscan optimizar costos y rendimiento en despliegues de inteligencia artificial
Red Hat anunció la expansión de su colaboración con Amazon Web Services (AWS) para impulsar soluciones empresariales de inteligencia artificial generativa, mediante la integración de su portafolio Red Hat AI con chips de IA de AWS.
El objetivo es ofrecer a las organizaciones mayores capacidades para ejecutar inferencia de IA de alto rendimiento y de manera eficiente a escala, independientemente del hardware utilizado.
En un contexto donde la adopción de inteligencia artificial generativa continúa en aumento, las empresas están reevaluando sus infraestructuras tecnológicas para responder a la demanda de procesamiento. De acuerdo con IDC, para 2027 el 40% de las organizaciones utilizará silicio personalizado para optimizar rendimiento y costos en cargas de trabajo de IA.
La nueva fase de la colaboración contempla la integración del Red Hat AI Inference Server con chips de AWS, como Inferentia2 y Trainium3, con el fin de mejorar el rendimiento, reducir la latencia y optimizar los costos en despliegues de IA en producción.
Además, ambas compañías trabajaron en el desarrollo de un operador de AWS Neuron para plataformas como OpenShift y OpenShift AI, con el propósito de facilitar la ejecución de cargas de trabajo de inteligencia artificial sobre infraestructura de AWS.
Otro de los componentes de la iniciativa es la integración de herramientas de automatización mediante la Colección Ansible Certificada amazon.ai, que permite orquestar servicios de IA en la nube de AWS.
Como parte del enfoque técnico, las empresas también colaboran en el desarrollo de capacidades dentro del proyecto de código abierto vLLM, orientado a mejorar la inferencia de modelos de lenguaje a gran escala.
“Al habilitar el Red Hat AI Inference Server para el sector empresarial, desarrollado sobre el innovador framework vLLM, con chips de IA de AWS, estamos empoderando a las organizaciones para desplegar y escalar cargas de IA con mayor eficiencia y flexibilidad”, señaló Joe Fernandes, vicepresidente y gerente general de la Unidad de Negocios de IA de Red Hat.
Por su parte, Colin Brace, vicepresidente de Annapurna Labs en AWS, destacó que la colaboración busca ofrecer a las empresas un camino estructurado para implementar inteligencia artificial generativa a escala, combinando infraestructura especializada y herramientas de código abierto.
En cuanto a disponibilidad, el operador AWS Neuron ya se encuentra accesible en OperatorHub de Red Hat OpenShift, mientras que el soporte del Red Hat AI Inference Server para chips de AWS está disponible en versión preliminar desde enero de 2026.
WhatsApp eSemanal 55 7360 5651



