
Red Hat AI Factory with NVIDIA accélère la transition vers une IA de production à grande échelle
Red Hat, annonce aujourd’hui le lancement de Red Hat AI Factory with NVIDIA, une plateforme logicielle co-développée qui combine Red Hat AI Enterprise et NVIDIA AI Enterprise pour fournir aux organisations une solution de bout en bout optimisée pour les déploiements à grande échelle de l’IA. Nouvelle étape majeure de la collaboration étroite entre les deux sociétés, Red Hat AI Factory with NVIDIA permet aux grandes entreprises d’accélérer la mise à disposition des dernières innovations IA, tout en assurant un support Day-0 des architectures matérielles NVIDIA.
À l’heure où les dépenses en IA d’entreprise devraient dépasser les 1 000 milliards de dollars d’ici 2029[1], une tendance largement impulsée par les applications d’IA agentique, les organisations cherchent à orienter leurs stratégies vers des workflows agentiques à haute densité, et à répondre aux besoins qui en découlent en matière d’inférence et d’infrastructure IA. Pour les aider à tenir la cadence, Red Hat AI Factory with NVIDIA permet aux équipes informatiques de rationaliser aussi bien la gestion de l’infrastructure traditionnelle que celle des exigences évolutives de la pile IA.
Red Hat AI Factory with NVIDIA accélère la transition vers l’IA de production, et fournit la plateforme logicielle pour les usines d’IA, sur une infrastructure informatique accélérée qui optimise les performances des modèles et des GPU NVIDIA chargés de piloter la pile d’inférence. La plateforme s’appuie sur l’infrastructure d’usine IA de grands fabricants de systèmes, tels que Cisco, Dell Technologies, Lenovo et Supermicro. Les administrateurs informatiques et les équipes d’exploitation ont ainsi toutes les cartes en main pour faire évoluer et maintenir les déploiements d’IA avec la même rigueur opérationnelle et la même prévisibilité que pour n’importe quelle autre charge de travail de l’entreprise.
Cette plateforme logicielle combine l’expertise de Red Hat et de NVIDIA en matière de collaboration, d’ingénierie et de support open source pour fournir une solution fiable et adaptée aux entreprises. Red Hat AI Factory with NVIDIA offre une base hautement évolutive pour le déploiement de l’IA dans tous les environnements : sur site, dans le cloud ou en périphérie. Elle intègre des fonctionnalités essentielles pour l’inférence d’IA hautes performances, l’optimisation des modèles, la personnalisation, le déploiement et la gestion des agents, avec un accent particulier sur la sécurité. Les organisations peuvent ainsi conserver la maîtrise de leur architecture, du datacenter jusqu’au cloud public. À la clé :
- Accélération du délai de rentabilisation : passez à une IA de production grâce à des workflows rationalisés et un accès instantané à des modèles préconfigurés, notamment les modèles ouverts garantis IBM Granite, NVIDIA Nemotron et NVIDIA Cosmos, fournis sous forme de microservices NVIDIA NIM. La suite logicielle NVIDIA NeMo permet également aux organisations d’aligner davantage les modèles sur les données d’entreprise, et ainsi de réduire le temps et les coûts de réglage.
- Optimisation des coûts et des performances : maximisez l’utilisation de l’infrastructure et renforcez les performances d’inférence au travers d’une pile de services unifiée et hautement performante. Red Hat AI Factory with NVIDIA intègre des fonctionnalités d’observabilité et exploite les capacités d’inférence de Red Hat AI optimisées par vLLM, NVIDIA TensorRT-LLM, NVIDIA Dynamo et NVIDIA BlueField pour répondre à des objectifs stricts de niveau de service en matière d’IA. Cela permet aux organisations d’optimiser la connexion entre les modèles et les GPU NVIDIA afin de réduire le coût total de possession (TCO) de l’IA.
- Orchestration intelligente des GPU : activez l’accès à la demande aux ressources GPU grâce à une orchestration intelligente et une infrastructure mutualisée, avec des points de contrôle automatiques pour protéger les tâches de longue durée et assurer une meilleure prévisibilité des coûts de calcul dans les environnements dynamiques.
- Renforcement de la posture de l’entreprise : exploitez la fiabilité et la flexibilité de Red Hat Enterprise Linux pour bénéficier de fonctionnalités de conformité et de sécurité avancée intégrées dès la conception qui contribuent à réduire les risques, à gagner du temps et à limiter au maximum les interruptions de service. Ces fonctionnalités offrent une base sécurisée pour les charges de travail d’IA critiques qui nécessitent une isolation et une vérification continue. Les microservices NVIDIA DOCA s’appuient sur cette base pour créer une architecture Zero Trust et assurer la sécurité du runtime IA à travers l’infrastructure.
[1] IDC, Agentic AI to Dominate IT Budget Expansion Over Next Five Years, Exceeding 26% of Worldwide IT Spending, and $1.3 Trillion in 2029, 26 août 2025


