Cloudera et NVIDIA collaborent pour étendre les capacités d'IA générative avec les microservices de NVIDIA
Le 19 mars 2024 à 14:04
Partager
Cloudera a annoncé l'extension de sa collaboration avec NVIDIA. Cloudera Powered by NVIDIA intégrera les microservices NVIDIA NIM de qualité professionnelle, qui font partie de la plate-forme logicielle NVIDIA AI Enterprise, dans Cloudera Machine Learning, un service Cloudera Data Platform pour les flux de travail d'IA/ML, afin de fournir des flux de travail d'IA générative de bout en bout, rapides, sécurisés et simplifiés en production. Les données d'entreprise, associées à une plateforme complète optimisée pour les grands modèles de langage (LLM), jouent un rôle essentiel dans l'avancement des applications d'IA générative d'une organisation, du pilote à la production.
Les microservices NVIDIA NIM et NeMo Retriever permettent aux développeurs de relier les modèles d'IA à leurs données d'entreprise - y compris le texte, les images et les visualisations, telles que les diagrammes à barres, les diagrammes linéaires et les diagrammes circulaires - afin de générer des réponses très précises et pertinentes en fonction du contexte. Les développeurs qui utilisent ces microservices peuvent déployer des applications via NVIDIA AI Enterprise, qui fournit des runtimes optimisés pour construire, personnaliser et déployer des LLM d'entreprise. En s'appuyant sur les microservices de NVIDIA, Cloudera Machine Learning permettra aux clients de libérer la valeur de leurs données d'entreprise sous la gestion de Cloudera en apportant des workflows d'IA haute performance, des logiciels de plate-forme d'IA et des calculs accélérés aux données, où qu'elles se trouvent. Cloudera introduira plusieurs intégrations avec les microservices de NVIDIA.
Cloudera Machine learning intégrera le service de modèle et d'application optimisé par les microservices NVIDIA pour augmenter les performances d'inférence de modèle dans toutes les charges de travail. Avec cette nouvelle fonctionnalité de service de modèles d'IA, les clients peuvent obtenir une tolérance aux pannes, un service à faible latence et une mise à l'échelle automatique pour les modèles déployés n'importe où - à partir de clouds publics et privés. De plus, Cloudera Machine learning proposera des micro-services NVIDIA NeMo Retriever intégrés pour simplifier la connexion des LLM personnalisés aux données de l'entreprise.
Cette capacité permettra aux utilisateurs de créer des applications basées sur la génération RAG (retrieval-augmented generation) pour une utilisation en production. Cloudera a déjà travaillé avec NVIDIA pour exploiter le traitement des données optimisé par le GPU en intégrant l'accélérateur NVIDIA RAPIDS pour Apache Spark dans la Cloudera Data Platform. Désormais, avec l'ajout prévu de microservices NVIDIA et l'intégration avec NVIDIA AI Enterprise, Cloudera Data Platform fournira de façon unique des pipelines d'IA hybrides rationalisés de bout en bout.
NVIDIA Corporation est le n° 1 mondial de la conception, du développement et de la commercialisation de processeurs graphiques programmables. Le groupe développe parallèlement des logiciels associés. Le CA par famille de produits se répartit comme suit :
- solutions informatiques et de mise en réseau (55,9%) : plateformes et infrastructures de centres de données, solutions d'interconnexion Ethernet, solutions calcul haute performance, plateformes et solutions pour véhicules autonomes et intelligents, solutions pour l'infrastructure d'intelligence artificielle d'entreprise, processeurs d'extraction de crypto-monnaies, cartes informatiques embarquées pour la robotique, l'enseignement, l'apprentissage et le développement de l'intelligence artificielle, etc. ;
- processeurs graphiques (44,1%) : destinés aux ordinateurs, aux consoles de jeux, aux plateformes de diffusion en direct de jeux vidéo, aux stations de travail, etc. (marques GeForce, NVIDIA RTX, Quadro, etc.). Le groupe propose également des ordinateurs portables et de bureau, des ordinateurs de jeu, des périphériques pour ordinateurs (moniteurs, souris, manettes de jeux, télécommandes, etc.), des logiciels pour l'informatique visuelle et virtuelle, des plateformes pour les systèmes d'info-divertissement automobiles et des plateformes de collaboration dans le cloud.
Le CA par secteur d'activité se ventile entre stockage de données (55,6%), jeux (33,6%), visualisation professionnelle (5,7%), automobile (3,4%) et autres (1,7%).
La répartition géographique du CA est la suivante : Etats-Unis (30,7%), Taiwan (25,9%), Chine (21,5%) et autres (21,9%).