AMD a présenté ses dernières capacités logicielles et de calcul de bout en bout pour les clients et les développeurs de Microsoft. En utilisant les solutions AMD telles que les accélérateurs AMD Instinct MI300X, le logiciel ouvert ROCm, les processeurs et logiciels Ryzen AI et les accélérateurs multimédia Alveo MA35D, Microsoft est en mesure de fournir une puissante suite d'outils pour les déploiements basés sur l'IA sur de nombreux marchés. Les nouvelles machines virtuelles (VM) Microsoft Azure ND MI300X sont maintenant généralement disponibles, donnant aux clients comme Hugging Face, l'accès à des performances et une efficacité impressionnantes pour leurs charges de travail d'IA les plus exigeantes.

Précédemment annoncée en avant-première en novembre 2023, la série de VM Azure ND MI300x v5 est désormais disponible dans la région Canada Central pour que les clients puissent exécuter leurs charges de travail d'IA. Offrant des performances à la pointe de l'industrie, ces VM fournissent une capacité HBM et une bande passante mémoire impressionnantes, permettant aux clients d'intégrer des modèles plus importants dans la mémoire GPU et/ou d'utiliser moins de GPU, ce qui contribue finalement à économiser de l'énergie, des coûts et du temps pour la solution. Ces VM et le logiciel ROCm qui les alimente sont également utilisés pour les charges de travail Azure AI Production, y compris Azure OpenAI Service, permettant aux clients d'accéder aux modèles GPT-3.5 et GPT-4.

Avec AMD Instinct MI300X et la pile logicielle ouverte ROCm éprouvée et prête à l'emploi, Microsoft est en mesure d'atteindre un rapport prix/performance de premier plan sur les charges de travail d'inférence GPT. Au-delà des charges de travail de production d'Azure AI, l'un des premiers clients à utiliser ces VM est Hugging Face. En portant ses modèles sur les VM ND MI300X en seulement un mois, Hugging Face a pu atteindre des performances et un rapport prix/performance impressionnants pour ses modèles.

Ainsi, les clients des VM ND MI300X peuvent apporter les modèles Hugging Face aux VM pour créer et déployer des applications NLP avec facilité et efficacité. En outre, les développeurs peuvent utiliser le logiciel AMD Ryzen AI pour optimiser et déployer l'inférence AI sur les PC AMD Ryzen AI. Le logiciel Ryzen AI permet aux applications de s'exécuter sur l'unité de traitement neuronal (NPU) construite sur l'architecture AMD XDNA, le premier silicium de traitement AI dédié sur un processeur Windows x862. Alors que l'exécution de modèles d'IA sur un CPU ou un GPU seul peut épuiser rapidement la batterie, avec un ordinateur portable Ryzen AI powered, les modèles d'IA fonctionnent sur le NPU intégré, libérant les ressources du CPU et du GPU pour d'autres tâches de calcul.

Cela permet d'augmenter considérablement l'autonomie de la batterie et permet aux développeurs d'exécuter des charges de travail LLM AI sur l'appareil et des applications concurrentes de manière efficace et locale. Microsoft a choisi l'accélérateur multimédia AMD Alveo MA35D pour alimenter ses vastes charges de travail de streaming vidéo en direct, y compris Microsoft Teams, SharePoint video, et d'autres. Conçu pour alimenter les services de streaming interactifs en direct à grande échelle, l'Alveo MA35D aidera Microsoft à garantir une expérience vidéo de haute qualité en rationalisant les charges de travail de traitement vidéo, notamment le transcodage, le décodage et l'encodage vidéo, ainsi que le streaming à débit adaptatif (ABR).

En utilisant l'accélérateur Alveo MA35D dans des serveurs équipés de processeurs AMD EPYC de 4ème génération, Microsoft bénéficie des avantages suivants : Capacité à consolider les serveurs et l'infrastructure cloud - en exploitant la haute densité de canaux, l'efficacité énergétique et les capacités de traitement vidéo à très faible latence de l'Alveo MA35D, Microsoft peut réduire de manière significative le nombre de serveurs nécessaires pour prendre en charge ses applications de streaming interactif en direct à haut volume. Des performances impressionnantes - l'Alveo MA35D est doté d'unités de traitement vidéo basées sur un ASIC prenant en charge la norme de compression AV1 et des optimisations de la qualité vidéo basées sur l'IA qui permettent d'assurer des expériences vidéo fluides et continues. Technologie AV1 prête pour l'avenir - avec un chemin de mise à niveau pour prendre en charge les normes émergentes comme AV1, l'Alveo MA35D fournit à Microsoft une solution qui peut s'adapter à l'évolution des exigences en matière de traitement vidéo.

Les processeurs AMD EPYC de 4ème génération alimentent de nombreuses VM d'usage général, à forte intensité de mémoire, optimisées pour le calcul et accélérées sur Azure. Ces VM témoignent de la croissance et de la demande de processeurs AMD EPYC dans le cloud et peuvent offrir jusqu'à 20 % de performances supplémentaires pour les VM à usage général et à forte intensité de mémoire, avec un meilleur rapport prix/performances, et jusqu'à deux fois les performances du CPU pour les VM optimisées pour le calcul, par rapport à la génération précédente de VM alimentées par des processeurs AMD EPYC sur Azure. Les séries de VM Dalsv6, Dasv6, Easv6, Falsv6 et Famsv6, actuellement en avant-première, seront disponibles dans les mois à venir.