Oracle a annoncé la disponibilité générale de HeatWave GenAI, qui comprend les premiers grands modèles de langage (LLM) en base de données, un magasin de vecteurs automatisé en base de données, le traitement vectoriel scale-out et la possibilité d'avoir des conversations contextuelles en langage naturel à partir de contenu non structuré. Ces nouvelles fonctionnalités permettent aux clients d'apporter la puissance de l'IA générative aux données de leur entreprise, sans avoir besoin d'une expertise en IA ou de déplacer les données vers une base de données vectorielle distincte. HeatWave GenAI est disponible immédiatement dans toutes les régions Oracle Cloud, Oracle Cloud Infrastructure (OCI) Dedicated Region, et à travers les clouds sans coût supplémentaire pour les clients HeatWave.

Avec HeatWave GenAI, les développeurs peuvent créer un magasin vectoriel pour le contenu non structuré de l'entreprise avec une seule commande SQL, en utilisant des modèles d'intégration intégrés. Les utilisateurs peuvent effectuer des recherches en langage naturel en une seule étape en utilisant des LLM internes à la base de données ou externes. Les données ne quittent pas la base de données et, grâce à l'échelle et aux performances extrêmes de HeatWave, il n'est pas nécessaire de provisionner des GPU. Par conséquent, les développeurs peuvent réduire la complexité des applications, augmenter les performances, améliorer la sécurité des données et réduire les coûts.

Les nouvelles fonctionnalités automatisées et intégrées d'IA générative incluent : Les LLM dans la base de données simplifient le développement d'applications d'IA générative à moindre coût. Les clients peuvent bénéficier de l'IA générative sans la complexité de la sélection et de l'intégration des LLM externes, et sans se soucier de la disponibilité des LLM dans les centres de données des différents fournisseurs de cloud. Les LLM dans la base de données permettent aux clients de rechercher des données, de générer ou de résumer du contenu, et d'effectuer une génération augmentée de recherche (RAG) avec HeatWave Vector Store.

En outre, ils peuvent combiner l'IA générative avec d'autres capacités intégrées de HeatWave, telles que AutoML, pour créer des applications plus riches. HeatWave GenAI est également intégré au service OCI Generative AI pour accéder à des modèles fondamentaux pré-entraînés provenant des principaux fournisseurs de LLM. Le magasin de vecteurs automatisé dans la base de données permet aux clients d'utiliser l'IA générative avec leurs documents commerciaux sans déplacer les données vers une base de données vectorielle distincte et sans expertise en IA.

Toutes les étapes de création d'un magasin de vecteurs et d'embeddings vectoriels sont automatisées et exécutées à l'intérieur de la base de données, y compris la découverte des documents dans le stockage d'objets, leur analyse, la génération d'embeddings de manière hautement parallèle et optimisée, et leur insertion dans le magasin de vecteurs, ce qui rend le magasin de vecteurs HeatWave efficace et facile à utiliser. L'utilisation d'un magasin de vecteurs pour RAG permet de résoudre le problème d'hallucination des LLM, car les modèles peuvent rechercher des données propriétaires dans un contexte approprié afin de fournir des réponses plus précises et plus pertinentes. Le traitement vectoriel à grande échelle permet d'obtenir des résultats de recherche sémantique très rapides sans perte de précision.

HeatWave prend en charge un nouveau type de données natif VECTOR et une implémentation optimisée de la fonction de distance, ce qui permet aux clients d'effectuer des requêtes sémantiques avec le langage SQL standard. La représentation en colonne hybride en mémoire et l'architecture scale-out de HeatWave permettent au traitement vectoriel de s'exécuter à une bande passante proche de la mémoire et de paralléliser jusqu'à 512 nœuds HeatWave. Ainsi, les clients obtiennent rapidement des réponses à leurs questions.

Les utilisateurs peuvent également combiner la recherche sémantique avec d'autres opérateurs SQL pour, par exemple, joindre plusieurs tables avec différents documents et effectuer des recherches de similarité dans tous les documents. HeatWave Chat est un plug-in Visual Code pour MySQL Shell qui fournit une interface graphique pour HeatWave GenAI et permet aux développeurs de poser des questions en langage naturel ou SQL. Le Lakehouse Navigator intégré permet aux utilisateurs de sélectionner des fichiers à partir du stockage d'objets et de créer un magasin vectoriel.

Les utilisateurs peuvent effectuer des recherches dans l'ensemble de la base de données ou restreindre la recherche à un dossier. HeatWave conserve le contexte avec l'historique des questions posées, les citations des documents sources et l'invite au LLM. Cela facilite une conversation contextuelle et permet aux utilisateurs de vérifier la source des réponses générées par le LLM.

Ce contexte est conservé dans HeatWave et est disponible pour toute application utilisant HeatWave.