Oracle a annoncé qu'Oracle MySQL HeatWave prend désormais en charge l'apprentissage machine (ML) dans la base de données, en plus du traitement et de l'analyse des transactions précédemment disponibles—le seul service de base de données MySQL en nuage à le faire. MySQL HeatWave ML automatise entièrement le cycle de vie du ML et stocke tous les modèles formés dans la base de données MySQL, éliminant ainsi le besoin de déplacer les données ou le modèle vers un outil ou un service d'apprentissage automatique. L'élimination de l'ETL réduit la complexité des applications, diminue les coûts et améliore la sécurité des données et du modèle. HeatWave ML est inclus dans le service cloud de la base de données MySQL HeatWave dans les 37 régions Oracle Cloud Infrastructure (OCI). Jusqu'à présent, l'ajout de capacités d'apprentissage automatique aux applications MySQL s'est avéré excessivement difficile et long pour de nombreux développeurs. Tout d'abord, il y a le processus d'extraction des données de la base de données et d'un autre système pour créer et déployer des modèles ML. Cette approche crée de multiples silos pour l'application de l'apprentissage automatique aux données d'application et introduit une latence lorsque les données se déplacent. Elle conduit également à la prolifération des données hors de la base de données, ce qui les rend plus vulnérables aux menaces de sécurité, et ajoute de la complexité pour les développeurs qui doivent programmer dans plusieurs environnements. Deuxièmement, les services existants attendent des développeurs qu'ils soient des experts pour guider le processus de formation du modèle ML ; sinon, le modèle est sous-optimal, ce qui dégrade la précision des prédictions. Enfin, la plupart des solutions ML existantes n'incluent pas de fonctionnalité permettant de fournir des explications sur la raison pour laquelle les modèles que les développeurs construisent fournissent des prédictions spécifiques. MySQL HeatWave ML résout ces problèmes en intégrant nativement les capacités d'apprentissage automatique au sein de la base de données MySQL, éliminant ainsi la nécessité d'ETLer les données vers un autre service. HeatWave ML automatise entièrement le processus de formation et crée un modèle avec le meilleur algorithme, les caractéristiques optimales et les hyperparamètres optimaux pour un ensemble de données donné et une tâche spécifique. Tous les modèles générés par HeatWave ML peuvent fournir des explications sur le modèle et les prédictions. HeatWave ML propose des capacités supérieures à celles des autres services de base de données en nuage : Formation de modèle entièrement automatisée : Toutes les différentes étapes de la création d'un modèle avec HeatWave ML sont entièrement automatisées et ne nécessitent aucune intervention des développeurs. Il en résulte un modèle ajusté plus précis, qui ne nécessite aucun travail manuel et dont le processus de formation est toujours achevé. D'autres services de base de données en nuage, tels qu'Amazon Redshift, offrent une intégration avec des capacités d'apprentissage automatique dans des services externes, qui nécessitent des interventions manuelles importantes de la part des développeurs pendant le processus d'apprentissage ML. Explications des modèles et des inférences : L'explicabilité des modèles aide les développeurs à comprendre le comportement d'un modèle d'apprentissage automatique. Par exemple, si une banque refuse un prêt à un client, elle doit être en mesure de déterminer quels paramètres du modèle ont été pris en compte, ou si le modèle contient un quelconque biais. L'explicabilité des prédictions est un ensemble de techniques qui aident à répondre à la question de savoir pourquoi un modèle d'apprentissage automatique a fait une prédiction spécifique. L'explicabilité des prédictions est de plus en plus importante de nos jours, car les entreprises doivent être en mesure d'expliquer les décisions prises par leurs modèles d'apprentissage automatique. HeatWave ML intègre à la fois les explications de modèle et les explications de prédiction dans le cadre de son processus de formation de modèles. Par conséquent, tous les modèles créés par HeatWave ML peuvent proposer des explications de modèle et d'inférence sans avoir besoin de données d'entraînement au moment de l'explication de l'inférence. Oracle a augmenté les techniques d'explication existantes pour améliorer les performances, l'interprétabilité et la qualité. D'autres services de base de données en nuage ne proposent pas une explicabilité aussi riche pour tous leurs modèles d'apprentissage automatique. Réglage des hyper-paramètres : HeatWave ML met en œuvre un nouvel algorithme de réduction basé sur la recherche de gradient pour le réglage des hyper-paramètres. Cela permet d'exécuter la recherche d'hyper-paramètres en parallèle sans compromettre la précision du modèle. Le réglage des hyperparamètres est l'étape la plus longue de la formation d'un modèle ML. Cette capacité unique confère à HeatWave ML un avantage significatif en termes de performances par rapport aux autres services en nuage pour la création de modèles d'apprentissage automatique. Sélection d'algorithme : HeatWave ML utilise la notion de modèles proxy—qui sont des modèles simples présentant les propriétés d'un modèle complexe complet—pour déterminer le meilleur algorithme ML pour la formation. En utilisant un modèle proxy simple, la sélection des algorithmes se fait très efficacement sans perte de précision. Aucun autre service de base de données permettant de construire des modèles d'apprentissage automatique ne dispose de cette capacité de modélisation par procuration. Échantillonnage intelligent des données : Pendant l'apprentissage du modèle, HeatWave ML échantillonne un petit pourcentage des données afin d'améliorer les performances. Cet échantillonnage est effectué de manière à ce que tous les points de données représentatifs soient capturés dans l'ensemble de données échantillon. D'autres services en nuage pour la création de modèles d'apprentissage automatique adoptent une approche moins efficace : l'échantillonnage aléatoire des données, qui échantillonne un petit pourcentage de données sans tenir compte des caractéristiques de distribution des données. Sélection des caractéristiques : La sélection des caractéristiques permet de déterminer les attributs des données d'apprentissage qui influencent le comportement du modèle d'apprentissage automatique pour faire des prédictions. Les techniques de HeatWave ML pour la sélection des caractéristiques ont été formées sur un large éventail d'ensembles de données dans plusieurs domaines et applications. À partir de ces statistiques et méta-informations recueillies, HeatWave ML est capable d'identifier efficacement les caractéristiques pertinentes dans un nouvel ensemble de données. Outre les capacités d'apprentissage automatique, Oracle a publié d'autres innovations pour le service HeatWave de MySQL. L'élasticité en temps réel permet aux clients d'augmenter et de réduire la taille de leur cluster HeatWave à n'importe quel nombre de nœuds, sans aucun temps d'arrêt ou de lecture, et sans avoir à rééquilibrer manuellement le cluster. La compression des données est également incluse, ce qui permet aux clients de traiter deux fois la quantité de données par nœud et de réduire les coûts de près de 50 %, tout en conservant le même rapport prix/performance. Enfin, une nouvelle fonction de pause et de reprise permet aux clients de mettre HeatWave en pause pour économiser des coûts. Lors de la reprise, les données et les statistiques nécessaires à MySQL Autopilot sont automatiquement rechargées dans HeatWave.