L'entreprise avait initialement prévu de proposer cette expérience de conversation vocale réaliste à un petit groupe d'utilisateurs de ChatGPT Plus à la fin du mois de juin, mais elle a indiqué qu'elle la reportait parce qu'elle avait besoin de temps pour atteindre son niveau de lancement.
"Par exemple, nous améliorons la capacité du modèle à détecter et à refuser certains contenus. Nous travaillons également à l'amélioration de l'expérience utilisateur et préparons notre infrastructure à évoluer vers des millions d'utilisateurs tout en maintenant des réponses en temps réel", a déclaré OpenAI dans un message publié sur la plateforme de médias sociaux X.
La fonction sera d'abord proposée à un petit groupe d'utilisateurs afin de recueillir leurs commentaires, puis sera mise à la disposition de tous les utilisateurs de Plus à l'automne, sous réserve de contrôles de sécurité et de fiabilité, a précisé l'entreprise.
OpenAI travaille également au déploiement de nouvelles fonctionnalités de vidéo et de partage d'écran.
En mai, elle a annoncé qu'elle lancerait un nouveau modèle d'IA appelé GPT-4o, capable de conversations vocales réalistes et d'interagir avec du texte et des images, sa dernière initiative pour rester en tête dans la course à la domination des technologies d'IA émergentes.
Les nouvelles capacités audio permettront aux utilisateurs de parler à ChatGPT et d'obtenir des réponses en temps réel sans délai, ainsi que d'interrompre ChatGPT pendant qu'il parle - deux caractéristiques des conversations réalistes que les assistants vocaux de l'IA ont trouvé difficiles. (Reportage de Juby Babu à Mexico ; rédaction de Pooja Desai)