Le fabricant de chatGPT OpenAI a annoncé mardi qu'il retardait d'un mois le lancement de sa fonction "Voice Mode", qui sera lancée en juillet, en raison de problèmes techniques.

L'entreprise avait initialement prévu de proposer cette expérience de conversation vocale réaliste à un petit groupe d'utilisateurs de ChatGPT Plus à la fin du mois de juin, mais elle a indiqué qu'elle la reportait parce qu'elle avait besoin de temps pour atteindre son niveau de lancement.

"Par exemple, nous améliorons la capacité du modèle à détecter et à refuser certains contenus. Nous travaillons également à l'amélioration de l'expérience utilisateur et préparons notre infrastructure à évoluer vers des millions d'utilisateurs tout en maintenant des réponses en temps réel", a déclaré OpenAI dans un message publié sur la plateforme de médias sociaux X.

La fonction sera d'abord proposée à un petit groupe d'utilisateurs afin de recueillir leurs commentaires, puis sera mise à la disposition de tous les utilisateurs de Plus à l'automne, sous réserve de contrôles de sécurité et de fiabilité, a précisé l'entreprise.

OpenAI travaille également au déploiement de nouvelles fonctionnalités de vidéo et de partage d'écran.

En mai, elle a annoncé qu'elle lancerait un nouveau modèle d'IA appelé GPT-4o, capable de conversations vocales réalistes et d'interagir avec du texte et des images, sa dernière initiative pour rester en tête dans la course à la domination des technologies d'IA émergentes.

Les nouvelles capacités audio permettront aux utilisateurs de parler à ChatGPT et d'obtenir des réponses en temps réel sans délai, ainsi que d'interrompre ChatGPT pendant qu'il parle - deux caractéristiques des conversations réalistes que les assistants vocaux de l'IA ont trouvé difficiles. (Reportage de Juby Babu à Mexico ; rédaction de Pooja Desai)