OpenAI – Annonce du déploiement de la version alpha de la fonction vocale avancée de ChatGPT

Les équipes d’OpenAI viennent d’annoncer le déploiement de la version alpha de la fonction vocale avancée de ChatGPT auprès d’un panel d’utilisateurs de ChatGPT Plus, information partagée sur Twitter le mois dernier.

Fonctionnalités : cette fonction vocale avancée permet des conversations plus naturelles et en temps réel, pouvant être interrompues à tout moment. Elle détecte et répond également aux émotions.

Disponibilité : l’accès à un plus grand nombre d’utilisateurs de ChatGPT Plus sera étendu progressivement au cours des prochaines semaines, avec pour objectif de rendre cette fonctionnalité entièrement disponible pour tous les utilisateurs de ChatGPT Plus à l’automne prochain. Les utilisateurs de cette version alpha recevront une notification dans l’application ChatGPT et un e-mail contenant des instructions sur son utilisation. Les fonctionnalités vidéo et le partage d’écran seront lancés à une date ultérieure. Bien qu’un premier aperçu de la voix de GPT-4o ait été présenté en mai, les équipes d’OpenAI se concentrent actuellement en priorité sur la qualité et la sécurité des conversations vocales de GPT-4o afin de pouvoir offrir cette expérience à tous les utilisateurs de ChatGPT.

Qualité : pour offrir une meilleure expérience utilisateur, les équipes d’OpenAI ont renforcé la capacité du modèle à supporter des millions de conversations vocales simultanées et en temps réel, tout en maintenant une faible latence et une qualité élevée.

Sécurité : en juin dernier, les équipes d’OpenAI ont annoncé qu’elles travaillaient à l’amélioration du modèle pour détecter et refuser certains contenus. Au cours des dix derniers mois, les capacités vocales du modèle ont été testées avec plus de 100 testeurs externes, parlant collectivement 45 langues dans 29 régions géographiques différentes. Suite aux retours des testeurs et aux tests de sécurité internes, voici les mesures qui ont été prises :

  • Afin que le système respecte la vie privée des utilisateurs, la fonction vocale avancée utilisera quatre voix préconfigurées qu’OpenAI a créées en collaboration avec des acteurs vocaux. Les équipes d’OpenAI se sont assurées que ChatGPT ne puisse pas imiter les voix d’autres personnes, qu’il s’agisse d’individus ou de personnalités publiques, et bloquera les sorties qui diffèrent de ces voix préconfigurées.
  • Afin de respecter les droits d’auteur, de nouveaux filtres ont été intégrés. Ces filtres reconnaîtront et bloqueront toutes les demandes de génération de contenus musicaux et audio protégés par des droits d’auteur.
  • Pour que ChatGPT soit le plus utile et collaboratif possible, les mêmes techniques de sécurité appliquées aux textes ont été étendues aux voix, tout en veillant à ce que GPT-4o soit conforme aux lois en vigueur et ne génère pas de contenu nuisible.

Les équipes d’OpenAI partageront au début du mois d’août un rapport détaillé sur l’élaboration de la fonction vocale avancée et les dispositifs mis en place pour offrir une expérience utilisateur plus sûre et plus agréable.

Cette version alpha est déployée dans un objectif d’apprentissage, de test et d’optimisation afin de garantir la meilleure expérience utilisateur possible. En procédant à un déploiement progressif des phases de test, les équipes d’OpenAI peuvent s’assurer du bon fonctionnement du dispositif et de la sécurité des fonctionnalités grâce aux retours des testeurs.

Click to rate this post!
[Total: 0 Average: 0]