OpenAI met à niveau l’agent Operator avec le modèle o3 : performances et sécurité améliorées

OpenAI a annoncé une mise à niveau majeure de son agent d’IA autonome, Operator, en remplaçant l’ancien modèle basé sur GPT-4o par une nouvelle version basée sur le modèle avancé OpenAI o3. Cette mise à jour marque une avancée significative dans les capacités et la fiabilité d’Operator, notamment pour les utilisateurs qui utilisent ses fonctionnalités de navigation web et d’interaction avec des logiciels virtuels.

Qu’est-ce qu’Operator ?

Operator est l’agent d’OpenAI (CUA), conçu pour naviguer sur Internet de manière autonome et interagir avec les pages web et les logiciels hébergés dans le cloud, comme un humain : saisie, clic, défilement, etc. Depuis son lancement en avant-première en janvier 2025, Operator est disponible pour les utilisateurs de ChatGPT Pro du monde entier, constituant un outil de pointe pour l’automatisation de tâches en ligne complexes.

Pourquoi passer à o3 ?

Le modèle o3 fait partie de la dernière série « o » d’OpenAI, réputée pour ses capacités de raisonnement, mathématiques et logiques supérieures à celles de son prédécesseur, GPT-4o. Les tests de performance montrent qu’o3 offre des performances de pointe (SOTA) sur des tâches telles qu’OSWorld et WebArena, et surpasse les modèles précédents, tant dans les évaluations techniques que dans les études de préférences humaines.

Améliorations clés d’o3 Operator :

Précision et persistance accrues des tâches : Operator est désormais plus cohérent et précis lors des interactions avec les navigateurs, ce qui améliore les taux d’achèvement des tâches et l’expérience utilisateur.

Réponses plus claires et plus complètes : Le modèle mis à niveau fournit des réponses mieux structurées et plus complètes, facilitant la compréhension et l’utilisation des résultats d’Operator.

Sécurité renforcée : OpenAI a optimisé o3 Operator avec des jeux de données de sécurité supplémentaires adaptés à l’utilisation sur ordinateur. Cela inclut la formation sur les limites de décision pour confirmer ou refuser des actions, réduisant ainsi les risques tels que l’exécution d’activités interdites, la recherche de données sensibles ou la vulnérabilité aux attaques par injection rapide.

Approche de sécurité multicouche : L’architecture de sécurité de la version GPT-4o est conservée, garantissant une protection robuste contre les utilisations abusives.

Limites

Bien qu’il hérite des puissantes capacités de codage d’o3, o3 Operator ne dispose pas d’un accès natif à un environnement de codage ou à un terminal. Ses actions se limitent aux interactions avec un navigateur et des machines virtuelles, mettant l’accent sur la sécurité et le contrôle utilisateur.

Contexte sectoriel

La mise à niveau d’OpenAI s’inscrit dans un contexte de progrès rapides en matière d’agents d’IA autonomes. Des concurrents comme Google et Anthropic développent également des outils similaires, l’API Gemini de Google et les modèles d’Anthropic offrant des capacités comparables pour naviguer, interagir et effectuer des tâches pour le compte des utilisateurs.

Disponibilité

La version mise à niveau d’o3 Operator est disponible exclusivement dans ChatGPT pour les utilisateurs Pro, tandis que l’API Operator continue d’utiliser GPT-4o.

« Nous remplaçons le modèle existant basé sur GPT-4o pour Operator par une version basée sur OpenAI o3. La version de l’API restera basée sur 4o. » — OpenAI

Cette mise à niveau souligne l’engagement continu d’OpenAI à développer des agents d’IA sûrs et autonomes, capables de gérer des tâches numériques de plus en plus complexes avec une supervision minimale.

En savoir plus: OpenAI lance le mode d’enregistrement de ChatGPT

Author

  • Boogie Beckman

    Bienvenue dans mon monde où moi, Boogie Backman, ouvre la voie en tant que PDG de ChatGPT Francais et ChatGPTXOnline. Fort d'un parcours long et stimulant, je suis un ingénieur en développement logiciel avec plus de 10 ans d'expérience, un leader avec une vision et une passion inébranlables.

Laisser un commentaire