OpenAI o3

Fin décembre 2024, OpenAI a présenté o3, un nouveau modèle d’IA qui fait progresser la façon dont les systèmes d’IA traitent les informations. Contrairement à la série GPT, o3 utilise une approche innovante de la résolution de problèmes qui reflète étroitement les processus cognitifs humains.

Nom du modèle

La dénomination du modèle d’OpenAI montre les progrès en matière de capacités et de conception. La série “o”, à commencer par o1, met en évidence les modèles qui mettent l’accent sur les compétences avancées en matière de raisonnement et de résolution de problèmes, ce qui s’écarte de la nomenclature “GPT”. Alors que GPT-4o (“o” pour “omni”) se concentre sur les fonctionnalités multimodales, le traitement du texte, des images et de l’audio, le modèle o3 se concentre sur les tâches de raisonnement et d’analyse.

Innovation technique

OpenAI o3

O3 implémente le “calcul en temps de test”, ce qui lui permet de passer de longues périodes à explorer des solutions, similaires à la pensée humaine. Cela fonctionne en deux modes : calcul élevé pour des performances maximales et calcul faible pour l’efficacité. Même en mode calcul faible, o3 démontre des capacités qui dépassent les critères humains moyens. Les performances de référence du modèle incluent :

  • Précision de 87,5 % sur le benchmark ARC-AGI en mode calcul élevé
  • 25,2 % de précision sur le benchmark Frontier Math, résolvant des problèmes mathématiques au niveau de la recherche

Précision de 76 % sur ARC-AGI en mode de calcul faible, établissant une nouvelle base pour des performances IA efficaces

  • Ces mesures signifient une avancée significative dans les capacités de résolution de problèmes IA

Qu’est-ce qu’OpenAI o3?

OpenAI considère que les modèles o1 et o3 sont à la pointe du développement LLM. En tant que modèle de raisonnement, o3 est conçu pour gérer des tâches plus complexes que les types de modèles existants, tels que GPT-4o. Le modèle o3 utilise un processus appelé raisonnement simulé, qui permet au modèle de faire une pause et de réfléchir à ses processus de pensée internes avant de répondre. Le raisonnement simulé va au-delà de l’incitation à la chaîne de pensée (CoT) pour fournir une approche intégrée et autonome plus avancée de l’auto-analyse et de la réflexion sur la sortie du modèle. Le raisonnement simulé imite le raisonnement humain en identifiant des modèles et en tirant des conclusions basées sur ces modèles.

Que peut faire OpenAI o3?

En tant que modèle basé sur un transformateur, il peut gérer les activités courantes des LLM, y compris les réponses basées sur les connaissances, la synthèse et la génération de texte. Le modèle o3 a des capacités avancées dans plusieurs domaines :

  • Raisonnement avancé. Le modèle est capable d’un raisonnement logique étape par étape et peut gérer des tâches complexes nécessitant une analyse détaillée.
  • Programmation et codage. Le modèle o3 est très compétent en codage, atteignant une précision de 71,7 % sur SWE-bench Verified, un benchmark qui consiste en des tâches logicielles réelles, marquant une amélioration de 20 % par rapport au modèle o1.
  • Mathématiques. Les utilisateurs peuvent exécuter des opérations mathématiques complexes avec le modèle avec une capacité qui surpasse o1. OpenAI a rapporté que o3 a obtenu une précision de 96,7 % à l’American Invitational Mathematics Examination (AIME), contre 83,3 % pour o1.
  • Science. Le modèle o3 sera également utile pour la recherche scientifique. Selon OpenAI, le modèle a atteint une précision de 87,7 % sur GPQA Diamond, une référence testant les questions scientifiques de niveau doctorat.
  • Auto-vérification des faits. O3 peut auto-vérification des faits, améliorant la précision de ses réponses.
  • Adaptabilité à l’intelligence artificielle générale. Parmi les grandes avancées revendiquées par OpenAI pour o3, il y a les performances sur le benchmark ARC-AGI.

OpenAI ou 3-mini

OpenAI o3-mini

Le 31 janvier 2025, OpenAI a publié o3-mini pour tous les utilisateurs de ChatGPT (y compris le niveau gratuit) et certains utilisateurs d’API. O3-mini propose trois niveaux d’effort de raisonnement : faible, moyen et élevé. La version gratuite utilise le moyen. La variante utilisant plus de calcul s’appelle o3-mini-high et est disponible pour les abonnés payants.

OpenAI o3-mini est le modèle le plus récent et le plus rentable de leur série de raisonnements. Ce modèle repousse les limites de ce que les petits modèles peuvent réaliser, offrant des capacités STEM exceptionnelles – avec une force particulière en sciences, mathématiques et codage – tout en maintenant le faible coût et la latence réduite d’OpenAI o1-mini.

Les développeurs peuvent choisir entre trois options d’effort de raisonnement – faible, moyen et élevé – pour optimiser leurs cas d’utilisation spécifiques. Cette flexibilité permet à o3-mini de “réfléchir plus fort” lorsqu’il s’agit de relever des défis complexes ou de prioriser la vitesse lorsque la latence est un problème.

Accès et disponibilité des OpenAI o3 et o3-mini

La version initiale du modèle o3 était restreinte et limitée, principalement utilisée pour les tests de sécurité publique, obligeant les utilisateurs potentiels à demander l’accès. Depuis le 3 février 2025, le modèle o3 de base n’est disponible que dans le cadre du service de recherche approfondie OpenAI, qui est initialement exclusif aux utilisateurs de ChatGPT Pro. Le modèle o3-mini est devenu généralement disponible le 31 janvier 2025. Il est accessible via différents canaux :

  • Accès ChatGPT :
    • Les utilisateurs gratuits ont un accès limité au modèle o3-mini avec des restrictions de taux. Pour y accéder, les utilisateurs du plan gratuit peuvent sélectionner “Raison” dans le composeur de messages ou régénérer une réponse. C’est la première fois qu’un modèle de raisonnement est mis à la disposition des utilisateurs gratuits dans ChatGPT.
    • Les utilisateurs de ChatGPT Plus ont accès au modèle o3-mini avec une limite de 150 messages par jour. Dans le cadre de la mise à niveau, OpenAI triple la limite de débit pour les utilisateurs Plus et Team de 50 messages par jour avec o1-mini à 150 messages par jour avec o3-mini.
    • Les utilisateurs de ChatGPT Pro ont un accès illimité au modèle o3-mini. Les utilisateurs pro ont également la possibilité de sélectionner o3-mini-high dans le sélecteur de modèle pour une version plus intelligente qui prend un peu plus de temps pour générer des réponses.
  • Accès à l’API : le modèle o3-mini est disponible via l’API pour les développeurs avec un prix initial de 1,10 $par million de jetons d’entrée et de 4,40 $par million de jetons de sortie. OpenAI o3-mini est déployé dans l’API de complétion de chat, l’API d’assistants et l’API par lots à partir du 31 janvier 2025, pour sélectionner les développeurs dans les niveaux d’utilisation de l’API 3-5.

Dans ChatGPT, o3-mini utilise un effort de raisonnement moyen pour équilibrer vitesse et précision. Tous les utilisateurs payants ont également la possibilité de sélectionner o3-mini-high dans le sélecteur de modèles pour une version plus intelligente qui prend un peu plus de temps pour générer des réponses.

Techniques de sécurité

Le modèle o3 intègre une technique de sécurité appelée alignement délibératif, utilisant le raisonnement du modèle pour évaluer les implications en matière de sécurité des demandes des utilisateurs. Cette approche permet au modèle d’analyser les invites et d’identifier les intentions cachées, améliorant la précision du rejet de contenu dangereux et évitant les rejets inutiles de contenu sûr.Le 6 février 2025, OpenAI a annoncé une mise à jour pour améliorer la transparence du processus de réflexion dans son modèle o3-mini.

Impact

L’introduction du modèle o3 signifie une évolution vers des systèmes IA capables de gérer des tâches complexes de raisonnement et de résolution de problèmes. Ses performances améliorées et ses fonctionnalités innovantes en font un outil précieux pour diverses applications, du codage à la recherche scientifique.