OpenAI a récemment présenté la série o1, une nouvelle génération de grands modèles de langage (LLM) spécialement conçus pour s’attaquer à des tâches de raisonnement complexes. Cette introduction marque une évolution significative de la technologie IA, en se concentrant sur des processus de raisonnement plus profonds qui permettent à ces modèles de fonctionner à des niveaux comparables à ceux des experts humains dans des sujets difficiles.
Qu’est-ce qu’OpenAI o1
Caractéristiques clés d’OpenAI o1
- Compétences de raisonnement améliorées : L’amélioration la plus notable d’OpenAI o1 est sa capacité de raisonnement avancée. Le modèle a été conçu pour passer plus de temps à réfléchir aux problèmes, ce qui lui permet de mieux performer dans les tâches liées aux STEM, d’obtenir des résultats comparables à ceux des doctorants dans diverses disciplines scientifiques et de se classer très bien dans les tests de codage compétitifs. Par exemple, lors des tests, le modèle o1-preview a obtenu 83 % à un examen de qualification aux Olympiades internationales de mathématiques, surpassant largement son prédécesseur, GPT-4o, qui n’a obtenu que 13 %.
- Raisonnement de la chaîne de pensée : OpenAI o1 utilise une méthode connue sous le nom de “raisonnement de la chaîne de pensée”. Cette approche permet au modèle d’analyser les invites de manière plus approfondie avant de fournir une réponse, ce qui se traduit par des temps de réponse plus longs mais des résultats plus précis et raisonnés1.
- Performance améliorée : Lors de tests tels que l’examen de qualification aux Olympiades internationales de mathématiques, o1 a surpassé de manière significative le GPT-4o, résolvant 83 % des problèmes contre seulement 13 % par son prédécesseur.
- Améliorations de la sécurité : La série o1 a été développée avec un accent sur la sécurité, ce qui rend le jailbreak plus difficile que les modèles précédents. Cette amélioration vient après une collaboration avec les instituts de sécurité IA et les organismes gouvernementaux.
- Nouvelle convention de dénomination : cette version marque une rupture avec la convention de dénomination traditionnelle “GPT”, reflétant un changement vers ce qu’OpenAI décrit comme un nouveau “paradigme de raisonnement” plutôt que l’ancien “paradigme de pré-formation” utilisé dans les modèles précédents
Applications
- Recherche scientifique : Le modèle peut aider les chercheurs à analyser des ensembles de données ou à générer des hypothèses basées sur les connaissances existantes.
- Développement logiciel : dans les environnements de codage, tels que GitHub Copilot, o1-preview peut optimiser les algorithmes et déboguer le code plus efficacement que les modèles précédents. Les tests initiaux ont montré sa capacité à analyser le code en profondeur et à suggérer des améliorations basées sur une compréhension approfondie des contraintes et des cas extrêmes.
- Mathématiques et ingénierie : les capacités de raisonnement avancées du modèle le rendent apte à résoudre des problèmes difficiles en physique ou en ingénierie, où des calculs précis et des déductions logiques sont cruciaux.
Améliorations de la sécurité
OpenAI a donné la priorité à la sécurité dans le développement de la série o1. Les modèles sont formés avec un nouveau cadre de sécurité qui exploite leurs capacités de raisonnement avancées pour adhérer plus étroitement aux directives de sécurité. Par exemple, lors de tests conçus pour évaluer dans quelle mesure le modèle suit les protocoles de sécurité face aux tentatives de les contourner (connu sous le nom de “jailbreak”), le modèle o1-preview a obtenu 84 sur 100 – nettement mieux que le score de 22 de GPT-4o.
Pour garantir une utilisation responsable de ces outils puissants, OpenAI a également renforcé sa gouvernance interne et établi un partenariat avec les instituts de sécurité IA aux États-Unis et au Royaume-Uni. Ces collaborations visent à développer des protocoles de sécurité robustes dans le cadre des évaluations continues des performances des modèles.
Accéder aux modèles OpenAI o1
Les modèles o1 sont accessibles aux utilisateurs de ChatGPT Plus et Team. Depuis le 12 septembre 2024, ils peuvent sélectionner le modèle o1-preview ou o1-mini directement dans le sélecteur de modèles. Les limites de débit initiales sont fixées à 30 messages par semaine pour o1-preview et 50 messages par semaine pour o1-mini, avec des attentes pour que ces limites augmentent avec le temps à mesure qu’OpenAI recueille les commentaires des utilisateurs.
Utilisateurs de ChatGPT Pro. Le niveau ChatGPT Pro à 200 $par mois est la première exclusivité du modèle o1 pro.
OpenAI s’est engagé à fournir un accès aux deux modèles o1 pour les utilisateurs de ChatGPT Enterprise et Education à partir du 19 septembre 2024.
Les développeurs peuvent accéder aux modèles o1-preview et o1-mini via l’API d’OpenAI. Cela permet une intégration dans des applications et des flux de travail personnalisés.
Diverses plates-formes, y compris les modèles Microsoft Azure IA Studio et GitHub, ont intégré les modèles o1, permettant un accès plus large dans différents environnements.
Tableau de comparaison OpenAI o1 vs GPT-4o
Caractéristique / Aspect | OpenAI o1 | GPT-4o |
Capacité de raisonnement | Supérieur ; 83 % à l’examen IMO | Limité ; 13 % à l’examen IMO |
Conscience contextuelle | Temps de traitement amélioré | Traitement standard |
Fenêtre contextuelle | Jusqu’à 128 000 jetons | Fenêtre contextuelle plus petite |
Mesures de performance | 89e centile dans les tests de codage | Baisse des performances dans les tâches complexes |
Protocoles de sécurité | Amélioration de la conformité en matière de sécurité | Protocoles de sécurité standard |
Structure de prix | 15,00 $par million de jetons d’entrée (o1), 3,00 $(o1-mini) | 2,50 $par million de jetons d’entrée (GPT-4o), 0,15 $(GPT-4o mini) |
Cas d’utilisation | Tâches STEM avancées, analyse juridique, service client, assistance sanitaire | Applications à usage général, tâches de codage de base |
Date de sortie | 12 septembre 2024 | Mars 2023 |
Développements futurs
OpenAI a l’intention de continuer à faire évoluer la série o1 parallèlement à ses modèles GPT existants. Les futures mises à jour pourraient inclure des fonctionnalités supplémentaires telles que les capacités de navigation Web et la prise en charge des téléchargements de fichiers. Ces améliorations visent à élargir l’applicabilité des modèles o1 dans divers domaines tout en maintenant leur concentration sur les tâches de raisonnement complexes.
L’introduction de la série o1 d’OpenAI représente un bond en avant significatif dans la capacité de l’IA à effectuer des tâches de raisonnement complexes. En se concentrant sur des processus de réflexion plus profonds et en améliorant les mesures de sécurité, OpenAI établit une nouvelle norme pour ce que l’IA peut accomplir dans les domaines nécessitant des compétences sophistiquées en résolution de problèmes. À mesure que ces modèles deviennent plus accessibles et subissent un développement ultérieur, ils sont très prometteurs pour transformer la façon dont les professionnels abordent les problèmes difficiles dans diverses disciplines.