OpenAI o3

Alla fine di dicembre 2024, OpenAI ha introdotto o3, un nuovo modello di intelligenza artificiale che migliora il modo in cui i sistemi di intelligenza artificiale elaborano le informazioni. A differenza della serie GPT, o3 utilizza un approccio innovativo alla risoluzione dei problemi che rispecchia fedelmente i processi cognitivi umani.

Nome del modello

La denominazione dei modelli di OpenAI mostra progressi nelle capacità e nella progettazione. La serie “o”, che inizia con o1, evidenzia i modelli che enfatizzano le capacità avanzate di ragionamento e risoluzione dei problemi, che si discostano dalla nomenclatura “GPT”. Mentre GPT-4o ("o" per "omni") si concentra sulle caratteristiche multimodali, sull'elaborazione di testo, immagini e audio, il modello o3 si concentra su attività di ragionamento e analisi.

Innovazione tecnica

OpenAI o3

O3 implementa il “test-time computing”, che gli consente di trascorrere lunghi periodi di tempo esplorando soluzioni, in modo simile al pensiero umano. Funziona in due modalità: elaborazione elevata per le massime prestazioni e elaborazione bassa per l'efficienza. Anche in modalità di calcolo basso, o3 dimostra capacità che superano i criteri umani medi. Le prestazioni del modello di riferimento includono:

  • Precisione dell'87,5% sul benchmark ARC-AGI in modalità di calcolo elevato
  • Precisione del 25,2% nel benchmark Frontier Math, risolvendo problemi matematici di livello di ricerca

Precisione del 76% su ARC-AGI in modalità di calcolo basso, stabilendo una nuova linea di base per prestazioni AI efficienti

  • Queste misure rappresentano un progresso significativo nelle capacità di risoluzione dei problemi dell'intelligenza artificiale.

Che cos'è OpenAI o3?

OpenAI ritiene che i modelli o1 e oXNUMX o3 sono all'avanguardia nello sviluppo degli LLM. In quanto modello di ragionamento, o3 è progettato per gestire attività più complesse rispetto ai tipi di modello esistenti, come GPT-4o. Il modello o3 utilizza un processo chiamato ragionamento simulato, che consente al modello di fermarsi e riflettere sui propri processi di pensiero interni prima di rispondere. Il ragionamento simulato va oltre la sollecitazione della catena di pensiero (CoT) per fornire un approccio più avanzato, integrato e autonomo all'autoanalisi e alla riflessione sull'output del modello. Il ragionamento simulato imita il ragionamento umano identificando schemi e traendo conclusioni basate su tali schemi.

Cosa può fare OpenAI o3?

In quanto modello basato su trasformatori, è in grado di gestire le comuni attività LLM, tra cui risposte basate sulla conoscenza, riepiloghi e generazione di testo. Il modello o3 ha capacità avanzate in diverse aree :

  • Ragionamento avanzato. Il modello è in grado di effettuare ragionamenti logici passo dopo passo e di gestire attività complesse che richiedono un'analisi dettagliata.
  • Programmazione e codifica. Il modello o3 è molto competente nella codifica, raggiungendo un'accuratezza del 71,7% su SWE-bench Verified, un benchmark costituito da attività software reali, segnando un miglioramento del 20% rispetto al modello o1.
  • Matematica. Gli utenti possono eseguire complesse operazioni matematiche con il modello, con una capacità che supera o1. OpenAI ha riferito che o3 ha raggiunto il 96,7% di precisione nell'American Invitational Mathematics Examination (AIME), rispetto all'83,3% di o1.
  • Scienza. Il modello o3 sarà utile anche per la ricerca scientifica. Secondo OpenAI, il modello ha raggiunto un'accuratezza dell'87,7% su GPQA Diamond, un benchmark che testa le domande scientifiche a livello di dottorato.
  • Autoverifica dei fatti. O3 è in grado di autocontrollare i fatti, migliorando così l'accuratezza delle sue risposte.
  • Adattabilità all'intelligenza artificiale generale. Tra i principali progressi dichiarati da OpenAI per o3 vi è la prestazione nel benchmark ARC-AGI.

OpenAI o 3-mini

OpenAI o3-mini

Il 31 gennaio 2025, OpenAI ha rilasciato o3-mini per tutti gli utenti di ChatGPT (incluso il livello gratuito) e alcuni utenti API. O3-mini offre tre livelli di sforzo di ragionamento: basso, medio e alto. La versione gratuita utilizza il mezzo. La variante che utilizza più calcoli si chiama o3-mini-high ed è disponibile per gli abbonati paganti.

OpenAI o3-mini è il modello più nuovo e conveniente della loro serie di ragionamento. Questo modello amplia i confini di ciò che i piccoli modelli possono realizzare, offrendo eccezionali capacità STEM, con particolare attenzione a scienza, matematica e codifica, mantenendo al contempo i bassi costi e la bassa latenza di OpenAI o1-mini.

Gli sviluppatori possono scegliere tra tre opzioni di sforzo di ragionamento: basso, medio e alto, per ottimizzare i loro casi d'uso specifici. Questa flessibilità consente a o3-mini di "pensare più attentamente" quando affronta sfide complesse o di dare priorità alla velocità quando la latenza è un problema.

Accesso e disponibilità di OpenAI o3 e o3-mini

La versione iniziale del modello o3 era limitata e ristretta, utilizzata principalmente per test di sicurezza pubblica, e richiedeva ai potenziali utenti di richiedere l'accesso. A partire dal 3 febbraio 2025, il modello base o3 è disponibile solo come parte del servizio di ricerca approfondita OpenAI, inizialmente riservato esclusivamente agli utenti di ChatGPT Pro. Il modello o3-mini è diventato disponibile al pubblico il 31 gennaio 2025. È accessibile tramite diversi canali:

  • accesso ChatGPT :
    • Gli utenti gratuiti hanno un accesso limitato al modello o3-mini con restrizioni tariffarie. Per accedervi, gli utenti del piano gratuito possono selezionare "Motivo" nel compositore del messaggio o rigenerare una risposta. Questa è la prima volta che un modello di ragionamento viene reso disponibile agli utenti gratuiti di ChatGPT.
    • Gli utenti di ChatGPT Plus hanno accesso al modello o3-mini con un limite di 150 messaggi al giorno. Come parte dell'aggiornamento, OpenAI triplica il limite di capacità per gli utenti Plus e Team, passando da 50 messaggi al giorno con o1-mini a 150 messaggi al giorno con o3-mini.
    • Gli utenti di ChatGPT Pro hanno accesso illimitato al modello o3-mini. Gli utenti Pro hanno anche la possibilità di selezionare o3-mini-alto nel selettore dei modelli per una versione più intelligente che impiega un po' più di tempo per generare le risposte.
  • Accesso API: il modello o3-mini è disponibile tramite API per gli sviluppatori con un prezzo iniziale di $ 1,10 per milione di token di input e $ 4,40 per milione di token di output. OpenAI o3-mini verrà distribuito alle API Chat Completion, Assistants e Batch a partire dal 31 gennaio 2025, per alcuni sviluppatori selezionati nei livelli di utilizzo API da 3 a 5.

In ChatGPT, o3-mini utilizza uno sforzo di ragionamento medio per bilanciare velocità e precisione. Tutti gli utenti paganti hanno anche la possibilità di selezionare o3-mini-alto nel selettore dei modelli per una versione più intelligente che impiega un po' più di tempo per generare le risposte.

Tecniche di sicurezza

Il modello o3 incorpora una tecnica di sicurezza chiamata allineamento deliberativo, che utilizza il ragionamento del modello per valutare le implicazioni di sicurezza delle richieste degli utenti. Questo approccio consente al modello di analizzare i prompt e identificare le intenzioni nascoste, migliorando l'accuratezza del rifiuto di contenuti pericolosi ed evitando rifiuti non necessari di contenuti sicuri. Il 6 febbraio 2025, OpenAI ha annunciato un aggiornamento per migliorare la trasparenza del processo di pensiero nel suo modello o3-mini.

Impact

L'introduzione del modello o3 segna un'evoluzione verso sistemi di intelligenza artificiale in grado di gestire ragionamenti complessi e attività di risoluzione dei problemi. Le sue prestazioni migliorate e le sue caratteristiche innovative lo rendono uno strumento prezioso per una vasta gamma di applicazioni, dalla codifica alla ricerca scientifica.