OpenAI ha annunciato un importante aggiornamento del suo agente di intelligenza artificiale autonomo, Operator, che sostituisce il modello legacy basato su GPT-4o con una nuova versione basata sul modello avanzato OpenAI o3. Questo aggiornamento segna un significativo passo avanti nelle capacità e nell'affidabilità di Operator, in particolare per gli utenti che fanno affidamento sulle sue funzionalità di navigazione web e di interazione con software virtuali.
Che cosa è Operator?
Operator è l'agente di OpenAI (CUA), progettato per navigare in Internet in modo autonomo e interagire con pagine web e software ospitati sul cloud, proprio come un essere umano: digitando, cliccando, scorrendo, ecc. Dal suo lancio in anteprima nel gennaio 2025, Operator è disponibile per gli utenti di ChatGPT Pro in tutto il mondo, costituendo uno strumento all'avanguardia per l'automazione di complesse attività online.
Perché passare a o3?
Le modello o3 Fa parte dell'ultima serie "o" di OpenAI, rinomata per le sue superiori capacità di ragionamento, matematiche e logiche rispetto al suo predecessore, GPT-4o. I test delle prestazioni dimostrano che o3 offre prestazioni allo stato dell'arte (SOTA) in attività come OSWorld e WebArena, e supera i modelli precedenti sia nelle valutazioni tecniche che negli studi sulle preferenze umane.
Miglioramenti chiave nell'operatore o3:
Maggiore precisione e persistenza delle attività: l'operatore è ora più coerente e preciso quando interagisce con i browser, migliorando i tassi di completamento delle attività e l'esperienza utente.
Risposte più chiare e complete: il modello aggiornato fornisce risposte meglio strutturate e più complete, rendendo più facile comprendere e utilizzare i risultati dell'operatore.
Sicurezza migliorata: OpenAI ha ottimizzato o3 Operator con set di dati di sicurezza aggiuntivi, pensati appositamente per l'uso desktop. Questo include l'addestramento sui limiti decisionali per confermare o negare le azioni, riducendo rischi come l'esecuzione di attività vietate, la ricerca di dati sensibili o la vulnerabilità agli attacchi di iniezione rapida.
Approccio di sicurezza multilivello: viene mantenuta l'architettura di sicurezza della versione GPT-4o, garantendo una protezione solida contro l'uso improprio.

Limitazioni
Pur ereditando le potenti capacità di programmazione di o3, o3 Operator non dispone di accesso nativo a un ambiente di programmazione o a un terminale. Le sue azioni sono limitate alle interazioni con un browser e macchine virtuali, il che pone l'accento sulla sicurezza e sul controllo utente.
Contesto settoriale
L'aggiornamento di OpenAI arriva in un contesto di rapidi progressi negli agenti di intelligenza artificiale autonomi. Anche concorrenti come Google e Anthropic stanno sviluppando strumenti simili, con l'API Gemini di Google e i modelli di Anthropic che offrono funzionalità comparabili per navigare, interagire ed eseguire attività per conto degli utenti.
disponibilità
La versione aggiornata di o3 Operator è disponibile esclusivamente in ChatGPT per gli utenti Pro, mentre l'API di Operator continua a utilizzare GPT-4o.
Stiamo sostituendo l'attuale modello basato su GPT-4o per Operator con una versione basata su OpenAI o3. La versione API rimarrà basata su 4o. — OpenAI
Questo aggiornamento sottolinea l'impegno continuo di OpenAI nello sviluppo di agenti di intelligenza artificiale sicuri e autonomi, in grado di gestire attività digitali sempre più complesse con una supervisione minima.


