No final de dezembro de 2024, a OpenAI introduziu o o3, um novo modelo de IA que aprimora a maneira como os sistemas de IA processam informações. Diferentemente da série GPT, o o3 usa uma abordagem inovadora para resolução de problemas que reflete de perto os processos cognitivos humanos.
Nome do modelo
A nomenclatura do modelo da OpenAI mostra avanços em recursos e design. A série “o”, começando com o1, destaca modelos que enfatizam o raciocínio avançado e as habilidades de resolução de problemas, o que se desvia da nomenclatura “GPT”. Enquanto GPT-4o (“o” para “omni”) foca em recursos multimodais, processamento de texto, imagens e áudio, o modelo o3 foca em tarefas de raciocínio e análise.
Inovação técnica
O O3 implementa “computação em tempo de teste”, o que lhe permite gastar longos períodos de tempo explorando soluções, semelhante ao pensamento humano. Ele funciona em dois modos: alta computação para desempenho máximo e baixa computação para eficiência. Mesmo em modo computacional baixo, o o3 demonstra capacidades que excedem os critérios humanos médios. Os desempenhos de referência do modelo incluem:
- Precisão de 87,5% no benchmark ARC-AGI em modo de alta computação
- Precisão de 25,2% no benchmark Frontier Math, resolvendo problemas de matemática de nível de pesquisa
Precisão de 76% no ARC-AGI em modo de computação baixa, definindo uma nova linha de base para desempenho de IA eficiente
- Essas medidas representam um avanço significativo nas capacidades de resolução de problemas de IA.
O que é OpenAI o3?
A OpenAI considera que os modelos o1 e oXNUMX o3 estão na vanguarda do desenvolvimento de LLM. Como modelo de raciocínio, o o3 foi projetado para lidar com tarefas mais complexas do que os tipos de modelos existentes, como o GPT-4o. O modelo o3 usa um processo chamado raciocínio simulado, que permite ao modelo fazer uma pausa e refletir sobre seus processos de pensamento internos antes de responder. O raciocínio simulado vai além da solicitação de cadeia de pensamento (CoT) para fornecer uma abordagem mais avançada, integrada e autônoma para autoanálise e reflexão sobre a saída do modelo. O raciocínio simulado imita o raciocínio humano ao identificar padrões e tirar conclusões com base nesses padrões.
O que o OpenAI o3 pode fazer?
Como um modelo baseado em transformador, ele pode lidar com atividades comuns de LLM, incluindo respostas baseadas em conhecimento, resumo e geração de texto. O modelo o3 possui capacidades avançadas em diversas áreas :
- Raciocínio avançado. O modelo é capaz de raciocínio lógico passo a passo e pode lidar com tarefas complexas que exigem análise detalhada.
- Programação e codificação. O modelo o3 é muito competente em codificação, alcançando uma precisão de 71,7% no SWE-bench Verified, um benchmark que consiste em tarefas de software reais, marcando uma melhoria de 20% em relação ao modelo o1.
- Matemática. Os usuários podem executar operações matemáticas complexas com o modelo com uma capacidade que ultrapassa o1. A OpenAI relatou que o o3 alcançou 96,7% de precisão no American Invitational Mathematics Examination (AIME), em comparação com 83,3% do o1.
- Ciência. O modelo o3 também será útil para pesquisas científicas. De acordo com a OpenAI, o modelo alcançou 87,7% de precisão no GPQA Diamond, um benchmark que testa questões científicas de nível de doutorado.
- Autoverificação de fatos. O O3 pode fazer autoverificação de fatos, melhorando a precisão de suas respostas.
- Adaptabilidade à inteligência artificial geral. Entre os principais avanços reivindicados pela OpenAI para o o3 está o desempenho no benchmark ARC-AGI.
OpenAI ou 3-mini
Em 31 de janeiro de 2025, a OpenAI lançou o3-mini para todos os usuários do ChatGPT (incluindo o nível gratuito) e alguns usuários da API. O O3-mini oferece três níveis de esforço de raciocínio: baixo, médio e alto. A versão gratuita usa o meio. A variante que usa mais computação é chamada o3-mini-high e está disponível para assinantes pagantes.
O OpenAI o3-mini é o modelo mais novo e econômico da série de raciocínio. Este modelo ultrapassa os limites do que modelos pequenos podem alcançar, oferecendo recursos STEM excepcionais – com força particular em ciências, matemática e codificação – ao mesmo tempo em que mantém o baixo custo e a baixa latência do OpenAI o1-mini.
Os desenvolvedores podem escolher entre três opções de esforço de raciocínio – baixo, médio e alto – para otimizar seus casos de uso específicos. Essa flexibilidade permite que o o3-mini “pense mais” ao enfrentar desafios complexos ou priorize a velocidade quando a latência é um problema.
Acesso e disponibilidade do OpenAI o3 e o3-mini
A versão inicial do modelo o3 era restrita e limitada, usada principalmente para testes de segurança pública, exigindo que usuários em potencial solicitassem acesso. A partir de 3 de fevereiro de 2025, o modelo base o3 estará disponível apenas como parte do serviço de pesquisa profunda OpenAI, que é inicialmente exclusivo para usuários do ChatGPT Pro. O modelo o3-mini tornou-se disponível ao público em geral em 31 de janeiro de 2025. Ele pode ser acessado por meio de diferentes canais:
- acesso ChatGPT :
- Usuários gratuitos têm acesso limitado ao modelo o3-mini com restrições de taxa. Para acessá-lo, os usuários do plano gratuito podem selecionar “Motivo” no compositor de mensagens ou gerar novamente uma resposta. Esta é a primeira vez que um modelo de raciocínio é disponibilizado para usuários gratuitos no ChatGPT.
- Usuários do ChatGPT Plus têm acesso ao modelo o3-mini com um limite de 150 mensagens por dia. Como parte da atualização, a OpenAI está triplicando o limite de transferência para usuários Plus e Team de 50 mensagens por dia com o1-mini para 150 mensagens por dia com o3-mini.
- Usuários do ChatGPT Pro têm acesso ilimitado ao modelo o3-mini. Usuários profissionais também têm a opção de selecionar o3-mini-alto no seletor de modelos para uma versão mais inteligente que leva um pouco mais de tempo para gerar respostas.
- Acesso à API: O modelo o3-mini está disponível via API para desenvolvedores com um preço inicial de US$ 1,10 por milhão de tokens de entrada e US$ 4,40 por milhão de tokens de saída. O OpenAI o3-mini será implementado na API de conclusão de bate-papo, na API de assistentes e na API de lote a partir de 31 de janeiro de 2025 para desenvolvedores selecionados nos níveis de uso de API 3 a 5.
No ChatGPT, o o3-mini usa esforço médio de raciocínio para equilibrar velocidade e precisão. Todos os usuários pagos também têm a opção de selecionar o3-mini-alto no seletor de modelos para uma versão mais inteligente que leva um pouco mais de tempo para gerar respostas.
Técnicas de segurança
O modelo o3 incorpora uma técnica de segurança chamada alinhamento deliberativo, usando o raciocínio do modelo para avaliar as implicações de segurança das solicitações do usuário. Essa abordagem permite que o modelo analise prompts e identifique intenções ocultas, melhorando a precisão da rejeição de conteúdo perigoso e evitando rejeições desnecessárias de conteúdo seguro. Em 6 de fevereiro de 2025, a OpenAI anunciou uma atualização para melhorar a transparência do processo de pensamento em seu modelo o3-mini.
Impacto
A introdução do modelo o3 significa uma evolução em direção a sistemas de IA capazes de lidar com tarefas complexas de raciocínio e resolução de problemas. Seu desempenho aprimorado e recursos inovadores o tornam uma ferramenta valiosa para uma variedade de aplicações, desde codificação até pesquisa científica.