A OpenAI introduziu recentemente a série o1, uma nova geração de grandes modelos de linguagem (LLMs) projetados especificamente para lidar com tarefas complexas de raciocínio. Esta introdução marca uma evolução significativa na tecnologia de IA, concentrando-se em processos de raciocínio mais profundos que permitem que estes modelos tenham um desempenho em níveis comparáveis aos de especialistas humanos em tópicos difíceis.
O que é OpenAI o1
Principais recursos do OpenAI o1
- Habilidades de raciocínio aprimoradas: A melhoria mais notável no OpenAI o1 é sua capacidade avançada de raciocínio. O modelo foi projetado para passar mais tempo pensando nos problemas, permitindo um melhor desempenho em tarefas relacionadas a STEM, para alcançar resultados comparáveis aos de estudantes de doutorado em diversas disciplinas científicas e para obter uma classificação elevada em testes de codificação competitivos. Por exemplo, nos testes, o modelo o1-preview obteve 83% em um exame de qualificação para a Olimpíada Internacional de Matemática, superando significativamente seu antecessor, GPT-4o, que recebeu apenas 13%.
- Cadeia de raciocínio de pensamento: OpenAI o1 usa um método conhecido como “raciocínio em cadeia de pensamento”. Essa abordagem permite que o modelo analise os prompts de forma mais completa antes de fornecer uma resposta, resultando em tempos de resposta mais lentos, mas em resultados mais precisos e fundamentados1.
- Performance melhorada: Em testes como o exame de qualificação para a Olimpíada Internacional de Matemática, o1 superou significativamente o GPT-4o, resolvendo 83% dos problemas, em comparação com apenas 13% do seu antecessor.
- Melhorias de segurança: A série o1 foi desenvolvida com foco na segurança, tornando o jailbreak mais difícil do que os modelos anteriores. Esta melhoria surge após a colaboração com institutos de segurança de IA e agências governamentais.
- Nova convenção de nomenclatura: Este lançamento marca uma ruptura com a convenção de nomenclatura tradicional “GPT”, refletindo uma mudança em direção ao que a OpenAI descreve como um novo “paradigma de raciocínio” em vez do antigo “paradigma de pré-treinamento” usado em modelos anteriores
Aplicações
- Pesquisa científica : O modelo pode ajudar os pesquisadores a analisar conjuntos de dados ou gerar hipóteses com base no conhecimento existente.
- Desenvolvimento de software: Em ambientes de codificação, como GitHub Copilot, o1-preview pode otimizar algoritmos e depurar código com mais eficiência do que os modelos anteriores. Os testes iniciais mostraram sua capacidade de analisar código em profundidade e sugerir melhorias com base em uma compreensão profunda de restrições e casos extremos.
- Matemática e engenharia: As capacidades avançadas de raciocínio do modelo tornam-no adequado para resolver problemas difíceis em física ou engenharia, onde cálculos precisos e deduções lógicas são cruciais.
Melhorias de segurança
A OpenAI priorizou a segurança no desenvolvimento da série o1. Os modelos são treinados com uma nova estrutura de segurança que aproveita seus recursos avançados de raciocínio para aderir mais de perto às diretrizes de segurança. Por exemplo, em testes projetados para avaliar quão bem o modelo segue os protocolos de segurança diante de tentativas de contorná-los (conhecidos como “jailbreaking”), o modelo o1-preview obteve pontuação de 84 em 100 – significativamente melhor do que a pontuação GPT-22o de 4.
Para garantir a utilização responsável destas ferramentas poderosas, a OpenAI também reforçou a sua governação interna e estabeleceu parcerias com AI Safety Institutes nos EUA e no Reino Unido. Essas colaborações visam desenvolver protocolos de segurança robustos como parte de avaliações contínuas de desempenho de modelos.
Acesse modelos OpenAI o1
Os modelos o1 estão disponíveis para usuários ChatGPT Plus e Team. Desde 12 de setembro de 2024, eles podem selecionar o modelo o1-preview ou o1-mini diretamente no seletor de modelos. Os limites de taxa iniciais são definidos em 30 mensagens por semana para o1-preview e 50 mensagens por semana para o1-mini, com expectativas de que esses limites aumentem ao longo do tempo, à medida que a OpenAI coleta feedback do usuário.
Usuários de ChatGPT Pro. O nível ChatGPT Pro de US$ 200 por mês é o primeiro exclusivo do modelo o1 pro.
A OpenAI se comprometeu a fornecer acesso a ambos os modelos o1 para usuários ChatGPT Enterprise e Education a partir de 19 de setembro de 2024.
Os desenvolvedores podem acessar os modelos o1-preview e o1-mini por meio da API OpenAI. Isso permite a integração em aplicativos e fluxos de trabalho personalizados.
Várias plataformas, incluindo modelos Microsoft Azure IA Studio e GitHub, integraram modelos o1, permitindo acesso mais amplo em diferentes ambientes.
Tabela de comparação OpenAI o1 vs GPT-4o
Característica / Aparência | OpenAI o1 | GPT-4o |
Capacidade de raciocínio | Superior; 83% no exame IMO | Limite; 13% no exame IMO |
Consciência contextual | Melhor tempo de processamento | Processamento padrão |
Janela pop-up | Até 128 tokens | Pop-up menor |
Medidas de desempenho | 89º percentil em testes de codificação | Diminuição do desempenho em tarefas complexas |
Protocolos de segurança | Conformidade de segurança aprimorada | Protocolos de segurança padrão |
Estrutura de preços | US$ 15,00 por milhão de tokens de entrada (o1), US$ 3,00 (o1-mini) | US$ 2,50 por milhão de tokens de entrada (GPT-4o), US$ 0,15 (GPT-4o mini) |
Caso de uso | Tarefas STEM avançadas, análise jurídica, atendimento ao cliente, assistência médica | Aplicativos de uso geral, tarefas básicas de codificação |
Data de Lançamento | 12 de setembro de 2024 | Março 2023 |
Desenvolvimentos futuros
OpenAI pretende continuar evoluindo a série o1 junto com seus modelos GPT existente. Atualizações futuras podem incluir recursos adicionais, como recursos de navegação na web e suporte para download de arquivos. Essas melhorias visam ampliar a aplicabilidade dos modelos o1 em vários domínios, mantendo seu foco em tarefas complexas de raciocínio.
A introdução da série o1 da OpenAI representa um salto significativo na capacidade da IA de realizar tarefas complexas de raciocínio. Ao concentrar-se em processos de pensamento mais profundos e na melhoria das medidas de segurança, a OpenAI estabelece um novo padrão para o que a IA pode realizar em campos que exigem competências sofisticadas de resolução de problemas. À medida que estes modelos se tornam mais acessíveis e passam por um maior desenvolvimento, eles representam uma grande promessa para transformar a forma como os profissionais abordam problemas difíceis em diversas disciplinas.