OtwórzAI o3

Pod koniec grudnia 2024 r. firma OpenAI zaprezentowała o3, nowy model sztucznej inteligencji, który rozwija sposób, w jaki systemy sztucznej inteligencji przetwarzają informacje. W przeciwieństwie do serii GPT, o3 wykorzystuje innowacyjne podejście do rozwiązywania problemów, które ściśle odzwierciedla ludzkie procesy poznawcze.

Nazwa modelu

Nazewnictwo modeli OpenAI wskazuje na postęp w zakresie możliwości i projektu. Seria „o”, zaczynająca się od o1, obejmuje modele kładące nacisk na zaawansowane umiejętności rozumowania i rozwiązywania problemów, co odbiega od nomenklatury „GPT”. Chwila GPT-4o („o” jak „omni”) koncentruje się na funkcjach multimodalnych, przetwarzaniu tekstu, obrazów i dźwięku, model o3 skupia się na zadaniach wymagających rozumowania i analizy.

Innowacje techniczne

OtwórzAI o3

O3 wdraża „obliczenia w czasie testowania”, które pozwalają firmie spędzać długie okresy czasu na badaniu rozwiązań, podobnie jak dzieje się to w przypadku myślenia ludzkiego. Działa w dwóch trybach: wysokim obciążeniu obliczeniowym dla maksymalnej wydajności i niskim obciążeniu obliczeniowym dla efektywności. Nawet w trybie nisko-obliczeniowym o3 wykazuje możliwości wykraczające poza przeciętne ludzkie kryteria. Wydajność modelu w testach porównawczych obejmuje:

  • 87,5% dokładności w teście porównawczym ARC-AGI w trybie obliczeń o wysokiej wydajności
  • Dokładność na poziomie 25,2% w teście Frontier Math, rozwiązywanie problemów matematycznych na poziomie badawczym

Dokładność na poziomie 76% w ARC-AGI w trybie niskiego obciążenia obliczeniowego, wyznaczając nowy poziom odniesienia dla wydajnej wydajności sztucznej inteligencji

  • Środki te stanowią znaczący postęp w zakresie możliwości rozwiązywania problemów przez sztuczną inteligencję.

Czym jest OpenAI o3?

OpenAI bierze pod uwagę modele o1 i oXNUMX o3 są pionierami w rozwoju LLM. Jako model wnioskowania o3 został zaprojektowany do obsługi bardziej złożonych zadań niż istniejące typy modeli, takie jak GPT-4o. Model o3 wykorzystuje proces zwany symulowanym rozumowaniem, który pozwala modelowi zatrzymać się i zastanowić nad wewnętrznymi procesami myślowymi przed udzieleniem odpowiedzi. Symulowane rozumowanie wykracza poza pobudzanie łańcucha myślowego (CoT), zapewniając bardziej zaawansowane, zintegrowane i autonomiczne podejście do autoanalizy i refleksji nad wynikami modelu. Symulowane rozumowanie naśladuje ludzkie rozumowanie poprzez identyfikację wzorców i wyciąganie wniosków na ich podstawie.

Co potrafi OpenAI o3?

Jako model oparty na transformatorach może obsługiwać typowe działania LLM, w tym udzielanie odpowiedzi opartych na wiedzy, podsumowywanie i generowanie tekstu. Model o3 ma zaawansowane możliwości w kilku obszarach :

  • Zaawansowane rozumowanie. Model ten umożliwia logiczne rozumowanie krok po kroku i radzi sobie ze złożonymi zadaniami wymagającymi szczegółowej analizy.
  • Programowanie i kodowanie. Model o3 jest bardzo kompetentny w kodowaniu i osiągnął dokładność na poziomie 71,7% w SWE-bench Verified, teście obejmującym rzeczywiste zadania programistyczne, co oznacza 20% poprawę w stosunku do modelu o1.
  • Matematyka. Użytkownicy mogą wykonywać skomplikowane operacje matematyczne za pomocą modelu o możliwościach przewyższających o1. Firma OpenAI podała, że ​​o3 osiągnął 96,7% dokładności w teście American Invitational Mathematics Examination (AIME), podczas gdy o83,3 uzyskał wynik 1%.
  • Nauka. Model o3 będzie również przydatny w badaniach naukowych. Według OpenAI model osiągnął dokładność 87,7% w teście GPQA Diamond, który sprawdza odpowiedzi na pytania z zakresu nauk ścisłych na poziomie doktoranckim.
  • Samodzielne sprawdzanie faktów. O3 może samodzielnie weryfikować fakty, zwiększając dokładność swoich odpowiedzi.
  • Możliwość dostosowania do ogólnej sztucznej inteligencji. Jednym z głównych postępów, jakie według OpenAI osiągnięto w przypadku o3, jest wydajność w teście ARC-AGI.

OpenAI lub 3-mini

OtwartaAI o3-mini

31 stycznia 2025 r. wydano OpenAI o3-mini dla wszystkich użytkowników ChatGPT (w tym użytkowników wersji bezpłatnej) i niektórych użytkowników API. O3-mini oferuje trzy poziomy wysiłku rozumowania: niski, średni i wysoki. Wersja darmowa wykorzystuje to medium. Wersja wymagająca większej ilości obliczeń nosi nazwę o3-mini-high i jest dostępna dla płacących abonentów.

OpenAI o3-mini to najnowszy i najbardziej ekonomiczny model w serii systemów rozumujących. Model ten poszerza granice możliwości małych modeli, zapewniając wyjątkowe możliwości STEM – ze szczególnym uwzględnieniem nauk ścisłych, matematyki i kodowania – przy jednoczesnym zachowaniu niskich kosztów i małych opóźnień OpenAI o1-mini.

Programiści mogą wybierać pomiędzy trzema opcjami wysiłku rozumowania – niskim, średnim i wysokim – aby zoptymalizować konkretne przypadki użycia. Dzięki tej elastyczności o3-mini może „myśleć intensywniej” podczas stawiania czoła złożonym wyzwaniom lub priorytetowo traktować szybkość, gdy problemem jest opóźnienie.

Dostępność i dostępność OpenAI o3 i o3-mini

Początkowa wersja modelu o3 była ograniczona i wykorzystywana głównie do testów bezpieczeństwa publicznego. Wymagała od potencjalnych użytkowników złożenia wniosku o dostęp. Od 3 lutego 2025 r. podstawowy model o3 będzie dostępny wyłącznie w ramach usługi głębokiego wyszukiwania OpenAI, która początkowo będzie dostępna wyłącznie dla użytkowników ChatGPT Pro. Model o3-mini stał się ogólnie dostępny 31 stycznia 2025 r. Jest dostępny za pośrednictwem różnych kanałów:

  • Dostęp ChatGPT :
    • Użytkownicy korzystający z bezpłatnego abonamentu mają ograniczony dostęp do modelu o3-mini z powodu ograniczeń prędkości. Aby uzyskać do niego dostęp, użytkownicy planu bezpłatnego mogą wybrać opcję „Powód” w edytorze wiadomości lub ponownie wygenerować odpowiedź. Po raz pierwszy model wnioskowania został udostępniony użytkownikom darmowym w ChatGPT.
    • Użytkownicy ChatGPT Plus mają dostęp do modelu o3-mini z limitem 150 wiadomości dziennie. W ramach aktualizacji OpenAI potraja limit przepustowości dla użytkowników kont Plus i Team, z 50 wiadomości dziennie w przypadku o1-mini do 150 wiadomości dziennie w przypadku o3-mini.
    • Użytkownicy ChatGPT Pro mają nieograniczony dostęp do modelu o3-mini. Użytkownicy Pro mają również możliwość wyboru o3-mini-wysoki w selektorze szablonów, aby skorzystać z inteligentniejszej wersji, w której generowanie odpowiedzi zajmuje nieco więcej czasu.
  • Dostęp przez API: Model o3-mini jest dostępny za pośrednictwem API dla deweloperów. Jego początkowa cena wynosi 1,10 USD za milion tokenów wejściowych i 4,40 USD za milion tokenów wyjściowych. Rozwiązanie OpenAI o3-mini będzie wdrażane w interfejsach Chat Completion API, Assistants API i Batch API od 31 stycznia 2025 r. i będzie dostępne dla wybranych deweloperów w poziomach użytkowania interfejsu API 3–5.

W ChatGPT o3-mini wykorzystuje średni wysiłek rozumowania w celu zrównoważenia szybkości i dokładności. Wszyscy użytkownicy płacący mają również możliwość wyboru o3-mini-wysoki w selektorze szablonów, aby skorzystać z inteligentniejszej wersji, w której generowanie odpowiedzi zajmuje nieco więcej czasu.

Techniki bezpieczeństwa

Model o3 wykorzystuje technikę bezpieczeństwa zwaną deliberatywnym dopasowaniem, wykorzystującą wnioskowanie modelowe do oceny skutków bezpieczeństwa żądań użytkowników. To podejście pozwala modelowi analizować monity i identyfikować ukryte intencje, zwiększając dokładność odrzucania niebezpiecznych treści i unikając niepotrzebnych odrzuceń bezpiecznych treści. 6 lutego 2025 r. OpenAI ogłosiło aktualizację w celu zwiększenia przejrzystości procesu myślowego w swoim modelu o3-mini.

Rezultat

Wprowadzenie modelu o3 oznacza ewolucję w kierunku systemów sztucznej inteligencji zdolnych do radzenia sobie ze złożonymi zadaniami związanymi z rozumowaniem i rozwiązywaniem problemów. Dzięki udoskonalonej wydajności i innowacyjnym funkcjom jest to cenne narzędzie do różnych zastosowań, od kodowania po badania naukowe.