OpenAI ogłasza nowe modele rozumowania o3 i o3-mini, które mogą myśleć na ludzkim poziomie
CEO OpenAI, Sam Altman, ogłosił w ostatnim dniu wydarzenia 12 Days of OpenAI nowe modele sztucznej inteligencji o3 i o3-mini, które bazują na poprzednich modelach o1. Modele te wykorzystują metodę "prywatnego łańcucha myśli", która pozwala im planować odpowiedzi z wyprzedzeniem, co nazywa się symulowanym rozumowaniem (SR).
Co wiadomo
Model o3 osiągnął rekordowe wyniki w teście porównawczym ARC-AGI, uzyskując 75,7% przy niskich zasobach obliczeniowych i 87,5% przy wysokich zasobach obliczeniowych, co jest porównywalne z wydajnością człowieka. O3 uzyskał również wynik 96,7% w teście American Invitational Maths 2024 i 87,7% w teście GPQA Diamond, który obejmuje pytania na poziomie licencjackim z biologii, fizyki i chemii. W teście porównawczym Frontier Math firmy EpochAI, o3 rozwiązał 25,2% problemów, podczas gdy żaden inny model nie przekroczył 2%.
Model o3-mini zawiera funkcję adaptacyjnego czasu myślenia, oferując niskie, średnie i wysokie prędkości przetwarzania. OpenAI twierdzi, że wyższe ustawienia obliczeniowe dają lepsze wyniki. Modele te będą dostępne do testowania przez badaczy bezpieczeństwa. Premiera o3-mini planowana jest na koniec stycznia, a o3 wkrótce potem.
Źródło: OpenAI