Nowa wersja Grok AI Elona Muska poprawia możliwości kodowania i matematyki
xAI
Należąca do Elona Muska firma xAI udostępniła wczesnym testerom zaktualizowaną wersję swojego wielkoskalowego modelu językowego Grok-1.5. Według firmy, nowa iteracja wykazuje ulepszone możliwości i umiejętności rozumowania, a także zdolność do obsługi dłuższych kontekstów.
Co wiadomo
Według xAI, Grok-1.5 przewyższa konkurencyjne modele, takie jak GPT-4 OpenAI, Gemini Pro 1.5 Google i Claude 3 Opus firmy Anthropic w wielu testach porównawczych związanych z zadaniami matematycznymi i kodowaniem.
W szczególności wyniki Grok-1.5 w benchmarkach MATH, GSM8K (matematyka) i HumanEval (kodowanie) znacznie się poprawiły w porównaniu do poprzedniej wersji i przewyższyły konkurencję, z wyjątkiem Claude 3 Opus w teście HumanEval.
Porównanie Grok-1.5 z innymi modelami językowymi w popularnych benchmarkach
Ponadto nowa wersja Grok może przetwarzać konteksty o długości do 128 000 tokenów, czyli 16 razy więcej niż poprzednia wersja. Pozwala to modelowi łączyć informacje z większych źródeł w celu lepszego zrozumienia sytuacji.
Pomimo deklarowanego postępu w matematyce i kodowaniu, xAI nie podało szczegółów na temat ulepszeń Groka w innych obszarach, w których może on nadal pozostawać w tyle za konkurencją.
Obecnie Grok jest dostępny tylko dla użytkowników premium platformy X (dawniej Twitter) należącej do Elona Muska. Oczekuje się jednak, że chatbot zostanie udostępniony zwykłym użytkownikom X w najbliższej przyszłości.
Wydanie zaktualizowanej wersji Groka następuje w oczekiwaniu na kolejną dużą aktualizację ChatGPT od OpenAI, która obiecuje zaoferować bardziej podobne do ludzkich interakcje ze sztuczną inteligencją.
Źródło: Engadget