Nowa wersja Grok AI Elona Muska poprawia możliwości kodowania i matematyki

Aktualizacja: 02.04.2024, 09:38

xAI

Należąca do Elona Muska firma xAI udostępniła wczesnym testerom zaktualizowaną wersję swojego wielkoskalowego modelu językowego Grok-1.5. Według firmy, nowa iteracja wykazuje ulepszone możliwości i umiejętności rozumowania, a także zdolność do obsługi dłuższych kontekstów.

Co wiadomo

Według xAI, Grok-1.5 przewyższa konkurencyjne modele, takie jak GPT-4 OpenAI, Gemini Pro 1.5 Google i Claude 3 Opus firmy Anthropic w wielu testach porównawczych związanych z zadaniami matematycznymi i kodowaniem.

W szczególności wyniki Grok-1.5 w benchmarkach MATH, GSM8K (matematyka) i HumanEval (kodowanie) znacznie się poprawiły w porównaniu do poprzedniej wersji i przewyższyły konkurencję, z wyjątkiem Claude 3 Opus w teście HumanEval.

Porównanie Grok-1.5 z innymi modelami językowymi w popularnych benchmarkach

Ponadto nowa wersja Grok może przetwarzać konteksty o długości do 128 000 tokenów, czyli 16 razy więcej niż poprzednia wersja. Pozwala to modelowi łączyć informacje z większych źródeł w celu lepszego zrozumienia sytuacji.

Pomimo deklarowanego postępu w matematyce i kodowaniu, xAI nie podało szczegółów na temat ulepszeń Groka w innych obszarach, w których może on nadal pozostawać w tyle za konkurencją.

Obecnie Grok jest dostępny tylko dla użytkowników premium platformy X (dawniej Twitter) należącej do Elona Muska. Oczekuje się jednak, że chatbot zostanie udostępniony zwykłym użytkownikom X w najbliższej przyszłości.

Wydanie zaktualizowanej wersji Groka następuje w oczekiwaniu na kolejną dużą aktualizację ChatGPT od OpenAI, która obiecuje zaoferować bardziej podobne do ludzkich interakcje ze sztuczną inteligencją.

Źródło: Engadget