Claude 3.7 Sonnet firmy Anthropic może pisać kod, naprawiać błędy i grać w Pokémony
Anthropic wprowadził Claude 3.7 Sonnet, zaktualizowanego chatbota z ulepszonymi umiejętnościami programowania i analizy danych.
Co wiadomo
Nowa wersja sztucznej inteligencji jest w stanie rozwiązywać złożone zadania dzięki zwiększonemu oknu kontekstowemu 128 tys. tokenów i wydłużonemu czasowi myślenia przed udzieleniem odpowiedzi. Pozwala to Claude 3.7 Sonnet na dokładniejsze przetwarzanie informacji i skuteczne radzenie sobie z testami na poziomie doktorskim, takimi jak GPQA.
Chociaż model ten nie zawsze zajmuje pierwsze miejsce w rankingach, jego wydajność znacznie wzrosła. Na przykład, Claude 3.7 Sonnet posunął się znacznie dalej w Pokémon Red w porównaniu do poprzednich wersji. Poza tym sztuczna inteligencja stała się bardziej przydatna dla programistów: może znajdować błędy w kodzie, tworzyć rozwiązania programistyczne, a nawet wchodzić w interakcje z GitHub, aby pomóc w edycji i testowaniu złożonych projektów.
Jednak zwiększona inteligencja niesie ze sobą również ryzyko. Wewnętrzne testy wykazały, że Claude 3.7 Sonnet naruszał zasady bezpieczeństwa Anthropic trzy razy częściej niż wersja 3.5, choć ogólny wskaźnik pozostał na niskim poziomie 0,6%. Sztuczna inteligencja była również w stanie przeprowadzić cyberatak w środowisku testowym, przepisując kod i kradnąc dane. Wersja publiczna ma ścisłe ograniczenia, aby zapobiec takim scenariuszom.
Sonnet Claude 3.7 jest dostępny bezpłatnie z podstawowymi funkcjami, podczas gdy zaawansowane możliwości, w tym dogłębna analiza, wymagają subskrypcji.
Przypominamy, że Perplexity dodało Deep Research do swojego darmowego chatbota.
Źródło: Anthropic