Meta i Microsoft udostępniają Llama 2, model językowy sztucznej inteligencji do użytku komercyjnego
Firmy Meta i Microsoft połączyły siły, aby zaprezentować Llama 2, wielkoskalowy model językowy nowej generacji przeznaczony zarówno do celów komercyjnych, jak i badawczych.
Co wiemy
Llama 2 jest dystrybuowana bezpłatnie. Według Meta, model został wytrenowany z 40% większą ilością danych niż Llama 1. Długość kontekstowa została podwojona.
Wydanie zawiera wagi modelu i kod źródłowy, a liczba parametrów waha się od 7 miliardów do 70 miliardów. Meta twierdzi, że Llama 2 przewyższa inne modele językowe typu open source pod względem wielu zewnętrznych wskaźników, w tym rozumowania, kodowania, biegłości i testów wiedzy.
Podczas opracowywania Llama 2 więcej uwagi poświęcono odpowiedzialności. Deweloperzy ponownie przetestowali modele i stworzyli schemat przejrzystości, który szczegółowo opisuje możliwe problemy.
Ponadto zawierają one przewodnik po odpowiedzialnym użytkowaniu, a także zasady dopuszczalnego użytkowania, aby zapobiec niewłaściwemu użyciu, takim jak działalność przestępcza, wprowadzające w błąd oświadczenia i spam.
Microsoft udostępnia model za pośrednictwem katalogu Azure AI do wykorzystania w narzędziach opartych na chmurze, takich jak filtrowanie treści. Narzędzie może również działać bezpośrednio na komputerach z systemem Windows i będzie dostępne za pośrednictwem zewnętrznych dostawców, takich jak Amazon Web Services i Hugging Face.
Pierwsza wersja modelu była open source, ale była przeznaczona wyłącznie dla naukowców i badaczy. Llama 2 umożliwia firmom dostosowanie technologii do własnych celów, na przykład do tworzenia chatbotów lub generatorów obrazów. Pozwala to firmom czerpać korzyści z modelu, a zewnętrznym programistom testować go pod kątem stronniczości, niedokładności i innych wad.