Microsoft wprowadził na rynek Phi-3 Mini, kompaktowy model sztucznej inteligencji
Microsoft zaprezentował Phi-3 Mini, swój nowy lekki model sztucznej inteligencji, pierwszy z trzech zapowiedzianych małych modeli z rodziny Phi-3.
Co wiadomo
Phi-3 Mini ma tylko 3,8 miliarda parametrów, czyli jest znacznie mniejszy niż duże modele językowe, takie jak GPT-4. Jednak zgodnie z oświadczeniem Microsoftu, pomimo niewielkich rozmiarów, nowość jest prawie tak potężna jak GPT-3.5.
Według Erica Boyda, wiceprezesa Microsoft Azure AI Platform, Phi-3 Mini ma podobne możliwości do dużych modeli językowych, "tylko w mniejszej obudowie".
Firma planuje również wypuścić w przyszłości Phi-3 Small z 7 mld parametrów i Phi-3 Medium z 14 mld parametrów. Małe modele mają szereg zalet - są tańsze w eksploatacji i lepiej sprawdzają się na urządzeniach osobistych.
Według Boyda, Phi-3 Mini został przeszkolony przy użyciu pewnego rodzaju "programu nauczania" inspirowanego metodami nauczania dzieci na książkach z prostymi strukturami zdań, stopniowo przechodząc do bardziej złożonych koncepcji.
Podczas gdy kompaktowe modele nie mogą równać się z większymi pod względem zakresu wiedzy, są one wystarczające do wielu popularnych zadań, takich jak streszczanie tekstów, pomoc w programowaniu lub tworzeniu chatbotów.
Kiedy można się spodziewać
Phi-3 Mini jest już dostępny w Azure, Hugging Face i Ollama. Większe wersje pojawią się później.
Źródło: The Verge