Zen: kolejny "pierwszy na świecie" tłumacz głosowy na ChatGPT, mówiący w 138 językach

Autor: Technosław Bergamot | 25.09.2024, 12:13

Pomimo faktu, że każdy smartfon może wykonywać wszystkie funkcje tego gadżetu, jedna część ludzkości wciąż tworzy takie urządzenia, a druga je zamawia. W serwisie Kickstarter wystartowała kampania, której celem jest zebranie 10 000 dolarów hongkońskich (czyli zaledwie około 1280 dolarów amerykańskich, dla ułatwienia wszystkie dalsze ceny podawane są w tej walucie) na urządzenie proste jak mnich dzwoniący dzwonkiem, o nazwie Zen. Urządzenie to jest w rzeczywistości uproszczonym smartfonem (cena detaliczna to 269 dolarów, ale w czasie trwania kampanii można go zamówić już od 149 dolarów), który posiada własny aparat fotograficzny, moduł GSM, GPS i Wi-Fi.

Oto jak twórcy urządzenia definiują problem, który próbują rozwiązać:

Zen został zainspirowany wyzwaniami, przed którymi stanął nasz zespół programistów podczas podróży międzynarodowych. Byliśmy sfrustrowani żonglowaniem wieloma urządzeniami, zawodnymi narzędziami i nieporęcznymi konstrukcjami.

Ich smartfony nie wydawały się być w stanie zrobić tego wszystkiego, więc postanowili stworzyć własne. Zen może tłumaczyć głos na 138 języków (jest tu pewne zamieszanie - strona projektu wymienia jednocześnie 138 i 139 języków), z czego 13 może działać w trybie offline. Oznacza to, że urządzenie potrzebuje Internetu do działania, dlatego korzysta z karty SIM. Deweloperzy mówią o wykorzystaniu ChatGPT, choć w specyfikacji wymienia się silniki tłumaczące od Google, Microsoftu (zakładając, że jest powiązany z ChatGPT jako jeden z inwestorów OpenAI) i chińskiego startupu tłumaczącego AI iFlytek. Pozwala to zwrócić się do ChatGPT jako asystenta głosowego i uzyskać odpowiedź. Nie jest jasne, jak rozwiązano kwestię korzystania z zasobów ChatGPT (które nie są bezpłatne dla stron trzecich).

Oprócz tłumaczenia głosowego, Zen może transkrybować głos na tekst i tłumaczyć zdjęcia wykonane wbudowanym 5-megapikselowym aparatem. Możliwość dystrybucji Wi-Fi jest również wymieniona jako czwarta kluczowa funkcja, ale wydaje się to raczej naciągane.

Dla wygody wielu użytkowników Zen może udostępniać swój ekran poprzez zeskanowanie kodu QR, a wtedy tłumaczenie tekstu będzie dostępne nie tylko dla osoby trzymającej urządzenie, ale także dla innych uczestników rozmowy.

Reszta specyfikacji obejmuje procesor MediaTek MT6739WW, baterię 2000 mAh (obiecującą do 12 godzin pracy i do 10 dni czuwania) ze złączem USB-C, 1/16 GB pamięci i podwójny mikrofon (nawiasem mówiąc, mówi się, że urządzenie działa stabilnie w hałasie i ma dokładność tłumaczenia 98%). Urządzenie waży 168 gramów i mierzy 129x58x13 milimetrów.

Warto zauważyć, że urządzenie jest już w pełni gotowe zgodnie z mapą drogową i jak tylko kampania się zakończy (co nastąpi w listopadzie), rozpoczniemy wysyłkę urządzeń do klientów. Zebrana kwota jest niewielka, a zespół programistów ma już za sobą udaną kampanię na Kickstarterze ze swoim poprzednim produktem, podobnym, ale nieco prostszym tłumaczem o nazwie Allingo Remo. W tym czasie zespół Allingo zebrał 616% wymaganej kwoty pieniędzy (choć cel był również niewielki - 23 550 HK $). W rzeczywistości, gdy pisałem ten tekst, ci wspaniali chłopcy zebrali już ponad połowę wymaganej kwoty, choć zbiórka została ogłoszona dzisiaj.

Źródło: Kickstarter