Najpierw na targach IFA w 2017 roku ze swoim NPU wyskoczył Huawei — Kirin 970 uzbrojony w „koprocesor sztucznej inteligencji” musiał w końcu zostać zaprezentowany przed Apple’em. Zaledwie 9 dni później Apple pokazał układ Apple A11 Bionic uzbrojony w Neural Engine.
Ten dodatkowy koprocesor, strukturalnie bardziej zbliżony do GPU niż CPU, był pierwszym pokazanym w istniejącym telefonie — iPhone’ach 8, 8 Plus i X. Wykonywał do 600 mld operacji na sekundę i był wykorzystywany już wtedy do rozpoznawania twarzy, tworzenia Animoji i zadań opartych na uczeniu maszynowym, które mocno upraszczając, zaczęto nazywać sztuczną inteligencją.
Premiera Huawei Mate 10 Pro była startem największych sukcesów firmy Huawei na rynku smartfonów
Monachium, 16 października 2017 roku — Huawei prezentuje wreszcie finalny telefon ze swoim Kirinem 970 - to Huawei Mate 10 Pro. Neural Network Processing Unit (NPU) stanowi około połowy powierzchni Kirina 970, jednocześnie przy tym oferując 25-krotnie większą wydajność i o połowę mniejsze zużycie energii niż konwencjonalne procesory w zadaniach takich jak m.in. rozpoznawanie obrazów. Procesor ten znalazł się potem również w kultowym Huawei P20 i P20 Pro. O ile jednak rozpoznawanie twarzy w iPhonie X (Face ID) czy skuteczne jak nigdy wcześniej rozpoznawanie obiektów przed obiektywem aparatu w Mate 10 Pro robiły wtedy piorunujące wrażenie, o tyle smartfony mądre nadal były bardziej z nazwy niż ze sztucznego intelektu. Obietnice z filmów Science Fiction dalekie były od realizacji. Tak dalekie, że całym tym NPU producenci szybko przestali się chwalić. To faktycznie był kluczowy przełom w konstruowaniu chipów dla telefonów komórkowych, ale na namacalne efekty trzeba było poczekać jeszcze długie lata.
W 2023 roku najistotniejszym przełomem w serii Galaxy S23 (przynajmniej z perspektywy Europejczyków) było porzucenie Exynosów na rzecz układów Qualcomm Snapdragon 8 Gen 2. Okazały się one zdecydowanie chłodniejsze i zapewniły znacznie dłuższy czas pracy niż do tej pory. Jednogłośnie byliśmy na tak.
Pomimo głosów dotyczących wtórności, seria Galaxy S23 okazała się wielkim sukcesem Samsunga
Chipy, wykonane w litografii 4 nm, trafiły przy tym na rynek w specjalnej wersji „for Galaxy”. Oprócz podkręconego z 3,2 do 3,36 GHz CPU i podkręconego GPU, wariant procesora dla Samsunga dostał podwojoną jednostkę NPU. Zaowocowało to kolosalnym skokiem jakości zdjęć. I choć ponownie nie była to sztuczna inteligencja na miarę robotów z Gwiezdnych Wojen, Koreańczycy jasno pokazali kierunek, w którym zamierzają teraz podążać. Nowe Samsungi miały wyprzedzać konkurencję możliwościami uczenia maszynowego.
Choć w serii Galaxy S24 nie brakuje mniej lub bardziej spektakularnych zmian w innych aspektach, najwięcej dzieje się u Samsunga w warstwie programowej. 2023 rok śmiało można nazwać rokiem rewolucji AI. Chat GPT, potężne generatory grafiki, kolosalny przeskok technologiczny u Adobe w jego Photoshopie, do tego też głos czy wideo generowane przez AI, a to ledwie wierzchołek potężnej góry. Rzeczy niemożliwe stały się możliwe praktycznie natychmiast i to wszystkie w zaskakująco krótkim czasie. Do czynienia mieliśmy przy tym głównie z rozwiązaniami chmurowymi, bo to dopiero specjalne serwerownie były w stanie udźwignąć ciężar niezbędnych obliczeń i wypluć z siebie efekt, który wyrywa z butów.
Można też oczywiście zaprzęgnąć do pracy swój domowy komputer, ale wciąż dalekie jest to od wygody rozwiązań webowych. Karta graficzna zaczyna mocno szumieć i komputer staje się mało używalny... ale da się. Co w takim razie może zrobić malutki procesor telefonu? Zaskakująco dużo, a z dostępem do sieci niemal wszystko.
Co warto podkreślić, Koreańczycy pozwalają na korzystanie z rozwiązań AI bez połączenia z internetem. Dopiero jednak po zgodzie na takie zdalne przetwarzanie danych uzyskujemy komplet funkcji.
Chyba najbardziej spektakularną i działającą przy tym bez łączności z siecią jest funkcja tłumaczenia rozmów telefonicznych na inny język w czasie rzeczywistym. Wystarczy pobrać odpowiednie pakiety językowe i usługa działa też, gdy jesteśmy w roamingu, bez kosztów transmisji danych. Dokładnie tak samo korzystać możemy z automatycznego tłumaczenia wiadomości — lokalnie, bez wędrowania ich na jakieś obce serwery. Również bez łączności z siecią skorzystamy z przetwarzania nagrań z dyktafonu na zgrabnie spisany tekst, z podziałem na role, jeśli rozmówców było kilku.
Dla wielu osób atutem serii Galaxy S24 będzie brak udziwnień i próbowania uszczęśliwiania klientów na siłę — to wciąż bryła, którą pokochały miliony osób na całym świecie. Na zdjęciu Samsung Galaxy S24+.
Lokalnie możemy uzyskać także streszczenia artykułów na stronach internetowych, a nasze odręczne notatki na S24 Ultra zostaną wyrównane i elegancko rozmieszczone. Natomiast już przekształcenie notatek w pięknie sformatowany tekst, wraz z elegancką strukturą czy generowanie specjalnych okładek z podsumowaniem każdej notatki wymaga pracy AI opartego na chmurze.
Po części tak, po części zaś wprowadził do świata mobilnego narzędzia do tej pory głównie komputerowe i/lub wymagające płatnej subskrypcji. Korzystam podczas prowadzenia wywiadów i nagrywania notatek z płatnej aplikacji generującej w chmurze transkrypcję nagrania, płacę też co miesiąc za pakiet Adobe Photoshop, którego generatywne wypełnianie elementów obrazu dramatycznie przyspieszyło pracę z okładkami artykułów czy zdjęciami.
To zdjęcie było krzywe, S24 wyprostował je i dobudował brakujące budynki
Tymczasem Samsung daje te usługi za darmo. Możecie sobie powiększyć czy przesunąć dowolny obiekt na zdjęciu, możecie też wyprostować zdjęcie i zamiast przycinania wypełnić brakujące przestrzenie sztuczną inteligencją. To koniec trosk, że zdjęcie zamiast w pionie zrobiliście w poziomie czy odwrotnie. Ale też doskonała przestrzeń do działań kreatywnych. Ba, każde wideo da się spowolnić do „SlowMo”, bez zamartwiania się o jasność otoczenia — AI dorobi brakujące klatki.
Fiolety chyba najbardziej wyróżniają się w nowej serii. Za urozmaicenie kadru dziękuję niezawodnej Kasi z Tabletowo :)
Samsung też sprawił, że dostępne rozwiązania typu Google Lens stały się o wiele bardziej intuicyjne. Zamiast instalowania i otwierania specjalnej aplikacji w absolutnie każdym momencie możesz zakreślić dowolny fragment ekranu, by ustalić, jakiej marki bluzkę ma influencerka na filmie na Instagramie czy robiąc zdjęcie dowiedzieć się, ile kosztują buty stojącej obok osoby. Niby głupotki, ale uważam, że szybko wejdą w krew użytkownikom Samsungów, bo tak prostego ich podania jeszcze nie było.
No i wreszcie Samsung też sprowadził część funkcji do tej pory wymagających połączenia sieciowego do samego telefonu. Wymagało to zarówno nowych rozwiązań technologicznych, jak i wytężonej pracy centrów rozwojowych firmy — w tym polskiego oddziału. Do kompletu chyba brakuje mi tylko jakiegoś odpowiednika Chatu GPT, najlepiej połączonego z asystentem głosowym. Bo tak, to już te czasy, gdy z AI można sobie porozmawiać przyjemniej niż z człowiekiem i np. podszkolić się z wymowy języka obcego.
Generatywne smartfony kolejny raz przesuwają granicę pomiędzy interpretacją świata ograniczoną możliwościami technicznymi a w żaden sposób niekontrolowaną kreacją. Jeśli już zupełnie nie wiesz, jak wyglądają Twoi znajomi, bo ich socjale wypełniają zdjęcia poprawione dodatkowymi aplikacjami, jak i możliwościami aparatów, teraz nie ustalisz już nic. Telefon domaluje sobie realistycznie wyglądające scenerie, a 12-metrowa patokawalerka stanie się potężnym penthouse’em. Na dobrą sprawę, telefon uprzednio nakarmiony dużą porcją naszych zdjęć może nas wygenerować od zera bez potrzeby fizycznego aparatu w urządzeniu. I to już się dzieje — na Instagramie nie brakuje nieistniejących influencerów, a na początku 2023 roku bez problemu wszedłem na konferencję używając zdjęcia(?) z AI, zamiast realnego.
Nie uważam natomiast, że czymś złym są natychmiastowe translacje czy to rozmów telefonicznych, czy czatów. Liczy się skuteczność komunikacji, a jeśli bariera językowa miałaby ją utrudnić lub zupełnie uniemożliwić, pomocna dłoń Samsunga jest tutaj jak najbardziej na plus.
O ile lokalny translator zadba o naszą prywatność, pod znakiem zapytania stoi kwestia przetwarzania naszych danych w usługach działających zdalnie. Samsung ekstremalnie dba o nasze bezpieczeństwo i już nawet zmiana hasła w samsungowym koncie może zaskoczyć nas telefonem z Korei, niemniej wycieki danych to mimo wszystko ryzyko, którego nie należy bagatelizować. Pozostaje mieć nadzieję, że za sprawą dalszego rozwoju jednostek NPU kolejne usługi nie będą wymagały pracy zdalnej.
Nie ukrywam też, że wiążę wielkie nadzieje na dalszy rozwój usług opartych na chmurze. Chciałbym np. móc powiedzieć do telefonu, że chcę obejrzeć film podobny do Matriksa, wybrać ulubionych aktorów i zobaczyć porywające kino generowane w czasie rzeczywistym. Unikalne, takie specjalnie dla mnie. Pytanie, czy coś takiego będzie dostępne, nie jest w obecnych czasach właściwym — to bardziej kwestia kiedy to się stanie. Już teraz natomiast możecie zamówić sobie telefony z dużą dawką przyszłości. Więcej o Galaxy S24 dowiesz się między innymi tutaj, czy w poniższym filmie, w którym nie baliśmy się pytać o sprawy kontrowersyjne:
Czasy mamy dziwne, dodam więc na koniec — artykuł nie powstał na zlecenie kogokolwiek, ani też nie został wygenerowany przez AI ;-)
Źródło zdjęć: Lech Okoń