Skandal w sieci. Apple uczył swoje AI treściami z YouTube'a

17.07.2024

Lech Okoń

Apple Inteligence było karmione filmami youtuberów. Na liście wielkie gwiazdy, w tym Marques Brownlee

Jak się okazuje, firma Apple, ale też inne firmy karmiły swoje modele sztucznej inteligencji treściami z kanałów YouTube największych twórców internetowych. Zassano napisy z ponad 170 tys. filmów - bez zgody twórców.

Czym by tu nakarmić sztuczną inteligencję? Może tak tekstami youtuberów

Jak udowadnia w swoim dochodzeniu Proof News, niektóre z najbogatszych firm AI na świecie korzystały z tysięcy filmów na YouTube do szkolenia swoich modeli AI. Złamane zostały tutaj zarówno prawa YouTube'a, zabraniającego w swoich politykach pobierania materiałów z platformy, jak i majątkowe prawa autorskie twórców.

Nasze dochodzenie wykazało, że napisy z 173 536 filmów na YouTube, pobrane z ponad 48 tys. kanałów, były używane przez gigantów z Doliny Krzemowej, w tym Anthropic, Nvidia, Apple i Salesforce

- informuje Proof News

Proof News stworzyło narzędzie dla twórców internetowych do wyszukiwania użycia ich treści w modelach AI. Tym sposobem udało się namierzyć m.in. użycie 337 filmów PewDiePie (111 mln subskrybentów) czy 377 filmów Jacksepticeye (prawie 31 mln subskrybentów).

Zobacz: Kluczowa funkcja nowych iPhone'ów nie dla Polaka
Zobacz: Nowa usługa Apple na razie będzie za darmo, ale nie na zawsze

AI prawdę ci powie, słowami prosto z materiałów sponsorowanych

Pobrania treści były przy tym zautomatyzowane, zajęła się nimi EleutherAI, organizacja non-profit, która rzekomo miała dostarczać materiały szkoleniowe małym deweloperom i uczelniom. Dane te, zgromadzone w kompilacji Pile, były jednak wykorzystywane przez gigantów technologicznych, z Apple'em na czele.

Jak tłumaczy się w oświadczeniu EleutherAI, większość zestawów danych zebranych w Pile jest dostępna i otwarta dla każdej osoby w Internecie — wystarczy mieć wystarczająco dużo miejsca i mocy obliczeniowej, by je pobrać.

Dokumentacja techniczna modeli językowych potwierdza The Pile jako źródło

Dokumentacje techniczne gigantów takich jak Nvidia, Slaesforce czy Apple jednoznacznie potwierdzają użycie Pile do trenowania modeli językowych. Między innymi do szkolenia OpenELM, modelu, o który oparte zostało Apple Inteligence.

Co ciekawe z Pile skorzystał też Anthropic, lider w dziedzinie budowania nowoczesnych modeli AI, z 4 mld dolarów z doinwestowania ze strony Amazonu. Anthropic próbuje się przy tym promować jako ta etyczna firma AI, z bezpieczeństwem AI na pierwszym miejscu.

I co teraz?

Wśród poszkodowanych twórców internetowych są takie gwiazdy jak Marquees Brownlee (MKBHD), MrBeast, PewDiePie, Stephen Colbert, John Oliver czy Jimmy Kimmel. Gdyby jakaś stacja telewizyjna wyemitowała ich filmy bez zgody, z pewnością wywalczyliby odpowiednie tantiemy w sądzie.

Niestety obecnie obowiązujące przepisy prawa autorskiego nie znają jeszcze pojęcia sztucznej inteligencji. Ewentualne sprawy sądowe mogą utworzyć tutaj precedens, zanim jeszcze powstaną ustawy doprecyzowujące zakres majątkowych praw autorskich twórców. Prawnej wojny w tej sprawie nie ogłosił jeszcze żaden z twórców, ale to tylko kwestia czasu.

Apple czy Nvidia nie mają się o co martwić

To nie giganci z doliny krzemowej mogli dopuścić się złamania zasad YouTube'a, tylko jeśli już EleutherAI — brzmią komentarze analityków. Apple czy Nvidia prawdopodobnie bez trudu wybronią się, że korzystały z publicznie dostępnych baz danych jedynie w dobrej wierze.

Sęk w tym, że rzetelni twórcy internetowi, nawet nie szukając poklasku dla własnej osoby, przytaczają w swoich materiałach oryginalne źródła, odpowiednio oznaczając autorów. Po przemieleniu przez AI wszystkie te informacje zmieniają się w papkę wypluwaną jako odpowiedź użytkownikowi. Nie jest ona połączona z oryginalnymi treściami nie tylko poszkodowanych teraz youtuberów, ale wszystkich naukowców, twórców i badaczy, na których dorobku powstały treści youtuberów.

AI-owa afera, która dotknęła teraz za jednym zamachem niemal wszystkich najbardziej wpływowych twórców YouTube'a może się odbić big techom czkawką. Wszystko zależy od skali reakcji influencerów na problem.

Jak o Apple Inteligence opowiadał Marques Brownlee, znany też jako (MKBHD), zanim dowiedział się, że jego filmy były wykorzystane do jej stworzenia, zobaczyć możecie w poniższym materiale wideo. Ciekawi jesteśmy, czy w świetle zaistniałych okoliczności zmieni swoje zdanie.