DAJ CYNK

AI ma duży problem. Dane znikają w zastraszającym tempie

Anna Kopeć

Wydarzenia

Dane, które napędzają sztuczną inteligencję znikają w zastraszająco szybkim tempie. O co tu dokładnie chodzi?

Skurczył się dostęp do danych

Eksperci, zajmujący się tworzeniem zaawansowanych systemów sztucznej inteligencji, do tej pory korzystali z niewyobrażalnie wielkich ilości tekstów, obrazów, filmików obecnych w sieci, aby szkolić swoje modele. Teraz te dane się skurczyły. Nie ma z czego czerpać materiałów szkoleniowych.

Jak wynika z badania grupy badawczej MIT, opublikowanego przez Data Provenance Initiative, wiele dotychczasowych źródeł internetowych ograniczyło wykorzystanie swoich danych. Zadziało się to zaledwie w ciągu ostatniego roku. Badacze przeanalizowali 14 tysięcy domen internetowych, uwzględnianych do tej pory w zestawach szkoleniowych AI. Niestety, jesteśmy w momencie kryzysowym, biorąc pod uwagę aspekt zgody na używanie materiałów do szkolenia modeli AI. Wydawcy i platformy internetowe podjęli działania zapobiegające wykorzystywaniu danych bez pozwolenia. 

45% danych zostało ograniczonych przez zmianę warunków korzystania z nich przez serwisy internetowe, które coraz częściej blokują dostęp. Nie życzą sobie bowiem, by ich treści były wykorzystwane przez ChatGPT i inne modele sztucznej inteligencji. Co więcej ruszyły nawet pierwsze procesy sądowe o bezprawne wykorzystanie treści wydawców przez firmy AI. 

Zobacz: Nowa wersja Chat GPT już dostępna. Lepsza i dosłownie za grosze

Chcesz być na bieżąco? Obserwuj nas na Google News

Źródło zdjęć: Deemerwha studio / Shutterstock.com

Źródło tekstu: New York Times