Energy Expo - Join the revolution

Apple și-a antrenat AI-ul folosindu-se fără consimțământ de peste 170.000 de clipuri de pe YouTube

Scris de | 17 iulie, 2024
Apple și-a antrenat AI-ul folosindu-se fără consimțământ de peste 170.000 de clipuri de pe YouTube
FOTO via MKBHD

Un număr de giganți din tehnologie, inclusiv Apple, au antrenat modele AI pe baza clipurilor de pe YouTube, fără să aibă consimțământul creatorilor, conform unei noi știri.

Companiile au realizat acest lucru folosindu-se de fișiere de subtitrări descărcate de o aplicație third-party din peste 170.000 de clipuri. Printre creatorii afectați se numără vloggerul de tehnologie Marquees Brownlee (MKBHD), MrBeast, PewDiePie, Stephen Colbert, John Oliver și Jimmy Kimmel.

Fișierele de subtitrări sunt, în esență, transcrieri ale conținutului video.

Wired a scris inițial despre acest subiect.

O investigație realizată de Proof News a descoperit că unele dintre cele mai bogate companii din lume au folosit material din mii de clipuri de pe YouTube pentru a-și antrena AI-urile. Ele au făcut acest lucru în pofida regulilor YouTube împotriva recoltării de materiale de pe platformă fără permisiune.

Investigația a constatat că subtitrările din 173.536 de videoclipuri de pe YouTube, preluate de la mai mult de 48.000 de canale, au fost folosite de greii din Silicon Valley, inclusiv Anthropic, Nvidia, Apple și Salesforce.

Descărcările au fost realizate de o organizație non-profit numită EleutherAI, care spune că ajută dezvoltatorii să antreneze modele de limbaj. Deși scopul aparent a fost să ofere materiale de antrenament pentru dezvoltatorii mici și academicieni, setul de date a fost folosit și de mai mulți giganți tehnologici, inclusiv Apple.

Conform unei lucrări de cercetare publicate de EleutherAI, setul de date face parte dintr-o compilație pe care organizația non-profit a lansat-o sub numele de Pile. Majoritatea seturilor de date din Pile sunt accesibile și „open-source” pentru oricine de pe internet cu suficient spațiu și putere de calcul pentru a le accesa. Academicienii și alți dezvoltatori din afara Big Tech s-au folosit de setul de date, însă ei nu au fost singurii.

Apple, Nvidia și Salesforce, companii evaluate la sute de miliarde și trilioane de dolari, descriu în lucrările lor de cercetare cum au folosit Pile pentru a antrena AI. Documentele arată, de asemenea, că Apple a folosit Pile pentru a antrena OpenELM, un model de limbaj lansat în aprilie, cu câteva săptămâni înainte ca gigantul să dezvăluie că va adăuga noi capabilități AI pe iPhone-uri și MacBook-uri.

Etichete: , , ,

Sursa: Apple trained AI models on YouTube content without consent; includes MKBHD videos