AI-ul și antrenarea lui pe conținutul disponibil online este în continuare un subiect controversat, însă CEO-ul Microsoft AI, Mustafa Suleyman, expune destul de clar poziția diviziei pe care o conduce asupra acestui subiect. Conform unui interviu din cadrul Aspen Ideas Festival, liderului AI Microsoft, dacă există conținut online, accesibil gratuit, acesta va putea fi folosit pentru a antrena modelele AI.
Microsoft va folosi conținutul online disponibil „gratuit” pentru a-și antrena AI-ul
„Cu privire la conținutul care este deja pe web-ul deschis, contractul social al acelui conținut din anii ’90 a fost că este utilizare corectă. Oricine poate să-l copieze, să-l recreeze, să-l reproducă. Acesta a fost considerat „freeware”, aceasta a fost înțelegerea. Există o categorie separată în care un site web, un editor sau o organizație de știri a spus explicit să nu fie accesat sau extras pentru alte motive decât indexarea, astfel încât alți oameni să poată găsi acest conținut. Aceasta este o zonă gri și cred că va ajunge să fie clarificată de instanțe.”, a declarat Suleyman
Răspunsul acesta a fost dat la o întrebare despre drepturile asupra conținutului pe baza căruia AI-ul este antrenat. Suleyman spune că dacă acest conținut este disponibil online, va fi folosit, iar creatorii vor trebui să refuze explicit prin blocarea crawler-elor antrenarea AI-ului. Desigur, blocarea boților este un proces nu foarte simplu pentru toți creatorii de conținut, care, probabil că nu au cunoștințele necesare pentru a bloca boții care antrenează AI. De asemenea, fiecare companie care dezvoltă AI poate să își creeze propriul crawler de date, iar blocarea individuală a fiecăruia ar putea fi chiar imposibilă.
Totodată, Suleyman este sigur că o hotărâre judecătorească va clarifica pentru toată lumea cât de legală este antrenarea AI-ului pe articole sau clipuri video de pe internet, dar poziția sa, și implicit a Microsoft este că, dacă nu blochezi explicit antrenarea AI pe site-ul tău, conținutul de pe acesta va fi, cu siguranță, folosit.
Totuși, OpenAI (partenerul Microsoft pentru AI), Google și alte companii care dezvoltă AI, plătesc pentru acces la anumite baze de date, precum Reddit, pentru a antrena AI-ul pe conversațiile și conținutul publicat acolo. În teorie, și acel conținut poate fi accesat gratuit.