Oznámení generálního ředitele společnosti Meta Marka Zuckerberga o AI vyvolalo velké obavy poté, co řekl, že společnost má více uživatelských dat, než bylo použito k trénování ChatGPT – a brzy je použije k trénování vlastní AI.



Plán společnosti využívat příspěvky a komentáře na Facebooku a Instagramu k výcviku AI vyvolává obavy o soukromí. Pro mnoho lidí je Facebook internet a počet jeho uživatelů podle posledních finančních výsledků Meta Platforms Inc. stále roste. Mark Zuckerberg ale neslaví jen pokračující růst. Chce toho využít tím, že použije data z Facebooku a Instagramu k vytvoření výkonné, univerzální umělé inteligence. „Na Facebooku a Instagramu jsou stovky miliard veřejně sdílených obrázků a desítky miliard veřejných videí, což je podle našeho odhadu větší než datová sada Common Crawl a lidé také sdílejí velké množství veřejných textových příspěvků v komentářích napříč našimi službami.“
Common Crawl odkazuje na obrovský archiv 250 miliard webových stránek, který představuje většinu textu používaného k trénování ChatGPT.

Použitím více dat by Meta mohla vybudovat chytřejšího chatbota. Jak poznamenává Bloomberg, není to jen samotný objem dat, který by mohl poskytnout Meta výhodu – je to skutečnost, že velká část z nich je interaktivní. Hromada dat, které Meta má je obzvláště cenná, protože mnoho z nich pochází z vláken komentářů. Jakýkoli text, který představuje lidský dialog, je důležitý pro trénování takzvaných konverzačních chatbotů, což je důvod, proč OpenAI intenzivně těžila z internetového fóra Reddit Inc., aby vytvořila svého vlastního chatbota. To však také představuje alarmující skutečnosti. Za prvé, Meta by efektivně trénovala svou AI na tom, co mohou být docela osobní příspěvky a konverzace mezi přáteli v komentářích na Facebooku. To vyvolává velké obavy o soukromí.

Za druhé, každý, kdo někdy četl sekci komentářů kdekoli na internetu, ví, že procento toxického obsahu je vysoké. Zatímco přemýšliví uživatelé diskutují o problémech, není nouze o komentátory, kteří se uchylují k osobním útokům a hrubým urážkám – a znepokojivá část z toho je rasistická a sexistická. To je něco, co musí každý školicí systém chatbotů filtrovat – a Apple je pravděpodobně ve své vlastní práci na vývoji chatbotů opatrnější než kdokoli jiný – ale situace zde může být obzvláště špatná. Facebook navíc obsahuje spoustu falešných příspěvků, které na platformě stále zůstávají.