Meta byla obviněna z používání pirátského obsahu z torrentů k trénování svého velkého jazykového modelu (LLM) Llama, který pohání Meta AI. Případ byl jednou z prvních žalob podaných proti společnosti za školení AI.
Jak uvádí Wired, na společnost Meta byla v roce 2023 podána žaloba za údajné školení Llama, LLM společnosti, pomocí pirátského obsahu. Případ se stal známým jako „Kadrey et al. v. Meta Platforms“ a byl podán romanopisci Richardem Kadreyem a Christopherem Goldenem, kteří tvrdili, že Meta používala obsah chráněný autorským právem bez povolení. Až dosud Meta předávala soudu dokumenty s upravenými informacemi, ale soudce Vince Chhabria z okresního soudu Spojených států pro severní okres Kalifornie nařídil, aby byly původní dokumenty zveřejněny – a to se také stalo. Dokumenty odhalují rozhovory mezi zaměstnanci Meta o Meta AI a Llama.
Důkazy naznačují, že Meta používala obsah z LibGen, obrovské knihovny pirátských knih, časopisů a akademických článků. LibGen byl vytvořen v Rusku v roce 2008 a od té doby na něj bylo podáno několik žalob o autorská práva, i když nikdo neví, kdo skutečně provozuje toto pirátské centrum. Meta také údajně používala obsah z jiných knihoven pro školení AI. Společnost tvrdí, že použila veřejné materiály podle „fair use“, která za určitých okolností umožňuje použití obsahu chráněného autorskými právy bez povolení, které jsou analyzovány případ od případu. Meta také tvrdí, že je to jen používání textu ke statistickému modelování jazyka a generování originálního výrazu.