Meta pirateou mais de 81TB de livros via torrent para treinar IA - Drops de Jogos

Meta pirateou mais de 81TB de livros via torrent para treinar IA

Documentos mostram que empresa baixou ilegalmente todo o acervo das principais bibliotecas online do mundo.

(Imagem: montagem por Rafael Silva/Drops de Jogos)

No fim da semana passada, o Tribunal de Justiça da Califórnia tornou público alguns documentos do caso onde um grupo de artistas e autores está processando a Meta e a OpenAI pelo uso não autorizado de obras protegidas por direito autoral no treinamento de modelos de inteligência artificial.

Entre os documentos divulgados estão alguns e-mails que comprovam que a Meta não apenas pirateou mesmo diversas obras, como o volume dessa pirataria talvez fosse muito maior do que qualquer pessoa imaginava. Os documentos apontam que a Meta pirateou via torrent pelo menos 81TB de acervos como LibGen e Z-Library (duas das principais shadow libraries existentes hoje, e que permitem às pessoas o acesso a diversas mídias que estão disponíveis online mas em sites protegidos por paywall) além da Anna’s Archive (um site agregador de shadow libraries).

Esse processo contra a Meta e a OpenAI está sendo movido desde julho de 2023 pela Joseph Saveri, uma firma de advocacia que nos últimos anos se especializou em ações envolvendo quebra de direitos autorais por empresas de treinamento de IA.

Os documentos que provam o uso de torrent para download de mídia de forma ilegal pela Meta faz parte de um processo envolvendo grandes nomes da indústria do entretenimento. Entre eles está a comediante Sarah Silverman, o escritor Christopher Golden e o romancista/fotógrafo Richard Kadrey.

Meta (um tapa olho e uma perna de pau nesse) pirata

O que surpreende não é o fato da Meta usar ilegalmente obras protegidas por direitos autorais para treinar seu modelo de IA – ela sempre admitiu isso. Mas sim a magnitude do quanto foi baixado ilegalmente via torrent. Não podemos esquecer de Aaron Swartz, o “hacktivista” que tirou a própria vida em 2013 devido a perseguição que sofreu do governo dos EUA por causa da disponibilização de torrents.

Aaron Swartz foi um grande opositor dos projetos SOPA e PIPA, que criariam leis mais severas para punir o compartilhamento de obras protegidas por direitos autorais na internet (Foto: Daniel J. Sieradski/Wikimedia Commons)

Em 2010, Swartz havia feito o download via torrent de 70GB do acervo da JSTOR, um dos mais famosos repositórios de revistas científicas e artigos acadêmicos. Ele teria disponibilizado esses arquivos como um protesto à forma como o site era administrado. Isto porque o JSTOR cobrava altos valores para o acesso aos artigos, e nem um centavo dessas transações eram repassados para os autores. Todo o dinheiro pago era dividido entre o site e as editoras que publicaram o artigo.

Aaron foi preso em 2011 e optou por acabar com a própria vida em dezembro de 2013. Na época ele estava respondendo por 13 crimes federais, e a promotoria pedia a pena máxima de reclusão (50 anos) além de uma multa de mais de um milhão de dólares para cobrir as perdas causadas ao JSTOR e às editoras.

E tudo isso por uma quantia que representa apenas 0,08% de tudo o que a Meta pirateou para treinar a inteligência artificial dela.

E-mails sobre torrent podem melar o processo pra Meta

Os documentos também revelam algo que pode ajudar muito Joseph Saveri no processo contra a Meta. Primeiro, que há a confirmação de que todos os downloads ilegais foram feitos em notebooks que pertenciam a empresa. Ou seja, foi tudo oficial, e não um funcionário que resolveu fazer isso no tempo livre.

Segundo, os e-mails também afirmam que a Meta sabia que, para fazer o download dos arquivos via torrent, ela precisaria também participar do processo de seeding (disponibilizar o arquivo para download a outras pessoas). Os documentos mostram que a empresa tentou modificar as configurações de rede dela para diminuir ao máximo o seeding, mas estava ciente de que isso era inevitável e escolheu continuar.

E é justamente essa parte que mais tem potencial para “melar” a vida da Meta. Isto porque ela comprova uma teoria levantada pelo reclamantes no processo, que é a de que a empresa não apenas usou essas obras sem permissão como também contribuiu na distribuição ilegal delas. E o seeding de um torrent é exatamente isso: contribuir com a distribuição de um arquivo. Além disso, os documentos também provam que a Meta sabia que tudo isso que ela estava fazendo era ilegal.

E eles também pegam Mark Zuckerberg na mentira. Até então, o CEO da Meta se defendia dizendo que não sabia de nada sobre o uso dos arquivos da LibGen para o treinamento da IA da empresa. Mas os e-mails revelados ao público deixam claro que a escolha de usar este acervo só foi tomada após uma consulta direta com Zuckerberg.

Até o momento, a Meta afirmou apenas que vai explicar a questão do seeding em audiências futuras, mas que continua confiante na capacidade de sua defesa provar que ela não cometeu nenhum crime.

Veja nossa campanha de financiamento coletivo, nosso crowdfunding.

Conheça os canais do Drops de Jogos no YouTube, no Facebook, na Twitch, no TikTok e no Instagram.

** Este texto não reflete, necessariamente, a opinião do Portal UAI.

Subscribe
Notify of
guest
0 Comentários
Inline Feedbacks
View all comments