欧交易所app下载官网ios:法庭文件显示

  • 2025-02-22 20:37:01
  • 3
欧意报道:

法院文件显示,元工作人员已经使用受版权保护的内容来培训其人工智能模型。根据最近的法院文件 ,大多数讨论与从合法可疑手段获得的内容有关 。

原告在Kadrey诉Meta案中提供了这些文件,这是通过美国法院通过的许多AI版权案件之一。根据Meta的说法,在公平的政策下 ,使用受版权保护的作品(尤其是书籍)来训练其模型。但是 ,由莎拉·西尔弗曼(Sarah Silverman)和塔尼西(Ta -Nehisi Coates)领导的原告不同意该公司的主张 。

根据先前提交的文件,元首席执行官马克·扎克伯格(Mark Zuckerberg)批准了该公司的AI团队使用受版权保护的内容来培训其模型 。这些文件进一步表明,该公司还削减了与书籍出版商的数据许可谈判。

据称META使用版权内容来训练其AI模型

根据新备案在法庭上可用的是 ,Meta的工人之间共享的内部工作聊天表明了该公司如何使用受版权保护的数据来训练其AI模型,包括Llama家族中的大多数模型。

其中一项聊天涉及Meta的高级主管Melanie Kambadur,他是Llama研究团队的高级经理 。在聊天中 ,她谈到了培训AI模型的内容,这些模型没有合法的理由。

梅塔研究工程师Xavier Martinet在2023年2月的聊天中说:“我的意见将是(在'问宽恕,而不是为了许可'中):我们试图获取书籍并将其升级给高管 ,因此他们打了电话。 ” ,根据文件 。他补充说:“这就是为什么他们为[SIC]设置了这个Gen Gen org:因此我们可以降低风险。”

马丁内特(Martinet)提到,该公司可以以零售价购买电子书来建立数据培训集 ,而不是与不同出版商进行许可协议。尽管另一名员工警告使用此类内容和法律后果,但马丁特提到其他公司也可能正在使用盗版书籍进行培训 。

在同一聊天中,坎巴杜尔(Kambadur)提到该公司正在与某些平台进行许可 ,但指出 ,尽管使用公开可用的数据将需要批准,但该公司的律师比过去的律师不那么保守。坎巴杜尔说:“现在的差异是,我们有更多的钱 ,更多的律师,更多的Bizdev帮助,可以快速追踪/升级速度的能力 ,而律师对批准的保守也不那么保守。”

员工讨论使用Libgen

根据文件,另一项工作聊天显示了Kambadur谈论使用Libgen的汇总网站,该网站提供了发行商的受版权保护内容的链接 ,作为Meta可以许可的数据源 。利比根(Libgen)曾多次起诉,由于侵犯版权的主张,该平台被命令关闭其服务。

聊天中的另一位同事发布了一张照片 ,然后以“不,Libgen是不合法的。 ”,看来 ,一些高管的某些高管感觉就像没有使用Libgen可能会妨碍公司在AI竞赛中的竞争力 。在META产品管理总监Sony Theakanath到Meta AI副总裁Joelle Pineau的一封电子邮件中 ,他指出,Libgen对于在所有类别的最先进的(SOTA)数字上非常重要 。

Theakanath还谈到了该公司可以减少法律曝光率的几种方法,包括删除被盗窃/盗版的数据 ,而不是公开引用其他用法。他说:“我们不会透露用于训练的利比根数据集的使用。 ”实际上,此举意味着公司将首先通过Libgen文件检查“被盗或盗版”作品 。

法院文件显示其他侵权

在其中一次工作聊天中,坎巴杜尔还建议元AI团队应调整模型“避免风险的IP提示” ,这将配置模型以拒绝为试图了解电子书的用户提供答案。

这些文件还揭示了其他细节,启示显示了元可能已经使用了reddit数据训练其模型以模仿名为PushShift的第三方应用程序的行为。雷迪特(Reddit)在2023年4月的一份声明中提到,它将开始向AI公司收取访问数据以培训其模型的费用 。

自诉讼于2023年开始以来 ,本案中的原告已经多次修改了他们的投诉。该文件是在加利福尼亚北部北部地区旧金山北部地区法院进行的。在最新的修正案中,原告声称,元参考的盗版书与受版权保护的书籍 ,以确定追求的理想许可交易 。梅塔(Meta)将案件视为一个高风险的法律问题,将最高法院诉讼人添加到其辩护团队中。

加密大都会学院:如何撰写web3简历来吸引采访 - 免费备忘单