更新一下AI版权的事儿。

2025年6月下旬,美国旧金山联邦法官裁定AI公司Anthropic使用版权书籍构建大模型Claude的行为被认定为“合理使用”。这是AI公司在这类官司中首次获得这样有利的判定。法官认为该使用“具有高度转化性”,因为AI开发具有“变革性”,符合版权法里“促进科学进步”的原则。隔壁Meta的案子,法官文斯·查布里亚也做出了同样的判决。这对AI行业是一个利好,为AI数据的使用提供了法律依据。

所以,以后该怎么“偷”数据?

法官给画了条线。Anthropic公司曾有存储700万册盗版书的情况,此行为构成版权侵权(该部分未实际用于开发),不过该公司通过合法购买并手动扫描实体书用于AI开发的行为被认定为合理使用。这表明,关键是数据来源要合法。自己购买的数据可以用于开发,而网上获取的盗版数据则不行。Meta那个案子也是基于同样的逻辑。等于说,法院认可花钱买来的数据用于开发。当然,法官也强调要“个案评估”。

法官的逻辑是啥?

主要还是依据美国的“合理使用”四要素。法官的逻辑如下:1、AI不是复印机,它学习书籍中的模式和知识,具有“高度转化性”。2、对原作市场影响不大,使用AI不会导致人们不购买原书。AI若只能输出原文,就如同高级搜索,会面临法律问题。不过判决也指出,使用的数据量不能过大,且不能直接照搬原文。总之,AI可以学习但不能抄袭。

有啥风险?

这一判决短期内对AI公司是有利的。但判决书也存在一些潜在风险。一,该判决仅适用于美国,欧盟的态度尚不确定。二,在技术上,不能将整本书存储在服务器中。三,也是最重要的,AI输出的内容不能与原书形成直接竞争。如果生成类似《哈利波特与火焰杯》续集并用于商业盈利,可能会面临法律诉讼。总的来说,该判决为AI数据使用划定了界限。差不多就这些。

追加内容

本文作者可以追加内容哦 !