发布时间:2023-02-26 08:47:21 来源:本站 作者:admin
如果软件抓取互联网图像并使用其中的 20 张来制作一张全新的照片,谁拥有版权——原始摄影师、请求混搭的人还是 AI 公司?
洛杉矶——我们正在目睹一场人工智能 (AI) 的大规模革命。 ChatGPT、Midjourney、Stable Diffusion、Dall-E 和 Copilot 等工具允许用户仅根据自然语言提示生成文本、图像、计算机代码和其他内容。
人工智能输出的创造力、细节和类人品质令人惊叹,导致广泛的兴奋、恐惧和愤怒,因为思维机器迫使我们质疑长期以来关于人类独创性的假定假设,并思考人工智能是否正在带来 我们更接近乌托邦、人类过时或介于两者之间。 值得庆幸的是,这只是一个法律博客,所以我们可以将这些关于即将到来的奇点的存在主义问题留给《黑镜》的一集。
AI 的法律含义是多种多样、不断发展和复杂的,但这篇文章的重点是 AI 与知识产权的交集——特别是 AI 的输入——即用于训练 AI 的内容——引起的 IP 和 IP 相关问题。 (一组不同的问题与提供给 AI 输出的 IP 保护或缺乏保护有关。我们之前在博客中讨论过输出问题,这不是本文的重点。)
根本问题是:内容创作者是否有权授权或阻止人工智能系统收集和使用他们的内容作为训练数据? 这个问题不仅涉及复杂的法律问题,而且涉及重要的公共政策问题。 围绕人工智能的哪些规则将以最佳方式“促进科学和实用艺术的进步”,这是美国宪法版权授权的主要指令?
这些问题是针对被指控未经许可摄取内容的生成 AI 提供商提起的两起集体诉讼的核心。 这两起案件均由同一位律师(Joseph Saveri 律师事务所和 Matthew Butterick)向美国加利福尼亚州北区地方法院提起诉讼。 Getty Images 在英国提起的第三起诉讼提出了类似的主张。
通过建立人工智能机器学习的法律参数,这些纠纷有可能深刻影响人工智能系统的加速、采用和质量。 下面是对这三起诉讼的总结,然后是对一些关键法律问题的讨论——即版权、网络抓取和版权优先购买权——在这些案件中可能会引起激烈的诉讼。
三个新的 AI 案例
1. Doe 诉 GitHub,22 Civ。 6823(北达科他州,2022 年 11 月 10 日)
在第一项诉讼中,假定的一类开发人员起诉了 GitHub(一个流行的开源代码存储库)、OpenAI(GPT-3 的所有者,ChatGPT 背后的语言模型)和 Microsoft(GitHub 的所有者和 OpenAI 的主要投资者)。 该行动针对 Copilot,这是一种基于订阅的人工智能工具,由 GitHub 和 OpenAI 使用 GPT-3 共同开发,“承诺通过使用人工智能提供或填充代码块来协助软件编码人员。”
开发人员声称,被告使用受版权保护的源代码,开发人员根据各种开源许可将其发布到 GitHub,作为 Copilot 的训练数据。
该投诉提出了各种诉讼理由,包括违反《数字千年版权法》(用于从源代码中删除 CMI)的“版权管理信息”部分,17 U.S.C. 第 1202 条; 违约(未能提供归属、版权声明和源代码的开源许可证副本)。 有趣的是,该投诉并未指控直接侵犯版权。
根据目前的时间表,被告回应的截止日期——可能是驳回动议——是 2023 年 1 月 26 日。开发商的异议截止日期为 2023 年 3 月 9 日,答复截止日期为 2023 年 4 月 6 日。
2. Andersen 诉 Stability AI 等人,第 23 号 Civ。 201(北达科他州,2023 年 1 月 13 日)
第二个案例由三位视觉艺术家提出,针对生成艺术人工智能工具 Stable AI(Stable Diffusion 背后的开发者)、MidJourney(一种流行的图像生成器)和 Deviant Art(DreamUp 应用程序的开发者)。
与 GitHub 案类似,艺术家声称被告未经许可使用艺术家的作品来训练 AI 系统,然后使用机器学习生成新的、涉嫌侵权的衍生作品。 与 GitHub 案例不同,针对 AI 艺术生成器的投诉主张侵犯版权(根据直接和替代责任理论)。
有趣的是,版权声明针对的是某些工具能够以“特定艺术家的风格”创作艺术的能力。 被告尚未出现在这个全新的案件中。
3. Getty Images 诉 Stable Diffusion
2023 年 1 月 17 日,库存图片许可方 Getty Images 宣布将在英国对 Stability AI 提起诉讼。 在发布时,投诉尚不可用。 但在一份新闻声明中,Getty Images 辩称,“Stability AI 非法复制和处理了数百万受版权保护的图像以及 Getty Images 拥有或代表的相关元数据,这些图像没有获得许可,有利于 Stability AI 的商业利益,并损害了内容创作者的利益 ”
盖蒂进一步表示,它提供“与以尊重个人和知识产权的方式训练人工智能系统相关的许可证”,但 Stability AI 没有获得许可证,而是追求自己的“独立商业利益”。 Getty Images 建议投诉将包括侵犯版权和非法网络抓取的索赔。
版权和合理使用
版权将是所有这三个案例的核心,即使它不是 GitHub 案例中的直接索赔。
在美国,版权存在于固定在有形表达媒体中的原创作品中。 这涵盖了三起诉讼中的所有争议内容,包括视觉设计、照片和源代码。 撇开可能保护这些作品的合同或其他权利不谈(更多内容见下文),AI 生成器在未经许可的情况下使用受版权保护的作品的程度可能会归结为合理使用的问题。 该问题的确定几乎肯定会涉及对三个具有里程碑意义的合理使用案例的审查。 每一个都对未经授权的机器学习问题有明显的影响。
1. The Authors Guild v. HathiTrust (2d Cir. 2014) 和 Google (2d Cir. 2015)
在两个案例中,一个作者权利组织和一群个人作者在扫描并索引了数百万本受版权保护的书籍以使这些书籍可以在线搜索后,以侵犯版权为由起诉谷歌和几个研究图书馆。 第二巡回法院在这两种情况下都认定合理使用。 数百万受版权保护的作品在未经作者许可的情况下被使用或者谷歌试图通过这些作品获利并不重要。
在 HathiTrust 案中,法院认为“创建全文可搜索数据库是一种典型的变革性使用”,因为它不会“取代最初创建的对象或目的”,而是添加“具有不同目的和目的的新内容” 一个不同的角色。”
在针对谷歌的案件中,法院认为“谷歌制作数字副本以提供搜索功能……通过提供有关 [p] 原告书籍的信息而不向公众提供
版权抢占
一种不如合理使用吸引人的原则——但对于未经授权的 AI 机器学习所引发的问题同样重要——是版权优先购买权。 正如上面讨论的网络抓取案例所表明的那样,版权并不是保护内容的唯一可用工具。
在线内容经常发布在受服务条款约束的网站上,这些条款通常旨在限制商业用途和对其内容的网络抓取。 当有人违反这些条款收集和使用内容时,有论点认为这是违约,即使该使用不构成侵犯版权(例如,因为该使用已获得许可或合理使用)。 版权优先购买通常是对该主张的重要抗辩。
《版权法》第 301(a) 节规定:“在版权的一般范围内等同于任何专有权的所有法律或衡平法权利……均受本标题的专属管辖。”
根据该法规,法院经常驳回不当得利、公开权和其他州法律要求,这些要求被《版权法》所取代。 如果索赔被先发制人,则被告可以根据《版权法》提出一整套可用的抗辩理由,包括明示或默示许可、缺乏版权和合理使用。
基于违反《版权法》的服务条款使用内容而提出的违约索赔是否优先? 有时是,有时不是。 法院一直在努力解决这个问题。 在许多情况下,包括在第二巡回法院,结果取决于是否发现违约索赔包含任何“使其与版权侵权索赔在质量上有所不同的额外要素”。
例如,在 Briarpatch Ltd., L.P. v. Phoenix Pictures, Inc., 373 F.3d 296 (2d Cir. 2004) 中,已发现合同承诺支付构成排除版权优先购买权的“额外要素”。
第二巡回法院在 ML Genius Holdings LLC 诉 Google LLC(2d Cir. 2022)中没有发现此类“额外元素”。 在这种情况下,歌词网站 Genius.com 起诉谷歌在搜索结果中抓取并显示其歌词,据称这违反了 Genius 的服务条款。 Genius 没有(也不能)起诉侵犯版权,因为 Genius 不拥有歌词的版权。 但是,Genius 的服务条款禁止用户以商业方式复制或分发发布到 Genius 的内容的任何部分。 Genius 起诉谷歌违反这些条款,但第二巡回法院认为该索赔被抢先了,发现违约索赔“与版权索赔没有质的区别”。
Genius 请求最高法院复审该决定,辩称“[t]巡回法院在《版权法》对违约索赔的优先权方面存在棘手的分歧。 作为回应,谷歌辩称 Genius 试图不恰当地使用其服务条款来“发明新的权利”,这些权利等同于版权并被版权所取代。 2022 年 12 月 12 日,最高法院邀请美国副检察长提交一份简报,分享其对该案的看法,表明可能授予调卷令。
根据预期的合理使用辩护的结果,Genius(特别是如果 SCOTUS 授予证书)和其他版权优先购买案件可能在确定因收集和使用 AI 机器的公开可用数据而引起的州法律索赔的可行性方面发挥关键作用 学习。
结语
这一切都发生得非常快。 几年前,人工智能生成的作品完全属于新锐艺术家、学者和版权学者的领域。 突然间,在过去几个月里,人工智能工具变得无处不在——不仅用于实验和媒体炒作,还用于商业用途、教育等。
法律总是难以跟上技术的发展,人工智能也不例外。 当我开始起草这篇文章时,我写了假设——即“艺术家起诉这些工具之一侵犯版权只是时间问题。” 中期,Stability Diffusion 案的消息传来。 随后 Getty Images 宣布了其诉讼。 像人工智能一样,这些问题不再是学术性的。
鉴于人工智能的发展速度,人工智能对“更多输入”永无止境的需求,以及人工智能已经对创意产业产生的深远影响,我相信这仅仅是个开始。
虽然新技术带来了一定程度的不确定性,但我们很幸运有几个世纪的先例可以借鉴来帮助我们应对即将到来的冲击。 希望在制定人工智能内容摄取的道路规则时,政策制定者和法院将考虑他们的决定不仅对他们面前的私人团体产生的影响,而且对社会对“科学进步和有用艺术的进步”的压倒一切的兴趣产生影响。
此警报提供其主题领域的一般报道。 我们提供它的理解是 Frankfurt Kurnit Klein & Selz 不是 eng