站长之家(ChinaZ.com) 12 月 28 日消息:纽约时报于当地时间周三对微软和流行的人工智能聊天机器人 ChatGPT 的开发者 OpenAI 提起诉讼,指控这些公司侵犯版权,并滥用报纸的知识产权来训练大型语言模型。
微软既是 OpenAI 的投资者,也是其供应商,为其提供 Azure 云计算技术的访问。
在纽约南区联邦地区法院提交的诉状中,《纽约时报》称其寻求让微软和 OpenAI 对其认为自己应得的「数十亿美元的法定和实际损害」负责,这些损害是由于「非法复制和使用《纽约时报》独特有价值的作品」所致。
纽约时报在一份通过电子邮件发送的声明中表示,「认识到 GenAI 对公众和新闻业的力量和潜力」,但补充说,新闻材料应在获得原始来源许可的情况下用于商业利益。
该报称:「这些工具是基于并将继续使用独立的新闻和内容而构建的,而这些内容只有在我们和我们的同行以高成本和相当多的专业知识进行报道、编辑和事实核查后才能获得。」
《纽约时报》补充说:「既定的版权法律保护我们的新闻和内容。如果微软和 OpenAI 想要商业用途使用我们的作品,法律要求他们首先获得我们的许可。他们没有这样做。」
「我们尊重内容创作者和所有者的权利,并致力于与他们合作,确保他们从 AI 技术和新的收入模式中受益,」一位 OpenAI 代表在一份声明中说。「我们与《纽约时报》的持续对话一直富有成效并向前推进,因此我们对这一发展感到惊讶和失望。我们希望能找到一种对双方都有利的合作方式,正如我们正在与许多其他出版商所做的那样。」
微软的代表没有回应置评请求。
《纽约时报》由 Susman Godfrey 律师事务所代表参与诉讼,该事务所曾代表 Dominion Voting Systems 在诉讼 Fox News 的诽谤案中,最终以 7.875 亿美元的和解结束。
Susman Godfrey 还代表作家 Julian Sancton 和其他作者在另一起针对 OpenAI 和微软的诉讼中,指控这些公司未经许可使用版权材料训练了 ChatGPT 的几个版本。
「大规模版权侵权」
《纽约时报》是众多追求补偿的媒体机构之一,它们指控一些最先进的人工智能模型背后的公司非法使用其内容来训练 AI 程序。
OpenAI 是 GPT 的创造者,GPT 是一种可以根据用户提示生成类似人类的内容的大型语言模型。它使用了数十亿参数的信息,这些信息是从 2021 年之前的公共网络数据中获取的。
媒体出版商和内容创作者发现他们的材料被像 ChatGPT、Dall-E、Midjourney 和 Stable Diffusion 这样的生成式 AI 工具使用和重塑。在许多情况下,这些程序产生的内容看起来与原始材料类似。
OpenAI 试图缓解新闻出版商的担忧。该公司宣布与 Axel Springer 达成合作伙伴关系——该公司是商业内幕、Politico 以及欧洲媒体 Bild 和 Welt 的母公司——将其内容授权给 OpenAI 以换取费用。
该交易的财务条款未公开。
在周三的诉讼中,《纽约时报》指责微软和 OpenAI 基于「大规模版权侵权」创建了一种商业模式,称这些公司的 AI 系统「被用于创建多份《纽约时报》知识产权的复制品,用于创建 GPT 模型,这些模型在许多情况下都利用并保留了这些作品中包含的大量版权表达。」
出版商担心,随着生成式 AI 聊天机器人的出现,越来越少的人会点击新闻网站,导致流量和收入减少。
《纽约时报》在诉状中列举了多个例子,其中 GPT-4 生成了与该报出版的材料类似的改编版本。
在一个例子中,诉状显示 OpenAI 的软件生成了与《纽约时报》关于纽约市出租车行业掠夺性放贷行为的文章几乎相同的文本。
但在 OpenAI 的版本中,GPT-4 排除了关于城市出售出租车牌照和征收私人销售税的重要背景信息。
在其诉讼中,时报称微软和 OpenAI 的 GPT 模型「与时报的内容直接竞争。」
AI 模型还通过改变其内容,限制了时报的商业机会。例如,出版商声称 GPT 输出删除了其 Wirecutter 应用中产品的链接,「因此剥夺了《纽约时报》获得推荐收入的机会,并将这一机会转移给了被告。」
《纽约时报》还指控微软和 OpenAI 的模型产生与报纸生成的内容类似的内容,且未经同意使用其内容来训练 LLM,「相当于免费搭便车,利用《纽约时报》在收集这些信息方面的重大努力和投入的人力资本。」
《纽约时报》称,微软和 OpenAI 的 LLM「可以生成完全复述时报内容、紧密总结和模仿其表现风格的输出」,「错误地将虚假信息归咎于时报」,并「剥夺时报的订阅、许可、广告和附属收入。」
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】