Meta宣布,它采集了Facebook和Instagram上的公开帖子来训练其新型人工智能虚拟助手的部分功能。这家社交媒体巨头强调,它没有把用户的私人帖子或与亲朋好友分享的信息作为训练数据的一部分。
该公司全球事务总裁尼克-克莱格(NickClegg)上周在Meta的Connect大会上接受路透社采访时说:"我们试图排除那些个人信息占很大比重的数据集。"这位英国前副首相补充说,Meta用于培训的绝大多数数据原本都是设定为公开的。"
Meta公司上周三宣布推出MetaAI测试版,这是一款高级对话助手,可在WhatsApp、Messenger和Instagram上使用,并将在雷朋Meta智能眼镜和Quest3上推出。
MetaAI由今年7月发布的LLaMA2语言模型和Emu文本到图像模型提供支持,这两个模型都是在Facebook和Instagram的公开帖子上训练出来的。
克莱格说,LinkedIn就是一个例子,出于隐私方面的考虑,Meta故意不将其内容用于数据训练。
生成式人工智能的许多争议因素之一仍然是其LLM所训练内容的版权问题。今年,艺术家们对StableDiffusion和Midjourney发起了版权诉讼,而包括约翰-格里沙姆(JohnGrisham)和乔治-R-R-马丁(GeorgeR.R.Martin)在内的作家则起诉了OpenAI。克莱格说,他预计在"创意内容是否在现有合理使用原则的覆盖范围内"这一问题上会有"相当数量的诉讼"。
克莱格说:"我们认为是的,但我强烈怀疑这会在诉讼案中上演。"
Meta并不是唯一一家利用用户内容训练人工智能的公司。埃隆-马斯克(ElonMusk)的xAI也在利用用户的推文做同样的事情,而Google在7月份的政策更新中确认,所有发布的用户内容都将用于人工智能训练。
上周三,Meta公司的老板马克-扎克伯格(MarkZuckerberg)也宣布将推出多款基于人工智能的聊天机器人,这些机器人将以名人和有影响力的人物为原型,包括汤姆-布雷迪(TomBrady)、野兽先生(Mr.Beast)、帕丽斯-希尔顿(ParisHilton)、肯达尔-詹娜(KendallJenner)和史努比-道格(SnoopDogg)。Meta表示将推出28个同样由LLaMA2支持的机器人。这次活动并没有取得圆满成功。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】