人工智能

OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频

字号+作者: 来源:站长之家 2024-04-07 10:18 评论(创建话题) 收藏成功收藏本文

划重点:- ⭐ OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频- ⭐ Google 和 Meta 也遇到了数据获取限制的挑战- ⭐ AI 公司面临数据获取'...

划重点:wvN品论天涯网

- ⭐ OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频wvN品论天涯网

- ⭐ Google 和 Meta 也遇到了数据获取限制的挑战wvN品论天涯网

- ⭐ AI 公司面临数据获取困难,采取争议性手段应对wvN品论天涯网

站长之家(ChinaZ.com)4月7日 消息:AI 公司在获取高质量训练数据方面遇到的挑战,OpenAI 为了训练其最先进的大型语言模型 GPT-4,使用了超过一百万小时的 YouTube 视频副本。wvN品论天涯网

据了解,该公司通过其 Whisper 音频转录模型转录这些视频,尽管这一做法在法律上具有争议性,OpenAI 仍认为这属于合理使用。wvN品论天涯网

youtube 油管wvN品论天涯网

Google 对此表示关注,指出其条款禁止未经授权地获取 YouTube 内容。同时,Google 和 Meta 也遇到了训练数据获取的限制,为了跟进 OpenAI 的步伐,这两家公司也采取了一些争议性的做法。wvN品论天涯网

AI 领域正面临训练数据短缺的挑战,而解决方案尚未明朗,公司们需要权衡利弊并寻求合理途径应对这一问题。wvN品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]