OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频-品论天涯网

划重点:8ck品论天涯网
- ⭐ OpenAI 为训练 GPT-4模型转录了超过一百万小时的 YouTube 视频8ck品论天涯网
- ⭐ Google 和 Meta 也遇到了数据获取限制的挑战8ck品论天涯网
- ⭐ AI 公司面临数据获取困难，采取争议性手段应对8ck品论天涯网

站长之家（ChinaZ.com）4月7日消息:AI 公司在获取高质量训练数据方面遇到的挑战，OpenAI 为了训练其最先进的大型语言模型 GPT-4，使用了超过一百万小时的 YouTube 视频副本。8ck品论天涯网

据了解，该公司通过其 Whisper 音频转录模型转录这些视频，尽管这一做法在法律上具有争议性，OpenAI 仍认为这属于合理使用。8ck品论天涯网

youtube 油管 8ck品论天涯网

Google 对此表示关注，指出其条款禁止未经授权地获取 YouTube 内容。同时，Google 和 Meta 也遇到了训练数据获取的限制，为了跟进 OpenAI 的步伐，这两家公司也采取了一些争议性的做法。8ck品论天涯网

AI 领域正面临训练数据短缺的挑战，而解决方案尚未明朗，公司们需要权衡利弊并寻求合理途径应对这一问题。8ck品论天涯网