人工智能

OpenAI抨击的“蒸馏”技术 很多大型AI公司正争着用

字号+作者:凤凰网科技 来源:凤凰网科技 2025-03-03 14:34 评论(创建话题) 收藏成功收藏本文

当DeepSeek在今年初凭借低成本模型一鸣惊人时,OpenAI曾在没有证据的情况下指控DeepSeek违规“蒸馏”。据《金融时报》报道,包括OpenAI、微软和Meta在内的'...

当DeepSeek在今年初凭借低成本模型一鸣惊人时,OpenAI曾在没有证据的情况下指控DeepSeek违规“蒸馏”。据《金融时报》报道,包括OpenAI、微软和Meta在内的领先AI公司正转用“蒸馏”技术,以便在全球竞争中开发出更便宜、便于消费者和企业采用的AI模型。TDQ品论天涯网

TDQ品论天涯网

大型公司也开始利用蒸馏技术TDQ品论天涯网

通过蒸馏技术,企业使用一个被称为“教师”模型的大语言模型生成数据,然后用这些数据训练一个较小的“学生”模型,从而快速将大模型的知识和预测能力转移到较小的模型上。TDQ品论天涯网

虽然蒸馏技术已被广泛应用多年,但是近期的进展使得业内专家相信,对于寻求以经济高效的方法来开发大模型应用的创业公司来说,这项技术将逐渐成为他们的福音。TDQ品论天涯网

“蒸馏技术相当神奇,”OpenAI平台产品负责人奥利维尔·戈德门特(OlivierGodement)表示,“其本质上是利用一个非常庞大且智能的前沿模型来训练一个较小的模型……使其在特定任务上具备极强的能力,同时成本极低,执行速度极快。”TDQ品论天涯网

OpenAI的GPT-4,谷歌Gemini和Meta的Llama等大语言模型需要海量数据和算力来开发和维护。虽然这些公司尚未披露训练大模型的具体成本,但很可能高达数亿美元。借助蒸馏技术,开发者和企业可以以极低的成本获取这些模型的能力,使应用开发者能够在笔记本电脑和智能手机等设备上快速运行AI模型。TDQ品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱service@pltyw.com

评论(0人参与,0条评论)
  • 请先说点什么
    热门评论
    最新评论
    正在载入评论列表...

    查看完整讨论话题】 | 【用户登录】 | 【用户注册

    13
    扫二维码添加收藏返回顶部