人工智能

OpenAI 的预测输出功能可将 GPT-4o 模型的输出速度提高 5 倍

字号+作者:cnBeta.COM 来源:cnBeta 2024-11-06 00:15 评论(创建话题) 收藏成功收藏本文

对于大多数LLM相关用例而言,延迟都是一个重要问题。对于代码建议和修改长文档等情况,延迟更是影响整体用户体验。想象一下,用户想要重写一份2页文档的最后'...

对于大多数LLM相关用例而言,延迟都是一个重要问题。对于代码建议和修改长文档等情况,延迟更是影响整体用户体验。想象一下,用户想要重写一份2页文档的最后一段。如果改写后的文档能立即出现是更为合理的,因为改动只涉及一个段落。然而,目前的LLMAPI需要重新生成整个文档,这给用户带来了很大的延迟。Ca4品论天涯网

Ca4品论天涯网

OpenAI目前正试图通过一项名为预测输出的新开发人员功能来解决这一问题。在LLM的大部分输出已经提前知晓的情况下,可以使用该功能。编辑文档或重构代码等任务都可以使用此功能进行改进。预测输出使用推测解码来跳过已知内容,使迭代速度大大加快。Ca4品论天涯网

开发人员可以将现有内容作为预测内容传入,从而大大减少延迟。通过这种方式,他们可以更快地重新生成整个内容。Ca4品论天涯网

OpenAI与一些外部合作伙伴一起测试了这一功能,结果非常积极。例如,根据微软GitHub团队的内部基准测试,CopilotWorkspace工作负载中的预测输出速度提高了5.8倍。Ca4品论天涯网

感谢@openaidevs!我们在CopilotWorkspace工作负载上对其进行了基准测试,测得速度提高了5.8倍!https://t.co/FOCwYJheUcCa4品论天涯网

-EddieAftandilian(@eaftandilian)2024年11月4日Ca4品论天涯网

预测输出非常快。我们与@openai合作,帮助测试和改进API,从中获得了很多乐趣。注册获得Exponent的早期访问权限并亲自试用:https://t.co/eC3XD4F3Iwhttps://t.co/1jUzMEARCCCa4品论天涯网

-Exponent(@exponent_run)November4,2024Ca4品论天涯网

要使用"预测输出",开发人员会受到一些限制。首先,它只支持GPT-4o和GPT-4o-mini系列机型。不支持最新的o1型号。此外,在使用预测输出时,不支持以下现有API参数:Ca4品论天涯网

  • nvaluesgreaterthan1Ca4品论天涯网

  • logprobsCa4品论天涯网

  • presence_penaltygreaterthan0Ca4品论天涯网

  • frequency_penaltygreaterthan0Ca4品论天涯网

  • audiooptionsCa4品论天涯网

  • modalitiesotherthantextCa4品论天涯网

  • max_completion_tokensCa4品论天涯网

  • tools-functioncallingisnotsupportedCa4品论天涯网

  • 在提供预测时,所提供的词元如果不是API最终完成的一部分,则按完成词元费率收费。虽然存在一些限制,但这项新的预测输出功能的潜在优势是巨大的,它为更灵敏、更高效的LLM工具铺平了道路。Ca4品论天涯网

    本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]