人工智能

GPT-4o加钱能变快 新功能“预测输出”7秒完成原先23秒的任务

字号+作者:量子位 来源:量子位 2024-11-07 08:48 评论(创建话题) 收藏成功收藏本文

OpenAI出了个新功能,直接让ChatGPT输出的速度原地起飞!这个功能叫做“预测输出”(PredictedOutputs),在它的加持之下,GPT-4o可以比原先快至多5倍。以编程为例'...

OpenAI出了个新功能,直接让ChatGPT输出的速度原地起飞!这个功能叫做“预测输出”(PredictedOutputs),在它的加持之下,GPT-4o可以比原先快至多5倍。以编程为例,来感受一下这个feel:JeK品论天涯网


JeK品论天涯网

为啥会这么快?用一句话来总结就是:JeK品论天涯网

跳过已知内容,不用从头开始重新生成。JeK品论天涯网

因此,“预测输出”就特别适合下面这些任务:JeK品论天涯网

在文档中更新博客文章JeK品论天涯网

迭代先前的响应JeK品论天涯网

重写现有文件中的代码JeK品论天涯网

而且与OpenAI合作开发这个功能的FactoryAI,也亮出了他们在编程任务上的数据:JeK品论天涯网


JeK品论天涯网

从实验结果来看,“预测输出”加持下的GPT-4o响应时间比之前快了2-4倍,同时保持高精度。JeK品论天涯网

并且官方还表示:JeK品论天涯网

原先需要70秒完成的编程任务,现在只需要20秒。JeK品论天涯网

值得注意的是,目前“预测输出”功能仅支持GPT-4o和GPT-4omini两个模型,且是以API的形式。JeK品论天涯网

对于开发者而言,这可以说是个利好消息了。JeK品论天涯网

网友们在线实测JeK品论天涯网

消息一出,众多网友也是坐不住了,反手就是实测一波。JeK品论天涯网

例如Firecrawl创始人EricCiarla就用“预测输出”体验了一把将博客文章转为SEO(搜索引擎优化)的内容,然后他表示:JeK品论天涯网

速度真的超级快。JeK品论天涯网

它就像在API调用中添加一个预测参数一样简单。JeK品论天涯网

另一位网友则是在已有的代码之上,“喂”了一句Prompt:JeK品论天涯网

changethedetailstoberandompiecesoftext.JeK品论天涯网

将详细信息更改为随机文本片段。JeK品论天涯网

来感受一下这个速度:JeK品论天涯网


JeK品论天涯网

也有网友晒出了自己实测的数据:JeK品论天涯网


JeK品论天涯网

总而言之,快,是真的快。JeK品论天涯网

怎么做到的?JeK品论天涯网

对于“预测输出”的技术细节,OpenAI在官方文档中也有所介绍。JeK品论天涯网


JeK品论天涯网

OpenAI认为,在某些情况下,LLM的大部分输出都是提前知道的。JeK品论天涯网

如果你要求模型仅对某些文本或代码进行细微修改,就可以通过“预测输出”,将现有内容作为预测输入,让延迟明显降低。JeK品论天涯网

例如,假设你想重构一段C#代码,将Username属性更改为Email:JeK品论天涯网


JeK品论天涯网

你可以合理地假设文件的大部分内容将不会被修改(例如类的文档字符串、一些现有的属性等)。JeK品论天涯网

通过将现有的类文件作为预测文本传入,你可以更快地重新生成整个文件。JeK品论天涯网


JeK品论天涯网

使用“预测输出”生成tokens会大大降低这些类型请求的延迟。JeK品论天涯网

不过对于“预测输出”的使用,OpenAI官方也给出了几点注意事项。JeK品论天涯网

首先就是我们刚才提到的仅支持GPT-4o和GPT-4o-mini系列模型。JeK品论天涯网

其次,以下API参数在使用预测输出时是不受支持的:JeK品论天涯网

nvaluesgreaterthan1JeK品论天涯网

logprobsJeK品论天涯网

presence_penaltygreaterthan0JeK品论天涯网

frequency_penaltygreaterthan0JeK品论天涯网

audiooptionsJeK品论天涯网

modalitiesotherthantextJeK品论天涯网

max_completion_tokensJeK品论天涯网

tools-functioncallingisnotsupportedJeK品论天涯网

除此之外,在这份文档中,OpenAI还总结了除“预测输出”之外的几个延迟优化的方法。JeK品论天涯网

包括“加速处理token”、“生成更少的token”、“使用更少的输入token”、“减少请求”、“并行化”等等。JeK品论天涯网

文档链接放在文末了,感兴趣的小伙伴可以查阅哦~JeK品论天涯网

OneMoreThingJeK品论天涯网

虽然输出的速度变快了,但OpenAI还有一个注意事项引发了网友们的讨论:JeK品论天涯网

Whenprovidingaprediction,anytokensprovidedthatarenotpartofthefinalcompletionarechargedatcompletiontokenrates.JeK品论天涯网

在提供预测时,所提供的任何非最终完成部分的tokens都按完成tokens费率收费。JeK品论天涯网

有网友也晒出了他的测试结果:JeK品论天涯网

未采用“预测输出”:5.2秒,0.1555美分JeK品论天涯网

采用了“预测输出”:3.3秒,0.2675美分JeK品论天涯网


JeK品论天涯网

嗯,快了,也贵了。JeK品论天涯网

OpenAI官方文档:JeK品论天涯网

https://platform.openai.com/docs/guides/latency-optimization#use-predicted-outputsJeK品论天涯网

参考链接:JeK品论天涯网

[1]https://x.com/OpenAIDevs/status/1853564730872607229JeK品论天涯网

[2]https://x.com/romainhuet/status/1853586848641433834JeK品论天涯网

[3]https://x.com/GregKamradt/status/1853620167655481411JeK品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]