OpenAI发布GPT-4o mini 奥尔特曼称两年时间模型成本下降了99%-品论天涯网

相比2022年的text-davinci-003型号，GPT-4omini的成本下降了99%。虽然OpenAI迟迟未发布下一代模型GPT-5，但在现有能力基础上，仍在更新模型，继续推动大模型成本下降。egF品论天涯网

当地时间7月18日，OpenAI发布了新款轻量级的大模型GPT-4omini。据介绍，GPT-4omini即日起将在问答机器人ChatGPT中取代GPT-3.5Turbo，企业用户则能从下周起访问GPT-4omini。egF品论天涯网

“我们预计GPT-4omini将扩大人工智能的应用，让人工智能变得更实惠。”OpenAI官网文章称，GPT-4omini的输入价格为15美分（0.15美元）/百万tokens（词元），输出价格为60美分（0.6美元）/百万tokens（约等于一本2500页的书），比GPT-3.5Turbo便宜60%。egF品论天涯网

从模型能力看，OpenAI称，GPT-4omini在行业基准测试MMLU（评估大规模多任务语言理解）中获得82%的分数，低于GPT-4o的88.7%，高于77.9%的GenminiFlash、73.8%的Claude3Haiku和69.8%的GPT-3.5Turbo。GPT-4omini在MGSM测试（评估数学推理）和MMMU测试（评估多模态推理）中，分别得分87%和59.4%，均超过GeminiFlash和Claude3Haiku，但低于GPT-4o。egF品论天涯网

egF品论天涯网

此外，GPT-4omini上下文窗口为128Ktokens，支持输出16Ktokens，知识更新至2023年10月。OpenAI介绍，GPT-4omini还改进了处理非英语文本时的成本效益。GPT-4omini能以较低成本和延迟执行广泛任务，如链接或并行多个模型调用（调用API接口）、将大量上下文输入给模型、通过快速的实时文本响应与人交互。egF品论天涯网

目前，GPT-4omini可以生成文字和图像，未来将支持视频和音频。OpenAI计划还在未来几天推出GPT-4o的微调。egF品论天涯网

目前来看，GPT-4omini的主要作用可能是取代GPT-3.5Turbo，并通过降低价格吸引用户。egF品论天涯网

OpenAI称，公司还将在提高模型性能的同时继续降低成本。相比2022年的text-davinci-003型号，GPT-4omini的成本下降了99%。egF品论天涯网

“2022年全世界最先进的模型还是text-davinci-003，这个模型比现在的新模型差了很多，却贵了100倍。”OpenAICEO萨姆·奥尔特曼（SamAltman）在社交平台上表示。egF品论天涯网

其他大模型厂商今年也在推动模型轻量化，追求“小而美”。此前有大模型业内人士告诉记者，参数较小的大模型今年来展现了颇高的潜力，通过加大数据量而不是加大参数量的方式训练，模型性能还有很大提升空间，好处则在于轻量大模型的使用成本低，可以扩大使用。egF品论天涯网

谷歌今年5月也发布了轻量级模型Gemini1.5Flash。Anthropic3月发布的Claude3系列中，则包括轻量级的Claude3Haiku，在多项基准测试中Claude3Haiku的得分高于GPT-3.5、低于GPT-4。微软今年也在推动部署轻量级AI模型系列Phi。微软此前称，今年4月推出的Phi-3系列是市面上性能最强、最具性价比的“小语言模型”，最小版本的Phi-3-mini性能可超过参数规模高出一倍多的模型，成本可能只有类似功能的模型的十分之一。egF品论天涯网

从价格上看，Gemini1.5Flash每百万tokens起始价格为0.35美元，输出为1.05美元，Claude3Haiku每百万tokens价格0.25美元，输出为1.25美元。GPT-4omini的价格相对更便宜。egF品论天涯网