英国《经济学人》周刊网站9月21日发表题为《ChatGPT热或在降温,但一个重要的新行业正在形成》的文章。文章认为,一个以超强劲的人工智能模型为核心的全新产业正在形成。编译如下:第一波有关生成式人工智能的兴奋情绪无与伦比。在2022年11月上线后的两个月内,聊天生成预训练转换器(ChatGPT)就获得了1亿用户。
互联网上对“人工智能”的搜索激增;仅今年上半年,就有超过400亿美元的风险资本流入人工智能公司。
此后,热情有所降温:对ChatGPT的使用已经下降,用Google搜索“人工智能”的人越来越少。据信,以进入有泡沫的市场而著称的日本投资者孙正义有意投资推出ChatGPT的开放人工智能研究中心(OpenAI)。但第二个更为重要的阶段已经开始。一个以超强劲的人工智能模型为核心的全新产业正在形成。有三个要素将决定它最终会是什么样子——以及是OpenAI保持主导地位,还是其他参与者胜出。
第一个要素是算力。算力成本迫使模型建造者提高效率。例如,面对训练和运行更强大模型的惊人成本,OpenAI还没有开始训练它的下一个大模型GPT-5,而是训练GPT-4.5,这是它当前领先产品的更高效版本。这可能会给Google等财力雄厚的对手一个迎头赶上的机会。这家科技巨头即将发布的尖端模型“双子座”被认为比OpenAI目前的版本更强大。
高昂的算力成本也鼓励了规模小得多的模型的大量增长。用特定数据训练而成的这些模型可以完成特定任务。例如,初创公司Replit训练了一个生成计算机代码的模型,可以帮助开发人员编写程序。开源模型也使人们和企业更容易进入生成式人工智能的世界。根据人工智能企业抱抱脸公司所做的统计,目前约有1500个版本的这类微调模型。
所有这些模型现在都在抢夺数据——影响生成式人工智能行业的第二个要素。最大的模型——比如OpenAI和Google的模型——都是“大胃王”:用来训练它们的数据超过1万亿个字,相当于250多个英文版维基百科。随着它们的规模越来越大,它们对数据的需求也水涨船高。但互联网即将被吃干榨尽。因此,许多模型制造商正在与新闻和摄影机构签署协议。有的模型制造商争相利用算法创造“合成”训练数据;还有的则试图利用新形式数据,比如视频。它们竞争的目标是一个击败对手的模型。
生成式人工智能对数据和算力的渴求使得第三个要素——金钱——更为重要。许多模型制造商已经放弃面向普通民众的ChatGPT式聊天机器人,转而着眼于付费业务。于2015年作为一个非营利性项目起家的OpenAI在这方面一直特别有活力。它不仅授权微软公司使用其模型,还为摩根士丹利和赛富时等公司提供定制工具。阿联酋计划成立一家公司,帮助其类ChatGPT开源人工智能模型“猎鹰”的应用商业化。
另一种策略是吸引软件开发人员,希望让他们迷上你的模型,创造出在技术上非常宝贵的网络效应。OpenAI正在提供工具,帮助开发人员利用它的模型搭建产品;元宇宙平台公司希望,它的开源模型llama将帮助创建一个忠实的程序员社群。
谁会胜出?像拥有大量用户的OpenAI和财大气粗的Google这样的公司具有明显的先发优势。但是,只要算力和数据仍受到限制,能巧妙绕过它们的回报就会很大。一个策略最高效、数据合成方法最独创或者对客户的宣传最动人的模型制造商就可能会抢占领先地位。
炒作或许已经降温,但大戏才刚刚开始。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】