人工智能

不要叫我程序员,我是“AI工程师” 马斯克开始卷自然语言编程

字号+作者: 来源:机器之心 2023-07-01 15:25 评论(创建话题) 收藏成功收藏本文

未来十年需求最高的工作,是“AI工程师”?ChatGPT出现后,人们预测“所有行业都要通过AI进行重塑”,有些工作会被代替,也有工作会改变形式。作为把AI造出来的'...

未来十年需求最高的工作,是“AI工程师”?ChatGPT出现后,人们预测“所有行业都要通过AI进行重塑”,有些工作会被代替,也有工作会改变形式。作为把AI造出来的程序员,他们的职业会变成什么样?最近,事情看起来有了谱,一群工程师和学者喊出了“AI工程师”的概念,获得了众多响应:0Ur品论天涯网


0Ur品论天涯网

由于GPT-4等大语言模型展现出的通用化且强大的能力,我们的工作方式或许很快就会转变成和AI协同工作,跟上人工智能的步伐本身就是一项全职工作。0Ur品论天涯网

据说,这个“AI工程师”处于全栈工程师和机器学习工程师之间,占据后端工程师的一部分,专注于大模型的构建。现在它还处于定义阶段,不过看大家热烈讨论的样子,距离落地应该不远了,毕竟ChatGPT革命的速度就是这么快。0Ur品论天涯网

想法一出,AI领域大v们迅速有了点评。OpenAI科学家、前特斯拉AI和自动驾驶主管AndrejKarpathy表示赞同。“大模型创建了一个全新的抽象和专业层,到目前为止,我把它称为『提示工程师』,但现在不止是提示的问题。”0Ur品论天涯网

另外他指出四个要点:0Ur品论天涯网

过去的机器学习工作通常要从头开始训练算法,而结果一般性能有限。0Ur品论天涯网

大模型训练与传统机器学习有很大不同,前者系统工作量很大,进而分裂出一种新角色,专注于在超级计算机上对Transformer进行大规模训练。0Ur品论天涯网

从数字上看,AI工程师的数量可能会比机器学习工程师/大模型工程师多得多。0Ur品论天涯网

你无需接受任何训练就可以成功担任这一角色。0Ur品论天涯网


0Ur品论天涯网

马斯克看完以后也说了:0Ur品论天涯网


0Ur品论天涯网

职位需求大,有重要意义且门槛低,看起来让人既兴奋又焦虑。0Ur品论天涯网

在讨论中,也有人提出了“认知工程师”、“AI系统工程师”等名称作为候选,英伟达AI科学家JimFan认为这种新兴的职业应该被称为“无梯度工程师”——从传统工具1.0,到神经网络2.0,再到无梯度架构的3.0,我们终于等来了GPT系列自我训练的4.0版本。0Ur品论天涯网


0Ur品论天涯网

对此,威斯康星大学助理教授SebastianRaschka表示,这仅适用于通用助理,对于大多数业务,你也不需要“通用”。0Ur品论天涯网

名称和定义给了很多,让我们看看这个“AI工程师”到底是什么样的职位?0Ur品论天涯网

在基础模型的突破性能力和开源大模型、API的推动下,我们正在见证应用人工智能十年一次的转变。0Ur品论天涯网

在2013年需要花费五年时间和一个研究团队才能完成的人工智能任务,现在只需要API、文档和2023年一个空闲的下午即可完成。0Ur品论天涯网


0Ur品论天涯网

然而,细节决定成败——应用和产品化人工智能的挑战无穷无尽:0Ur品论天涯网

模型上,有从最大的GPT-4和Claude模型,到开源的Huggingface、LLaMA和其他模型;0Ur品论天涯网

工具上,从最流行的链接、检索和矢量搜索工具(如LangChain、LlamaIndex和Pinecone)到新兴的自主代理领域(如Auto-GPT和BabyAGI);0Ur品论天涯网

技术上,每天新提交的论文、模型和技术的数量随着兴趣和资金的增加而呈指数级增长,以至于了解这一切几乎已是一项全职工作。0Ur品论天涯网

若认真严肃地对待此种情况,这应该被认为是一份全职工作。因此,软件工程将催生出一个新的子学科,专门研究人工智能的应用并有效地运用新兴的堆栈,就像“站点可靠性工程师”(SRE)、“开发运营工程师”、“数据工程师”和“分析工程师”的出现一样。0Ur品论天涯网

这个角色的全新(也是最不令人敬畏的)版本似乎是:人工智能工程师。0Ur品论天涯网

我们知道,每家创业公司都有某种讨论AI使用的Slack频道,很快这些渠道将从非正式团体转变为正式团队。目前,成千上万的软件工程师正致力于生产AIAPI和OSS模型,无论是在上班时间还是晚上和周末,在公司Slacks或独立Discords中,这一切都将专业化并集中在一个头衔上:AI工程师。0Ur品论天涯网

这可能是未来十年需求最高的工程工作。0Ur品论天涯网

人工智能工程师将随处可见,从微软和Google等科技巨头,到Figma、Vercel和Notion这样领先的初创公司,独立开发者,如SimonWillison、PieterLevels和RileyGoodside。他们在Anthropic进行的工程实践,每年可以赚取30万美元,在OpenAI构建软件,每年能赚取90万美元。他们利用周末空闲时间在AGIHouse思考想法,并在Reddit的/r/LocalLLaMA专区上分享技巧。0Ur品论天涯网

他们的共同点是,几乎可以在一夜之间就能把人工智能的进步转化为数百万人使用的实际产品。而在其中,你看不到一个博士学位的头衔。在交付人工智能产品时,你需要的是工程师,而不是研究人员。0Ur品论天涯网

AI工程师与ML工程师的大反转0Ur品论天涯网

在Indeed网站上的一组数据表明,机器学习工程师的职位数量是AI工程师职位数量的10倍,但相比较而言,AI领域的增长速率更快一些,有预测认为这种比例将在五年内发生反转,即AI工程师将会是ML工程师的数倍。0Ur品论天涯网


0Ur品论天涯网

HNWho’sHiring(其是HackerNews上的一个月度帖子,它提供了一个平台,供雇主发布招聘信息)不同类别的月度就业趋势0Ur品论天涯网

一直以来,关于AI和ML之间差异的争论无休无止,但又小心谨慎。我们也很清楚,职位为普通的软件工程师完全可以构建起AI软件。然而,最近大家又在围绕另一个问题展开讨论,即在HackerNews的一个热帖“如何进入AI工程”引起了大家的广泛兴趣,这则热门帖子也说明了市场上仍然存在的基本限制原则,对每个职位的区分还是很细的。0Ur品论天涯网


0Ur品论天涯网

HackerNews上2023年6月一个帖子的截图:“如何进入AI工程”的热门投票答案。0Ur品论天涯网

直到现在,还有很多人认为AI工程是ML工程或数据工程的一种形式,所以当有人询问如何进入某一领域时,他们倾向于推荐相同的先决条件,如在上面的回答中,很多人推荐了吴恩达(AndrewNg)的Coursera课程。但那些高效的AI工程师中没有一个人完成过吴恩达在Coursera上的课程,他们也不熟悉PyTorch,也不知道数据湖(DataLake)和数据仓库(DataWarehouse)之间的区别。0Ur品论天涯网

在不久的将来,没有人会建议通过阅读Transformer的论文《AttentionisAllYouNeed》来开始学习AI工程,就像你不会通过阅读福特T型车的设计图纸来开始学习驾驶一样。当然,理解基本原理和技术的历史进展是有帮助的,它可以帮你找到提高思路和效率的方法。但有时你也可以通过使用产品,以实际经验来了解它们的特性。0Ur品论天涯网

AI工程师与ML工程师的反转不会在一夜之间发生,对于拥有良好的数据科学和机器学习背景的人来说,Prompt工程和AI工程可能会在很长一段时间内不被看好。然而,随着时间的推移,需求和供应的经济规律将会占上风,人们对AI工程观点也会改观。0Ur品论天涯网

为什么AI工程师会兴起?0Ur品论天涯网

在模型层面,现在很多基础模型是少样本学习器,具有很强的上下文学习以及零样本迁移能力,模型展现出来的性能往往超越了训练模型的最初意图。换句话说,创建这些模型的人并不完全知道模型的能力范围。而那些非LLM(大语言模型)专家的人可以通过与模型更多地交互,并将其应用于研究所低估的领域来发现和利用这些能力。0Ur品论天涯网

在人才层面,微软、Google、Meta以及大型基础模型实验室已经垄断了稀缺的研究人才,他们提供了“AI研究即服务”的API。你可能无法雇佣这种研究人员,但你可以租用他们的服务。现在全球大约有5000名LLM研究人员、5000万名软件工程师。这一供应限制决定了处于“中间”类别的AI工程师将会崛起,从而满足人才需求。0Ur品论天涯网

硬件层面,各大科技公司、机构等大量囤积GPU,当然,OpenAI、微软是第一个这样做的,但StabilityAI通过强调他们的4000个GPU集群开启了初创公司的GPU竞争战。0Ur品论天涯网


0Ur品论天涯网

此外,一些新的初创公司开始崛起,如Inflection(13亿美元)、Mistral(1.13亿美元)、Reka(5800万美元)、Poolside(2600万美元)和Contextual(2000万美元)已经普遍开始筹集巨额种子轮融资,以拥有自己的硬件设施。0Ur品论天涯网

美国科技行业的高管和投资者NatFriedman甚至宣布了他们的Andromeda计划,该计划是一座价值1亿美元、拥有10exaflop计算能力的GPU集群,专门为其投资的初创公司提供支持。在API领域的另一侧,将会有更多的AI工程师能够使用模型,而不仅仅是训练模型。0Ur品论天涯网

效率方面,与其要求数据科学家、机器学习工程师在训练单个特定领域模型并投入生产之前进行繁琐的数据收集工作,产品经理、软件工程师可以通过与LLM进行交互,构建和验证产品想法。0Ur品论天涯网


0Ur品论天涯网

假设后者(数据、ML工程师)的数量是前者(AI工程师)的100到1000倍,而通过与LLM交互的工作方式会让你比传统的机器学习快10到100倍。因此,AI工程师将能够以比以往便宜10000倍的方式验证AI产品。0Ur品论天涯网

软件层面,会出现Python到JavaScript的变化。传统上,数据和AI领域以Python为中心,而第一批AI工程工具(如LangChain、LlamaIndex和Guardrails)也以Python为主。然而,JavaScript开发者的数量至少应与Python开发者数量相当,因此现在的工具越来越多地向这个方向扩展,从LangChain.js和Transformers.js到Vercel的新AISDK。JavaScript的市场总体规模的扩大和机遇是令人瞩目的。0Ur品论天涯网

每当一个有着完全不同的背景、使用完全不同的语言、生产完全不同的产品、使用完全不同的工具的子群体出现时,他们最终会分裂成自己的群体。0Ur品论天涯网

代码在软件2.0到软件3.0演进中的作用0Ur品论天涯网

6年前,AndrejKarpathy撰写了一篇非常有影响力的文章,描述了软件2.0,将精确建模逻辑的经典堆栈手写编程语言与近似逻辑的机器学习神经网络的新堆栈进行对比。文章表明软件能够解决更多问题,而这些问题是人类无法建模的。0Ur品论天涯网

今年,Karpathy继续发表文章指出,最热门的新编程语言是英语,因为生成式AI的提示可以理解为人类设计的代码,很多情况下是英语,并由LLM解释,最终填补了他的图表中的灰色区域。0Ur品论天涯网


0Ur品论天涯网

注:软件1.0(Software1.0)的经典堆栈是用Python、C++等语言编写的。软件2.0是用神经网络权重编写的,没有人参与这段代码的编写过程,因为权重有很多。0Ur品论天涯网

去年,PromptEngineering成为一个流行的话题,人们开始将GPT-3和StableDiffusion应用于工作。人们嘲笑AI创业公司为OpenAI包装器,并对LLM应用程序易受提示注入和反向提示工程的问题感到担忧。0Ur品论天涯网

但2023年很重要的一个主题是关于重新确立人类编写的代码的作用,从超过2亿美元的巨头Langchain到由英伟达支持的Voyager,显示出代码生成和重用的重要性。PromptEngineering既被过度炒作又具有持久性,但在软件3.0应用程序中重新出现的软件1.0范式既是一个巨大的机遇,也为大量的创业公司创造了新的空间:0Ur品论天涯网


0Ur品论天涯网

随着人类工程师学会利用AI,AI越来越多地接手工程工作,未来,当我们回头看时,分辨出两者之间的区别已经很困难了。0Ur品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]