人工智能

马斯克首个编码模型上线 编程飙进Top5 9位华人天团爆肝打造

字号+作者:新智元 来源:新智元 2025-08-29 20:22 评论(创建话题) 收藏成功收藏本文

马斯克画的饼,终于兑现了!一大早,xAI正式上线首个编码模型——GrokCodeFast1,一款兼具速度、高性价比的推理模型。经过微调,GrokCode在编码性能上表现非常惊'...

马斯克画的饼,终于兑现了!一大早,xAI正式上线首个编码模型——GrokCodeFast1,一款兼具速度、高性价比的推理模型。经过微调,GrokCode在编码性能上表现非常惊艳。42m品论天涯网


42m品论天涯网

在SWE-benchVerified基准测试中,GrokCode拿下70.8%高分,仅次于Codex-1、Claude4Opus。42m品论天涯网

在编码LiveCodeBench中,它拿下了62%高分;数学IOI得分4.3%。42m品论天涯网


42m品论天涯网

可以说,GrokCode编程实打实的强,有开发者测试,仅用几次提示直出一个网页。42m品论天涯网


42m品论天涯网

甚至,有人仅用一天时间,就打造出了战斗模拟器游戏原型,编码速度极快。42m品论天涯网

值得一提的是,GrokCode是所有编码模型中,成本最低的那个。42m品论天涯网

输入价格:0.20美元/百万token;输出价格:1.5美元/百万token;缓存输入:0.02美元/百万token。42m品论天涯网


42m品论天涯网

目前,GrokCode已在Cursor、Windsurf等各大编码平台上线,限时免费使用7天。42m品论天涯网

Grok编程冲进前五,狂飚速42m品论天涯网

xAI从零打造的GrokCodeFast1,专门面向更轻盈、更敏捷的编程场景,主打一个“快速响应”。42m品论天涯网

就看它直出代码的速度,就知道有多快了。42m品论天涯网

而且,网友实测GrokCode要比GPT-5速度快五倍。42m品论天涯网


42m品论天涯网

能做到如此神速,一定离不开GrokCode背后技术架构的创新。42m品论天涯网

为此,他们设计了一款全新的模型架构,在训练阶段,精心构建了一个高度聚焦于编程领域的语料库。42m品论天涯网

在后训练阶段,他们还筛选了高质量的数据集,涵盖真实世界中的PullRequest和实际编码任务。42m品论天涯网

最关键的是,xAI在推理、训练流程中做了一系列创新,直接拉满运行速度,让体验原地起飞。42m品论天涯网

你可能连CoT的第一段文字都还没读完,GrokCode已经在后台狂调数十个工具了。42m品论天涯网


42m品论天涯网

此外,xAI还针对提示词做了缓存优化,在协作编程时,缓存命中率稳定超过90%。42m品论天涯网

在软件工程的基准测试中,GrokCode一举拿下了70.8%的高分。42m品论天涯网

在ToyBench上,GrokCode位居第五,仅次于GPT-5、ClaudeOpus4、Gemini2.5Pro和DeepSeekReasoner。42m品论天涯网


42m品论天涯网

与此同时,在打造GrokCode的过程中,xAI还通过真实用户的评价不断优化模型,让其更贴合日常开发场景。42m品论天涯网

全能程序员,改bug直出网页42m品论天涯网

GrokCodeFast1具备出色的全栈开发能力,尤其擅长TypeScript、Python、Java、Rust、C++和Go。42m品论天涯网

无论是从零构建项目、深入回答代码库问题,还是精确修复复杂bug,都可轻松应对,而且只需最少的监督。42m品论天涯网

有开发者用GrokCode开发了一款网页应用,它能快速生成设计草图。42m品论天涯网

测试中,性能从最佳时的60-80tps,提升到了220-250tps。42m品论天涯网


42m品论天涯网

网友认为,GrokCode的一次性输出的代码量最丰富,在如下星舰模拟演示中,效果着实令人惊艳。42m品论天涯网


42m品论天涯网

GrokCodeFast1在遵循指令方面,表现非常出色。42m品论天涯网

ShubhamSaboo认为它的性能可以媲美ClaudeSonnet4和GPT-5,但价格几乎低10倍。42m品论天涯网


42m品论天涯网

更震撼的是,有人直接给出一句话,就用GrokCode和Cursor中cursorrules,瞬间搞定了整个后端。42m品论天涯网

有人使用GrokCode修复失败的单元测试,它可以自动生成修复方案并给出可运行的patch。42m品论天涯网

华人团队占多半,清北校友在列42m品论天涯网

或许你还不知道,在xAI打造GrokCode模型的员工,这次还有一个特殊福利——42m品论天涯网

去SpaceX星舰基地,去看现场发射。42m品论天涯网


42m品论天涯网

xAI华人研究员骆梁宸,晒出了自己在星舰基地的大片。42m品论天涯网


42m品论天涯网

话又说回来,这次GrokCode能够顺利诞生,是xAI全团队的努力数月的结晶。42m品论天涯网

另一位研究员MohitReddy透露,几个月前,这个项目还仅有两人,如今已经发展成为人才济济的小团队。42m品论天涯网


42m品论天涯网

他特别点出了一些重点参与GrokCode的研究人员,其中华人学者占了半壁江山。42m品论天涯网


42m品论天涯网

LiangchenLuo(骆梁宸)42m品论天涯网


42m品论天涯网

骆梁宸在xAI公司从事机器思维与学习算法的研发工作。主导创建了GrokCode项目并从0搭建其完整体系,同时作为核心研发人员,参与了Grok3Think、Grok4两大系统的开发建设。42m品论天涯网

他本科就读于北京大学地球与空间科学学院。42m品论天涯网

ZihangDai(戴子航)42m品论天涯网


42m品论天涯网

前Google大脑研究员,毕业于清华和CMU。此前,他还在百度美国分公司和蒙特利尔大学的MILA进行过研究实习。42m品论天涯网

ZiniuHu42m品论天涯网


42m品论天涯网

ZiniuHu目前在xAI专注于强化大语言模型,包括GrokCodeFast1、Grok3-mini推理API、Grok3及Grok2等研究。42m品论天涯网

他本科毕业于北大计算机系,在UCLA获得了计算机科学博士学位,并在加州理工学院CMS实验室完成博士后研究。42m品论天涯网

YongchaoZhou42m品论天涯网


42m品论天涯网

YongchaoZhou就职于xAI,在多伦多大学分别获得了机器学习学士学位和计算机博士学位。42m品论天涯网

JiayiPan(潘家怡)42m品论天涯网


42m品论天涯网

潘家怡从伯克利人工智能研究中心的博士研究中休假后,加入了xAI,参与了Grok4研发。42m品论天涯网

EvanWang42m品论天涯网


42m品论天涯网

EvanWang在xAI任后训练团队技术研究员,曾获得了加州理工学院计算机科学学士学位,和马里兰大学学士学位。42m品论天涯网

HonghuaZhang(张宏华)42m品论天涯网


42m品论天涯网

张宏华在xAI参与模型后训练研究,本科毕业于UCLA,获得计算机科学与数学双学位。42m品论天涯网

同时,他亦获得了UCLA计算机科学系的博士学位。42m品论天涯网

EricJiang42m品论天涯网


42m品论天涯网

RuiHou42m品论天涯网


42m品论天涯网

RuiHou在xAI专注于推理与智能体方向研究,曾获得同济大学学士学位,密歇根大学硕士和博士学位。42m品论天涯网

可以看到,特别感谢11人中,9人都是华人学者,规模壮观。42m品论天涯网

提示工程指南42m品论天涯网

对于开发者来说,grok-code-fast-1是一款轻量级的智能体模型,为了帮助程序员高效地完成日常编码任务,xAI总结了一些提示词编写指南。42m品论天涯网

提供必要的上下文42m品论天涯网

大多数编程工具会自动获取上下文信息,但很多时候,我们需要主动选择自己希望用作上下文的具体代码会更高效。42m品论天涯网

因此,为让grok-code-fast-1聚焦目标任务,建议明确提供相关的文件路径、项目结构或依赖信息。42m品论天涯网

❌ 不推荐的无上下文提示词:42m品论天涯网

 =改进错误处理逻辑42m品论天涯网

✅ 推荐的带上下文提示词:42m品论天涯网

我的错误码都定义在@errors.ts文件中,你可以参考它,在我写SQL查询的@sql.ts文件中补充合适的错误处理和错误码吗?42m品论天涯网

明确你的目标和需求42m品论天涯网

清楚地说明你希望grok-code-fast-1实现什么目标、解决什么问题,越具体,效果越好。模糊不清的提示词,往往会导致结果不理想。42m品论天涯网

❌ 模糊提示词例子:42m品论天涯网

创建一个食物追踪器42m品论天涯网

✅ 详细提示词例子:42m品论天涯网

创建一个食物追踪器,能显示每天的卡路里摄入量,按不同营养成分分类;我输入食物后,需要能看到总览视图,也能分析摄入趋势。42m品论天涯网

持续优化你的提示词42m品论天涯网

grok-code-fast-1对速度比主流模型快4倍,成本只有1/10,这意味着你可以以前所未有的速度测试各种复杂想法。42m品论天涯网

即便你的第一次输出不够理想,也可以尝试加入更多上下文,或者根据失败的结果做微调。42m品论天涯网

✅ 优化后提示词例子:42m品论天涯网

上一版没考虑IO密集型进程会阻塞主线程,我们应该用线程循环方式跑它,而不是简单用async库版本。42m品论天涯网

总体而言,grok-code-fast-1用于智能体式任务,也就是模型需要结合上下文、调用工具、完成多步操作的场景。42m品论天涯网

而Grok4更适合用来解决一次性问答或复杂的概念解析。42m品论天涯网

Grok4发布会上,马斯克预告未来三个月的路线图,如今终于赶在8月底前兑现了第一个。42m品论天涯网

接下来,就坐等9月多模态智能体、10月视频生成模型的上线了。42m品论天涯网


42m品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]