人工智能

Claude 4破解困扰人类4年系统bug 30年码龄程序员200小时没搞定

字号+作者:量子位 来源:量子位 2025-05-28 14:14 评论(创建话题) 收藏成功收藏本文

30年码龄程序员4年都没搞定的bug,ClaudeOpus4只用几个小时轻松破解了。全程只需30个prompt+1次重启。而人类在过去4年花了至少200个小时,都没找到这个bug'...

30年码龄程序员4年都没搞定的bug,ClaudeOpus4只用几个小时轻松破解了。全程只需30个prompt+1次重启。而人类在过去4年花了至少200个小时,都没找到这个bug在哪。sUH品论天涯网

一位资深C++程序员的分享,最近火了。sUH品论天涯网


sUH品论天涯网

要知道,他曾在FAANG(指Meta、亚马逊、苹果、奈飞、Google硅谷五巨头)担任工程师,如今也是团队中“定海神针”一样的人物。sUH品论天涯网

这个bug不仅困扰他,包括GPT-4.1、Gemini-2.5以及Claude-3.7也找不到。sUH品论天涯网

有围观的程序员表示,这种剧情他也经历过!sUH品论天涯网

一个月没解决的bug,用o1-Pro十分钟就搞定了。sUH品论天涯网


sUH品论天涯网

Anthropic的开发者关系主管也留言表示,这样的故事可能会越来越常见。sUH品论天涯网


6万行代码重构后出现“白鲸bug”sUH品论天涯网

故事的主角名叫ShelZuuz。sUH品论天涯网

这位老哥自称有30年C++开发经验,在目前的团队里承担“技术支援”的角色,大家卡了一周的问题,他当场就能解决。sUH品论天涯网


sUH品论天涯网

从他在Reddit上的资料来看,这些介绍应该不是吹水,他7年来发布的帖子都是和hacker、硬件等相关。sUH品论天涯网


sUH品论天涯网

然鹅大佬也有解决不了的难题。sUH品论天涯网

4年前,因为一次设计6万行代码的大规模重构,系统里突然出现了一个bug:在一个特定shader(着色器)被特定使用方式下,出现了一个边界条件下的问题。sUH品论天涯网

大概就是在一种非常特殊的组合条件下才会触发渲染错误,平时难以察觉,但只要触发就会出错,属于典型的顽固型bugsUH品论天涯网

ShelZuuz老哥表示,这个bug业务优先级不那么高,但也很烦人。在系统没有重构前,这个bug并不存在。sUH品论天涯网

过去几年里,他一直在尝试解决这个问题,零零碎碎花了有200个小时时间,都没能定位和修复它。sUH品论天涯网

因此,他把这个bug称为“白鲸bug”sUH品论天涯网

这是参考了文学作品《白鲸》中,哈克船长执着半生都在追逐一头行动诡异的白鲸。sUH品论天涯网


sUH品论天涯网

这不,最近ClaudeOpus4发布了么,老哥就想着用它试试看。sUH品论天涯网

结果配合着ClaudeCode模式,只用几个小时,这个bug就被解决了。sUH品论天涯网

ClaudeOpus4不仅提供了系统重构前后的完整代码,并且明确说明了为什么在新架构下会出问题:sUH品论天涯网

  • 旧架构下只是“巧合”地支持了这种用法;sUH品论天涯网

  • 而新架构没有考虑到这种“非设计性行为”,所以失效;sUH品论天涯网

  • 这并不是常规意义上的逻辑Bug,而是架构层面的兼容性丢失,一种很难发现的问题。sUH品论天涯网

  • 定位bug全程只用了33个提示词(大概几个小时)、外加一次重启。sUH品论天涯网

    老哥表示,他之前尝试过GPT-4.1、Gemini2.5、Claude3.7等高级AI模型,但这些模型都没能找到头绪,Opus4是第一个成功定位问题的。sUH品论天涯网


    sUH品论天涯网

    有人就简单算了笔账:这样级别的工程师,200小时工时费2.5万美元起步,而Claude订阅费只要200美元(doge)。sUH品论天涯网


    sUH品论天涯网

    也有人补充说,这个结果一定程度上也取决于提示词的质量,但不得不承认Claude在编程方面真的很强。sUH品论天涯网


    ClaudeOpus4重新定义编码模型上限sUH品论天涯网

    就在上周,Claude4系列上新,其中ClaudeOpus4是旗舰款。sUH品论天涯网


    sUH品论天涯网

    从官方发布中可以明显感知到,Claude系列正在猛猛提升自己的编程和推理能力。sUH品论天涯网

    展示能力的方式都变成了连续24小时畅玩宝可梦、独立运行并持续编码7小时……sUH品论天涯网


    sUH品论天涯网

    同时还发布了ClaudeCode,也就是前面ShelZuuz用到的能力。sUH品论天涯网

    这个智能代码助手可以帮助开发者通过自然语言命令理解、浏览和修改整个代码库,让你能够将修复bug、实现新功能、代码重构、编写测试、跨文件修改等大量工程任务交给AI完成。sUH品论天涯网

    发布几天时间里,全球的开发者们都在尝试用Claude4解决各种编程代码问题。sUH品论天涯网

    当然也衍生了一些有趣的玩法,比如让它用ASCII来张自画像。sUH品论天涯网

    嗯……怎么有点ET的感觉?sUH品论天涯网


    sUH品论天涯网

    参考链接:sUH品论天涯网

    [1]https://www.reddit.com/r/ClaudeAI/comments/1kvgg7s/claude_opus_solved_my_white_whale_bug_today_that/?share_id=-Y9J9Hna8rIemyMsG8Jp9&utm_content=1&utm_medium=ios_app&utm_name=ioscss&utm_source=share&utm_term=1sUH品论天涯网

    [2]https://x.com/deedydas/status/1927188036560760844sUH品论天涯网

    本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]