紧迫发现:AI 的自进化,运转了。
这是 Anthropic 刚刚在长文博客中,发表的暴论。
咱们的里面数据骄气,Claude 正在加快 AI 发展,这可能是一条递归自我提高(RSI)的旅途。

并非「稠浊视听」,看了下著述,Anthropic 是果然实打实地用数据在言语——
截止本年 5 月,80% 以上的 Anthropic 代码,都是 Claude 写的。
而在 Claude Code 发布之前,这个数字还仅是个位数。
与此同期,Anthropic 工程师平均每季度委派的代码量,是 2021-2025 年的 8 倍。

更紧迫的是质料——
在最盛开、最暧昧、连谜底长什么样都不笃定的编程任务上,Claude 的告捷率当今是 76%,六个月前才 26%。
50 个百分点的跳升。半年。

Anthropic 里面也曾有不少工程师认为,Claude 写的代码质料和东说念主类打平了。
瞻望年内会荒芜。
Anthropic 还强调,若是这个趋势接续下去,AI 我方沟通和构建下一代 AI,是系数可能的。
这可能透彻改变社会,在医疗、科技、经济界限带来雄壮的自制。但也可能让对都问题重叠恶化,最终导致失控。
因此,Anthropic 带头敕令:
若是存在一个可考证的机制,能保证 AI 实验室照实都没悄悄卷,咱们自在降速、以致暂停。
除此以外,Anthropic 的这篇博客里,还放出了蛮多有趣味的不雅点和事实。
以下是经过整理,更浅陋全球阅读的版块。
Enjoy。
Anthropic 长文定调 AI 圈的摩尔定律来了
Anthropic 创建了个全新的推测维度,叫「AI 能零丁完成的任务时长」。
2024 年 3 月,Claude Opus 3 能贬责东说念主类约略需要 4 分钟的软件任务。
一年后,Claude Sonnet 3.7,1.5 小时。
又一年,Claude Opus 4.6,12 小时。
而最新的 Mythos,在内测中的进展是:
能纠合使命「至少」16 小时,也曾到了 METR 测试框架能推测的上限了。
这个翻倍速率,从本来的每 7 个月翻一倍,加快到了每 4 个月翻一倍。
若是趋势不变,2027 年,可能是好几周。

Claude 编写了大部分 Anthropic 代码
驱逐 2026 年 5 月,我 Anthropic 代码库的代码,荒芜 80% 由 Claude 编写。
在 Claude Code 发布前,这个数字一直唯一个位数。
这种变化,也体当今工程师的使命形式上。
在 Anthropic 的当先四年,工程师每天 Merge 的代码行数基本保持不变。
2025 年, Claude 运转我方写代码,merge 数一刹运转飙升。
如今,2026 年第二季度,工程师每天 merge 的代码量是 2024 年的 8 倍。

不外,代码量上去了,代码质料是不是注水了?
Anthropic 说,这一年来,工程师改良 Claude 的次数,越来越少了。
这少量,在 benchmark 中可见一斑,如下图所示。
通盘难度类型的任务中,Claude 的告捷率,无一例外的一都暴增。

是以,Anthropic 当今干脆用 Claude 来 review 代码。
是的,通盘提交到代码库的蜕变,都会先过一遍 Claude 自动审查,查验 bug、安全纰谬和其他颓势。
他们回溯分析发现,百家乐正规平台2026最新版下载若是之前每次蜕变都有这说念自动审查,约莫三分之一导致 claude.ai 线上事故的 bug,上线之前就会被拦下来。
要知说念,写那些代码的工程师,也曾是全宇宙造 AI 系统最顶尖的一批东说念主了。
Claude 在捏他们的造作。
创造力的放大镜
接下来是 Claude 在询查层面的参与进度。
Anthropic 有个旧例,每次发新模子,都会给 Claude 一段磨真金不怕火微型 AI 模子的代码,让它在保证正确性的前提下,把运行速率优化到最快。
2025 年 5 月,Claude Opus 4 交出的谜底是:加快 3 倍。
2026 年 4 月,Claude Mythos Preview 作念到了 52 倍。
算作参考,一个老练的东说念主类询查员,需要 4 到 8 个小时能力拼集达到 4 倍。
不到一年的时分,Claude 荒芜了东说念主类。
2026 年 4 月,Anthropic 丢给 Claude 一个 AI 安全询查,轻率是「一个弱模子能不成可靠地监督一个强模子」,然后让 Claude 我方提假定、跑实验……
此次先说东说念主类的进展吧,两个东说念主类询查员花了约莫一周时分,把 gap 减弱了 23%。
而 Claude,在约莫 800 小时、花了约莫 18000 好意思元的算力之后——
减弱了 97%。

咱们何去何从?
到这里为止,论断也曾很明晰了。
东说念主类在 AI 确立经过里的脚色,每一个要领都在收窄。
代码,Claude 写了。代码 review,Claude 作念了。实验现实,Claude 快了东说念主类一个数目级。实验沟通,Claude 运转我方来了……
东说念主类当今临了的相比上风,是询查试吃和判断力。
但这个上风能守多久?
Anthropic 在博客里说,他们也不笃定。
一种可能是,「询查试吃」就像之前 AI 不会的其他东西一样,先是作念不到,然后一刹就作念到了。
就像 AI 交融幽默、展示心智表面、解语言谜题,都履历了相同的弧线。
另一种可能是,即便 Claude 长期学不会着实的询查试吃,仅靠当今的加快趋势,每个东说念主类询查员能同期指示的使命量也曾大了好几倍。
你不需要 AI 系数替代你想考,它只消把通盘「现实」的活全干了,你就只需要作念那 5% 的地方领受。

RSI 的三种将来
开运体育中国官网入口博客扫尾,Anthropic 形容了对于此次「自进化」趋势三个可能演化地方。
1、停滞。
那些指数弧线其实是 S 弧线。
也许询查判断力这个东西即是没法靠 scale 解决,需要一种全新的架构落魄。
或者,瓶颈在动力、在芯片、在算力的物理供应链上。
不外,即便 AI 的才略就停滞在今天的水平,也会发生对宇宙带来首要变化。
前段时分的 Project Glasswing,Mythos Preview 在上线头几周就发现了荒芜一万个高危和严重级别的软件纰谬,遍布全球最要害的系统。
2、AI 接续加快,但东说念主类仍然把着地方盘。
组织恶果会指数级提高,100 东说念主的公司作念 1 万以致 10 万东说念主的活。知
Anthropic 认为咱们约略率正在走进这个场景。
但他们也发现了一个有趣味的风光,即是阿姆达尔定律在组织里的体现 _
Claude 把代码写得赶紧了,结果代码 review 造成了新瓶颈。多样新见地、新器用、新实验爆炸式知道,远超组织的消化才略。
瓶颈不会消除,仅仅革新到下一个要领。
3、AI 杀青系数的递归自我提高,运转我方造下一代我方。
这个场景下,AI 的发展速率系数取决于算力了。东说念主类退到监督、考证、审核的位置。
若是果然发生,这种才略约略率会迁徙到其他科学界限,医学、材料、动力,全线升空。
固然,另一种将来,是对都失败。
这种情况下百家乐正规平台2026最新版下载,偏差会在 AI 自我迭代的过程中慢慢蕴蓄,最终—
