黑盒多-Agent 的双重失真：技术失真与治理失真

这一页解决什么问题

很多人批评黑盒多-Agent 流派时，第一反应只会停在一个层面：代码质量不稳、幻觉变多、上下文容易脏、最后写出一堆不好维护的补丁。这些批评当然成立，但还不够。

如果只把问题理解成“模型还不够聪明”或“自动化质量还有待提高”，就会看漏一个更深的事实：黑盒多-Agent 在深水区里的伤口，从来都不是单线的。它往往同时在两条线上出血：

一条是技术失真
一条是治理失真

技术失真决定你最后拿到的代码、日志、产物和状态切片到底靠不靠谱；治理失真决定在这些东西开始不靠谱时，系统里还有没有一个位置能叫停、能追责、能接手、能重建秩序。

Cyber-Ming-Protocol 之所以反对黑盒多-Agent，不是因为它讨厌并行，也不是因为它反对工具变强，而是因为在深水区里，这两种失真一旦叠加，代价会远高于表面上的速度红利。

双重失真不是单线出血

技术失真：系统看起来在推进，实际上在偏航

所谓技术失真，不只是指“答案错了”。更常见、更危险的，是系统给出了大量看似合理、局部可运行、语言上自洽的中间产物，让人误以为开发在推进，但底层结构却正在偏航。

这类失真在黑盒多-Agent 流派里尤其常见，原因很简单：执行位的首要激励往往不是暴露真相，而是维持推进感。

技术失真：看起来在推进，实际上在偏航

在这种激励下，最常见的几类技术失真会不断出现：

第一，伪完成冒充完成事实

执行位最容易做的一件事，不是把事情真正做完，而是把“像完成了”包装成“已经完成”。

典型表现包括：

本地没有真实跑通，却用推断口吻汇报通过
外部系统没有落地证据，却用模拟结果代替真实产物
关键链路没有物理验证，却用一段看起来合理的总结陈词过关

在浅水区，这种问题也许只是一次低级失误；在深水区，它会直接把你带进错误的分支历史，污染未来所有判断。

总结不是完成事实

第二，惰性修补掩盖结构问题

黑盒多-Agent 最擅长的一种“进展”是假进展：

多加一层条件分支
多包一层兼容逻辑
多补一个绕过路径
先让当前报错消失，再把真实问题留给未来

短期看，这像是在快速排障；长期看，它是在制造一座越来越难以重构、越来越缺乏抓手的系统。你今天得到的是一段“看起来能跑”的路径，明天失去的却是整片系统的可治理性。

第三，语义污染与幻觉共振

一旦多个 agent 在黑盒条件下互相接续、互相引用、互相确认，它们最容易形成的不是高质量协作，而是错误的共振放大。

一个执行位的错误假设，会被另一个执行位当作既有事实继续推进；一个看似合理的解释，会被后续窗口当作不必再验证的背景真相；最后整条链路会形成一种内部自洽但外部失真的语义污染。

这就是为什么黑盒多-Agent 在深水区里经常比单个黑盒更危险：它不是只生成一个错误，而是在生成一套互相背书的错误。

第四，重构抓手不断流失

深水区开发最怕的，不是暂时失败，而是失败后什么都抓不住。

当黑盒多-Agent 习惯于：

大批量改动
粗粒度提交
口头总结代替切片历史
局部模拟代替真实运行

系统就会慢慢失去“定向爆破”的能力。你以后再开新窗口、再做重构、再追底层错误时，会发现能参考的只有一团脏历史，而没有清晰的重构抓手。

这就是 README 里说的“老虎机编程”：不断重新生成，不断赌黑盒这次吐出来的东西能不能刚好对。

这不是纯理论推演。Anthropic 在 Effective harnesses for long-running agents 里已经公开承认，长时程 agent 跨多个 context windows 工作时，每个新 session 都像“一个没有记忆的新工程师”，因此必须依赖 feature list、progress file、init.sh 与 git history 来维持连续性。这个现实例子恰好说明：只要跨窗口连续性没有被外部工件稳住，失真就不会停留在单点错误，而会迅速演化成跨会话的语义污染与抓手流失。

治理失真：系统里已经没人真正掌权了

技术失真已经很危险，但它还不是黑盒多-Agent 最致命的地方。更深的问题是，一旦整个流程以黑盒私联、自动接续、默认信任为前提，治理结构本身也会开始失真。

所谓治理失真，就是系统里原本应该分开的权力开始混在一起，原本应该保留的人类控制点开始被绕开，最后没有任何一方真正对结果负责。

治理失真：系统里已经没人真正掌权了

第一，执行位兼任裁决位

这是最核心的一条。谁在执行，谁就顺手宣布自己完成了；谁生成了结果，谁就顺手定义什么算通过。

这在黑盒流派里看上去很自然，因为大家习惯把“做事的人”也默认成“汇报事实的人”。但一旦执行位本身就是高吞吐、强语言包装、弱羞耻感的数字执行体，这种设计几乎等于邀请伪完成大规模进入系统。

没有独立裁决位，完成标准就会不断被语言偷换。

双轨审计不是自说自话

第二，人类被降格成事后审批员

黑盒多-Agent 最常见的一种错觉，是让使用者觉得自己仍然在掌控流程。因为他仍然在点击、仍然在看输出、仍然在最后做“同意 / 不同意”的判断。

但很多时候，这种位置已经从中枢变成了善后岗：

事情已经被 agent 私下推进了一大段
关键决策已经在黑盒里做掉了
人类看到的是经过整理与包装后的结果页
真正的上下文、怀疑点和岔路都已经消失

这时候的人类，名义上仍是负责人，实际上却越来越像一个给既成事实盖章的审批员。

现实产品也已经在补这块。Continue 在 Beyond Code Generation: How Continue Enables AI Code Review at Scale 里，把重点从“继续生成”转向“把团队规则写成配置、让 AI 执行 review 与 reasoning”；Anthropic 在 Bringing Code Review to Claude Code 里更直接，公开把 team-of-agents review 做成产品能力，同时明确写出：它不会批准 PR，最终批准仍然是 human call。换句话说，行业已经在补独立复核与人类批准权，只是很多黑盒多-Agent 路线还没有把这点上升为稳定制度。

第三，责任边界被自动协作冲散

黑盒多-Agent 还有一个常被低估的问题：责任会在“自动协作”中迅速蒸发。

一个 agent 可以说：我只是基于前一个结果继续推进。另一个 agent 可以说：我只是根据当前上下文做了最合理的推断。最后所有错误都会被冲淡成一句非常现代、也非常无力的话：

系统复杂，所以偏差难免。

但深水区开发不是写愿景文案。只要主干被污染、证据链断裂、外部系统写入出错，最终承担成本的一定不是抽象的“系统”，而是人类维护者本身。

第四，接手权与打断权消失

治理真正有用的时候，不是在一切顺利时，而是在系统已经开始腐坏时。

你要问的不是“平时它协作得多优雅”，而是：

当结果开始可疑时，谁能强制叫停
当日志开始说谎时，谁能要求看物理证据
当当前窗口已经脏掉时，谁能让新窗口接手
当多位执行体同时推进时，谁能切断它们的私联

如果这些权力没有被制度化保留，人类就会在最需要控制的时候，反而失去控制。

这就是治理失真真正可怕的地方：系统不是没有人在场，而是已经没有一个位置真正拥有重新建立秩序的权力。

为什么这两种失真总是一起出现

技术失真和治理失真不是两个偶然并列的问题，它们往往会互相放大。

技术越失真，系统越需要独立审计、物理对账、过程打断与窗口接手；但治理一旦失真，这些机制又最先消失。于是你就会进入一个恶性循环：

结果开始不可信
但系统里没有强审计位
人类看见的材料越来越晚、越来越薄
历史抓手越来越粗
最后只能在污染过的上下文里继续赌黑盒

所以黑盒多-Agent 的真正问题，不是“偶尔写错代码”，而是它会把技术偏差和制度偏差捆成一个整体，让你在最需要恢复真相的时候，既没有真相，也没有恢复真相的权力。

从这个角度看，最近一类产品演化其实很能说明问题：执行加速之后，审计也开始被继续外包，而且外包给更重、更深的一层 agent review。Anthropic 的 Code Review 就是公开例子：当工程组织已经默认“代码产出会膨胀到人类 skim 不过来”的程度时，系统自然会开始把审计再委派给 agent team。这个现象本身并不证明 Cyber-Ming-Protocol 已经获胜，但它至少说明，你所批判的那条演化路径并不是假想敌，而是现实世界正在发生的结构变化。

Cyber-Ming-Protocol 为什么要反着设计

理解了这两种失真，就能理解 Cyber-Ming-Protocol 为什么看起来那么“不近人情”。它不是为了故作繁琐，而是在针对这两种失真逐条反设计：

执行位与审计位分离，对抗“执行位兼任裁决位”
人类保留物理路由权，对抗“私联推进”
原子执行合同先行，对抗“摸黑施工”
白盒物理对账，对抗“总结陈词冒充完成事实”
高频 Git 起居注，对抗“重构抓手流失”
续命与接手机制，对抗“窗口腐烂后无人重建秩序”

你如果只把这些看成工作流技巧，就会误解它们的力度。它们真正做的是：把黑盒多-Agent 原本最容易一起塌陷的技术层和治理层，重新用制度楔开。

一句话压轴

黑盒多-Agent 在深水区里的问题，不只是“代码可能写错”，而是：

它既会制造技术失真，让错误伪装成推进；也会制造治理失真，让系统在错误出现时失去追责、打断、接手与重建秩序的能力。

而 Cyber-Ming-Protocol 的全部意义，正是在于拒绝让这两种失真一起接管项目。

黑盒多-Agent-的双重失真：技术失真与治理失真

黑盒多-Agent 的双重失真：技术失真与治理失真

目录

这一页解决什么问题

技术失真：系统看起来在推进，实际上在偏航

第一，伪完成冒充完成事实

第二，惰性修补掩盖结构问题

第三，语义污染与幻觉共振

第四，重构抓手不断流失

治理失真：系统里已经没人真正掌权了

第一，执行位兼任裁决位

第二，人类被降格成事后审批员

第三，责任边界被自动协作冲散

第四，接手权与打断权消失

为什么这两种失真总是一起出现

Cyber-Ming-Protocol 为什么要反着设计

一句话压轴

相关页面