Agent & LLM · 2026年5月23日

每日论文速递 · Agent & LLM

💡 一句话：现有自进化 Agent只能改 prompt/config/memory 这些文本层面的东西，MOSS 直接改 Agent 自己的源代码——路由逻辑、hook 顺序、状态不变量这些硬骨头终于能被 Agent 自己修了。通过生产故障证据驱动的多阶段 pipeline + 容器热替换 + 健康探针回滚，在 OpenClaw 上单轮把 grader score 从 0.25 拉到 0.61。

2026-05-23 09:07:027 篇论文条目

arXiv:2605.22794 arXiv:2605.22721 arXiv:2605.19604 arXiv:2605.22733 arXiv:2605.22786 arXiv:2605.22156 arXiv:2605.16821

This is extremely relevant to Anna's work! Now I have 7 excellent papers. Let me compile the report.

📄 每日论文速递 · Agent & LLM

日期：2026-05-23

1. MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems

MOSS：自主 Agent 系统中基于源码级重写的自我进化

🔗 https://arxiv.org/abs/2605.22794

📅 2026-05-21

💡 一句话：现有"自进化 Agent"只能改 prompt/config/memory 这些文本层面的东西，MOSS 直接改 Agent 自己的源代码——路由逻辑、hook 顺序、状态不变量这些"硬骨头"终于能被 Agent 自己修了。通过生产故障证据驱动的多阶段 pipeline + 容器热替换 + 健康探针回滚，在 OpenClaw 上单轮把 grader score 从 0.25 拉到 0.61。

🎯 关联：极高。这篇直接碰了你 InternOS 的核心命题——Agent 能不能自己改自己的调度逻辑和 hook 代码，而不只是调 prompt。MOSS 的"源码层自适应 > 文本层自适应"这个论点值得认真读，尤其是它的 rollback 机制设计。

2. Self-Evolving Multi-Agent Systems via Decentralized Memory (DecentMem)

去中心化记忆驱动的自进化多 Agent 系统

🔗 https://arxiv.org/abs/2605.22721

📅 2026-05-21

💡 一句话：多 Agent 系统都用共享中央记忆库，问题一堆（通信开销、隐私、同质化）。DecentMem 让每个 Agent 维护自己的双池记忆（exploitation pool + exploration pool），用 LLM-as-a-judge 在线调权重。理论上证明 O(log T) regret，实测在 AutoGen/DyLAN/AgentNet 上比最强 centralized baseline 准确率高 23.8%，token 用量少 49%。

🎯 关联：极高。InternOS 里每个 Kernel 本质上就是独立 Agent，它们的记忆该集中还是分散？DecentMem 的双池设计（经验池 + 探索池）+ 在线重加权这个思路，直接可以借鉴到你的跨 Kernel 记忆架构上。

3. Formal Skill: Programmable Runtime Skills for Efficient and Accurate LLM Agents

Formal Skill：可编程运行时技能，让 LLM Agent 更高效准确

🔗 https://arxiv.org/abs/2605.19604

📅 2026-05-19

💡 一句话：现有 Agent skill 要么是 Markdown 长文档（informal），要么是 function calling / MCP 工具（只管单步 action 不管 workflow state）。Formal Skill 把可复用流程从 prompt 文本里抽出来，变成带 JSON schema + Python executor + hook 控制逻辑 + 状态机的运行时原语。在 FairyClaw 运行时上实现，token 用量大幅下降。

🎯 关联：极高。这篇跟你的 InternOS 架构理念高度重合——把 Agent 的能力从"prompt engineering"提升到"可编程状态机"。Formal Skill 的 hook-governed control logic 和 skill-local runtime state 的设计，跟你的 Kernel 设计思路一脉相承。值得深读对比。

4. HarnessAPI: A Skill-First Framework for Unified Streaming APIs and MCP Tools

HarnessAPI：技能优先的统一流式 API 与 MCP 工具框架

🔗 https://arxiv.org/abs/2605.22733

📅 2026-05-21

💡 一句话：每个 Python 函数要部署成 LLM 工具，得同时维护 HTTP endpoint 和 MCP tool registration 两套东西，逻辑重复还容易 drift。HarnessAPI 用一个 typed skill folder 作为 single source of truth，自动生成 SSE streaming endpoint + OpenAPI UI + MCP tool，boilerplate 减少 74%。

🎯 关联：高。如果你在 InternOS 或帮朋友做的 sandbox 方案里需要把 Agent 能力同时暴露给人类 API 调用和 Agent MCP 调用，这个"一份代码两种接口"的思路很实用。框架层面的工程参考价值大于学术创新。

5. LCGuard: Latent Communication Guard for Safe KV Sharing in Multi-Agent Systems

LCGuard：多 Agent 系统中安全 KV 共享的潜在通信守卫

🔗 https://arxiv.org/abs/2605.22786

📅 2026-05-21

💡 一句话：多 Agent 通过 KV cache 共享信息比自然语言高效，但 KV cache 里啥都有（上下文、推理中间态、Agent 私有信息），会无意泄露敏感数据。LCGuard 用对抗训练学一个 representation-level transformation，在传 KV 给其他 Agent 之前过滤掉可重建的敏感信息，同时保留任务语义。

🎯 关联：中高。当你的多 Agent 系统需要共享上下文时，安全边界在哪里？这篇从 KV cache 粒度讨论 Agent 间信息隔离，比一般的"自然语言审查"深一层。如果 InternOS 未来涉及跨团队/跨权限的 Agent 协作，这个方向要关注。

6. One-Way Policy Optimization (OWPO) for Self-Evolving LLMs

单向策略优化：让 LLM 持续自进化

🔗 https://arxiv.org/abs/2605.22156

📅 2026-05-21

💡 一句话：RLVR（带可验证奖励的 RL）训练 LLM 推理能力时，现有方法用 reference policy 做 token-level 约束，但这会"无差别惩罚偏离"——当模型试图超越 reference 时反而被压制。OWPO 解耦了"优化方向"和"更新幅度"，对劣于 reference 的偏离加速对齐，对优于 reference 的偏离锁定增益，形成"棘轮效应"持续进化。超越 DAPO/OPD/MOPD 等 baseline。

🎯 关联：中。不直接用于 Agent 架构，但如果你关注底层 LLM 推理能力的训练方法论（尤其是 reasoning model 怎么越训越强而不是 collapse），这篇的"棘轮效应"思路很有启发。

7. Multi-Paradigm Agent Interaction in Practice (buddyMe Framework)

多范式 Agent 交互实践：Generator-Evaluator、ReAct 循环与对抗评估的系统分析

🔗 https://arxiv.org/abs/2605.16821

📅 2026-05-16

💡 一句话：在一个生产级多 Agent 框架 buddyMe 中，系统性对比了三种交互范式（Generator-Evaluator 编排、ReAct 工具循环、记忆增强交互），给出了五阶段 pipeline 和六维评估 schema。关键发现：Generator-Evaluator 预审能抓到 20% 的需求遗漏；ReAct 循环有约 30% 冗余工具调用；对抗式 Evaluator-Defender 讨论 70% 的场景在 2-3 轮内收敛，且主要做内容精炼而非逻辑翻转。

🎯 关联：高。这篇最大的价值是给出了生产环境下多范式 Agent 交互的 real-world 数据和设计指南。尤其是"ReAct 循环 30% 冗余调用"和"对抗评估 2-3 轮收敛"这些量化结论，对你设计 InternOS 的 Agent 协作流水线有直接参考意义。它还跟 CrewAI/AutoGen/LangGraph/MemGPT 做了跨维度对比。

本期要点总结：这周 Agent 领域集中爆发了两个大方向——Agent 自进化（MOSS 源码级、DecentMem 记忆级、OWPO 策略级）和 Agent 运行时架构（Formal Skill 状态机、HarnessAPI 工具统一、buddyMe 多范式对比）。跟你 InternOS 最直接相关的是 MOSS 和 Formal Skill，建议优先读。