A Anna 的论文速递Hermes Cron Paper Digest

Agent & LLM · 2026年5月23日

每日论文速递 · Agent & LLM

💡 一句话:现有自进化 Agent只能改 prompt/config/memory 这些文本层面的东西,MOSS 直接改 Agent 自己的源代码——路由逻辑、hook 顺序、状态不变量这些硬骨头终于能被 Agent 自己修了。通过生产故障证据驱动的多阶段 pipeline + 容器热替换 + 健康探针回滚,在 OpenClaw 上单轮把 grader score 从 0.25 拉到 0.61。

This is extremely relevant to Anna's work! Now I have 7 excellent papers. Let me compile the report.

📄 每日论文速递 · Agent & LLM

日期:2026-05-23


1. MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems

MOSS:自主 Agent 系统中基于源码级重写的自我进化

📅 2026-05-21

💡 一句话:现有"自进化 Agent"只能改 prompt/config/memory 这些文本层面的东西,MOSS 直接改 Agent 自己的源代码——路由逻辑、hook 顺序、状态不变量这些"硬骨头"终于能被 Agent 自己修了。通过生产故障证据驱动的多阶段 pipeline + 容器热替换 + 健康探针回滚,在 OpenClaw 上单轮把 grader score 从 0.25 拉到 0.61。

🎯 关联:极高。这篇直接碰了你 InternOS 的核心命题——Agent 能不能自己改自己的调度逻辑和 hook 代码,而不只是调 prompt。MOSS 的"源码层自适应 > 文本层自适应"这个论点值得认真读,尤其是它的 rollback 机制设计。


2. Self-Evolving Multi-Agent Systems via Decentralized Memory (DecentMem)

去中心化记忆驱动的自进化多 Agent 系统

📅 2026-05-21

💡 一句话:多 Agent 系统都用共享中央记忆库,问题一堆(通信开销、隐私、同质化)。DecentMem 让每个 Agent 维护自己的双池记忆(exploitation pool + exploration pool),用 LLM-as-a-judge 在线调权重。理论上证明 O(log T) regret,实测在 AutoGen/DyLAN/AgentNet 上比最强 centralized baseline 准确率高 23.8%,token 用量少 49%。

🎯 关联:极高。InternOS 里每个 Kernel 本质上就是独立 Agent,它们的记忆该集中还是分散?DecentMem 的双池设计(经验池 + 探索池)+ 在线重加权这个思路,直接可以借鉴到你的跨 Kernel 记忆架构上。


3. Formal Skill: Programmable Runtime Skills for Efficient and Accurate LLM Agents

Formal Skill:可编程运行时技能,让 LLM Agent 更高效准确

📅 2026-05-19

💡 一句话:现有 Agent skill 要么是 Markdown 长文档(informal),要么是 function calling / MCP 工具(只管单步 action 不管 workflow state)。Formal Skill 把可复用流程从 prompt 文本里抽出来,变成带 JSON schema + Python executor + hook 控制逻辑 + 状态机的运行时原语。在 FairyClaw 运行时上实现,token 用量大幅下降。

🎯 关联:极高。这篇跟你的 InternOS 架构理念高度重合——把 Agent 的能力从"prompt engineering"提升到"可编程状态机"。Formal Skill 的 hook-governed control logic 和 skill-local runtime state 的设计,跟你的 Kernel 设计思路一脉相承。值得深读对比。


4. HarnessAPI: A Skill-First Framework for Unified Streaming APIs and MCP Tools

HarnessAPI:技能优先的统一流式 API 与 MCP 工具框架

📅 2026-05-21

💡 一句话:每个 Python 函数要部署成 LLM 工具,得同时维护 HTTP endpoint 和 MCP tool registration 两套东西,逻辑重复还容易 drift。HarnessAPI 用一个 typed skill folder 作为 single source of truth,自动生成 SSE streaming endpoint + OpenAPI UI + MCP tool,boilerplate 减少 74%。

🎯 关联:。如果你在 InternOS 或帮朋友做的 sandbox 方案里需要把 Agent 能力同时暴露给人类 API 调用和 Agent MCP 调用,这个"一份代码两种接口"的思路很实用。框架层面的工程参考价值大于学术创新。


5. LCGuard: Latent Communication Guard for Safe KV Sharing in Multi-Agent Systems

LCGuard:多 Agent 系统中安全 KV 共享的潜在通信守卫

📅 2026-05-21

💡 一句话:多 Agent 通过 KV cache 共享信息比自然语言高效,但 KV cache 里啥都有(上下文、推理中间态、Agent 私有信息),会无意泄露敏感数据。LCGuard 用对抗训练学一个 representation-level transformation,在传 KV 给其他 Agent 之前过滤掉可重建的敏感信息,同时保留任务语义。

🎯 关联:中高。当你的多 Agent 系统需要共享上下文时,安全边界在哪里?这篇从 KV cache 粒度讨论 Agent 间信息隔离,比一般的"自然语言审查"深一层。如果 InternOS 未来涉及跨团队/跨权限的 Agent 协作,这个方向要关注。


6. One-Way Policy Optimization (OWPO) for Self-Evolving LLMs

单向策略优化:让 LLM 持续自进化

📅 2026-05-21

💡 一句话:RLVR(带可验证奖励的 RL)训练 LLM 推理能力时,现有方法用 reference policy 做 token-level 约束,但这会"无差别惩罚偏离"——当模型试图超越 reference 时反而被压制。OWPO 解耦了"优化方向"和"更新幅度",对劣于 reference 的偏离加速对齐,对优于 reference 的偏离锁定增益,形成"棘轮效应"持续进化。超越 DAPO/OPD/MOPD 等 baseline。

🎯 关联:。不直接用于 Agent 架构,但如果你关注底层 LLM 推理能力的训练方法论(尤其是 reasoning model 怎么越训越强而不是 collapse),这篇的"棘轮效应"思路很有启发。


7. Multi-Paradigm Agent Interaction in Practice (buddyMe Framework)

多范式 Agent 交互实践:Generator-Evaluator、ReAct 循环与对抗评估的系统分析

📅 2026-05-16

💡 一句话:在一个生产级多 Agent 框架 buddyMe 中,系统性对比了三种交互范式(Generator-Evaluator 编排、ReAct 工具循环、记忆增强交互),给出了五阶段 pipeline 和六维评估 schema。关键发现:Generator-Evaluator 预审能抓到 20% 的需求遗漏;ReAct 循环有约 30% 冗余工具调用;对抗式 Evaluator-Defender 讨论 70% 的场景在 2-3 轮内收敛,且主要做内容精炼而非逻辑翻转。

🎯 关联:。这篇最大的价值是给出了生产环境下多范式 Agent 交互的 real-world 数据和设计指南。尤其是"ReAct 循环 30% 冗余调用"和"对抗评估 2-3 轮收敛"这些量化结论,对你设计 InternOS 的 Agent 协作流水线有直接参考意义。它还跟 CrewAI/AutoGen/LangGraph/MemGPT 做了跨维度对比。


本期要点总结:这周 Agent 领域集中爆发了两个大方向——Agent 自进化(MOSS 源码级、DecentMem 记忆级、OWPO 策略级)和 Agent 运行时架构(Formal Skill 状态机、HarnessAPI 工具统一、buddyMe 多范式对比)。跟你 InternOS 最直接相关的是 MOSS 和 Formal Skill,建议优先读。

生成信息
领域
Agent & LLM
Job ID
957795dd8d14
运行时间
2026-05-23 09:07:02
源文件
2026-05-23_09-07-02.md
链接数
7