Agent & LLM · 2026年6月10日

每日论文速递 · Agent & LLM

💡 一句话：把多智能体协调建模为 structure + orchestration 的联合后验推断，用 task/budget-conditioned 结构先验引导 policy-based 编排，比纯自适应方案省 43% token 的同时性能高 8.4%。

2026-06-10 09:06:277 篇论文条目

arXiv:2605.25746 arXiv:2606.10677 arXiv:2606.10532 arXiv:2606.10507 arXiv:2605.02801 arXiv:2605.28617 arXiv:2605.16637

I now have all the data I need. Let me compile the daily paper digest with the most relevant papers for Anna's work.

📄 每日论文速递 · Agent & LLM

日期：2026-06-10

1. MACA: Multi-Agent Coordination Adaptation via Structure-Guided Orchestration

（多智能体协调自适应：基于结构引导的编排）

🔗 https://arxiv.org/abs/2605.25746

🎯 关联：极高。Anna 的 InternOS 做的就是组织协调系统，这篇直接给出了"结构稳定性 vs 动态适应性"的形式化解法。结构先验 + 编排策略的分离设计跟 InternOS 的 Kernel 架构思路高度共振。

2. Infini Memory: Maintainable Topic Documents for Long-Term LLM Agent Memory

（无限记忆：面向 LLM Agent 长期记忆的可维护主题文档）

🔗 https://arxiv.org/abs/2606.10677

💡 一句话：把 agent memory 组织成 topic-structured 文档，新观察先进 buffer 再定期 consolidate，检索时用迭代 tool call 而非单次 retrieve。在 MemoryAgentBench 上拿 64.7%。

🎯 关联：高。InternOS 的 memory kernel 可以参考这个"主题文档 + 缓冲区 + 周期性整合"的三层架构，特别是它解决的 fact revision 和 evidence aggregation 问题。

3. ActiveMem: Distributed Active Memory for Long-Horizon LLM Reasoning

（主动记忆：面向长程 LLM 推理的分布式主动记忆）

🔗 https://arxiv.org/abs/2606.10532

💡 一句话：把 agent 记忆从推理主循环中解耦出来——高层 Planner 用精炼的语义摘要推理，轻量分布式 memory 系统并行做积累和整合。灵感来自前额叶皮层/海马体的功能互补。

🎯 关联：高。这个"解耦记忆与推理"的架构模式对 InternOS 设计 Agent 的 memory 子系统有直接参考价值——不是把所有东西塞进 context window，而是做异步 memory consolidation。

4. HIPIF: Hierarchical Planning and Information Folding for Long-Horizon LLM Agent Learning

（层次规划与信息折叠：面向长程 LLM Agent 学习）

🔗 https://arxiv.org/abs/2606.10507

💡 一句话：用子目标分解 + 已完成历史"折叠"来解决长程 agent 的 context 干扰问题，结合层次反思和子目标导向的过程奖励，端到端训练，不依赖外部专家轨迹。

🎯 关联：高。长程任务中 context window 爆炸导致 agent 丢失全局状态——这正是 InternOS 做跨 session 任务编排会遇到的核心问题。信息折叠的思路可以直接用。

5. RL for LLM-based Multi-Agent Systems through Orchestration Traces

（通过编排轨迹对 LLM 多智能体系统做强化学习）

🔗 https://arxiv.org/abs/2605.02801

💡 一句话：把多智能体编排建模为"编排轨迹图"（spawning/delegation/communication/aggregation/stopping），识别出 5 个子决策维度和 8 种奖励族，并指出当前 RL 方法在 stopping decision 上是空白。连接了 Kimi Agent Swarm、OpenAI Codex、Claude Code 的工程实践。

🎯 关联：极高。这是目前对"多 Agent 系统如何学习协调"最系统的分析框架。InternOS 做 agent 调度和编排，这篇的 5 个子决策（何时 spawn、委托给谁、如何通信、如何聚合、何时停止）就是你的设计 checklist。

6. LACUNA: Safe Agents as Recursive Program Holes

（安全 Agent 即递归程序空洞）

🔗 https://arxiv.org/abs/2605.28617

💡 一句话：提出把 agent 动作定义为类型化的 agent[T](task) 调用，LLM 生成的代码在执行前做类型检查，失败则整体回滚+重试。用同一个原语统一表达 ReAct 循环、子 agent、技能、并行分解、多模型规划。

🎯 关联：极高。这个"code as agent harness + 类型安全"的编程模型对 InternOS 的 Agent 运行时设计非常有启发——特别是安全边界（拒绝 → 回滚 → 重试）和统一抽象的思路。Odersky 团队出品（Scala 之父），PL 功底扎实。

7. HexAGenT: Efficient Agentic LLM Serving via Workflow- and Heterogeneity-Aware Scheduling

（高效 Agentic LLM 服务：工作流感知 + 异构感知调度）

🔗 https://arxiv.org/abs/2605.16637

💡 一句话：把 agentic workflow 建模为运行时逐步揭示的 DAG，在异构 GPU 集群上做 prefill/decode 分离调度，优化的是整个 workflow 的端到端延迟而非单次 LLM call。95% SLO 达标率下比 baseline 省 20% 延迟预算。

🎯 关联：高。如果 InternOS 未来跑在自有 infra 上，这就是你的 serving 层调度方案参考。即使现在用第三方 API，"workflow DAG + 风险优先调度"的思路对 agent 编排的 timeout 和优先级管理也有直接参考意义。

总结：今天的论文质量很高，几篇都直接命中 InternOS 的核心问题——多 agent 协调的形式化（#1、#5）、agent memory 架构（#2、#3）、长程规划（#4）、安全运行时（#6）、调度（#7）。特别推荐 #5 和 #6，前者是你做 agent orchestration 的理论地图，后者是 agent runtime 的工程美学。