Agent & LLM · 2026年6月10日
每日论文速递 · Agent & LLM
💡 一句话:把多智能体协调建模为 structure + orchestration 的联合后验推断,用 task/budget-conditioned 结构先验引导 policy-based 编排,比纯自适应方案省 43% token 的同时性能高 8.4%。
I now have all the data I need. Let me compile the daily paper digest with the most relevant papers for Anna's work.
📄 每日论文速递 · Agent & LLM
日期:2026-06-10
1. MACA: Multi-Agent Coordination Adaptation via Structure-Guided Orchestration
(多智能体协调自适应:基于结构引导的编排)
🔗 https://arxiv.org/abs/2605.25746
💡 一句话:把多智能体协调建模为 structure + orchestration 的联合后验推断,用 task/budget-conditioned 结构先验引导 policy-based 编排,比纯自适应方案省 43% token 的同时性能高 8.4%。
🎯 关联:极高。Anna 的 InternOS 做的就是组织协调系统,这篇直接给出了"结构稳定性 vs 动态适应性"的形式化解法。结构先验 + 编排策略的分离设计跟 InternOS 的 Kernel 架构思路高度共振。
2. Infini Memory: Maintainable Topic Documents for Long-Term LLM Agent Memory
(无限记忆:面向 LLM Agent 长期记忆的可维护主题文档)
🔗 https://arxiv.org/abs/2606.10677
💡 一句话:把 agent memory 组织成 topic-structured 文档,新观察先进 buffer 再定期 consolidate,检索时用迭代 tool call 而非单次 retrieve。在 MemoryAgentBench 上拿 64.7%。
🎯 关联:高。InternOS 的 memory kernel 可以参考这个"主题文档 + 缓冲区 + 周期性整合"的三层架构,特别是它解决的 fact revision 和 evidence aggregation 问题。
3. ActiveMem: Distributed Active Memory for Long-Horizon LLM Reasoning
(主动记忆:面向长程 LLM 推理的分布式主动记忆)
🔗 https://arxiv.org/abs/2606.10532
💡 一句话:把 agent 记忆从推理主循环中解耦出来——高层 Planner 用精炼的语义摘要推理,轻量分布式 memory 系统并行做积累和整合。灵感来自前额叶皮层/海马体的功能互补。
🎯 关联:高。这个"解耦记忆与推理"的架构模式对 InternOS 设计 Agent 的 memory 子系统有直接参考价值——不是把所有东西塞进 context window,而是做异步 memory consolidation。
4. HIPIF: Hierarchical Planning and Information Folding for Long-Horizon LLM Agent Learning
(层次规划与信息折叠:面向长程 LLM Agent 学习)
🔗 https://arxiv.org/abs/2606.10507
💡 一句话:用子目标分解 + 已完成历史"折叠"来解决长程 agent 的 context 干扰问题,结合层次反思和子目标导向的过程奖励,端到端训练,不依赖外部专家轨迹。
🎯 关联:高。长程任务中 context window 爆炸导致 agent 丢失全局状态——这正是 InternOS 做跨 session 任务编排会遇到的核心问题。信息折叠的思路可以直接用。
5. RL for LLM-based Multi-Agent Systems through Orchestration Traces
(通过编排轨迹对 LLM 多智能体系统做强化学习)
🔗 https://arxiv.org/abs/2605.02801
💡 一句话:把多智能体编排建模为"编排轨迹图"(spawning/delegation/communication/aggregation/stopping),识别出 5 个子决策维度和 8 种奖励族,并指出当前 RL 方法在 stopping decision 上是空白。连接了 Kimi Agent Swarm、OpenAI Codex、Claude Code 的工程实践。
🎯 关联:极高。这是目前对"多 Agent 系统如何学习协调"最系统的分析框架。InternOS 做 agent 调度和编排,这篇的 5 个子决策(何时 spawn、委托给谁、如何通信、如何聚合、何时停止)就是你的设计 checklist。
6. LACUNA: Safe Agents as Recursive Program Holes
(安全 Agent 即递归程序空洞)
🔗 https://arxiv.org/abs/2605.28617
💡 一句话:提出把 agent 动作定义为类型化的 agent[T](task) 调用,LLM 生成的代码在执行前做类型检查,失败则整体回滚+重试。用同一个原语统一表达 ReAct 循环、子 agent、技能、并行分解、多模型规划。
🎯 关联:极高。这个"code as agent harness + 类型安全"的编程模型对 InternOS 的 Agent 运行时设计非常有启发——特别是安全边界(拒绝 → 回滚 → 重试)和统一抽象的思路。Odersky 团队出品(Scala 之父),PL 功底扎实。
7. HexAGenT: Efficient Agentic LLM Serving via Workflow- and Heterogeneity-Aware Scheduling
(高效 Agentic LLM 服务:工作流感知 + 异构感知调度)
🔗 https://arxiv.org/abs/2605.16637
💡 一句话:把 agentic workflow 建模为运行时逐步揭示的 DAG,在异构 GPU 集群上做 prefill/decode 分离调度,优化的是整个 workflow 的端到端延迟而非单次 LLM call。95% SLO 达标率下比 baseline 省 20% 延迟预算。
🎯 关联:高。如果 InternOS 未来跑在自有 infra 上,这就是你的 serving 层调度方案参考。即使现在用第三方 API,"workflow DAG + 风险优先调度"的思路对 agent 编排的 timeout 和优先级管理也有直接参考意义。
总结:今天的论文质量很高,几篇都直接命中 InternOS 的核心问题——多 agent 协调的形式化(#1、#5)、agent memory 架构(#2、#3)、长程规划(#4)、安全运行时(#6)、调度(#7)。特别推荐 #5 和 #6,前者是你做 agent orchestration 的理论地图,后者是 agent runtime 的工程美学。