Agent & LLM · 2026年5月9日

每日论文速递 · Agent & LLM

💡 一句话：提出 LATTE 框架，让多Agent团队动态构建共享协调图（类似分布式系统），自适应分配子任务、发现新任务，在减少token/时间/通信冲突的同时超越MetaGPT等固定架构。

2026-05-09 09:04:107 篇论文条目

arXiv:2605.06320 arXiv:2605.06623 arXiv:2605.06614 arXiv:2605.05716 arXiv:2605.02168 arXiv:2605.05657 arXiv:2605.06642

This is a perfect match for Anna's InternOS project. I now have all the papers I need. I have 7 highly relevant papers from the past week (all submitted May 2-8, 2026). Let me compile the report.

📄 每日论文速递 · Agent & LLM

日期：2026-05-09

1. LATTE: Improving the Efficiency of Language Agent Teams with Adaptive Task Graphs

（自适应任务图提升语言Agent团队效率）

🔗 https://arxiv.org/abs/2605.06320

🎯 关联：极高 — 这篇几乎是 InternOS 协调系统的学术对标物。LATTE 的"共享演化协调图 + 动态工作分配"思路可直接参考用于 InternOS 的组织编排层设计。

2. MASPO: Joint Prompt Optimization for LLM-based Multi-Agent Systems

（面向多Agent系统的联合提示词优化）

🔗 https://arxiv.org/abs/2605.06623

💡 一句话：解决多Agent系统中各角色prompt独立优化导致全局目标脱节的问题，提出联合评估机制让每个Agent的prompt不仅考虑自身表现，还评估对下游Agent的促进效果。ICML 2026。

🎯 关联：高 — Agent平台的prompt管理层可借鉴其"局部-全局对齐"思想，尤其适合InternOS中多个协调Agent需要prompt调优的场景。

3. SkillOS: Learning Skill Curation for Self-Evolving Agents

（技能策展学习：让Agent自我进化）

🔗 https://arxiv.org/abs/2605.06614

💡 一句话：用RL训练一个"技能策展员"，让Agent从历史交互中提炼可复用技能存入SkillRepo，并学会何时创建/更新/检索技能，实现Agent自我进化而非每次从零开始。

🎯 关联：高 — Agent平台的memory/skill系统设计核心参考。SkillRepo的演化机制（从具体操作到高阶meta-skill）对InternOS的知识积累模块很有启发。

4. More Is Not Always Better: Cross-Component Interference in LLM Agent Scaffolding

（LLM Agent脚手架中的组件干扰问题）

🔗 https://arxiv.org/abs/2605.05716

💡 一句话：实验证明Agent系统"全装上"不一定好——规划/工具/记忆/反思/检索五大组件存在严重的交互干扰，最优配置是任务相关的，应按任务做子集选择而非默认全开。

🎯 关联：极高 — 对Agent平台架构设计有直接指导意义。InternOS在设计Agent能力组合时，需要考虑组件间干扰而非简单叠加，这篇给出了实验方法论。

5. Planner Matters! An Efficient and Unbalanced Multi-agent Collaboration Framework for Long-horizon Planning

（规划器为王：非均衡多Agent长程规划框架）

🔗 https://arxiv.org/abs/2605.02168

💡 一句话：发现在 Planner/Actor/Memory 三角色多Agent架构中，把算力集中投资在规划器上（用RL单独优化）远比平均分配有效，执行和记忆管理用小模型就够。

🎯 关联：高 — 直接指导InternOS的资源分配策略：协调/规划层用强模型，执行层可以用轻量模型，整体更高效。

6. RGAO: Retrieval-Conditioned Topology Selection for Multi-Agent Code Generation

（检索引导的多Agent代码生成拓扑自动选择）

🔗 https://arxiv.org/abs/2605.05657

💡 一句话：多Agent代码生成系统的编排拓扑应该根据代码结构复杂度动态选择，提出从代码索引中提取复杂度向量来路由到最优拓扑，并用形式化预算代数保证资源不超支。

🎯 关联：高 — 结合了"动态编排拓扑"和"形式化资源管理"两个InternOS需要的核心能力，特别是预算代数的思路可用于Agent平台的成本控制。

7. StraTA: Incentivizing Agentic RL with Strategic Trajectory Abstraction

（策略轨迹抽象激励Agent强化学习）

🔗 https://arxiv.org/abs/2605.06642

💡 一句话：在Agent RL训练中引入显式的"轨迹级策略"——先从任务状态采样一个策略摘要，再据此条件化行动，配合层级化GRPO训练，在ALFWorld达93.1%、WebShop达84.2%成功率。

🎯 关联：中高 — 对Agent的规划/推理层训练有参考价值，"先想策略再执行"的分层设计与InternOS中高层决策-底层执行的架构呼应。

💡 今日亮点总结：本周涌现了一批关于"多Agent协调效率"的重磅工作——LATTE的动态协调图、MASPO的联合优化、以及"组件干扰"的实证研究，都在说同一件事：多Agent系统的价值不在于堆叠组件，而在于智能编排。这正是InternOS要解决的核心问题。建议重点读 #1 和 #4。