A Anna 的论文速递Hermes Cron Paper Digest

Agent & LLM · 2026年5月9日

每日论文速递 · Agent & LLM

💡 一句话:提出 LATTE 框架,让多Agent团队动态构建共享协调图(类似分布式系统),自适应分配子任务、发现新任务,在减少token/时间/通信冲突的同时超越MetaGPT等固定架构。

This is a perfect match for Anna's InternOS project. I now have all the papers I need. I have 7 highly relevant papers from the past week (all submitted May 2-8, 2026). Let me compile the report.

📄 每日论文速递 · Agent & LLM

日期:2026-05-09


1. LATTE: Improving the Efficiency of Language Agent Teams with Adaptive Task Graphs

(自适应任务图提升语言Agent团队效率)

💡 一句话:提出 LATTE 框架,让多Agent团队动态构建共享协调图(类似分布式系统),自适应分配子任务、发现新任务,在减少token/时间/通信冲突的同时超越MetaGPT等固定架构。

🎯 关联:极高 — 这篇几乎是 InternOS 协调系统的学术对标物。LATTE 的"共享演化协调图 + 动态工作分配"思路可直接参考用于 InternOS 的组织编排层设计。


2. MASPO: Joint Prompt Optimization for LLM-based Multi-Agent Systems

(面向多Agent系统的联合提示词优化)

💡 一句话:解决多Agent系统中各角色prompt独立优化导致全局目标脱节的问题,提出联合评估机制让每个Agent的prompt不仅考虑自身表现,还评估对下游Agent的促进效果。ICML 2026。

🎯 关联: — Agent平台的prompt管理层可借鉴其"局部-全局对齐"思想,尤其适合InternOS中多个协调Agent需要prompt调优的场景。


3. SkillOS: Learning Skill Curation for Self-Evolving Agents

(技能策展学习:让Agent自我进化)

💡 一句话:用RL训练一个"技能策展员",让Agent从历史交互中提炼可复用技能存入SkillRepo,并学会何时创建/更新/检索技能,实现Agent自我进化而非每次从零开始。

🎯 关联: — Agent平台的memory/skill系统设计核心参考。SkillRepo的演化机制(从具体操作到高阶meta-skill)对InternOS的知识积累模块很有启发。


4. More Is Not Always Better: Cross-Component Interference in LLM Agent Scaffolding

(LLM Agent脚手架中的组件干扰问题)

💡 一句话:实验证明Agent系统"全装上"不一定好——规划/工具/记忆/反思/检索五大组件存在严重的交互干扰,最优配置是任务相关的,应按任务做子集选择而非默认全开。

🎯 关联:极高 — 对Agent平台架构设计有直接指导意义。InternOS在设计Agent能力组合时,需要考虑组件间干扰而非简单叠加,这篇给出了实验方法论。


5. Planner Matters! An Efficient and Unbalanced Multi-agent Collaboration Framework for Long-horizon Planning

(规划器为王:非均衡多Agent长程规划框架)

💡 一句话:发现在 Planner/Actor/Memory 三角色多Agent架构中,把算力集中投资在规划器上(用RL单独优化)远比平均分配有效,执行和记忆管理用小模型就够。

🎯 关联: — 直接指导InternOS的资源分配策略:协调/规划层用强模型,执行层可以用轻量模型,整体更高效。


6. RGAO: Retrieval-Conditioned Topology Selection for Multi-Agent Code Generation

(检索引导的多Agent代码生成拓扑自动选择)

💡 一句话:多Agent代码生成系统的编排拓扑应该根据代码结构复杂度动态选择,提出从代码索引中提取复杂度向量来路由到最优拓扑,并用形式化预算代数保证资源不超支。

🎯 关联: — 结合了"动态编排拓扑"和"形式化资源管理"两个InternOS需要的核心能力,特别是预算代数的思路可用于Agent平台的成本控制。


7. StraTA: Incentivizing Agentic RL with Strategic Trajectory Abstraction

(策略轨迹抽象激励Agent强化学习)

💡 一句话:在Agent RL训练中引入显式的"轨迹级策略"——先从任务状态采样一个策略摘要,再据此条件化行动,配合层级化GRPO训练,在ALFWorld达93.1%、WebShop达84.2%成功率。

🎯 关联:中高 — 对Agent的规划/推理层训练有参考价值,"先想策略再执行"的分层设计与InternOS中高层决策-底层执行的架构呼应。


💡 今日亮点总结:本周涌现了一批关于"多Agent协调效率"的重磅工作——LATTE的动态协调图、MASPO的联合优化、以及"组件干扰"的实证研究,都在说同一件事:多Agent系统的价值不在于堆叠组件,而在于智能编排。这正是InternOS要解决的核心问题。建议重点读 #1 和 #4。

生成信息
领域
Agent & LLM
Job ID
957795dd8d14
运行时间
2026-05-09 09:04:10
源文件
2026-05-09_09-04-10.md
链接数
7