Agent & LLM · 2026年7月5日
每日论文速递 · Agent & LLM
💡 一句话:把 Agent 的任务拆解、依赖、并行执行、失败定位都显式建成 DAG,不再靠一坨 textual trajectory 硬撑。
📄 每日论文速递 · Agent & LLM
日期:2026-07-05
1. Atomic Task Graph: A Unified Framework for Agentic Planning and Execution
原子任务图:面向 Agent 规划与执行的统一框架
🔗 https://arxiv.org/abs/2607.01942
💡 一句话:把 Agent 的任务拆解、依赖、并行执行、失败定位都显式建成 DAG,不再靠一坨 textual trajectory 硬撑。
🎯 关联:很高。Anna 做 AI Agent 平台时,task graph / execution trace / partial retry 这套东西可以直接变成核心调度抽象。
2. A-TMA: Decoupling State-Aware Memory Failures in Long-Term Agent Memory
A-TMA:拆解长期 Agent Memory 里的状态感知失败
🔗 https://arxiv.org/abs/2607.01935
💡 一句话:指出长期 memory 最大坑不是“记不住”,而是旧事实、新事实、变化过程混在一起导致 ghost memory。
🎯 关联:非常高。InternOS 的组织记忆和 AI Agent 的用户记忆都需要区分 current / historical / transition state,否则系统迟早胡说八道。
3. AutoMem: Automated Learning of Memory as a Cognitive Skill
AutoMem:把 Memory 管理当成可学习的认知技能
🔗 https://arxiv.org/abs/2607.01224
💡 一句话:让模型自己学习什么时候写 memory、怎么组织文件、什么时候检索,而不是靠人工 prompt 规则死调。
🎯 关联:非常高。Anna 的 Agent 平台如果要做长期任务,memory 不该只是 vector DB,而应该是 agent action space 的一部分。
4. ContextNest: Verifiable Context Governance for Autonomous AI Agent
ContextNest:面向自主 Agent 的可验证上下文治理
🔗 https://arxiv.org/abs/2607.02116
💡 一句话:给 RAG 底下补了一层 context governance:版本、来源、hash、可审计消费记录,保证 Agent 用过什么知识能追溯。
🎯 关联:很高。InternOS 如果要承载组织协作,context provenance 和 point-in-time reconstruction 不是 nice-to-have,是信任基础设施。
5. AgenticSTS: A Bounded-Memory Testbed for Long-Horizon LLM Agents
AgenticSTS:长周期 LLM Agent 的有界 Memory 测试床
🔗 https://arxiv.org/abs/2607.02255
💡 一句话:用“每次决策只通过 typed retrieval 组装上下文”的 bounded-memory contract,测试长周期 Agent 是否真能稳定决策。
🎯 关联:高。对 Anna 的平台很有启发:长期 Agent 不应该无限 append transcript,而要有明确 memory contract 和可消融层。
6. UA-ChatDev: Uncertainty-Aware Multi-Agent Collaboration for Reliable Software Development
UA-ChatDev:不确定性感知的多 Agent 软件开发协作
🔗 https://arxiv.org/abs/2607.02186
💡 一句话:在多 Agent 软件开发流程里加入 uncertainty estimation,低置信输出触发检索验证,减少早期 hallucination 传染到下游。
🎯 关联:高。对代码生成 Agent 和工程协作系统都关键:不是所有 agent output 都该默认可信,handoff 时必须带 confidence / verification gate。
7. Governance Gaps in Agent Interoperability Protocols: What MCP, A2A, and ACP Cannot Express
Agent 互操作协议的治理缺口:MCP、A2A、ACP 表达不了什么
🔗 https://arxiv.org/abs/2606.31498
💡 一句话:系统分析 MCP / A2A / ACP 等协议,指出它们能做工具调用和消息交换,但表达不了 voting、dissent preservation、audit/replay 等治理原语。
🎯 关联:非常高。Anna 做 InternOS 组织协调系统时,这篇很值得看:agent protocol 不能只设计 capability,还要设计 governance primitive。
8. TACO: Tool-Augmented Credit Optimization for Agentic Tool Use
TACO:面向 Agent 工具使用的工具增强信用分配优化
🔗 https://arxiv.org/abs/2606.30251
💡 一句话:给工具调用做 credit assignment,判断某次 tool call 到底有用、冗余还是误导,而不是只看最终答案对不对。
🎯 关联:高。Agent 平台要优化 tool-use policy,必须知道哪一步工具调用贡献了价值;这比粗暴记录“用了哪些工具”有用得多。