Agent & LLM · 2026年7月5日

每日论文速递 · Agent & LLM

💡 一句话：把 Agent 的任务拆解、依赖、并行执行、失败定位都显式建成 DAG，不再靠一坨 textual trajectory 硬撑。

2026-07-05 09:02:438 篇论文条目

📄 每日论文速递 · Agent & LLM

日期：2026-07-05

1. Atomic Task Graph: A Unified Framework for Agentic Planning and Execution

原子任务图：面向 Agent 规划与执行的统一框架

🔗 https://arxiv.org/abs/2607.01942

💡 一句话：把 Agent 的任务拆解、依赖、并行执行、失败定位都显式建成 DAG，不再靠一坨 textual trajectory 硬撑。

🎯 关联：很高。Anna 做 AI Agent 平台时，task graph / execution trace / partial retry 这套东西可以直接变成核心调度抽象。

2. A-TMA: Decoupling State-Aware Memory Failures in Long-Term Agent Memory

A-TMA：拆解长期 Agent Memory 里的状态感知失败

🔗 https://arxiv.org/abs/2607.01935

💡 一句话：指出长期 memory 最大坑不是“记不住”，而是旧事实、新事实、变化过程混在一起导致 ghost memory。

🎯 关联：非常高。InternOS 的组织记忆和 AI Agent 的用户记忆都需要区分 current / historical / transition state，否则系统迟早胡说八道。

3. AutoMem: Automated Learning of Memory as a Cognitive Skill

AutoMem：把 Memory 管理当成可学习的认知技能

🔗 https://arxiv.org/abs/2607.01224

💡 一句话：让模型自己学习什么时候写 memory、怎么组织文件、什么时候检索，而不是靠人工 prompt 规则死调。

🎯 关联：非常高。Anna 的 Agent 平台如果要做长期任务，memory 不该只是 vector DB，而应该是 agent action space 的一部分。

4. ContextNest: Verifiable Context Governance for Autonomous AI Agent

ContextNest：面向自主 Agent 的可验证上下文治理

🔗 https://arxiv.org/abs/2607.02116

💡 一句话：给 RAG 底下补了一层 context governance：版本、来源、hash、可审计消费记录，保证 Agent 用过什么知识能追溯。

🎯 关联：很高。InternOS 如果要承载组织协作，context provenance 和 point-in-time reconstruction 不是 nice-to-have，是信任基础设施。

5. AgenticSTS: A Bounded-Memory Testbed for Long-Horizon LLM Agents

AgenticSTS：长周期 LLM Agent 的有界 Memory 测试床

🔗 https://arxiv.org/abs/2607.02255

💡 一句话：用“每次决策只通过 typed retrieval 组装上下文”的 bounded-memory contract，测试长周期 Agent 是否真能稳定决策。

🎯 关联：高。对 Anna 的平台很有启发：长期 Agent 不应该无限 append transcript，而要有明确 memory contract 和可消融层。

6. UA-ChatDev: Uncertainty-Aware Multi-Agent Collaboration for Reliable Software Development

UA-ChatDev：不确定性感知的多 Agent 软件开发协作

🔗 https://arxiv.org/abs/2607.02186

💡 一句话：在多 Agent 软件开发流程里加入 uncertainty estimation，低置信输出触发检索验证，减少早期 hallucination 传染到下游。

🎯 关联：高。对代码生成 Agent 和工程协作系统都关键：不是所有 agent output 都该默认可信，handoff 时必须带 confidence / verification gate。

7. Governance Gaps in Agent Interoperability Protocols: What MCP, A2A, and ACP Cannot Express

Agent 互操作协议的治理缺口：MCP、A2A、ACP 表达不了什么

🔗 https://arxiv.org/abs/2606.31498

💡 一句话：系统分析 MCP / A2A / ACP 等协议，指出它们能做工具调用和消息交换，但表达不了 voting、dissent preservation、audit/replay 等治理原语。

🎯 关联：非常高。Anna 做 InternOS 组织协调系统时，这篇很值得看：agent protocol 不能只设计 capability，还要设计 governance primitive。

8. TACO: Tool-Augmented Credit Optimization for Agentic Tool Use

TACO：面向 Agent 工具使用的工具增强信用分配优化

🔗 https://arxiv.org/abs/2606.30251

💡 一句话：给工具调用做 credit assignment，判断某次 tool call 到底有用、冗余还是误导，而不是只看最终答案对不对。

🎯 关联：高。Agent 平台要优化 tool-use policy，必须知道哪一步工具调用贡献了价值；这比粗暴记录“用了哪些工具”有用得多。