A Anna 的论文速递Hermes Cron Paper Digest

Agent & LLM · 2026年7月5日

每日论文速递 · Agent & LLM

💡 一句话:把 Agent 的任务拆解、依赖、并行执行、失败定位都显式建成 DAG,不再靠一坨 textual trajectory 硬撑。

📄 每日论文速递 · Agent & LLM

日期:2026-07-05


1. Atomic Task Graph: A Unified Framework for Agentic Planning and Execution

原子任务图:面向 Agent 规划与执行的统一框架

💡 一句话:把 Agent 的任务拆解、依赖、并行执行、失败定位都显式建成 DAG,不再靠一坨 textual trajectory 硬撑。

🎯 关联:很高。Anna 做 AI Agent 平台时,task graph / execution trace / partial retry 这套东西可以直接变成核心调度抽象。


2. A-TMA: Decoupling State-Aware Memory Failures in Long-Term Agent Memory

A-TMA:拆解长期 Agent Memory 里的状态感知失败

💡 一句话:指出长期 memory 最大坑不是“记不住”,而是旧事实、新事实、变化过程混在一起导致 ghost memory。

🎯 关联:非常高。InternOS 的组织记忆和 AI Agent 的用户记忆都需要区分 current / historical / transition state,否则系统迟早胡说八道。


3. AutoMem: Automated Learning of Memory as a Cognitive Skill

AutoMem:把 Memory 管理当成可学习的认知技能

💡 一句话:让模型自己学习什么时候写 memory、怎么组织文件、什么时候检索,而不是靠人工 prompt 规则死调。

🎯 关联:非常高。Anna 的 Agent 平台如果要做长期任务,memory 不该只是 vector DB,而应该是 agent action space 的一部分。


4. ContextNest: Verifiable Context Governance for Autonomous AI Agent

ContextNest:面向自主 Agent 的可验证上下文治理

💡 一句话:给 RAG 底下补了一层 context governance:版本、来源、hash、可审计消费记录,保证 Agent 用过什么知识能追溯。

🎯 关联:很高。InternOS 如果要承载组织协作,context provenance 和 point-in-time reconstruction 不是 nice-to-have,是信任基础设施。


5. AgenticSTS: A Bounded-Memory Testbed for Long-Horizon LLM Agents

AgenticSTS:长周期 LLM Agent 的有界 Memory 测试床

💡 一句话:用“每次决策只通过 typed retrieval 组装上下文”的 bounded-memory contract,测试长周期 Agent 是否真能稳定决策。

🎯 关联:高。对 Anna 的平台很有启发:长期 Agent 不应该无限 append transcript,而要有明确 memory contract 和可消融层。


6. UA-ChatDev: Uncertainty-Aware Multi-Agent Collaboration for Reliable Software Development

UA-ChatDev:不确定性感知的多 Agent 软件开发协作

💡 一句话:在多 Agent 软件开发流程里加入 uncertainty estimation,低置信输出触发检索验证,减少早期 hallucination 传染到下游。

🎯 关联:高。对代码生成 Agent 和工程协作系统都关键:不是所有 agent output 都该默认可信,handoff 时必须带 confidence / verification gate。


7. Governance Gaps in Agent Interoperability Protocols: What MCP, A2A, and ACP Cannot Express

Agent 互操作协议的治理缺口:MCP、A2A、ACP 表达不了什么

💡 一句话:系统分析 MCP / A2A / ACP 等协议,指出它们能做工具调用和消息交换,但表达不了 voting、dissent preservation、audit/replay 等治理原语。

🎯 关联:非常高。Anna 做 InternOS 组织协调系统时,这篇很值得看:agent protocol 不能只设计 capability,还要设计 governance primitive。


8. TACO: Tool-Augmented Credit Optimization for Agentic Tool Use

TACO:面向 Agent 工具使用的工具增强信用分配优化

💡 一句话:给工具调用做 credit assignment,判断某次 tool call 到底有用、冗余还是误导,而不是只看最终答案对不对。

🎯 关联:高。Agent 平台要优化 tool-use policy,必须知道哪一步工具调用贡献了价值;这比粗暴记录“用了哪些工具”有用得多。

生成信息
领域
Agent & LLM
Job ID
957795dd8d14
运行时间
2026-07-05 09:02:43
源文件
2026-07-05_09-02-43.md
链接数
8