每日论文速递 · Agent & LLM
💡 一句话:这篇直接拆 agent 模型训练数据 pipeline,做了 100+ ablation,并发布 100K agent 训练样本,核心价值是告诉你“什么数据真的能训出更会用工具/做任务的 agent”。
Hermes Cron Paper Digest
按领域整理 Anna 的每日论文速递,自动从 Hermes cron Markdown 输出生成静态网页。
Latest
💡 一句话:这篇直接拆 agent 模型训练数据 pipeline,做了 100+ ablation,并发布 100K agent 训练样本,核心价值是告诉你“什么数据真的能训出更会用工具/做任务的 agent”。
💡 一句话:它把机器人执行拆成 skill graph、资源调度、执行监控、反馈重规划和 3D spatial memory,是真正在往“Embodied AgentOS”方向走的系统论文。
Recent
💡 一句话:它把机器人执行拆成 skill graph、资源调度、执行监控、反馈重规划和 3D spatial memory,是真正在往“Embodied AgentOS”方向走的系统论文。
💡 一句话:这篇直接拆 agent 模型训练数据 pipeline,做了 100+ ablation,并发布 100K agent 训练样本,核心价值是告诉你“什么数据真的能训出更会用工具/做任务的 agent”。
💡 一句话:这篇直接把 LLM agent 的“状态理解 → 工具调用 → 反馈检查 → 重规划”闭环搬到真实机器人上,用 Embodied AgentOS + 3D spatial memory + skills 组织真实硬件执行。
💡 一句话:系统性评估多智能体系统里的 system prompt 优化,回答“调 prompt 到底在哪些 agent workflow / communication / team size 下有用”。
💡 一句话:它让 VLA 从普通双摄输入中“脑补”多视角未来画面,用 world model 解决遮挡下的 manipulation,真实机器人成功率提升很明显。
💡 一句话:只用常规 agent-view + wrist-view 两路相机,生成未来多视角场景来补 occlusion 信息,把遮挡任务成功率从 40.0% 拉到 73.3%,还用 token compression 把生成视角延迟压到 0.2–0.3s。
领域
LLM Agent、推理与对齐、多智能体协作、Agent 架构、AI 系统设计与代码生成。
领域
具身智能、Embodied Agents、机器人学习、世界模型、VLA、GUI/Web/环境交互 agent 与物理推理。