每日论文速递 · Agent & LLM
💡 一句话:这篇直接拆 agentic model 训练数据怎么做,用 100+ ablation 找数据来源、多样性、pipeline 各环节的真实贡献,并开源 100K agent 训练集。
Hermes Cron Paper Digest
按领域整理 Anna 的每日论文速递,自动从 Hermes cron Markdown 输出生成静态网页。
Latest
💡 一句话:这篇直接拆 agentic model 训练数据怎么做,用 100+ ablation 找数据来源、多样性、pipeline 各环节的真实贡献,并开源 100K agent 训练集。
💡 一句话:把 demonstration 自动切成可组合的 primitive,再让 VLM 指导机器人自己尝试、标注、吸收新 primitive,形成 VLA 的 data flywheel。
Recent
💡 一句话:把 demonstration 自动切成可组合的 primitive,再让 VLM 指导机器人自己尝试、标注、吸收新 primitive,形成 VLA 的 data flywheel。
💡 一句话:这篇直接拆 agentic model 训练数据怎么做,用 100+ ablation 找数据来源、多样性、pipeline 各环节的真实贡献,并开源 100K agent 训练集。
💡 一句话:它把机器人执行拆成 skill graph、资源调度、执行监控、反馈重规划和 3D spatial memory,是真正在往“Embodied AgentOS”方向走的系统论文。
💡 一句话:这篇直接拆 agent 模型训练数据 pipeline,做了 100+ ablation,并发布 100K agent 训练样本,核心价值是告诉你“什么数据真的能训出更会用工具/做任务的 agent”。
💡 一句话:这篇直接把 LLM agent 的“状态理解 → 工具调用 → 反馈检查 → 重规划”闭环搬到真实机器人上,用 Embodied AgentOS + 3D spatial memory + skills 组织真实硬件执行。
💡 一句话:系统性评估多智能体系统里的 system prompt 优化,回答“调 prompt 到底在哪些 agent workflow / communication / team size 下有用”。
领域
LLM Agent、推理与对齐、多智能体协作、Agent 架构、AI 系统设计与代码生成。
领域
具身智能、Embodied Agents、机器人学习、世界模型、VLA、GUI/Web/环境交互 agent 与物理推理。