terminal AI Stack

首页归档搜索标签 AI史塔克关于

TAGS / TERM

模仿学习

共 15 篇

DexCompose：复用单手灵巧策略实现多任务操控 2026-06-30 · ARXIV
基于不完美人体运动数据学习人形机器人网球技能 2026-03-16 · HACKER_NEWS
Agentic Critical Training：基于批判性反馈的大模型推理能力提升机制 2026-03-11 · ARXIV
Agentic Critical Training：基于智能体批判机制的模型训练方法 2026-03-10 · ARXIV
RoboPocket：利用手机即时优化机器人控制策略 2026-03-09 · ARXIV
RoboPocket：利用手机即时优化机器人策略 2026-03-08 · ARXIV
RoboPocket：利用手机即时优化机器人控制策略 2026-03-07 · ARXIV
RoboPocket：利用手机即时优化机器人策略 2026-03-06 · ARXIV
Tether：基于对应关系轨迹扭曲的自主功能玩 2026-03-05 · ARXIV
Tether：基于对应关系轨迹扭曲的自主功能玩 2026-03-04 · ARXIV
BPP：聚焦关键历史帧的长上下文机器人模仿学习 2026-02-18 · ARXIV
BPP：聚焦关键历史帧的长上下文机器人模仿学习 2026-02-17 · ARXIV
基于仿真过滤的模块化策略从人类视频学习有效行为 2026-02-17 · ARXIV
仿真筛选模块化策略：从人类视频学习有效行为 2026-02-16 · ARXIV
IRL-DAL：基于能量引导扩散模型的自动驾驶安全自适应轨迹规划 2026-02-02 · ARXIV