terminal

AI Stack

rss_feed
SYS_STABLE
目录

模仿学习

条目:14
2026年三月 9 篇
类型阅读条目
[自动] [HACKER_NEWS]
2minnewspaper 基于不完美人体运动数据学习人形机器人网球技能
03-16 人形机器人 运动学习 强化学习
[自动] [ARXIV]
4minschool Agentic Critical Training:基于批判性反馈的大模型推理能力提升机制
03-11 Agentic AI 强化学习 推理能力
[自动] [ARXIV]
4minschool Agentic Critical Training:基于智能体批判机制的模型训练方法
03-10 ACT Agent 强化学习
[自动] [ARXIV]
3minschool RoboPocket:利用手机即时优化机器人控制策略
03-09 机器人 模仿学习 RoboPocket
[自动] [ARXIV]
3minschool RoboPocket:利用手机即时优化机器人策略
03-08 机器人 模仿学习 RoboPocket
[自动] [ARXIV]
3minschool RoboPocket:利用手机即时优化机器人控制策略
03-07 机器人 模仿学习 RoboPocket
[自动] [ARXIV]
4minschool RoboPocket:利用手机即时优化机器人策略
03-06 机器人 模仿学习 RoboPocket
[自动] [ARXIV]
3minschool Tether:基于对应关系轨迹扭曲的自主功能玩
03-05 机器人学习 模仿学习 自主智能体
[自动] [ARXIV]
3minschool Tether:基于对应关系轨迹扭曲的自主功能玩
03-04 机器人学习 模仿学习 自主玩法
2026年二月 5 篇
类型阅读条目
[自动] [ARXIV]
3minschool BPP:聚焦关键历史帧的长上下文机器人模仿学习
02-18 机器人 模仿学习 长上下文
[自动] [ARXIV]
3minschool BPP:聚焦关键历史帧的长上下文机器人模仿学习
02-17 机器人 模仿学习 长上下文
[自动] [ARXIV]
4minschool 基于仿真过滤的模块化策略从人类视频学习有效行为
02-17 机器人 模仿学习 仿真过滤
[自动] [ARXIV]
4minschool 仿真筛选模块化策略:从人类视频学习有效行为
02-16 机器人 强化学习 模仿学习
[自动] [ARXIV]
4minschool IRL-DAL:基于能量引导扩散模型的自动驾驶安全自适应轨迹规划
02-02 自动驾驶 扩散模型 逆向强化学习