目录
模仿学习
条目:14
2026年三月
9 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 2min | newspaper
基于不完美人体运动数据学习人形机器人网球技能 03-16
人形机器人
运动学习
强化学习 |
[自动]
[ARXIV] | 4min | school
Agentic Critical Training:基于批判性反馈的大模型推理能力提升机制 03-11
Agentic AI
强化学习
推理能力 |
[自动]
[ARXIV] | 4min | school
Agentic Critical Training:基于智能体批判机制的模型训练方法 03-10
ACT
Agent
强化学习 |
[自动]
[ARXIV] | 3min | school
RoboPocket:利用手机即时优化机器人控制策略 03-09
机器人
模仿学习
RoboPocket |
[自动]
[ARXIV] | 3min | school
RoboPocket:利用手机即时优化机器人策略 03-08
机器人
模仿学习
RoboPocket |
[自动]
[ARXIV] | 3min | school
RoboPocket:利用手机即时优化机器人控制策略 03-07
机器人
模仿学习
RoboPocket |
[自动]
[ARXIV] | 4min | school
RoboPocket:利用手机即时优化机器人策略 03-06
机器人
模仿学习
RoboPocket |
[自动]
[ARXIV] | 3min | school
Tether:基于对应关系轨迹扭曲的自主功能玩 03-05
机器人学习
模仿学习
自主智能体 |
[自动]
[ARXIV] | 3min | school
Tether:基于对应关系轨迹扭曲的自主功能玩 03-04
机器人学习
模仿学习
自主玩法 |
2026年二月
5 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
BPP:聚焦关键历史帧的长上下文机器人模仿学习 02-18
机器人
模仿学习
长上下文 |
[自动]
[ARXIV] | 3min | school
BPP:聚焦关键历史帧的长上下文机器人模仿学习 02-17
机器人
模仿学习
长上下文 |
[自动]
[ARXIV] | 4min | school
基于仿真过滤的模块化策略从人类视频学习有效行为 02-17
机器人
模仿学习
仿真过滤 |
[自动]
[ARXIV] | 4min | school
仿真筛选模块化策略:从人类视频学习有效行为 02-16
机器人
强化学习
模仿学习 |
[自动]
[ARXIV] | 4min | school
IRL-DAL:基于能量引导扩散模型的自动驾驶安全自适应轨迹规划 02-02
自动驾驶
扩散模型
逆向强化学习 |
无匹配条目