目录
VLM
条目:34
2026年三月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
规模难以克服语用学:报告偏差对视觉语言推理的影响 03-01
VLM
视觉语言模型
报告偏差 |
2026年二月
33 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
规模难以克服语用学:报告偏差对视觉语言推理的影响 02-28
VLM
视觉语言模型
报告偏差 |
[自动]
[ARXIV] | 4min | school
规模难以克服语用学:报告偏差对视觉语言推理的影响 02-27
VLM
视觉语言模型
报告偏差 |
[自动]
[ARXIV] | 4min | school
MovieTeller:工具增强且ID一致的渐进式摘要生成 02-27
MovieTeller
视频摘要
VLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台部署开源视觉语言模型 02-25
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Bedrock Robotics用视觉语言模型规模化标注物理AI训练数据 02-25
VLM
视觉语言模型
数据标注 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 设备上部署开源视觉语言模型 02-25
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Bedrock Robotics利用视觉-语言模型自动化标注施工视频数据 02-25
VLM
数据标注
自动化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台上部署开源视觉语言模型 02-25
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在Jetson上部署开源视觉语言模型 02-25
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Bedrock Robotics应用视觉语言模型规模化标注物理AI数据 02-25
VLM
视觉语言模型
数据标注 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台上部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Bedrock Robotics利用视觉语言模型自动化标注物理AI训练数据 02-24
VLM
视觉语言模型
数据标注 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台上部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Bedrock Robotics利用视觉语言模型规模化标注数据赋能物理AI 02-24
VLM
物理AI
数据标注 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Bedrock Robotics利用视觉语言模型自动化生成物理AI训练数据 02-24
VLM
视觉语言模型
数据标注 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 上部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Bedrock Robotics利用视觉语言模型规模化标注施工数据 02-24
VLM
视觉语言模型
数据标注 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 设备上部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Bedrock Robotics利用视觉-语言模型规模化标注物理AI训练数据 02-24
VLM
视觉语言模型
数据标注 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Bedrock与AWS合作:利用视觉-语言模型规模化生成物理AI训练数据 02-24
VLM
视觉语言模型
数据标注 |
[自动]
[JUEJIN] | 2min | sticky_note_2
Open-AutoGLM:基于视觉语言模型的手机端智能助理框架 02-21
Phone Agent
AutoGLM
VLM |
[自动]
[ARXIV] | 4min | school
延迟视觉摄入优化图文密集文档问答 02-17
多模态
文档问答
VLM |
[自动]
[ARXIV] | 4min | school
超越VLM奖励:扩散原生潜在奖励建模 02-13
扩散模型
DiNa-LRM
奖励建模 |
[自动]
[ARXIV] | 4min | school
超越VLM奖励:扩散原生潜在奖励建模 02-12
扩散模型
DiNa-LRM
奖励建模 |
[自动]
[ARXIV] | 5min | school
LQA:面向边缘端视觉语言模型的轻量级量化自适应框架 02-10
VLM
边缘计算
模型量化 |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直观物理 02-09
VLM
直觉物理
强化学习 |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直觉物理 02-08
VLM
直觉物理
多模态 |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直观物理 02-07
VLM
多模态
具身智能 |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直觉物理 02-06
VLM
直觉物理
强化学习 |
[自动]
[ARXIV] | 3min | school
HERMES:基于视觉语言模型的长尾自动驾驶端到端风险感知系统 02-03
自动驾驶
VLM
长尾场景 |
[自动]
[ARXIV] | 5min | school
PaperBanana:面向AI科研人员的学术绘图自动化工具 02-03
PaperBanana
学术绘图
智能体框架 |
[自动]
[ARXIV] | 4min | school
PaperBanana:面向AI科研人员的学术绘图自动化工具 02-02
PaperBanana
学术绘图
VLM |
无匹配条目