VLM

条目：34

2026年三月 1 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school 规模难以克服语用学：报告偏差对视觉语言推理的影响 03-01 VLM 视觉语言模型报告偏差

2026年二月 33 篇

类型	阅读	条目
[自动] [ARXIV]	3min	school 规模难以克服语用学：报告偏差对视觉语言推理的影响 02-28 VLM 视觉语言模型报告偏差
[自动] [ARXIV]	4min	school 规模难以克服语用学：报告偏差对视觉语言推理的影响 02-27 VLM 视觉语言模型报告偏差
[自动] [ARXIV]	4min	school MovieTeller：工具增强且ID一致的渐进式摘要生成 02-27 MovieTeller 视频摘要 VLM
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台部署开源视觉语言模型 02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	2min	mic Bedrock Robotics用视觉语言模型规模化标注物理AI训练数据 02-25 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 设备上部署开源视觉语言模型 02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics利用视觉-语言模型自动化标注施工视频数据 02-25 VLM 数据标注自动化
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台上部署开源视觉语言模型 02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic 在Jetson上部署开源视觉语言模型 02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics应用视觉语言模型规模化标注物理AI数据 02-25 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台上部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	2min	mic Bedrock Robotics利用视觉语言模型自动化标注物理AI训练数据 02-24 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台上部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics利用视觉语言模型规模化标注数据赋能物理AI 02-24 VLM 物理AI 数据标注
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	2min	mic Bedrock Robotics利用视觉语言模型自动化生成物理AI训练数据 02-24 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 上部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics利用视觉语言模型规模化标注施工数据 02-24 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 设备上部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics利用视觉-语言模型规模化标注物理AI训练数据 02-24 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock与AWS合作：利用视觉-语言模型规模化生成物理AI训练数据 02-24 VLM 视觉语言模型数据标注
[自动] [JUEJIN]	2min	sticky_note_2 Open-AutoGLM：基于视觉语言模型的手机端智能助理框架 02-21 Phone Agent AutoGLM VLM
[自动] [ARXIV]	4min	school 延迟视觉摄入优化图文密集文档问答 02-17 多模态文档问答 VLM
[自动] [ARXIV]	4min	school 超越VLM奖励：扩散原生潜在奖励建模 02-13 扩散模型 DiNa-LRM 奖励建模
[自动] [ARXIV]	4min	school 超越VLM奖励：扩散原生潜在奖励建模 02-12 扩散模型 DiNa-LRM 奖励建模
[自动] [ARXIV]	5min	school LQA：面向边缘端视觉语言模型的轻量级量化自适应框架 02-10 VLM 边缘计算模型量化
[自动] [ARXIV]	3min	school 视觉语言模型能否通过交互学习直观物理 02-09 VLM 直觉物理强化学习
[自动] [ARXIV]	3min	school 视觉语言模型能否通过交互学习直觉物理 02-08 VLM 直觉物理多模态
[自动] [ARXIV]	3min	school 视觉语言模型能否通过交互学习直观物理 02-07 VLM 多模态具身智能
[自动] [ARXIV]	3min	school 视觉语言模型能否通过交互学习直觉物理 02-06 VLM 直觉物理强化学习
[自动] [ARXIV]	3min	school HERMES：基于视觉语言模型的长尾自动驾驶端到端风险感知系统 02-03 自动驾驶 VLM 长尾场景
[自动] [ARXIV]	5min	school PaperBanana：面向AI科研人员的学术绘图自动化工具 02-03 PaperBanana 学术绘图智能体框架
[自动] [ARXIV]	4min	school PaperBanana：面向AI科研人员的学术绘图自动化工具 02-02 PaperBanana 学术绘图 VLM