terminal

AI Stack

rss_feed
SYS_STABLE
目录

VLM

条目:34
2026年三月 1 篇
类型阅读条目
[自动] [ARXIV]
4minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
03-01 VLM 视觉语言模型 报告偏差
2026年二月 33 篇
类型阅读条目
[自动] [ARXIV]
3minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
02-28 VLM 视觉语言模型 报告偏差
[自动] [ARXIV]
4minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
02-27 VLM 视觉语言模型 报告偏差
[自动] [ARXIV]
4minschool MovieTeller:工具增强且ID一致的渐进式摘要生成
02-27 MovieTeller 视频摘要 VLM
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics用视觉语言模型规模化标注物理AI训练数据
02-25 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 设备上部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉-语言模型自动化标注施工视频数据
02-25 VLM 数据标注 自动化
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台上部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic 在Jetson上部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics应用视觉语言模型规模化标注物理AI数据
02-25 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics利用视觉语言模型自动化标注物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉语言模型规模化标注数据赋能物理AI
02-24 VLM 物理AI 数据标注
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics利用视觉语言模型自动化生成物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉语言模型规模化标注施工数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 设备上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉-语言模型规模化标注物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic Bedrock与AWS合作:利用视觉-语言模型规模化生成物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [JUEJIN]
2minsticky_note_2 Open-AutoGLM:基于视觉语言模型的手机端智能助理框架
02-21 Phone Agent AutoGLM VLM
[自动] [ARXIV]
4minschool 延迟视觉摄入优化图文密集文档问答
02-17 多模态 文档问答 VLM
[自动] [ARXIV]
4minschool 超越VLM奖励:扩散原生潜在奖励建模
02-13 扩散模型 DiNa-LRM 奖励建模
[自动] [ARXIV]
4minschool 超越VLM奖励:扩散原生潜在奖励建模
02-12 扩散模型 DiNa-LRM 奖励建模
[自动] [ARXIV]
5minschool LQA:面向边缘端视觉语言模型的轻量级量化自适应框架
02-10 VLM 边缘计算 模型量化
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直观物理
02-09 VLM 直觉物理 强化学习
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直觉物理
02-08 VLM 直觉物理 多模态
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直观物理
02-07 VLM 多模态 具身智能
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直觉物理
02-06 VLM 直觉物理 强化学习
[自动] [ARXIV]
3minschool HERMES:基于视觉语言模型的长尾自动驾驶端到端风险感知系统
02-03 自动驾驶 VLM 长尾场景
[自动] [ARXIV]
5minschool PaperBanana:面向AI科研人员的学术绘图自动化工具
02-03 PaperBanana 学术绘图 智能体框架
[自动] [ARXIV]
4minschool PaperBanana:面向AI科研人员的学术绘图自动化工具
02-02 PaperBanana 学术绘图 VLM