视觉语言模型

条目：28

2026年三月 2 篇

类型	阅读	条目
[自动] [ARXIV]	3min	school 规模难以克服语用学：报告偏差对视觉语言推理的影响 03-01 VLM 视觉语言模型报告偏差
[自动] [ARXIV]	4min	school SOTAlign：基于最优传输的单模态视觉与语言模型半监督对齐 03-01 多模态视觉语言模型最优传输

2026年二月 26 篇

类型	阅读	条目
[自动] [ARXIV]	3min	school 规模难以克服语用学：报告偏差对视觉语言推理的影响 02-28 VLM 视觉语言模型报告偏差
[自动] [ARXIV]	4min	school SOTAlign：基于最优传输的单模态视觉与语言模型半监督对齐 02-28 多模态视觉语言模型最优传输
[自动] [ARXIV]	4min	school 规模难以克服语用学：报告偏差对视觉语言推理的影响 02-27 VLM 视觉语言模型报告偏差
[自动] [ARXIV]	4min	school SOTAlign：基于最优传输的单模态视觉与语言模型半监督对齐 02-27 多模态视觉语言模型最优传输
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台部署开源视觉语言模型 02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	2min	mic Bedrock Robotics用视觉语言模型规模化标注物理AI训练数据 02-25 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 设备上部署开源视觉语言模型 02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics利用视觉-语言模型自动化标注施工视频数据 02-25 VLM 数据标注自动化
[自动] [BLOGS_PODCASTS]	2min	mic Bedrock Robotics利用视觉-语言模型自动化标注施工视频数据 02-25 视觉语言模型数据标注自动化
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台上部署开源视觉语言模型 02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic 在Jetson上部署开源视觉语言模型 02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics应用视觉语言模型规模化标注物理AI数据 02-25 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台上部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	2min	mic Bedrock Robotics利用视觉语言模型自动化标注物理AI训练数据 02-24 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台上部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics利用视觉语言模型规模化标注数据赋能物理AI 02-24 VLM 物理AI 数据标注
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	2min	mic Bedrock Robotics利用视觉语言模型自动化生成物理AI训练数据 02-24 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 上部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics利用视觉语言模型规模化标注施工数据 02-24 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 设备上部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics利用视觉-语言模型规模化标注物理AI训练数据 02-24 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock与AWS合作：利用视觉-语言模型规模化生成物理AI训练数据 02-24 VLM 视觉语言模型数据标注
[自动] [ARXIV]	4min	school 视觉-语言-动作对齐：扩展验证比扩展策略学习更有效 02-16 VLA 具身智能 CoVer
[自动] [HACKER_NEWS]	4min	newspaper GLM-OCR：面向复杂文档理解的多模态OCR模型 02-12 GLM-OCR 多模态 OCR
[自动] [HACKER_NEWS]	4min	newspaper GLM-OCR：兼顾准确度、速度与通用性的多模态大模型 02-11 GLM-OCR 多模态 OCR