terminal

AI Stack

rss_feed
SYS_STABLE
目录

视觉语言模型

条目:28
2026年三月 2 篇
类型阅读条目
[自动] [ARXIV]
3minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
03-01 VLM 视觉语言模型 报告偏差
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
03-01 多模态 视觉语言模型 最优传输
2026年二月 26 篇
类型阅读条目
[自动] [ARXIV]
3minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
02-28 VLM 视觉语言模型 报告偏差
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-28 多模态 视觉语言模型 最优传输
[自动] [ARXIV]
4minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
02-27 VLM 视觉语言模型 报告偏差
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-27 多模态 视觉语言模型 最优传输
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics用视觉语言模型规模化标注物理AI训练数据
02-25 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 设备上部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉-语言模型自动化标注施工视频数据
02-25 VLM 数据标注 自动化
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics利用视觉-语言模型自动化标注施工视频数据
02-25 视觉语言模型 数据标注 自动化
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台上部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic 在Jetson上部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics应用视觉语言模型规模化标注物理AI数据
02-25 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics利用视觉语言模型自动化标注物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉语言模型规模化标注数据赋能物理AI
02-24 VLM 物理AI 数据标注
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics利用视觉语言模型自动化生成物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉语言模型规模化标注施工数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 设备上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉-语言模型规模化标注物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic Bedrock与AWS合作:利用视觉-语言模型规模化生成物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [ARXIV]
4minschool 视觉-语言-动作对齐:扩展验证比扩展策略学习更有效
02-16 VLA 具身智能 CoVer
[自动] [HACKER_NEWS]
4minnewspaper GLM-OCR:面向复杂文档理解的多模态OCR模型
02-12 GLM-OCR 多模态 OCR
[自动] [HACKER_NEWS]
4minnewspaper GLM-OCR:兼顾准确度、速度与通用性的多模态大模型
02-11 GLM-OCR 多模态 OCR