计算机视觉

条目：65

2026年三月 1 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school SeeThrough3D：文本生成图像中的遮挡感知三维控制 03-01 SeeThrough3D 文本生成图像 3D控制

2026年二月 57 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school SeeThrough3D：文本生成图像中的遮挡感知三维控制 02-28 SeeThrough3D 文本生成图像 3D控制
[自动] [JUEJIN]	2min	sticky_note_2 WiFi-DensePose项目利用AI分析信号实现无摄像头人体姿态感知 02-28 WiFi感知姿态估计 DensePose
[自动] [BLOGS_PODCASTS]	2min	mic 使用 Nano Banana 2 构建图像生成与编辑应用 02-27 Nano Banana 2 图像生成图像编辑
[自动] [ARXIV]	5min	school SeeThrough3D：文本生成图像中的遮挡感知三维控制 02-27 SeeThrough3D 文本生成图像 3D控制
[自动] [JUEJIN]	2min	sticky_note_2 AI视觉实战：高斯滤波器原理可视化与图像降噪 02-27 计算机视觉图像处理高斯滤波
[自动] [BLOGS_PODCASTS]	2min	mic 使用 Nano Banana 2 构建图像生成与编辑应用 02-27 Nano Banana 2 图像生成图像编辑
[自动] [ARXIV]	5min	school 面向高效高分辨率GUI智能体的时空令牌剪枝 02-27 GUI Agent Token Pruning Qwen2-VL
[自动] [ARXIV]	4min	school 现成图像模型可攻破图像保护方案 02-27 图像保护对抗攻击 Stable Diffusion
[自动] [HACKER_NEWS]	4min	newspaper 谷歌发布 Nano Banana 2 AI 图像生成模型 02-26 Google Nano Banana 2 图像生成
[自动] [ARXIV]	4min	school 现成图生图模型可攻破主流图像保护方案 02-26 图像保护对抗样本图生图
[自动] [JUEJIN]	2min	sticky_note_2 AI Agent接管手机：移动端观测技术与事件特征提取 02-26 AI Agent 移动端 UI 树解析
[自动] [HACKER_NEWS]	4min	newspaper 谷歌发布 Nano Banana 2 AI 图像生成模型 02-26 Google Nano Banana 2 图像生成
[自动] [HACKER_NEWS]	5min	newspaper 谷歌发布 Nano Banana 2：最新 AI 图像生成模型 02-26 Google Nano Banana 2 图像生成
[自动] [HACKER_NEWS]	5min	newspaper 谷歌发布 Nano Banana 2 AI 图像生成模型 02-26 Google Nano Banana 2 图像生成
[自动] [HACKER_NEWS]	4min	newspaper 谷歌发布 Nano Banana 2：最新 AI 图像生成模型 02-26 Google Nano Banana 2 图像生成
[自动] [JUEJIN]	2min	sticky_note_2 空洞卷积原理：如何解决计算机视觉的精度与视野矛盾 02-26 空洞卷积计算机视觉深度学习
[自动] [JUEJIN]	2min	sticky_note_2 AI视觉连载6：传统CV之高斯滤波原理与平滑效果 02-25 计算机视觉传统CV 图像处理
[自动] [BLOGS_PODCASTS]	4min	mic 基于AWS CDK集成Rekognition与Neptune构建智能照片搜索系统 02-25 AWS CDK Rekognition
[自动] [JUEJIN]	2min	sticky_note_2 AI视觉连载6：传统CV之高斯滤波原理与应用 02-25 计算机视觉图像处理高斯滤波
[自动] [BLOGS_PODCASTS]	3min	mic 基于 AWS CDK 集成 Rekognition 与 Neptune 的智能照片搜索系统 02-25 AWS CDK Rekognition
[自动] [BLOGS_PODCASTS]	3min	mic 基于 AWS CDK 集成 Rekognition 与 Neptune 构建智能图片搜索系统 02-25 AWS CDK Rekognition
[自动] [ARXIV]	4min	school VAUQ：面向LVLM自评估的视觉感知不确定性量化 02-25 LVLM 多模态不确定性量化
[自动] [BLOGS_PODCASTS]	4min	mic Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 02-24 AWS SageMaker HyperPod
[自动] [BLOGS_PODCASTS]	3min	mic Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 02-24 AWS SageMaker HyperPod
[自动] [ARXIV]	4min	school RetinaVision：基于XAI增强调控的深度学习视网膜疾病分类 02-24 计算机视觉医疗AI 深度学习
[自动] [ARXIV]	4min	school A.R.I.S.：基于深度学习的电子废弃物自动分类系统 02-21 深度学习计算机视觉 YOLOx
[自动] [ARXIV]	3min	school 以对象为中心的表征是否更利于组合泛化 02-20 组合泛化对象中心视觉表征
[自动] [ARXIV]	4min	school 以对象为中心的表征在组合泛化任务中的表现评估 02-19 组合泛化以对象为中心视觉问答
[自动] [ARXIV]	4min	school UniT：统一多模态思维链测试时扩展方法 02-16 多模态思维链测试时扩展
[自动] [ARXIV]	4min	school UniT：统一多模态思维链测试时扩展 02-14 多模态思维链测试时扩展
[自动] [HACKER_NEWS]	5min	newspaper 神经渲染技术探索与应用实践 02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]	7min	newspaper 神经渲染技术探索与应用实践 02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]	6min	newspaper 神经渲染技术探索与应用实践 02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]	6min	newspaper 神经渲染技术探索：从原理到应用实践 02-14 神经渲染 NeRF 3D重建
[自动] [ARXIV]	4min	school 超越VLM奖励：扩散原生潜在奖励建模 02-12 扩散模型 DiNa-LRM 奖励建模
[自动] [BLOGS_PODCASTS]	3min	mic 亚马逊利用Nova模型自动化新履约中心运营就绪测试 02-12 Amazon Nova Amazon Bedrock 图像识别
[自动] [BLOGS_PODCASTS]	3min	mic 亚马逊利用Nova模型自动化新履约中心运营验收测试 02-12 Amazon Nova Amazon Bedrock 图像识别
[自动] [BLOGS_PODCASTS]	3min	mic 亚马逊利用 Nova 模型自动化检测新履约中心组件 02-12 Amazon Nova Amazon Bedrock 计算机视觉
[自动] [BLOGS_PODCASTS]	3min	mic 亚马逊利用 Nova 模型自动化新履约中心运营就绪测试 02-12 Amazon Nova Amazon Bedrock 图像识别
[自动] [JUEJIN]	3min	sticky_note_2 AI视觉连载3：RGB图像模式与通道原理解析 02-12 计算机视觉图像处理 RGB
[自动] [JUEJIN]	2min	sticky_note_2 AI视觉连载3：RGB图像原理与通道详解 02-11 AI视觉 RGB 图像处理
[自动] [BLOGS_PODCASTS]	3min	mic 亚马逊利用Nova模型自动化新履约中心运营就绪测试 02-11 Amazon Nova Amazon Bedrock 图像识别
[自动] [ARXIV]	3min	school 鲁棒性是函数而非数值：基于视觉驾驶的OOD鲁棒性因子化研究 02-10 OOD鲁棒性视觉驾驶因子化
[自动] [HACKER_NEWS]	6min	newspaper Waymo 世界模型：利用生成式世界模型提升自动驾驶决策能力 02-07 Waymo 世界模型自动驾驶
[自动] [HACKER_NEWS]	4min	newspaper Waymo 世界模型：利用生成式世界模拟提升自动驾驶决策 02-07 Waymo 世界模型自动驾驶
[自动] [HACKER_NEWS]	4min	newspaper Waymo 世界模型：自动驾驶场景生成与预测架构 02-07 Waymo 世界模型自动驾驶
[自动] [HACKER_NEWS]	4min	newspaper Waymo 世界模型：利用生成式视频预测驾驶场景 02-06 Waymo 世界模型生成式视频
[自动] [HACKER_NEWS]	4min	newspaper Waymo世界模型：自动驾驶仿真的新前沿 02-06 Waymo 自动驾驶世界模型
[自动] [HACKER_NEWS]	6min	newspaper Waymo世界模型：自动驾驶仿真的新前沿 02-06 Waymo 自动驾驶世界模型
[自动] [BLOGS_PODCASTS]	2min	mic 文生图模型训练设计：消融实验的经验总结 02-04 文生图模型训练消融实验
[自动] [ARXIV]	5min	school PixelGen：像素扩散结合感知损失超越潜在扩散 02-04 PixelGen 扩散模型计算机视觉
[自动] [ARXIV]	4min	school PixelGen：引入感知损失的像素扩散模型性能超越潜在扩散 02-03 PixelGen 扩散模型计算机视觉
[自动] [ARXIV]	3min	school HERMES：基于视觉语言模型的长尾自动驾驶端到端风险感知系统 02-03 自动驾驶 VLM 长尾场景
[自动] [ARXIV]	4min	school VideoGPA：提取几何先验实现三维一致性视频生成 02-03 VideoGPA 视频生成 3D一致性
[自动] [ARXIV]	5min	school VideoGPA：提取几何先验实现三维一致视频生成 02-02 视频生成 3D一致性扩散模型
[自动] [ARXIV]	4min	school IRL-DAL：基于能量引导扩散模型的自动驾驶安全自适应轨迹规划 02-02 自动驾驶扩散模型逆向强化学习
[自动] [HACKER_NEWS]	3min	newspaper 自动驾驶与无人机易受路牌提示词攻击 02-01 提示词注入对抗性攻击自动驾驶

2026年一月 7 篇

类型	阅读	条目
[自动] [ARXIV]	3min	school 基于相机-IMU融合的鲁棒路面分类数据集与框架 01-29 计算机视觉多模态融合 IMU
[自动] [ARXIV]	5min	school 🚀AnyView：动态场景任意新视角合成！开创性技术突破🔥 01-27 计算机视觉视频生成扩散模型
[自动] [ARXIV]	5min	school 🚀动态场景新视角合成！AnyView实现任意视角自由切换！🤯 01-26 动态场景新视角合成扩散模型
[自动] [HACKER_NEWS]	3min	newspaper macOS神器：含胸驼背？屏幕立刻模糊！强制你挺直腰杆！💻✨ 01-26 macOS 健康坐姿监测
[自动] [HACKER_NEWS]	3min	newspaper ⚠️一咬指甲就强制关机？这款桌面App太狠了！🖥️🚫 01-26 桌面应用习惯矫正生产力工具
[自动] [ARXIV]	6min	school 🤖抽屉打不开？揭秘零样本组合动作识别中的“物体捷径”！ 01-25 计算机视觉零样本学习动作识别
[自动] [HACKER_NEWS]	3min	newspaper 🔥 视频修复难题：如何攻克时间一致性？ 01-25 视频修复时序一致性光流