terminal

AI Stack

rss_feed
SYS_STABLE
目录

计算机视觉

条目:65
2026年三月 1 篇
类型阅读条目
[自动] [ARXIV]
4minschool SeeThrough3D:文本生成图像中的遮挡感知三维控制
03-01 SeeThrough3D 文本生成图像 3D控制
2026年二月 57 篇
类型阅读条目
[自动] [ARXIV]
4minschool SeeThrough3D:文本生成图像中的遮挡感知三维控制
02-28 SeeThrough3D 文本生成图像 3D控制
[自动] [JUEJIN]
2minsticky_note_2 WiFi-DensePose项目利用AI分析信号实现无摄像头人体姿态感知
02-28 WiFi感知 姿态估计 DensePose
[自动] [BLOGS_PODCASTS]
2minmic 使用 Nano Banana 2 构建图像生成与编辑应用
02-27 Nano Banana 2 图像生成 图像编辑
[自动] [ARXIV]
5minschool SeeThrough3D:文本生成图像中的遮挡感知三维控制
02-27 SeeThrough3D 文本生成图像 3D控制
[自动] [JUEJIN]
2minsticky_note_2 AI视觉实战:高斯滤波器原理可视化与图像降噪
02-27 计算机视觉 图像处理 高斯滤波
[自动] [BLOGS_PODCASTS]
2minmic 使用 Nano Banana 2 构建图像生成与编辑应用
02-27 Nano Banana 2 图像生成 图像编辑
[自动] [ARXIV]
5minschool 面向高效高分辨率GUI智能体的时空令牌剪枝
02-27 GUI Agent Token Pruning Qwen2-VL
[自动] [ARXIV]
4minschool 现成图像模型可攻破图像保护方案
02-27 图像保护 对抗攻击 Stable Diffusion
[自动] [HACKER_NEWS]
4minnewspaper 谷歌发布 Nano Banana 2 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [ARXIV]
4minschool 现成图生图模型可攻破主流图像保护方案
02-26 图像保护 对抗样本 图生图
[自动] [JUEJIN]
2minsticky_note_2 AI Agent接管手机:移动端观测技术与事件特征提取
02-26 AI Agent 移动端 UI 树解析
[自动] [HACKER_NEWS]
4minnewspaper 谷歌发布 Nano Banana 2 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [HACKER_NEWS]
5minnewspaper 谷歌发布 Nano Banana 2:最新 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [HACKER_NEWS]
5minnewspaper 谷歌发布 Nano Banana 2 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [HACKER_NEWS]
4minnewspaper 谷歌发布 Nano Banana 2:最新 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [JUEJIN]
2minsticky_note_2 空洞卷积原理:如何解决计算机视觉的精度与视野矛盾
02-26 空洞卷积 计算机视觉 深度学习
[自动] [JUEJIN]
2minsticky_note_2 AI视觉连载6:传统CV之高斯滤波原理与平滑效果
02-25 计算机视觉 传统CV 图像处理
[自动] [BLOGS_PODCASTS]
4minmic 基于AWS CDK集成Rekognition与Neptune构建智能照片搜索系统
02-25 AWS CDK Rekognition
[自动] [JUEJIN]
2minsticky_note_2 AI视觉连载6:传统CV之高斯滤波原理与应用
02-25 计算机视觉 图像处理 高斯滤波
[自动] [BLOGS_PODCASTS]
3minmic 基于 AWS CDK 集成 Rekognition 与 Neptune 的智能照片搜索系统
02-25 AWS CDK Rekognition
[自动] [BLOGS_PODCASTS]
3minmic 基于 AWS CDK 集成 Rekognition 与 Neptune 构建智能图片搜索系统
02-25 AWS CDK Rekognition
[自动] [ARXIV]
4minschool VAUQ:面向LVLM自评估的视觉感知不确定性量化
02-25 LVLM 多模态 不确定性量化
[自动] [BLOGS_PODCASTS]
4minmic Hexagon 利用 SageMaker HyperPod 加速分割模型预训练
02-24 AWS SageMaker HyperPod
[自动] [BLOGS_PODCASTS]
3minmic Hexagon 利用 SageMaker HyperPod 加速分割模型预训练
02-24 AWS SageMaker HyperPod
[自动] [ARXIV]
4minschool RetinaVision:基于XAI增强调控的深度学习视网膜疾病分类
02-24 计算机视觉 医疗AI 深度学习
[自动] [ARXIV]
4minschool A.R.I.S.:基于深度学习的电子废弃物自动分类系统
02-21 深度学习 计算机视觉 YOLOx
[自动] [ARXIV]
3minschool 以对象为中心的表征是否更利于组合泛化
02-20 组合泛化 对象中心 视觉表征
[自动] [ARXIV]
4minschool 以对象为中心的表征在组合泛化任务中的表现评估
02-19 组合泛化 以对象为中心 视觉问答
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-16 多模态 思维链 测试时扩展
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展
02-14 多模态 思维链 测试时扩展
[自动] [HACKER_NEWS]
5minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
7minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
6minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
6minnewspaper 神经渲染技术探索:从原理到应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [ARXIV]
4minschool 超越VLM奖励:扩散原生潜在奖励建模
02-12 扩散模型 DiNa-LRM 奖励建模
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊利用Nova模型自动化新履约中心运营就绪测试
02-12 Amazon Nova Amazon Bedrock 图像识别
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊利用Nova模型自动化新履约中心运营验收测试
02-12 Amazon Nova Amazon Bedrock 图像识别
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊利用 Nova 模型自动化检测新履约中心组件
02-12 Amazon Nova Amazon Bedrock 计算机视觉
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊利用 Nova 模型自动化新履约中心运营就绪测试
02-12 Amazon Nova Amazon Bedrock 图像识别
[自动] [JUEJIN]
3minsticky_note_2 AI视觉连载3:RGB图像模式与通道原理解析
02-12 计算机视觉 图像处理 RGB
[自动] [JUEJIN]
2minsticky_note_2 AI视觉连载3:RGB图像原理与通道详解
02-11 AI视觉 RGB 图像处理
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊利用Nova模型自动化新履约中心运营就绪测试
02-11 Amazon Nova Amazon Bedrock 图像识别
[自动] [ARXIV]
3minschool 鲁棒性是函数而非数值:基于视觉驾驶的OOD鲁棒性因子化研究
02-10 OOD鲁棒性 视觉驾驶 因子化
[自动] [HACKER_NEWS]
6minnewspaper Waymo 世界模型:利用生成式世界模型提升自动驾驶决策能力
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:利用生成式世界模拟提升自动驾驶决策
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:自动驾驶场景生成与预测架构
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:利用生成式视频预测驾驶场景
02-06 Waymo 世界模型 生成式视频
[自动] [HACKER_NEWS]
4minnewspaper Waymo世界模型:自动驾驶仿真的新前沿
02-06 Waymo 自动驾驶 世界模型
[自动] [HACKER_NEWS]
6minnewspaper Waymo世界模型:自动驾驶仿真的新前沿
02-06 Waymo 自动驾驶 世界模型
[自动] [BLOGS_PODCASTS]
2minmic 文生图模型训练设计:消融实验的经验总结
02-04 文生图 模型训练 消融实验
[自动] [ARXIV]
5minschool PixelGen:像素扩散结合感知损失超越潜在扩散
02-04 PixelGen 扩散模型 计算机视觉
[自动] [ARXIV]
4minschool PixelGen:引入感知损失的像素扩散模型性能超越潜在扩散
02-03 PixelGen 扩散模型 计算机视觉
[自动] [ARXIV]
3minschool HERMES:基于视觉语言模型的长尾自动驾驶端到端风险感知系统
02-03 自动驾驶 VLM 长尾场景
[自动] [ARXIV]
4minschool VideoGPA:提取几何先验实现三维一致性视频生成
02-03 VideoGPA 视频生成 3D一致性
[自动] [ARXIV]
5minschool VideoGPA:提取几何先验实现三维一致视频生成
02-02 视频生成 3D一致性 扩散模型
[自动] [ARXIV]
4minschool IRL-DAL:基于能量引导扩散模型的自动驾驶安全自适应轨迹规划
02-02 自动驾驶 扩散模型 逆向强化学习
[自动] [HACKER_NEWS]
3minnewspaper 自动驾驶与无人机易受路牌提示词攻击
02-01 提示词注入 对抗性攻击 自动驾驶
2026年一月 7 篇
类型阅读条目
[自动] [ARXIV]
3minschool 基于相机-IMU融合的鲁棒路面分类数据集与框架
01-29 计算机视觉 多模态融合 IMU
[自动] [ARXIV]
5minschool 🚀AnyView:动态场景任意新视角合成!开创性技术突破🔥
01-27 计算机视觉 视频生成 扩散模型
[自动] [ARXIV]
5minschool 🚀动态场景新视角合成!AnyView实现任意视角自由切换!🤯
01-26 动态场景 新视角合成 扩散模型
[自动] [HACKER_NEWS]
3minnewspaper macOS神器:含胸驼背?屏幕立刻模糊!强制你挺直腰杆!💻✨
01-26 macOS 健康 坐姿监测
[自动] [HACKER_NEWS]
3minnewspaper ⚠️一咬指甲就强制关机?这款桌面App太狠了!🖥️🚫
01-26 桌面应用 习惯矫正 生产力工具
[自动] [ARXIV]
6minschool 🤖抽屉打不开?揭秘零样本组合动作识别中的“物体捷径”!
01-25 计算机视觉 零样本学习 动作识别
[自动] [HACKER_NEWS]
3minnewspaper 🔥 视频修复难题:如何攻克时间一致性?
01-25 视频修复 时序一致性 光流