目录
计算机视觉
条目:65
2026年三月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
SeeThrough3D:文本生成图像中的遮挡感知三维控制 03-01
SeeThrough3D
文本生成图像
3D控制 |
2026年二月
57 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
SeeThrough3D:文本生成图像中的遮挡感知三维控制 02-28
SeeThrough3D
文本生成图像
3D控制 |
[自动]
[JUEJIN] | 2min | sticky_note_2
WiFi-DensePose项目利用AI分析信号实现无摄像头人体姿态感知 02-28
WiFi感知
姿态估计
DensePose |
[自动]
[BLOGS_PODCASTS] | 2min | mic
使用 Nano Banana 2 构建图像生成与编辑应用 02-27
Nano Banana 2
图像生成
图像编辑 |
[自动]
[ARXIV] | 5min | school
SeeThrough3D:文本生成图像中的遮挡感知三维控制 02-27
SeeThrough3D
文本生成图像
3D控制 |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI视觉实战:高斯滤波器原理可视化与图像降噪 02-27
计算机视觉
图像处理
高斯滤波 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
使用 Nano Banana 2 构建图像生成与编辑应用 02-27
Nano Banana 2
图像生成
图像编辑 |
[自动]
[ARXIV] | 5min | school
面向高效高分辨率GUI智能体的时空令牌剪枝 02-27
GUI Agent
Token Pruning
Qwen2-VL |
[自动]
[ARXIV] | 4min | school
现成图像模型可攻破图像保护方案 02-27
图像保护
对抗攻击
Stable Diffusion |
[自动]
[HACKER_NEWS] | 4min | newspaper
谷歌发布 Nano Banana 2 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[ARXIV] | 4min | school
现成图生图模型可攻破主流图像保护方案 02-26
图像保护
对抗样本
图生图 |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI Agent接管手机:移动端观测技术与事件特征提取 02-26
AI Agent
移动端
UI 树解析 |
[自动]
[HACKER_NEWS] | 4min | newspaper
谷歌发布 Nano Banana 2 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[HACKER_NEWS] | 5min | newspaper
谷歌发布 Nano Banana 2:最新 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[HACKER_NEWS] | 5min | newspaper
谷歌发布 Nano Banana 2 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[HACKER_NEWS] | 4min | newspaper
谷歌发布 Nano Banana 2:最新 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[JUEJIN] | 2min | sticky_note_2
空洞卷积原理:如何解决计算机视觉的精度与视野矛盾 02-26
空洞卷积
计算机视觉
深度学习 |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI视觉连载6:传统CV之高斯滤波原理与平滑效果 02-25
计算机视觉
传统CV
图像处理 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
基于AWS CDK集成Rekognition与Neptune构建智能照片搜索系统 02-25
AWS
CDK
Rekognition |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI视觉连载6:传统CV之高斯滤波原理与应用 02-25
计算机视觉
图像处理
高斯滤波 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
基于 AWS CDK 集成 Rekognition 与 Neptune 的智能照片搜索系统 02-25
AWS
CDK
Rekognition |
[自动]
[BLOGS_PODCASTS] | 3min | mic
基于 AWS CDK 集成 Rekognition 与 Neptune 构建智能图片搜索系统 02-25
AWS
CDK
Rekognition |
[自动]
[ARXIV] | 4min | school
VAUQ:面向LVLM自评估的视觉感知不确定性量化 02-25
LVLM
多模态
不确定性量化 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 02-24
AWS
SageMaker
HyperPod |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 02-24
AWS
SageMaker
HyperPod |
[自动]
[ARXIV] | 4min | school
RetinaVision:基于XAI增强调控的深度学习视网膜疾病分类 02-24
计算机视觉
医疗AI
深度学习 |
[自动]
[ARXIV] | 4min | school
A.R.I.S.:基于深度学习的电子废弃物自动分类系统 02-21
深度学习
计算机视觉
YOLOx |
[自动]
[ARXIV] | 3min | school
以对象为中心的表征是否更利于组合泛化 02-20
组合泛化
对象中心
视觉表征 |
[自动]
[ARXIV] | 4min | school
以对象为中心的表征在组合泛化任务中的表现评估 02-19
组合泛化
以对象为中心
视觉问答 |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展方法 02-16
多模态
思维链
测试时扩展 |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展 02-14
多模态
思维链
测试时扩展 |
[自动]
[HACKER_NEWS] | 5min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 7min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经渲染技术探索:从原理到应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[ARXIV] | 4min | school
超越VLM奖励:扩散原生潜在奖励建模 02-12
扩散模型
DiNa-LRM
奖励建模 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊利用Nova模型自动化新履约中心运营就绪测试 02-12
Amazon Nova
Amazon Bedrock
图像识别 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊利用Nova模型自动化新履约中心运营验收测试 02-12
Amazon Nova
Amazon Bedrock
图像识别 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊利用 Nova 模型自动化检测新履约中心组件 02-12
Amazon Nova
Amazon Bedrock
计算机视觉 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊利用 Nova 模型自动化新履约中心运营就绪测试 02-12
Amazon Nova
Amazon Bedrock
图像识别 |
[自动]
[JUEJIN] | 3min | sticky_note_2
AI视觉连载3:RGB图像模式与通道原理解析 02-12
计算机视觉
图像处理
RGB |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI视觉连载3:RGB图像原理与通道详解 02-11
AI视觉
RGB
图像处理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊利用Nova模型自动化新履约中心运营就绪测试 02-11
Amazon Nova
Amazon Bedrock
图像识别 |
[自动]
[ARXIV] | 3min | school
鲁棒性是函数而非数值:基于视觉驾驶的OOD鲁棒性因子化研究 02-10
OOD鲁棒性
视觉驾驶
因子化 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Waymo 世界模型:利用生成式世界模型提升自动驾驶决策能力 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:利用生成式世界模拟提升自动驾驶决策 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:自动驾驶场景生成与预测架构 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:利用生成式视频预测驾驶场景 02-06
Waymo
世界模型
生成式视频 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo世界模型:自动驾驶仿真的新前沿 02-06
Waymo
自动驾驶
世界模型 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Waymo世界模型:自动驾驶仿真的新前沿 02-06
Waymo
自动驾驶
世界模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文生图模型训练设计:消融实验的经验总结 02-04
文生图
模型训练
消融实验 |
[自动]
[ARXIV] | 5min | school
PixelGen:像素扩散结合感知损失超越潜在扩散 02-04
PixelGen
扩散模型
计算机视觉 |
[自动]
[ARXIV] | 4min | school
PixelGen:引入感知损失的像素扩散模型性能超越潜在扩散 02-03
PixelGen
扩散模型
计算机视觉 |
[自动]
[ARXIV] | 3min | school
HERMES:基于视觉语言模型的长尾自动驾驶端到端风险感知系统 02-03
自动驾驶
VLM
长尾场景 |
[自动]
[ARXIV] | 4min | school
VideoGPA:提取几何先验实现三维一致性视频生成 02-03
VideoGPA
视频生成
3D一致性 |
[自动]
[ARXIV] | 5min | school
VideoGPA:提取几何先验实现三维一致视频生成 02-02
视频生成
3D一致性
扩散模型 |
[自动]
[ARXIV] | 4min | school
IRL-DAL:基于能量引导扩散模型的自动驾驶安全自适应轨迹规划 02-02
自动驾驶
扩散模型
逆向强化学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
自动驾驶与无人机易受路牌提示词攻击 02-01
提示词注入
对抗性攻击
自动驾驶 |
2026年一月
7 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
基于相机-IMU融合的鲁棒路面分类数据集与框架 01-29
计算机视觉
多模态融合
IMU |
[自动]
[ARXIV] | 5min | school
🚀AnyView:动态场景任意新视角合成!开创性技术突破🔥 01-27
计算机视觉
视频生成
扩散模型 |
[自动]
[ARXIV] | 5min | school
🚀动态场景新视角合成!AnyView实现任意视角自由切换!🤯 01-26
动态场景
新视角合成
扩散模型 |
[自动]
[HACKER_NEWS] | 3min | newspaper
macOS神器:含胸驼背?屏幕立刻模糊!强制你挺直腰杆!💻✨ 01-26
macOS
健康
坐姿监测 |
[自动]
[HACKER_NEWS] | 3min | newspaper
⚠️一咬指甲就强制关机?这款桌面App太狠了!🖥️🚫 01-26
桌面应用
习惯矫正
生产力工具 |
[自动]
[ARXIV] | 6min | school
🤖抽屉打不开?揭秘零样本组合动作识别中的“物体捷径”! 01-25
计算机视觉
零样本学习
动作识别 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔥 视频修复难题:如何攻克时间一致性? 01-25
视频修复
时序一致性
光流 |
无匹配条目