数据

条目：254

2026年三月 2 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school 理解AI科研工具使用与交互的Asta数据集 03-01 Asta数据集 RAG 科研工具
[自动] [ARXIV]	3min	school 数据集压缩至1MB：小规模数据集的模型训练效果评估 03-01 数据集压缩 PLADA 数据蒸馏

2026年二月 191 篇

类型	阅读	条目
[自动] [HACKER_NEWS]	4min	newspaper 构建生产级最近邻系统的工程实践与经验总结 02-28 向量检索近似最近邻 ANN
[自动] [ARXIV]	4min	school 数据集压缩至1MB：模型训练效率优化方法 02-28 数据集蒸馏 PLADA 模型训练
[自动] [ARXIV]	4min	school Asta交互数据集：解析AI科研工具的使用模式与用户参与度 02-28 Asta数据集 AI科研工具用户行为分析
[自动] [JUEJIN]	2min	sticky_note_2 深度学习激活函数原理：非线性能力与模型性能解析 02-28 深度学习激活函数神经网络
[自动] [JUEJIN]	2min	sticky_note_2 深度学习激活函数原理与非线性机制解析 02-27 深度学习激活函数非线性
[自动] [ARXIV]	3min	school 数据集压缩至1MB：小规模数据集的模型训练效果评估 02-27 PLADA 数据集压缩伪标签
[自动] [ARXIV]	3min	school 基于超单纯形投影的可微零一损失函数 02-27 机器学习损失函数 0-1损失
[自动] [ARXIV]	4min	school 基于Asta数据集的AI科研工具使用与交互行为分析 02-27 Asta数据集 AI科研工具用户行为分析
[自动] [JUEJIN]	2min	sticky_note_2 AI视觉实战：高斯滤波器原理可视化与图像降噪 02-27 计算机视觉图像处理高斯滤波
[自动] [HACKER_NEWS]	5min	newspaper 利用大语言模型分析 TB 级 CI 日志数据 02-27 LLM CI/CD 日志分析
[自动] [HACKER_NEWS]	5min	newspaper 利用大语言模型分析 TB 级 CI 日志数据 02-27 LLM CI 日志分析
[自动] [BLOGS_PODCASTS]	2min	mic OpenAI 联合西北太平洋国家实验室推出 DraftNEPABench，加速联邦许可流程 02-27 OpenAI PNNL DraftNEPABench
[自动] [HACKER_NEWS]	4min	newspaper 利用大语言模型分析 TB 级 CI 日志数据 02-27 LLM CI 日志分析
[自动] [JUEJIN]	3min	sticky_note_2 阿里云 DataWorks 开源湖仓智能平台技术实践 02-27 DataWorks 湖仓一体 Data+AI
[自动] [ARXIV]	4min	school 利用大模型生成判断数据提升应用商店排序相关性 02-27 LLM 搜索相关性数据标注
[自动] [ARXIV]	4min	school 高效自动化翻译基准测试与数据集的流水线 02-26 LLM 多语言模型数据集
[自动] [BLOGS_PODCASTS]	3min	mic OpenAI 与西北太平洋国家实验室合作推出 DraftNEPABench 加速联邦许可流程 02-26 OpenAI AI 编程代理 DraftNEPABench
[自动] [BLOGS_PODCASTS]	2min	mic AI全息信息助力细胞生物学全景研究 02-26 细胞生物学 AI驱动全息信息
[自动] [BLOGS_PODCASTS]	2min	mic AI全局分析助力细胞生物学研究与实验规划 02-26 AI 细胞生物学实验规划
[自动] [BLOGS_PODCASTS]	2min	mic AI驱动方法助力细胞生物学全景分析与实验规划 02-26 AI for Science 细胞生物学实验规划
[自动] [BLOGS_PODCASTS]	2min	mic AI驱动方法助力细胞生物学全景解析与实验规划 02-26 AI for Science 细胞生物学系统生物学
[自动] [ARXIV]	5min	school 面向法语的ModernBERT多样性训练案例研究 02-26 ModernBERT 数据多样性预训练
[自动] [ARXIV]	3min	school 面向大模型终端能力扩展的数据工程研究 02-26 LLM 数据工程终端
[自动] [ARXIV]	4min	school 平滑无关学习统计查询复杂度下界 02-26 计算复杂度统计查询 SQ下界
[自动] [ARXIV]	5min	school 任意模态下的多向量索引压缩方法 02-26 多向量索引模态压缩 Late Interaction
[自动] [ARXIV]	3min	school 面向大模型终端能力扩展的数据工程研究 02-25 LLM 数据工程终端
[自动] [ARXIV]	4min	school 针对平滑对抗学习的统计查询下界研究 02-25 统计查询计算复杂性对抗学习
[自动] [ARXIV]	6min	school 多模态任意向量索引压缩技术 02-25 向量检索多模态索引压缩
[自动] [BLOGS_PODCASTS]	2min	mic AI驱动方法助力细胞生物学全景解析与实验规划 02-25 AI 细胞生物学多模态融合
[自动] [BLOGS_PODCASTS]	2min	mic Bedrock Robotics用视觉语言模型规模化标注物理AI训练数据 02-25 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	4min	mic Sonrai 联手 AWS 构建符合监管要求的 MLOps 框架加速精准医学试验 02-25 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics利用视觉-语言模型自动化标注施工视频数据 02-25 VLM 数据标注自动化
[自动] [BLOGS_PODCASTS]	4min	mic Sonrai 利用 SageMaker AI 构建合规 MLOps，加速精准医学试验 02-25 MLOps SageMaker AWS
[自动] [BLOGS_PODCASTS]	2min	mic Bedrock Robotics利用视觉-语言模型自动化标注施工视频数据 02-25 视觉语言模型数据标注自动化
[自动] [ARXIV]	3min	school 超越星级评分：基于LLM与文本分类的细粒度情感分析框架 02-25 LLM 情感分析 ABSA
[自动] [ARXIV]	3min	school 学术问答系统中大模型错误评估的专家框架 02-25 LLM 学术问答错误评估
[自动] [BLOGS_PODCASTS]	3min	mic Sonrai携手AWS SageMaker构建MLOps框架加速精准医学试验 02-25 MLOps AWS SageMaker
[自动] [ARXIV]	4min	school 面向大规模视频推理的综合基准测试套件 02-25 视频推理 VBVR 基准测试
[自动] [ARXIV]	4min	school 非单调损失函数的共形风险控制方法 02-25 非单调损失保序风险控制共形预测
[自动] [ARXIV]	4min	school KNIGHT：知识图谱驱动的多选题生成与自适应难度校准 02-25 LLM RAG 知识图谱
[自动] [ARXIV]	4min	school 面向大规模视频推理的综合基准测试套件 02-24 视频推理 VBVR 基准测试
[自动] [ARXIV]	4min	school 非单调损失函数的保形风险控制方法 02-24 保形预测风险控制非单调损失
[自动] [BLOGS_PODCASTS]	4min	mic Sonrai 利用 SageMaker AI 构建合规 MLOps 框架加速精准医学试验 02-24 MLOps SageMaker AWS
[自动] [ARXIV]	4min	school KNIGHT：知识图谱驱动的多选题生成与自适应难度校准 02-24 RAG 知识图谱 LLM
[自动] [BLOGS_PODCASTS]	2min	mic Bedrock Robotics利用视觉语言模型自动化标注物理AI训练数据 02-24 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	4min	mic SWE-bench Verified 数据泄露与缺陷分析：为何应转向 SWE-bench Pro 02-24 SWE-bench 数据泄露数据污染
[自动] [BLOGS_PODCASTS]	4min	mic Sonrai 联合 AWS SageMaker 构建 MLOps 框架，加速精准医学临床试验 02-24 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics利用视觉语言模型规模化标注数据赋能物理AI 02-24 VLM 物理AI 数据标注
[自动] [BLOGS_PODCASTS]	4min	mic Sonrai 联手 AWS 构建 MLOps 框架加速精准医学试验 02-24 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]	2min	mic Bedrock Robotics利用视觉语言模型自动化生成物理AI训练数据 02-24 VLM 视觉语言模型数据标注
[自动] [BLOGS_PODCASTS]	3min	mic SWE-bench Verified 数据污染与测度失准分析及替代方案 02-24 SWE-bench 数据污染代码生成
[自动] [BLOGS_PODCASTS]	3min	mic Sonrai利用SageMaker AI构建MLOps框架加速精准医学试验 02-24 MLOps SageMaker AWS
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics利用视觉语言模型规模化标注施工数据 02-24 VLM 视觉语言模型数据标注
[自动] [HACKER_NEWS]	4min	newspaper 53款模型“洗车”测试 02-24 模型评估基准测试 LLM
[自动] [ARXIV]	4min	school 部分软匹配距离：基于部分单元对应的神经表征比较 02-24 神经表征部分软匹配最优传输
[自动] [BLOGS_PODCASTS]	2min	mic SWE-bench Verified 存在数据污染与缺陷，建议迁移至 SWE-bench Pro 02-24 SWE-bench 数据污染基准测试
[自动] [BLOGS_PODCASTS]	4min	mic Sonrai利用Amazon SageMaker构建MLOps框架加速精准医学试验 02-24 MLOps Amazon SageMaker AWS
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock Robotics利用视觉-语言模型规模化标注物理AI训练数据 02-24 VLM 视觉语言模型数据标注
[自动] [ARXIV]	4min	school 基准测试图神经网络在解决难约束满足问题中的性能 02-24 GNN 图神经网络约束满足问题
[自动] [BLOGS_PODCASTS]	3min	mic SWE-bench Verified 数据泄露与测试缺陷分析：为何应迁移至 SWE-bench Pro 02-24 SWE-bench 数据泄露基准测试
[自动] [BLOGS_PODCASTS]	3min	mic Sonrai 利用 SageMaker AI 构建合规 MLOps 框架加速精准医学试验 02-24 MLOps SageMaker AWS
[自动] [ARXIV]	4min	school K-partition 集成方法：通过置信度分配提升模型性能 02-24 CAKE 聚类集成置信度评估
[自动] [BLOGS_PODCASTS]	3min	mic Bedrock与AWS合作：利用视觉-语言模型规模化生成物理AI训练数据 02-24 VLM 视觉语言模型数据标注
[自动] [ARXIV]	4min	school 为K分区集成模型分配置信度以提升预测性能 02-23 聚类分析集成学习置信度评估
[自动] [BLOGS_PODCASTS]	3min	mic SWE-bench Verified 数据泄漏与测试缺陷分析：为何推荐改用 SWE-bench Pro 02-23 SWE-bench 数据泄漏基准测试
[自动] [BLOGS_PODCASTS]	4min	mic Sonrai 联手 AWS 构建 MLOps 框架加速精准医学试验 02-23 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]	2min	mic SWE-bench Verified 数据污染严重，推荐使用 SWE-bench Pro 02-23 SWE-bench 数据污染基准测试
[自动] [BLOGS_PODCASTS]	4min	mic Sonrai 利用 SageMaker AI 构建合规 MLOps 框架，加速精准医疗临床试验 02-23 MLOps SageMaker AWS
[自动] [BLOGS_PODCASTS]	2min	mic 合成人设技术突破数据瓶颈，加速日本AI开发 02-23 合成数据数据瓶颈日本AI
[自动] [ARXIV]	4min	school 基于Tokenizer的文本语言识别方法研究 02-23 UniLID 语言识别 Tokenizer
[自动] [ARXIV]	4min	school Mine and Refine：优化电商搜索检索的分级相关性 02-23 电商搜索信息检索双塔模型
[自动] [ARXIV]	4min	school FAMOSE：基于ReAct范式的自动化特征发现方法 02-23 特征工程 ReAct 自动化特征发现
[自动] [BLOGS_PODCASTS]	2min	mic 利用合成人设突破数据瓶颈，加速日本AI开发 02-22 合成数据人设生成数据增强
[自动] [ARXIV]	4min	school 基于分词器的未知语言识别方法 02-22 UniLID 语言识别分词器
[自动] [ARXIV]	4min	school Mine and Refine：优化电商搜索检索中的分级相关性 02-22 电商搜索信息检索文本嵌入
[自动] [ARXIV]	4min	school FAMOSE：基于 ReAct 框架的自动化特征发现方法 02-22 特征工程自动化特征发现 ReAct
[自动] [BLOGS_PODCASTS]	2min	mic 合成人设技术突破数据瓶颈，加速日本AI开发 02-21 合成数据数据增强 LLM
[自动] [ARXIV]	3min	school Mine and Refine：优化电商搜索检索中的分级相关性 02-21 电商搜索信息检索相关性排序
[自动] [ARXIV]	5min	school FAMOSE：基于 ReAct 范式的自动化特征发现方法 02-21 特征工程 ReAct 自动化
[自动] [BLOGS_PODCASTS]	2min	mic 合成人设技术突破数据瓶颈，加速日本AI开发 02-21 合成数据数据增强 Persona
[自动] [ARXIV]	4min	school 基于分词器的语言识别方法研究 02-20 UniLID 语言识别 LID
[自动] [BLOGS_PODCASTS]	1min	mic 合成人设技术突破数据瓶颈，加速日本AI开发 02-20 合成数据数据瓶颈日本AI
[自动] [ARXIV]	4min	school Mine and Refine：优化电商搜索检索中的分级相关性 02-20 电商搜索检索优化相关性排序
[自动] [ARXIV]	5min	school FAMOSE：基于 ReAct 范式的自动化特征发现方法 02-20 FAMOSE 特征工程自动化特征发现
[自动] [BLOGS_PODCASTS]	2min	mic 合成人设技术突破数据瓶颈，加速日本AI开发 02-20 合成数据数据增强日本AI
[自动] [BLOGS_PODCASTS]	2min	mic 合成人设技术突破数据瓶颈，加速日本AI开发 02-20 合成数据数据瓶颈日本AI
[自动] [BLOGS_PODCASTS]	2min	mic 合成人设技术突破数据瓶颈，加速日本AI开发 02-20 合成数据数据增强 LLM
[自动] [ARXIV]	4min	school 知识嵌入潜在投影提升鲁棒表征学习 02-20 表征学习数据不平衡 EHR
[自动] [ARXIV]	4min	school 知识嵌入隐投影用于鲁棒表征学习 02-19 表征学习 EHR 数据不平衡
[自动] [BLOGS_PODCASTS]	2min	mic 合成人设技术突破数据瓶颈，加速日本AI开发 02-19 合成数据数据瓶颈日本AI
[自动] [HACKER_NEWS]	5min	newspaper 面向分析师的Python大语言模型实战指南 02-19 Python LLM 数据分析
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic 公布 METR 数据评估 Agent 自主能力 02-19 Anthropic METR Agent
[自动] [HACKER_NEWS]	4min	newspaper 面向分析师的Python大语言模型实战指南 02-19 Python LLM 数据分析
[自动] [BLOGS_PODCASTS]	2min	mic 合成人设技术突破数据瓶颈，加速日本AI开发 02-19 合成数据数据瓶颈日本AI
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic 发布 METR 数据集研究 AI Agent 自主性 02-19 Anthropic METR AI Agent
[自动] [ARXIV]	4min	school 用模拟数据开发AI智能体的原理与方法 02-19 AI智能体合成数据数据模拟
[自动] [ARXIV]	3min	school 胸部X光分类的任务无关持续学习方法 02-18 持续学习胸部X光医学影像
[自动] [ARXIV]	4min	school 基于模拟数据开发AI智能体的原理与方法 02-18 AI智能体合成数据模拟技术
[自动] [ARXIV]	3min	school 基于D最优统计的高维仿真代理测试时适应稳定化方法 02-18 TTA 仿真代理分布偏移
[自动] [HACKER_NEWS]	4min	newspaper LLM 数据集构建与模型训练优化指南 02-18 LLM 数据集构建模型训练
[自动] [HACKER_NEWS]	4min	newspaper LLM 模型应关注的数据处理与优化策略 02-18 LLM 数据处理模型优化
[自动] [HACKER_NEWS]	4min	newspaper 数学、计算机与人工智能综合资源合集 02-17 资源合集数学基础计算机科学
[自动] [HACKER_NEWS]	4min	newspaper 数学、计算机科学与人工智能综合资源指南 02-16 资源指南数学计算机科学
[自动] [HACKER_NEWS]	3min	newspaper AI致需求激增，西部数据称本年度机械硬盘已售罄 02-16 西部数据机械硬盘 HDD
[自动] [HACKER_NEWS]	4min	newspaper Zvec：轻量级进程内向量数据库 02-15 Zvec 向量数据库轻量级
[自动] [HACKER_NEWS]	5min	newspaper Zvec：轻量级进程内向量数据库 02-15 向量数据库 Zvec 轻量级
[自动] [HACKER_NEWS]	6min	newspaper Zvec：轻量级进程内向量数据库 02-15 向量数据库 Zvec 轻量级
[自动] [HACKER_NEWS]	4min	newspaper Zvec：轻量级进程内向量数据库 02-15 向量数据库 Zvec 轻量级
[自动] [HACKER_NEWS]	5min	newspaper Zvec：轻量级进程内向量数据库 02-15 向量数据库 Zvec 轻量级
[自动] [HACKER_NEWS]	5min	newspaper Zvec：轻量级进程内向量数据库 02-15 向量数据库 Zvec 轻量级
[自动] [HACKER_NEWS]	4min	newspaper 仅头文件的 C 语言向量数据库库 02-14 C语言向量数据库头文件库
[自动] [HACKER_NEWS]	5min	newspaper Zvec：轻量级进程内向量数据库，速度快 02-14 Zvec 向量数据库轻量级
[自动] [HACKER_NEWS]	5min	newspaper 仅头文件的 C 语言向量数据库库 02-14 C语言向量数据库 Header-only
[自动] [BLOGS_PODCASTS]	3min	mic AI与模拟加速科学发现：Rafael Gómez-Bombarelli谈技术转折点 02-13 AI for Science 科学发现模拟技术
[自动] [BLOGS_PODCASTS]	2min	mic AI与模拟加速科学发现：拉斐尔·戈麦斯-巴雷利谈技术拐点 02-13 科学发现 AI模拟科学计算
[自动] [BLOGS_PODCASTS]	2min	mic AI 与模拟加速科学发现：Rafael Gómez-Bombarelli 谈技术拐点 02-13 AI for Science 科学发现机器学习
[自动] [BLOGS_PODCASTS]	2min	mic Rafael Gómez-Bombarelli：AI与模拟加速科学发现 02-13 科学发现 AI模拟材料科学
[自动] [BLOGS_PODCASTS]	2min	mic Boltz开源AlphaFold传承工具赋能分子发现 02-13 Boltz AlphaFold 分子发现
[自动] [BLOGS_PODCASTS]	3min	mic AI与仿真加速科学发现的转折点 02-13 科学发现 AI for Science 仿真模拟
[自动] [ARXIV]	4min	school KAN-FIF：基于样条参数化的轻量级气象卫星热带气旋估算模型 02-13 KAN 气象预测热带气旋
[自动] [BLOGS_PODCASTS]	3min	mic AI与模拟加速科学发现：Rafael Gómez-Bombarelli谈技术拐点 02-12 科学发现生成式AI 模拟技术
[自动] [BLOGS_PODCASTS]	3min	mic AI与模拟技术加速科学发现的拐点已至 02-12 科学发现生成式AI 模拟技术
[自动] [BLOGS_PODCASTS]	2min	mic AI与仿真加速科学发现：Rafael Gómez-Bombarelli谈技术拐点 02-12 科学发现 AI模拟材料设计
[自动] [JUEJIN]	3min	sticky_note_2 AI视觉连载3：RGB图像模式与通道原理解析 02-12 计算机视觉图像处理 RGB
[自动] [JUEJIN]	2min	sticky_note_2 AI视觉连载3：RGB图像原理与通道详解 02-11 AI视觉 RGB 图像处理
[自动] [ARXIV]	3min	school Data Science and Technology Towards AGI Part I: Tiered 02-11 AGI 数据管理分层架构
[自动] [ARXIV]	2min	school 面向AGI的数据科学与技术：分层数据管理 02-10 AGI LLM 数据管理
[自动] [HACKER_NEWS]	7min	newspaper YC孵化Livedocs：面向数据分析的AI原生笔记本 02-10 Livedocs Y Combinator 数据分析
[自动] [HACKER_NEWS]	4min	newspaper Livedocs：面向数据分析的AI原生笔记本 02-10 Livedocs AI原生数据分析
[自动] [ARXIV]	3min	school Harpoon：面向条件表格扩散模型的广义流形引导 02-10 扩散模型表格数据流形引导
[自动] [ARXIV]	4min	school 基于熵排序流的非监督解耦表示学习模型 02-09 无监督学习解耦表示 EOFlows
[自动] [ARXIV]	3min	school 土耳其语子词策略大规模评估：数据、词表与形态交互 02-09 Subword Tokenization 土耳其语
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-09 GPT-5 OpenAI 云自动化
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5结合自动化实验室将无细胞蛋白合成成本降低40% 02-09 GPT-5 生物技术自动化实验室
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-08 GPT-5 OpenAI 生物科技
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-08 GPT-5 OpenAI 云自动化
[自动] [HACKER_NEWS]	5min	newspaper 微调Qwen2.5-7B模型基于百部电影构建概率故事图 02-08 Qwen2.5 微调故事图
[自动] [HACKER_NEWS]	4min	newspaper 基于百部电影微调的 Qwen2.5-7B 概率故事图模型 02-08 Qwen2.5 微调故事图
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5结合云自动化将无细胞蛋白质合成成本降低40% 02-07 GPT-5 OpenAI 生物科技
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5结合云端自动化将无细胞蛋白合成成本降低40% 02-07 GPT-5 合成生物学自动化
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理可视化解析 02-06 神经网络可视化深度学习
[自动] [HACKER_NEWS]	4min	newspaper BioTradingArena：预测生物科技股走势的LLM基准 02-06 LLM 基准测试金融预测
[自动] [HACKER_NEWS]	4min	newspaper BioTradingArena：用于评估LLM预测生物科技股票走势的基准 02-06 LLM 基准测试金融预测
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理可视化解析 02-06 神经网络可视化深度学习
[自动] [GITHUB_TRENDING]	11min	hub 动手学深度学习：面向中文读者的可运行教材 02-06 深度学习 D2L PyTorch
[自动] [ARXIV]	4min	school 数据块模型中的精确恢复方法 02-06 社区检测随机块模型数据块模型
[自动] [ARXIV]	4min	school Wedge Sampling：实现近线性样本复杂度的张量补全算法 02-06 张量补全楔形采样低秩张量
[自动] [BLOGS_PODCASTS]	2min	mic Nemotron ColEmbed V2：基于ViDoRe V3的多模态检索性能提升 02-06 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]	3min	mic GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-06 GPT-5 云自动化蛋白合成
[自动] [ARXIV]	3min	school 数据中的阈下效应：基于对数线性性的通用机制 02-06 LLM 数据质量 Logit-Linear-Selection
[自动] [ARXIV]	3min	school 数据中的阈下效应：一种基于对数线性性的通用机制 02-05 LLM 数据质量 Logit-Linear-Selection
[自动] [BLOGS_PODCASTS]	3min	mic Nemotron ColEmbed V2：基于ViDoRe V3的多模态检索模型 02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-05 GPT-5 OpenAI 云自动化
[自动] [BLOGS_PODCASTS]	3min	mic Nemotron ColEmbed V2：基于ViDoRe V3的多模态检索模型 02-05 多模态检索 Nemotron
[自动] [BLOGS_PODCASTS]	3min	mic Nemotron ColEmbed V2：基于ViDoRe V3的多模态检索模型 02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]	3min	mic Nemotron ColEmbed V2：基于ViDoRe V3的多模态检索模型 02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]	4min	mic Nemotron ColEmbed V2：基于ViDoRe V3的多模态检索模型 02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]	3min	mic Nemotron ColEmbed V2：基于ViDoRe V3的多模态检索性能优化 02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]	3min	mic Nemotron ColEmbed V2：基于ViDoRe V3的多模态检索模型 02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]	3min	mic Snowflake与OpenAI达成2亿美元协议，将前沿AI引入企业数据 02-05 Snowflake OpenAI 企业级
[自动] [BLOGS_PODCASTS]	2min	mic Nemotron ColEmbed V2：基于ViDoRe V3的多模态检索模型 02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]	3min	mic Snowflake与OpenAI合作：在数据平台内直接部署AI智能体 02-04 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]	3min	mic Nemotron ColEmbed V2：基于ViDoRe V3的多模态检索模型 02-04 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]	4min	mic Snowflake与OpenAI达成2亿美元协议引入企业级AI智能体 02-04 OpenAI Snowflake AI Agents
[自动] [BLOGS_PODCASTS]	4min	mic Snowflake与OpenAI合作：2亿美元协议引入企业级AI智能体 02-04 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]	3min	mic Snowflake与OpenAI合作：在企业数据中直接部署AI智能体 02-04 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]	4min	mic Snowflake与OpenAI合作：在数据平台内集成前沿AI模型 02-04 Snowflake OpenAI 企业级AI
[自动] [BLOGS_PODCASTS]	2min	mic Snowflake与OpenAI达成2亿美元协议，在数据平台内集成AI智能体 02-03 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]	3min	mic Snowflake与OpenAI合作：在企业数据中直接实现AI智能体与洞察 02-03 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]	2min	mic Snowflake与OpenAI合作：2亿美元协议将AI智能体引入企业数据 02-03 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]	4min	mic OpenAI内部数据代理：结合GPT-5与记忆机制快速分析海量数据 02-03 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]	3min	mic Snowflake与OpenAI达成2亿美元协议引入前沿智能 02-03 Snowflake OpenAI 企业数据
[自动] [BLOGS_PODCASTS]	2min	mic OpenAI 内部数据代理：结合 GPT‑5 与记忆能力实现数据推理 02-03 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]	2min	mic Snowflake与OpenAI达成2亿美元合作，将前沿智能引入企业数据 02-03 OpenAI Snowflake 企业级AI
[自动] [BLOGS_PODCASTS]	2min	mic OpenAI内部数据代理：结合GPT‑5与记忆能力实现分钟级洞察 02-03 OpenAI GPT-5 数据代理
[自动] [BLOGS_PODCASTS]	4min	mic Snowflake与OpenAI达成2亿美元合作，将前沿智能引入企业数据 02-03 OpenAI Snowflake 企业级AI
[自动] [BLOGS_PODCASTS]	3min	mic OpenAI 内部数据代理：利用 GPT-5 与记忆快速分析海量数据 02-03 OpenAI GPT-5 数据代理
[自动] [ARXIV]	4min	school 基于预测集的最优决策方法 02-03 预测集最优决策决策理论
[自动] [ARXIV]	4min	school 可扩展随机小波特征：带收敛保证的高效非平稳核近似 02-03 机器学习非平稳核小波变换
[自动] [ARXIV]	4min	school IRL-DAL：基于能量引导扩散模型的安全自适应自动驾驶轨迹规划 02-03 扩散模型自动驾驶轨迹规划
[自动] [BLOGS_PODCASTS]	4min	mic Snowflake与OpenAI合作：在数据平台内直接集成前沿AI模型 02-02 Snowflake OpenAI 企业级
[自动] [BLOGS_PODCASTS]	2min	mic OpenAI 内部数据代理：利用 GPT-5 与记忆能力快速分析大规模数据集 02-02 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]	3min	mic Snowflake与OpenAI合作2亿美元，在企业数据中直接启用AI智能体 02-02 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]	2min	mic OpenAI 内部数据智能体：结合 GPT-5 与记忆快速分析海量数据 02-02 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]	3min	mic OpenAI 内部数据智能体：结合 GPT‑5 与记忆快速分析海量数据集 02-02 OpenAI GPT-5 Codex
[自动] [ARXIV]	3min	school 发现模型仓库中的隐藏价值 02-02 模型评估 Llama-3.1 多臂老虎机
[自动] [ARXIV]	4min	school FineInstructions：将合成指令数据扩展至预训练规模 02-02 LLM 指令微调合成数据
[自动] [ARXIV]	3min	school 挖掘模型仓库中的隐藏价值 02-01 模型评估 Llama 微调
[自动] [BLOGS_PODCASTS]	2min	mic OpenAI 内部数据代理：结合 GPT-5 与记忆实现海量数据推理 02-01 OpenAI GPT-5 数据代理
[自动] [ARXIV]	4min	school FineInstructions：将合成指令扩展至预训练规模 02-01 FineInstructions 合成数据指令微调
[自动] [BLOGS_PODCASTS]	2min	mic OpenAI内部数据代理：结合GPT-5与记忆机制快速分析大规模数据集 02-01 OpenAI GPT-5 数据代理

2026年一月 61 篇

类型	阅读	条目
[自动] [BLOGS_PODCASTS]	3min	mic OpenAI内部数据代理：结合GPT-5与记忆快速分析数据 01-31 OpenAI 数据代理 GPT-5
[自动] [ARXIV]	3min	school FineInstructions：将合成指令数据扩展至预训练规模 01-31 LLM 指令微调合成数据
[自动] [HACKER_NEWS]	4min	newspaper Pinecone Explorer：Pinecone 向量数据库桌面 GUI 01-31 Pinecone 向量数据库 GUI
[自动] [BLOGS_PODCASTS]	3min	mic OpenAI 内部数据代理：结合 GPT‑5 与记忆机制实现分钟级数据洞察 01-30 OpenAI GPT-5 数据代理
[自动] [BLOGS_PODCASTS]	2min	mic OpenAI 内部数据代理：结合 GPT-5 与记忆机制实现分钟级数据洞察 01-30 OpenAI GPT-5 数据智能体
[自动] [ARXIV]	4min	school 面向文本检索器域适应的影响引导采样方法 01-30 文本检索域适应密集检索
[自动] [ARXIV]	4min	school 探索Transformer在表格数据变分自编码器中的位置 01-30 Transformer VAE 表格数据
[自动] [ARXIV]	4min	school 后训练公平性控制：推荐系统动态公平性单训练框架 01-30 推荐系统公平性 Cofair
[自动] [ARXIV]	4min	school R^{2k}维度理论上足以支持基于嵌入的Top-k检索 01-30 向量检索嵌入维度 Top-k检索
[自动] [ARXIV]	4min	school 探索Transformer在表格数据变分自编码器中的位置 01-29 Transformer VAE 表格数据
[自动] [ARXIV]	3min	school 基于嵌入的Top-$k$检索：理论上$\mathbb{R}^{2k}$维空间已足够 01-29 向量检索嵌入 Top-k
[自动] [ARXIV]	4min	school 后训练公平性控制：推荐系统动态公平性单训练框架 01-29 推荐系统公平性 Cofair
[自动] [BLOGS_PODCASTS]	3min	mic OpenAI内部数据代理：结合GPT‑5与记忆快速分析海量数据 01-29 OpenAI GPT-5 Codex
[自动] [HACKER_NEWS]	5min	newspaper OpenAI内部数据智能体：自动化分析SQL数据库 01-29 OpenAI Data Agent SQL
[自动] [HACKER_NEWS]	6min	newspaper ShapedQL：支持多阶段排序与RAG的SQL引擎 01-29 ShapedQL SQL引擎 RAG
[自动] [HACKER_NEWS]	5min	newspaper ShapedQL：支持多阶段排序与 RAG 的 SQL 引擎 01-29 SQL RAG 向量检索
[自动] [BLOGS_PODCASTS]	2min	mic Nemotron-Personas-Brazil：主权AI协同设计数据集 01-29 主权AI 数据集 Nemotron
[自动] [HACKER_NEWS]	7min	newspaper ShapedQL：支持多阶段排序与RAG的SQL引擎 01-29 ShapedQL SQL引擎 RAG
[自动] [ARXIV]	3min	school 基于相机-IMU融合的鲁棒路面分类数据集与框架 01-29 计算机视觉多模态融合 IMU
[自动] [HACKER_NEWS]	5min	newspaper Bf-Tree：面向大规模数据的读写优化并发范围索引 01-29 Bf-Tree B-Tree 数据库索引
[自动] [BLOGS_PODCASTS]	3min	mic Nemotron-Personas-Brazil：主权AI协作设计数据集 01-29 主权AI Nemotron 葡萄牙语
[自动] [HACKER_NEWS]	8min	newspaper Bf-Tree：面向大规模数据的读写优化并发范围索引 01-29 Bf-Tree 数据库索引 B+树
[自动] [ARXIV]	4min	school 🧠RHSIA！非理想颅内动脉瘤实时血流替代技术，精准高效！ 01-28 RHSIA 血流动力学颅内动脉瘤
[自动] [ARXIV]	4min	school 🔥动态环境下的对抗约束：Bandits算法如何应对未知挑战？ 01-28 Bandits 对抗约束动态环境
[自动] [ARXIV]	5min	school 🌍 M-SGWR: 多尺度相似+地理加权回归！空间建模神器🚀 01-28 M-SGWR 地理加权回归空间建模
[自动] [BLOGS_PODCASTS]	3min	mic 🇧🇷主权AI新突破！Nemotron-Personas-Brazil：共创数据引领未来 01-28 主权AI Nemotron NVIDIA
[自动] [HACKER_NEWS]	3min	newspaper 箭头→查询！类别转换黑科技，AI新范式？🚀 01-28 范畴论查询优化数据库设计
[自动] [ARXIV]	4min	school MEG情绪分析新突破！🔬脑数据标注+情感计算，解锁大脑密码！🧠✨ 01-28 MEG 情绪分析脑机接口
[自动] [ARXIV]	5min	school 🚀ctELM：用ELM解码临床试验嵌入！精准操控💡 01-28 ctELM 临床试验嵌入空间
[自动] [ARXIV]	5min	school 💥无需标注！基于核变化点检测的无监督文本分割！ 01-28 文本分割无监督学习核方法
[自动] [ARXIV]	4min	school 🌍 242种语言大比拼！Wikipedia数据揭秘跨语言比较语言学新突破！ 01-28 比较语言学 BPE 多语言
[自动] [GITHUB_TRENDING]	10min	hub GitHub爆款：B站API最全收录！🚀开箱即用！ 01-27 Bilibili API文档逆向工程
[自动] [ARXIV]	5min	school 🔥无需标注！核变点检测+句嵌入实现超强文本分割🚀 01-27 文本分割无监督学习句嵌入
[自动] [HACKER_NEWS]	3min	newspaper 🔥Prism：颠覆性工具！让你的数据可视化效率飙升！✨ 01-27 数据可视化 Prism 效率工具
[自动] [ARXIV]	4min	school 🔍脑电+情感=超强分析！MEG数据解锁情绪新维度 01-27 MEG 情感分析脑机接口
[自动] [ARXIV]	4min	school 🌍 跨242种语言！用子词模型解锁比较语言学新视角！ 01-27 比较语言学子词模型 BPE
[自动] [BLOGS_PODCASTS]	4min	mic 🔥支撑8亿用户！PostgreSQL如何驱动ChatGPT爆发式增长？🚀 01-27 PostgreSQL 数据库扩展高并发
[自动] [HACKER_NEWS]	3min	newspaper 用ChatGPT分析10年Apple Watch数据后，我立刻给医生打了电话！😨 01-27 ChatGPT Apple Watch 健康数据分析
[自动] [HACKER_NEWS]	2min	newspaper 数学、物理、生物的万能模式！🧪🧬2013年震撼发现 01-27 本福德定律统计学幂律分布
[自动] [GITHUB_TRENDING]	10min	hub 🔥A股数据神器！mootdx：Python量化交易/金融数据爬取必备！🚀 01-27 Python 量化交易金融数据
[自动] [HACKER_NEWS]	2min	newspaper 🔥 跨越数理化生！这个万能模式正在颠覆科学界！🤯 01-27 Scaling Laws 异速生长复杂系统
[自动] [BLOGS_PODCASTS]	4min	mic ⚡️支撑8亿用户！揭秘ChatGPT背后的PostgreSQL极致扩展架构 01-27 PostgreSQL 数据库扩展读写分离
[自动] [HACKER_NEWS]	3min	newspaper 我把10年Apple Watch数据扔给ChatGPT，结果惊出一身冷汗！😱🩺 01-27 ChatGPT 数据分析健康数据
[自动] [BLOGS_PODCASTS]	4min	mic 🚀支撑8亿ChatGPT用户！PostgreSQL极致扩容实录🔥 01-27 PostgreSQL OpenAI 数据库扩容
[自动] [HACKER_NEWS]	3min	newspaper 🚀告别噪点！有序抖动算法：让像素画面更清晰的魔法✨ 01-27 图像处理抖动算法像素画
[自动] [ARXIV]	5min	school 🚗AgentDrive重磅发布！首个Agent推理开源自驾数据集🔥 01-27 AgentDrive 自动驾驶 Agent AI
[自动] [ARXIV]	5min	school 🚀BONO-Bench：可追溯Pareto集的双目标优化基准测试！ 01-27 多目标优化基准测试 Pareto集
[自动] [HACKER_NEWS]	4min	newspaper 🔥告别杂点！有序抖动算法揭秘：让像素更清晰！ 01-27 计算机图形学图像处理抖动算法
[自动] [HACKER_NEWS]	2min	newspaper 🤔不是所有Chess960局面都一样难？揭秘深藏的复杂性差异！ 01-27 Chess960 国际象棋复杂性分析
[自动] [HACKER_NEWS]	4min	newspaper MapLibre Tile：现代高效矢量切片格式！🚀 01-27 MapLibre 矢量切片 FlatBuffers
[自动] [BLOGS_PODCASTS]	4min	mic 🚀 单库支撑8亿用户！PostgreSQL如何为ChatGPT提供核动力？ 01-27 PostgreSQL 数据库扩展高并发
[自动] [HACKER_NEWS]	5min	newspaper 🔥Postgres最强搜索！模糊+语义，精准匹配Abbey Road！🚀 01-27 Postgres pg_trgm pgvector
[自动] [HACKER_NEWS]	3min	newspaper 🧠并非所有Chess960局面都同样复杂！揭秘棋局难度的隐藏差异？ 01-26 Chess960 菲舍尔任意制象棋棋局复杂度
[自动] [HACKER_NEWS]	4min	newspaper Postgres模糊/语义搜索：输入'Beatles abbey rd'精准定位Abbey Road！🚀 01-26 Postgres 模糊搜索语义搜索
[自动] [ARXIV]	5min	school AgentDrive：首个开放基准！🚗 LLM生成场景驱动Agent智能推理 01-26 AgentDrive 自动驾驶基准测试
[自动] [GITHUB_TRENDING]	10min	hub 🚀Mootdx：Python金融数据神器！行情/财报/选股一站式搞定！💰 01-26 Python 金融数据通达信
[自动] [HACKER_NEWS]	4min	newspaper 🚀 现代化矢量瓦片格式！MapLibre Tile：效率革命来袭！ 01-26 MapLibre 矢量瓦片地图渲染
[自动] [ARXIV]	6min	school 🔥BONO-Bench震撼发布！首套可追溯Pareto集的双目标优化基准测试！ 01-26 BONO-Bench 双目标优化 Pareto集
[自动] [HACKER_NEWS]	2min	newspaper 🧠科学家发现定义“自我”的脑波！揭秘意识的边界✨ 01-26 脑科学 Alpha波意识
[自动] [ARXIV]	4min	school 多舱+多时间窗！🚛⏰ 滚动空间分支定价算法惊艳求解VRP难题！ 01-25 VRP 多舱车辆路径时间窗
[自动] [BLOGS_PODCASTS]	4min	mic 🚀 PostgreSQL如何支撑8亿ChatGPT用户？架构解密！ 01-25 PostgreSQL OpenAI ChatGPT