terminal

AI Stack

rss_feed
SYS_STABLE
目录

数据

条目:254
2026年三月 2 篇
类型阅读条目
[自动] [ARXIV]
4minschool 理解AI科研工具使用与交互的Asta数据集
03-01 Asta数据集 RAG 科研工具
[自动] [ARXIV]
3minschool 数据集压缩至1MB:小规模数据集的模型训练效果评估
03-01 数据集压缩 PLADA 数据蒸馏
2026年二月 191 篇
类型阅读条目
[自动] [HACKER_NEWS]
4minnewspaper 构建生产级最近邻系统的工程实践与经验总结
02-28 向量检索 近似最近邻 ANN
[自动] [ARXIV]
4minschool 数据集压缩至1MB:模型训练效率优化方法
02-28 数据集蒸馏 PLADA 模型训练
[自动] [ARXIV]
4minschool Asta交互数据集:解析AI科研工具的使用模式与用户参与度
02-28 Asta数据集 AI科研工具 用户行为分析
[自动] [JUEJIN]
2minsticky_note_2 深度学习激活函数原理:非线性能力与模型性能解析
02-28 深度学习 激活函数 神经网络
[自动] [JUEJIN]
2minsticky_note_2 深度学习激活函数原理与非线性机制解析
02-27 深度学习 激活函数 非线性
[自动] [ARXIV]
3minschool 数据集压缩至1MB:小规模数据集的模型训练效果评估
02-27 PLADA 数据集压缩 伪标签
[自动] [ARXIV]
3minschool 基于超单纯形投影的可微零一损失函数
02-27 机器学习 损失函数 0-1损失
[自动] [ARXIV]
4minschool 基于Asta数据集的AI科研工具使用与交互行为分析
02-27 Asta数据集 AI科研工具 用户行为分析
[自动] [JUEJIN]
2minsticky_note_2 AI视觉实战:高斯滤波器原理可视化与图像降噪
02-27 计算机视觉 图像处理 高斯滤波
[自动] [HACKER_NEWS]
5minnewspaper 利用大语言模型分析 TB 级 CI 日志数据
02-27 LLM CI/CD 日志分析
[自动] [HACKER_NEWS]
5minnewspaper 利用大语言模型分析 TB 级 CI 日志数据
02-27 LLM CI 日志分析
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 联合西北太平洋国家实验室推出 DraftNEPABench,加速联邦许可流程
02-27 OpenAI PNNL DraftNEPABench
[自动] [HACKER_NEWS]
4minnewspaper 利用大语言模型分析 TB 级 CI 日志数据
02-27 LLM CI 日志分析
[自动] [JUEJIN]
3minsticky_note_2 阿里云 DataWorks 开源湖仓智能平台技术实践
02-27 DataWorks 湖仓一体 Data+AI
[自动] [ARXIV]
4minschool 利用大模型生成判断数据提升应用商店排序相关性
02-27 LLM 搜索相关性 数据标注
[自动] [ARXIV]
4minschool 高效自动化翻译基准测试与数据集的流水线
02-26 LLM 多语言模型 数据集
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 与西北太平洋国家实验室合作推出 DraftNEPABench 加速联邦许可流程
02-26 OpenAI AI 编程代理 DraftNEPABench
[自动] [BLOGS_PODCASTS]
2minmic AI全息信息助力细胞生物学全景研究
02-26 细胞生物学 AI驱动 全息信息
[自动] [BLOGS_PODCASTS]
2minmic AI全局分析助力细胞生物学研究与实验规划
02-26 AI 细胞生物学 实验规划
[自动] [BLOGS_PODCASTS]
2minmic AI驱动方法助力细胞生物学全景分析与实验规划
02-26 AI for Science 细胞生物学 实验规划
[自动] [BLOGS_PODCASTS]
2minmic AI驱动方法助力细胞生物学全景解析与实验规划
02-26 AI for Science 细胞生物学 系统生物学
[自动] [ARXIV]
5minschool 面向法语的ModernBERT多样性训练案例研究
02-26 ModernBERT 数据多样性 预训练
[自动] [ARXIV]
3minschool 面向大模型终端能力扩展的数据工程研究
02-26 LLM 数据工程 终端
[自动] [ARXIV]
4minschool 平滑无关学习统计查询复杂度下界
02-26 计算复杂度 统计查询 SQ下界
[自动] [ARXIV]
5minschool 任意模态下的多向量索引压缩方法
02-26 多向量索引 模态压缩 Late Interaction
[自动] [ARXIV]
3minschool 面向大模型终端能力扩展的数据工程研究
02-25 LLM 数据工程 终端
[自动] [ARXIV]
4minschool 针对平滑对抗学习的统计查询下界研究
02-25 统计查询 计算复杂性 对抗学习
[自动] [ARXIV]
6minschool 多模态任意向量索引压缩技术
02-25 向量检索 多模态 索引压缩
[自动] [BLOGS_PODCASTS]
2minmic AI驱动方法助力细胞生物学全景解析与实验规划
02-25 AI 细胞生物学 多模态融合
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics用视觉语言模型规模化标注物理AI训练数据
02-25 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 联手 AWS 构建符合监管要求的 MLOps 框架加速精准医学试验
02-25 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉-语言模型自动化标注施工视频数据
02-25 VLM 数据标注 自动化
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 利用 SageMaker AI 构建合规 MLOps,加速精准医学试验
02-25 MLOps SageMaker AWS
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics利用视觉-语言模型自动化标注施工视频数据
02-25 视觉语言模型 数据标注 自动化
[自动] [ARXIV]
3minschool 超越星级评分:基于LLM与文本分类的细粒度情感分析框架
02-25 LLM 情感分析 ABSA
[自动] [ARXIV]
3minschool 学术问答系统中大模型错误评估的专家框架
02-25 LLM 学术问答 错误评估
[自动] [BLOGS_PODCASTS]
3minmic Sonrai携手AWS SageMaker构建MLOps框架加速精准医学试验
02-25 MLOps AWS SageMaker
[自动] [ARXIV]
4minschool 面向大规模视频推理的综合基准测试套件
02-25 视频推理 VBVR 基准测试
[自动] [ARXIV]
4minschool 非单调损失函数的共形风险控制方法
02-25 非单调损失 保序风险控制 共形预测
[自动] [ARXIV]
4minschool KNIGHT:知识图谱驱动的多选题生成与自适应难度校准
02-25 LLM RAG 知识图谱
[自动] [ARXIV]
4minschool 面向大规模视频推理的综合基准测试套件
02-24 视频推理 VBVR 基准测试
[自动] [ARXIV]
4minschool 非单调损失函数的保形风险控制方法
02-24 保形预测 风险控制 非单调损失
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 利用 SageMaker AI 构建合规 MLOps 框架加速精准医学试验
02-24 MLOps SageMaker AWS
[自动] [ARXIV]
4minschool KNIGHT:知识图谱驱动的多选题生成与自适应难度校准
02-24 RAG 知识图谱 LLM
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics利用视觉语言模型自动化标注物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
4minmic SWE-bench Verified 数据泄露与缺陷分析:为何应转向 SWE-bench Pro
02-24 SWE-bench 数据泄露 数据污染
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 联合 AWS SageMaker 构建 MLOps 框架,加速精准医学临床试验
02-24 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉语言模型规模化标注数据赋能物理AI
02-24 VLM 物理AI 数据标注
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 联手 AWS 构建 MLOps 框架加速精准医学试验
02-24 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics利用视觉语言模型自动化生成物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic SWE-bench Verified 数据污染与测度失准分析及替代方案
02-24 SWE-bench 数据污染 代码生成
[自动] [BLOGS_PODCASTS]
3minmic Sonrai利用SageMaker AI构建MLOps框架加速精准医学试验
02-24 MLOps SageMaker AWS
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉语言模型规模化标注施工数据
02-24 VLM 视觉语言模型 数据标注
[自动] [HACKER_NEWS]
4minnewspaper 53款模型“洗车”测试
02-24 模型评估 基准测试 LLM
[自动] [ARXIV]
4minschool 部分软匹配距离:基于部分单元对应的神经表征比较
02-24 神经表征 部分软匹配 最优传输
[自动] [BLOGS_PODCASTS]
2minmic SWE-bench Verified 存在数据污染与缺陷,建议迁移至 SWE-bench Pro
02-24 SWE-bench 数据污染 基准测试
[自动] [BLOGS_PODCASTS]
4minmic Sonrai利用Amazon SageMaker构建MLOps框架加速精准医学试验
02-24 MLOps Amazon SageMaker AWS
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉-语言模型规模化标注物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [ARXIV]
4minschool 基准测试图神经网络在解决难约束满足问题中的性能
02-24 GNN 图神经网络 约束满足问题
[自动] [BLOGS_PODCASTS]
3minmic SWE-bench Verified 数据泄露与测试缺陷分析:为何应迁移至 SWE-bench Pro
02-24 SWE-bench 数据泄露 基准测试
[自动] [BLOGS_PODCASTS]
3minmic Sonrai 利用 SageMaker AI 构建合规 MLOps 框架加速精准医学试验
02-24 MLOps SageMaker AWS
[自动] [ARXIV]
4minschool K-partition 集成方法:通过置信度分配提升模型性能
02-24 CAKE 聚类集成 置信度评估
[自动] [BLOGS_PODCASTS]
3minmic Bedrock与AWS合作:利用视觉-语言模型规模化生成物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [ARXIV]
4minschool 为K分区集成模型分配置信度以提升预测性能
02-23 聚类分析 集成学习 置信度评估
[自动] [BLOGS_PODCASTS]
3minmic SWE-bench Verified 数据泄漏与测试缺陷分析:为何推荐改用 SWE-bench Pro
02-23 SWE-bench 数据泄漏 基准测试
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 联手 AWS 构建 MLOps 框架加速精准医学试验
02-23 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]
2minmic SWE-bench Verified 数据污染严重,推荐使用 SWE-bench Pro
02-23 SWE-bench 数据污染 基准测试
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 利用 SageMaker AI 构建合规 MLOps 框架,加速精准医疗临床试验
02-23 MLOps SageMaker AWS
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-23 合成数据 数据瓶颈 日本AI
[自动] [ARXIV]
4minschool 基于Tokenizer的文本语言识别方法研究
02-23 UniLID 语言识别 Tokenizer
[自动] [ARXIV]
4minschool Mine and Refine:优化电商搜索检索的分级相关性
02-23 电商搜索 信息检索 双塔模型
[自动] [ARXIV]
4minschool FAMOSE:基于ReAct范式的自动化特征发现方法
02-23 特征工程 ReAct 自动化特征发现
[自动] [BLOGS_PODCASTS]
2minmic 利用合成人设突破数据瓶颈,加速日本AI开发
02-22 合成数据 人设生成 数据增强
[自动] [ARXIV]
4minschool 基于分词器的未知语言识别方法
02-22 UniLID 语言识别 分词器
[自动] [ARXIV]
4minschool Mine and Refine:优化电商搜索检索中的分级相关性
02-22 电商搜索 信息检索 文本嵌入
[自动] [ARXIV]
4minschool FAMOSE:基于 ReAct 框架的自动化特征发现方法
02-22 特征工程 自动化特征发现 ReAct
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-21 合成数据 数据增强 LLM
[自动] [ARXIV]
3minschool Mine and Refine:优化电商搜索检索中的分级相关性
02-21 电商搜索 信息检索 相关性排序
[自动] [ARXIV]
5minschool FAMOSE:基于 ReAct 范式的自动化特征发现方法
02-21 特征工程 ReAct 自动化
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-21 合成数据 数据增强 Persona
[自动] [ARXIV]
4minschool 基于分词器的语言识别方法研究
02-20 UniLID 语言识别 LID
[自动] [BLOGS_PODCASTS]
1minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-20 合成数据 数据瓶颈 日本AI
[自动] [ARXIV]
4minschool Mine and Refine:优化电商搜索检索中的分级相关性
02-20 电商搜索 检索优化 相关性排序
[自动] [ARXIV]
5minschool FAMOSE:基于 ReAct 范式的自动化特征发现方法
02-20 FAMOSE 特征工程 自动化特征发现
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-20 合成数据 数据增强 日本AI
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-20 合成数据 数据瓶颈 日本AI
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-20 合成数据 数据增强 LLM
[自动] [ARXIV]
4minschool 知识嵌入潜在投影提升鲁棒表征学习
02-20 表征学习 数据不平衡 EHR
[自动] [ARXIV]
4minschool 知识嵌入隐投影用于鲁棒表征学习
02-19 表征学习 EHR 数据不平衡
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-19 合成数据 数据瓶颈 日本AI
[自动] [HACKER_NEWS]
5minnewspaper 面向分析师的Python大语言模型实战指南
02-19 Python LLM 数据分析
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 公布 METR 数据评估 Agent 自主能力
02-19 Anthropic METR Agent
[自动] [HACKER_NEWS]
4minnewspaper 面向分析师的Python大语言模型实战指南
02-19 Python LLM 数据分析
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-19 合成数据 数据瓶颈 日本AI
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 发布 METR 数据集研究 AI Agent 自主性
02-19 Anthropic METR AI Agent
[自动] [ARXIV]
4minschool 用模拟数据开发AI智能体的原理与方法
02-19 AI智能体 合成数据 数据模拟
[自动] [ARXIV]
3minschool 胸部X光分类的任务无关持续学习方法
02-18 持续学习 胸部X光 医学影像
[自动] [ARXIV]
4minschool 基于模拟数据开发AI智能体的原理与方法
02-18 AI智能体 合成数据 模拟技术
[自动] [ARXIV]
3minschool 基于D最优统计的高维仿真代理测试时适应稳定化方法
02-18 TTA 仿真代理 分布偏移
[自动] [HACKER_NEWS]
4minnewspaper LLM 数据集构建与模型训练优化指南
02-18 LLM 数据集构建 模型训练
[自动] [HACKER_NEWS]
4minnewspaper LLM 模型应关注的数据处理与优化策略
02-18 LLM 数据处理 模型优化
[自动] [HACKER_NEWS]
4minnewspaper 数学、计算机与人工智能综合资源合集
02-17 资源合集 数学基础 计算机科学
[自动] [HACKER_NEWS]
4minnewspaper 数学、计算机科学与人工智能综合资源指南
02-16 资源指南 数学 计算机科学
[自动] [HACKER_NEWS]
3minnewspaper AI致需求激增,西部数据称本年度机械硬盘已售罄
02-16 西部数据 机械硬盘 HDD
[自动] [HACKER_NEWS]
4minnewspaper Zvec:轻量级进程内向量数据库
02-15 Zvec 向量数据库 轻量级
[自动] [HACKER_NEWS]
5minnewspaper Zvec:轻量级进程内向量数据库
02-15 向量数据库 Zvec 轻量级
[自动] [HACKER_NEWS]
6minnewspaper Zvec:轻量级进程内向量数据库
02-15 向量数据库 Zvec 轻量级
[自动] [HACKER_NEWS]
4minnewspaper Zvec:轻量级进程内向量数据库
02-15 向量数据库 Zvec 轻量级
[自动] [HACKER_NEWS]
5minnewspaper Zvec:轻量级进程内向量数据库
02-15 向量数据库 Zvec 轻量级
[自动] [HACKER_NEWS]
5minnewspaper Zvec:轻量级进程内向量数据库
02-15 向量数据库 Zvec 轻量级
[自动] [HACKER_NEWS]
4minnewspaper 仅头文件的 C 语言向量数据库库
02-14 C语言 向量数据库 头文件库
[自动] [HACKER_NEWS]
5minnewspaper Zvec:轻量级进程内向量数据库,速度快
02-14 Zvec 向量数据库 轻量级
[自动] [HACKER_NEWS]
5minnewspaper 仅头文件的 C 语言向量数据库库
02-14 C语言 向量数据库 Header-only
[自动] [BLOGS_PODCASTS]
3minmic AI与模拟加速科学发现:Rafael Gómez-Bombarelli谈技术转折点
02-13 AI for Science 科学发现 模拟技术
[自动] [BLOGS_PODCASTS]
2minmic AI与模拟加速科学发现:拉斐尔·戈麦斯-巴雷利谈技术拐点
02-13 科学发现 AI模拟 科学计算
[自动] [BLOGS_PODCASTS]
2minmic AI 与模拟加速科学发现:Rafael Gómez-Bombarelli 谈技术拐点
02-13 AI for Science 科学发现 机器学习
[自动] [BLOGS_PODCASTS]
2minmic Rafael Gómez-Bombarelli:AI与模拟加速科学发现
02-13 科学发现 AI模拟 材料科学
[自动] [BLOGS_PODCASTS]
2minmic Boltz开源AlphaFold传承工具赋能分子发现
02-13 Boltz AlphaFold 分子发现
[自动] [BLOGS_PODCASTS]
3minmic AI与仿真加速科学发现的转折点
02-13 科学发现 AI for Science 仿真模拟
[自动] [ARXIV]
4minschool KAN-FIF:基于样条参数化的轻量级气象卫星热带气旋估算模型
02-13 KAN 气象预测 热带气旋
[自动] [BLOGS_PODCASTS]
3minmic AI与模拟加速科学发现:Rafael Gómez-Bombarelli谈技术拐点
02-12 科学发现 生成式AI 模拟技术
[自动] [BLOGS_PODCASTS]
3minmic AI与模拟技术加速科学发现的拐点已至
02-12 科学发现 生成式AI 模拟技术
[自动] [BLOGS_PODCASTS]
2minmic AI与仿真加速科学发现:Rafael Gómez-Bombarelli谈技术拐点
02-12 科学发现 AI模拟 材料设计
[自动] [JUEJIN]
3minsticky_note_2 AI视觉连载3:RGB图像模式与通道原理解析
02-12 计算机视觉 图像处理 RGB
[自动] [JUEJIN]
2minsticky_note_2 AI视觉连载3:RGB图像原理与通道详解
02-11 AI视觉 RGB 图像处理
[自动] [ARXIV]
3minschool Data Science and Technology Towards AGI Part I: Tiered
02-11 AGI 数据管理 分层架构
[自动] [ARXIV]
2minschool 面向AGI的数据科学与技术:分层数据管理
02-10 AGI LLM 数据管理
[自动] [HACKER_NEWS]
7minnewspaper YC孵化Livedocs:面向数据分析的AI原生笔记本
02-10 Livedocs Y Combinator 数据分析
[自动] [HACKER_NEWS]
4minnewspaper Livedocs:面向数据分析的AI原生笔记本
02-10 Livedocs AI原生 数据分析
[自动] [ARXIV]
3minschool Harpoon:面向条件表格扩散模型的广义流形引导
02-10 扩散模型 表格数据 流形引导
[自动] [ARXIV]
4minschool 基于熵排序流的非监督解耦表示学习模型
02-09 无监督学习 解耦表示 EOFlows
[自动] [ARXIV]
3minschool 土耳其语子词策略大规模评估:数据、词表与形态交互
02-09 Subword Tokenization 土耳其语
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-09 GPT-5 OpenAI 云自动化
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合自动化实验室将无细胞蛋白合成成本降低40%
02-09 GPT-5 生物技术 自动化实验室
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-08 GPT-5 OpenAI 生物科技
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-08 GPT-5 OpenAI 云自动化
[自动] [HACKER_NEWS]
5minnewspaper 微调Qwen2.5-7B模型基于百部电影构建概率故事图
02-08 Qwen2.5 微调 故事图
[自动] [HACKER_NEWS]
4minnewspaper 基于百部电影微调的 Qwen2.5-7B 概率故事图模型
02-08 Qwen2.5 微调 故事图
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白质合成成本降低40%
02-07 GPT-5 OpenAI 生物科技
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云端自动化将无细胞蛋白合成成本降低40%
02-07 GPT-5 合成生物学 自动化
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
4minnewspaper BioTradingArena:预测生物科技股走势的LLM基准
02-06 LLM 基准测试 金融预测
[自动] [HACKER_NEWS]
4minnewspaper BioTradingArena:用于评估LLM预测生物科技股票走势的基准
02-06 LLM 基准测试 金融预测
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:面向中文读者的可运行教材
02-06 深度学习 D2L PyTorch
[自动] [ARXIV]
4minschool 数据块模型中的精确恢复方法
02-06 社区检测 随机块模型 数据块模型
[自动] [ARXIV]
4minschool Wedge Sampling:实现近线性样本复杂度的张量补全算法
02-06 张量补全 楔形采样 低秩张量
[自动] [BLOGS_PODCASTS]
2minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索性能提升
02-06 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
3minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-06 GPT-5 云自动化 蛋白合成
[自动] [ARXIV]
3minschool 数据中的阈下效应:基于对数线性性的通用机制
02-06 LLM 数据质量 Logit-Linear-Selection
[自动] [ARXIV]
3minschool 数据中的阈下效应:一种基于对数线性性的通用机制
02-05 LLM 数据质量 Logit-Linear-Selection
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-05 GPT-5 OpenAI 云自动化
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 多模态 检索 Nemotron
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
4minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索性能优化
02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
3minmic Snowflake与OpenAI达成2亿美元协议,将前沿AI引入企业数据
02-05 Snowflake OpenAI 企业级
[自动] [BLOGS_PODCASTS]
2minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
3minmic Snowflake与OpenAI合作:在数据平台内直接部署AI智能体
02-04 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-04 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
4minmic Snowflake与OpenAI达成2亿美元协议引入企业级AI智能体
02-04 OpenAI Snowflake AI Agents
[自动] [BLOGS_PODCASTS]
4minmic Snowflake与OpenAI合作:2亿美元协议引入企业级AI智能体
02-04 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]
3minmic Snowflake与OpenAI合作:在企业数据中直接部署AI智能体
02-04 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]
4minmic Snowflake与OpenAI合作:在数据平台内集成前沿AI模型
02-04 Snowflake OpenAI 企业级AI
[自动] [BLOGS_PODCASTS]
2minmic Snowflake与OpenAI达成2亿美元协议,在数据平台内集成AI智能体
02-03 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]
3minmic Snowflake与OpenAI合作:在企业数据中直接实现AI智能体与洞察
02-03 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]
2minmic Snowflake与OpenAI合作:2亿美元协议将AI智能体引入企业数据
02-03 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]
4minmic OpenAI内部数据代理:结合GPT-5与记忆机制快速分析海量数据
02-03 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]
3minmic Snowflake与OpenAI达成2亿美元协议引入前沿智能
02-03 Snowflake OpenAI 企业数据
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 内部数据代理:结合 GPT‑5 与记忆能力实现数据推理
02-03 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]
2minmic Snowflake与OpenAI达成2亿美元合作,将前沿智能引入企业数据
02-03 OpenAI Snowflake 企业级AI
[自动] [BLOGS_PODCASTS]
2minmic OpenAI内部数据代理:结合GPT‑5与记忆能力实现分钟级洞察
02-03 OpenAI GPT-5 数据代理
[自动] [BLOGS_PODCASTS]
4minmic Snowflake与OpenAI达成2亿美元合作,将前沿智能引入企业数据
02-03 OpenAI Snowflake 企业级AI
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 内部数据代理:利用 GPT-5 与记忆快速分析海量数据
02-03 OpenAI GPT-5 数据代理
[自动] [ARXIV]
4minschool 基于预测集的最优决策方法
02-03 预测集 最优决策 决策理论
[自动] [ARXIV]
4minschool 可扩展随机小波特征:带收敛保证的高效非平稳核近似
02-03 机器学习 非平稳核 小波变换
[自动] [ARXIV]
4minschool IRL-DAL:基于能量引导扩散模型的安全自适应自动驾驶轨迹规划
02-03 扩散模型 自动驾驶 轨迹规划
[自动] [BLOGS_PODCASTS]
4minmic Snowflake与OpenAI合作:在数据平台内直接集成前沿AI模型
02-02 Snowflake OpenAI 企业级
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 内部数据代理:利用 GPT-5 与记忆能力快速分析大规模数据集
02-02 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]
3minmic Snowflake与OpenAI合作2亿美元,在企业数据中直接启用AI智能体
02-02 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 内部数据智能体:结合 GPT-5 与记忆快速分析海量数据
02-02 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 内部数据智能体:结合 GPT‑5 与记忆快速分析海量数据集
02-02 OpenAI GPT-5 Codex
[自动] [ARXIV]
3minschool 发现模型仓库中的隐藏价值
02-02 模型评估 Llama-3.1 多臂老虎机
[自动] [ARXIV]
4minschool FineInstructions:将合成指令数据扩展至预训练规模
02-02 LLM 指令微调 合成数据
[自动] [ARXIV]
3minschool 挖掘模型仓库中的隐藏价值
02-01 模型评估 Llama 微调
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 内部数据代理:结合 GPT-5 与记忆实现海量数据推理
02-01 OpenAI GPT-5 数据代理
[自动] [ARXIV]
4minschool FineInstructions:将合成指令扩展至预训练规模
02-01 FineInstructions 合成数据 指令微调
[自动] [BLOGS_PODCASTS]
2minmic OpenAI内部数据代理:结合GPT-5与记忆机制快速分析大规模数据集
02-01 OpenAI GPT-5 数据代理
2026年一月 61 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
3minmic OpenAI内部数据代理:结合GPT-5与记忆快速分析数据
01-31 OpenAI 数据代理 GPT-5
[自动] [ARXIV]
3minschool FineInstructions:将合成指令数据扩展至预训练规模
01-31 LLM 指令微调 合成数据
[自动] [HACKER_NEWS]
4minnewspaper Pinecone Explorer:Pinecone 向量数据库桌面 GUI
01-31 Pinecone 向量数据库 GUI
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 内部数据代理:结合 GPT‑5 与记忆机制实现分钟级数据洞察
01-30 OpenAI GPT-5 数据代理
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 内部数据代理:结合 GPT-5 与记忆机制实现分钟级数据洞察
01-30 OpenAI GPT-5 数据智能体
[自动] [ARXIV]
4minschool 面向文本检索器域适应的影响引导采样方法
01-30 文本检索 域适应 密集检索
[自动] [ARXIV]
4minschool 探索Transformer在表格数据变分自编码器中的位置
01-30 Transformer VAE 表格数据
[自动] [ARXIV]
4minschool 后训练公平性控制:推荐系统动态公平性单训练框架
01-30 推荐系统 公平性 Cofair
[自动] [ARXIV]
4minschool R^{2k}维度理论上足以支持基于嵌入的Top-k检索
01-30 向量检索 嵌入维度 Top-k检索
[自动] [ARXIV]
4minschool 探索Transformer在表格数据变分自编码器中的位置
01-29 Transformer VAE 表格数据
[自动] [ARXIV]
3minschool 基于嵌入的Top-$k$检索:理论上$\mathbb{R}^{2k}$维空间已足够
01-29 向量检索 嵌入 Top-k
[自动] [ARXIV]
4minschool 后训练公平性控制:推荐系统动态公平性单训练框架
01-29 推荐系统 公平性 Cofair
[自动] [BLOGS_PODCASTS]
3minmic OpenAI内部数据代理:结合GPT‑5与记忆快速分析海量数据
01-29 OpenAI GPT-5 Codex
[自动] [HACKER_NEWS]
5minnewspaper OpenAI内部数据智能体:自动化分析SQL数据库
01-29 OpenAI Data Agent SQL
[自动] [HACKER_NEWS]
6minnewspaper ShapedQL:支持多阶段排序与RAG的SQL引擎
01-29 ShapedQL SQL引擎 RAG
[自动] [HACKER_NEWS]
5minnewspaper ShapedQL:支持多阶段排序与 RAG 的 SQL 引擎
01-29 SQL RAG 向量检索
[自动] [BLOGS_PODCASTS]
2minmic Nemotron-Personas-Brazil:主权AI协同设计数据集
01-29 主权AI 数据集 Nemotron
[自动] [HACKER_NEWS]
7minnewspaper ShapedQL:支持多阶段排序与RAG的SQL引擎
01-29 ShapedQL SQL引擎 RAG
[自动] [ARXIV]
3minschool 基于相机-IMU融合的鲁棒路面分类数据集与框架
01-29 计算机视觉 多模态融合 IMU
[自动] [HACKER_NEWS]
5minnewspaper Bf-Tree:面向大规模数据的读写优化并发范围索引
01-29 Bf-Tree B-Tree 数据库索引
[自动] [BLOGS_PODCASTS]
3minmic Nemotron-Personas-Brazil:主权AI协作设计数据集
01-29 主权AI Nemotron 葡萄牙语
[自动] [HACKER_NEWS]
8minnewspaper Bf-Tree:面向大规模数据的读写优化并发范围索引
01-29 Bf-Tree 数据库索引 B+树
[自动] [ARXIV]
4minschool 🧠RHSIA!非理想颅内动脉瘤实时血流替代技术,精准高效!
01-28 RHSIA 血流动力学 颅内动脉瘤
[自动] [ARXIV]
4minschool 🔥动态环境下的对抗约束:Bandits算法如何应对未知挑战?
01-28 Bandits 对抗约束 动态环境
[自动] [ARXIV]
5minschool 🌍 M-SGWR: 多尺度相似+地理加权回归!空间建模神器🚀
01-28 M-SGWR 地理加权回归 空间建模
[自动] [BLOGS_PODCASTS]
3minmic 🇧🇷主权AI新突破!Nemotron-Personas-Brazil:共创数据引领未来
01-28 主权AI Nemotron NVIDIA
[自动] [HACKER_NEWS]
3minnewspaper 箭头→查询!类别转换黑科技,AI新范式?🚀
01-28 范畴论 查询优化 数据库设计
[自动] [ARXIV]
4minschool MEG情绪分析新突破!🔬脑数据标注+情感计算,解锁大脑密码!🧠✨
01-28 MEG 情绪分析 脑机接口
[自动] [ARXIV]
5minschool 🚀ctELM:用ELM解码临床试验嵌入!精准操控💡
01-28 ctELM 临床试验 嵌入空间
[自动] [ARXIV]
5minschool 💥无需标注!基于核变化点检测的无监督文本分割!
01-28 文本分割 无监督学习 核方法
[自动] [ARXIV]
4minschool 🌍 242种语言大比拼!Wikipedia数据揭秘跨语言比较语言学新突破!
01-28 比较语言学 BPE 多语言
[自动] [GITHUB_TRENDING]
10minhub GitHub爆款:B站API最全收录!🚀开箱即用!
01-27 Bilibili API文档 逆向工程
[自动] [ARXIV]
5minschool 🔥无需标注!核变点检测+句嵌入实现超强文本分割🚀
01-27 文本分割 无监督学习 句嵌入
[自动] [HACKER_NEWS]
3minnewspaper 🔥Prism:颠覆性工具!让你的数据可视化效率飙升!✨
01-27 数据可视化 Prism 效率工具
[自动] [ARXIV]
4minschool 🔍脑电+情感=超强分析!MEG数据解锁情绪新维度
01-27 MEG 情感分析 脑机接口
[自动] [ARXIV]
4minschool 🌍 跨242种语言!用子词模型解锁比较语言学新视角!
01-27 比较语言学 子词模型 BPE
[自动] [BLOGS_PODCASTS]
4minmic 🔥支撑8亿用户!PostgreSQL如何驱动ChatGPT爆发式增长?🚀
01-27 PostgreSQL 数据库扩展 高并发
[自动] [HACKER_NEWS]
3minnewspaper 用ChatGPT分析10年Apple Watch数据后,我立刻给医生打了电话!😨
01-27 ChatGPT Apple Watch 健康数据分析
[自动] [HACKER_NEWS]
2minnewspaper 数学、物理、生物的万能模式!🧪🧬2013年震撼发现
01-27 本福德定律 统计学 幂律分布
[自动] [GITHUB_TRENDING]
10minhub 🔥A股数据神器!mootdx:Python量化交易/金融数据爬取必备!🚀
01-27 Python 量化交易 金融数据
[自动] [HACKER_NEWS]
2minnewspaper 🔥 跨越数理化生!这个万能模式正在颠覆科学界!🤯
01-27 Scaling Laws 异速生长 复杂系统
[自动] [BLOGS_PODCASTS]
4minmic ⚡️支撑8亿用户!揭秘ChatGPT背后的PostgreSQL极致扩展架构
01-27 PostgreSQL 数据库扩展 读写分离
[自动] [HACKER_NEWS]
3minnewspaper 我把10年Apple Watch数据扔给ChatGPT,结果惊出一身冷汗!😱🩺
01-27 ChatGPT 数据分析 健康数据
[自动] [BLOGS_PODCASTS]
4minmic 🚀支撑8亿ChatGPT用户!PostgreSQL极致扩容实录🔥
01-27 PostgreSQL OpenAI 数据库扩容
[自动] [HACKER_NEWS]
3minnewspaper 🚀告别噪点!有序抖动算法:让像素画面更清晰的魔法✨
01-27 图像处理 抖动算法 像素画
[自动] [ARXIV]
5minschool 🚗AgentDrive重磅发布!首个Agent推理开源自驾数据集🔥
01-27 AgentDrive 自动驾驶 Agent AI
[自动] [ARXIV]
5minschool 🚀BONO-Bench:可追溯Pareto集的双目标优化基准测试!
01-27 多目标优化 基准测试 Pareto集
[自动] [HACKER_NEWS]
4minnewspaper 🔥告别杂点!有序抖动算法揭秘:让像素更清晰!
01-27 计算机图形学 图像处理 抖动算法
[自动] [HACKER_NEWS]
2minnewspaper 🤔不是所有Chess960局面都一样难?揭秘深藏的复杂性差异!
01-27 Chess960 国际象棋 复杂性分析
[自动] [HACKER_NEWS]
4minnewspaper MapLibre Tile:现代高效矢量切片格式!🚀
01-27 MapLibre 矢量切片 FlatBuffers
[自动] [BLOGS_PODCASTS]
4minmic 🚀 单库支撑8亿用户!PostgreSQL如何为ChatGPT提供核动力?
01-27 PostgreSQL 数据库扩展 高并发
[自动] [HACKER_NEWS]
5minnewspaper 🔥Postgres最强搜索!模糊+语义,精准匹配Abbey Road!🚀
01-27 Postgres pg_trgm pgvector
[自动] [HACKER_NEWS]
3minnewspaper 🧠并非所有Chess960局面都同样复杂!揭秘棋局难度的隐藏差异?
01-26 Chess960 菲舍尔任意制象棋 棋局复杂度
[自动] [HACKER_NEWS]
4minnewspaper Postgres模糊/语义搜索:输入'Beatles abbey rd'精准定位Abbey Road!🚀
01-26 Postgres 模糊搜索 语义搜索
[自动] [ARXIV]
5minschool AgentDrive:首个开放基准!🚗 LLM生成场景驱动Agent智能推理
01-26 AgentDrive 自动驾驶 基准测试
[自动] [GITHUB_TRENDING]
10minhub 🚀Mootdx:Python金融数据神器!行情/财报/选股一站式搞定!💰
01-26 Python 金融数据 通达信
[自动] [HACKER_NEWS]
4minnewspaper 🚀 现代化矢量瓦片格式!MapLibre Tile:效率革命来袭!
01-26 MapLibre 矢量瓦片 地图渲染
[自动] [ARXIV]
6minschool 🔥BONO-Bench震撼发布!首套可追溯Pareto集的双目标优化基准测试!
01-26 BONO-Bench 双目标优化 Pareto集
[自动] [HACKER_NEWS]
2minnewspaper 🧠科学家发现定义“自我”的脑波!揭秘意识的边界✨
01-26 脑科学 Alpha波 意识
[自动] [ARXIV]
4minschool 多舱+多时间窗!🚛⏰ 滚动空间分支定价算法惊艳求解VRP难题!
01-25 VRP 多舱车辆路径 时间窗
[自动] [BLOGS_PODCASTS]
4minmic 🚀 PostgreSQL如何支撑8亿ChatGPT用户?架构解密!
01-25 PostgreSQL OpenAI ChatGPT