terminal

AI Stack

rss_feed
SYS_STABLE
目录

CS.LG

条目:100
2026年三月 3 篇
类型阅读条目
[自动] [ARXIV]
4minschool 通过锚定机制实现模型一致性
03-01 模型一致性 锚定机制 cs.LG
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
03-01 多模态 视觉语言模型 最优传输
[自动] [ARXIV]
4minschool 1MB数据集足以训练模型:小样本学习新范式
03-01 PLADA 小样本学习 数据蒸馏
2026年二月 83 篇
类型阅读条目
[自动] [ARXIV]
4minschool 数据集压缩至1MB:模型训练效率优化方法
02-28 数据集蒸馏 PLADA 模型训练
[自动] [ARXIV]
3minschool 基于锚点机制实现模型一致性
02-28 模型一致性 锚点机制 模型不一致性
[自动] [ARXIV]
4minschool 基于超单纯形投影的可微零一损失函数
02-28 0-1损失 可微损失 超单纯形
[自动] [ARXIV]
3minschool 通过锚定机制提升模型一致性
02-27 模型一致性 锚定机制 模型差异
[自动] [ARXIV]
3minschool 数据集压缩至1MB:小规模数据集的模型训练效果评估
02-27 PLADA 数据集压缩 伪标签
[自动] [ARXIV]
3minschool 基于超单纯形投影的可微零一损失函数
02-27 机器学习 损失函数 0-1损失
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-27 多模态 视觉语言模型 最优传输
[自动] [ARXIV]
5minschool FlashOptim:面向内存高效训练的优化器
02-27 FlashOptim 内存优化 训练优化器
[自动] [ARXIV]
4minschool 平滑无关学习统计查询复杂度下界
02-26 计算复杂度 统计查询 SQ下界
[自动] [ARXIV]
4minschool Test-Time训练结合KV绑定等价于线性注意力
02-26 TTT 线性注意力 KV绑定
[自动] [ARXIV]
4minschool 针对平滑对抗学习的统计查询下界研究
02-25 统计查询 计算复杂性 对抗学习
[自动] [ARXIV]
4minschool KV绑定测试时训练等价于线性注意力
02-25 TTT 线性注意力 KV缓存
[自动] [ARXIV]
4minschool 离线强化学习:面向离动力学环境的局部动力学感知域适应
02-25 离线强化学习 LoDADA 域适应
[自动] [ARXIV]
4minschool 行为学习:从数据中学习分层优化结构
02-24 行为学习 分层优化 可解释性
[自动] [ARXIV]
4minschool 部分软匹配距离:基于部分单元对应的神经表征比较
02-24 神经表征 部分软匹配 最优传输
[自动] [ARXIV]
4minschool 无需训练的图神经网络跨架构合并方法
02-24 arxiv cs.LG
[自动] [ARXIV]
4minschool 扩散模型无需噪声调节的几何学原理
02-24 扩散模型 Flow Matching 几何学原理
[自动] [ARXIV]
5minschool U(d)子群导出自然RNN与Transformer架构
02-24 RNN Transformer 序列模型
[自动] [ARXIV]
3minschool 统一图神经网络均匀表达能力的通用方法
02-23 GNN 图神经网络 表达能力
[自动] [ARXIV]
4minschool 扩散模型无需噪声条件:几何视角的解释
02-23 扩散模型 几何视角 生成模型
[自动] [ARXIV]
4minschool 为K分区集成模型分配置信度以提升预测性能
02-23 聚类分析 集成学习 置信度评估
[自动] [ARXIV]
4minschool 多轮人机协作框架支持用户自定义需求
02-22 人机协作 多轮对话 决策质量
[自动] [ARXIV]
4minschool 知识嵌入潜在投影提升鲁棒表征学习
02-20 表征学习 数据不平衡 EHR
[自动] [ARXIV]
3minschool 机器遗忘中保护未删除数据隐私的方法
02-20 机器遗忘 隐私保护 重构攻击
[自动] [ARXIV]
4minschool 知识嵌入隐投影用于鲁棒表征学习
02-19 表征学习 EHR 数据不平衡
[自动] [ARXIV]
3minschool 机器遗忘中保护未删除数据的隐私防御机制
02-19 机器遗忘 隐私保护 重构攻击
[自动] [ARXIV]
3minschool 通过任务复杂度量化验证浅层对齐假说
02-19 浅层对齐假说 SAH 任务复杂度
[自动] [ARXIV]
3minschool 基于D最优统计的高维仿真代理测试时适应稳定化方法
02-18 TTA 仿真代理 分布偏移
[自动] [ARXIV]
3minschool 长上下文LLM缩放缺陷:隐私与个性化任务揭示注意力分散
02-18 长上下文 LLM 个性化
[自动] [ARXIV]
4minschool 基于正则化与对称性重审扩散模型及其分子图生成应用
02-18 扩散模型 分子图生成 对称性
[自动] [ARXIV]
3minschool 长上下文LLM隐私与个性化任务中的缩放差距研究
02-17 长上下文 隐私保护 个性化
[自动] [ARXIV]
3minschool 语言统计对称性塑造模型表征的几何结构
02-17 表征学习 几何结构 统计对称性
[自动] [ARXIV]
4minschool 离散扩散模型高效采样:具备锐利性与自适应保证
02-17 离散扩散模型 高效采样 tau-leaping
[自动] [ARXIV]
4minschool 基于标准化的扩散模型对称性重思考与分子图生成
02-17 扩散模型 分子图生成 对称性
[自动] [ARXIV]
4minschool 利用辅助信息实现少样本设计优化
02-13 贝叶斯优化 少样本学习 设计优化
[自动] [ARXIV]
4minschool KAN-FIF:基于样条参数化的轻量级气象卫星热带气旋估算模型
02-13 KAN 气象预测 热带气旋
[自动] [ARXIV]
3minschool GENIUS:生成式流体智能评估套件
02-13 GENIUS 流体智力 多模态评估
[自动] [ARXIV]
2minschool 步级解析数据归因:面向循环Transformer
02-12 arxiv cs.LG
[自动] [ARXIV]
1minschool Learning on the Manifold: Unlocking Standard Diffusion
02-12 Diffusion Transformer DiT 表征学习
[自动] [ARXIV]
3minschool 迈向可解释联邦学习:理解差分隐私的影响
02-11 联邦学习 差分隐私 可解释性
[自动] [ARXIV]
1minschool 基于表征编码器解锁标准扩散Transformer
02-11 DiT 扩散模型 流匹配
[自动] [ARXIV]
1minschool Transformer模型在低信噪比时间序列预测中的统计基准测试
02-11 arxiv cs.LG
[自动] [ARXIV]
2minschool CoFEH:LLM驱动的协同贝叶斯特征工程框架
02-11 arxiv cs.LG
[自动] [ARXIV]
2minschool ANCRe: Adaptive Neural Connection Reassignment for Effi
02-11 ANCRe 深度学习 残差连接
[自动] [ARXIV]
4minschool ARO:面向大模型矩阵优化的新视角
02-10 矩阵优化 ARO 大模型
[自动] [ARXIV]
3minschool 下一代验证码:利用认知差异防御GUI智能体
02-10 arxiv cs.LG
[自动] [ARXIV]
3minschool ANCRe:自适应神经连接重分配实现高效深度扩展
02-10 arxiv cs.LG
[自动] [ARXIV]
4minschool 基于朗之万动力学的直接软策略采样
02-10 arxiv cs.LG
[自动] [ARXIV]
1minschool MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Rei
02-10 arxiv cs.LG
[自动] [ARXIV]
3minschool Harpoon:面向条件表格扩散模型的广义流形引导
02-10 扩散模型 表格数据 流形引导
[自动] [ARXIV]
4minschool 学习大模型神经元激活的生成式元模型
02-09 神经元激活 生成式模型 元模型
[自动] [ARXIV]
4minschool 基于熵排序流的非监督解耦表示学习模型
02-09 无监督学习 解耦表示 EOFlows
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直观物理
02-09 VLM 直觉物理 强化学习
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直觉物理
02-08 VLM 直觉物理 多模态
[自动] [ARXIV]
4minschool 好奇心即知识:基于主动推理的自一致学习与无悔优化
02-08 主动推理 好奇心 探索与利用
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直观物理
02-07 VLM 多模态 具身智能
[自动] [ARXIV]
3minschool 好奇心即知识:基于主动推理的自一致学习与无悔优化
02-07 主动推理 强化学习 好奇心
[自动] [ARXIV]
4minschool 伪可逆神经网络:通过伪可逆性提升模型可逆性
02-07 神经网络 伪可逆 SPNN
[自动] [ARXIV]
3minschool 好奇心即知识:基于主动推理的自一致学习与无遗憾优化
02-06 主动推理 探索与利用 自由能
[自动] [ARXIV]
4minschool 共享 LoRA 子空间实现近乎严格的持续学习
02-06 LoRA 持续学习 微调
[自动] [ARXIV]
4minschool 数据块模型中的精确恢复方法
02-06 社区检测 随机块模型 数据块模型
[自动] [ARXIV]
4minschool DLM-Scope:利用稀疏自编码器解析扩散语言模型
02-06 DLM SAE 稀疏自编码器
[自动] [ARXIV]
3minschool 面向物联网模型适应性的对比持续学习方法
02-06 持续学习 对比学习 物联网
[自动] [ARXIV]
3minschool 数据中的阈下效应:基于对数线性性的通用机制
02-06 LLM 数据质量 Logit-Linear-Selection
[自动] [ARXIV]
5minschool CRoSS:面向可扩展强化学习的持续机器人仿真套件
02-05 强化学习 持续学习 机器人仿真
[自动] [ARXIV]
3minschool 面向物联网模型适应性的对比持续学习
02-05 持续学习 对比学习 物联网
[自动] [ARXIV]
4minschool 利用权重更新稀疏性提升分布式强化学习通信效率
02-05 分布式强化学习 通信效率 权重稀疏性
[自动] [ARXIV]
5minschool PLATE:用于几何感知持续学习的可塑性调谐高效适配器
02-05 持续学习 PLATE 模型适配
[自动] [ARXIV]
3minschool 基于急停干预的鲁棒干预学习
02-04 强化学习 RL 自动驾驶
[自动] [ARXIV]
4minschool PLATE:面向几何感知持续学习的可塑性调谐高效适配器
02-04 持续学习 PLATE 高效适配器
[自动] [ARXIV]
4minschool 通过文本反馈扩展强化学习的能力边界
02-04 强化学习 RLHF 文本反馈
[自动] [ARXIV]
3minschool MEG-XL:长上下文预训练实现数据高效的脑电转文本
02-04 MEG-XL 脑机接口 脑电转文本
[自动] [ARXIV]
4minschool MEG-XL:基于长上下文预训练的高效脑电转文本模型
02-03 MEG-XL 脑机接口 BCI
[自动] [ARXIV]
3minschool 粒子引导扩散模型用于偏微分方程求解
02-03 扩散模型 PDE求解 物理引导
[自动] [ARXIV]
5minschool TEON:张量化正交化方法优化大语言模型预训练
02-03 TEON 优化器 预训练
[自动] [ARXIV]
4minschool FOCUS:DLLMs 如何突破算力瓶颈
02-03 DLLMs 扩散模型 推理加速
[自动] [ARXIV]
4minschool FOCUS:DLLMs如何突破算力瓶颈
02-02 DLLMs 扩散模型 算力优化
[自动] [ARXIV]
4minschool SplineFlow:基于B样条插值的动力系统流匹配方法
02-02 流匹配 SplineFlow B样条
[自动] [ARXIV]
4minschool RN-D:基于正则化网络的离散分类演员与同策强化学习
02-02 强化学习 RL 连续控制
[自动] [ARXIV]
4minschool CATTO:平衡语言模型偏好与置信度的方法
02-02 LLM CATTO 校准
[自动] [ARXIV]
3minschool 神经网络转逻辑流以优化边缘计算性能
02-02 边缘计算 神经网络 逻辑流
[自动] [ARXIV]
3minschool 发现模型仓库中的隐藏价值
02-02 模型评估 Llama-3.1 多臂老虎机
[自动] [ARXIV]
3minschool 挖掘模型仓库中的隐藏价值
02-01 模型评估 Llama 微调
2026年一月 14 篇
类型阅读条目
[自动] [ARXIV]
4minschool 神经网络转逻辑流以优化边缘计算性能
01-31 边缘计算 神经网络 逻辑流
[自动] [ARXIV]
6minschool 为何Adam在$β_1=β_2$时更优:缺失的梯度尺度不变性原理
01-30 Adam优化器 梯度尺度不变性 深度学习
[自动] [ARXIV]
4minschool 探索Transformer在表格数据变分自编码器中的位置
01-30 Transformer VAE 表格数据
[自动] [ARXIV]
4minschool R^{2k}维度理论上足以支持基于嵌入的Top-k检索
01-30 向量检索 嵌入维度 Top-k检索
[自动] [ARXIV]
4minschool 进化策略导致大语言模型出现灾难性遗忘
01-29 进化策略 灾难性遗忘 持续学习
[自动] [ARXIV]
4minschool 探索Transformer在表格数据变分自编码器中的位置
01-29 Transformer VAE 表格数据
[自动] [ARXIV]
3minschool 基于嵌入的Top-$k$检索:理论上$\mathbb{R}^{2k}$维空间已足够
01-29 向量检索 嵌入 Top-k
[自动] [ARXIV]
5minschool ✨告别遗忘!Self-Distillation解锁持续学习新范式!
01-28 持续学习 Self-Distillation 灾难性遗忘
[自动] [ARXIV]
6minschool 🔥LLM训练动力学新突破!可扩展损失景观曲率度量!
01-27 LLM 训练动力学 损失景观
[自动] [ARXIV]
4minschool 🧬重磅!基于SE(3)流的刚体模态3D分子生成!
01-26 3D分子生成 SE(3)流 刚体模态
[自动] [ARXIV]
5minschool 🚀 自回归+掩码扩散:下一代生成式AI!🔥
01-26 扩散模型 自回归 生成式AI
[自动] [ARXIV]
5minschool 🔥LLM训练动力学新突破!可扩展损失景观曲率度量🚀
01-26 LLM 训练动力学 损失景观
[自动] [ARXIV]
4minschool 🤖反事实训练!让模型学会靠谱又可落地的解释!
01-25 反事实训练 模型解释性 可解释AI
[自动] [ARXIV]
4minschool 测试时也能发现新规律?🤯AI解锁动态学习能力!
01-25 TTT-Discover 测试时训练 强化学习