CS.LG

条目：100

2026年三月 3 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school 通过锚定机制实现模型一致性 03-01 模型一致性锚定机制 cs.LG
[自动] [ARXIV]	4min	school SOTAlign：基于最优传输的单模态视觉与语言模型半监督对齐 03-01 多模态视觉语言模型最优传输
[自动] [ARXIV]	4min	school 1MB数据集足以训练模型：小样本学习新范式 03-01 PLADA 小样本学习数据蒸馏

2026年二月 83 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school 数据集压缩至1MB：模型训练效率优化方法 02-28 数据集蒸馏 PLADA 模型训练
[自动] [ARXIV]	3min	school 基于锚点机制实现模型一致性 02-28 模型一致性锚点机制模型不一致性
[自动] [ARXIV]	4min	school 基于超单纯形投影的可微零一损失函数 02-28 0-1损失可微损失超单纯形
[自动] [ARXIV]	3min	school 通过锚定机制提升模型一致性 02-27 模型一致性锚定机制模型差异
[自动] [ARXIV]	3min	school 数据集压缩至1MB：小规模数据集的模型训练效果评估 02-27 PLADA 数据集压缩伪标签
[自动] [ARXIV]	3min	school 基于超单纯形投影的可微零一损失函数 02-27 机器学习损失函数 0-1损失
[自动] [ARXIV]	4min	school SOTAlign：基于最优传输的单模态视觉与语言模型半监督对齐 02-27 多模态视觉语言模型最优传输
[自动] [ARXIV]	5min	school FlashOptim：面向内存高效训练的优化器 02-27 FlashOptim 内存优化训练优化器
[自动] [ARXIV]	4min	school 平滑无关学习统计查询复杂度下界 02-26 计算复杂度统计查询 SQ下界
[自动] [ARXIV]	4min	school Test-Time训练结合KV绑定等价于线性注意力 02-26 TTT 线性注意力 KV绑定
[自动] [ARXIV]	4min	school 针对平滑对抗学习的统计查询下界研究 02-25 统计查询计算复杂性对抗学习
[自动] [ARXIV]	4min	school KV绑定测试时训练等价于线性注意力 02-25 TTT 线性注意力 KV缓存
[自动] [ARXIV]	4min	school 离线强化学习：面向离动力学环境的局部动力学感知域适应 02-25 离线强化学习 LoDADA 域适应
[自动] [ARXIV]	4min	school 行为学习：从数据中学习分层优化结构 02-24 行为学习分层优化可解释性
[自动] [ARXIV]	4min	school 部分软匹配距离：基于部分单元对应的神经表征比较 02-24 神经表征部分软匹配最优传输
[自动] [ARXIV]	4min	school 无需训练的图神经网络跨架构合并方法 02-24 arxiv cs.LG
[自动] [ARXIV]	4min	school 扩散模型无需噪声调节的几何学原理 02-24 扩散模型 Flow Matching 几何学原理
[自动] [ARXIV]	5min	school U(d)子群导出自然RNN与Transformer架构 02-24 RNN Transformer 序列模型
[自动] [ARXIV]	3min	school 统一图神经网络均匀表达能力的通用方法 02-23 GNN 图神经网络表达能力
[自动] [ARXIV]	4min	school 扩散模型无需噪声条件：几何视角的解释 02-23 扩散模型几何视角生成模型
[自动] [ARXIV]	4min	school 为K分区集成模型分配置信度以提升预测性能 02-23 聚类分析集成学习置信度评估
[自动] [ARXIV]	4min	school 多轮人机协作框架支持用户自定义需求 02-22 人机协作多轮对话决策质量
[自动] [ARXIV]	4min	school 知识嵌入潜在投影提升鲁棒表征学习 02-20 表征学习数据不平衡 EHR
[自动] [ARXIV]	3min	school 机器遗忘中保护未删除数据隐私的方法 02-20 机器遗忘隐私保护重构攻击
[自动] [ARXIV]	4min	school 知识嵌入隐投影用于鲁棒表征学习 02-19 表征学习 EHR 数据不平衡
[自动] [ARXIV]	3min	school 机器遗忘中保护未删除数据的隐私防御机制 02-19 机器遗忘隐私保护重构攻击
[自动] [ARXIV]	3min	school 通过任务复杂度量化验证浅层对齐假说 02-19 浅层对齐假说 SAH 任务复杂度
[自动] [ARXIV]	3min	school 基于D最优统计的高维仿真代理测试时适应稳定化方法 02-18 TTA 仿真代理分布偏移
[自动] [ARXIV]	3min	school 长上下文LLM缩放缺陷：隐私与个性化任务揭示注意力分散 02-18 长上下文 LLM 个性化
[自动] [ARXIV]	4min	school 基于正则化与对称性重审扩散模型及其分子图生成应用 02-18 扩散模型分子图生成对称性
[自动] [ARXIV]	3min	school 长上下文LLM隐私与个性化任务中的缩放差距研究 02-17 长上下文隐私保护个性化
[自动] [ARXIV]	3min	school 语言统计对称性塑造模型表征的几何结构 02-17 表征学习几何结构统计对称性
[自动] [ARXIV]	4min	school 离散扩散模型高效采样：具备锐利性与自适应保证 02-17 离散扩散模型高效采样 tau-leaping
[自动] [ARXIV]	4min	school 基于标准化的扩散模型对称性重思考与分子图生成 02-17 扩散模型分子图生成对称性
[自动] [ARXIV]	4min	school 利用辅助信息实现少样本设计优化 02-13 贝叶斯优化少样本学习设计优化
[自动] [ARXIV]	4min	school KAN-FIF：基于样条参数化的轻量级气象卫星热带气旋估算模型 02-13 KAN 气象预测热带气旋
[自动] [ARXIV]	3min	school GENIUS：生成式流体智能评估套件 02-13 GENIUS 流体智力多模态评估
[自动] [ARXIV]	2min	school 步级解析数据归因：面向循环Transformer 02-12 arxiv cs.LG
[自动] [ARXIV]	1min	school Learning on the Manifold: Unlocking Standard Diffusion 02-12 Diffusion Transformer DiT 表征学习
[自动] [ARXIV]	3min	school 迈向可解释联邦学习：理解差分隐私的影响 02-11 联邦学习差分隐私可解释性
[自动] [ARXIV]	1min	school 基于表征编码器解锁标准扩散Transformer 02-11 DiT 扩散模型流匹配
[自动] [ARXIV]	1min	school Transformer模型在低信噪比时间序列预测中的统计基准测试 02-11 arxiv cs.LG
[自动] [ARXIV]	2min	school CoFEH：LLM驱动的协同贝叶斯特征工程框架 02-11 arxiv cs.LG
[自动] [ARXIV]	2min	school ANCRe: Adaptive Neural Connection Reassignment for Effi 02-11 ANCRe 深度学习残差连接
[自动] [ARXIV]	4min	school ARO：面向大模型矩阵优化的新视角 02-10 矩阵优化 ARO 大模型
[自动] [ARXIV]	3min	school 下一代验证码：利用认知差异防御GUI智能体 02-10 arxiv cs.LG
[自动] [ARXIV]	3min	school ANCRe：自适应神经连接重分配实现高效深度扩展 02-10 arxiv cs.LG
[自动] [ARXIV]	4min	school 基于朗之万动力学的直接软策略采样 02-10 arxiv cs.LG
[自动] [ARXIV]	1min	school MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Rei 02-10 arxiv cs.LG
[自动] [ARXIV]	3min	school Harpoon：面向条件表格扩散模型的广义流形引导 02-10 扩散模型表格数据流形引导
[自动] [ARXIV]	4min	school 学习大模型神经元激活的生成式元模型 02-09 神经元激活生成式模型元模型
[自动] [ARXIV]	4min	school 基于熵排序流的非监督解耦表示学习模型 02-09 无监督学习解耦表示 EOFlows
[自动] [ARXIV]	3min	school 视觉语言模型能否通过交互学习直观物理 02-09 VLM 直觉物理强化学习
[自动] [ARXIV]	3min	school 视觉语言模型能否通过交互学习直觉物理 02-08 VLM 直觉物理多模态
[自动] [ARXIV]	4min	school 好奇心即知识：基于主动推理的自一致学习与无悔优化 02-08 主动推理好奇心探索与利用
[自动] [ARXIV]	3min	school 视觉语言模型能否通过交互学习直观物理 02-07 VLM 多模态具身智能
[自动] [ARXIV]	3min	school 好奇心即知识：基于主动推理的自一致学习与无悔优化 02-07 主动推理强化学习好奇心
[自动] [ARXIV]	4min	school 伪可逆神经网络：通过伪可逆性提升模型可逆性 02-07 神经网络伪可逆 SPNN
[自动] [ARXIV]	3min	school 好奇心即知识：基于主动推理的自一致学习与无遗憾优化 02-06 主动推理探索与利用自由能
[自动] [ARXIV]	4min	school 共享 LoRA 子空间实现近乎严格的持续学习 02-06 LoRA 持续学习微调
[自动] [ARXIV]	4min	school 数据块模型中的精确恢复方法 02-06 社区检测随机块模型数据块模型
[自动] [ARXIV]	4min	school DLM-Scope：利用稀疏自编码器解析扩散语言模型 02-06 DLM SAE 稀疏自编码器
[自动] [ARXIV]	3min	school 面向物联网模型适应性的对比持续学习方法 02-06 持续学习对比学习物联网
[自动] [ARXIV]	3min	school 数据中的阈下效应：基于对数线性性的通用机制 02-06 LLM 数据质量 Logit-Linear-Selection
[自动] [ARXIV]	5min	school CRoSS：面向可扩展强化学习的持续机器人仿真套件 02-05 强化学习持续学习机器人仿真
[自动] [ARXIV]	3min	school 面向物联网模型适应性的对比持续学习 02-05 持续学习对比学习物联网
[自动] [ARXIV]	4min	school 利用权重更新稀疏性提升分布式强化学习通信效率 02-05 分布式强化学习通信效率权重稀疏性
[自动] [ARXIV]	5min	school PLATE：用于几何感知持续学习的可塑性调谐高效适配器 02-05 持续学习 PLATE 模型适配
[自动] [ARXIV]	3min	school 基于急停干预的鲁棒干预学习 02-04 强化学习 RL 自动驾驶
[自动] [ARXIV]	4min	school PLATE：面向几何感知持续学习的可塑性调谐高效适配器 02-04 持续学习 PLATE 高效适配器
[自动] [ARXIV]	4min	school 通过文本反馈扩展强化学习的能力边界 02-04 强化学习 RLHF 文本反馈
[自动] [ARXIV]	3min	school MEG-XL：长上下文预训练实现数据高效的脑电转文本 02-04 MEG-XL 脑机接口脑电转文本
[自动] [ARXIV]	4min	school MEG-XL：基于长上下文预训练的高效脑电转文本模型 02-03 MEG-XL 脑机接口 BCI
[自动] [ARXIV]	3min	school 粒子引导扩散模型用于偏微分方程求解 02-03 扩散模型 PDE求解物理引导
[自动] [ARXIV]	5min	school TEON：张量化正交化方法优化大语言模型预训练 02-03 TEON 优化器预训练
[自动] [ARXIV]	4min	school FOCUS：DLLMs 如何突破算力瓶颈 02-03 DLLMs 扩散模型推理加速
[自动] [ARXIV]	4min	school FOCUS：DLLMs如何突破算力瓶颈 02-02 DLLMs 扩散模型算力优化
[自动] [ARXIV]	4min	school SplineFlow：基于B样条插值的动力系统流匹配方法 02-02 流匹配 SplineFlow B样条
[自动] [ARXIV]	4min	school RN-D：基于正则化网络的离散分类演员与同策强化学习 02-02 强化学习 RL 连续控制
[自动] [ARXIV]	4min	school CATTO：平衡语言模型偏好与置信度的方法 02-02 LLM CATTO 校准
[自动] [ARXIV]	3min	school 神经网络转逻辑流以优化边缘计算性能 02-02 边缘计算神经网络逻辑流
[自动] [ARXIV]	3min	school 发现模型仓库中的隐藏价值 02-02 模型评估 Llama-3.1 多臂老虎机
[自动] [ARXIV]	3min	school 挖掘模型仓库中的隐藏价值 02-01 模型评估 Llama 微调

2026年一月 14 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school 神经网络转逻辑流以优化边缘计算性能 01-31 边缘计算神经网络逻辑流
[自动] [ARXIV]	6min	school 为何Adam在$β_1=β_2$时更优：缺失的梯度尺度不变性原理 01-30 Adam优化器梯度尺度不变性深度学习
[自动] [ARXIV]	4min	school 探索Transformer在表格数据变分自编码器中的位置 01-30 Transformer VAE 表格数据
[自动] [ARXIV]	4min	school R^{2k}维度理论上足以支持基于嵌入的Top-k检索 01-30 向量检索嵌入维度 Top-k检索
[自动] [ARXIV]	4min	school 进化策略导致大语言模型出现灾难性遗忘 01-29 进化策略灾难性遗忘持续学习
[自动] [ARXIV]	4min	school 探索Transformer在表格数据变分自编码器中的位置 01-29 Transformer VAE 表格数据
[自动] [ARXIV]	3min	school 基于嵌入的Top-$k$检索：理论上$\mathbb{R}^{2k}$维空间已足够 01-29 向量检索嵌入 Top-k
[自动] [ARXIV]	5min	school ✨告别遗忘！Self-Distillation解锁持续学习新范式！ 01-28 持续学习 Self-Distillation 灾难性遗忘
[自动] [ARXIV]	6min	school 🔥LLM训练动力学新突破！可扩展损失景观曲率度量！ 01-27 LLM 训练动力学损失景观
[自动] [ARXIV]	4min	school 🧬重磅！基于SE(3)流的刚体模态3D分子生成！ 01-26 3D分子生成 SE(3)流刚体模态
[自动] [ARXIV]	5min	school 🚀 自回归+掩码扩散：下一代生成式AI！🔥 01-26 扩散模型自回归生成式AI
[自动] [ARXIV]	5min	school 🔥LLM训练动力学新突破！可扩展损失景观曲率度量🚀 01-26 LLM 训练动力学损失景观
[自动] [ARXIV]	4min	school 🤖反事实训练！让模型学会靠谱又可落地的解释！ 01-25 反事实训练模型解释性可解释AI
[自动] [ARXIV]	4min	school 测试时也能发现新规律？🤯AI解锁动态学习能力！ 01-25 TTT-Discover 测试时训练强化学习