目录
CS.LG
条目:100
2026年三月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
通过锚定机制实现模型一致性 03-01
模型一致性
锚定机制
cs.LG |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 03-01
多模态
视觉语言模型
最优传输 |
[自动]
[ARXIV] | 4min | school
1MB数据集足以训练模型:小样本学习新范式 03-01
PLADA
小样本学习
数据蒸馏 |
2026年二月
83 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
数据集压缩至1MB:模型训练效率优化方法 02-28
数据集蒸馏
PLADA
模型训练 |
[自动]
[ARXIV] | 3min | school
基于锚点机制实现模型一致性 02-28
模型一致性
锚点机制
模型不一致性 |
[自动]
[ARXIV] | 4min | school
基于超单纯形投影的可微零一损失函数 02-28
0-1损失
可微损失
超单纯形 |
[自动]
[ARXIV] | 3min | school
通过锚定机制提升模型一致性 02-27
模型一致性
锚定机制
模型差异 |
[自动]
[ARXIV] | 3min | school
数据集压缩至1MB:小规模数据集的模型训练效果评估 02-27
PLADA
数据集压缩
伪标签 |
[自动]
[ARXIV] | 3min | school
基于超单纯形投影的可微零一损失函数 02-27
机器学习
损失函数
0-1损失 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 02-27
多模态
视觉语言模型
最优传输 |
[自动]
[ARXIV] | 5min | school
FlashOptim:面向内存高效训练的优化器 02-27
FlashOptim
内存优化
训练优化器 |
[自动]
[ARXIV] | 4min | school
平滑无关学习统计查询复杂度下界 02-26
计算复杂度
统计查询
SQ下界 |
[自动]
[ARXIV] | 4min | school
Test-Time训练结合KV绑定等价于线性注意力 02-26
TTT
线性注意力
KV绑定 |
[自动]
[ARXIV] | 4min | school
针对平滑对抗学习的统计查询下界研究 02-25
统计查询
计算复杂性
对抗学习 |
[自动]
[ARXIV] | 4min | school
KV绑定测试时训练等价于线性注意力 02-25
TTT
线性注意力
KV缓存 |
[自动]
[ARXIV] | 4min | school
离线强化学习:面向离动力学环境的局部动力学感知域适应 02-25
离线强化学习
LoDADA
域适应 |
[自动]
[ARXIV] | 4min | school
行为学习:从数据中学习分层优化结构 02-24
行为学习
分层优化
可解释性 |
[自动]
[ARXIV] | 4min | school
部分软匹配距离:基于部分单元对应的神经表征比较 02-24
神经表征
部分软匹配
最优传输 |
[自动]
[ARXIV] | 4min | school
无需训练的图神经网络跨架构合并方法 02-24
arxiv
cs.LG |
[自动]
[ARXIV] | 4min | school
扩散模型无需噪声调节的几何学原理 02-24
扩散模型
Flow Matching
几何学原理 |
[自动]
[ARXIV] | 5min | school
U(d)子群导出自然RNN与Transformer架构 02-24
RNN
Transformer
序列模型 |
[自动]
[ARXIV] | 3min | school
统一图神经网络均匀表达能力的通用方法 02-23
GNN
图神经网络
表达能力 |
[自动]
[ARXIV] | 4min | school
扩散模型无需噪声条件:几何视角的解释 02-23
扩散模型
几何视角
生成模型 |
[自动]
[ARXIV] | 4min | school
为K分区集成模型分配置信度以提升预测性能 02-23
聚类分析
集成学习
置信度评估 |
[自动]
[ARXIV] | 4min | school
多轮人机协作框架支持用户自定义需求 02-22
人机协作
多轮对话
决策质量 |
[自动]
[ARXIV] | 4min | school
知识嵌入潜在投影提升鲁棒表征学习 02-20
表征学习
数据不平衡
EHR |
[自动]
[ARXIV] | 3min | school
机器遗忘中保护未删除数据隐私的方法 02-20
机器遗忘
隐私保护
重构攻击 |
[自动]
[ARXIV] | 4min | school
知识嵌入隐投影用于鲁棒表征学习 02-19
表征学习
EHR
数据不平衡 |
[自动]
[ARXIV] | 3min | school
机器遗忘中保护未删除数据的隐私防御机制 02-19
机器遗忘
隐私保护
重构攻击 |
[自动]
[ARXIV] | 3min | school
通过任务复杂度量化验证浅层对齐假说 02-19
浅层对齐假说
SAH
任务复杂度 |
[自动]
[ARXIV] | 3min | school
基于D最优统计的高维仿真代理测试时适应稳定化方法 02-18
TTA
仿真代理
分布偏移 |
[自动]
[ARXIV] | 3min | school
长上下文LLM缩放缺陷:隐私与个性化任务揭示注意力分散 02-18
长上下文
LLM
个性化 |
[自动]
[ARXIV] | 4min | school
基于正则化与对称性重审扩散模型及其分子图生成应用 02-18
扩散模型
分子图生成
对称性 |
[自动]
[ARXIV] | 3min | school
长上下文LLM隐私与个性化任务中的缩放差距研究 02-17
长上下文
隐私保护
个性化 |
[自动]
[ARXIV] | 3min | school
语言统计对称性塑造模型表征的几何结构 02-17
表征学习
几何结构
统计对称性 |
[自动]
[ARXIV] | 4min | school
离散扩散模型高效采样:具备锐利性与自适应保证 02-17
离散扩散模型
高效采样
tau-leaping |
[自动]
[ARXIV] | 4min | school
基于标准化的扩散模型对称性重思考与分子图生成 02-17
扩散模型
分子图生成
对称性 |
[自动]
[ARXIV] | 4min | school
利用辅助信息实现少样本设计优化 02-13
贝叶斯优化
少样本学习
设计优化 |
[自动]
[ARXIV] | 4min | school
KAN-FIF:基于样条参数化的轻量级气象卫星热带气旋估算模型 02-13
KAN
气象预测
热带气旋 |
[自动]
[ARXIV] | 3min | school
GENIUS:生成式流体智能评估套件 02-13
GENIUS
流体智力
多模态评估 |
[自动]
[ARXIV] | 2min | school
步级解析数据归因:面向循环Transformer 02-12
arxiv
cs.LG |
[自动]
[ARXIV] | 1min | school
Learning on the Manifold: Unlocking Standard Diffusion 02-12
Diffusion Transformer
DiT
表征学习 |
[自动]
[ARXIV] | 3min | school
迈向可解释联邦学习:理解差分隐私的影响 02-11
联邦学习
差分隐私
可解释性 |
[自动]
[ARXIV] | 1min | school
基于表征编码器解锁标准扩散Transformer 02-11
DiT
扩散模型
流匹配 |
[自动]
[ARXIV] | 1min | school
Transformer模型在低信噪比时间序列预测中的统计基准测试 02-11
arxiv
cs.LG |
[自动]
[ARXIV] | 2min | school
CoFEH:LLM驱动的协同贝叶斯特征工程框架 02-11
arxiv
cs.LG |
[自动]
[ARXIV] | 2min | school
ANCRe: Adaptive Neural Connection Reassignment for Effi 02-11
ANCRe
深度学习
残差连接 |
[自动]
[ARXIV] | 4min | school
ARO:面向大模型矩阵优化的新视角 02-10
矩阵优化
ARO
大模型 |
[自动]
[ARXIV] | 3min | school
下一代验证码:利用认知差异防御GUI智能体 02-10
arxiv
cs.LG |
[自动]
[ARXIV] | 3min | school
ANCRe:自适应神经连接重分配实现高效深度扩展 02-10
arxiv
cs.LG |
[自动]
[ARXIV] | 4min | school
基于朗之万动力学的直接软策略采样 02-10
arxiv
cs.LG |
[自动]
[ARXIV] | 1min | school
MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Rei 02-10
arxiv
cs.LG |
[自动]
[ARXIV] | 3min | school
Harpoon:面向条件表格扩散模型的广义流形引导 02-10
扩散模型
表格数据
流形引导 |
[自动]
[ARXIV] | 4min | school
学习大模型神经元激活的生成式元模型 02-09
神经元激活
生成式模型
元模型 |
[自动]
[ARXIV] | 4min | school
基于熵排序流的非监督解耦表示学习模型 02-09
无监督学习
解耦表示
EOFlows |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直观物理 02-09
VLM
直觉物理
强化学习 |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直觉物理 02-08
VLM
直觉物理
多模态 |
[自动]
[ARXIV] | 4min | school
好奇心即知识:基于主动推理的自一致学习与无悔优化 02-08
主动推理
好奇心
探索与利用 |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直观物理 02-07
VLM
多模态
具身智能 |
[自动]
[ARXIV] | 3min | school
好奇心即知识:基于主动推理的自一致学习与无悔优化 02-07
主动推理
强化学习
好奇心 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:通过伪可逆性提升模型可逆性 02-07
神经网络
伪可逆
SPNN |
[自动]
[ARXIV] | 3min | school
好奇心即知识:基于主动推理的自一致学习与无遗憾优化 02-06
主动推理
探索与利用
自由能 |
[自动]
[ARXIV] | 4min | school
共享 LoRA 子空间实现近乎严格的持续学习 02-06
LoRA
持续学习
微调 |
[自动]
[ARXIV] | 4min | school
数据块模型中的精确恢复方法 02-06
社区检测
随机块模型
数据块模型 |
[自动]
[ARXIV] | 4min | school
DLM-Scope:利用稀疏自编码器解析扩散语言模型 02-06
DLM
SAE
稀疏自编码器 |
[自动]
[ARXIV] | 3min | school
面向物联网模型适应性的对比持续学习方法 02-06
持续学习
对比学习
物联网 |
[自动]
[ARXIV] | 3min | school
数据中的阈下效应:基于对数线性性的通用机制 02-06
LLM
数据质量
Logit-Linear-Selection |
[自动]
[ARXIV] | 5min | school
CRoSS:面向可扩展强化学习的持续机器人仿真套件 02-05
强化学习
持续学习
机器人仿真 |
[自动]
[ARXIV] | 3min | school
面向物联网模型适应性的对比持续学习 02-05
持续学习
对比学习
物联网 |
[自动]
[ARXIV] | 4min | school
利用权重更新稀疏性提升分布式强化学习通信效率 02-05
分布式强化学习
通信效率
权重稀疏性 |
[自动]
[ARXIV] | 5min | school
PLATE:用于几何感知持续学习的可塑性调谐高效适配器 02-05
持续学习
PLATE
模型适配 |
[自动]
[ARXIV] | 3min | school
基于急停干预的鲁棒干预学习 02-04
强化学习
RL
自动驾驶 |
[自动]
[ARXIV] | 4min | school
PLATE:面向几何感知持续学习的可塑性调谐高效适配器 02-04
持续学习
PLATE
高效适配器 |
[自动]
[ARXIV] | 4min | school
通过文本反馈扩展强化学习的能力边界 02-04
强化学习
RLHF
文本反馈 |
[自动]
[ARXIV] | 3min | school
MEG-XL:长上下文预训练实现数据高效的脑电转文本 02-04
MEG-XL
脑机接口
脑电转文本 |
[自动]
[ARXIV] | 4min | school
MEG-XL:基于长上下文预训练的高效脑电转文本模型 02-03
MEG-XL
脑机接口
BCI |
[自动]
[ARXIV] | 3min | school
粒子引导扩散模型用于偏微分方程求解 02-03
扩散模型
PDE求解
物理引导 |
[自动]
[ARXIV] | 5min | school
TEON:张量化正交化方法优化大语言模型预训练 02-03
TEON
优化器
预训练 |
[自动]
[ARXIV] | 4min | school
FOCUS:DLLMs 如何突破算力瓶颈 02-03
DLLMs
扩散模型
推理加速 |
[自动]
[ARXIV] | 4min | school
FOCUS:DLLMs如何突破算力瓶颈 02-02
DLLMs
扩散模型
算力优化 |
[自动]
[ARXIV] | 4min | school
SplineFlow:基于B样条插值的动力系统流匹配方法 02-02
流匹配
SplineFlow
B样条 |
[自动]
[ARXIV] | 4min | school
RN-D:基于正则化网络的离散分类演员与同策强化学习 02-02
强化学习
RL
连续控制 |
[自动]
[ARXIV] | 4min | school
CATTO:平衡语言模型偏好与置信度的方法 02-02
LLM
CATTO
校准 |
[自动]
[ARXIV] | 3min | school
神经网络转逻辑流以优化边缘计算性能 02-02
边缘计算
神经网络
逻辑流 |
[自动]
[ARXIV] | 3min | school
发现模型仓库中的隐藏价值 02-02
模型评估
Llama-3.1
多臂老虎机 |
[自动]
[ARXIV] | 3min | school
挖掘模型仓库中的隐藏价值 02-01
模型评估
Llama
微调 |
2026年一月
14 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
神经网络转逻辑流以优化边缘计算性能 01-31
边缘计算
神经网络
逻辑流 |
[自动]
[ARXIV] | 6min | school
为何Adam在$β_1=β_2$时更优:缺失的梯度尺度不变性原理 01-30
Adam优化器
梯度尺度不变性
深度学习 |
[自动]
[ARXIV] | 4min | school
探索Transformer在表格数据变分自编码器中的位置 01-30
Transformer
VAE
表格数据 |
[自动]
[ARXIV] | 4min | school
R^{2k}维度理论上足以支持基于嵌入的Top-k检索 01-30
向量检索
嵌入维度
Top-k检索 |
[自动]
[ARXIV] | 4min | school
进化策略导致大语言模型出现灾难性遗忘 01-29
进化策略
灾难性遗忘
持续学习 |
[自动]
[ARXIV] | 4min | school
探索Transformer在表格数据变分自编码器中的位置 01-29
Transformer
VAE
表格数据 |
[自动]
[ARXIV] | 3min | school
基于嵌入的Top-$k$检索:理论上$\mathbb{R}^{2k}$维空间已足够 01-29
向量检索
嵌入
Top-k |
[自动]
[ARXIV] | 5min | school
✨告别遗忘!Self-Distillation解锁持续学习新范式! 01-28
持续学习
Self-Distillation
灾难性遗忘 |
[自动]
[ARXIV] | 6min | school
🔥LLM训练动力学新突破!可扩展损失景观曲率度量! 01-27
LLM
训练动力学
损失景观 |
[自动]
[ARXIV] | 4min | school
🧬重磅!基于SE(3)流的刚体模态3D分子生成! 01-26
3D分子生成
SE(3)流
刚体模态 |
[自动]
[ARXIV] | 5min | school
🚀 自回归+掩码扩散:下一代生成式AI!🔥 01-26
扩散模型
自回归
生成式AI |
[自动]
[ARXIV] | 5min | school
🔥LLM训练动力学新突破!可扩展损失景观曲率度量🚀 01-26
LLM
训练动力学
损失景观 |
[自动]
[ARXIV] | 4min | school
🤖反事实训练!让模型学会靠谱又可落地的解释! 01-25
反事实训练
模型解释性
可解释AI |
[自动]
[ARXIV] | 4min | school
测试时也能发现新规律?🤯AI解锁动态学习能力! 01-25
TTT-Discover
测试时训练
强化学习 |
无匹配条目