目录
长上下文
条目:49
2026年二月
40 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
DySCO:面向长上下文大模型的动态注意力缩放解码方法 02-27
DySCO
长上下文
解码算法 |
[自动]
[ARXIV] | 4min | school
DySCO:面向长上下文大模型的动态注意力缩放解码 02-26
DySCO
长上下文
注意力机制 |
[自动]
[ARXIV] | 3min | school
面向大模型终端能力扩展的数据工程研究 02-26
LLM
数据工程
终端 |
[自动]
[HACKER_NEWS] | 5min | newspaper
谷歌发布 Gemini 2.5 Pro:支持 100 万上下文窗口 02-20
Gemini
Google
LLM |
[自动]
[HACKER_NEWS] | 5min | newspaper
基于注意力匹配机制实现快速KV压缩 02-20
KV压缩
注意力机制
推理优化 |
[自动]
[HACKER_NEWS] | 5min | newspaper
谷歌发布 Gemini 2.5 Pro:上下文窗口达 100 万 tokens 02-20
Gemini
Google
LLM |
[自动]
[ARXIV] | 4min | school
强化快速权重结合下一序列预测模型 02-20
REFINE
强化学习
快速权重 |
[自动]
[ARXIV] | 4min | school
强化快速权重与下一序列预测 02-19
REFINE
快速权重
强化学习 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Claude Sonnet 4.6 发布:综合性能升级与部分局限 02-19
Claude
Sonnet 4.6
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Claude Sonnet 4.6 发布:基于 4.5 的升级与实测表现 02-19
Claude
Anthropic
Sonnet 4.6 |
[自动]
[ARXIV] | 3min | school
Avey-B:基于视觉基础模型的通用具身智能代理 02-19
Avey-B
NLP
Transformer |
[自动]
[ARXIV] | 5min | school
Avey-B:基于注意力机制的高效视觉Transformer模型 02-18
Avey-B
Transformer
NLP |
[自动]
[HACKER_NEWS] | 6min | newspaper
Claude Sonnet 4.6 发布:兼顾长上下文与高性价比 02-18
Claude
Sonnet 4.6
长上下文 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Claude Sonnet 4.6 发布:基于 4.5 的升级与局限性分析 02-18
Claude
Sonnet 4.6
Anthropic |
[自动]
[HACKER_NEWS] | 5min | newspaper
Claude Sonnet 4.6 发布:兼具高智能与长上下文 02-18
Claude
Sonnet 4.6
Anthropic |
[自动]
[ARXIV] | 3min | school
长上下文LLM缩放缺陷:隐私与个性化任务揭示注意力分散 02-18
长上下文
LLM
个性化 |
[自动]
[ARXIV] | 3min | school
BPP:聚焦关键历史帧的长上下文机器人模仿学习 02-18
机器人
模仿学习
长上下文 |
[自动]
[ARXIV] | 3min | school
长上下文LLM隐私与个性化任务中的缩放差距研究 02-17
长上下文
隐私保护
个性化 |
[自动]
[ARXIV] | 3min | school
BPP:聚焦关键历史帧的长上下文机器人模仿学习 02-17
机器人
模仿学习
长上下文 |
[自动]
[ARXIV] | 4min | school
GPT-5与其他大模型长短上下文性能对比 02-17
GPT-5
LLM
长文本 |
[自动]
[ARXIV] | 4min | school
WebAgent 智能体测试时计算扩展方法 02-16
WebAgent
Test-Time Scaling
CATTS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Z.ai GLM-5开源:新SOTA级开放权重大模型 02-13
GLM-5
Z.ai
SOTA |
[自动]
[ARXIV] | 2min | school
Anagent For Enhancing Scientific Table & Figure Analysi 02-11
Anagent
多智能体
科学图表分析 |
[自动]
[ARXIV] | 4min | school
InftyThink+: 基于强化学习的高效无限视野推理框架 02-09
强化学习
推理框架
思维链 |
[自动]
[ARXIV] | 4min | school
面向运行时智能体记忆的查询感知预算分层路由 02-09
LLM
Agent
Memory |
[自动]
[ARXIV] | 3min | school
面向运行时智能体记忆的查询感知预算层路由 02-08
Agent
LLM
智能体 |
[自动]
[ARXIV] | 5min | school
RRAttention:基于轮询移位的动态块稀疏注意力机制 02-06
RRAttention
稀疏注意力
长上下文 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称感知泰勒近似实现恒定Token成本注意力机制 02-05
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 6min | newspaper
对称感知泰勒近似实现恒定Token成本注意力机制 02-05
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称性泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称性泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 5min | newspaper
基于对称性泰勒近似实现恒定每Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 7min | newspaper
基于对称感知泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[ARXIV] | 4min | school
MemSkill:面向自进化代理的记忆技能学习与演化框架 02-04
MemSkill
智能体
Agent |
[自动]
[ARXIV] | 3min | school
MEG-XL:长上下文预训练实现数据高效的脑电转文本 02-04
MEG-XL
脑机接口
脑电转文本 |
[自动]
[ARXIV] | 4min | school
RE-TRAC:面向深度搜索智能体的递归轨迹压缩方法 02-03
Re-TRAC
深度搜索
智能体 |
[自动]
[ARXIV] | 4min | school
MemSkill:赋予自进化代理学习与演进记忆技能 02-03
MemSkill
智能体
记忆机制 |
[自动]
[ARXIV] | 4min | school
MEG-XL:基于长上下文预训练的高效脑电转文本模型 02-03
MEG-XL
脑机接口
BCI |
[自动]
[ARXIV] | 6min | school
混合线性注意力新架构:高效蒸馏与超长上下文处理 02-02
HALO
HypeNet
混合架构 |
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与超长上下文处理 02-01
Transformer
混合架构
线性注意力 |
2026年一月
9 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与超长上下文建模 01-31
线性注意力
长上下文
混合架构 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Kimi k2.5 技术报告发布:长上下文与推理能力详解 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:长上下文与多模态推理能力详解 01-31
Kimi K2.5
技术报告
长上下文 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-31
Kimi
K2.5
Moonshot |
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与极长上下文处理 01-30
HALO
HypeNet
长上下文 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:强化学习与长上下文能力升级 01-30
Kimi
K2.5
强化学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-30
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 6min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-30
Kimi K2.5
技术报告
长上下文 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Kimi K2.5震撼开源!视觉SOTA Agent模型,性能炸裂🔥 01-27
Kimi
K2.5
多模态 |
无匹配条目