长上下文

条目：49

2026年二月 40 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school DySCO：面向长上下文大模型的动态注意力缩放解码方法 02-27 DySCO 长上下文解码算法
[自动] [ARXIV]	4min	school DySCO：面向长上下文大模型的动态注意力缩放解码 02-26 DySCO 长上下文注意力机制
[自动] [ARXIV]	3min	school 面向大模型终端能力扩展的数据工程研究 02-26 LLM 数据工程终端
[自动] [HACKER_NEWS]	5min	newspaper 谷歌发布 Gemini 2.5 Pro：支持 100 万上下文窗口 02-20 Gemini Google LLM
[自动] [HACKER_NEWS]	5min	newspaper 基于注意力匹配机制实现快速KV压缩 02-20 KV压缩注意力机制推理优化
[自动] [HACKER_NEWS]	5min	newspaper 谷歌发布 Gemini 2.5 Pro：上下文窗口达 100 万 tokens 02-20 Gemini Google LLM
[自动] [ARXIV]	4min	school 强化快速权重结合下一序列预测模型 02-20 REFINE 强化学习快速权重
[自动] [ARXIV]	4min	school 强化快速权重与下一序列预测 02-19 REFINE 快速权重强化学习
[自动] [BLOGS_PODCASTS]	3min	mic Claude Sonnet 4.6 发布：综合性能升级与部分局限 02-19 Claude Sonnet 4.6 Anthropic
[自动] [BLOGS_PODCASTS]	2min	mic Claude Sonnet 4.6 发布：基于 4.5 的升级与实测表现 02-19 Claude Anthropic Sonnet 4.6
[自动] [ARXIV]	3min	school Avey-B：基于视觉基础模型的通用具身智能代理 02-19 Avey-B NLP Transformer
[自动] [ARXIV]	5min	school Avey-B：基于注意力机制的高效视觉Transformer模型 02-18 Avey-B Transformer NLP
[自动] [HACKER_NEWS]	6min	newspaper Claude Sonnet 4.6 发布：兼顾长上下文与高性价比 02-18 Claude Sonnet 4.6 长上下文
[自动] [BLOGS_PODCASTS]	3min	mic Claude Sonnet 4.6 发布：基于 4.5 的升级与局限性分析 02-18 Claude Sonnet 4.6 Anthropic
[自动] [HACKER_NEWS]	5min	newspaper Claude Sonnet 4.6 发布：兼具高智能与长上下文 02-18 Claude Sonnet 4.6 Anthropic
[自动] [ARXIV]	3min	school 长上下文LLM缩放缺陷：隐私与个性化任务揭示注意力分散 02-18 长上下文 LLM 个性化
[自动] [ARXIV]	3min	school BPP：聚焦关键历史帧的长上下文机器人模仿学习 02-18 机器人模仿学习长上下文
[自动] [ARXIV]	3min	school 长上下文LLM隐私与个性化任务中的缩放差距研究 02-17 长上下文隐私保护个性化
[自动] [ARXIV]	3min	school BPP：聚焦关键历史帧的长上下文机器人模仿学习 02-17 机器人模仿学习长上下文
[自动] [ARXIV]	4min	school GPT-5与其他大模型长短上下文性能对比 02-17 GPT-5 LLM 长文本
[自动] [ARXIV]	4min	school WebAgent 智能体测试时计算扩展方法 02-16 WebAgent Test-Time Scaling CATTS
[自动] [BLOGS_PODCASTS]	3min	mic Z.ai GLM-5开源：新SOTA级开放权重大模型 02-13 GLM-5 Z.ai SOTA
[自动] [ARXIV]	2min	school Anagent For Enhancing Scientific Table & Figure Analysi 02-11 Anagent 多智能体科学图表分析
[自动] [ARXIV]	4min	school InftyThink+: 基于强化学习的高效无限视野推理框架 02-09 强化学习推理框架思维链
[自动] [ARXIV]	4min	school 面向运行时智能体记忆的查询感知预算分层路由 02-09 LLM Agent Memory
[自动] [ARXIV]	3min	school 面向运行时智能体记忆的查询感知预算层路由 02-08 Agent LLM 智能体
[自动] [ARXIV]	5min	school RRAttention：基于轮询移位的动态块稀疏注意力机制 02-06 RRAttention 稀疏注意力长上下文
[自动] [HACKER_NEWS]	6min	newspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制 02-05 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]	6min	newspaper 对称感知泰勒近似实现恒定Token成本注意力机制 02-05 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]	6min	newspaper 基于对称性泰勒近似实现恒定Token成本注意力机制 02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]	6min	newspaper 基于对称性泰勒近似实现恒定Token成本注意力机制 02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]	5min	newspaper 基于对称性泰勒近似实现恒定每Token成本注意力机制 02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]	7min	newspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制 02-04 注意力机制 Transformer 泰勒近似
[自动] [ARXIV]	4min	school MemSkill：面向自进化代理的记忆技能学习与演化框架 02-04 MemSkill 智能体 Agent
[自动] [ARXIV]	3min	school MEG-XL：长上下文预训练实现数据高效的脑电转文本 02-04 MEG-XL 脑机接口脑电转文本
[自动] [ARXIV]	4min	school RE-TRAC：面向深度搜索智能体的递归轨迹压缩方法 02-03 Re-TRAC 深度搜索智能体
[自动] [ARXIV]	4min	school MemSkill：赋予自进化代理学习与演进记忆技能 02-03 MemSkill 智能体记忆机制
[自动] [ARXIV]	4min	school MEG-XL：基于长上下文预训练的高效脑电转文本模型 02-03 MEG-XL 脑机接口 BCI
[自动] [ARXIV]	6min	school 混合线性注意力新架构：高效蒸馏与超长上下文处理 02-02 HALO HypeNet 混合架构
[自动] [ARXIV]	5min	school 混合线性注意力新架构：高效蒸馏与超长上下文处理 02-01 Transformer 混合架构线性注意力

2026年一月 9 篇

类型	阅读	条目
[自动] [ARXIV]	5min	school 混合线性注意力新架构：高效蒸馏与超长上下文建模 01-31 线性注意力长上下文混合架构
[自动] [HACKER_NEWS]	5min	newspaper Kimi k2.5 技术报告发布：长上下文与推理能力详解 01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]	4min	newspaper Kimi K2.5 技术报告发布：长上下文与多模态推理能力详解 01-31 Kimi K2.5 技术报告长上下文
[自动] [HACKER_NEWS]	7min	newspaper Kimi K2.5 技术报告发布：长上下文与推理能力升级 01-31 Kimi K2.5 Moonshot
[自动] [ARXIV]	5min	school 混合线性注意力新架构：高效蒸馏与极长上下文处理 01-30 HALO HypeNet 长上下文
[自动] [HACKER_NEWS]	4min	newspaper Kimi K2.5 技术报告发布：强化学习与长上下文能力升级 01-30 Kimi K2.5 强化学习
[自动] [HACKER_NEWS]	4min	newspaper Kimi K2.5 技术报告发布：长上下文与推理能力升级 01-30 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]	6min	newspaper Kimi K2.5 技术报告发布：长上下文与推理能力升级 01-30 Kimi K2.5 技术报告长上下文
[自动] [HACKER_NEWS]	3min	newspaper Kimi K2.5震撼开源！视觉SOTA Agent模型，性能炸裂🔥 01-27 Kimi K2.5 多模态