terminal

AI Stack

rss_feed
SYS_STABLE
目录

长上下文

条目:78
2026年三月 29 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
3minmic [AINews] Context Drought
03-17 Anthropic Claude 长上下文
[自动] [BLOGS_PODCASTS]
2minmic RAG后的检索优化:混合搜索、Agent与数据库设计
03-16 RAG 混合搜索 向量数据库
[自动] [ARXIV]
3minschool Spatial-TTT:基于测试时训练的流式视觉空间智能
03-15 计算机视觉 测试时训练 流式处理
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 百万 token 上下文窗口通用版为何姗姗来迟
03-15 Anthropic Claude 长上下文
[自动] [ARXIV]
3minschool Spatial-TTT:基于测试时训练的流式视觉空间智能
03-14 Spatial-TTT 测试时训练 空间智能
[自动] [HACKER_NEWS]
1minnewspaper Opus 4.6 与 Sonnet 4.6 现已开放 100 万上下文窗口
03-14 Claude Opus 4.6 Sonnet 4.6
[自动] [HACKER_NEWS]
1minnewspaper Opus 4.6 与 Sonnet 4.6 现已开放百万级上下文窗口
03-14 Claude Anthropic 长上下文
[自动] [HACKER_NEWS]
1minnewspaper Opus 4.6 与 Sonnet 4.6 现已开放 100 万上下文窗口
03-14 Claude Opus Sonnet
[自动] [BLOGS_PODCASTS]
3minmic Ulysses序列并行:实现百万级Token上下文训练
03-10 Ulysses 序列并行 长上下文
[自动] [BLOGS_PODCASTS]
4minmic Ulysses序列并行:实现百万级Token上下文训练
03-10 Ulysses 序列并行 长上下文
[自动] [BLOGS_PODCASTS]
4minmic Ulysses序列并行技术支持百万级Token上下文训练
03-10 Ulysses 序列并行 长上下文
[自动] [BLOGS_PODCASTS]
4minmic Ulysses序列并行技术实现百万Token上下文训练
03-10 Ulysses 序列并行 长上下文
[自动] [BLOGS_PODCASTS]
3minmic Ulysses序列并行:支持百万Token上下文训练
03-09 Ulysses 序列并行 长上下文
[自动] [BLOGS_PODCASTS]
3minmic Ulysses序列并行技术实现百万Token上下文训练
03-09 Ulysses 序列并行 长上下文
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT-5.4:面向专业工作,支持百万token上下文
03-09 OpenAI GPT-5.4 LLM
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT-5.4:百万token上下文,强化代码与工具调用
03-08 OpenAI GPT-5.4 LLM
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT-5.4:百万token上下文与代码能力前沿模型
03-08 OpenAI GPT-5.4 LLM
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT-5.4:支持百万token上下文与计算机操作的前沿模型
03-07 OpenAI GPT-5.4 LLM
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT-5.4:百万token上下文与代码能力提升
03-07 OpenAI GPT-5.4 LLM
[自动] [BLOGS_PODCASTS]
2minmic 谷歌二月发布Gemini 3.1 Pro与Nano Banana 2
03-07 Google Gemini 1.5 Pro Gemini Nano
[自动] [BLOGS_PODCASTS]
2minmic OpenAI推出GPT-5.4:支持百万token上下文与计算机操作
03-07 OpenAI GPT-5.4 LLM
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布GPT-5.4:百万token上下文,强化代码与工具调用
03-06 OpenAI GPT-5.4 LLM
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT-5.4:百万token上下文与代码操控能力
03-06 OpenAI GPT-5.4 LLM
[自动] [ARXIV]
3minschool τ-Knowledge:评估非结构化知识下的对话智能体
03-06 对话智能体 评估基准 非结构化知识
[自动] [ARXIV]
3minschool τ-Knowledge:评估非结构化知识中的对话智能体
03-05 Agent RAG 评估基准
[自动] [ARXIV]
3minschool LoGeR:基于混合记忆的长上下文几何重建
03-05 LoGeR 3D重建 长上下文
[自动] [ARXIV]
3minschool LoGeR:基于混合记忆的长上下文几何重建
03-04 LoGeR 几何重建 3D重建
[自动] [ARXIV]
5minschool 多头低秩注意力机制
03-03 MLRA 注意力机制 长上下文
[自动] [ARXIV]
4minschool RNN引入记忆缓存机制以实现动态增长的存储能力
03-02 RNN 长上下文 Memory Caching
2026年二月 40 篇
类型阅读条目
[自动] [ARXIV]
3minschool DySCO:面向长上下文大模型的动态注意力缩放解码方法
02-27 DySCO 长上下文 解码算法
[自动] [ARXIV]
3minschool DySCO:面向长上下文大模型的动态注意力缩放解码
02-26 DySCO 长上下文 注意力机制
[自动] [ARXIV]
3minschool 面向大模型终端能力扩展的数据工程研究
02-26 LLM 数据工程 终端
[自动] [HACKER_NEWS]
1minnewspaper 谷歌发布 Gemini 2.5 Pro:支持 100 万上下文窗口
02-20 Gemini Google LLM
[自动] [HACKER_NEWS]
1minnewspaper 基于注意力匹配机制实现快速KV压缩
02-20 KV压缩 注意力机制 推理优化
[自动] [HACKER_NEWS]
6minnewspaper 谷歌发布 Gemini 2.5 Pro:上下文窗口达 100 万 tokens
02-20 Gemini Google LLM
[自动] [ARXIV]
4minschool 强化快速权重结合下一序列预测模型
02-20 REFINE 强化学习 快速权重
[自动] [ARXIV]
4minschool 强化快速权重与下一序列预测
02-19 REFINE 快速权重 强化学习
[自动] [BLOGS_PODCASTS]
3minmic Claude Sonnet 4.6 发布:综合性能升级与部分局限
02-19 Claude Sonnet 4.6 Anthropic
[自动] [BLOGS_PODCASTS]
2minmic Claude Sonnet 4.6 发布:基于 4.5 的升级与实测表现
02-19 Claude Anthropic Sonnet 4.6
[自动] [ARXIV]
3minschool Avey-B:基于视觉基础模型的通用具身智能代理
02-19 Avey-B NLP Transformer
[自动] [ARXIV]
5minschool Avey-B:基于注意力机制的高效视觉Transformer模型
02-18 Avey-B Transformer NLP
[自动] [HACKER_NEWS]
5minnewspaper Claude Sonnet 4.6 发布:兼顾长上下文与高性价比
02-18 Claude Sonnet 4.6 长上下文
[自动] [BLOGS_PODCASTS]
3minmic Claude Sonnet 4.6 发布:基于 4.5 的升级与局限性分析
02-18 Claude Sonnet 4.6 Anthropic
[自动] [HACKER_NEWS]
5minnewspaper Claude Sonnet 4.6 发布:兼具高智能与长上下文
02-18 Claude Sonnet 4.6 Anthropic
[自动] [ARXIV]
3minschool 长上下文LLM缩放缺陷:隐私与个性化任务揭示注意力分散
02-18 长上下文 LLM 个性化
[自动] [ARXIV]
3minschool BPP:聚焦关键历史帧的长上下文机器人模仿学习
02-18 机器人 模仿学习 长上下文
[自动] [ARXIV]
3minschool 长上下文LLM隐私与个性化任务中的缩放差距研究
02-17 长上下文 隐私保护 个性化
[自动] [ARXIV]
3minschool BPP:聚焦关键历史帧的长上下文机器人模仿学习
02-17 机器人 模仿学习 长上下文
[自动] [ARXIV]
4minschool GPT-5与其他大模型长短上下文性能对比
02-17 GPT-5 LLM 长文本
[自动] [ARXIV]
4minschool WebAgent 智能体测试时计算扩展方法
02-16 WebAgent Test-Time Scaling CATTS
[自动] [BLOGS_PODCASTS]
3minmic Z.ai GLM-5开源:新SOTA级开放权重大模型
02-13 GLM-5 Z.ai SOTA
[自动] [ARXIV]
2minschool Anagent For Enhancing Scientific Table & Figure Analysi
02-11 Anagent 多智能体 科学图表分析
[自动] [ARXIV]
4minschool InftyThink+: 基于强化学习的高效无限视野推理框架
02-09 强化学习 推理框架 思维链
[自动] [ARXIV]
4minschool 面向运行时智能体记忆的查询感知预算分层路由
02-09 LLM Agent Memory
[自动] [ARXIV]
3minschool 面向运行时智能体记忆的查询感知预算层路由
02-08 Agent LLM 智能体
[自动] [ARXIV]
5minschool RRAttention:基于轮询移位的动态块稀疏注意力机制
02-06 RRAttention 稀疏注意力 长上下文
[自动] [HACKER_NEWS]
6minnewspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制
02-05 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
6minnewspaper 对称感知泰勒近似实现恒定Token成本注意力机制
02-05 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
6minnewspaper 基于对称性泰勒近似实现恒定Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
6minnewspaper 基于对称性泰勒近似实现恒定Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
5minnewspaper 基于对称性泰勒近似实现恒定每Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
7minnewspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [ARXIV]
4minschool MemSkill:面向自进化代理的记忆技能学习与演化框架
02-04 MemSkill 智能体 Agent
[自动] [ARXIV]
3minschool MEG-XL:长上下文预训练实现数据高效的脑电转文本
02-04 MEG-XL 脑机接口 脑电转文本
[自动] [ARXIV]
4minschool RE-TRAC:面向深度搜索智能体的递归轨迹压缩方法
02-03 Re-TRAC 深度搜索 智能体
[自动] [ARXIV]
4minschool MemSkill:赋予自进化代理学习与演进记忆技能
02-03 MemSkill 智能体 记忆机制
[自动] [ARXIV]
3minschool MEG-XL:基于长上下文预训练的高效脑电转文本模型
02-03 MEG-XL 脑机接口 BCI
[自动] [ARXIV]
6minschool 混合线性注意力新架构:高效蒸馏与超长上下文处理
02-02 HALO HypeNet 混合架构
[自动] [ARXIV]
4minschool 混合线性注意力新架构:高效蒸馏与超长上下文处理
02-01 Transformer 混合架构 线性注意力
2026年一月 9 篇
类型阅读条目
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与超长上下文建模
01-31 线性注意力 长上下文 混合架构
[自动] [HACKER_NEWS]
4minnewspaper Kimi k2.5 技术报告发布:长上下文与推理能力详解
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:长上下文与多模态推理能力详解
01-31 Kimi K2.5 技术报告 长上下文
[自动] [HACKER_NEWS]
7minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-31 Kimi K2.5 Moonshot
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与极长上下文处理
01-30 HALO HypeNet 长上下文
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:强化学习与长上下文能力升级
01-30 Kimi K2.5 强化学习
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-30 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
6minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-30 Kimi K2.5 技术报告 长上下文
[自动] [HACKER_NEWS]
3minnewspaper Kimi K2.5震撼开源!视觉SOTA Agent模型,性能炸裂🔥
01-27 Kimi K2.5 多模态