LINK_STATUS: STABLE // ENCODING: UTF-8

SECTOR_ID: AI_STACK // MODE: LIST

terminal

AI Stack

时间 --:--:--

安全连接 rss_feed

SYS_STABLE

目录

算法优化

条目：12

2026年三月 1 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school 通过锚定机制实现模型一致性 03-01 模型一致性锚定机制 cs.LG

2026年二月 9 篇

类型	阅读	条目
[自动] [BLOGS_PODCASTS]	2min	mic 利用闲置算时将大模型训练速度翻倍且保持精度 02-26 LLM 模型训练算力优化
[自动] [ARXIV]	4min	school 重新思考大模型强化学习中的信任区域机制 02-06 强化学习 LLM PPO
[自动] [ARXIV]	5min	school 重新思考大模型强化学习中的信任区域 02-05 RLHF PPO 强化学习
[自动] [HACKER_NEWS]	6min	newspaper 对称感知泰勒近似实现恒定Token成本注意力机制 02-05 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]	5min	newspaper 基于对称性泰勒近似实现恒定每Token成本注意力机制 02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]	7min	newspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制 02-04 注意力机制 Transformer 泰勒近似
[自动] [ARXIV]	3min	school 训练LLM采用分治推理提升测试时扩展性 02-04 LLM 推理强化学习
[自动] [ARXIV]	3min	school 训练LLM采用分治推理提升测试时扩展性 02-03 LLM 推理强化学习
[自动] [ARXIV]	3min	school 发现模型仓库中的隐藏价值 02-02 模型评估 Llama-3.1 多臂老虎机

2026年一月 2 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school 发现模型仓库中的隐藏价值 01-31 模型评估 Llama 多臂老虎机
[自动] [ARXIV]	4min	school 🚀复用FLOPs！RL突破性扩展：超离策略前缀如何解决硬难题？ 01-28 强化学习 RL LLM