模型优化

条目：97

2026年五月 2 篇

类型	阅读	条目
[自动] [ARXIV]	2min	school 可微分自适应稀疏分层注意力 05-19 稀疏注意力分层注意力可微分
[自动] [ARXIV]	2min	school SpecKV：压缩感知Gamma选择优化自适应推测解码 05-05 大模型推理推测解码压缩感知

2026年四月 2 篇

类型	阅读	条目
[自动] [ARXIV]	1min	school 面向代理多模态模型的元认知工具使用培养 04-10 多模态模型强化学习工具使用
[自动] [HACKER_NEWS]	1min	newspaper 自蒸馏方法提升代码生成效率 04-04 自蒸馏代码生成模型优化

2026年三月 40 篇

类型	阅读	条目
[自动] [HACKER_NEWS]	1min	newspaper Unsloth Studio 03-17 Unsloth LLM 微调
[自动] [BLOGS_PODCASTS]	2min	mic OpenAI研究员谈提升LLM抱负的高回报活动 03-17 OpenAI LLM 模型优化
[自动] [BLOGS_PODCASTS]	4min	mic P-EAGLE：vLLM 集成并行推测解码加速 LLM 推理 03-17 LLM vLLM 推理加速
[自动] [JUEJIN]	2min	sticky_note_2 Amazon Nova Forge 如何缓解大模型微调中的灾难性遗忘 03-17 大模型微调灾难性遗忘 SFT
[自动] [BLOGS_PODCASTS]	2min	mic OpenAI研究员探讨提升LLM抱负的高回报活动 03-14 LLM OpenAI Prompt Engineering
[自动] [JUEJIN]	2min	sticky_note_2 1-bit 大模型官方推理框架：低显存低功耗 LLM 部署方案 03-13 1-bit LLM 推理框架模型量化
[自动] [HACKER_NEWS]	1min	newspaper LLM 模型合并率未见提升，技术瓶颈待解 03-13 LLM 模型合并模型融合
[自动] [BLOGS_PODCASTS]	2min	mic NVIDIA AI-Q登顶DeepResearch Bench I与II榜单 03-12 NVIDIA AI-Q DeepResearch
[自动] [BLOGS_PODCASTS]	2min	mic NVIDIA AI-Q登顶DeepResearch Bench I与II榜单 03-12 NVIDIA AI-Q DeepResearch
[自动] [BLOGS_PODCASTS]	2min	mic AI递归自我改进：迈向AGI的关键进展 03-11 AGI 自我改进递归
[自动] [HACKER_NEWS]	1min	newspaper Launch HN: RunAnywhere (YC W26) – Faster AI Inference o 03-11 Apple Silicon AI 推理模型优化
[自动] [HACKER_NEWS]	1min	newspaper RunAnywhere：在 Apple Silicon 上实现更快的 AI 推理 03-11 RunAnywhere Apple Silicon AI 推理
[自动] [HACKER_NEWS]	1min	newspaper RunAnywhere：在Apple Silicon上实现更快的AI推理 03-11 Apple Silicon AI 推理模型优化
[自动] [ARXIV]	4min	school 尺度空间扩散模型 03-11 扩散模型计算机视觉尺度空间
[自动] [HACKER_NEWS]	2min	newspaper 双游戏GPU登顶HuggingFace开源LLM榜单的实现方法 03-10 LLM HuggingFace GPU
[自动] [HACKER_NEWS]	1min	newspaper RunAnywhere：在 Apple Silicon 上实现更快的 AI 推理 03-10 RunAnywhere Apple Silicon AI 推理
[自动] [HACKER_NEWS]	1min	newspaper 双游戏显卡登顶HuggingFace开源大模型排行榜 03-10 HuggingFace LLM 排行榜
[自动] [HACKER_NEWS]	2min	newspaper RunAnwhere：在 Apple Silicon 上实现更快的 AI 推理 03-10 Apple Silicon AI 推理本地部署
[自动] [BLOGS_PODCASTS]	2min	mic AI实现递归自我改进：AGI迈向新一步 03-10 AGI 递归自我改进 LLM
[自动] [HACKER_NEWS]	1min	newspaper 如何用两张游戏显卡登顶HuggingFace开源大模型榜单 03-10 HuggingFace 开源榜单显卡
[自动] [BLOGS_PODCASTS]	2min	mic 新方法提升AI模型可解释性以增强关键领域信任度 03-09 可解释性 XAI 模型信任
[自动] [BLOGS_PODCASTS]	2min	mic 将机器人AI引入嵌入式平台：数据集录制、VLA微调与端侧优化 03-09 机器人嵌入式 VLA
[自动] [HACKER_NEWS]	1min	newspaper 单GPU微调NanoChat：自动Agent实现端到端训练研究 03-08 微调 Agent 单GPU
[自动] [BLOGS_PODCASTS]	2min	mic 将机器人AI引入嵌入式平台：数据集录制、VLA微调与端侧优化 03-07 机器人嵌入式 VLA
[自动] [BLOGS_PODCASTS]	2min	mic 将机器人AI引入嵌入式平台：数据集录制、VLA微调与端侧优化 03-06 机器人嵌入式 VLA
[自动] [BLOGS_PODCASTS]	2min	mic 将机器人AI移植至嵌入式平台：数据采集、VLA微调与端侧优化 03-06 机器人 VLA 嵌入式
[自动] [BLOGS_PODCASTS]	1min	mic 将机器人AI引入嵌入式平台：数据采集、VLA微调与端侧优化 03-06 机器人嵌入式 VLA
[自动] [BLOGS_PODCASTS]	2min	mic 将机器人AI引入嵌入式平台：数据集构建、VLA微调与端侧优化 03-06 机器人 VLA 端侧部署
[自动] [BLOGS_PODCASTS]	2min	mic 将机器人AI引入嵌入式平台：数据集录制、VLA微调与端侧优化 03-05 机器人 VLA 端侧部署
[自动] [BLOGS_PODCASTS]	2min	mic 将机器人AI引入嵌入式平台：数据集录制、VLA微调与端侧优化 03-05 机器人嵌入式 VLA
[自动] [HACKER_NEWS]	1min	newspaper Qwen3.5 微调指南 03-05 Qwen3.5 微调 Fine-tuning
[自动] [ARXIV]	4min	school Speculative Decoding：推测解码加速大模型推理 03-04 Speculative Decoding 推理加速 SSD
[自动] [HACKER_NEWS]	3min	newspaper Qwen3.5 微调指南：基于 Unsloth 的高效训练流程 03-04 Qwen3.5 Unsloth 微调
[自动] [HACKER_NEWS]	1min	newspaper Speculative Decoding：大模型推理加速的投机解码技术 03-04 Speculative Decoding SSD 推理加速
[自动] [HACKER_NEWS]	1min	newspaper 推测性推测解码：一种加速大模型推理的方法 03-04 SSD 推理加速推测解码
[自动] [HACKER_NEWS]	1min	newspaper 根据硬件资源动态调整大模型规模 03-02 LLM 资源调度动态调整
[自动] [HACKER_NEWS]	1min	newspaper 根据系统硬件配置自动调整大模型规模 03-02 LLM 硬件适配资源调度
[自动] [HACKER_NEWS]	1min	newspaper 根据硬件资源动态调整LLM模型规模 03-02 LLM 模型优化资源调度
[自动] [ARXIV]	4min	school SenCache：基于敏感度感知缓存加速扩散模型推理 03-02 扩散模型 SenCache 推理加速
[自动] [HACKER_NEWS]	1min	newspaper MicroGPT：基于微型Transformer的轻量级语言模型 03-02 MicroGPT Transformer 轻量级模型

2026年二月 48 篇

类型	阅读	条目
[自动] [HACKER_NEWS]	1min	newspaper 能计算两个10位数加法的最小Transformer模型 02-28 Transformer 算法推理算术运算
[自动] [BLOGS_PODCASTS]	2min	mic 使用 Nano Banana 2 构建图像生成与编辑应用 02-27 Nano Banana 2 图像生成图像编辑
[自动] [BLOGS_PODCASTS]	2min	mic Transformer 架构中的混合专家模型原理与优势 02-26 MoE Transformer 混合专家
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 MoE Transformer 混合专家
[自动] [BLOGS_PODCASTS]	2min	mic Transformer中的混合专家模型：架构原理与应用 02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 Transformer MoE 混合专家模型
[自动] [BLOGS_PODCASTS]	2min	mic AI 资讯：中型模型发布凸显闭环效应 02-26 中型模型闭环效应模型发布
[自动] [JUEJIN]	2min	sticky_note_2 空洞卷积原理：如何解决计算机视觉的精度与视野矛盾 02-26 空洞卷积计算机视觉深度学习
[自动] [HACKER_NEWS]	1min	newspaper Mercury 2：基于扩散模型的快速推理大语言模型 02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [HACKER_NEWS]	1min	newspaper Mercury 2：基于扩散模型的快速推理大语言模型 02-25 Mercury 2 扩散模型推理加速
[自动] [ARXIV]	3min	school 基于Tokenizer的文本语言识别方法研究 02-23 UniLID 语言识别 Tokenizer
[自动] [ARXIV]	4min	school 面向扩散语言模型的感知汇点剪枝方法 02-22 扩散模型 DLM 模型剪枝
[自动] [HACKER_NEWS]	1min	newspaper LLM智能体新增Claws层以增强能力 02-22 LLM 智能体 Claws
[自动] [HACKER_NEWS]	2min	newspaper 误差随时间前向传播机制解析 02-22 误差传播时间序列神经网络
[自动] [HACKER_NEWS]	1min	newspaper LLM智能体新增Claws层以增强功能 02-22 LLM 智能体 Claws
[自动] [HACKER_NEWS]	1min	newspaper 迈向通用AI：17k tokens/sec的推理性能路径 02-20 推理性能 Token生成通用AI
[自动] [HACKER_NEWS]	1min	newspaper 一致性扩散语言模型提速14倍且无损质量 02-20 扩散模型一致性模型语言模型
[自动] [HACKER_NEWS]	1min	newspaper 一致性扩散语言模型提速14倍且无损质量 02-20 扩散模型一致性模型语言模型
[自动] [HACKER_NEWS]	1min	newspaper 通往普及AI之路：实现每秒1.7万tokens推理 02-20 推理加速高性能计算 Token吞吐
[自动] [HACKER_NEWS]	1min	newspaper 一致性扩散语言模型提速14倍且无损质量 02-20 扩散模型一致性模型语言模型
[自动] [HACKER_NEWS]	1min	newspaper 利用注意力匹配加速 KV 键值对压缩 02-20 KV压缩注意力机制推理加速
[自动] [HACKER_NEWS]	3min	newspaper 一致性扩散语言模型提速14倍且无损质量 02-20 扩散模型一致性模型语言模型
[自动] [HACKER_NEWS]	4min	newspaper LLM 模型应关注的数据处理与优化策略 02-18 LLM 数据处理模型优化
[自动] [ARXIV]	4min	school MonarchRT：面向实时视频生成的高效注意力机制 02-15 视频生成 DiT 注意力机制
[自动] [HACKER_NEWS]	5min	newspaper 两种加速大模型推理的技术方法 02-15 LLM 推理加速 KV Cache
[自动] [ARXIV]	4min	school 基于策略上下文蒸馏的大语言模型优化方法 02-14 LLM 蒸馏上下文学习
[自动] [BLOGS_PODCASTS]	2min	mic Codex与Claude支持定制化内核 02-13 Codex Claude 定制化内核
[自动] [BLOGS_PODCASTS]	2min	mic Codex 与 Claude 支持构建自定义内核 02-13 Codex Claude 自定义内核
[自动] [HACKER_NEWS]	6min	newspaper 仅改用Harness框架即可提升15个大模型编程能力 02-13 LLM 代码生成 Harness
[自动] [ARXIV]	4min	school Meta-Sel：基于监督元学习的高效上下文学习示例选择方法 02-13 ICL 元学习示例选择
[自动] [BLOGS_PODCASTS]	4min	mic 利用 Hugging Face 与 SageMaker 扩展企业级 LLM 微调 02-10 LLM 微调 Hugging Face
[自动] [HACKER_NEWS]	3min	newspaper 停止生成开始思考：大模型推理范式转变 02-09 推理范式思维链 CoT
[自动] [ARXIV]	4min	school 强化注意力学习：基于奖励反馈的注意力机制优化方法 02-05 强化学习注意力机制多模态
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-05 文本生成图像模型训练消融实验
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-05 文本生成图像模型训练消融实验
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-05 文本生成图像模型训练消融实验
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-04 文本生成图像模型训练消融实验
[自动] [HACKER_NEWS]	6min	newspaper 基于对称性泰勒近似实现恒定Token成本注意力机制 02-04 注意力机制 Transformer 泰勒近似
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-04 文本生成图像模型训练消融实验
[自动] [BLOGS_PODCASTS]	2min	mic 文生图模型训练设计：消融实验的经验总结 02-04 文生图模型训练消融实验
[自动] [HACKER_NEWS]	7min	newspaper FlashAttention-T：张量化注意力机制优化方案 02-04 FlashAttention 注意力机制张量化
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-04 文本生成图像模型训练消融实验
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-03 文本生成图像模型训练消融实验
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-03 文本生成图像模型训练消融实验
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-03 文本生成图像模型训练消融实验
[自动] [ARXIV]	4min	school 神经网络转逻辑流以优化边缘计算性能 02-01 边缘计算神经网络模型优化

2026年一月 5 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school 神经网络转逻辑流以优化边缘计算性能 01-31 边缘计算神经网络逻辑流
[自动] [ARXIV]	4min	school 神经网络转逻辑流以优化边缘计算 01-30 边缘计算神经网络模型优化
[自动] [ARXIV]	4min	school 后训练公平性控制：推荐系统动态公平性单训练框架 01-30 推荐系统公平性 Cofair
[自动] [HACKER_NEWS]	5min	newspaper 压缩智能体：Agent Skills 技术解析 01-30 Agent LLM 技术解析
[自动] [ARXIV]	4min	school 无需真值！🔥颠覆性校准技术来了！🤯 01-28 模型校准无监督学习 LLM