terminal

AI Stack

rss_feed
SYS_STABLE
目录

模型量化

条目:17
2026年三月 3 篇
类型阅读条目
[自动] [HACKER_NEWS]
1minnewspaper 在本地设备运行 AI 模型的硬件与软件指南
03-14 本地部署 边缘计算 硬件指南
[自动] [JUEJIN]
2minsticky_note_2 1-bit 大模型官方推理框架:低显存低功耗 LLM 部署方案
03-13 1-bit LLM 推理框架 模型量化
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA AI-Q登顶DeepResearch Bench I与II榜单
03-12 NVIDIA AI-Q DeepResearch
2026年二月 12 篇
类型阅读条目
[自动] [HACKER_NEWS]
1minnewspaper Unsloth Dynamic 2.0 推出 GGUF 格式模型
02-28 Unsloth GGUF 模型量化
[自动] [HACKER_NEWS]
1minnewspaper Unsloth发布Dynamic 2.0 GGUF模型
02-28 Unsloth GGUF 模型量化
[自动] [HACKER_NEWS]
1minnewspaper Unsloth推出Dynamic 2.0 GGUF模型
02-28 Unsloth GGUF 模型量化
[自动] [HACKER_NEWS]
1minnewspaper zclaw:体积小于888 KB的个人AI助手,可在ESP32运行
02-22 LLM 边缘计算 ESP32
[自动] [HACKER_NEWS]
1minnewspaper zclaw:体积小于888 KB的个人AI助手,可在ESP32运行
02-22 LLM 边缘计算 ESP32
[自动] [HACKER_NEWS]
1minnewspaper 推理服务商如何证明未提供量化模型
02-21 模型推理 模型量化 零知识证明
[自动] [HACKER_NEWS]
1minnewspaper zclaw:体积小于888 KB的个人AI助手,可在ESP32运行
02-21 LLM 边缘计算 ESP32
[自动] [ARXIV]
3minschool ROCKET:校准导向背包增强截断的高效模型压缩
02-12 模型压缩 ROCKET 免训练
[自动] [ARXIV]
5minschool LQA:面向边缘端视觉语言模型的轻量级量化自适应框架
02-10 VLM 边缘计算 模型量化
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量异常
02-02 MLX LLM iPhone 16
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量差
02-02 MLX LLM iPhone
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量异常
02-02 MLX LLM Apple Silicon
2026年一月 2 篇
类型阅读条目
[自动] [HACKER_NEWS]
5minnewspaper 在8位摩托罗拉6809上运行深度卷积神经网络玩棋盘游戏
01-29 复古计算 摩托罗拉6809 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic 中国开源AI生态:超越DeepSeek的架构突围!🏗️🔥
01-28 DeepSeek MoE 架构设计