目录
模型量化
条目:17
2026年三月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 1min | newspaper
在本地设备运行 AI 模型的硬件与软件指南 03-14
本地部署
边缘计算
硬件指南 |
[自动]
[JUEJIN] | 2min | sticky_note_2
1-bit 大模型官方推理框架:低显存低功耗 LLM 部署方案 03-13
1-bit LLM
推理框架
模型量化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA AI-Q登顶DeepResearch Bench I与II榜单 03-12
NVIDIA
AI-Q
DeepResearch |
2026年二月
12 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Dynamic 2.0 推出 GGUF 格式模型 02-28
Unsloth
GGUF
模型量化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth发布Dynamic 2.0 GGUF模型 02-28
Unsloth
GGUF
模型量化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth推出Dynamic 2.0 GGUF模型 02-28
Unsloth
GGUF
模型量化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
zclaw:体积小于888 KB的个人AI助手,可在ESP32运行 02-22
LLM
边缘计算
ESP32 |
[自动]
[HACKER_NEWS] | 1min | newspaper
zclaw:体积小于888 KB的个人AI助手,可在ESP32运行 02-22
LLM
边缘计算
ESP32 |
[自动]
[HACKER_NEWS] | 1min | newspaper
推理服务商如何证明未提供量化模型 02-21
模型推理
模型量化
零知识证明 |
[自动]
[HACKER_NEWS] | 1min | newspaper
zclaw:体积小于888 KB的个人AI助手,可在ESP32运行 02-21
LLM
边缘计算
ESP32 |
[自动]
[ARXIV] | 3min | school
ROCKET:校准导向背包增强截断的高效模型压缩 02-12
模型压缩
ROCKET
免训练 |
[自动]
[ARXIV] | 5min | school
LQA:面向边缘端视觉语言模型的轻量级量化自适应框架 02-10
VLM
边缘计算
模型量化 |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出质量异常 02-02
MLX
LLM
iPhone 16 |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出质量差 02-02
MLX
LLM
iPhone |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出质量异常 02-02
MLX
LLM
Apple Silicon |
2026年一月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 5min | newspaper
在8位摩托罗拉6809上运行深度卷积神经网络玩棋盘游戏 01-29
复古计算
摩托罗拉6809
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
中国开源AI生态:超越DeepSeek的架构突围!🏗️🔥 01-28
DeepSeek
MoE
架构设计 |
无匹配条目