目录
模型部署
条目:173
2026年四月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 1min | mic
Amazon Nova模型Bedrock微调完整指南 04-08
Nova
Bedrock
微调 |
2026年三月
74 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nova Forge SDK发布:简化企业LLM定制流程 03-20
LLM定制
SDK工具
企业AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock环境部署Nemotron 3 Super模型指南 03-20
Nemotron 3
Amazon Bedrock
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nova Forge SDK 训练 Amazon Nova 模型教程 03-19
Nova Forge SDK
Amazon Nova
Amazon SageMaker |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nova Forge SDK 发布:简化企业 LLM 模型定制流程 03-19
LLM定制
SDK
企业AI |
[自动]
[ARXIV] | 3min | school
大语言模型的在线体验学习框架 03-18
LLM
OEL
在线学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Holotron-12B:高吞吐率计算机使用智能体 03-18
Holotron
智能体
计算机使用 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mistral AI 发布 Forge:用于微调和测试的轻量级模型 03-18
Mistral AI
模型微调
轻量级模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Holotron-12B:高吞吐率计算机使用智能体 03-18
Holotron
智能体
Computer Use |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mistral AI 发布 Forge:微调与推理优化工具 03-18
Mistral AI
Forge
模型微调 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mistral AI 发布 Forge 模型微调工具 03-18
Mistral AI
Forge
模型微调 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
Holotron-12B:高吞吐率计算机使用智能体 03-17
Holotron
智能体
Computer Use |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Holotron-12B:高吞吐率计算机操作智能体 03-17
Holotron
计算机操作
Agent |
[自动]
[BLOGS_PODCASTS] | 5min | mic
P-EAGLE:vLLM集成并行推测解码加速LLM推理 03-17
vLLM
P-EAGLE
推测解码 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
P-EAGLE: Faster LLM inference with Parallel Speculative 03-16
LLM
vLLM
P-EAGLE |
[自动]
[HACKER_NEWS] | 1min | newspaper
语言模型团队作为分布式系统的架构设计 03-16
LLM
分布式系统
架构设计 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
P-EAGLE:vLLM集成并行推测解码加速LLM推理 03-16
vLLM
P-EAGLE
推测解码 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM Architecture Gallery 03-16
LLM
架构设计
模型部署 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM Architecture Gallery 03-16
LLM
架构设计
模型部署 |
[自动]
[HACKER_NEWS] | 1min | newspaper
大语言模型架构图集 03-16
LLM
架构图
模型架构 |
[自动]
[HACKER_NEWS] | 1min | newspaper
大语言模型架构图集与设计概览 03-15
LLM
架构设计
Transformer |
[自动]
[BLOGS_PODCASTS] | 4min | mic
P-EAGLE:vLLM 集成并行推测解码加速 LLM 推理 03-15
vLLM
P-EAGLE
推测解码 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
P-EAGLE:vLLM集成并行推测解码加速LLM推理 03-14
vLLM
P-EAGLE
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
P-EAGLE:vLLM集成并行推测解码加速LLM推理 03-13
vLLM
P-EAGLE
推测解码 |
[自动]
[HACKER_NEWS] | 3min | newspaper
IonRouter:低成本高吞吐推理引擎 03-13
IonRouter
推理引擎
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
YC W26项目IonRouter:高吞吐低成本推理引擎 03-12
IonRouter
YC W26
推理引擎 |
[自动]
[HACKER_NEWS] | 1min | newspaper
YC W26项目IonRouter:高吞吐低成本推理引擎 03-12
IonRouter
YC W26
推理引擎 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Untitled 03-12
LLM
Llama
Oumi |
[自动]
[BLOGS_PODCASTS] | 3min | mic
利用Oumi在EC2微调Llama并导入Bedrock部署 03-11
Llama
Oumi
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 2min | mic
在 EC2 上使用 Oumi 微调并部署 Llama 至 Amazon Bedrock 03-11
LLM
Llama
Oumi |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上推出完全托管无服务器模型 03-11
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[HACKER_NEWS] | 2min | newspaper
Launch HN: RunAnywhere (YC W26) – Faster AI Inference o 03-11
Apple Silicon
AI 推理
模型部署 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在印度使用Amazon Bedrock跨区域推理部署Claude模型 03-11
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上提供无服务器服务 03-11
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在印度使用 Amazon Bedrock 跨区域推理运行 Claude 模型 03-11
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线 03-11
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-10
LLM
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上提供无服务器托管 03-10
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-10
LLM
Llama
Oumi |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线 03-10
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-10
Oumi
Llama
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 无服务器模型上推出 03-10
NVIDIA
Amazon Bedrock
Nemotron 3 Nano |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 无服务器服务上推出 03-10
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线 03-10
NVIDIA
Amazon Bedrock
Nemotron 3 Nano |
[自动]
[BLOGS_PODCASTS] | 5min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线 03-10
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线全托管无服务器模型 03-10
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano现已在Amazon Bedrock无服务器服务上推出 03-10
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上提供完全托管无服务器模型 03-09
NVIDIA
Amazon Bedrock
Nemotron 3 Nano |
[自动]
[BLOGS_PODCASTS] | 3min | mic
将机器人AI引入嵌入式平台:数据采集、VLA微调与端侧优化 03-09
机器人
嵌入式
VLA |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在SageMaker上部署SGLang并集成Strands智能体自定义模型 03-09
SageMaker
SGLang
Llama 3.1 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
将机器人AI引入嵌入式平台:数据集录制、VLA微调与端侧优化 03-09
机器人
嵌入式
VLA |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在SageMaker上部署SGLang并构建Strands自定义模型解析器 03-09
SageMaker
SGLang
Strands |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在SageMaker上部署SGLang并集成Strands代理自定义模型 03-09
SageMaker
SGLang
Llama 3.1 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
将机器人AI引入嵌入式平台:数据集记录、VLA微调与端侧优化 03-08
机器人
VLA
嵌入式 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
为Strands智能体构建SageMaker自定义模型解析器 03-08
Strands
SageMaker
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
将机器人AI引入嵌入式平台:数据采集、VLA微调与端侧优化 03-07
机器人
嵌入式
VLA |
[自动]
[BLOGS_PODCASTS] | 4min | mic
为 Strands 智能体构建 SageMaker 托管 LLM 的自定义模型解析器 03-07
SageMaker
Strands
LLM |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 SageMaker 上部署 SGLang 并为 Strands 智能体构建自定义模型解析器 03-07
SageMaker
SGLang
Strands |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在SageMaker部署SGLang并构建Strands代理自定义模型解析器 03-06
SageMaker
SGLang
Strands |
[自动]
[BLOGS_PODCASTS] | 5min | mic
为 Strands 智能体构建 SageMaker 托管 LLM 自定义模型解析器 03-06
AWS
SageMaker
Strands |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在SageMaker部署SGLang并集成Strands代理自定义解析器 03-06
AWS SageMaker
SGLang
Llama 3.1 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
将机器人AI引入嵌入式平台:数据集录制、VLA微调与端侧优化 03-06
机器人
嵌入式
VLA |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在SageMaker上部署SGLang并集成Strands智能体自定义模型 03-06
SageMaker
SGLang
Llama 3.1 |
[自动]
[JUEJIN] | 2min | sticky_note_2
函数计算零配置部署 Qwen3.5 模型 03-06
函数计算
Qwen3.5
模型部署 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
为Strands智能体构建SageMaker自定义模型解析器 03-06
Strands
SageMaker
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
为Strands智能体构建SageMaker托管LLM自定义解析器 03-06
AWS
SageMaker
Strands |
[自动]
[BLOGS_PODCASTS] | 2min | mic
将机器人AI引入嵌入式平台:数据集记录、VLA微调与端侧优化 03-05
机器人
嵌入式
VLA |
[自动]
[BLOGS_PODCASTS] | 4min | mic
为Strands智能体构建SageMaker托管LLM自定义解析器 03-05
LLM
SageMaker
Strands |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 SageMaker 上部署 SGLang 并集成至 Strands 智能体 03-05
SageMaker
SGLang
Strands |
[自动]
[BLOGS_PODCASTS] | 4min | mic
基于Amazon Nova Canvas构建可扩展虚拟试穿方案 03-04
Amazon Nova
AWS
虚拟试穿 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Flash Lite:面向大规模部署的轻量级智能模型 03-04
Gemini
Google
轻量级模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Timber:面向经典机器学习模型的 Ollama,速度比 Python 快 336 倍 03-02
Timber
机器学习
MLOps |
[自动]
[HACKER_NEWS] | 1min | newspaper
Timber:面向经典机器学习模型的部署工具,运行速度较Python提升336倍 03-02
Timber
机器学习
模型部署 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Timber:面向经典机器学习模型,速度较Python提升336倍 03-02
Timber
机器学习
性能优化 |
[自动]
[JUEJIN] | 2min | sticky_note_2
开源推理平台全景:NVIDIA Dynamo、llm-d、KServe等 03-01
推理平台
模型部署
NVIDIA Dynamo |
2026年二月
96 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Dynamic 2.0 发布:支持 GGUF 格式 02-28
Unsloth
GGUF
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS LMI 推理容器更新:提升性能与简化部署 02-28
AWS
LMI
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS LMI 容器更新:扩展模型支持并提升推理性能 02-27
AWS
LMI
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
AWS发布LMI容器更新:提升托管LLM性能并简化部署 02-27
AWS
LMI
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
AWS发布LMI容器更新:提升LLM托管性能与部署效率 02-26
AWS
LMI
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 SageMaker AI 与 Bedrock 上高效部署多 LoRA 模型 02-26
vLLM
LoRA
SageMaker |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 SageMaker AI 与 Amazon Bedrock 上使用 vLLM 高效部署多 LoRA 模型 02-26
vLLM
LoRA
MoE |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在SageMaker AI与Bedrock上利用vLLM高效部署多LoRA及MoE模型 02-26
vLLM
LoRA
MoE |
[自动]
[BLOGS_PODCASTS] | 2min | mic
亚马逊Bedrock在亚太五区上线Anthropic模型全球跨区域推理 02-26
Amazon Bedrock
Anthropic
Claude 3 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
AWS SageMaker 集成 Dottxt Outlines 实现 LLM 结构化输出 02-26
AWS
SageMaker
LLM |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 SageMaker AI 与 Bedrock 上利用 vLLM 高效部署多 LoRA 模型 02-25
vLLM
LoRA
MoE |
[自动]
[BLOGS_PODCASTS] | 5min | mic
AWS SageMaker实战:用Dottxt Outlines实现LLM结构化输出 02-25
LLM
结构化输出
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 中东区域支持 Anthropic Claude 全球跨区域推理 02-25
AWS
Amazon Bedrock
Anthropic |
[自动]
[BLOGS_PODCASTS] | 4min | mic
AWS SageMaker集成Dottxt Outlines实现LLM结构化输出 02-25
LLM
结构化输出
AWS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Amazon Bedrock 推出中东跨区域推理支持多款 Claude 模型 02-25
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 4min | mic
AWS SageMaker实战:利用Dottxt Outlines实现LLM结构化输出 02-25
LLM
结构化输出
AWS SageMaker |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台部署开源视觉语言模型 02-25
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 现支持中东跨区域推理使用 Anthropic Claude 模型 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 设备上部署开源视觉语言模型 02-25
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Amazon SageMaker 上利用 Dottxt Outlines 实现 LLM 结构化输出 02-25
LLM
结构化输出
Outlines |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊 Bedrock 推出 Claude 模型中东全球跨区域推理 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 2min | mic
亚马逊 Bedrock 推出中东跨区域推理支持 Claude 模型 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 2min | mic
在 Jetson 平台上部署开源视觉语言模型 02-25
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在Jetson上部署开源视觉语言模型 02-25
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊Bedrock在东南亚及台湾推出Anthropic Claude模型全球跨区域推理 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊 Bedrock 推出中东全球跨区域推理支持 Claude 模型 02-25
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Sonrai携手AWS SageMaker构建MLOps框架加速精准医学试验 02-25
MLOps
AWS
SageMaker |
[自动]
[BLOGS_PODCASTS] | 4min | mic
AWS SageMaker集成Dottxt Outlines实现LLM结构化输出 02-25
LLM
结构化输出
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台上部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 Amazon SageMaker 中使用 Outlines 实现 LLM 结构化输出 02-24
LLM
结构化输出
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 现支持在中东地区进行跨区域推理,使用 Anthropic Claude 模型 02-24
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台上部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Sonrai 联合 AWS SageMaker 构建 MLOps 框架,加速精准医学临床试验 02-24
MLOps
AWS
SageMaker |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理 02-24
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 推出中东全球跨区域推理支持 Claude 模型 02-24
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Sonrai 联手 AWS 构建 MLOps 框架加速精准医学试验 02-24
MLOps
AWS
SageMaker |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 上部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2025年亚马逊SageMaker AI:增强可观测性与模型定制托管功能 02-24
SageMaker
AWS
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 设备上部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 成立 Frontier 联盟:携手合作伙伴,护航企业智能体安全落地 02-23
OpenAI
Frontier Alliance
AI Agent |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2025年Amazon SageMaker AI可观测性、模型定制与托管功能增强 02-23
SageMaker
AWS
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Sonrai 利用 SageMaker AI 构建合规 MLOps 框架,加速精准医疗临床试验 02-23
MLOps
SageMaker
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GGML与llama.cpp加入HF推动本地AI长期发展 02-23
GGML
llama.cpp
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2025年回顾:SageMaker AI提升可观测性并优化模型定制与托管 02-23
SageMaker
AWS
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
GGML与llama.cpp加入HF以保障本地AI长期发展 02-23
GGML
llama.cpp
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GGML与llama.cpp加入HF,推动本地AI长期发展 02-23
GGML
llama.cpp
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GGML与llama.cpp加入HF以保障本地AI长期发展 02-22
GGML
llama.cpp
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 3min | mic
2025年Amazon SageMaker AI回顾:可观测性、模型定制与托管增强 02-22
SageMaker
AWS
LLM |
[自动]
[HACKER_NEWS] | 3min | newspaper
Taalas 如何将大语言模型直接打印至芯片 02-22
Taalas
LLM
芯片 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Taalas 如何将大语言模型“打印”至芯片 02-22
Taalas
芯片
ASIC |
[自动]
[HACKER_NEWS] | 1min | newspaper
Taalas技术解析:如何将大模型直接打印至芯片 02-22
Taalas
芯片
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
Taalas 如何将大语言模型直接打印至芯片 02-22
Taalas
LLM
ASIC |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GGML与llama.cpp加入Hugging Face推动本地AI发展 02-21
GGML
llama.cpp
Hugging Face |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ggml.ai加入Hugging Face推动本地AI长期发展 02-21
GGML
Hugging Face
本地AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ggml.ai加入Hugging Face以推动本地AI长期发展 02-21
GGML
Hugging Face
本地AI |
[自动]
[HACKER_NEWS] | 2min | newspaper
Ggml.ai 加入 Hugging Face 以推动本地 AI 长期发展 02-21
GGML
Hugging Face
本地 AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展 02-21
Hugging Face
GGML
本地AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
通往普及AI之路:实现每秒1.7万Token推理 02-21
推理加速
Token生成
AI普及 |
[自动]
[HACKER_NEWS] | 1min | newspaper
通往普及AI之路:实现每秒1.7万tokens推理 02-21
推理加速
Token生成
性能优化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展 02-21
GGML
Hugging Face
本地 AI |
[自动]
[BLOGS_PODCASTS] | 4min | mic
GGML与llama.cpp加入HF以推动本地AI长期发展 02-21
GGML
llama.cpp
Hugging Face |
[自动]
[HACKER_NEWS] | 2min | newspaper
Ggml.ai加入Hugging Face推动本地AI长期发展 02-21
GGML
Hugging Face
本地AI |
[自动]
[BLOGS_PODCASTS] | 4min | mic
GGML与llama.cpp加入HF以保障本地AI长期发展 02-20
GGML
llama.cpp
Hugging Face |
[自动]
[HACKER_NEWS] | 2min | newspaper
Ggml.ai加入Hugging Face以推动本地AI长期发展 02-20
GGML
Hugging Face
本地AI |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2025年回顾:SageMaker AI弹性训练计划与推理性价比优化 02-20
SageMaker
AWS
弹性训练 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
GGML与llama.cpp加入HF推动本地AI长期发展 02-20
GGML
llama.cpp
Hugging Face |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ggml.ai加入Hugging Face以推动本地AI长期发展 02-20
GGML
Hugging Face
本地AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
通往泛在AI之路:实现每秒1.7万tokens推理 02-20
推理加速
Token生成
泛在AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
通往无处不在的AI:实现每秒1.7万tokens推理 02-20
LLM
推理加速
Token |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展 02-20
GGML
Hugging Face
本地AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
Step 3.5 Flash 开源基础模型:支持高速深度推理 02-19
Step 3.5 Flash
开源模型
深度推理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Step 3.5 Flash:快到能思考,稳到可执行 02-19
Step 3.5 Flash
LLM
推理模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Codex与Claude支持定制内核以适配各类应用 02-14
Claude
Codex
定制内核 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS 02-13
NVIDIA
Nemotron
SageMaker |
[自动]
[HACKER_NEWS] | 7min | newspaper
仅更换框架,一下午提升15个大模型代码能力 02-13
LLM
代码生成
模型评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-13
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 5min | mic
NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12
NVIDIA
AWS
SageMaker |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12
NVIDIA
AWS
SageMaker |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12
NVIDIA
AWS
SageMaker |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS 02-12
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12
NVIDIA
Nemotron
AWS |
[自动]
[ARXIV] | 3min | school
LoRA-Squeeze:LoRA模块的调优后与调优中压缩方法 02-12
LoRA
PEFT
模型压缩 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Agent-to-agent collaboration: Using Amazon Nova 2 Lite 02-11
Multi-Agent
Amazon Bedrock
Agent 协作 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
利用 Hugging Face 与 SageMaker 扩展企业级 LLM 微调 02-10
LLM
微调
Hugging Face |
[自动]
[HACKER_NEWS] | 5min | newspaper
Pure C, CPU-only inference with Mistral Voxtral Realtim 02-10
Mistral
STT
语音识别 |
[自动]
[HACKER_NEWS] | 2min | newspaper
Pure C, CPU-only inference with Mistral Voxtral Realtim 02-10
C语言
语音识别
Mistral |
[自动]
[HACKER_NEWS] | 2min | newspaper
纯C语言实现Mistral Voxtral 4B语音模型CPU推理 02-10
C语言
Mistral
Voxtral |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-05
DeepSeek
AI生态
开源模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-04
DeepSeek
AI生态
开源模型 |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出质量差 02-02
MLX
LLM
iPhone 16 |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出异常 02-02
MLX
LLM
iPhone 16 |
2026年一月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 2min | mic
中国开源AI生态的架构选择:超越DeepSeek的构建路径 01-29
DeepSeek
架构选型
中国AI |
[自动]
[HACKER_NEWS] | 5min | newspaper
谷歌将 Gemini 模型集成至 Chrome 浏览器 01-29
Gemini
Chrome
Google |
无匹配条目