目录
模型部署
条目:98
2026年二月
96 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 6min | newspaper
Unsloth Dynamic 2.0 发布:支持 GGUF 格式 02-28
Unsloth
GGUF
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS LMI 推理容器更新:提升性能与简化部署 02-28
AWS
LMI
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS LMI 容器更新:扩展模型支持并提升推理性能 02-27
AWS
LMI
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
AWS发布LMI容器更新:提升托管LLM性能并简化部署 02-27
AWS
LMI
LLM |
[自动]
[BLOGS_PODCASTS] | 5min | mic
AWS发布LMI容器更新:提升LLM托管性能与部署效率 02-26
AWS
LMI
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 SageMaker AI 与 Bedrock 上高效部署多 LoRA 模型 02-26
vLLM
LoRA
SageMaker |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 SageMaker AI 与 Amazon Bedrock 上使用 vLLM 高效部署多 LoRA 模型 02-26
vLLM
LoRA
MoE |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在SageMaker AI与Bedrock上利用vLLM高效部署多LoRA及MoE模型 02-26
vLLM
LoRA
MoE |
[自动]
[BLOGS_PODCASTS] | 2min | mic
亚马逊Bedrock在亚太五区上线Anthropic模型全球跨区域推理 02-26
Amazon Bedrock
Anthropic
Claude 3 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
AWS SageMaker 集成 Dottxt Outlines 实现 LLM 结构化输出 02-26
AWS
SageMaker
LLM |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 SageMaker AI 与 Bedrock 上利用 vLLM 高效部署多 LoRA 模型 02-25
vLLM
LoRA
MoE |
[自动]
[BLOGS_PODCASTS] | 5min | mic
AWS SageMaker实战:用Dottxt Outlines实现LLM结构化输出 02-25
LLM
结构化输出
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 中东区域支持 Anthropic Claude 全球跨区域推理 02-25
AWS
Amazon Bedrock
Anthropic |
[自动]
[BLOGS_PODCASTS] | 4min | mic
AWS SageMaker集成Dottxt Outlines实现LLM结构化输出 02-25
LLM
结构化输出
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 推出中东跨区域推理支持多款 Claude 模型 02-25
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 4min | mic
AWS SageMaker实战:利用Dottxt Outlines实现LLM结构化输出 02-25
LLM
结构化输出
AWS SageMaker |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台部署开源视觉语言模型 02-25
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 现支持中东跨区域推理使用 Anthropic Claude 模型 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 设备上部署开源视觉语言模型 02-25
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Amazon SageMaker 上利用 Dottxt Outlines 实现 LLM 结构化输出 02-25
LLM
结构化输出
Outlines |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊 Bedrock 推出 Claude 模型中东全球跨区域推理 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 2min | mic
亚马逊 Bedrock 推出中东跨区域推理支持 Claude 模型 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台上部署开源视觉语言模型 02-25
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在Jetson上部署开源视觉语言模型 02-25
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊Bedrock在东南亚及台湾推出Anthropic Claude模型全球跨区域推理 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊 Bedrock 推出中东全球跨区域推理支持 Claude 模型 02-25
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Sonrai携手AWS SageMaker构建MLOps框架加速精准医学试验 02-25
MLOps
AWS
SageMaker |
[自动]
[BLOGS_PODCASTS] | 5min | mic
AWS SageMaker集成Dottxt Outlines实现LLM结构化输出 02-25
LLM
结构化输出
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台上部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 Amazon SageMaker 中使用 Outlines 实现 LLM 结构化输出 02-24
LLM
结构化输出
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 现支持在中东地区进行跨区域推理,使用 Anthropic Claude 模型 02-24
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台上部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Sonrai 联合 AWS SageMaker 构建 MLOps 框架,加速精准医学临床试验 02-24
MLOps
AWS
SageMaker |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理 02-24
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 推出中东全球跨区域推理支持 Claude 模型 02-24
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 平台部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Sonrai 联手 AWS 构建 MLOps 框架加速精准医学试验 02-24
MLOps
AWS
SageMaker |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 上部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2025年亚马逊SageMaker AI:增强可观测性与模型定制托管功能 02-24
SageMaker
AWS
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Jetson 设备上部署开源视觉语言模型 02-24
VLM
Jetson
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 成立 Frontier 联盟:携手合作伙伴,护航企业智能体安全落地 02-23
OpenAI
Frontier Alliance
AI Agent |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2025年Amazon SageMaker AI可观测性、模型定制与托管功能增强 02-23
SageMaker
AWS
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Sonrai 利用 SageMaker AI 构建合规 MLOps 框架,加速精准医疗临床试验 02-23
MLOps
SageMaker
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GGML与llama.cpp加入HF推动本地AI长期发展 02-23
GGML
llama.cpp
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2025年回顾:SageMaker AI提升可观测性并优化模型定制与托管 02-23
SageMaker
AWS
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
GGML与llama.cpp加入HF以保障本地AI长期发展 02-23
GGML
llama.cpp
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GGML与llama.cpp加入HF,推动本地AI长期发展 02-23
GGML
llama.cpp
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GGML与llama.cpp加入HF以保障本地AI长期发展 02-22
GGML
llama.cpp
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2025年Amazon SageMaker AI回顾:可观测性、模型定制与托管增强 02-22
SageMaker
AWS
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
Taalas 如何将大语言模型直接打印至芯片 02-22
Taalas
LLM
芯片 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Taalas 如何将大语言模型“打印”至芯片 02-22
Taalas
芯片
ASIC |
[自动]
[HACKER_NEWS] | 5min | newspaper
Taalas技术解析:如何将大模型直接打印至芯片 02-22
Taalas
芯片
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
Taalas 如何将大语言模型直接打印至芯片 02-22
Taalas
LLM
ASIC |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GGML与llama.cpp加入Hugging Face推动本地AI发展 02-21
GGML
llama.cpp
Hugging Face |
[自动]
[HACKER_NEWS] | 5min | newspaper
Ggml.ai加入Hugging Face推动本地AI长期发展 02-21
GGML
Hugging Face
本地AI |
[自动]
[HACKER_NEWS] | 5min | newspaper
Ggml.ai加入Hugging Face以推动本地AI长期发展 02-21
GGML
Hugging Face
本地AI |
[自动]
[HACKER_NEWS] | 6min | newspaper
Ggml.ai 加入 Hugging Face 以推动本地 AI 长期发展 02-21
GGML
Hugging Face
本地 AI |
[自动]
[HACKER_NEWS] | 5min | newspaper
Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展 02-21
Hugging Face
GGML
本地AI |
[自动]
[HACKER_NEWS] | 7min | newspaper
通往普及AI之路:实现每秒1.7万Token推理 02-21
推理加速
Token生成
AI普及 |
[自动]
[HACKER_NEWS] | 5min | newspaper
通往普及AI之路:实现每秒1.7万tokens推理 02-21
推理加速
Token生成
性能优化 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展 02-21
GGML
Hugging Face
本地 AI |
[自动]
[BLOGS_PODCASTS] | 4min | mic
GGML与llama.cpp加入HF以推动本地AI长期发展 02-21
GGML
llama.cpp
Hugging Face |
[自动]
[HACKER_NEWS] | 5min | newspaper
Ggml.ai加入Hugging Face推动本地AI长期发展 02-21
GGML
Hugging Face
本地AI |
[自动]
[BLOGS_PODCASTS] | 5min | mic
GGML与llama.cpp加入HF以保障本地AI长期发展 02-20
GGML
llama.cpp
Hugging Face |
[自动]
[HACKER_NEWS] | 6min | newspaper
Ggml.ai加入Hugging Face以推动本地AI长期发展 02-20
GGML
Hugging Face
本地AI |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2025年回顾:SageMaker AI弹性训练计划与推理性价比优化 02-20
SageMaker
AWS
弹性训练 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
GGML与llama.cpp加入HF推动本地AI长期发展 02-20
GGML
llama.cpp
Hugging Face |
[自动]
[HACKER_NEWS] | 4min | newspaper
Ggml.ai加入Hugging Face以推动本地AI长期发展 02-20
GGML
Hugging Face
本地AI |
[自动]
[HACKER_NEWS] | 5min | newspaper
通往泛在AI之路:实现每秒1.7万tokens推理 02-20
推理加速
Token生成
泛在AI |
[自动]
[HACKER_NEWS] | 4min | newspaper
通往无处不在的AI:实现每秒1.7万tokens推理 02-20
LLM
推理加速
Token |
[自动]
[HACKER_NEWS] | 5min | newspaper
Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展 02-20
GGML
Hugging Face
本地AI |
[自动]
[HACKER_NEWS] | 4min | newspaper
Step 3.5 Flash 开源基础模型:支持高速深度推理 02-19
Step 3.5 Flash
开源模型
深度推理 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Step 3.5 Flash:快到能思考,稳到可执行 02-19
Step 3.5 Flash
LLM
推理模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Codex与Claude支持定制内核以适配各类应用 02-14
Claude
Codex
定制内核 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS 02-13
NVIDIA
Nemotron
SageMaker |
[自动]
[HACKER_NEWS] | 7min | newspaper
仅更换框架,一下午提升15个大模型代码能力 02-13
LLM
代码生成
模型评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-13
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 5min | mic
NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12
NVIDIA
AWS
SageMaker |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12
NVIDIA
AWS
SageMaker |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12
NVIDIA
AWS
SageMaker |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS 02-12
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12
NVIDIA
Nemotron
AWS |
[自动]
[ARXIV] | 4min | school
LoRA-Squeeze:LoRA模块的调优后与调优中压缩方法 02-12
LoRA
PEFT
模型压缩 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Agent-to-agent collaboration: Using Amazon Nova 2 Lite 02-11
Multi-Agent
Amazon Bedrock
Agent 协作 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
利用 Hugging Face 与 SageMaker 扩展企业级 LLM 微调 02-10
LLM
微调
Hugging Face |
[自动]
[HACKER_NEWS] | 6min | newspaper
Pure C, CPU-only inference with Mistral Voxtral Realtim 02-10
Mistral
STT
语音识别 |
[自动]
[HACKER_NEWS] | 2min | newspaper
Pure C, CPU-only inference with Mistral Voxtral Realtim 02-10
C语言
语音识别
Mistral |
[自动]
[HACKER_NEWS] | 2min | newspaper
纯C语言实现Mistral Voxtral 4B语音模型CPU推理 02-10
C语言
Mistral
Voxtral |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-05
DeepSeek
AI生态
开源模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-04
DeepSeek
AI生态
开源模型 |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出质量差 02-02
MLX
LLM
iPhone 16 |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出异常 02-02
MLX
LLM
iPhone 16 |
2026年一月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 2min | mic
中国开源AI生态的架构选择:超越DeepSeek的构建路径 01-29
DeepSeek
架构选型
中国AI |
[自动]
[HACKER_NEWS] | 5min | newspaper
谷歌将 Gemini 模型集成至 Chrome 浏览器 01-29
Gemini
Chrome
Google |
无匹配条目