模型部署

条目：98

2026年二月 96 篇

类型	阅读	条目
[自动] [HACKER_NEWS]	6min	newspaper Unsloth Dynamic 2.0 发布：支持 GGUF 格式 02-28 Unsloth GGUF LLM
[自动] [BLOGS_PODCASTS]	3min	mic AWS LMI 推理容器更新：提升性能与简化部署 02-28 AWS LMI LLM
[自动] [BLOGS_PODCASTS]	3min	mic AWS LMI 容器更新：扩展模型支持并提升推理性能 02-27 AWS LMI LLM
[自动] [BLOGS_PODCASTS]	4min	mic AWS发布LMI容器更新：提升托管LLM性能并简化部署 02-27 AWS LMI LLM
[自动] [BLOGS_PODCASTS]	5min	mic AWS发布LMI容器更新：提升LLM托管性能与部署效率 02-26 AWS LMI LLM
[自动] [BLOGS_PODCASTS]	4min	mic 在 SageMaker AI 与 Bedrock 上高效部署多 LoRA 模型 02-26 vLLM LoRA SageMaker
[自动] [BLOGS_PODCASTS]	5min	mic 在 SageMaker AI 与 Amazon Bedrock 上使用 vLLM 高效部署多 LoRA 模型 02-26 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]	5min	mic 在SageMaker AI与Bedrock上利用vLLM高效部署多LoRA及MoE模型 02-26 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]	2min	mic 亚马逊Bedrock在亚太五区上线Anthropic模型全球跨区域推理 02-26 Amazon Bedrock Anthropic Claude 3
[自动] [BLOGS_PODCASTS]	5min	mic AWS SageMaker 集成 Dottxt Outlines 实现 LLM 结构化输出 02-26 AWS SageMaker LLM
[自动] [BLOGS_PODCASTS]	5min	mic 在 SageMaker AI 与 Bedrock 上利用 vLLM 高效部署多 LoRA 模型 02-25 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]	5min	mic AWS SageMaker实战：用Dottxt Outlines实现LLM结构化输出 02-25 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]	3min	mic Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理 02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]	3min	mic Amazon Bedrock 中东区域支持 Anthropic Claude 全球跨区域推理 02-25 AWS Amazon Bedrock Anthropic
[自动] [BLOGS_PODCASTS]	4min	mic AWS SageMaker集成Dottxt Outlines实现LLM结构化输出 02-25 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]	3min	mic Amazon Bedrock 推出中东跨区域推理支持多款 Claude 模型 02-25 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]	4min	mic AWS SageMaker实战：利用Dottxt Outlines实现LLM结构化输出 02-25 LLM 结构化输出 AWS SageMaker
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台部署开源视觉语言模型 02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic Amazon Bedrock 现支持中东跨区域推理使用 Anthropic Claude 模型 02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 设备上部署开源视觉语言模型 02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic 在 Amazon SageMaker 上利用 Dottxt Outlines 实现 LLM 结构化输出 02-25 LLM 结构化输出 Outlines
[自动] [BLOGS_PODCASTS]	3min	mic 亚马逊 Bedrock 推出 Claude 模型中东全球跨区域推理 02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]	2min	mic 亚马逊 Bedrock 推出中东跨区域推理支持 Claude 模型 02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台上部署开源视觉语言模型 02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic 在Jetson上部署开源视觉语言模型 02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic 亚马逊Bedrock在东南亚及台湾推出Anthropic Claude模型全球跨区域推理 02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]	3min	mic 亚马逊 Bedrock 推出中东全球跨区域推理支持 Claude 模型 02-25 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]	3min	mic Sonrai携手AWS SageMaker构建MLOps框架加速精准医学试验 02-25 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]	5min	mic AWS SageMaker集成Dottxt Outlines实现LLM结构化输出 02-25 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台上部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	5min	mic 在 Amazon SageMaker 中使用 Outlines 实现 LLM 结构化输出 02-24 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]	3min	mic Amazon Bedrock 现支持在中东地区进行跨区域推理，使用 Anthropic Claude 模型 02-24 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台上部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	4min	mic Sonrai 联合 AWS SageMaker 构建 MLOps 框架，加速精准医学临床试验 02-24 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]	3min	mic Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理 02-24 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]	3min	mic Amazon Bedrock 推出中东全球跨区域推理支持 Claude 模型 02-24 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 平台部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	4min	mic Sonrai 联手 AWS 构建 MLOps 框架加速精准医学试验 02-24 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 上部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	4min	mic 2025年亚马逊SageMaker AI：增强可观测性与模型定制托管功能 02-24 SageMaker AWS LLM
[自动] [BLOGS_PODCASTS]	3min	mic 在 Jetson 设备上部署开源视觉语言模型 02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]	3min	mic OpenAI 成立 Frontier 联盟：携手合作伙伴，护航企业智能体安全落地 02-23 OpenAI Frontier Alliance AI Agent
[自动] [BLOGS_PODCASTS]	4min	mic 2025年Amazon SageMaker AI可观测性、模型定制与托管功能增强 02-23 SageMaker AWS LLM
[自动] [BLOGS_PODCASTS]	4min	mic Sonrai 利用 SageMaker AI 构建合规 MLOps 框架，加速精准医疗临床试验 02-23 MLOps SageMaker AWS
[自动] [BLOGS_PODCASTS]	3min	mic GGML与llama.cpp加入HF推动本地AI长期发展 02-23 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]	4min	mic 2025年回顾：SageMaker AI提升可观测性并优化模型定制与托管 02-23 SageMaker AWS LLM
[自动] [BLOGS_PODCASTS]	4min	mic GGML与llama.cpp加入HF以保障本地AI长期发展 02-23 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]	3min	mic GGML与llama.cpp加入HF，推动本地AI长期发展 02-23 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]	3min	mic GGML与llama.cpp加入HF以保障本地AI长期发展 02-22 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]	4min	mic 2025年Amazon SageMaker AI回顾：可观测性、模型定制与托管增强 02-22 SageMaker AWS LLM
[自动] [HACKER_NEWS]	4min	newspaper Taalas 如何将大语言模型直接打印至芯片 02-22 Taalas LLM 芯片
[自动] [HACKER_NEWS]	4min	newspaper Taalas 如何将大语言模型“打印”至芯片 02-22 Taalas 芯片 ASIC
[自动] [HACKER_NEWS]	5min	newspaper Taalas技术解析：如何将大模型直接打印至芯片 02-22 Taalas 芯片 LLM
[自动] [HACKER_NEWS]	4min	newspaper Taalas 如何将大语言模型直接打印至芯片 02-22 Taalas LLM ASIC
[自动] [BLOGS_PODCASTS]	3min	mic GGML与llama.cpp加入Hugging Face推动本地AI发展 02-21 GGML llama.cpp Hugging Face
[自动] [HACKER_NEWS]	5min	newspaper Ggml.ai加入Hugging Face推动本地AI长期发展 02-21 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]	5min	newspaper Ggml.ai加入Hugging Face以推动本地AI长期发展 02-21 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]	6min	newspaper Ggml.ai 加入 Hugging Face 以推动本地 AI 长期发展 02-21 GGML Hugging Face 本地 AI
[自动] [HACKER_NEWS]	5min	newspaper Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展 02-21 Hugging Face GGML 本地AI
[自动] [HACKER_NEWS]	7min	newspaper 通往普及AI之路：实现每秒1.7万Token推理 02-21 推理加速 Token生成 AI普及
[自动] [HACKER_NEWS]	5min	newspaper 通往普及AI之路：实现每秒1.7万tokens推理 02-21 推理加速 Token生成性能优化
[自动] [HACKER_NEWS]	5min	newspaper Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展 02-21 GGML Hugging Face 本地 AI
[自动] [BLOGS_PODCASTS]	4min	mic GGML与llama.cpp加入HF以推动本地AI长期发展 02-21 GGML llama.cpp Hugging Face
[自动] [HACKER_NEWS]	5min	newspaper Ggml.ai加入Hugging Face推动本地AI长期发展 02-21 GGML Hugging Face 本地AI
[自动] [BLOGS_PODCASTS]	5min	mic GGML与llama.cpp加入HF以保障本地AI长期发展 02-20 GGML llama.cpp Hugging Face
[自动] [HACKER_NEWS]	6min	newspaper Ggml.ai加入Hugging Face以推动本地AI长期发展 02-20 GGML Hugging Face 本地AI
[自动] [BLOGS_PODCASTS]	4min	mic 2025年回顾：SageMaker AI弹性训练计划与推理性价比优化 02-20 SageMaker AWS 弹性训练
[自动] [BLOGS_PODCASTS]	4min	mic GGML与llama.cpp加入HF推动本地AI长期发展 02-20 GGML llama.cpp Hugging Face
[自动] [HACKER_NEWS]	4min	newspaper Ggml.ai加入Hugging Face以推动本地AI长期发展 02-20 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]	5min	newspaper 通往泛在AI之路：实现每秒1.7万tokens推理 02-20 推理加速 Token生成泛在AI
[自动] [HACKER_NEWS]	4min	newspaper 通往无处不在的AI：实现每秒1.7万tokens推理 02-20 LLM 推理加速 Token
[自动] [HACKER_NEWS]	5min	newspaper Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展 02-20 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]	4min	newspaper Step 3.5 Flash 开源基础模型：支持高速深度推理 02-19 Step 3.5 Flash 开源模型深度推理
[自动] [HACKER_NEWS]	4min	newspaper Step 3.5 Flash：快到能思考，稳到可执行 02-19 Step 3.5 Flash LLM 推理模型
[自动] [BLOGS_PODCASTS]	2min	mic Codex与Claude支持定制内核以适配各类应用 02-14 Claude Codex 定制内核
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS 02-13 NVIDIA Nemotron SageMaker
[自动] [HACKER_NEWS]	7min	newspaper 仅更换框架，一下午提升15个大模型代码能力 02-13 LLM 代码生成模型评估
[自动] [BLOGS_PODCASTS]	3min	mic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-13 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]	5min	mic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12 NVIDIA AWS SageMaker
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12 NVIDIA AWS SageMaker
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12 NVIDIA AWS SageMaker
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS 02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]	3min	mic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12 NVIDIA Nemotron AWS
[自动] [ARXIV]	4min	school LoRA-Squeeze：LoRA模块的调优后与调优中压缩方法 02-12 LoRA PEFT 模型压缩
[自动] [BLOGS_PODCASTS]	2min	mic Agent-to-agent collaboration: Using Amazon Nova 2 Lite 02-11 Multi-Agent Amazon Bedrock Agent 协作
[自动] [BLOGS_PODCASTS]	4min	mic 利用 Hugging Face 与 SageMaker 扩展企业级 LLM 微调 02-10 LLM 微调 Hugging Face
[自动] [HACKER_NEWS]	6min	newspaper Pure C, CPU-only inference with Mistral Voxtral Realtim 02-10 Mistral STT 语音识别
[自动] [HACKER_NEWS]	2min	newspaper Pure C, CPU-only inference with Mistral Voxtral Realtim 02-10 C语言语音识别 Mistral
[自动] [HACKER_NEWS]	2min	newspaper 纯C语言实现Mistral Voxtral 4B语音模型CPU推理 02-10 C语言 Mistral Voxtral
[自动] [BLOGS_PODCASTS]	2min	mic 全球开源AI生态展望：从DeepSeek到AI+ 02-05 DeepSeek AI生态开源模型
[自动] [BLOGS_PODCASTS]	2min	mic 全球开源AI生态展望：从DeepSeek到AI+ 02-04 DeepSeek AI生态开源模型
[自动] [HACKER_NEWS]	5min	newspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量差 02-02 MLX LLM iPhone 16
[自动] [HACKER_NEWS]	5min	newspaper iPhone 16 Pro Max 运行 MLX 大模型输出异常 02-02 MLX LLM iPhone 16

2026年一月 2 篇

类型	阅读	条目
[自动] [BLOGS_PODCASTS]	2min	mic 中国开源AI生态的架构选择：超越DeepSeek的构建路径 01-29 DeepSeek 架构选型中国AI
[自动] [HACKER_NEWS]	5min	newspaper 谷歌将 Gemini 模型集成至 Chrome 浏览器 01-29 Gemini Chrome Google