terminal

AI Stack

rss_feed
SYS_STABLE
目录

模型部署

条目:98
2026年二月 96 篇
类型阅读条目
[自动] [HACKER_NEWS]
6minnewspaper Unsloth Dynamic 2.0 发布:支持 GGUF 格式
02-28 Unsloth GGUF LLM
[自动] [BLOGS_PODCASTS]
3minmic AWS LMI 推理容器更新:提升性能与简化部署
02-28 AWS LMI LLM
[自动] [BLOGS_PODCASTS]
3minmic AWS LMI 容器更新:扩展模型支持并提升推理性能
02-27 AWS LMI LLM
[自动] [BLOGS_PODCASTS]
4minmic AWS发布LMI容器更新:提升托管LLM性能并简化部署
02-27 AWS LMI LLM
[自动] [BLOGS_PODCASTS]
5minmic AWS发布LMI容器更新:提升LLM托管性能与部署效率
02-26 AWS LMI LLM
[自动] [BLOGS_PODCASTS]
4minmic 在 SageMaker AI 与 Bedrock 上高效部署多 LoRA 模型
02-26 vLLM LoRA SageMaker
[自动] [BLOGS_PODCASTS]
5minmic 在 SageMaker AI 与 Amazon Bedrock 上使用 vLLM 高效部署多 LoRA 模型
02-26 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]
5minmic 在SageMaker AI与Bedrock上利用vLLM高效部署多LoRA及MoE模型
02-26 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]
2minmic 亚马逊Bedrock在亚太五区上线Anthropic模型全球跨区域推理
02-26 Amazon Bedrock Anthropic Claude 3
[自动] [BLOGS_PODCASTS]
5minmic AWS SageMaker 集成 Dottxt Outlines 实现 LLM 结构化输出
02-26 AWS SageMaker LLM
[自动] [BLOGS_PODCASTS]
5minmic 在 SageMaker AI 与 Bedrock 上利用 vLLM 高效部署多 LoRA 模型
02-25 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]
5minmic AWS SageMaker实战:用Dottxt Outlines实现LLM结构化输出
02-25 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 中东区域支持 Anthropic Claude 全球跨区域推理
02-25 AWS Amazon Bedrock Anthropic
[自动] [BLOGS_PODCASTS]
4minmic AWS SageMaker集成Dottxt Outlines实现LLM结构化输出
02-25 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 推出中东跨区域推理支持多款 Claude 模型
02-25 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]
4minmic AWS SageMaker实战:利用Dottxt Outlines实现LLM结构化输出
02-25 LLM 结构化输出 AWS SageMaker
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 现支持中东跨区域推理使用 Anthropic Claude 模型
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 设备上部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic 在 Amazon SageMaker 上利用 Dottxt Outlines 实现 LLM 结构化输出
02-25 LLM 结构化输出 Outlines
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊 Bedrock 推出 Claude 模型中东全球跨区域推理
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
2minmic 亚马逊 Bedrock 推出中东跨区域推理支持 Claude 模型
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台上部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic 在Jetson上部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊Bedrock在东南亚及台湾推出Anthropic Claude模型全球跨区域推理
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊 Bedrock 推出中东全球跨区域推理支持 Claude 模型
02-25 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]
3minmic Sonrai携手AWS SageMaker构建MLOps框架加速精准医学试验
02-25 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]
5minmic AWS SageMaker集成Dottxt Outlines实现LLM结构化输出
02-25 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
5minmic 在 Amazon SageMaker 中使用 Outlines 实现 LLM 结构化输出
02-24 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 现支持在中东地区进行跨区域推理,使用 Anthropic Claude 模型
02-24 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 联合 AWS SageMaker 构建 MLOps 框架,加速精准医学临床试验
02-24 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理
02-24 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 推出中东全球跨区域推理支持 Claude 模型
02-24 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 联手 AWS 构建 MLOps 框架加速精准医学试验
02-24 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
4minmic 2025年亚马逊SageMaker AI:增强可观测性与模型定制托管功能
02-24 SageMaker AWS LLM
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 设备上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 成立 Frontier 联盟:携手合作伙伴,护航企业智能体安全落地
02-23 OpenAI Frontier Alliance AI Agent
[自动] [BLOGS_PODCASTS]
4minmic 2025年Amazon SageMaker AI可观测性、模型定制与托管功能增强
02-23 SageMaker AWS LLM
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 利用 SageMaker AI 构建合规 MLOps 框架,加速精准医疗临床试验
02-23 MLOps SageMaker AWS
[自动] [BLOGS_PODCASTS]
3minmic GGML与llama.cpp加入HF推动本地AI长期发展
02-23 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]
4minmic 2025年回顾:SageMaker AI提升可观测性并优化模型定制与托管
02-23 SageMaker AWS LLM
[自动] [BLOGS_PODCASTS]
4minmic GGML与llama.cpp加入HF以保障本地AI长期发展
02-23 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]
3minmic GGML与llama.cpp加入HF,推动本地AI长期发展
02-23 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]
3minmic GGML与llama.cpp加入HF以保障本地AI长期发展
02-22 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]
4minmic 2025年Amazon SageMaker AI回顾:可观测性、模型定制与托管增强
02-22 SageMaker AWS LLM
[自动] [HACKER_NEWS]
4minnewspaper Taalas 如何将大语言模型直接打印至芯片
02-22 Taalas LLM 芯片
[自动] [HACKER_NEWS]
4minnewspaper Taalas 如何将大语言模型“打印”至芯片
02-22 Taalas 芯片 ASIC
[自动] [HACKER_NEWS]
5minnewspaper Taalas技术解析:如何将大模型直接打印至芯片
02-22 Taalas 芯片 LLM
[自动] [HACKER_NEWS]
4minnewspaper Taalas 如何将大语言模型直接打印至芯片
02-22 Taalas LLM ASIC
[自动] [BLOGS_PODCASTS]
3minmic GGML与llama.cpp加入Hugging Face推动本地AI发展
02-21 GGML llama.cpp Hugging Face
[自动] [HACKER_NEWS]
5minnewspaper Ggml.ai加入Hugging Face推动本地AI长期发展
02-21 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]
5minnewspaper Ggml.ai加入Hugging Face以推动本地AI长期发展
02-21 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]
6minnewspaper Ggml.ai 加入 Hugging Face 以推动本地 AI 长期发展
02-21 GGML Hugging Face 本地 AI
[自动] [HACKER_NEWS]
5minnewspaper Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展
02-21 Hugging Face GGML 本地AI
[自动] [HACKER_NEWS]
7minnewspaper 通往普及AI之路:实现每秒1.7万Token推理
02-21 推理加速 Token生成 AI普及
[自动] [HACKER_NEWS]
5minnewspaper 通往普及AI之路:实现每秒1.7万tokens推理
02-21 推理加速 Token生成 性能优化
[自动] [HACKER_NEWS]
5minnewspaper Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展
02-21 GGML Hugging Face 本地 AI
[自动] [BLOGS_PODCASTS]
4minmic GGML与llama.cpp加入HF以推动本地AI长期发展
02-21 GGML llama.cpp Hugging Face
[自动] [HACKER_NEWS]
5minnewspaper Ggml.ai加入Hugging Face推动本地AI长期发展
02-21 GGML Hugging Face 本地AI
[自动] [BLOGS_PODCASTS]
5minmic GGML与llama.cpp加入HF以保障本地AI长期发展
02-20 GGML llama.cpp Hugging Face
[自动] [HACKER_NEWS]
6minnewspaper Ggml.ai加入Hugging Face以推动本地AI长期发展
02-20 GGML Hugging Face 本地AI
[自动] [BLOGS_PODCASTS]
4minmic 2025年回顾:SageMaker AI弹性训练计划与推理性价比优化
02-20 SageMaker AWS 弹性训练
[自动] [BLOGS_PODCASTS]
4minmic GGML与llama.cpp加入HF推动本地AI长期发展
02-20 GGML llama.cpp Hugging Face
[自动] [HACKER_NEWS]
4minnewspaper Ggml.ai加入Hugging Face以推动本地AI长期发展
02-20 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]
5minnewspaper 通往泛在AI之路:实现每秒1.7万tokens推理
02-20 推理加速 Token生成 泛在AI
[自动] [HACKER_NEWS]
4minnewspaper 通往无处不在的AI:实现每秒1.7万tokens推理
02-20 LLM 推理加速 Token
[自动] [HACKER_NEWS]
5minnewspaper Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展
02-20 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]
4minnewspaper Step 3.5 Flash 开源基础模型:支持高速深度推理
02-19 Step 3.5 Flash 开源模型 深度推理
[自动] [HACKER_NEWS]
4minnewspaper Step 3.5 Flash:快到能思考,稳到可执行
02-19 Step 3.5 Flash LLM 推理模型
[自动] [BLOGS_PODCASTS]
2minmic Codex与Claude支持定制内核以适配各类应用
02-14 Claude Codex 定制内核
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS
02-13 NVIDIA Nemotron SageMaker
[自动] [HACKER_NEWS]
7minnewspaper 仅更换框架,一下午提升15个大模型代码能力
02-13 LLM 代码生成 模型评估
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-13 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
5minmic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta
02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta
02-12 NVIDIA AWS SageMaker
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta
02-12 NVIDIA AWS SageMaker
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-12 NVIDIA AWS SageMaker
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS
02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-12 NVIDIA Nemotron AWS
[自动] [ARXIV]
4minschool LoRA-Squeeze:LoRA模块的调优后与调优中压缩方法
02-12 LoRA PEFT 模型压缩
[自动] [BLOGS_PODCASTS]
2minmic Agent-to-agent collaboration: Using Amazon Nova 2 Lite
02-11 Multi-Agent Amazon Bedrock Agent 协作
[自动] [BLOGS_PODCASTS]
4minmic 利用 Hugging Face 与 SageMaker 扩展企业级 LLM 微调
02-10 LLM 微调 Hugging Face
[自动] [HACKER_NEWS]
6minnewspaper Pure C, CPU-only inference with Mistral Voxtral Realtim
02-10 Mistral STT 语音识别
[自动] [HACKER_NEWS]
2minnewspaper Pure C, CPU-only inference with Mistral Voxtral Realtim
02-10 C语言 语音识别 Mistral
[自动] [HACKER_NEWS]
2minnewspaper 纯C语言实现Mistral Voxtral 4B语音模型CPU推理
02-10 C语言 Mistral Voxtral
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-05 DeepSeek AI生态 开源模型
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-04 DeepSeek AI生态 开源模型
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量差
02-02 MLX LLM iPhone 16
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出异常
02-02 MLX LLM iPhone 16
2026年一月 2 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
2minmic 中国开源AI生态的架构选择:超越DeepSeek的构建路径
01-29 DeepSeek 架构选型 中国AI
[自动] [HACKER_NEWS]
5minnewspaper 谷歌将 Gemini 模型集成至 Chrome 浏览器
01-29 Gemini Chrome Google