terminal

AI Stack

rss_feed
SYS_STABLE
目录

模型部署

条目:173
2026年四月 1 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
1minmic Amazon Nova模型Bedrock微调完整指南
04-08 Nova Bedrock 微调
2026年三月 74 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
3minmic Nova Forge SDK发布:简化企业LLM定制流程
03-20 LLM定制 SDK工具 企业AI
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock环境部署Nemotron 3 Super模型指南
03-20 Nemotron 3 Amazon Bedrock AWS
[自动] [BLOGS_PODCASTS]
3minmic Nova Forge SDK 训练 Amazon Nova 模型教程
03-19 Nova Forge SDK Amazon Nova Amazon SageMaker
[自动] [BLOGS_PODCASTS]
3minmic Nova Forge SDK 发布:简化企业 LLM 模型定制流程
03-19 LLM定制 SDK 企业AI
[自动] [ARXIV]
3minschool 大语言模型的在线体验学习框架
03-18 LLM OEL 在线学习
[自动] [BLOGS_PODCASTS]
2minmic Holotron-12B:高吞吐率计算机使用智能体
03-18 Holotron 智能体 计算机使用
[自动] [HACKER_NEWS]
1minnewspaper Mistral AI 发布 Forge:用于微调和测试的轻量级模型
03-18 Mistral AI 模型微调 轻量级模型
[自动] [BLOGS_PODCASTS]
2minmic Holotron-12B:高吞吐率计算机使用智能体
03-18 Holotron 智能体 Computer Use
[自动] [HACKER_NEWS]
1minnewspaper Mistral AI 发布 Forge:微调与推理优化工具
03-18 Mistral AI Forge 模型微调
[自动] [HACKER_NEWS]
1minnewspaper Mistral AI 发布 Forge 模型微调工具
03-18 Mistral AI Forge 模型微调
[自动] [BLOGS_PODCASTS]
1minmic Holotron-12B:高吞吐率计算机使用智能体
03-17 Holotron 智能体 Computer Use
[自动] [BLOGS_PODCASTS]
2minmic Holotron-12B:高吞吐率计算机操作智能体
03-17 Holotron 计算机操作 Agent
[自动] [BLOGS_PODCASTS]
5minmic P-EAGLE:vLLM集成并行推测解码加速LLM推理
03-17 vLLM P-EAGLE 推测解码
[自动] [BLOGS_PODCASTS]
4minmic P-EAGLE: Faster LLM inference with Parallel Speculative
03-16 LLM vLLM P-EAGLE
[自动] [HACKER_NEWS]
1minnewspaper 语言模型团队作为分布式系统的架构设计
03-16 LLM 分布式系统 架构设计
[自动] [BLOGS_PODCASTS]
3minmic P-EAGLE:vLLM集成并行推测解码加速LLM推理
03-16 vLLM P-EAGLE 推测解码
[自动] [HACKER_NEWS]
1minnewspaper LLM Architecture Gallery
03-16 LLM 架构设计 模型部署
[自动] [HACKER_NEWS]
4minnewspaper LLM Architecture Gallery
03-16 LLM 架构设计 模型部署
[自动] [HACKER_NEWS]
1minnewspaper 大语言模型架构图集
03-16 LLM 架构图 模型架构
[自动] [HACKER_NEWS]
1minnewspaper 大语言模型架构图集与设计概览
03-15 LLM 架构设计 Transformer
[自动] [BLOGS_PODCASTS]
4minmic P-EAGLE:vLLM 集成并行推测解码加速 LLM 推理
03-15 vLLM P-EAGLE 推测解码
[自动] [BLOGS_PODCASTS]
3minmic P-EAGLE:vLLM集成并行推测解码加速LLM推理
03-14 vLLM P-EAGLE LLM
[自动] [BLOGS_PODCASTS]
4minmic P-EAGLE:vLLM集成并行推测解码加速LLM推理
03-13 vLLM P-EAGLE 推测解码
[自动] [HACKER_NEWS]
3minnewspaper IonRouter:低成本高吞吐推理引擎
03-13 IonRouter 推理引擎 LLM
[自动] [HACKER_NEWS]
1minnewspaper YC W26项目IonRouter:高吞吐低成本推理引擎
03-12 IonRouter YC W26 推理引擎
[自动] [HACKER_NEWS]
1minnewspaper YC W26项目IonRouter:高吞吐低成本推理引擎
03-12 IonRouter YC W26 推理引擎
[自动] [BLOGS_PODCASTS]
3minmic Untitled
03-12 LLM Llama Oumi
[自动] [BLOGS_PODCASTS]
3minmic 利用Oumi在EC2微调Llama并导入Bedrock部署
03-11 Llama Oumi Amazon Bedrock
[自动] [BLOGS_PODCASTS]
2minmic 在 EC2 上使用 Oumi 微调并部署 Llama 至 Amazon Bedrock
03-11 LLM Llama Oumi
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上推出完全托管无服务器模型
03-11 NVIDIA Nemotron Amazon Bedrock
[自动] [HACKER_NEWS]
2minnewspaper Launch HN: RunAnywhere (YC W26) – Faster AI Inference o
03-11 Apple Silicon AI 推理 模型部署
[自动] [BLOGS_PODCASTS]
3minmic 在印度使用Amazon Bedrock跨区域推理部署Claude模型
03-11 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上提供无服务器服务
03-11 NVIDIA Nemotron Amazon Bedrock
[自动] [BLOGS_PODCASTS]
4minmic 在印度使用 Amazon Bedrock 跨区域推理运行 Claude 模型
03-11 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线
03-11 NVIDIA Nemotron Amazon Bedrock
[自动] [BLOGS_PODCASTS]
3minmic 在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock
03-10 LLM Llama 微调
[自动] [BLOGS_PODCASTS]
5minmic NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上提供无服务器托管
03-10 NVIDIA Nemotron Amazon Bedrock
[自动] [BLOGS_PODCASTS]
4minmic 在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock
03-10 LLM Llama Oumi
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线
03-10 NVIDIA Nemotron Amazon Bedrock
[自动] [BLOGS_PODCASTS]
4minmic 在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock
03-10 Oumi Llama Amazon Bedrock
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 无服务器模型上推出
03-10 NVIDIA Amazon Bedrock Nemotron 3 Nano
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 无服务器服务上推出
03-10 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线
03-10 NVIDIA Amazon Bedrock Nemotron 3 Nano
[自动] [BLOGS_PODCASTS]
5minmic NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线
03-10 NVIDIA Nemotron Amazon Bedrock
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线全托管无服务器模型
03-10 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano现已在Amazon Bedrock无服务器服务上推出
03-10 NVIDIA Nemotron Amazon Bedrock
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上提供完全托管无服务器模型
03-09 NVIDIA Amazon Bedrock Nemotron 3 Nano
[自动] [BLOGS_PODCASTS]
3minmic 将机器人AI引入嵌入式平台:数据采集、VLA微调与端侧优化
03-09 机器人 嵌入式 VLA
[自动] [BLOGS_PODCASTS]
5minmic 在SageMaker上部署SGLang并集成Strands智能体自定义模型
03-09 SageMaker SGLang Llama 3.1
[自动] [BLOGS_PODCASTS]
2minmic 将机器人AI引入嵌入式平台:数据集录制、VLA微调与端侧优化
03-09 机器人 嵌入式 VLA
[自动] [BLOGS_PODCASTS]
5minmic 在SageMaker上部署SGLang并构建Strands自定义模型解析器
03-09 SageMaker SGLang Strands
[自动] [BLOGS_PODCASTS]
3minmic 在SageMaker上部署SGLang并集成Strands代理自定义模型
03-09 SageMaker SGLang Llama 3.1
[自动] [BLOGS_PODCASTS]
2minmic 将机器人AI引入嵌入式平台:数据集记录、VLA微调与端侧优化
03-08 机器人 VLA 嵌入式
[自动] [BLOGS_PODCASTS]
4minmic 为Strands智能体构建SageMaker自定义模型解析器
03-08 Strands SageMaker LLM
[自动] [BLOGS_PODCASTS]
2minmic 将机器人AI引入嵌入式平台:数据采集、VLA微调与端侧优化
03-07 机器人 嵌入式 VLA
[自动] [BLOGS_PODCASTS]
4minmic 为 Strands 智能体构建 SageMaker 托管 LLM 的自定义模型解析器
03-07 SageMaker Strands LLM
[自动] [BLOGS_PODCASTS]
5minmic 在 SageMaker 上部署 SGLang 并为 Strands 智能体构建自定义模型解析器
03-07 SageMaker SGLang Strands
[自动] [BLOGS_PODCASTS]
4minmic 在SageMaker部署SGLang并构建Strands代理自定义模型解析器
03-06 SageMaker SGLang Strands
[自动] [BLOGS_PODCASTS]
5minmic 为 Strands 智能体构建 SageMaker 托管 LLM 自定义模型解析器
03-06 AWS SageMaker Strands
[自动] [BLOGS_PODCASTS]
3minmic 在SageMaker部署SGLang并集成Strands代理自定义解析器
03-06 AWS SageMaker SGLang Llama 3.1
[自动] [BLOGS_PODCASTS]
2minmic 将机器人AI引入嵌入式平台:数据集录制、VLA微调与端侧优化
03-06 机器人 嵌入式 VLA
[自动] [BLOGS_PODCASTS]
3minmic 在SageMaker上部署SGLang并集成Strands智能体自定义模型
03-06 SageMaker SGLang Llama 3.1
[自动] [JUEJIN]
2minsticky_note_2 函数计算零配置部署 Qwen3.5 模型
03-06 函数计算 Qwen3.5 模型部署
[自动] [BLOGS_PODCASTS]
3minmic 为Strands智能体构建SageMaker自定义模型解析器
03-06 Strands SageMaker LLM
[自动] [BLOGS_PODCASTS]
4minmic 为Strands智能体构建SageMaker托管LLM自定义解析器
03-06 AWS SageMaker Strands
[自动] [BLOGS_PODCASTS]
2minmic 将机器人AI引入嵌入式平台:数据集记录、VLA微调与端侧优化
03-05 机器人 嵌入式 VLA
[自动] [BLOGS_PODCASTS]
4minmic 为Strands智能体构建SageMaker托管LLM自定义解析器
03-05 LLM SageMaker Strands
[自动] [BLOGS_PODCASTS]
4minmic 在 SageMaker 上部署 SGLang 并集成至 Strands 智能体
03-05 SageMaker SGLang Strands
[自动] [BLOGS_PODCASTS]
4minmic 基于Amazon Nova Canvas构建可扩展虚拟试穿方案
03-04 Amazon Nova AWS 虚拟试穿
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Flash Lite:面向大规模部署的轻量级智能模型
03-04 Gemini Google 轻量级模型
[自动] [HACKER_NEWS]
1minnewspaper Timber:面向经典机器学习模型的 Ollama,速度比 Python 快 336 倍
03-02 Timber 机器学习 MLOps
[自动] [HACKER_NEWS]
1minnewspaper Timber:面向经典机器学习模型的部署工具,运行速度较Python提升336倍
03-02 Timber 机器学习 模型部署
[自动] [HACKER_NEWS]
1minnewspaper Timber:面向经典机器学习模型,速度较Python提升336倍
03-02 Timber 机器学习 性能优化
[自动] [JUEJIN]
2minsticky_note_2 开源推理平台全景:NVIDIA Dynamo、llm-d、KServe等
03-01 推理平台 模型部署 NVIDIA Dynamo
2026年二月 96 篇
类型阅读条目
[自动] [HACKER_NEWS]
1minnewspaper Unsloth Dynamic 2.0 发布:支持 GGUF 格式
02-28 Unsloth GGUF LLM
[自动] [BLOGS_PODCASTS]
3minmic AWS LMI 推理容器更新:提升性能与简化部署
02-28 AWS LMI LLM
[自动] [BLOGS_PODCASTS]
3minmic AWS LMI 容器更新:扩展模型支持并提升推理性能
02-27 AWS LMI LLM
[自动] [BLOGS_PODCASTS]
4minmic AWS发布LMI容器更新:提升托管LLM性能并简化部署
02-27 AWS LMI LLM
[自动] [BLOGS_PODCASTS]
4minmic AWS发布LMI容器更新:提升LLM托管性能与部署效率
02-26 AWS LMI LLM
[自动] [BLOGS_PODCASTS]
4minmic 在 SageMaker AI 与 Bedrock 上高效部署多 LoRA 模型
02-26 vLLM LoRA SageMaker
[自动] [BLOGS_PODCASTS]
5minmic 在 SageMaker AI 与 Amazon Bedrock 上使用 vLLM 高效部署多 LoRA 模型
02-26 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]
5minmic 在SageMaker AI与Bedrock上利用vLLM高效部署多LoRA及MoE模型
02-26 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]
2minmic 亚马逊Bedrock在亚太五区上线Anthropic模型全球跨区域推理
02-26 Amazon Bedrock Anthropic Claude 3
[自动] [BLOGS_PODCASTS]
5minmic AWS SageMaker 集成 Dottxt Outlines 实现 LLM 结构化输出
02-26 AWS SageMaker LLM
[自动] [BLOGS_PODCASTS]
5minmic 在 SageMaker AI 与 Bedrock 上利用 vLLM 高效部署多 LoRA 模型
02-25 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]
5minmic AWS SageMaker实战:用Dottxt Outlines实现LLM结构化输出
02-25 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 中东区域支持 Anthropic Claude 全球跨区域推理
02-25 AWS Amazon Bedrock Anthropic
[自动] [BLOGS_PODCASTS]
4minmic AWS SageMaker集成Dottxt Outlines实现LLM结构化输出
02-25 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]
2minmic Amazon Bedrock 推出中东跨区域推理支持多款 Claude 模型
02-25 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]
4minmic AWS SageMaker实战:利用Dottxt Outlines实现LLM结构化输出
02-25 LLM 结构化输出 AWS SageMaker
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 现支持中东跨区域推理使用 Anthropic Claude 模型
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 设备上部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic 在 Amazon SageMaker 上利用 Dottxt Outlines 实现 LLM 结构化输出
02-25 LLM 结构化输出 Outlines
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊 Bedrock 推出 Claude 模型中东全球跨区域推理
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
2minmic 亚马逊 Bedrock 推出中东跨区域推理支持 Claude 模型
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
2minmic 在 Jetson 平台上部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic 在Jetson上部署开源视觉语言模型
02-25 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊Bedrock在东南亚及台湾推出Anthropic Claude模型全球跨区域推理
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊 Bedrock 推出中东全球跨区域推理支持 Claude 模型
02-25 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]
3minmic Sonrai携手AWS SageMaker构建MLOps框架加速精准医学试验
02-25 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]
4minmic AWS SageMaker集成Dottxt Outlines实现LLM结构化输出
02-25 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
5minmic 在 Amazon SageMaker 中使用 Outlines 实现 LLM 结构化输出
02-24 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 现支持在中东地区进行跨区域推理,使用 Anthropic Claude 模型
02-24 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 联合 AWS SageMaker 构建 MLOps 框架,加速精准医学临床试验
02-24 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]
2minmic Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理
02-24 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 推出中东全球跨区域推理支持 Claude 模型
02-24 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 平台部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 联手 AWS 构建 MLOps 框架加速精准医学试验
02-24 MLOps AWS SageMaker
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
4minmic 2025年亚马逊SageMaker AI:增强可观测性与模型定制托管功能
02-24 SageMaker AWS LLM
[自动] [BLOGS_PODCASTS]
3minmic 在 Jetson 设备上部署开源视觉语言模型
02-24 VLM Jetson 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 成立 Frontier 联盟:携手合作伙伴,护航企业智能体安全落地
02-23 OpenAI Frontier Alliance AI Agent
[自动] [BLOGS_PODCASTS]
4minmic 2025年Amazon SageMaker AI可观测性、模型定制与托管功能增强
02-23 SageMaker AWS LLM
[自动] [BLOGS_PODCASTS]
4minmic Sonrai 利用 SageMaker AI 构建合规 MLOps 框架,加速精准医疗临床试验
02-23 MLOps SageMaker AWS
[自动] [BLOGS_PODCASTS]
3minmic GGML与llama.cpp加入HF推动本地AI长期发展
02-23 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]
4minmic 2025年回顾:SageMaker AI提升可观测性并优化模型定制与托管
02-23 SageMaker AWS LLM
[自动] [BLOGS_PODCASTS]
4minmic GGML与llama.cpp加入HF以保障本地AI长期发展
02-23 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]
3minmic GGML与llama.cpp加入HF,推动本地AI长期发展
02-23 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]
3minmic GGML与llama.cpp加入HF以保障本地AI长期发展
02-22 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]
3minmic 2025年Amazon SageMaker AI回顾:可观测性、模型定制与托管增强
02-22 SageMaker AWS LLM
[自动] [HACKER_NEWS]
3minnewspaper Taalas 如何将大语言模型直接打印至芯片
02-22 Taalas LLM 芯片
[自动] [HACKER_NEWS]
1minnewspaper Taalas 如何将大语言模型“打印”至芯片
02-22 Taalas 芯片 ASIC
[自动] [HACKER_NEWS]
1minnewspaper Taalas技术解析:如何将大模型直接打印至芯片
02-22 Taalas 芯片 LLM
[自动] [HACKER_NEWS]
1minnewspaper Taalas 如何将大语言模型直接打印至芯片
02-22 Taalas LLM ASIC
[自动] [BLOGS_PODCASTS]
3minmic GGML与llama.cpp加入Hugging Face推动本地AI发展
02-21 GGML llama.cpp Hugging Face
[自动] [HACKER_NEWS]
1minnewspaper Ggml.ai加入Hugging Face推动本地AI长期发展
02-21 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]
1minnewspaper Ggml.ai加入Hugging Face以推动本地AI长期发展
02-21 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]
2minnewspaper Ggml.ai 加入 Hugging Face 以推动本地 AI 长期发展
02-21 GGML Hugging Face 本地 AI
[自动] [HACKER_NEWS]
1minnewspaper Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展
02-21 Hugging Face GGML 本地AI
[自动] [HACKER_NEWS]
1minnewspaper 通往普及AI之路:实现每秒1.7万Token推理
02-21 推理加速 Token生成 AI普及
[自动] [HACKER_NEWS]
1minnewspaper 通往普及AI之路:实现每秒1.7万tokens推理
02-21 推理加速 Token生成 性能优化
[自动] [HACKER_NEWS]
1minnewspaper Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展
02-21 GGML Hugging Face 本地 AI
[自动] [BLOGS_PODCASTS]
4minmic GGML与llama.cpp加入HF以推动本地AI长期发展
02-21 GGML llama.cpp Hugging Face
[自动] [HACKER_NEWS]
2minnewspaper Ggml.ai加入Hugging Face推动本地AI长期发展
02-21 GGML Hugging Face 本地AI
[自动] [BLOGS_PODCASTS]
4minmic GGML与llama.cpp加入HF以保障本地AI长期发展
02-20 GGML llama.cpp Hugging Face
[自动] [HACKER_NEWS]
2minnewspaper Ggml.ai加入Hugging Face以推动本地AI长期发展
02-20 GGML Hugging Face 本地AI
[自动] [BLOGS_PODCASTS]
4minmic 2025年回顾:SageMaker AI弹性训练计划与推理性价比优化
02-20 SageMaker AWS 弹性训练
[自动] [BLOGS_PODCASTS]
4minmic GGML与llama.cpp加入HF推动本地AI长期发展
02-20 GGML llama.cpp Hugging Face
[自动] [HACKER_NEWS]
1minnewspaper Ggml.ai加入Hugging Face以推动本地AI长期发展
02-20 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]
1minnewspaper 通往泛在AI之路:实现每秒1.7万tokens推理
02-20 推理加速 Token生成 泛在AI
[自动] [HACKER_NEWS]
1minnewspaper 通往无处不在的AI:实现每秒1.7万tokens推理
02-20 LLM 推理加速 Token
[自动] [HACKER_NEWS]
1minnewspaper Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展
02-20 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]
1minnewspaper Step 3.5 Flash 开源基础模型:支持高速深度推理
02-19 Step 3.5 Flash 开源模型 深度推理
[自动] [HACKER_NEWS]
1minnewspaper Step 3.5 Flash:快到能思考,稳到可执行
02-19 Step 3.5 Flash LLM 推理模型
[自动] [BLOGS_PODCASTS]
2minmic Codex与Claude支持定制内核以适配各类应用
02-14 Claude Codex 定制内核
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS
02-13 NVIDIA Nemotron SageMaker
[自动] [HACKER_NEWS]
7minnewspaper 仅更换框架,一下午提升15个大模型代码能力
02-13 LLM 代码生成 模型评估
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-13 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
5minmic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta
02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta
02-12 NVIDIA AWS SageMaker
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta
02-12 NVIDIA AWS SageMaker
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-12 NVIDIA AWS SageMaker
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS
02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-12 NVIDIA Nemotron AWS
[自动] [ARXIV]
3minschool LoRA-Squeeze:LoRA模块的调优后与调优中压缩方法
02-12 LoRA PEFT 模型压缩
[自动] [BLOGS_PODCASTS]
2minmic Agent-to-agent collaboration: Using Amazon Nova 2 Lite
02-11 Multi-Agent Amazon Bedrock Agent 协作
[自动] [BLOGS_PODCASTS]
4minmic 利用 Hugging Face 与 SageMaker 扩展企业级 LLM 微调
02-10 LLM 微调 Hugging Face
[自动] [HACKER_NEWS]
5minnewspaper Pure C, CPU-only inference with Mistral Voxtral Realtim
02-10 Mistral STT 语音识别
[自动] [HACKER_NEWS]
2minnewspaper Pure C, CPU-only inference with Mistral Voxtral Realtim
02-10 C语言 语音识别 Mistral
[自动] [HACKER_NEWS]
2minnewspaper 纯C语言实现Mistral Voxtral 4B语音模型CPU推理
02-10 C语言 Mistral Voxtral
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-05 DeepSeek AI生态 开源模型
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-04 DeepSeek AI生态 开源模型
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量差
02-02 MLX LLM iPhone 16
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出异常
02-02 MLX LLM iPhone 16
2026年一月 2 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
2minmic 中国开源AI生态的架构选择:超越DeepSeek的构建路径
01-29 DeepSeek 架构选型 中国AI
[自动] [HACKER_NEWS]
5minnewspaper 谷歌将 Gemini 模型集成至 Chrome 浏览器
01-29 Gemini Chrome Google