AI Stack 探索 AI 技术前沿，分享深度思考与实践

条目: 1923
延迟: —
最新内容: 2026-07-15 23:49; 非站点部署时间
当前时间: --:--:--

首页归档搜索标签 AI史塔克关于

TAGS / TERM

模型微调

共 24 篇

NeuroBait：针对ADHD大脑的多巴胺激发模型微调 2026-06-09 · BLOGS_PODCASTS
多语言领域口音适配：Nemotron 3.5 ASR微调教程 2026-06-04 · BLOGS_PODCASTS
海战棋游戏帮助AI学会高效提问 2026-06-03 · BLOGS_PODCASTS
Amazon Nova Forge超参数优化：平衡领域性能与通用能力 2026-06-02 · BLOGS_PODCASTS
Pulse AI与Amazon Bedrock构建金融文档提取管道 2026-05-13 · BLOGS_PODCASTS
Amazon Nova模型的RLAIF强化学习微调实践 2026-04-30 · BLOGS_PODCASTS
大语言模型的在线体验学习框架 2026-03-18 · ARXIV
Mistral AI 发布 Forge 模型微调工具 2026-03-18 · HACKER_NEWS
OpenAI研究员探讨提升大语言模型期望的高回报活动 2026-03-13 · BLOGS_PODCASTS
移除开源大模型审查机制的工具 2026-03-06 · HACKER_NEWS
将机器人AI引入嵌入式平台：数据集录制、VLA微调与端侧优化 2026-03-05 · BLOGS_PODCASTS
AI工程争议：Harness Engineering是否成立 2026-03-05 · BLOGS_PODCASTS
轻量级后门攻击针对多编码器扩散模型研究 2026-03-05 · ARXIV
基于Amazon Nova Canvas构建可扩展虚拟试穿方案 2026-03-03 · BLOGS_PODCASTS
FlashOptim：面向内存高效训练的优化器 2026-02-27 · ARXIV
利用大模型生成判断数据提升应用商店排序相关性 2026-02-27 · ARXIV
Amazon Nova 强化微调：原理、应用场景与实现指南 2026-02-26 · BLOGS_PODCASTS
面向语言模型的在线上下文蒸馏方法 2026-02-13 · ARXIV
共享 LoRA 子空间实现近乎严格的持续学习 2026-02-06 · ARXIV
Qwen3-Coder-Next：下一代代码模型架构与性能解析 2026-02-03 · HACKER_NEWS
推理大模型从被动求解转向主动提问 2026-01-30 · ARXIV
进化策略导致大语言模型出现灾难性遗忘 2026-01-29 · ARXIV
让 Claude 编写 CUDA 内核并指导开源模型 2026-01-29 · BLOGS_PODCASTS
✨告别遗忘！Self-Distillation解锁持续学习新范式！ 2026-01-28 · ARXIV