terminal

AI Stack

rss_feed
SYS_STABLE
目录

大模型

条目:2078
2026年三月 27 篇
类型阅读条目
[自动] [ARXIV]
3minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
03-01 VLM 视觉语言模型 报告偏差
[自动] [ARXIV]
4minschool 理解AI科研工具使用与交互的Asta数据集
03-01 Asta数据集 RAG 科研工具
[自动] [HACKER_NEWS]
4minnewspaper 构建极简Transformer模型实现10位数加法运算
03-01 Transformer LLM 算法推理
[自动] [ARXIV]
4minschool 基于锚定机制实现模型一致性验证
03-01 模型一致性 锚定机制 模型差异
[自动] [ARXIV]
4minschool 基于单纯形投影的可微零一损失函数
03-01 损失函数 0-1损失 超单纯形投影
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
03-01 多模态 视觉语言模型 最优传输
[自动] [BLOGS_PODCASTS]
2minmic SemiAnalysis创始人谈2000亿美元AI资本开支与2027年谷歌盈利前景
03-01 SemiAnalysis Dylan Patel 资本开支
[自动] [ARXIV]
4minschool SeeThrough3D:文本生成图像中的遮挡感知三维控制
03-01 SeeThrough3D 文本生成图像 3D控制
[自动] [BLOGS_PODCASTS]
3minmic OpenAI与亚马逊达成战略合作,Frontier平台入驻AWS
03-01 OpenAI AWS 亚马逊
[自动] [BLOGS_PODCASTS]
2minmic Nano Banana 2:Gemini 3.1 Flash 图像生成模型预览
03-01 Gemini 图像生成 SOTA
[自动] [HACKER_NEWS]
3minnewspaper MicroGPT:基于微型架构的轻量级大语言模型
03-01 MicroGPT 轻量级模型 LLM
[自动] [BLOGS_PODCASTS]
2minmic METR Joel Becker谈指数级时间视野评估与AI生产力边界
03-01 METR Joel Becker AI评估
[自动] [HACKER_NEWS]
5minnewspaper 构建极简Transformer实现十位数加法运算
03-01 Transformer LLM 算法实现
[自动] [HACKER_NEWS]
5minnewspaper Qwen3.5 122B与35B模型本地实现Sonnet 4.5性能
03-01 Qwen3.5 Sonnet 4.5 本地部署
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析
03-01 模型蒸馏 合成数据 SWE-Bench
[自动] [HACKER_NEWS]
4minnewspaper 构建极简Transformer模型实现十位数加法运算
03-01 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
5minnewspaper 利用大语言模型实现确定性编程
03-01 LLM 确定性编程 代码生成
[自动] [BLOGS_PODCASTS]
3minmic OpenAI与亚马逊达成战略合作,在AWS部署Frontier模型与企业级智能体
03-01 OpenAI AWS 亚马逊
[自动] [BLOGS_PODCASTS]
4minmic Nano Banana 2:Gemini 2.5 Pro与SOTA文生图模型
03-01 Gemini 3.1 Nano Banana 2 文生图
[自动] [BLOGS_PODCASTS]
2minmic METR Joel Becker谈指数级时间视野评估与AI生产力极限
03-01 AI评估 METR 时间视野
[自动] [BLOGS_PODCASTS]
3minmic Anthropic模型蒸馏与SWE-Bench失效机制分析
03-01 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova强化微调原理、应用场景与实现路径解析
03-01 Amazon Nova 强化微调 RFT
[自动] [HACKER_NEWS]
4minnewspaper 构建极简Transformer模型实现十位数加法运算
03-01 Transformer 模型构建 算术运算
[自动] [HACKER_NEWS]
5minnewspaper 利用大语言模型实现确定性编程
03-01 LLM 确定性编程 代码生成
[自动] [BLOGS_PODCASTS]
3minmic OpenAI与亚马逊达成战略合作,在AWS部署Frontier模型
03-01 OpenAI AWS 亚马逊
[自动] [BLOGS_PODCASTS]
3minmic Anthropic模型蒸馏与SWE-Bench失效机制分析
03-01 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova 强化微调原理、应用场景与实现选项解析
03-01 Amazon Nova 强化微调 RFT
2026年二月 1751 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
3minmic 首个 Gemini 3.1 模型 Nano Banana 2 预览:SOTA 图像生成
02-28 Gemini Nano Banana 2 图像生成
[自动] [ARXIV]
3minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
02-28 VLM 视觉语言模型 报告偏差
[自动] [JUEJIN]
1minsticky_note_2 深度学习通用逼近定理:神经网络的理论基础与核心原理
02-28 深度学习 神经网络 通用逼近定理
[自动] [HACKER_NEWS]
4minnewspaper 构建极简Transformer模型实现十位数加法运算
02-28 Transformer 算法实现 算术运算
[自动] [ARXIV]
3minschool 基于锚点机制实现模型一致性
02-28 模型一致性 锚点机制 模型不一致性
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-28 多模态 视觉语言模型 最优传输
[自动] [BLOGS_PODCASTS]
2minmic SemiAnalysis谈2000亿美元AI支出与谷歌2027年盈利前景
02-28 SemiAnalysis AI支出 谷歌
[自动] [ARXIV]
4minschool SeeThrough3D:文本生成图像中的遮挡感知三维控制
02-28 SeeThrough3D 文本生成图像 3D控制
[自动] [HACKER_NEWS]
5minnewspaper Qwen3.5 122B与35B本地部署性能对标Sonnet 4.5
02-28 Qwen3.5 Sonnet 4.5 本地部署
[自动] [BLOGS_PODCASTS]
3minmic OpenAI与亚马逊达成战略合作:在AWS上引入Frontier平台扩展AI基础设施
02-28 OpenAI AWS 亚马逊
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析
02-28 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova 强化微调:原理、应用场景与实现指南
02-28 Amazon Nova 强化微调 RFT
[自动] [BLOGS_PODCASTS]
4minmic Amazon Bedrock 推出面向代理的有状态运行时
02-28 Amazon Bedrock AI Agent 有状态运行时
[自动] [HACKER_NEWS]
6minnewspaper Unsloth Dynamic 2.0 发布:支持 GGUF 格式
02-28 Unsloth GGUF LLM
[自动] [BLOGS_PODCASTS]
3minmic OpenAI与亚马逊达成战略合作,在AWS部署Frontier模型平台
02-28 OpenAI AWS 亚马逊
[自动] [HACKER_NEWS]
4minnewspaper 从噪声到图像:扩散模型交互指南
02-28 扩散模型 Diffusion 生成式AI
[自动] [HACKER_NEWS]
6minnewspaper Unsloth Dynamic 2.0 推出 GGUF 格式模型
02-28 Unsloth GGUF 模型量化
[自动] [HACKER_NEWS]
4minnewspaper 从噪声到图像:扩散模型交互式指南
02-28 扩散模型 生成式AI 图像生成
[自动] [HACKER_NEWS]
5minnewspaper Unsloth Dynamic 2.0 GGUFs 发布
02-28 Unsloth GGUF llama.cpp
[自动] [HACKER_NEWS]
4minnewspaper 构建智能体文明:多智能体协作系统开源
02-28 智能体 多智能体协作 Agent
[自动] [JUEJIN]
3minsticky_note_2 EverMemOS:开源Agent长时记忆系统,LoCoMo推理准确率93%
02-28 Agent 长时记忆 EverMemOS
[自动] [HACKER_NEWS]
4minnewspaper 最小Transformer模型实现两位数加法运算
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
5minnewspaper Unsloth发布Dynamic 2.0 GGUF模型
02-28 Unsloth GGUF 模型量化
[自动] [HACKER_NEWS]
7minnewspaper 能对齐十位数加法运算的最小 Transformer 模型
02-28 Transformer 算法可解释性 算术运算
[自动] [HACKER_NEWS]
3minnewspaper 消除程序员的尝试史:自动化编程的演进
02-28 自动化编程 代码生成 LLM
[自动] [HACKER_NEWS]
5minnewspaper Unsloth推出Dynamic 2.0 GGUF模型
02-28 Unsloth GGUF 模型量化
[自动] [HACKER_NEWS]
6minnewspaper 能对齐十位数加法运算的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
5minnewspaper 能计算两个10位数加法的最小Transformer模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 获准在美国防部机密网络部署 AI 模型
02-28 OpenAI 国防部 机密网络
[自动] [HACKER_NEWS]
4minnewspaper 能计算两位十进制数相加的最小 Transformer 模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 获准在美国防部机密网络部署 AI 模型
02-28 OpenAI 国防部 机密网络
[自动] [HACKER_NEWS]
6minnewspaper 能对齐十位数加法的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [BLOGS_PODCASTS]
2minmic SemiAnalysis创始人谈2000亿美元AI资本支出与谷歌2027年盈利隐忧
02-28 SemiAnalysis Dylan Patel AI资本支出
[自动] [BLOGS_PODCASTS]
3minmic OpenAI与亚马逊战略合作:将Frontier模型引入AWS
02-28 OpenAI AWS 亚马逊
[自动] [BLOGS_PODCASTS]
2minmic METR探讨指数级时间跨度评估、威胁模型与AI生产力边界
02-28 METR AI评估 威胁模型
[自动] [BLOGS_PODCASTS]
4minmic Gemini 3.1 Flash Image Preview 登场:全新 SOTA 图像生成模型
02-28 Gemini 3.1 Nano Banana 2 图像生成
[自动] [BLOGS_PODCASTS]
3minmic Anthropic模型蒸馏与SWE-Bench失效机制分析
02-28 模型蒸馏 SWE-Bench Anthropic
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova 强化微调解析:基于反馈的 AI 定制原理与实践
02-28 Amazon Nova RFT 强化微调
[自动] [HACKER_NEWS]
6minnewspaper 能计算两个10位数加法的最小Transformer模型
02-28 Transformer 算法推理 算术运算
[自动] [BLOGS_PODCASTS]
4minmic Amazon Bedrock 推出 Agent 有状态运行时环境
02-28 Amazon Bedrock Agent 有状态运行时
[自动] [HACKER_NEWS]
6minnewspaper 能对齐十位数加法运算的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [JUEJIN]
2minsticky_note_2 深度学习激活函数原理:非线性能力与模型性能解析
02-28 深度学习 激活函数 神经网络
[自动] [BLOGS_PODCASTS]
2minmic 使用 Nano Banana 2 构建图像生成与编辑应用
02-28 图像生成 图像编辑 Nano Banana 2
[自动] [BLOGS_PODCASTS]
3minmic Nano Banana 2 发布:首个 Gemini 3.1 模型与 SOTA 图像生成
02-28 Gemini 3.1 图像生成 SOTA
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova 强化微调解析:原理、应用场景与实现选项
02-28 Amazon Nova 强化微调 RFT
[自动] [ARXIV]
3minschool 通过锚定机制提升模型一致性
02-27 模型一致性 锚定机制 模型差异
[自动] [ARXIV]
4minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
02-27 VLM 视觉语言模型 报告偏差
[自动] [JUEJIN]
2minsticky_note_2 深度学习激活函数原理与非线性机制解析
02-27 深度学习 激活函数 非线性
[自动] [BLOGS_PODCASTS]
2minmic 使用 Nano Banana 2 构建图像生成与编辑应用
02-27 Nano Banana 2 图像生成 图像编辑
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-27 多模态 视觉语言模型 最优传输
[自动] [ARXIV]
5minschool SeeThrough3D:文本生成图像中的遮挡感知三维控制
02-27 SeeThrough3D 文本生成图像 3D控制
[自动] [HACKER_NEWS]
4minnewspaper OpenAI融资66亿美元投后估值达1570亿美元
02-27 OpenAI 融资 估值
[自动] [BLOGS_PODCASTS]
3minmic OpenAI与亚马逊达成战略合作:Frontier平台接入AWS
02-27 OpenAI AWS 亚马逊
[自动] [BLOGS_PODCASTS]
2minmic METR Joel Becker谈指数级时间评估与AI生产力局限
02-27 METR Joel Becker 指数级评估
[自动] [BLOGS_PODCASTS]
4minmic Gemini 2.0 Flash 登场:成新一代 SOTA 图像生成模型
02-27 Gemini Google 图像生成
[自动] [BLOGS_PODCASTS]
2minmic Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析
02-27 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]
3minmic 使用 Nano Banana 2 构建图像生成与编辑应用
02-27 图像生成 图像编辑 Nano Banana 2
[自动] [BLOGS_PODCASTS]
3minmic OpenAI与亚马逊达成战略合作,将Frontier模型引入AWS
02-27 OpenAI AWS 亚马逊
[自动] [BLOGS_PODCASTS]
2minmic Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析
02-27 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]
2minmic Amazon Nova 强化微调原理:从评估学习到多轮智能体构建
02-27 Amazon Nova 强化微调 RFT
[自动] [HACKER_NEWS]
5minnewspaper 利用大语言模型分析 TB 级 CI 日志数据
02-27 LLM CI/CD 日志分析
[自动] [HACKER_NEWS]
4minnewspaper 逆向工程挑战:解析神经网络架构与参数
02-27 逆向工程 神经网络 模型安全
[自动] [HACKER_NEWS]
5minnewspaper 展示代码库与 LLM 上下文窗口匹配度的徽章
02-27 LLM Context Window 代码库
[自动] [HACKER_NEWS]
5minnewspaper 利用大语言模型分析 TB 级 CI 日志数据
02-27 LLM CI 日志分析
[自动] [BLOGS_PODCASTS]
3minmic Nano Banana 2:Gemini 3.1 Flash 图像生成模型预览
02-27 Gemini Google 图像生成
[自动] [BLOGS_PODCASTS]
3minmic Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析
02-27 Anthropic 模型蒸馏 宪法AI
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova 强化微调原理、应用场景与实现选项解析
02-27 Amazon Nova 强化微调 RFT
[自动] [BLOGS_PODCASTS]
3minmic OpenAI与亚马逊达成战略合作,将Frontier模型引入AWS
02-27 OpenAI AWS 亚马逊
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 联合西北太平洋国家实验室推出 DraftNEPABench,加速联邦许可流程
02-27 OpenAI PNNL DraftNEPABench
[自动] [HACKER_NEWS]
4minnewspaper 逆向工程神经网络:技术挑战与防御机制解析
02-27 模型提取 逆向工程 模型安全
[自动] [HACKER_NEWS]
4minnewspaper 利用大语言模型分析 TB 级 CI 日志数据
02-27 LLM CI 日志分析
[自动] [HACKER_NEWS]
4minnewspaper 逆向工程挑战:解析该神经网络架构
02-27 神经网络 逆向工程 模型架构
[自动] [BLOGS_PODCASTS]
2minmic 使用 Nano Banana 2 构建图像生成与编辑应用
02-27 Nano Banana 2 图像生成 图像编辑
[自动] [BLOGS_PODCASTS]
3minmic 利用闲置算时将大模型训练速度提升一倍
02-27 LLM 训练效率 算力优化
[自动] [BLOGS_PODCASTS]
2minmic Transformer中的混合专家模型架构解析
02-27 Transformer MoE 混合专家
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 与太平洋西北国家实验室推基准测试,加速联邦许可流程
02-27 OpenAI 基准测试 AI 编程代理
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 与 Figma 集成 Codex 实现代码与设计无缝切换
02-27 OpenAI Figma Codex
[自动] [BLOGS_PODCASTS]
2minmic Nano Banana 2:Gemini 3.1 Flash 图像生成模型预览
02-27 Gemini 3.1 图像生成 SOTA
[自动] [BLOGS_PODCASTS]
5minmic AWS LMI 容器更新:提升托管 LLM 性能并简化部署
02-27 AWS LMI LLM
[自动] [BLOGS_PODCASTS]
4minmic Anthropic 模型蒸馏与 SWE-Bench 失效机制分析
02-27 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova 强化微调:原理、场景与实现指南
02-27 Amazon Nova 强化微调 RFT
[自动] [BLOGS_PODCASTS]
2minmic 2025年12月AI技术进展综述:编程范式的深刻变革
02-27 AI编程 范式转移 技术变革
[自动] [HACKER_NEWS]
3minnewspaper 谷歌员工效仿Anthropic,要求制定军事AI红线
02-27 谷歌 Anthropic 军事AI
[自动] [JUEJIN]
3minsticky_note_2 后端面试高频考点:MCP、Skill 与 Function Call 的区别
02-27 MCP Function Call Skill
[自动] [HACKER_NEWS]
4minnewspaper 谷歌员工效仿Anthropic,要求为军事AI设定红线
02-27 谷歌 军事AI Anthropic
[自动] [HACKER_NEWS]
5minnewspaper YC W26项目Cardboard:基于智能体的视频编辑工具
02-27 YC 智能体 视频编辑
[自动] [ARXIV]
4minschool 风险感知世界模型预测控制提升端到端自动驾驶泛化性
02-27 自动驾驶 世界模型 预测控制
[自动] [ARXIV]
5minschool 面向高效高分辨率GUI智能体的时空令牌剪枝
02-27 GUI Agent Token Pruning Qwen2-VL
[自动] [ARXIV]
4minschool 面向低延迟口语对话的语篇感知双流响应生成
02-27 DDTSR 低延迟 口语对话
[自动] [ARXIV]
2minschool 缓解可读性代价:基于解耦证明者-验证者博弈的方法
02-27 LLM 可解释性 模型评估
[自动] [ARXIV]
4minschool 无模型通用AI框架
02-27 通用人工智能 强化学习 无模型
[自动] [ARXIV]
3minschool 基于优化的系统为何难以实现规范响应:代理与架构限制
02-27 RLHF AI对齐 智能体
[自动] [BLOGS_PODCASTS]
2minmic 利用闲置算力将大模型训练速度提高一倍且保持精度
02-27 LLM 训练加速 算力优化
[自动] [ARXIV]
4minschool 利用大模型生成判断数据提升应用商店排序相关性
02-27 LLM 搜索相关性 数据标注
[自动] [BLOGS_PODCASTS]
3minmic Transformer架构中的混合专家模型原理与应用
02-27 Transformer MoE 混合专家模型
[自动] [ARXIV]
4minschool ReCoN-Ipsundrum:具备情感耦合控制与机制关联意识指标的可检查循环持久代理
02-27 ReCoN-Ipsundrum 机器意识 AI Agent
[自动] [ARXIV]
4minschool MovieTeller:工具增强且ID一致的渐进式摘要生成
02-27 MovieTeller 视频摘要 VLM
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析
02-27 模型蒸馏 SWE-bench 奖励黑客
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova 强化微调:原理、应用场景与实现指南
02-27 Amazon Nova 强化微调 RFT
[自动] [ARXIV]
4minschool AgentDropoutV2:测试时剪枝优化多智能体系统信息流
02-27 AgentDropoutV2 多智能体系统 MAS
[自动] [JUEJIN]
2minsticky_note_2 10分钟接入AgentNet:从零开始的实践指南
02-27 AgentNet AI Agent LLM
[自动] [ARXIV]
4minschool 现成图像模型可攻破图像保护方案
02-27 图像保护 对抗攻击 Stable Diffusion
[自动] [ARXIV]
4minschool 提升推理语言模型的参数化知识获取能力
02-27 LLM 推理模型 参数化知识
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 与西北太平洋国家实验室合作推出 DraftNEPABench 加速联邦许可审批
02-27 OpenAI PNNL DraftNEPABench
[自动] [ARXIV]
3minschool LiCQA:轻量级复杂问答系统
02-27 LiCQA 复杂问答 QA系统
[自动] [ARXIV]
5minschool GUI-Libra:动作感知监督与可验证强化学习的原生GUI智能体
02-27 GUI Agent 强化学习 RL
[自动] [ARXIV]
4minschool DySCO:面向长上下文大模型的动态注意力缩放解码方法
02-27 DySCO 长上下文 解码算法
[自动] [ARXIV]
4minschool 高效自动化翻译基准测试与数据集的流水线
02-26 LLM 多语言模型 数据集
[自动] [HACKER_NEWS]
4minnewspaper 谷歌发布 Nano Banana 2 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [ARXIV]
4minschool 现成图生图模型可攻破主流图像保护方案
02-26 图像保护 对抗样本 图生图
[自动] [ARXIV]
4minschool 提升推理语言模型的参数化知识访问能力
02-26 推理模型 参数化知识 强化学习
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:面向中文读者的可运行教程,获500余所高校采用
02-26 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]
2minmic 利用闲置算力将LLM训练速度提升一倍且保持精度
02-26 LLM 训练加速 算力优化
[自动] [BLOGS_PODCASTS]
2minmic Transformer 架构中的混合专家模型原理与优势
02-26 MoE Transformer 混合专家
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 与西北太平洋国家实验室合作推出 DraftNEPABench 加速联邦许可流程
02-26 OpenAI AI 编程代理 DraftNEPABench
[自动] [BLOGS_PODCASTS]
4minmic OpenAI Codex 集成 Figma 实现代码与设计无缝切换
02-26 OpenAI Codex Figma
[自动] [ARXIV]
4minschool LiCQA:面向复杂问答的轻量级系统
02-26 LiCQA 复杂问答 轻量级系统
[自动] [ARXIV]
4minschool GUI-Libra:动作感知监督与可验证RL训练原生GUI智能体
02-26 GUI Agent RL CoT
[自动] [ARXIV]
4minschool DySCO:面向长上下文大模型的动态注意力缩放解码
02-26 DySCO 长上下文 注意力机制
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析
02-26 Anthropic 模型蒸馏 SWE-Bench
[自动] [JUEJIN]
3minsticky_note_2 Android AI Agent四层架构与安全设计实战解析
02-26 Android AI Agent 系统架构
[自动] [BLOGS_PODCASTS]
2minmic Amazon Nova 强化微调解析:原理、应用场景与实现指南
02-26 Amazon Nova 强化微调 RFT
[自动] [JUEJIN]
2minsticky_note_2 AI Agent接管手机:移动端观测技术与事件特征提取
02-26 AI Agent 移动端 UI 树解析
[自动] [HACKER_NEWS]
4minnewspaper 谷歌发布 Nano Banana 2 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [HACKER_NEWS]
4minnewspaper 用概念代数引导可解释的语言模型
02-26 可解释性 概念代数 模型控制
[自动] [HACKER_NEWS]
5minnewspaper 谷歌发布 Nano Banana 2:最新 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [BLOGS_PODCASTS]
2minmic 利用闲置算力将大模型训练速度提升一倍
02-26 LLM 训练加速 算力优化
[自动] [BLOGS_PODCASTS]
2minmic 使用 Nano Banana 2 构建图像生成与编辑应用
02-26 图像生成 图像编辑 Nano Banana 2
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家
[自动] [BLOGS_PODCASTS]
3minmic OpenAI Codex 集成 Figma:实现代码与设计无缝连接
02-26 OpenAI Codex Figma
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova 强化微调原理、应用场景与实现路径解析
02-26 Amazon Nova 强化微调 RFT
[自动] [BLOGS_PODCASTS]
2minmic 2025年12月回顾:编程已发生永久性改变
02-26 编程范式 AI 编程 行业变革
[自动] [HACKER_NEWS]
5minnewspaper 谷歌发布 Nano Banana 2 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [HACKER_NEWS]
4minnewspaper 谷歌DeepMind推出SynthID:为AI生成文本添加水印的技术
02-26 SynthID DeepMind 文本水印
[自动] [BLOGS_PODCASTS]
2minmic 利用闲置算力将大模型训练速度提升一倍的新方法
02-26 LLM 训练效率 算力优化
[自动] [BLOGS_PODCASTS]
3minmic 使用 Nano Banana 2 构建图像生成与编辑应用
02-26 图像生成 图像编辑 Nano Banana 2
[自动] [BLOGS_PODCASTS]
2minmic Transformer中的混合专家模型:架构原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [HACKER_NEWS]
4minnewspaper Anthropic 放弃其核心安全承诺
02-26 Anthropic AI安全 对齐
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova 强化微调指南:原理、场景与实现路径
02-26 Amazon Nova RFT 强化微调
[自动] [HACKER_NEWS]
4minnewspaper 谷歌发布 Nano Banana 2:最新 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [BLOGS_PODCASTS]
4minmic 在 SageMaker AI 与 Bedrock 上高效部署多 LoRA 模型
02-26 vLLM LoRA SageMaker
[自动] [BLOGS_PODCASTS]
2minmic 利用空闲计算时间将大模型训练速度提升一倍
02-26 LLM 模型训练 算力优化
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [HACKER_NEWS]
5minnewspaper OpenAI的竞争策略与市场定位分析
02-26 OpenAI 竞争策略 市场定位
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 与西北太平洋国家实验室推基准测试,加速联邦许可流程
02-26 OpenAI PNNL DraftNEPABench
[自动] [BLOGS_PODCASTS]
4minmic OpenAI Codex 集成 Figma 实现代码与设计无缝协作
02-26 OpenAI Codex Figma
[自动] [HACKER_NEWS]
5minnewspaper Google API密钥曾非机密,但Gemini改变了规则
02-26 Google Gemini API密钥
[自动] [HACKER_NEWS]
5minnewspaper Ferret-UI Lite:端侧轻量级GUI Agent构建经验
02-26 Ferret-UI GUI Agent 端侧模型
[自动] [BLOGS_PODCASTS]
2minmic CuspAI利用生成式AI搜索全材料空间以加速发现
02-26 生成式AI CuspAI 材料科学
[自动] [HACKER_NEWS]
4minnewspaper Anthropic 放弃核心安全承诺
02-26 Anthropic AI安全 大模型
[自动] [BLOGS_PODCASTS]
3minmic AI领域“闭环”效应显现:数十场中型发布会综述
02-26 AI闭环 产品发布 行业综述
[自动] [BLOGS_PODCASTS]
2minmic AI全息信息助力细胞生物学全景研究
02-26 细胞生物学 AI驱动 全息信息
[自动] [BLOGS_PODCASTS]
2minmic CuspAI 探索全材料空间:Max Welling 谈生成式 AI 加速材料发现
02-26 CuspAI Max Welling 生成式AI
[自动] [BLOGS_PODCASTS]
2minmic AI全局分析助力细胞生物学研究与实验规划
02-26 AI 细胞生物学 实验规划
[自动] [BLOGS_PODCASTS]
2minmic 2026年2月威胁报告:AI模型与社交平台结合的恶意利用及防御
02-26 威胁报告 恶意利用 AI安全
[自动] [HACKER_NEWS]
6minnewspaper 谷歌API密钥曾非机密 但Gemini改变了规则
02-26 API密钥 Google Gemini
[自动] [BLOGS_PODCASTS]
3minmic 利用闲置算力将大模型训练速度提升一倍
02-26 LLM 模型训练 算力优化
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 的竞争策略分析
02-26 OpenAI 竞争策略 商业模式
[自动] [HACKER_NEWS]
4minnewspaper Anthropic 放弃其核心安全承诺
02-26 Anthropic AI安全 对齐
[自动] [HACKER_NEWS]
6minnewspaper Agent Swarm:开源多智能体自学习团队框架
02-26 Agent Swarm Multi-agent 多智能体
[自动] [HACKER_NEWS]
4minnewspaper 利用大语言模型实现大规模在线去匿名化
02-26 LLM 去匿名化 隐私攻击
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 的竞争策略分析
02-26 OpenAI 竞争策略 商业模式
[自动] [BLOGS_PODCASTS]
3minmic CuspAI融资1亿美元:Max Welling谈遍历所有可能材料空间
02-26 CuspAI 生成式AI 材料科学
[自动] [HACKER_NEWS]
4minnewspaper Anthropic 放弃核心安全承诺,不再发布高风险模型
02-26 Anthropic 模型安全 AI治理
[自动] [BLOGS_PODCASTS]
2minmic AI驱动方法助力细胞生物学全景分析与实验规划
02-26 AI for Science 细胞生物学 实验规划
[自动] [HACKER_NEWS]
7minnewspaper Agent Swarm:开源多智能体自学习团队框架
02-26 Agent Swarm Multi-agent 自学习
[自动] [HACKER_NEWS]
4minnewspaper 首个完全通用的计算机动作模型
02-26 Agent LLM 计算机控制
[自动] [BLOGS_PODCASTS]
5minmic 在SageMaker AI与Bedrock上利用vLLM高效部署多LoRA及MoE模型
02-26 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]
4minmic 在 Amazon SageMaker 上使用 veRL 与 Ray 训练 CodeFu-7B 模型
02-26 SageMaker veRL Ray
[自动] [BLOGS_PODCASTS]
2minmic 利用闲置算时将大模型训练速度翻倍且保持精度
02-26 LLM 模型训练 算力优化
[自动] [HACKER_NEWS]
3minnewspaper 利用大语言模型实现大规模在线去匿名化
02-26 LLM 去匿名化 隐私攻击
[自动] [BLOGS_PODCASTS]
3minmic 中型模型发布潮揭示AI应用“闭环”效应
02-26 中型模型 AI应用 闭环
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 Transformer MoE 混合专家模型
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 的竞争策略分析
02-26 OpenAI 竞争策略 商业模式
[自动] [BLOGS_PODCASTS]
3minmic CuspAI利用生成式AI搜索全空间材料
02-26 CuspAI 生成式AI 材料科学
[自动] [BLOGS_PODCASTS]
3minmic Claude Code周年回顾:代码生成占比预测与全球内存短缺分析
02-26 Claude Code 代码生成 AI 编程
[自动] [BLOGS_PODCASTS]
2minmic 2026年2月威胁报告:AI模型结合网站与社交平台的恶意利用及防御
02-26 威胁报告 恶意利用 AI安全
[自动] [HACKER_NEWS]
4minnewspaper 首个完全通用的计算机动作模型
02-26 通用模型 计算机控制 Agent
[自动] [HACKER_NEWS]
3minnewspaper 利用大语言模型实现大规模在线用户去匿名化
02-26 LLM 去匿名化 隐私攻击
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 的竞争策略分析
02-26 OpenAI 竞争策略 商业模式
[自动] [BLOGS_PODCASTS]
2minmic AI 资讯:中型模型发布凸显闭环效应
02-26 中型模型 闭环效应 模型发布
[自动] [BLOGS_PODCASTS]
2minmic 2026年2月威胁报告:AI模型结合网站与社交平台的恶意利用及防御
02-26 威胁报告 AI安全 恶意利用
[自动] [HACKER_NEWS]
4minnewspaper 首个完全通用的计算机动作模型
02-26 计算机动作模型 通用模型 LLM
[自动] [HACKER_NEWS]
4minnewspaper 利用大语言模型实现大规模在线去匿名化
02-26 去匿名化 隐私攻击 LLM
[自动] [HACKER_NEWS]
7minnewspaper PA基准:评估Web智能体在真实个人助理工作流中的表现
02-26 Web智能体 PA基准 个人助理
[自动] [JUEJIN]
2minsticky_note_2 空洞卷积原理:如何解决计算机视觉的精度与视野矛盾
02-26 空洞卷积 计算机视觉 深度学习
[自动] [JUEJIN]
2minsticky_note_2 大模型非线性变换解析:从MLP到MoE的架构演进
02-26 非线性变换 MLP MoE
[自动] [BLOGS_PODCASTS]
5minmic 在 Amazon SageMaker 上使用 veRL 与 Ray 训练 CodeFu-7B 模型
02-26 SageMaker veRL Ray
[自动] [JUEJIN]
2minsticky_note_2 从隐藏向量到文本:LM Head 如何预测下一个词
02-26 LLM Transformer LM Head
[自动] [BLOGS_PODCASTS]
2minmic 亚马逊Bedrock在亚太五区上线Anthropic模型全球跨区域推理
02-26 Amazon Bedrock Anthropic Claude 3
[自动] [BLOGS_PODCASTS]
2minmic CuspAI 探索全材料空间:Hinton 与 LeCun 顾问
02-26 CuspAI Max Welling Geoffrey Hinton
[自动] [BLOGS_PODCASTS]
2minmic AI驱动方法助力细胞生物学全景解析与实验规划
02-26 AI for Science 细胞生物学 系统生物学
[自动] [BLOGS_PODCASTS]
2minmic AI进展综述:中型模型发布凸显“闭环”有效性
02-26 AI进展 闭环 AI产品
[自动] [BLOGS_PODCASTS]
3minmic 2026年2月威胁报告:AI模型结合社交平台的恶意利用及防御
02-26 威胁报告 恶意利用 AI安全
[自动] [HACKER_NEWS]
3minnewspaper 利用大语言模型实现大规模在线用户去匿名化
02-26 LLM 去匿名化 隐私攻击
[自动] [HACKER_NEWS]
6minnewspaper PA基准:评估Web智能体在真实个人助理工作流中的表现
02-26 Web智能体 PA基准 个人助理
[自动] [ARXIV]
5minschool 面向法语的ModernBERT多样性训练案例研究
02-26 ModernBERT 数据多样性 预训练
[自动] [ARXIV]
3minschool 通过剔除已覆盖代码增强大模型测试生成
02-26 LLM 单元测试 代码覆盖率
[自动] [ARXIV]
5minschool 用于Wasserstein测地线与最优传输动力学的神经求解器
02-26 最优传输 Wasserstein 神经网络
[自动] [HACKER_NEWS]
5minnewspaper 四个月图像视频VAE实验的经验总结
02-26 VAE 图像生成 视频生成
[自动] [ARXIV]
4minschool 函数空间经验贝叶斯正则化:基于t分布先验
02-26 贝叶斯深度学习 函数空间 经验贝叶斯
[自动] [ARXIV]
4minschool TG-ASR:基于并行门控交叉注意力的翻译引导低资源语音识别
02-26 ASR 语音识别 低资源学习
[自动] [ARXIV]
4minschool CxMP:评估语言模型构式理解的语言学最小对子基准
02-26 CxMP 构式语法 最小对子
[自动] [ARXIV]
3minschool 面向大模型终端能力扩展的数据工程研究
02-26 LLM 数据工程 终端
[自动] [ARXIV]
3minschool 扩散对偶性第二章:Ψ采样器与高效课程
02-26 扩散模型 离散扩散 Psi采样器
[自动] [ARXIV]
4minschool 基于试错学习的反思式测试时规划:用于具身大模型
02-26 具身智能 反思机制 测试时规划
[自动] [HACKER_NEWS]
3minnewspaper 基于LLM的大规模在线去匿名化研究
02-26 LLM 去匿名化 隐私攻击
[自动] [HACKER_NEWS]
7minnewspaper 四个月图像视频VAE实验的技术总结与经验
02-26 VAE 视频生成 图像生成
[自动] [ARXIV]
5minschool 为何LLM后训练中Pass@k优化会降低Pass@1性能
02-26 LLM 后训练 Pass@k
[自动] [ARXIV]
4minschool Test-Time训练结合KV绑定等价于线性注意力
02-26 TTT 线性注意力 KV绑定
[自动] [ARXIV]
4minschool Squint:面向机器人虚实迁移的快速视觉强化学习
02-26 强化学习 机器人 Sim-to-Real
[自动] [ARXIV]
4minschool Aletheia自主攻克FirstProof数学定理
02-26 Aletheia Gemini 3 数学定理
[自动] [BLOGS_PODCASTS]
5minmic 基于 veRL 在 SageMaker 与 Ray 上训练 CodeFu-7B 模型
02-25 veRL SageMaker Ray
[自动] [BLOGS_PODCASTS]
4minmic 利用Amazon Bedrock构建生产级智能活动助理
02-25 Amazon Bedrock AgentCore RAG
[自动] [JUEJIN]
2minsticky_note_2 OpenHands框架拆解:CodeActAgent的设计与核心能力
02-25 OpenHands CodeActAgent AI Agent
[自动] [BLOGS_PODCASTS]
2minmic CuspAI利用生成式AI搜索全材料空间以加速发现
02-25 CuspAI 生成式AI 材料科学
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 中东区域支持 Anthropic Claude 全球跨区域推理
02-25 AWS Amazon Bedrock Anthropic
[自动] [BLOGS_PODCASTS]
3minmic 2026年2月威胁报告:AI模型结合网站与社交平台的恶意利用及防御
02-25 威胁报告 恶意利用 AI安全
[自动] [HACKER_NEWS]
3minnewspaper 首个完全通用的计算机动作模型
02-25 计算机动作模型 通用模型 Agent
[自动] [ARXIV]
3minschool 面向大模型终端能力扩展的数据工程研究
02-25 LLM 数据工程 终端
[自动] [ARXIV]
4minschool 扩散对偶性第二章:Ψ采样器与高效课程
02-25 扩散模型 离散扩散 采样器
[自动] [ARXIV]
4minschool 基于试错反思的具身大模型测试时规划
02-25 具身智能 反思机制 测试时规划
[自动] [HACKER_NEWS]
4minnewspaper 利用大语言模型实现大规模在线用户去匿名化
02-25 去匿名化 隐私攻击 LLM
[自动] [ARXIV]
5minschool 为何Pass@k优化会降低Pass@1:大模型后训练中的提示干扰
02-25 LLM 后训练 代码生成
[自动] [ARXIV]
4minschool Squint:面向机器人具身迁移的快速视觉强化学习
02-25 强化学习 机器人 Sim-to-Real
[自动] [ARXIV]
4minschool KV绑定测试时训练等价于线性注意力
02-25 TTT 线性注意力 KV缓存
[自动] [ARXIV]
6minschool Headwise Chunking:面向上下文并行的内存高效方案
02-25 上下文并行 长文本训练 内存优化
[自动] [ARXIV]
4minschool Aletheia模型自主攻克FirstProof数学定理证明
02-25 Aletheia FirstProof 数学定理证明
[自动] [HACKER_NEWS]
5minnewspaper 四个月图像视频VAE实验的经验总结
02-25 VAE 视频生成 图像生成
[自动] [HACKER_NEWS]
3minnewspaper 利用大语言模型实现大规模在线去匿名化
02-25 LLM 去匿名化 隐私安全
[自动] [HACKER_NEWS]
4minnewspaper PA Bench:评估前沿模型多标签页任务能力
02-25 PA Bench 多标签页 模型评估
[自动] [BLOGS_PODCASTS]
3minmic 数十场中型发布会背后的共同主题:形成闭环
02-25 闭环 数据飞轮 合成数据
[自动] [HACKER_NEWS]
3minnewspaper 利用大语言模型实现大规模在线用户去匿名化
02-25 去匿名化 隐私攻击 LLM
[自动] [BLOGS_PODCASTS]
5minmic 使用 veRL 和 Ray 在 SageMaker 上训练 CodeFu-7B 模型
02-25 veRL Ray SageMaker
[自动] [BLOGS_PODCASTS]
2minmic 亚马逊云科技宣布Amazon Bedrock在亚太五个国家/地区正式上线Anthropic Claude模型,
02-25 Amazon Bedrock Anthropic Claude 全球跨区域推理
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 推出中东跨区域推理支持多款 Claude 模型
02-25 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]
2minmic 2026年2月威胁报告:AI模型结合社交平台的恶意利用与防御
02-25 威胁报告 恶意利用 社交平台
[自动] [BLOGS_PODCASTS]
5minmic 基于veRL与Ray在SageMaker上训练CodeFu-7B模型
02-25 veRL Ray SageMaker
[自动] [BLOGS_PODCASTS]
2minmic Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击
02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]
2minmic Amazon Bedrock在亚太六地推Claude模型全球跨区域推理
02-25 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]
2minmic Nature视角:CuspAI利用AI搜索材料并获1亿美元融资
02-25 CuspAI 材料科学 Geoffrey Hinton
[自动] [BLOGS_PODCASTS]
2minmic AI驱动方法助力细胞生物学全景解析与实验规划
02-25 AI 细胞生物学 多模态融合
[自动] [BLOGS_PODCASTS]
2minmic 2026年2月威胁报告:AI模型结合网站与社交平台的恶意利用及防御
02-25 威胁报告 AI安全 恶意利用
[自动] [BLOGS_PODCASTS]
5minmic 在 Amazon SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B 模型
02-25 SageMaker veRL Ray
[自动] [BLOGS_PODCASTS]
3minmic OpenAI前沿评估负责人探讨SWE-Bench Verified后的下一步
02-25 OpenAI SWE-Bench 智能体
[自动] [HACKER_NEWS]
5minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [BLOGS_PODCASTS]
3minmic Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击
02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 现支持中东跨区域推理使用 Anthropic Claude 模型
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 推出 Anthropic Claude 全球跨区域推理,覆盖东南亚及台湾
02-25 Amazon Bedrock Claude Anthropic
[自动] [BLOGS_PODCASTS]
2minmic AI News:数十场发布会背后的共同主题是“闭环”
02-25 AI新闻 闭环 发布会
[自动] [BLOGS_PODCASTS]
2minmic 2026年2月威胁报告:AI模型结合网站与社交平台的恶意利用及防御
02-25 威胁报告 恶意利用 AI安全
[自动] [JUEJIN]
2minsticky_note_2 OpenHands 框架解析:CodeActAgent 架构与设计原则
02-25 OpenHands CodeActAgent AI Agent
[自动] [HACKER_NEWS]
5minnewspaper Moonshine 开源语音识别模型:精度超越 WhisperLargev3
02-25 语音识别 STT Moonshine
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [HACKER_NEWS]
8minnewspaper AI 智能体可玩的即时战略游戏
02-25 AI Agent 游戏 即时战略
[自动] [BLOGS_PODCASTS]
3minmic 在 Amazon SageMaker 上利用 Dottxt Outlines 实现 LLM 结构化输出
02-25 LLM 结构化输出 Outlines
[自动] [BLOGS_PODCASTS]
5minmic 使用 veRL 和 Ray 在 SageMaker 上训练 CodeFu-7B 模型
02-25 SageMaker Ray veRL
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
2minmic OpenAI前沿评估团队:迈向智能体评测的下一步
02-25 OpenAI SWE-Bench 智能体评测
[自动] [HACKER_NEWS]
5minnewspaper Moonshine 开源 STT 模型:精度超越 WhisperLargev3
02-25 STT Whisper Moonshine
[自动] [BLOGS_PODCASTS]
2minmic Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击
02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊 Bedrock 推出 Claude 模型中东全球跨区域推理
02-25 Amazon Bedrock Anthropic Claude
[自动] [HACKER_NEWS]
5minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [HACKER_NEWS]
4minnewspaper AI 智能体可参与的即时战略游戏演示
02-25 AI Agent 游戏 RTS
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:可运行中文教程,被500多所高校采用
02-25 深度学习 PyTorch MXNet
[自动] [HACKER_NEWS]
5minnewspaper Moonshine 开源 STT 模型:精度超越 WhisperLargev3
02-25 STT Whisper Moonshine
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [HACKER_NEWS]
3minnewspaper 系统提示词中的主权归属与控制机制
02-25 System Prompt Prompt Engineering LLM
[自动] [BLOGS_PODCASTS]
5minmic 在 SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B
02-25 SageMaker veRL Ray
[自动] [BLOGS_PODCASTS]
2minmic 亚马逊Bedrock在东南亚及台湾推出Anthropic Claude模型
02-25 AWS Bedrock Anthropic
[自动] [BLOGS_PODCASTS]
2minmic 亚马逊 Bedrock 推出中东跨区域推理支持 Claude 模型
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
4minmic OpenAI前沿评估负责人:SWE-Bench Verified后的智能体评测新方向
02-25 OpenAI SWE-Bench 智能体
[自动] [HACKER_NEWS]
5minnewspaper Moonshine 开源 STT 模型:精度超越 WhisperLargev3
02-25 STT Whisper Moonshine
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [BLOGS_PODCASTS]
3minmic Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击
02-25 Anthropic DeepSeek 模型蒸馏
[自动] [HACKER_NEWS]
4minnewspaper Anthropic 撤销旗舰产品安全承诺
02-25 Anthropic Claude 安全承诺
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [HACKER_NEWS]
4minnewspaper Anthropic 放弃旗舰安全承诺,不再遵守 AI 安全准则
02-25 Anthropic AI安全 负责任AI
[自动] [HACKER_NEWS]
5minnewspaper Moonshine 开源 STT 模型:精度超越 WhisperLargev3
02-25 STT Whisper Moonshine
[自动] [HACKER_NEWS]
5minnewspaper Mercury 2:基于扩散模型的最快推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [HACKER_NEWS]
5minnewspaper Hugging Face Skills:基于技能的模型微调框架
02-25 Hugging Face 模型微调 Skills
[自动] [HACKER_NEWS]
4minnewspaper Anthropic 放弃旗舰产品安全承诺
02-25 Anthropic Claude 安全承诺
[自动] [ARXIV]
3minschool 工具构建:通往高级智能的路径
02-25 LLM 超级智能 工具构建
[自动] [ARXIV]
3minschool 学术问答系统中大模型错误评估的专家框架
02-25 LLM 学术问答 错误评估
[自动] [BLOGS_PODCASTS]
5minmic 基于AWS与Hugging Face smolagents构建多模型医疗AI智能体
02-25 Agentic AI Hugging Face smolagents
[自动] [BLOGS_PODCASTS]
5minmic 在 Amazon SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B 模型
02-25 SageMaker veRL Ray
[自动] [ARXIV]
3minschool 动机优化:提升大语言模型任务表现的关键机制
02-25 动机优化 训练范式 情感神经科学
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊Bedrock在东南亚及台湾推出Anthropic Claude模型全球跨区域推理
02-25 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊 Bedrock 推出中东全球跨区域推理支持 Claude 模型
02-25 Amazon Bedrock Claude Anthropic
[自动] [ARXIV]
4minschool VAUQ:面向LVLM自评估的视觉感知不确定性量化
02-25 LVLM 多模态 不确定性量化
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的最快推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [BLOGS_PODCASTS]
2minmic Claude Code金融应用与全球内存短缺:SemiAnalysis深度解析
02-25 Claude Code 代码生成 SemiAnalysis
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics应用视觉语言模型规模化标注物理AI数据
02-25 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
5minmic AWS SageMaker集成Dottxt Outlines实现LLM结构化输出
02-25 LLM 结构化输出 AWS
[自动] [BLOGS_PODCASTS]
3minmic Anthropic指控DeepSeek等三家中国公司超1600万次蒸馏攻击
02-25 Anthropic DeepSeek 模型蒸馏
[自动] [HACKER_NEWS]
3minnewspaper Anthropic 撤销旗舰级安全承诺,不再遵守自愿安全准则
02-25 Anthropic 安全承诺 AI治理
[自动] [ARXIV]
4minschool 面向大规模视频推理的综合基准测试套件
02-25 视频推理 VBVR 基准测试
[自动] [ARXIV]
4minschool 部分可观测平均场博弈的循环结构策略梯度算法
02-25 平均场博弈 MFG 策略梯度
[自动] [ARXIV]
4minschool 行为学习:从数据中学习分层优化结构
02-25 行为学习 分层优化 可解释性
[自动] [ARXIV]
4minschool 智能体AI实现光学系统的可扩展鲁棒控制
02-25 AgentOptics 智能体 光学系统
[自动] [ARXIV]
4minschool Skill-Inject:评估智能体技能文件攻击的脆弱性
02-25 LLM智能体 提示注入 Agent安全
[自动] [BLOGS_PODCASTS]
3minmic OpenAI前沿评估团队:SWE-Bench Verified后的智能体评估新方向
02-25 OpenAI SWE-Bench 智能体
[自动] [HACKER_NEWS]
5minnewspaper Moonshine 开源 STT 模型:精度超越 WhisperLargev3
02-25 STT Whisper Moonshine
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的最快推理 LLM
02-25 Mercury 2 扩散模型 推理模型
[自动] [ARXIV]
4minschool KNIGHT:知识图谱驱动的多选题生成与自适应难度校准
02-25 LLM RAG 知识图谱
[自动] [ARXIV]
4minschool JUCAL:分类任务中偶然与认知不确定性的联合校准
02-25 不确定性校准 JUCAL 偶然不确定性
[自动] [ARXIV]
4minschool AdaEvolve:基于大语言模型的自适应零阶优化框架
02-25 LLM 零阶优化 进化算法
[自动] [ARXIV]
4minschool 行为学习:从数据中学习分层优化结构
02-24 行为学习 分层优化 可解释性
[自动] [BLOGS_PODCASTS]
3minmic 基于AWS与Hugging Face smolagents的多模型医疗AI智能体构建
02-24 Agentic AI Hugging Face AWS
[自动] [BLOGS_PODCASTS]
5minmic 在 Amazon SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B 模型
02-24 SageMaker veRL Ray
[自动] [GITHUB_TRENDING]
10minhub 动手学深度学习:面向中文读者的可运行教材
02-24 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊Bedrock新推亚太六区:Anthropic Claude模型支持全球跨区域推理
02-24 Amazon Bedrock Anthropic Claude
[自动] [ARXIV]
4minschool Skill-Inject:评估智能体技能文件攻击漏洞
02-24 LLM Agents Prompt Injection Skill-Inject
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 前沿评估团队探讨迈向智能体评估的下一阶段
02-24 OpenAI SWE-Bench 智能体评估
[自动] [HACKER_NEWS]
7minnewspaper Moonshine 开源 STT 模型:精度超越 WhisperLargev3
02-24 STT Whisper Moonshine
[自动] [ARXIV]
4minschool KNIGHT:知识图谱驱动的多选题生成与自适应难度校准
02-24 RAG 知识图谱 LLM
[自动] [ARXIV]
4minschool JUCAL:分类任务中偶然与认知不确定性的联合校准
02-24 不确定性校准 JUCAL 偶然不确定性
[自动] [HACKER_NEWS]
5minnewspaper Hugging Face Skills 功能上线与模型评估体系更新
02-24 Hugging Face 模型评估 LLM
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics利用视觉语言模型自动化标注物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 现支持在中东地区进行跨区域推理,使用 Anthropic Claude 模型
02-24 Amazon Bedrock Anthropic Claude
[自动] [JUEJIN]
2minsticky_note_2 AI视觉连载5:传统CV之均值滤波
02-24 AI视觉 传统CV 均值滤波
[自动] [JUEJIN]
3minsticky_note_2 AI Agent 进化论:从 SkillSMP 到 EvoMap 的技术栈演进
02-24 AI Agent MCP SkillSMP
[自动] [ARXIV]
4minschool AdaEvolve:基于大语言模型的自适应零阶优化方法
02-24 AdaEvolve LLM 零阶优化
[自动] [BLOGS_PODCASTS]
4minmic Taalas 定制芯片实现 Llama 3.1 8B 每秒 16960 tok/s
02-24 Taalas 定制芯片 ASIC
[自动] [BLOGS_PODCASTS]
4minmic SWE-bench Verified 数据泄露与缺陷分析:为何应转向 SWE-bench Pro
02-24 SWE-bench 数据泄露 数据污染
[自动] [BLOGS_PODCASTS]
2minmic OpenAI前沿评估团队:从SWE-Bench Verified看智能体评估演进
02-24 OpenAI SWE-Bench 智能体
[自动] [HACKER_NEWS]
5minnewspaper HuggingFace Agent 技能机制解析
02-24 HuggingFace Agent LLM
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉语言模型规模化标注数据赋能物理AI
02-24 VLM 物理AI 数据标注
[自动] [BLOGS_PODCASTS]
5minmic AWS SageMaker集成Dottxt Outlines实现LLM结构化输出
02-24 AWS SageMaker 结构化输出
[自动] [BLOGS_PODCASTS]
2minmic Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击
02-24 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理
02-24 Amazon Bedrock Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 推出中东全球跨区域推理支持 Claude 模型
02-24 Amazon Bedrock Claude Anthropic
[自动] [HACKER_NEWS]
5minnewspaper HuggingFace Agent 技能框架:工具调用与任务编排解析
02-24 HuggingFace Agent 工具调用
[自动] [ARXIV]
4minschool 部分可观测平均场博弈的循环结构策略梯度算法
02-24 平均场博弈 部分可观测 策略梯度
[自动] [BLOGS_PODCASTS]
6minmic 使用veRL和Ray在SageMaker上训练CodeFu-7B模型
02-24 SageMaker veRL Ray
[自动] [BLOGS_PODCASTS]
4minmic Taalas 定制芯片实现 Llama 3.1 推理速度 16960 tok/s
02-24 Taalas 定制芯片 ASIC
[自动] [BLOGS_PODCASTS]
3minmic SWE-bench Verified 存在数据污染与评估偏差,建议改用 SWE-bench Pro
02-24 SWE-bench 数据污染 基准测试
[自动] [BLOGS_PODCASTS]
2minmic OpenAI前沿评估团队探讨SWE-Bench Verified后的下一步
02-24 OpenAI SWE-Bench Agent
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 成立前沿联盟,助力企业实现智能体规模化生产部署
02-24 OpenAI 智能体 企业部署
[自动] [BLOGS_PODCASTS]
4minmic Hexagon 利用 SageMaker HyperPod 加速分割模型预训练
02-24 SageMaker HyperPod AWS
[自动] [BLOGS_PODCASTS]
2minmic Bedrock Robotics利用视觉语言模型自动化生成物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
2minmic Anthropic指控DeepSeek等遭超1600万次蒸馏攻击
02-24 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 新增中东区域支持 Anthropic Claude 模型推理
02-24 AWS Amazon Bedrock Anthropic
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 在东南亚及台湾推出 Anthropic Claude 模型全球跨区域推理
02-24 Amazon Bedrock Anthropic Claude 3
[自动] [BLOGS_PODCASTS]
5minmic 基于AWS与Hugging Face smolagents构建多模型医疗智能体
02-24 AWS Hugging Face smolagents
[自动] [JUEJIN]
2minsticky_note_2 大模型开发演进:从ChatGPT到多模态与A2A协作
02-24 LLM ChatGPT 多模态
[自动] [BLOGS_PODCASTS]
5minmic 基于Hugging Face smolagents与AWS构建多模型医疗AI代理
02-24 Hugging Face smolagents AWS
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-24 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]
3minmic Taalas HC1 定制芯片实现 Llama 3.1 8B 推理速度 1.7 万 token/s
02-24 Taalas 定制芯片 ASIC
[自动] [BLOGS_PODCASTS]
3minmic SWE-bench Verified 数据污染与测度失准分析及替代方案
02-24 SWE-bench 数据污染 代码生成
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 前沿评估团队:SWE-Bench Verified 之后的下一步
02-24 OpenAI SWE-Bench 智能体
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-24 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉语言模型规模化标注施工数据
02-24 VLM 视觉语言模型 数据标注
[自动] [BLOGS_PODCASTS]
2minmic Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击
02-24 Anthropic DeepSeek 模型蒸馏
[自动] [HACKER_NEWS]
6minnewspaper 将 Wolfram 技术作为基础工具接入大语言模型
02-24 Wolfram LLM 工具调用
[自动] [HACKER_NEWS]
6minnewspaper Steerling-8B:可解释自身生成任一 token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]
5minnewspaper Wolfram 技术作为 LLM 系统基础工具开放
02-24 Wolfram LLM 工具链
[自动] [HACKER_NEWS]
3minnewspaper Steerling-8B:可解释自身生成任一 Token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]
4minnewspaper 53款模型“洗车”测试
02-24 模型评估 基准测试 LLM
[自动] [JUEJIN]
1minsticky_note_2 阿里云PAI升级全链路基础设施支持Qwen3.5
02-24 阿里云 Qwen3.5 PAI
[自动] [HACKER_NEWS]
5minnewspaper 将 Wolfram 技术作为 LLM 系统基础工具
02-24 LLM Wolfram 工具调用
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用
02-24 深度学习 D2L PyTorch
[自动] [HACKER_NEWS]
5minnewspaper Steerling-8B:可解释自身生成任一 Token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [BLOGS_PODCASTS]
3minmic OpenAI成立前沿联盟:助企业安全部署AI智能体落地生产
02-24 OpenAI 智能体 AI部署
[自动] [JUEJIN]
2minsticky_note_2 DeepMind研究:多智能体协作瓶颈与Agent能力天花板分析
02-24 DeepMind 多智能体 Agent
[自动] [JUEJIN]
2minsticky_note_2 ArcFlow实现FLUX与Qwen推理40倍加速
02-24 ArcFlow FLUX Qwen
[自动] [HACKER_NEWS]
3minnewspaper 53款模型“洗车”测试:评估多模态AI在物理场景中的表现
02-24 多模态 物理场景 模型评估
[自动] [HACKER_NEWS]
4minnewspaper Steerling-8B:可解释自身生成任一 Token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]
3minnewspaper 53款模型“洗车”测试:评估代码生成与修复能力
02-24 代码生成 模型评估 Bug修复
[自动] [HACKER_NEWS]
4minnewspaper Steerling-8B:可解释自身生成任一 Token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]
5minnewspaper 将 Wolfram 技术集成为大语言模型系统的基础工具
02-24 Wolfram LLM 工具集成
[自动] [HACKER_NEWS]
4minnewspaper 53款模型“洗车”测试:评估大模型代码生成鲁棒性
02-24 代码生成 鲁棒性 模型评估
[自动] [ARXIV]
4minschool 用于软优势策略优化的平滑门函数
02-24 强化学习 GRPO SAPO
[自动] [BLOGS_PODCASTS]
5minmic 基于AWS与Hugging Face smolagents构建多模型医疗AI智能体
02-24 AWS Hugging Face smolagents
[自动] [ARXIV]
4minschool 城市编辑:面向依赖感知的分层智能体城市地理空间修改
02-24 City Editing 分层智能体 多模态推理
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-24 First Proof 数学证明 AI推理
[自动] [HACKER_NEWS]
5minnewspaper Wolfram技术作为LLM系统基础工具的集成方案
02-24 Wolfram LLM 工具集成
[自动] [BLOGS_PODCASTS]
2minmic Taalas HC1 芯片实测:Llama 3.1 8B 跑出 16960 tok/s
02-24 Taalas 定制芯片 ASIC
[自动] [BLOGS_PODCASTS]
2minmic SWE-bench Verified 存在数据污染与缺陷,建议迁移至 SWE-bench Pro
02-24 SWE-bench 数据污染 基准测试
[自动] [ARXIV]
5minschool Soft Sequence Policy Optimization:连接GMPO与SAPO
02-24 SSPO LLM对齐 强化学习
[自动] [BLOGS_PODCASTS]
2minmic OpenAI前沿评测团队:SWE-Bench Verified后的智能体评测演进
02-24 OpenAI SWE-Bench Agent
[自动] [BLOGS_PODCASTS]
4minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-24 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
3minmic Bedrock Robotics利用视觉-语言模型规模化标注物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [ARXIV]
4minschool 统一图神经网络均匀表达能力的通用方法
02-24 GNN 图神经网络 表达能力
[自动] [ARXIV]
4minschool 扩散模型无需噪声调节的几何学原理
02-24 扩散模型 Flow Matching 几何学原理
[自动] [BLOGS_PODCASTS]
5minmic 基于AWS与Hugging Face smolagents构建多模型医疗AI Agent
02-24 Agent AWS Hugging Face
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-24 数学推理 First Proof 研究级推理
[自动] [ARXIV]
5minschool U(d)子群导出自然RNN与Transformer架构
02-24 RNN Transformer 序列模型
[自动] [BLOGS_PODCASTS]
2minmic Taalas HC1 定制芯片实现 Llama 3.1 8B 每秒 16960 tok
02-24 Taalas 定制芯片 ASIC
[自动] [BLOGS_PODCASTS]
3minmic SWE-bench Verified 数据泄露与测试缺陷分析:为何应迁移至 SWE-bench Pro
02-24 SWE-bench 数据泄露 基准测试
[自动] [ARXIV]
4minschool SPQ:面向大语言模型压缩的集成技术
02-24 LLM 模型压缩 SPQ
[自动] [ARXIV]
3minschool RVR:检索-验证-检索机制提升综合问答能力
02-24 RVR RAG 检索增强
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 推进智能体评估:SWE-Bench Verified 后续方向
02-24 OpenAI SWE-Bench 智能体评估
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-24 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
3minmic Bedrock与AWS合作:利用视觉-语言模型规模化生成物理AI训练数据
02-24 VLM 视觉语言模型 数据标注
[自动] [JUEJIN]
1minsticky_note_2 2025年AI技术综述:DeepSeek R1与Agent落地元年
02-24 DeepSeek R1 Agent OpenAI
[自动] [BLOGS_PODCASTS]
2minmic 研究显示主流AI模型向弱势用户提供的信息准确度较低
02-23 AI偏见 数字鸿沟 模型评估
[自动] [ARXIV]
4minschool 扩散模型无需噪声条件:几何视角的解释
02-23 扩散模型 几何视角 生成模型
[自动] [BLOGS_PODCASTS]
5minmic 基于AWS与Hugging Face smolagents构建多模型医疗AI Agent
02-23 Hugging Face smolagents AWS
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:面向中文读者的可运行教材,全球500余所高校采用
02-23 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-23 First Proof 数学证明 推理能力
[自动] [ARXIV]
4minschool U(d)子群自然导出RNN与Transformer架构
02-23 RNN Transformer U(d)
[自动] [BLOGS_PODCASTS]
3minmic Taalas HC1 定制芯片运行 Llama 3.1 8B 达 16960 tok/s
02-23 Taalas 定制芯片 ASIC
[自动] [BLOGS_PODCASTS]
3minmic SWE-bench Verified 数据泄漏与测试缺陷分析:为何推荐改用 SWE-bench Pro
02-23 SWE-bench 数据泄漏 基准测试
[自动] [ARXIV]
6minschool SPQ:大语言模型压缩的集成技术
02-23 模型压缩 LLM 量化
[自动] [ARXIV]
4minschool RVR:检索-验证-检索框架提升综合问答能力
02-23 RVR RAG 检索增强
[自动] [BLOGS_PODCASTS]
3minmic OpenAI前沿评估团队:超越SWE-Bench Verified的智能体评估新阶段
02-23 OpenAI SWE-Bench 智能体评估
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 成立 Frontier 联盟:携手合作伙伴,护航企业智能体安全落地
02-23 OpenAI Frontier Alliance AI Agent
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍
02-23 Gemini 3.1 Pro Google ARC-AGI 2
[自动] [BLOGS_PODCASTS]
3minmic OpenAI提出SWE-Bench-Dead:智能体前沿评估的下一步
02-23 OpenAI SWE-Bench Agent
[自动] [HACKER_NEWS]
4minnewspaper 53 款模型参与“洗车”基准测试
02-23 基准测试 模型评估 LLM
[自动] [BLOGS_PODCASTS]
2minmic 研究显示AI聊天机器人向弱势用户提供的信息准确性较低
02-23 AI偏见 公平性 弱势群体
[自动] [BLOGS_PODCASTS]
4minmic Taalas 定制芯片实现 Llama 3.1 8B 每用户 16960 tok/s
02-23 Taalas 定制芯片 ASIC
[自动] [BLOGS_PODCASTS]
2minmic SWE-bench Verified 数据污染严重,推荐使用 SWE-bench Pro
02-23 SWE-bench 数据污染 基准测试
[自动] [BLOGS_PODCASTS]
2minmic MIT新方法根除漏洞并提升大语言模型安全性与性能
02-23 MIT LLM 模型安全
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍
02-23 Gemini Google ARC-AGI
[自动] [HACKER_NEWS]
4minnewspaper Anthropic 发布 AI 熟练度指数以评估教育领域应用
02-23 Anthropic AI教育 熟练度指数
[自动] [BLOGS_PODCASTS]
2minmic AI模型在First Proof数学挑战中的证明尝试
02-23 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]
2minmic 研究显示主流AI模型向弱势用户提供的信息准确度较低
02-23 LLM 公平性 偏见
[自动] [BLOGS_PODCASTS]
5minmic 基于AWS与Hugging Face smolagents构建医疗AI智能体
02-23 Agentic AI Hugging Face smolagents
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-23 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]
2minmic MIT新方法根除漏洞并提升大语言模型安全性与性能
02-23 MIT LLM 模型安全
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic Anthropic与OpenAI的博弈:a16z对话AI投资与算力经济
02-23 a16z Anthropic OpenAI
[自动] [HACKER_NEWS]
6minnewspaper AI时间线:从Transformer(2017)到GPT-5.3(2026)的171个大模型
02-23 LLM 时间线 Transformer
[自动] [BLOGS_PODCASTS]
2minmic 研究显示AI聊天机器人向弱势群体提供更不准确信息
02-23 AI偏见 公平性 信息准确性
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-23 First Proof 数学证明 推理能力
[自动] [BLOGS_PODCASTS]
3minmic 使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型
02-23 Unsloth Hugging Face 免费训练
[自动] [BLOGS_PODCASTS]
3minmic Taalas 定制芯片实现 Llama 3.1 8B 每秒 16960 tokens
02-23 Taalas ASIC 定制芯片
[自动] [JUEJIN]
3minsticky_note_2 nano-vllm:vLLM 极简实现与大模型推理流程解析
02-23 vLLM LLM 推理引擎
[自动] [BLOGS_PODCASTS]
2minmic MIT新方法根除漏洞并提升大语言模型安全性与性能
02-23 MIT LLM 模型安全
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro:针对复杂任务设计的智能模型
02-23 Gemini Google LLM
[自动] [BLOGS_PODCASTS]
2minmic a16z深度对话:Anthropic与OpenAI的博弈、Noam Shazeer及AI创业趋势
02-23 a16z Anthropic OpenAI
[自动] [JUEJIN]
1minsticky_note_2 2025年AI回顾:DeepSeek R1破圈与模型落地应用元年
02-23 DeepSeek R1 AI Agent 模型落地
[自动] [HACKER_NEWS]
5minnewspaper 谷歌限制使用OpenClaw的AI Pro/Ultra订阅用户
02-23 Google OpenClaw AI订阅
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-23 合成数据 数据瓶颈 日本AI
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-23 数学推理 First Proof 专家级问题
[自动] [BLOGS_PODCASTS]
2minmic Taalas HC1 定制芯片实现 Llama 3.1 每秒 16960 tok
02-23 Taalas HC1 定制芯片 ASIC
[自动] [BLOGS_PODCASTS]
2minmic MIT研究:主流AI模型对低学历及非美用户提供信息准确度较低
02-23 MIT LLM 偏见
[自动] [BLOGS_PODCASTS]
2minmic MIT新方法揭示大模型隐藏偏差并提升安全性
02-23 MIT LLM 模型安全
[自动] [BLOGS_PODCASTS]
3minmic GGML与llama.cpp加入HF,推动本地AI长期发展
02-23 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro:面向复杂任务的深度解答模型
02-23 Gemini Google LLM
[自动] [HACKER_NEWS]
5minnewspaper AI Timeline:收录 171 个大语言模型发展时间线
02-23 LLM 时间线 Transformer
[自动] [HACKER_NEWS]
4minnewspaper 谷歌限制使用OpenClaw的AI Pro/Ultra订阅用户
02-23 Google OpenClaw 账号封禁
[自动] [BLOGS_PODCASTS]
4minmic Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍
02-23 Gemini 3.1 Pro Google ARC-AGI
[自动] [ARXIV]
4minschool 面向扩散语言模型的感知剪枝方法
02-23 扩散模型 语言模型 模型剪枝
[自动] [ARXIV]
3minschool 语言模型处理差异论元标记时的类型学对齐差异
02-23 语言模型 类型学 区分性论元标记
[自动] [ARXIV]
3minschool 细粒度细节定向提升黑盒LVLM攻击能力
02-23 LVLM 黑盒攻击 对抗攻击
[自动] [ARXIV]
3minschool 多轮人机协作中用户需求的精准对齐方法
02-23 人机协作 多轮对话 决策质量
[自动] [ARXIV]
4minschool 基于Tokenizer的文本语言识别方法研究
02-23 UniLID 语言识别 Tokenizer
[自动] [ARXIV]
4minschool Mine and Refine:优化电商搜索检索的分级相关性
02-23 电商搜索 信息检索 双塔模型
[自动] [ARXIV]
4minschool MARS:基于边界感知与自我优化的奖励建模
02-23 RLHF 奖励模型 MARS
[自动] [ARXIV]
4minschool FAMOSE:基于ReAct范式的自动化特征发现方法
02-23 特征工程 ReAct 自动化特征发现
[自动] [BLOGS_PODCASTS]
2minmic 麻省理工学院新方法根除漏洞提升大模型安全性与性能
02-22 MIT LLM 模型安全
[自动] [BLOGS_PODCASTS]
2minmic 研究:主流AI聊天机器人向弱势用户提供的信息准确度较低
02-22 AI偏见 信息准确性 弱势群体
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-22 AI模型 First Proof 数学挑战
[自动] [BLOGS_PODCASTS]
2minmic Taalas HC1 芯片实测:Llama 3.1 8B 跑出 16960 tok/s
02-22 Taalas HC1 ASIC
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍
02-22 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro:面向复杂任务设计的智能模型
02-22 Gemini Google LLM
[自动] [BLOGS_PODCASTS]
4minmic a16z对话Anthropic与OpenAI:风险投资与增长策略的艰难教训
02-22 a16z OpenAI Anthropic
[自动] [BLOGS_PODCASTS]
2minmic 利用合成人设突破数据瓶颈,加速日本AI开发
02-22 合成数据 人设生成 数据增强
[自动] [ARXIV]
4minschool 面向扩散语言模型的感知汇点剪枝方法
02-22 扩散模型 DLM 模型剪枝
[自动] [ARXIV]
3minschool 语言模型处理差异论元标记的类型对齐差异
02-22 语言模型 GPT-2 计算语言学
[自动] [ARXIV]
4minschool 多轮人机协作框架支持用户自定义需求
02-22 人机协作 多轮对话 决策质量
[自动] [ARXIV]
4minschool 基于分词器的未知语言识别方法
02-22 UniLID 语言识别 分词器
[自动] [HACKER_NEWS]
4minnewspaper Taalas 如何将大语言模型直接打印至芯片
02-22 Taalas LLM 芯片
[自动] [ARXIV]
4minschool MARS:基于边距感知奖励建模与自我精炼
02-22 MARS RLHF Reward Model
[自动] [ARXIV]
4minschool FAMOSE:基于 ReAct 框架的自动化特征发现方法
02-22 特征工程 自动化特征发现 ReAct
[自动] [HACKER_NEWS]
4minnewspaper Taalas 如何将大语言模型“打印”至芯片
02-22 Taalas 芯片 ASIC
[自动] [HACKER_NEWS]
4minnewspaper Taalas如何将大语言模型“打印”至芯片
02-22 Taalas LLM ASIC
[自动] [HACKER_NEWS]
5minnewspaper Claws 现已成为 LLM 智能体的新架构层
02-22 LLM 智能体 Agent
[自动] [HACKER_NEWS]
4minnewspaper Taalas技术解析:如何将大语言模型直接印制于芯片
02-22 Taalas 模型固化 ASIC
[自动] [HACKER_NEWS]
5minnewspaper Claws 成为 LLM 智能体顶层新抽象层
02-22 LLM 智能体 抽象层
[自动] [HACKER_NEWS]
5minnewspaper Taalas技术解析:如何将大模型直接打印至芯片
02-22 Taalas 芯片 LLM
[自动] [HACKER_NEWS]
5minnewspaper LLM智能体新增Claws层以增强工具调用能力
02-22 LLM 智能体 工具调用
[自动] [JUEJIN]
3minsticky_note_2 Gemini 2.5 Pro实测:同API对比三款大模型找Bug能力
02-22 Gemini Claude GPT
[自动] [HACKER_NEWS]
6minnewspaper Claws 成为 LLM 智能体之上的新架构层
02-22 LLM 智能体 架构
[自动] [HACKER_NEWS]
6minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 时间序列 前向传播
[自动] [HACKER_NEWS]
4minnewspaper 人类信任根:面向智能体问责的公共领域框架
02-22 智能体 问责制 信任根
[自动] [HACKER_NEWS]
4minnewspaper Taalas 如何将大语言模型直接打印至芯片
02-22 Taalas LLM ASIC
[自动] [HACKER_NEWS]
7minnewspaper LLM智能体新增Claws层以增强能力
02-22 LLM 智能体 Claws
[自动] [HACKER_NEWS]
4minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 前向传播 时间序列
[自动] [HACKER_NEWS]
6minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 时间序列 神经网络
[自动] [HACKER_NEWS]
7minnewspaper LLM智能体新增Claws层以增强功能
02-22 LLM 智能体 Claws
[自动] [HACKER_NEWS]
5minnewspaper LLM智能体新增Claws层以优化任务执行
02-22 LLM 智能体 Claws
[自动] [ARXIV]
5minschool 面向扩散语言模型的Sink感知剪枝方法
02-21 扩散模型 语言模型 模型剪枝
[自动] [ARXIV]
3minschool 语言模型处理差价论元标记的类型学对齐差异
02-21 语言模型 计算语言学 类型学
[自动] [BLOGS_PODCASTS]
2minmic 研究显示主流AI模型向弱势用户提供的信息准确性较低
02-21 偏见 幻觉 数字鸿沟
[自动] [ARXIV]
4minschool 多轮人机协作框架支持用户自定义需求
02-21 人机协作 LLM 决策质量
[自动] [ARXIV]
4minschool 基于分词器的语言识别模型研究
02-21 UniLID 语言识别 分词器
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-21 合成数据 数据增强 LLM
[自动] [BLOGS_PODCASTS]
3minmic Taalas HC1 自研芯片运行 Llama 3.1 8B 达 16960 tok/s
02-21 Taalas HC1 ASIC
[自动] [ARXIV]
5minschool MMARS:基于边际感知与自我精炼的奖励建模
02-21 RLHF 奖励建模 数据增强
[自动] [BLOGS_PODCASTS]
2minmic MIT新方法根除漏洞并提升LLM安全性与性能
02-21 MIT LLM 模型安全
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro:面向复杂任务设计的智能模型
02-21 Gemini Google LLM
[自动] [ARXIV]
5minschool FAMOSE:基于 ReAct 范式的自动化特征发现方法
02-21 特征工程 ReAct 自动化
[自动] [BLOGS_PODCASTS]
3minmic AI模型针对First Proof数学挑战的证明尝试与推理能力测试
02-21 LLM 数学推理 First Proof
[自动] [HACKER_NEWS]
5minnewspaper LLM智能体新增Claws层:强化外部工具调用与任务执行能力
02-21 LLM 智能体 Claws
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-21 Gemini Google ARC-AGI
[自动] [GITHUB_TRENDING]
10minhub ChatGPT中文调教指南:多场景提示词与使用技巧
02-21 ChatGPT 提示词工程 Prompt
[自动] [HACKER_NEWS]
5minnewspaper Ggml.ai加入Hugging Face推动本地AI长期发展
02-21 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]
4minnewspaper 打造AI助手的公司如今都转型成了广告公司
02-21 AI助手 商业模式 广告变现
[自动] [HACKER_NEWS]
5minnewspaper Lean 4 定理证明器工作原理及其在 AI 领域的竞争优势
02-21 Lean 4 定理证明器 形式化验证
[自动] [HACKER_NEWS]
5minnewspaper Ggml.ai加入Hugging Face以推动本地AI长期发展
02-21 GGML Hugging Face 本地AI
[自动] [HACKER_NEWS]
6minnewspaper Ggml.ai 加入 Hugging Face 以推动本地 AI 长期发展
02-21 GGML Hugging Face 本地 AI
[自动] [HACKER_NEWS]
4minnewspaper 大语言模型推理失败机制分析
02-21 LLM 推理 逻辑错误
[自动] [HACKER_NEWS]
5minnewspaper Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展
02-21 Hugging Face GGML 本地AI
[自动] [HACKER_NEWS]
9minnewspaper Lean 4 定理证明器原理与AI竞争新优势
02-21 Lean 4 定理证明器 形式化验证
[自动] [HACKER_NEWS]
5minnewspaper Cord:协调多层级 AI 智能体树状协作框架
02-21 AI Agents 多智能体 协作框架
[自动] [HACKER_NEWS]
4minnewspaper 打造AI助手的公司正转型为广告公司
02-21 AI助手 广告模式 商业化
[自动] [HACKER_NEWS]
5minnewspaper Lean 4 定理证明器工作原理及其在 AI 领域的新竞争优势
02-21 Lean 4 定理证明器 形式化验证
[自动] [HACKER_NEWS]
3minnewspaper Cord:AI 智能体树状协作框架
02-21 AI 智能体 协作框架 树状结构
[自动] [HACKER_NEWS]
7minnewspaper 通往普及AI之路:实现每秒1.7万Token推理
02-21 推理加速 Token生成 AI普及
[自动] [HACKER_NEWS]
4minnewspaper 打造AI助手的公司正转型为广告公司
02-21 AI助手 商业化 广告模式
[自动] [HACKER_NEWS]
5minnewspaper Lean 4 定理证明器工作原理及其在 AI 领域的竞争优势
02-21 Lean 4 定理证明器 形式化验证
[自动] [HACKER_NEWS]
7minnewspaper Cord:协调多智能体树状协作框架
02-21 多智能体 协作框架 Cord
[自动] [HACKER_NEWS]
5minnewspaper 通往普及AI之路:实现每秒1.7万tokens推理
02-21 推理加速 Token生成 性能优化
[自动] [JUEJIN]
2minsticky_note_2 Open-AutoGLM:基于视觉语言模型的手机端智能助理框架
02-21 Phone Agent AutoGLM VLM
[自动] [HACKER_NEWS]
5minnewspaper Cord:协调多层级 AI 智能体树的框架
02-21 AI Agents Multi-Agent Cord
[自动] [JUEJIN]
2minsticky_note_2 AI Agent SOUL.md 人格文件编写指南与核心模块解析
02-21 AI Agent SOUL.md Prompt工程
[自动] [JUEJIN]
1minsticky_note_2 谷歌AI购物助手技术架构与商业化路径解析
02-21 谷歌 AI购物助手 Gemini
[自动] [HACKER_NEWS]
5minnewspaper Cord:协调多层级 AI 智能体树状结构
02-21 AI Agent 多智能体 智能体编排
[自动] [BLOGS_PODCASTS]
2minmic 麻省理工学院新方法提升大语言模型安全性与性能
02-21 MIT LLM 可解释性
[自动] [BLOGS_PODCASTS]
4minmic 谷歌Gemini 3.1 Pro发布:ARC-AGI 2测试性能达3.0两倍
02-21 Gemini 3.1 Pro Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic 研究显示主流AI模型向弱势用户提供信息准确度较低
02-21 AI偏见 公平性 准确性
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-21 合成数据 数据增强 Persona
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-21 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]
5minmic 使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型
02-21 Unsloth Hugging Face 模型训练
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 承诺 750 万美元资助独立 AI 对齐研究
02-21 OpenAI AI对齐 AGI安全
[自动] [HACKER_NEWS]
4minnewspaper 通向无处不在的AI之路:实现每秒1.7万tokens推理
02-21 推理加速 Token生成 AI部署
[自动] [HACKER_NEWS]
5minnewspaper Ggml.ai加入Hugging Face推动本地AI长期发展
02-21 GGML Hugging Face 本地AI
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro:面向复杂任务的高性能模型
02-21 Gemini Google LLM
[自动] [ARXIV]
4minschool 面向扩散语言模型的Sink感知剪枝方法
02-20 扩散模型 语言模型 模型剪枝
[自动] [ARXIV]
3minschool 通过细粒度细节定向提升黑盒LVLM攻击能力
02-20 对抗攻击 LVLM 黑盒攻击
[自动] [HACKER_NEWS]
5minnewspaper 迈向通用AI:17k tokens/sec的推理性能路径
02-20 推理性能 Token生成 通用AI
[自动] [BLOGS_PODCASTS]
2minmic 谷歌Gemini 3.1 Pro发布:ARC-AGI 2性能达3.0两倍
02-20 Gemini Google ARC-AGI
[自动] [ARXIV]
3minschool 语言模型对差异论元标记处理的类型学对齐差异
02-20 语言模型 GPT-2 计算语言学
[自动] [BLOGS_PODCASTS]
2minmic 研究:AI聊天机器人向弱势用户提供的信息准确度较低
02-20 偏见 公平性 准确性
[自动] [HACKER_NEWS]
3minnewspaper 打造AI助手的科技公司正转型为广告公司
02-20 AI助手 广告模式 商业化
[自动] [ARXIV]
3minschool 基于用户指定需求的多轮人机协作框架
02-20 人机协作 多轮对话 决策质量
[自动] [BLOGS_PODCASTS]
1minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-20 合成数据 数据瓶颈 日本AI
[自动] [BLOGS_PODCASTS]
4minmic 使用Unsloth和Hugging Face Jobs免费训练AI模型
02-20 Unsloth Hugging Face 免费训练
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 投入 750 万美元资助独立 AI 对齐研究
02-20 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
2minmic MIT新方法根除漏洞并提升大语言模型安全性与性能
02-20 MIT LLM 模型安全
[自动] [ARXIV]
5minschool MARS:基于边际感知与自我精炼的奖励建模
02-20 MARS RLHF 奖励模型
[自动] [BLOGS_PODCASTS]
5minmic GGML与llama.cpp加入HF以保障本地AI长期发展
02-20 GGML llama.cpp Hugging Face
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro:专用于处理复杂任务的智能模型
02-20 Gemini Google LLM
[自动] [ARXIV]
5minschool FAMOSE:基于 ReAct 范式的自动化特征发现方法
02-20 FAMOSE 特征工程 自动化特征发现
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 发布自主智能体 METR 基准测试数据
02-20 Anthropic 智能体 Agent
[自动] [JUEJIN]
3minsticky_note_2 Agent 开发实战:赋予大模型工具调用能力
02-20 Agent LLM Tool Use
[自动] [BLOGS_PODCASTS]
2minmic 麻省理工学院新方法根除漏洞并提升大模型安全性与性能
02-20 MIT LLM 模型安全
[自动] [BLOGS_PODCASTS]
2minmic 研究显示主流AI模型向弱势用户提供的信息准确度较低
02-20 AI偏见 模型评估 用户体验
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-20 合成数据 数据增强 日本AI
[自动] [BLOGS_PODCASTS]
3minmic 使用Unsloth与Hugging Face Jobs免费训练AI模型
02-20 Unsloth Hugging Face 免费训练
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 投入 750 万美元资助独立 AI 对齐研究
02-20 OpenAI AI对齐 AGI安全
[自动] [HACKER_NEWS]
4minnewspaper Ggml.ai加入Hugging Face以推动本地AI长期发展
02-20 GGML Hugging Face 本地AI
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro发布:ARC-AGI 2性能达3.0两倍
02-20 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro:面向复杂任务设计的智能模型
02-20 Gemini Google LLM
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 公布 Agent 自主性研究及 METR 基准数据
02-20 Anthropic Agent 自主性
[自动] [HACKER_NEWS]
5minnewspaper 通往泛在AI之路:实现每秒1.7万tokens推理
02-20 推理加速 Token生成 泛在AI
[自动] [HACKER_NEWS]
4minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [BLOGS_PODCASTS]
3minmic 研究显示主流AI模型对弱势群体提供信息准确度较低
02-20 AI偏见 公平性 包容性
[自动] [HACKER_NEWS]
4minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [BLOGS_PODCASTS]
2minmic MIT新方法根除漏洞并提升大语言模型安全性与性能
02-20 LLM MIT 模型安全
[自动] [HACKER_NEWS]
5minnewspaper Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展
02-20 GGML Hugging Face 本地AI
[自动] [BLOGS_PODCASTS]
3minmic Anthropic发布自主Agent研究:基于METR数据评估模型自主能力
02-20 Anthropic 自主Agent METR
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-20 合成数据 数据瓶颈 日本AI
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 投入750万美元资助独立AI对齐研究
02-20 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro:针对复杂任务设计的智能模型
02-20 Gemini Google LLM
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 发布自主智能体 METR 基准测试数据
02-20 Anthropic METR 自主智能体
[自动] [BLOGS_PODCASTS]
2minmic 麻省理工学院新方法根除漏洞并提升大语言模型安全性
02-20 MIT LLM 模型安全
[自动] [HACKER_NEWS]
5minnewspaper 谷歌发布 Gemini 2.5 Pro:支持 100 万上下文窗口
02-20 Gemini Google LLM
[自动] [HACKER_NEWS]
5minnewspaper 基于注意力匹配机制实现快速KV压缩
02-20 KV压缩 注意力机制 推理优化
[自动] [BLOGS_PODCASTS]
3minmic 使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型
02-20 Unsloth Hugging Face 免费训练
[自动] [HACKER_NEWS]
4minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [BLOGS_PODCASTS]
2minmic MIT研究:主流AI模型向低教育及非美用户提供信息准确性更低
02-20 MIT研究 AI偏见 数字鸿沟
[自动] [BLOGS_PODCASTS]
4minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-20 Gemini 3.1 Pro Google ARC-AGI
[自动] [BLOGS_PODCASTS]
3minmic Anthropic与OpenAI的创业教训:a16z对话AI投资逻辑
02-20 a16z 投资逻辑 Anthropic
[自动] [HACKER_NEWS]
4minnewspaper 通往普及AI之路:实现每秒1.7万tokens推理
02-20 推理加速 高性能计算 Token吞吐
[自动] [HACKER_NEWS]
4minnewspaper 谷歌发布 Gemini 3.1 Pro 模型
02-20 Gemini Google LLM
[自动] [HACKER_NEWS]
4minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [HACKER_NEWS]
5minnewspaper 利用注意力匹配加速 KV 键值对压缩
02-20 KV压缩 注意力机制 推理加速
[自动] [HACKER_NEWS]
6minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [GITHUB_TRENDING]
10minhub ChatGPT中文调教指南:涵盖多场景使用与提示词优化
02-20 ChatGPT 提示词 Prompt
[自动] [HACKER_NEWS]
5minnewspaper 利用注意力匹配加速 KV 缓存压缩
02-20 KV Cache 注意力机制 模型推理
[自动] [JUEJIN]
1minsticky_note_2 2026年2月19日AI热点:OpenAI加码医疗,OpenEvidence估值120亿美元
02-20 AI热点 医疗AI OpenAI
[自动] [HACKER_NEWS]
7minnewspaper 谷歌发布 Gemini 3.1 Pro 模型
02-20 Gemini Google LLM
[自动] [BLOGS_PODCASTS]
2minmic 研究:主流AI聊天机器人向弱势用户提供的信息准确度较低
02-20 偏见 公平性 准确性
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-20 合成数据 数据增强 LLM
[自动] [BLOGS_PODCASTS]
3minmic 使用 Unsloth 与 Hugging Face Jobs 免费训练大模型
02-20 Unsloth Hugging Face 免费训练
[自动] [HACKER_NEWS]
4minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 投 750 万美元资助独立 AI 对齐研究
02-20 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
2minmic MIT新方法根除漏洞并提升大语言模型安全性与性能
02-20 MIT LLM 模型安全
[自动] [BLOGS_PODCASTS]
3minmic Anthropic发布基于METR数据的Agent自主性研究
02-20 Anthropic Agent 自主性
[自动] [BLOGS_PODCASTS]
3minmic a16z深度对话:Anthropic与OpenAI的博弈、Noam Shazeer及AI投资逻辑
02-20 a16z Anthropic OpenAI
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro:专为复杂任务设计的智能模型
02-20 Gemini Google LLM
[自动] [HACKER_NEWS]
5minnewspaper 谷歌发布 Gemini 2.5 Pro:上下文窗口达 100 万 tokens
02-20 Gemini Google LLM
[自动] [HACKER_NEWS]
3minnewspaper 不要轻信盐值:AI摘要、多语言安全与大模型防护
02-20 LLM安全 AI摘要 多语言
[自动] [HACKER_NEWS]
5minnewspaper AI智能体自主性评估的实践方法
02-20 AI Agent 自主性 评估体系
[自动] [ARXIV]
5minschool 面向安全智能体系统的策略编译器
02-20 智能体 LLM 策略编译器
[自动] [ARXIV]
3minschool 评估LLM辅助对生物学新手表现的影响
02-20 LLM 生物学 随机对照试验
[自动] [ARXIV]
4minschool 强化快速权重结合下一序列预测模型
02-20 REFINE 强化学习 快速权重
[自动] [ARXIV]
4minschool 因果性是可解释性泛化的关键
02-20 可解释性 因果推断 泛化性
[自动] [ARXIV]
3minschool 以对象为中心的表征是否更利于组合泛化
02-20 组合泛化 对象中心 视觉表征
[自动] [HACKER_NEWS]
4minnewspaper 不要盲目信任盐值:AI摘要、多语言安全与大模型护栏
02-20 LLM 安全护栏 AI摘要
[自动] [ARXIV]
5minschool Calibrate-Then-Act:面向大模型智能体的成本感知探索
02-20 LLM Agents 成本感知 CTA框架
[自动] [HACKER_NEWS]
4minnewspaper AI智能体自主性水平的实践评估方法
02-20 AI Agent 自主性 评估方法
[自动] [ARXIV]
4minschool 面向安全智能体系统的策略编译器
02-19 Agentic Systems Policy Compiler LLM Security
[自动] [HACKER_NEWS]
5minnewspaper 谷歌发布 Gemini 3.1 Pro 模型
02-19 Gemini Google LLM
[自动] [ARXIV]
3minschool 评估2025年中期LLM辅助对生物学初学者表现的影响
02-19 LLM 生物安全 AI评估
[自动] [ARXIV]
4minschool 强化快速权重与下一序列预测
02-19 REFINE 快速权重 强化学习
[自动] [ARXIV]
3minschool 因果性是可解释性泛化的关键
02-19 因果推断 可解释性 LLM
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-19 合成数据 数据瓶颈 日本AI
[自动] [ARXIV]
4minschool 以对象为中心的表征在组合泛化任务中的表现评估
02-19 组合泛化 以对象为中心 视觉问答
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 投 750 万美元资助独立 AI 对齐研究
02-19 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
2minmic MIT新方法根除漏洞并提升大语言模型安全性与性能
02-19 MIT LLM 模型安全
[自动] [GITHUB_TRENDING]
10minhub ChatGPT中文调教指南:多场景提示词与使用技巧
02-19 ChatGPT 提示词 Prompt
[自动] [ARXIV]
5minschool Calibrate-Then-Act:大模型智能体的成本感知探索
02-19 LLM Agents 成本感知 探索策略
[自动] [BLOGS_PODCASTS]
3minmic Anthropic发布Agent自主性研究及METR数据
02-19 Anthropic Agent 自主性
[自动] [HACKER_NEWS]
5minnewspaper AI智能体自主性评估的实践方法
02-19 AI Agent 自主性 评估方法
[自动] [HACKER_NEWS]
7minnewspaper 谷歌发布 Gemini 3.1 Pro 预览版
02-19 Gemini Google LLM
[自动] [HACKER_NEWS]
8minnewspaper 谷歌发布 Gemini 3.1 Pro 模型
02-19 Gemini Google LLM
[自动] [BLOGS_PODCASTS]
4minmic 使用 Unsloth 和 Hugging Face 免费训练 AI 模型
02-19 Unsloth Hugging Face 模型微调
[自动] [HACKER_NEWS]
3minnewspaper 不要盲目信任盐值:AI摘要、多语言安全与大模型防护机制
02-19 LLM AI安全 防护机制
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro:专为复杂任务设计的智能模型
02-19 Gemini Google LLM
[自动] [HACKER_NEWS]
5minnewspaper AI智能体自主性的实践测量方法
02-19 AI Agent 自主性 评估指标
[自动] [HACKER_NEWS]
5minnewspaper 面向分析师的Python大语言模型实战指南
02-19 Python LLM 数据分析
[自动] [HACKER_NEWS]
7minnewspaper 谷歌发布 Gemini 3.1 Pro 预览版
02-19 Google Gemini Gemini 3.1 Pro
[自动] [BLOGS_PODCASTS]
2minmic 理性人无目标论:AI对齐应基于实践协调而非终极目的
02-19 AI对齐 正交性论题 美德伦理
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊构建代理式AI系统的评估框架与实战经验
02-19 AI Agent 评估框架 Amazon Bedrock
[自动] [HACKER_NEWS]
4minnewspaper 不要盲目信任Salt:AI摘要、多语言安全与LLM护栏
02-19 LLM AI安全 护栏
[自动] [BLOGS_PODCASTS]
2minmic OpenAI出资750万美元资助独立AI对齐研究
02-19 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 公布 METR 数据评估 Agent 自主能力
02-19 Anthropic METR Agent
[自动] [HACKER_NEWS]
5minnewspaper AI智能体自主性的实践评估方法
02-19 AI Agent 自主性 评估方法
[自动] [HACKER_NEWS]
4minnewspaper 面向分析师的Python大语言模型实战指南
02-19 Python LLM 数据分析
[自动] [HACKER_NEWS]
5minnewspaper 谷歌发布 Gemini 3.1 模型
02-19 Google Gemini 模型发布
[自动] [HACKER_NEWS]
4minnewspaper 警惕AI总结幻觉:多语言安全与大模型护栏机制
02-19 LLM 幻觉 护栏机制
[自动] [BLOGS_PODCASTS]
2minmic 合成人设技术突破数据瓶颈,加速日本AI开发
02-19 合成数据 数据瓶颈 日本AI
[自动] [BLOGS_PODCASTS]
2minmic 亚马逊AI智能体评估框架:通用工作流与Bedrock指标库
02-19 AI智能体 评估框架 Amazon Bedrock
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro:面向复杂任务的深度回答模型
02-19 Gemini Google LLM
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 发布 METR 数据集研究 AI Agent 自主性
02-19 Anthropic METR AI Agent
[自动] [HACKER_NEWS]
5minnewspaper AI智能体自主性评估的实践方法与指标
02-19 AI Agent 自主性 评估指标
[自动] [BLOGS_PODCASTS]
3minmic 长期对话语境下LLM个性化特征与回音室效应分析
02-19 LLM 个性化 回音室效应
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊智能体系统评估框架:通用工作流与评估库
02-19 AI Agent 评估框架 Amazon Bedrock
[自动] [HACKER_NEWS]
4minnewspaper 不要轻信盐值:AI摘要、多语言安全与大模型防护机制
02-19 LLM AI安全 提示词注入
[自动] [HACKER_NEWS]
4minnewspaper Step 3.5 Flash 开源基础模型:支持高速深度推理
02-19 Step 3.5 Flash 开源模型 深度推理
[自动] [BLOGS_PODCASTS]
3minmic IBM与UC Berkeley发布IT-Bench及MAST:诊断企业Agent失败原因
02-19 Agent IT-Bench MAST
[自动] [BLOGS_PODCASTS]
3minmic Gemini应用集成Lyria 3模型,支持文本或图像生成30秒音轨
02-19 Gemini Lyria 3 音乐生成
[自动] [BLOGS_PODCASTS]
3minmic Claude Sonnet 4.6 发布:综合性能升级与部分局限
02-19 Claude Sonnet 4.6 Anthropic
[自动] [JUEJIN]
1minsticky_note_2 2026年2月19日AI热点:OpenAI加码医疗,OpenEvidence估值120亿美元
02-19 AI热点 医疗AI OpenAI
[自动] [HACKER_NEWS]
4minnewspaper 警惕AI总结幻觉:多语言安全与大模型防护机制
02-19 LLM 幻觉 安全防护
[自动] [HACKER_NEWS]
4minnewspaper Step 3.5 Flash 开源:支持高速深度推理
02-19 Step 3.5 Flash 深度推理 开源模型
[自动] [BLOGS_PODCASTS]
3minmic Anthropic发布Agent自主性研究及METR数据
02-19 Anthropic Agent 自主性
[自动] [JUEJIN]
1minsticky_note_2 2026年2月19日AI热点:OpenAI加码医疗大模型,OpenEvidence估值120亿美元
02-19 医疗AI OpenAI 行业格局
[自动] [HACKER_NEWS]
4minnewspaper 开源模型 Step 3.5 Flash:支持高速深度推理
02-19 Step 3.5 Flash 开源模型 深度推理
[自动] [GITHUB_TRENDING]
10minhub ChatGPT 中文调教指南:场景化提示词与指令优化
02-19 ChatGPT 提示词 Prompt
[自动] [JUEJIN]
3minsticky_note_2 大模型AI编程实测:Opus 4.6与K2.5等模型排序对比
02-19 AI编程 模型测评 Claude
[自动] [HACKER_NEWS]
4minnewspaper Step 3.5 Flash:速度足以思考,可靠性足以行动
02-19 Google Gemini Flash
[自动] [BLOGS_PODCASTS]
2minmic 美德伦理在AI对齐中的有效性
02-19 AI对齐 美德伦理 AI安全
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊构建AI代理评估框架:通用工作流与Bedrock评估库
02-19 AI Agents 评估框架 Amazon Bedrock
[自动] [BLOGS_PODCASTS]
2minmic 个性化功能可能导致大语言模型迎合用户观点形成回声室
02-19 LLM 个性化 回声室
[自动] [HACKER_NEWS]
5minnewspaper Step 3.5 Flash:快速思考与可靠执行
02-19 Step 3.5 Flash 推理模型 快速响应
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA发布Nemotron 2 Nano 9B日语模型:支持日本主权AI的小规模语言模型
02-19 NVIDIA Nemotron 日语模型
[自动] [BLOGS_PODCASTS]
2minmic IBM与加州大学伯克利分校发布IT-Bench与MAST诊断企业智能体失败原因
02-19 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
2minmic Google 2026 AI峰会:宣布合作伙伴关系与投资
02-19 Google AI峰会 战略合作
[自动] [BLOGS_PODCASTS]
2minmic Gemini应用集成Lyria 3模型,支持图文生成30秒音乐
02-19 Gemini Lyria 3 音乐生成
[自动] [BLOGS_PODCASTS]
2minmic 长期对话语境下LLM观点映射与回声室效应
02-19 LLM 个性化 回声室效应
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊代理式AI系统评估框架:通用工作流与评估库详解
02-19 AI Agent 评估框架 Amazon Bedrock
[自动] [HACKER_NEWS]
4minnewspaper Step 3.5 Flash:快到能思考,稳到可执行
02-19 Step 3.5 Flash LLM 推理模型
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Nemotron 2 Nano 9B 日语模型:支持日本主权AI的小规模语言模型
02-19 NVIDIA Nemotron 日语模型
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC伯克利利用IT-Bench和MAST诊断企业智能体失败原因
02-19 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
2minmic Gemini接入Lyria 3模型支持文字图像生成30秒音乐
02-19 Gemini Lyria 3 音乐生成
[自动] [BLOGS_PODCASTS]
2minmic 2026年负责任人工智能进展报告
02-19 负责任AI AI安全 伦理
[自动] [BLOGS_PODCASTS]
2minmic 长期对话导致LLM迎合用户观点形成回声室
02-19 LLM 个性化 回声室
[自动] [BLOGS_PODCASTS]
4minmic 英伟达发布 Nemotron 2 Nano 9B 日语模型
02-19 NVIDIA Nemotron 日语模型
[自动] [HACKER_NEWS]
4minnewspaper 写作的演变:认知债务、Claude Code与AI的边界
02-19 Claude Code 认知债务 AI写作
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊发布AI Agent评估框架:通用工作流与Bedrock评估库
02-19 AI Agent 评估框架 Amazon Bedrock
[自动] [JUEJIN]
3minsticky_note_2 Spring AI 多模态实战:构建图像理解应用
02-19 Spring AI 多模态 图像理解
[自动] [BLOGS_PODCASTS]
2minmic Qwen3.5-397B-A17B:最小Open-Opus级高效模型
02-19 Qwen3.5 Qwen MoE
[自动] [BLOGS_PODCASTS]
2minmic IBM联合UC Berkeley发布IT-Bench与MAST:诊断企业智能体失败原因
02-19 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
2minmic Gemini应用集成Lyria 3模型,支持文生30秒音乐
02-19 Gemini Lyria 3 音乐生成
[自动] [BLOGS_PODCASTS]
3minmic DeepMind在印度推国家AI伙伴关系,加速科学与教育应用
02-19 DeepMind Google AI for Science
[自动] [BLOGS_PODCASTS]
3minmic Claude Sonnet 4.6 发布:基于 4.5 的升级与局限
02-19 Claude Anthropic Sonnet 4.6
[自动] [BLOGS_PODCASTS]
2minmic 2026年度负责任人工智能进展报告
02-19 负责任AI AI安全 伦理
[自动] [BLOGS_PODCASTS]
2minmic 长期对话导致大语言模型镜像用户观点并形成回声室
02-19 LLM 个性化 回声室
[自动] [ARXIV]
3minschool 通过任务复杂度量化验证浅层对齐假说
02-19 浅层对齐假说 SAH 任务复杂度
[自动] [ARXIV]
4minschool 用模拟数据开发AI智能体的原理与方法
02-19 AI智能体 合成数据 数据模拟
[自动] [ARXIV]
3minschool 基于D最优统计的高维仿真代理测试时适应稳定化方法
02-19 测试时适应 TTA 仿真代理
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊发布代理式AI评估框架:标准化工作流与专用指标库
02-19 AI Agent 评估框架 Amazon Bedrock
[自动] [BLOGS_PODCASTS]
3minmic Qwen3.5-397B-A17B:最小Open-Opus级高效模型
02-19 Qwen3.5 MoE 稀疏模型
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Nemotron 2 Nano 9B 日语模型:支持日本主权AI的小规模语言模型
02-19 NVIDIA Nemotron 日语模型
[自动] [HACKER_NEWS]
4minnewspaper LLM 上下文长度外推技术综述
02-19 LLM 上下文窗口 外推
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC Berkeley发布IT-Bench及MAST诊断企业智能体失败原因
02-19 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
3minmic Google DeepMind 在印度扩展AI科学与教育应用
02-19 Google DeepMind AI 科学 教育应用
[自动] [BLOGS_PODCASTS]
3minmic Gemini应用接入Lyria 3模型,支持图文生成30秒乐曲
02-19 Gemini Lyria 3 音乐生成
[自动] [ARXIV]
4minschool Dex4D:任务无关点跟踪策略实现灵巧操作Sim-to-Real
02-19 灵巧操作 Sim-to-Real 机器人
[自动] [ARXIV]
4minschool CrispEdit:低曲率投影实现可扩展的大模型无损编辑
02-19 LLM编辑 模型编辑 CrispEdit
[自动] [BLOGS_PODCASTS]
2minmic Claude Sonnet 4.6 发布:基于 4.5 的升级与实测表现
02-19 Claude Anthropic Sonnet 4.6
[自动] [ARXIV]
3minschool Avey-B:基于视觉基础模型的通用具身智能代理
02-19 Avey-B NLP Transformer
[自动] [BLOGS_PODCASTS]
2minmic 2026年度负责任人工智能进展报告
02-19 负责任AI Responsible AI AI安全
[自动] [BLOGS_PODCASTS]
2minmic 长期对话导致大模型模仿用户观点并降低准确性
02-18 LLM 个性化 长期对话
[自动] [BLOGS_PODCASTS]
2minmic 构建Amazon智能体评估框架:通用工作流与Bedrock指标库
02-18 AI Agent 评估框架 Amazon Bedrock
[自动] [BLOGS_PODCASTS]
2minmic Qwen3.5-397B-A17B:最小的高效Open-Opus级模型
02-18 Qwen3.5 模型压缩 性能优化
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Nemotron 2 Nano 9B 日语模型:支持日本主权AI的小规模语言模型
02-18 NVIDIA Nemotron 日语模型
[自动] [HACKER_NEWS]
4minnewspaper LLM上下文学习机制与性能优化指南
02-18 LLM 上下文学习 ICL
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC Berkeley发布IT-Bench及MAST诊断企业智能体失败原因
02-18 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
2minmic Gemini接入Lyria 3模型,支持图文生成30秒音乐
02-18 Gemini Lyria 3 音乐生成
[自动] [BLOGS_PODCASTS]
3minmic DeepMind在印度启动国家AI伙伴关系推动科学与教育
02-18 DeepMind AI for Science Google
[自动] [BLOGS_PODCASTS]
3minmic Claude Sonnet 4.6发布:基于4.5的升级与部分局限
02-18 Claude Sonnet 4.6 Anthropic
[自动] [GITHUB_TRENDING]
10minhub ChatGPT中文调教指南:涵盖各类场景的提示词库
02-18 ChatGPT 提示词 Prompt
[自动] [BLOGS_PODCASTS]
2minmic 2026年负责任人工智能进展报告
02-18 负责任AI AI伦理 AI安全
[自动] [ARXIV]
4minschool 基于模拟数据开发AI智能体的原理与方法
02-18 AI智能体 合成数据 模拟技术
[自动] [ARXIV]
3minschool 基于任务复杂度的浅层对齐假说操作化研究
02-18 浅层对齐 SAH 任务复杂度
[自动] [ARXIV]
4minschool CrispEdit:低曲率投影实现可扩展的大模型无损编辑
02-18 模型编辑 CrispEdit LLM
[自动] [BLOGS_PODCASTS]
2minmic 长期对话导致LLM镜像用户观点并形成回声室
02-18 LLM 个性化 回声室
[自动] [HACKER_NEWS]
4minnewspaper 李飞飞World Labs获10亿美元融资:英伟达与A16Z领投,加速世界模型研发
02-18 李飞飞 World Labs 融资
[自动] [BLOGS_PODCASTS]
2minmic Qwen3.5-397B-A17B:最小Open-Opus级高效模型
02-18 Qwen3.5 通义千问 Open-Opus
[自动] [BLOGS_PODCASTS]
4minmic OpenAI 应该构建 Slack 的原因分析
02-18 OpenAI Slack 企业协作
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Nemotron 2 Nano 9B 日语模型:支持日本主权AI的小规模语言模型
02-18 NVIDIA Nemotron 日语模型
[自动] [HACKER_NEWS]
4minnewspaper LLM 数据集构建与模型训练优化指南
02-18 LLM 数据集构建 模型训练
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC Berkeley利用IT-Bench和MAST诊断企业智能体失败原因
02-18 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出新胶子振幅公式并获合作者验证
02-18 GPT-5.2 OpenAI 理论物理
[自动] [BLOGS_PODCASTS]
2minmic Gemini应用集成Lyria 3模型,支持文图生成30秒音乐
02-18 Gemini Lyria 3 音乐生成
[自动] [BLOGS_PODCASTS]
2minmic DeepMind 在印度启动 AI 伙伴关系以加速科学与教育发展
02-18 DeepMind AI教育 科学发现
[自动] [BLOGS_PODCASTS]
4minmic Claude Sonnet 4.6 发布:基于 4.5 的升级与部分限制
02-18 Claude Sonnet 4.6 Anthropic
[自动] [BLOGS_PODCASTS]
3minmic ChatGPT 推出锁定模式与高风险标签以防御提示注入
02-18 ChatGPT 提示注入 锁定模式
[自动] [ARXIV]
5minschool Avey-B:基于注意力机制的高效视觉Transformer模型
02-18 Avey-B Transformer NLP
[自动] [BLOGS_PODCASTS]
2minmic 2026年度负责任人工智能进展报告
02-18 负责任AI ResponsibleAI 年度报告
[自动] [HACKER_NEWS]
5minnewspaper Claude Sonnet 4.6发布:兼顾性能与成本效率
02-18 Claude Anthropic 模型发布
[自动] [BLOGS_PODCASTS]
3minmic 长期对话导致大语言模型镜像用户观点形成回声室
02-18 LLM 个性化 回声室
[自动] [BLOGS_PODCASTS]
3minmic Qwen3.5-397B-A17B:最小Open-Opus级高效模型
02-18 Qwen3.5 Qwen MoE
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 应该打造 Slack:Sam Altman 的下一步产品方向
02-18 OpenAI Sam Altman Slack
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Nemotron 2 Nano 9B 日语模型:支持主权AI的小规模语言模型
02-18 NVIDIA Nemotron 日语模型
[自动] [HACKER_NEWS]
4minnewspaper LLM 模型应关注的数据处理与优化策略
02-18 LLM 数据处理 模型优化
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.2推导胶子振幅新公式并获验证
02-18 GPT-5.2 理论物理 胶子振幅
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think发布;Anthropic估值380B;GPT-5.3-Codex Spa
02-18 Gemini Anthropic GPT-5.3
[自动] [BLOGS_PODCASTS]
3minmic DeepMind在印度推动AI科学与教育规模化发展
02-18 DeepMind AI教育 科学发现
[自动] [BLOGS_PODCASTS]
4minmic Claude Sonnet 4.6 发布:基于 4.5 的升级与部分局限
02-18 Claude Anthropic Sonnet 4.6
[自动] [HACKER_NEWS]
6minnewspaper Claude Sonnet 4.6 发布:兼顾长上下文与高性价比
02-18 Claude Sonnet 4.6 长上下文
[自动] [BLOGS_PODCASTS]
2minmic 2026年负责任AI进展报告
02-18 负责任AI AI治理 AI伦理
[自动] [BLOGS_PODCASTS]
2minmic Google 在 AI Impact Summit 2026 宣布合作与投资
02-18 Google AI Impact Summit 战略合作
[自动] [HACKER_NEWS]
5minnewspaper Claude Sonnet 4.6发布:兼顾高性能与长文本
02-18 Claude Sonnet 4.6 Anthropic
[自动] [BLOGS_PODCASTS]
4minmic ChatGPT 推出锁定模式与高风险标签以防御提示注入
02-18 ChatGPT OpenAI 提示注入
[自动] [JUEJIN]
2minsticky_note_2 SkillsBench 论文解读:跨任务基准测试如何揭示 Agent 技能的实际效用
02-18 Agent LLM SkillsBench
[自动] [HACKER_NEWS]
5minnewspaper Claude Sonnet 4.6发布:兼顾性能与成本,支持长文本
02-18 Claude Sonnet 4.6 Anthropic
[自动] [BLOGS_PODCASTS]
2minmic 长期对话语境导致LLM迎合用户观点形成回声室
02-18 LLM 个性化 回声室
[自动] [BLOGS_PODCASTS]
2minmic 英伟达发布 Nemotron 2 Nano 9B 日语模型
02-18 NVIDIA Nemotron 日语模型
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 应该收购 Slack 的商业逻辑分析
02-18 OpenAI Slack 企业协作
[自动] [BLOGS_PODCASTS]
2minmic Jeff Dean:重写谷歌搜索栈与TPU共稀疏万亿参数模型
02-18 Jeff Dean TPU 稀疏模型
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.2推导新胶子振幅公式获正式证明
02-18 GPT-5.2 理论物理 科学发现
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex与Mi
02-18 Gemini Anthropic GPT-5.3
[自动] [BLOGS_PODCASTS]
3minmic Claude Sonnet 4.6 发布:基于 4.5 的升级与局限性分析
02-18 Claude Sonnet 4.6 Anthropic
[自动] [HACKER_NEWS]
5minnewspaper Claude Sonnet 4.6 发布:兼具高智能与长上下文
02-18 Claude Sonnet 4.6 Anthropic
[自动] [BLOGS_PODCASTS]
4minmic Amazon Bedrock AgentCore 浏览器新增代理、配置文件及扩展支持
02-18 Amazon Bedrock AgentCore AI Agent
[自动] [BLOGS_PODCASTS]
2minmic 2026年负责任AI进展报告
02-18 负责任AI Responsible AI AI伦理
[自动] [BLOGS_PODCASTS]
2minmic 长期对话导致LLM模仿用户观点并形成回声室
02-18 LLM 个性化 回声室
[自动] [BLOGS_PODCASTS]
2minmic Qwen3.5-397B-A17B:最小Open-Opus级高效模型
02-18 Qwen3.5 Qwen MoE
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Nemotron 2 Nano 9B 日语模型:支持日本主权AI的小规模语言模型
02-18 NVIDIA Nemotron 日语模型
[自动] [BLOGS_PODCASTS]
3minmic Jeff Dean:重写搜索架构、TPU 协同设计及稀疏万亿参数模型
02-18 Jeff Dean Google TPU
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2 提出胶子振幅新公式并获合作验证
02-18 GPT-5.2 理论物理 胶子振幅
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex与Mi
02-18 Gemini Anthropic GPT-5.3
[自动] [BLOGS_PODCASTS]
2minmic Codex与Claude赋能自定义内核生成
02-18 Codex Claude 自定义内核
[自动] [BLOGS_PODCASTS]
2minmic ChatGPT推出锁定模式与高风险标签以抵御提示注入
02-18 ChatGPT 提示注入 锁定模式
[自动] [BLOGS_PODCASTS]
2minmic 2026年度负责任人工智能进展报告
02-18 负责任AI AI治理 合规
[自动] [BLOGS_PODCASTS]
2minmic Jeff Dean:重写搜索栈、复兴稀疏模型与TPU协同设计
02-18 Jeff Dean TPU 稀疏模型
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:面向科学、研究与工程的推理模式更新
02-18 Gemini 3 Deep Think 推理模式
[自动] [BLOGS_PODCASTS]
2minmic Qwen3.5-397B-A17B:最小Open-Opus级高效模型
02-18 Qwen3.5 Qwen MoE
[自动] [BLOGS_PODCASTS]
3minmic OpenAI为何应打造企业协作平台Slack
02-18 OpenAI Slack 企业协作
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 2 Nano 9B 日语模型:支持日本主权AI的小规模语言模型
02-18 NVIDIA Nemotron 日语模型
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出胶子振幅新公式并获学术验证
02-18 GPT-5.2 理论物理 胶子振幅
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex Sp
02-18 Gemini 3 Anthropic GPT-5.3
[自动] [HACKER_NEWS]
5minnewspaper Claude Sonnet 4.6 发布:兼顾性能与成本效益
02-18 Claude Anthropic 模型发布
[自动] [BLOGS_PODCASTS]
2minmic 2026年度负责任人工智能进展报告
02-18 负责任AI AI安全 模型治理
[自动] [ARXIV]
3minschool 长上下文LLM缩放缺陷:隐私与个性化任务揭示注意力分散
02-18 长上下文 LLM 个性化
[自动] [ARXIV]
4minschool 超越掩码扩散语言模型的扩展性研究
02-18 扩散模型 语言模型 扩展定律
[自动] [ARXIV]
4minschool 语言统计对称性塑造模型表征的几何结构
02-18 表征几何 统计对称性 词嵌入
[自动] [ARXIV]
4minschool 离散扩散模型高效采样:锐利且自适应的理论保证
02-18 离散扩散模型 CTMC 采样效率
[自动] [ARXIV]
3minschool 深度研究AI代理用于医药资产全球筛选与评估
02-18 AI Agent 生物医药 资产筛选
[自动] [JUEJIN]
1minsticky_note_2 提示工程悖论:为何与AI对话比想象中更难
02-18 提示工程 Prompt Engineering 认知偏差
[自动] [ARXIV]
3minschool 基于结构化世界模型先验的冷启动个性化方案
02-18 冷启动 个性化 世界模型
[自动] [ARXIV]
4minschool 基于正则化与对称性重审扩散模型及其分子图生成应用
02-18 扩散模型 分子图生成 对称性
[自动] [ARXIV]
2minschool 基于参数高效微调与往返翻译的文本风格迁移
02-18 文本风格迁移 参数高效微调 LLM
[自动] [ARXIV]
3minschool BPP:聚焦关键历史帧的长上下文机器人模仿学习
02-18 机器人 模仿学习 长上下文
[自动] [ARXIV]
3minschool 长上下文LLM隐私与个性化任务中的缩放差距研究
02-17 长上下文 隐私保护 个性化
[自动] [ARXIV]
3minschool 超越掩码扩散语言模型的扩展性研究
02-17 扩散模型 语言模型 扩展定律
[自动] [ARXIV]
3minschool 语言统计对称性塑造模型表征的几何结构
02-17 表征学习 几何结构 统计对称性
[自动] [HACKER_NEWS]
4minnewspaper 让大语言模型互斗万智牌的实验项目
02-17 LLM Agent 游戏AI
[自动] [ARXIV]
4minschool 离散扩散模型高效采样:具备锐利性与自适应保证
02-17 离散扩散模型 高效采样 tau-leaping
[自动] [ARXIV]
4minschool 基于标准化的扩散模型对称性重思考与分子图生成
02-17 扩散模型 分子图生成 对称性
[自动] [ARXIV]
4minschool 基于参数高效微调与往返翻译的文本风格迁移
02-17 文本风格迁移 PEFT LLM
[自动] [ARXIV]
3minschool 全球深度调研AI代理:药物资产筛选与投资评估
02-17 AI Agent 生物医药 资产筛选
[自动] [BLOGS_PODCASTS]
2minmic Qwen3.5-397B-A17B:最小的高效Open-Opus级模型
02-17 Qwen3.5 Qwen MoE
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT-5.3-Codex-Spark:首个实时编码模型,生成速度提升15倍
02-17 OpenAI GPT-5.3 Codex
[自动] [BLOGS_PODCASTS]
3minmic OpenAI为何应该构建Slack:Sam Altman的下一步产品方向
02-17 OpenAI Slack Sam Altman
[自动] [BLOGS_PODCASTS]
4minmic Jeff Dean:重塑搜索、TPU与稀疏模型的AI技术栈
02-17 Jeff Dean Google TPU
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.2提出胶子振幅新公式并获验证
02-17 GPT-5.2 OpenAI 理论物理
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think发布;Anthropic估值达380亿美元;GPT-5.3最新动态
02-17 Gemini 3 Anthropic OpenAI
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think:推进科学与工程研究
02-17 Gemini 3 DeepMind Deep Think
[自动] [HACKER_NEWS]
5minnewspaper Claude Sonnet 4.6 发布:兼顾高性能与长文本处理
02-17 Claude Sonnet 4.6 Anthropic
[自动] [ARXIV]
3minschool BPP:聚焦关键历史帧的长上下文机器人模仿学习
02-17 机器人 模仿学习 长上下文
[自动] [JUEJIN]
2minsticky_note_2 提示工程悖论:为何与AI对话比预期更难
02-17 提示工程 LLM 自然语言处理
[自动] [JUEJIN]
2minsticky_note_2 Qwen3.5-397B-A17B:极致稀疏MoE架构与多模态能力详解
02-17 Qwen3.5 MoE 多模态
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:面向科研与工程的专用推理模式更新
02-17 Gemini 3 Deep Think 推理模式
[自动] [HACKER_NEWS]
4minnewspaper 语义消融实验:揭示AI写作为何平庸同质化
02-17 语义消融 AI写作 同质化
[自动] [HACKER_NEWS]
4minnewspaper 让大语言模型互斗万智牌的实验项目
02-17 LLM Agent 游戏AI
[自动] [HACKER_NEWS]
4minnewspaper 为何AI写作平庸且危险:语义消融机制解析
02-17 AI写作 语义消融 内容质量
[自动] [HACKER_NEWS]
5minnewspaper 评估 AGENTS.md 文档对编程 AI 智能体的实际效用
02-17 AI Agents AGENTS.md 编程助手
[自动] [JUEJIN]
3minsticky_note_2 SkillsBench论文:评估Agent技能在多任务中的实际效用
02-17 Agent LLM SkillsBench
[自动] [HACKER_NEWS]
7minnewspaper 评测 AGENTS.md:对编程 AI 智能体的实际效用分析
02-17 AI Agent LLM 代码生成
[自动] [HACKER_NEWS]
4minnewspaper 评估 AGENTS.md 文档对编程 AI 智能体的实际效用
02-17 AI Agents AGENTS.md 编程助手
[自动] [HACKER_NEWS]
7minnewspaper SkillsBench:评估智能体技能在多样化任务中的表现基准
02-17 SkillsBench 智能体 Agent
[自动] [ARXIV]
4minschool 过程监督多智能体强化学习提升临床推理可靠性
02-17 多智能体 强化学习 临床推理
[自动] [ARXIV]
4minschool 科学推理模型引入拒答机制以提升准确性
02-17 科学推理 拒答机制 NLI
[自动] [HACKER_NEWS]
4minnewspaper 研究:自生成的智能体技能通常无效
02-17 AI Agent 智能体 LLM
[自动] [ARXIV]
3minschool 恶意提示词分类器在真实分布偏移下的评估方法
02-17 LLM安全 提示词注入 越狱攻击
[自动] [ARXIV]
4minschool 延迟视觉摄入优化图文密集文档问答
02-17 多模态 文档问答 VLM
[自动] [ARXIV]
5minschool 基于枢纽重采样的LLM强化学习深度密集探索
02-17 LLM 强化学习 RLHF
[自动] [BLOGS_PODCASTS]
2minmic Z.ai发布GLM-5开源模型,性能超越Opus 4.5
02-17 GLM-5 Z.ai Opus 4.5
[自动] [ARXIV]
5minschool UniWeTok:统一二进制分词器支持2^128码本规模
02-17 UniWeTok 多模态 Tokenizer
[自动] [HACKER_NEWS]
6minnewspaper Qwen3.5:迈向原生多模态智能体
02-17 Qwen3.5 多模态 智能体
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布GPT-5.3-Codex-Spark:首款实时编程模型,生成提速15倍
02-17 OpenAI GPT-5.3 Codex
[自动] [BLOGS_PODCASTS]
3minmic Jeff Dean:重塑搜索架构、复兴稀疏模型与设计TPU
02-17 Jeff Dean Google TPU
[自动] [ARXIV]
4minschool GPT-5与其他大模型长短上下文性能对比
02-17 GPT-5 LLM 长文本
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出新胶子振幅公式获学术验证
02-17 GPT-5.2 OpenAI 理论物理
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think发布;Anthropic估值3800亿;GPT-5.3-Codex Sp
02-17 Gemini 3 Deep Think Anthropic
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:升级推理模式以解决科研与工程挑战
02-17 Gemini 3 Deep Think 推理模型
[自动] [BLOGS_PODCASTS]
2minmic Codex与Claude支持定制化内核扩展
02-17 Codex Claude 定制化
[自动] [BLOGS_PODCASTS]
2minmic ChatGPT 推出锁定模式与高风险标签以防御提示注入
02-17 ChatGPT 提示注入 锁定模式
[自动] [ARXIV]
3minschool 语义分块与自然语言熵:优化文本切分策略
02-17 语义分块 自然语言熵 文本切分
[自动] [HACKER_NEWS]
4minnewspaper 研究:自生成的Agent技能实际无效
02-17 Agent LLM 研究
[自动] [ARXIV]
5minschool 异步验证语义缓存优化分层大模型架构
02-17 语义缓存 LLM架构 异步验证
[自动] [ARXIV]
4minschool 基于大语言模型的端到端网络事件自主响应方法
02-17 LLM Agent 网络安全 事件响应
[自动] [ARXIV]
4minschool 基于仿真过滤的模块化策略从人类视频学习有效行为
02-17 机器人 模仿学习 仿真过滤
[自动] [ARXIV]
5minschool CoPE-VideoLM:基于编解码基元的高效视频语言模型
02-17 VideoLM 视频理解 多模态
[自动] [ARXIV]
3minschool 语义分块与自然语言熵的关联研究
02-16 语义分块 自然语言熵 LLM
[自动] [HACKER_NEWS]
3minnewspaper 研究:自生成的Agent技能通常无效
02-16 Agent LLM 自生成技能
[自动] [HACKER_NEWS]
4minnewspaper 数学、计算机科学与人工智能综合资源指南
02-16 资源指南 数学 计算机科学
[自动] [ARXIV]
4minschool 异步验证语义缓存技术优化分层大模型架构
02-16 语义缓存 Krites LLM
[自动] [ARXIV]
4minschool 基于大语言模型Agent的上下文网络事件自主响应端到端方法
02-16 LLM Agent 网络安全 事件响应
[自动] [ARXIV]
4minschool 仿真筛选模块化策略:从人类视频学习有效行为
02-16 机器人 强化学习 模仿学习
[自动] [BLOGS_PODCASTS]
3minmic Z.ai发布GLM-5开源模型:性能超越Opus 4.5
02-16 GLM-5 Z.ai SOTA
[自动] [BLOGS_PODCASTS]
3minmic OpenAI推出GPT-5.3-Codex-Spark:首款实时编程模型
02-16 OpenAI GPT-5.3 Codex
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 下一步该构建什么:基于 Slack 协作模式的思考
02-16 OpenAI Slack 协作模式
[自动] [HACKER_NEWS]
7minnewspaper LCM:无损上下文管理技术论文
02-16 LCM 上下文管理 无损
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2 提出胶子振幅新公式并获合作者验证
02-16 GPT-5.2 理论物理 胶子振幅
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think推理模式升级,专注解决科研与工程领域挑战
02-16 Gemini 3 Deep Think 推理模式
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex与Mi
02-16 Gemini Anthropic GPT-5.3
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:面向科研与工程的深度推理模型
02-16 Gemini 3 Deep Think 深度推理
[自动] [ARXIV]
4minschool CoPE-VideoLM:基于编解码基元的高效视频语言模型
02-16 VideoLM 多模态 视频理解
[自动] [BLOGS_PODCASTS]
2minmic Codex 与 Claude 支持定制内核
02-16 Codex Claude 定制内核
[自动] [HACKER_NEWS]
4minnewspaper 研究:自生成的Agent技能通常无效
02-16 Agent LLM 自生成技能
[自动] [HACKER_NEWS]
3minnewspaper Qwen3.5:迈向原生多模态智能体
02-16 Qwen3.5 多模态 智能体
[自动] [HACKER_NEWS]
4minnewspaper LLM 辅助反编译的长尾效应与挑战
02-16 LLM 反编译 逆向工程
[自动] [HACKER_NEWS]
4minnewspaper Qwen3.5:迈向原生多模态智能体
02-16 Qwen3.5 多模态 智能体
[自动] [BLOGS_PODCASTS]
2minmic Jeff Dean:重写搜索堆栈、复兴稀疏模型与TPU协同设计
02-16 Jeff Dean Google TPU
[自动] [HACKER_NEWS]
7minnewspaper Qwen3.5:迈向原生多模态智能体
02-16 Qwen3.5 多模态 智能体
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布GPT-5.3-Codex-Spark:首款实时编码模型,生成提速15倍
02-16 OpenAI GPT-5.3 Codex
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 应该构建 Slack 的原因分析
02-16 OpenAI Slack 企业协作
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出胶子振幅新公式并获合作验证
02-16 GPT-5.2 OpenAI 理论物理
[自动] [HACKER_NEWS]
4minnewspaper Anthropic 试图隐藏 Claude AI 行为,引发开发者不满
02-16 Anthropic Claude AI透明度
[自动] [BLOGS_PODCASTS]
4minmic Amazon Bedrock AgentCore 浏览器新增代理配置、配置文件及扩展支持
02-16 Amazon Bedrock AgentCore AI Agent
[自动] [HACKER_NEWS]
5minnewspaper Qwen3.5:迈向原生多模态智能体
02-16 Qwen3.5 多模态 智能体
[自动] [HACKER_NEWS]
5minnewspaper LLM Agent 成本呈二次方增长:算力开销分析
02-16 LLM Agent 成本分析
[自动] [HACKER_NEWS]
4minnewspaper Anthropic 试图隐藏 Claude AI 行为引发开发者不满
02-16 Anthropic Claude 开发者
[自动] [HACKER_NEWS]
4minnewspaper 小实验室在音频领域取得竞争优势
02-16 音频 小实验室 竞争优势
[自动] [HACKER_NEWS]
6minnewspaper Qwen3.5:迈向原生多模态智能体
02-16 Qwen3.5 多模态 智能体
[自动] [HACKER_NEWS]
4minnewspaper Microgpt:可在浏览器中可视化的GPT模型
02-16 MicroGPT GPT 可视化
[自动] [HACKER_NEWS]
7minnewspaper LLM 智能体成本呈二次方增长,复杂任务开销急剧上升
02-16 LLM 智能体 成本分析
[自动] [HACKER_NEWS]
4minnewspaper 赋予Claude控制笔式绘图仪能力的实践
02-16 Claude LLM Function Calling
[自动] [HACKER_NEWS]
5minnewspaper Microgpt:可在浏览器中可视化的GPT模型
02-16 Microgpt GPT 可视化
[自动] [HACKER_NEWS]
5minnewspaper LLM Agent 成本呈二次方增长:计算开销随任务规模急剧上升
02-16 LLM Agent 成本优化 二次方增长
[自动] [HACKER_NEWS]
3minnewspaper 小实验室在音频领域取得领先优势
02-16 音频生成 小模型 AI初创
[自动] [HACKER_NEWS]
5minnewspaper Microgpt:可在浏览器中可视化的GPT模型
02-16 MicroGPT 可视化 浏览器
[自动] [HACKER_NEWS]
5minnewspaper LLM 智能体成本呈二次方增长,复杂任务开销急剧攀升
02-16 LLM 智能体 成本分析
[自动] [HACKER_NEWS]
3minnewspaper 小实验室在音频领域取得领先优势
02-16 音频生成 小实验室 AI 竞争
[自动] [HACKER_NEWS]
4minnewspaper LLM Agent 成本曲线:二次方增长与昂贵计算
02-16 LLM Agent 成本分析
[自动] [HACKER_NEWS]
4minnewspaper 我让 Claude 控制我的笔式绘图仪
02-16 Claude LLM AI Agent
[自动] [HACKER_NEWS]
4minnewspaper Microgpt:可在浏览器中可视化的GPT模型
02-16 MicroGPT 浏览器 可视化
[自动] [HACKER_NEWS]
4minnewspaper 音频领域成为小实验室实现技术突围的关键赛道
02-16 音频 小实验室 技术突围
[自动] [HACKER_NEWS]
4minnewspaper 播客主持人指控谷歌NotebookLM语音克隆侵权
02-16 NotebookLM 谷歌 语音克隆
[自动] [HACKER_NEWS]
5minnewspaper 授予Claude控制权:用笔式绘图仪生成实体艺术
02-16 Claude LLM AI代理
[自动] [HACKER_NEWS]
4minnewspaper Microgpt:可在浏览器中可视化的 GPT 模型
02-16 MicroGPT GPT 可视化
[自动] [HACKER_NEWS]
5minnewspaper Microgpt:可在浏览器中可视化的GPT模型
02-16 MicroGPT 可视化 浏览器
[自动] [ARXIV]
4minschool 面向语言模型的在线上下文蒸馏方法
02-16 LLM 蒸馏 上下文学习
[自动] [HACKER_NEWS]
4minnewspaper 迈向自主数学研究
02-16 自主研究 数学 AI
[自动] [JUEJIN]
2minsticky_note_2 豆包大模型 2.0 发布:模型能力实测与升级详解
02-16 豆包大模型 字节跳动 LLM
[自动] [ARXIV]
4minschool 视觉-语言-动作对齐:扩展验证比扩展策略学习更有效
02-16 VLA 具身智能 CoVer
[自动] [HACKER_NEWS]
6minnewspaper 电台主播指控谷歌NotebookLM语音克隆功能未经授权使用其声音
02-16 NotebookLM 语音克隆 Google
[自动] [ARXIV]
4minschool WebAgent 智能体测试时计算扩展方法
02-16 WebAgent Test-Time Scaling CATTS
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-16 多模态 思维链 测试时扩展
[自动] [ARXIV]
4minschool MonarchRT:面向实时视频生成的高效注意力机制
02-16 视频生成 扩散模型 注意力机制
[自动] [HACKER_NEWS]
4minnewspaper Microgpt:可在浏览器中可视化的GPT模型
02-16 MicroGPT 可视化 浏览器
[自动] [ARXIV]
5minschool CM2:基于清单奖励强化学习的多步智能体工具调用
02-16 强化学习 Agent 工具调用
[自动] [ARXIV]
4minschool AttentionRetriever:注意力层即长文档检索器
02-16 RAG 长文档 检索
[自动] [HACKER_NEWS]
4minnewspaper 音频领域成为小型实验室实现技术突破的主战场
02-15 音频生成 AI音乐 语音合成
[自动] [HACKER_NEWS]
4minnewspaper 迈向自主数学研究
02-15 自主研究 数学 AI
[自动] [JUEJIN]
2minsticky_note_2 豆包大模型2.0发布:核心升级与Trae实测
02-15 豆包大模型 字节跳动 LLM
[自动] [ARXIV]
4minschool 语言模型在线策略上下文蒸馏方法
02-15 模型蒸馏 上下文学习 在线策略
[自动] [ARXIV]
4minschool 扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐
02-15 VLA 具身智能 机器人
[自动] [BLOGS_PODCASTS]
2minmic Z.ai发布GLM-5开源权重模型,性能达SOTA
02-15 GLM-5 Z.ai SOTA
[自动] [ARXIV]
4minschool WebAgents测试时扩展:智能体性能提升方法
02-15 WebAgents 测试时扩展 CATTS
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-15 多模态 思维链 测试时扩展
[自动] [BLOGS_PODCASTS]
3minmic OpenAI下一步应构建的企业级协作工具分析
02-15 OpenAI 企业协作 Slack
[自动] [BLOGS_PODCASTS]
3minmic Jeff Dean:重写谷歌搜索与TPU共稀疏模型设计
02-15 Jeff Dean Google TPU
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think发布;Anthropic估值达380亿美元;GPT-5.3动态更新
02-15 Gemini Anthropic GPT-5.3
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:面向科研与工程的科学推理模型
02-15 Gemini 3 Deep Think 科学推理
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:面向科研与工程的专用推理模式更新
02-15 Gemini 3 Deep Think 推理模式
[自动] [ARXIV]
4minschool CM2:基于清单奖励强化学习的多步智能体工具调用
02-15 CM2 强化学习 Agent
[自动] [BLOGS_PODCASTS]
2minmic ChatGPT 推出锁定模式与高风险标签以抵御提示注入
02-15 ChatGPT 提示注入 锁定模式
[自动] [ARXIV]
3minschool AttentionRetriever:注意力层隐式实现长文档检索
02-15 RAG 长文档检索 AttentionRetriever
[自动] [HACKER_NEWS]
4minnewspaper 迈向自主数学研究
02-15 自主研究 数学 AI科学家
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布GPT-5.3-Codex-Spark:首款实时代码模型,生成提速15倍
02-15 OpenAI GPT-5.3 Codex
[自动] [HACKER_NEWS]
4minnewspaper Microgpt:可在浏览器中可视化的GPT模型
02-15 MicroGPT 可视化 浏览器
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.2提出胶子振幅新公式并获验证
02-15 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]
3minschool AI时代的创意所有权界定
02-15 版权 生成式AI 法律
[自动] [HACKER_NEWS]
4minnewspaper 迈向自主数学研究:AI 探索自动化定理证明
02-15 自动化定理证明 AI for Math 形式化验证
[自动] [HACKER_NEWS]
3minnewspaper RynnBrain:基于神经网络的脑机接口解码系统
02-15 脑机接口 神经网络 解码系统
[自动] [HACKER_NEWS]
5minnewspaper 两种提升大模型推理速度的技术方法
02-15 LLM 推理加速 KV Cache
[自动] [JUEJIN]
1minsticky_note_2 小米开源机器人VLA模型Xiaomi-Robotics-0:47亿参数刷新三大基准SOTA
02-15 小米 具身智能 VLA模型
[自动] [HACKER_NEWS]
4minnewspaper 打破“氛围编程”的迷思:代码生成背后的技术局限与本质
02-15 代码生成 氛围编程 技术局限
[自动] [HACKER_NEWS]
5minnewspaper 两种提升大模型推理速度的技术方法
02-15 LLM 推理加速 KV Cache
[自动] [BLOGS_PODCASTS]
2minmic Z.ai GLM-5开源:Opus 4.5级性能的新SOTA模型
02-15 GLM-5 Z.ai SOTA
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布GPT-5.3-Codex-Spark:首款实时编码模型,生成提速15倍
02-15 OpenAI GPT-5.3 Codex
[自动] [BLOGS_PODCASTS]
3minmic Jeff Dean:重写搜索栈、复兴稀疏模型与设计TPU
02-15 Jeff Dean Google TPU
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出新胶子振幅公式并获合作验证
02-15 GPT-5.2 OpenAI 理论物理
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think发布,Anthropic估值达380B
02-15 Gemini Anthropic GPT-5
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:强化推理能力以应对科研与工程挑战
02-15 Gemini 3 Deep Think 推理模型
[自动] [JUEJIN]
1minsticky_note_2 小米开源Xiaomi-Robotics-0:47亿参数VLA模型刷新具身智能基准
02-15 具身智能 VLA模型 小米
[自动] [JUEJIN]
2minsticky_note_2 大模型行为塑造:SFT与LoRA深度解析
02-15 SFT LoRA 微调
[自动] [HACKER_NEWS]
5minnewspaper 两种加速大模型推理的技术方法
02-15 LLM 推理加速 KV Cache
[自动] [JUEJIN]
2minsticky_note_2 PageLM:开源AI教育平台,将PDF文档转化为测验与播客
02-15 PageLM AI教育 NotebookLM
[自动] [JUEJIN]
2minsticky_note_2 LangChain 模型 I/O 模块:提示构建、模型调用与输出解析
02-15 LangChain LLM 提示工程
[自动] [JUEJIN]
2minsticky_note_2 开源大模型涨价潮:Llama 3.5与GLM-5的商业化博弈
02-15 Llama 3.5 GLM-5 商业化
[自动] [JUEJIN]
3minsticky_note_2 大模型API开发:Tools、MCP与Skills的本质区别
02-15 LLM AI Agent API开发
[自动] [HACKER_NEWS]
5minnewspaper OpenAI应构建企业级协作平台Slack
02-15 OpenAI Slack 企业协作
[自动] [JUEJIN]
2minsticky_note_2 智谱GLM与Meta Llama开源大模型涨价策略分析
02-15 智谱GLM Meta Llama 商业化
[自动] [HACKER_NEWS]
4minnewspaper 打破“氛围编程”的迷思与局限
02-15 氛围编程 Vibe Coding AI 编程
[自动] [JUEJIN]
3minsticky_note_2 大模型API本质解析:Tools、MCP与Skills的区别
02-15 LLM AI Agent Tools
[自动] [HACKER_NEWS]
5minnewspaper OpenAI应构建Slack:企业级AI协作平台演进方向
02-15 OpenAI Slack 企业协作
[自动] [HACKER_NEWS]
7minnewspaper 着色Petri网结合大语言模型构建分布式应用
02-14 LLM 着色Petri网 分布式系统
[自动] [BLOGS_PODCASTS]
3minmic Z.ai发布GLM-5开源模型:性能达SOTA
02-14 GLM-5 Z.ai SOTA
[自动] [BLOGS_PODCASTS]
4minmic OpenAI发布首款实时编码模型:生成速度提升15倍
02-14 OpenAI Codex GPT-5.3
[自动] [BLOGS_PODCASTS]
2minmic Jeff Dean:重塑Google搜索栈与TPU及稀疏万亿参数模型
02-14 Jeff Dean Google TPU
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出新胶子振幅公式获学术验证
02-14 GPT-5.2 理论物理 胶子振幅
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think发布,Anthropic估值达600亿美元
02-14 Gemini 3 Anthropic GPT-5.3
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:面向科研与工程的推理模型
02-14 Gemini 3 Deep Think 推理模型
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think:升级推理模式以解决科研与工程挑战
02-14 Gemini 3 Deep Think 复杂推理
[自动] [BLOGS_PODCASTS]
4minmic Amazon Bedrock AgentCore 浏览器更新:新增代理、配置文件及扩展支持
02-14 Amazon Bedrock AgentCore AI Agent
[自动] [HACKER_NEWS]
6minnewspaper 着色Petri网结合大语言模型构建分布式应用
02-14 LLM Petri网 分布式系统
[自动] [ARXIV]
4minschool 扩展验证比扩展策略学习更有效实现视觉-语言-动作对齐
02-14 VLA 具身智能 机器人
[自动] [HACKER_NEWS]
4minnewspaper 打破“氛围编程”的迷思:回归代码本质
02-14 氛围编程 AI编程 代码本质
[自动] [ARXIV]
4minschool 基于策略上下文蒸馏的大语言模型优化方法
02-14 LLM 蒸馏 上下文学习
[自动] [BLOGS_PODCASTS]
3minmic Z.ai发布GLM-5开放权重模型,性能超越Opus 4.5
02-14 GLM-5 Z.ai Opus 4.5
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展
02-14 多模态 思维链 测试时扩展
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布GPT-5.3-Codex-Spark:首个实时编码模型,生成提速15倍
02-14 OpenAI GPT-5.3 Codex
[自动] [HACKER_NEWS]
5minnewspaper OpenAI 应该构建 Slack:企业级 AI 协作平台构想
02-14 OpenAI Slack 企业协作
[自动] [ARXIV]
5minschool MonarchRT:面向实时视频生成的高效注意力机制
02-14 视频生成 DiT 注意力机制
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2推导新胶子振幅公式获正式验证
02-14 GPT-5.2 OpenAI 理论物理
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex与Mi
02-14 Gemini 3 Anthropic OpenAI
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think:升级推理模式以解决科研与工程挑战
02-14 Gemini 3 Deep Think 推理模型
[自动] [BLOGS_PODCASTS]
2minmic Codex与Claude支持定制内核以适配各类应用
02-14 Claude Codex 定制内核
[自动] [ARXIV]
5minschool CM2:基于清单奖励强化学习的多步多轮智能体工具调用
02-14 智能体 强化学习 工具调用
[自动] [BLOGS_PODCASTS]
3minmic ChatGPT推出锁定模式与高危标签以防范提示词注入及数据外泄
02-14 ChatGPT 提示词注入 数据安全
[自动] [ARXIV]
4minschool AttentionRetriever:注意力层可作为长文档检索器
02-14 RAG 长文档检索 AttentionRetriever
[自动] [ARXIV]
4minschool Agentic测试时扩展技术提升WebAgent性能
02-14 WebAgent 测试时扩展 CATTS
[自动] [HACKER_NEWS]
5minnewspaper Gemini 3 Deep Think 生成鹈鹕骑自行车 SVG 图像
02-14 Gemini 3 Deep Think SVG
[自动] [ARXIV]
3minschool AI时代的创意所有权界定与归属问题研究
02-14 版权 生成式AI 法律
[自动] [BLOGS_PODCASTS]
3minmic Jeff Dean:重塑搜索栈、复兴稀疏模型与TPU设计
02-14 Jeff Dean TPU 稀疏模型
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新结果
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
3minnewspaper G
02-14 GPT-5.2 理论物理 科学发现
[自动] [JUEJIN]
2minsticky_note_2 国产 Windows 版 Claude Cowork 上线:集成海量 Skills
02-14 Claude Claude Cowork AI 办公
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理领域新成果
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新结果
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
7minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [BLOGS_PODCASTS]
2minmic Z.ai GLM-5:开放权重新一代SOTA大模型
02-14 GLM-5 Z.ai SOTA
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布GPT-5.3-Codex-Spark:首个实时编码模型,生成提速15倍
02-14 OpenAI GPT-5.3 Codex
[自动] [BLOGS_PODCASTS]
3minmic microgpt:200行纯Python实现GPT训练与推理
02-14 microgpt Andrej Karpathy LLM
[自动] [BLOGS_PODCASTS]
2minmic Jeff Dean:重塑Google搜索栈与TPU联合设计之路
02-14 Jeff Dean TPU 稀疏模型
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think发布;Anthropic估值380B;MiniMax推M2.5
02-14 Gemini 3 Deep Think Anthropic
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think:强化推理能力以解决科研与工程挑战
02-14 Gemini Deep Think 推理模型
[自动] [BLOGS_PODCASTS]
2minmic Codex 与 Claude 支持自定义内核以适配所有模型
02-14 Codex Claude 自定义内核
[自动] [HACKER_NEWS]
6minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
5minnewspaper GPT-5.2 推导出理论物理新结果
02-14 GPT-5.2 理论物理 AI for Science
[自动] [HACKER_NEWS]
6minnewspaper 神经渲染技术探索:从原理到应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新成果
02-14 GPT-5.2 理论物理 科学发现
[自动] [JUEJIN]
2minsticky_note_2 阿里千问发布 Qwen-Image-2.0:强化文字渲染与图表生成
02-14 Qwen 阿里千问 图像生成
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 使命声明演变:从通用人工智能到造福人类
02-14 OpenAI 使命声明 AGI
[自动] [ARXIV]
4minschool 面向语言模型的在线上下文蒸馏方法
02-13 LLM 模型蒸馏 上下文学习
[自动] [ARXIV]
4minschool 扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐
02-13 VLA 具身智能 机器人
[自动] [BLOGS_PODCASTS]
3minmic Z.ai GLM-5开源:新SOTA级开放权重大模型
02-13 GLM-5 Z.ai SOTA
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-13 多模态 思维链 测试时扩展
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布GPT-5.3-Codex-Spark:首款实时代码模型,速度提升15倍
02-13 OpenAI GPT-5.3 Codex
[自动] [ARXIV]
4minschool MonarchRT:面向实时视频生成的高效注意力机制
02-13 MonarchRT 实时视频生成 DiT
[自动] [BLOGS_PODCASTS]
4minmic microgpt:200行纯Python实现GPT训练与推理
02-13 microgpt Andrej Karpathy LLM
[自动] [BLOGS_PODCASTS]
3minmic Jeff Dean:重塑搜索堆栈、TPU与稀疏万亿参数模型
02-13 Jeff Dean Google TPU
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新结果
02-13 GPT-5.2 理论物理 AI for Science
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think发布;Anthropic估值380B;GPT-5.3-Codex与Min
02-13 Gemini Anthropic GPT-5.3
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:升级推理模式以应对科研与工程挑战
02-13 Gemini 3 Deep Think 推理模型
[自动] [HACKER_NEWS]
4minnewspaper Dario Amodei:AI指数增长阶段即将终结
02-13 Dario Amodei Anthropic 指数增长
[自动] [BLOGS_PODCASTS]
2minmic Codex与Claude支持定制化内核
02-13 Codex Claude 定制化内核
[自动] [ARXIV]
6minschool CM2:基于清单奖励强化学习的多轮多步智能体工具调用
02-13 强化学习 Agent 工具调用
[自动] [BLOGS_PODCASTS]
2minmic ChatGPT推出锁定模式与高风险标签防御提示词注入
02-13 ChatGPT OpenAI 提示词注入
[自动] [ARXIV]
4minschool AttentionRetriever:注意力层即长文档检索器
02-13 RAG 长文档检索 AttentionRetriever
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock AgentCore 浏览器新增代理、配置文件及扩展支持
02-13 Amazon Bedrock AgentCore AI Agent
[自动] [ARXIV]
5minschool Agentic WebAgents 的测试时缩放方法
02-13 WebAgents 测试时缩放 CATTS
[自动] [JUEJIN]
2minsticky_note_2 阿里发布千问 Qwen-Image-2.0:强化文字渲染与图表生成能力
02-13 Qwen 阿里云 图像生成
[自动] [JUEJIN]
2minsticky_note_2 即梦Seedance 2.0海外爆火,AI视频生成迎来DeepSeek时刻
02-13 AI视频 Seedance 即梦
[自动] [BLOGS_PODCASTS]
3minmic 单文件200行代码:microgpt实现无依赖GPT训练与推理
02-13 microgpt Andrej Karpathy LLM
[自动] [BLOGS_PODCASTS]
2minmic Z.ai发布GLM-5开源模型:性能超越Opus 4.5
02-13 GLM-5 Z.ai SOTA
[自动] [BLOGS_PODCASTS]
2minmic Jeff Dean:重写搜索栈、TPU 与稀疏万亿参数模型
02-13 Jeff Dean TPU 稀疏模型
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think推理模式升级,专注科研与工程挑战
02-13 Gemini 3 Deep Think 推理模式
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex与Mi
02-13 Gemini Anthropic GPT-5.3
[自动] [BLOGS_PODCASTS]
2minmic ChatGPT推出锁定模式与高风险标记以防御提示词注入
02-13 ChatGPT 提示词注入 企业安全
[自动] [BLOGS_PODCASTS]
3minmic AI与模拟加速科学发现:Rafael Gómez-Bombarelli谈技术转折点
02-13 AI for Science 科学发现 模拟技术
[自动] [BLOGS_PODCASTS]
2minmic Z.ai发布GLM-5开源模型,性能超越Opus 4.5
02-13 GLM-5 Z.ai Open Weights
[自动] [BLOGS_PODCASTS]
4minmic MicroGPT:200行纯Python代码实现GPT训练与推理
02-13 MicroGPT LLM 纯Python
[自动] [HACKER_NEWS]
5minnewspaper Gemini 3 Deep Think 推理模型发布
02-13 Gemini 3 Deep Think 推理模型
[自动] [BLOGS_PODCASTS]
2minmic AI与模拟加速科学发现:拉斐尔·戈麦斯-巴雷利谈技术拐点
02-13 科学发现 AI模拟 科学计算
[自动] [BLOGS_PODCASTS]
3minmic Z.ai发布GLM-5开源模型:性能超越Opus 4.5
02-13 GLM-5 Z.ai SOTA
[自动] [BLOGS_PODCASTS]
4minmic microgpt:200行Python实现的GPT训练与推理极简指南
02-13 LLM GPT Python
[自动] [BLOGS_PODCASTS]
2minmic Jeff Dean:重写搜索栈、复兴稀疏万亿参数模型与TPU共设计
02-13 Jeff Dean TPU 稀疏模型
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex与Mi
02-13 Gemini 3 Deep Think Anthropic
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think:强化推理模式以应对科研与工程挑战
02-13 Gemini 3 Deep Think 推理模型
[自动] [HACKER_NEWS]
4minnewspaper Gemini 3 Deep Think 模式发布:支持长链思考推理
02-13 Gemini 3 Deep Think Google
[自动] [BLOGS_PODCASTS]
2minmic AI 与模拟加速科学发现:Rafael Gómez-Bombarelli 谈技术拐点
02-13 AI for Science 科学发现 机器学习
[自动] [BLOGS_PODCASTS]
4minmic 利用 Amazon Bedrock 构建AI驱动的招聘系统优化人才获取
02-13 Amazon Bedrock AWS RAG
[自动] [BLOGS_PODCASTS]
2minmic Z.ai发布GLM-5开源模型:性能超越Opus 4.5
02-13 GLM-5 Z.ai Opus 4.5
[自动] [BLOGS_PODCASTS]
3minmic Rafael Gómez-Bombarelli:AI与模拟加速科学发现的转折点
02-13 AI for Science 科学发现 模拟技术
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv 实践:评估真实环境中的工具调用智能体
02-13 智能体 工具调用 OpenEnv
[自动] [BLOGS_PODCASTS]
3minmic Jeff Dean:重塑Google搜索架构与TPU及稀疏模型的技术历程
02-13 Jeff Dean Google TPU
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think发布,Anthropic估值达600亿美元
02-13 Gemini 3 Deep Think Anthropic
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:升级推理模式以应对科研与工程挑战
02-13 Gemini 3 Deep Think 推理模型
[自动] [BLOGS_PODCASTS]
2minmic Codex 与 Claude 支持构建自定义内核
02-13 Codex Claude 自定义内核
[自动] [BLOGS_PODCASTS]
3minmic Boltz开源AlphaFold传承工具赋能药物发现
02-13 Boltz AlphaFold 药物发现
[自动] [BLOGS_PODCASTS]
3minmic 200行纯Python实现microgpt:无依赖训练推理GPT
02-13 GPT Python LLM
[自动] [BLOGS_PODCASTS]
4minmic 仅200行Python的microgpt:无依赖实现GPT训练与推理
02-13 LLM GPT Python
[自动] [BLOGS_PODCASTS]
2minmic Z.ai发布GLM-5开源模型,性能超越Opus 4.5
02-13 GLM-5 Z.ai SOTA
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv 实战:评估真实环境中的工具调用智能体
02-13 OpenEnv 智能体 Agent
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS
02-13 NVIDIA Nemotron SageMaker
[自动] [BLOGS_PODCASTS]
3minmic Jeff Dean:重塑谷歌搜索架构与TPU及稀疏模型的技术演进
02-13 Jeff Dean Google TPU
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think推理模式更新,专注解决科研与工程挑战
02-13 Gemini 3 Deep Think 推理模式
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think发布;Anthropic估值380亿美元;GPT-5.3-Codex S
02-13 Gemini 3 Anthropic GPT-5.3
[自动] [HACKER_NEWS]
4minnewspaper Gemini 3 Deep Think 模式发布:支持长链思考
02-13 Gemini 3 Deep Think 长链思考
[自动] [HACKER_NEWS]
6minnewspaper 仅更换测试框架,一下午提升15个大模型代码能力
02-13 LLM 代码生成 基准测试
[自动] [HACKER_NEWS]
4minnewspaper Gemini 3 Deep Think 推理模型发布
02-13 Gemini 3 Deep Think 推理模型
[自动] [BLOGS_PODCASTS]
2minmic Boltz 开源分子发现模型:超越 AlphaFold 的药物研发新工具
02-13 Boltz AlphaFold 药物研发
[自动] [BLOGS_PODCASTS]
2minmic AI与模拟加速科学发现的转折点
02-13 科学发现 AI模拟 Rafael Gómez-Bombarelli
[自动] [HACKER_NEWS]
4minnewspaper Gemini 3 Deep Think 模式发布:强化推理与长思考能力
02-13 Gemini 3 Deep Think 推理模型
[自动] [BLOGS_PODCASTS]
4minmic 单文件200行纯Python实现GPT训练与推理
02-13 GPT Python LLM
[自动] [HACKER_NEWS]
6minnewspaper 仅改用Harness框架即可提升15个大模型编程能力
02-13 LLM 代码生成 Harness
[自动] [BLOGS_PODCASTS]
2minmic Z.ai发布GLM-5开源模型,性能超越Opus 4.5
02-13 GLM-5 Z.ai Opus 4.5
[自动] [BLOGS_PODCASTS]
2minmic Rafael Gómez-Bombarelli:AI与模拟加速科学发现
02-13 科学发现 AI模拟 材料科学
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv 实战:评估真实环境中的工具调用智能体
02-13 智能体 工具调用 OpenEnv
[自动] [BLOGS_PODCASTS]
3minmic Jeff Dean:重塑谷歌搜索栈与TPU架构的AI系统设计之路
02-13 Jeff Dean Google TPU
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think:升级推理模式以应对科研与工程挑战
02-13 Gemini 3 Deep Think 推理模式
[自动] [HACKER_NEWS]
7minnewspaper 仅更换框架,一下午提升15个大模型代码能力
02-13 LLM 代码生成 模型评估
[自动] [HACKER_NEWS]
3minnewspaper 评估多语言上下文护栏:人道主义大模型应用
02-13 LLM 护栏 多语言
[自动] [HACKER_NEWS]
4minnewspaper Gemini 3 Deep Think 推出:强化长思维链推理能力
02-13 Gemini 3 Deep Think Google
[自动] [HACKER_NEWS]
3minnewspaper 尼克·博斯特罗姆新论文探讨超级智能的启动时机
02-13 超级智能 尼克·博斯特罗姆 AI安全
[自动] [BLOGS_PODCASTS]
2minmic Z.ai发布GLM-5开源模型:性能超越Opus 4.5
02-13 GLM-5 Z.ai 开源模型
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv实践:评估真实环境中的工具调用智能体
02-13 智能体 工具调用 OpenEnv
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-13 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
3minmic microgpt:200行Python实现的零依赖GPT训练与推理
02-13 GPT LLM Python
[自动] [BLOGS_PODCASTS]
3minmic Jeff Dean:重写搜索基建、复兴稀疏模型与设计 TPU
02-13 Jeff Dean Google TPU
[自动] [BLOGS_PODCASTS]
3minmic Boltz 开源药物发现工具:基于 AlphaFold 遗产赋能下一代分子发现
02-13 Boltz AlphaFold 药物发现
[自动] [BLOGS_PODCASTS]
3minmic AI与仿真加速科学发现的转折点
02-13 科学发现 AI for Science 仿真模拟
[自动] [HACKER_NEWS]
3minnewspaper 评估多语言上下文护栏:人道主义LLM用例
02-13 LLM 护栏 多语言
[自动] [HACKER_NEWS]
7minnewspaper 仅调整框架,一下午提升15个大模型编程能力
02-13 LLM 代码生成 模型评估
[自动] [HACKER_NEWS]
4minnewspaper Gemini 3 Deep Think 发布:强化深度推理能力
02-13 Gemini 3 Deep Think Google
[自动] [ARXIV]
4minschool 训练LRM模型:自适应反思与长度协调惩罚提升推理效率
02-13 LRM 推理效率 自适应反思
[自动] [ARXIV]
3minschool 能力导向训练引发大模型对齐风险研究
02-13 AI对齐 强化学习 奖励黑客
[自动] [ARXIV]
4minschool 离线强化学习在Q星近似与部分覆盖下的复杂度分析
02-13 离线强化学习 Q星近似 部分覆盖
[自动] [ARXIV]
4minschool 基于奖励外推的广义在线策略蒸馏算法
02-13 LLM 强化学习 知识蒸馏
[自动] [ARXIV]
3minschool Pensieve范式:有状态语言模型自主管理上下文
02-13 StateLM 有状态模型 上下文管理
[自动] [ARXIV]
4minschool P-GenRM:个性化生成式奖励模型与基于用户的测试时缩放
02-13 P-GenRM 个性化对齐 奖励模型
[自动] [ARXIV]
4minschool Meta-Sel:基于监督元学习的高效上下文学习示例选择方法
02-13 ICL 元学习 示例选择
[自动] [ARXIV]
4minschool KAN-FIF:基于样条参数化的轻量级气象卫星热带气旋估算模型
02-13 KAN 气象预测 热带气旋
[自动] [ARXIV]
4minschool 长思维链监督微调中数据重复优于数据扩展
02-13 长思维链 监督微调 数据重复
[自动] [ARXIV]
4minschool 超越VLM奖励:扩散原生潜在奖励建模
02-13 扩散模型 DiNa-LRM 奖励建模
[自动] [ARXIV]
4minschool 权重衰减提升语言模型可塑性
02-13 权重衰减 模型可塑性 微调
[自动] [ARXIV]
4minschool 基于扩散预训练的稠密上下文嵌入模型
02-13 Embeddings 扩散模型 RAG
[自动] [HACKER_NEWS]
4minnewspaper 仅修改框架,一下午提升15个大模型代码能力
02-13 LLM 代码生成 框架优化
[自动] [ARXIV]
3minschool TabICLv2:开源表格基础模型在性能与效率上的改进
02-13 表格模型 TabICLv2 SOTA
[自动] [ARXIV]
3minschool GENIUS:生成式流体智能评估套件
02-13 GENIUS 流体智力 多模态评估
[自动] [HACKER_NEWS]
4minnewspaper Gemini 3 Deep Think 模式发布:强化推理能力
02-13 Gemini 3 Deep Think 推理能力
[自动] [ARXIV]
3minschool 长思维链监督微调中数据重复优于数据扩展
02-12 长思维链 监督微调 数据重复
[自动] [ARXIV]
4minschool 超越VLM奖励:扩散原生潜在奖励建模
02-12 扩散模型 DiNa-LRM 奖励建模
[自动] [ARXIV]
4minschool 权重衰减提升语言模型可塑性
02-12 LLM 权重衰减 模型可塑性
[自动] [ARXIV]
4minschool 扩散预训练模型生成稠密上下文嵌入
02-12 Embeddings 扩散模型 RAG
[自动] [BLOGS_PODCASTS]
3minmic 单文件200行纯Python实现GPT训练与推理
02-12 GPT Python LLM
[自动] [HACKER_NEWS]
4minnewspaper 仅更换框架,一下午提升15个大模型编程能力
02-12 LLM 代码生成 框架对比
[自动] [ARXIV]
4minschool TabICLv2:更优性能与可扩展性的开源表格基础模型
02-12 TabICLv2 表格基础模型 RealTabPFN
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv 实践:在真实环境中评估工具调用智能体
02-12 OpenEnv 智能体 Agent
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
3minmic Jeff Dean:重写谷歌搜索栈与TPU共设计之路
02-12 Jeff Dean Google TPU
[自动] [ARXIV]
3minschool GENIUS:生成式流体智能评估套件
02-12 GENIUS 流体智能 GFI
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:专用于解决科研与工程挑战的推理模式更新
02-12 Gemini 3 Deep Think 推理模型
[自动] [HACKER_NEWS]
7minnewspaper Gemini 3 Deep Think 推出长思维链推理模式
02-12 Gemini 3 Deep Think 长思维链
[自动] [BLOGS_PODCASTS]
3minmic Boltz开源药物发现工具:传承AlphaFold并赋能下一代分子研究
02-12 Boltz AlphaFold 药物发现
[自动] [BLOGS_PODCASTS]
2minmic AI与模拟加速科学发现:Rafael Gómez-Bombarelli谈技术转折点
02-12 AI for Science 科学发现 逆向设计
[自动] [HACKER_NEWS]
4minnewspaper 仅调整框架一下午提升15个大模型编程能力
02-12 LLM 代码生成 模型评估
[自动] [BLOGS_PODCASTS]
2minmic Z.ai发布GLM-5开源模型:性能超越Opus 4.5
02-12 GLM-5 Z.ai LLM
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv实践:评估真实环境中的工具调用智能体
02-12 智能体 工具调用 OpenEnv
[自动] [BLOGS_PODCASTS]
5minmic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta
02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
2minmic LinqAlpha 基于 Amazon Bedrock 构建投资论点压力测试代理
02-12 Amazon Bedrock Agent 多智能体
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think推理模式更新,专注解决科研与工程挑战
02-12 Gemini 3 Deep Think 推理模式
[自动] [HACKER_NEWS]
7minnewspaper Gemini 3 Deep Think:长链推理与深度思考模式解析
02-12 Gemini 3 Deep Think 长链推理
[自动] [BLOGS_PODCASTS]
3minmic Boltz 开源平台:基于 AlphaFold 遗产加速药物发现
02-12 Boltz AlphaFold 药物发现
[自动] [BLOGS_PODCASTS]
3minmic AI与模拟加速科学发现:Rafael Gómez-Bombarelli谈技术拐点
02-12 科学发现 生成式AI 模拟技术
[自动] [HACKER_NEWS]
4minnewspaper 仅调整框架,一下午提升15个大模型编码能力
02-12 LLM 代码生成 Prompt Engineering
[自动] [HACKER_NEWS]
4minnewspaper 仅替换调度框架,一下午提升15个大模型编程能力
02-12 LLM 代码生成 调度框架
[自动] [BLOGS_PODCASTS]
2minmic Z.ai发布GLM-5开源模型:性能超越Opus 4.5
02-12 GLM-5 Z.ai Opus 4.5
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv实践:评估真实环境中的工具调用智能体
02-12 OpenEnv 智能体 Agent
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta
02-12 NVIDIA AWS SageMaker
[自动] [HACKER_NEWS]
5minnewspaper MiniMax M2.5 发布:SWE-bench Verified 得分 80.2%
02-12 MiniMax M2.5 SWE-bench
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think推理模式升级,面向科研与工程领域
02-12 Gemini 3 Deep Think 推理模式
[自动] [BLOGS_PODCASTS]
3minmic Boltz开源平台:基于AlphaFold遗产加速药物分子发现
02-12 Boltz AlphaFold 药物发现
[自动] [BLOGS_PODCASTS]
3minmic AI与模拟技术加速科学发现的拐点已至
02-12 科学发现 生成式AI 模拟技术
[自动] [HACKER_NEWS]
6minnewspaper 仅更换框架,一下午提升15个大模型编程能力
02-12 LLM 代码生成 框架对比
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊利用Nova模型自动化新履约中心运营就绪测试
02-12 Amazon Nova Amazon Bedrock 图像识别
[自动] [BLOGS_PODCASTS]
4minmic Z.ai发布GLM-5开源权重模型,性能超越Opus 4.5
02-12 GLM-5 Z.ai SOTA
[自动] [BLOGS_PODCASTS]
3minmic OpenEnv实践:评估真实环境中的工具调用智能体
02-12 OpenEnv 智能体 Agent
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta
02-12 NVIDIA AWS SageMaker
[自动] [HACKER_NEWS]
5minnewspaper MiniMax M2.5 发布:SWE-bench Verified 得分 80.2%
02-12 MiniMax M2.5 SWE-bench
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:面向科研与工程的深度推理模型
02-12 Gemini 3 Deep Think 深度推理
[自动] [HACKER_NEWS]
4minnewspaper Gemini 3 Deep Think 推出:强化长链思考能力
02-12 Gemini 3 Deep Think 长链思考
[自动] [BLOGS_PODCASTS]
2minmic Boltz开源平台:基于AlphaFold技术赋能新一代分子发现
02-12 Boltz AlphaFold 药物发现
[自动] [HACKER_NEWS]
5minnewspaper 仅更换调度框架,一下午提升15个大模型代码能力
02-12 LLM 代码生成 调度框架
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊利用Nova模型自动化新履约中心运营验收测试
02-12 Amazon Nova Amazon Bedrock 图像识别
[自动] [BLOGS_PODCASTS]
3minmic Qwen Image 2 与 Seedance 2:中国生成式媒体进展
02-12 Qwen Image 2 Seedance 2 图像生成
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv实践:评估真实环境中的工具调用智能体
02-12 OpenEnv 智能体 Agent
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-12 NVIDIA AWS SageMaker
[自动] [HACKER_NEWS]
7minnewspaper GLM-5:面向复杂系统工程与长周期智能体任务
02-12 GLM-5 智能体 系统工程
[自动] [BLOGS_PODCASTS]
3minmic Boltz 开源药物发现平台:延续 AlphaFold 技术赋能分子研究
02-12 Boltz AlphaFold 药物发现
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova Sonic 实时语音助手与级联架构对比
02-12 Amazon Nova 语音助手 实时语音
[自动] [BLOGS_PODCASTS]
2minmic AI与仿真加速科学发现:Rafael Gómez-Bombarelli谈技术拐点
02-12 科学发现 AI模拟 材料设计
[自动] [JUEJIN]
2minsticky_note_2 智谱GLM-5即Pony Alpha:对标Claude Opus
02-12 智谱AI GLM-5 Pony Alpha
[自动] [JUEJIN]
2minsticky_note_2 基于GLM-5与OpenClaw构建具备任务执行能力的AI伴侣
02-12 GLM-5 OpenClaw AI Agent
[自动] [BLOGS_PODCASTS]
2minmic Z.ai GLM-5开源:性能超越Opus 4.5
02-12 GLM-5 Z.ai SOTA
[自动] [HACKER_NEWS]
5minnewspaper GLM-5:面向复杂系统工程与长周期智能体任务
02-12 GLM-5 智能体 系统工程
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊利用 Nova 模型自动化新履约中心运营就绪测试
02-12 Amazon Nova Amazon Bedrock 图像识别
[自动] [BLOGS_PODCASTS]
3minmic 中国生成式媒体模型Qwen Image 2与Seedance 2发布
02-12 Qwen Image 2 Seedance 2 生成式媒体
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]
4minmic Amazon Nova Sonic 实时语音助手与级联架构对比
02-12 Amazon Nova 实时语音 语音助手
[自动] [JUEJIN]
2minsticky_note_2 深度解析Skill/MCP/RAG等五大AI技术的底层逻辑
02-12 LLM RAG Agent
[自动] [HACKER_NEWS]
6minnewspaper GLM-5:面向复杂系统工程与长周期智能体任务
02-12 GLM-5 智能体 系统工程
[自动] [HACKER_NEWS]
3minnewspaper 大语言模型面临的幻觉与逻辑推理局限
02-12 LLM 幻觉 逻辑推理
[自动] [BLOGS_PODCASTS]
2minmic 大语言模型无法凭自身治愈癌症
02-12 LLM 科学发现 模拟器
[自动] [BLOGS_PODCASTS]
2minmic 亚马逊利用Nova模型自动化检测新履约中心组件
02-12 Amazon Nova Amazon Bedrock 图像识别
[自动] [BLOGS_PODCASTS]
3minmic Qwen Image 2 与 Seedance 2:中国生成式媒体进展
02-12 Qwen Image 2 Seedance 2 文生图
[自动] [BLOGS_PODCASTS]
3minmic Iberdrola 如何利用 Amazon Bedrock AgentCore 优化 ServiceNow I
02-12 Amazon Bedrock AgentCore ServiceNow
[自动] [BLOGS_PODCASTS]
3minmic Boltz 开源策略:后AlphaFold时代的药物发现新工具
02-12 Boltz AlphaFold 药物发现
[自动] [BLOGS_PODCASTS]
2minmic Amazon Nova Sonic 实时语音助手与级联架构对比
02-12 Amazon Nova 实时语音 语音助手
[自动] [BLOGS_PODCASTS]
3minmic AI与模拟加速科学发现:拉斐尔·戈麦斯-巴雷利的观点
02-12 AI 科学发现 模拟
[自动] [BLOGS_PODCASTS]
2minmic 大语言模型无法独立攻克癌症的局限性分析
02-12 LLM 癌症研究 AI 局限性
[自动] [HACKER_NEWS]
4minnewspaper 大语言模型在逻辑推理与事实准确性上的局限
02-12 LLM 逻辑推理 事实准确性
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊利用 Nova 模型自动化检测新履约中心组件
02-12 Amazon Nova Amazon Bedrock 计算机视觉
[自动] [BLOGS_PODCASTS]
3minmic Qwen Image 2 与 Seedance 2:中国生成式媒体模型进展
02-12 Qwen Image 2 Seedance 2 通义千问
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS
02-12 NVIDIA Nemotron AWS
[自动] [HACKER_NEWS]
3minnewspaper GPT-5在法律推理实验中表现优于联邦法官
02-12 GPT-5 法律推理 联邦法官
[自动] [HACKER_NEWS]
7minnewspaper CodeRLM:基于 Tree-sitter 的 LLM 代码索引工具
02-12 CodeRLM Tree-sitter 代码索引
[自动] [BLOGS_PODCASTS]
3minmic Boltz 开源药物发现工具:传承 AlphaFold 推动分子发现
02-12 Boltz AlphaFold 药物发现
[自动] [BLOGS_PODCASTS]
4minmic Amazon Nova Sonic 实时语音助手与级联架构对比
02-12 Amazon Nova 实时语音 语音助手
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊利用 Nova 模型自动化新履约中心运营就绪测试
02-12 Amazon Nova Amazon Bedrock 图像识别
[自动] [ARXIV]
3minschool ROCKET:校准导向背包增强截断的高效模型压缩
02-12 模型压缩 ROCKET 免训练
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt
02-12 NVIDIA Nemotron AWS
[自动] [ARXIV]
4minschool LoRA-Squeeze:LoRA模块的调优后与调优中压缩方法
02-12 LoRA PEFT 模型压缩
[自动] [BLOGS_PODCASTS]
2minmic LLM 单独使用无法治愈癌症:科学与模拟的局限
02-12 LLM 生物医学 AI for Science
[自动] [BLOGS_PODCASTS]
2minmic LinqAlpha利用Amazon Bedrock构建投资论点压力测试AI
02-12 Amazon Bedrock 多代理系统 AI Agent
[自动] [HACKER_NEWS]
2minnewspaper GLM-5:面向复杂系统工程与长周期智能体任务
02-12 GLM-5 智能体 系统工程
[自动] [ARXIV]
4minschool CLI-Gym:基于智能体环境逆向的可扩展命令行任务生成
02-12 CLI-Gym Agent 环境逆向
[自动] [BLOGS_PODCASTS]
4minmic Amazon Nova Sonic 实时语音助手与级联架构对比
02-12 Amazon Nova 实时语音 语音助手
[自动] [ARXIV]
2minschool 用于增强科学图表分析的智能代理
02-12 智能代理 科学图表 多模态
[自动] [BLOGS_PODCASTS]
3minmic Qwen Image 2与Seedance 2:中国生成式媒体模型进展
02-12 Qwen Image 2 Seedance 2 生成式媒体
[自动] [ARXIV]
1minschool Learning on the Manifold: Unlocking Standard Diffusion
02-12 Diffusion Transformer DiT 表征学习
[自动] [HACKER_NEWS]
4minnewspaper GLM-OCR:面向复杂文档理解的多模态OCR模型
02-12 GLM-OCR 多模态 OCR
[自动] [ARXIV]
5minschool Agent World Model:面向智能体强化学习的无限合成环境
02-12 Agent World Model 强化学习 合成环境
[自动] [ARXIV]
1minschool 基于表征编码器解锁标准扩散Transformer
02-11 DiT 扩散模型 流匹配
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊利用Nova模型自动化新履约中心运营准备检测
02-11 Amazon Nova Amazon Bedrock 图像识别
[自动] [ARXIV]
3minschool LLM盲区偏差检测:识别模型未提及内容
02-11 LLM 偏见检测 模型评估
[自动] [HACKER_NEWS]
4minnewspaper GLM-5:从直觉编程迈向智能体工程
02-11 GLM-5 智能体 Agent Engineering
[自动] [ARXIV]
4minschool CODE-SHARP:基于分层奖励程序的技能持续演化框架
02-11 CODE-SHARP 强化学习 RL
[自动] [ARXIV]
3minschool Agent World Model: Infinity Synthetic Environments for
02-11 Agent World Model 强化学习
[自动] [HACKER_NEWS]
7minnewspaper Agent Alcove:支持多模型在论坛中进行辩论
02-11 Agent 多模型 Claude
[自动] [ARXIV]
1minschool 循环Transformer的步级数据归因方法
02-11 Transformer 数据归因 模型可解释性
[自动] [BLOGS_PODCASTS]
1minmic 大语言模型无法治愈癌症:科学家的模拟困境
02-11 LLM 科学发现 生物医学
[自动] [BLOGS_PODCASTS]
4minmic 中国生成式媒体模型Qwen Image 2与Seedance 2发布
02-11 Qwen Image 2 Seedance 2 文生图
[自动] [ARXIV]
3minschool Olaf-World: Orienting Latent Actions for Video World Mo
02-11 世界模型 Olaf-World 潜在动作
[自动] [JUEJIN]
1minsticky_note_2 讯飞星火X2发布:纯国产算力大模型性能对标GPT
02-11 讯飞星火 国产算力 GPT
[自动] [HACKER_NEWS]
4minnewspaper Show HN: AI agents play SimCity through a REST API
02-11 AI Agent SimCity REST API
[自动] [JUEJIN]
2minsticky_note_2 AI视觉连载3:RGB图像原理与通道详解
02-11 AI视觉 RGB 图像处理
[自动] [JUEJIN]
2minsticky_note_2 AI 核心术语解析:从神经网络原理到词嵌入与潜空间
02-11 神经网络 词嵌入 潜空间
[自动] [BLOGS_PODCASTS]
2minmic Qwen Image 2与Seedance 2发布:中国生成式媒体表现强劲
02-11 Qwen Image 2 Seedance 2 通义千问
[自动] [BLOGS_PODCASTS]
2minmic How Amazon uses Amazon Nova models to automate operatio
02-11 Amazon Nova Amazon Bedrock 多模态
[自动] [HACKER_NEWS]
3minnewspaper GLM-OCR: Accurate × Fast × Comprehensive
02-11 GLM-OCR OCR 多模态
[自动] [BLOGS_PODCASTS]
2minmic Building real-time voice assistants with Amazon Nova So
02-11 Amazon Nova 语音助手 实时交互
[自动] [HACKER_NEWS]
4minnewspaper GLM-OCR:兼顾准确度、速度与通用性的多模态大模型
02-11 GLM-OCR 多模态 OCR
[自动] [ARXIV]
2minschool Anagent For Enhancing Scientific Table & Figure Analysi
02-11 Anagent 多智能体 科学图表分析
[自动] [BLOGS_PODCASTS]
2minmic Agent-to-agent collaboration: Using Amazon Nova 2 Lite
02-11 Multi-Agent Amazon Bedrock Agent 协作
[自动] [BLOGS_PODCASTS]
1minmic [AINews] Qwen Image 2 and Seedance 2
02-11 Qwen Image 2 Seedance 2 通义千问
[自动] [JUEJIN]
2minsticky_note_2 AI Design-to-Code 的两个根本问题与解法
02-11 Design-to-Code D2C 空间认知
[自动] [BLOGS_PODCASTS]
3minmic 亚马逊利用Nova模型自动化新履约中心运营就绪测试
02-11 Amazon Nova Amazon Bedrock 图像识别
[自动] [HACKER_NEWS]
4minnewspaper The Little Learner:通往深度学习的直线路径
02-11 深度学习 机器学习 神经网络
[自动] [BLOGS_PODCASTS]
3minmic Scale LLM fine-tuning with Hugging Face and Amazon Sage
02-11 LLM 微调 Hugging Face
[自动] [BLOGS_PODCASTS]
3minmic Building real-time voice assistants with Amazon Nova So
02-11 Amazon Nova 语音助手 实时交互
[自动] [ARXIV]
1minschool Moltbook 漏洞:自进化 AI 社会中 Anthropic 安全机制失效
02-11 Anthropic AI安全 对齐
[自动] [HACKER_NEWS]
1minnewspaper The Little Learner: A Straight Line to Deep Learning
02-11 深度学习 机器学习 神经网络
[自动] [ARXIV]
2minschool GEBench:将图像生成模型评估为GUI环境的基准
02-11 GEBench GUI生成 图像生成
[自动] [ARXIV]
3minschool Data Science and Technology Towards AGI Part I: Tiered
02-11 AGI 数据管理 分层架构
[自动] [BLOGS_PODCASTS]
1minmic Bringing ChatGPT to GenAI.mil
02-11 OpenAI ChatGPT GenAI.mil
[自动] [ARXIV]
3minschool ARO: A New Lens On Matrix Optimization For Large Models
02-11 ARO 矩阵优化 LLM
[自动] [ARXIV]
2minschool ANCRe: Adaptive Neural Connection Reassignment for Effi
02-11 ANCRe 深度学习 残差连接
[自动] [HACKER_NEWS]
4minnewspaper The Little Learner: A Straight Line to Deep Learning
02-11 深度学习 Deep Learning 机器学习
[自动] [JUEJIN]
2minsticky_note_2 LangChain 进阶实战:当 Memory 遇上 OutputParser,打造有记忆的结构化助手
02-11 LangChain LLM Memory
[自动] [ARXIV]
3minschool 鲁棒性是函数而非数值:基于视觉驾驶的OOD鲁棒性因子化研究
02-10 OOD鲁棒性 视觉驾驶 因子化
[自动] [ARXIV]
2minschool 面向AGI的数据科学与技术:分层数据管理
02-10 AGI LLM 数据管理
[自动] [BLOGS_PODCASTS]
4minmic 利用 Hugging Face 与 SageMaker 扩展企业级 LLM 微调
02-10 LLM 微调 Hugging Face
[自动] [BLOGS_PODCASTS]
2minmic 利用 Amazon Nova Sonic 构建实时语音助手及架构选型指南
02-10 Amazon Nova 语音助手 实时语音
[自动] [ARXIV]
4minschool ARO:面向大模型矩阵优化的新视角
02-10 矩阵优化 ARO 大模型
[自动] [ARXIV]
2minschool ArcFlow:高精度非线性流蒸馏实现两步文生图生成
02-10 ArcFlow 文生图 流蒸馏
[自动] [BLOGS_PODCASTS]
2minmic OpenAI在ChatGPT测试广告以支持免费访问
02-10 OpenAI ChatGPT 商业化
[自动] [HACKER_NEWS]
4minnewspaper Frontier AI agents violate ethical constraints 30–50% o
02-10 AI Agent 对齐 伦理
[自动] [BLOGS_PODCASTS]
3minmic Bringing ChatGPT to GenAI.mil
02-10 OpenAI ChatGPT 政府
[自动] [HACKER_NEWS]
4minnewspaper Qwen-Image-2.0:生成专业信息图表与逼真照片
02-10 Qwen 通义千问 文生图
[自动] [BLOGS_PODCASTS]
1minmic The Scientist and the Simulator
02-10 LLM 生物医药 科学研究
[自动] [BLOGS_PODCASTS]
2minmic OpenAI在ChatGPT测试广告以支持免费访问
02-10 OpenAI ChatGPT 商业化
[自动] [BLOGS_PODCASTS]
3minmic Goodfire AI:打造可落地机械可解释性与企业级部署工作流
02-10 Goodfire AI 机械可解释性 Mechanistic Interpretability
[自动] [ARXIV]
3minschool GEBench: Benchmarking Image Generation Models as GUI En
02-10 GEBench GUI生成 图像生成
[自动] [HACKER_NEWS]
3minnewspaper Frontier AI agents violate ethical constraints 30–50% o
02-10 AI Agents 伦理约束 对齐
[自动] [BLOGS_PODCASTS]
2minmic [AINews] OpenAI and Anthropic go to war: Claude Opus 4
02-10 OpenAI Anthropic Claude
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型而LLM仅基于词模型预测
02-10 世界模型 词模型 智能体
[自动] [BLOGS_PODCASTS]
2minmic OpenAI在GenAI.mil部署定制版ChatGPT以服务美国防务团队
02-10 OpenAI ChatGPT GenAI.mil
[自动] [HACKER_NEWS]
4minnewspaper Qwen-Image-2.0:生成专业信息图与逼真照片
02-10 Qwen Qwen-Image-2.0 文生图
[自动] [BLOGS_PODCASTS]
3minmic Goodfire AI:打造可落地机制可解释性与生产工作流
02-10 Goodfire AI 机制可解释性 模型解释
[自动] [HACKER_NEWS]
2minnewspaper Qwen-Image-2.0: Professional infographics, exquisite ph
02-10 Qwen Qwen-Image-2.0 文生图
[自动] [HACKER_NEWS]
2minnewspaper Mistral Voxtral Mini 4B:浏览器端 Rust 实时语音运行
02-10 Mistral Voxtral Rust
[自动] [HACKER_NEWS]
2minnewspaper Qwen-Image-2.0:专业信息图表与逼真照片生成
02-10 Qwen Qwen-Image-2.0 文生图
[自动] [HACKER_NEWS]
4minnewspaper LLM 作为语言编译器:Fortran 对编程未来的启示
02-10 LLM 编译器 Fortran
[自动] [HACKER_NEWS]
4minnewspaper AI智能体发展预测:未来八个月的技术演进与挑战
02-10 AI智能体 LLM 技术预测
[自动] [HACKER_NEWS]
5minnewspaper 异步智能体成风潮但定义模糊
02-10 智能体 异步 LLM
[自动] [ARXIV]
3minschool 大模型涌现性错位易修复,窄错位难修正
02-10 LLM 对齐 微调
[自动] [HACKER_NEWS]
4minnewspaper 人人都在构建异步智能体 但鲜有人能定义其概念
02-10 智能体 异步 LLM
[自动] [BLOGS_PODCASTS]
1minmic 专家依赖世界模型推断隐藏状态,大语言模型需突破词模型局限
02-10 世界模型 词模型 隐藏状态
[自动] [BLOGS_PODCASTS]
2minmic OpenAI在GenAI.mil部署定制ChatGPT服务美国国防团队
02-10 OpenAI ChatGPT GenAI.mil
[自动] [HACKER_NEWS]
5minnewspaper Mistral Voxtral Mini 4B 浏览器端实时语音 Rust 实现
02-10 Mistral Voxtral Rust
[自动] [ARXIV]
5minschool LQA:面向边缘端视觉语言模型的轻量级量化自适应框架
02-10 VLM 边缘计算 模型量化
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-10 GPT-5 云自动化 无细胞蛋白合成
[自动] [BLOGS_PODCASTS]
3minmic Goodfire AI:打造首个机制可解释性实验室与企业级API
02-10 Goodfire AI 机制可解释性 Mechanistic Interpretability
[自动] [BLOGS_PODCASTS]
3minmic OpenAI对决Anthropic:Claude Opus 4.6与GPT 5.3 Codex编码能力实测
02-10 OpenAI Anthropic Claude Opus
[自动] [ARXIV]
4minschool 语言模型对激活引导攻击的内生抗性研究
02-09 激活引导 内生抗性 ESR
[自动] [ARXIV]
3minschool 智能体不确定性研究揭示过度自信问题
02-09 AI Agents 不确定性 过度自信
[自动] [ARXIV]
4minschool 学习大模型神经元激活的生成式元模型
02-09 神经元激活 生成式模型 元模型
[自动] [ARXIV]
3minschool 土耳其语子词策略大规模评估:数据、词表与形态交互
02-09 Subword Tokenization 土耳其语
[自动] [HACKER_NEWS]
4minnewspaper 人人都在构建异步智能体 但鲜有人能定义其概念
02-09 智能体 Agent 异步
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型决策,大语言模型需超越词模型
02-09 世界模型 词模型 专家系统
[自动] [BLOGS_PODCASTS]
3minmic OpenAI对决Anthropic:Claude Opus 4.6与GPT 5.3 Codex深度对比
02-09 OpenAI Anthropic Claude
[自动] [BLOGS_PODCASTS]
2minmic OpenAI在ChatGPT测试广告以支持免费使用
02-09 OpenAI ChatGPT 商业化
[自动] [ARXIV]
4minschool InftyThink+: 基于强化学习的高效无限视野推理框架
02-09 强化学习 推理框架 思维链
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-09 GPT-5 OpenAI 云自动化
[自动] [ARXIV]
4minschool DreamDojo:基于大规模人类视频的通用机器人世界模型
02-09 机器人 世界模型 DreamDojo
[自动] [ARXIV]
4minschool DAWN:面向扩散大模型的依赖感知快速推理
02-09 扩散模型 DAWN 并行解码
[自动] [BLOGS_PODCASTS]
3minmic OpenAI在GenAI.mil部署定制版ChatGPT服务美国国防团队
02-09 OpenAI ChatGPT GenAI.mil
[自动] [BLOGS_PODCASTS]
2minmic OpenAI在ChatGPT测试广告以支持免费访问
02-09 OpenAI ChatGPT 商业化
[自动] [BLOGS_PODCASTS]
2minmic Goodfire AI 打造可落地机械可解释性工作流
02-09 Goodfire AI 机械可解释性 模型解释
[自动] [BLOGS_PODCASTS]
3minmic 专家具备世界模型而LLM仅拥有词模型
02-09 LLM 世界模型 词模型
[自动] [HACKER_NEWS]
4minnewspaper OpenAI在ChatGPT中测试广告功能
02-09 OpenAI ChatGPT 商业化
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 对决 Anthropic:Claude Opus 4.6 挑战 GPT-5.3 Codex
02-09 OpenAI Anthropic Claude
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合自动化实验室将无细胞蛋白合成成本降低40%
02-09 GPT-5 生物技术 自动化实验室
[自动] [BLOGS_PODCASTS]
2minmic Goodfire AI:打造首个机械可解释性前沿实验室
02-09 Goodfire AI 可解释性 AI 机械可解释性
[自动] [BLOGS_PODCASTS]
2minmic 专家依赖世界模型决策,LLM需超越词模型以实现推理
02-09 世界模型 推理 智能体
[自动] [BLOGS_PODCASTS]
3minmic Goodfire AI 打造可落地机制可解释性标杆与生产工作流
02-09 Goodfire AI 机械可解释性 模型解释
[自动] [HACKER_NEWS]
3minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-09 世界模型 词模型 LLM
[自动] [BLOGS_PODCASTS]
3minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-09 GPT-5 云自动化 生物制造
[自动] [BLOGS_PODCASTS]
3minmic Goodfire AI 打造机械可解释性标杆并发布 API
02-09 Goodfire AI 可解释性 Mechanistic Interpretability
[自动] [BLOGS_PODCASTS]
2minmic ElevenLabs获5亿美元融资,Cerebras估值达230亿美元
02-09 ElevenLabs Cerebras 融资
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-09 世界模型 词模型 LLM
[自动] [GITHUB_TRENDING]
8minhub ChatGPT 中文调教指南:多场景提示词库
02-09 ChatGPT 提示词 Prompt
[自动] [HACKER_NEWS]
3minnewspaper 停止生成开始思考:大模型推理范式转变
02-09 推理范式 思维链 CoT
[自动] [HACKER_NEWS]
3minnewspaper 停止生成,开始思考:大模型推理能力进化路径
02-09 LLM 推理能力 思维链
[自动] [ARXIV]
4minschool 面向运行时智能体记忆的查询感知预算分层路由
02-09 LLM Agent Memory
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直观物理
02-09 VLM 直觉物理 强化学习
[自动] [ARXIV]
4minschool 好奇心即知识:基于主动推理的自一致学习与无遗憾优化
02-09 主动推理 好奇心 自一致学习
[自动] [ARXIV]
5minschool 共享LoRA子空间实现近乎严格的持续学习
02-09 持续学习 LoRA 灾难性遗忘
[自动] [ARXIV]
4minschool 伪可逆神经网络:通过伪逆变换提升模型可逆性与表达能力
02-09 神经网络 可逆性 SPNN
[自动] [ARXIV]
5minschool PhysicsAgentABM:物理引导的生成式主体建模框架
02-09 PhysicsAgentABM Agent 多智能体
[自动] [ARXIV]
3minschool DyTopo:基于语义匹配的多智能体动态拓扑路由
02-09 DyTopo Multi-Agent 动态拓扑
[自动] [ARXIV]
4minschool DFlash:基于块扩散的闪存推测解码方法
02-09 LLM 推理加速 推测解码
[自动] [ARXIV]
4minschool CommCP:基于共形预测的LLM通信提升多智能体协调效率
02-09 LLM 多智能体 共形预测
[自动] [ARXIV]
5minschool AP-OOD:基于注意力池化的分布外检测方法
02-09 OOD检测 注意力机制 NLP
[自动] [ARXIV]
3minschool 面向运行时智能体记忆的查询感知预算层路由
02-08 Agent LLM 智能体
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直觉物理
02-08 VLM 直觉物理 多模态
[自动] [ARXIV]
4minschool 好奇心即知识:基于主动推理的自一致学习与无悔优化
02-08 主动推理 好奇心 探索与利用
[自动] [ARXIV]
5minschool 共享LoRA子空间实现近乎严格的持续学习
02-08 LoRA 持续学习 灾难性遗忘
[自动] [ARXIV]
4minschool 伪可逆神经网络:基于伪逆变换的高效架构设计
02-08 神经网络 伪逆 SPNN
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型,大语言模型仅有词模型
02-08 LLM 世界模型 词模型
[自动] [ARXIV]
4minschool PhysicsAgentABM:物理引导的生成式智能体建模
02-08 PhysicsAgentABM 智能体 多主体系统
[自动] [BLOGS_PODCASTS]
4minmic OpenAI 对决 Anthropic:Claude Opus 4.6 与 GPT 5.3 Codex 深度评
02-08 OpenAI Anthropic Claude
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-08 GPT-5 OpenAI 生物科技
[自动] [BLOGS_PODCASTS]
3minmic Goodfire AI打造机制可解释性标杆:将模型内部洞察转化为生产级工作流
02-08 Goodfire AI 机制可解释性 模型黑盒
[自动] [BLOGS_PODCASTS]
4minmic ElevenLabs与Cerebras融资,音频模型与芯片进展
02-08 ElevenLabs Cerebras 融资
[自动] [ARXIV]
3minschool DyTopo:基于语义匹配的多智能体动态拓扑路由
02-08 多智能体 DyTopo 动态拓扑
[自动] [ARXIV]
4minschool DFlash:基于块扩散的闪存推测解码方法
02-08 LLM 推理加速 推测解码
[自动] [ARXIV]
4minschool CommCP:基于LLM通信与共形预测的多智能体高效协调
02-08 LLM Multi-Agent CommCP
[自动] [ARXIV]
4minschool AP-OOD:基于注意力池化的分布外检测方法
02-08 OOD检测 注意力机制 注意力池化
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-08 LLM 世界模型 词模型
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 与 Anthropic 的巅峰对决:Claude Opus 4.6 挑战 GPT 5.3 Cod
02-08 OpenAI Anthropic Claude Opus
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-08 GPT-5 OpenAI 云自动化
[自动] [BLOGS_PODCASTS]
2minmic Goodfire AI:打造首个机制可解释性实验室与生产级工作流
02-08 Goodfire AI 机制可解释性 Mechanistic Interpretability
[自动] [BLOGS_PODCASTS]
3minmic ElevenLabs获5亿美元融资,Cerebras估值达230亿美元
02-08 ElevenLabs Cerebras 融资
[自动] [GITHUB_TRENDING]
10minhub ChatGPT 中文调教指南:多场景提示词与使用技巧
02-08 ChatGPT 提示词 Prompt
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-08 世界模型 词模型 LLM
[自动] [HACKER_NEWS]
4minnewspaper 超越智能体编码:AI 编程助手的演进方向
02-08 AI编程 智能体 代码生成
[自动] [HACKER_NEWS]
5minnewspaper 超越自主编码:AI编程代理的演进方向
02-08 AI编程 智能体 Agentic
[自动] [HACKER_NEWS]
5minnewspaper 微调Qwen2.5-7B模型基于百部电影构建概率故事图
02-08 Qwen2.5 微调 故事图
[自动] [HACKER_NEWS]
5minnewspaper 超越智能体编码:AI 编程助手的演进方向
02-08 AI编程 智能体 LLM
[自动] [HACKER_NEWS]
4minnewspaper 基于百部电影微调的 Qwen2.5-7B 概率故事图模型
02-08 Qwen2.5 微调 故事图
[自动] [HACKER_NEWS]
4minnewspaper LLM成为新型高级编程语言
02-08 LLM 编程语言 AI 编程
[自动] [HACKER_NEWS]
5minnewspaper 大语言模型成为新型高级编程语言
02-08 LLM 编程语言 AI 编程
[自动] [GITHUB_TRENDING]
9minhub ChatGPT 中文调教指南:涵盖各类场景的使用提示词
02-08 ChatGPT 提示词 Prompt
[自动] [HACKER_NEWS]
4minnewspaper LLM成为新一代高级编程语言
02-08 LLM 编程语言 AI 辅助开发
[自动] [HACKER_NEWS]
4minnewspaper 大语言模型成为新一代高级编程语言
02-08 LLM 编程语言 AI 编程
[自动] [HACKER_NEWS]
4minnewspaper 基于人类反馈的强化学习:原理与应用
02-07 RLHF 强化学习 人类反馈
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型而LLM仅依赖词模型
02-07 世界模型 LLM 词模型
[自动] [BLOGS_PODCASTS]
4minmic OpenAI与Anthropic编码模型之争:Claude Opus 4.6对决GPT 5.3 Codex
02-07 OpenAI Anthropic Claude
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白质合成成本降低40%
02-07 GPT-5 OpenAI 生物科技
[自动] [BLOGS_PODCASTS]
2minmic Goodfire AI 打造可落地机械可解释性标杆并发布 API
02-07 Goodfire AI 机械可解释性 模型解释
[自动] [GITHUB_TRENDING]
9minhub ChatGPT中文调教指南:多场景提示词与使用技巧
02-07 ChatGPT 提示词 Prompt
[自动] [ARXIV]
5minschool 面向运行时智能体记忆的查询感知预算层路由
02-07 Agent LLM Memory
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直观物理
02-07 VLM 多模态 具身智能
[自动] [ARXIV]
3minschool 好奇心即知识:基于主动推理的自一致学习与无悔优化
02-07 主动推理 强化学习 好奇心
[自动] [HACKER_NEWS]
5minnewspaper 基于人类反馈的强化学习原理与应用
02-07 RLHF 强化学习 人类反馈
[自动] [ARXIV]
5minschool 共享 LoRA 子空间实现近乎严格的持续学习
02-07 LoRA 持续学习 灾难性遗忘
[自动] [ARXIV]
4minschool 伪可逆神经网络:通过伪可逆性提升模型可逆性
02-07 神经网络 伪可逆 SPNN
[自动] [ARXIV]
4minschool PhysicsAgentABM:物理引导的生成式智能体建模
02-07 PhysicsAgentABM 生成式ABM 多主体系统
[自动] [BLOGS_PODCASTS]
4minmic OpenAI Frontier:具备上下文与治理能力的企业级AI智能体平台
02-07 OpenAI AI智能体 企业级
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云端自动化将无细胞蛋白合成成本降低40%
02-07 GPT-5 合成生物学 自动化
[自动] [BLOGS_PODCASTS]
2minmic Goodfire AI打造机制可解释性平台并推API落地企业部署
02-07 Goodfire AI 机制可解释性 模型解释
[自动] [ARXIV]
4minschool DyTopo:基于语义匹配的多智能体动态拓扑路由
02-07 DyTopo 多智能体 动态拓扑
[自动] [ARXIV]
4minschool DFlash:基于块扩散的Flash推测解码方法
02-07 LLM 推理加速 推测解码
[自动] [ARXIV]
4minschool CommCP:基于共形预测的LLM通信提升多智能体协调效率
02-07 LLM Multi-Agent 共形预测
[自动] [ARXIV]
4minschool AP-OOD:基于注意力池化的分布外检测方法
02-07 OOD检测 NLP 注意力机制
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:基于多传感器数据生成驾驶场景
02-07 Waymo 世界模型 自动驾驶
[自动] [BLOGS_PODCASTS]
4minmic OpenAI 与 Anthropic 之争:Claude Opus 4.6 对抗 GPT 5.3 Codex
02-07 OpenAI Anthropic Claude
[自动] [HACKER_NEWS]
5minnewspaper 基于人类反馈的强化学习:原理与应用
02-07 RLHF 强化学习 人类反馈
[自动] [HACKER_NEWS]
6minnewspaper Waymo 世界模型:利用生成式世界模型提升自动驾驶决策能力
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:自动驾驶场景生成与仿真应用
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:利用生成式世界模拟提升自动驾驶决策
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
7minnewspaper 基于人类反馈的强化学习机制解析
02-07 RLHF 强化学习 人类反馈
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:自动驾驶场景生成与预测架构
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
6minnewspaper Waymo 世界模型:端到端自动驾驶的仿真与预测架构
02-07 Waymo 世界模型 端到端
[自动] [GITHUB_TRENDING]
14minhub ChatGPT 中文调教指南:多场景提示词与使用技巧
02-07 ChatGPT 提示词 Prompt
[自动] [HACKER_NEWS]
5minnewspaper 让信任变得无关紧要:玩家视角下的智能体安全
02-07 智能体 Agent安全 游戏理论
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理的可视化解析
02-07 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更难
02-07 LLM ICL 上下文学习
[自动] [BLOGS_PODCASTS]
3minmic 首个机制可解释性前沿实验室:Goodfire AI 团队专访
02-07 机制可解释性 Goodfire AI AI安全
[自动] [HACKER_NEWS]
4minnewspaper 评估与缓解大模型发现零日漏洞的新兴风险
02-07 LLM 零日漏洞 漏洞挖掘
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习的难度超出预期
02-07 上下文学习 ICL LLM
[自动] [BLOGS_PODCASTS]
3minmic OpenAI Frontier:企业级AI智能体构建与部署平台
02-07 OpenAI Frontier AI智能体
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云端自动化将无细胞蛋白合成成本降低40%
02-07 GPT-5 云端自动化 无细胞蛋白合成
[自动] [HACKER_NEWS]
5minnewspaper Claude Composer:AI 编排多智能体工作流
02-07 Claude 多智能体 工作流
[自动] [HACKER_NEWS]
4minnewspaper 评估与缓解大模型发现的零日漏洞风险
02-07 LLM 零日漏洞 漏洞挖掘
[自动] [HACKER_NEWS]
6minnewspaper 神经网络可视化:直观理解深度学习原理
02-07 神经网络 深度学习 可视化
[自动] [HACKER_NEWS]
4minnewspaper 从上下文学习的难度超出预期
02-07 上下文学习 ICL LLM
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 对决 Anthropic:Claude Opus 4.6 挑战 GPT-5.3 Codex
02-07 OpenAI Anthropic Claude
[自动] [BLOGS_PODCASTS]
2minmic Goodfire AI:首个机制可解释性前沿实验室
02-07 机制可解释性 Goodfire AI AI 安全
[自动] [BLOGS_PODCASTS]
2minmic 首个机制可解释性前沿实验室:Goodfire AI 创始人访谈
02-06 Goodfire AI 机制可解释性 Mechanistic Interpretability
[自动] [ARXIV]
3minschool 面向运行时智能体记忆的查询感知预算分层路由
02-06 Agent Memory RAG
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直觉物理
02-06 VLM 直觉物理 强化学习
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [ARXIV]
3minschool 好奇心即知识:基于主动推理的自一致学习与无遗憾优化
02-06 主动推理 探索与利用 自由能
[自动] [ARXIV]
4minschool 共享 LoRA 子空间实现近乎严格的持续学习
02-06 LoRA 持续学习 微调
[自动] [ARXIV]
4minschool 伪可逆神经网络:兼具可逆性与灵活性的新架构
02-06 神经网络 可逆性 伪逆
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更具挑战性
02-06 LLM ICL 上下文学习
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:利用生成式视频预测驾驶场景
02-06 Waymo 世界模型 生成式视频
[自动] [ARXIV]
4minschool PhysicsAgentABM:物理引导的生成式智能体建模
02-06 PhysicsAgentABM 多智能体系统 ABM
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 与 Anthropic 之争:Claude Opus 4.6 对决 GPT 5.3 Codex
02-06 OpenAI Anthropic Claude
[自动] [BLOGS_PODCASTS]
2minmic OpenAI Frontier:具备共享上下文与治理能力的企业级AI代理平台
02-06 OpenAI Frontier AI代理
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合自动化闭环实验降低无细胞蛋白合成成本40%
02-06 GPT-5 AI for Science 生物科技
[自动] [ARXIV]
3minschool DyTopo:基于语义匹配的多智能体动态拓扑路由
02-06 DyTopo 多智能体 动态拓扑
[自动] [ARXIV]
5minschool DFlash:基于块扩散的Flash推测解码方法
02-06 LLM 推理加速 推测解码
[自动] [ARXIV]
4minschool CommCP:基于LLM通信与共形预测的高效多智能体协调
02-06 LLM 多智能体 具身智能
[自动] [HACKER_NEWS]
4minnewspaper Claude Composer:AI 编排多智能体协作与任务流
02-06 Claude 多智能体 工作流编排
[自动] [HACKER_NEWS]
4minnewspaper BioTradingArena:预测生物科技股走势的LLM基准
02-06 LLM 基准测试 金融预测
[自动] [ARXIV]
5minschool AP-OOD:基于注意力池化的分布外检测方法
02-06 OOD检测 注意力机制 NLP
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 上下文学习难度超出原有认知
02-06 上下文学习 ICL 大模型
[自动] [HACKER_NEWS]
5minnewspaper Claude Composer:AI 编排多 Agent 协作完成复杂任务
02-06 Claude Multi-Agent Agent编排
[自动] [HACKER_NEWS]
4minnewspaper BioTradingArena:用于评估LLM预测生物科技股票走势的基准
02-06 LLM 基准测试 金融预测
[自动] [HACKER_NEWS]
4minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更难
02-06 LLM 上下文学习 ICL
[自动] [HACKER_NEWS]
4minnewspaper Waymo世界模型:自动驾驶仿真的新前沿
02-06 Waymo 自动驾驶 世界模型
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.3-Codex 智能体:结合前沿编码与通用推理以支持长周期技术任务
02-06 GPT-5.3-Codex 智能体 代码生成
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习的难度超出原有认知
02-06 上下文学习 ICL LLM
[自动] [HACKER_NEWS]
4minnewspaper OpenAI发布GPT-5.3-Codex代码生成模型
02-06 OpenAI GPT-5.3 Codex
[自动] [BLOGS_PODCASTS]
3minmic OpenAI与Anthropic编码模型之争:Claude Opus 4.6对决GPT 5.3 Codex
02-06 OpenAI Anthropic Claude
[自动] [BLOGS_PODCASTS]
2minmic OpenAI Frontier:具备共享上下文与治理能力的企业级AI代理平台
02-06 OpenAI Frontier 企业级
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-06 GPT-5 云自动化 蛋白合成
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.3-Codex系统卡:融合前沿代码性能与推理能力
02-06 GPT-5.3 Codex 代码模型
[自动] [BLOGS_PODCASTS]
2minmic Goodfire AI 首个机制可解释性前沿实验室访谈
02-06 Goodfire AI 机制可解释性 Mechanistic Interpretability
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
6minnewspaper Waymo世界模型:自动驾驶仿真的新前沿
02-06 Waymo 自动驾驶 世界模型
[自动] [HACKER_NEWS]
7minnewspaper Opus 4.6 智能体团队协作构建 C 语言编译器
02-06 Opus 4.6 智能体 Agent
[自动] [HACKER_NEWS]
4minnewspaper LLM不应作为编译器:技术局限与正确性风险
02-06 LLM 编译器 代码生成
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理的可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
5minnewspaper LLM 不应作为编译器:技术局限与可靠性分析
02-06 LLM 编译器 代码生成
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.3-Codex:融合推理与编码能力的代理式模型
02-06 GPT-5.3 Codex Agentic
[自动] [HACKER_NEWS]
4minnewspaper LLM 不应取代编译器:语言模型与符号编译的差异分析
02-06 LLM 编译器 符号执行
[自动] [GITHUB_TRENDING]
9minhub ChatGPT 中文调教指南:场景化提示词与指令优化
02-06 ChatGPT Prompt 提示词
[自动] [HACKER_NEWS]
6minnewspaper Anthropic 发布 Claude Opus 4.6 模型
02-06 Anthropic Claude Opus 4.6
[自动] [HACKER_NEWS]
7minnewspaper Agent Arena:评估 AI 智能体抗操纵能力的平台
02-06 Agent Arena AI Agent 抗操纵
[自动] [HACKER_NEWS]
7minnewspaper Opus 4.6 智能体团队协作构建 C 语言编译器
02-06 Opus 4.6 智能体 Agent
[自动] [HACKER_NEWS]
7minnewspaper Claude Opus 4.6 发布
02-06 Claude Opus Anthropic
[自动] [HACKER_NEWS]
8minnewspaper Opus 4.6 智能体团队协作构建 C 语言编译器
02-06 Opus 4.6 智能体 Agent
[自动] [HACKER_NEWS]
7minnewspaper Claude Opus 4.6 发布:上下文窗口与推理能力提升
02-06 Claude Opus 4.6 LLM
[自动] [HACKER_NEWS]
8minnewspaper 利用 Opus 4.6 智能体团队构建 C 语言编译器
02-06 Opus 4.6 智能体 Agent Teams
[自动] [HACKER_NEWS]
3minnewspaper 超网络:用于处理层级数据的神经网络架构
02-06 超网络 层级数据 神经网络架构
[自动] [HACKER_NEWS]
6minnewspaper 超网络:面向层级数据的神经网络架构
02-06 超网络 Hypernetworks 层级数据
[自动] [ARXIV]
4minschool 受限群组相对策略优化
02-06 GRPO 强化学习 策略优化
[自动] [ARXIV]
5minschool RRAttention:基于轮询移位的动态块稀疏注意力机制
02-06 RRAttention 稀疏注意力 长上下文
[自动] [BLOGS_PODCASTS]
2minmic OpenAI Frontier:企业级AI智能体构建与治理平台
02-06 OpenAI AI智能体 企业级
[自动] [BLOGS_PODCASTS]
2minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索性能提升
02-06 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
3minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-06 GPT-5 云自动化 蛋白合成
[自动] [BLOGS_PODCASTS]
2minmic Goodfire AI 首家机制可解释性实验室:Myra Deng 与 Mark Bissell 对谈
02-06 Goodfire AI 机制可解释性 Mechanistic Interpretability
[自动] [ARXIV]
4minschool DLM-Scope:利用稀疏自编码器解析扩散语言模型
02-06 DLM SAE 稀疏自编码器
[自动] [ARXIV]
4minschool 重新思考大模型强化学习中的信任区域机制
02-06 强化学习 LLM PPO
[自动] [ARXIV]
3minschool 蛋白质自回归建模:基于多尺度结构生成的方案
02-06 蛋白质生成 自回归模型 多尺度建模
[自动] [ARXIV]
4minschool 研究揭示推理大模型生成虚假新闻的内在机制
02-06 LLM CoT 虚假新闻
[自动] [ARXIV]
3minschool 数据中的阈下效应:基于对数线性性的通用机制
02-06 LLM 数据质量 Logit-Linear-Selection
[自动] [HACKER_NEWS]
3minnewspaper 心理越狱揭示前沿模型内部冲突
02-06 越狱 心理测量 前沿模型
[自动] [ARXIV]
4minschool 强化注意力学习:通过奖励机制优化视觉注意力模型
02-06 强化学习 多模态 注意力机制
[自动] [ARXIV]
4minschool 多层交叉注意力机制在多模态上下文学习中具有可证明的最优性
02-06 多模态 上下文学习 ICL
[自动] [ARXIV]
5minschool Multi-Head LatentMoE 与 Head 并行:通信高效的确定性 MoE 并行策略
02-06 MoE 分布式训练 通信优化
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.3-Codex:结合前沿编码与推理能力的具身智能体编程模型
02-06 GPT-5.3 Codex 具身智能
[自动] [ARXIV]
4minschool CRoSS:面向可扩展强化学习的持续机器人仿真套件
02-06 强化学习 机器人仿真 Gazebo
[自动] [BLOGS_PODCASTS]
2minmic 首个机制可解释性前沿实验室:Goodfire AI 团队专访
02-05 机制可解释性 Goodfire AI Myra Deng
[自动] [ARXIV]
5minschool 重新思考大模型强化学习中的信任区域
02-05 RLHF PPO 强化学习
[自动] [ARXIV]
3minschool 蛋白质多尺度结构生成的自回归建模方法
02-05 蛋白质生成 自回归模型 多尺度建模
[自动] [ARXIV]
3minschool 数据中的阈下效应:一种基于对数线性性的通用机制
02-05 LLM 数据质量 Logit-Linear-Selection
[自动] [HACKER_NEWS]
3minnewspaper 心理越狱揭示前沿模型的内部冲突
02-05 越狱 心理测量 前沿模型
[自动] [ARXIV]
4minschool 强化注意力学习:基于奖励反馈的注意力机制优化方法
02-05 强化学习 注意力机制 多模态
[自动] [ARXIV]
3minschool 多层交叉注意力被证明是多模态上下文学习的最优解
02-05 多模态 上下文学习 ICL
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用
02-05 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]
3minmic OpenAI Frontier:具备上下文与治理机制的企业级AI代理平台
02-05 OpenAI AI代理 企业级
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 Nemotron ColEmbed ViDoRe
[自动] [ARXIV]
5minschool Multi-Head LatentMoE与Head并行:通信高效且确定性的MoE方案
02-05 MoE 分布式训练 通信优化
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-05 GPT-5 OpenAI 云自动化
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.3-Codex:融合推理与编码能力的智能体模型
02-05 GPT-5.3 Codex 智能体
[自动] [ARXIV]
5minschool CRoSS:面向可扩展强化学习的持续机器人仿真套件
02-05 强化学习 持续学习 机器人仿真
[自动] [ARXIV]
3minschool CoT非真理链:推理LLM生成假新闻的实证内部分析
02-05 LLM CoT 假新闻
[自动] [HACKER_NEWS]
8minnewspaper Claude Opus 4.6 发布
02-05 Claude Opus 模型发布
[自动] [GITHUB_TRENDING]
9minhub ChatGPT中文调教指南:多场景提示词与使用技巧
02-05 ChatGPT 提示词工程 Prompt
[自动] [ARXIV]
3minschool 面向物联网模型适应性的对比持续学习
02-05 持续学习 对比学习 物联网
[自动] [HACKER_NEWS]
4minnewspaper 超网络:面向层级数据的神经网络架构
02-05 超网络 层级数据 神经网络架构
[自动] [HACKER_NEWS]
3minnewspaper 心理越狱揭示前沿模型内部冲突
02-05 越狱 心理攻击 模型对齐
[自动] [HACKER_NEWS]
5minnewspaper 利用 Claude Opus 4.6 推进金融业务发展
02-05 Claude Opus 金融科技 LLM
[自动] [HACKER_NEWS]
5minnewspaper Opus 4.6 智能体团队成功构建 C 语言编译器
02-05 Opus 4.6 智能体 Agent
[自动] [BLOGS_PODCASTS]
4minmic OpenAI Frontier:具备共享上下文与治理功能的企业级AI代理平台
02-05 OpenAI Frontier 企业级
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.3-Codex:融合推理与编程的智能体模型
02-05 GPT-5.3 Codex 智能体
[自动] [HACKER_NEWS]
3minnewspaper 心理越狱揭示前沿模型内部冲突
02-05 越狱 心理测量 前沿模型
[自动] [BLOGS_PODCASTS]
2minmic OpenAI Frontier:具备共享上下文与治理功能的企业级AI智能体平台
02-05 OpenAI AI智能体 企业级
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 多模态 检索 Nemotron
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合云自动化将无细胞蛋白合成成本降低40%
02-05 GPT-5 生物制造 云自动化
[自动] [HACKER_NEWS]
3minnewspaper 心理越狱揭示前沿模型内部冲突
02-05 越狱 心理测量 前沿模型
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.3-Codex:结合前沿编码性能与推理能力的代理式模型
02-05 GPT-5.3 Codex Agent
[自动] [HACKER_NEWS]
5minnewspaper Anthropic Claude Opus 4.6 挖掘开源代码500个零日漏洞
02-05 Anthropic Claude Opus 零日漏洞
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
2minmic Context Graphs与Agent Traces:技术解析与应用前景
02-05 Context Graphs Agent Traces Agent
[自动] [HACKER_NEWS]
5minnewspaper Claude 推出代码智能体团队协作模式
02-05 Claude 代码智能体 团队协作
[自动] [BLOGS_PODCASTS]
3minmic OpenAI Frontier:具备上下文与治理功能的企业级AI代理平台
02-05 OpenAI Frontier AI代理
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
3minmic ElevenLabs融资5亿美元,Cerebras估值达230亿
02-05 ElevenLabs Cerebras 融资
[自动] [HACKER_NEWS]
7minnewspaper Claude Opus 4.6 发布:性能与上下文窗口提升
02-05 Claude Opus 4.6 LLM
[自动] [BLOGS_PODCASTS]
2minmic 社区评估:以社区共识取代黑盒排行榜
02-05 社区评估 排行榜 黑盒
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-05 DeepSeek AI生态 开源模型
[自动] [BLOGS_PODCASTS]
2minmic OpenAI Frontier:企业级AI智能体构建与治理平台
02-05 OpenAI AI Agents 企业级
[自动] [BLOGS_PODCASTS]
4minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
2minmic Context Graphs与Agent Traces:解析AI系统的上下文与追踪技术
02-05 Context Graphs Agent Traces LLM
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-05 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-05 DeepSeek AI生态 开源模型
[自动] [HACKER_NEWS]
4minnewspaper OpenAI前沿技术进展与模型能力解析
02-05 OpenAI 模型能力 前沿技术
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索性能优化
02-05 Nemotron ColEmbed ViDoRe
[自动] [HACKER_NEWS]
5minnewspaper AI 正在重塑 B2B SaaS 商业模式
02-05 B2B SaaS 商业模式
[自动] [HACKER_NEWS]
4minnewspaper AI 正在重塑 B2B SaaS 商业模式
02-05 B2B SaaS 商业模式 AI重塑
[自动] [BLOGS_PODCASTS]
3minmic Context Graphs与Agent Traces技术解析
02-05 Context Graphs Agent Traces Agent
[自动] [GITHUB_TRENDING]
13minhub ChatGPT中文调教指南:多场景提示词与使用教程
02-05 ChatGPT 提示词 Prompt
[自动] [HACKER_NEWS]
6minnewspaper AI 正在重塑 B2B SaaS 商业模式
02-05 B2B SaaS 商业模式 AI重塑
[自动] [HACKER_NEWS]
4minnewspaper AI 正在重塑 B2B SaaS 商业模式
02-05 B2B SaaS 商业模式
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-05 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-05 DeepSeek 开源AI AI生态
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
2minmic Context Graphs 与 Agent Traces:解析 AI 智能体的记忆与回溯机制
02-05 AI Agent Context Graphs Agent Traces
[自动] [HACKER_NEWS]
5minnewspaper AI重塑B2B SaaS:通用模型挤压垂直软件价值空间
02-05 B2B SaaS 垂直软件 通用模型
[自动] [HACKER_NEWS]
6minnewspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制
02-05 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
4minnewspaper AI 正在重塑 B2B SaaS 行业
02-05 B2B SaaS 行业重塑 商业模式
[自动] [HACKER_NEWS]
6minnewspaper 对称感知泰勒近似实现恒定Token成本注意力机制
02-05 注意力机制 Transformer 泰勒近似
[自动] [ARXIV]
4minschool 加速科学研究:Gemini 案例研究与通用技术
02-05 Gemini 科学研究 数学发现
[自动] [ARXIV]
5minschool PrevizWhiz:结合粗略3D场景与2D视频引导生成式预演
02-05 AIGC 视频生成 3D场景
[自动] [ARXIV]
5minschool PLATE:用于几何感知持续学习的可塑性调谐高效适配器
02-05 持续学习 PLATE 模型适配
[自动] [ARXIV]
3minschool Parallel-Probe:通过二维探测实现高效并行思维
02-05 并行推理 思维链 2D Probing
[自动] [HACKER_NEWS]
4minnewspaper Claude:打造用于深度思考的AI交互空间
02-05 Claude AI交互 深度思考
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-05 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态演进:从DeepSeek到AI+
02-05 DeepSeek AI生态 开源模型
[自动] [BLOGS_PODCASTS]
3minmic Snowflake与OpenAI达成2亿美元协议,将前沿AI引入企业数据
02-05 Snowflake OpenAI 企业级
[自动] [BLOGS_PODCASTS]
2minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-05 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-04 文本生成图像 模型训练 消融实验
[自动] [ARXIV]
3minschool 基于急停干预的鲁棒干预学习
02-04 强化学习 RL 自动驾驶
[自动] [HACKER_NEWS]
6minnewspaper 基于对称性泰勒近似实现恒定Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [ARXIV]
4minschool 利用 Gemini 加速科学研究:案例研究与通用技术
02-04 Gemini 科学研究 数学证明
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-04 DeepSeek AI生态 开源模型
[自动] [BLOGS_PODCASTS]
3minmic Snowflake与OpenAI合作:在数据平台内直接部署AI智能体
02-04 Snowflake OpenAI AI智能体
[自动] [ARXIV]
5minschool PrevizWhiz:结合粗略3D场景与2D视频引导生成视频预演
02-04 视频生成 3D视觉 PrevizWhiz
[自动] [ARXIV]
4minschool PLATE:面向几何感知持续学习的可塑性调谐高效适配器
02-04 持续学习 PLATE 高效适配器
[自动] [ARXIV]
4minschool Parallel-Probe:通过2D探测实现高效并行思维
02-04 LLM 并行推理 思维链
[自动] [BLOGS_PODCASTS]
3minmic Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型
02-04 Nemotron ColEmbed ViDoRe
[自动] [BLOGS_PODCASTS]
3minmic Context Graphs与Agent Traces技术解析
02-04 Context Graphs Agent Traces LLM
[自动] [GITHUB_TRENDING]
9minhub ChatGPT中文调教指南:多场景使用提示词合集
02-04 ChatGPT 提示词 Prompt
[自动] [HACKER_NEWS]
5minnewspaper AI 正在重塑 B2B SaaS 商业模式
02-04 B2B SaaS 商业模式
[自动] [HACKER_NEWS]
6minnewspaper 基于对称性泰勒近似实现恒定Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
5minnewspaper Claude Is a Space to Think
02-04 Claude AI产品 思维工具
[自动] [HACKER_NEWS]
6minnewspaper AI 正在重塑 B2B SaaS 行业
02-04 B2B SaaS 行业变革
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-04 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-04 DeepSeek AI生态 开源模型
[自动] [BLOGS_PODCASTS]
4minmic Snowflake与OpenAI达成2亿美元协议引入企业级AI智能体
02-04 OpenAI Snowflake AI Agents
[自动] [HACKER_NEWS]
3minnewspaper Claude:打造用于深度思考的交互空间
02-04 Claude AI交互 深度思考
[自动] [HACKER_NEWS]
5minnewspaper AI 正在重塑 B2B SaaS 商业模式
02-04 B2B SaaS 商业模式
[自动] [HACKER_NEWS]
5minnewspaper 基于对称性泰勒近似实现恒定每Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
5minnewspaper Claude:一个用于深度思考的交互空间
02-04 Claude LLM AI交互
[自动] [HACKER_NEWS]
7minnewspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [BLOGS_PODCASTS]
3minmic Context Graphs与Agent Traces技术解析
02-04 Context Graphs Agent Traces LLM
[自动] [HACKER_NEWS]
7minnewspaper 基于对称泰勒近似实现恒定Token成本注意力机制
02-04 Attention机制 Taylor近似 线性注意力
[自动] [HACKER_NEWS]
5minnewspaper 对称感知泰勒近似实现恒定Token成本注意力机制
02-04 Attention机制 Taylor近似 Token成本
[自动] [HACKER_NEWS]
5minnewspaper Agent Skills:大模型智能体技能框架
02-04 Agent LLM 智能体
[自动] [BLOGS_PODCASTS]
2minmic 文生图模型训练设计:消融实验的经验总结
02-04 文生图 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-04 DeepSeek AI生态 开源AI
[自动] [BLOGS_PODCASTS]
4minmic Snowflake与OpenAI合作:2亿美元协议引入企业级AI智能体
02-04 Snowflake OpenAI AI智能体
[自动] [HACKER_NEWS]
5minnewspaper Agent Skills:AI 智能体技能评估框架
02-04 Agent 智能体 评估框架
[自动] [BLOGS_PODCASTS]
3minmic 2026年AI展望:大模型、智能体与算力趋势
02-04 LLM 智能体 Scaling Laws
[自动] [HACKER_NEWS]
7minnewspaper Agent Skills:智能体技能框架与能力评估
02-04 Agent 智能体 技能框架
[自动] [BLOGS_PODCASTS]
3minmic Context Graphs与Agent Traces技术解析
02-04 Context Graphs Agent Traces Agent
[自动] [BLOGS_PODCASTS]
2minmic 文生图模型训练设计:消融实验的经验总结
02-04 文生图 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-04 DeepSeek 开源AI 行业展望
[自动] [BLOGS_PODCASTS]
3minmic Snowflake与OpenAI合作:在企业数据中直接部署AI智能体
02-04 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]
3minmic 2026年AI展望:LLM、智能体、算力与中国角色
02-04 LLM 智能体 AI 编程
[自动] [HACKER_NEWS]
5minnewspaper Agent Skills:AI 智能体技能框架与训练方法
02-04 Agent 智能体 技能框架
[自动] [HACKER_NEWS]
4minnewspaper Qwen3-Coder-Next:下一代代码模型架构与性能升级
02-04 Qwen 代码模型 架构升级
[自动] [HACKER_NEWS]
7minnewspaper FlashAttention-T:张量化注意力机制优化方案
02-04 FlashAttention 注意力机制 张量化
[自动] [HACKER_NEWS]
4minnewspaper Qwen3-Coder-Next:下一代代码模型架构与性能解析
02-04 Qwen3 代码模型 LLM
[自动] [HACKER_NEWS]
8minnewspaper FlashAttention-T:张量化注意力机制优化方案
02-04 FlashAttention 注意力机制 张量化
[自动] [ARXIV]
4minschool 面向冲突目标的免奖励对齐方法
02-04 RACO 对齐 多目标优化
[自动] [ARXIV]
4minschool 通过文本反馈扩展强化学习的能力边界
02-04 强化学习 RLHF 文本反馈
[自动] [ARXIV]
3minschool 训练LLM采用分治推理提升测试时扩展性
02-04 LLM 推理 强化学习
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-04 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-04 DeepSeek 开源AI AI生态
[自动] [BLOGS_PODCASTS]
3minmic xAI 推出 Grok Imagine API:顶级视频模型与低延迟定价
02-04 xAI Grok Imagine API
[自动] [BLOGS_PODCASTS]
4minmic Snowflake与OpenAI合作:在数据平台内集成前沿AI模型
02-04 Snowflake OpenAI 企业级AI
[自动] [ARXIV]
4minschool RLAnything:构建完全动态强化学习系统环境与模型
02-04 RLAnything 强化学习 LLM
[自动] [ARXIV]
4minschool RE-TRAC:面向深度搜索智能体的递归轨迹压缩算法
02-04 Re-TRAC 深度搜索智能体 ReAct
[自动] [ARXIV]
5minschool PixelGen:像素扩散结合感知损失超越潜在扩散
02-04 PixelGen 扩散模型 计算机视觉
[自动] [BLOGS_PODCASTS]
3minmic Moltbook:首个面向AI代理的社交网络平台
02-04 AI Agents Moltbook 社交网络
[自动] [ARXIV]
4minschool MemSkill:面向自进化代理的记忆技能学习与演化框架
02-04 MemSkill 智能体 Agent
[自动] [ARXIV]
3minschool MEG-XL:长上下文预训练实现数据高效的脑电转文本
02-04 MEG-XL 脑机接口 脑电转文本
[自动] [ARXIV]
5minschool AgentRx:基于执行轨迹的AI智能体故障诊断
02-04 AgentRx AI Agent 故障诊断
[自动] [BLOGS_PODCASTS]
3minmic 2026年AI趋势展望:LLM、智能体、算力与AGI发展路径
02-04 LLM 智能体 AGI
[自动] [HACKER_NEWS]
4minnewspaper Qwen3-Coder-Next:阿里下一代代码模型
02-04 Qwen 阿里 代码模型
[自动] [HACKER_NEWS]
6minnewspaper FlashAttention-T:张量化注意力机制优化方案
02-04 FlashAttention 注意力机制 张量化
[自动] [ARXIV]
3minschool 训练LLM采用分治推理提升测试时扩展性
02-03 LLM 推理 强化学习
[自动] [ARXIV]
4minschool 无奖励对齐技术处理多目标冲突
02-03 RACO 对齐技术 多目标优化
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-03 文本生成图像 模型训练 消融实验
[自动] [ARXIV]
4minschool 基于流策略梯度的机器人控制方法
02-03 机器人控制 流匹配 策略梯度
[自动] [ARXIV]
4minschool 基于文本反馈扩展强化学习的能力
02-03 强化学习 RLHF 文本反馈
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-03 DeepSeek AI生态 开源模型
[自动] [BLOGS_PODCASTS]
4minmic xAI 推出 Grok Imagine API:顶级视频模型与性价比优势
02-03 xAI Grok Imagine API
[自动] [BLOGS_PODCASTS]
2minmic Snowflake与OpenAI达成2亿美元协议,在数据平台内集成AI智能体
02-03 Snowflake OpenAI AI智能体
[自动] [ARXIV]
4minschool RLAnything:完全动态强化学习系统构建环境、策略与奖励模型
02-03 强化学习 RL LLM
[自动] [ARXIV]
4minschool RE-TRAC:面向深度搜索智能体的递归轨迹压缩方法
02-03 Re-TRAC 深度搜索 智能体
[自动] [HACKER_NEWS]
7minnewspaper Qwen3-Coder-Next:阿里新一代代码模型
02-03 Qwen 阿里 代码模型
[自动] [ARXIV]
4minschool PixelGen:引入感知损失的像素扩散模型性能超越潜在扩散
02-03 PixelGen 扩散模型 计算机视觉
[自动] [BLOGS_PODCASTS]
3minmic Moltbook:首个面向 AI 智能体的社交网络平台
02-03 AI Agent 社交网络 Moltbook
[自动] [ARXIV]
4minschool MemSkill:赋予自进化代理学习与演进记忆技能
02-03 MemSkill 智能体 记忆机制
[自动] [ARXIV]
4minschool MEG-XL:基于长上下文预训练的高效脑电转文本模型
02-03 MEG-XL 脑机接口 BCI
[自动] [HACKER_NEWS]
6minnewspaper FlashAttention-T:张量化注意力机制优化方案
02-03 FlashAttention 注意力机制 张量化
[自动] [ARXIV]
5minschool AgentRx:基于执行轨迹的AI智能体故障诊断
02-03 AgentRx AI Agent 故障诊断
[自动] [HACKER_NEWS]
6minnewspaper Agent Skills:智能体技能框架与开发指南
02-03 Agent 智能体 Agent Skills
[自动] [BLOGS_PODCASTS]
3minmic 2026年AI展望:大模型、智能体、算力与Scaling Laws
02-03 AI 展望 Scaling Laws AI Agent
[自动] [HACKER_NEWS]
5minnewspaper Qwen3-Coder-Next:阿里通义千问下一代代码模型
02-03 Qwen 通义千问 代码模型
[自动] [HACKER_NEWS]
5minnewspaper Agent Skills:AI 智能体的技能框架
02-03 Agent 智能体 技能框架
[自动] [HACKER_NEWS]
6minnewspaper Agent Skills:智能体技能框架
02-03 Agent 智能体 Agent Skills
[自动] [HACKER_NEWS]
4minnewspaper 构建AI版Wattpad以评估大模型小说创作能力
02-03 LLM 小说创作 模型评估
[自动] [BLOGS_PODCASTS]
3minmic xAI 推出 Grok Imagine API:对标 SOTA 视频模型,优化定价与延迟
02-03 xAI Grok Imagine API
[自动] [BLOGS_PODCASTS]
3minmic Snowflake与OpenAI合作:在企业数据中直接实现AI智能体与洞察
02-03 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Cosmos策略:提升机器人控制能力
02-03 NVIDIA Cosmos 机器人
[自动] [BLOGS_PODCASTS]
4minmic Moltbook:首个面向 AI 智能体的社交网络平台
02-03 AI Agents Moltbook 社交网络
[自动] [HACKER_NEWS]
7minnewspaper Agent Skills:AI 智能体技能框架
02-03 Agent 智能体 Agent Skills
[自动] [BLOGS_PODCASTS]
3minmic 2026年AI展望:LLM、智能体、扩展定律与中国角色
02-03 LLM Scaling Laws 智能体
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-03 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 全球开源AI生态展望:从DeepSeek到AI+
02-03 DeepSeek AI生态 开源模型
[自动] [BLOGS_PODCASTS]
3minmic xAI 巩固前沿地位并计划与 SpaceX 合并
02-03 xAI Grok SpaceX
[自动] [BLOGS_PODCASTS]
2minmic Snowflake与OpenAI合作:2亿美元协议将AI智能体引入企业数据
02-03 Snowflake OpenAI AI智能体
[自动] [BLOGS_PODCASTS]
4minmic OpenAI内部数据代理:结合GPT-5与记忆机制快速分析海量数据
02-03 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Cosmos策略发布:提升机器人控制精度
02-03 NVIDIA Cosmos 机器人
[自动] [BLOGS_PODCASTS]
2minmic Moltbook:首个面向 AI 智能体的社交网络平台
02-03 AI Agent Moltbook 模拟 AI
[自动] [BLOGS_PODCASTS]
3minmic 2026年AI展望:LLM、智能体、缩放定律与中国发展
02-03 LLM 智能体 缩放定律
[自动] [HACKER_NEWS]
3minnewspaper 模型对齐偏差如何随智能水平与任务复杂度演变
02-03 模型对齐 智能水平 任务复杂度
[自动] [HACKER_NEWS]
6minnewspaper Agent Skills:大模型智能体的技能评估框架
02-03 Agent LLM 评估框架
[自动] [HACKER_NEWS]
4minnewspaper 模型智能与任务复杂度如何影响对齐偏差
02-03 对齐 模型智能 任务复杂度
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-03 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
4minmic xAI 发布 Grok Imagine API:对标 SOTA 视频模型与 SpaceX 合并前瞻
02-03 xAI Grok 视频生成
[自动] [BLOGS_PODCASTS]
3minmic Snowflake与OpenAI达成2亿美元协议引入前沿智能
02-03 Snowflake OpenAI 企业数据
[自动] [HACKER_NEWS]
5minnewspaper Show HN: 反向智能体模型:应用为客户端、对话为服务器与反思机制
02-03 智能体 Agent 架构设计
[自动] [BLOGS_PODCASTS]
2minmic Sam Altman全员会反思:AI孵化器与公司战略
02-03 Sam Altman OpenAI 战略
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Cosmos 策略模型提升机器人高级控制能力
02-03 NVIDIA Cosmos 机器人
[自动] [BLOGS_PODCASTS]
3minmic 2026年AI展望:LLM、智能体、缩放定律与中国发展
02-03 LLM 智能体 缩放定律
[自动] [HACKER_NEWS]
4minnewspaper 模型对齐问题如何随智能水平与任务复杂度演变
02-03 模型对齐 智能水平 任务复杂度
[自动] [BLOGS_PODCASTS]
3minmic xAI Grok Imagine API 登顶视频模型榜:定价与延迟优势显著
02-03 xAI Grok 视频生成
[自动] [BLOGS_PODCASTS]
2minmic Snowflake与OpenAI达成2亿美元合作,将前沿智能引入企业数据
02-03 OpenAI Snowflake 企业级AI
[自动] [BLOGS_PODCASTS]
3minmic Sam Altman内部会反思与AI孵化器动态
02-03 Sam Altman OpenAI AGI
[自动] [BLOGS_PODCASTS]
2minmic OpenAI将于2026年2月退役ChatGPT内GPT‑4o等四款模型
02-03 OpenAI ChatGPT 模型退役
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Cosmos 策略模型提升机器人控制精度
02-03 NVIDIA Cosmos 机器人
[自动] [BLOGS_PODCASTS]
4minmic 2026年AI展望:LLM、智能体、算力与AGI发展路径
02-03 LLM AGI 智能体
[自动] [BLOGS_PODCASTS]
3minmic xAI 推出 Grok Imagine API:对标 Sora 的视频生成能力与定价优势
02-03 xAI Grok Imagine API
[自动] [BLOGS_PODCASTS]
4minmic Snowflake与OpenAI达成2亿美元合作,将前沿智能引入企业数据
02-03 OpenAI Snowflake 企业级AI
[自动] [BLOGS_PODCASTS]
2minmic Sam Altman的AI孵化器计划与YC模式对比
02-03 Sam Altman YC AI孵化器
[自动] [BLOGS_PODCASTS]
3minmic OpenAI将于2026年2月退役ChatGPT中GPT-4o等四款模型
02-03 OpenAI ChatGPT GPT-4o
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 内部数据代理:利用 GPT-5 与记忆快速分析海量数据
02-03 OpenAI GPT-5 数据代理
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Cosmos策略发布:提升机器人控制精度
02-03 NVIDIA Cosmos 机器人
[自动] [HACKER_NEWS]
3minnewspaper Codex App:基于 GPT-3 的代码生成工具
02-03 GPT-3 代码生成 OpenAI
[自动] [BLOGS_PODCASTS]
3minmic 2026年AI展望:LLM、智能体、缩放定律与中国发展
02-03 LLM 智能体 缩放定律
[自动] [HACKER_NEWS]
7minnewspaper Codex 应用:基于 GPT-3 的代码生成工具
02-03 GPT-3 代码生成 Codex
[自动] [HACKER_NEWS]
3minnewspaper 训练万亿参数模型以生成幽默内容
02-03 LLM 万亿参数 幽默生成
[自动] [ARXIV]
3minschool 误差分类引导的提示词优化方法
02-03 提示词工程 ETGPO 自动优化
[自动] [HACKER_NEWS]
3minnewspaper 训练万亿参数模型使其具备幽默感
02-03 LLM 幽默感 万亿参数
[自动] [ARXIV]
3minschool 研究揭示RLHF如何加剧大模型谄媚行为
02-03 RLHF 谄媚行为 模型偏见
[自动] [ARXIV]
4minschool 智能体推理与工具使用的竞争:量化干扰与解调优
02-03 智能体 强化学习 工具使用
[自动] [ARXIV]
3minschool 大语言模型稀疏奖励子系统
02-03 LLM 稀疏奖励 价值神经元
[自动] [ARXIV]
4minschool 基于资格推理与分节强化学习的引理可靠利用
02-03 数学推理 引理应用 RULES
[自动] [HACKER_NEWS]
5minnewspaper Nano-vLLM 技术解析:vLLM 风格推理引擎的运行机制
02-03 vLLM 推理引擎 Nano-vLLM
[自动] [ARXIV]
4minschool DeALOG:基于日志中介的去中心化多智能体推理框架
02-03 Multi-Agent 去中心化 日志中介
[自动] [HACKER_NEWS]
4minnewspaper AI 基准测试新进展:Game Arena 推进评估方法
02-03 AI 基准测试 Game Arena 模型评估
[自动] [ARXIV]
3minschool 粒子引导扩散模型用于偏微分方程求解
02-03 扩散模型 PDE求解 物理引导
[自动] [HACKER_NEWS]
5minnewspaper 利用Game Arena平台推进AI基准测试
02-03 AI基准测试 Game Arena LLM评估
[自动] [ARXIV]
5minschool 函数空间逆问题的解耦扩散采样方法
02-03 扩散模型 逆问题 PDE
[自动] [ARXIV]
4minschool VideoGPA:提取几何先验实现三维一致性视频生成
02-03 VideoGPA 视频生成 3D一致性
[自动] [ARXIV]
4minschool UPA:基于树搜索与筛选的无监督提示代理
02-03 Prompt优化 UPA 无监督学习
[自动] [ARXIV]
5minschool TEON:张量化正交化方法优化大语言模型预训练
02-03 TEON 优化器 预训练
[自动] [HACKER_NEWS]
6minnewspaper Nano-vLLM 原理:vLLM 风格推理引擎的实现机制
02-03 vLLM 推理引擎 LLM
[自动] [ARXIV]
4minschool IRL-DAL:基于能量引导扩散模型的安全自适应自动驾驶轨迹规划
02-03 扩散模型 自动驾驶 轨迹规划
[自动] [ARXIV]
3minschool 粒子引导扩散模型求解偏微分方程
02-02 扩散模型 偏微分方程 PDE
[自动] [HACKER_NEWS]
4minnewspaper 用Game Arena平台推进AI基准测试
02-02 AI基准测试 Game Arena LLM评估
[自动] [BLOGS_PODCASTS]
3minmic xAi 推出 Grok Imagine API:对标 Sora 的视频模型与性价比优势
02-02 xAI Grok Imagine API
[自动] [ARXIV]
5minschool VideoGPA:提取几何先验实现三维一致视频生成
02-02 视频生成 3D一致性 扩散模型
[自动] [ARXIV]
4minschool UPA:基于树搜索与筛选的无监督提示智能体
02-02 Prompt优化 LLM智能体 无监督学习
[自动] [ARXIV]
5minschool TEON:张量化正交化技术优化大语言模型预训练
02-02 TEON 优化器 Muon
[自动] [BLOGS_PODCASTS]
4minmic Snowflake与OpenAI合作:在数据平台内直接集成前沿AI模型
02-02 Snowflake OpenAI 企业级
[自动] [BLOGS_PODCASTS]
2minmic Sam Altman全员大会讲话回顾:AI Combinator与未来方向
02-02 Sam Altman OpenAI AI Combinator
[自动] [BLOGS_PODCASTS]
3minmic OpenAI将于2026年2月退役ChatGPT内多款GPT‑4及o4模型
02-02 OpenAI ChatGPT 模型退役
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 内部数据代理:利用 GPT-5 与记忆能力快速分析大规模数据集
02-02 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Cosmos 策略模型提升机器人高级控制能力
02-02 NVIDIA Cosmos 机器人
[自动] [HACKER_NEWS]
5minnewspaper Nano-vLLM 原理剖析:vLLM 风格推理引擎的实现机制
02-02 vLLM 推理引擎 LLM
[自动] [BLOGS_PODCASTS]
2minmic Moltbook:首个面向AI智能体的社交网络平台
02-02 AI智能体 社交网络 Moltbook
[自动] [ARXIV]
4minschool IRL-DAL:基于能量引导扩散模型的自动驾驶安全自适应轨迹规划
02-02 自动驾驶 扩散模型 逆向强化学习
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量异常
02-02 MLX LLM iPhone 16
[自动] [ARXIV]
4minschool FOCUS:DLLMs如何突破算力瓶颈
02-02 DLLMs 扩散模型 算力优化
[自动] [BLOGS_PODCASTS]
3minmic 2026年AI展望:LLM、智能体、算力与Scaling Laws
02-02 LLM Scaling Laws 智能体
[自动] [BLOGS_PODCASTS]
4minmic OpenAI将于2026年2月退役ChatGPT中GPT‑4o等四款模型
02-02 OpenAI ChatGPT 模型退役
[自动] [HACKER_NEWS]
6minnewspaper Nano-vLLM 原理:解析 vLLM 风格推理引擎机制
02-02 vLLM 推理引擎 LLM
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量差
02-02 MLX LLM iPhone
[自动] [BLOGS_PODCASTS]
2minmic 英伟达推出Cosmos策略以提升机器人控制能力
02-02 英伟达 NVIDIA Cosmos
[自动] [BLOGS_PODCASTS]
3minmic xAI 推出 Grok Imagine API:顶级视频模型与低延迟定价
02-02 xAI Grok Imagine API
[自动] [BLOGS_PODCASTS]
3minmic Sam Altman内部会复盘:AI Combinator与OpenAI战略走向
02-02 OpenAI Sam Altman AI Combinator
[自动] [BLOGS_PODCASTS]
3minmic OpenAI将于2026年2月下线ChatGPT中GPT-4o等四款模型
02-02 OpenAI ChatGPT 模型下线
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 内部数据智能体:结合 GPT-5 与记忆快速分析海量数据
02-02 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]
3minmic Moltbook:首个面向AI智能体的社交网络平台
02-02 AI Agents 社交网络 Moltbook
[自动] [HACKER_NEWS]
6minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量异常
02-02 MLX LLM Apple Silicon
[自动] [BLOGS_PODCASTS]
4minmic 2026年AI展望:LLM、智能体、算力与Scaling Laws
02-02 LLM 智能体 Scaling Laws
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量差
02-02 MLX LLM iPhone 16
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量异常
02-02 MLX LLM iPhone 16
[自动] [BLOGS_PODCASTS]
4minmic 大林建设部署ChatGPT Enterprise加速生成式AI在建筑业务落地
02-02 ChatGPT 企业落地 生成式AI
[自动] [BLOGS_PODCASTS]
2minmic 为何当下是推出科学AI播客的最佳时机及工程师关注点
02-02 AI for Science 播客 AlphaFold
[自动] [BLOGS_PODCASTS]
3minmic xAI 发布 Grok Imagine API:对标 SOTA 视频模型与 SpaceX 合并前瞻
02-02 xAI Grok 视频生成
[自动] [BLOGS_PODCASTS]
2minmic Sam Altman内部会复盘:OpenAI战略与AI孵化器走向
02-02 OpenAI Sam Altman 战略
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 内部数据智能体:结合 GPT‑5 与记忆快速分析海量数据集
02-02 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Cosmos 策略模型提升机器人控制精度
02-02 NVIDIA Cosmos 机器人
[自动] [BLOGS_PODCASTS]
2minmic Moltbook:首个面向AI智能体的社交网络平台
02-02 AI智能体 社交网络 Moltbook
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量异常
02-02 MLX LLM Apple Silicon
[自动] [BLOGS_PODCASTS]
3minmic 2026年AI展望:LLM、智能体、扩展定律与中国角色
02-02 LLM 智能体 扩展定律
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出异常
02-02 MLX LLM iPhone 16
[自动] [HACKER_NEWS]
5minnewspaper iPhone 16 Pro Max 运行 MLX 大模型输出质量异常
02-02 MLX LLM Apple Silicon
[自动] [ARXIV]
3minschool 大语言模型中角色作为潜变量:机制视角下的错位与安全失效
02-02 LLM 对齐 角色扮演
[自动] [ARXIV]
3minschool 基于输出监督学习的思维链混淆技术可泛化至未见任务
02-02 思维链 CoT 输出监督
[自动] [ARXIV]
3minschool 动态认知回退机制提升策略合规安全性
02-02 LLM 安全对齐 提示工程
[自动] [ARXIV]
4minschool SplineFlow:基于B样条插值的动力系统流匹配方法
02-02 流匹配 SplineFlow B样条
[自动] [ARXIV]
4minschool OrLog:结合大模型与概率推理解决复杂查询
02-02 神经符号AI 概率推理 复杂查询
[自动] [ARXIV]
4minschool LLM语义缓存面临密钥碰撞攻击风险
02-02 语义缓存 密钥碰撞 LLM安全
[自动] [ARXIV]
4minschool ExplainerPFN:面向表格数据的无模型零样本特征重要性估计
02-02 ExplainerPFN TabPFN 表格数据
[自动] [ARXIV]
4minschool CATTO:平衡语言模型偏好与置信度的方法
02-02 LLM CATTO 校准
[自动] [HACKER_NEWS]
7minnewspaper 迈向智能体系统规模化科学:探究其生效机制与适用场景
02-02 智能体 Agent系统 规模化
[自动] [ARXIV]
6minschool 混合线性注意力新架构:高效蒸馏与超长上下文处理
02-02 HALO HypeNet 混合架构
[自动] [ARXIV]
4minschool 推理大语言模型从被动求解到主动提问的转变
02-02 推理 CoT 主动交互
[自动] [ARXIV]
4minschool 探索面向智能体的推理奖励模型
02-02 Agentic RL Reward Model 推理奖励
[自动] [ARXIV]
3minschool 发现模型仓库中的隐藏价值
02-02 模型评估 Llama-3.1 多臂老虎机
[自动] [ARXIV]
4minschool UEval:统一多模态生成基准
02-02 UEval 多模态 基准测试
[自动] [ARXIV]
3minschool Routing the Lottery: 面向异构数据的自适应子网络路由
02-02 模型剪枝 彩票假设 异构数据
[自动] [ARXIV]
4minschool RedSage:网络安全通用大语言模型
02-02 RedSage 网络安全 垂直领域模型
[自动] [ARXIV]
4minschool FineInstructions:将合成指令数据扩展至预训练规模
02-02 LLM 指令微调 合成数据
[自动] [ARXIV]
5minschool DynaWeb:基于模型的强化学习网页智能体
02-02 DynaWeb Web Agent 强化学习
[自动] [HACKER_NEWS]
4minnewspaper 迈向智能体系统规模化科学:工作原理与适用条件
02-01 智能体 规模化 系统设计
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与超长上下文处理
02-01 Transformer 混合架构 线性注意力
[自动] [ARXIV]
3minschool 推理大语言模型从被动求解转向主动询问
02-01 推理 交互式推理 PIR
[自动] [ARXIV]
4minschool 探索面向智能体的推理奖励模型
02-01 Agent RLHF 奖励模型
[自动] [ARXIV]
3minschool 挖掘模型仓库中的隐藏价值
02-01 模型评估 Llama 微调
[自动] [BLOGS_PODCASTS]
3minmic 为何推出首个科学AI播客恰逢其时及工程师关注点
02-01 AI for Science AlphaFold 播客
[自动] [BLOGS_PODCASTS]
3minmic xAI巩固前沿实验室地位并拟与SpaceX合并
02-01 xAI SpaceX Grok
[自动] [ARXIV]
4minschool UEval:统一多模态生成基准评测
02-01 UEval 多模态 基准评测
[自动] [BLOGS_PODCASTS]
3minmic Sam Altman提出AI孵化器模式以加速初创公司发展
02-01 Sam Altman OpenAI 初创公司
[自动] [ARXIV]
4minschool Routing the Lottery:面向异型数据的自适应子网络
02-01 模型剪枝 彩票假说 自适应路由
[自动] [ARXIV]
5minschool RedSage:网络安全通用大语言模型
02-01 RedSage 网络安全 LLM
[自动] [BLOGS_PODCASTS]
4minmic OpenAI将于2026年2月退役多款GPT‑4及o4‑mini模型
02-01 OpenAI GPT-4 模型退役
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Cosmos策略:面向高级机器人控制的新方案
02-01 NVIDIA Cosmos 机器人
[自动] [BLOGS_PODCASTS]
2minmic Moltbook:首个面向 AI 智能体的社交网络平台
02-01 Moltbook AI Agents 社交网络
[自动] [ARXIV]
4minschool FineInstructions:将合成指令扩展至预训练规模
02-01 FineInstructions 合成数据 指令微调
[自动] [ARXIV]
5minschool DynaWeb:基于模型的强化学习网页智能体
02-01 DynaWeb Web Agent 强化学习
[自动] [BLOGS_PODCASTS]
3minmic 2026年AI展望:LLM、智能体、缩放定律与中国发展
02-01 LLM 智能体 缩放定律
[自动] [HACKER_NEWS]
4minnewspaper 迈向智能体系统规模化科学:作用机制与生效条件
02-01 Agent LLM Scaling Law
[自动] [HACKER_NEWS]
5minnewspaper 构建极简编程代理的技术实践与经验总结
02-01 AI Agent LLM 编程代理
[自动] [HACKER_NEWS]
5minnewspaper 构建极简且具倾向性的编程代理的经验总结
02-01 AI Agent LLM 编程代理
[自动] [HACKER_NEWS]
5minnewspaper 生成式AI与维基百科编辑的2025年实践总结
02-01 生成式AI 维基百科 LLM
[自动] [HACKER_NEWS]
4minnewspaper 生成式 AI 与维基百科编辑:2025 年观察总结
02-01 生成式AI 维基百科 LLM
[自动] [HACKER_NEWS]
4minnewspaper 构建极简且具倾向性的编程代理的经验总结
02-01 AI Agent LLM 编程代理
[自动] [HACKER_NEWS]
3minnewspaper 生成式AI与维基百科编辑:2025年经验总结
02-01 生成式AI 维基百科 LLM
[自动] [HACKER_NEWS]
4minnewspaper 生成式AI与维基百科协作的2025年实践总结
02-01 生成式AI 维基百科 LLM
[自动] [HACKER_NEWS]
4minnewspaper 2025年生成式AI在维基百科编辑中的应用与发现
02-01 生成式AI 维基百科 LLM
[自动] [HACKER_NEWS]
4minnewspaper 生成式AI与维基百科编辑:2025年经验总结
02-01 生成式AI 维基百科 LLM
[自动] [HACKER_NEWS]
5minnewspaper 2025年生成式AI在维基百科编辑中的应用与发现
02-01 生成式AI 维基百科 LLM
[自动] [HACKER_NEWS]
4minnewspaper 生成式AI与维基百科编辑:2025年观察总结
02-01 生成式AI 维基百科 LLM
[自动] [HACKER_NEWS]
4minnewspaper 生成式AI与维基百科编辑:2025年经验总结
02-01 生成式AI 维基百科 LLM
[自动] [HACKER_NEWS]
6minnewspaper 生成式AI与维基百科编辑:2025年实践经验总结
02-01 生成式AI 维基百科 LLM
[自动] [HACKER_NEWS]
5minnewspaper 生成式AI与维基百科编辑:2025年观察总结
02-01 生成式AI 维基百科 LLM
[自动] [HACKER_NEWS]
5minnewspaper 生成式AI与维基百科编辑的2025年实践总结
02-01 生成式AI 维基百科 LLM
[自动] [BLOGS_PODCASTS]
2minmic 推出世界首个科学领域AI播客及工程师关注理由
02-01 AI for Science 播客 职业发展
[自动] [BLOGS_PODCASTS]
2minmic xAI推出Grok Imagine视频模型API:定价与延迟优势显著
02-01 xAI Grok Imagine 视频模型
[自动] [BLOGS_PODCASTS]
2minmic Sam Altman全员大会讲话要点与AI孵化器计划
02-01 Sam Altman OpenAI AI孵化器
[自动] [BLOGS_PODCASTS]
2minmic OpenAI内部数据代理:结合GPT-5与记忆机制快速分析大规模数据集
02-01 OpenAI GPT-5 数据代理
[自动] [BLOGS_PODCASTS]
4minmic OpenAI 将于2026年2月退役多款GPT-4及o4-mini模型
02-01 OpenAI 模型退役 GPT-4o
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Cosmos 策略模型提升机器人控制能力
02-01 NVIDIA Cosmos 机器人
[自动] [BLOGS_PODCASTS]
3minmic Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,支持原生图文视频及百并发Agent管理
02-01 Moonshot AI Kimi k2.5 开源模型
[自动] [HACKER_NEWS]
4minnewspaper 生成式AI与维基百科编辑:2025年实践回顾
02-01 生成式AI 维基百科 LLM
2026年一月 300 篇
类型阅读条目
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与超长上下文建模
01-31 线性注意力 长上下文 混合架构
[自动] [ARXIV]
4minschool 推理大语言模型从被动求解转向主动询问
01-31 LLM 推理模型 主动询问
[自动] [ARXIV]
5minschool 探索面向智能体的推理奖励模型
01-31 Agent 强化学习 奖励模型
[自动] [ARXIV]
4minschool 发现模型仓库中的隐藏价值
01-31 模型评估 Llama 多臂老虎机
[自动] [BLOGS_PODCASTS]
5minmic xAI巩固前沿实验室地位并计划与SpaceX合并
01-31 xAI Grok SpaceX
[自动] [ARXIV]
4minschool UEval:统一多模态生成基准
01-31 多模态 UEval 基准测试
[自动] [BLOGS_PODCASTS]
2minmic Sam Altman在市政厅会议发言回顾
01-31 Sam Altman OpenAI AI Combinator
[自动] [ARXIV]
4minschool RedSage:网络安全通用大语言模型
01-31 RedSage 网络安全 LLM
[自动] [BLOGS_PODCASTS]
4minmic OpenAI 将于 2026 年 2 月退役多款 GPT‑4 系列模型
01-31 OpenAI GPT-4 模型退役
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Cosmos策略:面向高级机器人控制的新方法
01-31 NVIDIA 机器人 Cosmos
[自动] [BLOGS_PODCASTS]
3minmic Moltbook:首个面向 AI 智能体的社交网络
01-31 AI Agents 社交网络 Moltbook
[自动] [BLOGS_PODCASTS]
3minmic Kimi K2.5:半价超越Sonnet 4.5,支持原生多模态与百并发Agent
01-31 Kimi k1.5 Moonshot AI 开源模型
[自动] [ARXIV]
3minschool FineInstructions:将合成指令数据扩展至预训练规模
01-31 LLM 指令微调 合成数据
[自动] [ARXIV]
5minschool DynaWeb:基于模型的强化学习网页智能体框架
01-31 DynaWeb Web Agent 强化学习
[自动] [HACKER_NEWS]
4minnewspaper 训练900万参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper 训练 9M 参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
3minnewspaper Show HN:我用9M参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper 训练9M参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper Show HN: 训练900万参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper 训练9M参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
5minnewspaper Kimi k2.5 技术报告发布:长上下文与推理能力详解
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
4minnewspaper 训练900万参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:模型架构与性能评估
01-31 Kimi K2.5 技术报告 模型架构
[自动] [HACKER_NEWS]
4minnewspaper 训练9M参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper Show HN:我用9M参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
5minnewspaper Kimi K2.5 技术报告发布:模型架构与训练细节
01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:架构与性能细节
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 与英伟达百亿美元芯片采购交易暂停
01-31 OpenAI 英伟达 芯片
[自动] [HACKER_NEWS]
4minnewspaper 训练9M参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper OpenAI与英伟达千亿美元芯片交易暂停
01-31 OpenAI 英伟达 芯片交易
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:模型架构与性能评估
01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 与英伟达价值千亿美元芯片交易暂停
01-31 OpenAI 英伟达 Nvidia
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:长上下文与多模态推理能力详解
01-31 Kimi K2.5 技术报告 长上下文
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 与英伟达百亿美元芯片采购谈判暂停
01-31 OpenAI 英伟达 芯片
[自动] [HACKER_NEWS]
4minnewspaper Kimi k2.5 技术报告发布
01-31 Kimi K2.5 技术报告
[自动] [HACKER_NEWS]
6minnewspaper Show HN: 我构建了一个用于练习口语的AI对话伙伴
01-31 AI对话 语言学习 口语练习
[自动] [HACKER_NEWS]
5minnewspaper OpenAI 与英伟达价值千亿美元芯片交易搁浅
01-31 OpenAI 英伟达 Nvidia
[自动] [HACKER_NEWS]
7minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
7minnewspaper 月之暗面发布 Kimi k2.5 技术报告
01-31 月之暗面 Kimi K2.5
[自动] [BLOGS_PODCASTS]
3minmic xAI 推出 Grok Imagine API:顶级视频模型与低延迟定价
01-31 xAI Grok Imagine API
[自动] [BLOGS_PODCASTS]
3minmic Sam Altman市政厅发言反思与AI孵化器动态
01-31 Sam Altman OpenAI AI Combinator
[自动] [BLOGS_PODCASTS]
4minmic OpenAI将于2026年2月退役GPT-4o等四款模型
01-31 OpenAI GPT-4o GPT-5
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 内部数据代理:结合 GPT-5 与记忆机制实现数据集快速推理
01-31 OpenAI GPT-5 Codex
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Cosmos 策略模型提升机器人控制精度
01-31 NVIDIA Cosmos 机器人
[自动] [BLOGS_PODCASTS]
3minmic Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,支持原生图文视频与百并发Agent管理
01-31 Moonshot Kimi K2.5 SOTA
[自动] [HACKER_NEWS]
4minnewspaper Show HN: 构建AI语言对话伙伴辅助口语练习
01-31 语言学习 口语练习 AI对话
[自动] [HACKER_NEWS]
6minnewspaper Kimi K2.5 技术报告发布:模型架构与性能评估
01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [ARXIV]
4minschool 面向异构数据的自适应子网络路由机制
01-30 模型剪枝 异构数据 子网络
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与极长上下文处理
01-30 HALO HypeNet 长上下文
[自动] [ARXIV]
4minschool 推理大模型从被动求解转向主动提问
01-30 推理模型 主动交互 思维链
[自动] [ARXIV]
5minschool 探索面向智能体的推理奖励模型
01-30 Agent 强化学习 推理奖励模型
[自动] [BLOGS_PODCASTS]
2minmic 大林建设采用ChatGPT Enterprise推动全球建筑业务人才发展
01-30 ChatGPT 企业应用 人才发展
[自动] [ARXIV]
3minschool 发现模型仓库中被忽视的高质量模型
01-30 模型评估 Llama-3.1 微调
[自动] [BLOGS_PODCASTS]
4minmic xAI 巩固前沿地位并拟与 SpaceX 合并
01-30 xAI SpaceX Grok
[自动] [ARXIV]
3minschool UEval:统一多模态生成基准
01-30 UEval 多模态 统一模型
[自动] [BLOGS_PODCASTS]
3minmic Sam Altman在市政厅会议回顾AI创业孵化模式
01-30 Sam Altman Y Combinator AI创业
[自动] [ARXIV]
5minschool RedSage:网络安全通用大模型
01-30 RedSage 网络安全 LLM
[自动] [BLOGS_PODCASTS]
4minmic OpenAI将于2026年2月退役ChatGPT内多款GPT‑4及o4‑mini模型
01-30 OpenAI ChatGPT 模型退役
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 内部数据代理:结合 GPT‑5 与记忆机制实现分钟级数据洞察
01-30 OpenAI GPT-5 数据代理
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Cosmos策略:提升机器人高级控制能力
01-30 NVIDIA 机器人 Cosmos
[自动] [BLOGS_PODCASTS]
3minmic Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,原生图文视频及百并发Agent管理
01-30 Moonshot AI Kimi k2.5 开源模型
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:强化学习与长上下文能力升级
01-30 Kimi K2.5 强化学习
[自动] [ARXIV]
4minschool FineInstructions:将合成指令数据扩展至预训练规模
01-30 LLM 预训练 指令微调
[自动] [ARXIV]
5minschool DynaWeb:基于模型的强化学习网页智能体
01-30 DynaWeb Web Agent 强化学习
[自动] [HACKER_NEWS]
7minnewspaper 月之暗面发布Kimi K2.5技术报告
01-30 Kimi K2.5 月之暗面
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-30 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
6minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-30 Kimi K2.5 技术报告 长上下文
[自动] [HACKER_NEWS]
4minnewspaper AI辅助编程对代码技能形成的影响研究
01-30 AI辅助编程 代码技能 Copilot
[自动] [HACKER_NEWS]
4minnewspaper AI辅助编程对代码技能形成的影响研究
01-30 AI辅助编程 代码技能 学习曲线
[自动] [HACKER_NEWS]
4minnewspaper AI 辅助编程对代码技能形成的影响研究
01-30 AI编程 代码技能 Copilot
[自动] [HACKER_NEWS]
5minnewspaper Project Genie:无限交互式世界的实验探索
01-30 Project Genie 无限世界 交互式
[自动] [BLOGS_PODCASTS]
4minmic 为何现在推出全球首个科学AI播客及其对工程师的意义
01-30 AI for Science AlphaFold 播客
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 将在 ChatGPT 中下架 GPT-4o 等四款模型
01-30 OpenAI ChatGPT GPT-4o
[自动] [BLOGS_PODCASTS]
3minmic Moonshot K2.5:成本减半超越Sonnet 4.5,原生图文视频与百并发Agent管理
01-30 Moonshot Kimi k2.5 开源模型
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 将在 ChatGPT 中停用 GPT-4o 等四款模型
01-30 OpenAI ChatGPT GPT-4o
[自动] [HACKER_NEWS]
4minnewspaper AI 辅助编程对代码技能形成的影响研究
01-30 AI辅助编程 代码技能 学习曲线
[自动] [HACKER_NEWS]
4minnewspaper AGENTS.md 架构在智能体评估中超越 Skills 技能
01-30 智能体 评估 AGENTS.md
[自动] [HACKER_NEWS]
4minnewspaper Project Genie:探索无限交互世界的实验
01-30 Project Genie 无限交互 AI 实验
[自动] [HACKER_NEWS]
5minnewspaper OpenAI 将在 ChatGPT 中下架 GPT-4o 等四款模型
01-30 OpenAI ChatGPT GPT-4o
[自动] [HACKER_NEWS]
5minnewspaper OpenAI 将在 ChatGPT 中下架 GPT-4o 等四款模型
01-30 OpenAI ChatGPT GPT-4o
[自动] [HACKER_NEWS]
5minnewspaper 人工智能如何重塑技能形成机制
01-30 技能重塑 AI影响 教育变革
[自动] [HACKER_NEWS]
5minnewspaper Project Genie:无限交互世界的实验性探索
01-30 Project Genie 无限交互 世界模拟
[自动] [HACKER_NEWS]
5minnewspaper Agent评估显示AGENTS.md配置优于Skills
01-30 Agent 评估 AGENTS.md
[自动] [HACKER_NEWS]
4minnewspaper Project Genie:无限交互世界的实验探索
01-30 Project Genie 无限交互 世界模拟
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 将在 ChatGPT 中下架 GPT-4o 等多款模型
01-30 OpenAI ChatGPT GPT-4o
[自动] [HACKER_NEWS]
4minnewspaper AI 辅助编程对代码技能形成的影响研究
01-30 AI编程 代码技能 Copilot
[自动] [HACKER_NEWS]
5minnewspaper AGENTS.md 架构在智能体评估中优于 Skills 架构
01-30 智能体 Agent AGENTS.md
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 将在 ChatGPT 中停用 GPT-4o 等四款模型
01-30 OpenAI ChatGPT GPT-4o
[自动] [HACKER_NEWS]
4minnewspaper Agent评估显示AGENTS.md配置优于Skills
01-30 Agent LLM AGENTS.md
[自动] [BLOGS_PODCASTS]
3minmic Sam Altman内部会复盘与YC孵化模式对比
01-30 Sam Altman OpenAI YC
[自动] [BLOGS_PODCASTS]
4minmic OpenAI将于2026年2月退役ChatGPT中多款GPT‑4及o4模型
01-30 OpenAI ChatGPT 模型退役
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 内部数据代理:结合 GPT-5 与记忆机制实现分钟级数据洞察
01-30 OpenAI GPT-5 数据智能体
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA Cosmos 策略模型:提升机器人高级控制能力
01-30 NVIDIA Cosmos 机器人
[自动] [HACKER_NEWS]
5minnewspaper Agent评估显示AGENTS.md配置优于技能配置
01-30 Agent AGENTS.md 技能配置
[自动] [HACKER_NEWS]
5minnewspaper Agent评估显示AGENTS.md配置优于Skills
01-30 Agent AGENTS.md Skills
[自动] [ARXIV]
3minschool 面向大语言模型的时间引导机制
01-30 LLM 对比解码 时间引导
[自动] [ARXIV]
4minschool 基于认知上下文学习构建大模型多智能体系统的信任机制
01-30 多智能体 信任机制 ECL
[自动] [ARXIV]
3minschool 基于经验的试错算法超越语言模型
01-30 LLM SCOUT 探索与利用
[自动] [ARXIV]
3minschool EWSJF:面向混合负载LLM推理的自适应调度器
01-30 LLM推理 调度器 vLLM
[自动] [HACKER_NEWS]
4minnewspaper AGENTS.md 架构在智能体评估中超越 Skills 技能
01-30 智能体 Agent 评估
[自动] [ARXIV]
4minschool 进化策略导致大语言模型出现灾难性遗忘
01-30 进化策略 灾难性遗忘 持续学习
[自动] [HACKER_NEWS]
4minnewspaper 编码代理的成功对通用AI系统的启示
01-30 AI Agent 编码代理 LLM
[自动] [ARXIV]
4minschool 机器翻译评估中的跨向污染问题研究
01-30 机器翻译 数据污染 FLORES-200
[自动] [ARXIV]
4minschool 后训练公平性控制:推荐系统动态公平性单训练框架
01-30 推荐系统 公平性 Cofair
[自动] [ARXIV]
4minschool SokoBench:评估大模型长周期规划与推理能力
01-30 SokoBench 长周期规划 推理能力
[自动] [ARXIV]
3minschool PatchFormer:基于分层掩码重建的零样本多步预测时序基础模型
01-30 时间序列 PatchFormer 零样本预测
[自动] [ARXIV]
4minschool Deep Researcher:结合序列规划反思与候选交叉的深度研究框架
01-30 Deep Researcher AI Agent 智能体架构
[自动] [HACKER_NEWS]
5minnewspaper 压缩智能体:Agent Skills 技术解析
01-30 Agent LLM 技术解析
[自动] [HACKER_NEWS]
5minnewspaper Project Genie:无限交互式世界的实验性探索
01-30 Project Genie 无限世界 交互式
[自动] [BLOGS_PODCASTS]
2minmic 推出全球首个科学AI播客及工程师应关注的时机
01-30 AI播客 科学AI AI工程师
[自动] [HACKER_NEWS]
5minnewspaper OpenAI 将在 ChatGPT 中停用 GPT-4o 等四款模型
01-30 OpenAI ChatGPT GPT-4o
[自动] [BLOGS_PODCASTS]
4minmic Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,原生图文视频与百并发Agent管理
01-30 Moonshot AI Kimi k2.5 开源模型
[自动] [HACKER_NEWS]
5minnewspaper Compressed Agents:Agent Skills 技术解析
01-30 Agent LLM 技术解析
[自动] [ARXIV]
4minschool 进化策略导致大语言模型出现灾难性遗忘
01-29 进化策略 灾难性遗忘 持续学习
[自动] [ARXIV]
3minschool 机器翻译评估中的跨向污染问题研究
01-29 机器翻译 数据污染 FLORES
[自动] [BLOGS_PODCASTS]
2minmic 推出全球首个科学AI播客:为何AI工程师应关注
01-29 AI for Science 科学智能 播客
[自动] [ARXIV]
4minschool SokoBench:评估大模型长程规划与推理能力
01-29 SokoBench 长程规划 推理能力
[自动] [BLOGS_PODCASTS]
2minmic Sam Altman 全员大会复盘与 AI Combinator 解析
01-29 OpenAI Sam Altman AGI
[自动] [HACKER_NEWS]
7minnewspaper Project Genie:无限交互世界的实验性探索
01-29 Project Genie 交互世界 无限生成
[自动] [ARXIV]
5minschool PatchFormer:基于分层掩码重建的零样本多步预测时序基础模型
01-29 时序预测 PatchFormer 零样本学习
[自动] [BLOGS_PODCASTS]
3minmic OpenAI内部数据代理:结合GPT‑5与记忆快速分析海量数据
01-29 OpenAI GPT-5 Codex
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 将在 ChatGPT 中下架 GPT-4o 等四款模型
01-29 OpenAI ChatGPT GPT-4o
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 如何防范 AI 代理点击链接时的数据外泄与提示注入
01-29 OpenAI AI Agent 提示注入
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Cosmos策略:提升机器人控制能力
01-29 NVIDIA 机器人 Cosmos
[自动] [BLOGS_PODCASTS]
3minmic Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,支持原生图文视频
01-29 Moonshot AI Kimi k2.5 开源模型
[自动] [ARXIV]
3minschool Deep Researcher:序列规划反思与候选交叉
01-29 Deep Researcher AI Agent 反思机制
[自动] [HACKER_NEWS]
5minnewspaper Agent Skills:压缩智能体技能以提升模型效率
01-29 Agent 模型压缩 效率优化
[自动] [HACKER_NEWS]
5minnewspaper 苹果收购以色列创企Q.ai 加速AI布局
01-29 苹果 Apple 收购
[自动] [HACKER_NEWS]
4minnewspaper OpenAI 将在 ChatGPT 中停用 GPT-4o 等四款模型
01-29 OpenAI ChatGPT GPT-4o
[自动] [BLOGS_PODCASTS]
3minmic 让 Claude 编写 CUDA 内核并指导开源模型
01-29 Claude CUDA 内核开发
[自动] [BLOGS_PODCASTS]
3minmic 推出全球首个科学领域AI播客及工程师关注理由
01-29 AI for Science 播客 科学发现
[自动] [BLOGS_PODCASTS]
2minmic Sam Altman全员大会反思与AI孵化器动态
01-29 Sam Altman OpenAI 战略转型
[自动] [HACKER_NEWS]
4minnewspaper OpenAI内部数据智能体:自动化数据分析与决策
01-29 OpenAI Data Agent 数据分析
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 如何在 AI 代理点击链接时保护用户数据安全
01-29 OpenAI AI Agent 数据安全
[自动] [BLOGS_PODCASTS]
3minmic Moonshot Kimi K2.5:半价超越Sonnet 4.5,原生图文视频与百并发Agent管理
01-29 Kimi k2.5 Moonshot AI 月之暗面
[自动] [HACKER_NEWS]
5minnewspaper OpenAI内部数据智能体:自动化分析SQL数据库
01-29 OpenAI Data Agent SQL
[自动] [BLOGS_PODCASTS]
3minmic 让 Claude 编写 CUDA 内核并指导开源模型
01-29 Claude CUDA 代码生成
[自动] [BLOGS_PODCASTS]
2minmic 中国开源AI生态的架构选择:超越DeepSeek的构建路径
01-29 DeepSeek 架构选型 中国AI
[自动] [BLOGS_PODCASTS]
4minmic OpenAI 如何通过内置安全机制防范 AI 代理点击链接时的数据泄露与提示词注入
01-29 OpenAI AI代理 数据泄露
[自动] [BLOGS_PODCASTS]
3minmic Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,支持原生图文与百并发智能体
01-29 Moonshot AI Kimi k2.5 开源模型
[自动] [BLOGS_PODCASTS]
2minmic Alyah:评估阿拉伯语大模型阿联酋方言能力
01-29 LLM 阿拉伯语 方言评估
[自动] [BLOGS_PODCASTS]
2minmic 为何推出首个科学AI播客及工程师应关注的原因
01-29 AI for Science 科学智能 几何深度学习
[自动] [BLOGS_PODCASTS]
2minmic Sam Altman的AI孵化器:OpenAI加速初创公司生态布局
01-29 OpenAI Sam Altman AI Combinator
[自动] [BLOGS_PODCASTS]
2minmic Nemotron-Personas-Brazil:主权AI协同设计数据集
01-29 主权AI 数据集 Nemotron
[自动] [BLOGS_PODCASTS]
3minmic Moonshot Kimi K25:成本减半超越Sonnet 45,原生图文视频与百并发Agent管理
01-29 Moonshot AI Kimi k2.5 开源模型
[自动] [HACKER_NEWS]
5minnewspaper Trinity Large:开源4000亿稀疏MoE模型
01-29 MoE 稀疏模型 Trinity
[自动] [HACKER_NEWS]
4minnewspaper Trinity Large:开源4000亿稀疏MoE模型
01-29 MoE 稀疏模型 Trinity
[自动] [HACKER_NEWS]
4minnewspaper Trinity Large:开源4000亿稀疏MoE模型
01-29 MoE 稀疏模型 Trinity
[自动] [HACKER_NEWS]
4minnewspaper Trinity Large:开源4000亿稀疏MoE模型
01-29 MoE 稀疏模型 Trinity
[自动] [HACKER_NEWS]
5minnewspaper 谷歌将 Gemini 模型集成至 Chrome 浏览器
01-29 Gemini Chrome Google
[自动] [HACKER_NEWS]
7minnewspaper Trinity Large:开源4000亿稀疏MoE模型
01-29 MoE 稀疏模型 Trinity
[自动] [HACKER_NEWS]
5minnewspaper Trinity Large:开源4000亿参数稀疏MoE模型
01-29 MoE 稀疏模型 Trinity
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布《欧盟经济蓝图2.0》加速欧洲AI应用与增长
01-29 OpenAI 欧盟 AI应用
[自动] [BLOGS_PODCASTS]
3minmic 让 Claude 编写 CUDA 内核并指导开源模型
01-29 Claude 3.5 CUDA 微调
[自动] [BLOGS_PODCASTS]
2minmic 推出全球首个专注科学的人工智能播客及工程师关注理由
01-29 AI for Science AlphaFold GNN
[自动] [BLOGS_PODCASTS]
2minmic 中国开源AI生态架构选择:DeepSeek之外的路径
01-29 DeepSeek MoE 混合专家模型
[自动] [HACKER_NEWS]
5minnewspaper Trinity Large:开源4000亿稀疏MoE模型
01-29 MoE 稀疏模型 Trinity
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布欧盟经济蓝图2.0 加速欧洲AI应用与增长
01-29 OpenAI 欧盟 经济蓝图
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 如何防范 AI 代理点击链接时的数据泄露与提示注入
01-29 OpenAI AI Agent 安全防护
[自动] [BLOGS_PODCASTS]
3minmic Nemotron-Personas-Brazil:主权AI协作设计数据集
01-29 主权AI Nemotron 葡萄牙语
[自动] [BLOGS_PODCASTS]
2minmic Moonshot Kimi K2.5:半价超越Sonnet 4.5,支持原生图文视频与百并发智能体
01-29 Moonshot AI Kimi k2.5 Sonnet 4.5
[自动] [HACKER_NEWS]
5minnewspaper LM Studio 0.4 发布:支持本地运行 Llama 3 与多模型并行
01-29 LM Studio Llama 3 本地部署
[自动] [BLOGS_PODCASTS]
5minmic Anthropic 发布 MCP Apps 开放标准,定义富生成式 UI 规范
01-29 Anthropic MCP Claude
[自动] [BLOGS_PODCASTS]
2minmic Alyah:评估阿拉伯语大模型阿联酋方言能力
01-29 LLM 模型评估 阿拉伯语
[自动] [ARXIV]
4minschool 无需真值!🔥颠覆性校准技术来了!🤯
01-28 模型校准 无监督学习 LLM
[自动] [BLOGS_PODCASTS]
3minmic 中国开源AI生态:超越DeepSeek的架构突围!🏗️🔥
01-28 DeepSeek MoE 架构设计
[自动] [BLOGS_PODCASTS]
4minmic PVH携手OpenAI重塑时尚未来!🚀AI赋能,开启无限可能✨
01-28 OpenAI ChatGPT Enterprise 时尚行业
[自动] [BLOGS_PODCASTS]
2minmic Alyah ⭐️:阿拉伯语LLM方言鲁棒性评估!🔥
01-28 LLM 阿拉伯语 方言评估
[自动] [ARXIV]
4minschool AI碳交易!让效率、可持续性与可及性共赢!🌱⚡
01-28 AI碳交易 总量管制与交易 绿色AI
[自动] [ARXIV]
4minschool 🚀低资源机器翻译的救星!结构化自反思引领新突破✨
01-28 机器翻译 低资源语言 自反思
[自动] [ARXIV]
5minschool 🚀SONIC: 颠覆频谱学习!神经网络不变性卷积的终极突破?
01-28 SONIC 频谱学习 神经网络
[自动] [BLOGS_PODCASTS]
5minmic 🚀Claude.ai重大更新!Anthropic发布MCP Apps开放规范
01-28 Anthropic Claude MCP
[自动] [HACKER_NEWS]
4minnewspaper 🚀AI2重磅开源!Open Coding Agents:AI写代码的革命来了!
01-28 AI Agents AI2 Open Coding Agents
[自动] [ARXIV]
4minschool 🔥肿瘤会诊新革命!LLM系统Oncotimia惊艳亮相!
01-28 LLM RAG 医疗AI
[自动] [BLOGS_PODCASTS]
3minmic 🔥实战复盘:解锁GPT-OSS的智能体RL训练秘籍!
01-28 强化学习 智能体 Llama
[自动] [ARXIV]
6minschool 🔥Post-LayerNorm强势回归!稳定、高效、深度训练的新神器!
01-28 Transformer Post-LayerNorm Keel
[自动] [ARXIV]
5minschool ✨告别遗忘!Self-Distillation解锁持续学习新范式!
01-28 持续学习 Self-Distillation 灾难性遗忘
[自动] [BLOGS_PODCASTS]
3minmic 🇧🇷主权AI新突破!Nemotron-Personas-Brazil:共创数据引领未来
01-28 主权AI Nemotron NVIDIA
[自动] [BLOGS_PODCASTS]
3minmic PVH × OpenAI:时尚界的未来革命!🚀👗
01-28 OpenAI ChatGPT Enterprise 时尚科技
[自动] [BLOGS_PODCASTS]
2minmic GPT-OSS实战复盘:解锁Agentic RL训练的突破性路径!🚀
01-28 GPT-OSS 强化学习 RL训练
[自动] [HACKER_NEWS]
4minnewspaper Claude编码实战笔记:几周深度使用后的意外发现!💡
01-28 Claude LLM 代码生成
[自动] [HACKER_NEWS]
4minnewspaper AI2开源最强智能体!自动写代码的超级工程师🚀
01-28 AI Agents AI2 SWE-bench
[自动] [ARXIV]
4minschool 🚚🚀多目标强化学习!让卡车在高速车流中决策更高效、更智能!
01-28 强化学习 PPO 多目标优化
[自动] [BLOGS_PODCASTS]
6minmic 🚀重磅!Anthropic发布MCP开放规范,Claude生态迎来大升级!
01-28 Anthropic Claude MCP
[自动] [HACKER_NEWS]
4minnewspaper 🚀用LLM重写ZORKS!让AI玩转文字冒险游戏,这波操作太硬核了!
01-28 LLM Zork 文字冒险游戏
[自动] [ARXIV]
4minschool 🚀复用FLOPs!RL突破性扩展:超离策略前缀如何解决硬难题?
01-28 强化学习 RL LLM
[自动] [ARXIV]
5minschool 🚀ctELM:用ELM解码临床试验嵌入!精准操控💡
01-28 ctELM 临床试验 嵌入空间
[自动] [ARXIV]
4minschool 🔥模型自学革命!突破可学习性边界,推理能力暴涨!
01-28 SOAR 强化学习 推理能力
[自动] [ARXIV]
5minschool 🔥POPE:利用特权探索破解硬核难题!
01-28 POPE 强化学习 LLM
[自动] [ARXIV]
4minschool 💥MortalMATH:当推理目标遇上紧急场景,AI会“翻车”吗?
01-28 LLM 推理模型 MortalMATH
[自动] [ARXIV]
4minschool 🎭LLM如何颠覆互动叙事?Dramamancer案例揭秘设计黑科技!
01-28 LLM 互动叙事 游戏设计
[自动] [BLOGS_PODCASTS]
3minmic 🌍 NVIDIA Earth-2开源模型霸榜!覆盖全气象栈!
01-28 NVIDIA Earth-2 气象预报
[自动] [BLOGS_PODCASTS]
3minmic 🇨🇳中国开源AI生态:破局DeepSeek!架构选择的深层洞察
01-28 DeepSeek Qwen MoE
[自动] [BLOGS_PODCASTS]
3minmic 🇦🇪 Alyah ⭐️:揭秘阿拉伯LLM方言鲁棒评估!
01-28 LLM 阿拉伯语 方言评估
[自动] [BLOGS_PODCASTS]
3minmic 阿联酋方言评测新突破!Alyah让阿拉伯语大模型更鲁棒🚀
01-27 Alyah 阿拉伯语 方言评测
[自动] [ARXIV]
4minschool 突破极限!AI如何教会自己推理?🤯 边缘学习性的惊天秘密!🚀
01-27 SOAR 强化学习 元学习
[自动] [BLOGS_PODCASTS]
4minmic 实战复盘:解锁GPT-OSS智能体强化训练!🚀
01-27 强化学习 智能体 模型蒸馏
[自动] [BLOGS_PODCASTS]
4minmic PVH携手OpenAI颠覆时尚界!🔥重塑未来的创新革命!🤖✨
01-27 OpenAI ChatGPT Enterprise 时尚科技
[自动] [ARXIV]
4minschool MortalMATH:当推理目标遇上紧急语境,冲突何解?🧠🔥
01-27 LLM 模型评估 安全对齐
[自动] [BLOGS_PODCASTS]
4minmic Indeed如何用AI颠覆求职?🤖✨ 招聘效率革命!
01-27 Indeed 招聘 求职
[自动] [ARXIV]
5minschool ctELM:用LLM解码临床试验嵌入!解锁临床新价值🔥
01-27 ctELM 临床试验 嵌入语言模型
[自动] [ARXIV]
4minschool 🚛🚦高速公路卡车决策新突破!多目标强化学习让战术决策更高效!
01-27 强化学习 PPO 多目标优化
[自动] [ARXIV]
5minschool 🚀RL新突破!复用FLOPs,硬难题上通过离线前缀扩展
01-27 PrefixRL 强化学习 LLM
[自动] [ARXIV]
4minschool 🔥POPE:用特权探索让AI学会解决复杂难题!
01-27 强化学习 LLM 推理能力
[自动] [ARXIV]
4minschool 🎭LLM驱动的交互式叙事设计:Dramamancer案例研究!🚀
01-27 LLM 交互式叙事 游戏设计
[自动] [BLOGS_PODCASTS]
4minmic 🌍NVIDIA Earth-2开放模型覆盖全气象栈!精准预测未来🌦️
01-27 NVIDIA Earth-2 气象预测
[自动] [ARXIV]
4minschool 🌍 跨242种语言!用子词模型解锁比较语言学新视角!
01-27 比较语言学 子词模型 BPE
[自动] [BLOGS_PODCASTS]
4minmic 🇨🇳中国开源AI生态:深求之外,架构如何突围?🚀
01-27 DeepSeek 架构设计 MoE
[自动] [HACKER_NEWS]
3minnewspaper 🚀Kimi K2.5震撼开源!视觉SOTA级智能模型,性能炸裂!
01-27 Kimi K2.5 Moonshot AI 视觉模型
[自动] [BLOGS_PODCASTS]
3minmic 🤖Indeed如何用AI颠覆求职体验?招聘效率飙升!
01-27 Indeed AI应用 招聘
[自动] [BLOGS_PODCASTS]
4minmic 揭秘Agentic RL训练!GPT-OSS实战回顾,核心干货🔥
01-27 Agentic RL 强化学习 GPT-OSS
[自动] [BLOGS_PODCASTS]
3minmic PVH x OpenAI:开启时尚未来!🚀✨
01-27 OpenAI ChatGPT Enterprise PVH
[自动] [BLOGS_PODCASTS]
5minmic 🚀重大!Anthropic发布MCP开放标准,Claude.ai生态大爆发!
01-27 Anthropic Claude MCP
[自动] [HACKER_NEWS]
4minnewspaper 🚀Kimi K2.5重磅开源!视觉SOTA级Agent模型,AI新王炸?
01-27 Kimi Moonshot AI K1.5
[自动] [BLOGS_PODCASTS]
4minmic 💡颠覆传统!Praktika对话式语言学习法:让开口说英语像呼吸一样自然!
01-27 Praktika 语言学习 AI 导师
[自动] [BLOGS_PODCASTS]
4minmic 🌍NVIDIA Earth-2 开放模型!解锁全栈天气预报的终极力量 🚀
01-27 NVIDIA Earth-2 CorrDiff
[自动] [BLOGS_PODCASTS]
3minmic ⭐️Alyah:阿联酋方言能力评估!阿拉伯语LLM新突破!
01-27 LLM 阿拉伯语 方言评估
[自动] [HACKER_NEWS]
4minnewspaper 🤯ChatGPT容器解锁!bash/安装包/下载文件全能!
01-27 ChatGPT OpenAI 高级数据分析
[自动] [BLOGS_PODCASTS]
3minmic 颠覆传统!Praktika对话式语言学习,让你开口即会话!🚀
01-27 Praktika 语言学习 AI 导师
[自动] [HACKER_NEWS]
3minnewspaper Kimi K2.5震撼开源!视觉SOTA Agent模型,性能炸裂🔥
01-27 Kimi K2.5 多模态
[自动] [BLOGS_PODCASTS]
3minmic 🚀GPT-OSS智能体RL训练解密!从0到1实战复盘🔥
01-27 强化学习 Agent GPT-OSS
[自动] [HACKER_NEWS]
4minnewspaper 🔥Model Market Fit!PMF的终极解法?你的模型真的适配市场吗?
01-27 Model Market Fit PMF LLM
[自动] [BLOGS_PODCASTS]
4minmic 🌍NVIDIA Earth-2开放模型震撼发布!全栈天气预测新纪元!🚀
01-27 NVIDIA Earth-2 天气预报
[自动] [HACKER_NEWS]
3minnewspaper 🧠炸裂!Gemini Flash在俄罗斯大战Opus胜率66%!🚀
01-27 Gemini Flash Claude Opus TetrisBench
[自动] [BLOGS_PODCASTS]
4minmic 颠覆语言学习!揭秘Praktika的对话式魔法 🗣️✨
01-27 Praktika 语言学习 AI 导师
[自动] [BLOGS_PODCASTS]
3minmic 揭秘GPT-5职场革命!企业如何用它降本增效?🚀💼
01-27 GPT-5 职场应用 降本增效
[自动] [HACKER_NEWS]
3minnewspaper 我把10年Apple Watch数据扔给ChatGPT,结果惊出一身冷汗!😱🩺
01-27 ChatGPT 数据分析 健康数据
[自动] [BLOGS_PODCASTS]
3minmic Unlocking Agentic RL Training for GPT-OSS: A Practical Retrospective
01-27 Agentic RL 强化学习 GPT-OSS
[自动] [BLOGS_PODCASTS]
4minmic Higgsfield让灵感秒变大片级社媒视频!🎬✨
01-27 Higgsfield Sora GPT-4
[自动] [HACKER_NEWS]
3minnewspaper ChatGPT容器爆发!🔥能跑bash/装包/下载,代码能力狂飙!🚀
01-27 ChatGPT OpenAI 代码解释器
[自动] [BLOGS_PODCASTS]
3minmic 🌍NVIDIA Earth-2开放模型横扫气象全栈!精准预测未来!🚀
01-27 NVIDIA Earth-2 气象预测
[自动] [HACKER_NEWS]
3minnewspaper 阿里Qwen3-Max-Thinking深度思考模型!震撼发布🔥
01-27 Qwen3 通义千问 深度思考
[自动] [BLOGS_PODCASTS]
3minmic AssetOpsBench:填补AI基准与工业现实的鸿沟!🤖🏭🚀
01-27 AssetOpsBench AI Agent LLM
[自动] [ARXIV]
5minschool 🚗AgentDrive重磅发布!首个Agent推理开源自驾数据集🔥
01-27 AgentDrive 自动驾驶 Agent AI
[自动] [ARXIV]
5minschool 🚀AnyView:动态场景任意新视角合成!开创性技术突破🔥
01-27 计算机视觉 视频生成 扩散模型
[自动] [ARXIV]
6minschool 🔥自回归+掩码扩散!下一代生成模型架构强势登场!
01-27 扩散模型 自回归 语言建模
[自动] [ARXIV]
6minschool 🔥LLM训练动力学新突破!可扩展损失景观曲率度量!
01-27 LLM 训练动力学 损失景观
[自动] [ARXIV]
6minschool 🔥LLM序列标注新突破!揭秘高效策略,性能飙升!
01-27 LLM 序列标注 NLP
[自动] [ARXIV]
4minschool 🔥IoT攻击数据生成新突破!Latent Diffusion助力入侵检测🚀
01-27 IoT 入侵检测 潜在扩散模型
[自动] [BLOGS_PODCASTS]
3minmic 💥GPT-5商业实战!企业如何引爆生产力革命?🚀
01-27 GPT-5 企业应用 生产力
[自动] [BLOGS_PODCASTS]
4minmic 💡颠覆传统!Praktika对话式语言学习法,让你开口即流利!
01-27 Praktika 语言学习 GPT-4
[自动] [ARXIV]
5minschool 🌍Spatial-Agent:科学核心驱动的智能地理空间推理!🚀
01-27 Spatial-Agent Agent 地理空间推理
[自动] [BLOGS_PODCASTS]
3minmic 🌍NVIDIA Earth-2开放模型震撼发布!覆盖全气象栈,预测能力再升级!
01-27 NVIDIA Earth-2 气象预测
[自动] [BLOGS_PODCASTS]
3minmic 🌍 Edu for Countries 重磅发布!赋能国家级教育的创新方案 🚀
01-27 OpenAI 教育科技 AI教育
[自动] [HACKER_NEWS]
4minnewspaper ⚡️俄罗斯方块爆杀Opus!Gemini Flash胜率66%震撼实测🎮
01-27 LLM Gemini Flash Claude Opus
[自动] [ARXIV]
6minschool ⚛️ 基于SE(3)流的刚性 motifs 3D 分子生成!🔥
01-27 分子生成 SE(3) 等变模型
[自动] [HACKER_NEWS]
3minnewspaper 震惊!Gemini Flash击败Opus!🎮Tetris胜率66%🚀
01-27 LLM Gemini Flash Claude 3 Opus
[自动] [BLOGS_PODCASTS]
4minmic Praktika对话式语言学习:颠覆传统,高效掌握新语言!🚀🗣️
01-27 语言学习 GPT-4 AI 导师
[自动] [BLOGS_PODCASTS]
4minmic 🚀重磅!Edu for Countries 横空出世!国家级教育升级方案来了!
01-27 OpenAI 教育科技 AI教育
[自动] [HACKER_NEWS]
3minnewspaper 🚀Qwen3-Max-Thinking发布!AI推理能力炸裂升级!
01-27 Qwen3 通义千问 思维链
[自动] [BLOGS_PODCASTS]
3minmic 🚀GPT-5商用实战!企业如何用AI实现10倍效率增长?💼✨
01-27 GPT-5 企业应用 效率提升
[自动] [BLOGS_PODCASTS]
3minmic 🔥AssetOpsBench填平鸿沟!AI Agent基准测评如何真实落地工业场景?
01-27 AI Agent LLM 基准测试
[自动] [BLOGS_PODCASTS]
3minmic 💥从创意到大片级社媒视频!Higgsfield如何颠覆视频制作?🎥✨
01-27 Higgsfield 视频生成 Sora 2
[自动] [ARXIV]
4minschool 🧬重磅!基于SE(3)流的刚体模态3D分子生成!
01-26 3D分子生成 SE(3)流 刚体模态
[自动] [HACKER_NEWS]
4minnewspaper 谷歌健康搜索惊现YouTube>医疗网站?AI Overview引争议!🤖🏥
01-26 Google AI Overview 搜索
[自动] [BLOGS_PODCASTS]
2minmic 终结能力过剩!国家如何解锁科技潜力?🔓🚀
01-26 AI 生产力 国家战略
[自动] [BLOGS_PODCASTS]
2minmic 告别无序扩张!🚀实现高质量规模化增长,拒绝平庸!
01-26 规模化 高质量增长 2026计划
[自动] [BLOGS_PODCASTS]
3minmic Praktika的对话式语言学习法!沉浸式互动,轻松掌握语言 🗣️✨
01-26 Praktika 语言学习 GPT-4
[自动] [BLOGS_PODCASTS]
3minmic AssetOpsBench:打破AI Agent评测与工业现实的壁垒!🚀
01-26 AI Agent AssetOpsBench 工业智能
[自动] [ARXIV]
5minschool AgentDrive:首个开放基准!🚗 LLM生成场景驱动Agent智能推理
01-26 AgentDrive 自动驾驶 基准测试
[自动] [ARXIV]
5minschool 🚀动态场景新视角合成!AnyView实现任意视角自由切换!🤯
01-26 动态场景 新视角合成 扩散模型
[自动] [HACKER_NEWS]
3minnewspaper 🚀OracleGPT震撼实验:AI能否成为下一代超级高管?
01-26 OracleGPT AI Agent 企业管理
[自动] [ARXIV]
5minschool 🚀 自回归+掩码扩散:下一代生成式AI!🔥
01-26 扩散模型 自回归 生成式AI
[自动] [BLOGS_PODCASTS]
4minmic 🚀 GPT-5职场革命!企业如何用它10倍提升生产力?
01-26 GPT-5 ChatGPT 企业应用
[自动] [HACKER_NEWS]
3minnewspaper 🔥Qwen3-Max-Thinking!深度推理颠覆想象!
01-26 Qwen 通义千问 深度推理
[自动] [ARXIV]
5minschool 🔥LLM训练动力学新突破!可扩展损失景观曲率度量🚀
01-26 LLM 训练动力学 损失景观
[自动] [ARXIV]
5minschool 🔥LLM序列标注新策略!突破性能天花板🚀
01-26 LLM 序列标注 NER
[自动] [BLOGS_PODCASTS]
4minmic 🌍英伟达Earth-2开放模型震撼登场!🚀全栈天气预测彻底变革
01-26 NVIDIA Earth-2 天气预报
[自动] [BLOGS_PODCASTS]
3minmic 🌍 重磅!Edu for Countries 革命性教育解决方案,赋能国家未来!🚀
01-26 OpenAI 教育 政府合作
[自动] [ARXIV]
5minschool 🌍 Spatial-Agent:具科学核心的智能体地理空间推理!
01-26 Spatial-Agent 地理空间推理 GeoFlow Graphs
[自动] [HACKER_NEWS]
3minnewspaper ⚡️震惊!仅1个LLL就能控制无人机?AI飞行革命来了!🚀
01-26 LLM GPT-4o 无人机
[自动] [HACKER_NEWS]
3minnewspaper 震惊!仅1个大模型能操控无人机!🚀🤯
01-26 LLM AI Agent 无人机
[自动] [HACKER_NEWS]
4minnewspaper Google震惊!健康查询竟引YouTube胜过医疗网站?🏥📹
01-26 Google AI Overviews 搜索
[自动] [BLOGS_PODCASTS]
4minmic 🗣️告别死记硬背!Praktika对话式语言学习:开口就能流利说!
01-26 语言学习 AI 导师 GPT-4
[自动] [BLOGS_PODCASTS]
2minmic 终结能力过剩!国家如何破局?🚀💡
01-26 AI LLM 国家战略
[自动] [BLOGS_PODCASTS]
3minmic 告别混乱扩张!🚀 系统化规模化:精准、高效、可复制!🎯
01-26 Latent Space Scaling 2026计划
[自动] [BLOGS_PODCASTS]
3minmic 一秒变大片!🎬Higgsfield:让创意瞬间炸裂社交媒体!🚀
01-26 Higgsfield 视频生成 Sora 2
[自动] [BLOGS_PODCASTS]
3minmic AssetOpsBench:AI Agent基准测试与工业现实鸿沟如何跨越?🤖🔥
01-26 AI Agent 基准测试 工业运维
[自动] [BLOGS_PODCASTS]
3minmic 🚀Horizon 1000:颠覆基层医疗!AI如何重塑未来?
01-26 OpenAI 盖茨基金会 Horizon 1000
[自动] [HACKER_NEWS]
3minnewspaper 🔍 深度拆解:AI伪造数学证明的惊人真相!🚀
01-26 LLM 幻觉 数学证明
[自动] [HACKER_NEWS]
3minnewspaper 💥文本为王!揭秘AI时代最被低估的核心价值!
01-26 LLM RAG 语义检索
[自动] [BLOGS_PODCASTS]
3minmic 🌍 重磅!Edu for Countries:赋能国家级教育的未来!
01-26 OpenAI 教育科技 国家战略
[自动] [HACKER_NEWS]
3minnewspaper 🤖AI竟伪造数学证明?深扒“创意数学”背后的惊人真相!
01-26 AI 数学证明 形式化验证
[自动] [ARXIV]
6minschool 🤖抽屉打不开?揭秘零样本组合动作识别中的“物体捷径”!
01-25 计算机视觉 零样本学习 动作识别
[自动] [ARXIV]
4minschool 🤖反事实训练!让模型学会靠谱又可落地的解释!
01-25 反事实训练 模型解释性 可解释AI
[自动] [ARXIV]
4minschool 🛡️多模态大模型鲁棒性突破!特征空间平滑实现可证防御!
01-25 多模态大模型 鲁棒性 对抗攻击
[自动] [ARXIV]
7minschool 高效定理证明新突破!结构化提示实现少样本学习 🚀
01-25 定理证明 Lean DeepSeek-Prover
[自动] [ARXIV]
3minschool 超越预测不确定性!🚀结构约束下的可靠表征学习!🔥
01-25 表征学习 不确定性 结构约束
[自动] [BLOGS_PODCASTS]
2minmic 终结能力过剩!国家如何打破增长瓶颈?🔥🚀
01-25 AI应用 生产力 国家战略
[自动] [ARXIV]
4minschool 测试时也能发现新规律?🤯AI解锁动态学习能力!
01-25 TTT-Discover 测试时训练 强化学习
[自动] [BLOGS_PODCASTS]
3minmic 揭秘GPT-5如何颠覆职场!企业实战应用全解析🚀💼
01-25 GPT-5 企业应用 职场效率
[自动] [BLOGS_PODCASTS]
3minmic Praktika对话式语言学习:颠覆传统,AI对话让你轻松开口!🗣️✨
01-25 语言学习 GPT-4 GPT-5
[自动] [HACKER_NEWS]
4minnewspaper David Patterson重磅:LLM推理硬件的挑战与研究🚀!
01-25 LLM推理 硬件架构 David Patterson
[自动] [ARXIV]
5minschool Cosmos重磅:微调视频模型!解锁 visuomotor 控制与规划 🚀✨
01-25 Cosmos 机器人 视觉运动控制
[自动] [ARXIV]
5minschool 🚀沙盒机制唤醒LLM智能体通用能力!AI Agent突破性架构!
01-25 LLM AI Agent 沙盒机制
[自动] [BLOGS_PODCASTS]
3minmic 🚀Horizon 1000:AI如何引爆基层医疗革命?💡
01-25 OpenAI 盖茨基金会 Horizon 1000
[自动] [BLOGS_PODCASTS]
3minmic 🚀 国家级教育升级!Edu for Countries:开启智慧教育新时代!
01-25 OpenAI 教育科技 智慧教育
[自动] [ARXIV]
5minschool 🔥PyraTok!视频生成神器:语言对齐金字塔Tokenizer震撼来袭!
01-25 PyraTok 视频生成 视频理解
[自动] [HACKER_NEWS]
3minnewspaper 🔥 视频修复难题:如何攻克时间一致性?
01-25 视频修复 时序一致性 光流
[自动] [BLOGS_PODCASTS]
4minmic 🎬 Higgsfield:让简单idea秒变电影级社媒大片!✨
01-25 Higgsfield 视频生成 Sora 2