terminal

AI Stack

rss_feed
SYS_STABLE
目录

推理能力

条目:50
2026年二月 37 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-24 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-24 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-23 First Proof 数学证明 推理能力
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍
02-23 Gemini 3.1 Pro Google ARC-AGI 2
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍
02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-23 First Proof 数学证明 推理能力
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro:面向复杂任务的深度解答模型
02-23 Gemini Google LLM
[自动] [BLOGS_PODCASTS]
4minmic Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍
02-23 Gemini 3.1 Pro Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-22 AI模型 First Proof 数学挑战
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro:面向复杂任务设计的智能模型
02-21 Gemini Google LLM
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-21 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro:面向复杂任务的高性能模型
02-21 Gemini Google LLM
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro:专为复杂任务设计的智能模型
02-20 Gemini Google LLM
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro:专为复杂任务设计的智能模型
02-19 Gemini Google LLM
[自动] [JUEJIN]
3minsticky_note_2 大模型AI编程实测:Opus 4.6与K2.5等模型排序对比
02-19 AI编程 模型测评 Claude
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新结果
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
3minnewspaper G
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理领域新成果
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新成果
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新结果
02-13 GPT-5.2 理论物理 AI for Science
[自动] [HACKER_NEWS]
4minnewspaper Gemini 3 Deep Think 推出:强化长思维链推理能力
02-13 Gemini 3 Deep Think Google
[自动] [HACKER_NEWS]
4minnewspaper Gemini 3 Deep Think 发布:强化深度推理能力
02-13 Gemini 3 Deep Think Google
[自动] [ARXIV]
4minschool 长思维链监督微调中数据重复优于数据扩展
02-13 长思维链 监督微调 数据重复
[自动] [HACKER_NEWS]
4minnewspaper Gemini 3 Deep Think 模式发布:强化推理能力
02-13 Gemini 3 Deep Think 推理能力
[自动] [BLOGS_PODCASTS]
3minmic 专家具备世界模型而LLM仅拥有词模型
02-09 LLM 世界模型 词模型
[自动] [HACKER_NEWS]
3minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-09 世界模型 词模型 LLM
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-09 世界模型 词模型 LLM
[自动] [HACKER_NEWS]
3minnewspaper 停止生成,开始思考:大模型推理能力进化路径
02-09 LLM 推理能力 思维链
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-08 LLM 世界模型 词模型
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-08 世界模型 词模型 LLM
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型而LLM仅依赖词模型
02-07 世界模型 LLM 词模型
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.3-Codex系统卡:融合前沿代码性能与推理能力
02-06 GPT-5.3 Codex 代码模型
[自动] [HACKER_NEWS]
7minnewspaper Claude Opus 4.6 发布:上下文窗口与推理能力提升
02-06 Claude Opus 4.6 LLM
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.3-Codex:结合前沿编码性能与推理能力的代理式模型
02-05 GPT-5.3 Codex Agent
[自动] [ARXIV]
4minschool 加速科学研究:Gemini 案例研究与通用技术
02-05 Gemini 科学研究 数学发现
[自动] [BLOGS_PODCASTS]
3minmic Context Graphs与Agent Traces技术解析
02-04 Context Graphs Agent Traces LLM
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 内部数据智能体:结合 GPT‑5 与记忆快速分析海量数据集
02-02 OpenAI GPT-5 Codex
2026年一月 13 篇
类型阅读条目
[自动] [HACKER_NEWS]
5minnewspaper Kimi k2.5 技术报告发布:长上下文与推理能力详解
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:长上下文与多模态推理能力详解
01-31 Kimi K2.5 技术报告 长上下文
[自动] [HACKER_NEWS]
7minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-30 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
6minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-30 Kimi K2.5 技术报告 长上下文
[自动] [ARXIV]
4minschool SokoBench:评估大模型长周期规划与推理能力
01-30 SokoBench 长周期规划 推理能力
[自动] [ARXIV]
4minschool SokoBench:评估大模型长程规划与推理能力
01-29 SokoBench 长程规划 推理能力
[自动] [BLOGS_PODCASTS]
3minmic OpenAI内部数据代理:结合GPT‑5与记忆快速分析海量数据
01-29 OpenAI GPT-5 Codex
[自动] [ARXIV]
4minschool 🔥模型自学革命!突破可学习性边界,推理能力暴涨!
01-28 SOAR 强化学习 推理能力
[自动] [BLOGS_PODCASTS]
4minmic 实战复盘:解锁GPT-OSS智能体强化训练!🚀
01-27 强化学习 智能体 模型蒸馏
[自动] [ARXIV]
4minschool 🔥POPE:用特权探索让AI学会解决复杂难题!
01-27 强化学习 LLM 推理能力
[自动] [HACKER_NEWS]
3minnewspaper 震惊!Gemini Flash击败Opus!🎮Tetris胜率66%🚀
01-27 LLM Gemini Flash Claude 3 Opus
[自动] [HACKER_NEWS]
3minnewspaper 🚀Qwen3-Max-Thinking发布!AI推理能力炸裂升级!
01-27 Qwen3 通义千问 思维链