推理能力

条目：50

2026年二月 37 篇

类型	阅读	条目
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro发布：ARC-AGI 2得分达3.0两倍 02-24 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro发布：ARC-AGI 2得分达3.0两倍 02-24 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型针对First Proof数学挑战的证明尝试 02-23 First Proof 数学证明推理能力
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro 发布：ARC-AGI 2 得分达 3.0 两倍 02-23 Gemini 3.1 Pro Google ARC-AGI 2
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro发布：ARC-AGI 2评测分数达3.0两倍 02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型针对First Proof数学挑战的证明尝试 02-23 First Proof 数学证明推理能力
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro：面向复杂任务的深度解答模型 02-23 Gemini Google LLM
[自动] [BLOGS_PODCASTS]	4min	mic Gemini 3.1 Pro 发布：ARC-AGI 2 得分达 3.0 两倍 02-23 Gemini 3.1 Pro Google ARC-AGI
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型在First Proof数学挑战中的证明尝试 02-22 AI模型 First Proof 数学挑战
[自动] [BLOGS_PODCASTS]	2min	mic Gemini 3.1 Pro：面向复杂任务设计的智能模型 02-21 Gemini Google LLM
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro发布：ARC-AGI 2得分达3.0两倍 02-21 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]	2min	mic Gemini 3.1 Pro：面向复杂任务的高性能模型 02-21 Gemini Google LLM
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro：专为复杂任务设计的智能模型 02-20 Gemini Google LLM
[自动] [BLOGS_PODCASTS]	2min	mic Gemini 3.1 Pro：专为复杂任务设计的智能模型 02-19 Gemini Google LLM
[自动] [JUEJIN]	3min	sticky_note_2 大模型AI编程实测：Opus 4.6与K2.5等模型排序对比 02-19 AI编程模型测评 Claude
[自动] [HACKER_NEWS]	4min	newspaper GPT-5.2 推导出理论物理新结果 02-14 GPT-5.2 理论物理科学发现
[自动] [HACKER_NEWS]	3min	newspaper G 02-14 GPT-5.2 理论物理科学发现
[自动] [HACKER_NEWS]	4min	newspaper GPT-5.2 推导出理论物理领域新成果 02-14 GPT-5.2 理论物理科学发现
[自动] [HACKER_NEWS]	4min	newspaper GPT-5.2 推导出理论物理新成果 02-14 GPT-5.2 理论物理科学发现
[自动] [HACKER_NEWS]	4min	newspaper GPT-5.2 推导出理论物理新结果 02-13 GPT-5.2 理论物理 AI for Science
[自动] [HACKER_NEWS]	4min	newspaper Gemini 3 Deep Think 推出：强化长思维链推理能力 02-13 Gemini 3 Deep Think Google
[自动] [HACKER_NEWS]	4min	newspaper Gemini 3 Deep Think 发布：强化深度推理能力 02-13 Gemini 3 Deep Think Google
[自动] [ARXIV]	4min	school 长思维链监督微调中数据重复优于数据扩展 02-13 长思维链监督微调数据重复
[自动] [HACKER_NEWS]	4min	newspaper Gemini 3 Deep Think 模式发布：强化推理能力 02-13 Gemini 3 Deep Think 推理能力
[自动] [BLOGS_PODCASTS]	3min	mic 专家具备世界模型而LLM仅拥有词模型 02-09 LLM 世界模型词模型
[自动] [HACKER_NEWS]	3min	newspaper 专家具备世界模型，大语言模型仅有词模型 02-09 世界模型词模型 LLM
[自动] [HACKER_NEWS]	4min	newspaper 专家具备世界模型，大语言模型仅有词模型 02-09 世界模型词模型 LLM
[自动] [HACKER_NEWS]	3min	newspaper 停止生成，开始思考：大模型推理能力进化路径 02-09 LLM 推理能力思维链
[自动] [HACKER_NEWS]	4min	newspaper 专家具备世界模型，大语言模型仅有词模型 02-08 LLM 世界模型词模型
[自动] [HACKER_NEWS]	4min	newspaper 专家具备世界模型，大语言模型仅有词模型 02-08 世界模型词模型 LLM
[自动] [BLOGS_PODCASTS]	3min	mic 专家依赖世界模型而LLM仅依赖词模型 02-07 世界模型 LLM 词模型
[自动] [BLOGS_PODCASTS]	3min	mic GPT-5.3-Codex系统卡：融合前沿代码性能与推理能力 02-06 GPT-5.3 Codex 代码模型
[自动] [HACKER_NEWS]	7min	newspaper Claude Opus 4.6 发布：上下文窗口与推理能力提升 02-06 Claude Opus 4.6 LLM
[自动] [BLOGS_PODCASTS]	3min	mic GPT-5.3-Codex：结合前沿编码性能与推理能力的代理式模型 02-05 GPT-5.3 Codex Agent
[自动] [ARXIV]	4min	school 加速科学研究：Gemini 案例研究与通用技术 02-05 Gemini 科学研究数学发现
[自动] [BLOGS_PODCASTS]	3min	mic Context Graphs与Agent Traces技术解析 02-04 Context Graphs Agent Traces LLM
[自动] [BLOGS_PODCASTS]	3min	mic OpenAI 内部数据智能体：结合 GPT‑5 与记忆快速分析海量数据集 02-02 OpenAI GPT-5 Codex

2026年一月 13 篇

类型	阅读	条目
[自动] [HACKER_NEWS]	5min	newspaper Kimi k2.5 技术报告发布：长上下文与推理能力详解 01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]	4min	newspaper Kimi K2.5 技术报告发布：长上下文与多模态推理能力详解 01-31 Kimi K2.5 技术报告长上下文
[自动] [HACKER_NEWS]	7min	newspaper Kimi K2.5 技术报告发布：长上下文与推理能力升级 01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]	4min	newspaper Kimi K2.5 技术报告发布：长上下文与推理能力升级 01-30 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]	6min	newspaper Kimi K2.5 技术报告发布：长上下文与推理能力升级 01-30 Kimi K2.5 技术报告长上下文
[自动] [ARXIV]	4min	school SokoBench：评估大模型长周期规划与推理能力 01-30 SokoBench 长周期规划推理能力
[自动] [ARXIV]	4min	school SokoBench：评估大模型长程规划与推理能力 01-29 SokoBench 长程规划推理能力
[自动] [BLOGS_PODCASTS]	3min	mic OpenAI内部数据代理：结合GPT‑5与记忆快速分析海量数据 01-29 OpenAI GPT-5 Codex
[自动] [ARXIV]	4min	school 🔥模型自学革命！突破可学习性边界，推理能力暴涨！ 01-28 SOAR 强化学习推理能力
[自动] [BLOGS_PODCASTS]	4min	mic 实战复盘：解锁GPT-OSS智能体强化训练！🚀 01-27 强化学习智能体模型蒸馏
[自动] [ARXIV]	4min	school 🔥POPE：用特权探索让AI学会解决复杂难题！ 01-27 强化学习 LLM 推理能力
[自动] [HACKER_NEWS]	3min	newspaper 震惊！Gemini Flash击败Opus！🎮Tetris胜率66%🚀 01-27 LLM Gemini Flash Claude 3 Opus
[自动] [HACKER_NEWS]	3min	newspaper 🚀Qwen3-Max-Thinking发布！AI推理能力炸裂升级！ 01-27 Qwen3 通义千问思维链