目录
推理能力
条目:50
2026年二月
37 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-24
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-24
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-23
First Proof
数学证明
推理能力 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍 02-23
Gemini 3.1 Pro
Google
ARC-AGI 2 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍 02-23
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-23
First Proof
数学证明
推理能力 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro:面向复杂任务的深度解答模型 02-23
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍 02-23
Gemini 3.1 Pro
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-22
AI模型
First Proof
数学挑战 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro:面向复杂任务设计的智能模型 02-21
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-21
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro:面向复杂任务的高性能模型 02-21
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro:专为复杂任务设计的智能模型 02-20
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro:专为复杂任务设计的智能模型 02-19
Gemini
Google
LLM |
[自动]
[JUEJIN] | 3min | sticky_note_2
大模型AI编程实测:Opus 4.6与K2.5等模型排序对比 02-19
AI编程
模型测评
Claude |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新结果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 3min | newspaper
G 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理领域新成果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新成果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新结果 02-13
GPT-5.2
理论物理
AI for Science |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 推出:强化长思维链推理能力 02-13
Gemini 3
Deep Think
Google |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 发布:强化深度推理能力 02-13
Gemini 3
Deep Think
Google |
[自动]
[ARXIV] | 4min | school
长思维链监督微调中数据重复优于数据扩展 02-13
长思维链
监督微调
数据重复 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 模式发布:强化推理能力 02-13
Gemini 3
Deep Think
推理能力 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家具备世界模型而LLM仅拥有词模型 02-09
LLM
世界模型
词模型 |
[自动]
[HACKER_NEWS] | 3min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-09
世界模型
词模型
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-09
世界模型
词模型
LLM |
[自动]
[HACKER_NEWS] | 3min | newspaper
停止生成,开始思考:大模型推理能力进化路径 02-09
LLM
推理能力
思维链 |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-08
LLM
世界模型
词模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-08
世界模型
词模型
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型而LLM仅依赖词模型 02-07
世界模型
LLM
词模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.3-Codex系统卡:融合前沿代码性能与推理能力 02-06
GPT-5.3
Codex
代码模型 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Claude Opus 4.6 发布:上下文窗口与推理能力提升 02-06
Claude
Opus 4.6
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.3-Codex:结合前沿编码性能与推理能力的代理式模型 02-05
GPT-5.3
Codex
Agent |
[自动]
[ARXIV] | 4min | school
加速科学研究:Gemini 案例研究与通用技术 02-05
Gemini
科学研究
数学发现 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Context Graphs与Agent Traces技术解析 02-04
Context Graphs
Agent Traces
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 内部数据智能体:结合 GPT‑5 与记忆快速分析海量数据集 02-02
OpenAI
GPT-5
Codex |
2026年一月
13 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 5min | newspaper
Kimi k2.5 技术报告发布:长上下文与推理能力详解 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:长上下文与多模态推理能力详解 01-31
Kimi K2.5
技术报告
长上下文 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-30
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 6min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-30
Kimi K2.5
技术报告
长上下文 |
[自动]
[ARXIV] | 4min | school
SokoBench:评估大模型长周期规划与推理能力 01-30
SokoBench
长周期规划
推理能力 |
[自动]
[ARXIV] | 4min | school
SokoBench:评估大模型长程规划与推理能力 01-29
SokoBench
长程规划
推理能力 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI内部数据代理:结合GPT‑5与记忆快速分析海量数据 01-29
OpenAI
GPT-5
Codex |
[自动]
[ARXIV] | 4min | school
🔥模型自学革命!突破可学习性边界,推理能力暴涨! 01-28
SOAR
强化学习
推理能力 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
实战复盘:解锁GPT-OSS智能体强化训练!🚀 01-27
强化学习
智能体
模型蒸馏 |
[自动]
[ARXIV] | 4min | school
🔥POPE:用特权探索让AI学会解决复杂难题! 01-27
强化学习
LLM
推理能力 |
[自动]
[HACKER_NEWS] | 3min | newspaper
震惊!Gemini Flash击败Opus!🎮Tetris胜率66%🚀 01-27
LLM
Gemini Flash
Claude 3 Opus |
[自动]
[HACKER_NEWS] | 3min | newspaper
🚀Qwen3-Max-Thinking发布!AI推理能力炸裂升级! 01-27
Qwen3
通义千问
思维链 |
无匹配条目