目录
GPQA
条目:3
2026年三月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
Reasoning Theater:解耦模型信念与思维链 03-06
CoT
思维链
推理模型 |
2026年二月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
长思维链监督微调中数据重复优于数据扩展 02-13
长思维链
监督微调
数据重复 |
[自动]
[ARXIV] | 3min | school
长思维链监督微调中数据重复优于数据扩展 02-12
长思维链
监督微调
数据重复 |
无匹配条目