terminal

AI Stack

rss_feed
SYS_STABLE
目录

探索与利用

条目:5
2026年三月 1 篇
类型阅读条目
[自动] [ARXIV]
4minschool Conformal Policy Control:基于保形预测的策略控制方法
03-04 保形预测 策略控制 RL
2026年二月 3 篇
类型阅读条目
[自动] [ARXIV]
4minschool 好奇心即知识:基于主动推理的自一致学习与无遗憾优化
02-09 主动推理 好奇心 自一致学习
[自动] [ARXIV]
4minschool 好奇心即知识:基于主动推理的自一致学习与无悔优化
02-08 主动推理 好奇心 探索与利用
[自动] [ARXIV]
3minschool 好奇心即知识:基于主动推理的自一致学习与无遗憾优化
02-06 主动推理 探索与利用 自由能
2026年一月 1 篇
类型阅读条目
[自动] [ARXIV]
3minschool 基于经验的试错算法超越语言模型
01-30 LLM SCOUT 探索与利用