terminal

AI Stack

rss_feed
SYS_STABLE
目录

树搜索

条目:6
2026年三月 4 篇
类型阅读条目
[自动] [HACKER_NEWS]
1minnewspaper 基于PPO的树搜索蒸馏优化语言模型
03-15 PPO 强化学习 模型蒸馏
[自动] [HACKER_NEWS]
1minnewspaper 基于PPO的树搜索蒸馏技术优化语言模型
03-15 PPO 树搜索 模型蒸馏
[自动] [HACKER_NEWS]
1minnewspaper 基于PPO的树搜索蒸馏优化语言模型
03-15 PPO 强化学习 树搜索
[自动] [HACKER_NEWS]
1minnewspaper 基于PPO的树搜索蒸馏技术优化语言模型
03-15 PPO 强化学习 树搜索
2026年二月 2 篇
类型阅读条目
[自动] [ARXIV]
4minschool UPA:基于树搜索与筛选的无监督提示代理
02-03 Prompt优化 UPA 无监督学习
[自动] [ARXIV]
4minschool UPA:基于树搜索与筛选的无监督提示智能体
02-02 Prompt优化 LLM智能体 无监督学习