terminal

AI Stack

rss_feed
SYS_STABLE
目录

Agent

条目:506
2026年四月 1 篇
类型阅读条目
[自动] [JUEJIN]
1minsticky_note_2 ReAct让大模型掌握边想边做的循环机制
04-12 ReAct LLM 推理链
2026年三月 191 篇
类型阅读条目
[自动] [JUEJIN]
1minsticky_note_2 自然语言控制AI操作网页,告别重复点击
03-20 AI自动化 自然语言交互 网页操作
[自动] [BLOGS_PODCASTS]
2minmic Holotron-12B:高吞吐率计算机使用智能体
03-18 Holotron 智能体 计算机使用
[自动] [BLOGS_PODCASTS]
2minmic Holotron-12B:高吞吐率计算机使用智能体
03-18 Holotron 智能体 Computer Use
[自动] [ARXIV]
3minschool Chronos:基于结构化事件检索的时序感知对话智能体
03-18 LLM Agent RAG
[自动] [ARXIV]
4minschool OpenSeeker: Democratizing Frontier Search Agents by Ful
03-18 OpenSeeker 搜索代理 数据集开源
[自动] [BLOGS_PODCASTS]
1minmic Holotron-12B:高吞吐率计算机使用智能体
03-17 Holotron 智能体 Computer Use
[自动] [BLOGS_PODCASTS]
2minmic Holotron-12B:高吞吐率计算机操作智能体
03-17 Holotron 计算机操作 Agent
[自动] [HACKER_NEWS]
1minnewspaper AI 智能体三月挑战赛
03-17 AI智能体 LLM 挑战赛
[自动] [JUEJIN]
2minsticky_note_2 从LLM到Agent:一文拆解AI核心概念与演进
03-17 LLM Agent Prompt
[自动] [HACKER_NEWS]
2minnewspaper AI 智能体三月挑战赛
03-17 AI 智能体 LLM Agent
[自动] [BLOGS_PODCASTS]
2minmic Holotron-12B:高吞吐率计算机使用智能体
03-17 Holotron-12B Computer Use 智能体
[自动] [BLOGS_PODCASTS]
3minmic RAG后的检索:混合搜索、Agent与数据库设计
03-17 RAG 混合搜索 Agent
[自动] [JUEJIN]
2minsticky_note_2 零基础学 Agent :拆解一个 Agent 的「零件清单」——8 个模块逐一讲透 第 2 期
03-17 Agent LLM RAG
[自动] [JUEJIN]
2minsticky_note_2 MiniMax M2.5:108天极速迭代,MoE与Agent原生架构重塑全球AI格局
03-17 MiniMax M2.5 MoE
[自动] [BLOGS_PODCASTS]
3minmic Turbopuffer 探讨 RAG 后的混合检索、Agent 与数据库设计
03-17 RAG 混合检索 向量数据库
[自动] [BLOGS_PODCASTS]
3minmic RAG后的检索策略:混合搜索与Agent及数据库设计
03-16 RAG 混合搜索 向量数据库
[自动] [ARXIV]
2minschool 从实验到专家:AI计算研究中的科学知识整合
03-16 AI for Science LLM Agent
[自动] [ARXIV]
3minschool Semantic Invariance in Agentic AI
03-16 Agentic AI 语义不变性 Agent
[自动] [JUEJIN]
2minsticky_note_2 阿里云通义实验室发布2026年开源个人AI助手CoPaw
03-16 CoPaw 通义实验室 阿里云
[自动] [HACKER_NEWS]
1minnewspaper Agent Skills:面向智能体的开放安全数据库
03-16 Agent 智能体 安全数据库
[自动] [BLOGS_PODCASTS]
2minmic Replit Agent 4:面向知识工作的智能体
03-16 Replit Agent AI智能体
[自动] [BLOGS_PODCASTS]
2minmic RAG后的检索优化:混合搜索、Agent与数据库设计
03-16 RAG 混合搜索 向量数据库
[自动] [GITHUB_TRENDING]
7minhub AstrBot:集成多平台与大语言模型的智能聊天机器人基础设施
03-16 AstrBot 聊天机器人 LLM
[自动] [JUEJIN]
3minsticky_note_2 基于 LangChain.js 与 ReAct 循环实现 AI 编程助手
03-16 LangChain.js ReAct AI 编程助手
[自动] [HACKER_NEWS]
1minnewspaper 什么是智能体工程:定义、架构与应用场景
03-16 智能体 Agent 架构设计
[自动] [BLOGS_PODCASTS]
2minmic RAG之后的检索:混合搜索、Agent与数据库设计
03-15 RAG 混合搜索 Agent
[自动] [GITHUB_TRENDING]
2minhub AstrBot:集成多IM与大模型的智能聊天机器人基础设施
03-15 AstrBot 聊天机器人 LLM
[自动] [JUEJIN]
1minsticky_note_2 Claude Skills 与 Prompt 的区别:可复用工作流封装与代码审查实践
03-15 Claude Claude Skills Prompt
[自动] [JUEJIN]
3minsticky_note_2 前端 Agent 工作流编排:Tool 注册、思维链可视化与实时 DAG 渲染
03-15 LangChain.js Agent 工作流编排
[自动] [GITHUB_TRENDING]
1minhub langbot-app / LangBot
03-15 LangBot Agent Python
[自动] [GITHUB_TRENDING]
2minhub Kirara-AI:多模态聊天机器人框架,支持多平台接入与工作流
03-15 LLM 聊天机器人 多模态
[自动] [JUEJIN]
2minsticky_note_2 Codex 工程化实践:解析 AGENTS.md、SKILL.md 与 MCP
03-15 Codex MCP Model Context Protocol
[自动] [BLOGS_PODCASTS]
2minmic Replit Agent 4:面向知识工作的智能体
03-14 Replit Agent 智能体
[自动] [BLOGS_PODCASTS]
2minmic RAG后的检索:混合搜索、Agent与数据库设计
03-14 RAG 混合搜索 向量检索
[自动] [GITHUB_TRENDING]
2minhub AstrBot:集成多平台与大模型的智能聊天机器人基础设施
03-14 AstrBot 聊天机器人 LLM
[自动] [BLOGS_PODCASTS]
3minmic RAG后的检索:混合搜索、Agent与数据库设计
03-14 RAG 混合搜索 向量检索
[自动] [JUEJIN]
2minsticky_note_2 AI编程工具普及:从传统职能转向Agent工程师
03-14 Agent AI 编程 Claude Code
[自动] [HACKER_NEWS]
1minnewspaper 面向智能代理的内容优化策略
03-14 智能代理 Agent 内容优化
[自动] [GITHUB_TRENDING]
2minhub 基于大模型的AI助理CowAgent:支持主动思考与多平台接入
03-14 LLM Agent Python
[自动] [GITHUB_TRENDING]
7minhub LangBot:支持多平台接入的生产级智能代理机器人开发框架
03-14 LangBot 智能代理 Agent
[自动] [GITHUB_TRENDING]
2minhub AstrBot:集成多平台与 LLM 的智能体 IM 机器人基础设施
03-14 AstrBot 聊天机器人 LLM
[自动] [HACKER_NEWS]
1minnewspaper 面向AI代理的内容优化策略
03-14 AI代理 内容优化 LLM
[自动] [HACKER_NEWS]
1minnewspaper Optimizing Content for Agents
03-14 Agent 内容优化 AI交互
[自动] [HACKER_NEWS]
1minnewspaper Context Gateway:在LLM前压缩Agent上下文
03-14 LLM Agent 上下文压缩
[自动] [BLOGS_PODCASTS]
2minmic RAG后的检索优化:混合搜索、Agent与数据库设计
03-13 RAG 混合搜索 Agent
[自动] [GITHUB_TRENDING]
2minhub LangBot:支持多平台接入的生产级智能代理机器人开发平台
03-13 LangBot 智能代理 Agent
[自动] [GITHUB_TRENDING]
1minhub ChatGPT-on-WeChat:接入多平台的大模型AI助理框架
03-13 ChatGPT AI助理 Agent
[自动] [GITHUB_TRENDING]
2minhub AstrBot:集成多平台与大模型的IM聊天机器人基础设施
03-13 AstrBot 聊天机器人 LLM
[自动] [HACKER_NEWS]
1minnewspaper Context Gateway:压缩Agent上下文以降低LLM调用成本
03-13 LLM Agent 上下文压缩
[自动] [BLOGS_PODCASTS]
2minmic 构建可复用工具生成Agent:登顶DABStep榜单的数据科学实践
03-13 Agent 数据科学 DABStep
[自动] [BLOGS_PODCASTS]
4minmic RAG后的检索优化:混合搜索、Agent与数据库设计
03-13 RAG 混合搜索 向量检索
[自动] [HACKER_NEWS]
1minnewspaper Context Gateway:在LLM处理前压缩Agent上下文
03-13 LLM Agent 上下文压缩
[自动] [BLOGS_PODCASTS]
1minmic Replit Agent 4:面向知识工作的开发助手
03-13 Replit Agent AI 助手
[自动] [BLOGS_PODCASTS]
2minmic 构建具备数据科学家思维的Agent:可复用工具生成技术解析
03-13 Agent 数据科学 工具生成
[自动] [BLOGS_PODCASTS]
2minmic Turbopuffer 源自阅读应用的数据库设计
03-13 Turbopuffer RAG 向量数据库
[自动] [BLOGS_PODCASTS]
3minmic From model to agent: Equipping the Responses API with a
03-13 OpenAI Agent Responses API
[自动] [JUEJIN]
2minsticky_note_2 从聊天机器人到数字员工:解析AI世界的运转逻辑
03-13 LLM Agent RAG
[自动] [ARXIV]
3minschool COMIC:基于智能体的素描喜剧生成框架
03-13 COMIC Agent 多智能体
[自动] [GITHUB_TRENDING]
2minhub LangBot:生产级多平台智能体IM机器人开发平台
03-13 LangBot Agent Python
[自动] [GITHUB_TRENDING]
2minhub AstrBot:集成多平台与大模型的智能体聊天机器人基础设施
03-13 AstrBot 聊天机器人 LLM
[自动] [BLOGS_PODCASTS]
4minmic OpenAI 构建 Responses API 代理运行时:集成 Shell 与托管容器
03-12 OpenAI Responses API Agent
[自动] [GITHUB_TRENDING]
2minhub LangBot:支持多平台接入的生产级智能机器人开发平台
03-12 LangBot 智能机器人 Agent
[自动] [GITHUB_TRENDING]
7minhub AstrBot:集成多平台与大模型的智能体 IM 聊天机器人基础设施
03-12 AstrBot 聊天机器人 LLM
[自动] [HACKER_NEWS]
1minnewspaper Understudy:演示一次即可教会桌面代理执行任务
03-12 Desktop Agent Agent 自动化
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 如何利用 Responses API 构建安全可扩展的代理运行时
03-12 OpenAI Agent LLM
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA AI-Q登顶DeepResearch Bench I与II榜单
03-12 NVIDIA AI-Q DeepResearch
[自动] [HACKER_NEWS]
1minnewspaper Understudy:演示一次即可训练桌面智能体
03-12 智能体 桌面自动化 UI 交互
[自动] [BLOGS_PODCASTS]
3minmic Untitled
03-12 OpenAI Agent Responses API
[自动] [BLOGS_PODCASTS]
2minmic Replit Agent 4:面向知识工作的开发代理
03-12 Replit Agent AI Agent
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 基于 Responses API 构建智能体运行时环境
03-12 OpenAI Responses API Agent
[自动] [GITHUB_TRENDING]
8minhub LangBot:生产级多平台 IM 智能体机器人开发平台
03-12 LangBot Agent LLM
[自动] [GITHUB_TRENDING]
11minhub AstrBot:整合多平台与大模型能力的智能 IM 聊天机器人基础设施
03-12 AstrBot 聊天机器人 LLM
[自动] [HACKER_NEWS]
1minnewspaper Show HN: 面向 Claude Code 的上下文感知权限守卫
03-12 Claude Code 权限管理 上下文感知
[自动] [HACKER_NEWS]
1minnewspaper SWE-bench基准测试:多数通过评估的PR实际无法合并
03-12 SWE-bench 基准测试 代码生成
[自动] [JUEJIN]
2minsticky_note_2 大模型调用工具的原理与Agent开发基础
03-11 LLM Agent 工具调用
[自动] [BLOGS_PODCASTS]
4minmic OpenAI 基于 Responses API 构建安全可扩展的 Agent 运行时
03-11 OpenAI Agent Responses API
[自动] [GITHUB_TRENDING]
4minhub LangBot:生产级多平台 Agent IM 机器人开发平台
03-11 LangBot Agent IM机器人
[自动] [GITHUB_TRENDING]
2minhub AstrBot:集成多平台与大模型的智能体IM聊天机器人基础设施
03-11 AstrBot 聊天机器人 LLM
[自动] [BLOGS_PODCASTS]
3minmic OpenAI构建基于Responses API的代理运行时环境
03-11 OpenAI Responses API Agent
[自动] [BLOGS_PODCASTS]
3minmic NVIDIA AI 工程师探讨行星级 Agent 推理与光速计算
03-11 NVIDIA Agent 推理
[自动] [HACKER_NEWS]
1minnewspaper 探索 Agent 化 IDE 的演进方向
03-11 IDE Agent LLM
[自动] [BLOGS_PODCASTS]
4minmic OpenAI 利用 Responses API 构建具备文件与状态管理的代理运行时
03-11 OpenAI Responses API Agent
[自动] [BLOGS_PODCASTS]
2minmic 英伟达AI工程师探讨行星级Agent推理与光速计算
03-11 NVIDIA Agent 推理
[自动] [GITHUB_TRENDING]
2minhub LangBot:生产级多平台智能机器人开发平台
03-11 LangBot Python Agent
[自动] [JUEJIN]
2minsticky_note_2 我用 OpenClaw 搭建运营 Agent 实现内容自动化
03-11 OpenClaw Agent 运营自动化
[自动] [JUEJIN]
2minsticky_note_2 OpenClaw架构总览与具身智能时代的工程路径
03-11 具身智能 Agent OpenClaw
[自动] [GITHUB_TRENDING]
7minhub LangBot:生产级多平台智能 Agent 机器人开发平台
03-11 LangBot 智能体 Agent
[自动] [GITHUB_TRENDING]
2minhub CowAgent:支持多平台接入与多模态交互的自主任务规划 AI 助理
03-11 LLM Agent Python
[自动] [BLOGS_PODCASTS]
2minmic 英伟达AI工程师谈行星级Agent推理与光速计算
03-11 NVIDIA Agent 推理
[自动] [BLOGS_PODCASTS]
2minmic 英伟达工程师对话:行星级Agent推理与光速计算
03-11 NVIDIA GTC Agent
[自动] [JUEJIN]
2minsticky_note_2 OpenAI 指南:从传统编程转向 Agent 编程以提升代码质量
03-11 Agent OpenAI 编程范式
[自动] [HACKER_NEWS]
1minnewspaper 代理工程的技术层级与能力演进
03-10 Agent LLM Agentic Engineering
[自动] [GITHUB_TRENDING]
2minhub LangBot:生产级多平台 Agent IM 机器人开发平台
03-10 LangBot Agent LLM
[自动] [GITHUB_TRENDING]
1minhub CowAgent:主动思考与任务规划的AI助理,支持多平台接入
03-10 LLM Agent Python
[自动] [ARXIV]
4minschool Agentic Critical Training:基于智能体批判机制的模型训练方法
03-10 ACT Agent 强化学习
[自动] [HACKER_NEWS]
1minnewspaper 智能体工程化的能力层级划分
03-10 智能体 Agent 工程化
[自动] [BLOGS_PODCASTS]
4minmic 英伟达 AI 工程师探讨行星级智能体推理与光速计算
03-10 英伟达 NVIDIA GTC
[自动] [BLOGS_PODCASTS]
3minmic 英伟达AI工程师探讨行星级Agent推理与光速计算
03-10 NVIDIA Agent 推理
[自动] [BLOGS_PODCASTS]
4minmic 英伟达AI工程师探讨行星级智能体推理与光速计算
03-10 NVIDIA GTC 智能体
[自动] [JUEJIN]
2minsticky_note_2 OpenClaw Skill 系统设计:LLM 按需学习工作流与工具分发机制
03-10 LLM OpenClaw 系统设计
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT 5.4:集成CUA模型,实现SOTA级知识工作与编程能力
03-10 OpenAI GPT 5.4 SOTA
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布GPT 5.4:集成SOTA知识工作、编程与CUA模型
03-10 OpenAI GPT 5.4 SOTA
[自动] [BLOGS_PODCASTS]
3minmic Balyasny 基于 GPT-5.4 与 Agent 工作流构建 AI 投研引擎
03-10 Agent GPT-5.4 工作流
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布GPT 5.4:集成CUA模型刷新代码与知识工作SOTA
03-09 OpenAI GPT 5.4 CUA
[自动] [GITHUB_TRENDING]
3minhub AstrBot:集成多平台与大模型的IM聊天机器人基础设施
03-09 AstrBot 聊天机器人 LLM
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT 5.4:集成CUA模型,在知识工作与编程领域实现SOTA
03-09 OpenAI GPT 5.4 SOTA
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 发布 GPT 5.4:集成 SOTA 知识与编程能力,推出 CUA 模型
03-09 OpenAI GPT 5.4 SOTA
[自动] [HACKER_NEWS]
1minnewspaper VS Code Agent Kanban:面向 AI 辅助开发者的任务管理工具
03-09 VS Code Agent 看板
[自动] [BLOGS_PODCASTS]
3minmic Balyasny 如何利用 GPT‑5.4 与智能体工作流构建 AI 投研引擎
03-09 GPT-5.4 智能体工作流 Agent
[自动] [HACKER_NEWS]
3minnewspaper Agent Safehouse:macOS 原生沙箱技术保护本地 Agent
03-09 Agent macOS 沙箱技术
[自动] [HACKER_NEWS]
1minnewspaper VS Code Agent Kanban:面向 AI 辅助开发者的任务管理
03-09 VS Code Agent AI 辅助开发
[自动] [BLOGS_PODCASTS]
2minmic Balyasny 融合 GPT-5.4 与代理工作流构建 AI 投研引擎
03-09 LLM Agent 工作流
[自动] [HACKER_NEWS]
1minnewspaper Agent Safehouse:基于 macOS 原生沙箱的本地 Agent 隔离技术
03-09 Agent macOS 沙箱
[自动] [HACKER_NEWS]
1minnewspaper VS Code Agent Kanban:面向 AI 辅助开发者的任务管理工具
03-09 VS Code Agent 看板
[自动] [HACKER_NEWS]
1minnewspaper Agent Safehouse:利用 macOS 原生沙箱实现本地 Agent 隔离
03-09 Agent macOS 沙箱
[自动] [HACKER_NEWS]
1minnewspaper Agent Safehouse:macOS 本地 Agent 的原生沙箱方案
03-09 Agent Safehouse macOS 沙箱
[自动] [BLOGS_PODCASTS]
2minmic Balyasny 构建 AI 投研引擎:基于 GPT-5.4 与 Agent 工作流
03-09 Agent LLM GPT
[自动] [JUEJIN]
3minsticky_note_2 Agent Skills 概念解析及其在 Agent 开发中的应用
03-09 Agent LLM AI Agent
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT-5.4:百万token上下文与代码、工具调用能力升级
03-08 OpenAI GPT-5.4 LLM
[自动] [BLOGS_PODCASTS]
3minmic Balyasny 融合 GPT-5.4 与 Agent 工作流构建 AI 投研引擎
03-08 GPT-5.4 Agent 工作流
[自动] [HACKER_NEWS]
1minnewspaper Agent Safehouse:macOS 本地代理的原生沙箱方案
03-08 Agent Safehouse macOS 沙箱
[自动] [HACKER_NEWS]
1minnewspaper SWE-CI:评估 AI 智能体通过 CI 维护代码库的能力
03-08 SWE-CI AI 智能体 CI/CD
[自动] [HACKER_NEWS]
1minnewspaper SWE-CI:基于 CI 流程评估代码库维护的智能体能力
03-08 SWE-CI 智能体 CI/CD
[自动] [HACKER_NEWS]
1minnewspaper SWE-CI:基于 CI 流程评估 AI 智能体代码库维护能力
03-08 SWE-CI AI 智能体 代码评估
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT-5.4:百万token上下文,强化代码与工具调用
03-08 OpenAI GPT-5.4 LLM
[自动] [HACKER_NEWS]
1minnewspaper Autoresearch:单GPU自动训练NanoChat的研究Agent
03-08 AutoResearch Agent NanoChat
[自动] [HACKER_NEWS]
1minnewspaper 单GPU微调NanoChat:自动Agent实现端到端训练研究
03-08 微调 Agent 单GPU
[自动] [HACKER_NEWS]
1minnewspaper 单GPU训练NanoChat:自动Agent实现自主研究
03-08 Agent LLM 训练
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT-5.4:支持百万token上下文与计算机操作的前沿模型
03-07 OpenAI GPT-5.4 LLM
[自动] [JUEJIN]
2minsticky_note_2 OpenClash架构解析:节点、Canvas与子Agent设计
03-07 OpenClaw Agent 多Agent系统
[自动] [BLOGS_PODCASTS]
2minmic Balyasny 基于 GPT-5.4 与 Agent 工作流构建 AI 投研引擎
03-07 LLM Agent 工作流
[自动] [JUEJIN]
3minsticky_note_2 OpenClash 架构解析:节点、Canvas 与子 Agent 设计逻辑
03-07 OpenClaw Agent 架构设计
[自动] [JUEJIN]
2minsticky_note_2 learn-claude-code 实战:用 TodoWrite 解决长链路健忘
03-07 ClaudeCode Agent LLM
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA NeMo Evaluator:分钟级评估对话式LLM的Agent技能
03-07 NVIDIA NeMo LLM
[自动] [JUEJIN]
2minsticky_note_2 AI核心概念解析:Prompt、Agent与Function Call的区别
03-07 LLM Agent Prompt
[自动] [BLOGS_PODCASTS]
2minmic OpenAI推出GPT-5.4:支持百万token上下文与计算机操作
03-07 OpenAI GPT-5.4 LLM
[自动] [BLOGS_PODCASTS]
4minmic 在SageMaker部署SGLang并构建Strands代理自定义模型解析器
03-06 SageMaker SGLang Strands
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布GPT-5.4:百万token上下文,强化代码与工具调用
03-06 OpenAI GPT-5.4 LLM
[自动] [BLOGS_PODCASTS]
4minmic OpenAI发布GPT 5.4:集成SOTA知识工作与CUA模型
03-06 OpenAI GPT 5.4 SOTA
[自动] [BLOGS_PODCASTS]
4minmic NVIDIA NeMo Evaluator Agent Skills:分钟级评估对话式LLM
03-06 NVIDIA NeMo LLM
[自动] [BLOGS_PODCASTS]
3minmic Balyasny 借 GPT-5.4 与 Agent 工作流构建 AI 投研引擎
03-06 GPT-5.4 Agent 工作流
[自动] [GITHUB_TRENDING]
2minhub AstrBot:集成多平台与大模型的 IM 聊天机器人基础设施
03-06 AstrBot 聊天机器人 Agent
[自动] [BLOGS_PODCASTS]
2minmic OpenAI发布GPT-5.4:百万token上下文与代码操控能力
03-06 OpenAI GPT-5.4 LLM
[自动] [BLOGS_PODCASTS]
3minmic Balyasny 融合 GPT-5.4 与 Agent 工作流构建 AI 投研引擎
03-06 Agent GPT-5.4 工作流编排
[自动] [JUEJIN]
3minsticky_note_2 OpenFang:Rust 构建的 Agent 操作系统,16 层安全与 7 个自主 Hands
03-06 OpenFang Rust Agent
[自动] [GITHUB_TRENDING]
4minhub AstrBot:支持多平台与插件集成的智能体 IM 聊天机器人基础设施
03-06 AstrBot 聊天机器人 Agent
[自动] [HACKER_NEWS]
1minnewspaper Jido 2.0:基于 Elixir 的 Agent 框架
03-06 Elixir Agent Jido
[自动] [ARXIV]
3minschool 基于对抗雅可比正则化的智能体AI系统鲁棒性增强方法
03-06 鲁棒性 对抗训练 多智能体
[自动] [ARXIV]
3minschool τ-Knowledge:评估非结构化知识下的对话智能体
03-06 对话智能体 评估基准 非结构化知识
[自动] [JUEJIN]
2minsticky_note_2 OpenClaw+Opocode构建24小时云端自动化助理
03-06 Agent OpenClaw Opocode
[自动] [ARXIV]
3minschool τ-Knowledge:评估非结构化知识中的对话智能体
03-05 Agent RAG 评估基准
[自动] [JUEJIN]
2minsticky_note_2 OpenClaw + Opencode 搭建 24 小时云端数字助理
03-05 OpenClaw Opencode Agent
[自动] [HACKER_NEWS]
2minnewspaper Jido 2.0:基于 Elixir 的智能体框架
03-05 Elixir 智能体 Agent
[自动] [GITHUB_TRENDING]
2minhub AstrBot:支持多平台与大模型的智能聊天机器人基础设施
03-05 AstrBot 聊天机器人 Agent
[自动] [BLOGS_PODCASTS]
3minmic OpenAI发布GPT-5.4:百万token上下文与计算机使用能力
03-05 OpenAI GPT-5.4 LLM
[自动] [BLOGS_PODCASTS]
2minmic AI工程争议:Harness Engineering是否成立
03-05 提示词工程 LLM Agent
[自动] [HACKER_NEWS]
1minnewspaper Show HN: Jido 2.0,基于 Elixir 的 Agent 框架
03-05 Elixir Agent Jido
[自动] [JUEJIN]
2minsticky_note_2 网易有道开源LobsterAI:桌面级Agent部署与实战
03-05 LobsterAI Agent 网易有道
[自动] [JUEJIN]
2minsticky_note_2 当人类知识学会自己奔跑:Skill 属性与 AI 工程化实践
03-05 LLM Agent MCP
[自动] [ARXIV]
2minschool 研究揭示上下文压力导致智能体目标漂移
03-05 智能体 目标漂移 上下文压力
[自动] [ARXIV]
3minschool 继承性目标漂移:情境压力如何削弱智能体目标
03-04 目标漂移 Agent 鲁棒性
[自动] [HACKER_NEWS]
1minnewspaper 智能体工程模式:构建自主系统的架构设计
03-04 智能体 Agent 架构设计
[自动] [HACKER_NEWS]
1minnewspaper 智能体工程模式:构建自主系统的设计范式
03-04 智能体 Agent 设计模式
[自动] [BLOGS_PODCASTS]
4minmic Lendi 基于 Amazon Bedrock 构建智能抵押贷款助手的实践
03-04 Amazon Bedrock Agent RAG
[自动] [HACKER_NEWS]
1minnewspaper 智能体工程模式:构建自主系统的架构设计
03-04 智能体 Agent 架构设计
[自动] [HACKER_NEWS]
1minnewspaper 智能体工程模式:架构设计与核心范式
03-04 智能体 Agent 架构设计
[自动] [GITHUB_TRENDING]
2minhub CowAgent:基于大模型的主动思考型 AI 助理,支持接入多平台与多模型
03-04 LLM Agent Python
[自动] [BLOGS_PODCASTS]
4minmic 基于Bedrock和LangGraph在SageMaker AI上构建无服务器对话代理
03-04 Amazon Bedrock LangGraph SageMaker AI
[自动] [BLOGS_PODCASTS]
4minmic 基于Bedrock与LangGraph在SageMaker构建无服务器对话代理
03-04 AWS Bedrock LangGraph
[自动] [JUEJIN]
2minsticky_note_2 LangGraph核心解析:基于有向环图的状态机思维与灵活性突破
03-04 LangGraph LangChain 状态机
[自动] [JUEJIN]
3minsticky_note_2 从 Prompt 到 Agent Skill:AI 交互模式的架构设计与实现
03-03 Agent Prompt 架构设计
[自动] [GITHUB_TRENDING]
2minhub ChatGPT-on-WeChat:接入多平台与大模型的多模态AI助理框架
03-03 ChatGPT-on-WeChat CowAgent Python
[自动] [BLOGS_PODCASTS]
5minmic 基于Amazon SageMaker AI构建无服务器对话AI代理
03-03 AWS SageMaker Bedrock
[自动] [BLOGS_PODCASTS]
3minmic 在SageMaker AI上基于Bedrock与LangGraph构建无服务器对话代理
03-03 AWS Bedrock LangGraph
[自动] [BLOGS_PODCASTS]
5minmic 基于Bedrock与LangGraph构建SageMaker AI对话代理
03-03 LangGraph Bedrock SageMaker
[自动] [JUEJIN]
2minsticky_note_2 从 Prompt 到 Agent Skill:AI 能力跃迁与设计实现
03-03 Agent Prompt LLM
[自动] [GITHUB_TRENDING]
9minhub AstrBot:集成多平台与LLM的智能体IM聊天机器人基础设施
03-03 AstrBot 聊天机器人 LLM
[自动] [BLOGS_PODCASTS]
4minmic 基于Bedrock与LangGraph在SageMaker构建无服务器对话代理
03-03 AWS Bedrock LangGraph
[自动] [ARXIV]
3minschool 面向自动定理证明的最小智能体框架
03-03 自动定理证明 智能体 Agent
[自动] [ARXIV]
3minschool 面向自动定理证明的最小智能体框架
03-02 自动定理证明 Agent 最小智能体
[自动] [GITHUB_TRENDING]
2minhub AstrBot:集成多平台与大模型的可扩展 IM 聊天机器人基础设施
03-02 AstrBot 聊天机器人 LLM
[自动] [BLOGS_PODCASTS]
5minmic 基于Bedrock与LangGraph构建SageMaker无服务器AI对话代理
03-02 LangGraph Amazon Bedrock SageMaker
[自动] [GITHUB_TRENDING]
2minhub CowAgent:支持多平台接入与多模型的主动思考型 AI 助理
03-02 LLM Agent Python
[自动] [HACKER_NEWS]
1minnewspaper MCP 与 CLI 适用场景对比及决策分析
03-02 MCP CLI 工具链
[自动] [JUEJIN]
3minsticky_note_2 基于Spring AI构建类OpenClaw自主Agent的实现方案
03-02 Spring AI Agent 自主智能体
[自动] [GITHUB_TRENDING]
2minhub 基于大模型的AI助理CowAgent:多平台接入与多模型处理
03-01 LLM Agent Python
[自动] [GITHUB_TRENDING]
2minhub LangBot:支持多平台接入的生产级即时通讯机器人开发平台
03-01 LangBot Agent Python
[自动] [HACKER_NEWS]
1minnewspaper 面向智能体的音频工具包
03-01 Agent Audio TTS
[自动] [HACKER_NEWS]
1minnewspaper 面向智能体的音频工具包
03-01 Agent Audio Toolkit
[自动] [GITHUB_TRENDING]
2minhub LangBot:生产级多平台 Agent 机器人开发框架
03-01 Agent LangBot Python
[自动] [GITHUB_TRENDING]
1minhub ChatGPT-on-wechat:支持多平台接入的AI助理框架
03-01 ChatGPT-on-wechat LLM AI助理
2026年二月 277 篇
类型阅读条目
[自动] [GITHUB_TRENDING]
1minhub zhayujie/chatgpt-on-wechat:接入多平台与模型的多模态AI助手框架
02-28 ChatGPT 微信机器人 多模态
[自动] [GITHUB_TRENDING]
2minhub LangBot:生产级多平台Agent智能机器人开发平台
02-28 LangBot Agent 智能机器人
[自动] [HACKER_NEWS]
1minnewspaper Rivet Actors 集成 SQLite:实现每 Agent 单独数据库
02-28 Rivet SQLite Actors
[自动] [HACKER_NEWS]
1minnewspaper 构建智能体文明:多智能体协作系统开源
02-28 智能体 多智能体协作 Agent
[自动] [JUEJIN]
2minsticky_note_2 EverMemOS:开源Agent长时记忆系统,LoCoMo推理准确率93%
02-28 Agent 长时记忆 EverMemOS
[自动] [BLOGS_PODCASTS]
4minmic Amazon Bedrock 推出 Agent 有状态运行时环境
02-28 Amazon Bedrock Agent 有状态运行时
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova 强化微调解析:原理、应用场景与实现选项
02-28 Amazon Nova 强化微调 RFT
[自动] [GITHUB_TRENDING]
2minhub LangBot:生产级多平台智能代理机器人开发平台
02-27 LangBot 智能代理 Agent
[自动] [GITHUB_TRENDING]
1minhub CowAgent:基于大模型的自主思考与任务规划 AI 助理
02-27 LLM Agent Python
[自动] [BLOGS_PODCASTS]
3minmic Amazon Bedrock 推出 Agent 有状态运行时环境
02-27 Amazon Bedrock Agent 有状态运行时
[自动] [HACKER_NEWS]
1minnewspaper 我们构建了安全可扩展的 Agent 沙箱基础设施
02-27 Agent 沙箱 基础设施
[自动] [GITHUB_TRENDING]
2minhub 基于大模型的AI助理CowAgent:主动思考、任务规划与多平台接入
02-27 LLM Agent Python
[自动] [GITHUB_TRENDING]
2minhub LangBot:生产级多平台 Agent IM 机器人开发平台
02-27 LangBot Agent LLM
[自动] [HACKER_NEWS]
1minnewspaper Launch HN: Cardboard – 智能体视频编辑器
02-27 智能体 视频编辑 YC
[自动] [GITHUB_TRENDING]
1minhub 基于大模型的AI助理ChatGPT-on-WeChat:支持多平台接入与多模型
02-26 ChatGPT-on-WeChat LLM AI助理
[自动] [GITHUB_TRENDING]
2minhub LangBot:生产级多平台智能体开发平台
02-26 LangBot 智能体 Agent
[自动] [HACKER_NEWS]
1minnewspaper Launch HN: Cardboard – 智能体视频编辑器
02-26 智能体 视频编辑 YC
[自动] [HACKER_NEWS]
1minnewspaper Mission Control:AI 智能体开源任务管理工具
02-26 AI 智能体 任务管理 开源
[自动] [HACKER_NEWS]
1minnewspaper Beehive:多工作区智能体编排工具
02-26 Beehive Agent 编排工具
[自动] [HACKER_NEWS]
1minnewspaper Show HN: Beehive 多工作区智能体编排工具
02-26 Beehive Agent 智能体编排
[自动] [HACKER_NEWS]
1minnewspaper Mission Control:面向 AI 智能体的开源任务管理工具
02-26 AI 智能体 任务管理 开源工具
[自动] [HACKER_NEWS]
2minnewspaper just-bash:面向智能体的 Bash 交互工具
02-26 Bash Agent CLI
[自动] [HACKER_NEWS]
1minnewspaper 首个完全通用的计算机动作模型
02-26 Agent LLM 计算机控制
[自动] [HACKER_NEWS]
1minnewspaper 首个完全通用的计算机动作模型
02-26 通用模型 计算机控制 Agent
[自动] [ARXIV]
3minschool 面向大模型终端能力扩展的数据工程研究
02-26 LLM 数据工程 终端
[自动] [HACKER_NEWS]
1minnewspaper 首个完全通用的计算机动作模型
02-25 计算机动作模型 通用模型 Agent
[自动] [ARXIV]
3minschool 面向大模型终端能力扩展的数据工程研究
02-25 LLM 数据工程 终端
[自动] [HACKER_NEWS]
1minnewspaper PA Bench:评估前沿模型多标签页任务能力
02-25 PA Bench 多标签页 模型评估
[自动] [HACKER_NEWS]
1minnewspaper Claude Code 推出远程控制功能
02-25 Claude Claude Code 远程控制
[自动] [JUEJIN]
2minsticky_note_2 Claude Code 构建指南:自定义子代理与核心功能解析
02-25 Claude Code AI 编程 子代理
[自动] [HACKER_NEWS]
1minnewspaper Show HN: Emdash – 开源智能体开发环境
02-25 Emdash 智能体 Agent
[自动] [BLOGS_PODCASTS]
2minmic OpenAI前沿评估团队:迈向智能体评测的下一步
02-25 OpenAI SWE-Bench 智能体评测
[自动] [HACKER_NEWS]
1minnewspaper Show HN: Emdash – 开源智能体开发环境
02-25 Emdash 智能体 Agent
[自动] [HACKER_NEWS]
1minnewspaper Show HN: Emdash – 开源智能体开发环境
02-25 智能体 AI开发 开源
[自动] [HACKER_NEWS]
1minnewspaper Show HN: Emdash – 开源 Agent 开发环境
02-25 Agent 开源 开发环境
[自动] [BLOGS_PODCASTS]
4minmic OpenAI前沿评估负责人:SWE-Bench Verified后的智能体评测新方向
02-25 OpenAI SWE-Bench 智能体
[自动] [HACKER_NEWS]
1minnewspaper Show HN: Emdash – 开源智能体开发环境
02-25 Emdash 智能体 Agent
[自动] [HACKER_NEWS]
1minnewspaper Show HN: Emdash – 开源智能体开发环境
02-25 智能体 Agent 开源
[自动] [BLOGS_PODCASTS]
3minmic OpenAI前沿评估团队:SWE-Bench Verified后的智能体评估新方向
02-25 OpenAI SWE-Bench 智能体
[自动] [GITHUB_TRENDING]
2minhub 接入多平台的大模型 AI 助理框架
02-24 LLM ChatGPT Python
[自动] [HACKER_NEWS]
1minnewspaper Show HN: Emdash – 开源智能体开发环境
02-24 Emdash 智能体 Agent
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 前沿评估团队探讨迈向智能体评估的下一阶段
02-24 OpenAI SWE-Bench 智能体评估
[自动] [JUEJIN]
2minsticky_note_2 oh-my-opencode-slim:体积缩减80%的AI编程精简版
02-24 AI编程 LLM Agent
[自动] [HACKER_NEWS]
1minnewspaper Show HN: Emdash – 开源智能体开发环境
02-24 智能体 Agent 开发环境
[自动] [BLOGS_PODCASTS]
2minmic OpenAI前沿评估团队:从SWE-Bench Verified看智能体评估演进
02-24 OpenAI SWE-Bench 智能体
[自动] [HACKER_NEWS]
5minnewspaper HuggingFace Agent 技能机制解析
02-24 HuggingFace Agent LLM
[自动] [HACKER_NEWS]
4minnewspaper Show HN: Emdash – 开源智能体开发环境
02-24 Emdash 智能体 Agent
[自动] [HACKER_NEWS]
1minnewspaper HuggingFace Agent 技能框架:工具调用与任务编排解析
02-24 HuggingFace Agent 工具调用
[自动] [BLOGS_PODCASTS]
2minmic OpenAI前沿评估团队探讨SWE-Bench Verified后的下一步
02-24 OpenAI SWE-Bench Agent
[自动] [BLOGS_PODCASTS]
5minmic 基于Hugging Face smolagents与AWS构建多模型医疗AI代理
02-24 Hugging Face smolagents AWS
[自动] [BLOGS_PODCASTS]
4minmic 使用MCP将外部工具集成至Amazon Quick Agents的六步指南
02-24 MCP Amazon Quick Agent
[自动] [JUEJIN]
2minsticky_note_2 DeepMind研究:多智能体协作瓶颈与Agent能力天花板分析
02-24 DeepMind 多智能体 Agent
[自动] [GITHUB_TRENDING]
2minhub AstrBot:集成多平台与大模型的智能 IM 机器人基础设施
02-24 AstrBot 聊天机器人 LLM
[自动] [ARXIV]
3minschool 城市编辑:面向依赖感知的分层智能体城市地理空间修改
02-24 City Editing 分层智能体 多模态推理
[自动] [BLOGS_PODCASTS]
2minmic OpenAI前沿评测团队:SWE-Bench Verified后的智能体评测演进
02-24 OpenAI SWE-Bench Agent
[自动] [BLOGS_PODCASTS]
5minmic 基于AWS与Hugging Face smolagents构建多模型医疗AI Agent
02-24 Agent AWS Hugging Face
[自动] [BLOGS_PODCASTS]
5minmic 使用MCP集成外部工具至Amazon Quick Agents的六步指南
02-24 MCP Amazon Quick Agent
[自动] [BLOGS_PODCASTS]
3minmic OpenAI 推进智能体评估:SWE-Bench Verified 后续方向
02-24 OpenAI SWE-Bench 智能体评估
[自动] [JUEJIN]
1minsticky_note_2 2025年AI技术综述:DeepSeek R1与Agent落地元年
02-24 DeepSeek R1 Agent OpenAI
[自动] [BLOGS_PODCASTS]
5minmic 基于AWS与Hugging Face smolagents构建多模型医疗AI Agent
02-23 Hugging Face smolagents AWS
[自动] [BLOGS_PODCASTS]
3minmic OpenAI前沿评估团队:超越SWE-Bench Verified的智能体评估新阶段
02-23 OpenAI SWE-Bench 智能体评估
[自动] [GITHUB_TRENDING]
4minhub AstrBot:整合多平台IM与大模型的智能体聊天机器人基础设施
02-23 AstrBot 聊天机器人 LLM
[自动] [BLOGS_PODCASTS]
3minmic OpenAI提出SWE-Bench-Dead:智能体前沿评估的下一步
02-23 OpenAI SWE-Bench Agent
[自动] [BLOGS_PODCASTS]
5minmic 基于AWS与Hugging Face smolagents构建医疗AI Agent及多模型检索方案
02-23 Agent AWS Hugging Face
[自动] [BLOGS_PODCASTS]
4minmic 使用MCP集成外部工具至Amazon Quick Agents的构建指南
02-23 MCP Amazon Quick Agent
[自动] [BLOGS_PODCASTS]
5minmic 使用MCP集成外部工具至Amazon Quick Agents的六步指南
02-23 MCP Amazon Quick 模型上下文协议
[自动] [BLOGS_PODCASTS]
5minmic 使用MCP协议集成外部工具至Amazon Quick Agents的实操指南
02-23 MCP Amazon Quick LLM
[自动] [GITHUB_TRENDING]
1minhub ChatGPT-On-WeChat:基于大语言模型的微信接入平台
02-23 ChatGPT 微信机器人 Python
[自动] [GITHUB_TRENDING]
2minhub AstrBot:整合多平台与大模型的Agent化IM机器人基础设施
02-23 AstrBot Python Agent
[自动] [HACKER_NEWS]
2minnewspaper Aqua:面向 AI 智能体的 CLI 消息工具
02-23 Aqua AI 智能体 CLI
[自动] [BLOGS_PODCASTS]
5minmic 使用MCP将外部工具集成至Amazon Quick Agents的六步指南
02-22 MCP Amazon Quick Agent
[自动] [GITHUB_TRENDING]
2minhub CowAgent:支持多平台接入与多模型调用的自主任务规划 AI 助理
02-22 ChatGPT-on-WeChat CowAgent AI 助理
[自动] [GITHUB_TRENDING]
1minhub AstrBot:聚合多平台与大模型的智能聊天机器人基础设施
02-22 AstrBot 聊天机器人 LLM
[自动] [HACKER_NEWS]
1minnewspaper 我如何使用 Claude Code:规划与执行的分离
02-22 Claude Code AI 编程 工作流
[自动] [HACKER_NEWS]
1minnewspaper 如何使用 Claude Code:规划与执行的分离
02-22 Claude Code AI 编程 工作流
[自动] [HACKER_NEWS]
1minnewspaper Claws 现已成为 LLM 智能体的新架构层
02-22 LLM 智能体 Agent
[自动] [HACKER_NEWS]
1minnewspaper Claws 成为 LLM 智能体顶层新抽象层
02-22 LLM 智能体 抽象层
[自动] [HACKER_NEWS]
1minnewspaper 如何使用 Claude Code:规划与执行的分离
02-22 Claude Code AI 编程 工作流
[自动] [HACKER_NEWS]
1minnewspaper LLM智能体新增Claws层以增强工具调用能力
02-22 LLM 智能体 工具调用
[自动] [HACKER_NEWS]
1minnewspaper Claws 成为 LLM 智能体之上的新架构层
02-22 LLM 智能体 架构
[自动] [GITHUB_TRENDING]
3minhub AstrBot:集成多IM与大模型的代理式聊天机器人基础设施
02-22 AstrBot 聊天机器人 Agent
[自动] [HACKER_NEWS]
3minnewspaper 人类信任根:面向智能体问责的公共领域框架
02-22 智能体 问责制 信任根
[自动] [JUEJIN]
3minsticky_note_2 CountBot工具系统设计:从抽象基类到JSON Schema实现
02-22 Function Calling Agent LLM
[自动] [HACKER_NEWS]
1minnewspaper LLM智能体新增Claws层以增强功能
02-22 LLM 智能体 Claws
[自动] [HACKER_NEWS]
1minnewspaper LLM智能体新增Claws层以优化任务执行
02-22 LLM 智能体 Claws
[自动] [BLOGS_PODCASTS]
3minmic 使用 MCP 将外部工具集成至 Amazon Quick Agents
02-21 MCP Amazon Quick Agent
[自动] [ARXIV]
4minschool FAMOSE:基于 ReAct 范式的自动化特征发现方法
02-21 特征工程 ReAct 自动化
[自动] [GITHUB_TRENDING]
2minhub AstrBot:整合多平台与大模型能力的智能体 IM 聊天机器人基础设施
02-21 AstrBot 聊天机器人 Agent
[自动] [HACKER_NEWS]
1minnewspaper LLM智能体新增Claws层:强化外部工具调用与任务执行能力
02-21 LLM 智能体 Claws
[自动] [JUEJIN]
2minsticky_note_2 CodeFlicker 接入 MiniMax M2.5 与 GLM-5:降本增效,提升 Agent 效率
02-21 AI 编码 CodeFlicker MiniMax
[自动] [HACKER_NEWS]
1minnewspaper Cord:AI 智能体树状协作框架
02-21 AI 智能体 协作框架 树状结构
[自动] [GITHUB_TRENDING]
1minhub ChatGPT-on-WeChat:接入多平台与大模型的多模态AI助理
02-21 ChatGPT-on-WeChat AI助理 多模态
[自动] [GITHUB_TRENDING]
3minhub AstrBot:整合多平台与大模型的智能体 IM 聊天机器人基础设施
02-21 AstrBot 聊天机器人 LLM
[自动] [HACKER_NEWS]
1minnewspaper Cord:协调多智能体树状协作框架
02-21 多智能体 协作框架 Cord
[自动] [BLOGS_PODCASTS]
4minmic 使用 MCP 将外部工具集成至 Amazon Quick Agents
02-21 MCP Amazon Quick Agent
[自动] [BLOGS_PODCASTS]
3minmic 使用MCP集成外部工具至Amazon Quick Agents的实施指南
02-20 MCP Amazon Quick Agent
[自动] [ARXIV]
4minschool FAMOSE:基于 ReAct 范式的自动化特征发现方法
02-20 FAMOSE 特征工程 自动化特征发现
[自动] [GITHUB_TRENDING]
1minhub CowAgent:支持多平台接入与多模型的自主任务规划 AI 助理
02-20 LLM Python Agent
[自动] [GITHUB_TRENDING]
10minhub AstrBot:集成多平台与大模型的智能体 IM 机器人基础设施
02-20 AstrBot 聊天机器人 LLM
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 发布自主智能体 METR 基准测试数据
02-20 Anthropic 智能体 Agent
[自动] [JUEJIN]
3minsticky_note_2 Agent 开发实战:赋予大模型工具调用能力
02-20 Agent LLM Tool Use
[自动] [BLOGS_PODCASTS]
5minmic 使用MCP集成外部工具至Amazon Quick Agents的实施指南
02-20 MCP Amazon Quick Agent
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 公布 Agent 自主性研究及 METR 基准数据
02-20 Anthropic Agent 自主性
[自动] [BLOGS_PODCASTS]
3minmic Anthropic发布自主Agent研究:基于METR数据评估模型自主能力
02-20 Anthropic 自主Agent METR
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 发布自主智能体 METR 基准测试数据
02-20 Anthropic METR 自主智能体
[自动] [BLOGS_PODCASTS]
3minmic Anthropic发布基于METR数据的Agent自主性研究
02-20 Anthropic Agent 自主性
[自动] [GITHUB_TRENDING]
2minhub AstrBot:整合多平台与大模型能力的Agent型IM聊天机器人基础设施
02-19 AstrBot 聊天机器人 Agent
[自动] [BLOGS_PODCASTS]
3minmic Anthropic发布Agent自主性研究及METR数据
02-19 Anthropic Agent 自主性
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 公布 METR 数据评估 Agent 自主能力
02-19 Anthropic METR Agent
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC Berkeley发布IT-Bench及MAST:诊断企业Agent失败原因
02-19 Agent IT-Bench MAST
[自动] [BLOGS_PODCASTS]
3minmic Anthropic发布Agent自主性研究及METR数据
02-19 Anthropic Agent 自主性
[自动] [HACKER_NEWS]
1minnewspaper Step 3.5 Flash:速度足以思考,可靠性足以行动
02-19 Google Gemini Flash
[自动] [HACKER_NEWS]
1minnewspaper Step 3.5 Flash:快速思考与可靠执行
02-19 Step 3.5 Flash 推理模型 快速响应
[自动] [BLOGS_PODCASTS]
1minmic IBM与加州大学伯克利分校发布IT-Bench与MAST诊断企业智能体失败原因
02-19 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
3minmic 基于Amazon Bedrock AgentCore构建统一智能系统
02-19 Amazon Bedrock AgentCore LLM
[自动] [HACKER_NEWS]
1minnewspaper Step 3.5 Flash:快到能思考,稳到可执行
02-19 Step 3.5 Flash LLM 推理模型
[自动] [JUEJIN]
2minsticky_note_2 LlamaIndex官方方案:用AgentFS沙盒构建安全AI编码智能体
02-19 LlamaIndex Agent 沙盒
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC伯克利利用IT-Bench和MAST诊断企业智能体失败原因
02-19 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
2minmic IBM联合UC Berkeley发布IT-Bench与MAST:诊断企业智能体失败原因
02-19 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC Berkeley发布IT-Bench及MAST诊断企业智能体失败原因
02-19 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC Berkeley发布IT-Bench及MAST诊断企业智能体失败原因
02-18 IBM UC Berkeley IT-Bench
[自动] [GITHUB_TRENDING]
12minhub AstrBot:集成多平台与大模型的 IM 聊天机器人基础设施
02-18 AstrBot 聊天机器人 LLM
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC Berkeley利用IT-Bench和MAST诊断企业智能体失败原因
02-18 IBM UC Berkeley IT-Bench
[自动] [JUEJIN]
2minsticky_note_2 SkillsBench 论文解读:跨任务基准测试如何揭示 Agent 技能的实际效用
02-18 Agent LLM SkillsBench
[自动] [JUEJIN]
2minsticky_note_2 OpenClaw实现高并发群聊AI的上下文隔离与并行调度
02-18 OpenClaw 群聊AI 高并发
[自动] [GITHUB_TRENDING]
12minhub AstrBot:整合多平台与大模型的智能体聊天机器人基础设施
02-18 AstrBot 聊天机器人 Agent
[自动] [JUEJIN]
3minsticky_note_2 LangChain.js 快速上手:模型接入与流式输出实现
02-18 LangChain.js LLM 流式输出
[自动] [HACKER_NEWS]
4minnewspaper 让大语言模型互斗万智牌的实验项目
02-17 LLM Agent 游戏AI
[自动] [GITHUB_TRENDING]
12minhub AstrBot:支持多IM与大模型接入的智能聊天机器人基础设施
02-17 聊天机器人 LLM Agent
[自动] [JUEJIN]
2minsticky_note_2 Qwen3.5-397B-A17B:极致稀疏MoE架构与多模态能力详解
02-17 Qwen3.5 MoE 多模态
[自动] [HACKER_NEWS]
4minnewspaper 让大语言模型互斗万智牌的实验项目
02-17 LLM Agent 游戏AI
[自动] [JUEJIN]
3minsticky_note_2 SkillsBench论文:评估Agent技能在多任务中的实际效用
02-17 Agent LLM SkillsBench
[自动] [GITHUB_TRENDING]
12minhub AstrBot:整合多平台IM与LLM的智能体机器人基础设施
02-17 AstrBot 聊天机器人 LLM
[自动] [HACKER_NEWS]
7minnewspaper SkillsBench:评估智能体技能在多样化任务中的表现基准
02-17 SkillsBench 智能体 Agent
[自动] [HACKER_NEWS]
6minnewspaper Qwen3.5:迈向原生多模态智能体
02-17 Qwen3.5 多模态 智能体
[自动] [HACKER_NEWS]
4minnewspaper 研究:自生成的Agent技能实际无效
02-17 Agent LLM 研究
[自动] [HACKER_NEWS]
3minnewspaper 研究:自生成的Agent技能通常无效
02-16 Agent LLM 自生成技能
[自动] [GITHUB_TRENDING]
12minhub AstrBot:整合多平台IM与大模型的智能体聊天机器人基础设施
02-16 AstrBot 聊天机器人 LLM
[自动] [HACKER_NEWS]
4minnewspaper 研究:自生成的Agent技能通常无效
02-16 Agent LLM 自生成技能
[自动] [HACKER_NEWS]
7minnewspaper Qwen3.5:迈向原生多模态智能体
02-16 Qwen3.5 多模态 智能体
[自动] [HACKER_NEWS]
5minnewspaper LLM Agent 成本呈二次方增长:算力开销分析
02-16 LLM Agent 成本分析
[自动] [HACKER_NEWS]
3minnewspaper 授予Claude控制权:用笔式绘图仪生成物理图形
02-16 Claude LLM Agent
[自动] [GITHUB_TRENDING]
12minhub AstrBot:整合多平台与大模型的智能体聊天机器人基础设施
02-16 AstrBot 聊天机器人 LLM
[自动] [HACKER_NEWS]
4minnewspaper LLM Agent 成本曲线:二次方增长与昂贵计算
02-16 LLM Agent 成本分析
[自动] [ARXIV]
5minschool CM2:基于清单奖励强化学习的多步智能体工具调用
02-16 强化学习 Agent 工具调用
[自动] [HACKER_NEWS]
5minnewspaper 我让 Claude 控制笔式绘图仪绘制图案
02-15 Claude LLM Agent
[自动] [ARXIV]
3minschool CM2:基于清单奖励强化学习的多步智能体工具调用
02-15 CM2 强化学习 Agent
[自动] [GITHUB_TRENDING]
12minhub AstrBot:整合多平台与大模型的智能体化IM聊天机器人基础设施
02-15 AstrBot 聊天机器人 LLM
[自动] [GITHUB_TRENDING]
10minhub ChatGPT-on-WeChat:接入多平台与大模型的企业级AI助理框架
02-15 ChatGPT-on-WeChat 企业级应用 AI助理
[自动] [GITHUB_TRENDING]
12minhub AstrBot:集成多平台与大语言模型的智能聊天机器人基础设施
02-15 AstrBot 聊天机器人 LLM
[自动] [GITHUB_TRENDING]
10minhub ChatGPT-on-WeChat:支持多平台接入与多模型配置的AI助理
02-14 ChatGPT-on-WeChat LLM Python
[自动] [GITHUB_TRENDING]
13minhub AstrBot:整合多IM平台与大模型的智能体聊天机器人基础设施
02-14 AstrBot 聊天机器人 LLM
[自动] [ARXIV]
4minschool CM2:基于清单奖励强化学习的多步多轮智能体工具调用
02-14 智能体 强化学习 工具调用
[自动] [HACKER_NEWS]
5minnewspaper Moltis:具备记忆、工具调用及自扩展技能的AI助手
02-14 AI助手 Agent LLM
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-13 多模态 思维链 测试时扩展
[自动] [HACKER_NEWS]
4minnewspaper Moltis:具备记忆、工具与技能扩展能力的AI助手
02-13 AI助手 Agent LLM
[自动] [ARXIV]
6minschool CM2:基于清单奖励强化学习的多轮多步智能体工具调用
02-13 强化学习 Agent 工具调用
[自动] [HACKER_NEWS]
4minnewspaper Moltis:具备记忆与工具调用能力的自扩展AI助手
02-13 AI助手 Agent 记忆机制
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv 实践:评估真实环境中的工具调用智能体
02-13 智能体 工具调用 OpenEnv
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv 实战:评估真实环境中的工具调用智能体
02-13 OpenEnv 智能体 Agent
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv 实战:评估真实环境中的工具调用智能体
02-13 智能体 工具调用 OpenEnv
[自动] [JUEJIN]
3minsticky_note_2 Vercel AI SDK 实战:利用 Call Options 动态配置 Agent
02-13 Vercel AI SDK Agent LLM
[自动] [GITHUB_TRENDING]
12minhub AstrBot:整合多平台与大语言模型的智能体 IM 聊天机器人基础设施
02-13 AstrBot 聊天机器人 Agent
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv 实践:在真实环境中评估工具调用智能体
02-12 OpenEnv 智能体 Agent
[自动] [GITHUB_TRENDING]
12minhub AstrBot:集成多平台与大模型的智能 IM 机器人基础设施
02-12 AstrBot 聊天机器人 LLM
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv实践:评估真实环境中的工具调用智能体
02-12 智能体 工具调用 OpenEnv
[自动] [BLOGS_PODCASTS]
2minmic LinqAlpha 基于 Amazon Bedrock 构建投资论点压力测试代理
02-12 Amazon Bedrock Agent 多智能体
[自动] [BLOGS_PODCASTS]
2minmic 工程团队实践:在Agent优先架构中应用Codex
02-12 Agent Codex 架构设计
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv实践:评估真实环境中的工具调用智能体
02-12 OpenEnv 智能体 Agent
[自动] [BLOGS_PODCASTS]
2minmic 工程团队实践:在 Agent 优先架构中利用 Codex
02-12 Agent Codex 架构设计
[自动] [BLOGS_PODCASTS]
3minmic OpenEnv实践:评估真实环境中的工具调用智能体
02-12 OpenEnv 智能体 Agent
[自动] [BLOGS_PODCASTS]
3minmic 工程效能实践:在 Agent 优先架构中集成 Codex
02-12 Agent Codex LLM
[自动] [BLOGS_PODCASTS]
2minmic OpenEnv实践:评估真实环境中的工具调用智能体
02-12 OpenEnv 智能体 Agent
[自动] [HACKER_NEWS]
5minnewspaper GLM-5:面向复杂系统工程与长周期智能体任务
02-12 GLM-5 智能体 系统工程
[自动] [BLOGS_PODCASTS]
3minmic 利用 Codex 构建以 Agent 为中心的工程化实践
02-12 Codex Agent 工程化
[自动] [JUEJIN]
2minsticky_note_2 深度解析Skill/MCP/RAG等五大AI技术的底层逻辑
02-12 LLM RAG Agent
[自动] [BLOGS_PODCASTS]
2minmic LinqAlpha利用Amazon Bedrock构建“唱反调”机制以压力测试投资逻辑
02-12 LLM Agent Amazon Bedrock
[自动] [BLOGS_PODCASTS]
3minmic 利用 Codex 构建以 Agent 为中心的工程实践
02-12 Agent Codex LLM
[自动] [BLOGS_PODCASTS]
3minmic LinqAlpha利用Amazon Bedrock构建投资思路压力测试智能体
02-12 Amazon Bedrock Agent 智能体
[自动] [HACKER_NEWS]
5minnewspaper Agent框架:运行时生成拓扑并动态演进
02-12 Agent 框架 动态拓扑
[自动] [BLOGS_PODCASTS]
2minmic 利用 Codex 构建以 Agent 为中心的工程体系
02-12 Codex Agent 工程体系
[自动] [ARXIV]
4minschool CLI-Gym:基于智能体环境逆向的可扩展命令行任务生成
02-12 CLI-Gym Agent 环境逆向
[自动] [ARXIV]
3minschool Agent World Model: Infinity Synthetic Environments for
02-11 Agent World Model 强化学习
[自动] [HACKER_NEWS]
7minnewspaper Agent Alcove:支持多模型在论坛中进行辩论
02-11 Agent 多模型 Claude
[自动] [HACKER_NEWS]
5minnewspaper Tambo 1.0:支持渲染 React 组件的开源 Agent 工具包
02-11 Tambo Agent React
[自动] [BLOGS_PODCASTS]
3minmic Building real-time voice assistants with Amazon Nova So
02-11 Amazon Nova 语音助手 实时交互
[自动] [ARXIV]
1minschool Moltbook 漏洞:自进化 AI 社会中 Anthropic 安全机制失效
02-11 Anthropic AI安全 对齐
[自动] [HACKER_NEWS]
5minnewspaper Tambo 1.0:渲染 React 组件的开源 Agent 工具包
02-11 Tambo React Agent
[自动] [HACKER_NEWS]
4minnewspaper AI智能体发展预测:未来八个月的技术演进与挑战
02-10 AI智能体 LLM 技术预测
[自动] [BLOGS_PODCASTS]
2minmic AI vs SaaS:从OpenClaw到Cursor的AI中心化演进
02-10 AI vs SaaS OpenAI Anthropic
[自动] [HACKER_NEWS]
4minnewspaper 从通讯软件智能体中提取数据的方法
02-09 智能体 数据泄露 通讯软件
[自动] [HACKER_NEWS]
4minnewspaper 人人都在构建异步智能体 但鲜有人能定义其概念
02-09 智能体 Agent 异步
[自动] [BLOGS_PODCASTS]
2minmic AI vs SaaS:从OpenClaw到Cursor看AI中心化效能
02-09 AI 原生 SaaS 转型 MCP 协议
[自动] [ARXIV]
4minschool 面向运行时智能体记忆的查询感知预算分层路由
02-09 LLM Agent Memory
[自动] [ARXIV]
4minschool PhysicsAgentABM:物理引导的生成式主体建模框架
02-09 PhysicsAgentABM Agent 多智能体
[自动] [ARXIV]
3minschool 面向运行时智能体记忆的查询感知预算层路由
02-08 Agent LLM 智能体
[自动] [BLOGS_PODCASTS]
3minmic AI vs SaaS:从 OpenClaw 到 MCP UI 的中心化效能
02-08 AI vs SaaS OpenClaw MCP
[自动] [GITHUB_TRENDING]
10minhub 基于大模型的主动思考AI助理ChatGPT-on-Wechat
02-08 ChatGPT-on-Wechat LLM Agent
[自动] [HACKER_NEWS]
5minnewspaper 软件工厂与代理时刻:AI 编程范式的演进
02-08 AI 编程 软件工厂 Agent
[自动] [GITHUB_TRENDING]
11minhub CowAgent:基于大模型的自主任务规划与多平台接入 AI 助理
02-07 LLM Agent Python
[自动] [ARXIV]
5minschool 面向运行时智能体记忆的查询感知预算层路由
02-07 Agent LLM Memory
[自动] [GITHUB_TRENDING]
11minhub ChatGPT-on-WeChat:支持多模型与多平台接入的AI助理框架
02-07 ChatGPT-on-WeChat LLM AI助理
[自动] [HACKER_NEWS]
5minnewspaper Claude Composer:AI 编排多智能体工作流
02-07 Claude 多智能体 工作流
[自动] [ARXIV]
3minschool 面向运行时智能体记忆的查询感知预算分层路由
02-06 Agent Memory RAG
[自动] [GITHUB_TRENDING]
11minhub 基于大模型的主动思考型 AI 助理 CowAgent 支持多平台接入
02-06 LLM Agent Python
[自动] [HACKER_NEWS]
4minnewspaper Claude Composer:AI 编排多智能体协作与任务流
02-06 Claude 多智能体 工作流编排
[自动] [HACKER_NEWS]
7minnewspaper Opus 4.6 智能体团队协作构建 C 语言编译器
02-06 Opus 4.6 智能体 Agent
[自动] [GITHUB_TRENDING]
12minhub AstrBot:集成多平台与大模型的智能体 IM 聊天机器人基础设施
02-06 AstrBot 聊天机器人 LLM
[自动] [HACKER_NEWS]
7minnewspaper Opus 4.6 智能体团队协作构建 C 语言编译器
02-06 Opus 4.6 智能体 Agent
[自动] [HACKER_NEWS]
8minnewspaper Opus 4.6 智能体团队协作构建 C 语言编译器
02-06 Opus 4.6 智能体 Agent
[自动] [HACKER_NEWS]
8minnewspaper Opus 4.6 智能体团队协作构建 C 语言编译器
02-06 Opus 4.6 智能体 Agent
[自动] [HACKER_NEWS]
5minnewspaper OpenClaw赋予AI全系统权限引发安全担忧
02-06 AI Agents 系统安全 OpenClaw
[自动] [GITHUB_TRENDING]
9minhub CowAgent:基于大模型的AI助理,支持主动思考与多平台接入
02-05 LLM Agent Python
[自动] [GITHUB_TRENDING]
12minhub AstrBot:整合多平台 LLM 与插件的智能体 IM 聊天机器人基础设施
02-05 AstrBot 聊天机器人 LLM
[自动] [HACKER_NEWS]
4minnewspaper Opus 4.6 智能体团队成功构建 C 语言编译器
02-05 Opus 4.6 智能体 Agent
[自动] [BLOGS_PODCASTS]
4minmic 构建 Codex 应用服务器:嵌入代理与双向 JSON-RPC API 实践
02-05 Codex App Server JSON-RPC
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.3-Codex:结合前沿编码性能与推理能力的代理式模型
02-05 GPT-5.3 Codex Agent
[自动] [BLOGS_PODCASTS]
4minmic 构建 Codex 应用服务器:实现双向 JSON-RPC 与流式进度
02-05 Codex App Server JSON-RPC
[自动] [BLOGS_PODCASTS]
2minmic Context Graphs与Agent Traces:技术解析与应用前景
02-05 Context Graphs Agent Traces Agent
[自动] [BLOGS_PODCASTS]
3minmic OpenAI Frontier:具备上下文与治理功能的企业级AI代理平台
02-05 OpenAI Frontier AI代理
[自动] [BLOGS_PODCASTS]
3minmic Codex App Server 构建解析:嵌入代理与双向 JSON-RPC API 实现
02-05 Codex App Server Agent
[自动] [BLOGS_PODCASTS]
4minmic 构建 Codex App Server:集成 JSON-RPC 实现流式响应与工具调用
02-05 Codex App Server JSON-RPC
[自动] [BLOGS_PODCASTS]
2minmic Context Graphs与Agent Traces:解析AI系统的上下文与追踪技术
02-05 Context Graphs Agent Traces LLM
[自动] [BLOGS_PODCASTS]
3minmic 构建 Codex App Server:支持流式传输与工具调用的双向 JSON-RPC API
02-05 Codex JSON-RPC 流式传输
[自动] [GITHUB_TRENDING]
11minhub LangBot:生产级多平台Agent智能机器人开发平台
02-05 Agent LLM Python
[自动] [GITHUB_TRENDING]
11minhub CowAgent:基于大模型的自主任务规划与多平台接入助手
02-05 LLM Agent Python
[自动] [BLOGS_PODCASTS]
3minmic Context Graphs与Agent Traces技术解析
02-05 Context Graphs Agent Traces Agent
[自动] [BLOGS_PODCASTS]
4minmic Codex App Server 构建实践:集成双向 JSON-RPC 与流式工具调用
02-05 Codex App Server JSON-RPC
[自动] [HACKER_NEWS]
4minnewspaper RS-SDK:利用 Claude Code 自动化操控 RuneScape
02-05 Claude Code RuneScape 游戏自动化
[自动] [HACKER_NEWS]
4minnewspaper RS-SDK:利用 Claude Code 驱动 RuneScape 游戏操作
02-05 Claude Code RuneScape 游戏自动化
[自动] [BLOGS_PODCASTS]
3minmic Codex App Server 构建实践:集成双向 JSON-RPC 代理
02-05 Codex App Server JSON-RPC
[自动] [HACKER_NEWS]
6minnewspaper RS-SDK:利用 Claude Code 自动化驱动 RuneScape
02-04 Claude LLM 自动化
[自动] [GITHUB_TRENDING]
11minhub LangBot:生产级多平台 Agent 机器人开发平台
02-04 LangBot Agent 多平台机器人
[自动] [GITHUB_TRENDING]
11minhub CowAgent:具备主动思考与长期记忆的大模型 AI 助理
02-04 LLM Agent Python
[自动] [BLOGS_PODCASTS]
3minmic Context Graphs与Agent Traces技术解析
02-04 Context Graphs Agent Traces LLM
[自动] [BLOGS_PODCASTS]
4minmic Codex App Server 构建解析:支持流式与工具调用的双向 JSON-RPC API
02-04 Codex JSON-RPC App Server
[自动] [HACKER_NEWS]
3minnewspaper RS-SDK:利用 Claude Code 自动化操控 RuneScape
02-04 Claude Code RuneScape 游戏自动化
[自动] [BLOGS_PODCASTS]
2minmic Codex for macOS:支持多智能体与并行工作流的 AI 编程指挥中心
02-04 Codex macOS AI编程
[自动] [HACKER_NEWS]
7minnewspaper RS-SDK:利用 Claude Code 自动化驱动 RuneScape
02-04 Claude Code 自动化 游戏开发
[自动] [GITHUB_TRENDING]
12minhub LangBot:支持多平台接入的生产级智能机器人开发框架
02-04 LangBot 智能机器人 Agent
[自动] [HACKER_NEWS]
5minnewspaper Agent Skills:大模型智能体技能框架
02-04 Agent LLM 智能体
[自动] [HACKER_NEWS]
5minnewspaper Agent Skills:AI 智能体技能评估框架
02-04 Agent 智能体 评估框架
[自动] [HACKER_NEWS]
7minnewspaper Agent Skills:智能体技能框架与能力评估
02-04 Agent 智能体 技能框架
[自动] [BLOGS_PODCASTS]
3minmic Context Graphs与Agent Traces技术解析
02-04 Context Graphs Agent Traces Agent
[自动] [HACKER_NEWS]
5minnewspaper Agent Skills:AI 智能体技能框架与训练方法
02-04 Agent 智能体 技能框架
[自动] [HACKER_NEWS]
7minnewspaper Agent Skills:智能体技能评估与开源框架
02-04 Agent LLM 智能体
[自动] [BLOGS_PODCASTS]
4minmic 适用于 macOS 的 Codex 应用:支持多智能体协作与并行工作流的 AI 编程中枢
02-04 Codex macOS 多智能体
[自动] [ARXIV]
4minschool RLAnything:构建完全动态强化学习系统环境与模型
02-04 RLAnything 强化学习 LLM
[自动] [ARXIV]
4minschool MemSkill:面向自进化代理的记忆技能学习与演化框架
02-04 MemSkill 智能体 Agent
[自动] [BLOGS_PODCASTS]
4minmic 适用于 macOS 的 Codex 应用:支持多智能体与并行工作流的 AI 编程指挥中心
02-03 Codex macOS AI 编程
[自动] [ARXIV]
4minschool RLAnything:完全动态强化学习系统构建环境、策略与奖励模型
02-03 强化学习 RL LLM
[自动] [GITHUB_TRENDING]
12minhub LangBot:支持多平台接入的生产级 Agent 机器人开发平台
02-03 LangBot Agent Python
[自动] [HACKER_NEWS]
6minnewspaper Agent Skills:智能体技能框架与开发指南
02-03 Agent 智能体 Agent Skills
[自动] [HACKER_NEWS]
4minnewspaper Xcode 26.3 引入 Agent 编码能力
02-03 Xcode Agent AI 编程
[自动] [HACKER_NEWS]
5minnewspaper Agent Skills:AI 智能体的技能框架
02-03 Agent 智能体 技能框架
[自动] [HACKER_NEWS]
6minnewspaper Agent Skills:智能体技能框架
02-03 Agent 智能体 Agent Skills
[自动] [HACKER_NEWS]
5minnewspaper Xcode 26.3 引入 Agent 智能编码能力
02-03 Xcode Apple Agent
[自动] [BLOGS_PODCASTS]
4minmic Codex macOS 应用发布:多智能体 AI 编程指挥中心
02-03 Codex macOS 多智能体
[自动] [HACKER_NEWS]
7minnewspaper Agent Skills:AI 智能体技能框架
02-03 Agent 智能体 Agent Skills
[自动] [HACKER_NEWS]
3minnewspaper Show HN: 反向代理模型(应用为客户端、聊天为服务端与反思)
02-03 反向代理 Agent 架构设计
[自动] [HACKER_NEWS]
5minnewspaper Agent Skills:大模型智能体的技能评估框架
02-03 Agent LLM 评估框架
[自动] [HACKER_NEWS]
5minnewspaper Show HN: 反向智能体模型:应用为客户端、对话为服务器与反思机制
02-03 智能体 Agent 架构设计
[自动] [HACKER_NEWS]
4minnewspaper AI 基准测试新进展:Game Arena 推进评估方法
02-03 AI 基准测试 Game Arena 模型评估
[自动] [HACKER_NEWS]
5minnewspaper 利用Game Arena平台推进AI基准测试
02-03 AI基准测试 Game Arena LLM评估
[自动] [ARXIV]
4minschool UPA:基于树搜索与筛选的无监督提示代理
02-03 Prompt优化 UPA 无监督学习
[自动] [HACKER_NEWS]
4minnewspaper 用Game Arena平台推进AI基准测试
02-02 AI基准测试 Game Arena LLM评估
[自动] [BLOGS_PODCASTS]
2minmic Moltbook:首个面向AI智能体的社交网络平台
02-02 AI智能体 社交网络 Moltbook
[自动] [GITHUB_TRENDING]
12minhub LangBot:生产级多平台智能 IM 机器人开发平台
02-02 LangBot 智能机器人 Agent
[自动] [BLOGS_PODCASTS]
2minmic Moltbook:首个面向AI智能体的社交网络平台
02-02 AI智能体 社交网络 Moltbook
[自动] [GITHUB_TRENDING]
16minhub LangBot:生产级多平台智能 IM 机器人开发平台
02-02 LangBot Python Agent
[自动] [ARXIV]
4minschool 探索面向智能体的推理奖励模型
02-02 Agentic RL Reward Model 推理奖励
[自动] [ARXIV]
4minschool 探索面向智能体的推理奖励模型
02-01 Agent RLHF 奖励模型
[自动] [GITHUB_TRENDING]
10minhub LangBot:生产级多平台智能体机器人开发平台
02-01 LangBot Agent 智能体
[自动] [HACKER_NEWS]
4minnewspaper 迈向智能体系统规模化科学:作用机制与生效条件
02-01 Agent LLM Scaling Law
[自动] [HACKER_NEWS]
4minnewspaper 构建极简编码代理的技术实践与经验总结
02-01 Coding Agent LLM Agent
[自动] [GITHUB_TRENDING]
11minhub LangBot:支持多平台集成的生产级智能代理机器人开发平台
02-01 LangBot 智能代理 Agent
[自动] [BLOGS_PODCASTS]
3minmic Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,支持原生图文视频及百并发Agent管理
02-01 Moonshot AI Kimi k2.5 开源模型
2026年一月 37 篇
类型阅读条目
[自动] [ARXIV]
4minschool 推理大语言模型从被动求解转向主动询问
01-31 LLM 推理模型 主动询问
[自动] [ARXIV]
5minschool 探索面向智能体的推理奖励模型
01-31 Agent 强化学习 奖励模型
[自动] [ARXIV]
4minschool RedSage:网络安全通用大语言模型
01-31 RedSage 网络安全 LLM
[自动] [GITHUB_TRENDING]
12minhub LangBot:支持多平台集成的生产级 Agent 机器人开发框架
01-31 LangBot Agent Python
[自动] [BLOGS_PODCASTS]
3minmic Kimi K2.5:半价超越Sonnet 4.5,支持原生多模态与百并发Agent
01-31 Kimi k1.5 Moonshot AI 开源模型
[自动] [ARXIV]
4minschool 探索面向智能体的推理奖励模型
01-30 Agent 强化学习 推理奖励模型
[自动] [BLOGS_PODCASTS]
3minmic Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,原生图文视频及百并发Agent管理
01-30 Moonshot AI Kimi k2.5 开源模型
[自动] [ARXIV]
4minschool DynaWeb:基于模型的强化学习网页智能体
01-30 DynaWeb Web Agent 强化学习
[自动] [HACKER_NEWS]
4minnewspaper AGENTS.md 架构在智能体评估中超越 Skills 技能
01-30 智能体 评估 AGENTS.md
[自动] [HACKER_NEWS]
5minnewspaper Agent评估显示AGENTS.md配置优于Skills
01-30 Agent 评估 AGENTS.md
[自动] [HACKER_NEWS]
5minnewspaper AGENTS.md 架构在智能体评估中优于 Skills 架构
01-30 智能体 Agent AGENTS.md
[自动] [HACKER_NEWS]
4minnewspaper Agent评估显示AGENTS.md配置优于Skills
01-30 Agent LLM AGENTS.md
[自动] [HACKER_NEWS]
5minnewspaper Agent评估显示AGENTS.md配置优于技能配置
01-30 Agent AGENTS.md 技能配置
[自动] [HACKER_NEWS]
5minnewspaper Project Genie:无限交互世界的实验探索
01-30 Genie 交互世界 生成式AI
[自动] [HACKER_NEWS]
5minnewspaper Agent评估显示AGENTS.md配置优于Skills
01-30 Agent AGENTS.md Skills
[自动] [HACKER_NEWS]
4minnewspaper AGENTS.md 架构在智能体评估中超越 Skills 技能
01-30 智能体 Agent 评估
[自动] [HACKER_NEWS]
5minnewspaper 压缩智能体:Agent Skills 技术解析
01-30 Agent LLM 技术解析
[自动] [BLOGS_PODCASTS]
4minmic Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,原生图文视频与百并发Agent管理
01-30 Moonshot AI Kimi k2.5 开源模型
[自动] [HACKER_NEWS]
5minnewspaper Compressed Agents:Agent Skills 技术解析
01-30 Agent LLM 技术解析
[自动] [HACKER_NEWS]
5minnewspaper Agent Skills:压缩智能体技能以提升模型效率
01-29 Agent 模型压缩 效率优化
[自动] [BLOGS_PODCASTS]
3minmic Moonshot Kimi K25:成本减半超越Sonnet 45,原生图文视频与百并发Agent管理
01-29 Moonshot AI Kimi k2.5 开源模型
[自动] [HACKER_NEWS]
5minnewspaper LM Studio 0.4 发布:支持本地运行 Llama 3 与多模型并行
01-29 LM Studio Llama 3 本地部署
[自动] [BLOGS_PODCASTS]
4minmic 🚀Codex Agent循环全解!揭秘AI核心价值!
01-27 Codex Agent LLM
[自动] [HACKER_NEWS]
3minnewspaper 🚀Kimi K2.5震撼开源!视觉SOTA级智能模型,性能炸裂!
01-27 Kimi K2.5 Moonshot AI 视觉模型
[自动] [HACKER_NEWS]
4minnewspaper 🚀Kimi K2.5重磅开源!视觉SOTA级Agent模型,AI新王炸?
01-27 Kimi Moonshot AI K1.5
[自动] [BLOGS_PODCASTS]
4minmic 🔥揭秘Codex Agent循环!AI如何实现自主进化?
01-27 Agent LLM Codex
[自动] [BLOGS_PODCASTS]
4minmic 揭秘Codex Agent核心循环!🔥智能编程的终极引擎!🤖✨
01-27 Codex Agent LLM
[自动] [HACKER_NEWS]
3minnewspaper Kimi K2.5震撼开源!视觉SOTA Agent模型,性能炸裂🔥
01-27 Kimi K2.5 多模态
[自动] [BLOGS_PODCASTS]
3minmic 🚀GPT-OSS智能体RL训练解密!从0到1实战复盘🔥
01-27 强化学习 Agent GPT-OSS
[自动] [BLOGS_PODCASTS]
5minmic 揭开Codex Agent循环的神秘面纱!🚀 探索核心机制与价值
01-27 Codex Agent LLM
[自动] [HACKER_NEWS]
3minnewspaper ChatGPT容器爆发!🔥能跑bash/装包/下载,代码能力狂飙!🚀
01-27 ChatGPT OpenAI 代码解释器
[自动] [ARXIV]
5minschool 🌍Spatial-Agent:科学核心驱动的智能地理空间推理!🚀
01-27 Spatial-Agent Agent 地理空间推理
[自动] [HACKER_NEWS]
3minnewspaper 震惊!Gemini Flash击败Opus!🎮Tetris胜率66%🚀
01-27 LLM Gemini Flash Claude 3 Opus
[自动] [BLOGS_PODCASTS]
4minmic 揭秘 Codex Agent 智能循环!🤖 AI自动化新范式?
01-27 LLM Agent Codex
[自动] [BLOGS_PODCASTS]
4minmic 揭秘Codex Agent循环!🚀 智能体核心逻辑全解析!
01-26 Codex Agent 智能体循环
[自动] [ARXIV]
5minschool 🌍 Spatial-Agent:具科学核心的智能体地理空间推理!
01-26 Spatial-Agent 地理空间推理 GeoFlow Graphs
[自动] [BLOGS_PODCASTS]
4minmic 🤖解密Codex智能体闭环:AI如何自主进化?
01-25 Codex Agent LLM