目录
大模型
条目:3146
2026年四月
48 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 1min | school
SpatialEvo:基于确定性几何环境的自进化空间智能框架 04-16
空间推理
确定性几何环境
零噪声标注 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Flash TTS细粒度音频标签提升语音表现力 04-16
Gemini
TTS
语音生成 |
[自动]
[GITHUB_TRENDING] | 4min | hub
CowAgent企业微信AI助理支持多平台接入 04-16
企业微信
AI助理
多平台接入 |
[自动]
[ARXIV] | 2min | school
SceneCritic:3D室内场景合成符号评估方法 04-16
3D场景合成
符号评估
SceneOnto |
[自动]
[ARXIV] | 2min | school
SceneCritic:3D室内场景合成的符号化评估器 04-15
3D场景合成
符号化评估
空间约束 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
Gemini 3.1 Flash TTS: the next generation of expressive 04-15
TTS
语音合成
AI语音 |
[自动]
[GITHUB_TRENDING] | 4min | hub
CowAgent:开源多平台AI助理框架,支持十余种模型 04-15
AI助理
多平台接入
多模型支持 |
[自动]
[JUEJIN] | 1min | sticky_note_2
LangChainGo框架解析:Go语言大模型应用开发实战 04-14
LangChainGo
Go语言
大模型应用 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
使用Lambda设计Amazon Nova模型的奖励函数指南 04-14
RLVR
RLAIF
奖励函数 |
[自动]
[ARXIV] | 1min | school
大语言模型生成有害内容的统一机制 04-13
大语言模型
有害内容
权重剪枝 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS Lambda为Amazon Nova构建可扩展奖励函数的最佳实践 04-13
AWS Lambda
Amazon Nova
强化学习 |
[自动]
[JUEJIN] | 1min | sticky_note_2
香港大学开源Nanobot:4000行代码实现生产级AI Agent框架 04-13
AI Agent
轻量框架
开源项目 |
[自动]
[JUEJIN] | 1min | sticky_note_2
Claude Code与Managed Agents定位差异与适用场景对比 04-13
Claude Code
Managed Agents
智能体 |
[自动]
[ARXIV] | 1min | school
代理多模态模型的元认知工具使用策略 04-12
多模态模型
工具调用
元认知 |
[自动]
[HACKER_NEWS] | 1min | newspaper
中度使用仍耗尽:Pro Max 5倍配额1.5小时用完 04-12
AI配额
用量超限
API限制 |
[自动]
[JUEJIN] | 1min | sticky_note_2
AI周报:Anthropic闭门发模型、阿里HappyHorse登顶、线下矛盾升温 04-12
Anthropic
Claude Mythos
闭门模型 |
[自动]
[JUEJIN] | 1min | sticky_note_2
内网离线场景AI模型本地部署指南 04-12
本地部署
离线运行
数据安全 |
[自动]
[JUEJIN] | 1min | sticky_note_2
ReAct让大模型掌握边想边做的循环机制 04-12
ReAct
LLM
推理链 |
[自动]
[JUEJIN] | 1min | sticky_note_2
Function Calling 原理与实战指南 04-12
Function Calling
大模型
AI工程 |
[自动]
[ARXIV] | 2min | school
发展代理多模态模型的元认知工具使用能力 04-11
多模态代理
工具调用优化
元认知 |
[自动]
[JUEJIN] | 1min | sticky_note_2
AI具备思考能力时人类面临的准备挑战 04-11
AI思考能力
就业结构
数据隐私 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Cirrus Labs 团队加入 OpenAI 04-11
Cirrus团队
OpenAI
团队加入 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
ChatGPT搜索与深度研究功能教程 04-10
ChatGPT
搜索功能
深度研究 |
[自动]
[ARXIV] | 1min | school
面向代理多模态模型的元认知工具使用培养 04-10
多模态模型
强化学习
工具使用 |
[自动]
[JUEJIN] | 1min | sticky_note_2
Claude Code 国内大模型配置:多模型并存可回滚 04-10
Claude Code
国内大模型
多模型配置 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
AI模型训练中复杂性削减技术 04-09
模型压缩
在线剪枝
控制理论 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
Meta发布Muse Spark,首个基于全新栈的前沿模型 04-09
Meta
Muse
大模型 |
[自动]
[JUEJIN] | 1min | sticky_note_2
LangChain实战:多会话AI聊天页面构建 04-09
LangChain
Streamlit
通义千问 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
MSL发布Muse Spark首个全新架构前沿模型 04-08
大模型
MuseSpark
Meta |
[自动]
[BLOGS_PODCASTS] | 1min | mic
Amazon Nova模型Bedrock微调完整指南 04-08
Nova
Bedrock
微调 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic估值达$30B 新模型因太危险无法发布 04-08
Anthropic
Claude
GlassWing |
[自动]
[JUEJIN] | 1min | sticky_note_2
Claude Code 架构深度解析:从终端输入到响应输出 04-08
Claude Code
架构解析
终端交互 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Sonnet 4.6错误率上升 04-08
Sonnet
错误率上升
大模型 |
[自动]
[ARXIV] | 2min | school
建模LLM生成文本中创造者与编辑者双重角色 04-07
LLM生成检测
细粒度分类
修辞结构理论 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
Symphony:OpenAI代码工厂百万行代码日产十亿token 04-07
大模型
代码工厂
自动化 |
[自动]
[JUEJIN] | 1min | sticky_note_2
OpenClaw如何引发开源AI智能体生态热潮 04-07
开源AI
智能体
OpenClaw |
[自动]
[HACKER_NEWS] | 1min | newspaper
Netflix Void模型实现交互与视频对象删除功能 04-07
Netflix
Void模型
视频对象删除 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemma 4下载量突破200万次 04-07
Gemma
大模型
Google |
[自动]
[JUEJIN] | 1min | sticky_note_2
SeedDance2.0快速上手:跳过万人排队,两分钟体验AI视频生成 04-06
AI视频生成
SeedDance2.0
快速上手 |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建轻量级LLM:以代码直观展示语言模型工作原理 04-06
轻量级LLM
语言模型原理
代码示例 |
[自动]
[ARXIV] | 2min | school
ActionParty:生成式视频游戏多主体动作绑定方法 04-05
生成式视频
多智能体
动作绑定 |
[自动]
[HACKER_NEWS] | 1min | newspaper
实测Gemma 4在iPhone上的性能表现 04-05
Gemma
iPhone
性能测试 |
[自动]
[JUEJIN] | 1min | sticky_note_2
Claude Opus/Sonnet/Haiku 4.6文档摘要与抽取实测对比 04-05
Claude
模型对比
文档摘要 |
[自动]
[ARXIV] | 1min | school
ActionParty:生成式游戏多主体动作绑定 04-04
多主体动作绑定
视频扩散模型
生成式游戏 |
[自动]
[HACKER_NEWS] | 1min | newspaper
自蒸馏方法提升代码生成效率 04-04
自蒸馏
代码生成
模型优化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Apple自蒸馏技术简化代码生成流程 04-04
自蒸馏
代码生成
大模型 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
Google Gemma 4小型多模态开源模型性能大幅提升 04-03
Gemma 4
多模态
Google |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布Gemma 4开源模型 04-03
谷歌
Gemma
开源模型 |
2026年三月
1047 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[JUEJIN] | 1min | sticky_note_2
机器学习:先看数据标签再选算法 03-20
机器学习
算法分类
监督学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
新指标识别大型语言模型过度自信问题 03-20
大语言模型
过度自信
不确定性量化 |
[自动]
[ARXIV] | 2min | school
动量解相关优化器MUD加速Transformer训练 03-20
MUD优化器
动量去相关
Transformer训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用RAG将文本图像转化为视频的方案 03-20
AI视频
VRAG
AmazonBedrock |
[自动]
[ARXIV] | 3min | school
仅解码器模型的机器翻译性别消歧诊断 03-20
机器翻译
性别偏见
仅解码器 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI思维链监控:检测内部编码智能体对齐失败 03-20
思维链监控
对齐失败
AI安全 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nova Forge SDK发布:简化企业LLM定制流程 03-20
LLM定制
SDK工具
企业AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
MiniMax 2.7发布:GLM-5开源模型成本降至三分之一 03-20
MiniMax
GLM-5
开源模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock环境部署Nemotron 3 Super模型指南 03-20
Nemotron 3
Amazon Bedrock
AWS |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT慢速运行实现10倍数据效率方案 03-20
NanoGPT
大模型
训练优化 |
[自动]
[ARXIV] | 3min | school
Loc3R-VLM语言驱动定位与3D推理视觉模型 03-20
视觉语言模型
三维推理
语言驱动定位 |
[自动]
[ARXIV] | 4min | school
统一时空Token评分提升视频VLM效率 03-19
视频VLM
Token剪枝
计算效率 |
[自动]
[HACKER_NEWS] | 1min | newspaper
神经细胞自动机预训练语言模型研究 03-19
神经细胞自动机
语言模型
预训练 |
[自动]
[ARXIV] | 2min | school
机器翻译性别消歧:仅解码器架构诊断评估 03-19
机器翻译
性别消歧
解码器 |
[自动]
[ARXIV] | 2min | school
机器人基础模型的规范感知分布塑造 03-19
机器人基础模型
规格感知
分布优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
新指标识别AI模型过度自信 降低幻觉风险 03-19
过度自信
不确定性量化
幻觉检测 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI收购Astral加速Codex和Python开发工具 03-19
OpenAI
Astral
收购 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nova Forge SDK 训练 Amazon Nova 模型教程 03-19
Nova Forge SDK
Amazon Nova
Amazon SageMaker |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nova Forge SDK 发布:简化企业 LLM 模型定制流程 03-19
LLM定制
SDK
企业AI |
[自动]
[ARXIV] | 3min | school
MUD优化器通过动量去相关加速Transformer训练 03-19
优化器
动量去相关
白化 |
[自动]
[ARXIV] | 3min | school
Loc3R-VLM:基于语言提示的3D定位与推理模型 03-19
视觉语言模型
3D定位
语言提示 |
[自动]
[HACKER_NEWS] | 1min | newspaper
ICML审稿使用LLM导致2%论文被直接拒稿 03-19
ICML
大模型
审稿 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Bark与AWS合作打造可扩展AI视频生成方案 03-19
视频生成
AWS
可扩展架构 |
[自动]
[ARXIV] | 2min | school
AgentFactory框架:子代理积累复用实现自进化 03-19
AgentFactory
LLM-Agent
自演进 |
[自动]
[ARXIV] | 3min | school
边缘端高效推理:资源受限设备的模型优化方法 03-18
边缘计算
模型压缩
高效推理 |
[自动]
[ARXIV] | 3min | school
大语言模型的在线体验学习框架 03-18
LLM
OEL
在线学习 |
[自动]
[HACKER_NEWS] | 2min | newspaper
为何AI系统难以自主学习:基于认知科学的视角 03-18
自主学习
认知科学
AI系统 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Studio 03-18
Unsloth
LLM
微调 |
[自动]
[ARXIV] | 2min | school
SocialOmni:全模态模型视听社交交互基准测试 03-18
SocialOmni
全模态
OLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Nemotron 3 Nano 4B:面向高效本地AI的紧凑型混合模型 03-18
Nemotron
本地部署
混合模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Meta REA 自主代理加速广告排名模型 ML 实验 03-18
Meta
REA
AI Agent |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Introducing GPT-5.4 mini and nano 03-18
GPT-5.4
OpenAI
小模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Hugging Face 2026年春季开源生态现状报告 03-18
Hugging Face
开源报告
行业现状 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Holotron-12B:高吞吐率计算机使用智能体 03-18
Holotron
智能体
计算机使用 |
[自动]
[ARXIV] | 2min | school
Demystifing Video Reasoning 03-18
视频推理
扩散模型
Diffusion Transformer |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS生成式AI创新中心:企业代理型AI落地指南(下) 03-18
Agentic AI
企业落地
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT-4o mini与nano:更小更快,优化编码与多模态推理 03-18
OpenAI
GPT-4o
模型发布 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nemotron 3 Nano 4B:面向高效本地 AI 的紧凑混合模型 03-18
Nemotron
本地部署
混合模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mistral AI 发布 Forge:用于微调和测试的轻量级模型 03-18
Mistral AI
模型微调
轻量级模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Meta 排序工程师代理:自主加速广告排名模型迭代 03-18
Meta
REA
AI Agent |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Holotron-12B:高吞吐率计算机使用智能体 03-18
Holotron
智能体
Computer Use |
[自动]
[ARXIV] | 3min | school
Chronos:基于结构化事件检索的时序感知对话智能体 03-18
LLM
Agent
RAG |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS生成式AI创新中心:企业代理型AI落地指南(角色篇) 03-18
Agentic AI
企业落地
AWS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Atos利用AWS AI League加速AI学习与游戏化实践 03-18
AWS
Atos
AI教育 |
[自动]
[HACKER_NEWS] | 1min | newspaper
为何AI系统难以自主学习:认知科学视角的解析 03-18
自主学习
认知科学
AI系统 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mistral AI 发布 Forge:微调与推理优化工具 03-18
Mistral AI
Forge
模型微调 |
[自动]
[ARXIV] | 3min | school
SmartSearch:排序机制如何优化对话记忆检索 03-18
RAG
检索增强
排序机制 |
[自动]
[ARXIV] | 4min | school
OpenSeeker: Democratizing Frontier Search Agents by Ful 03-18
OpenSeeker
搜索代理
数据集开源 |
[自动]
[ARXIV] | 4min | school
Code-A1:基于强化学习的代码与测试大模型对抗进化 03-18
Code-A1
强化学习
代码生成 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Studio 03-18
Unsloth
LLM
微调 |
[自动]
[ARXIV] | 4min | school
Mixture-of-Depths 动态分配计算资源的注意力机制 03-18
MoDA
注意力机制
深度学习 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mistral AI 发布 Forge 模型微调工具 03-18
Mistral AI
Forge
模型微调 |
[自动]
[ARXIV] | 4min | school
HorizonMath:自动验证技术衡量AI数学发现进展 03-18
HorizonMath
数学推理
基准测试 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
首个医疗机器人数据集及基础物理AI模型发布 03-17
医疗机器人
物理AI
基础模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Studio 03-17
Unsloth
LLM
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT-4o mini与nano:更小更快,优化代码与多模态 03-17
OpenAI
GPT-4o
模型发布 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Meta 排序工程师代理:自主管理广告排序模型全生命周期 03-17
Meta
AI Agent
广告排序 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Hugging Face 2026年春季开源生态现状报告 03-17
Hugging Face
开源报告
行业现状 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
Holotron-12B:高吞吐率计算机使用智能体 03-17
Holotron
智能体
Computer Use |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS生成式AI创新中心:企业代理型AI实施指南与角色分工 03-17
Agentic AI
企业落地
AWS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
首个医疗机器人数据集及基础物理AI模型发布 03-17
医疗机器人
物理AI
基础模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS生成式AI创新中心:企业代理式AI实施指南(角色篇) 03-17
Agentic AI
AWS
企业落地 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 推出百万上下文窗口通用版 03-17
Anthropic
上下文窗口
LLM |
[自动]
[ARXIV] | 3min | school
强化学习激发过程推理能力提升机器人操控性能 03-17
机器人操控
强化学习
过程推理 |
[自动]
[ARXIV] | 3min | school
大语言模型道德冷漠现象的机制起源研究 03-17
对齐
AI安全
道德推理 |
[自动]
[ARXIV] | 3min | school
反事实解释指标与用户感知的一致性研究 03-17
可解释性
反事实解释
用户感知 |
[自动]
[ARXIV] | 3min | school
SmartSearch:排序机制如何优化对话记忆检索 03-17
RAG
检索优化
对话记忆 |
[自动]
[ARXIV] | 4min | school
OpenSeeker:通过完全开源训练数据降低前沿搜索代理门槛 03-17
OpenSeeker
搜索智能体
数据合成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT-5.4 mini与nano:优化编程与多模态推理 03-17
OpenAI
GPT-5.4
模型发布 |
[自动]
[ARXIV] | 4min | school
Mixture-of-Depths 动态分配计算资源的注意力机制 03-17
MoDA
注意力机制
模型架构 |
[自动]
[ARXIV] | 3min | school
HorizonMath:自动验证技术评估AI数学发现能力 03-17
HorizonMath
数学基准
自动验证 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Holotron-12B:高吞吐率计算机操作智能体 03-17
Holotron
计算机操作
Agent |
[自动]
[ARXIV] | 2min | school
Code-A1:基于强化学习的代码与测试大模型对抗进化 03-17
Code-A1
强化学习
代码生成 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI 智能体三月挑战赛 03-17
AI智能体
LLM
挑战赛 |
[自动]
[ARXIV] | 3min | school
AC-Foley:参考音频引导的声学迁移视频生成音频模型 03-17
多模态
V2A
视频生成音频 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
首个医疗机器人数据集及基础物理AI模型发布 03-17
医疗机器人
物理AI
基础模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
企业级代理型 AI 落地指南:针对不同角色的实施策略 03-17
Agentic AI
企业落地
AWS |
[自动]
[JUEJIN] | 2min | sticky_note_2
从LLM到Agent:一文拆解AI核心概念与演进 03-17
LLM
Agent
Prompt |
[自动]
[HACKER_NEWS] | 1min | newspaper
OpenAI发布GPT‑5.4 Mini与Nano模型 03-17
OpenAI
GPT-5.4
Mini模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Hugging Face 2026年春季开源生态现状报告 03-17
Hugging Face
开源报告
行业现状 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 百万上下文窗口 GA:为何落后于 Gemini 与 OpenAI 03-17
Anthropic
Claude 3
上下文窗口 |
[自动]
[HACKER_NEWS] | 2min | newspaper
AI 智能体三月挑战赛 03-17
AI 智能体
LLM
Agent |
[自动]
[BLOGS_PODCASTS] | 1min | mic
首个医疗机器人数据集及基础物理AI模型发布 03-17
医疗机器人
物理AI
基础模型 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
P-EAGLE:vLLM集成并行推测解码加速LLM推理 03-17
vLLM
P-EAGLE
推测解码 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LLM可解释性研究:特征归因与数据归因方法解析 03-17
LLM
可解释性
特征归因 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Holotron-12B:高吞吐率计算机使用智能体 03-17
Holotron-12B
Computer Use
智能体 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
[AINews] Context Drought 03-17
Anthropic
Claude
长上下文 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究员谈提升LLM抱负的高回报活动 03-17
OpenAI
LLM
模型优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
面向大规模语言模型的交互识别与可解释性研究 03-17
LLM
可解释性
SPEX |
[自动]
[BLOGS_PODCASTS] | 3min | mic
RAG后的检索:混合搜索、Agent与数据库设计 03-17
RAG
混合搜索
Agent |
[自动]
[BLOGS_PODCASTS] | 4min | mic
P-EAGLE:vLLM集成并行推测解码加速LLM推理 03-17
vLLM
P-EAGLE
推测解码 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛开发深度学习模型可提前一年预测心衰恶化 03-17
深度学习
医疗AI
心衰预测 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 推出百万上下文窗口,落后于 Gemini 与 OpenAI 03-17
Anthropic
上下文窗口
百万上下文 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
首个医疗机器人数据集及基础物理AI模型发布 03-17
医疗机器人
物理AI
数据集 |
[自动]
[JUEJIN] | 2min | sticky_note_2
零基础学 Agent :拆解一个 Agent 的「零件清单」——8 个模块逐一讲透 第 2 期 03-17
Agent
LLM
RAG |
[自动]
[JUEJIN] | 2min | sticky_note_2
编码 Agent 如何重塑工程、产品与设计工作流 03-17
编码Agent
LangChain
工作流 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS生成式AI创新中心:企业代理型AI落地指南(下篇) 03-17
Agentic AI
AWS
企业落地 |
[自动]
[JUEJIN] | 1min | sticky_note_2
清华团队开源!1 键生成多 Agent 智能体 AI 课堂 03-17
多智能体
AI教育
个性化学习 |
[自动]
[JUEJIN] | 2min | sticky_note_2
MiniMax M2.5:108天极速迭代,MoE与Agent原生架构重塑全球AI格局 03-17
MiniMax
M2.5
MoE |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA GTC 2026 回顾:OpenClaw 与 Vera CPU 亮相及万亿销售目标展望 03-17
NVIDIA
GTC 2026
Jensen Huang |
[自动]
[BLOGS_PODCASTS] | 2min | mic
首个医疗机器人数据集及基础物理AI模型发布 03-17
医疗机器人
物理AI
基础模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
面向大语言模型的大规模交互识别方法 03-17
LLM
可解释性
SPEX |
[自动]
[ARXIV] | 3min | school
基于脉冲神经网络的层级自适应幅度剪枝 03-17
脉冲神经网络
剪枝
模型压缩 |
[自动]
[ARXIV] | 1min | school
合成监督学习优化视频问答关键帧选择 03-17
VideoQA
关键帧选择
多模态模型 |
[自动]
[ARXIV] | 2min | school
RS-WorldModel:遥感理解与未来预测统一模型 03-17
遥感
世界模型
时空预测 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
P-EAGLE:vLLM 集成并行推测解码加速 LLM 推理 03-17
LLM
vLLM
推理加速 |
[自动]
[ARXIV] | 4min | school
LLM作为图核:文本丰富图的消息传递重思考 03-17
LLM
Text-Rich Graphs
RAMP |
[自动]
[BLOGS_PODCASTS] | 1min | mic
Agentic AI in the Enterprise Part 2: Guidance by Person 03-17
Agentic AI
企业级应用
AWS |
[自动]
[ARXIV] | 3min | school
面向神经元感知的大模型指令数据筛选方法 03-17
NAIT
指令微调
数据筛选 |
[自动]
[HACKER_NEWS] | 1min | newspaper
英伟达发布Vera CPU:专用于代理式AI 03-17
英伟达
Vera CPU
代理式 AI |
[自动]
[ARXIV] | 3min | school
智能体AI中的语义不变性研究 03-17
Agentic AI
语义不变性
鲁棒性 |
[自动]
[ARXIV] | 3min | school
可学习性与隐私漏洞纠缠于少数关键权重 03-17
隐私保护
机器学习
成员推断 |
[自动]
[ARXIV] | 2min | school
从实验到专家:AI驱动计算研究的科学知识整合 03-17
AI驱动研究
科学知识整合
计算物理 |
[自动]
[ARXIV] | 3min | school
Visual-ERM:面向视觉等价性的奖励建模 03-17
Visual-ERM
视觉奖励模型
LVLM |
[自动]
[ARXIV] | 3min | school
PhysMoDPO:基于偏好优化的人形机器人物理逼真运动生成 03-17
人形机器人
运动控制
DPO |
[自动]
[JUEJIN] | 3min | sticky_note_2
Next.js + Ollama + Qwen3 构建本地流式聊天应用 03-17
Next.js
Ollama
Qwen3 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-17
深度学习
医疗AI
心衰预测 |
[自动]
[ARXIV] | 3min | school
LLM宪法多智能体治理框架 03-17
多智能体
LLM治理
对齐 |
[自动]
[JUEJIN] | 2min | sticky_note_2
Amazon Nova Forge 如何缓解大模型微调中的灾难性遗忘 03-17
大模型微调
灾难性遗忘
SFT |
[自动]
[BLOGS_PODCASTS] | 1min | mic
首个医疗机器人数据集及基础物理AI模型发布 03-16
医疗机器人
物理AI
基础模型 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
P-EAGLE: Faster LLM inference with Parallel Speculative 03-16
LLM
vLLM
P-EAGLE |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型,可提前一年预测心衰恶化风险 03-16
深度学习
医疗AI
心衰预测 |
[自动]
[ARXIV] | 2min | school
从实验到专家:AI计算研究中的科学知识整合 03-16
AI for Science
LLM
Agent |
[自动]
[ARXIV] | 3min | school
Visual-ERM:视觉等效性奖励建模方法 03-16
Visual-ERM
奖励模型
RLHF |
[自动]
[ARXIV] | 3min | school
Semantic Invariance in Agentic AI 03-16
Agentic AI
语义不变性
Agent |
[自动]
[ARXIV] | 4min | school
PhysMoDPO:基于偏好优化的仿人运动生成 03-16
PhysMoDPO
DPO
偏好优化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mistral 发布 Leanstral 模型 03-16
Mistral
Leanstral
LLM |
[自动]
[ARXIV] | 3min | school
LLM 宪政多智能体治理框架 03-16
LLM
多智能体
AI治理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
面向大规模语言模型的交互识别与归因分析 03-16
LLM
可解释性
归因分析 |
[自动]
[JUEJIN] | 2min | sticky_note_2
阿里云通义实验室发布2026年开源个人AI助手CoPaw 03-16
CoPaw
通义实验室
阿里云 |
[自动]
[HACKER_NEWS] | 2min | newspaper
英伟达发布Vera CPU:专用于代理式AI 03-16
英伟达
Vera
CPU |
[自动]
[BLOGS_PODCASTS] | 4min | mic
P-EAGLE:vLLM 集成并行推测解码加速 LLM 推理 03-16
vLLM
P-EAGLE
LLM推理 |
[自动]
[JUEJIN] | 2min | sticky_note_2
OpenClaw 记忆系统指南:让 AI 持久化记住用户偏好 03-16
OpenClaw
记忆系统
持久化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA NeMo Retriever 推出可泛化智能体检索流水道 03-16
NVIDIA
NeMo
RAG |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型 提前一年预测心衰预后 03-16
深度学习
心衰预测
医疗AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS企业级代理式AI指南:面向不同角色的落地策略 03-16
Agentic AI
AWS
企业落地 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Agent Skills:面向智能体的开放安全数据库 03-16
Agent
智能体
安全数据库 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
[AINews] Context Drought 03-16
Anthropic
Claude
上下文窗口 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI研究员探讨提升大语言模型期望的高回报活动 03-16
OpenAI
LLM
高回报活动 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
P-EAGLE:vLLM集成并行推测解码加速LLM推理 03-16
vLLM
P-EAGLE
推测解码 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-16
深度学习
心衰预测
医疗AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LLM可解释性研究:规模化场景下的交互识别方法 03-16
LLM
可解释性
SPEX |
[自动]
[HACKER_NEWS] | 1min | newspaper
大语言模型交互中的认知负荷与用户疲劳研究 03-16
LLM
认知负荷
用户体验 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA NeMo Retriever 推出通用智能体检索流水线 03-16
NVIDIA
NeMo
RAG |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 架构画廊:主流大语言模型结构概览 03-16
LLM
Transformer
模型架构 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI反复改变决策的“你确定吗”问题解析 03-16
决策一致性
模型幻觉
提示词工程 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
[AINews] Context Drought 03-16
Anthropic
上下文窗口
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
识别LLM大规模交互:特征与数据归因 03-16
LLM
可解释性
特征归因 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
P-EAGLE:vLLM集成并行推测解码加速LLM推理 03-16
vLLM
P-EAGLE
EAGLE |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA NeMo Retriever 推出通用智能体检索流水线 03-16
NeMo
RAG
检索增强 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型可提前一年预测心衰恶化 03-16
深度学习
医疗AI
心衰预测 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 正式上线百万上下文窗口 03-16
Anthropic
上下文窗口
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Amazon Bedrock新增CloudWatch指标:监控TTFT与配额消耗 03-16
Amazon Bedrock
CloudWatch
TTFT |
[自动]
[BLOGS_PODCASTS] | 3min | mic
3 Questions: On the future of AI and the mathematical a 03-16
AI
数学
物理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究员谈提升LLM抱负的高回报活动 03-16
LLM
OpenAI
Prompt技巧 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 输出易引发认知疲劳,需优化交互设计 03-16
LLM
交互设计
认知疲劳 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM Architecture Gallery 03-16
LLM
架构设计
模型部署 |
[自动]
[HACKER_NEWS] | 1min | newspaper
大语言模型交互中的认知疲劳与能耗问题 03-16
LLM
认知疲劳
能耗 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM Architecture Gallery 03-16
LLM
架构设计
模型部署 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM的高认知负荷与用户疲劳机制分析 03-16
LLM
认知负荷
用户体验 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 架构画廊:主流大语言模型结构解析 03-16
LLM
模型架构
Transformer |
[自动]
[HACKER_NEWS] | 1min | newspaper
大语言模型架构图集 03-16
LLM
架构图
模型架构 |
[自动]
[HACKER_NEWS] | 2min | newspaper
LLM 应用中的认知负荷与用户疲劳问题研究 03-16
LLM
认知负荷
用户体验 |
[自动]
[HACKER_NEWS] | 1min | newspaper
什么是智能体工程:定义、架构与应用场景 03-16
智能体
Agent
架构设计 |
[自动]
[ARXIV] | 3min | school
探究推理模型作为裁判在非可验证LLM后训练中的作用 03-16
LLM
后训练
LLM-as-Judge |
[自动]
[JUEJIN] | 1min | sticky_note_2
大模型幻觉频发:代码调试与API调用的隐形陷阱 03-16
大模型
幻觉
代码调试 |
[自动]
[ARXIV] | 3min | school
基于能量函数的语言模型特征匹配微调方法 03-16
LLM
微调
能量函数 |
[自动]
[ARXIV] | 3min | school
可分离神经架构:统一预测与生成智能的基元 03-16
SNA
神经架构
统一智能 |
[自动]
[ARXIV] | 3min | school
SciMDR:科学多模态文档推理基准测试与进展 03-16
SciMDR
多模态
文档推理 |
[自动]
[ARXIV] | 3min | school
EndoCoT: Scaling Endogenous Chain-of-Thought Reasoning 03-16
EndoCoT
扩散模型
DiT |
[自动]
[ARXIV] | 4min | school
BiGain:面向生成与分类任务的统一令牌压缩 03-16
扩散模型
令牌压缩
DiT |
[自动]
[ARXIV] | 4min | school
高维混沌中的潜在颜色子空间涌现秩序 03-16
FLUX.1
文生图
VAE |
[自动]
[HACKER_NEWS] | 1min | newspaper
机器学习可视化的直观入门指南 03-16
机器学习
可视化
入门指南 |
[自动]
[HACKER_NEWS] | 2min | newspaper
基于不完美人体运动数据学习人形机器人网球技能 03-16
人形机器人
运动学习
强化学习 |
[自动]
[ARXIV] | 2min | school
Spatial-TTT:基于测试时训练的流式视觉空间智能 03-16
Spatial-TTT
测试时训练
TTT |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM生成内容导致用户认知负荷过重 03-16
认知负荷
用户体验
LLM |
[自动]
[ARXIV] | 3min | school
潜在色彩子空间:高维混沌中的涌现秩序 03-15
文生图
FLUX.1
VAE |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·泰勒:AI与数理科学的双向互通与共同进步 03-15
AI for Science
数理科学
Jesse Thaler |
[自动]
[HACKER_NEWS] | 1min | newspaper
机器学习可视化入门指南 03-15
机器学习
可视化
入门指南 |
[自动]
[ARXIV] | 3min | school
探究推理模型作为裁判在非可验证LLM后训练中的表现 03-15
LLM
RLHF
强化学习 |
[自动]
[HACKER_NEWS] | 1min | newspaper
大语言模型架构图集与设计概览 03-15
LLM
架构设计
Transformer |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大规模识别LLM交互:提升可解释性与安全性的归因方法 03-15
LLM
可解释性
归因分析 |
[自动]
[ARXIV] | 3min | school
基于能量的语言模型微调:匹配特征而非词元 03-15
微调
能量模型
特征匹配 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-15
ASR
NVIDIA
Nemotron |
[自动]
[ARXIV] | 3min | school
可分离神经架构:统一预测与生成智能的基元 03-15
神经架构
SNA
统一智能 |
[自动]
[ARXIV] | 3min | school
STAMP:面向文本隐私的选择性任务感知机制 03-15
STAMP
文本隐私
差分隐私 |
[自动]
[ARXIV] | 3min | school
Spatial-TTT:基于测试时训练的流式视觉空间智能 03-15
计算机视觉
测试时训练
流式处理 |
[自动]
[ARXIV] | 4min | school
SciMDR:科学多模态文档推理基准与进展 03-15
SciMDR
多模态
文档推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
RAG之后的检索:混合搜索、Agent与数据库设计 03-15
RAG
混合搜索
Agent |
[自动]
[BLOGS_PODCASTS] | 4min | mic
P-EAGLE:vLLM 集成并行推测解码加速 LLM 推理 03-15
vLLM
P-EAGLE
推测解码 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究员探讨提升大语言模型期望的高回报活动 03-15
OpenAI
LLM
模型评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA NeMo Retriever 推出通用智能体检索管线 03-15
NVIDIA
NeMo
RAG |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-15
深度学习
心衰预测
医疗AI |
[自动]
[ARXIV] | 4min | school
EndoCoT:扩散模型内生思维链推理扩展方法 03-15
扩散模型
EndoCoT
思维链 |
[自动]
[ARXIV] | 4min | school
BiGain:面向生成与分类任务的统一令牌压缩方法 03-15
BiGain
Token压缩
扩散模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 百万 token 上下文窗口通用版为何姗姗来迟 03-15
Anthropic
Claude
长上下文 |
[自动]
[HACKER_NEWS] | 1min | newspaper
机器学习原理的可视化入门指南 03-15
机器学习
可视化
入门指南 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用不完美人体动作数据学习仿人机器人网球技能 03-15
仿人机器人
运动控制
强化学习 |
[自动]
[JUEJIN] | 1min | sticky_note_2
315晚会曝光大模型投毒:操纵AI推荐虚假信息 03-15
数据投毒
AI安全
315晚会 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 架构画廊:主流大模型架构概览与设计对比 03-15
LLM
Transformer
模型架构 |
[自动]
[JUEJIN] | 1min | sticky_note_2
Claude Skills 与 Prompt 的区别:可复用工作流封装与代码审查实践 03-15
Claude
Claude Skills
Prompt |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于PPO的树搜索蒸馏优化语言模型 03-15
PPO
强化学习
模型蒸馏 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于PPO的树搜索蒸馏技术优化语言模型 03-15
PPO
树搜索
模型蒸馏 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Claude 推出合作伙伴网络,扩大企业级 AI 应用生态 03-15
Claude
企业级
AI生态 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于PPO的树搜索蒸馏优化语言模型 03-15
PPO
强化学习
树搜索 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Claude 推出合作伙伴网络,扩大企业级 AI 应用生态 03-15
Claude
企业级
AI生态 |
[自动]
[HACKER_NEWS] | 1min | newspaper
推出 Claude 合作伙伴网络,扩大企业级 AI 落地生态 03-15
Claude
企业级AI
生态合作 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于PPO的树搜索蒸馏技术优化语言模型 03-15
PPO
强化学习
树搜索 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic 投资 1 亿美元扩展 Claude 合作伙伴网络 03-15
Anthropic
Claude
合作伙伴网络 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·赛勒:AI与数理科学的协同演进 03-14
AI
数理科学
协同演进 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
识别大模型交互机制以提升可解释性与安全性 03-14
LLM
可解释性
SPEX |
[自动]
[ARXIV] | 2min | school
潜在色彩子空间:高维混沌中的涌现秩序 03-14
FLUX.1
文生图
VAE |
[自动]
[ARXIV] | 3min | school
探究非可验证LLM后训练中的推理模型评判机制 03-14
LLM
RLHF
强化学习 |
[自动]
[ARXIV] | 3min | school
基于能量函数的语言模型特征级微调方法 03-14
LLM
微调
EBFT |
[自动]
[JUEJIN] | 2min | sticky_note_2
基于 Next.js 构建入门级智能水果推荐 Demo 03-14
Next.js
AI推荐
实战Demo |
[自动]
[ARXIV] | 3min | school
可分离神经架构:统一预测与生成智能的基元 03-14
SNA
神经架构
统一智能 |
[自动]
[ARXIV] | 3min | school
STAMP:面向文本隐私的选择性任务感知机制 03-14
STAMP
文本隐私
差分隐私 |
[自动]
[ARXIV] | 3min | school
Spatial-TTT:基于测试时训练的流式视觉空间智能 03-14
Spatial-TTT
测试时训练
空间智能 |
[自动]
[ARXIV] | 4min | school
SciMDR:科学多模态文档推理基准测试与进展 03-14
SciMDR
多模态
文档推理 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
P-EAGLE:vLLM集成并行推测解码加速LLM推理 03-14
vLLM
P-EAGLE
推测解码 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA NeMo Retriever 推出可泛化智能体检索流水道 03-14
NVIDIA
NeMo
RAG |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-14
深度学习
医疗AI
疾病预测 |
[自动]
[ARXIV] | 4min | school
EndoCoT:扩散模型内生思维链推理扩展方法 03-14
扩散模型
EndoCoT
思维链 |
[自动]
[ARXIV] | 4min | school
BiGain:面向生成与分类任务的统一Token压缩方法 03-14
BiGain
Token压缩
扩散模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 正式发布 100 万 token 上下文窗口 03-14
Anthropic
上下文窗口
长文本 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
基于EC2微调NVIDIA Nemotron ASR模型实现领域适配 03-14
ASR
NVIDIA
NeMo |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-14
深度学习
医疗AI
心衰预测 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS生成式AI中心:高管落地智能体的实战指南 03-14
AWS
Agentic AI
智能体 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
杰西·泰勒:AI与数理科学的交叉融合与双向赋能 03-14
AI for Science
数理科学
交叉融合 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Opus 4.6 与 Sonnet 4.6 现已开放 100 万上下文窗口 03-14
Claude
Opus 4.6
Sonnet 4.6 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Opus 4.6 与 Sonnet 4.6 现已开放百万级上下文窗口 03-14
Claude
Anthropic
长上下文 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究员探讨提升LLM抱负的高回报活动 03-14
LLM
OpenAI
Prompt Engineering |
[自动]
[HACKER_NEWS] | 1min | newspaper
Opus 4.6 与 Sonnet 4.6 现已开放 100 万上下文窗口 03-14
Claude
Opus
Sonnet |
[自动]
[HACKER_NEWS] | 1min | newspaper
能否在本地设备运行人工智能模型 03-14
本地部署
LLM
边缘计算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
面向智能代理的内容优化策略 03-14
智能代理
Agent
内容优化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
马斯克辞退更多 xAI 联合创始人,AI 编码项目进展受阻 03-14
xAI
马斯克
AI编程 |
[自动]
[JUEJIN] | 1min | sticky_note_2
利用RAG技术有效解决大模型幻觉问题 03-14
RAG
LLM
幻觉 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Elon Musk pushes out more xAI founders as AI coding eff 03-14
xAI
Elon Musk
Grok |
[自动]
[JUEJIN] | 2min | sticky_note_2
3分钟搭建AI开发团队:Agency-Agents实战指南 03-14
AI Agents
Agency-Agents
Multi-Agent |
[自动]
[BLOGS_PODCASTS] | 3min | mic
P-EAGLE:vLLM集成并行推测解码加速LLM推理 03-14
vLLM
P-EAGLE
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Operationalizing Agentic AI Part 1: A Stakeholder’s Gui 03-14
Agentic AI
AWS
落地实践 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA NeMo Retriever 推出通用化智能体检索流水道 03-14
NVIDIA
NeMo
RAG |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-14
深度学习
心衰预测
医疗AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Jesse Thaler:AI与数理科学的双向桥梁与未来愿景 03-14
AI
数理科学
跨学科 |
[自动]
[HACKER_NEWS] | 1min | newspaper
探索JEPA架构在实时语音翻译中的应用 03-14
JEPA
语音翻译
实时翻译 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI研究员分享提升LLM期望值的高回报活动 03-14
LLM
OpenAI
Prompt Engineering |
[自动]
[HACKER_NEWS] | 1min | newspaper
Context Gateway:在LLM前压缩Agent上下文 03-14
LLM
Agent
上下文压缩 |
[自动]
[ARXIV] | 2min | school
潜在色彩子空间:高维混沌中的涌现秩序 03-13
FLUX.1
文生图
VAE |
[自动]
[HACKER_NEWS] | 1min | newspaper
探索JEPA架构在实时语音翻译中的应用 03-13
JEPA
语音翻译
实时翻译 |
[自动]
[ARXIV] | 3min | school
探究推理LLM作为非可验证后训练评估器的有效性 03-13
LLM-as-Judge
RLHF
强化学习 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
微调NVIDIA Nemotron ASR模型:基于AWS EC2的领域适配实践 03-13
ASR
NVIDIA
Nemotron |
[自动]
[ARXIV] | 3min | school
基于能量函数的语言模型特征匹配微调方法 03-13
微调
SFT
能量函数 |
[自动]
[ARXIV] | 3min | school
可分离神经网络架构:统一预测与生成智能的基元 03-13
神经网络
架构设计
统一建模 |
[自动]
[ARXIV] | 3min | school
Spatial-TTT:基于测试时训练的流式视觉空间智能 03-13
计算机视觉
测试时训练
流式推理 |
[自动]
[ARXIV] | 3min | school
SciMDR:科学多模态文档推理基准与进展 03-13
SciMDR
多模态
文档推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
RAG后的检索优化:混合搜索、Agent与数据库设计 03-13
RAG
混合搜索
Agent |
[自动]
[BLOGS_PODCASTS] | 4min | mic
P-EAGLE:vLLM集成并行推测解码加速LLM推理 03-13
vLLM
P-EAGLE
推测解码 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA NeMo Retriever 推出可泛化的智能体检索流水线 03-13
NVIDIA
NeMo
RAG |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛团队开发深度学习模型可提前一年预测心衰恶化 03-13
深度学习
医疗AI
心衰预测 |
[自动]
[ARXIV] | 3min | school
EndoCoT:扩散模型内生思维链推理扩展方法 03-13
扩散模型
EndoCoT
思维链 |
[自动]
[ARXIV] | 4min | school
BiGain:面向生成与分类任务的统一Token压缩 03-13
BiGain
Token压缩
扩散模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS生成式AI中心高管指南:如何将智能体AI投入生产 03-13
Agentic AI
AWS
落地指南 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI与数理科学的融合:Jesse Thaler谈双向赋能与未来愿景 03-13
AI
数理科学
Jesse Thaler |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究员Aidan McLaughlin:提升LLM期望的高回报活动 03-13
LLM
OpenAI
Prompt |
[自动]
[HACKER_NEWS] | 1min | newspaper
Elon Musk pushes out more xAI founders as AI coding eff 03-13
Elon Musk
xAI
Grok |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Amazon Bedrock新增CloudWatch指标:TTFT与配额消耗监控 03-13
Amazon Bedrock
CloudWatch
TTFT |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·泰勒:AI与数理科学的双向桥梁与共同进步 03-13
AI for Science
跨学科融合
可解释性 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-13
ASR
NVIDIA
Nemotron |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS生成式AI中心:C级高管落地智能体的行动指南 03-13
Agentic AI
AWS
落地指南 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
构建可复用工具生成Agent:登顶DABStep榜单的数据科学实践 03-13
Agent
数据科学
DABStep |
[自动]
[HACKER_NEWS] | 3min | newspaper
Spine Swarm:支持 AI 智能体在可视化画布上协作 03-13
Spine Swarm
AI 智能体
Agent 协作 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-13
深度学习
心衰预测
医疗AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
Context Gateway:在LLM处理前压缩Agent上下文 03-13
LLM
Agent
上下文压缩 |
[自动]
[HACKER_NEWS] | 1min | newspaper
在Transformer内部执行程序以实现指数级推理加速 03-13
Transformer
推理加速
算法优化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
杰西·泰勒:AI与数理科学的双向桥梁及共同进步愿景 03-13
AI
数理科学
跨学科 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
构建具备数据科学家思维的Agent:可复用工具生成技术解析 03-13
Agent
数据科学
工具生成 |
[自动]
[HACKER_NEWS] | 1min | newspaper
在Transformer内部执行程序以实现指数级推理加速 03-13
Transformer
推理加速
算法优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型 提前一年预测心衰恶化 03-13
深度学习
心衰预测
MIT |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic推出提示词缓存功能 自动注入断点节省90%Token 03-13
Anthropic
提示词缓存
Token优化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
在Transformer内部执行程序以实现指数级推理加速 03-13
Transformer
推理加速
算法创新 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic推出提示词缓存自动注入功能,可节省90%Token成本 03-13
Anthropic
提示词缓存
Token成本 |
[自动]
[JUEJIN] | 2min | sticky_note_2
1-bit 大模型官方推理框架:低显存低功耗 LLM 部署方案 03-13
1-bit LLM
推理框架
模型量化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
在Transformer内部执行程序以实现指数级推理加速 03-13
Transformer
推理加速
算法创新 |
[自动]
[HACKER_NEWS] | 2min | newspaper
RAG系统文档投毒攻击:如何污染AI数据源 03-13
RAG
LLM
提示注入 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
杰西·塞勒:AI与数理科学的双向赋能与未来愿景 03-13
AI
数理科学
交叉学科 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
Replit Agent 4:面向知识工作的智能体 03-13
Replit Agent
智能体
AI 编程 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
From model to agent: Equipping the Responses API with a 03-13
OpenAI
Agent
Responses API |
[自动]
[BLOGS_PODCASTS] | 2min | mic
构建具备数据科学家思维的智能体:可复用工具生成机制与DABStep榜首实践 03-13
AI Agent
数据科学
工具生成 |
[自动]
[JUEJIN] | 2min | sticky_note_2
从聊天机器人到数字员工:解析AI世界的运转逻辑 03-13
LLM
Agent
RAG |
[自动]
[HACKER_NEWS] | 1min | newspaper
RAG系统文档投毒攻击:如何污染AI数据源 03-13
RAG
数据投毒
提示注入 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-13
ASR
NVIDIA
Nemotron |
[自动]
[HACKER_NEWS] | 1min | newspaper
RAG系统文档投毒攻击:如何污染AI数据源 03-13
RAG
数据投毒
提示词注入 |
[自动]
[JUEJIN] | 1min | sticky_note_2
提示词工程指南:掌握角色设定与任务约束 03-13
提示词工程
Prompt Engineering
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Wayfair利用OpenAI提升电商客服响应速度与商品目录准确性 03-13
OpenAI
电商
客服自动化 |
[自动]
[HACKER_NEWS] | 2min | newspaper
RAG系统文档投毒攻击:如何污染AI知识源 03-13
RAG
提示词注入
数据投毒 |
[自动]
[JUEJIN] | 3min | sticky_note_2
LangChain实战:利用Tool与Function Calling突破大模型能力边界 03-13
LangChain
Function Calling
Tool |
[自动]
[BLOGS_PODCASTS] | 3min | mic
英伟达AI-Q登顶DeepResearch Bench I与II榜单 03-13
英伟达
NVIDIA
AI-Q |
[自动]
[ARXIV] | 4min | school
基于LLM的伪相关反馈系统性研究 03-13
LLM
PRF
伪相关反馈 |
[自动]
[ARXIV] | 4min | school
基于 Leech 格的向量量化实现高效大模型压缩 03-13
LLVQ
模型压缩
向量量化 |
[自动]
[ARXIV] | 3min | school
V2M-Zero:零样本时间对齐视频配乐生成模型 03-13
V2M-Zero
视频配乐
零样本学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型 提前一年预测心衰恶化 03-13
深度学习
医疗AI
心衰预测 |
[自动]
[ARXIV] | 2min | school
LLM评测新范式:从表面启发式到知识 grounded 评估 03-13
LLM评测
LLM-as-a-Judge
评估幻觉 |
[自动]
[ARXIV] | 3min | school
COMIC:基于智能体的素描喜剧生成框架 03-13
COMIC
Agent
多智能体 |
[自动]
[HACKER_NEWS] | 1min | newspaper
RAG系统文档投毒攻击:如何通过污染数据源破坏AI 03-13
RAG
数据投毒
提示词注入 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 模型合并率未见提升,技术瓶颈待解 03-13
LLM
模型合并
模型融合 |
[自动]
[HACKER_NEWS] | 1min | newspaper
IonRouter:低成本高吞吐推理引擎 03-13
IonRouter
推理引擎
YC |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·萨勒:AI与数理科学的双向融合与未来 03-12
AI
数理科学
跨学科 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-12
ASR
NVIDIA
Nemotron |
[自动]
[HACKER_NEWS] | 2min | newspaper
RAG系统文档投毒攻击:攻击者如何污染AI数据源 03-12
RAG
LLM
数据投毒 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA AI-Q登顶DeepResearch Bench I与II榜单 03-12
NVIDIA
AI-Q
DeepResearch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-12
深度学习
心衰预测
医疗AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
ChatGPT防御提示注入:限制风险操作与保护敏感数据 03-12
提示注入
Prompt Injection
AI Agent |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS生成式AI中心:C-suite高管落地智能体的生产实践指南 03-12
Agentic AI
AWS
落地实践 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 新增 CloudWatch 指标:TTFT 与估算配额使用率 03-12
Amazon Bedrock
CloudWatch
TTFT |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杨立昆AMI Labs获10亿美元融资,将基于JEPA架构构建世界模型 03-12
Yann LeCun
AMI Labs
世界模型 |
[自动]
[ARXIV] | 3min | school
前沿AI评估:RCT与人类提升研究的方法挑战与解决方案 03-12
AI评估
RCT
因果推断 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Wayfair利用OpenAI提升目录准确性与客服工单分类效率 03-12
OpenAI
LLM
电商应用 |
[自动]
[ARXIV] | 3min | school
V2M-Zero:零样本时序对齐视频配乐生成 03-12
V2M-Zero
视频配乐
零样本学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA AI-Q登顶DeepResearch Bench I与II榜单 03-12
NVIDIA
AI-Q
DeepResearch |
[自动]
[ARXIV] | 3min | school
LLM评测新范式:从表面启发式到知识 grounded 评估 03-12
LLM评测
LLM-as-a-Judge
MERG框架 |
[自动]
[ARXIV] | 4min | school
Leech 格点向量量化实现高效大模型压缩 03-12
LLVQ
模型压缩
量化 |
[自动]
[ARXIV] | 2min | school
COMIC:智能体驱动的素描喜剧生成框架 03-12
COMIC
多智能体
视频生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ChatGPT防御提示词注入与社会工程攻击的机制 03-12
ChatGPT
提示词注入
社会工程学 |
[自动]
[ARXIV] | 3min | school
AI能否像艺术史学家一样解读视觉语言模型的艺术风格识别机制 03-12
VLM
视觉语言模型
艺术风格 |
[自动]
[ARXIV] | 3min | school
A Systematic Study of Pseudo-Relevance Feedback with LL 03-12
LLM
PRF
伪相关反馈 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·泰勒:AI与数理科学的双向融合与未来愿景 03-12
AI for Science
跨学科融合
双向赋能 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Kotlin 创作者推出新语言:用形式化语法与 LLM 交互 03-12
Kotlin
JetBrains
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
Kotlin 作者发布新语言:提供与 LLM 交互的规范化语法 03-12
Kotlin
LLM
新语言 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Claude 新增交互式图表生成与可视化绘图能力 03-12
Claude
交互式图表
可视化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
设计AI代理抵御提示注入与保护敏感数据的方法 03-12
Prompt Injection
AI Agents
ChatGPT |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Wayfair利用OpenAI优化产品目录并自动化工单分流 03-12
OpenAI
电商
工单自动化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Untitled 03-12
OpenAI
Agent
Responses API |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Untitled 03-12
LLM
Llama
Oumi |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI大模型应用指南:RAG技术原理与企业知识库搭建 03-12
RAG
企业知识库
检索增强生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
面向C级高管的智能体AI落地实践指南 03-12
Agentic AI
AWS
C-Level |
[自动]
[BLOGS_PODCASTS] | 2min | mic
混合系统助力机器人在动态环境中导航及提升装配效率 03-12
机器人
混合系统
动态环境 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
杰西·塞勒:AI与数理科学的协同演进愿景 03-12
AI for Science
跨学科融合
物理信息机器学习 |
[自动]
[JUEJIN] | 1min | sticky_note_2
大模型垂直领域微调系列:认识微调 03-12
微调
LLM
垂直领域 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 EC2 上使用 Oumi 微调 Llama 并将其部署至 Amazon Bedrock 03-12
LLM
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Wayfair利用OpenAI优化产品目录并自动化工单分拣 03-12
OpenAI
电商
自动化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 基于 Responses API 构建智能体运行时环境 03-12
OpenAI
Responses API
Agent |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM 模型性能提升停滞的质疑与分析 03-12
LLM
模型性能
Scaling Laws |
[自动]
[HACKER_NEWS] | 1min | newspaper
为何我不使用大语言模型辅助编程 03-12
LLM
编程
AI辅助编程 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Yann LeCun 创立 AI 实验室融资 4.5 亿美元:基于 JEPA 架构构建世界模型 03-12
Yann LeCun
AMI Labs
世界模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·萨勒:构建AI与数理科学的双向桥梁 03-12
AI
数理科学
跨学科 |
[自动]
[HACKER_NEWS] | 1min | newspaper
SWE-bench通过率存疑:多数通过测试的PR实际不会被合并 03-12
SWE-bench
代码生成
基准测试 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA AI-Q登顶DeepResearch Bench I与II榜单 03-12
NVIDIA
AI-Q
DeepResearch |
[自动]
[HACKER_NEWS] | 1min | newspaper
BitNet:面向本地CPU的1000亿参数1比特模型 03-12
BitNet
1-bit
量化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
SWE-bench通过率高的PR往往无法合并 03-12
SWE-bench
代码生成
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
BitNet:面向本地CPU的1000亿参数1比特模型 03-12
BitNet
1-bit
量化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
纵向AI影响研究初步数据发布 03-12
纵向研究
AI影响
初步数据 |
[自动]
[HACKER_NEWS] | 1min | newspaper
生成式模型的实用价值评估与适用场景分析 03-12
生成式AI
LLM
ROI |
[自动]
[HACKER_NEWS] | 1min | newspaper
SWE-bench基准测试:多数通过评估的PR实际无法合并 03-12
SWE-bench
基准测试
代码生成 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
Code Concepts: A Large-Scale Synthetic Dataset Generate 03-12
合成数据
代码生成
数据集 |
[自动]
[HACKER_NEWS] | 1min | newspaper
BitNet: 100B Param 1-Bit model for local CPUs 03-12
BitNet
1-bit
量化 |
[自动]
[ARXIV] | 3min | school
神经优化器宽度缩放研究:行列归一化与超参数迁移 03-12
优化器
宽度缩放
AdamW |
[自动]
[HACKER_NEWS] | 1min | newspaper
生成式模型的实用价值评估与适用场景分析 03-12
生成式AI
LLM
ROI评估 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·泰勒:AI与数理科学的双向融合与未来愿景 03-12
AI for Science
可解释性
XAI |
[自动]
[ARXIV] | 2min | school
推理机制如何提升大模型诚实度 03-12
诚实度
推理机制
欺骗行为 |
[自动]
[ARXIV] | 3min | school
大语言模型导览如何帮助视障群体使用虚拟现实 03-12
LLM
VR
无障碍 |
[自动]
[ARXIV] | 3min | school
从语义到像素:用于分层视觉理解的粗到细掩码自编码器 03-12
计算机视觉
自监督学习
掩码自编码器 |
[自动]
[ARXIV] | 3min | school
从数据统计到特征几何:相关性如何塑造叠加态 03-12
叠加态
特征几何
相关性 |
[自动]
[ARXIV] | 3min | school
Towards a Neural Debugger for Python 03-12
Neural Debugger
LLM
Python |
[自动]
[HACKER_NEWS] | 1min | newspaper
Perplexity 推出个人电脑:AI 原生计算终端 03-12
Perplexity
AI 原生
硬件 |
[自动]
[ARXIV] | 3min | school
CREATE基准:测试大语言模型的联想创造力 03-12
LLM
CREATE基准
联想创造力 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Autoresearch_at_home:类SETI项目利用闲置资源训练LLM 03-12
分布式训练
LLM
闲置资源 |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型调用工具的原理与Agent开发基础 03-11
LLM
Agent
工具调用 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 EC2 上使用 Oumi 微调 Llama 并将其部署至 Amazon Bedrock 03-11
LLM
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Yann LeCun新公司AMI融资10亿美元开发世界模型 03-11
Yann LeCun
AMI Labs
世界模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Operationalizing Agentic AI Part 1: A Stakeholder’s Gui 03-11
Agentic AI
AWS
落地实践 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI 基于 Responses API 构建安全可扩展的 Agent 运行时 03-11
OpenAI
Agent
Responses API |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Code Concepts:基于编程概念种子的大规模合成数据集 03-11
合成数据
代码生成
数据集 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ChatGPT防范提示注入:限制高风险操作与保护敏感数据 03-11
提示注入
Prompt Injection
AI Agent |
[自动]
[BLOGS_PODCASTS] | 3min | mic
ChatGPT推出数理交互式可视化讲解功能 03-11
ChatGPT
STEM教育
交互式学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
A better method for planning complex visual tasks 03-11
视觉任务规划
混合系统
机器人导航 |
[自动]
[ARXIV] | 2min | school
面向Python的神经网络调试器研究 03-11
LLM
Python
调试器 |
[自动]
[ARXIV] | 4min | school
神经优化器宽度缩放:行列归一化与超参迁移 03-11
优化器
宽度缩放
μP |
[自动]
[ARXIV] | 2min | school
推理机制如何提升大模型的诚实度 03-11
LLM
推理机制
诚实度 |
[自动]
[HACKER_NEWS] | 1min | newspaper
如何入侵麦肯锡AI平台 03-11
麦肯锡
AI平台
安全漏洞 |
[自动]
[ARXIV] | 3min | school
从语义到像素:粗到细掩码自编码器实现分层视觉理解 03-11
计算机视觉
自监督学习
掩码自编码器 |
[自动]
[ARXIV] | 3min | school
从数据统计到特征几何:相关性如何塑造叠加态 03-11
机械可解释性
叠加态
特征几何 |
[自动]
[HACKER_NEWS] | 1min | newspaper
SWE-bench基准测试通过率与实际PR合并率存在偏差 03-11
SWE-bench
基准测试
代码生成 |
[自动]
[ARXIV] | 3min | school
LLM驱动的VR导览系统如何帮助视障用户实现无障碍体验 03-11
LLM
VR
无障碍 |
[自动]
[ARXIV] | 2min | school
CREATE基准测试:评估大模型联想创造力 03-11
CREATE
联想创造力
基准测试 |
[自动]
[HACKER_NEWS] | 1min | newspaper
BitNet:支持本地CPU运行的1000亿参数1比特模型 03-11
BitNet
1-bit
量化 |
[自动]
[ARXIV] | 2min | school
BEACON:遮挡条件下的语言导航可行性预测 03-11
BEACON
语言导航
VLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
利用Oumi在EC2微调Llama并导入Bedrock部署 03-11
Llama
Oumi
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Yann LeCun成立AMI实验室:融资4.5亿美元基于JEPA研发世界模型 03-11
Yann LeCun
JEPA
世界模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI构建基于Responses API的代理运行时环境 03-11
OpenAI
Responses API
Agent |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA AI 工程师探讨行星级 Agent 推理与光速计算 03-11
NVIDIA
Agent
推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IH-Challenge训练提升前沿大模型指令层级与安全性 03-11
指令层级
IH-Challenge
提示词注入 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Code Concepts:基于编程概念种子的大规模合成数据集 03-11
合成数据
代码生成
数据集 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ChatGPT推出数学与科学交互式可视化讲解功能 03-11
ChatGPT
交互式可视化
数学教育 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ChatGPT 代理工作流防范提示注入与社会工程学攻击 03-11
ChatGPT
提示注入
社会工程学 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI自改进研究新进展:递归自我优化能力的初步实现 03-11
AGI
自我改进
递归优化 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Yann LeCun 创立新实验室融资 4.5 亿美元,欲基于 JEPA 架构构建世界模型 03-11
Yann LeCun
AMI Labs
世界模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Wayfair boosts catalog accuracy and support speed with 03-11
OpenAI
电商
客户支持 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI 利用 Responses API 构建具备文件与状态管理的代理运行时 03-11
OpenAI
Responses API
Agent |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IH-Challenge训练提升前沿大模型指令层级与防御能力 03-11
指令层级
IH-Challenge
提示注入 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
ChatGPT新增数学与科学交互式可视化讲解功能 03-11
ChatGPT
交互式可视化
数学教育 |
[自动]
[HACKER_NEWS] | 1min | newspaper
BitNet:面向本地CPU的1000亿参数1比特模型 03-11
BitNet
1-bit
量化 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
AI实现递归自我改进:通用人工智能研究新进展 03-11
AGI
自我改进
递归 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI Agent Hacks McKinsey 03-11
AI Agent
LLM
McKinsey |
[自动]
[BLOGS_PODCASTS] | 2min | mic
16个开源RL库的经验总结:保持Token流动 03-11
RLHF
强化学习
开源库 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
杨立昆AMI Labs融资4.5亿美元:基于JEPA架构构建世界模型 03-11
杨立昆
AMI Labs
世界模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
微软BitNet:可在本地CPU运行的1000亿参数1比特模型 03-11
BitNet
1-bit
量化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在印度使用Amazon Bedrock跨区域推理调用Claude模型 03-11
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上推出完全托管无服务器模型 03-11
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ChatGPT推出数学与科学互动式可视化讲解功能 03-11
ChatGPT
数学教育
科学可视化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI递归自我改进:迈向AGI的关键进展 03-11
AGI
自我改进
递归 |
[自动]
[HACKER_NEWS] | 1min | newspaper
微软BitNet:可在本地CPU运行的1000亿参数1比特模型 03-11
BitNet
1-bit
量化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Yann LeCun成立新实验室获4.5亿美元融资:基于JEPA架构研发世界模型 03-11
Yann LeCun
世界模型
JEPA |
[自动]
[HACKER_NEWS] | 2min | newspaper
TADA:通过文本-声学同步实现快速可靠的语音生成 03-11
TADA
语音生成
TTS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IH-Challenge提升前沿大模型指令层级与安全性 03-11
IH-Challenge
指令层级
提示注入 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI Agent 模拟麦肯锡顾问完成复杂咨询任务 03-11
AI Agent
麦肯锡
咨询 |
[自动]
[HACKER_NEWS] | 1min | newspaper
TADA:通过文本-声学同步实现快速可靠的语音生成 03-11
TADA
语音生成
TTS |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌将为五角大楼提供AI智能体 03-11
Google
Pentagon
AI Agents |
[自动]
[HACKER_NEWS] | 1min | newspaper
Yann LeCun 融资 10 亿美元构建具物理世界理解力的 AI 03-11
Yann LeCun
世界模型
具身智能 |
[自动]
[HACKER_NEWS] | 1min | newspaper
TADA:通过文本-声学同步实现快速可靠的语音生成 03-11
TADA
语音生成
TTS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
混合系统提升机器人在复杂环境中的导航与协作效率 03-11
机器人
混合系统
导航 |
[自动]
[HACKER_NEWS] | 1min | newspaper
智能体工程的层级划分与能力进阶 03-11
智能体
Agent Engineering
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
基于16个开源RL库的Token流生成经验总结 03-11
RLHF
强化学习
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
Yann LeCun 获10亿美元融资研发具身世界模型 03-11
Yann LeCun
世界模型
具身智能 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上提供无服务器服务 03-11
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IH-Challenge提升前沿大模型指令层级与安全防御能力 03-11
LLM
指令层级
安全防御 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Granite 4.0 10亿参数多模态语音模型:紧凑高效,适配边缘计算 03-11
Granite 4.0
语音模型
多模态 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
ChatGPT新增数学与科学交互式可视化讲解功能 03-11
ChatGPT
交互式可视化
数学教育 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI自改进研究新进展:递归自我优化的初步迹象 03-11
AGI
自我改进
递归优化 |
[自动]
[JUEJIN] | 1min | sticky_note_2
美国国家实验室:30张图3D重建化工厂气体泄漏 03-11
NeRF
3D重建
气体检测 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在印度使用 Amazon Bedrock 跨区域推理运行 Claude 模型 03-11
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-11
LLM
Llama
微调 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Yann LeCun 融资 10 亿美元构建理解物理世界的 AI 03-11
Yann LeCun
世界模型
物理世界 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线 03-11
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[JUEJIN] | 2min | sticky_note_2
LangChain结果解析器:将大模型非结构化输出转为结构化数据 03-11
LangChain
LLM
输出解析 |
[自动]
[JUEJIN] | 2min | sticky_note_2
LangChain RAG Loader:网页文档加载、智能分割与检索实现 03-11
LangChain
RAG
文档加载 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IH-Challenge训练提升前沿大模型指令层级与安全性 03-11
IH-Challenge
指令层级
提示注入 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Granite 4.0 1B语音模型:紧凑多语言,专为边缘端设计 03-11
Granite
语音模型
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Google 表格 Gemini 新增 Beta 版功能支持整表创建与编辑 03-11
Google Sheets
Gemini
AI 办公 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
ChatGPT推出数学与科学互动可视化讲解功能 03-11
ChatGPT
数学学习
科学教育 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI自我改进新进展:Autoresearch推动AGI演进 03-11
AGI
自我改进
Autoresearch |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI Skill 技术全景解析:从聊天机器人到全能智能体的进化 03-11
LLM
AI Agent
智能体 |
[自动]
[ARXIV] | 3min | school
评估大语言模型金融智能:SuperInvesting AI基准测试 03-11
LLM
金融智能
基准测试 |
[自动]
[HACKER_NEWS] | 1min | newspaper
生成式模型的实用价值评估与适用场景分析 03-11
生成式AI
LLM
ROI评估 |
[自动]
[ARXIV] | 4min | school
尺度空间扩散模型 03-11
扩散模型
计算机视觉
尺度空间 |
[自动]
[JUEJIN] | 2min | sticky_note_2
OpenAI 指南:从传统编程转向 Agent 编程以提升代码质量 03-11
Agent
OpenAI
编程范式 |
[自动]
[ARXIV] | 4min | school
Agentic Critical Training:基于批判性反馈的大模型推理能力提升机制 03-11
Agentic AI
强化学习
推理能力 |
[自动]
[ARXIV] | 3min | school
评估大语言模型金融智能:SuperInvesting AI基准测试 03-10
金融智能
基准测试
SuperInvesting |
[自动]
[HACKER_NEWS] | 1min | newspaper
杨立昆筹集10亿美元研发具物理世界理解力的AI 03-10
杨立昆
Yann LeCun
融资 |
[自动]
[HACKER_NEWS] | 1min | newspaper
开源权重不等同于开源训练过程 03-10
开源权重
训练过程
模型透明度 |
[自动]
[ARXIV] | 3min | school
尺度空间扩散模型 03-10
扩散模型
计算机视觉
Flexi-UNet |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大脑学习机制揭示:神经元接收精准定制反馈信号 03-10
神经科学
反向传播
误差信号 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-10
LLM
Llama
微调 |
[自动]
[HACKER_NEWS] | 2min | newspaper
双游戏GPU登顶HuggingFace开源LLM榜单的实现方法 03-10
LLM
HuggingFace
GPU |
[自动]
[HACKER_NEWS] | 1min | newspaper
代理工程的技术层级与能力演进 03-10
Agent
LLM
Agentic Engineering |
[自动]
[BLOGS_PODCASTS] | 2min | mic
从16个开源强化学习库中总结的Token流优化经验 03-10
强化学习
RLHF
Token流 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上提供无服务器托管 03-10
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IH-Challenge训练提升前沿大模型指令层级与抗攻击能力 03-10
IH-Challenge
指令层级
Prompt Injection |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Granite 4.0 1B语音模型:轻量级多语言边缘部署方案 03-10
Granite 4.0
语音模型
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
ChatGPT推出数学与科学交互式可视化讲解功能 03-10
ChatGPT
数学学习
科学教育 |
[自动]
[ARXIV] | 4min | school
Agentic Critical Training:基于智能体批判机制的模型训练方法 03-10
ACT
Agent
强化学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
神经元在学习中接收特异性反馈信号 03-10
神经科学
学习机制
误差信号 |
[自动]
[HACKER_NEWS] | 1min | newspaper
智能体工程化的能力层级划分 03-10
智能体
Agent
工程化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
在印度使用Amazon Bedrock跨区域推理调用Claude模型 03-10
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-10
LLM
Llama
Oumi |
[自动]
[HACKER_NEWS] | 1min | newspaper
Yann LeCun 融资 10 亿美元研发具身世界模型 03-10
Yann LeCun
具身智能
世界模型 |
[自动]
[JUEJIN] | 2min | sticky_note_2
OpenClaw 开源智能体科普:电脑操作与文件自动化 03-10
OpenClaw
AI Agent
智能体 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线 03-10
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IH-Challenge提升前沿大模型指令层级与抗攻击能力 03-10
LLM
指令层级
IH-Challenge |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Granite 4.0 1B 语音模型:紧凑、多语言且适配边缘端 03-10
Granite 4.0
语音模型
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ChatGPT引入交互式可视化讲解助力数学与科学学习 03-10
ChatGPT
交互式可视化
数学学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI实现递归式自我改进,通用人工智能研究迎新进展 03-10
AGI
自我改进
递归 |
[自动]
[JUEJIN] | 3min | sticky_note_2
5分钟用Amazon Bedrock搭建能调API的AI Agent 03-10
Amazon Bedrock
AI Agent
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
16个开源RL库经验总结:维持Token流的关键 03-10
RLHF
强化学习
开源库 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大脑学习机制揭示:神经元接收特异性反馈信号 03-10
神经科学
脑机对比
误差信号 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
基于16个开源RL库的Token流生成经验总结 03-10
RLHF
强化学习
开源库 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-10
Oumi
Llama
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 收购 AI 安全平台 Promptfoo 以修复系统漏洞 03-10
OpenAI
Promptfoo
AI安全 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 无服务器模型上推出 03-10
NVIDIA
Amazon Bedrock
Nemotron 3 Nano |
[自动]
[BLOGS_PODCASTS] | 1min | mic
IH-Challenge 训练提升前沿模型指令层级与抗注入能力 03-10
指令层级
提示注入
IH-Challenge |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Granite 4.0 1B语音模型:紧凑多语言,专为边缘端设计 03-10
Granite 4.0
语音模型
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ChatGPT推出数学与科学交互式可视化讲解 03-10
ChatGPT
教育科技
交互式学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AlphaGo 十周年:从围棋博弈到催化科学发现与通用的路径 03-10
AlphaGo
AlphaFold
AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI自我改进新进展:递归研究能力推动AGI演进 03-10
AGI
递归自我改进
AutoResearch |
[自动]
[HACKER_NEWS] | 1min | newspaper
智能体工程的四个层级划分 03-10
智能体
Agent Engineering
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
双游戏显卡登顶HuggingFace开源大模型榜单的方法 03-10
HuggingFace
LLM
排行榜 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Yann LeCun 融资10亿美元研发具身世界模型 03-10
Yann LeCun
世界模型
具身智能 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
英伟达AI工程师探讨行星级Agent推理与光速计算 03-10
NVIDIA
Agent
推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习过程向神经元提供精准反馈信号 03-10
神经科学
学习机制
反馈信号 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型解释能力以增强安全关键领域可信度 03-10
可解释性
XAI
安全关键 |
[自动]
[HACKER_NEWS] | 1min | newspaper
双游戏显卡登顶HuggingFace开源大模型排行榜 03-10
HuggingFace
LLM
排行榜 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Yann LeCun初创公司融资10亿美元创欧洲种子轮纪录 03-10
Yann LeCun
融资
初创公司 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 无服务器服务上推出 03-10
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Granite 4.0 1B 语音模型:轻量化多语言边缘部署 03-10
Granite 4.0
语音模型
边缘部署 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
ChatGPT推出数学与科学互动式可视化讲解功能 03-10
ChatGPT
教育科技
可视化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AlphaGo十周年:从游戏到生物科学加速AGI发展 03-10
AlphaGo
AGI
DeepMind |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI实现递归自我改进:AGI迈向新一步 03-10
AGI
递归自我改进
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型解释能力以增强关键领域可信度 03-10
可解释性
黑箱问题
反事实解释 |
[自动]
[HACKER_NEWS] | 1min | newspaper
如何用两张游戏显卡登顶HuggingFace开源大模型榜单 03-10
HuggingFace
开源榜单
显卡 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
在印度使用Amazon Bedrock跨区域推理调用Claude模型 03-10
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
从16个开源强化学习库中总结的Token流优化经验 03-10
强化学习
RL
Token流 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Ulysses序列并行:实现百万级Token上下文训练 03-10
Ulysses
序列并行
长上下文 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线 03-10
NVIDIA
Amazon Bedrock
Nemotron 3 Nano |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Granite 4.0 1B语音模型:紧凑、多语言、面向边缘端 03-10
Granite
语音模型
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AlphaGo十年:加速科学发现并铺就AGI之路 03-10
AlphaGo
AGI
科学发现 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI 递归自我改进能力推动 AGI 研究进展 03-10
AGI
递归自我改进
AutoResearch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型在医疗与自动驾驶等场景的可解释性 03-10
可解释性
XAI
医疗AI |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI 收购 AI 安全平台 Promptfoo 以强化系统漏洞修复能力 03-10
OpenAI
Promptfoo
AI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LeRobot v0.5.0:扩展数据、模型与平台能力 03-10
LeRobot
机器人学习
Hugging Face |
[自动]
[HACKER_NEWS] | 1min | newspaper
DeepMind与伯克利提出LoGeR:实现超长视频3D重建 03-10
DeepMind
伯克利
LoGeR |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic 否认 Claude Code 用户成本高达 5000 美元 03-10
Anthropic
Claude Code
成本分析 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习过程中神经元接收精准定制反馈信号 03-10
神经科学
学习机制
误差信号 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
新方法提升AI模型可解释性 助力医疗与自动驾驶可信度评估 03-10
可解释性
模型评估
医疗AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
Y AI获10亿美元种子轮融资,系欧洲迄今最大规模 03-10
Yann LeCun
融资
初创公司 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Ulysses序列并行:实现百万级Token上下文训练 03-10
Ulysses
序列并行
长上下文 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线 03-10
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LeRobot v0.5.0 发布:扩展数据、模型与仿真维度 03-10
LeRobot
机器人
仿真 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Granite 4.0 10亿参数多模态语音模型:紧凑高效,适配边缘端 03-10
Granite 4.0
语音模型
多模态 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic 否认 Claude Code 用户成本高达五千美元 03-10
Anthropic
Claude
Claude Code |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI实现递归式自我改进:AGI研究新进展 03-10
AGI
递归自我改进
AutoResearch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习向神经元提供特异性反馈信号 03-10
神经科学
反向传播
机器学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型在医疗与自动驾驶场景中的可解释性 03-10
XAI
可解释性
医疗AI |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在印度通过Amazon Bedrock跨区域推理调用Claude模型 03-10
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上线全托管无服务器模型 03-10
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Granite 4.0 1B语音模型:轻量多语言适配边缘端 03-10
Granite 4.0
语音模型
边缘计算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
DeepMind与伯克利提出LoGeR:实现超长视频3D重建 03-10
DeepMind
伯克利
LoGeR |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic 否认 Claude Code 用户成本高达 5000 美元 03-10
Anthropic
Claude
Claude Code |
[自动]
[BLOGS_PODCASTS] | 3min | mic
通过Amazon Bedrock全球跨区域推理在印度调用Claude模型 03-10
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习通过特异反馈信号指导神经元 03-10
神经科学
大脑学习
误差信号 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型解释能力以增强医疗与自动驾驶预测可信度 03-10
可解释性
XAI
医疗AI |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Ulysses序列并行技术支持百万级Token上下文训练 03-10
Ulysses
序列并行
长上下文 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发布GPT 5.4:集成CUA模型,实现SOTA级知识工作与编程能力 03-10
OpenAI
GPT 5.4
SOTA |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano现已在Amazon Bedrock无服务器服务上推出 03-10
NVIDIA
Nemotron
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Granite 4.0 10亿参数语音模型:紧凑、多语言与边缘部署 03-10
Granite 4.0
语音模型
边缘部署 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic 否认 Claude Code 用户成本高达 5000 美元 03-10
Anthropic
Claude
Claude Code |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI自我改进新进展:递归研究能力推动AGI发展 03-10
AGI
自我改进
递归研究 |
[自动]
[JUEJIN] | 3min | sticky_note_2
从零开始调用 Qwen 大模型 API 的入门指南 03-10
LLM
Qwen
通义千问 |
[自动]
[JUEJIN] | 2min | sticky_note_2
LangChain 实战:处理大型文档与跨文档摘要 03-10
LangChain
LLM
文本摘要 |
[自动]
[ARXIV] | 4min | school
表格基础模型分布回归:基于适当评分规则的预测评估 03-10
表格基础模型
TabPFN
分布回归 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型解释能力以增强安全关键应用的可信度 03-10
可解释性
XAI
安全关键应用 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大脑学习机制揭示:神经元接收精准定制反馈信号 03-10
神经科学
学习机制
误差信号 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Ulysses序列并行技术实现百万Token上下文训练 03-10
Ulysses
序列并行
长上下文 |
[自动]
[ARXIV] | 3min | school
TildeOpen LLM:利用课程学习实现公平语言表示 03-10
LLM
开源模型
多语言模型 |
[自动]
[ARXIV] | 4min | school
SERQ:基于显著性感知的低秩误差重构LLM量化方法 03-10
LLM量化
SERQ
PTQ |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT 5.4:集成SOTA知识工作、编程与CUA模型 03-10
OpenAI
GPT 5.4
SOTA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 收购 AI 安全平台 Promptfoo 以强化漏洞修复 03-10
OpenAI
Promptfoo
AI安全 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上提供无服务器托管 03-10
NVIDIA
Amazon Bedrock
Nemotron |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Granite 4.0 1B语音模型:轻量多语言与边缘部署优化 03-10
Granite 4.0
语音模型
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Balyasny 基于 GPT-5.4 与 Agent 工作流构建 AI 投研引擎 03-10
Agent
GPT-5.4
工作流 |
[自动]
[ARXIV] | 3min | school
基于贡献分解的神经网络计算因果解释 03-10
神经网络
可解释性
因果推断 |
[自动]
[ARXIV] | 4min | school
利用逻辑选项预训练提升深度强化学习 03-10
强化学习
RL
H²RL |
[自动]
[ARXIV] | 4min | school
SCOPE:场景上下文增量式少样本3D分割 03-10
3D分割
少样本学习
增量学习 |
[自动]
[ARXIV] | 1min | school
BEVLM:将LLM语义知识蒸馏至鸟瞰图表示 03-10
BEVLM
自动驾驶
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习通过特异性反馈信号指导神经元 03-09
神经科学
大脑学习
误差信号 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型解释能力以增强安全关键应用可信度 03-09
可解释性
XAI
安全关键应用 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Ulysses序列并行:支持百万Token上下文训练 03-09
Ulysses
序列并行
长上下文 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT 5.4:集成CUA模型刷新代码与知识工作SOTA 03-09
OpenAI
GPT 5.4
CUA |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 现已在 Amazon Bedrock 上提供完全托管无服务器模型 03-09
NVIDIA
Amazon Bedrock
Nemotron 3 Nano |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Granite 4.0 1B 语音模型:紧凑、多语言、适配边缘端 03-09
Granite 4.0
语音模型
边缘计算 |
[自动]
[ARXIV] | 3min | school
神经网络计算的因果解释:基于贡献分解方法 03-09
神经网络
可解释性
因果推断 |
[自动]
[ARXIV] | 3min | school
基于全节点注意力机制的可扩展机器学习势函数构建方法 03-09
AllScAIP
机器学习势函数
MLIP |
[自动]
[ARXIV] | 3min | school
利用逻辑选项预训练提升深度强化学习 03-09
强化学习
H^2RL
逻辑选项 |
[自动]
[ARXIV] | 4min | school
BEVLM:将LLM语义知识蒸馏至鸟瞰图表征 03-09
BEVLM
自动驾驶
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
谷歌技术专家解析:AI如何理解视觉搜索 03-09
视觉搜索
计算机视觉
CNN |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发布GPT 5.4:集成CUA模型,在知识工作与编程领域实现SOTA 03-09
OpenAI
GPT 5.4
SOTA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
新方法提升AI模型可解释性以增强关键领域信任度 03-09
可解释性
XAI
模型信任 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Ulysses序列并行技术实现百万Token上下文训练 03-09
Ulysses
序列并行
长上下文 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LeRobot v0.5.0:扩展数据集、架构与策略维度 03-09
LeRobot
机器人学习
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Granite 4.0 10亿参数多模态语音模型:紧凑高效,支持边缘部署 03-09
Granite 4.0
语音模型
多模态 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习过程向神经元提供精准定制反馈信号 03-09
神经科学
学习机制
反馈信号 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型解释能力以增强安全关键应用可信度 03-09
可解释性
模型信任度
安全关键应用 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 发布 GPT 5.4:集成 SOTA 知识与编程能力,推出 CUA 模型 03-09
OpenAI
GPT 5.4
SOTA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Balyasny如何构建AI投资研究引擎与智能体工作流 03-09
智能体
工作流
投资研究 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI技术解析:视觉搜索如何理解图像内容 03-09
计算机视觉
图像识别
视觉搜索 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发布GPT-5.4:面向专业工作,支持百万token上下文 03-09
OpenAI
GPT-5.4
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型解释能力以增强安全关键应用的可信度 03-09
可解释性
XAI
安全关键应用 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Balyasny 如何利用 GPT‑5.4 与智能体工作流构建 AI 投研引擎 03-09
GPT-5.4
智能体工作流
Agent |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI 视觉搜索技术解析:如何理解图像内容 03-09
计算机视觉
深度学习
神经网络 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型解释能力以增强安全关键应用可信度 03-09
可解释性
XAI
模型安全 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI发布GPT 5.4:集成CUA模型,编程与知识工作达SOTA 03-09
OpenAI
GPT 5.4
SOTA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4 Thinking 系统卡发布:技术原理与安全机制详解 03-09
GPT-5.4
Thinking
系统卡 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI如何理解视觉搜索:技术原理解析 03-09
计算机视觉
多模态
深度学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI推出CoT-Control:强化推理模型思维链的可监控性 03-09
OpenAI
CoT
思维链 |
[自动]
[HACKER_NEWS] | 1min | newspaper
智能体时代重拾文学化编程 03-09
智能体
文学化编程
代码生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4 Thinking 系统卡发布:揭示模型推理机制与安全策略 03-09
GPT-5.4
Thinking
系统卡 |
[自动]
[JUEJIN] | 2min | sticky_note_2
55个AI角色组成虚拟公司The Agency开源 03-09
AI Agent
The Agency
GitHub |
[自动]
[JUEJIN] | 3min | sticky_note_2
AI Agent 开发入门技术栈选型指南 03-09
AI Agent
技术选型
LangChain |
[自动]
[HACKER_NEWS] | 1min | newspaper
智能体时代应重拾文学化编程范式 03-09
智能体
文学化编程
代码可读性 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发现推理模型难以控制思维链凸显可监控性安全价值 03-09
OpenAI
思维链
CoT |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI发布GPT 5.4:集成CUA模型,实现知识工作与编程SOTA 03-09
OpenAI
GPT-5.4
SOTA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Balyasny 构建 AI 投研引擎:基于 GPT-5.4 与 Agent 工作流 03-09
Agent
LLM
GPT |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI技术解析:计算机视觉如何理解图像搜索 03-09
计算机视觉
图像搜索
多模态 |
[自动]
[ARXIV] | 3min | school
通过偏差有界评估实现可证明无偏的LLM评判者 03-09
LLM-as-a-Judge
评估方法
偏差控制 |
[自动]
[JUEJIN] | 3min | sticky_note_2
谷歌发布 Android Bench:Gemini-3.1 Pro 开发基准测试领先 03-09
Android
Gemini
Google |
[自动]
[ARXIV] | 3min | school
廉价标签实现高效摊销优化 03-09
摊销优化
代理模型
廉价标签 |
[自动]
[ARXIV] | 3min | school
审查大模型作为秘密知识提取的自然测试床 03-09
大模型安全
知识提取
审查机制 |
[自动]
[ARXIV] | 3min | school
大规模激活与注意力槽的机制解析 03-09
Transformer
注意力机制
Pre-norm |
[自动]
[ARXIV] | 3min | school
利用LLM参数化知识实现无检索的事实核查 03-09
LLM
事实核查
参数化知识 |
[自动]
[ARXIV] | 3min | school
RoboPocket:利用手机即时优化机器人控制策略 03-09
机器人
模仿学习
RoboPocket |
[自动]
[ARXIV] | 3min | school
Reasoning Theater:解耦模型信念与思维链 03-09
CoT
模型推理
思维链 |
[自动]
[ARXIV] | 4min | school
POET-X:基于正交变换缩放的内存高效LLM训练方法 03-09
LLM
训练优化
内存优化 |
[自动]
[JUEJIN] | 3min | sticky_note_2
Agent Skills 概念解析及其在 Agent 开发中的应用 03-09
Agent
LLM
AI Agent |
[自动]
[ARXIV] | 3min | school
迈向偏差可控的LLM评判器:基于有界评估的无偏验证 03-08
LLM-as-a-Judge
偏见控制
模型评估 |
[自动]
[HACKER_NEWS] | 1min | newspaper
智能体时代应重探文学化编程范式 03-08
智能体
文学化编程
代码生成 |
[自动]
[ARXIV] | 2min | school
审查大模型作为秘密知识提取的自然测试床 03-08
审查
知识提取
越狱 |
[自动]
[ARXIV] | 3min | school
大模型激活与注意力下沉机制解析 03-08
Transformer
注意力机制
Pre-Norm |
[自动]
[GITHUB_TRENDING] | 3min | hub
动手学深度学习:面向中文读者的可运行教材 03-08
深度学习
D2L
PyTorch |
[自动]
[ARXIV] | 3min | school
利用大模型参数化知识实现无检索的事实核查 03-08
事实核查
无检索
参数化知识 |
[自动]
[ARXIV] | 3min | school
RoboPocket:利用手机即时优化机器人策略 03-08
机器人
模仿学习
RoboPocket |
[自动]
[ARXIV] | 4min | school
POET-X:通过正交变换扩展实现LLM高效训练 03-08
LLM
POET-X
模型训练 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI推出CoT-Control:强化推理模型可监控性 03-08
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发布GPT-5.4:百万token上下文与代码、工具调用能力升级 03-08
OpenAI
GPT-5.4
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 发布 GPT 5.4:集成 CUA 模型,强化知识工作与编程能力 03-08
OpenAI
GPT-5.4
CUA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4 Thinking系统卡发布:技术机制与安全评估 03-08
OpenAI
GPT-5.4
o1 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Balyasny 融合 GPT-5.4 与 Agent 工作流构建 AI 投研引擎 03-08
GPT-5.4
Agent
工作流 |
[自动]
[GITHUB_TRENDING] | 2min | hub
AstrBot:集成多平台与大模型的可扩展 IM 机器人框架 03-08
AstrBot
聊天机器人
Python |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI如何理解视觉搜索:技术原理解析 03-08
视觉搜索
计算机视觉
图像识别 |
[自动]
[HACKER_NEWS] | 1min | newspaper
模拟鸟群行为的神经网络算法 Neural Boids 03-08
Neural Boids
鸟群算法
Boids |
[自动]
[HACKER_NEWS] | 1min | newspaper
智能体时代重思文学化编程 03-08
智能体
文学化编程
代码生成 |
[自动]
[ARXIV] | 3min | school
Reasoning Theater:解耦模型信念与思维链 03-08
思维链
CoT
模型推理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AGI 定义变迁与时间线演进分析 03-08
AGI
时间线
定义变迁 |
[自动]
[HACKER_NEWS] | 5min | newspaper
本地部署 Qwen 3.5 大模型的方法与流程 03-08
Qwen
本地部署
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
SWE-CI:评估 AI 智能体通过 CI 维护代码库的能力 03-08
SWE-CI
AI 智能体
CI/CD |
[自动]
[HACKER_NEWS] | 1min | newspaper
Phi-4多模态推理模型训练经验与技术解析 03-08
Phi-4
多模态
推理模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
如何在本地部署运行 Qwen 3.5 大模型 03-08
Qwen
本地部署
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
SWE-CI:基于 CI 流程评估代码库维护的智能体能力 03-08
SWE-CI
智能体
CI/CD |
[自动]
[HACKER_NEWS] | 1min | newspaper
Phi-4多模态推理模型的训练经验与技术解析 03-08
Phi-4
多模态
推理模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型难控思维链凸显可监控性价值 03-08
OpenAI
推理模型
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4 Thinking 系统卡发布:技术架构与安全策略详解 03-08
OpenAI
GPT-5.4
o1 |
[自动]
[HACKER_NEWS] | 5min | newspaper
如何在本地运行 Qwen 3.5 模型 03-08
Qwen
本地部署
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
SWE-CI:基于 CI 流程评估 AI 智能体代码库维护能力 03-08
SWE-CI
AI 智能体
代码评估 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI推出CoT-Control:强化推理模型思维链的可监控性 03-08
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发布GPT-5.4:百万token上下文,强化代码与工具调用 03-08
OpenAI
GPT-5.4
LLM |
[自动]
[HACKER_NEWS] | 5min | newspaper
如何在本地部署并运行 Qwen 3.5 大模型 03-08
Qwen
本地部署
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
Autoresearch:单GPU自动训练NanoChat的研究Agent 03-08
AutoResearch
Agent
NanoChat |
[自动]
[HACKER_NEWS] | 2min | newspaper
本地运行 Qwen 3.5 大模型的完整指南 03-08
Qwen
本地部署
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
单GPU微调NanoChat:自动Agent实现端到端训练研究 03-08
微调
Agent
单GPU |
[自动]
[HACKER_NEWS] | 1min | newspaper
单GPU自动训练Nanochat:智能体实现自主研究 03-08
智能体
自主训练
单GPU |
[自动]
[JUEJIN] | 1min | sticky_note_2
一键联动多模型同题并行提问,无需切换平台 03-08
多模型对比
AI工作流
DeepSeek |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发布GPT-5.4:百万token上下文与代码能力前沿模型 03-08
OpenAI
GPT-5.4
LLM |
[自动]
[HACKER_NEWS] | 5min | newspaper
如何在本地运行 Qwen 3.5 大模型 03-08
Qwen 3.5
本地部署
LLM |
[自动]
[HACKER_NEWS] | 2min | newspaper
Autoresearch:单GPU自动训练NanoChat智能体 03-08
LLM
智能体
AutoResearch |
[自动]
[HACKER_NEWS] | 1min | newspaper
单GPU训练NanoChat:自动Agent实现自主研究 03-08
Agent
LLM
训练 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 写作中的常见套路与模式分析 03-08
LLM
写作模式
提示词工程 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发布GPT-5.4:支持百万token上下文与计算机操作的前沿模型 03-07
OpenAI
GPT-5.4
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4 Thinking 系统卡发布:技术原理与安全机制详解 03-07
OpenAI
GPT-5.4
o1 |
[自动]
[ARXIV] | 3min | school
迈向可证明无偏的LLM评判器:基于偏差界限评估 03-07
LLM评判器
A-BB算法
偏差控制 |
[自动]
[ARXIV] | 3min | school
审查版大模型作为秘密知识提取的自然测试床 03-07
大模型安全
对齐攻击
知识提取 |
[自动]
[ARXIV] | 4min | school
大模型激活机制研究:尖峰、稀疏性与注意力汇 03-07
Transformer
注意力机制
激活异常 |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教程,全球500多所高校采用 03-07
深度学习
D2L
PyTorch |
[自动]
[ARXIV] | 3min | school
利用LLM参数化知识实现无检索的事实核查 03-07
事实核查
无检索
参数化知识 |
[自动]
[ARXIV] | 3min | school
RoboPocket:利用手机即时优化机器人控制策略 03-07
机器人
模仿学习
RoboPocket |
[自动]
[ARXIV] | 2min | school
Reasoning Theater:解耦模型信念与思维链 03-07
CoT
思维链
模型信念 |
[自动]
[ARXIV] | 4min | school
POET-X:通过正交变换扩展实现LLM高效训练 03-07
LLM
训练优化
内存优化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT 5.4:集成CUA模型刷新知识工作与编程SOTA 03-07
OpenAI
GPT 5.4
SOTA |
[自动]
[GITHUB_TRENDING] | 1min | hub
Fay:数字人与大语言模型连通业务系统的Agent框架 03-07
数字人
Agent框架
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Balyasny 基于 GPT-5.4 与 Agent 工作流构建 AI 投研引擎 03-07
LLM
Agent
工作流 |
[自动]
[JUEJIN] | 1min | sticky_note_2
AI提示词框架深度对比:掌握与大模型沟通的关键方法 03-07
提示词工程
Prompt
LLM |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI Agent 工程师指南:深入解析 Zero-shot 与 Few-shot 核心概念 03-07
AI Agent
LLM
Zero-shot |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型思维链难控强化可监控安全性 03-07
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI如何理解视觉搜索背后的技术原理 03-07
视觉搜索
多模态
嵌入 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 效果优化:用户需先定义验收标准 03-07
LLM
效果优化
验收标准 |
[自动]
[HACKER_NEWS] | 1min | newspaper
用户先定义验收标准可提升大模型输出质量 03-07
LLM
Prompt Engineering
验收标准 |
[自动]
[HACKER_NEWS] | 1min | newspaper
大模型生成的代码看似合理实则存在错误 03-07
LLM
代码生成
幻觉 |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI提示词框架对比分析:掌握与大模型高效沟通的关键方法 03-07
LLM
提示词工程
Prompt |
[自动]
[HACKER_NEWS] | 1min | newspaper
Sarvam 105B:首个具备竞争力的印度开源大模型 03-07
Sarvam
印度
开源 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM效果优化:用户预先定义验收标准 03-07
LLM
效果优化
验收标准 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4思维系统技术报告发布 03-07
GPT-5.4
OpenAI
思维链 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Sarvam 105B:首个具备竞争力的印度开源大模型 03-07
Sarvam
印度
开源模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 效果优化:用户需预先定义验收标准 03-07
LLM
效果优化
验收标准 |
[自动]
[JUEJIN] | 2min | sticky_note_2
learn-claude-code 实战:用 TodoWrite 解决长链路健忘 03-07
ClaudeCode
Agent
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究揭示推理模型思维链难以控制凸显可监控性重要性 03-07
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Balyasny如何构建AI投资研究引擎 03-07
GPT-5.4
智能体
工作流 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI视觉搜索技术解析:如何理解图像内容 03-07
计算机视觉
图像识别
视觉搜索 |
[自动]
[HACKER_NEWS] | 1min | newspaper
展示一款大语言模型难以应对的1v1编程游戏 03-07
LLM
编程游戏
1v1对战 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM在用户预设验收标准时效果最佳 03-07
LLM
验收标准
Prompt |
[自动]
[HACKER_NEWS] | 1min | newspaper
面向大模型的1v1编程对战游戏 03-07
LLM
编程对战
游戏化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM效果优化:用户预先定义验收标准 03-07
LLM
效果优化
验收标准 |
[自动]
[HACKER_NEWS] | 1min | newspaper
展示 LLM 表现不佳的 1v1 编程游戏 03-07
LLM
编程游戏
代码对战 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型思维链难控强化可监控性 03-07
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发布GPT-5.4:百万token上下文与代码能力提升 03-07
OpenAI
GPT-5.4
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA NeMo Evaluator:分钟级评估对话式LLM的Agent技能 03-07
NVIDIA
NeMo
LLM |
[自动]
[HACKER_NEWS] | 3min | newspaper
LLM不生成正确代码而是生成看似合理的代码 03-07
LLM
代码生成
幻觉 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4 Thinking 系统卡发布:推理架构与安全机制详解 03-07
GPT-5.4
Thinking
系统卡 |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI核心概念解析:Prompt、Agent与Function Call的区别 03-07
LLM
Agent
Prompt |
[自动]
[BLOGS_PODCASTS] | 2min | mic
谷歌二月发布Gemini 3.1 Pro与Nano Banana 2 03-07
Google
Gemini 1.5 Pro
Gemini Nano |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型难以控制思维链,强化可监控性安全价值 03-07
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI推出GPT-5.4:支持百万token上下文与计算机操作 03-07
OpenAI
GPT-5.4
LLM |
[自动]
[ARXIV] | 3min | school
通过偏差界限评估实现可证无偏的LLM评判者 03-06
LLM
LLM-as-a-judge
评估 |
[自动]
[ARXIV] | 3min | school
廉价标签实现高效摊销优化 03-06
摊销优化
代理模型
标签效率 |
[自动]
[ARXIV] | 3min | school
审查大模型作为秘密知识提取的自然测试床 03-06
大模型安全
知识提取
对齐攻击 |
[自动]
[ARXIV] | 3min | school
大模型激活与注意力下沉机制解析 03-06
Transformer
注意力机制
Pre-norm |
[自动]
[ARXIV] | 3min | school
利用LLM参数化知识实现无检索的事实核查 03-06
事实核查
无检索
参数化知识 |
[自动]
[ARXIV] | 4min | school
RoboPocket:利用手机即时优化机器人策略 03-06
机器人
模仿学习
RoboPocket |
[自动]
[ARXIV] | 3min | school
Reasoning Theater:解耦模型信念与思维链 03-06
CoT
思维链
推理模型 |
[自动]
[ARXIV] | 4min | school
POET-X:通过正交变换扩展实现大模型高效训练 03-06
POET-X
LLM训练
正交变换 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型难以控制思维链凸显可监控性价值 03-06
OpenAI
思维链
CoT |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT-5.4:百万token上下文,强化代码与工具调用 03-06
OpenAI
GPT-5.4
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI发布GPT 5.4:集成SOTA知识工作与CUA模型 03-06
OpenAI
GPT 5.4
SOTA |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA NeMo Evaluator Agent Skills:分钟级评估对话式LLM 03-06
NVIDIA
NeMo
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4 Thinking 系统卡发布:技术架构与推理能力解析 03-06
GPT-5.4
Thinking
系统卡 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Balyasny 借 GPT-5.4 与 Agent 工作流构建 AI 投研引擎 03-06
GPT-5.4
Agent
工作流 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI如何理解视觉搜索:技术原理解析 03-06
视觉搜索
多模态
LLM |
[自动]
[JUEJIN] | 2min | sticky_note_2
端侧RAG实战:构建具备私有数据检索能力的离线AI代理 03-06
RAG
端侧AI
离线代理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI推出CoT-Control:强化推理模型思维链监控 03-06
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发布GPT-5.4:百万token上下文与代码操控能力 03-06
OpenAI
GPT-5.4
LLM |
[自动]
[JUEJIN] | 2min | sticky_note_2
LangGraph 框架指南:构建基于有向图与状态管理的生产级 AI 工作流 03-06
LangGraph
AI Agent
工作流 |
[自动]
[JUEJIN] | 2min | sticky_note_2
LangChain 框架完全指南:基于 LLM 的应用开发 03-06
LangChain
LLM
框架指南 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4思维系统卡:推理机制与安全策略详解 03-06
GPT-5.4
思维链
推理机制 |
[自动]
[HACKER_NEWS] | 1min | newspaper
移除开源大模型审查机制的工具 03-06
审查机制
对齐
模型微调 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
OpenAI推CoT-Control:验证思维链可监控性对AI安全的重要性 03-06
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT 5.4 登场:集成 SOTA 知识工作、编程与 CUA 模型 03-06
OpenAI
GPT 5.4
SOTA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI如何理解视觉搜索:技术原理解析 03-06
计算机视觉
CNN
视觉搜索 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型思维链难以控制凸显可监控性重要性 03-06
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT 5.4 发布:集成 CUA 模型,知识工作与编程能力达 SOTA 03-06
OpenAI
GPT 5.4
SOTA |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Balyasny 融合 GPT-5.4 与 Agent 工作流构建 AI 投研引擎 03-06
Agent
GPT-5.4
工作流编排 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI视觉搜索技术解析:如何理解图像内容 03-06
计算机视觉
多模态AI
CNN |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4 Thinking系统卡发布:技术架构与推理机制详解 03-06
GPT-5.4
Thinking
系统卡 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI推Excel版ChatGPT:GPT-5.4驱动集成金融数据加速建模 03-06
OpenAI
GPT-5.4
Excel集成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.4 Thinking 系统卡发布:技术原理与安全机制详解 03-06
OpenAI
GPT-5.4
o1 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI如何理解视觉搜索:Ask a Techspert解析 03-06
视觉搜索
多模态
计算机视觉 |
[自动]
[HACKER_NEWS] | 1min | newspaper
OpenAI发布GPT-5.4模型升级推理与多模态能力 03-06
OpenAI
GPT-5.4
多模态 |
[自动]
[JUEJIN] | 2min | sticky_note_2
LangChain文本分割器原理、参数配置与RAG实践 03-06
LangChain
RAG
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
将机器人AI引入嵌入式平台:数据集构建、VLA微调与端侧优化 03-06
机器人
VLA
端侧部署 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI推出Excel版ChatGPT及金融数据集成,由GPT-5.4驱动加速受监管环境分析 03-06
OpenAI
GPT-5.4
Excel集成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI推出CoT-Control:思维链难控凸显可监控性安全价值 03-06
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI技术解析:计算机视觉如何理解图像搜索 03-06
计算机视觉
多模态
生成式 AI |
[自动]
[JUEJIN] | 1min | sticky_note_2
2026国内大模型格局:用户规模与API调用量分析 03-06
行业格局
API调用量
用户规模 |
[自动]
[HACKER_NEWS] | 1min | newspaper
PageAgent:运行于 Web 应用内部的 GUI 智能体 03-06
GUI Agent
Web 应用
智能体 |
[自动]
[JUEJIN] | 2min | sticky_note_2
高德纳称赞Claude协助解决《计算机程序设计艺术》难题 03-06
Claude
高德纳
Donald Knuth |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型原理与Context、RAG、Function Calling等核心概念解析 03-06
LLM
RAG
Function Calling |
[自动]
[HACKER_NEWS] | 1min | newspaper
GLiNER2:基于统一架构的通用信息抽取模型 03-06
GLiNER2
信息抽取
NER |
[自动]
[BLOGS_PODCASTS] | 2min | mic
推出模块化扩散模型:可组合的扩散流水线构建模块 03-06
扩散模型
模块化
可组合 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型难以掌控思维链强化AI安全 03-06
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI推出Excel版ChatGPT及金融数据集成,由GPT-5.4驱动 03-06
OpenAI
ChatGPT
Excel |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4 Thinking 推理模型技术报告发布 03-06
OpenAI
GPT-5.4
推理模型 |
[自动]
[ARXIV] | 3min | school
基于对抗雅可比正则化的智能体AI系统鲁棒性增强方法 03-06
鲁棒性
对抗训练
多智能体 |
[自动]
[ARXIV] | 3min | school
τ-Knowledge:评估非结构化知识下的对话智能体 03-06
对话智能体
评估基准
非结构化知识 |
[自动]
[ARXIV] | 3min | school
TaxonRL:基于中间奖励强化学习的可解释细粒度视觉推理 03-06
TaxonRL
强化学习
细粒度分类 |
[自动]
[HACKER_NEWS] | 1min | newspaper
GLiNER2:基于统一Schema的信息抽取模型 03-06
GLiNER2
信息抽取
NER |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Ask a Techspert:AI如何理解视觉搜索 03-06
计算机视觉
视觉搜索
深度学习 |
[自动]
[JUEJIN] | 2min | sticky_note_2
Anthropic指控三家中国公司大规模蒸馏模型 03-06
Anthropic
模型蒸馏
数据安全 |
[自动]
[ARXIV] | 4min | school
AgentIR:面向深度研究智能体的推理感知检索 03-06
AgentIR
RAG
深度研究代理 |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI大模型指南:Embedding技术与向量数据库原理 03-06
Embedding
向量数据库
RAG |
[自动]
[ARXIV] | 4min | school
面向WebGIS开发的双螺旋治理:构建可靠智能体系统 03-05
Agentic AI
WebGIS
双螺旋治理 |
[自动]
[ARXIV] | 4min | school
基于对抗雅可比正则化的智能体系统鲁棒性增强方法 03-05
Agentic AI
鲁棒性
对抗训练 |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材 03-05
深度学习
D2L
PyTorch |
[自动]
[ARXIV] | 3min | school
τ-Knowledge:评估非结构化知识中的对话智能体 03-05
Agent
RAG
评估基准 |
[自动]
[ARXIV] | 3min | school
TaxonRL:基于中间奖励的可解释细粒度视觉推理 03-05
TaxonRL
强化学习
细粒度视觉推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI推出Excel版ChatGPT及金融数据集成功能 03-05
OpenAI
ChatGPT
Excel |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 推出 CoT-Control 并强调思维链监控的重要性 03-05
OpenAI
CoT
思维链 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Nvidia PersonaPlex 7B 登陆 Apple Silicon:实现全双工语音交互 03-05
Nvidia
PersonaPlex
Apple Silicon |
[自动]
[BLOGS_PODCASTS] | 1min | mic
GPT-5.4 Thinking 系统卡发布:技术原理与安全机制详解 03-05
OpenAI
GPT-5.4
o1 |
[自动]
[HACKER_NEWS] | 1min | newspaper
GLiNER2:基于统一Schema的信息抽取模型 03-05
GLiNER2
信息抽取
NER |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI技术解析:计算机视觉如何理解图像搜索 03-05
计算机视觉
图像搜索
AI |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI大模型入门:Embedding原理与向量数据库应用 03-05
Embedding
向量数据库
LLM |
[自动]
[ARXIV] | 3min | school
AgentIR:面向深度研究智能体的推理感知检索 03-05
AgentIR
RAG
深度研究 |
[自动]
[HACKER_NEWS] | 1min | newspaper
英伟达PersonaPlex 7B登陆苹果芯片:Swift实现全双工语音交互 03-05
英伟达
PersonaPlex
苹果芯片 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
推出 Modular Diffusers:扩散模型管线的可组合构建模块 03-05
Diffusers
扩散模型
Modular |
[自动]
[BLOGS_PODCASTS] | 3min | mic
利用 Amazon Nova 基础模型增强联络中心分析能力 03-05
Amazon Nova
联络中心
呼叫分析 |
[自动]
[HACKER_NEWS] | 1min | newspaper
PageAgent:运行于 Web 应用内部的 GUI 智能体 03-05
GUI Agent
Web 应用
智能体 |
[自动]
[HACKER_NEWS] | 1min | newspaper
PageAgent:运行在 Web 应用内部的 GUI 智能体 03-05
GUI Agent
Web 应用
智能体 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT-5.4:百万token上下文与计算机使用能力 03-05
OpenAI
GPT-5.4
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
Nvidia PersonaPlex 7B 在 Apple Silicon 上实现 Swift 全双工语音交互 03-05
Nvidia
PersonaPlex
Apple Silicon |
[自动]
[HACKER_NEWS] | 1min | newspaper
智能已成商品,上下文才是AI护城河 03-05
AI护城河
上下文
智能商品化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
推出 Modular Diffusers:扩散模型管道的可组合构建块 03-05
Diffusers
扩散模型
模块化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用 Amazon Nova 基础模型增强呼叫中心分析能力 03-05
Amazon Nova
呼叫中心
对话分析 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Nvidia PersonaPlex 7B 在 Apple Silicon 上实现 Swift 全双工语音交互 03-05
Nvidia
PersonaPlex
Apple Silicon |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic估值达190亿美元;Qwen团队离职;Gemini与GPT加速模型迭代 03-05
Anthropic
Qwen
Gemini |
[自动]
[HACKER_NEWS] | 5min | newspaper
英伟达PersonaPlex 7B登陆苹果芯片:Swift实现全双工语音交互 03-05
英伟达
PersonaPlex
苹果芯片 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
利用 Amazon Nova 基础模型增强呼叫中心分析能力 03-05
Amazon Nova
呼叫中心
对话分析 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-05
Stable Diffusion
扩散模型
模型训练 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM中的L代表撒谎:大语言模型幻觉现象分析 03-05
LLM
幻觉
模型评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic估值180亿美元:Qwen团队出走与Gemini、GPT模型升级加速 03-05
Anthropic
Qwen
Gemini |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用Amazon Nova基础模型增强联络中心分析能力 03-05
Amazon Nova
联络中心
呼叫分析 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
PRX Part 3:24小时训练文本生成图像模型 03-05
Stable Diffusion
扩散模型
文本生成图像 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 中的 L 代表撒谎:大语言模型的幻觉问题 03-05
LLM
幻觉
撒谎 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Flash-Lite:速度最快且性价比最高的 Gemini 3 模型 03-05
Gemini
Google
Flash-Lite |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic估值达190亿美元;Qwen团队离职;Gemini与GPT模型升级 03-05
Anthropic
Qwen
Gemini |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI模式Canvas面向美区开放:支持起草文档与构建互动工具 03-05
Canvas
AI模式
搜索引擎 |
[自动]
[HACKER_NEWS] | 1min | newspaper
苹果 Silicon 运行英伟达 PersonaPlex 7B:Swift 实现全双工语音交互 03-05
Nvidia
PersonaPlex
Apple Silicon |
[自动]
[JUEJIN] | 2min | sticky_note_2
网易有道开源LobsterAI:桌面级Agent部署与实战 03-05
LobsterAI
Agent
网易有道 |
[自动]
[JUEJIN] | 1min | sticky_note_2
斯坦福博士论文提出持续自我提升式AI框架 03-05
斯坦福
自我进化
持续学习 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM中的L意指撒谎:大语言模型幻觉问题分析 03-05
LLM
幻觉
撒谎 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2 Pro辅助推导量子引力非零引力子树图振幅 03-05
GPT-5.2 Pro
量子引力
振幅 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Flash Lite:面向规模化智能构建的轻量级模型 03-05
Gemini
Flash Lite
轻量级模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Qwen 模型动态更新与能力演进分析 03-05
Qwen
通义千问
模型演进 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM中的L代表谎言:大语言模型的幻觉问题分析 03-05
LLM
幻觉
AI安全 |
[自动]
[JUEJIN] | 2min | sticky_note_2
当人类知识学会自己奔跑:Skill 属性与 AI 工程化实践 03-05
LLM
Agent
MCP |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT Slowrun:有限数据与无限算力的语言建模 03-05
NanoGPT
语言建模
算力 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Qwen3.5 微调指南 03-05
Qwen3.5
微调
Fine-tuning |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT Slowrun:有限数据与无限算力下的语言建模 03-05
NanoGPT
语言建模
算力优化 |
[自动]
[JUEJIN] | 2min | sticky_note_2
LangChain 实现图片 OCR 与多模态 RAG 数据读取 03-05
LangChain
RAG
OCR |
[自动]
[ARXIV] | 4min | school
轻量级后门攻击针对多编码器扩散模型研究 03-05
后门攻击
Stable Diffusion 3
扩散模型 |
[自动]
[ARXIV] | 3min | school
多候选人译后编辑中的后见质量预测实验 03-05
机器翻译
质量估计
LLM |
[自动]
[ARXIV] | 3min | school
基于内部激活监测生成过程中的突发奖励黑客行为 03-05
Reward Hacking
内部激活
Sparse Autoencoders |
[自动]
[BLOGS_PODCASTS] | 3min | mic
利用 Amazon Nova 基础模型增强联络中心分析能力 03-05
Amazon Nova
联络中心
呼叫中心 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-05
Stable Diffusion
扩散模型
模型训练 |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT Slowrun:有限数据与无限算力的语言建模 03-05
NanoGPT
语言建模
算力 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Flash-Lite:速度最快且性价比最高的模型 03-05
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic估值达190亿美元 Qwen团队出走及大模型更新 03-05
Anthropic
Qwen
Gemini |
[自动]
[ARXIV] | 2min | school
研究揭示上下文压力导致智能体目标漂移 03-05
智能体
目标漂移
上下文压力 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
利用 Amazon Nova 基础模型增强联络中心分析能力 03-05
Amazon Nova
联络中心
呼叫分析 |
[自动]
[ARXIV] | 4min | school
Valet:传统不完美信息卡牌游戏标准化测试平台 03-05
AI
博弈论
不完美信息 |
[自动]
[ARXIV] | 3min | school
Tether:基于对应关系轨迹扭曲的自主功能玩 03-05
机器人学习
模仿学习
自主智能体 |
[自动]
[ARXIV] | 1min | school
Speculative Decoding加速大模型推理 03-05
Speculative Decoding
推理加速
SSD |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-05
Stable Diffusion
扩散模型
文本生成图像 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Flash-Lite:速度最快、性价比最高的3系列模型 03-05
Gemini
Flash-Lite
LLM |
[自动]
[ARXIV] | 4min | school
CFG-Ctrl:基于控制的分类器无关扩散引导算法 03-05
扩散模型
CFG
流匹配 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic估值达190亿美元;Qwen团队离职;Gemini与GPT加速模型升级 03-05
Anthropic
Qwen
Gemini |
[自动]
[JUEJIN] | 1min | sticky_note_2
重新认识Markdown:用结构化思维编写高质量Prompt 03-04
Prompt工程
Markdown
结构化思维 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用 Amazon Nova 基础模型增强联络中心分析能力 03-04
Amazon Nova
联络中心
会话分析 |
[自动]
[ARXIV] | 4min | school
Speculative Decoding:推测解码加速大模型推理 03-04
Speculative Decoding
推理加速
SSD |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
文本生成图像
模型训练
Stable Diffusion |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Flash-Lite:Gemini 3 系列中速度最快、性价比最高的模型 03-04
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Flash Lite:面向大规模智能应用构建 03-04
Gemini
Google
Flash-Lite |
[自动]
[ARXIV] | 3min | school
继承性目标漂移:情境压力如何削弱智能体目标 03-04
目标漂移
Agent
鲁棒性 |
[自动]
[ARXIV] | 3min | school
Valet:传统不完美信息卡牌游戏标准化测试基准 03-04
Valet
不完美信息
卡牌游戏 |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT Slowrun:有限数据与无限算力的语言建模 03-04
NanoGPT
语言建模
算力 |
[自动]
[ARXIV] | 4min | school
CFG-Ctrl:基于分类器无关的扩散模型控制引导方法 03-04
扩散模型
CFG
控制论 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Qwen3.5 微调指南:基于 Unsloth 文档 03-04
Qwen3.5
Unsloth
微调 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
Stable Diffusion
扩散模型
文本生成图像 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Project Genie创建功能详解:4个技巧助你生成新世界 03-04
Project Genie
虚拟世界
全景视图 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Flash-Lite:速度最快且性价比最高的3系模型 03-04
Gemini
Google
Flash-Lite |
[自动]
[BLOGS_PODCASTS] | 4min | mic
基于Amazon Nova Canvas构建可扩展虚拟试穿方案 03-04
Amazon Nova
虚拟试穿
AWS |
[自动]
[HACKER_NEWS] | 1min | newspaper
Qwen3.5微调指南:Unsloth文档与实现流程 03-04
Qwen3.5
Unsloth
微调 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
Stable Diffusion
文本生成图像
模型训练 |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT Slowrun:有限数据与无限算力的语言建模 03-04
NanoGPT
语言建模
算力优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3即时版:提升日常对话流畅度与实用性 03-04
GPT-5.3
OpenAI
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3 Instant 系统卡发布:技术规格与安全机制详解 03-04
GPT-5.3
OpenAI
系统卡 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Flash-Lite:兼顾速度与成本效益的轻量级模型 03-04
Gemini
Flash-Lite
轻量级模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic估值达190亿美元 Qwen团队出走及大模型提速 03-04
Anthropic
Qwen
Gemini |
[自动]
[HACKER_NEWS] | 1min | newspaper
智能体工程模式:构建自主系统的设计范式 03-04
智能体
Agent
设计模式 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
Stable Diffusion
扩散模型
文本生成图像 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3 Instant:提升日常对话流畅度与实用性 03-04
GPT-5.3
OpenAI
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3 Instant 系统卡发布:模型规格与安全策略详解 03-04
OpenAI
GPT-5.3
系统卡 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Flash-Lite:兼顾速度与性价比的轻量级模型 03-04
Gemini
Google
Flash-Lite |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic估值达190亿美元 通义千问团队离职 03-04
Anthropic
通义千问
Qwen |
[自动]
[HACKER_NEWS] | 1min | newspaper
代理工程模式:构建自主智能体的设计范式 03-04
Agentic
智能体
设计模式 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Qwen3.5 微调指南:基于 Unsloth 文档 03-04
Qwen3.5
Unsloth
微调指南 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
Stable Diffusion
PRX
文本生成图像 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3即时版:提升日常对话流畅度与实用性 03-04
GPT-5.3
OpenAI
对话流畅度 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3 Instant 系统卡发布:性能与安全机制详解 03-04
GPT-5.3
OpenAI
系统卡 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Gemini 3.1 Flash-Lite:Gemini 3 系列中速度最快且性价比最高的模型 03-04
Gemini 3.1
Flash-Lite
大模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS中国团队评估Nova Forge:VOC分类任务与开源模型基准对比 03-04
AWS
Nova Forge
VOC分类 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic估值达190亿美元;Qwen团队离职;Gemini与GPT升级快模型 03-04
Anthropic
Qwen
通义千问 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Qwen3.5 微调指南:基于 Unsloth 的高效训练流程 03-04
Qwen3.5
Unsloth
微调 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Speculative Decoding:大模型推理加速的投机解码技术 03-04
Speculative Decoding
SSD
推理加速 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Flash Lite:面向大规模部署的轻量级智能模型 03-04
Gemini
Google
轻量级模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
逆向工程人脑:脉冲网络与矩阵运算的终结 03-04
脉冲神经网络
SNN
类脑计算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
智能体工程模式:架构设计与核心范式 03-04
智能体
Agent
架构设计 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Speculative Decoding:SSD加速大模型推理 03-04
Speculative Decoding
SSD
模型推理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
推测性推测解码:SSD 加速大模型推理 03-04
SSD
推测解码
模型推理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nova Forge 数据混合技术评估:在专业 AI 任务中保持智能水准 03-04
Nova Forge
数据混合
模型评估 |
[自动]
[HACKER_NEWS] | 1min | newspaper
推测性推测解码:SSD加速大模型推理 03-04
SSD
推测解码
模型推理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
推测性推测解码:一种加速大模型推理的方法 03-04
SSD
推理加速
推测解码 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
文本生成图像
模型训练
Stable Diffusion |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Lendi 基于 Amazon Bedrock 16周构建房贷AI守护者 03-04
Amazon Bedrock
Agentic AI
生成式AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3 Instant 系统卡发布:模型规格与安全策略详解 03-04
GPT-5.3
OpenAI
系统卡 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Flash-Lite:速度最快且性价比最高的模型 03-04
Gemini
Flash-Lite
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS中国团队评估Nova Forge:VOC分类任务表现及开源基准对比 03-04
Nova Forge
AWS
VOC分类 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic估值达190亿美元 通义千问团队离职及大模型更新 03-04
Anthropic
通义千问
Qwen |
[自动]
[ARXIV] | 3min | school
过程感知评估揭示大模型智能体中的虚假成功 03-04
LLM Agents
评估基准
流程感知 |
[自动]
[ARXIV] | 2min | school
指令微调LLM的紧凑提示实现论辩成分联合检测 03-04
指令微调
LLM
论辩挖掘 |
[自动]
[ARXIV] | 3min | school
多轮LLM系统模型切换性能漂移评估方法 03-04
LLM
模型切换
性能漂移 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
基于 Amazon Nova Canvas 构建可扩展虚拟试穿方案 03-04
Amazon Nova
虚拟试穿
AWS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
Stable Diffusion
扩散模型
模型训练 |
[自动]
[ARXIV] | 3min | school
Odin:多信号图智能技术实现知识图谱自主发现 03-04
知识图谱
图神经网络
GNN |
[自动]
[ARXIV] | 4min | school
MoECLIP:基于补丁专家的零样本异常检测 03-04
MoECLIP
零样本学习
异常检测 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3 即时版系统卡发布:性能与安全机制详解 03-04
GPT-5.3
OpenAI
系统卡 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Flash-Lite:速度最快、性价比最高的 Gemini 3 模型 03-04
Gemini 3.1
Flash-Lite
Google |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS中国团队评估Nova Forge:VOC分类任务性能实测 03-04
Nova Forge
AWS
VOC分类 |
[自动]
[ARXIV] | 4min | school
Adam为何优于SGD:二阶矩归一化产生更尖锐的尾部 03-04
优化算法
Adam
SGD |
[自动]
[ARXIV] | 3min | school
自适应置信度正则化用于多模态失效检测 03-04
多模态
失效检测
置信度 |
[自动]
[ARXIV] | 3min | school
符号等变循环推理模型 03-04
神经网络架构
符号推理
ARC-AGI |
[自动]
[ARXIV] | 4min | school
多头低秩注意力机制 03-04
MLRA
KV Cache
注意力机制 |
[自动]
[ARXIV] | 3min | school
Sketch2Colab:基于可控流蒸馏的草图多人动画 03-04
计算机视觉
动作生成
扩散模型 |
[自动]
[JUEJIN] | 2min | sticky_note_2
LangGraph核心解析:基于有向环图的状态机思维与灵活性突破 03-04
LangGraph
LangChain
状态机 |
[自动]
[ARXIV] | 4min | school
Conformal Policy Control:基于保形预测的策略控制方法 03-04
保形预测
策略控制
RL |
[自动]
[ARXIV] | 3min | school
测试时强化学习的工具验证方法 03-04
T3RL
Test-Time RL
强化学习 |
[自动]
[ARXIV] | 3min | school
前沿模型低概率行动能力研究 03-04
前沿模型
低概率行动
校准 |
[自动]
[ARXIV] | 3min | school
Reasoning Core:符号模型预训练与后训练的程序化数据生成套件 03-04
符号推理
数据生成
Reasoning Core |
[自动]
[ARXIV] | 3min | school
自适应置信度正则化用于多模态失效检测 03-03
多模态
失效检测
自动驾驶 |
[自动]
[ARXIV] | 3min | school
符号等变循环推理模型 03-03
符号推理
神经网络架构
ARC-AGI |
[自动]
[ARXIV] | 4min | school
测试时强化学习的工具验证方法 03-03
T3RL
测试时强化学习
TTRL |
[自动]
[ARXIV] | 5min | school
多头低秩注意力机制 03-03
MLRA
注意力机制
长上下文 |
[自动]
[ARXIV] | 3min | school
前沿模型低概率行动能力研究 03-03
前沿模型
低概率行动
模型校准 |
[自动]
[JUEJIN] | 3min | sticky_note_2
从 Prompt 到 Agent Skill:AI 交互模式的架构设计与实现 03-03
Agent
Prompt
架构设计 |
[自动]
[ARXIV] | 4min | school
Sketch2Colab:基于可控流蒸馏的草图多人动画生成 03-03
Sketch2Colab
多人生成
草图动画 |
[自动]
[ARXIV] | 3min | school
Reasoning Core:面向符号预训练与后训练的可扩展程序化数据生成套件 03-03
Reasoning Core
符号推理
数据生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-03
Stable Diffusion
扩散模型
文本生成图像 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3 Instant 系统卡发布:性能与安全机制详解 03-03
GPT-5.3
OpenAI
系统卡 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Flash-Lite:速度最快且最具成本效益的模型 03-03
Gemini
Flash-Lite
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS中国团队评估Nova Forge:VOC分类任务实测与开源模型对比 03-03
Nova Forge
AWS
VOC分类 |
[自动]
[JUEJIN] | 1min | sticky_note_2
AI视觉连载:传统计算机视觉中的边缘检测原理 03-03
计算机视觉
边缘检测
图像处理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
GPT‑5.3 Instant 模型发布 03-03
OpenAI
GPT-5.3
Instant |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS中国团队评估Nova Forge:在VOC分类任务中保持智能的数据混合实践 03-03
Nova Forge
AWS
数据混合 |
[自动]
[HACKER_NEWS] | 1min | newspaper
为何尚未出现真正的AI游戏 03-03
AI游戏
AIGC
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
Claude Opus 4.6 解决 Donald Knuth 提出的数学问题 03-03
Claude Opus
Donald Knuth
数学问题 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS评估Nova Forge数据混合技术:VOC分类任务性能优于开源模型 03-03
AWS
Nova Forge
数据混合 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
基于Bedrock与LangGraph构建SageMaker AI对话代理 03-03
LangGraph
Bedrock
SageMaker |
[自动]
[BLOGS_PODCASTS] | 3min | mic
利用 Amazon Bedrock Guardrails 构建安全的生成式 AI 应用 03-03
Amazon Bedrock
Guardrails
生成式 AI |
[自动]
[JUEJIN] | 2min | sticky_note_2
从 Prompt 到 Agent Skill:AI 能力跃迁与设计实现 03-03
Agent
Prompt
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
SemiAnalysis创始人谈2000亿美元AI支出与2027年谷歌盈利前景 03-03
SemiAnalysis
谷歌
AI支出 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI与亚马逊达成战略合作,将Frontier模型引入AWS 03-03
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
METR探讨指数级时间视界评估、威胁模型与AI生产力极限 03-03
METR
AI评估
威胁模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Claude Opus 4.6 解决 Donald Knuth 提出的问题 03-03
Claude Opus
Donald Knuth
算法问题 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS中国团队评估Nova Forge:VOC分类任务与开源模型基准对比 03-03
Nova Forge
AWS
VOC分类 |
[自动]
[HACKER_NEWS] | 1min | newspaper
被盗 Gemini API 密钥致 48 小时内损失 8.2 万美元 03-03
Gemini
API密钥
数据泄露 |
[自动]
[JUEJIN] | 2min | sticky_note_2
小米MWC展示AI技术:从对话框走向物理世界控制 03-03
小米
MWC
AI应用 |
[自动]
[JUEJIN] | 2min | sticky_note_2
MiniMax首份财报:ARR破1.5亿美元并预判2026年三大PMF 03-03
MiniMax
财报
ARR |
[自动]
[JUEJIN] | 2min | sticky_note_2
Java开发者大模型应用指南:LangChain4j组件解析 03-03
LangChain4j
Java
LLM |
[自动]
[JUEJIN] | 2min | sticky_note_2
Hologres集成百炼:SQL直接调用大模型实现全模态分析 03-03
Hologres
百炼
AI Function |
[自动]
[BLOGS_PODCASTS] | 3min | mic
SemiAnalysis谈2000亿美元AI支出与谷歌2027年盈利隐忧 03-03
SemiAnalysis
谷歌
资本支出 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作,将Frontier模型引入AWS 03-03
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
METR Joel Becker谈指数级时间视野评估与威胁模型 03-03
METR
Joel Becker
时间视野评估 |
[自动]
[HACKER_NEWS] | 1min | newspaper
从零构建延迟低于500毫秒的语音智能体 03-03
语音智能体
低延迟
实时语音 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS团队评估Nova Forge:VOC分类任务实测与开源模型对比 03-03
Nova Forge
AWS
VOC分类 |
[自动]
[ARXIV] | 3min | school
深度序列模型中的概率学习与生成机制 03-03
深度序列模型
概率模型
贝叶斯方法 |
[自动]
[ARXIV] | 3min | school
曲率加权容量分配:基于MDL的层自适应大模型优化 03-03
LLM优化
MDL
曲率感知 |
[自动]
[ARXIV] | 3min | school
无智慧的知识:评估大模型与预期影响的错位 03-03
LLM
对齐
OOD |
[自动]
[ARXIV] | 4min | school
持续强化学习中的快速与元知识学习原则 03-03
强化学习
持续学习
元学习 |
[自动]
[ARXIV] | 3min | school
基于大规模真实手写数学数据评估AI阅卷性能 03-03
AI阅卷
手写识别
OCR |
[自动]
[ARXIV] | 4min | school
MC-Search:基于结构化长推理链的多模态智能体搜索评估与增强 03-03
多模态
MLLM
智能体 |
[自动]
[ARXIV] | 4min | school
KVSlimmer:非对称KV合并的理论洞察与优化 03-03
LLM
KV Cache
推理优化 |
[自动]
[ARXIV] | 3min | school
CHIMERA:用于提升大模型推理泛化能力的紧凑合成数据 03-03
LLM
合成数据
思维链 |
[自动]
[ARXIV] | 3min | school
BioProAgent:神经符号约束下的科学规划框架 03-03
BioProAgent
神经符号
科学规划 |
[自动]
[ARXIV] | 5min | school
Active Flow Matching:一种高效的生成模型训练范式 03-03
Flow Matching
扩散模型
生成式模型 |
[自动]
[ARXIV] | 3min | school
面向自动定理证明的最小智能体框架 03-03
自动定理证明
智能体
Agent |
[自动]
[ARXIV] | 4min | school
通过低秩近似优化大模型动量状态以降低显存占用 03-03
LoRA-Pre
低秩近似
优化器 |
[自动]
[ARXIV] | 3min | school
辅助RAG系统自动化评估资源:助力新闻可信度评估 03-03
RAG
论文
自动化评估 |
[自动]
[ARXIV] | 3min | school
神经机制稀疏化助力高效发现近似因果抽象 03-03
因果抽象
神经机制稀疏化
结构化剪枝 |
[自动]
[ARXIV] | 4min | school
模式寻优与均值寻优结合实现快速长视频生成 03-03
视频生成
扩散模型
Transformer |
[自动]
[ARXIV] | 4min | school
RNN引入动态记忆缓存机制以提升长序列建模能力 03-03
RNN
长序列建模
Memory Caching |
[自动]
[ARXIV] | 3min | school
LLM是否受益于自身生成文本的反馈训练 03-03
LLM
Self-Feedback
多轮对话 |
[自动]
[ARXIV] | 3min | school
DARE-bench:评估大模型数据科学建模与指令保真度 03-03
LLM
数据科学
基准测试 |
[自动]
[ARXIV] | 4min | school
CUDA Agent:面向高性能内核生成的大规模智能体强化学习 03-03
CUDA
强化学习
智能体 |
[自动]
[ARXIV] | 3min | school
面向自动定理证明的最小智能体框架 03-02
自动定理证明
Agent
最小智能体 |
[自动]
[ARXIV] | 3min | school
通过神经机制稀疏化高效发现近似因果抽象 03-02
因果抽象
结构化剪枝
SCM |
[自动]
[ARXIV] | 5min | school
通过低秩近似优化大模型动量状态以降低显存占用 03-02
LoRA-Pre
低秩近似
优化器 |
[自动]
[ARXIV] | 3min | school
辅助RAG系统新闻可信度评估自动化资源 03-02
RAG
TREC
新闻可信度 |
[自动]
[ARXIV] | 4min | school
模式寻优结合均值寻优实现快速长视频生成 03-02
视频生成
扩散模型
Transformer |
[自动]
[HACKER_NEWS] | 2min | newspaper
从零构建延迟低于500ms的语音智能体 03-02
语音智能体
低延迟
实时语音 |
[自动]
[ARXIV] | 4min | school
RNN引入记忆缓存机制以实现动态增长的存储能力 03-02
RNN
长上下文
Memory Caching |
[自动]
[BLOGS_PODCASTS] | 1min | mic
OpenAI完成110亿美元融资,投后估值达8400亿美元 03-02
OpenAI
融资
估值 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作,将Frontier模型引入AWS 03-02
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
METR Joel Becker谈指数级时间跨度评估与AI生产力极限 03-02
METR
Joel Becker
指数级评估 |
[自动]
[ARXIV] | 3min | school
LLM是否受益于自身生成的文本 03-02
LLM
多轮对话
上下文学习 |
[自动]
[ARXIV] | 4min | school
DARE-bench:评估大模型数据科学建模与指令遵循能力 03-02
DARE-bench
LLM评估
数据科学 |
[自动]
[ARXIV] | 4min | school
CUDA Agent:面向高性能内核生成的大规模智能体强化学习框架 03-02
CUDA Agent
强化学习
内核生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AWS中国团队评估Nova Forge:VOC分类任务表现与开源模型基准对比 03-02
Nova Forge
AWS
VOC分类 |
[自动]
[HACKER_NEWS] | 1min | newspaper
语言模型存在可独立调控的个性子网络 03-02
LLM
个性子网络
模型调控 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
SemiAnalysis创始人谈2000亿美元AI支出与谷歌2027年盈利前景 03-02
SemiAnalysis
谷歌
AI支出 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作:Frontier模型接入AWS并扩展企业级AI智能体 03-02
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
METR Joel Becker谈指数级时间视界评估与威胁模型 03-02
METR
模型评估
威胁模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS Nova Forge 数据混合技术评估:兼顾专业化与智能水平 03-02
AWS
Nova Forge
数据混合 |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型连载2:初步认识 tokenizer 的过程 03-02
Tokenizer
Token
分词器 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
利用 Amazon Bedrock Guardrails 构建安全的生成式 AI 应用 03-02
Amazon Bedrock
Guardrails
生成式 AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
SemiAnalysis谈2000亿美元AI支出与谷歌2027年盈利隐忧 03-02
SemiAnalysis
资本支出
AI基础设施 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作,将Frontier模型引入AWS 03-02
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
METR Joel Becker谈指数级时间地平线评估与AI生产力边界 03-02
METR
Joel Becker
评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 2.0 Flash 登场:新 SOTA 图像生成模型 03-02
Gemini 2.0
Gemini 3.1
Google |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS中国团队评估Nova Forge:VOC分类任务与开源模型基准比对 03-02
Nova Forge
AWS
VOC分类 |
[自动]
[JUEJIN] | 2min | sticky_note_2
2026年大模型与IDE选型指南及Coding Arena榜单分析 03-02
大模型选型
IDE
前端开发 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
SemiAnalysis创始人谈2000亿美元AI支出与谷歌2027年盈利隐忧 03-02
SemiAnalysis
资本支出
英伟达 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI与亚马逊达成战略合作,Frontier模型接入AWS 03-02
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nano Banana 2:Gemini 3.1 Flash 图像生成模型预览 03-02
Gemini
图像生成
SOTA |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作,将Frontier模型引入AWS 03-02
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 2.0 Flash 登场:超越 GPT-4o,成新 SOTA 图像生成模型 03-02
Gemini
Google
SOTA |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic模型蒸馏与SWE-Bench失效机制分析直播 03-02
模型蒸馏
SWE-Bench
基准测试 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
SemiAnalysis创始人谈2000亿美元AI资本支出与芯片战争 03-02
SemiAnalysis
资本支出
芯片战争 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
METR探讨指数级时间视界评估、威胁模型与AI生产力边界 03-02
METR
AI评估
威胁模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
根据硬件资源动态调整大模型规模 03-02
LLM
资源调度
动态调整 |
[自动]
[JUEJIN] | 1min | sticky_note_2
从ChatGPT到OpenClaw:梳理模型、工程与框架的AI进化脉络 03-02
ChatGPT
OpenClaw
AI进化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
根据系统硬件资源自动调整大模型规模 03-02
LLM
资源调度
GPU |
[自动]
[HACKER_NEWS] | 1min | newspaper
根据系统硬件配置动态调整LLM模型规模 03-02
LLM
模型压缩
硬件适配 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于人脑活动演化思维内容的描述性文本 03-02
脑机接口
fMRI
LLM |
[自动]
[GITHUB_TRENDING] | 1min | hub
ChatGPT中文调教指南:多场景提示词与使用技巧 03-02
ChatGPT
提示词
Prompt |
[自动]
[HACKER_NEWS] | 1min | newspaper
根据系统硬件配置自动调整大模型规模 03-02
LLM
硬件适配
资源调度 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于脑活动解码生成思维描述文本 03-02
脑机接口
fMRI
脑活动解码 |
[自动]
[HACKER_NEWS] | 1min | newspaper
根据硬件资源动态调整LLM模型规模 03-02
LLM
模型优化
资源调度 |
[自动]
[HACKER_NEWS] | 1min | newspaper
根据系统硬件配置自动调整大模型规模 03-02
LLM
资源调度
硬件适配 |
[自动]
[JUEJIN] | 2min | sticky_note_2
技术周刊第1期:Paul Graham谈品味、19分钟入门AI及失业论 03-02
技术周刊
Paul Graham
品味 |
[自动]
[JUEJIN] | 2min | sticky_note_2
KV Cache与位置编码:大模型推理加速原理 03-02
KV Cache
位置编码
推理加速 |
[自动]
[ARXIV] | 3min | school
可控推理模型:具备隐私保护能力的思维链 03-02
隐私保护
思维链
可控推理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
XML标签为何是Claude模型架构的核心基础 03-02
Claude
XML标签
模型架构 |
[自动]
[ARXIV] | 3min | school
SafeGen-LLM:增强机器人系统任务规划的安全泛化能力 03-02
SafeGen-LLM
机器人
任务规划 |
[自动]
[JUEJIN] | 3min | sticky_note_2
Ollama 本地部署开源大模型指南与代码实践 03-02
Ollama
LLM
本地部署 |
[自动]
[HACKER_NEWS] | 1min | newspaper
MicroGPT:基于微型Transformer的轻量级语言模型 03-02
MicroGPT
Transformer
轻量级模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
MicroGPT 交互式原理解析 03-02
MicroGPT
LLM
Transformer |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI 聊天免费广告化模式的交互演示 03-02
AI 聊天
免费模式
广告化 |
[自动]
[ARXIV] | 4min | school
$L_p$校准误差的变分估计方法 03-02
校准误差
变分估计
Lp散度 |
[自动]
[ARXIV] | 3min | school
通过锚定机制实现模型一致性 03-02
模型一致性
锚定机制
预测分歧 |
[自动]
[ARXIV] | 3min | school
规模无法克服语用学:报告偏见对视觉语言推理的影响 03-02
VLM
多模态
报告偏见 |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型连载1:理解 Token 这一基础概念 03-02
Token
LLM
NLP |
[自动]
[ARXIV] | 3min | school
基于超单纯形投影的可微零一损失函数 03-02
零一损失
可微损失
超单纯形投影 |
[自动]
[HACKER_NEWS] | 1min | newspaper
为什么 XML 标签对 Claude 至关重要 03-02
Claude
XML
提示词工程 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 03-02
多模态
视觉语言模型
最优传输 |
[自动]
[ARXIV] | 4min | school
SeeThrough3D:文本生成图像中的遮挡感知三维控制 03-02
SeeThrough3D
文本生成图像
3D控制 |
[自动]
[HACKER_NEWS] | 1min | newspaper
MicroGPT:基于微型架构的轻量级大语言模型 03-02
MicroGPT
轻量级模型
LLM |
[自动]
[ARXIV] | 5min | school
FlashOptim:面向大模型内存高效训练的优化器 03-02
FlashOptim
显存优化
训练优化器 |
[自动]
[ARXIV] | 3min | school
通过锚定机制提升模型一致性 03-01
模型一致性
锚定机制
堆叠平均 |
[自动]
[ARXIV] | 3min | school
规模难以克服语用学:报告偏差对视觉语言推理的影响 03-01
VLM
视觉语言模型
报告偏差 |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型连载1:理解自然语言处理与大模型中的 Token 概念 03-01
Token
NLP
Transformer |
[自动]
[HACKER_NEWS] | 4min | newspaper
XML标签为何是Claude模型能力的关键基础 03-01
Claude
XML标签
提示词工程 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 03-01
多模态
SOTAlign
最优传输 |
[自动]
[ARXIV] | 4min | school
SeeThrough3D:实现遮挡感知的文本生成图像三维控制 03-01
SeeThrough3D
文本生成图像
3D控制 |
[自动]
[JUEJIN] | 2min | sticky_note_2
OpenClow构建11个AI Agent实现自主观察与策略进化 03-01
AI Agent
OpenClaw
自我进化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作,将Frontier模型引入AWS 03-01
OpenAI
AWS
亚马逊 |
[自动]
[HACKER_NEWS] | 1min | newspaper
MicroGPT 原理交互式解析 03-01
MicroGPT
LLM
Transformer |
[自动]
[ARXIV] | 4min | school
FlashOptim:面向内存高效训练的优化器 03-01
FlashOptim
内存优化
训练优化器 |
[自动]
[GITHUB_TRENDING] | 3min | hub
ChatGPT 中文调教指南:场景化提示词与使用技巧 03-01
ChatGPT
提示词
Prompt |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 模型蒸馏与 SWE-Bench 作弊机制解析 03-01
模型蒸馏
SWE-Bench
数据污染 |
[自动]
[HACKER_NEWS] | 1min | newspaper
为何 XML 标签对 Claude 至关重要 03-01
Claude
XML
提示词工程 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nano Banana 2:Gemini 3.1 Flash 图像生成模型预览 03-01
Gemini
图像生成
SOTA |
[自动]
[HACKER_NEWS] | 5min | newspaper
MicroGPT 交互式原理解析 03-01
MicroGPT
LLM
Transformer |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 课程:现代人工智能导论 03-01
CMU
课程
现代AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
为什么 XML 标签对 Claude 模型如此关键 03-01
Claude
XML 标签
Prompt |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 现代人工智能导论课程资源 03-01
CMU
课程资源
现代人工智能 |
[自动]
[HACKER_NEWS] | 1min | newspaper
为何XML标签对Claude模型如此关键 03-01
Claude
XML标签
提示词工程 |
[自动]
[HACKER_NEWS] | 1min | newspaper
MicroGPT:基于微型架构的轻量级大语言模型 03-01
MicroGPT
轻量级模型
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
METR探讨指数级时间地平线评估与AI生产力极限 03-01
METR
时间地平线评估
AI生产力 |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 现代人工智能导论课程 03-01
CMU
课程
AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI 聊天免费广告支持模式的演示实现 03-01
AI聊天
广告模式
免费增值 |
[自动]
[HACKER_NEWS] | 2min | newspaper
无需重新训练即可迁移至 Claude 03-01
Claude
模型迁移
API |
[自动]
[HACKER_NEWS] | 1min | newspaper
我构建了免费且含广告的AI聊天演示 03-01
AI聊天
广告模式
免费增值 |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 课程:现代人工智能导论 03-01
CMU
现代人工智能
课程 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI 聊天免费化与广告支持模式的演示实现 03-01
商业模式
广告支持
免费化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI聊天免费化与广告支持模式的交互演示 03-01
AI聊天
免费模式
广告支持 |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 现代人工智能导论课程资源 03-01
CMU
课程资源
现代AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
SemiAnalysis创始人谈2000亿美元AI支出与谷歌2027年盈利隐忧 03-01
SemiAnalysis
谷歌
AI支出 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作,Frontier模型接入AWS 03-01
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 2.5 Pro与Nano Banana 2:SOTA文生图模型与图像预览 03-01
Gemini
Google
文生图 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 模型蒸馏与 SWE-Bench 失效机制探讨 03-01
模型蒸馏
SWE-bench
数据污染 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
METR探讨指数级时间线评估、威胁模型与AI生产力边界 03-01
METR
指数级评估
威胁模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM生成文本检测:原理、方法与技术挑战 03-01
LLM
文本检测
AI安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建极简Transformer模型实现十位数加法运算 03-01
Transformer
算法实现
算术推理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Qwen3.5 122B/35B 本地跑出 Sonnet 4.5 性能 03-01
Qwen3.5
Sonnet 4.5
本地部署 |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建极简Transformer实现十位数加法运算 03-01
Transformer
LLM
算法实现 |
[自动]
[HACKER_NEWS] | 2min | newspaper
Qwen3.5 122B与35B模型本地实现Sonnet 4.5性能 03-01
Qwen3.5
Sonnet 4.5
本地部署 |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建极简Transformer模型实现十位数加法运算 03-01
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用大语言模型实现确定性编程 03-01
LLM
确定性编程
代码生成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Nova强化微调原理、应用场景与实现路径解析 03-01
Amazon Nova
强化微调
RFT |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建极简Transformer模型实现十位数加法运算 03-01
Transformer
模型构建
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用大语言模型实现确定性编程 03-01
LLM
确定性编程
代码生成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作,在AWS部署Frontier模型 03-01
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic模型蒸馏与SWE-Bench失效机制分析 03-01
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Nova 强化微调原理、应用场景与实现选项解析 03-01
Amazon Nova
强化微调
RFT |
2026年二月
1751 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 3min | mic
首个 Gemini 3.1 模型 Nano Banana 2 预览:SOTA 图像生成 02-28
Gemini
Nano Banana 2
图像生成 |
[自动]
[ARXIV] | 3min | school
规模难以克服语用学:报告偏差对视觉语言推理的影响 02-28
VLM
视觉语言模型
报告偏差 |
[自动]
[JUEJIN] | 1min | sticky_note_2
深度学习通用逼近定理:神经网络的理论基础与核心原理 02-28
深度学习
神经网络
通用逼近定理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建极简Transformer模型实现十位数加法运算 02-28
Transformer
算法实现
算术运算 |
[自动]
[ARXIV] | 3min | school
基于锚点机制实现模型一致性 02-28
模型一致性
锚点机制
模型不一致性 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 02-28
多模态
视觉语言模型
最优传输 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
SemiAnalysis谈2000亿美元AI支出与谷歌2027年盈利前景 02-28
SemiAnalysis
AI支出
谷歌 |
[自动]
[ARXIV] | 3min | school
SeeThrough3D:文本生成图像中的遮挡感知三维控制 02-28
SeeThrough3D
文本生成图像
3D控制 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Qwen3.5 122B与35B本地部署性能对标Sonnet 4.5 02-28
Qwen3.5
Sonnet 4.5
本地部署 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作:在AWS上引入Frontier平台扩展AI基础设施 02-28
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 02-28
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Nova 强化微调:原理、应用场景与实现指南 02-28
Amazon Nova
强化微调
RFT |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Amazon Bedrock 推出面向代理的有状态运行时 02-28
Amazon Bedrock
AI Agent
有状态运行时 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Dynamic 2.0 发布:支持 GGUF 格式 02-28
Unsloth
GGUF
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作,在AWS部署Frontier模型平台 02-28
OpenAI
AWS
亚马逊 |
[自动]
[HACKER_NEWS] | 1min | newspaper
从噪声到图像:扩散模型交互指南 02-28
扩散模型
Diffusion
生成式AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Dynamic 2.0 推出 GGUF 格式模型 02-28
Unsloth
GGUF
模型量化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
从噪声到图像:扩散模型交互式指南 02-28
扩散模型
生成式AI
图像生成 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Dynamic 2.0 GGUFs 发布 02-28
Unsloth
GGUF
llama.cpp |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建智能体文明:多智能体协作系统开源 02-28
智能体
多智能体协作
Agent |
[自动]
[JUEJIN] | 2min | sticky_note_2
EverMemOS:开源Agent长时记忆系统,LoCoMo推理准确率93% 02-28
Agent
长时记忆
EverMemOS |
[自动]
[HACKER_NEWS] | 1min | newspaper
最小Transformer模型实现两位数加法运算 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth发布Dynamic 2.0 GGUF模型 02-28
Unsloth
GGUF
模型量化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能对齐十位数加法运算的最小 Transformer 模型 02-28
Transformer
算法可解释性
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
消除程序员的尝试史:自动化编程的演进 02-28
自动化编程
代码生成
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth推出Dynamic 2.0 GGUF模型 02-28
Unsloth
GGUF
模型量化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能对齐十位数加法运算的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能计算两个10位数加法的最小Transformer模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
OpenAI 获准在美国防部机密网络部署 AI 模型 02-28
OpenAI
国防部
机密网络 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能计算两位十进制数相加的最小 Transformer 模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
OpenAI 获准在美国防部机密网络部署 AI 模型 02-28
OpenAI
国防部
机密网络 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能对齐十位数加法的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
SemiAnalysis创始人谈2000亿美元AI资本支出与谷歌2027年盈利隐忧 02-28
SemiAnalysis
Dylan Patel
AI资本支出 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI与亚马逊战略合作:将Frontier模型引入AWS 02-28
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
METR探讨指数级时间跨度评估、威胁模型与AI生产力边界 02-28
METR
AI评估
威胁模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Flash Image Preview 登场:全新 SOTA 图像生成模型 02-28
Gemini 3.1
Nano Banana 2
图像生成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic模型蒸馏与SWE-Bench失效机制分析 02-28
模型蒸馏
SWE-Bench
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Amazon Nova 强化微调解析:基于反馈的 AI 定制原理与实践 02-28
Amazon Nova
RFT
强化微调 |
[自动]
[HACKER_NEWS] | 2min | newspaper
能计算两个10位数加法的最小Transformer模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Amazon Bedrock 推出 Agent 有状态运行时环境 02-28
Amazon Bedrock
Agent
有状态运行时 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能对齐十位数加法运算的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[JUEJIN] | 2min | sticky_note_2
深度学习激活函数原理:非线性能力与模型性能解析 02-28
深度学习
激活函数
神经网络 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
使用 Nano Banana 2 构建图像生成与编辑应用 02-28
图像生成
图像编辑
Nano Banana 2 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nano Banana 2 发布:首个 Gemini 3.1 模型与 SOTA 图像生成 02-28
Gemini 3.1
图像生成
SOTA |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Nova 强化微调解析:原理、应用场景与实现选项 02-28
Amazon Nova
强化微调
RFT |
[自动]
[ARXIV] | 2min | school
通过锚定机制提升模型一致性 02-27
模型一致性
锚定机制
模型差异 |
[自动]
[ARXIV] | 3min | school
规模难以克服语用学:报告偏差对视觉语言推理的影响 02-27
VLM
视觉语言模型
报告偏差 |
[自动]
[JUEJIN] | 2min | sticky_note_2
深度学习激活函数原理与非线性机制解析 02-27
深度学习
激活函数
非线性 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
使用 Nano Banana 2 构建图像生成与编辑应用 02-27
Nano Banana 2
图像生成
图像编辑 |
[自动]
[ARXIV] | 3min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 02-27
多模态
视觉语言模型
最优传输 |
[自动]
[ARXIV] | 4min | school
SeeThrough3D:文本生成图像中的遮挡感知三维控制 02-27
SeeThrough3D
文本生成图像
3D控制 |
[自动]
[HACKER_NEWS] | 1min | newspaper
OpenAI融资66亿美元投后估值达1570亿美元 02-27
OpenAI
融资
估值 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作:Frontier平台接入AWS 02-27
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
METR Joel Becker谈指数级时间评估与AI生产力局限 02-27
METR
Joel Becker
指数级评估 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Gemini 2.0 Flash 登场:成新一代 SOTA 图像生成模型 02-27
Gemini
Google
图像生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析 02-27
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用 Nano Banana 2 构建图像生成与编辑应用 02-27
图像生成
图像编辑
Nano Banana 2 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作,将Frontier模型引入AWS 02-27
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析 02-27
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Amazon Nova 强化微调原理:从评估学习到多轮智能体构建 02-27
Amazon Nova
强化微调
RFT |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用大语言模型分析 TB 级 CI 日志数据 02-27
LLM
CI/CD
日志分析 |
[自动]
[HACKER_NEWS] | 1min | newspaper
逆向工程挑战:解析神经网络架构与参数 02-27
逆向工程
神经网络
模型安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
展示代码库与 LLM 上下文窗口匹配度的徽章 02-27
LLM
Context Window
代码库 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用大语言模型分析 TB 级 CI 日志数据 02-27
LLM
CI
日志分析 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nano Banana 2:Gemini 3.1 Flash 图像生成模型预览 02-27
Gemini
Google
图像生成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析 02-27
Anthropic
模型蒸馏
宪法AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Nova 强化微调原理、应用场景与实现选项解析 02-27
Amazon Nova
强化微调
RFT |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与亚马逊达成战略合作,将Frontier模型引入AWS 02-27
OpenAI
AWS
亚马逊 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 联合西北太平洋国家实验室推出 DraftNEPABench,加速联邦许可流程 02-27
OpenAI
PNNL
DraftNEPABench |
[自动]
[HACKER_NEWS] | 1min | newspaper
逆向工程神经网络:技术挑战与防御机制解析 02-27
模型提取
逆向工程
模型安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用大语言模型分析 TB 级 CI 日志数据 02-27
LLM
CI
日志分析 |
[自动]
[HACKER_NEWS] | 1min | newspaper
逆向工程挑战:解析该神经网络架构 02-27
神经网络
逆向工程
模型架构 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
使用 Nano Banana 2 构建图像生成与编辑应用 02-27
Nano Banana 2
图像生成
图像编辑 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用闲置算时将大模型训练速度提升一倍 02-27
LLM
训练效率
算力优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer中的混合专家模型架构解析 02-27
Transformer
MoE
混合专家 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 与太平洋西北国家实验室推基准测试,加速联邦许可流程 02-27
OpenAI
基准测试
AI 编程代理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 与 Figma 集成 Codex 实现代码与设计无缝切换 02-27
OpenAI
Figma
Codex |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Nano Banana 2:Gemini 3.1 Flash 图像生成模型预览 02-27
Gemini 3.1
图像生成
SOTA |
[自动]
[BLOGS_PODCASTS] | 4min | mic
AWS LMI 容器更新:提升托管 LLM 性能并简化部署 02-27
AWS
LMI
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 模型蒸馏与 SWE-Bench 失效机制分析 02-27
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Amazon Nova 强化微调:原理、场景与实现指南 02-27
Amazon Nova
强化微调
RFT |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2025年12月AI技术进展综述:编程范式的深刻变革 02-27
AI编程
范式转移
技术变革 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌员工效仿Anthropic,要求制定军事AI红线 02-27
谷歌
Anthropic
军事AI |
[自动]
[JUEJIN] | 3min | sticky_note_2
后端面试高频考点:MCP、Skill 与 Function Call 的区别 02-27
MCP
Function Call
Skill |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌员工效仿Anthropic,要求为军事AI设定红线 02-27
谷歌
军事AI
Anthropic |
[自动]
[HACKER_NEWS] | 1min | newspaper
YC W26项目Cardboard:基于智能体的视频编辑工具 02-27
YC
智能体
视频编辑 |
[自动]
[ARXIV] | 4min | school
风险感知世界模型预测控制提升端到端自动驾驶泛化性 02-27
自动驾驶
世界模型
预测控制 |
[自动]
[ARXIV] | 4min | school
面向高效高分辨率GUI智能体的时空令牌剪枝 02-27
GUI Agent
Token Pruning
Qwen2-VL |
[自动]
[ARXIV] | 3min | school
面向低延迟口语对话的语篇感知双流响应生成 02-27
DDTSR
低延迟
口语对话 |
[自动]
[ARXIV] | 2min | school
缓解可读性代价:基于解耦证明者-验证者博弈的方法 02-27
LLM
可解释性
模型评估 |
[自动]
[ARXIV] | 3min | school
无模型通用AI框架 02-27
通用人工智能
强化学习
无模型 |
[自动]
[ARXIV] | 3min | school
基于优化的系统为何难以实现规范响应:代理与架构限制 02-27
RLHF
AI对齐
智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用闲置算力将大模型训练速度提高一倍且保持精度 02-27
LLM
训练加速
算力优化 |
[自动]
[ARXIV] | 4min | school
利用大模型生成判断数据提升应用商店排序相关性 02-27
LLM
搜索相关性
数据标注 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-27
Transformer
MoE
混合专家模型 |
[自动]
[ARXIV] | 3min | school
ReCoN-Ipsundrum:具备情感耦合控制与机制关联意识指标的可检查循环持久代理 02-27
ReCoN-Ipsundrum
机器意识
AI Agent |
[自动]
[ARXIV] | 3min | school
MovieTeller:工具增强且ID一致的渐进式摘要生成 02-27
MovieTeller
视频摘要
VLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 02-27
模型蒸馏
SWE-bench
奖励黑客 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Nova 强化微调:原理、应用场景与实现指南 02-27
Amazon Nova
强化微调
RFT |
[自动]
[ARXIV] | 3min | school
AgentDropoutV2:测试时剪枝优化多智能体系统信息流 02-27
AgentDropoutV2
多智能体系统
MAS |
[自动]
[JUEJIN] | 2min | sticky_note_2
10分钟接入AgentNet:从零开始的实践指南 02-27
AgentNet
AI Agent
LLM |
[自动]
[ARXIV] | 3min | school
现成图像模型可攻破图像保护方案 02-27
图像保护
对抗攻击
Stable Diffusion |
[自动]
[ARXIV] | 3min | school
提升推理语言模型的参数化知识获取能力 02-27
LLM
推理模型
参数化知识 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 与西北太平洋国家实验室合作推出 DraftNEPABench 加速联邦许可审批 02-27
OpenAI
PNNL
DraftNEPABench |
[自动]
[ARXIV] | 3min | school
LiCQA:轻量级复杂问答系统 02-27
LiCQA
复杂问答
QA系统 |
[自动]
[ARXIV] | 4min | school
GUI-Libra:动作感知监督与可验证强化学习的原生GUI智能体 02-27
GUI Agent
强化学习
RL |
[自动]
[ARXIV] | 3min | school
DySCO:面向长上下文大模型的动态注意力缩放解码方法 02-27
DySCO
长上下文
解码算法 |
[自动]
[ARXIV] | 3min | school
高效自动化翻译基准测试与数据集的流水线 02-26
LLM
多语言模型
数据集 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Nano Banana 2 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[ARXIV] | 3min | school
现成图生图模型可攻破主流图像保护方案 02-26
图像保护
对抗样本
图生图 |
[自动]
[ARXIV] | 3min | school
提升推理语言模型的参数化知识访问能力 02-26
推理模型
参数化知识
强化学习 |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教程,获500余所高校采用 02-26
深度学习
D2L
PyTorch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用闲置算力将LLM训练速度提升一倍且保持精度 02-26
LLM
训练加速
算力优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer 架构中的混合专家模型原理与优势 02-26
MoE
Transformer
混合专家 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 与西北太平洋国家实验室合作推出 DraftNEPABench 加速联邦许可流程 02-26
OpenAI
AI 编程代理
DraftNEPABench |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI Codex 集成 Figma 实现代码与设计无缝切换 02-26
OpenAI
Codex
Figma |
[自动]
[ARXIV] | 3min | school
LiCQA:面向复杂问答的轻量级系统 02-26
LiCQA
复杂问答
轻量级系统 |
[自动]
[ARXIV] | 4min | school
GUI-Libra:动作感知监督与可验证RL训练原生GUI智能体 02-26
GUI Agent
RL
CoT |
[自动]
[ARXIV] | 3min | school
DySCO:面向长上下文大模型的动态注意力缩放解码 02-26
DySCO
长上下文
注意力机制 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 02-26
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[JUEJIN] | 2min | sticky_note_2
Android AI Agent四层架构与安全设计实战解析 02-26
Android
AI Agent
系统架构 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Amazon Nova 强化微调解析:原理、应用场景与实现指南 02-26
Amazon Nova
强化微调
RFT |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI Agent接管手机:移动端观测技术与事件特征提取 02-26
AI Agent
移动端
UI 树解析 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Nano Banana 2 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[HACKER_NEWS] | 1min | newspaper
用概念代数引导可解释的语言模型 02-26
可解释性
概念代数
模型控制 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Nano Banana 2:最新 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用闲置算力将大模型训练速度提升一倍 02-26
LLM
训练加速
算力优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
使用 Nano Banana 2 构建图像生成与编辑应用 02-26
图像生成
图像编辑
Nano Banana 2 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI Codex 集成 Figma:实现代码与设计无缝连接 02-26
OpenAI
Codex
Figma |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Nova 强化微调原理、应用场景与实现路径解析 02-26
Amazon Nova
强化微调
RFT |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2025年12月回顾:编程已发生永久性改变 02-26
编程范式
AI 编程
行业变革 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Nano Banana 2 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌DeepMind推出SynthID:为AI生成文本添加水印的技术 02-26
SynthID
DeepMind
文本水印 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用闲置算力将大模型训练速度提升一倍的新方法 02-26
LLM
训练效率
算力优化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用 Nano Banana 2 构建图像生成与编辑应用 02-26
图像生成
图像编辑
Nano Banana 2 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer中的混合专家模型:架构原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic 放弃其核心安全承诺 02-26
Anthropic
AI安全
对齐 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Nova 强化微调指南:原理、场景与实现路径 02-26
Amazon Nova
RFT
强化微调 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Nano Banana 2:最新 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 SageMaker AI 与 Bedrock 上高效部署多 LoRA 模型 02-26
vLLM
LoRA
SageMaker |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用空闲计算时间将大模型训练速度提升一倍 02-26
LLM
模型训练
算力优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
OpenAI的竞争策略与市场定位分析 02-26
OpenAI
竞争策略
市场定位 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 与西北太平洋国家实验室推基准测试,加速联邦许可流程 02-26
OpenAI
PNNL
DraftNEPABench |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI Codex 集成 Figma 实现代码与设计无缝协作 02-26
OpenAI
Codex
Figma |
[自动]
[HACKER_NEWS] | 1min | newspaper
Google API密钥曾非机密,但Gemini改变了规则 02-26
Google
Gemini
API密钥 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ferret-UI Lite:端侧轻量级GUI Agent构建经验 02-26
Ferret-UI
GUI Agent
端侧模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
CuspAI利用生成式AI搜索全材料空间以加速发现 02-26
生成式AI
CuspAI
材料科学 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic 放弃核心安全承诺 02-26
Anthropic
AI安全
大模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI领域“闭环”效应显现:数十场中型发布会综述 02-26
AI闭环
产品发布
行业综述 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI全息信息助力细胞生物学全景研究 02-26
细胞生物学
AI驱动
全息信息 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
CuspAI 探索全材料空间:Max Welling 谈生成式 AI 加速材料发现 02-26
CuspAI
Max Welling
生成式AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI全局分析助力细胞生物学研究与实验规划 02-26
AI
细胞生物学
实验规划 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年2月威胁报告:AI模型与社交平台结合的恶意利用及防御 02-26
威胁报告
恶意利用
AI安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌API密钥曾非机密 但Gemini改变了规则 02-26
API密钥
Google
Gemini |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用闲置算力将大模型训练速度提升一倍 02-26
LLM
模型训练
算力优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
OpenAI 的竞争策略分析 02-26
OpenAI
竞争策略
商业模式 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Anthropic 放弃其核心安全承诺 02-26
Anthropic
AI安全
对齐 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Agent Swarm:开源多智能体自学习团队框架 02-26
Agent Swarm
Multi-agent
多智能体 |
[自动]
[HACKER_NEWS] | 4min | newspaper
利用大语言模型实现大规模在线去匿名化 02-26
LLM
去匿名化
隐私攻击 |
[自动]
[HACKER_NEWS] | 1min | newspaper
OpenAI 的竞争策略分析 02-26
OpenAI
竞争策略
商业模式 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
CuspAI融资1亿美元:Max Welling谈遍历所有可能材料空间 02-26
CuspAI
生成式AI
材料科学 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Anthropic 放弃核心安全承诺,不再发布高风险模型 02-26
Anthropic
模型安全
AI治理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI驱动方法助力细胞生物学全景分析与实验规划 02-26
AI for Science
细胞生物学
实验规划 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Agent Swarm:开源多智能体自学习团队框架 02-26
Agent Swarm
Multi-agent
自学习 |
[自动]
[HACKER_NEWS] | 1min | newspaper
首个完全通用的计算机动作模型 02-26
Agent
LLM
计算机控制 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在SageMaker AI与Bedrock上利用vLLM高效部署多LoRA及MoE模型 02-26
vLLM
LoRA
MoE |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 Amazon SageMaker 上使用 veRL 与 Ray 训练 CodeFu-7B 模型 02-26
SageMaker
veRL
Ray |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用闲置算时将大模型训练速度翻倍且保持精度 02-26
LLM
模型训练
算力优化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用大语言模型实现大规模在线去匿名化 02-26
LLM
去匿名化
隐私攻击 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
中型模型发布潮揭示AI应用“闭环”效应 02-26
中型模型
AI应用
闭环 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
Transformer
MoE
混合专家模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
OpenAI 的竞争策略分析 02-26
OpenAI
竞争策略
商业模式 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
CuspAI利用生成式AI搜索全空间材料 02-26
CuspAI
生成式AI
材料科学 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Claude Code周年回顾:代码生成占比预测与全球内存短缺分析 02-26
Claude Code
代码生成
AI 编程 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年2月威胁报告:AI模型结合网站与社交平台的恶意利用及防御 02-26
威胁报告
恶意利用
AI安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
首个完全通用的计算机动作模型 02-26
通用模型
计算机控制
Agent |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用大语言模型实现大规模在线用户去匿名化 02-26
LLM
去匿名化
隐私攻击 |
[自动]
[HACKER_NEWS] | 1min | newspaper
OpenAI 的竞争策略分析 02-26
OpenAI
竞争策略
商业模式 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI 资讯:中型模型发布凸显闭环效应 02-26
中型模型
闭环效应
模型发布 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年2月威胁报告:AI模型结合网站与社交平台的恶意利用及防御 02-26
威胁报告
AI安全
恶意利用 |
[自动]
[HACKER_NEWS] | 1min | newspaper
首个完全通用的计算机动作模型 02-26
计算机动作模型
通用模型
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用大语言模型实现大规模在线去匿名化 02-26
去匿名化
隐私攻击
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
PA基准:评估Web智能体在真实个人助理工作流中的表现 02-26
Web智能体
PA基准
个人助理 |
[自动]
[JUEJIN] | 2min | sticky_note_2
空洞卷积原理:如何解决计算机视觉的精度与视野矛盾 02-26
空洞卷积
计算机视觉
深度学习 |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型非线性变换解析:从MLP到MoE的架构演进 02-26
非线性变换
MLP
MoE |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 Amazon SageMaker 上使用 veRL 与 Ray 训练 CodeFu-7B 模型 02-26
SageMaker
veRL
Ray |
[自动]
[JUEJIN] | 2min | sticky_note_2
从隐藏向量到文本:LM Head 如何预测下一个词 02-26
LLM
Transformer
LM Head |
[自动]
[BLOGS_PODCASTS] | 2min | mic
亚马逊Bedrock在亚太五区上线Anthropic模型全球跨区域推理 02-26
Amazon Bedrock
Anthropic
Claude 3 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
CuspAI 探索全材料空间:Hinton 与 LeCun 顾问 02-26
CuspAI
Max Welling
Geoffrey Hinton |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI驱动方法助力细胞生物学全景解析与实验规划 02-26
AI for Science
细胞生物学
系统生物学 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI进展综述:中型模型发布凸显“闭环”有效性 02-26
AI进展
闭环
AI产品 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年2月威胁报告:AI模型结合社交平台的恶意利用及防御 02-26
威胁报告
恶意利用
AI安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用大语言模型实现大规模在线用户去匿名化 02-26
LLM
去匿名化
隐私攻击 |
[自动]
[HACKER_NEWS] | 1min | newspaper
PA基准:评估Web智能体在真实个人助理工作流中的表现 02-26
Web智能体
PA基准
个人助理 |
[自动]
[ARXIV] | 4min | school
面向法语的ModernBERT多样性训练案例研究 02-26
ModernBERT
数据多样性
预训练 |
[自动]
[ARXIV] | 3min | school
通过剔除已覆盖代码增强大模型测试生成 02-26
LLM
单元测试
代码覆盖率 |
[自动]
[ARXIV] | 4min | school
用于Wasserstein测地线与最优传输动力学的神经求解器 02-26
最优传输
Wasserstein
神经网络 |
[自动]
[HACKER_NEWS] | 1min | newspaper
四个月图像视频VAE实验的经验总结 02-26
VAE
图像生成
视频生成 |
[自动]
[ARXIV] | 3min | school
函数空间经验贝叶斯正则化:基于t分布先验 02-26
贝叶斯深度学习
函数空间
经验贝叶斯 |
[自动]
[ARXIV] | 4min | school
TG-ASR:基于并行门控交叉注意力的翻译引导低资源语音识别 02-26
ASR
语音识别
低资源学习 |
[自动]
[ARXIV] | 3min | school
CxMP:评估语言模型构式理解的语言学最小对子基准 02-26
CxMP
构式语法
最小对子 |
[自动]
[ARXIV] | 3min | school
面向大模型终端能力扩展的数据工程研究 02-26
LLM
数据工程
终端 |
[自动]
[ARXIV] | 3min | school
扩散对偶性第二章:Ψ采样器与高效课程 02-26
扩散模型
离散扩散
Psi采样器 |
[自动]
[ARXIV] | 3min | school
基于试错学习的反思式测试时规划:用于具身大模型 02-26
具身智能
反思机制
测试时规划 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于LLM的大规模在线去匿名化研究 02-26
LLM
去匿名化
隐私攻击 |
[自动]
[HACKER_NEWS] | 1min | newspaper
四个月图像视频VAE实验的技术总结与经验 02-26
VAE
视频生成
图像生成 |
[自动]
[ARXIV] | 4min | school
为何LLM后训练中Pass@k优化会降低Pass@1性能 02-26
LLM
后训练
Pass@k |
[自动]
[ARXIV] | 4min | school
Test-Time训练结合KV绑定等价于线性注意力 02-26
TTT
线性注意力
KV绑定 |
[自动]
[ARXIV] | 4min | school
Squint:面向机器人虚实迁移的快速视觉强化学习 02-26
强化学习
机器人
Sim-to-Real |
[自动]
[ARXIV] | 3min | school
Aletheia自主攻克FirstProof数学定理 02-26
Aletheia
Gemini 3
数学定理 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
基于 veRL 在 SageMaker 与 Ray 上训练 CodeFu-7B 模型 02-25
veRL
SageMaker
Ray |
[自动]
[BLOGS_PODCASTS] | 3min | mic
利用Amazon Bedrock构建生产级智能活动助理 02-25
Amazon Bedrock
AgentCore
RAG |
[自动]
[JUEJIN] | 2min | sticky_note_2
OpenHands框架拆解:CodeActAgent的设计与核心能力 02-25
OpenHands
CodeActAgent
AI Agent |
[自动]
[BLOGS_PODCASTS] | 2min | mic
CuspAI利用生成式AI搜索全材料空间以加速发现 02-25
CuspAI
生成式AI
材料科学 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 中东区域支持 Anthropic Claude 全球跨区域推理 02-25
AWS
Amazon Bedrock
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年2月威胁报告:AI模型结合网站与社交平台的恶意利用及防御 02-25
威胁报告
恶意利用
AI安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
首个完全通用的计算机动作模型 02-25
计算机动作模型
通用模型
Agent |
[自动]
[ARXIV] | 3min | school
面向大模型终端能力扩展的数据工程研究 02-25
LLM
数据工程
终端 |
[自动]
[ARXIV] | 3min | school
扩散对偶性第二章:Ψ采样器与高效课程 02-25
扩散模型
离散扩散
采样器 |
[自动]
[ARXIV] | 4min | school
基于试错反思的具身大模型测试时规划 02-25
具身智能
反思机制
测试时规划 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用大语言模型实现大规模在线用户去匿名化 02-25
去匿名化
隐私攻击
LLM |
[自动]
[ARXIV] | 5min | school
为何Pass@k优化会降低Pass@1:大模型后训练中的提示干扰 02-25
LLM
后训练
代码生成 |
[自动]
[ARXIV] | 4min | school
Squint:面向机器人具身迁移的快速视觉强化学习 02-25
强化学习
机器人
Sim-to-Real |
[自动]
[ARXIV] | 4min | school
KV绑定测试时训练等价于线性注意力 02-25
TTT
线性注意力
KV缓存 |
[自动]
[ARXIV] | 5min | school
Headwise Chunking:面向上下文并行的内存高效方案 02-25
上下文并行
长文本训练
内存优化 |
[自动]
[ARXIV] | 4min | school
Aletheia模型自主攻克FirstProof数学定理证明 02-25
Aletheia
FirstProof
数学定理证明 |
[自动]
[HACKER_NEWS] | 1min | newspaper
四个月图像视频VAE实验的经验总结 02-25
VAE
视频生成
图像生成 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用大语言模型实现大规模在线去匿名化 02-25
LLM
去匿名化
隐私安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
PA Bench:评估前沿模型多标签页任务能力 02-25
PA Bench
多标签页
模型评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
数十场中型发布会背后的共同主题:形成闭环 02-25
闭环
数据飞轮
合成数据 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用大语言模型实现大规模在线用户去匿名化 02-25
去匿名化
隐私攻击
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
使用 veRL 和 Ray 在 SageMaker 上训练 CodeFu-7B 模型 02-25
veRL
Ray
SageMaker |
[自动]
[BLOGS_PODCASTS] | 2min | mic
亚马逊云科技宣布Amazon Bedrock在亚太五个国家/地区正式上线Anthropic Claude模型, 02-25
Amazon Bedrock
Anthropic Claude
全球跨区域推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Amazon Bedrock 推出中东跨区域推理支持多款 Claude 模型 02-25
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年2月威胁报告:AI模型结合社交平台的恶意利用与防御 02-25
威胁报告
恶意利用
社交平台 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
基于veRL与Ray在SageMaker上训练CodeFu-7B模型 02-25
veRL
Ray
SageMaker |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Amazon Bedrock在亚太六地推Claude模型全球跨区域推理 02-25
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Nature视角:CuspAI利用AI搜索材料并获1亿美元融资 02-25
CuspAI
材料科学
Geoffrey Hinton |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI驱动方法助力细胞生物学全景解析与实验规划 02-25
AI
细胞生物学
多模态融合 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年2月威胁报告:AI模型结合网站与社交平台的恶意利用及防御 02-25
威胁报告
AI安全
恶意利用 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 Amazon SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B 模型 02-25
SageMaker
veRL
Ray |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI前沿评估负责人探讨SWE-Bench Verified后的下一步 02-25
OpenAI
SWE-Bench
智能体 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
Diffusion Model |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 现支持中东跨区域推理使用 Anthropic Claude 模型 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 推出 Anthropic Claude 全球跨区域推理,覆盖东南亚及台湾 02-25
Amazon Bedrock
Claude
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI News:数十场发布会背后的共同主题是“闭环” 02-25
AI新闻
闭环
发布会 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年2月威胁报告:AI模型结合网站与社交平台的恶意利用及防御 02-25
威胁报告
恶意利用
AI安全 |
[自动]
[JUEJIN] | 2min | sticky_note_2
OpenHands 框架解析:CodeActAgent 架构与设计原则 02-25
OpenHands
CodeActAgent
AI Agent |
[自动]
[HACKER_NEWS] | 1min | newspaper
Moonshine 开源语音识别模型:精度超越 WhisperLargev3 02-25
语音识别
STT
Moonshine |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
Diffusion Model |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI 智能体可玩的即时战略游戏 02-25
AI Agent
游戏
即时战略 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 Amazon SageMaker 上利用 Dottxt Outlines 实现 LLM 结构化输出 02-25
LLM
结构化输出
Outlines |
[自动]
[BLOGS_PODCASTS] | 5min | mic
使用 veRL 和 Ray 在 SageMaker 上训练 CodeFu-7B 模型 02-25
SageMaker
Ray
veRL |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI前沿评估团队:迈向智能体评测的下一步 02-25
OpenAI
SWE-Bench
智能体评测 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Moonshine 开源 STT 模型:精度超越 WhisperLargev3 02-25
STT
Whisper
Moonshine |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊 Bedrock 推出 Claude 模型中东全球跨区域推理 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[HACKER_NEWS] | 3min | newspaper
AI 智能体可参与的即时战略游戏演示 02-25
AI Agent
游戏
RTS |
[自动]
[GITHUB_TRENDING] | 1min | hub
动手学深度学习:可运行中文教程,被500多所高校采用 02-25
深度学习
PyTorch
MXNet |
[自动]
[HACKER_NEWS] | 1min | newspaper
Moonshine 开源 STT 模型:精度超越 WhisperLargev3 02-25
STT
Whisper
Moonshine |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
Diffusion Model |
[自动]
[HACKER_NEWS] | 1min | newspaper
系统提示词中的主权归属与控制机制 02-25
System Prompt
Prompt Engineering
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B 02-25
SageMaker
veRL
Ray |
[自动]
[BLOGS_PODCASTS] | 2min | mic
亚马逊Bedrock在东南亚及台湾推出Anthropic Claude模型 02-25
AWS
Bedrock
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
亚马逊 Bedrock 推出中东跨区域推理支持 Claude 模型 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI前沿评估负责人:SWE-Bench Verified后的智能体评测新方向 02-25
OpenAI
SWE-Bench
智能体 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Moonshine 开源 STT 模型:精度超越 WhisperLargev3 02-25
STT
Whisper
Moonshine |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic 撤销旗舰产品安全承诺 02-25
Anthropic
Claude
安全承诺 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic 放弃旗舰安全承诺,不再遵守 AI 安全准则 02-25
Anthropic
AI安全
负责任AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
Moonshine 开源 STT 模型:精度超越 WhisperLargev3 02-25
STT
Whisper
Moonshine |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的最快推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Hugging Face Skills:基于技能的模型微调框架 02-25
Hugging Face
模型微调
Skills |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic 放弃旗舰产品安全承诺 02-25
Anthropic
Claude
安全承诺 |
[自动]
[ARXIV] | 2min | school
工具构建:通往高级智能的路径 02-25
LLM
超级智能
工具构建 |
[自动]
[ARXIV] | 3min | school
学术问答系统中大模型错误评估的专家框架 02-25
LLM
学术问答
错误评估 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
基于AWS与Hugging Face smolagents构建多模型医疗AI智能体 02-25
Agentic AI
Hugging Face
smolagents |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 Amazon SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B 模型 02-25
SageMaker
veRL
Ray |
[自动]
[ARXIV] | 3min | school
动机优化:提升大语言模型任务表现的关键机制 02-25
动机优化
训练范式
情感神经科学 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊Bedrock在东南亚及台湾推出Anthropic Claude模型全球跨区域推理 02-25
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊 Bedrock 推出中东全球跨区域推理支持 Claude 模型 02-25
Amazon Bedrock
Claude
Anthropic |
[自动]
[ARXIV] | 3min | school
VAUQ:面向LVLM自评估的视觉感知不确定性量化 02-25
LVLM
多模态
不确定性量化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的最快推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Claude Code金融应用与全球内存短缺:SemiAnalysis深度解析 02-25
Claude Code
代码生成
SemiAnalysis |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Bedrock Robotics应用视觉语言模型规模化标注物理AI数据 02-25
VLM
视觉语言模型
数据标注 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
AWS SageMaker集成Dottxt Outlines实现LLM结构化输出 02-25
LLM
结构化输出
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic指控DeepSeek等三家中国公司超1600万次蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic 撤销旗舰级安全承诺,不再遵守自愿安全准则 02-25
Anthropic
安全承诺
AI治理 |
[自动]
[ARXIV] | 3min | school
面向大规模视频推理的综合基准测试套件 02-25
视频推理
VBVR
基准测试 |
[自动]
[ARXIV] | 3min | school
部分可观测平均场博弈的循环结构策略梯度算法 02-25
平均场博弈
MFG
策略梯度 |
[自动]
[ARXIV] | 4min | school
行为学习:从数据中学习分层优化结构 02-25
行为学习
分层优化
可解释性 |
[自动]
[ARXIV] | 4min | school
智能体AI实现光学系统的可扩展鲁棒控制 02-25
AgentOptics
智能体
光学系统 |
[自动]
[ARXIV] | 3min | school
Skill-Inject:评估智能体技能文件攻击的脆弱性 02-25
LLM智能体
提示注入
Agent安全 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI前沿评估团队:SWE-Bench Verified后的智能体评估新方向 02-25
OpenAI
SWE-Bench
智能体 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Moonshine 开源 STT 模型:精度超越 WhisperLargev3 02-25
STT
Whisper
Moonshine |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的最快推理 LLM 02-25
Mercury 2
扩散模型
推理模型 |
[自动]
[ARXIV] | 3min | school
KNIGHT:知识图谱驱动的多选题生成与自适应难度校准 02-25
LLM
RAG
知识图谱 |
[自动]
[ARXIV] | 4min | school
JUCAL:分类任务中偶然与认知不确定性的联合校准 02-25
不确定性校准
JUCAL
偶然不确定性 |
[自动]
[ARXIV] | 3min | school
AdaEvolve:基于大语言模型的自适应零阶优化框架 02-25
LLM
零阶优化
进化算法 |
[自动]
[ARXIV] | 4min | school
行为学习:从数据中学习分层优化结构 02-24
行为学习
分层优化
可解释性 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
基于AWS与Hugging Face smolagents的多模型医疗AI智能体构建 02-24
Agentic AI
Hugging Face
AWS |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 Amazon SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B 模型 02-24
SageMaker
veRL
Ray |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材 02-24
深度学习
D2L
PyTorch |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊Bedrock新推亚太六区:Anthropic Claude模型支持全球跨区域推理 02-24
Amazon Bedrock
Anthropic
Claude |
[自动]
[ARXIV] | 4min | school
Skill-Inject:评估智能体技能文件攻击漏洞 02-24
LLM Agents
Prompt Injection
Skill-Inject |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 前沿评估团队探讨迈向智能体评估的下一阶段 02-24
OpenAI
SWE-Bench
智能体评估 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Moonshine 开源 STT 模型:精度超越 WhisperLargev3 02-24
STT
Whisper
Moonshine |
[自动]
[ARXIV] | 4min | school
KNIGHT:知识图谱驱动的多选题生成与自适应难度校准 02-24
RAG
知识图谱
LLM |
[自动]
[ARXIV] | 4min | school
JUCAL:分类任务中偶然与认知不确定性的联合校准 02-24
不确定性校准
JUCAL
偶然不确定性 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Hugging Face Skills 功能上线与模型评估体系更新 02-24
Hugging Face
模型评估
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Bedrock Robotics利用视觉语言模型自动化标注物理AI训练数据 02-24
VLM
视觉语言模型
数据标注 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 现支持在中东地区进行跨区域推理,使用 Anthropic Claude 模型 02-24
Amazon Bedrock
Anthropic
Claude |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI视觉连载5:传统CV之均值滤波 02-24
AI视觉
传统CV
均值滤波 |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI Agent 进化论:从 SkillSMP 到 EvoMap 的技术栈演进 02-24
AI Agent
MCP
SkillSMP |
[自动]
[ARXIV] | 4min | school
AdaEvolve:基于大语言模型的自适应零阶优化方法 02-24
AdaEvolve
LLM
零阶优化 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Taalas 定制芯片实现 Llama 3.1 8B 每秒 16960 tok/s 02-24
Taalas
定制芯片
ASIC |
[自动]
[BLOGS_PODCASTS] | 3min | mic
SWE-bench Verified 数据泄露与缺陷分析:为何应转向 SWE-bench Pro 02-24
SWE-bench
数据泄露
数据污染 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI前沿评估团队:从SWE-Bench Verified看智能体评估演进 02-24
OpenAI
SWE-Bench
智能体 |
[自动]
[HACKER_NEWS] | 5min | newspaper
HuggingFace Agent 技能机制解析 02-24
HuggingFace
Agent
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Bedrock Robotics利用视觉语言模型规模化标注数据赋能物理AI 02-24
VLM
物理AI
数据标注 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
AWS SageMaker集成Dottxt Outlines实现LLM结构化输出 02-24
AWS
SageMaker
结构化输出 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击 02-24
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Amazon Bedrock在东南亚及台湾推出Anthropic模型全球跨区域推理 02-24
Amazon Bedrock
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock 推出中东全球跨区域推理支持 Claude 模型 02-24
Amazon Bedrock
Claude
Anthropic |
[自动]
[HACKER_NEWS] | 1min | newspaper
HuggingFace Agent 技能框架:工具调用与任务编排解析 02-24
HuggingFace
Agent
工具调用 |
[自动]
[ARXIV] | 3min | school
部分可观测平均场博弈的循环结构策略梯度算法 02-24
平均场博弈
部分可观测
策略梯度 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
使用veRL和Ray在SageMaker上训练CodeFu-7B模型 02-24
SageMaker
veRL
Ray |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Taalas 定制芯片实现 Llama 3.1 推理速度 16960 tok/s 02-24
Taalas
定制芯片
ASIC |
[自动]
[BLOGS_PODCASTS] | 3min | mic
SWE-bench Verified 存在数据污染与评估偏差,建议改用 SWE-bench Pro 02-24
SWE-bench
数据污染
基准测试 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI前沿评估团队探讨SWE-Bench Verified后的下一步 02-24
OpenAI
SWE-Bench
Agent |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 成立前沿联盟,助力企业实现智能体规模化生产部署 02-24
OpenAI
智能体
企业部署 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 02-24
SageMaker
HyperPod
AWS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Bedrock Robotics利用视觉语言模型自动化生成物理AI训练数据 02-24
VLM
视觉语言模型
数据标注 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等遭超1600万次蒸馏攻击 02-24
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Amazon Bedrock 新增中东区域支持 Anthropic Claude 模型推理 02-24
AWS
Amazon Bedrock
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Amazon Bedrock 在东南亚及台湾推出 Anthropic Claude 模型全球跨区域推理 02-24
Amazon Bedrock
Anthropic
Claude 3 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
基于AWS与Hugging Face smolagents构建多模型医疗智能体 02-24
AWS
Hugging Face
smolagents |
[自动]
[JUEJIN] | 1min | sticky_note_2
大模型开发演进:从ChatGPT到多模态与A2A协作 02-24
LLM
ChatGPT
多模态 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
基于Hugging Face smolagents与AWS构建多模型医疗AI代理 02-24
Hugging Face
smolagents
AWS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-24
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Taalas HC1 定制芯片实现 Llama 3.1 8B 推理速度 1.7 万 token/s 02-24
Taalas
定制芯片
ASIC |
[自动]
[BLOGS_PODCASTS] | 3min | mic
SWE-bench Verified 数据污染与测度失准分析及替代方案 02-24
SWE-bench
数据污染
代码生成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 前沿评估团队:SWE-Bench Verified 之后的下一步 02-24
OpenAI
SWE-Bench
智能体 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-24
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Bedrock Robotics利用视觉语言模型规模化标注施工数据 02-24
VLM
视觉语言模型
数据标注 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击 02-24
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[HACKER_NEWS] | 1min | newspaper
将 Wolfram 技术作为基础工具接入大语言模型 02-24
Wolfram
LLM
工具调用 |
[自动]
[HACKER_NEWS] | 2min | newspaper
Steerling-8B:可解释自身生成任一 token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
Wolfram 技术作为 LLM 系统基础工具开放 02-24
Wolfram
LLM
工具链 |
[自动]
[HACKER_NEWS] | 2min | newspaper
Steerling-8B:可解释自身生成任一 Token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
53款模型“洗车”测试 02-24
模型评估
基准测试
LLM |
[自动]
[JUEJIN] | 1min | sticky_note_2
阿里云PAI升级全链路基础设施支持Qwen3.5 02-24
阿里云
Qwen3.5
PAI |
[自动]
[HACKER_NEWS] | 1min | newspaper
将 Wolfram 技术作为 LLM 系统基础工具 02-24
LLM
Wolfram
工具调用 |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用 02-24
深度学习
D2L
PyTorch |
[自动]
[HACKER_NEWS] | 2min | newspaper
Steerling-8B:可解释自身生成任一 Token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI成立前沿联盟:助企业安全部署AI智能体落地生产 02-24
OpenAI
智能体
AI部署 |
[自动]
[JUEJIN] | 2min | sticky_note_2
DeepMind研究:多智能体协作瓶颈与Agent能力天花板分析 02-24
DeepMind
多智能体
Agent |
[自动]
[JUEJIN] | 2min | sticky_note_2
ArcFlow实现FLUX与Qwen推理40倍加速 02-24
ArcFlow
FLUX
Qwen |
[自动]
[HACKER_NEWS] | 1min | newspaper
53款模型“洗车”测试:评估多模态AI在物理场景中的表现 02-24
多模态
物理场景
模型评估 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Steerling-8B:可解释自身生成任一 Token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
53款模型“洗车”测试:评估代码生成与修复能力 02-24
代码生成
模型评估
Bug修复 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Steerling-8B:可解释自身生成任一 Token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
将 Wolfram 技术集成为大语言模型系统的基础工具 02-24
Wolfram
LLM
工具集成 |
[自动]
[HACKER_NEWS] | 1min | newspaper
53款模型“洗车”测试:评估大模型代码生成鲁棒性 02-24
代码生成
鲁棒性
模型评估 |
[自动]
[ARXIV] | 3min | school
用于软优势策略优化的平滑门函数 02-24
强化学习
GRPO
SAPO |
[自动]
[BLOGS_PODCASTS] | 5min | mic
基于AWS与Hugging Face smolagents构建多模型医疗AI智能体 02-24
AWS
Hugging Face
smolagents |
[自动]
[ARXIV] | 3min | school
城市编辑:面向依赖感知的分层智能体城市地理空间修改 02-24
City Editing
分层智能体
多模态推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-24
First Proof
数学证明
AI推理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Wolfram技术作为LLM系统基础工具的集成方案 02-24
Wolfram
LLM
工具集成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Taalas HC1 芯片实测:Llama 3.1 8B 跑出 16960 tok/s 02-24
Taalas
定制芯片
ASIC |
[自动]
[BLOGS_PODCASTS] | 2min | mic
SWE-bench Verified 存在数据污染与缺陷,建议迁移至 SWE-bench Pro 02-24
SWE-bench
数据污染
基准测试 |
[自动]
[ARXIV] | 4min | school
Soft Sequence Policy Optimization:连接GMPO与SAPO 02-24
SSPO
LLM对齐
强化学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI前沿评测团队:SWE-Bench Verified后的智能体评测演进 02-24
OpenAI
SWE-Bench
Agent |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-24
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Bedrock Robotics利用视觉-语言模型规模化标注物理AI训练数据 02-24
VLM
视觉语言模型
数据标注 |
[自动]
[ARXIV] | 3min | school
统一图神经网络均匀表达能力的通用方法 02-24
GNN
图神经网络
表达能力 |
[自动]
[ARXIV] | 3min | school
扩散模型无需噪声调节的几何学原理 02-24
扩散模型
Flow Matching
几何学原理 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
基于AWS与Hugging Face smolagents构建多模型医疗AI Agent 02-24
Agent
AWS
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-24
数学推理
First Proof
研究级推理 |
[自动]
[ARXIV] | 4min | school
U(d)子群导出自然RNN与Transformer架构 02-24
RNN
Transformer
序列模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Taalas HC1 定制芯片实现 Llama 3.1 8B 每秒 16960 tok 02-24
Taalas
定制芯片
ASIC |
[自动]
[BLOGS_PODCASTS] | 3min | mic
SWE-bench Verified 数据泄露与测试缺陷分析:为何应迁移至 SWE-bench Pro 02-24
SWE-bench
数据泄露
基准测试 |
[自动]
[ARXIV] | 4min | school
SPQ:面向大语言模型压缩的集成技术 02-24
LLM
模型压缩
SPQ |
[自动]
[ARXIV] | 3min | school
RVR:检索-验证-检索机制提升综合问答能力 02-24
RVR
RAG
检索增强 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 推进智能体评估:SWE-Bench Verified 后续方向 02-24
OpenAI
SWE-Bench
智能体评估 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-24
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Bedrock与AWS合作:利用视觉-语言模型规模化生成物理AI训练数据 02-24
VLM
视觉语言模型
数据标注 |
[自动]
[JUEJIN] | 1min | sticky_note_2
2025年AI技术综述:DeepSeek R1与Agent落地元年 02-24
DeepSeek R1
Agent
OpenAI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示主流AI模型向弱势用户提供的信息准确度较低 02-23
AI偏见
数字鸿沟
模型评估 |
[自动]
[ARXIV] | 3min | school
扩散模型无需噪声条件:几何视角的解释 02-23
扩散模型
几何视角
生成模型 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
基于AWS与Hugging Face smolagents构建多模型医疗AI Agent 02-23
Hugging Face
smolagents
AWS |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材,全球500余所高校采用 02-23
深度学习
D2L
PyTorch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-23
First Proof
数学证明
推理能力 |
[自动]
[ARXIV] | 4min | school
U(d)子群自然导出RNN与Transformer架构 02-23
RNN
Transformer
U(d) |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Taalas HC1 定制芯片运行 Llama 3.1 8B 达 16960 tok/s 02-23
Taalas
定制芯片
ASIC |
[自动]
[BLOGS_PODCASTS] | 3min | mic
SWE-bench Verified 数据泄漏与测试缺陷分析:为何推荐改用 SWE-bench Pro 02-23
SWE-bench
数据泄漏
基准测试 |
[自动]
[ARXIV] | 4min | school
SPQ:大语言模型压缩的集成技术 02-23
模型压缩
LLM
量化 |
[自动]
[ARXIV] | 3min | school
RVR:检索-验证-检索框架提升综合问答能力 02-23
RVR
RAG
检索增强 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI前沿评估团队:超越SWE-Bench Verified的智能体评估新阶段 02-23
OpenAI
SWE-Bench
智能体评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 成立 Frontier 联盟:携手合作伙伴,护航企业智能体安全落地 02-23
OpenAI
Frontier Alliance
AI Agent |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍 02-23
Gemini 3.1 Pro
Google
ARC-AGI 2 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI提出SWE-Bench-Dead:智能体前沿评估的下一步 02-23
OpenAI
SWE-Bench
Agent |
[自动]
[HACKER_NEWS] | 1min | newspaper
53 款模型参与“洗车”基准测试 02-23
基准测试
模型评估
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示AI聊天机器人向弱势用户提供的信息准确性较低 02-23
AI偏见
公平性
弱势群体 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Taalas 定制芯片实现 Llama 3.1 8B 每用户 16960 tok/s 02-23
Taalas
定制芯片
ASIC |
[自动]
[BLOGS_PODCASTS] | 2min | mic
SWE-bench Verified 数据污染严重,推荐使用 SWE-bench Pro 02-23
SWE-bench
数据污染
基准测试 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT新方法根除漏洞并提升大语言模型安全性与性能 02-23
MIT
LLM
模型安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍 02-23
Gemini
Google
ARC-AGI |
[自动]
[HACKER_NEWS] | 1min | newspaper
Anthropic 发布 AI 熟练度指数以评估教育领域应用 02-23
Anthropic
AI教育
熟练度指数 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI模型在First Proof数学挑战中的证明尝试 02-23
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示主流AI模型向弱势用户提供的信息准确度较低 02-23
LLM
公平性
偏见 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
基于AWS与Hugging Face smolagents构建医疗AI智能体 02-23
Agentic AI
Hugging Face
smolagents |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-23
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT新方法根除漏洞并提升大语言模型安全性与性能 02-23
MIT
LLM
模型安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-23
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic与OpenAI的博弈:a16z对话AI投资与算力经济 02-23
a16z
Anthropic
OpenAI |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI时间线:从Transformer(2017)到GPT-5.3(2026)的171个大模型 02-23
LLM
时间线
Transformer |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示AI聊天机器人向弱势群体提供更不准确信息 02-23
AI偏见
公平性
信息准确性 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-23
First Proof
数学证明
推理能力 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-23
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Taalas 定制芯片实现 Llama 3.1 8B 每秒 16960 tokens 02-23
Taalas
ASIC
定制芯片 |
[自动]
[JUEJIN] | 3min | sticky_note_2
nano-vllm:vLLM 极简实现与大模型推理流程解析 02-23
vLLM
LLM
推理引擎 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT新方法根除漏洞并提升大语言模型安全性与性能 02-23
MIT
LLM
模型安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-23
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro:针对复杂任务设计的智能模型 02-23
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
a16z深度对话:Anthropic与OpenAI的博弈、Noam Shazeer及AI创业趋势 02-23
a16z
Anthropic
OpenAI |
[自动]
[JUEJIN] | 1min | sticky_note_2
2025年AI回顾:DeepSeek R1破圈与模型落地应用元年 02-23
DeepSeek R1
AI Agent
模型落地 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌限制使用OpenClaw的AI Pro/Ultra订阅用户 02-23
Google
OpenClaw
AI订阅 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
合成人设技术突破数据瓶颈,加速日本AI开发 02-23
合成数据
数据瓶颈
日本AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-23
数学推理
First Proof
专家级问题 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Taalas HC1 定制芯片实现 Llama 3.1 每秒 16960 tok 02-23
Taalas HC1
定制芯片
ASIC |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT研究:主流AI模型对低学历及非美用户提供信息准确度较低 02-23
MIT
LLM
偏见 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT新方法揭示大模型隐藏偏差并提升安全性 02-23
MIT
LLM
模型安全 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GGML与llama.cpp加入HF,推动本地AI长期发展 02-23
GGML
llama.cpp
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro:面向复杂任务的深度解答模型 02-23
Gemini
Google
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI Timeline:收录 171 个大语言模型发展时间线 02-23
LLM
时间线
Transformer |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌限制使用OpenClaw的AI Pro/Ultra订阅用户 02-23
Google
OpenClaw
账号封禁 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍 02-23
Gemini 3.1 Pro
Google
ARC-AGI |
[自动]
[ARXIV] | 3min | school
面向扩散语言模型的感知剪枝方法 02-23
扩散模型
语言模型
模型剪枝 |
[自动]
[ARXIV] | 3min | school
语言模型处理差异论元标记时的类型学对齐差异 02-23
语言模型
类型学
区分性论元标记 |
[自动]
[ARXIV] | 3min | school
细粒度细节定向提升黑盒LVLM攻击能力 02-23
LVLM
黑盒攻击
对抗攻击 |
[自动]
[ARXIV] | 3min | school
多轮人机协作中用户需求的精准对齐方法 02-23
人机协作
多轮对话
决策质量 |
[自动]
[ARXIV] | 3min | school
基于Tokenizer的文本语言识别方法研究 02-23
UniLID
语言识别
Tokenizer |
[自动]
[ARXIV] | 3min | school
Mine and Refine:优化电商搜索检索的分级相关性 02-23
电商搜索
信息检索
双塔模型 |
[自动]
[ARXIV] | 4min | school
MARS:基于边界感知与自我优化的奖励建模 02-23
RLHF
奖励模型
MARS |
[自动]
[ARXIV] | 4min | school
FAMOSE:基于ReAct范式的自动化特征发现方法 02-23
特征工程
ReAct
自动化特征发现 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
麻省理工学院新方法根除漏洞提升大模型安全性与性能 02-22
MIT
LLM
模型安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究:主流AI聊天机器人向弱势用户提供的信息准确度较低 02-22
AI偏见
信息准确性
弱势群体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-22
AI模型
First Proof
数学挑战 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Taalas HC1 芯片实测:Llama 3.1 8B 跑出 16960 tok/s 02-22
Taalas
HC1
ASIC |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍 02-22
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro:面向复杂任务设计的智能模型 02-22
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
a16z对话Anthropic与OpenAI:风险投资与增长策略的艰难教训 02-22
a16z
OpenAI
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用合成人设突破数据瓶颈,加速日本AI开发 02-22
合成数据
人设生成
数据增强 |
[自动]
[ARXIV] | 4min | school
面向扩散语言模型的感知汇点剪枝方法 02-22
扩散模型
DLM
模型剪枝 |
[自动]
[ARXIV] | 3min | school
语言模型处理差异论元标记的类型对齐差异 02-22
语言模型
GPT-2
计算语言学 |
[自动]
[ARXIV] | 3min | school
多轮人机协作框架支持用户自定义需求 02-22
人机协作
多轮对话
决策质量 |
[自动]
[ARXIV] | 4min | school
基于分词器的未知语言识别方法 02-22
UniLID
语言识别
分词器 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Taalas 如何将大语言模型直接打印至芯片 02-22
Taalas
LLM
芯片 |
[自动]
[ARXIV] | 4min | school
MARS:基于边距感知奖励建模与自我精炼 02-22
MARS
RLHF
Reward Model |
[自动]
[ARXIV] | 3min | school
FAMOSE:基于 ReAct 框架的自动化特征发现方法 02-22
特征工程
自动化特征发现
ReAct |
[自动]
[HACKER_NEWS] | 1min | newspaper
Taalas 如何将大语言模型“打印”至芯片 02-22
Taalas
芯片
ASIC |
[自动]
[HACKER_NEWS] | 1min | newspaper
Taalas如何将大语言模型“打印”至芯片 02-22
Taalas
LLM
ASIC |
[自动]
[HACKER_NEWS] | 1min | newspaper
Claws 现已成为 LLM 智能体的新架构层 02-22
LLM
智能体
Agent |
[自动]
[HACKER_NEWS] | 1min | newspaper
Taalas技术解析:如何将大语言模型直接印制于芯片 02-22
Taalas
模型固化
ASIC |
[自动]
[HACKER_NEWS] | 1min | newspaper
Claws 成为 LLM 智能体顶层新抽象层 02-22
LLM
智能体
抽象层 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Taalas技术解析:如何将大模型直接打印至芯片 02-22
Taalas
芯片
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM智能体新增Claws层以增强工具调用能力 02-22
LLM
智能体
工具调用 |
[自动]
[JUEJIN] | 2min | sticky_note_2
Gemini 2.5 Pro实测:同API对比三款大模型找Bug能力 02-22
Gemini
Claude
GPT |
[自动]
[HACKER_NEWS] | 1min | newspaper
Claws 成为 LLM 智能体之上的新架构层 02-22
LLM
智能体
架构 |
[自动]
[HACKER_NEWS] | 1min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
时间序列
前向传播 |
[自动]
[HACKER_NEWS] | 3min | newspaper
人类信任根:面向智能体问责的公共领域框架 02-22
智能体
问责制
信任根 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Taalas 如何将大语言模型直接打印至芯片 02-22
Taalas
LLM
ASIC |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM智能体新增Claws层以增强能力 02-22
LLM
智能体
Claws |
[自动]
[HACKER_NEWS] | 1min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
前向传播
时间序列 |
[自动]
[HACKER_NEWS] | 2min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
时间序列
神经网络 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM智能体新增Claws层以增强功能 02-22
LLM
智能体
Claws |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM智能体新增Claws层以优化任务执行 02-22
LLM
智能体
Claws |
[自动]
[ARXIV] | 4min | school
面向扩散语言模型的Sink感知剪枝方法 02-21
扩散模型
语言模型
模型剪枝 |
[自动]
[ARXIV] | 2min | school
语言模型处理差价论元标记的类型学对齐差异 02-21
语言模型
计算语言学
类型学 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示主流AI模型向弱势用户提供的信息准确性较低 02-21
偏见
幻觉
数字鸿沟 |
[自动]
[ARXIV] | 3min | school
多轮人机协作框架支持用户自定义需求 02-21
人机协作
LLM
决策质量 |
[自动]
[ARXIV] | 3min | school
基于分词器的语言识别模型研究 02-21
UniLID
语言识别
分词器 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
合成人设技术突破数据瓶颈,加速日本AI开发 02-21
合成数据
数据增强
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Taalas HC1 自研芯片运行 Llama 3.1 8B 达 16960 tok/s 02-21
Taalas
HC1
ASIC |
[自动]
[ARXIV] | 4min | school
MMARS:基于边际感知与自我精炼的奖励建模 02-21
RLHF
奖励建模
数据增强 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT新方法根除漏洞并提升LLM安全性与性能 02-21
MIT
LLM
模型安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro:面向复杂任务设计的智能模型 02-21
Gemini
Google
LLM |
[自动]
[ARXIV] | 4min | school
FAMOSE:基于 ReAct 范式的自动化特征发现方法 02-21
特征工程
ReAct
自动化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI模型针对First Proof数学挑战的证明尝试与推理能力测试 02-21
LLM
数学推理
First Proof |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM智能体新增Claws层:强化外部工具调用与任务执行能力 02-21
LLM
智能体
Claws |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-21
Gemini
Google
ARC-AGI |
[自动]
[GITHUB_TRENDING] | 1min | hub
ChatGPT中文调教指南:多场景提示词与使用技巧 02-21
ChatGPT
提示词工程
Prompt |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ggml.ai加入Hugging Face推动本地AI长期发展 02-21
GGML
Hugging Face
本地AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
打造AI助手的公司如今都转型成了广告公司 02-21
AI助手
商业模式
广告变现 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Lean 4 定理证明器工作原理及其在 AI 领域的竞争优势 02-21
Lean 4
定理证明器
形式化验证 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ggml.ai加入Hugging Face以推动本地AI长期发展 02-21
GGML
Hugging Face
本地AI |
[自动]
[HACKER_NEWS] | 2min | newspaper
Ggml.ai 加入 Hugging Face 以推动本地 AI 长期发展 02-21
GGML
Hugging Face
本地 AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
大语言模型推理失败机制分析 02-21
LLM
推理
逻辑错误 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展 02-21
Hugging Face
GGML
本地AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
Lean 4 定理证明器原理与AI竞争新优势 02-21
Lean 4
定理证明器
形式化验证 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Cord:协调多层级 AI 智能体树状协作框架 02-21
AI Agents
多智能体
协作框架 |
[自动]
[HACKER_NEWS] | 1min | newspaper
打造AI助手的公司正转型为广告公司 02-21
AI助手
广告模式
商业化 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Lean 4 定理证明器工作原理及其在 AI 领域的新竞争优势 02-21
Lean 4
定理证明器
形式化验证 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Cord:AI 智能体树状协作框架 02-21
AI 智能体
协作框架
树状结构 |
[自动]
[HACKER_NEWS] | 1min | newspaper
通往普及AI之路:实现每秒1.7万Token推理 02-21
推理加速
Token生成
AI普及 |
[自动]
[HACKER_NEWS] | 1min | newspaper
打造AI助手的公司正转型为广告公司 02-21
AI助手
商业化
广告模式 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Lean 4 定理证明器工作原理及其在 AI 领域的竞争优势 02-21
Lean 4
定理证明器
形式化验证 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Cord:协调多智能体树状协作框架 02-21
多智能体
协作框架
Cord |
[自动]
[HACKER_NEWS] | 1min | newspaper
通往普及AI之路:实现每秒1.7万tokens推理 02-21
推理加速
Token生成
性能优化 |
[自动]
[JUEJIN] | 2min | sticky_note_2
Open-AutoGLM:基于视觉语言模型的手机端智能助理框架 02-21
Phone Agent
AutoGLM
VLM |
[自动]
[HACKER_NEWS] | 3min | newspaper
Cord:协调多层级 AI 智能体树的框架 02-21
AI Agents
Multi-Agent
Cord |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI Agent SOUL.md 人格文件编写指南与核心模块解析 02-21
AI Agent
SOUL.md
Prompt工程 |
[自动]
[JUEJIN] | 1min | sticky_note_2
谷歌AI购物助手技术架构与商业化路径解析 02-21
谷歌
AI购物助手
Gemini |
[自动]
[HACKER_NEWS] | 1min | newspaper
Cord:协调多层级 AI 智能体树状结构 02-21
AI Agent
多智能体
智能体编排 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
麻省理工学院新方法提升大语言模型安全性与性能 02-21
MIT
LLM
可解释性 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
谷歌Gemini 3.1 Pro发布:ARC-AGI 2测试性能达3.0两倍 02-21
Gemini 3.1 Pro
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示主流AI模型向弱势用户提供信息准确度较低 02-21
AI偏见
公平性
准确性 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
合成人设技术突破数据瓶颈,加速日本AI开发 02-21
合成数据
数据增强
Persona |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-21
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-21
Unsloth
Hugging Face
模型训练 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 承诺 750 万美元资助独立 AI 对齐研究 02-21
OpenAI
AI对齐
AGI安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
通向无处不在的AI之路:实现每秒1.7万tokens推理 02-21
推理加速
Token生成
AI部署 |
[自动]
[HACKER_NEWS] | 2min | newspaper
Ggml.ai加入Hugging Face推动本地AI长期发展 02-21
GGML
Hugging Face
本地AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro:面向复杂任务的高性能模型 02-21
Gemini
Google
LLM |
[自动]
[ARXIV] | 3min | school
面向扩散语言模型的Sink感知剪枝方法 02-20
扩散模型
语言模型
模型剪枝 |
[自动]
[ARXIV] | 3min | school
通过细粒度细节定向提升黑盒LVLM攻击能力 02-20
对抗攻击
LVLM
黑盒攻击 |
[自动]
[HACKER_NEWS] | 1min | newspaper
迈向通用AI:17k tokens/sec的推理性能路径 02-20
推理性能
Token生成
通用AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
谷歌Gemini 3.1 Pro发布:ARC-AGI 2性能达3.0两倍 02-20
Gemini
Google
ARC-AGI |
[自动]
[ARXIV] | 3min | school
语言模型对差异论元标记处理的类型学对齐差异 02-20
语言模型
GPT-2
计算语言学 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究:AI聊天机器人向弱势用户提供的信息准确度较低 02-20
偏见
公平性
准确性 |
[自动]
[HACKER_NEWS] | 1min | newspaper
打造AI助手的科技公司正转型为广告公司 02-20
AI助手
广告模式
商业化 |
[自动]
[ARXIV] | 3min | school
基于用户指定需求的多轮人机协作框架 02-20
人机协作
多轮对话
决策质量 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
合成人设技术突破数据瓶颈,加速日本AI开发 02-20
合成数据
数据瓶颈
日本AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用Unsloth和Hugging Face Jobs免费训练AI模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 投入 750 万美元资助独立 AI 对齐研究 02-20
OpenAI
AI对齐
AGI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT新方法根除漏洞并提升大语言模型安全性与性能 02-20
MIT
LLM
模型安全 |
[自动]
[ARXIV] | 4min | school
MARS:基于边际感知与自我精炼的奖励建模 02-20
MARS
RLHF
奖励模型 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
GGML与llama.cpp加入HF以保障本地AI长期发展 02-20
GGML
llama.cpp
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro:专用于处理复杂任务的智能模型 02-20
Gemini
Google
LLM |
[自动]
[ARXIV] | 4min | school
FAMOSE:基于 ReAct 范式的自动化特征发现方法 02-20
FAMOSE
特征工程
自动化特征发现 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 发布自主智能体 METR 基准测试数据 02-20
Anthropic
智能体
Agent |
[自动]
[JUEJIN] | 3min | sticky_note_2
Agent 开发实战:赋予大模型工具调用能力 02-20
Agent
LLM
Tool Use |
[自动]
[BLOGS_PODCASTS] | 2min | mic
麻省理工学院新方法根除漏洞并提升大模型安全性与性能 02-20
MIT
LLM
模型安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示主流AI模型向弱势用户提供的信息准确度较低 02-20
AI偏见
模型评估
用户体验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
合成人设技术突破数据瓶颈,加速日本AI开发 02-20
合成数据
数据增强
日本AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用Unsloth与Hugging Face Jobs免费训练AI模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 投入 750 万美元资助独立 AI 对齐研究 02-20
OpenAI
AI对齐
AGI安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ggml.ai加入Hugging Face以推动本地AI长期发展 02-20
GGML
Hugging Face
本地AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro发布:ARC-AGI 2性能达3.0两倍 02-20
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro:面向复杂任务设计的智能模型 02-20
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 公布 Agent 自主性研究及 METR 基准数据 02-20
Anthropic
Agent
自主性 |
[自动]
[HACKER_NEWS] | 1min | newspaper
通往泛在AI之路:实现每秒1.7万tokens推理 02-20
推理加速
Token生成
泛在AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示主流AI模型对弱势群体提供信息准确度较低 02-20
AI偏见
公平性
包容性 |
[自动]
[HACKER_NEWS] | 1min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT新方法根除漏洞并提升大语言模型安全性与性能 02-20
LLM
MIT
模型安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ggml.ai 加入 Hugging Face 推动本地 AI 长期发展 02-20
GGML
Hugging Face
本地AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic发布自主Agent研究:基于METR数据评估模型自主能力 02-20
Anthropic
自主Agent
METR |
[自动]
[BLOGS_PODCASTS] | 2min | mic
合成人设技术突破数据瓶颈,加速日本AI开发 02-20
合成数据
数据瓶颈
日本AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 投入750万美元资助独立AI对齐研究 02-20
OpenAI
AI对齐
AGI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro:针对复杂任务设计的智能模型 02-20
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 发布自主智能体 METR 基准测试数据 02-20
Anthropic
METR
自主智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
麻省理工学院新方法根除漏洞并提升大语言模型安全性 02-20
MIT
LLM
模型安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Gemini 2.5 Pro:支持 100 万上下文窗口 02-20
Gemini
Google
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于注意力匹配机制实现快速KV压缩 02-20
KV压缩
注意力机制
推理优化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[HACKER_NEWS] | 1min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT研究:主流AI模型向低教育及非美用户提供信息准确性更低 02-20
MIT研究
AI偏见
数字鸿沟 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-20
Gemini 3.1 Pro
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic与OpenAI的创业教训:a16z对话AI投资逻辑 02-20
a16z
投资逻辑
Anthropic |
[自动]
[HACKER_NEWS] | 1min | newspaper
通往普及AI之路:实现每秒1.7万tokens推理 02-20
推理加速
高性能计算
Token吞吐 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Gemini 3.1 Pro 模型 02-20
Gemini
Google
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用注意力匹配加速 KV 键值对压缩 02-20
KV压缩
注意力机制
推理加速 |
[自动]
[HACKER_NEWS] | 3min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[GITHUB_TRENDING] | 2min | hub
ChatGPT中文调教指南:涵盖多场景使用与提示词优化 02-20
ChatGPT
提示词
Prompt |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用注意力匹配加速 KV 缓存压缩 02-20
KV Cache
注意力机制
模型推理 |
[自动]
[JUEJIN] | 1min | sticky_note_2
2026年2月19日AI热点:OpenAI加码医疗,OpenEvidence估值120亿美元 02-20
AI热点
医疗AI
OpenAI |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Gemini 3.1 Pro 模型 02-20
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究:主流AI聊天机器人向弱势用户提供的信息准确度较低 02-20
偏见
公平性
准确性 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
合成人设技术突破数据瓶颈,加速日本AI开发 02-20
合成数据
数据增强
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练大模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[HACKER_NEWS] | 1min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 投 750 万美元资助独立 AI 对齐研究 02-20
OpenAI
AI对齐
AGI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT新方法根除漏洞并提升大语言模型安全性与性能 02-20
MIT
LLM
模型安全 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic发布基于METR数据的Agent自主性研究 02-20
Anthropic
Agent
自主性 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
a16z深度对话:Anthropic与OpenAI的博弈、Noam Shazeer及AI投资逻辑 02-20
a16z
Anthropic
OpenAI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro:专为复杂任务设计的智能模型 02-20
Gemini
Google
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
谷歌发布 Gemini 2.5 Pro:上下文窗口达 100 万 tokens 02-20
Gemini
Google
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
不要轻信盐值:AI摘要、多语言安全与大模型防护 02-20
LLM安全
AI摘要
多语言 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI智能体自主性评估的实践方法 02-20
AI Agent
自主性
评估体系 |
[自动]
[ARXIV] | 4min | school
面向安全智能体系统的策略编译器 02-20
智能体
LLM
策略编译器 |
[自动]
[ARXIV] | 3min | school
评估LLM辅助对生物学新手表现的影响 02-20
LLM
生物学
随机对照试验 |
[自动]
[ARXIV] | 4min | school
强化快速权重结合下一序列预测模型 02-20
REFINE
强化学习
快速权重 |
[自动]
[ARXIV] | 3min | school
因果性是可解释性泛化的关键 02-20
可解释性
因果推断
泛化性 |
[自动]
[ARXIV] | 2min | school
以对象为中心的表征是否更利于组合泛化 02-20
组合泛化
对象中心
视觉表征 |
[自动]
[HACKER_NEWS] | 1min | newspaper
不要盲目信任盐值:AI摘要、多语言安全与大模型护栏 02-20
LLM
安全护栏
AI摘要 |
[自动]
[ARXIV] | 3min | school
Calibrate-Then-Act:面向大模型智能体的成本感知探索 02-20
LLM Agents
成本感知
CTA框架 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI智能体自主性水平的实践评估方法 02-20
AI Agent
自主性
评估方法 |
[自动]
[ARXIV] | 4min | school
面向安全智能体系统的策略编译器 02-19
Agentic Systems
Policy Compiler
LLM Security |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Gemini 3.1 Pro 模型 02-19
Gemini
Google
LLM |
[自动]
[ARXIV] | 3min | school
评估2025年中期LLM辅助对生物学初学者表现的影响 02-19
LLM
生物安全
AI评估 |
[自动]
[ARXIV] | 4min | school
强化快速权重与下一序列预测 02-19
REFINE
快速权重
强化学习 |
[自动]
[ARXIV] | 2min | school
因果性是可解释性泛化的关键 02-19
因果推断
可解释性
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
合成人设技术突破数据瓶颈,加速日本AI开发 02-19
合成数据
数据瓶颈
日本AI |
[自动]
[ARXIV] | 3min | school
以对象为中心的表征在组合泛化任务中的表现评估 02-19
组合泛化
以对象为中心
视觉问答 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 投 750 万美元资助独立 AI 对齐研究 02-19
OpenAI
AI对齐
AGI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT新方法根除漏洞并提升大语言模型安全性与性能 02-19
MIT
LLM
模型安全 |
[自动]
[GITHUB_TRENDING] | 2min | hub
ChatGPT中文调教指南:多场景提示词与使用技巧 02-19
ChatGPT
提示词
Prompt |
[自动]
[ARXIV] | 4min | school
Calibrate-Then-Act:大模型智能体的成本感知探索 02-19
LLM Agents
成本感知
探索策略 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic发布Agent自主性研究及METR数据 02-19
Anthropic
Agent
自主性 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI智能体自主性评估的实践方法 02-19
AI Agent
自主性
评估方法 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Gemini 3.1 Pro 预览版 02-19
Gemini
Google
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Gemini 3.1 Pro 模型 02-19
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
使用 Unsloth 和 Hugging Face 免费训练 AI 模型 02-19
Unsloth
Hugging Face
模型微调 |
[自动]
[HACKER_NEWS] | 1min | newspaper
不要盲目信任盐值:AI摘要、多语言安全与大模型防护机制 02-19
LLM
AI安全
防护机制 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro:专为复杂任务设计的智能模型 02-19
Gemini
Google
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI智能体自主性的实践测量方法 02-19
AI Agent
自主性
评估指标 |
[自动]
[HACKER_NEWS] | 1min | newspaper
面向分析师的Python大语言模型实战指南 02-19
Python
LLM
数据分析 |
[自动]
[HACKER_NEWS] | 7min | newspaper
谷歌发布 Gemini 3.1 Pro 预览版 02-19
Google
Gemini
Gemini 3.1 Pro |
[自动]
[BLOGS_PODCASTS] | 2min | mic
理性人无目标论:AI对齐应基于实践协调而非终极目的 02-19
AI对齐
正交性论题
美德伦理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊构建代理式AI系统的评估框架与实战经验 02-19
AI Agent
评估框架
Amazon Bedrock |
[自动]
[HACKER_NEWS] | 1min | newspaper
不要盲目信任Salt:AI摘要、多语言安全与LLM护栏 02-19
LLM
AI安全
护栏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI出资750万美元资助独立AI对齐研究 02-19
OpenAI
AI对齐
AGI安全 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 公布 METR 数据评估 Agent 自主能力 02-19
Anthropic
METR
Agent |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI智能体自主性的实践评估方法 02-19
AI Agent
自主性
评估方法 |
[自动]
[HACKER_NEWS] | 1min | newspaper
面向分析师的Python大语言模型实战指南 02-19
Python
LLM
数据分析 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Gemini 3.1 模型 02-19
Google
Gemini
模型发布 |
[自动]
[HACKER_NEWS] | 3min | newspaper
警惕AI总结幻觉:多语言安全与大模型护栏机制 02-19
LLM
幻觉
护栏机制 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
合成人设技术突破数据瓶颈,加速日本AI开发 02-19
合成数据
数据瓶颈
日本AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
亚马逊AI智能体评估框架:通用工作流与Bedrock指标库 02-19
AI智能体
评估框架
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro:面向复杂任务的深度回答模型 02-19
Gemini
Google
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 发布 METR 数据集研究 AI Agent 自主性 02-19
Anthropic
METR
AI Agent |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI智能体自主性评估的实践方法与指标 02-19
AI Agent
自主性
评估指标 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
长期对话语境下LLM个性化特征与回音室效应分析 02-19
LLM
个性化
回音室效应 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
亚马逊智能体系统评估框架:通用工作流与评估库 02-19
AI Agent
评估框架
Amazon Bedrock |
[自动]
[HACKER_NEWS] | 1min | newspaper
不要轻信盐值:AI摘要、多语言安全与大模型防护机制 02-19
LLM
AI安全
提示词注入 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Step 3.5 Flash 开源基础模型:支持高速深度推理 02-19
Step 3.5 Flash
开源模型
深度推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IBM与UC Berkeley发布IT-Bench及MAST:诊断企业Agent失败原因 02-19
Agent
IT-Bench
MAST |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini应用集成Lyria 3模型,支持文本或图像生成30秒音轨 02-19
Gemini
Lyria 3
音乐生成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Claude Sonnet 4.6 发布:综合性能升级与部分局限 02-19
Claude
Sonnet 4.6
Anthropic |
[自动]
[JUEJIN] | 1min | sticky_note_2
2026年2月19日AI热点:OpenAI加码医疗,OpenEvidence估值120亿美元 02-19
AI热点
医疗AI
OpenAI |
[自动]
[HACKER_NEWS] | 1min | newspaper
警惕AI总结幻觉:多语言安全与大模型防护机制 02-19
LLM
幻觉
安全防护 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Step 3.5 Flash 开源:支持高速深度推理 02-19
Step 3.5 Flash
深度推理
开源模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic发布Agent自主性研究及METR数据 02-19
Anthropic
Agent
自主性 |
[自动]
[JUEJIN] | 1min | sticky_note_2
2026年2月19日AI热点:OpenAI加码医疗大模型,OpenEvidence估值120亿美元 02-19
医疗AI
OpenAI
行业格局 |
[自动]
[HACKER_NEWS] | 1min | newspaper
开源模型 Step 3.5 Flash:支持高速深度推理 02-19
Step 3.5 Flash
开源模型
深度推理 |
[自动]
[GITHUB_TRENDING] | 2min | hub
ChatGPT 中文调教指南:场景化提示词与指令优化 02-19
ChatGPT
提示词
Prompt |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型AI编程实测:Opus 4.6与K2.5等模型排序对比 02-19
AI编程
模型测评
Claude |
[自动]
[HACKER_NEWS] | 1min | newspaper
Step 3.5 Flash:速度足以思考,可靠性足以行动 02-19
Google
Gemini
Flash |
[自动]
[BLOGS_PODCASTS] | 2min | mic
美德伦理在AI对齐中的有效性 02-19
AI对齐
美德伦理
AI安全 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊构建AI代理评估框架:通用工作流与Bedrock评估库 02-19
AI Agents
评估框架
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 2min | mic
个性化功能可能导致大语言模型迎合用户观点形成回声室 02-19
LLM
个性化
回声室 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Step 3.5 Flash:快速思考与可靠执行 02-19
Step 3.5 Flash
推理模型
快速响应 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA发布Nemotron 2 Nano 9B日语模型:支持日本主权AI的小规模语言模型 02-19
NVIDIA
Nemotron
日语模型 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
IBM与加州大学伯克利分校发布IT-Bench与MAST诊断企业智能体失败原因 02-19
IBM
UC Berkeley
IT-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Google 2026 AI峰会:宣布合作伙伴关系与投资 02-19
Google
AI峰会
战略合作 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini应用集成Lyria 3模型,支持图文生成30秒音乐 02-19
Gemini
Lyria 3
音乐生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
长期对话语境下LLM观点映射与回声室效应 02-19
LLM
个性化
回声室效应 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
亚马逊代理式AI系统评估框架:通用工作流与评估库详解 02-19
AI Agent
评估框架
Amazon Bedrock |
[自动]
[HACKER_NEWS] | 1min | newspaper
Step 3.5 Flash:快到能思考,稳到可执行 02-19
Step 3.5 Flash
LLM
推理模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Nemotron 2 Nano 9B 日语模型:支持日本主权AI的小规模语言模型 02-19
NVIDIA
Nemotron
日语模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IBM与UC伯克利利用IT-Bench和MAST诊断企业智能体失败原因 02-19
IBM
UC Berkeley
IT-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini接入Lyria 3模型支持文字图像生成30秒音乐 02-19
Gemini
Lyria 3
音乐生成 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
2026年负责任人工智能进展报告 02-19
负责任AI
AI安全
伦理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
长期对话导致LLM迎合用户观点形成回声室 02-19
LLM
个性化
回声室 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
英伟达发布 Nemotron 2 Nano 9B 日语模型 02-19
NVIDIA
Nemotron
日语模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
写作的演变:认知债务、Claude Code与AI的边界 02-19
Claude Code
认知债务
AI写作 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊发布AI Agent评估框架:通用工作流与Bedrock评估库 02-19
AI Agent
评估框架
Amazon Bedrock |
[自动]
[JUEJIN] | 3min | sticky_note_2
Spring AI 多模态实战:构建图像理解应用 02-19
Spring AI
多模态
图像理解 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Qwen3.5-397B-A17B:最小Open-Opus级高效模型 02-19
Qwen3.5
Qwen
MoE |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IBM联合UC Berkeley发布IT-Bench与MAST:诊断企业智能体失败原因 02-19
IBM
UC Berkeley
IT-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini应用集成Lyria 3模型,支持文生30秒音乐 02-19
Gemini
Lyria 3
音乐生成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
DeepMind在印度推国家AI伙伴关系,加速科学与教育应用 02-19
DeepMind
Google
AI for Science |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Claude Sonnet 4.6 发布:基于 4.5 的升级与局限 02-19
Claude
Anthropic
Sonnet 4.6 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年度负责任人工智能进展报告 02-19
负责任AI
AI安全
伦理 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
长期对话导致大语言模型镜像用户观点并形成回声室 02-19
LLM
个性化
回声室 |
[自动]
[ARXIV] | 3min | school
通过任务复杂度量化验证浅层对齐假说 02-19
浅层对齐假说
SAH
任务复杂度 |
[自动]
[ARXIV] | 3min | school
用模拟数据开发AI智能体的原理与方法 02-19
AI智能体
合成数据
数据模拟 |
[自动]
[ARXIV] | 3min | school
基于D最优统计的高维仿真代理测试时适应稳定化方法 02-19
测试时适应
TTA
仿真代理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊发布代理式AI评估框架:标准化工作流与专用指标库 02-19
AI Agent
评估框架
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Qwen3.5-397B-A17B:最小Open-Opus级高效模型 02-19
Qwen3.5
MoE
稀疏模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Nemotron 2 Nano 9B 日语模型:支持日本主权AI的小规模语言模型 02-19
NVIDIA
Nemotron
日语模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 上下文长度外推技术综述 02-19
LLM
上下文窗口
外推 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IBM与UC Berkeley发布IT-Bench及MAST诊断企业智能体失败原因 02-19
IBM
UC Berkeley
IT-Bench |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Google DeepMind 在印度扩展AI科学与教育应用 02-19
Google DeepMind
AI 科学
教育应用 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini应用接入Lyria 3模型,支持图文生成30秒乐曲 02-19
Gemini
Lyria 3
音乐生成 |
[自动]
[ARXIV] | 3min | school
Dex4D:任务无关点跟踪策略实现灵巧操作Sim-to-Real 02-19
灵巧操作
Sim-to-Real
机器人 |
[自动]
[ARXIV] | 4min | school
CrispEdit:低曲率投影实现可扩展的大模型无损编辑 02-19
LLM编辑
模型编辑
CrispEdit |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Claude Sonnet 4.6 发布:基于 4.5 的升级与实测表现 02-19
Claude
Anthropic
Sonnet 4.6 |
[自动]
[ARXIV] | 3min | school
Avey-B:基于视觉基础模型的通用具身智能代理 02-19
Avey-B
NLP
Transformer |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年度负责任人工智能进展报告 02-19
负责任AI
Responsible AI
AI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
长期对话导致大模型模仿用户观点并降低准确性 02-18
LLM
个性化
长期对话 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
构建Amazon智能体评估框架:通用工作流与Bedrock指标库 02-18
AI Agent
评估框架
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Qwen3.5-397B-A17B:最小的高效Open-Opus级模型 02-18
Qwen3.5
模型压缩
性能优化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Nemotron 2 Nano 9B 日语模型:支持日本主权AI的小规模语言模型 02-18
NVIDIA
Nemotron
日语模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM上下文学习机制与性能优化指南 02-18
LLM
上下文学习
ICL |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IBM与UC Berkeley发布IT-Bench及MAST诊断企业智能体失败原因 02-18
IBM
UC Berkeley
IT-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini接入Lyria 3模型,支持图文生成30秒音乐 02-18
Gemini
Lyria 3
音乐生成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
DeepMind在印度启动国家AI伙伴关系推动科学与教育 02-18
DeepMind
AI for Science
Google |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Claude Sonnet 4.6发布:基于4.5的升级与部分局限 02-18
Claude
Sonnet 4.6
Anthropic |
[自动]
[GITHUB_TRENDING] | 10min | hub
ChatGPT中文调教指南:涵盖各类场景的提示词库 02-18
ChatGPT
提示词
Prompt |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年负责任人工智能进展报告 02-18
负责任AI
AI伦理
AI安全 |
[自动]
[ARXIV] | 4min | school
基于模拟数据开发AI智能体的原理与方法 02-18
AI智能体
合成数据
模拟技术 |
[自动]
[ARXIV] | 3min | school
基于任务复杂度的浅层对齐假说操作化研究 02-18
浅层对齐
SAH
任务复杂度 |
[自动]
[ARXIV] | 4min | school
CrispEdit:低曲率投影实现可扩展的大模型无损编辑 02-18
模型编辑
CrispEdit
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
长期对话导致LLM镜像用户观点并形成回声室 02-18
LLM
个性化
回声室 |
[自动]
[HACKER_NEWS] | 4min | newspaper
李飞飞World Labs获10亿美元融资:英伟达与A16Z领投,加速世界模型研发 02-18
李飞飞
World Labs
融资 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Qwen3.5-397B-A17B:最小Open-Opus级高效模型 02-18
Qwen3.5
通义千问
Open-Opus |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI 应该构建 Slack 的原因分析 02-18
OpenAI
Slack
企业协作 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Nemotron 2 Nano 9B 日语模型:支持日本主权AI的小规模语言模型 02-18
NVIDIA
Nemotron
日语模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM 数据集构建与模型训练优化指南 02-18
LLM
数据集构建
模型训练 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IBM与UC Berkeley利用IT-Bench和MAST诊断企业智能体失败原因 02-18
IBM
UC Berkeley
IT-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出新胶子振幅公式并获合作者验证 02-18
GPT-5.2
OpenAI
理论物理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini应用集成Lyria 3模型,支持文图生成30秒音乐 02-18
Gemini
Lyria 3
音乐生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
DeepMind 在印度启动 AI 伙伴关系以加速科学与教育发展 02-18
DeepMind
AI教育
科学发现 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Claude Sonnet 4.6 发布:基于 4.5 的升级与部分限制 02-18
Claude
Sonnet 4.6
Anthropic |
[自动]
[BLOGS_PODCASTS] | 3min | mic
ChatGPT 推出锁定模式与高风险标签以防御提示注入 02-18
ChatGPT
提示注入
锁定模式 |
[自动]
[ARXIV] | 5min | school
Avey-B:基于注意力机制的高效视觉Transformer模型 02-18
Avey-B
Transformer
NLP |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年度负责任人工智能进展报告 02-18
负责任AI
ResponsibleAI
年度报告 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Claude Sonnet 4.6发布:兼顾性能与成本效率 02-18
Claude
Anthropic
模型发布 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
长期对话导致大语言模型镜像用户观点形成回声室 02-18
LLM
个性化
回声室 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Qwen3.5-397B-A17B:最小Open-Opus级高效模型 02-18
Qwen3.5
Qwen
MoE |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 应该打造 Slack:Sam Altman 的下一步产品方向 02-18
OpenAI
Sam Altman
Slack |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Nemotron 2 Nano 9B 日语模型:支持主权AI的小规模语言模型 02-18
NVIDIA
Nemotron
日语模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM 模型应关注的数据处理与优化策略 02-18
LLM
数据处理
模型优化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2推导胶子振幅新公式并获验证 02-18
GPT-5.2
理论物理
胶子振幅 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think发布;Anthropic估值380B;GPT-5.3-Codex Spa 02-18
Gemini
Anthropic
GPT-5.3 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
DeepMind在印度推动AI科学与教育规模化发展 02-18
DeepMind
AI教育
科学发现 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Claude Sonnet 4.6 发布:基于 4.5 的升级与部分局限 02-18
Claude
Anthropic
Sonnet 4.6 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Claude Sonnet 4.6 发布:兼顾长上下文与高性价比 02-18
Claude
Sonnet 4.6
长上下文 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年负责任AI进展报告 02-18
负责任AI
AI治理
AI伦理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Google 在 AI Impact Summit 2026 宣布合作与投资 02-18
Google
AI Impact Summit
战略合作 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Claude Sonnet 4.6发布:兼顾高性能与长文本 02-18
Claude
Sonnet 4.6
Anthropic |
[自动]
[BLOGS_PODCASTS] | 4min | mic
ChatGPT 推出锁定模式与高风险标签以防御提示注入 02-18
ChatGPT
OpenAI
提示注入 |
[自动]
[JUEJIN] | 2min | sticky_note_2
SkillsBench 论文解读:跨任务基准测试如何揭示 Agent 技能的实际效用 02-18
Agent
LLM
SkillsBench |
[自动]
[HACKER_NEWS] | 5min | newspaper
Claude Sonnet 4.6发布:兼顾性能与成本,支持长文本 02-18
Claude
Sonnet 4.6
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
长期对话语境导致LLM迎合用户观点形成回声室 02-18
LLM
个性化
回声室 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
英伟达发布 Nemotron 2 Nano 9B 日语模型 02-18
NVIDIA
Nemotron
日语模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 应该收购 Slack 的商业逻辑分析 02-18
OpenAI
Slack
企业协作 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Jeff Dean:重写谷歌搜索栈与TPU共稀疏万亿参数模型 02-18
Jeff Dean
TPU
稀疏模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2推导新胶子振幅公式获正式证明 02-18
GPT-5.2
理论物理
科学发现 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex与Mi 02-18
Gemini
Anthropic
GPT-5.3 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Claude Sonnet 4.6 发布:基于 4.5 的升级与局限性分析 02-18
Claude
Sonnet 4.6
Anthropic |
[自动]
[HACKER_NEWS] | 5min | newspaper
Claude Sonnet 4.6 发布:兼具高智能与长上下文 02-18
Claude
Sonnet 4.6
Anthropic |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Amazon Bedrock AgentCore 浏览器新增代理、配置文件及扩展支持 02-18
Amazon Bedrock
AgentCore
AI Agent |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年负责任AI进展报告 02-18
负责任AI
Responsible AI
AI伦理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
长期对话导致LLM模仿用户观点并形成回声室 02-18
LLM
个性化
回声室 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Qwen3.5-397B-A17B:最小Open-Opus级高效模型 02-18
Qwen3.5
Qwen
MoE |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Nemotron 2 Nano 9B 日语模型:支持日本主权AI的小规模语言模型 02-18
NVIDIA
Nemotron
日语模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Jeff Dean:重写搜索架构、TPU 协同设计及稀疏万亿参数模型 02-18
Jeff Dean
Google
TPU |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2 提出胶子振幅新公式并获合作验证 02-18
GPT-5.2
理论物理
胶子振幅 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex与Mi 02-18
Gemini
Anthropic
GPT-5.3 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Codex与Claude赋能自定义内核生成 02-18
Codex
Claude
自定义内核 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ChatGPT推出锁定模式与高风险标签以抵御提示注入 02-18
ChatGPT
提示注入
锁定模式 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年度负责任人工智能进展报告 02-18
负责任AI
AI治理
合规 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Jeff Dean:重写搜索栈、复兴稀疏模型与TPU协同设计 02-18
Jeff Dean
TPU
稀疏模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:面向科学、研究与工程的推理模式更新 02-18
Gemini 3
Deep Think
推理模式 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Qwen3.5-397B-A17B:最小Open-Opus级高效模型 02-18
Qwen3.5
Qwen
MoE |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI为何应打造企业协作平台Slack 02-18
OpenAI
Slack
企业协作 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 2 Nano 9B 日语模型:支持日本主权AI的小规模语言模型 02-18
NVIDIA
Nemotron
日语模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出胶子振幅新公式并获学术验证 02-18
GPT-5.2
理论物理
胶子振幅 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex Sp 02-18
Gemini 3
Anthropic
GPT-5.3 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Claude Sonnet 4.6 发布:兼顾性能与成本效益 02-18
Claude
Anthropic
模型发布 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
2026年度负责任人工智能进展报告 02-18
负责任AI
AI安全
模型治理 |
[自动]
[ARXIV] | 3min | school
长上下文LLM缩放缺陷:隐私与个性化任务揭示注意力分散 02-18
长上下文
LLM
个性化 |
[自动]
[ARXIV] | 4min | school
超越掩码扩散语言模型的扩展性研究 02-18
扩散模型
语言模型
扩展定律 |
[自动]
[ARXIV] | 3min | school
语言统计对称性塑造模型表征的几何结构 02-18
表征几何
统计对称性
词嵌入 |
[自动]
[ARXIV] | 4min | school
离散扩散模型高效采样:锐利且自适应的理论保证 02-18
离散扩散模型
CTMC
采样效率 |
[自动]
[ARXIV] | 3min | school
深度研究AI代理用于医药资产全球筛选与评估 02-18
AI Agent
生物医药
资产筛选 |
[自动]
[JUEJIN] | 1min | sticky_note_2
提示工程悖论:为何与AI对话比想象中更难 02-18
提示工程
Prompt Engineering
认知偏差 |
[自动]
[ARXIV] | 3min | school
基于结构化世界模型先验的冷启动个性化方案 02-18
冷启动
个性化
世界模型 |
[自动]
[ARXIV] | 4min | school
基于正则化与对称性重审扩散模型及其分子图生成应用 02-18
扩散模型
分子图生成
对称性 |
[自动]
[ARXIV] | 2min | school
基于参数高效微调与往返翻译的文本风格迁移 02-18
文本风格迁移
参数高效微调
LLM |
[自动]
[ARXIV] | 3min | school
BPP:聚焦关键历史帧的长上下文机器人模仿学习 02-18
机器人
模仿学习
长上下文 |
[自动]
[ARXIV] | 3min | school
长上下文LLM隐私与个性化任务中的缩放差距研究 02-17
长上下文
隐私保护
个性化 |
[自动]
[ARXIV] | 3min | school
超越掩码扩散语言模型的扩展性研究 02-17
扩散模型
语言模型
扩展定律 |
[自动]
[ARXIV] | 3min | school
语言统计对称性塑造模型表征的几何结构 02-17
表征学习
几何结构
统计对称性 |
[自动]
[HACKER_NEWS] | 4min | newspaper
让大语言模型互斗万智牌的实验项目 02-17
LLM
Agent
游戏AI |
[自动]
[ARXIV] | 4min | school
离散扩散模型高效采样:具备锐利性与自适应保证 02-17
离散扩散模型
高效采样
tau-leaping |
[自动]
[ARXIV] | 4min | school
基于标准化的扩散模型对称性重思考与分子图生成 02-17
扩散模型
分子图生成
对称性 |
[自动]
[ARXIV] | 4min | school
基于参数高效微调与往返翻译的文本风格迁移 02-17
文本风格迁移
PEFT
LLM |
[自动]
[ARXIV] | 3min | school
全球深度调研AI代理:药物资产筛选与投资评估 02-17
AI Agent
生物医药
资产筛选 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Qwen3.5-397B-A17B:最小的高效Open-Opus级模型 02-17
Qwen3.5
Qwen
MoE |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发布GPT-5.3-Codex-Spark:首个实时编码模型,生成速度提升15倍 02-17
OpenAI
GPT-5.3
Codex |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI为何应该构建Slack:Sam Altman的下一步产品方向 02-17
OpenAI
Slack
Sam Altman |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Jeff Dean:重塑搜索、TPU与稀疏模型的AI技术栈 02-17
Jeff Dean
Google
TPU |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2提出胶子振幅新公式并获验证 02-17
GPT-5.2
OpenAI
理论物理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think发布;Anthropic估值达380亿美元;GPT-5.3最新动态 02-17
Gemini 3
Anthropic
OpenAI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think:推进科学与工程研究 02-17
Gemini 3
DeepMind
Deep Think |
[自动]
[HACKER_NEWS] | 5min | newspaper
Claude Sonnet 4.6 发布:兼顾高性能与长文本处理 02-17
Claude
Sonnet 4.6
Anthropic |
[自动]
[ARXIV] | 3min | school
BPP:聚焦关键历史帧的长上下文机器人模仿学习 02-17
机器人
模仿学习
长上下文 |
[自动]
[JUEJIN] | 2min | sticky_note_2
提示工程悖论:为何与AI对话比预期更难 02-17
提示工程
LLM
自然语言处理 |
[自动]
[JUEJIN] | 2min | sticky_note_2
Qwen3.5-397B-A17B:极致稀疏MoE架构与多模态能力详解 02-17
Qwen3.5
MoE
多模态 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:面向科研与工程的专用推理模式更新 02-17
Gemini 3
Deep Think
推理模式 |
[自动]
[HACKER_NEWS] | 4min | newspaper
语义消融实验:揭示AI写作为何平庸同质化 02-17
语义消融
AI写作
同质化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
让大语言模型互斗万智牌的实验项目 02-17
LLM
Agent
游戏AI |
[自动]
[HACKER_NEWS] | 4min | newspaper
为何AI写作平庸且危险:语义消融机制解析 02-17
AI写作
语义消融
内容质量 |
[自动]
[HACKER_NEWS] | 5min | newspaper
评估 AGENTS.md 文档对编程 AI 智能体的实际效用 02-17
AI Agents
AGENTS.md
编程助手 |
[自动]
[JUEJIN] | 3min | sticky_note_2
SkillsBench论文:评估Agent技能在多任务中的实际效用 02-17
Agent
LLM
SkillsBench |
[自动]
[HACKER_NEWS] | 7min | newspaper
评测 AGENTS.md:对编程 AI 智能体的实际效用分析 02-17
AI Agent
LLM
代码生成 |
[自动]
[HACKER_NEWS] | 4min | newspaper
评估 AGENTS.md 文档对编程 AI 智能体的实际效用 02-17
AI Agents
AGENTS.md
编程助手 |
[自动]
[HACKER_NEWS] | 7min | newspaper
SkillsBench:评估智能体技能在多样化任务中的表现基准 02-17
SkillsBench
智能体
Agent |
[自动]
[ARXIV] | 4min | school
过程监督多智能体强化学习提升临床推理可靠性 02-17
多智能体
强化学习
临床推理 |
[自动]
[ARXIV] | 4min | school
科学推理模型引入拒答机制以提升准确性 02-17
科学推理
拒答机制
NLI |
[自动]
[HACKER_NEWS] | 4min | newspaper
研究:自生成的智能体技能通常无效 02-17
AI Agent
智能体
LLM |
[自动]
[ARXIV] | 3min | school
恶意提示词分类器在真实分布偏移下的评估方法 02-17
LLM安全
提示词注入
越狱攻击 |
[自动]
[ARXIV] | 4min | school
延迟视觉摄入优化图文密集文档问答 02-17
多模态
文档问答
VLM |
[自动]
[ARXIV] | 5min | school
基于枢纽重采样的LLM强化学习深度密集探索 02-17
LLM
强化学习
RLHF |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai发布GLM-5开源模型,性能超越Opus 4.5 02-17
GLM-5
Z.ai
Opus 4.5 |
[自动]
[ARXIV] | 4min | school
UniWeTok:统一二进制分词器支持2^128码本规模 02-17
UniWeTok
多模态
Tokenizer |
[自动]
[HACKER_NEWS] | 6min | newspaper
Qwen3.5:迈向原生多模态智能体 02-17
Qwen3.5
多模态
智能体 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT-5.3-Codex-Spark:首款实时编程模型,生成提速15倍 02-17
OpenAI
GPT-5.3
Codex |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Jeff Dean:重塑搜索架构、复兴稀疏模型与设计TPU 02-17
Jeff Dean
Google
TPU |
[自动]
[ARXIV] | 4min | school
GPT-5与其他大模型长短上下文性能对比 02-17
GPT-5
LLM
长文本 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出新胶子振幅公式获学术验证 02-17
GPT-5.2
OpenAI
理论物理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think发布;Anthropic估值3800亿;GPT-5.3-Codex Sp 02-17
Gemini 3
Deep Think
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:升级推理模式以解决科研与工程挑战 02-17
Gemini 3
Deep Think
推理模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Codex与Claude支持定制化内核扩展 02-17
Codex
Claude
定制化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ChatGPT 推出锁定模式与高风险标签以防御提示注入 02-17
ChatGPT
提示注入
锁定模式 |
[自动]
[ARXIV] | 3min | school
语义分块与自然语言熵:优化文本切分策略 02-17
语义分块
自然语言熵
文本切分 |
[自动]
[HACKER_NEWS] | 4min | newspaper
研究:自生成的Agent技能实际无效 02-17
Agent
LLM
研究 |
[自动]
[ARXIV] | 5min | school
异步验证语义缓存优化分层大模型架构 02-17
语义缓存
LLM架构
异步验证 |
[自动]
[ARXIV] | 4min | school
基于大语言模型的端到端网络事件自主响应方法 02-17
LLM Agent
网络安全
事件响应 |
[自动]
[ARXIV] | 4min | school
基于仿真过滤的模块化策略从人类视频学习有效行为 02-17
机器人
模仿学习
仿真过滤 |
[自动]
[ARXIV] | 5min | school
CoPE-VideoLM:基于编解码基元的高效视频语言模型 02-17
VideoLM
视频理解
多模态 |
[自动]
[ARXIV] | 3min | school
语义分块与自然语言熵的关联研究 02-16
语义分块
自然语言熵
LLM |
[自动]
[HACKER_NEWS] | 3min | newspaper
研究:自生成的Agent技能通常无效 02-16
Agent
LLM
自生成技能 |
[自动]
[HACKER_NEWS] | 4min | newspaper
数学、计算机科学与人工智能综合资源指南 02-16
资源指南
数学
计算机科学 |
[自动]
[ARXIV] | 4min | school
异步验证语义缓存技术优化分层大模型架构 02-16
语义缓存
Krites
LLM |
[自动]
[ARXIV] | 4min | school
基于大语言模型Agent的上下文网络事件自主响应端到端方法 02-16
LLM Agent
网络安全
事件响应 |
[自动]
[ARXIV] | 4min | school
仿真筛选模块化策略:从人类视频学习有效行为 02-16
机器人
强化学习
模仿学习 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Z.ai发布GLM-5开源模型:性能超越Opus 4.5 02-16
GLM-5
Z.ai
SOTA |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI推出GPT-5.3-Codex-Spark:首款实时编程模型 02-16
OpenAI
GPT-5.3
Codex |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 下一步该构建什么:基于 Slack 协作模式的思考 02-16
OpenAI
Slack
协作模式 |
[自动]
[HACKER_NEWS] | 7min | newspaper
LCM:无损上下文管理技术论文 02-16
LCM
上下文管理
无损 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2 提出胶子振幅新公式并获合作者验证 02-16
GPT-5.2
理论物理
胶子振幅 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think推理模式升级,专注解决科研与工程领域挑战 02-16
Gemini 3
Deep Think
推理模式 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex与Mi 02-16
Gemini
Anthropic
GPT-5.3 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:面向科研与工程的深度推理模型 02-16
Gemini 3
Deep Think
深度推理 |
[自动]
[ARXIV] | 4min | school
CoPE-VideoLM:基于编解码基元的高效视频语言模型 02-16
VideoLM
多模态
视频理解 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Codex 与 Claude 支持定制内核 02-16
Codex
Claude
定制内核 |
[自动]
[HACKER_NEWS] | 4min | newspaper
研究:自生成的Agent技能通常无效 02-16
Agent
LLM
自生成技能 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Qwen3.5:迈向原生多模态智能体 02-16
Qwen3.5
多模态
智能体 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM 辅助反编译的长尾效应与挑战 02-16
LLM
反编译
逆向工程 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Qwen3.5:迈向原生多模态智能体 02-16
Qwen3.5
多模态
智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Jeff Dean:重写搜索堆栈、复兴稀疏模型与TPU协同设计 02-16
Jeff Dean
Google
TPU |
[自动]
[HACKER_NEWS] | 7min | newspaper
Qwen3.5:迈向原生多模态智能体 02-16
Qwen3.5
多模态
智能体 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT-5.3-Codex-Spark:首款实时编码模型,生成提速15倍 02-16
OpenAI
GPT-5.3
Codex |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 应该构建 Slack 的原因分析 02-16
OpenAI
Slack
企业协作 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出胶子振幅新公式并获合作验证 02-16
GPT-5.2
OpenAI
理论物理 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Anthropic 试图隐藏 Claude AI 行为,引发开发者不满 02-16
Anthropic
Claude
AI透明度 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Amazon Bedrock AgentCore 浏览器新增代理配置、配置文件及扩展支持 02-16
Amazon Bedrock
AgentCore
AI Agent |
[自动]
[HACKER_NEWS] | 5min | newspaper
Qwen3.5:迈向原生多模态智能体 02-16
Qwen3.5
多模态
智能体 |
[自动]
[HACKER_NEWS] | 5min | newspaper
LLM Agent 成本呈二次方增长:算力开销分析 02-16
LLM
Agent
成本分析 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Anthropic 试图隐藏 Claude AI 行为引发开发者不满 02-16
Anthropic
Claude
开发者 |
[自动]
[HACKER_NEWS] | 4min | newspaper
小实验室在音频领域取得竞争优势 02-16
音频
小实验室
竞争优势 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Qwen3.5:迈向原生多模态智能体 02-16
Qwen3.5
多模态
智能体 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Microgpt:可在浏览器中可视化的GPT模型 02-16
MicroGPT
GPT
可视化 |
[自动]
[HACKER_NEWS] | 7min | newspaper
LLM 智能体成本呈二次方增长,复杂任务开销急剧上升 02-16
LLM
智能体
成本分析 |
[自动]
[HACKER_NEWS] | 4min | newspaper
赋予Claude控制笔式绘图仪能力的实践 02-16
Claude
LLM
Function Calling |
[自动]
[HACKER_NEWS] | 5min | newspaper
Microgpt:可在浏览器中可视化的GPT模型 02-16
Microgpt
GPT
可视化 |
[自动]
[HACKER_NEWS] | 5min | newspaper
LLM Agent 成本呈二次方增长:计算开销随任务规模急剧上升 02-16
LLM Agent
成本优化
二次方增长 |
[自动]
[HACKER_NEWS] | 3min | newspaper
小实验室在音频领域取得领先优势 02-16
音频生成
小模型
AI初创 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Microgpt:可在浏览器中可视化的GPT模型 02-16
MicroGPT
可视化
浏览器 |
[自动]
[HACKER_NEWS] | 5min | newspaper
LLM 智能体成本呈二次方增长,复杂任务开销急剧攀升 02-16
LLM
智能体
成本分析 |
[自动]
[HACKER_NEWS] | 3min | newspaper
小实验室在音频领域取得领先优势 02-16
音频生成
小实验室
AI 竞争 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM Agent 成本曲线:二次方增长与昂贵计算 02-16
LLM
Agent
成本分析 |
[自动]
[HACKER_NEWS] | 4min | newspaper
我让 Claude 控制我的笔式绘图仪 02-16
Claude
LLM
AI Agent |
[自动]
[HACKER_NEWS] | 4min | newspaper
Microgpt:可在浏览器中可视化的GPT模型 02-16
MicroGPT
浏览器
可视化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
音频领域成为小实验室实现技术突围的关键赛道 02-16
音频
小实验室
技术突围 |
[自动]
[HACKER_NEWS] | 4min | newspaper
播客主持人指控谷歌NotebookLM语音克隆侵权 02-16
NotebookLM
谷歌
语音克隆 |
[自动]
[HACKER_NEWS] | 5min | newspaper
授予Claude控制权:用笔式绘图仪生成实体艺术 02-16
Claude
LLM
AI代理 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Microgpt:可在浏览器中可视化的 GPT 模型 02-16
MicroGPT
GPT
可视化 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Microgpt:可在浏览器中可视化的GPT模型 02-16
MicroGPT
可视化
浏览器 |
[自动]
[ARXIV] | 4min | school
面向语言模型的在线上下文蒸馏方法 02-16
LLM
蒸馏
上下文学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向自主数学研究 02-16
自主研究
数学
AI |
[自动]
[JUEJIN] | 2min | sticky_note_2
豆包大模型 2.0 发布:模型能力实测与升级详解 02-16
豆包大模型
字节跳动
LLM |
[自动]
[ARXIV] | 4min | school
视觉-语言-动作对齐:扩展验证比扩展策略学习更有效 02-16
VLA
具身智能
CoVer |
[自动]
[HACKER_NEWS] | 6min | newspaper
电台主播指控谷歌NotebookLM语音克隆功能未经授权使用其声音 02-16
NotebookLM
语音克隆
Google |
[自动]
[ARXIV] | 4min | school
WebAgent 智能体测试时计算扩展方法 02-16
WebAgent
Test-Time Scaling
CATTS |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展方法 02-16
多模态
思维链
测试时扩展 |
[自动]
[ARXIV] | 4min | school
MonarchRT:面向实时视频生成的高效注意力机制 02-16
视频生成
扩散模型
注意力机制 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Microgpt:可在浏览器中可视化的GPT模型 02-16
MicroGPT
可视化
浏览器 |
[自动]
[ARXIV] | 5min | school
CM2:基于清单奖励强化学习的多步智能体工具调用 02-16
强化学习
Agent
工具调用 |
[自动]
[ARXIV] | 4min | school
AttentionRetriever:注意力层即长文档检索器 02-16
RAG
长文档
检索 |
[自动]
[HACKER_NEWS] | 4min | newspaper
音频领域成为小型实验室实现技术突破的主战场 02-15
音频生成
AI音乐
语音合成 |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向自主数学研究 02-15
自主研究
数学
AI |
[自动]
[JUEJIN] | 2min | sticky_note_2
豆包大模型2.0发布:核心升级与Trae实测 02-15
豆包大模型
字节跳动
LLM |
[自动]
[ARXIV] | 4min | school
语言模型在线策略上下文蒸馏方法 02-15
模型蒸馏
上下文学习
在线策略 |
[自动]
[ARXIV] | 4min | school
扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐 02-15
VLA
具身智能
机器人 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai发布GLM-5开源权重模型,性能达SOTA 02-15
GLM-5
Z.ai
SOTA |
[自动]
[ARXIV] | 4min | school
WebAgents测试时扩展:智能体性能提升方法 02-15
WebAgents
测试时扩展
CATTS |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展方法 02-15
多模态
思维链
测试时扩展 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI下一步应构建的企业级协作工具分析 02-15
OpenAI
企业协作
Slack |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Jeff Dean:重写谷歌搜索与TPU共稀疏模型设计 02-15
Jeff Dean
Google
TPU |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think发布;Anthropic估值达380亿美元;GPT-5.3动态更新 02-15
Gemini
Anthropic
GPT-5.3 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:面向科研与工程的科学推理模型 02-15
Gemini 3
Deep Think
科学推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:面向科研与工程的专用推理模式更新 02-15
Gemini 3
Deep Think
推理模式 |
[自动]
[ARXIV] | 3min | school
CM2:基于清单奖励强化学习的多步智能体工具调用 02-15
CM2
强化学习
Agent |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ChatGPT 推出锁定模式与高风险标签以抵御提示注入 02-15
ChatGPT
提示注入
锁定模式 |
[自动]
[ARXIV] | 3min | school
AttentionRetriever:注意力层隐式实现长文档检索 02-15
RAG
长文档检索
AttentionRetriever |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向自主数学研究 02-15
自主研究
数学
AI科学家 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT-5.3-Codex-Spark:首款实时代码模型,生成提速15倍 02-15
OpenAI
GPT-5.3
Codex |
[自动]
[HACKER_NEWS] | 4min | newspaper
Microgpt:可在浏览器中可视化的GPT模型 02-15
MicroGPT
可视化
浏览器 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2提出胶子振幅新公式并获验证 02-15
GPT-5.2
OpenAI
理论物理 |
[自动]
[ARXIV] | 3min | school
AI时代的创意所有权界定 02-15
版权
生成式AI
法律 |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向自主数学研究:AI 探索自动化定理证明 02-15
自动化定理证明
AI for Math
形式化验证 |
[自动]
[HACKER_NEWS] | 3min | newspaper
RynnBrain:基于神经网络的脑机接口解码系统 02-15
脑机接口
神经网络
解码系统 |
[自动]
[HACKER_NEWS] | 5min | newspaper
两种提升大模型推理速度的技术方法 02-15
LLM
推理加速
KV Cache |
[自动]
[JUEJIN] | 1min | sticky_note_2
小米开源机器人VLA模型Xiaomi-Robotics-0:47亿参数刷新三大基准SOTA 02-15
小米
具身智能
VLA模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
打破“氛围编程”的迷思:代码生成背后的技术局限与本质 02-15
代码生成
氛围编程
技术局限 |
[自动]
[HACKER_NEWS] | 5min | newspaper
两种提升大模型推理速度的技术方法 02-15
LLM
推理加速
KV Cache |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai GLM-5开源:Opus 4.5级性能的新SOTA模型 02-15
GLM-5
Z.ai
SOTA |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT-5.3-Codex-Spark:首款实时编码模型,生成提速15倍 02-15
OpenAI
GPT-5.3
Codex |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Jeff Dean:重写搜索栈、复兴稀疏模型与设计TPU 02-15
Jeff Dean
Google
TPU |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出新胶子振幅公式并获合作验证 02-15
GPT-5.2
OpenAI
理论物理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think发布,Anthropic估值达380B 02-15
Gemini
Anthropic
GPT-5 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:强化推理能力以应对科研与工程挑战 02-15
Gemini 3
Deep Think
推理模型 |
[自动]
[JUEJIN] | 1min | sticky_note_2
小米开源Xiaomi-Robotics-0:47亿参数VLA模型刷新具身智能基准 02-15
具身智能
VLA模型
小米 |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型行为塑造:SFT与LoRA深度解析 02-15
SFT
LoRA
微调 |
[自动]
[HACKER_NEWS] | 5min | newspaper
两种加速大模型推理的技术方法 02-15
LLM
推理加速
KV Cache |
[自动]
[JUEJIN] | 2min | sticky_note_2
PageLM:开源AI教育平台,将PDF文档转化为测验与播客 02-15
PageLM
AI教育
NotebookLM |
[自动]
[JUEJIN] | 2min | sticky_note_2
LangChain 模型 I/O 模块:提示构建、模型调用与输出解析 02-15
LangChain
LLM
提示工程 |
[自动]
[JUEJIN] | 2min | sticky_note_2
开源大模型涨价潮:Llama 3.5与GLM-5的商业化博弈 02-15
Llama 3.5
GLM-5
商业化 |
[自动]
[JUEJIN] | 3min | sticky_note_2
大模型API开发:Tools、MCP与Skills的本质区别 02-15
LLM
AI Agent
API开发 |
[自动]
[HACKER_NEWS] | 5min | newspaper
OpenAI应构建企业级协作平台Slack 02-15
OpenAI
Slack
企业协作 |
[自动]
[JUEJIN] | 2min | sticky_note_2
智谱GLM与Meta Llama开源大模型涨价策略分析 02-15
智谱GLM
Meta Llama
商业化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
打破“氛围编程”的迷思与局限 02-15
氛围编程
Vibe Coding
AI 编程 |
[自动]
[JUEJIN] | 3min | sticky_note_2
大模型API本质解析:Tools、MCP与Skills的区别 02-15
LLM
AI Agent
Tools |
[自动]
[HACKER_NEWS] | 5min | newspaper
OpenAI应构建Slack:企业级AI协作平台演进方向 02-15
OpenAI
Slack
企业协作 |
[自动]
[HACKER_NEWS] | 7min | newspaper
着色Petri网结合大语言模型构建分布式应用 02-14
LLM
着色Petri网
分布式系统 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Z.ai发布GLM-5开源模型:性能达SOTA 02-14
GLM-5
Z.ai
SOTA |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI发布首款实时编码模型:生成速度提升15倍 02-14
OpenAI
Codex
GPT-5.3 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Jeff Dean:重塑Google搜索栈与TPU及稀疏万亿参数模型 02-14
Jeff Dean
Google
TPU |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出新胶子振幅公式获学术验证 02-14
GPT-5.2
理论物理
胶子振幅 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think发布,Anthropic估值达600亿美元 02-14
Gemini 3
Anthropic
GPT-5.3 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:面向科研与工程的推理模型 02-14
Gemini 3
Deep Think
推理模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think:升级推理模式以解决科研与工程挑战 02-14
Gemini 3
Deep Think
复杂推理 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Amazon Bedrock AgentCore 浏览器更新:新增代理、配置文件及扩展支持 02-14
Amazon Bedrock
AgentCore
AI Agent |
[自动]
[HACKER_NEWS] | 6min | newspaper
着色Petri网结合大语言模型构建分布式应用 02-14
LLM
Petri网
分布式系统 |
[自动]
[ARXIV] | 4min | school
扩展验证比扩展策略学习更有效实现视觉-语言-动作对齐 02-14
VLA
具身智能
机器人 |
[自动]
[HACKER_NEWS] | 4min | newspaper
打破“氛围编程”的迷思:回归代码本质 02-14
氛围编程
AI编程
代码本质 |
[自动]
[ARXIV] | 4min | school
基于策略上下文蒸馏的大语言模型优化方法 02-14
LLM
蒸馏
上下文学习 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Z.ai发布GLM-5开放权重模型,性能超越Opus 4.5 02-14
GLM-5
Z.ai
Opus 4.5 |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展 02-14
多模态
思维链
测试时扩展 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT-5.3-Codex-Spark:首个实时编码模型,生成提速15倍 02-14
OpenAI
GPT-5.3
Codex |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI 应该构建 Slack:企业级 AI 协作平台构想 02-14
OpenAI
Slack
企业协作 |
[自动]
[ARXIV] | 5min | school
MonarchRT:面向实时视频生成的高效注意力机制 02-14
视频生成
DiT
注意力机制 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2推导新胶子振幅公式获正式验证 02-14
GPT-5.2
OpenAI
理论物理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex与Mi 02-14
Gemini 3
Anthropic
OpenAI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think:升级推理模式以解决科研与工程挑战 02-14
Gemini 3
Deep Think
推理模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Codex与Claude支持定制内核以适配各类应用 02-14
Claude
Codex
定制内核 |
[自动]
[ARXIV] | 4min | school
CM2:基于清单奖励强化学习的多步多轮智能体工具调用 02-14
智能体
强化学习
工具调用 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
ChatGPT推出锁定模式与高危标签以防范提示词注入及数据外泄 02-14
ChatGPT
提示词注入
数据安全 |
[自动]
[ARXIV] | 3min | school
AttentionRetriever:注意力层可作为长文档检索器 02-14
RAG
长文档检索
AttentionRetriever |
[自动]
[ARXIV] | 4min | school
Agentic测试时扩展技术提升WebAgent性能 02-14
WebAgent
测试时扩展
CATTS |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 生成鹈鹕骑自行车 SVG 图像 02-14
Gemini 3
Deep Think
SVG |
[自动]
[ARXIV] | 3min | school
AI时代的创意所有权界定与归属问题研究 02-14
版权
生成式AI
法律 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Jeff Dean:重塑搜索栈、复兴稀疏模型与TPU设计 02-14
Jeff Dean
TPU
稀疏模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新结果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 3min | newspaper
G 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[JUEJIN] | 2min | sticky_note_2
国产 Windows 版 Claude Cowork 上线:集成海量 Skills 02-14
Claude
Claude Cowork
AI 办公 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理领域新成果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新结果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 7min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai GLM-5:开放权重新一代SOTA大模型 02-14
GLM-5
Z.ai
SOTA |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT-5.3-Codex-Spark:首个实时编码模型,生成提速15倍 02-14
OpenAI
GPT-5.3
Codex |
[自动]
[BLOGS_PODCASTS] | 3min | mic
microgpt:200行纯Python实现GPT训练与推理 02-14
microgpt
Andrej Karpathy
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Jeff Dean:重塑Google搜索栈与TPU联合设计之路 02-14
Jeff Dean
TPU
稀疏模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think发布;Anthropic估值380B;MiniMax推M2.5 02-14
Gemini 3
Deep Think
Anthropic |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think:强化推理能力以解决科研与工程挑战 02-14
Gemini
Deep Think
推理模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Codex 与 Claude 支持自定义内核以适配所有模型 02-14
Codex
Claude
自定义内核 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 5min | newspaper
GPT-5.2 推导出理论物理新结果 02-14
GPT-5.2
理论物理
AI for Science |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经渲染技术探索:从原理到应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新成果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[JUEJIN] | 2min | sticky_note_2
阿里千问发布 Qwen-Image-2.0:强化文字渲染与图表生成 02-14
Qwen
阿里千问
图像生成 |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI 使命声明演变:从通用人工智能到造福人类 02-14
OpenAI
使命声明
AGI |
[自动]
[ARXIV] | 4min | school
面向语言模型的在线上下文蒸馏方法 02-13
LLM
模型蒸馏
上下文学习 |
[自动]
[ARXIV] | 4min | school
扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐 02-13
VLA
具身智能
机器人 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Z.ai GLM-5开源:新SOTA级开放权重大模型 02-13
GLM-5
Z.ai
SOTA |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展方法 02-13
多模态
思维链
测试时扩展 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布GPT-5.3-Codex-Spark:首款实时代码模型,速度提升15倍 02-13
OpenAI
GPT-5.3
Codex |
[自动]
[ARXIV] | 4min | school
MonarchRT:面向实时视频生成的高效注意力机制 02-13
MonarchRT
实时视频生成
DiT |
[自动]
[BLOGS_PODCASTS] | 4min | mic
microgpt:200行纯Python实现GPT训练与推理 02-13
microgpt
Andrej Karpathy
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Jeff Dean:重塑搜索堆栈、TPU与稀疏万亿参数模型 02-13
Jeff Dean
Google
TPU |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新结果 02-13
GPT-5.2
理论物理
AI for Science |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think发布;Anthropic估值380B;GPT-5.3-Codex与Min 02-13
Gemini
Anthropic
GPT-5.3 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:升级推理模式以应对科研与工程挑战 02-13
Gemini 3
Deep Think
推理模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Dario Amodei:AI指数增长阶段即将终结 02-13
Dario Amodei
Anthropic
指数增长 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Codex与Claude支持定制化内核 02-13
Codex
Claude
定制化内核 |
[自动]
[ARXIV] | 6min | school
CM2:基于清单奖励强化学习的多轮多步智能体工具调用 02-13
强化学习
Agent
工具调用 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ChatGPT推出锁定模式与高风险标签防御提示词注入 02-13
ChatGPT
OpenAI
提示词注入 |
[自动]
[ARXIV] | 4min | school
AttentionRetriever:注意力层即长文档检索器 02-13
RAG
长文档检索
AttentionRetriever |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Bedrock AgentCore 浏览器新增代理、配置文件及扩展支持 02-13
Amazon Bedrock
AgentCore
AI Agent |
[自动]
[ARXIV] | 5min | school
Agentic WebAgents 的测试时缩放方法 02-13
WebAgents
测试时缩放
CATTS |
[自动]
[JUEJIN] | 2min | sticky_note_2
阿里发布千问 Qwen-Image-2.0:强化文字渲染与图表生成能力 02-13
Qwen
阿里云
图像生成 |
[自动]
[JUEJIN] | 2min | sticky_note_2
即梦Seedance 2.0海外爆火,AI视频生成迎来DeepSeek时刻 02-13
AI视频
Seedance
即梦 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
单文件200行代码:microgpt实现无依赖GPT训练与推理 02-13
microgpt
Andrej Karpathy
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai发布GLM-5开源模型:性能超越Opus 4.5 02-13
GLM-5
Z.ai
SOTA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Jeff Dean:重写搜索栈、TPU 与稀疏万亿参数模型 02-13
Jeff Dean
TPU
稀疏模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think推理模式升级,专注科研与工程挑战 02-13
Gemini 3
Deep Think
推理模式 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex与Mi 02-13
Gemini
Anthropic
GPT-5.3 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ChatGPT推出锁定模式与高风险标记以防御提示词注入 02-13
ChatGPT
提示词注入
企业安全 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI与模拟加速科学发现:Rafael Gómez-Bombarelli谈技术转折点 02-13
AI for Science
科学发现
模拟技术 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai发布GLM-5开源模型,性能超越Opus 4.5 02-13
GLM-5
Z.ai
Open Weights |
[自动]
[BLOGS_PODCASTS] | 4min | mic
MicroGPT:200行纯Python代码实现GPT训练与推理 02-13
MicroGPT
LLM
纯Python |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 推理模型发布 02-13
Gemini 3
Deep Think
推理模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI与模拟加速科学发现:拉斐尔·戈麦斯-巴雷利谈技术拐点 02-13
科学发现
AI模拟
科学计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Z.ai发布GLM-5开源模型:性能超越Opus 4.5 02-13
GLM-5
Z.ai
SOTA |
[自动]
[BLOGS_PODCASTS] | 4min | mic
microgpt:200行Python实现的GPT训练与推理极简指南 02-13
LLM
GPT
Python |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Jeff Dean:重写搜索栈、复兴稀疏万亿参数模型与TPU共设计 02-13
Jeff Dean
TPU
稀疏模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think发布;Anthropic估值达380B;GPT-5.3-Codex与Mi 02-13
Gemini 3
Deep Think
Anthropic |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think:强化推理模式以应对科研与工程挑战 02-13
Gemini 3
Deep Think
推理模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 模式发布:支持长链思考推理 02-13
Gemini 3
Deep Think
Google |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI 与模拟加速科学发现:Rafael Gómez-Bombarelli 谈技术拐点 02-13
AI for Science
科学发现
机器学习 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
利用 Amazon Bedrock 构建AI驱动的招聘系统优化人才获取 02-13
Amazon Bedrock
AWS
RAG |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai发布GLM-5开源模型:性能超越Opus 4.5 02-13
GLM-5
Z.ai
Opus 4.5 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Rafael Gómez-Bombarelli:AI与模拟加速科学发现的转折点 02-13
AI for Science
科学发现
模拟技术 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenEnv 实践:评估真实环境中的工具调用智能体 02-13
智能体
工具调用
OpenEnv |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Jeff Dean:重塑Google搜索架构与TPU及稀疏模型的技术历程 02-13
Jeff Dean
Google
TPU |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think发布,Anthropic估值达600亿美元 02-13
Gemini 3
Deep Think
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:升级推理模式以应对科研与工程挑战 02-13
Gemini 3
Deep Think
推理模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Codex 与 Claude 支持构建自定义内核 02-13
Codex
Claude
自定义内核 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Boltz开源AlphaFold传承工具赋能药物发现 02-13
Boltz
AlphaFold
药物发现 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
200行纯Python实现microgpt:无依赖训练推理GPT 02-13
GPT
Python
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
仅200行Python的microgpt:无依赖实现GPT训练与推理 02-13
LLM
GPT
Python |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai发布GLM-5开源模型,性能超越Opus 4.5 02-13
GLM-5
Z.ai
SOTA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenEnv 实战:评估真实环境中的工具调用智能体 02-13
OpenEnv
智能体
Agent |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS 02-13
NVIDIA
Nemotron
SageMaker |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Jeff Dean:重塑谷歌搜索架构与TPU及稀疏模型的技术演进 02-13
Jeff Dean
Google
TPU |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think推理模式更新,专注解决科研与工程挑战 02-13
Gemini 3
Deep Think
推理模式 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think发布;Anthropic估值380亿美元;GPT-5.3-Codex S 02-13
Gemini 3
Anthropic
GPT-5.3 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 模式发布:支持长链思考 02-13
Gemini 3
Deep Think
长链思考 |
[自动]
[HACKER_NEWS] | 6min | newspaper
仅更换测试框架,一下午提升15个大模型代码能力 02-13
LLM
代码生成
基准测试 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 推理模型发布 02-13
Gemini 3
Deep Think
推理模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Boltz 开源分子发现模型:超越 AlphaFold 的药物研发新工具 02-13
Boltz
AlphaFold
药物研发 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI与模拟加速科学发现的转折点 02-13
科学发现
AI模拟
Rafael Gómez-Bombarelli |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 模式发布:强化推理与长思考能力 02-13
Gemini 3
Deep Think
推理模型 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
单文件200行纯Python实现GPT训练与推理 02-13
GPT
Python
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
仅改用Harness框架即可提升15个大模型编程能力 02-13
LLM
代码生成
Harness |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai发布GLM-5开源模型,性能超越Opus 4.5 02-13
GLM-5
Z.ai
Opus 4.5 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Rafael Gómez-Bombarelli:AI与模拟加速科学发现 02-13
科学发现
AI模拟
材料科学 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenEnv 实战:评估真实环境中的工具调用智能体 02-13
智能体
工具调用
OpenEnv |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Jeff Dean:重塑谷歌搜索栈与TPU架构的AI系统设计之路 02-13
Jeff Dean
Google
TPU |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think:升级推理模式以应对科研与工程挑战 02-13
Gemini 3
Deep Think
推理模式 |
[自动]
[HACKER_NEWS] | 7min | newspaper
仅更换框架,一下午提升15个大模型代码能力 02-13
LLM
代码生成
模型评估 |
[自动]
[HACKER_NEWS] | 3min | newspaper
评估多语言上下文护栏:人道主义大模型应用 02-13
LLM
护栏
多语言 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 推出:强化长思维链推理能力 02-13
Gemini 3
Deep Think
Google |
[自动]
[HACKER_NEWS] | 3min | newspaper
尼克·博斯特罗姆新论文探讨超级智能的启动时机 02-13
超级智能
尼克·博斯特罗姆
AI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai发布GLM-5开源模型:性能超越Opus 4.5 02-13
GLM-5
Z.ai
开源模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenEnv实践:评估真实环境中的工具调用智能体 02-13
智能体
工具调用
OpenEnv |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-13
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
microgpt:200行Python实现的零依赖GPT训练与推理 02-13
GPT
LLM
Python |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Jeff Dean:重写搜索基建、复兴稀疏模型与设计 TPU 02-13
Jeff Dean
Google
TPU |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Boltz 开源药物发现工具:基于 AlphaFold 遗产赋能下一代分子发现 02-13
Boltz
AlphaFold
药物发现 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI与仿真加速科学发现的转折点 02-13
科学发现
AI for Science
仿真模拟 |
[自动]
[HACKER_NEWS] | 3min | newspaper
评估多语言上下文护栏:人道主义LLM用例 02-13
LLM
护栏
多语言 |
[自动]
[HACKER_NEWS] | 7min | newspaper
仅调整框架,一下午提升15个大模型编程能力 02-13
LLM
代码生成
模型评估 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 发布:强化深度推理能力 02-13
Gemini 3
Deep Think
Google |
[自动]
[ARXIV] | 4min | school
训练LRM模型:自适应反思与长度协调惩罚提升推理效率 02-13
LRM
推理效率
自适应反思 |
[自动]
[ARXIV] | 3min | school
能力导向训练引发大模型对齐风险研究 02-13
AI对齐
强化学习
奖励黑客 |
[自动]
[ARXIV] | 4min | school
离线强化学习在Q星近似与部分覆盖下的复杂度分析 02-13
离线强化学习
Q星近似
部分覆盖 |
[自动]
[ARXIV] | 4min | school
基于奖励外推的广义在线策略蒸馏算法 02-13
LLM
强化学习
知识蒸馏 |
[自动]
[ARXIV] | 3min | school
Pensieve范式:有状态语言模型自主管理上下文 02-13
StateLM
有状态模型
上下文管理 |
[自动]
[ARXIV] | 4min | school
P-GenRM:个性化生成式奖励模型与基于用户的测试时缩放 02-13
P-GenRM
个性化对齐
奖励模型 |
[自动]
[ARXIV] | 4min | school
Meta-Sel:基于监督元学习的高效上下文学习示例选择方法 02-13
ICL
元学习
示例选择 |
[自动]
[ARXIV] | 4min | school
KAN-FIF:基于样条参数化的轻量级气象卫星热带气旋估算模型 02-13
KAN
气象预测
热带气旋 |
[自动]
[ARXIV] | 4min | school
长思维链监督微调中数据重复优于数据扩展 02-13
长思维链
监督微调
数据重复 |
[自动]
[ARXIV] | 4min | school
超越VLM奖励:扩散原生潜在奖励建模 02-13
扩散模型
DiNa-LRM
奖励建模 |
[自动]
[ARXIV] | 4min | school
权重衰减提升语言模型可塑性 02-13
权重衰减
模型可塑性
微调 |
[自动]
[ARXIV] | 3min | school
基于扩散预训练的稠密上下文嵌入模型 02-13
Embeddings
扩散模型
RAG |
[自动]
[HACKER_NEWS] | 4min | newspaper
仅修改框架,一下午提升15个大模型代码能力 02-13
LLM
代码生成
框架优化 |
[自动]
[ARXIV] | 3min | school
TabICLv2:开源表格基础模型在性能与效率上的改进 02-13
表格模型
TabICLv2
SOTA |
[自动]
[ARXIV] | 3min | school
GENIUS:生成式流体智能评估套件 02-13
GENIUS
流体智力
多模态评估 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 模式发布:强化推理能力 02-13
Gemini 3
Deep Think
推理能力 |
[自动]
[ARXIV] | 3min | school
长思维链监督微调中数据重复优于数据扩展 02-12
长思维链
监督微调
数据重复 |
[自动]
[ARXIV] | 4min | school
超越VLM奖励:扩散原生潜在奖励建模 02-12
扩散模型
DiNa-LRM
奖励建模 |
[自动]
[ARXIV] | 3min | school
权重衰减提升语言模型可塑性 02-12
LLM
权重衰减
模型可塑性 |
[自动]
[ARXIV] | 4min | school
扩散预训练模型生成稠密上下文嵌入 02-12
Embeddings
扩散模型
RAG |
[自动]
[BLOGS_PODCASTS] | 3min | mic
单文件200行纯Python实现GPT训练与推理 02-12
GPT
Python
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
仅更换框架,一下午提升15个大模型编程能力 02-12
LLM
代码生成
框架对比 |
[自动]
[ARXIV] | 3min | school
TabICLv2:更优性能与可扩展性的开源表格基础模型 02-12
TabICLv2
表格基础模型
RealTabPFN |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenEnv 实践:在真实环境中评估工具调用智能体 02-12
OpenEnv
智能体
Agent |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Jeff Dean:重写谷歌搜索栈与TPU共设计之路 02-12
Jeff Dean
Google
TPU |
[自动]
[ARXIV] | 3min | school
GENIUS:生成式流体智能评估套件 02-12
GENIUS
流体智能
GFI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:专用于解决科研与工程挑战的推理模式更新 02-12
Gemini 3
Deep Think
推理模型 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Gemini 3 Deep Think 推出长思维链推理模式 02-12
Gemini 3
Deep Think
长思维链 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Boltz开源药物发现工具:传承AlphaFold并赋能下一代分子研究 02-12
Boltz
AlphaFold
药物发现 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI与模拟加速科学发现:Rafael Gómez-Bombarelli谈技术转折点 02-12
AI for Science
科学发现
逆向设计 |
[自动]
[HACKER_NEWS] | 4min | newspaper
仅调整框架一下午提升15个大模型编程能力 02-12
LLM
代码生成
模型评估 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai发布GLM-5开源模型:性能超越Opus 4.5 02-12
GLM-5
Z.ai
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenEnv实践:评估真实环境中的工具调用智能体 02-12
智能体
工具调用
OpenEnv |
[自动]
[BLOGS_PODCASTS] | 5min | mic
NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LinqAlpha 基于 Amazon Bedrock 构建投资论点压力测试代理 02-12
Amazon Bedrock
Agent
多智能体 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think推理模式更新,专注解决科研与工程挑战 02-12
Gemini 3
Deep Think
推理模式 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Gemini 3 Deep Think:长链推理与深度思考模式解析 02-12
Gemini 3
Deep Think
长链推理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Boltz 开源平台:基于 AlphaFold 遗产加速药物发现 02-12
Boltz
AlphaFold
药物发现 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI与模拟加速科学发现:Rafael Gómez-Bombarelli谈技术拐点 02-12
科学发现
生成式AI
模拟技术 |
[自动]
[HACKER_NEWS] | 4min | newspaper
仅调整框架,一下午提升15个大模型编码能力 02-12
LLM
代码生成
Prompt Engineering |
[自动]
[HACKER_NEWS] | 4min | newspaper
仅替换调度框架,一下午提升15个大模型编程能力 02-12
LLM
代码生成
调度框架 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai发布GLM-5开源模型:性能超越Opus 4.5 02-12
GLM-5
Z.ai
Opus 4.5 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenEnv实践:评估真实环境中的工具调用智能体 02-12
OpenEnv
智能体
Agent |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12
NVIDIA
AWS
SageMaker |
[自动]
[HACKER_NEWS] | 5min | newspaper
MiniMax M2.5 发布:SWE-bench Verified 得分 80.2% 02-12
MiniMax
M2.5
SWE-bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think推理模式升级,面向科研与工程领域 02-12
Gemini 3
Deep Think
推理模式 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Boltz开源平台:基于AlphaFold遗产加速药物分子发现 02-12
Boltz
AlphaFold
药物发现 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI与模拟技术加速科学发现的拐点已至 02-12
科学发现
生成式AI
模拟技术 |
[自动]
[HACKER_NEWS] | 6min | newspaper
仅更换框架,一下午提升15个大模型编程能力 02-12
LLM
代码生成
框架对比 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊利用Nova模型自动化新履约中心运营就绪测试 02-12
Amazon Nova
Amazon Bedrock
图像识别 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Z.ai发布GLM-5开源权重模型,性能超越Opus 4.5 02-12
GLM-5
Z.ai
SOTA |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenEnv实践:评估真实环境中的工具调用智能体 02-12
OpenEnv
智能体
Agent |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12
NVIDIA
AWS
SageMaker |
[自动]
[HACKER_NEWS] | 5min | newspaper
MiniMax M2.5 发布:SWE-bench Verified 得分 80.2% 02-12
MiniMax
M2.5
SWE-bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:面向科研与工程的深度推理模型 02-12
Gemini 3
Deep Think
深度推理 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Gemini 3 Deep Think 推出:强化长链思考能力 02-12
Gemini 3
Deep Think
长链思考 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Boltz开源平台:基于AlphaFold技术赋能新一代分子发现 02-12
Boltz
AlphaFold
药物发现 |
[自动]
[HACKER_NEWS] | 5min | newspaper
仅更换调度框架,一下午提升15个大模型代码能力 02-12
LLM
代码生成
调度框架 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊利用Nova模型自动化新履约中心运营验收测试 02-12
Amazon Nova
Amazon Bedrock
图像识别 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Qwen Image 2 与 Seedance 2:中国生成式媒体进展 02-12
Qwen Image 2
Seedance 2
图像生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenEnv实践:评估真实环境中的工具调用智能体 02-12
OpenEnv
智能体
Agent |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12
NVIDIA
AWS
SageMaker |
[自动]
[HACKER_NEWS] | 7min | newspaper
GLM-5:面向复杂系统工程与长周期智能体任务 02-12
GLM-5
智能体
系统工程 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Boltz 开源药物发现平台:延续 AlphaFold 技术赋能分子研究 02-12
Boltz
AlphaFold
药物发现 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Nova Sonic 实时语音助手与级联架构对比 02-12
Amazon Nova
语音助手
实时语音 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI与仿真加速科学发现:Rafael Gómez-Bombarelli谈技术拐点 02-12
科学发现
AI模拟
材料设计 |
[自动]
[JUEJIN] | 2min | sticky_note_2
智谱GLM-5即Pony Alpha:对标Claude Opus 02-12
智谱AI
GLM-5
Pony Alpha |
[自动]
[JUEJIN] | 2min | sticky_note_2
基于GLM-5与OpenClaw构建具备任务执行能力的AI伴侣 02-12
GLM-5
OpenClaw
AI Agent |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Z.ai GLM-5开源:性能超越Opus 4.5 02-12
GLM-5
Z.ai
SOTA |
[自动]
[HACKER_NEWS] | 5min | newspaper
GLM-5:面向复杂系统工程与长周期智能体任务 02-12
GLM-5
智能体
系统工程 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊利用 Nova 模型自动化新履约中心运营就绪测试 02-12
Amazon Nova
Amazon Bedrock
图像识别 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
中国生成式媒体模型Qwen Image 2与Seedance 2发布 02-12
Qwen Image 2
Seedance 2
生成式媒体 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12
NVIDIA
Nemotron
AWS |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Amazon Nova Sonic 实时语音助手与级联架构对比 02-12
Amazon Nova
实时语音
语音助手 |
[自动]
[JUEJIN] | 2min | sticky_note_2
深度解析Skill/MCP/RAG等五大AI技术的底层逻辑 02-12
LLM
RAG
Agent |
[自动]
[HACKER_NEWS] | 6min | newspaper
GLM-5:面向复杂系统工程与长周期智能体任务 02-12
GLM-5
智能体
系统工程 |
[自动]
[HACKER_NEWS] | 3min | newspaper
大语言模型面临的幻觉与逻辑推理局限 02-12
LLM
幻觉
逻辑推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大语言模型无法凭自身治愈癌症 02-12
LLM
科学发现
模拟器 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
亚马逊利用Nova模型自动化检测新履约中心组件 02-12
Amazon Nova
Amazon Bedrock
图像识别 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Qwen Image 2 与 Seedance 2:中国生成式媒体进展 02-12
Qwen Image 2
Seedance 2
文生图 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Iberdrola 如何利用 Amazon Bedrock AgentCore 优化 ServiceNow I 02-12
Amazon Bedrock
AgentCore
ServiceNow |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Boltz 开源策略:后AlphaFold时代的药物发现新工具 02-12
Boltz
AlphaFold
药物发现 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Amazon Nova Sonic 实时语音助手与级联架构对比 02-12
Amazon Nova
实时语音
语音助手 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI与模拟加速科学发现:拉斐尔·戈麦斯-巴雷利的观点 02-12
AI
科学发现
模拟 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大语言模型无法独立攻克癌症的局限性分析 02-12
LLM
癌症研究
AI 局限性 |
[自动]
[HACKER_NEWS] | 4min | newspaper
大语言模型在逻辑推理与事实准确性上的局限 02-12
LLM
逻辑推理
事实准确性 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊利用 Nova 模型自动化检测新履约中心组件 02-12
Amazon Nova
Amazon Bedrock
计算机视觉 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Qwen Image 2 与 Seedance 2:中国生成式媒体模型进展 02-12
Qwen Image 2
Seedance 2
通义千问 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS 02-12
NVIDIA
Nemotron
AWS |
[自动]
[HACKER_NEWS] | 3min | newspaper
GPT-5在法律推理实验中表现优于联邦法官 02-12
GPT-5
法律推理
联邦法官 |
[自动]
[HACKER_NEWS] | 6min | newspaper
CodeRLM:基于 Tree-sitter 的 LLM 代码索引工具 02-12
CodeRLM
Tree-sitter
代码索引 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Boltz 开源药物发现工具:传承 AlphaFold 推动分子发现 02-12
Boltz
AlphaFold
药物发现 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Amazon Nova Sonic 实时语音助手与级联架构对比 02-12
Amazon Nova
实时语音
语音助手 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊利用 Nova 模型自动化新履约中心运营就绪测试 02-12
Amazon Nova
Amazon Bedrock
图像识别 |
[自动]
[ARXIV] | 3min | school
ROCKET:校准导向背包增强截断的高效模型压缩 02-12
模型压缩
ROCKET
免训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12
NVIDIA
Nemotron
AWS |
[自动]
[ARXIV] | 3min | school
LoRA-Squeeze:LoRA模块的调优后与调优中压缩方法 02-12
LoRA
PEFT
模型压缩 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LLM 单独使用无法治愈癌症:科学与模拟的局限 02-12
LLM
生物医学
AI for Science |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LinqAlpha利用Amazon Bedrock构建投资论点压力测试AI 02-12
Amazon Bedrock
多代理系统
AI Agent |
[自动]
[HACKER_NEWS] | 2min | newspaper
GLM-5:面向复杂系统工程与长周期智能体任务 02-12
GLM-5
智能体
系统工程 |
[自动]
[ARXIV] | 4min | school
CLI-Gym:基于智能体环境逆向的可扩展命令行任务生成 02-12
CLI-Gym
Agent
环境逆向 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Amazon Nova Sonic 实时语音助手与级联架构对比 02-12
Amazon Nova
实时语音
语音助手 |
[自动]
[ARXIV] | 2min | school
用于增强科学图表分析的智能代理 02-12
智能代理
科学图表
多模态 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Qwen Image 2与Seedance 2:中国生成式媒体模型进展 02-12
Qwen Image 2
Seedance 2
生成式媒体 |
[自动]
[ARXIV] | 1min | school
Learning on the Manifold: Unlocking Standard Diffusion 02-12
Diffusion Transformer
DiT
表征学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GLM-OCR:面向复杂文档理解的多模态OCR模型 02-12
GLM-OCR
多模态
OCR |
[自动]
[ARXIV] | 5min | school
Agent World Model:面向智能体强化学习的无限合成环境 02-12
Agent World Model
强化学习
合成环境 |
[自动]
[ARXIV] | 1min | school
基于表征编码器解锁标准扩散Transformer 02-11
DiT
扩散模型
流匹配 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊利用Nova模型自动化新履约中心运营准备检测 02-11
Amazon Nova
Amazon Bedrock
图像识别 |
[自动]
[ARXIV] | 3min | school
LLM盲区偏差检测:识别模型未提及内容 02-11
LLM
偏见检测
模型评估 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GLM-5:从直觉编程迈向智能体工程 02-11
GLM-5
智能体
Agent Engineering |
[自动]
[ARXIV] | 4min | school
CODE-SHARP:基于分层奖励程序的技能持续演化框架 02-11
CODE-SHARP
强化学习
RL |
[自动]
[ARXIV] | 3min | school
Agent World Model: Infinity Synthetic Environments for 02-11
Agent
World Model
强化学习 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Agent Alcove:支持多模型在论坛中进行辩论 02-11
Agent
多模型
Claude |
[自动]
[ARXIV] | 1min | school
循环Transformer的步级数据归因方法 02-11
Transformer
数据归因
模型可解释性 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
大语言模型无法治愈癌症:科学家的模拟困境 02-11
LLM
科学发现
生物医学 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
中国生成式媒体模型Qwen Image 2与Seedance 2发布 02-11
Qwen Image 2
Seedance 2
文生图 |
[自动]
[ARXIV] | 3min | school
Olaf-World: Orienting Latent Actions for Video World Mo 02-11
世界模型
Olaf-World
潜在动作 |
[自动]
[JUEJIN] | 1min | sticky_note_2
讯飞星火X2发布:纯国产算力大模型性能对标GPT 02-11
讯飞星火
国产算力
GPT |
[自动]
[HACKER_NEWS] | 4min | newspaper
Show HN: AI agents play SimCity through a REST API 02-11
AI Agent
SimCity
REST API |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI视觉连载3:RGB图像原理与通道详解 02-11
AI视觉
RGB
图像处理 |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI 核心术语解析:从神经网络原理到词嵌入与潜空间 02-11
神经网络
词嵌入
潜空间 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Qwen Image 2与Seedance 2发布:中国生成式媒体表现强劲 02-11
Qwen Image 2
Seedance 2
通义千问 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
How Amazon uses Amazon Nova models to automate operatio 02-11
Amazon Nova
Amazon Bedrock
多模态 |
[自动]
[HACKER_NEWS] | 3min | newspaper
GLM-OCR: Accurate × Fast × Comprehensive 02-11
GLM-OCR
OCR
多模态 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Building real-time voice assistants with Amazon Nova So 02-11
Amazon Nova
语音助手
实时交互 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GLM-OCR:兼顾准确度、速度与通用性的多模态大模型 02-11
GLM-OCR
多模态
OCR |
[自动]
[ARXIV] | 2min | school
Anagent For Enhancing Scientific Table & Figure Analysi 02-11
Anagent
多智能体
科学图表分析 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Agent-to-agent collaboration: Using Amazon Nova 2 Lite 02-11
Multi-Agent
Amazon Bedrock
Agent 协作 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
[AINews] Qwen Image 2 and Seedance 2 02-11
Qwen Image 2
Seedance 2
通义千问 |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI Design-to-Code 的两个根本问题与解法 02-11
Design-to-Code
D2C
空间认知 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
亚马逊利用Nova模型自动化新履约中心运营就绪测试 02-11
Amazon Nova
Amazon Bedrock
图像识别 |
[自动]
[HACKER_NEWS] | 4min | newspaper
The Little Learner:通往深度学习的直线路径 02-11
深度学习
机器学习
神经网络 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Scale LLM fine-tuning with Hugging Face and Amazon Sage 02-11
LLM
微调
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Building real-time voice assistants with Amazon Nova So 02-11
Amazon Nova
语音助手
实时交互 |
[自动]
[ARXIV] | 1min | school
Moltbook 漏洞:自进化 AI 社会中 Anthropic 安全机制失效 02-11
Anthropic
AI安全
对齐 |
[自动]
[HACKER_NEWS] | 1min | newspaper
The Little Learner: A Straight Line to Deep Learning 02-11
深度学习
机器学习
神经网络 |
[自动]
[ARXIV] | 2min | school
GEBench:将图像生成模型评估为GUI环境的基准 02-11
GEBench
GUI生成
图像生成 |
[自动]
[ARXIV] | 2min | school
Data Science and Technology Towards AGI Part I: Tiered 02-11
AGI
数据管理
分层架构 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
Bringing ChatGPT to GenAI.mil 02-11
OpenAI
ChatGPT
GenAI.mil |
[自动]
[ARXIV] | 3min | school
ARO: A New Lens On Matrix Optimization For Large Models 02-11
ARO
矩阵优化
LLM |
[自动]
[ARXIV] | 2min | school
ANCRe: Adaptive Neural Connection Reassignment for Effi 02-11
ANCRe
深度学习
残差连接 |
[自动]
[HACKER_NEWS] | 4min | newspaper
The Little Learner: A Straight Line to Deep Learning 02-11
深度学习
Deep Learning
机器学习 |
[自动]
[JUEJIN] | 2min | sticky_note_2
LangChain 进阶实战:当 Memory 遇上 OutputParser,打造有记忆的结构化助手 02-11
LangChain
LLM
Memory |
[自动]
[ARXIV] | 3min | school
鲁棒性是函数而非数值:基于视觉驾驶的OOD鲁棒性因子化研究 02-10
OOD鲁棒性
视觉驾驶
因子化 |
[自动]
[ARXIV] | 2min | school
面向AGI的数据科学与技术:分层数据管理 02-10
AGI
LLM
数据管理 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
利用 Hugging Face 与 SageMaker 扩展企业级 LLM 微调 02-10
LLM
微调
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用 Amazon Nova Sonic 构建实时语音助手及架构选型指南 02-10
Amazon Nova
语音助手
实时语音 |
[自动]
[ARXIV] | 4min | school
ARO:面向大模型矩阵优化的新视角 02-10
矩阵优化
ARO
大模型 |
[自动]
[ARXIV] | 2min | school
ArcFlow:高精度非线性流蒸馏实现两步文生图生成 02-10
ArcFlow
文生图
流蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI在ChatGPT测试广告以支持免费访问 02-10
OpenAI
ChatGPT
商业化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Frontier AI agents violate ethical constraints 30–50% o 02-10
AI Agent
对齐
伦理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Bringing ChatGPT to GenAI.mil 02-10
OpenAI
ChatGPT
政府 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Qwen-Image-2.0:生成专业信息图表与逼真照片 02-10
Qwen
通义千问
文生图 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
The Scientist and the Simulator 02-10
LLM
生物医药
科学研究 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI在ChatGPT测试广告以支持免费访问 02-10
OpenAI
ChatGPT
商业化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Goodfire AI:打造可落地机械可解释性与企业级部署工作流 02-10
Goodfire AI
机械可解释性
Mechanistic Interpretability |
[自动]
[ARXIV] | 3min | school
GEBench: Benchmarking Image Generation Models as GUI En 02-10
GEBench
GUI生成
图像生成 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Frontier AI agents violate ethical constraints 30–50% o 02-10
AI Agents
伦理约束
对齐 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
[AINews] OpenAI and Anthropic go to war: Claude Opus 4 02-10
OpenAI
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型而LLM仅基于词模型预测 02-10
世界模型
词模型
智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI在GenAI.mil部署定制版ChatGPT以服务美国防务团队 02-10
OpenAI
ChatGPT
GenAI.mil |
[自动]
[HACKER_NEWS] | 4min | newspaper
Qwen-Image-2.0:生成专业信息图与逼真照片 02-10
Qwen
Qwen-Image-2.0
文生图 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Goodfire AI:打造可落地机制可解释性与生产工作流 02-10
Goodfire AI
机制可解释性
模型解释 |
[自动]
[HACKER_NEWS] | 2min | newspaper
Qwen-Image-2.0: Professional infographics, exquisite ph 02-10
Qwen
Qwen-Image-2.0
文生图 |
[自动]
[HACKER_NEWS] | 2min | newspaper
Mistral Voxtral Mini 4B:浏览器端 Rust 实时语音运行 02-10
Mistral
Voxtral
Rust |
[自动]
[HACKER_NEWS] | 2min | newspaper
Qwen-Image-2.0:专业信息图表与逼真照片生成 02-10
Qwen
Qwen-Image-2.0
文生图 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM 作为语言编译器:Fortran 对编程未来的启示 02-10
LLM
编译器
Fortran |
[自动]
[HACKER_NEWS] | 4min | newspaper
AI智能体发展预测:未来八个月的技术演进与挑战 02-10
AI智能体
LLM
技术预测 |
[自动]
[HACKER_NEWS] | 5min | newspaper
异步智能体成风潮但定义模糊 02-10
智能体
异步
LLM |
[自动]
[ARXIV] | 3min | school
大模型涌现性错位易修复,窄错位难修正 02-10
LLM
对齐
微调 |
[自动]
[HACKER_NEWS] | 4min | newspaper
人人都在构建异步智能体 但鲜有人能定义其概念 02-10
智能体
异步
LLM |
[自动]
[BLOGS_PODCASTS] | 1min | mic
专家依赖世界模型推断隐藏状态,大语言模型需突破词模型局限 02-10
世界模型
词模型
隐藏状态 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI在GenAI.mil部署定制ChatGPT服务美国国防团队 02-10
OpenAI
ChatGPT
GenAI.mil |
[自动]
[HACKER_NEWS] | 5min | newspaper
Mistral Voxtral Mini 4B 浏览器端实时语音 Rust 实现 02-10
Mistral
Voxtral
Rust |
[自动]
[ARXIV] | 5min | school
LQA:面向边缘端视觉语言模型的轻量级量化自适应框架 02-10
VLM
边缘计算
模型量化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-10
GPT-5
云自动化
无细胞蛋白合成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Goodfire AI:打造首个机制可解释性实验室与企业级API 02-10
Goodfire AI
机制可解释性
Mechanistic Interpretability |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI对决Anthropic:Claude Opus 4.6与GPT 5.3 Codex编码能力实测 02-10
OpenAI
Anthropic
Claude Opus |
[自动]
[ARXIV] | 4min | school
语言模型对激活引导攻击的内生抗性研究 02-09
激活引导
内生抗性
ESR |
[自动]
[ARXIV] | 3min | school
智能体不确定性研究揭示过度自信问题 02-09
AI Agents
不确定性
过度自信 |
[自动]
[ARXIV] | 4min | school
学习大模型神经元激活的生成式元模型 02-09
神经元激活
生成式模型
元模型 |
[自动]
[ARXIV] | 3min | school
土耳其语子词策略大规模评估:数据、词表与形态交互 02-09
Subword
Tokenization
土耳其语 |
[自动]
[HACKER_NEWS] | 4min | newspaper
人人都在构建异步智能体 但鲜有人能定义其概念 02-09
智能体
Agent
异步 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型决策,大语言模型需超越词模型 02-09
世界模型
词模型
专家系统 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI对决Anthropic:Claude Opus 4.6与GPT 5.3 Codex深度对比 02-09
OpenAI
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI在ChatGPT测试广告以支持免费使用 02-09
OpenAI
ChatGPT
商业化 |
[自动]
[ARXIV] | 4min | school
InftyThink+: 基于强化学习的高效无限视野推理框架 02-09
强化学习
推理框架
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-09
GPT-5
OpenAI
云自动化 |
[自动]
[ARXIV] | 4min | school
DreamDojo:基于大规模人类视频的通用机器人世界模型 02-09
机器人
世界模型
DreamDojo |
[自动]
[ARXIV] | 4min | school
DAWN:面向扩散大模型的依赖感知快速推理 02-09
扩散模型
DAWN
并行解码 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI在GenAI.mil部署定制版ChatGPT服务美国国防团队 02-09
OpenAI
ChatGPT
GenAI.mil |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI在ChatGPT测试广告以支持免费访问 02-09
OpenAI
ChatGPT
商业化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Goodfire AI 打造可落地机械可解释性工作流 02-09
Goodfire AI
机械可解释性
模型解释 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家具备世界模型而LLM仅拥有词模型 02-09
LLM
世界模型
词模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI在ChatGPT中测试广告功能 02-09
OpenAI
ChatGPT
商业化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 对决 Anthropic:Claude Opus 4.6 挑战 GPT-5.3 Codex 02-09
OpenAI
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合自动化实验室将无细胞蛋白合成成本降低40% 02-09
GPT-5
生物技术
自动化实验室 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Goodfire AI:打造首个机械可解释性前沿实验室 02-09
Goodfire AI
可解释性 AI
机械可解释性 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
专家依赖世界模型决策,LLM需超越词模型以实现推理 02-09
世界模型
推理
智能体 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Goodfire AI 打造可落地机制可解释性标杆与生产工作流 02-09
Goodfire AI
机械可解释性
模型解释 |
[自动]
[HACKER_NEWS] | 3min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-09
世界模型
词模型
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-09
GPT-5
云自动化
生物制造 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Goodfire AI 打造机械可解释性标杆并发布 API 02-09
Goodfire AI
可解释性
Mechanistic Interpretability |
[自动]
[BLOGS_PODCASTS] | 2min | mic
ElevenLabs获5亿美元融资,Cerebras估值达230亿美元 02-09
ElevenLabs
Cerebras
融资 |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-09
世界模型
词模型
LLM |
[自动]
[GITHUB_TRENDING] | 8min | hub
ChatGPT 中文调教指南:多场景提示词库 02-09
ChatGPT
提示词
Prompt |
[自动]
[HACKER_NEWS] | 3min | newspaper
停止生成开始思考:大模型推理范式转变 02-09
推理范式
思维链
CoT |
[自动]
[HACKER_NEWS] | 3min | newspaper
停止生成,开始思考:大模型推理能力进化路径 02-09
LLM
推理能力
思维链 |
[自动]
[ARXIV] | 4min | school
面向运行时智能体记忆的查询感知预算分层路由 02-09
LLM
Agent
Memory |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直观物理 02-09
VLM
直觉物理
强化学习 |
[自动]
[ARXIV] | 4min | school
好奇心即知识:基于主动推理的自一致学习与无遗憾优化 02-09
主动推理
好奇心
自一致学习 |
[自动]
[ARXIV] | 5min | school
共享LoRA子空间实现近乎严格的持续学习 02-09
持续学习
LoRA
灾难性遗忘 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:通过伪逆变换提升模型可逆性与表达能力 02-09
神经网络
可逆性
SPNN |
[自动]
[ARXIV] | 4min | school
PhysicsAgentABM:物理引导的生成式主体建模框架 02-09
PhysicsAgentABM
Agent
多智能体 |
[自动]
[ARXIV] | 3min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-09
DyTopo
Multi-Agent
动态拓扑 |
[自动]
[ARXIV] | 4min | school
DFlash:基于块扩散的闪存推测解码方法 02-09
LLM
推理加速
推测解码 |
[自动]
[ARXIV] | 4min | school
CommCP:基于共形预测的LLM通信提升多智能体协调效率 02-09
LLM
多智能体
共形预测 |
[自动]
[ARXIV] | 5min | school
AP-OOD:基于注意力池化的分布外检测方法 02-09
OOD检测
注意力机制
NLP |
[自动]
[ARXIV] | 3min | school
面向运行时智能体记忆的查询感知预算层路由 02-08
Agent
LLM
智能体 |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直觉物理 02-08
VLM
直觉物理
多模态 |
[自动]
[ARXIV] | 4min | school
好奇心即知识:基于主动推理的自一致学习与无悔优化 02-08
主动推理
好奇心
探索与利用 |
[自动]
[ARXIV] | 5min | school
共享LoRA子空间实现近乎严格的持续学习 02-08
LoRA
持续学习
灾难性遗忘 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:基于伪逆变换的高效架构设计 02-08
神经网络
伪逆
SPNN |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型,大语言模型仅有词模型 02-08
LLM
世界模型
词模型 |
[自动]
[ARXIV] | 4min | school
PhysicsAgentABM:物理引导的生成式智能体建模 02-08
PhysicsAgentABM
智能体
多主体系统 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI 对决 Anthropic:Claude Opus 4.6 与 GPT 5.3 Codex 深度评 02-08
OpenAI
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-08
GPT-5
OpenAI
生物科技 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Goodfire AI打造机制可解释性标杆:将模型内部洞察转化为生产级工作流 02-08
Goodfire AI
机制可解释性
模型黑盒 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
ElevenLabs与Cerebras融资,音频模型与芯片进展 02-08
ElevenLabs
Cerebras
融资 |
[自动]
[ARXIV] | 3min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-08
多智能体
DyTopo
动态拓扑 |
[自动]
[ARXIV] | 4min | school
DFlash:基于块扩散的闪存推测解码方法 02-08
LLM
推理加速
推测解码 |
[自动]
[ARXIV] | 4min | school
CommCP:基于LLM通信与共形预测的多智能体高效协调 02-08
LLM
Multi-Agent
CommCP |
[自动]
[ARXIV] | 4min | school
AP-OOD:基于注意力池化的分布外检测方法 02-08
OOD检测
注意力机制
注意力池化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-08
LLM
世界模型
词模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 与 Anthropic 的巅峰对决:Claude Opus 4.6 挑战 GPT 5.3 Cod 02-08
OpenAI
Anthropic
Claude Opus |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-08
GPT-5
OpenAI
云自动化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Goodfire AI:打造首个机制可解释性实验室与生产级工作流 02-08
Goodfire AI
机制可解释性
Mechanistic Interpretability |
[自动]
[BLOGS_PODCASTS] | 3min | mic
ElevenLabs获5亿美元融资,Cerebras估值达230亿美元 02-08
ElevenLabs
Cerebras
融资 |
[自动]
[GITHUB_TRENDING] | 9min | hub
ChatGPT 中文调教指南:多场景提示词与使用技巧 02-08
ChatGPT
提示词
Prompt |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-08
世界模型
词模型
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
超越智能体编码:AI 编程助手的演进方向 02-08
AI编程
智能体
代码生成 |
[自动]
[HACKER_NEWS] | 5min | newspaper
超越自主编码:AI编程代理的演进方向 02-08
AI编程
智能体
Agentic |
[自动]
[HACKER_NEWS] | 4min | newspaper
微调Qwen2.5-7B模型基于百部电影构建概率故事图 02-08
Qwen2.5
微调
故事图 |
[自动]
[HACKER_NEWS] | 5min | newspaper
超越智能体编码:AI 编程助手的演进方向 02-08
AI编程
智能体
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
基于百部电影微调的 Qwen2.5-7B 概率故事图模型 02-08
Qwen2.5
微调
故事图 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM成为新型高级编程语言 02-08
LLM
编程语言
AI 编程 |
[自动]
[HACKER_NEWS] | 4min | newspaper
大语言模型成为新型高级编程语言 02-08
LLM
编程语言
AI 编程 |
[自动]
[GITHUB_TRENDING] | 9min | hub
ChatGPT 中文调教指南:涵盖各类场景的使用提示词 02-08
ChatGPT
提示词
Prompt |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM成为新一代高级编程语言 02-08
LLM
编程语言
AI 辅助开发 |
[自动]
[HACKER_NEWS] | 4min | newspaper
大语言模型成为新一代高级编程语言 02-08
LLM
编程语言
AI 编程 |
[自动]
[HACKER_NEWS] | 4min | newspaper
基于人类反馈的强化学习:原理与应用 02-07
RLHF
强化学习
人类反馈 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型而LLM仅依赖词模型 02-07
世界模型
LLM
词模型 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI与Anthropic编码模型之争:Claude Opus 4.6对决GPT 5.3 Codex 02-07
OpenAI
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合云自动化将无细胞蛋白质合成成本降低40% 02-07
GPT-5
OpenAI
生物科技 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Goodfire AI 打造可落地机械可解释性标杆并发布 API 02-07
Goodfire AI
机械可解释性
模型解释 |
[自动]
[GITHUB_TRENDING] | 9min | hub
ChatGPT中文调教指南:多场景提示词与使用技巧 02-07
ChatGPT
提示词
Prompt |
[自动]
[ARXIV] | 5min | school
面向运行时智能体记忆的查询感知预算层路由 02-07
Agent
LLM
Memory |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直观物理 02-07
VLM
多模态
具身智能 |
[自动]
[ARXIV] | 3min | school
好奇心即知识:基于主动推理的自一致学习与无悔优化 02-07
主动推理
强化学习
好奇心 |
[自动]
[HACKER_NEWS] | 4min | newspaper
基于人类反馈的强化学习原理与应用 02-07
RLHF
强化学习
人类反馈 |
[自动]
[ARXIV] | 5min | school
共享 LoRA 子空间实现近乎严格的持续学习 02-07
LoRA
持续学习
灾难性遗忘 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:通过伪可逆性提升模型可逆性 02-07
神经网络
伪可逆
SPNN |
[自动]
[ARXIV] | 4min | school
PhysicsAgentABM:物理引导的生成式智能体建模 02-07
PhysicsAgentABM
生成式ABM
多主体系统 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI Frontier:具备上下文与治理能力的企业级AI智能体平台 02-07
OpenAI
AI智能体
企业级 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合云端自动化将无细胞蛋白合成成本降低40% 02-07
GPT-5
合成生物学
自动化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Goodfire AI打造机制可解释性平台并推API落地企业部署 02-07
Goodfire AI
机制可解释性
模型解释 |
[自动]
[ARXIV] | 3min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-07
DyTopo
多智能体
动态拓扑 |
[自动]
[ARXIV] | 4min | school
DFlash:基于块扩散的Flash推测解码方法 02-07
LLM
推理加速
推测解码 |
[自动]
[ARXIV] | 4min | school
CommCP:基于共形预测的LLM通信提升多智能体协调效率 02-07
LLM
Multi-Agent
共形预测 |
[自动]
[ARXIV] | 4min | school
AP-OOD:基于注意力池化的分布外检测方法 02-07
OOD检测
NLP
注意力机制 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:基于多传感器数据生成驾驶场景 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI 与 Anthropic 之争:Claude Opus 4.6 对抗 GPT 5.3 Codex 02-07
OpenAI
Anthropic
Claude |
[自动]
[HACKER_NEWS] | 5min | newspaper
基于人类反馈的强化学习:原理与应用 02-07
RLHF
强化学习
人类反馈 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Waymo 世界模型:利用生成式世界模型提升自动驾驶决策能力 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:自动驾驶场景生成与仿真应用 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:利用生成式世界模拟提升自动驾驶决策 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 7min | newspaper
基于人类反馈的强化学习机制解析 02-07
RLHF
强化学习
人类反馈 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:自动驾驶场景生成与预测架构 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Waymo 世界模型:端到端自动驾驶的仿真与预测架构 02-07
Waymo
世界模型
端到端 |
[自动]
[GITHUB_TRENDING] | 14min | hub
ChatGPT 中文调教指南:多场景提示词与使用技巧 02-07
ChatGPT
提示词
Prompt |
[自动]
[HACKER_NEWS] | 5min | newspaper
让信任变得无关紧要:玩家视角下的智能体安全 02-07
智能体
Agent安全
游戏理论 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理的可视化解析 02-07
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更难 02-07
LLM
ICL
上下文学习 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
首个机制可解释性前沿实验室:Goodfire AI 团队专访 02-07
机制可解释性
Goodfire AI
AI安全 |
[自动]
[HACKER_NEWS] | 4min | newspaper
评估与缓解大模型发现零日漏洞的新兴风险 02-07
LLM
零日漏洞
漏洞挖掘 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习的难度超出预期 02-07
上下文学习
ICL
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI Frontier:企业级AI智能体构建与部署平台 02-07
OpenAI
Frontier
AI智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合云端自动化将无细胞蛋白合成成本降低40% 02-07
GPT-5
云端自动化
无细胞蛋白合成 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Claude Composer:AI 编排多智能体工作流 02-07
Claude
多智能体
工作流 |
[自动]
[HACKER_NEWS] | 4min | newspaper
评估与缓解大模型发现的零日漏洞风险 02-07
LLM
零日漏洞
漏洞挖掘 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络可视化:直观理解深度学习原理 02-07
神经网络
深度学习
可视化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
从上下文学习的难度超出预期 02-07
上下文学习
ICL
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 对决 Anthropic:Claude Opus 4.6 挑战 GPT-5.3 Codex 02-07
OpenAI
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Goodfire AI:首个机制可解释性前沿实验室 02-07
机制可解释性
Goodfire AI
AI 安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
首个机制可解释性前沿实验室:Goodfire AI 创始人访谈 02-06
Goodfire AI
机制可解释性
Mechanistic Interpretability |
[自动]
[ARXIV] | 3min | school
面向运行时智能体记忆的查询感知预算分层路由 02-06
Agent
Memory
RAG |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直觉物理 02-06
VLM
直觉物理
强化学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[ARXIV] | 3min | school
好奇心即知识:基于主动推理的自一致学习与无遗憾优化 02-06
主动推理
探索与利用
自由能 |
[自动]
[ARXIV] | 3min | school
共享 LoRA 子空间实现近乎严格的持续学习 02-06
LoRA
持续学习
微调 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:兼具可逆性与灵活性的新架构 02-06
神经网络
可逆性
伪逆 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更具挑战性 02-06
LLM
ICL
上下文学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:利用生成式视频预测驾驶场景 02-06
Waymo
世界模型
生成式视频 |
[自动]
[ARXIV] | 4min | school
PhysicsAgentABM:物理引导的生成式智能体建模 02-06
PhysicsAgentABM
多智能体系统
ABM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 与 Anthropic 之争:Claude Opus 4.6 对决 GPT 5.3 Codex 02-06
OpenAI
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI Frontier:具备共享上下文与治理能力的企业级AI代理平台 02-06
OpenAI
Frontier
AI代理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合自动化闭环实验降低无细胞蛋白合成成本40% 02-06
GPT-5
AI for Science
生物科技 |
[自动]
[ARXIV] | 3min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-06
DyTopo
多智能体
动态拓扑 |
[自动]
[ARXIV] | 5min | school
DFlash:基于块扩散的Flash推测解码方法 02-06
LLM
推理加速
推测解码 |
[自动]
[ARXIV] | 4min | school
CommCP:基于LLM通信与共形预测的高效多智能体协调 02-06
LLM
多智能体
具身智能 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Claude Composer:AI 编排多智能体协作与任务流 02-06
Claude
多智能体
工作流编排 |
[自动]
[HACKER_NEWS] | 4min | newspaper
BioTradingArena:预测生物科技股走势的LLM基准 02-06
LLM
基准测试
金融预测 |
[自动]
[ARXIV] | 5min | school
AP-OOD:基于注意力池化的分布外检测方法 02-06
OOD检测
注意力机制
NLP |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
上下文学习难度超出原有认知 02-06
上下文学习
ICL
大模型 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Claude Composer:AI 编排多 Agent 协作完成复杂任务 02-06
Claude
Multi-Agent
Agent编排 |
[自动]
[HACKER_NEWS] | 4min | newspaper
BioTradingArena:用于评估LLM预测生物科技股票走势的基准 02-06
LLM
基准测试
金融预测 |
[自动]
[HACKER_NEWS] | 4min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更难 02-06
LLM
上下文学习
ICL |
[自动]
[HACKER_NEWS] | 3min | newspaper
Waymo世界模型:自动驾驶仿真的新前沿 02-06
Waymo
自动驾驶
世界模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.3-Codex 智能体:结合前沿编码与通用推理以支持长周期技术任务 02-06
GPT-5.3-Codex
智能体
代码生成 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习的难度超出原有认知 02-06
上下文学习
ICL
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI发布GPT-5.3-Codex代码生成模型 02-06
OpenAI
GPT-5.3
Codex |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI与Anthropic编码模型之争:Claude Opus 4.6对决GPT 5.3 Codex 02-06
OpenAI
Anthropic
Claude |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI Frontier:具备共享上下文与治理能力的企业级AI代理平台 02-06
OpenAI
Frontier
企业级 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-06
GPT-5
云自动化
蛋白合成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.3-Codex系统卡:融合前沿代码性能与推理能力 02-06
GPT-5.3
Codex
代码模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Goodfire AI 首个机制可解释性前沿实验室访谈 02-06
Goodfire AI
机制可解释性
Mechanistic Interpretability |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Waymo世界模型:自动驾驶仿真的新前沿 02-06
Waymo
自动驾驶
世界模型 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Opus 4.6 智能体团队协作构建 C 语言编译器 02-06
Opus 4.6
智能体
Agent |
[自动]
[HACKER_NEWS] | 3min | newspaper
LLM不应作为编译器:技术局限与正确性风险 02-06
LLM
编译器
代码生成 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理的可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 5min | newspaper
LLM 不应作为编译器:技术局限与可靠性分析 02-06
LLM
编译器
代码生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3-Codex:融合推理与编码能力的代理式模型 02-06
GPT-5.3
Codex
Agentic |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM 不应取代编译器:语言模型与符号编译的差异分析 02-06
LLM
编译器
符号执行 |
[自动]
[GITHUB_TRENDING] | 9min | hub
ChatGPT 中文调教指南:场景化提示词与指令优化 02-06
ChatGPT
Prompt
提示词 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Anthropic 发布 Claude Opus 4.6 模型 02-06
Anthropic
Claude
Opus 4.6 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Agent Arena:评估 AI 智能体抗操纵能力的平台 02-06
Agent Arena
AI Agent
抗操纵 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Opus 4.6 智能体团队协作构建 C 语言编译器 02-06
Opus 4.6
智能体
Agent |
[自动]
[HACKER_NEWS] | 7min | newspaper
Claude Opus 4.6 发布 02-06
Claude
Opus
Anthropic |
[自动]
[HACKER_NEWS] | 8min | newspaper
Opus 4.6 智能体团队协作构建 C 语言编译器 02-06
Opus 4.6
智能体
Agent |
[自动]
[HACKER_NEWS] | 7min | newspaper
Claude Opus 4.6 发布:上下文窗口与推理能力提升 02-06
Claude
Opus 4.6
LLM |
[自动]
[HACKER_NEWS] | 8min | newspaper
利用 Opus 4.6 智能体团队构建 C 语言编译器 02-06
Opus 4.6
智能体
Agent Teams |
[自动]
[HACKER_NEWS] | 3min | newspaper
超网络:用于处理层级数据的神经网络架构 02-06
超网络
层级数据
神经网络架构 |
[自动]
[HACKER_NEWS] | 6min | newspaper
超网络:面向层级数据的神经网络架构 02-06
超网络
Hypernetworks
层级数据 |
[自动]
[ARXIV] | 4min | school
受限群组相对策略优化 02-06
GRPO
强化学习
策略优化 |
[自动]
[ARXIV] | 5min | school
RRAttention:基于轮询移位的动态块稀疏注意力机制 02-06
RRAttention
稀疏注意力
长上下文 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI Frontier:企业级AI智能体构建与治理平台 02-06
OpenAI
AI智能体
企业级 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索性能提升 02-06
Nemotron
ColEmbed
ViDoRe |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-06
GPT-5
云自动化
蛋白合成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Goodfire AI 首家机制可解释性实验室:Myra Deng 与 Mark Bissell 对谈 02-06
Goodfire AI
机制可解释性
Mechanistic Interpretability |
[自动]
[ARXIV] | 4min | school
DLM-Scope:利用稀疏自编码器解析扩散语言模型 02-06
DLM
SAE
稀疏自编码器 |
[自动]
[ARXIV] | 4min | school
重新思考大模型强化学习中的信任区域机制 02-06
强化学习
LLM
PPO |
[自动]
[ARXIV] | 3min | school
蛋白质自回归建模:基于多尺度结构生成的方案 02-06
蛋白质生成
自回归模型
多尺度建模 |
[自动]
[ARXIV] | 4min | school
研究揭示推理大模型生成虚假新闻的内在机制 02-06
LLM
CoT
虚假新闻 |
[自动]
[ARXIV] | 3min | school
数据中的阈下效应:基于对数线性性的通用机制 02-06
LLM
数据质量
Logit-Linear-Selection |
[自动]
[HACKER_NEWS] | 3min | newspaper
心理越狱揭示前沿模型内部冲突 02-06
越狱
心理测量
前沿模型 |
[自动]
[ARXIV] | 4min | school
强化注意力学习:通过奖励机制优化视觉注意力模型 02-06
强化学习
多模态
注意力机制 |
[自动]
[ARXIV] | 4min | school
多层交叉注意力机制在多模态上下文学习中具有可证明的最优性 02-06
多模态
上下文学习
ICL |
[自动]
[ARXIV] | 5min | school
Multi-Head LatentMoE 与 Head 并行:通信高效的确定性 MoE 并行策略 02-06
MoE
分布式训练
通信优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3-Codex:结合前沿编码与推理能力的具身智能体编程模型 02-06
GPT-5.3
Codex
具身智能 |
[自动]
[ARXIV] | 4min | school
CRoSS:面向可扩展强化学习的持续机器人仿真套件 02-06
强化学习
机器人仿真
Gazebo |
[自动]
[BLOGS_PODCASTS] | 2min | mic
首个机制可解释性前沿实验室:Goodfire AI 团队专访 02-05
机制可解释性
Goodfire AI
Myra Deng |
[自动]
[ARXIV] | 5min | school
重新思考大模型强化学习中的信任区域 02-05
RLHF
PPO
强化学习 |
[自动]
[ARXIV] | 3min | school
蛋白质多尺度结构生成的自回归建模方法 02-05
蛋白质生成
自回归模型
多尺度建模 |
[自动]
[ARXIV] | 3min | school
数据中的阈下效应:一种基于对数线性性的通用机制 02-05
LLM
数据质量
Logit-Linear-Selection |
[自动]
[HACKER_NEWS] | 3min | newspaper
心理越狱揭示前沿模型的内部冲突 02-05
越狱
心理测量
前沿模型 |
[自动]
[ARXIV] | 4min | school
强化注意力学习:基于奖励反馈的注意力机制优化方法 02-05
强化学习
注意力机制
多模态 |
[自动]
[ARXIV] | 3min | school
多层交叉注意力被证明是多模态上下文学习的最优解 02-05
多模态
上下文学习
ICL |
[自动]
[GITHUB_TRENDING] | 11min | hub
动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用 02-05
深度学习
D2L
PyTorch |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI Frontier:具备上下文与治理机制的企业级AI代理平台 02-05
OpenAI
AI代理
企业级 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型 02-05
Nemotron
ColEmbed
ViDoRe |
[自动]
[ARXIV] | 5min | school
Multi-Head LatentMoE与Head并行:通信高效且确定性的MoE方案 02-05
MoE
分布式训练
通信优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-05
GPT-5
OpenAI
云自动化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3-Codex:融合推理与编码能力的智能体模型 02-05
GPT-5.3
Codex
智能体 |
[自动]
[ARXIV] | 5min | school
CRoSS:面向可扩展强化学习的持续机器人仿真套件 02-05
强化学习
持续学习
机器人仿真 |
[自动]
[ARXIV] | 3min | school
CoT非真理链:推理LLM生成假新闻的实证内部分析 02-05
LLM
CoT
假新闻 |
[自动]
[HACKER_NEWS] | 8min | newspaper
Claude Opus 4.6 发布 02-05
Claude
Opus
模型发布 |
[自动]
[GITHUB_TRENDING] | 9min | hub
ChatGPT中文调教指南:多场景提示词与使用技巧 02-05
ChatGPT
提示词工程
Prompt |
[自动]
[ARXIV] | 3min | school
面向物联网模型适应性的对比持续学习 02-05
持续学习
对比学习
物联网 |
[自动]
[HACKER_NEWS] | 4min | newspaper
超网络:面向层级数据的神经网络架构 02-05
超网络
层级数据
神经网络架构 |
[自动]
[HACKER_NEWS] | 3min | newspaper
心理越狱揭示前沿模型内部冲突 02-05
越狱
心理攻击
模型对齐 |
[自动]
[HACKER_NEWS] | 5min | newspaper
利用 Claude Opus 4.6 推进金融业务发展 02-05
Claude Opus
金融科技
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
Opus 4.6 智能体团队成功构建 C 语言编译器 02-05
Opus 4.6
智能体
Agent |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI Frontier:具备共享上下文与治理功能的企业级AI代理平台 02-05
OpenAI
Frontier
企业级 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.3-Codex:融合推理与编程的智能体模型 02-05
GPT-5.3
Codex
智能体 |
[自动]
[HACKER_NEWS] | 3min | newspaper
心理越狱揭示前沿模型内部冲突 02-05
越狱
心理测量
前沿模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI Frontier:具备共享上下文与治理功能的企业级AI智能体平台 02-05
OpenAI
AI智能体
企业级 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型 02-05
多模态
检索
Nemotron |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合云自动化将无细胞蛋白合成成本降低40% 02-05
GPT-5
生物制造
云自动化 |
[自动]
[HACKER_NEWS] | 3min | newspaper
心理越狱揭示前沿模型内部冲突 02-05
越狱
心理测量
前沿模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.3-Codex:结合前沿编码性能与推理能力的代理式模型 02-05
GPT-5.3
Codex
Agent |
[自动]
[HACKER_NEWS] | 4min | newspaper
Anthropic Claude Opus 4.6 挖掘开源代码500个零日漏洞 02-05
Anthropic
Claude Opus
零日漏洞 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型 02-05
Nemotron
ColEmbed
ViDoRe |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Context Graphs与Agent Traces:技术解析与应用前景 02-05
Context Graphs
Agent Traces
Agent |
[自动]
[HACKER_NEWS] | 5min | newspaper
Claude 推出代码智能体团队协作模式 02-05
Claude
代码智能体
团队协作 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI Frontier:具备上下文与治理功能的企业级AI代理平台 02-05
OpenAI
Frontier
AI代理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型 02-05
Nemotron
ColEmbed
ViDoRe |
[自动]
[BLOGS_PODCASTS] | 3min | mic
ElevenLabs融资5亿美元,Cerebras估值达230亿 02-05
ElevenLabs
Cerebras
融资 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Claude Opus 4.6 发布:性能与上下文窗口提升 02-05
Claude
Opus 4.6
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
社区评估:以社区共识取代黑盒排行榜 02-05
社区评估
排行榜
黑盒 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-05
DeepSeek
AI生态
开源模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI Frontier:企业级AI智能体构建与治理平台 02-05
OpenAI
AI Agents
企业级 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型 02-05
Nemotron
ColEmbed
ViDoRe |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Context Graphs与Agent Traces:解析AI系统的上下文与追踪技术 02-05
Context Graphs
Agent Traces
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-05
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-05
DeepSeek
AI生态
开源模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI前沿技术进展与模型能力解析 02-05
OpenAI
模型能力
前沿技术 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索性能优化 02-05
Nemotron
ColEmbed
ViDoRe |
[自动]
[HACKER_NEWS] | 5min | newspaper
AI 正在重塑 B2B SaaS 商业模式 02-05
B2B
SaaS
商业模式 |
[自动]
[HACKER_NEWS] | 4min | newspaper
AI 正在重塑 B2B SaaS 商业模式 02-05
B2B SaaS
商业模式
AI重塑 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Context Graphs与Agent Traces技术解析 02-05
Context Graphs
Agent Traces
Agent |
[自动]
[GITHUB_TRENDING] | 13min | hub
ChatGPT中文调教指南:多场景提示词与使用教程 02-05
ChatGPT
提示词
Prompt |
[自动]
[HACKER_NEWS] | 6min | newspaper
AI 正在重塑 B2B SaaS 商业模式 02-05
B2B SaaS
商业模式
AI重塑 |
[自动]
[HACKER_NEWS] | 4min | newspaper
AI 正在重塑 B2B SaaS 商业模式 02-05
B2B
SaaS
商业模式 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-05
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-05
DeepSeek
开源AI
AI生态 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型 02-05
Nemotron
ColEmbed
ViDoRe |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Context Graphs 与 Agent Traces:解析 AI 智能体的记忆与回溯机制 02-05
AI Agent
Context Graphs
Agent Traces |
[自动]
[HACKER_NEWS] | 5min | newspaper
AI重塑B2B SaaS:通用模型挤压垂直软件价值空间 02-05
B2B SaaS
垂直软件
通用模型 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称感知泰勒近似实现恒定Token成本注意力机制 02-05
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 4min | newspaper
AI 正在重塑 B2B SaaS 行业 02-05
B2B SaaS
行业重塑
商业模式 |
[自动]
[HACKER_NEWS] | 6min | newspaper
对称感知泰勒近似实现恒定Token成本注意力机制 02-05
注意力机制
Transformer
泰勒近似 |
[自动]
[ARXIV] | 4min | school
加速科学研究:Gemini 案例研究与通用技术 02-05
Gemini
科学研究
数学发现 |
[自动]
[ARXIV] | 5min | school
PrevizWhiz:结合粗略3D场景与2D视频引导生成式预演 02-05
AIGC
视频生成
3D场景 |
[自动]
[ARXIV] | 5min | school
PLATE:用于几何感知持续学习的可塑性调谐高效适配器 02-05
持续学习
PLATE
模型适配 |
[自动]
[ARXIV] | 3min | school
Parallel-Probe:通过二维探测实现高效并行思维 02-05
并行推理
思维链
2D Probing |
[自动]
[HACKER_NEWS] | 4min | newspaper
Claude:打造用于深度思考的AI交互空间 02-05
Claude
AI交互
深度思考 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-05
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态演进:从DeepSeek到AI+ 02-05
DeepSeek
AI生态
开源模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Snowflake与OpenAI达成2亿美元协议,将前沿AI引入企业数据 02-05
Snowflake
OpenAI
企业级 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型 02-05
Nemotron
ColEmbed
ViDoRe |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-04
文本生成图像
模型训练
消融实验 |
[自动]
[ARXIV] | 3min | school
基于急停干预的鲁棒干预学习 02-04
强化学习
RL
自动驾驶 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称性泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[ARXIV] | 4min | school
利用 Gemini 加速科学研究:案例研究与通用技术 02-04
Gemini
科学研究
数学证明 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-04
DeepSeek
AI生态
开源模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Snowflake与OpenAI合作:在数据平台内直接部署AI智能体 02-04
Snowflake
OpenAI
AI智能体 |
[自动]
[ARXIV] | 5min | school
PrevizWhiz:结合粗略3D场景与2D视频引导生成视频预演 02-04
视频生成
3D视觉
PrevizWhiz |
[自动]
[ARXIV] | 4min | school
PLATE:面向几何感知持续学习的可塑性调谐高效适配器 02-04
持续学习
PLATE
高效适配器 |
[自动]
[ARXIV] | 3min | school
Parallel-Probe:通过2D探测实现高效并行思维 02-04
LLM
并行推理
思维链 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nemotron ColEmbed V2:基于ViDoRe V3的多模态检索模型 02-04
Nemotron
ColEmbed
ViDoRe |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Context Graphs与Agent Traces技术解析 02-04
Context Graphs
Agent Traces
LLM |
[自动]
[GITHUB_TRENDING] | 9min | hub
ChatGPT中文调教指南:多场景使用提示词合集 02-04
ChatGPT
提示词
Prompt |
[自动]
[HACKER_NEWS] | 5min | newspaper
AI 正在重塑 B2B SaaS 商业模式 02-04
B2B
SaaS
商业模式 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称性泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Claude Is a Space to Think 02-04
Claude
AI产品
思维工具 |
[自动]
[HACKER_NEWS] | 6min | newspaper
AI 正在重塑 B2B SaaS 行业 02-04
B2B
SaaS
行业变革 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-04
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-04
DeepSeek
AI生态
开源模型 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Snowflake与OpenAI达成2亿美元协议引入企业级AI智能体 02-04
OpenAI
Snowflake
AI Agents |
[自动]
[HACKER_NEWS] | 3min | newspaper
Claude:打造用于深度思考的交互空间 02-04
Claude
AI交互
深度思考 |
[自动]
[HACKER_NEWS] | 5min | newspaper
AI 正在重塑 B2B SaaS 商业模式 02-04
B2B
SaaS
商业模式 |
[自动]
[HACKER_NEWS] | 5min | newspaper
基于对称性泰勒近似实现恒定每Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Claude:一个用于深度思考的交互空间 02-04
Claude
LLM
AI交互 |
[自动]
[HACKER_NEWS] | 7min | newspaper
基于对称感知泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Context Graphs与Agent Traces技术解析 02-04
Context Graphs
Agent Traces
LLM |
[自动]
[HACKER_NEWS] | 7min | newspaper
基于对称泰勒近似实现恒定Token成本注意力机制 02-04
Attention机制
Taylor近似
线性注意力 |
[自动]
[HACKER_NEWS] | 5min | newspaper
对称感知泰勒近似实现恒定Token成本注意力机制 02-04
Attention机制
Taylor近似
Token成本 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Agent Skills:大模型智能体技能框架 02-04
Agent
LLM
智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文生图模型训练设计:消融实验的经验总结 02-04
文生图
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-04
DeepSeek
AI生态
开源AI |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Snowflake与OpenAI合作:2亿美元协议引入企业级AI智能体 02-04
Snowflake
OpenAI
AI智能体 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Agent Skills:AI 智能体技能评估框架 02-04
Agent
智能体
评估框架 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
2026年AI展望:大模型、智能体与算力趋势 02-04
LLM
智能体
Scaling Laws |
[自动]
[HACKER_NEWS] | 7min | newspaper
Agent Skills:智能体技能框架与能力评估 02-04
Agent
智能体
技能框架 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Context Graphs与Agent Traces技术解析 02-04
Context Graphs
Agent Traces
Agent |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文生图模型训练设计:消融实验的经验总结 02-04
文生图
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-04
DeepSeek
开源AI
行业展望 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Snowflake与OpenAI合作:在企业数据中直接部署AI智能体 02-04
Snowflake
OpenAI
AI智能体 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
2026年AI展望:LLM、智能体、算力与中国角色 02-04
LLM
智能体
AI 编程 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Agent Skills:AI 智能体技能框架与训练方法 02-04
Agent
智能体
技能框架 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Qwen3-Coder-Next:下一代代码模型架构与性能升级 02-04
Qwen
代码模型
架构升级 |
[自动]
[HACKER_NEWS] | 7min | newspaper
FlashAttention-T:张量化注意力机制优化方案 02-04
FlashAttention
注意力机制
张量化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Qwen3-Coder-Next:下一代代码模型架构与性能解析 02-04
Qwen3
代码模型
LLM |
[自动]
[HACKER_NEWS] | 8min | newspaper
FlashAttention-T:张量化注意力机制优化方案 02-04
FlashAttention
注意力机制
张量化 |
[自动]
[ARXIV] | 4min | school
面向冲突目标的免奖励对齐方法 02-04
RACO
对齐
多目标优化 |
[自动]
[ARXIV] | 4min | school
通过文本反馈扩展强化学习的能力边界 02-04
强化学习
RLHF
文本反馈 |
[自动]
[ARXIV] | 3min | school
训练LLM采用分治推理提升测试时扩展性 02-04
LLM
推理
强化学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-04
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-04
DeepSeek
开源AI
AI生态 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
xAI 推出 Grok Imagine API:顶级视频模型与低延迟定价 02-04
xAI
Grok
Imagine API |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Snowflake与OpenAI合作:在数据平台内集成前沿AI模型 02-04
Snowflake
OpenAI
企业级AI |
[自动]
[ARXIV] | 4min | school
RLAnything:构建完全动态强化学习系统环境与模型 02-04
RLAnything
强化学习
LLM |
[自动]
[ARXIV] | 4min | school
RE-TRAC:面向深度搜索智能体的递归轨迹压缩算法 02-04
Re-TRAC
深度搜索智能体
ReAct |
[自动]
[ARXIV] | 5min | school
PixelGen:像素扩散结合感知损失超越潜在扩散 02-04
PixelGen
扩散模型
计算机视觉 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Moltbook:首个面向AI代理的社交网络平台 02-04
AI Agents
Moltbook
社交网络 |
[自动]
[ARXIV] | 4min | school
MemSkill:面向自进化代理的记忆技能学习与演化框架 02-04
MemSkill
智能体
Agent |
[自动]
[ARXIV] | 3min | school
MEG-XL:长上下文预训练实现数据高效的脑电转文本 02-04
MEG-XL
脑机接口
脑电转文本 |
[自动]
[ARXIV] | 5min | school
AgentRx:基于执行轨迹的AI智能体故障诊断 02-04
AgentRx
AI Agent
故障诊断 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
2026年AI趋势展望:LLM、智能体、算力与AGI发展路径 02-04
LLM
智能体
AGI |
[自动]
[HACKER_NEWS] | 4min | newspaper
Qwen3-Coder-Next:阿里下一代代码模型 02-04
Qwen
阿里
代码模型 |
[自动]
[HACKER_NEWS] | 5min | newspaper
FlashAttention-T:张量化注意力机制优化方案 02-04
FlashAttention
注意力机制
张量化 |
[自动]
[ARXIV] | 3min | school
训练LLM采用分治推理提升测试时扩展性 02-03
LLM
推理
强化学习 |
[自动]
[ARXIV] | 4min | school
无奖励对齐技术处理多目标冲突 02-03
RACO
对齐技术
多目标优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-03
文本生成图像
模型训练
消融实验 |
[自动]
[ARXIV] | 4min | school
基于流策略梯度的机器人控制方法 02-03
机器人控制
流匹配
策略梯度 |
[自动]
[ARXIV] | 4min | school
基于文本反馈扩展强化学习的能力 02-03
强化学习
RLHF
文本反馈 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-03
DeepSeek
AI生态
开源模型 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
xAI 推出 Grok Imagine API:顶级视频模型与性价比优势 02-03
xAI
Grok
Imagine API |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Snowflake与OpenAI达成2亿美元协议,在数据平台内集成AI智能体 02-03
Snowflake
OpenAI
AI智能体 |
[自动]
[ARXIV] | 4min | school
RLAnything:完全动态强化学习系统构建环境、策略与奖励模型 02-03
强化学习
RL
LLM |
[自动]
[ARXIV] | 4min | school
RE-TRAC:面向深度搜索智能体的递归轨迹压缩方法 02-03
Re-TRAC
深度搜索
智能体 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Qwen3-Coder-Next:阿里新一代代码模型 02-03
Qwen
阿里
代码模型 |
[自动]
[ARXIV] | 4min | school
PixelGen:引入感知损失的像素扩散模型性能超越潜在扩散 02-03
PixelGen
扩散模型
计算机视觉 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Moltbook:首个面向 AI 智能体的社交网络平台 02-03
AI Agent
社交网络
Moltbook |
[自动]
[ARXIV] | 4min | school
MemSkill:赋予自进化代理学习与演进记忆技能 02-03
MemSkill
智能体
记忆机制 |
[自动]
[ARXIV] | 3min | school
MEG-XL:基于长上下文预训练的高效脑电转文本模型 02-03
MEG-XL
脑机接口
BCI |
[自动]
[HACKER_NEWS] | 6min | newspaper
FlashAttention-T:张量化注意力机制优化方案 02-03
FlashAttention
注意力机制
张量化 |
[自动]
[ARXIV] | 5min | school
AgentRx:基于执行轨迹的AI智能体故障诊断 02-03
AgentRx
AI Agent
故障诊断 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Agent Skills:智能体技能框架与开发指南 02-03
Agent
智能体
Agent Skills |
[自动]
[BLOGS_PODCASTS] | 3min | mic
2026年AI展望:大模型、智能体、算力与Scaling Laws 02-03
AI 展望
Scaling Laws
AI Agent |
[自动]
[HACKER_NEWS] | 5min | newspaper
Qwen3-Coder-Next:阿里通义千问下一代代码模型 02-03
Qwen
通义千问
代码模型 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Agent Skills:AI 智能体的技能框架 02-03
Agent
智能体
技能框架 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Agent Skills:智能体技能框架 02-03
Agent
智能体
Agent Skills |
[自动]
[HACKER_NEWS] | 3min | newspaper
构建AI版Wattpad以评估大模型小说创作能力 02-03
LLM
小说创作
模型评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
xAI 推出 Grok Imagine API:对标 SOTA 视频模型,优化定价与延迟 02-03
xAI
Grok
Imagine API |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Snowflake与OpenAI合作:在企业数据中直接实现AI智能体与洞察 02-03
Snowflake
OpenAI
AI智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Cosmos策略:提升机器人控制能力 02-03
NVIDIA
Cosmos
机器人 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Moltbook:首个面向 AI 智能体的社交网络平台 02-03
AI Agents
Moltbook
社交网络 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Agent Skills:AI 智能体技能框架 02-03
Agent
智能体
Agent Skills |
[自动]
[BLOGS_PODCASTS] | 3min | mic
2026年AI展望:LLM、智能体、扩展定律与中国角色 02-03
LLM
Scaling Laws
智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-03
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
全球开源AI生态展望:从DeepSeek到AI+ 02-03
DeepSeek
AI生态
开源模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
xAI 巩固前沿地位并计划与 SpaceX 合并 02-03
xAI
Grok
SpaceX |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Snowflake与OpenAI合作:2亿美元协议将AI智能体引入企业数据 02-03
Snowflake
OpenAI
AI智能体 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI内部数据代理:结合GPT-5与记忆机制快速分析海量数据 02-03
OpenAI
GPT-5
Codex |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Cosmos策略发布:提升机器人控制精度 02-03
NVIDIA
Cosmos
机器人 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Moltbook:首个面向 AI 智能体的社交网络平台 02-03
AI Agent
Moltbook
模拟 AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
2026年AI展望:LLM、智能体、缩放定律与中国发展 02-03
LLM
智能体
缩放定律 |
[自动]
[HACKER_NEWS] | 3min | newspaper
模型对齐偏差如何随智能水平与任务复杂度演变 02-03
模型对齐
智能水平
任务复杂度 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Agent Skills:大模型智能体的技能评估框架 02-03
Agent
LLM
评估框架 |
[自动]
[HACKER_NEWS] | 4min | newspaper
模型智能与任务复杂度如何影响对齐偏差 02-03
对齐
模型智能
任务复杂度 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-03
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
xAI 发布 Grok Imagine API:对标 SOTA 视频模型与 SpaceX 合并前瞻 02-03
xAI
Grok
视频生成 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Snowflake与OpenAI达成2亿美元协议引入前沿智能 02-03
Snowflake
OpenAI
企业数据 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Show HN: 反向智能体模型:应用为客户端、对话为服务器与反思机制 02-03
智能体
Agent
架构设计 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Sam Altman全员会反思:AI孵化器与公司战略 02-03
Sam Altman
OpenAI
战略 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Cosmos 策略模型提升机器人高级控制能力 02-03
NVIDIA
Cosmos
机器人 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
2026年AI展望:LLM、智能体、缩放定律与中国发展 02-03
LLM
智能体
缩放定律 |
[自动]
[HACKER_NEWS] | 4min | newspaper
模型对齐问题如何随智能水平与任务复杂度演变 02-03
模型对齐
智能水平
任务复杂度 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
xAI Grok Imagine API 登顶视频模型榜:定价与延迟优势显著 02-03
xAI
Grok
视频生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Snowflake与OpenAI达成2亿美元合作,将前沿智能引入企业数据 02-03
OpenAI
Snowflake
企业级AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Sam Altman内部会反思与AI孵化器动态 02-03
Sam Altman
OpenAI
AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI将于2026年2月退役ChatGPT内GPT‑4o等四款模型 02-03
OpenAI
ChatGPT
模型退役 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Cosmos 策略模型提升机器人控制精度 02-03
NVIDIA
Cosmos
机器人 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2026年AI展望:LLM、智能体、算力与AGI发展路径 02-03
LLM
AGI
智能体 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
xAI 推出 Grok Imagine API:对标 Sora 的视频生成能力与定价优势 02-03
xAI
Grok
Imagine API |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Snowflake与OpenAI达成2亿美元合作,将前沿智能引入企业数据 02-03
OpenAI
Snowflake
企业级AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Sam Altman的AI孵化器计划与YC模式对比 02-03
Sam Altman
YC
AI孵化器 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI将于2026年2月退役ChatGPT中GPT-4o等四款模型 02-03
OpenAI
ChatGPT
GPT-4o |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 内部数据代理:利用 GPT-5 与记忆快速分析海量数据 02-03
OpenAI
GPT-5
数据代理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Cosmos策略发布:提升机器人控制精度 02-03
NVIDIA
Cosmos
机器人 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Codex App:基于 GPT-3 的代码生成工具 02-03
GPT-3
代码生成
OpenAI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
2026年AI展望:LLM、智能体、缩放定律与中国发展 02-03
LLM
智能体
缩放定律 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Codex 应用:基于 GPT-3 的代码生成工具 02-03
GPT-3
代码生成
Codex |
[自动]
[HACKER_NEWS] | 3min | newspaper
训练万亿参数模型以生成幽默内容 02-03
LLM
万亿参数
幽默生成 |
[自动]
[ARXIV] | 3min | school
误差分类引导的提示词优化方法 02-03
提示词工程
ETGPO
自动优化 |
[自动]
[HACKER_NEWS] | 3min | newspaper
训练万亿参数模型使其具备幽默感 02-03
LLM
幽默感
万亿参数 |
[自动]
[ARXIV] | 3min | school
研究揭示RLHF如何加剧大模型谄媚行为 02-03
RLHF
谄媚行为
模型偏见 |
[自动]
[ARXIV] | 4min | school
智能体推理与工具使用的竞争:量化干扰与解调优 02-03
智能体
强化学习
工具使用 |
[自动]
[ARXIV] | 3min | school
大语言模型稀疏奖励子系统 02-03
LLM
稀疏奖励
价值神经元 |
[自动]
[ARXIV] | 4min | school
基于资格推理与分节强化学习的引理可靠利用 02-03
数学推理
引理应用
RULES |
[自动]
[HACKER_NEWS] | 5min | newspaper
Nano-vLLM 技术解析:vLLM 风格推理引擎的运行机制 02-03
vLLM
推理引擎
Nano-vLLM |
[自动]
[ARXIV] | 4min | school
DeALOG:基于日志中介的去中心化多智能体推理框架 02-03
Multi-Agent
去中心化
日志中介 |
[自动]
[HACKER_NEWS] | 4min | newspaper
AI 基准测试新进展:Game Arena 推进评估方法 02-03
AI 基准测试
Game Arena
模型评估 |
[自动]
[ARXIV] | 3min | school
粒子引导扩散模型用于偏微分方程求解 02-03
扩散模型
PDE求解
物理引导 |
[自动]
[HACKER_NEWS] | 5min | newspaper
利用Game Arena平台推进AI基准测试 02-03
AI基准测试
Game Arena
LLM评估 |
[自动]
[ARXIV] | 4min | school
函数空间逆问题的解耦扩散采样方法 02-03
扩散模型
逆问题
PDE |
[自动]
[ARXIV] | 3min | school
VideoGPA:提取几何先验实现三维一致性视频生成 02-03
VideoGPA
视频生成
3D一致性 |
[自动]
[ARXIV] | 4min | school
UPA:基于树搜索与筛选的无监督提示代理 02-03
Prompt优化
UPA
无监督学习 |
[自动]
[ARXIV] | 5min | school
TEON:张量化正交化方法优化大语言模型预训练 02-03
TEON
优化器
预训练 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Nano-vLLM 原理:vLLM 风格推理引擎的实现机制 02-03
vLLM
推理引擎
LLM |
[自动]
[ARXIV] | 4min | school
IRL-DAL:基于能量引导扩散模型的安全自适应自动驾驶轨迹规划 02-03
扩散模型
自动驾驶
轨迹规划 |
[自动]
[ARXIV] | 3min | school
粒子引导扩散模型求解偏微分方程 02-02
扩散模型
偏微分方程
PDE |
[自动]
[HACKER_NEWS] | 4min | newspaper
用Game Arena平台推进AI基准测试 02-02
AI基准测试
Game Arena
LLM评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
xAi 推出 Grok Imagine API:对标 Sora 的视频模型与性价比优势 02-02
xAI
Grok
Imagine API |
[自动]
[ARXIV] | 5min | school
VideoGPA:提取几何先验实现三维一致视频生成 02-02
视频生成
3D一致性
扩散模型 |
[自动]
[ARXIV] | 4min | school
UPA:基于树搜索与筛选的无监督提示智能体 02-02
Prompt优化
LLM智能体
无监督学习 |
[自动]
[ARXIV] | 5min | school
TEON:张量化正交化技术优化大语言模型预训练 02-02
TEON
优化器
Muon |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Snowflake与OpenAI合作:在数据平台内直接集成前沿AI模型 02-02
Snowflake
OpenAI
企业级 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Sam Altman全员大会讲话回顾:AI Combinator与未来方向 02-02
Sam Altman
OpenAI
AI Combinator |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI将于2026年2月退役ChatGPT内多款GPT‑4及o4模型 02-02
OpenAI
ChatGPT
模型退役 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 内部数据代理:利用 GPT-5 与记忆能力快速分析大规模数据集 02-02
OpenAI
GPT-5
Codex |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Cosmos 策略模型提升机器人高级控制能力 02-02
NVIDIA
Cosmos
机器人 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Nano-vLLM 原理剖析:vLLM 风格推理引擎的实现机制 02-02
vLLM
推理引擎
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Moltbook:首个面向AI智能体的社交网络平台 02-02
AI智能体
社交网络
Moltbook |
[自动]
[ARXIV] | 4min | school
IRL-DAL:基于能量引导扩散模型的自动驾驶安全自适应轨迹规划 02-02
自动驾驶
扩散模型
逆向强化学习 |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出质量异常 02-02
MLX
LLM
iPhone 16 |
[自动]
[ARXIV] | 4min | school
FOCUS:DLLMs如何突破算力瓶颈 02-02
DLLMs
扩散模型
算力优化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
2026年AI展望:LLM、智能体、算力与Scaling Laws 02-02
LLM
Scaling Laws
智能体 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI将于2026年2月退役ChatGPT中GPT‑4o等四款模型 02-02
OpenAI
ChatGPT
模型退役 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Nano-vLLM 原理:解析 vLLM 风格推理引擎机制 02-02
vLLM
推理引擎
LLM |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出质量差 02-02
MLX
LLM
iPhone |
[自动]
[BLOGS_PODCASTS] | 2min | mic
英伟达推出Cosmos策略以提升机器人控制能力 02-02
英伟达
NVIDIA
Cosmos |
[自动]
[BLOGS_PODCASTS] | 3min | mic
xAI 推出 Grok Imagine API:顶级视频模型与低延迟定价 02-02
xAI
Grok
Imagine API |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Sam Altman内部会复盘:AI Combinator与OpenAI战略走向 02-02
OpenAI
Sam Altman
AI Combinator |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI将于2026年2月下线ChatGPT中GPT-4o等四款模型 02-02
OpenAI
ChatGPT
模型下线 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 内部数据智能体:结合 GPT-5 与记忆快速分析海量数据 02-02
OpenAI
GPT-5
Codex |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Moltbook:首个面向AI智能体的社交网络平台 02-02
AI Agents
社交网络
Moltbook |
[自动]
[HACKER_NEWS] | 6min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出质量异常 02-02
MLX
LLM
Apple Silicon |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2026年AI展望:LLM、智能体、算力与Scaling Laws 02-02
LLM
智能体
Scaling Laws |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出质量差 02-02
MLX
LLM
iPhone 16 |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出质量异常 02-02
MLX
LLM
iPhone 16 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
大林建设部署ChatGPT Enterprise加速生成式AI在建筑业务落地 02-02
ChatGPT
企业落地
生成式AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
为何当下是推出科学AI播客的最佳时机及工程师关注点 02-02
AI for Science
播客
AlphaFold |
[自动]
[BLOGS_PODCASTS] | 3min | mic
xAI 发布 Grok Imagine API:对标 SOTA 视频模型与 SpaceX 合并前瞻 02-02
xAI
Grok
视频生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Sam Altman内部会复盘:OpenAI战略与AI孵化器走向 02-02
OpenAI
Sam Altman
战略 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 内部数据智能体:结合 GPT‑5 与记忆快速分析海量数据集 02-02
OpenAI
GPT-5
Codex |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Cosmos 策略模型提升机器人控制精度 02-02
NVIDIA
Cosmos
机器人 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Moltbook:首个面向AI智能体的社交网络平台 02-02
AI智能体
社交网络
Moltbook |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出质量异常 02-02
MLX
LLM
Apple Silicon |
[自动]
[BLOGS_PODCASTS] | 3min | mic
2026年AI展望:LLM、智能体、扩展定律与中国角色 02-02
LLM
智能体
扩展定律 |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出异常 02-02
MLX
LLM
iPhone 16 |
[自动]
[HACKER_NEWS] | 5min | newspaper
iPhone 16 Pro Max 运行 MLX 大模型输出质量异常 02-02
MLX
LLM
Apple Silicon |
[自动]
[ARXIV] | 3min | school
大语言模型中角色作为潜变量:机制视角下的错位与安全失效 02-02
LLM
对齐
角色扮演 |
[自动]
[ARXIV] | 3min | school
基于输出监督学习的思维链混淆技术可泛化至未见任务 02-02
思维链
CoT
输出监督 |
[自动]
[ARXIV] | 3min | school
动态认知回退机制提升策略合规安全性 02-02
LLM
安全对齐
提示工程 |
[自动]
[ARXIV] | 4min | school
SplineFlow:基于B样条插值的动力系统流匹配方法 02-02
流匹配
SplineFlow
B样条 |
[自动]
[ARXIV] | 4min | school
OrLog:结合大模型与概率推理解决复杂查询 02-02
神经符号AI
概率推理
复杂查询 |
[自动]
[ARXIV] | 4min | school
LLM语义缓存面临密钥碰撞攻击风险 02-02
语义缓存
密钥碰撞
LLM安全 |
[自动]
[ARXIV] | 4min | school
ExplainerPFN:面向表格数据的无模型零样本特征重要性估计 02-02
ExplainerPFN
TabPFN
表格数据 |
[自动]
[ARXIV] | 4min | school
CATTO:平衡语言模型偏好与置信度的方法 02-02
LLM
CATTO
校准 |
[自动]
[HACKER_NEWS] | 7min | newspaper
迈向智能体系统规模化科学:探究其生效机制与适用场景 02-02
智能体
Agent系统
规模化 |
[自动]
[ARXIV] | 6min | school
混合线性注意力新架构:高效蒸馏与超长上下文处理 02-02
HALO
HypeNet
混合架构 |
[自动]
[ARXIV] | 4min | school
推理大语言模型从被动求解到主动提问的转变 02-02
推理
CoT
主动交互 |
[自动]
[ARXIV] | 4min | school
探索面向智能体的推理奖励模型 02-02
Agentic RL
Reward Model
推理奖励 |
[自动]
[ARXIV] | 3min | school
发现模型仓库中的隐藏价值 02-02
模型评估
Llama-3.1
多臂老虎机 |
[自动]
[ARXIV] | 4min | school
UEval:统一多模态生成基准 02-02
UEval
多模态
基准测试 |
[自动]
[ARXIV] | 3min | school
Routing the Lottery: 面向异构数据的自适应子网络路由 02-02
模型剪枝
彩票假设
异构数据 |
[自动]
[ARXIV] | 4min | school
RedSage:网络安全通用大语言模型 02-02
RedSage
网络安全
垂直领域模型 |
[自动]
[ARXIV] | 4min | school
FineInstructions:将合成指令数据扩展至预训练规模 02-02
LLM
指令微调
合成数据 |
[自动]
[ARXIV] | 4min | school
DynaWeb:基于模型的强化学习网页智能体 02-02
DynaWeb
Web Agent
强化学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向智能体系统规模化科学:工作原理与适用条件 02-01
智能体
规模化
系统设计 |
[自动]
[ARXIV] | 4min | school
混合线性注意力新架构:高效蒸馏与超长上下文处理 02-01
Transformer
混合架构
线性注意力 |
[自动]
[ARXIV] | 3min | school
推理大语言模型从被动求解转向主动询问 02-01
推理
交互式推理
PIR |
[自动]
[ARXIV] | 4min | school
探索面向智能体的推理奖励模型 02-01
Agent
RLHF
奖励模型 |
[自动]
[ARXIV] | 3min | school
挖掘模型仓库中的隐藏价值 02-01
模型评估
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
为何推出首个科学AI播客恰逢其时及工程师关注点 02-01
AI for Science
AlphaFold
播客 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
xAI巩固前沿实验室地位并拟与SpaceX合并 02-01
xAI
SpaceX
Grok |
[自动]
[ARXIV] | 4min | school
UEval:统一多模态生成基准评测 02-01
UEval
多模态
基准评测 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Sam Altman提出AI孵化器模式以加速初创公司发展 02-01
Sam Altman
OpenAI
初创公司 |
[自动]
[ARXIV] | 4min | school
Routing the Lottery:面向异型数据的自适应子网络 02-01
模型剪枝
彩票假说
自适应路由 |
[自动]
[ARXIV] | 4min | school
RedSage:网络安全通用大语言模型 02-01
RedSage
网络安全
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI将于2026年2月退役多款GPT‑4及o4‑mini模型 02-01
OpenAI
GPT-4
模型退役 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Cosmos策略:面向高级机器人控制的新方案 02-01
NVIDIA
Cosmos
机器人 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Moltbook:首个面向 AI 智能体的社交网络平台 02-01
Moltbook
AI Agents
社交网络 |
[自动]
[ARXIV] | 4min | school
FineInstructions:将合成指令扩展至预训练规模 02-01
FineInstructions
合成数据
指令微调 |
[自动]
[ARXIV] | 5min | school
DynaWeb:基于模型的强化学习网页智能体 02-01
DynaWeb
Web Agent
强化学习 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
2026年AI展望:LLM、智能体、缩放定律与中国发展 02-01
LLM
智能体
缩放定律 |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向智能体系统规模化科学:作用机制与生效条件 02-01
Agent
LLM
Scaling Law |
[自动]
[HACKER_NEWS] | 4min | newspaper
构建极简编程代理的技术实践与经验总结 02-01
AI Agent
LLM
编程代理 |
[自动]
[HACKER_NEWS] | 5min | newspaper
构建极简且具倾向性的编程代理的经验总结 02-01
AI Agent
LLM
编程代理 |
[自动]
[HACKER_NEWS] | 5min | newspaper
生成式AI与维基百科编辑的2025年实践总结 02-01
生成式AI
维基百科
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
生成式 AI 与维基百科编辑:2025 年观察总结 02-01
生成式AI
维基百科
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
构建极简且具倾向性的编程代理的经验总结 02-01
AI Agent
LLM
编程代理 |
[自动]
[HACKER_NEWS] | 3min | newspaper
生成式AI与维基百科编辑:2025年经验总结 02-01
生成式AI
维基百科
LLM |
[自动]
[HACKER_NEWS] | 3min | newspaper
生成式AI与维基百科协作的2025年实践总结 02-01
生成式AI
维基百科
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
2025年生成式AI在维基百科编辑中的应用与发现 02-01
生成式AI
维基百科
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
生成式AI与维基百科编辑:2025年经验总结 02-01
生成式AI
维基百科
LLM |
[自动]
[HACKER_NEWS] | 5min | newspaper
2025年生成式AI在维基百科编辑中的应用与发现 02-01
生成式AI
维基百科
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
生成式AI与维基百科编辑:2025年观察总结 02-01
生成式AI
维基百科
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
生成式AI与维基百科编辑:2025年经验总结 02-01
生成式AI
维基百科
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
生成式AI与维基百科编辑:2025年实践经验总结 02-01
生成式AI
维基百科
LLM |
[自动]
[HACKER_NEWS] | 5min | newspaper
生成式AI与维基百科编辑:2025年观察总结 02-01
生成式AI
维基百科
LLM |
[自动]
[HACKER_NEWS] | 5min | newspaper
生成式AI与维基百科编辑的2025年实践总结 02-01
生成式AI
维基百科
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
推出世界首个科学领域AI播客及工程师关注理由 02-01
AI for Science
播客
职业发展 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
xAI推出Grok Imagine视频模型API:定价与延迟优势显著 02-01
xAI
Grok Imagine
视频模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Sam Altman全员大会讲话要点与AI孵化器计划 02-01
Sam Altman
OpenAI
AI孵化器 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI内部数据代理:结合GPT-5与记忆机制快速分析大规模数据集 02-01
OpenAI
GPT-5
数据代理 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI 将于2026年2月退役多款GPT-4及o4-mini模型 02-01
OpenAI
模型退役
GPT-4o |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Cosmos 策略模型提升机器人控制能力 02-01
NVIDIA
Cosmos
机器人 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,支持原生图文视频及百并发Agent管理 02-01
Moonshot AI
Kimi k2.5
开源模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
生成式AI与维基百科编辑:2025年实践回顾 02-01
生成式AI
维基百科
LLM |
2026年一月
300 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与超长上下文建模 01-31
线性注意力
长上下文
混合架构 |
[自动]
[ARXIV] | 4min | school
推理大语言模型从被动求解转向主动询问 01-31
LLM
推理模型
主动询问 |
[自动]
[ARXIV] | 5min | school
探索面向智能体的推理奖励模型 01-31
Agent
强化学习
奖励模型 |
[自动]
[ARXIV] | 4min | school
发现模型仓库中的隐藏价值 01-31
模型评估
Llama
多臂老虎机 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
xAI巩固前沿实验室地位并计划与SpaceX合并 01-31
xAI
Grok
SpaceX |
[自动]
[ARXIV] | 4min | school
UEval:统一多模态生成基准 01-31
多模态
UEval
基准测试 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Sam Altman在市政厅会议发言回顾 01-31
Sam Altman
OpenAI
AI Combinator |
[自动]
[ARXIV] | 4min | school
RedSage:网络安全通用大语言模型 01-31
RedSage
网络安全
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI 将于 2026 年 2 月退役多款 GPT‑4 系列模型 01-31
OpenAI
GPT-4
模型退役 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Cosmos策略:面向高级机器人控制的新方法 01-31
NVIDIA
机器人
Cosmos |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Moltbook:首个面向 AI 智能体的社交网络 01-31
AI Agents
社交网络
Moltbook |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Kimi K2.5:半价超越Sonnet 4.5,支持原生多模态与百并发Agent 01-31
Kimi k1.5
Moonshot AI
开源模型 |
[自动]
[ARXIV] | 3min | school
FineInstructions:将合成指令数据扩展至预训练规模 01-31
LLM
指令微调
合成数据 |
[自动]
[ARXIV] | 5min | school
DynaWeb:基于模型的强化学习网页智能体框架 01-31
DynaWeb
Web Agent
强化学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练900万参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练 9M 参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Show HN:我用9M参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练9M参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Show HN: 训练900万参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练9M参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi k2.5 技术报告发布:长上下文与推理能力详解 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练900万参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:模型架构与性能评估 01-31
Kimi K2.5
技术报告
模型架构 |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练9M参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Show HN:我用9M参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:模型架构与训练细节 01-31
Kimi K2.5
Moonshot AI
技术报告 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:架构与性能细节 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI 与英伟达百亿美元芯片采购交易暂停 01-31
OpenAI
英伟达
芯片 |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练9M参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI与英伟达千亿美元芯片交易暂停 01-31
OpenAI
英伟达
芯片交易 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:模型架构与性能评估 01-31
Kimi K2.5
Moonshot AI
技术报告 |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI 与英伟达价值千亿美元芯片交易暂停 01-31
OpenAI
英伟达
Nvidia |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:长上下文与多模态推理能力详解 01-31
Kimi K2.5
技术报告
长上下文 |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI 与英伟达百亿美元芯片采购谈判暂停 01-31
OpenAI
英伟达
芯片 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi k2.5 技术报告发布 01-31
Kimi
K2.5
技术报告 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Show HN: 我构建了一个用于练习口语的AI对话伙伴 01-31
AI对话
语言学习
口语练习 |
[自动]
[HACKER_NEWS] | 5min | newspaper
OpenAI 与英伟达价值千亿美元芯片交易搁浅 01-31
OpenAI
英伟达
Nvidia |
[自动]
[HACKER_NEWS] | 7min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 7min | newspaper
月之暗面发布 Kimi k2.5 技术报告 01-31
月之暗面
Kimi
K2.5 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
xAI 推出 Grok Imagine API:顶级视频模型与低延迟定价 01-31
xAI
Grok
Imagine API |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Sam Altman市政厅发言反思与AI孵化器动态 01-31
Sam Altman
OpenAI
AI Combinator |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI将于2026年2月退役GPT-4o等四款模型 01-31
OpenAI
GPT-4o
GPT-5 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 内部数据代理:结合 GPT-5 与记忆机制实现数据集快速推理 01-31
OpenAI
GPT-5
Codex |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Cosmos 策略模型提升机器人控制精度 01-31
NVIDIA
Cosmos
机器人 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,支持原生图文视频与百并发Agent管理 01-31
Moonshot
Kimi K2.5
SOTA |
[自动]
[HACKER_NEWS] | 4min | newspaper
Show HN: 构建AI语言对话伙伴辅助口语练习 01-31
语言学习
口语练习
AI对话 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Kimi K2.5 技术报告发布:模型架构与性能评估 01-31
Kimi K2.5
Moonshot AI
技术报告 |
[自动]
[ARXIV] | 4min | school
面向异构数据的自适应子网络路由机制 01-30
模型剪枝
异构数据
子网络 |
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与极长上下文处理 01-30
HALO
HypeNet
长上下文 |
[自动]
[ARXIV] | 3min | school
推理大模型从被动求解转向主动提问 01-30
推理模型
主动交互
思维链 |
[自动]
[ARXIV] | 4min | school
探索面向智能体的推理奖励模型 01-30
Agent
强化学习
推理奖励模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大林建设采用ChatGPT Enterprise推动全球建筑业务人才发展 01-30
ChatGPT
企业应用
人才发展 |
[自动]
[ARXIV] | 3min | school
发现模型仓库中被忽视的高质量模型 01-30
模型评估
Llama-3.1
微调 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
xAI 巩固前沿地位并拟与 SpaceX 合并 01-30
xAI
SpaceX
Grok |
[自动]
[ARXIV] | 3min | school
UEval:统一多模态生成基准 01-30
UEval
多模态
统一模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Sam Altman在市政厅会议回顾AI创业孵化模式 01-30
Sam Altman
Y Combinator
AI创业 |
[自动]
[ARXIV] | 5min | school
RedSage:网络安全通用大模型 01-30
RedSage
网络安全
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI将于2026年2月退役ChatGPT内多款GPT‑4及o4‑mini模型 01-30
OpenAI
ChatGPT
模型退役 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 内部数据代理:结合 GPT‑5 与记忆机制实现分钟级数据洞察 01-30
OpenAI
GPT-5
数据代理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Cosmos策略:提升机器人高级控制能力 01-30
NVIDIA
机器人
Cosmos |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,原生图文视频及百并发Agent管理 01-30
Moonshot AI
Kimi k2.5
开源模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:强化学习与长上下文能力升级 01-30
Kimi
K2.5
强化学习 |
[自动]
[ARXIV] | 4min | school
FineInstructions:将合成指令数据扩展至预训练规模 01-30
LLM
预训练
指令微调 |
[自动]
[ARXIV] | 4min | school
DynaWeb:基于模型的强化学习网页智能体 01-30
DynaWeb
Web Agent
强化学习 |
[自动]
[HACKER_NEWS] | 7min | newspaper
月之暗面发布Kimi K2.5技术报告 01-30
Kimi
K2.5
月之暗面 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-30
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 6min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-30
Kimi K2.5
技术报告
长上下文 |
[自动]
[HACKER_NEWS] | 4min | newspaper
AI辅助编程对代码技能形成的影响研究 01-30
AI辅助编程
代码技能
Copilot |
[自动]
[HACKER_NEWS] | 4min | newspaper
AI辅助编程对代码技能形成的影响研究 01-30
AI辅助编程
代码技能
学习曲线 |
[自动]
[HACKER_NEWS] | 4min | newspaper
AI 辅助编程对代码技能形成的影响研究 01-30
AI编程
代码技能
Copilot |
[自动]
[HACKER_NEWS] | 5min | newspaper
Project Genie:无限交互式世界的实验探索 01-30
Project Genie
无限世界
交互式 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
为何现在推出全球首个科学AI播客及其对工程师的意义 01-30
AI for Science
AlphaFold
播客 |
[自动]
[HACKER_NEWS] | 3min | newspaper
OpenAI 将在 ChatGPT 中下架 GPT-4o 等四款模型 01-30
OpenAI
ChatGPT
GPT-4o |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Moonshot K2.5:成本减半超越Sonnet 4.5,原生图文视频与百并发Agent管理 01-30
Moonshot
Kimi k2.5
开源模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI 将在 ChatGPT 中停用 GPT-4o 等四款模型 01-30
OpenAI
ChatGPT
GPT-4o |
[自动]
[HACKER_NEWS] | 4min | newspaper
AI 辅助编程对代码技能形成的影响研究 01-30
AI辅助编程
代码技能
学习曲线 |
[自动]
[HACKER_NEWS] | 4min | newspaper
AGENTS.md 架构在智能体评估中超越 Skills 技能 01-30
智能体
评估
AGENTS.md |
[自动]
[HACKER_NEWS] | 4min | newspaper
Project Genie:探索无限交互世界的实验 01-30
Project Genie
无限交互
AI 实验 |
[自动]
[HACKER_NEWS] | 5min | newspaper
OpenAI 将在 ChatGPT 中下架 GPT-4o 等四款模型 01-30
OpenAI
ChatGPT
GPT-4o |
[自动]
[HACKER_NEWS] | 5min | newspaper
OpenAI 将在 ChatGPT 中下架 GPT-4o 等四款模型 01-30
OpenAI
ChatGPT
GPT-4o |
[自动]
[HACKER_NEWS] | 5min | newspaper
人工智能如何重塑技能形成机制 01-30
技能重塑
AI影响
教育变革 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Project Genie:无限交互世界的实验性探索 01-30
Project Genie
无限交互
世界模拟 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Agent评估显示AGENTS.md配置优于Skills 01-30
Agent
评估
AGENTS.md |
[自动]
[HACKER_NEWS] | 4min | newspaper
Project Genie:无限交互世界的实验探索 01-30
Project Genie
无限交互
世界模拟 |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI 将在 ChatGPT 中下架 GPT-4o 等多款模型 01-30
OpenAI
ChatGPT
GPT-4o |
[自动]
[HACKER_NEWS] | 4min | newspaper
AI 辅助编程对代码技能形成的影响研究 01-30
AI编程
代码技能
Copilot |
[自动]
[HACKER_NEWS] | 5min | newspaper
AGENTS.md 架构在智能体评估中优于 Skills 架构 01-30
智能体
Agent
AGENTS.md |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI 将在 ChatGPT 中停用 GPT-4o 等四款模型 01-30
OpenAI
ChatGPT
GPT-4o |
[自动]
[HACKER_NEWS] | 4min | newspaper
Agent评估显示AGENTS.md配置优于Skills 01-30
Agent
LLM
AGENTS.md |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Sam Altman内部会复盘与YC孵化模式对比 01-30
Sam Altman
OpenAI
YC |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI将于2026年2月退役ChatGPT中多款GPT‑4及o4模型 01-30
OpenAI
ChatGPT
模型退役 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 内部数据代理:结合 GPT-5 与记忆机制实现分钟级数据洞察 01-30
OpenAI
GPT-5
数据智能体 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
NVIDIA Cosmos 策略模型:提升机器人高级控制能力 01-30
NVIDIA
Cosmos
机器人 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Agent评估显示AGENTS.md配置优于技能配置 01-30
Agent
AGENTS.md
技能配置 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Agent评估显示AGENTS.md配置优于Skills 01-30
Agent
AGENTS.md
Skills |
[自动]
[ARXIV] | 3min | school
面向大语言模型的时间引导机制 01-30
LLM
对比解码
时间引导 |
[自动]
[ARXIV] | 3min | school
基于认知上下文学习构建大模型多智能体系统的信任机制 01-30
多智能体
信任机制
ECL |
[自动]
[ARXIV] | 3min | school
基于经验的试错算法超越语言模型 01-30
LLM
SCOUT
探索与利用 |
[自动]
[ARXIV] | 3min | school
EWSJF:面向混合负载LLM推理的自适应调度器 01-30
LLM推理
调度器
vLLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
AGENTS.md 架构在智能体评估中超越 Skills 技能 01-30
智能体
Agent
评估 |
[自动]
[ARXIV] | 3min | school
进化策略导致大语言模型出现灾难性遗忘 01-30
进化策略
灾难性遗忘
持续学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
编码代理的成功对通用AI系统的启示 01-30
AI Agent
编码代理
LLM |
[自动]
[ARXIV] | 4min | school
机器翻译评估中的跨向污染问题研究 01-30
机器翻译
数据污染
FLORES-200 |
[自动]
[ARXIV] | 4min | school
后训练公平性控制:推荐系统动态公平性单训练框架 01-30
推荐系统
公平性
Cofair |
[自动]
[ARXIV] | 4min | school
SokoBench:评估大模型长周期规划与推理能力 01-30
SokoBench
长周期规划
推理能力 |
[自动]
[ARXIV] | 3min | school
PatchFormer:基于分层掩码重建的零样本多步预测时序基础模型 01-30
时间序列
PatchFormer
零样本预测 |
[自动]
[ARXIV] | 4min | school
Deep Researcher:结合序列规划反思与候选交叉的深度研究框架 01-30
Deep Researcher
AI Agent
智能体架构 |
[自动]
[HACKER_NEWS] | 5min | newspaper
压缩智能体:Agent Skills 技术解析 01-30
Agent
LLM
技术解析 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Project Genie:无限交互式世界的实验性探索 01-30
Project Genie
无限世界
交互式 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
推出全球首个科学AI播客及工程师应关注的时机 01-30
AI播客
科学AI
AI工程师 |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI 将在 ChatGPT 中停用 GPT-4o 等四款模型 01-30
OpenAI
ChatGPT
GPT-4o |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,原生图文视频与百并发Agent管理 01-30
Moonshot AI
Kimi k2.5
开源模型 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Compressed Agents:Agent Skills 技术解析 01-30
Agent
LLM
技术解析 |
[自动]
[ARXIV] | 4min | school
进化策略导致大语言模型出现灾难性遗忘 01-29
进化策略
灾难性遗忘
持续学习 |
[自动]
[ARXIV] | 3min | school
机器翻译评估中的跨向污染问题研究 01-29
机器翻译
数据污染
FLORES |
[自动]
[BLOGS_PODCASTS] | 2min | mic
推出全球首个科学AI播客:为何AI工程师应关注 01-29
AI for Science
科学智能
播客 |
[自动]
[ARXIV] | 4min | school
SokoBench:评估大模型长程规划与推理能力 01-29
SokoBench
长程规划
推理能力 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Sam Altman 全员大会复盘与 AI Combinator 解析 01-29
OpenAI
Sam Altman
AGI |
[自动]
[HACKER_NEWS] | 7min | newspaper
Project Genie:无限交互世界的实验性探索 01-29
Project Genie
交互世界
无限生成 |
[自动]
[ARXIV] | 5min | school
PatchFormer:基于分层掩码重建的零样本多步预测时序基础模型 01-29
时序预测
PatchFormer
零样本学习 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI内部数据代理:结合GPT‑5与记忆快速分析海量数据 01-29
OpenAI
GPT-5
Codex |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI 将在 ChatGPT 中下架 GPT-4o 等四款模型 01-29
OpenAI
ChatGPT
GPT-4o |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 如何防范 AI 代理点击链接时的数据外泄与提示注入 01-29
OpenAI
AI Agent
提示注入 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Cosmos策略:提升机器人控制能力 01-29
NVIDIA
机器人
Cosmos |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,支持原生图文视频 01-29
Moonshot AI
Kimi k2.5
开源模型 |
[自动]
[ARXIV] | 3min | school
Deep Researcher:序列规划反思与候选交叉 01-29
Deep Researcher
AI Agent
反思机制 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Agent Skills:压缩智能体技能以提升模型效率 01-29
Agent
模型压缩
效率优化 |
[自动]
[HACKER_NEWS] | 5min | newspaper
苹果收购以色列创企Q.ai 加速AI布局 01-29
苹果
Apple
收购 |
[自动]
[HACKER_NEWS] | 3min | newspaper
OpenAI 将在 ChatGPT 中停用 GPT-4o 等四款模型 01-29
OpenAI
ChatGPT
GPT-4o |
[自动]
[BLOGS_PODCASTS] | 3min | mic
让 Claude 编写 CUDA 内核并指导开源模型 01-29
Claude
CUDA
内核开发 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
推出全球首个科学领域AI播客及工程师关注理由 01-29
AI for Science
播客
科学发现 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Sam Altman全员大会反思与AI孵化器动态 01-29
Sam Altman
OpenAI
战略转型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
OpenAI内部数据智能体:自动化数据分析与决策 01-29
OpenAI
Data Agent
数据分析 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 如何在 AI 代理点击链接时保护用户数据安全 01-29
OpenAI
AI Agent
数据安全 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Moonshot Kimi K2.5:半价超越Sonnet 4.5,原生图文视频与百并发Agent管理 01-29
Kimi k2.5
Moonshot AI
月之暗面 |
[自动]
[HACKER_NEWS] | 5min | newspaper
OpenAI内部数据智能体:自动化分析SQL数据库 01-29
OpenAI
Data Agent
SQL |
[自动]
[BLOGS_PODCASTS] | 3min | mic
让 Claude 编写 CUDA 内核并指导开源模型 01-29
Claude
CUDA
代码生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
中国开源AI生态的架构选择:超越DeepSeek的构建路径 01-29
DeepSeek
架构选型
中国AI |
[自动]
[BLOGS_PODCASTS] | 4min | mic
OpenAI 如何通过内置安全机制防范 AI 代理点击链接时的数据泄露与提示词注入 01-29
OpenAI
AI代理
数据泄露 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Moonshot Kimi K2.5:成本减半超越Sonnet 4.5,支持原生图文与百并发智能体 01-29
Moonshot AI
Kimi k2.5
开源模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Alyah:评估阿拉伯语大模型阿联酋方言能力 01-29
LLM
阿拉伯语
方言评估 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
为何推出首个科学AI播客及工程师应关注的原因 01-29
AI for Science
科学智能
几何深度学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Sam Altman的AI孵化器:OpenAI加速初创公司生态布局 01-29
OpenAI
Sam Altman
AI Combinator |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Nemotron-Personas-Brazil:主权AI协同设计数据集 01-29
主权AI
数据集
Nemotron |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Moonshot Kimi K25:成本减半超越Sonnet 45,原生图文视频与百并发Agent管理 01-29
Moonshot AI
Kimi k2.5
开源模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Trinity Large:开源4000亿稀疏MoE模型 01-29
MoE
稀疏模型
Trinity |
[自动]
[HACKER_NEWS] | 4min | newspaper
Trinity Large:开源4000亿稀疏MoE模型 01-29
MoE
稀疏模型
Trinity |
[自动]
[HACKER_NEWS] | 4min | newspaper
Trinity Large:开源4000亿稀疏MoE模型 01-29
MoE
稀疏模型
Trinity |
[自动]
[HACKER_NEWS] | 4min | newspaper
Trinity Large:开源4000亿稀疏MoE模型 01-29
MoE
稀疏模型
Trinity |
[自动]
[HACKER_NEWS] | 5min | newspaper
谷歌将 Gemini 模型集成至 Chrome 浏览器 01-29
Gemini
Chrome
Google |
[自动]
[HACKER_NEWS] | 7min | newspaper
Trinity Large:开源4000亿稀疏MoE模型 01-29
MoE
稀疏模型
Trinity |
[自动]
[HACKER_NEWS] | 5min | newspaper
Trinity Large:开源4000亿参数稀疏MoE模型 01-29
MoE
稀疏模型
Trinity |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发布《欧盟经济蓝图2.0》加速欧洲AI应用与增长 01-29
OpenAI
欧盟
AI应用 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
让 Claude 编写 CUDA 内核并指导开源模型 01-29
Claude 3.5
CUDA
微调 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
推出全球首个专注科学的人工智能播客及工程师关注理由 01-29
AI for Science
AlphaFold
GNN |
[自动]
[BLOGS_PODCASTS] | 2min | mic
中国开源AI生态架构选择:DeepSeek之外的路径 01-29
DeepSeek
MoE
混合专家模型 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Trinity Large:开源4000亿稀疏MoE模型 01-29
MoE
稀疏模型
Trinity |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI发布欧盟经济蓝图2.0 加速欧洲AI应用与增长 01-29
OpenAI
欧盟
经济蓝图 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
OpenAI 如何防范 AI 代理点击链接时的数据泄露与提示注入 01-29
OpenAI
AI Agent
安全防护 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nemotron-Personas-Brazil:主权AI协作设计数据集 01-29
主权AI
Nemotron
葡萄牙语 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Moonshot Kimi K2.5:半价超越Sonnet 4.5,支持原生图文视频与百并发智能体 01-29
Moonshot AI
Kimi k2.5
Sonnet 4.5 |
[自动]
[HACKER_NEWS] | 5min | newspaper
LM Studio 0.4 发布:支持本地运行 Llama 3 与多模型并行 01-29
LM Studio
Llama 3
本地部署 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
Anthropic 发布 MCP Apps 开放标准,定义富生成式 UI 规范 01-29
Anthropic
MCP
Claude |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Alyah:评估阿拉伯语大模型阿联酋方言能力 01-29
LLM
模型评估
阿拉伯语 |
[自动]
[ARXIV] | 4min | school
无需真值!🔥颠覆性校准技术来了!🤯 01-28
模型校准
无监督学习
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
中国开源AI生态:超越DeepSeek的架构突围!🏗️🔥 01-28
DeepSeek
MoE
架构设计 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
PVH携手OpenAI重塑时尚未来!🚀AI赋能,开启无限可能✨ 01-28
OpenAI
ChatGPT Enterprise
时尚行业 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Alyah ⭐️:阿拉伯语LLM方言鲁棒性评估!🔥 01-28
LLM
阿拉伯语
方言评估 |
[自动]
[ARXIV] | 4min | school
AI碳交易!让效率、可持续性与可及性共赢!🌱⚡ 01-28
AI碳交易
总量管制与交易
绿色AI |
[自动]
[ARXIV] | 4min | school
🚀低资源机器翻译的救星!结构化自反思引领新突破✨ 01-28
机器翻译
低资源语言
自反思 |
[自动]
[ARXIV] | 5min | school
🚀SONIC: 颠覆频谱学习!神经网络不变性卷积的终极突破? 01-28
SONIC
频谱学习
神经网络 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
🚀Claude.ai重大更新!Anthropic发布MCP Apps开放规范 01-28
Anthropic
Claude
MCP |
[自动]
[HACKER_NEWS] | 4min | newspaper
🚀AI2重磅开源!Open Coding Agents:AI写代码的革命来了! 01-28
AI Agents
AI2
Open Coding Agents |
[自动]
[ARXIV] | 4min | school
🔥肿瘤会诊新革命!LLM系统Oncotimia惊艳亮相! 01-28
LLM
RAG
医疗AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🔥实战复盘:解锁GPT-OSS的智能体RL训练秘籍! 01-28
强化学习
智能体
Llama |
[自动]
[ARXIV] | 6min | school
🔥Post-LayerNorm强势回归!稳定、高效、深度训练的新神器! 01-28
Transformer
Post-LayerNorm
Keel |
[自动]
[ARXIV] | 5min | school
✨告别遗忘!Self-Distillation解锁持续学习新范式! 01-28
持续学习
Self-Distillation
灾难性遗忘 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🇧🇷主权AI新突破!Nemotron-Personas-Brazil:共创数据引领未来 01-28
主权AI
Nemotron
NVIDIA |
[自动]
[BLOGS_PODCASTS] | 3min | mic
PVH × OpenAI:时尚界的未来革命!🚀👗 01-28
OpenAI
ChatGPT Enterprise
时尚科技 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-OSS实战复盘:解锁Agentic RL训练的突破性路径!🚀 01-28
GPT-OSS
强化学习
RL训练 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Claude编码实战笔记:几周深度使用后的意外发现!💡 01-28
Claude
LLM
代码生成 |
[自动]
[HACKER_NEWS] | 4min | newspaper
AI2开源最强智能体!自动写代码的超级工程师🚀 01-28
AI Agents
AI2
SWE-bench |
[自动]
[ARXIV] | 4min | school
🚚🚀多目标强化学习!让卡车在高速车流中决策更高效、更智能! 01-28
强化学习
PPO
多目标优化 |
[自动]
[BLOGS_PODCASTS] | 6min | mic
🚀重磅!Anthropic发布MCP开放规范,Claude生态迎来大升级! 01-28
Anthropic
Claude
MCP |
[自动]
[HACKER_NEWS] | 4min | newspaper
🚀用LLM重写ZORKS!让AI玩转文字冒险游戏,这波操作太硬核了! 01-28
LLM
Zork
文字冒险游戏 |
[自动]
[ARXIV] | 4min | school
🚀复用FLOPs!RL突破性扩展:超离策略前缀如何解决硬难题? 01-28
强化学习
RL
LLM |
[自动]
[ARXIV] | 4min | school
🚀ctELM:用ELM解码临床试验嵌入!精准操控💡 01-28
ctELM
临床试验
嵌入空间 |
[自动]
[ARXIV] | 4min | school
🔥模型自学革命!突破可学习性边界,推理能力暴涨! 01-28
SOAR
强化学习
推理能力 |
[自动]
[ARXIV] | 5min | school
🔥POPE:利用特权探索破解硬核难题! 01-28
POPE
强化学习
LLM |
[自动]
[ARXIV] | 4min | school
💥MortalMATH:当推理目标遇上紧急场景,AI会“翻车”吗? 01-28
LLM
推理模型
MortalMATH |
[自动]
[ARXIV] | 4min | school
🎭LLM如何颠覆互动叙事?Dramamancer案例揭秘设计黑科技! 01-28
LLM
互动叙事
游戏设计 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🌍 NVIDIA Earth-2开源模型霸榜!覆盖全气象栈! 01-28
NVIDIA
Earth-2
气象预报 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🇨🇳中国开源AI生态:破局DeepSeek!架构选择的深层洞察 01-28
DeepSeek
Qwen
MoE |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🇦🇪 Alyah ⭐️:揭秘阿拉伯LLM方言鲁棒评估! 01-28
LLM
阿拉伯语
方言评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
阿联酋方言评测新突破!Alyah让阿拉伯语大模型更鲁棒🚀 01-27
Alyah
阿拉伯语
方言评测 |
[自动]
[ARXIV] | 4min | school
突破极限!AI如何教会自己推理?🤯 边缘学习性的惊天秘密!🚀 01-27
SOAR
强化学习
元学习 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
实战复盘:解锁GPT-OSS智能体强化训练!🚀 01-27
强化学习
智能体
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
PVH携手OpenAI颠覆时尚界!🔥重塑未来的创新革命!🤖✨ 01-27
OpenAI
ChatGPT Enterprise
时尚科技 |
[自动]
[ARXIV] | 4min | school
MortalMATH:当推理目标遇上紧急语境,冲突何解?🧠🔥 01-27
LLM
模型评估
安全对齐 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Indeed如何用AI颠覆求职?🤖✨ 招聘效率革命! 01-27
Indeed
招聘
求职 |
[自动]
[ARXIV] | 5min | school
ctELM:用LLM解码临床试验嵌入!解锁临床新价值🔥 01-27
ctELM
临床试验
嵌入语言模型 |
[自动]
[ARXIV] | 4min | school
🚛🚦高速公路卡车决策新突破!多目标强化学习让战术决策更高效! 01-27
强化学习
PPO
多目标优化 |
[自动]
[ARXIV] | 5min | school
🚀RL新突破!复用FLOPs,硬难题上通过离线前缀扩展 01-27
PrefixRL
强化学习
LLM |
[自动]
[ARXIV] | 4min | school
🔥POPE:用特权探索让AI学会解决复杂难题! 01-27
强化学习
LLM
推理能力 |
[自动]
[ARXIV] | 4min | school
🎭LLM驱动的交互式叙事设计:Dramamancer案例研究!🚀 01-27
LLM
交互式叙事
游戏设计 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
🌍NVIDIA Earth-2开放模型覆盖全气象栈!精准预测未来🌦️ 01-27
NVIDIA
Earth-2
气象预测 |
[自动]
[ARXIV] | 4min | school
🌍 跨242种语言!用子词模型解锁比较语言学新视角! 01-27
比较语言学
子词模型
BPE |
[自动]
[BLOGS_PODCASTS] | 4min | mic
🇨🇳中国开源AI生态:深求之外,架构如何突围?🚀 01-27
DeepSeek
架构设计
MoE |
[自动]
[HACKER_NEWS] | 3min | newspaper
🚀Kimi K2.5震撼开源!视觉SOTA级智能模型,性能炸裂! 01-27
Kimi K2.5
Moonshot AI
视觉模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🤖Indeed如何用AI颠覆求职体验?招聘效率飙升! 01-27
Indeed
AI应用
招聘 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
揭秘Agentic RL训练!GPT-OSS实战回顾,核心干货🔥 01-27
Agentic RL
强化学习
GPT-OSS |
[自动]
[BLOGS_PODCASTS] | 3min | mic
PVH x OpenAI:开启时尚未来!🚀✨ 01-27
OpenAI
ChatGPT Enterprise
PVH |
[自动]
[BLOGS_PODCASTS] | 5min | mic
🚀重大!Anthropic发布MCP开放标准,Claude.ai生态大爆发! 01-27
Anthropic
Claude
MCP |
[自动]
[HACKER_NEWS] | 4min | newspaper
🚀Kimi K2.5重磅开源!视觉SOTA级Agent模型,AI新王炸? 01-27
Kimi
Moonshot AI
K1.5 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
💡颠覆传统!Praktika对话式语言学习法:让开口说英语像呼吸一样自然! 01-27
Praktika
语言学习
AI 导师 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
🌍NVIDIA Earth-2 开放模型!解锁全栈天气预报的终极力量 🚀 01-27
NVIDIA
Earth-2
CorrDiff |
[自动]
[BLOGS_PODCASTS] | 3min | mic
⭐️Alyah:阿联酋方言能力评估!阿拉伯语LLM新突破! 01-27
LLM
阿拉伯语
方言评估 |
[自动]
[HACKER_NEWS] | 4min | newspaper
🤯ChatGPT容器解锁!bash/安装包/下载文件全能! 01-27
ChatGPT
OpenAI
高级数据分析 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
颠覆传统!Praktika对话式语言学习,让你开口即会话!🚀 01-27
Praktika
语言学习
AI 导师 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Kimi K2.5震撼开源!视觉SOTA Agent模型,性能炸裂🔥 01-27
Kimi
K2.5
多模态 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🚀GPT-OSS智能体RL训练解密!从0到1实战复盘🔥 01-27
强化学习
Agent
GPT-OSS |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔥Model Market Fit!PMF的终极解法?你的模型真的适配市场吗? 01-27
Model Market Fit
PMF
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
🌍NVIDIA Earth-2开放模型震撼发布!全栈天气预测新纪元!🚀 01-27
NVIDIA
Earth-2
天气预报 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🧠炸裂!Gemini Flash在俄罗斯大战Opus胜率66%!🚀 01-27
Gemini Flash
Claude Opus
TetrisBench |
[自动]
[BLOGS_PODCASTS] | 4min | mic
颠覆语言学习!揭秘Praktika的对话式魔法 🗣️✨ 01-27
Praktika
语言学习
AI 导师 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
揭秘GPT-5职场革命!企业如何用它降本增效?🚀💼 01-27
GPT-5
职场应用
降本增效 |
[自动]
[HACKER_NEWS] | 3min | newspaper
我把10年Apple Watch数据扔给ChatGPT,结果惊出一身冷汗!😱🩺 01-27
ChatGPT
数据分析
健康数据 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Unlocking Agentic RL Training for GPT-OSS: A Practical Retrospective 01-27
Agentic RL
强化学习
GPT-OSS |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Higgsfield让灵感秒变大片级社媒视频!🎬✨ 01-27
Higgsfield
Sora
GPT-4 |
[自动]
[HACKER_NEWS] | 3min | newspaper
ChatGPT容器爆发!🔥能跑bash/装包/下载,代码能力狂飙!🚀 01-27
ChatGPT
OpenAI
代码解释器 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🌍NVIDIA Earth-2开放模型横扫气象全栈!精准预测未来!🚀 01-27
NVIDIA
Earth-2
气象预测 |
[自动]
[HACKER_NEWS] | 3min | newspaper
阿里Qwen3-Max-Thinking深度思考模型!震撼发布🔥 01-27
Qwen3
通义千问
深度思考 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AssetOpsBench:填补AI基准与工业现实的鸿沟!🤖🏭🚀 01-27
AssetOpsBench
AI Agent
LLM |
[自动]
[ARXIV] | 5min | school
🚗AgentDrive重磅发布!首个Agent推理开源自驾数据集🔥 01-27
AgentDrive
自动驾驶
Agent AI |
[自动]
[ARXIV] | 5min | school
🚀AnyView:动态场景任意新视角合成!开创性技术突破🔥 01-27
计算机视觉
视频生成
扩散模型 |
[自动]
[ARXIV] | 5min | school
🔥自回归+掩码扩散!下一代生成模型架构强势登场! 01-27
扩散模型
自回归
语言建模 |
[自动]
[ARXIV] | 6min | school
🔥LLM训练动力学新突破!可扩展损失景观曲率度量! 01-27
LLM
训练动力学
损失景观 |
[自动]
[ARXIV] | 6min | school
🔥LLM序列标注新突破!揭秘高效策略,性能飙升! 01-27
LLM
序列标注
NLP |
[自动]
[ARXIV] | 4min | school
🔥IoT攻击数据生成新突破!Latent Diffusion助力入侵检测🚀 01-27
IoT
入侵检测
潜在扩散模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
💥GPT-5商业实战!企业如何引爆生产力革命?🚀 01-27
GPT-5
企业应用
生产力 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
💡颠覆传统!Praktika对话式语言学习法,让你开口即流利! 01-27
Praktika
语言学习
GPT-4 |
[自动]
[ARXIV] | 5min | school
🌍Spatial-Agent:科学核心驱动的智能地理空间推理!🚀 01-27
Spatial-Agent
Agent
地理空间推理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🌍NVIDIA Earth-2开放模型震撼发布!覆盖全气象栈,预测能力再升级! 01-27
NVIDIA
Earth-2
气象预测 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🌍 Edu for Countries 重磅发布!赋能国家级教育的创新方案 🚀 01-27
OpenAI
教育科技
AI教育 |
[自动]
[HACKER_NEWS] | 4min | newspaper
⚡️俄罗斯方块爆杀Opus!Gemini Flash胜率66%震撼实测🎮 01-27
LLM
Gemini Flash
Claude Opus |
[自动]
[ARXIV] | 6min | school
⚛️ 基于SE(3)流的刚性 motifs 3D 分子生成!🔥 01-27
分子生成
SE(3)
等变模型 |
[自动]
[HACKER_NEWS] | 3min | newspaper
震惊!Gemini Flash击败Opus!🎮Tetris胜率66%🚀 01-27
LLM
Gemini Flash
Claude 3 Opus |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Praktika对话式语言学习:颠覆传统,高效掌握新语言!🚀🗣️ 01-27
语言学习
GPT-4
AI 导师 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
🚀重磅!Edu for Countries 横空出世!国家级教育升级方案来了! 01-27
OpenAI
教育科技
AI教育 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🚀Qwen3-Max-Thinking发布!AI推理能力炸裂升级! 01-27
Qwen3
通义千问
思维链 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🚀GPT-5商用实战!企业如何用AI实现10倍效率增长?💼✨ 01-27
GPT-5
企业应用
效率提升 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🔥AssetOpsBench填平鸿沟!AI Agent基准测评如何真实落地工业场景? 01-27
AI Agent
LLM
基准测试 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
💥从创意到大片级社媒视频!Higgsfield如何颠覆视频制作?🎥✨ 01-27
Higgsfield
视频生成
Sora 2 |
[自动]
[ARXIV] | 4min | school
🧬重磅!基于SE(3)流的刚体模态3D分子生成! 01-26
3D分子生成
SE(3)流
刚体模态 |
[自动]
[HACKER_NEWS] | 4min | newspaper
谷歌健康搜索惊现YouTube>医疗网站?AI Overview引争议!🤖🏥 01-26
Google
AI Overview
搜索 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
终结能力过剩!国家如何解锁科技潜力?🔓🚀 01-26
AI
生产力
国家战略 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
告别无序扩张!🚀实现高质量规模化增长,拒绝平庸! 01-26
规模化
高质量增长
2026计划 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Praktika的对话式语言学习法!沉浸式互动,轻松掌握语言 🗣️✨ 01-26
Praktika
语言学习
GPT-4 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AssetOpsBench:打破AI Agent评测与工业现实的壁垒!🚀 01-26
AI Agent
AssetOpsBench
工业智能 |
[自动]
[ARXIV] | 5min | school
AgentDrive:首个开放基准!🚗 LLM生成场景驱动Agent智能推理 01-26
AgentDrive
自动驾驶
基准测试 |
[自动]
[ARXIV] | 5min | school
🚀动态场景新视角合成!AnyView实现任意视角自由切换!🤯 01-26
动态场景
新视角合成
扩散模型 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🚀OracleGPT震撼实验:AI能否成为下一代超级高管? 01-26
OracleGPT
AI Agent
企业管理 |
[自动]
[ARXIV] | 5min | school
🚀 自回归+掩码扩散:下一代生成式AI!🔥 01-26
扩散模型
自回归
生成式AI |
[自动]
[BLOGS_PODCASTS] | 4min | mic
🚀 GPT-5职场革命!企业如何用它10倍提升生产力? 01-26
GPT-5
ChatGPT
企业应用 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔥Qwen3-Max-Thinking!深度推理颠覆想象! 01-26
Qwen
通义千问
深度推理 |
[自动]
[ARXIV] | 5min | school
🔥LLM训练动力学新突破!可扩展损失景观曲率度量🚀 01-26
LLM
训练动力学
损失景观 |
[自动]
[ARXIV] | 5min | school
🔥LLM序列标注新策略!突破性能天花板🚀 01-26
LLM
序列标注
NER |
[自动]
[BLOGS_PODCASTS] | 4min | mic
🌍英伟达Earth-2开放模型震撼登场!🚀全栈天气预测彻底变革 01-26
NVIDIA
Earth-2
天气预报 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🌍 重磅!Edu for Countries 革命性教育解决方案,赋能国家未来!🚀 01-26
OpenAI
教育
政府合作 |
[自动]
[ARXIV] | 5min | school
🌍 Spatial-Agent:具科学核心的智能体地理空间推理! 01-26
Spatial-Agent
地理空间推理
GeoFlow Graphs |
[自动]
[HACKER_NEWS] | 3min | newspaper
⚡️震惊!仅1个LLL就能控制无人机?AI飞行革命来了!🚀 01-26
LLM
GPT-4o
无人机 |
[自动]
[HACKER_NEWS] | 3min | newspaper
震惊!仅1个大模型能操控无人机!🚀🤯 01-26
LLM
AI Agent
无人机 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Google震惊!健康查询竟引YouTube胜过医疗网站?🏥📹 01-26
Google
AI Overviews
搜索 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
🗣️告别死记硬背!Praktika对话式语言学习:开口就能流利说! 01-26
语言学习
AI 导师
GPT-4 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
终结能力过剩!国家如何破局?🚀💡 01-26
AI
LLM
国家战略 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
告别混乱扩张!🚀 系统化规模化:精准、高效、可复制!🎯 01-26
Latent Space
Scaling
2026计划 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
一秒变大片!🎬Higgsfield:让创意瞬间炸裂社交媒体!🚀 01-26
Higgsfield
视频生成
Sora 2 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AssetOpsBench:AI Agent基准测试与工业现实鸿沟如何跨越?🤖🔥 01-26
AI Agent
基准测试
工业运维 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🚀Horizon 1000:颠覆基层医疗!AI如何重塑未来? 01-26
OpenAI
盖茨基金会
Horizon 1000 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔍 深度拆解:AI伪造数学证明的惊人真相!🚀 01-26
LLM
幻觉
数学证明 |
[自动]
[HACKER_NEWS] | 3min | newspaper
💥文本为王!揭秘AI时代最被低估的核心价值! 01-26
LLM
RAG
语义检索 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🌍 重磅!Edu for Countries:赋能国家级教育的未来! 01-26
OpenAI
教育科技
国家战略 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🤖AI竟伪造数学证明?深扒“创意数学”背后的惊人真相! 01-26
AI
数学证明
形式化验证 |
[自动]
[ARXIV] | 6min | school
🤖抽屉打不开?揭秘零样本组合动作识别中的“物体捷径”! 01-25
计算机视觉
零样本学习
动作识别 |
[自动]
[ARXIV] | 4min | school
🤖反事实训练!让模型学会靠谱又可落地的解释! 01-25
反事实训练
模型解释性
可解释AI |
[自动]
[ARXIV] | 4min | school
🛡️多模态大模型鲁棒性突破!特征空间平滑实现可证防御! 01-25
多模态大模型
鲁棒性
对抗攻击 |
[自动]
[ARXIV] | 7min | school
高效定理证明新突破!结构化提示实现少样本学习 🚀 01-25
定理证明
Lean
DeepSeek-Prover |
[自动]
[ARXIV] | 3min | school
超越预测不确定性!🚀结构约束下的可靠表征学习!🔥 01-25
表征学习
不确定性
结构约束 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
终结能力过剩!国家如何打破增长瓶颈?🔥🚀 01-25
AI应用
生产力
国家战略 |
[自动]
[ARXIV] | 4min | school
测试时也能发现新规律?🤯AI解锁动态学习能力! 01-25
TTT-Discover
测试时训练
强化学习 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
揭秘GPT-5如何颠覆职场!企业实战应用全解析🚀💼 01-25
GPT-5
企业应用
职场效率 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Praktika对话式语言学习:颠覆传统,AI对话让你轻松开口!🗣️✨ 01-25
语言学习
GPT-4
GPT-5 |
[自动]
[HACKER_NEWS] | 4min | newspaper
David Patterson重磅:LLM推理硬件的挑战与研究🚀! 01-25
LLM推理
硬件架构
David Patterson |
[自动]
[ARXIV] | 5min | school
Cosmos重磅:微调视频模型!解锁 visuomotor 控制与规划 🚀✨ 01-25
Cosmos
机器人
视觉运动控制 |
[自动]
[ARXIV] | 5min | school
🚀沙盒机制唤醒LLM智能体通用能力!AI Agent突破性架构! 01-25
LLM
AI Agent
沙盒机制 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🚀Horizon 1000:AI如何引爆基层医疗革命?💡 01-25
OpenAI
盖茨基金会
Horizon 1000 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🚀 国家级教育升级!Edu for Countries:开启智慧教育新时代! 01-25
OpenAI
教育科技
智慧教育 |
[自动]
[ARXIV] | 5min | school
🔥PyraTok!视频生成神器:语言对齐金字塔Tokenizer震撼来袭! 01-25
PyraTok
视频生成
视频理解 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔥 视频修复难题:如何攻克时间一致性? 01-25
视频修复
时序一致性
光流 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
🎬 Higgsfield:让简单idea秒变电影级社媒大片!✨ 01-25
Higgsfield
视频生成
Sora 2 |
无匹配条目