目录
幻觉
条目:19
2026年二月
12 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 3min | newspaper
53款模型“洗车”测试:评估多模态AI在物理场景中的表现 02-24
多模态
物理场景
模型评估 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示主流AI模型向弱势用户提供的信息准确性较低 02-21
偏见
幻觉
数字鸿沟 |
[自动]
[HACKER_NEWS] | 4min | newspaper
大语言模型推理失败机制分析 02-21
LLM
推理
逻辑错误 |
[自动]
[HACKER_NEWS] | 3min | newspaper
不要轻信盐值:AI摘要、多语言安全与大模型防护 02-20
LLM安全
AI摘要
多语言 |
[自动]
[HACKER_NEWS] | 4min | newspaper
警惕AI总结幻觉:多语言安全与大模型护栏机制 02-19
LLM
幻觉
护栏机制 |
[自动]
[HACKER_NEWS] | 4min | newspaper
警惕AI总结幻觉:多语言安全与大模型防护机制 02-19
LLM
幻觉
安全防护 |
[自动]
[HACKER_NEWS] | 3min | newspaper
大语言模型面临的幻觉与逻辑推理局限 02-12
LLM
幻觉
逻辑推理 |
[自动]
[HACKER_NEWS] | 4min | newspaper
大语言模型在逻辑推理与事实准确性上的局限 02-12
LLM
逻辑推理
事实准确性 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LLM 单独使用无法治愈癌症:科学与模拟的局限 02-12
LLM
生物医学
AI for Science |
[自动]
[BLOGS_PODCASTS] | 1min | mic
大语言模型无法治愈癌症:科学家的模拟困境 02-11
LLM
科学发现
生物医学 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
The Scientist and the Simulator 02-10
LLM
生物医药
科学研究 |
[自动]
[ARXIV] | 3min | school
智能体不确定性研究揭示过度自信问题 02-09
AI Agents
不确定性
过度自信 |
2026年一月
7 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 4min | newspaper
纽约市AI聊天bot因建议企业违法而被关停 01-30
AI 聊天机器人
纽约市
合规风险 |
[自动]
[ARXIV] | 4min | school
MortalMATH:当推理目标遇上紧急语境,冲突何解?🧠🔥 01-27
LLM
模型评估
安全对齐 |
[自动]
[HACKER_NEWS] | 4min | newspaper
🚨 AI代码审查泡沫要破了?揭示真相!💥 01-27
AI代码审查
GitHub Copilot
上下文窗口 |
[自动]
[HACKER_NEWS] | 4min | newspaper
谷歌健康搜索惊现YouTube>医疗网站?AI Overview引争议!🤖🏥 01-26
Google
AI Overview
搜索 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Google震惊!健康查询竟引YouTube胜过医疗网站?🏥📹 01-26
Google
AI Overviews
搜索 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔍 深度拆解:AI伪造数学证明的惊人真相!🚀 01-26
LLM
幻觉
数学证明 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🤖AI竟伪造数学证明?深扒“创意数学”背后的惊人真相! 01-26
AI
数学证明
形式化验证 |
无匹配条目