AI 新闻错误率近 5 成：Gemini 错最多，ChatGPT 误报教宗仍在世

2025-10-23

欧意交易app是数字货币交易平台

APP下载官网地址

欧洲广播联盟(EBU)与英国BBC联合发布最新国际研究指出，目前主流AI助理在回应新闻相关问题时，有近半数(45%)内容出现重大错误，且高达81%的回答存在不同程度的问题。

主流模型成研究对象，并从三大面向着手这项研究涵盖14种语言、3,000笔AI助手对新闻问题的回复。受测对象包括多款主流AI助手，像ChatGPT、Copilot、Gemini与Perplexity。研究团队检视每项回复的三大面向：

内容准确度。

资料来源标注是否正确。

能否区分“事实”与“意见”。

近半数AI回答出错，Gemini错误率第一结果显示，AI助手在回答新闻问题时，有45%的回复出现明显错误，像是提供误导资讯、引用错误内容，或使用过时资料。整体来看，有高达81%的回答多少都有问题，只是严重程度不同。

其中，约三成的回复在“来源标注”上出错，可能是没标明出处、引用了不准确的资料，或标记错误来源。在所有受测AI助手中，Google的Gemini表现最差，有72%的回答出现重大来源问题，远高于其他助手(大多在25%以下)。

另外，约20%的回复在“内容正确性”上出错，常见问题是回答用了过期或不正确的资讯。

Gemini误报法规，ChatGPT误称教宗仍在世研究举出数个具体例子：

Gemini曾误报“一次性电子烟法规”的修法内容。

ChatGPT在受测时仍回答“教宗方济各在世”，尽管他已于数月前过世。

很明显，AI模型在处理时事新闻时，仍存在延迟与资料来源不足的问题。

对此，Google已在官网上表示欢迎用户提供回馈，持续改善平台品质。OpenAI与Microsoft先前皆坦言有“AI幻觉”问题仍待解决，原因包括资料不足与模型判断错误。Perplexity宣称自家“深度搜寻模式”在事实正确率方面可达93.9%。

EBU警告：信任危机恐影响民主参与EBU表示，随著AI助理逐渐取代搜寻引擎成为新闻来源，民众如果无法辨别真假资讯，最终可能选择“不再相信任何东西，进而削弱民主参与。

EBU也呼吁AI业者应被纳入“新闻责任体系”，确保在处理新闻相关问题时能提供可验证的来源、准确事实、清楚区分评论与事实的能力。

这篇文章AI新闻错误率近5成：Gemini错最多，ChatGPT误报教宗仍在世最早出现于链新闻ABMedia。

新闻详情