新闻详情

AI 新闻错误率近 5 成:Gemini 错最多,ChatGPT 误报教宗仍在世

2025-10-23
AI 新闻错误率近 5 成:Gemini 错最多,ChatGPT 误报教宗仍在世_欧易官网登录中心-OKX官网登录入口

欧意APP下载

欧意交易app是数字货币交易平台

欧洲广播联盟(EBU)与英国BBC联合发布最新国际研究指出,目前主流AI助理在回应新闻相关问题时,有近半数(45%)内容出现重大错误,且高达81%的回答存在不同程度的问题。

主流模型成研究对象,并从三大面向着手这项研究涵盖14种语言、3,000笔AI助手对新闻问题的回复。受测对象包括多款主流AI助手,像ChatGPT、Copilot、Gemini与Perplexity。研究团队检视每项回复的三大面向:

内容准确度。

资料来源标注是否正确。

能否区分“事实”与“意见”。

近半数AI回答出错,Gemini错误率第一结果显示,AI助手在回答新闻问题时,有45%的回复出现明显错误,像是提供误导资讯、引用错误内容,或使用过时资料。整体来看,有高达81%的回答多少都有问题,只是严重程度不同。

其中,约三成的回复在“来源标注”上出错,可能是没标明出处、引用了不准确的资料,或标记错误来源。在所有受测AI助手中,Google的Gemini表现最差,有72%的回答出现重大来源问题,远高于其他助手(大多在25%以下)。

另外,约20%的回复在“内容正确性”上出错,常见问题是回答用了过期或不正确的资讯。

Gemini误报法规,ChatGPT误称教宗仍在世研究举出数个具体例子:

Gemini曾误报“一次性电子烟法规”的修法内容。

ChatGPT在受测时仍回答“教宗方济各在世”,尽管他已于数月前过世。

很明显,AI模型在处理时事新闻时,仍存在延迟与资料来源不足的问题。

对此,Google已在官网上表示欢迎用户提供回馈,持续改善平台品质。OpenAI与Microsoft先前皆坦言有“AI幻觉”问题仍待解决,原因包括资料不足与模型判断错误。Perplexity宣称自家“深度搜寻模式”在事实正确率方面可达93.9%。

EBU警告:信任危机恐影响民主参与EBU表示,随著AI助理逐渐取代搜寻引擎成为新闻来源,民众如果无法辨别真假资讯,最终可能选择“不再相信任何东西,进而削弱民主参与。

EBU也呼吁AI业者应被纳入“新闻责任体系”,确保在处理新闻相关问题时能提供可验证的来源、准确事实、清楚区分评论与事实的能力。

这篇文章AI新闻错误率近5成:Gemini错最多,ChatGPT误报教宗仍在世最早出现于链新闻ABMedia。

欧易数字货币交易所 更快、更好、更强