研究发现:主流 AI 聊天机器人传播虚假信息的概率较去年翻倍

2025-09-15 发布 · 浏览17次 · 点赞0次 · 收藏0次

9 月 14 日消息,据 Newsguard 的研究显示,截至今年 8 月,十大生成式 AI 工具在处理实时新闻话题时,有 35% 的情况会重复传播虚假信息,而去年 8 月这一数据为 18%。

虚假信息传播率的激增与一个重大的权衡有关。当聊天机器人引入实时网络搜索功能后,它们不再拒绝回答用户问题 —— 拒绝率从 2024 年 8 月的 31% 降至一年后的 0%。然而,这一变化使得这些 AI 机器人开始接入“受污染的网络信息生态系统”:在该系统中,不良行为者会蓄意散布虚假信息,而 AI 系统会对这些信息进行重复传播。

此类问题并非首次出现。去年,Newsguard 就标记出 966 个以 16 种语言运营的 AI 生成新闻网站。这些网站常使用“iBusiness Day”等通用名称,模仿正规媒体机构,实则传播虚假新闻。

注意到,各 AI 模型的具体表现细分数据显示,Inflection 公司的模型表现最差,传播虚假信息的概率高达 56.67%;紧随其后的是 Perplexity,出错率为 46.67%。ChatGPT 与 Meta 的 AI 模型传播虚假信息的比例为 40%;Copilot(微软必应聊天)和 Mistral 则为 36.67%。表现最佳的两款模型为 Claude 和 Gemini,其错误率分别为 10% 和 16.67%。

Perplexity 的表现下滑尤为显著。2024 年 8 月时,该模型对虚假信息的揭穿率仍能达到 100% 的完美水平;而一年后,其传播虚假信息的概率却接近 50%。

原本引入网络搜索功能是为了解决 AI 回答内容过时的问题,却反而使系统产生了新的问题。这些聊天机器人开始从不可靠来源获取信息,“混淆百年前的新闻出版物与使用相似名称的俄罗斯宣传机构”。

Newsguard 将此称为一个根本性缺陷:“早期 AI 采用‘不造成伤害’的策略,通过拒绝回答问题来避免传播虚假信息的风险。”

如今,随着网络信息生态系统被虚假信息充斥,辨别事实与假消息比以往任何时候都更加困难。

OpenAI 已承认,语言模型总会产生“幻觉内容”(指 AI 生成的虚假或无根据的信息),因为这些模型的工作原理是预测“最可能出现的下一个词”,而非追求“事实真相”。该公司表示,正致力于研发新技术,让未来的模型能够“提示不确定性”,而非笃定地编造信息。但目前尚不清楚这种方法能否解决 AI 聊天机器人传播虚假信息这一更深层次的问题 —— 要解决该问题,需要 AI 真正理解“何为真实、何为虚假”,而这一点目前仍难以实现。

研究发现:主流 AI 聊天机器人传播虚假信息的概率较去年翻倍 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。