BBC等机构研究评估AI工具新闻总结水平，谷歌Gemini错误比例最高-财经今日热点

炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

（来源：IT之家）

IT之家10月24日消息，生成式AI的确在信息整理方面大有用处，生成的内容也常令人惊叹，但只要仔细一看，就能发现这项技术仍存在不少缺陷。

据外媒AndroidAuthority今日报道，欧洲广播联盟（EBU）与BBC近日联合评估了ChatGPT、Gemini及Perplexity等多款AI系统在新闻摘要方面的表现。研究动因在于，现有约15%的25岁以下年轻人主要通过AI获取新闻。

BBC最初通过大规模问卷调查及六场焦点小组访谈收集公众对AI新闻工具的使用体验与看法，随后EBU将这项研究扩展至国际范围。

研究显示，约42%的英国成年人表示信任AI内容的准确性，年轻群体的信任度更高。不过，84%的受访者认为，一旦出现事实性错误，将严重削弱自己对AI的信任。问题在于，这些系统的“不准确度”究竟为何，以及用户是否真的察觉到了这些错误。

结果显示，大多数AI生成的内容都存在问题。各模型整体表现差距不大，但Gemini成为明显“异类”，不仅错误数量最多，严重错误的比例也远高于其他系统。

研究指出，Gemini的问题主要包括：缺乏清晰的资料来源链接、未能区分可靠信息与讽刺内容、过度依赖维基百科、缺乏足够语境，以及错误引用原文。

在六个月的研究周期中，各大AI系统的表现都有改进，新闻摘要的准确率普遍提升，Gemini的进步尤为明显。但即使如此，Gemini的表现仍明显落后于其他系统。

IT之家附报告链接：NewsIntegrityinAIAssistants

海量资讯、精准解读，尽在新浪财经APP

	破风而行，为卓越而生----迪卡侬AG2R车队北京荣耀之旅，与大众骑友共燃激情
	新时代总书记这样寄望这支队伍
	无棣县棣丰街道举办教师荣退致敬仪式
	阿娇《来战》客串神女太唯美！佟丽娅咸鱼飞升紫衣惊艳，李沁好绝！
	赵丽颖霸气官宣：这站我是女王！郑宝瑞导演揭秘选她演女儿国国王
	涪陵榨菜入选2025巴渝“土特产”名优百品
	疫情之下，一家医院的日与夜
	科画丨高考在即，这些注意事项你要知道！
	今年北方多地为何秋天这么短？专家解析有两大原因
	突发讣告！他于2025年10月6日在北京逝世，享年97岁

头条资讯网_今日热点_娱乐才是你关心的时事