常用工具 医生入驻 免费问医生

幻觉捕手:这更像是一门“玄学”

2025-08-04 23:18:18 来源:须发皆白网   

广州:4437家经营者申报“双承诺单位” 推进放心消费创建

2025年5月15日,玄学中国信息通信研究院人工智能研究所公布了大模型幻觉测试的幻觉第一期结果:包括DeepSeek R1在内的15个主流模型,无一例外都存在不同程度的捕手“幻觉”。

“幻觉”一词源于生物学,更像运用在人工智能领域,玄学始于谷歌2017年的幻觉一项研究。当时研究员们模仿人类的捕手神经网络,设计了一个机器翻译系统。更像

结果发现这个网络翻译系统哪怕“不会”,玄学仍能输出一段流畅的幻觉内容。过去,捕手谷歌传统的更像翻译系统遇到不会的单词,很多时候会保留原文。玄学于是幻觉,研究人员把神经翻译系统这种更有“迷惑性”的捕手错误命名为“幻觉”。

一个著名的幻觉案例是,2024年7月,Scale AI的高级提示工程师莱利·古德赛德向当时世界最强三大模型(GPT-4o、Gemini Advanced、Claude 3.5 Sonnet)询问,“9.11和9.9哪个更大?”它们异口同声回答:“9.11更大。”

ChatGPT并非全球首个大模型,Meta和谷歌此前也推出过类似产品。其中,Meta的Galactica AI因幻觉严重,上线仅三天便被撤回。

ChatGPT之所以被视为划时代产品,正是因其首次将幻觉率压低到可接受范围。从ChatGPT-3.5到o3,两年来模型性能持续提升,人们逐渐形成一种假设:模型越聪明,越不会出错。

直到2025年4月,OpenAI在一篇论文中泼了冷水:在其内部测试中,最新的推理模型o3比前一代推理模型o1的幻觉率更高。

这一反直觉的发现令整个行业都神经紧张,如果智能提升的同时,也增强了“伪装错误”的能力,那更聪明的推理大模型带来的不是更高的可靠性,而是更难察觉的风险。

不过,中国信息通信研究院刚刚出炉的这份测评结果,让业界可以稍感安慰。他们的结果显示,推理模型相对于通用模型,幻觉问题更轻。这说明推理过程一定程度上有助于缓解幻觉。

那么,这些测评结果究竟能说明什么?更聪明的模型,真的更会“说谎”吗?人类能不能彻底消灭“幻觉”?

一次次测试中,黑一鸣偶尔会陷入一个哲学思考,“子非鱼,焉知鱼之乐也?”视觉中国 图

幻觉捕手

2025年春节,中国信息通信研究院人工智能研究所的研究员黑一鸣整个假期都泡在论文堆里,为了寻找捕捉这种“大模型幻觉”的方法。

黑一鸣身高接近1.9米,2023年博士毕业。那是他读博的最后一年,大模型时代突如其来,打乱了所有人的节奏,“我这一届还好,下一届的学弟学妹,如果毕业论文里没大模型,会被认为没有跟进最新研究,被质疑创新性。”

原本专攻网络内容安全的黑一鸣,也在毕业后转向大模型研究,加入中国信息通信研究院人工智能研究所,成为一名研究员。当时,国内大模型纷纷要进行安全备案,研究所为各大模型企业提供安全测评,重点评估输出内容的合规性与越狱攻击等风险。黑一鸣最初负责的,正是这项安全测评工作。

随着行业从“百模大战”走向大模型在真实业务中的落地,关注的焦点也悄然转移。黑一鸣感觉到,过去一年,来自金融、医疗、法律等高风险行业的咨询明显增加。

这些领域容错率极低,对潜在风险格外敏感。“比如银行的客户服务机器人,跟客户交流时,它输出的内容会不会违背既有政策,大家特别担心。”

一个最新的例子来自全球知名的人工智能编程软件公司 Cursor。作为目前最成功的大模型应用之一,它已将客服业务完全交由AI处

希望以上内容对您有帮助。

阅读全文
相关推荐
知识视频推荐精选问答
养生文章推荐
下一次油价调整时间最新消息 2月27日今天92/95号汽油最新价格

开芯院采用芯华章P2E硬件验证平台加速RISC

下一次油价调整时间最新消息 2月27日今天92/95号汽油最新价格
下一次油价调整时间最新消息>>今天2月27日)是新一轮油价调整的第6个工作日3月4日24时调整),目前预计上调油价115元/吨,折合升计算为上涨油价0.09元/升-0.10元/升,相比昨日
短小精悍才是王道?《消逝的光芒》总监批评《刺客信条:影》

11月24日起 厦门和宁路临时改为单向通行

短小精悍才是王道?《消逝的光芒》总监批评《刺客信条:影》
《刺客信条:影》本应解决育碧的诸多问题,包括其过于臃肿的开放世界设计。然而,尽管该作在此基础上有所改进,但仍然会让人感到有些吃力。 而这正是《消逝的光芒:困兽》总监对《刺客信条:影》的评价。他说,如果
新秀透露与王安冉离婚原因:都是我的问题

全椒开发落地首单优质肉牛品质保证保险_

新秀透露与王安冉离婚原因:都是我的问题
3月31日凌晨,《新说唱2024》亚军新秀发文回应与王安冉离婚传闻,“这个事情确实是真的,我们可能缘分到头了”,他向王安冉道歉,表示是自己的不作为和面对婚姻生活的逃避导致了今天
突破關稅壁壘 台積除了赴美設廠,還有別的可能?|天下雜誌

AI正改变定制家居行业!涉索菲亚、尚品宅配等新动作

突破關稅壁壘 台積除了赴美設廠,還有別的可能?|天下雜誌
【徐小波/林繼恆專欄】川普關稅以實體商品進口為主,服務貿易都無關稅。因此,台灣應思考除了出海設廠、美國製造以外的突破點:「高附加價值服務業」模式。您的閱讀篇數已達上限立刻訂閱全閱讀,即可享全站不限篇數
光明家具荣登龙江老字号企业名单

四川2023年消费者满意度总指数84.09分

光明家具荣登龙江老字号企业名单
光明家具荣登龙江老字号企业名单据介绍,此次进入龙江“老字号”的企业,分布在制造业和商贸服务业两个领域。我省梳理出以哈尔滨锅炉厂、中国一重为代表的制造业“老字号”企业170户。商务厅梳理出以华梅西餐、马
美債ETF怎麼買?優點缺點是什麼?現在適合買債券ETF嗎?|天下雜誌

世界家居史上首创设计尖货节 红星美凯龙成无可争议的家居新零售领导者

美債ETF怎麼買?優點缺點是什麼?現在適合買債券ETF嗎?|天下雜誌
債券常常是資金的避風港,債券ETF具有股票的流動性,進入門檻相對低,是資產配置時,可以列入考慮的選項。您的閱讀篇數已達上限立刻訂閱全閱讀,即可享全站不限篇數閱讀
携手共进,好太太与广东艺涂开启战略合作新篇章,共绘蓝图

纯碱市场早报,市场研究

携手共进,好太太与广东艺涂开启战略合作新篇章,共绘蓝图
携手共进,好太太与广东艺涂开启战略合作新篇章,共绘蓝图责编:小乙 时间:2025-06-23 热度:45207
两全保险豁免什么意思,豁免保费之后两全还能不能领

債市將復甦?5數據顯示美國經濟降溫|天下雜誌

两全保险豁免什么意思,豁免保费之后两全还能不能领
导读: 两全保险中的“豁免”是指一项特殊条款,允许在满足特定条件时,投保人或被保险人无需继续缴纳后续的保险费,但保险合同仍然有效,继续为被
世界杯决赛夜蒋劲夫晒照公开恋情 蒋劲夫女友正面照身份遭扒

厦门岛内持续75天无有效降水 周末或有雨水降临

世界杯决赛夜蒋劲夫晒照公开恋情 蒋劲夫女友正面照身份遭扒
据报道,7月15日晚,蒋劲夫突然公开恋情更是盖过世界杯的势头,备受热议。其在微博中更新动态并写道:“太热了,真的,所以只穿了一条内裤。”蒋劲夫晒出一张与神秘女子穿情侣T恤的背影
铝扣板墙面装修效果图

纯碱市场早报,市场研究

铝扣板墙面装修效果图
铝扣板墙面装修效果图铝扣板墙面装修效果图是指使用铝扣板进行墙面装修,并通过效果图展示出来的效果。铝扣板是一种由铝合金制成的装饰材料,具有轻质、耐用、防火、防水等特点,广泛应用于室内外墙面装修。本文将介