色老头一区二区三区,av基地,午夜第一页,久久成人18免费网站,免费美女视频免费,性感美女视频思念天边的你dj,美女视频在线观看 网站大全

人類幻覺比AI要嚴(yán)重多了

人們很容易對(duì)deepseek、元寶、ChatGPT這些AI產(chǎn)品吹毛求疵,批評(píng)最多的就是AI幻覺,通俗說就是你問AI一個(gè)問題,對(duì)方回答振振有詞,看似嚴(yán)絲合縫,但其中有的內(nèi)容是捏造的,弄得你對(duì)它半信半疑。

要了解AI幻覺為何產(chǎn)生,先得了解AI模型主要是通過從數(shù)據(jù)中尋找規(guī)律來學(xué)習(xí)進(jìn)行預(yù)測(cè)。按照谷歌對(duì)AI產(chǎn)生幻覺的官方解釋,其原因主要有兩條:

最核心的是訓(xùn)練數(shù)據(jù)的質(zhì)量和完整性。如果訓(xùn)練數(shù)據(jù)不完整、有偏差或存在其他缺陷,AI 模型可能會(huì)學(xué)習(xí)不正確的模式,導(dǎo)致預(yù)測(cè)不準(zhǔn)確或出現(xiàn)幻覺。比如,基于醫(yī)學(xué)圖片數(shù)據(jù)集訓(xùn)練的 AI 模型可能會(huì)學(xué)習(xí)識(shí)別癌細(xì)胞。但是,如果數(shù)據(jù)集中不包含任何健康組織的圖片,AI 模型可能會(huì)錯(cuò)誤地預(yù)測(cè)健康組織會(huì)癌變。

另外一點(diǎn)是,AI 模型可能難以準(zhǔn)確理解現(xiàn)實(shí)世界的知識(shí)、物理屬性或事實(shí)信息。缺乏依據(jù)可能會(huì)導(dǎo)致模型生成看似合理的輸出,但其實(shí)是不正確、不相關(guān)或無意義的內(nèi)容。這甚至還包括編造指向從未存在過的網(wǎng)頁的鏈接。例如,用于生成新聞報(bào)道摘要的 AI 模型可能會(huì)生成包含原始報(bào)道中未包含的詳情的摘要,甚至完全虛構(gòu)信息。

如果說AI模型回答問題的準(zhǔn)確性,主要依賴于訓(xùn)練數(shù)據(jù)的質(zhì)量和多樣性,但他們又不能主動(dòng)驗(yàn)證信息的真實(shí)性,那么從理論上來講,人類可以通過批判性思維和多源信息驗(yàn)證來評(píng)估信息的準(zhǔn)確性,但事實(shí)果真如此嗎?

聲譽(yù)良好的Vectara在2025年3月對(duì)目前市場(chǎng)上主流的AI大模型測(cè)試發(fā)現(xiàn),大部分主流大模型產(chǎn)品的幻覺率大都處于一個(gè)較低的水平, Gemini-2.0-Flash-001,以0.7%的低幻覺率位居榜首,顯示出其在處理文檔時(shí)幾乎沒有引入虛假信息。此外,Gemini-2.0-Pro-Exp 和 OpenAI 的 o3-mini-high-reasoning 模型分別以0.8%的幻覺率緊隨其后。

這樣的幻覺率已經(jīng)遠(yuǎn)低于我們?nèi)祟愔械膶I(yè)精英了。當(dāng)前頂尖大模型在知識(shí)密集型任務(wù)和結(jié)構(gòu)化場(chǎng)景(如代碼生成、合規(guī)審查)中已超越人類專家,只是在開放性創(chuàng)造(如文學(xué)創(chuàng)作)和現(xiàn)實(shí)經(jīng)驗(yàn)依賴型任務(wù)(如復(fù)雜倫理判斷)上仍有差距。

以醫(yī)學(xué)為例,世界衛(wèi)生組織曾公布,臨床醫(yī)學(xué)的平均誤診率為30%,其中80%醫(yī)療失誤是思維和認(rèn)識(shí)錯(cuò)誤導(dǎo)致的。另據(jù)《中國罕見病綜合社會(huì)調(diào)查》2020-2021數(shù)據(jù),國內(nèi)罕見病平均確診需要4.26年,誤診率高達(dá)42%。

醫(yī)學(xué)是人類幻覺的一個(gè)縮影。從宏觀上看,人類的認(rèn)知偏見和誤解比大模型要嚴(yán)重多了。這其實(shí)是與我們?nèi)祟惖拇竽X處理信息的方式、認(rèn)知偏見以及外部環(huán)境的影響有關(guān),也是我們生物局限性的必然。人類產(chǎn)生幻覺的原因比AI幻覺的病根要多得多。

首先,人類傾向于尋找、解釋和記住支持自己已有信念的信息,同時(shí)忽視或低估相反的信息。人類依賴于容易想到的信息來判斷事件的可能性或頻率,可能導(dǎo)致對(duì)事件概率的誤判。我們?cè)谧鰶Q策時(shí)過于依賴最初獲得的信息(錨定效應(yīng)),即使后續(xù)信息可能更為重要。泰坦尼克號(hào)被認(rèn)為是“永不沉沒”的船只,船員和管理層對(duì)冰山警告未給予足夠重視,不幸在它的首次航行中撞上冰山沉沒,導(dǎo)致1500多人喪生。

其次,當(dāng)面對(duì)大量信息時(shí),人類可能難以有效處理和篩選,導(dǎo)致信息誤解或錯(cuò)誤判斷。1986年,前蘇聯(lián)切爾諾貝利核電站的操作人員在進(jìn)行安全測(cè)試時(shí),忽視了多項(xiàng)安全協(xié)議和警告信號(hào),導(dǎo)致了歷史上最嚴(yán)重的核電站事故之一,造成大量輻射泄漏,事故發(fā)生后至今,普里皮亞季和切爾諾貝利一直被形容為一座“鬼城”,2000多平方公里范圍接近無人區(qū)。

還有,人類時(shí)常波動(dòng)的情緒狀態(tài)及個(gè)人動(dòng)機(jī)會(huì)影響信息處理和決策。例如,焦慮可能導(dǎo)致對(duì)風(fēng)險(xiǎn)的過度評(píng)估,而樂觀可能導(dǎo)致風(fēng)險(xiǎn)低估。2003年,美國及其盟國基于錯(cuò)誤的情報(bào)判斷,認(rèn)為伊拉克擁有大規(guī)模殺傷性武器,于是發(fā)動(dòng)了對(duì)伊拉克的軍事入侵,導(dǎo)致長(zhǎng)期的地區(qū)不穩(wěn)定和大量人員傷亡,最終未能找到大規(guī)模殺傷性武器。

即使是擁有巨大權(quán)力和影響力的人物,也可能因?yàn)檎J(rèn)知偏見、錯(cuò)誤判斷或忽視警告而導(dǎo)致嚴(yán)重后果。歐洲獵巫、納粹屠殺,以及美國總統(tǒng)特朗普最近發(fā)起的關(guān)稅戰(zhàn),就是很典型的人類幻覺所引發(fā)的一系列危機(jī)。

特朗普在演講中曾表示:“多年來,當(dāng)其他國家變得富有和強(qiáng)大時(shí),辛勤工作的美國公民被迫袖手旁觀,其中大部分是以我們的利益為代價(jià)……現(xiàn)在輪到我們繁榮發(fā)展了?!?/p>

這樣的言論,就連美國的鐵桿盟友英國老牌的《經(jīng)濟(jì)學(xué)人》雜志都忍不住要批評(píng)幾句:“他(指特朗普)方便地忽略了兩個(gè)事實(shí):全球化為美國帶來了前所未有的繁榮,美國一直是支撐國際貿(mào)易的規(guī)則的主要制定者。現(xiàn)在,如果特朗普得償所愿,那么二戰(zhàn)后緩慢而穩(wěn)步建立起來的經(jīng)濟(jì)秩序?qū)⒈宦裨?。相反,特朗普贊揚(yáng)了 19 世紀(jì)末美國的繁榮,當(dāng)時(shí)美國比今天貧窮得多?!?/p>

位高權(quán)重如美國總統(tǒng)也無法從自我認(rèn)知偏見中爬出來,信息差更大的普通人的幻覺程度又當(dāng)如何?就像神經(jīng)科學(xué)家達(dá)馬西奧所說:“人不是可以感受的思維機(jī)器,而是可以思維的感受機(jī)器?!?/span>這句話讀起來繞口,但你多看兩眼,就會(huì)察覺這句話的精妙之處。


相關(guān)內(nèi)容