財聯(lián)社7月17日訊(編輯 牛占林)據(jù)美國蒙大拿大學(xué)的一項最新研究顯示,在創(chuàng)造性思維測試方面,人工智能(AI)聊天機(jī)器人ChatGPT可以與排名前1%的人類思想家相匹配。
研究人員對ChatGPT使用了托倫斯創(chuàng)造性思維測試,這是一種最常用的創(chuàng)造力測試方法,并記錄了ChatGPT給出的8份答案。然后還提交了由24名蒙大拿大學(xué)學(xué)生組成的對照組的答案。
這些分?jǐn)?shù)與參加托倫斯創(chuàng)造性思維測試的2700名全國大學(xué)生進(jìn)行了比較。所有提交的答案都是由學(xué)術(shù)測試服務(wù)機(jī)構(gòu)評分的,而該機(jī)構(gòu)并不知道人工智能也參與其中。
值得注意的是,托倫斯創(chuàng)造性思維測試是受保護(hù)的專有材料,因此ChatGPT也不能通過在互聯(lián)網(wǎng)或公共數(shù)據(jù)庫中訪問有關(guān)測試的信息來進(jìn)行“作弊”。
研究作者、蒙大拿大學(xué)商學(xué)院臨床助理教授Erik Guzik指出,研究結(jié)果令人驚訝,有些回答很新奇。Guzik的研究領(lǐng)域包括企業(yè)家精神和創(chuàng)造力經(jīng)濟(jì)方面。
Guzik表示:“對我來說,創(chuàng)造力就是用不同的方式做事。我喜歡企業(yè)家精神的一個定義是,作為一名企業(yè)家,要以不同的方式思考。所以,人工智能可以幫助我們將創(chuàng)造性思維應(yīng)用到商業(yè)和創(chuàng)新過程中,這讓我著迷?!?/p>
托倫斯思維測試包含兩種不同的評估:一種是文字評估,一種是圖像評估。兩者都測量發(fā)散性思維,或用于產(chǎn)生創(chuàng)造性想法的思維過程。
在文字評估中,會給考生提供圖片或口頭提示,并要求他們以書面形式作答。例如,他們可能會看到一個事件的圖片,并被要求對結(jié)果進(jìn)行假設(shè)?;蛘呦蛩麄冋故疽粋€產(chǎn)品,并詢問改進(jìn)它的方法。
他們的回答被用來評估三個心理特征:流暢性(相關(guān)想法的數(shù)量)、獨(dú)創(chuàng)性(想法的與眾不同)、靈活性(不同類型想法的多樣性)。
而圖像評估要求考生畫出答案。例如,他們可能會被要求完成一幅畫。除了流暢性和獨(dú)創(chuàng)性外,圖形測試還評估細(xì)化和標(biāo)題的抽象性等。
在這項研究中,ChatGPT的回答在流暢性和獨(dú)創(chuàng)性方面都處于前1%。但在靈活性、產(chǎn)生不同類型和類別想法的能力方面有所不足。
Guzik表示:“對于ChatGPT和GPT-4,我們首次表明它在創(chuàng)意方面的表現(xiàn)位居前1%。”他很高興地注意到,他的一些蒙大拿大學(xué)的學(xué)生也進(jìn)入了前1%。然而,ChatGTP的表現(xiàn)超過了全國絕大多數(shù)大學(xué)生。
Guzik補(bǔ)充說:“我們都在對ChatGPT進(jìn)行探索,我們注意到它做了一些我們沒有想到的有趣的事情。有些回應(yīng)新穎而令人驚訝。就在那時,我們決定對它進(jìn)行測試,看看它到底有多有創(chuàng)意?!?/p>