小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

粗心學(xué)者忘刪ChatGPT痕跡慘遭撤稿!Nature痛呼AI論文太泛濫,學(xué)術(shù)圈已被攻陷

 天承辦公室 2023-09-12

圖片


  新智元報道  

編輯:Aeneas 好困
【新智元導(dǎo)讀】最近,一篇數(shù)學(xué)論文被發(fā)現(xiàn)ChatGPT痕跡,慘遭撤稿。打假人痛心疾呼:我們的學(xué)術(shù)圈,早已被AI寫的論文吞沒了!

科研圈,快被ChatGPT生成的論文吞沒了!

8月9日,一篇收錄于<Physica Scripta>期刊上的論文,提出了一種復(fù)雜數(shù)學(xué)方程的全新解決方案。

圖片

論文地址:https://iopscience./article/10.1088/1402-4896/aceb40/meta

圖片

本來是皆大歡喜的事,直到科學(xué)打假人Guillaume Cabanac在論文的第三頁,發(fā)現(xiàn)了一處可疑的短語——「重新生成回復(fù)」(Regenerate Response)。

圖片

經(jīng)常用ChatGPT的小伙伴,看到這個短語,都會會心一笑。

圖片

「Regenerate Response」是網(wǎng)頁版ChatGPT上的一個按鈕,現(xiàn)在更新成了「Regenerate」。

圖片

Cabanac火速把這一發(fā)現(xiàn)po到了PubPeer上,這也意味著,事情鬧大的話,這篇論文基本就被判死刑了。

果然,論文作者不得不承認(rèn),在寫作論文稿件時確實(shí)使用了ChatGPT。

圖片

論文的通訊作者為Abdullahi Yusuf,他有兩個工作單位,一個是伊斯坦布爾的Biruni University,一個是貝魯特的Lebanese American University。

這篇論文在5月被提交,7月發(fā)出了修訂版,在兩個月的同行評審期間,都沒有人發(fā)現(xiàn)其中的異常。

現(xiàn)在,<Physica Scripta>決定撤回這篇論文,理由是作者在提交論文時,并沒有聲明自己使用了ChatGPT。

期刊的同行評審和研究誠信主管Kim Eggleton表示,「這種行為違反了我們的道德政策?!?/span>

只是冰山的一角

然而,這篇論文,只是少數(shù)被曝光出來的「倒霉」選手。

從今年4月以來,Cabanac已經(jīng)「打假」了十幾篇論文,掛到了PubPeer上。它們無一例外,都留下了ChatGPT的使用痕跡——「Regenerate response」或「作為一個語言模型,我……」

圖片

所以,寫論文時究竟可不可以用ChatGPT呢?

對于這個問題,Elsevier(愛思唯爾)和Springer Nature(施普林格·自然)在內(nèi)的許多出版商都有明確規(guī)定:大語言模型工具用是可以用的,只要作者聲明自己使用了即可。

不過目前看來,大部分使用了ChatGPT的同行評審論文,都沒有聲明這一點(diǎn)。

已經(jīng)被逮到的論文,只是因?yàn)樽髡叽中模瑳]有小心清除掉ChatGPT留下的痕跡而已。??

只要作者足夠細(xì)心,用沒用ChatGPT,又有誰能知道呢?

圖片

打假人Cabanac表示,目前自己發(fā)現(xiàn)的論文,才只是冰山一角。

在愛思唯爾期刊中,他也發(fā)現(xiàn)了一些典型的ChatGPT「黑話」。

比如一篇8月3日發(fā)表在<Resources Policy>上的論文,主題是電子商務(wù)對發(fā)展中國家化石燃料效率的影響。

其中,Cabanac就注意到,文章里有些方程完全就是不知所云。

不過最大的可疑之處在于,在某張表格上方,出現(xiàn)了這樣一行字:「請注意,作為一個語言模型,我無法生成具體的表格或進(jìn)行測試……」

圖片

對此,Elsevier的一位發(fā)言人表示,他們已經(jīng)發(fā)現(xiàn)了這個問題,正在對這篇論文進(jìn)行調(diào)查。

AI的大作,已經(jīng)完美混進(jìn)了人類作品

那么,一篇論文如果完全或部分由AI寫成,但作者不說,我們就沒有辦法發(fā)現(xiàn)了嗎?

大部分時候,的確如此。

最近美國南佛羅里達(dá)大學(xué)的一項(xiàng)研究表明,AI生成的文字內(nèi)容,可能已經(jīng)無法與人類寫的區(qū)分開來了。

圖片

他們邀請了72名世界頂級語言學(xué)期刊的專家,要求他們來審查各種研究摘要,但即使是這樣的專業(yè)人士,也很難識別出哪些摘要是人寫的,哪些是AI寫的。

在62%的情況下,他們會被AI騙過去。

圖片

具體來說,每位專家都被要求檢查四份摘要,能全部正確識別出來作者是人還是AI的,一個都沒有。

甚至13%的專家,一個都沒做對。

專家們的識別依據(jù)是語言習(xí)慣和文體特征,盡管他們的分析頭頭是道、合乎邏輯,但總體的陽性識別率也只有38.9%。

圖片
不過,英國科研誠信辦公室的Matt Hodgkinson表示,有些論文也會包含一些微妙的痕跡,讓我們可以隱約發(fā)現(xiàn)ChatGPT的「身影」。
比如,一些常見于AI的特定語言模式,以及翻譯得怪里怪氣的「奇妙短語」。
此處淺淺地感受一下:深度神經(jīng)網(wǎng)絡(luò)——profound neural organization(深刻神經(jīng)組織) 。
圖片
圖片
以及人工智能——counterfeit consciousness(仿制意識/虛偽意識);大數(shù)據(jù)——colossal information(巨信息);云計算—— haze figuring(霾運(yùn)籌);GPU——designs preparing unit(設(shè)計準(zhǔn)備器) ;CPU——focal preparing unit(焦點(diǎn)準(zhǔn)備器)等等。
圖片
除此之外,AI在生成參考文獻(xiàn)時也是相當(dāng)?shù)摹柑祚R行空」,而這就可以作為同行評審時的重要參考。
例如,<Retraction Watch>(《撤稿觀察》)就曾揭露過一篇關(guān)于馬陸(millipedes)的預(yù)印本論文是由ChatGPT編寫的。
在一位研究人員發(fā)現(xiàn)文章中引用的一篇「論文」竟然是自己寫的后,注意到了這里面提到的大量參考文獻(xiàn),都是假的。
圖片
類似的,丹麥國家血清研究所(State Serum Institute)的微生物學(xué)家Rune Stensvold也遇到了AI偽造參考文獻(xiàn)的問題。
當(dāng)時,一名學(xué)生向AI聊天機(jī)器人尋求有關(guān)腸道寄生蟲——芽囊原蟲屬(Blastocystis)的文獻(xiàn)建議,而這個聊天機(jī)器人則憑空編造了一篇以Stensvold為作者的參考文獻(xiàn)。
于是,這位學(xué)生就去找了Stensvold,表示希望能獲取這篇他發(fā)表于2006年的「論文」。
顯然,這篇論文根本就不存在。
圖片
然而,正如之前提到的,對于這些明顯會暴露論文使用了AI的痕跡,聰明的作者很容易就能把它們刪得一干二凈。
如此一來,想要發(fā)現(xiàn)是否實(shí)用了AI,就變成了一個不可能的任務(wù)。
Cabanac等打假人發(fā)現(xiàn),無論是同行評審的會議論文,還是未經(jīng)同行評審的預(yù)印本論文中,都存在大量使用了ChatGPT但未披露的情況。
當(dāng)這些論文被掛在PubPeer上之后,有部分作者會承認(rèn)的確使用了ChatGPT,但并未聲明。
Hodgkinson表示:「本質(zhì)上,這是一場軍備競賽。就看騙子和偵探誰能勝出了?!?/span>

學(xué)術(shù)界要被攻陷了!

總之,形勢已經(jīng)很嚴(yán)峻。
圖片
Elisabeth Bik已辭去工作,成為大眾知名的專業(yè)打假人
舊金山的一位微生物學(xué)家、獨(dú)立研究誠信顧問Elisabeth Bik表示,ChatGPT和其他生成式AI工具的迅猛崛起,為「論文工廠」提供了充足的彈藥。
這是一條完善的產(chǎn)業(yè)鏈:這些公司大量生產(chǎn)和炮制出虛假的論文,賣給急需提高學(xué)術(shù)成果產(chǎn)量的研究者。
Bik說,現(xiàn)在問題已經(jīng)惡化了一百倍。
如今的學(xué)術(shù)圈,可能已經(jīng)充斥著一大批AI生產(chǎn)的「垃圾」論文。我們根本無從分辨,哪些是經(jīng)過認(rèn)真研究產(chǎn)生的嚴(yán)肅學(xué)術(shù)成果,哪些是AI炮制出來濫竽充數(shù)的「垃圾」。
圖片

同行評審:時間緊,不夠

那么問題來了,為什么那些由AI生成的假論文,能屢次通過如此嚴(yán)格的同行評審?
一方面,ChatGPT這類的技術(shù)還比較新,并不是所有人都能有效辨別;另一方面,同行評審可能根本沒有時間來檢查這個問題。
對此,化名「Smuts Clyde」去揭發(fā)偽造論文的David Bimler表示,期刊中那些由LLM生成且未被發(fā)現(xiàn)的論文,指向了一個更深層次的問題:同行評審?fù)銐蚨嗟臎]有時間,來徹底檢查稿件中的可疑之處。
「畢竟,整個科學(xué)界的態(tài)度就是『要么發(fā)表,要么死亡(Publish or perish)』」,Bimler說,「因此『守門人』的數(shù)量永遠(yuǎn)都不是夠的?!?/span>
圖片
也許,這就是當(dāng)前殘酷的現(xiàn)實(shí):評審論文需要大量的時間和專業(yè)知識,但AI只需幾分鐘就能完成一篇,無論它的質(zhì)量是多差。
參考資料:
https://www./articles/d41586-023-02477-w
圖片



    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多