粗心學(xué)者忘刪ChatGPT痕跡慘遭撤稿！Nature痛呼AI論文太泛濫，學(xué)術(shù)圈已被攻陷

天承辦公室 2023-09-12

展開全文

新智元報道

編輯：Aeneas 好困

【新智元導(dǎo)讀】最近，一篇數(shù)學(xué)論文被發(fā)現(xiàn)ChatGPT痕跡，慘遭撤稿。打假人痛心疾呼：我們的學(xué)術(shù)圈，早已被AI寫的論文吞沒了！

科研圈，快被ChatGPT生成的論文吞沒了！

8月9日，一篇收錄于<Physica Scripta>期刊上的論文，提出了一種復(fù)雜數(shù)學(xué)方程的全新解決方案。

論文地址：https://iopscience./article/10.1088/1402-4896/aceb40/meta

本來是皆大歡喜的事，直到科學(xué)打假人Guillaume Cabanac在論文的第三頁，發(fā)現(xiàn)了一處可疑的短語——「重新生成回復(fù)」（Regenerate Response）。

經(jīng)常用ChatGPT的小伙伴，看到這個短語，都會會心一笑。

「Regenerate Response」是網(wǎng)頁版ChatGPT上的一個按鈕，現(xiàn)在更新成了「Regenerate」。

Cabanac火速把這一發(fā)現(xiàn)po到了PubPeer上，這也意味著，事情鬧大的話，這篇論文基本就被判死刑了。

果然，論文作者不得不承認(rèn)，在寫作論文稿件時確實(shí)使用了ChatGPT。

論文的通訊作者為Abdullahi Yusuf，他有兩個工作單位，一個是伊斯坦布爾的Biruni University，一個是貝魯特的Lebanese American University。

這篇論文在5月被提交，7月發(fā)出了修訂版，在兩個月的同行評審期間，都沒有人發(fā)現(xiàn)其中的異常。

現(xiàn)在，<Physica Scripta>決定撤回這篇論文，理由是作者在提交論文時，并沒有聲明自己使用了ChatGPT。

期刊的同行評審和研究誠信主管Kim Eggleton表示，「這種行為違反了我們的道德政策?！?/span>

只是冰山的一角

然而，這篇論文，只是少數(shù)被曝光出來的「倒霉」選手。

從今年4月以來，Cabanac已經(jīng)「打假」了十幾篇論文，掛到了PubPeer上。它們無一例外，都留下了ChatGPT的使用痕跡——「Regenerate response」或「作為一個語言模型，我……」

所以，寫論文時究竟可不可以用ChatGPT呢？

對于這個問題，Elsevier（愛思唯爾）和Springer Nature（施普林格·自然）在內(nèi)的許多出版商都有明確規(guī)定：大語言模型工具用是可以用的，只要作者聲明自己使用了即可。

不過目前看來，大部分使用了ChatGPT的同行評審論文，都沒有聲明這一點(diǎn)。

已經(jīng)被逮到的論文，只是因?yàn)樽髡叽中模瑳]有小心清除掉ChatGPT留下的痕跡而已。??

只要作者足夠細(xì)心，用沒用ChatGPT，又有誰能知道呢？

打假人Cabanac表示，目前自己發(fā)現(xiàn)的論文，才只是冰山一角。

在愛思唯爾期刊中，他也發(fā)現(xiàn)了一些典型的ChatGPT「黑話」。

比如一篇8月3日發(fā)表在<Resources Policy>上的論文，主題是電子商務(wù)對發(fā)展中國家化石燃料效率的影響。

其中，Cabanac就注意到，文章里有些方程完全就是不知所云。

不過最大的可疑之處在于，在某張表格上方，出現(xiàn)了這樣一行字：「請注意，作為一個語言模型，我無法生成具體的表格或進(jìn)行測試……」

對此，Elsevier的一位發(fā)言人表示，他們已經(jīng)發(fā)現(xiàn)了這個問題，正在對這篇論文進(jìn)行調(diào)查。

AI的大作，已經(jīng)完美混進(jìn)了人類作品

那么，一篇論文如果完全或部分由AI寫成，但作者不說，我們就沒有辦法發(fā)現(xiàn)了嗎？

大部分時候，的確如此。

最近美國南佛羅里達(dá)大學(xué)的一項(xiàng)研究表明，AI生成的文字內(nèi)容，可能已經(jīng)無法與人類寫的區(qū)分開來了。

他們邀請了72名世界頂級語言學(xué)期刊的專家，要求他們來審查各種研究摘要，但即使是這樣的專業(yè)人士，也很難識別出哪些摘要是人寫的，哪些是AI寫的。

在62%的情況下，他們會被AI騙過去。

具體來說，每位專家都被要求檢查四份摘要，能全部正確識別出來作者是人還是AI的，一個都沒有。

甚至13%的專家，一個都沒做對。

專家們的識別依據(jù)是語言習(xí)慣和文體特征，盡管他們的分析頭頭是道、合乎邏輯，但總體的陽性識別率也只有38.9%。

不過，英國科研誠信辦公室的Matt Hodgkinson表示，有些論文也會包含一些微妙的痕跡，讓我們可以隱約發(fā)現(xiàn)ChatGPT的「身影」。

比如，一些常見于AI的特定語言模式，以及翻譯得怪里怪氣的「奇妙短語」。

此處淺淺地感受一下：深度神經(jīng)網(wǎng)絡(luò)——profound neural organization（深刻神經(jīng)組織）。

以及人工智能——counterfeit consciousness（仿制意識/虛偽意識）；大數(shù)據(jù)——colossal information（巨信息）；云計算—— haze figuring（霾運(yùn)籌）；GPU——designs preparing unit（設(shè)計準(zhǔn)備器）；CPU——focal preparing unit（焦點(diǎn)準(zhǔn)備器）等等。

除此之外，AI在生成參考文獻(xiàn)時也是相當(dāng)?shù)摹柑祚R行空」，而這就可以作為同行評審時的重要參考。

例如，<Retraction Watch>（《撤稿觀察》）就曾揭露過一篇關(guān)于馬陸（millipedes）的預(yù)印本論文是由ChatGPT編寫的。

在一位研究人員發(fā)現(xiàn)文章中引用的一篇「論文」竟然是自己寫的后，注意到了這里面提到的大量參考文獻(xiàn)，都是假的。

類似的，丹麥國家血清研究所（State Serum Institute）的微生物學(xué)家Rune Stensvold也遇到了AI偽造參考文獻(xiàn)的問題。

當(dāng)時，一名學(xué)生向AI聊天機(jī)器人尋求有關(guān)腸道寄生蟲——芽囊原蟲屬（Blastocystis）的文獻(xiàn)建議，而這個聊天機(jī)器人則憑空編造了一篇以Stensvold為作者的參考文獻(xiàn)。

于是，這位學(xué)生就去找了Stensvold，表示希望能獲取這篇他發(fā)表于2006年的「論文」。

顯然，這篇論文根本就不存在。

然而，正如之前提到的，對于這些明顯會暴露論文使用了AI的痕跡，聰明的作者很容易就能把它們刪得一干二凈。

如此一來，想要發(fā)現(xiàn)是否實(shí)用了AI，就變成了一個不可能的任務(wù)。

Cabanac等打假人發(fā)現(xiàn)，無論是同行評審的會議論文，還是未經(jīng)同行評審的預(yù)印本論文中，都存在大量使用了ChatGPT但未披露的情況。

當(dāng)這些論文被掛在PubPeer上之后，有部分作者會承認(rèn)的確使用了ChatGPT，但并未聲明。

Hodgkinson表示：「本質(zhì)上，這是一場軍備競賽。就看騙子和偵探誰能勝出了?！?/span>

學(xué)術(shù)界要被攻陷了！

總之，形勢已經(jīng)很嚴(yán)峻。

Elisabeth Bik已辭去工作，成為大眾知名的專業(yè)打假人

舊金山的一位微生物學(xué)家、獨(dú)立研究誠信顧問Elisabeth Bik表示，ChatGPT和其他生成式AI工具的迅猛崛起，為「論文工廠」提供了充足的彈藥。

這是一條完善的產(chǎn)業(yè)鏈：這些公司大量生產(chǎn)和炮制出虛假的論文，賣給急需提高學(xué)術(shù)成果產(chǎn)量的研究者。

Bik說，現(xiàn)在問題已經(jīng)惡化了一百倍。

如今的學(xué)術(shù)圈，可能已經(jīng)充斥著一大批AI生產(chǎn)的「垃圾」論文。我們根本無從分辨，哪些是經(jīng)過認(rèn)真研究產(chǎn)生的嚴(yán)肅學(xué)術(shù)成果，哪些是AI炮制出來濫竽充數(shù)的「垃圾」。

同行評審：時間緊，人不夠

那么問題來了，為什么那些由AI生成的假論文，能屢次通過如此嚴(yán)格的同行評審？

一方面，ChatGPT這類的技術(shù)還比較新，并不是所有人都能有效辨別；另一方面，同行評審可能根本沒有時間來檢查這個問題。

對此，化名「Smuts Clyde」去揭發(fā)偽造論文的David Bimler表示，期刊中那些由LLM生成且未被發(fā)現(xiàn)的論文，指向了一個更深層次的問題：同行評審?fù)銐蚨嗟臎]有時間，來徹底檢查稿件中的可疑之處。

「畢竟，整個科學(xué)界的態(tài)度就是『要么發(fā)表，要么死亡（Publish or perish）』」，Bimler說，「因此『守門人』的數(shù)量永遠(yuǎn)都不是夠的?！?/span>

也許，這就是當(dāng)前殘酷的現(xiàn)實(shí)：評審論文需要大量的時間和專業(yè)知識，但AI只需幾分鐘就能完成一篇，無論它的質(zhì)量是多差。

參考資料：

https://www./articles/d41586-023-02477-w

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：天承辦公室 > 《023新智元說》

舉報/認(rèn)領(lǐng)