如何超越ChatGPT？Google DeepMind：要靠打敗人類玩家的AlphaGo

江海博覽 2023-07-04 發(fā)布于浙江

展開全文

大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自學(xué)術(shù)頭條

ChatGPT吸引了全世界的注意力，各路競(jìng)爭(zhēng)對(duì)手都在加速追趕。

而 Google DeepMind 稱，他們的下一個(gè)大型語(yǔ)言模型將與 ChatGPT 背后的 GPT-4 相媲美，甚至完成超越，其中的關(guān)鍵技術(shù)之一，便來(lái)自曾經(jīng)擊敗人類頂尖棋手、也曾轟動(dòng)世界的 AlphaGo。

據(jù)科技雜志 Wired 報(bào)道，Google DeepMind 的聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Demis Hassabis 近日透露，他們正在使用 AlphaGo 背后的技術(shù)來(lái)幫助制造一個(gè)能與 ChatGPT 相匹敵的聊天機(jī)器人——Gemini，這是一個(gè)處理文本的大型語(yǔ)言模型，目前仍在開發(fā)中，或?qū)⒒ㄙM(fèi)數(shù)千或數(shù)億美元。

Hassabis 表示，將 AlphaGo 背后的技術(shù)注入大型語(yǔ)言模型中，可以賦予 AI 系統(tǒng)新的能力，如計(jì)劃、解決問(wèn)題和分析文本的能力。

“你可以認(rèn)為 Gemini 結(jié)合了 AlphaGo 類系統(tǒng)的一些優(yōu)勢(shì)和大型語(yǔ)言模型的驚人語(yǔ)言能力...... 我們還有一些新的創(chuàng)新，也將是相當(dāng)有趣的?！?/span>

借助AlphaGo的成功經(jīng)驗(yàn)

AlphaGo，在 ChatGPT 出現(xiàn)之前，或許是 AI 領(lǐng)域內(nèi)最耀眼的明星（之一），其讓大眾最為熟知的成就，便是擊敗李世石，成為世界上第一個(gè)戰(zhàn)勝人類圍棋世界冠軍的機(jī)器人。

AlphaGo 的成功，離不開強(qiáng)化學(xué)習(xí)技術(shù)，該技術(shù)通過(guò)反復(fù)嘗試并接受關(guān)于其表現(xiàn)的反饋，可以學(xué)會(huì)處理需要選擇采取何種行動(dòng)的復(fù)雜問(wèn)題，如圍棋或視頻游戲等。

強(qiáng)化學(xué)習(xí)旨在“教”AI 系統(tǒng)在特定情況下表現(xiàn)出預(yù)期的行為，對(duì) AI 系統(tǒng)的某些行為進(jìn)行“獎(jiǎng)勵(lì)”，以及對(duì)不受大眾歡迎的行為進(jìn)行“懲罰”。

如今，ChatGPT 的核心技術(shù)之一——基于人類反饋的強(qiáng)化學(xué)習(xí)（RLHF）已經(jīng)成為后續(xù)大型語(yǔ)言模型開發(fā)中不可或缺的關(guān)鍵技術(shù)。專業(yè)人士認(rèn)為，Google DeepMind 在強(qiáng)化學(xué)習(xí)方面的經(jīng)驗(yàn)，或許可以幫助他們?cè)谏墒?AI 競(jìng)賽中奪得優(yōu)勢(shì)。

當(dāng)然，他們?cè)跈C(jī)器人、神經(jīng)科學(xué)等領(lǐng)域的工作也不容忽視。上周，他們展示了一個(gè)不需要人類監(jiān)督、能不斷自我學(xué)習(xí)，可以在模擬和物理環(huán)境中處理語(yǔ)言、圖像和動(dòng)作的 AI 模型——RoboCat。據(jù)介紹，RoboCat 是第一個(gè)可以解決和適應(yīng)多項(xiàng)任務(wù)的機(jī)器人代理，且可以把這種能力帶到不同的、實(shí)體機(jī)器人中。

此外，AlphaGo 還使用了一種叫做“蒙特卡洛樹搜索”的方法來(lái)探索和記憶棋盤上的可能動(dòng)作。這是一種在完美信息博弈場(chǎng)景中進(jìn)行決策的通用技術(shù)，除了游戲之外，還能廣泛應(yīng)用在很多其他現(xiàn)實(shí)世界場(chǎng)景中。

人們普遍認(rèn)為，像人類和動(dòng)物那樣從現(xiàn)實(shí)世界經(jīng)驗(yàn)中學(xué)習(xí)，對(duì)于創(chuàng)造出一個(gè)更強(qiáng)大 AI 系統(tǒng)的努力至關(guān)重要。一些業(yè)內(nèi)專家認(rèn)為，目前的語(yǔ)言模型通過(guò)文本間接地學(xué)習(xí)世界的方法是一個(gè)主要的限制。

因此，他們認(rèn)為，大型語(yǔ)言模型的下一個(gè)重大飛躍，將是通過(guò)聯(lián)網(wǎng)等方式加強(qiáng)與現(xiàn)實(shí)世界的交流，進(jìn)而在互聯(lián)網(wǎng)和計(jì)算機(jī)上執(zhí)行更多的任務(wù)。

當(dāng) Gemini 開發(fā)完成后，它或許可以在谷歌應(yīng)對(duì) ChatGPT 和其他生成式 AI 技術(shù)所帶來(lái)的競(jìng)爭(zhēng)威脅中發(fā)揮重要作用。

早在今年 3 月，The Information 就報(bào)道了 Gemini，稱“Gemini 因當(dāng)時(shí) Bard 的失敗所刺激而誕生”。據(jù)透露，谷歌高層，包括谷歌最高級(jí)別的人工智能研究主管 Jeff Dean，也直接參與到 Gemini 項(xiàng)目中。

今年 4 月，為應(yīng)對(duì)來(lái)自 OpenAI/微軟等競(jìng)爭(zhēng)對(duì)手的沖擊，DeepMind 與 Google Brain 合并為 Google DeepMind。

模糊的未來(lái)

當(dāng)前，Google DeepMind 的任務(wù)，是加速谷歌的 AI 研究工作，同時(shí)也要管理未知的、潛在的嚴(yán)重風(fēng)險(xiǎn)。

如今，語(yǔ)言模型的快速發(fā)展使許多 AI 專家（包括一些構(gòu)建算法的專家）擔(dān)心，該技術(shù)是否會(huì)被用于惡意的用途或變得難以控制。為避免產(chǎn)生危險(xiǎn)的東西，一些業(yè)內(nèi)人士甚至呼吁暫停開發(fā)更強(qiáng)大的算法。

Hassabis 認(rèn)為，AI 的潛在好處，如在健康或氣候等領(lǐng)域的科學(xué)發(fā)現(xiàn)，使得人類必須繼續(xù)發(fā)展這項(xiàng)技術(shù)?！叭绻龅谜_，它將是對(duì)人類最有益的技術(shù)。我們必須大膽地、勇敢地去追求這些東西?！?/span>

但是，Hassabis 也并不主張不負(fù)責(zé)任、不計(jì)后果地開發(fā) AI 模型，他在上個(gè)月簽署了一份聲明——稱 AI 有一天可能會(huì)帶來(lái)與核戰(zhàn)爭(zhēng)或大流行病相媲美的風(fēng)險(xiǎn)。

在他看來(lái)，目前最大的挑戰(zhàn)之一是，確定能力更強(qiáng)的人工智能的風(fēng)險(xiǎn)可能是什么?！拔艺J(rèn)為該領(lǐng)域需要進(jìn)行更多的研究，比如快速地進(jìn)行評(píng)估測(cè)試等工作，從而確定新的 AI 模型的能力和可控性如何?！薄拔蚁Ｍ吹綄W(xué)術(shù)界能夠盡早接觸到這些前沿模型?！?/span>

Hassabis 表示，沒(méi)有人真正知道 AI 會(huì)成為一個(gè)主要的危險(xiǎn)。但他可以肯定的是，如果繼續(xù)以目前的速度開發(fā) AI 模型，就沒(méi)有多少時(shí)間來(lái)開發(fā)保障措施。

參考鏈接：

https://www./story/google-deepmind-demis-hassabis-chatgpt/

https:///2023/06/26/deepmind-claims-its-next-chatbot-will-rival-chatgpt/

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：江海博覽 > 《科技》

舉報(bào)/認(rèn)領(lǐng)