大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自學(xué)術(shù)頭條 ChatGPT吸引了全世界的注意力,各路競(jìng)爭(zhēng)對(duì)手都在加速追趕。 而 Google DeepMind 稱,他們的下一個(gè)大型語(yǔ)言模型將與 ChatGPT 背后的 GPT-4 相媲美,甚至完成超越,其中的關(guān)鍵技術(shù)之一,便來(lái)自曾經(jīng)擊敗人類頂尖棋手、也曾轟動(dòng)世界的 AlphaGo。 據(jù)科技雜志 Wired 報(bào)道,Google DeepMind 的聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Demis Hassabis 近日透露,他們正在使用 AlphaGo 背后的技術(shù)來(lái)幫助制造一個(gè)能與 ChatGPT 相匹敵的聊天機(jī)器人——Gemini,這是一個(gè)處理文本的大型語(yǔ)言模型,目前仍在開發(fā)中,或?qū)⒒ㄙM(fèi)數(shù)千或數(shù)億美元。 Hassabis 表示,將 AlphaGo 背后的技術(shù)注入大型語(yǔ)言模型中,可以賦予 AI 系統(tǒng)新的能力,如計(jì)劃、解決問(wèn)題和分析文本的能力。 “你可以認(rèn)為 Gemini 結(jié)合了 AlphaGo 類系統(tǒng)的一些優(yōu)勢(shì)和大型語(yǔ)言模型的驚人語(yǔ)言能力...... 我們還有一些新的創(chuàng)新,也將是相當(dāng)有趣的?!?/span> AlphaGo,在 ChatGPT 出現(xiàn)之前,或許是 AI 領(lǐng)域內(nèi)最耀眼的明星(之一),其讓大眾最為熟知的成就,便是擊敗李世石,成為世界上第一個(gè)戰(zhàn)勝人類圍棋世界冠軍的機(jī)器人。 AlphaGo 的成功,離不開強(qiáng)化學(xué)習(xí)技術(shù),該技術(shù)通過(guò)反復(fù)嘗試并接受關(guān)于其表現(xiàn)的反饋,可以學(xué)會(huì)處理需要選擇采取何種行動(dòng)的復(fù)雜問(wèn)題,如圍棋或視頻游戲等。 強(qiáng)化學(xué)習(xí)旨在“教”AI 系統(tǒng)在特定情況下表現(xiàn)出預(yù)期的行為,對(duì) AI 系統(tǒng)的某些行為進(jìn)行“獎(jiǎng)勵(lì)”,以及對(duì)不受大眾歡迎的行為進(jìn)行“懲罰”。 如今,ChatGPT 的核心技術(shù)之一——基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)已經(jīng)成為后續(xù)大型語(yǔ)言模型開發(fā)中不可或缺的關(guān)鍵技術(shù)。專業(yè)人士認(rèn)為,Google DeepMind 在強(qiáng)化學(xué)習(xí)方面的經(jīng)驗(yàn),或許可以幫助他們?cè)谏墒?AI 競(jìng)賽中奪得優(yōu)勢(shì)。 當(dāng)然,他們?cè)跈C(jī)器人、神經(jīng)科學(xué)等領(lǐng)域的工作也不容忽視。上周,他們展示了一個(gè)不需要人類監(jiān)督、能不斷自我學(xué)習(xí),可以在模擬和物理環(huán)境中處理語(yǔ)言、圖像和動(dòng)作的 AI 模型——RoboCat。據(jù)介紹,RoboCat 是第一個(gè)可以解決和適應(yīng)多項(xiàng)任務(wù)的機(jī)器人代理,且可以把這種能力帶到不同的、實(shí)體機(jī)器人中。 此外,AlphaGo 還使用了一種叫做“蒙特卡洛樹搜索”的方法來(lái)探索和記憶棋盤上的可能動(dòng)作。這是一種在完美信息博弈場(chǎng)景中進(jìn)行決策的通用技術(shù),除了游戲之外,還能廣泛應(yīng)用在很多其他現(xiàn)實(shí)世界場(chǎng)景中。 人們普遍認(rèn)為,像人類和動(dòng)物那樣從現(xiàn)實(shí)世界經(jīng)驗(yàn)中學(xué)習(xí),對(duì)于創(chuàng)造出一個(gè)更強(qiáng)大 AI 系統(tǒng)的努力至關(guān)重要。一些業(yè)內(nèi)專家認(rèn)為,目前的語(yǔ)言模型通過(guò)文本間接地學(xué)習(xí)世界的方法是一個(gè)主要的限制。 因此,他們認(rèn)為,大型語(yǔ)言模型的下一個(gè)重大飛躍,將是通過(guò)聯(lián)網(wǎng)等方式加強(qiáng)與現(xiàn)實(shí)世界的交流,進(jìn)而在互聯(lián)網(wǎng)和計(jì)算機(jī)上執(zhí)行更多的任務(wù)。 當(dāng) Gemini 開發(fā)完成后,它或許可以在谷歌應(yīng)對(duì) ChatGPT 和其他生成式 AI 技術(shù)所帶來(lái)的競(jìng)爭(zhēng)威脅中發(fā)揮重要作用。 早在今年 3 月,The Information 就報(bào)道了 Gemini,稱“Gemini 因當(dāng)時(shí) Bard 的失敗所刺激而誕生”。據(jù)透露,谷歌高層,包括谷歌最高級(jí)別的人工智能研究主管 Jeff Dean,也直接參與到 Gemini 項(xiàng)目中。 今年 4 月,為應(yīng)對(duì)來(lái)自 OpenAI/微軟等競(jìng)爭(zhēng)對(duì)手的沖擊,DeepMind 與 Google Brain 合并為 Google DeepMind。 當(dāng)前,Google DeepMind 的任務(wù),是加速谷歌的 AI 研究工作,同時(shí)也要管理未知的、潛在的嚴(yán)重風(fēng)險(xiǎn)。 如今,語(yǔ)言模型的快速發(fā)展使許多 AI 專家(包括一些構(gòu)建算法的專家)擔(dān)心,該技術(shù)是否會(huì)被用于惡意的用途或變得難以控制。為避免產(chǎn)生危險(xiǎn)的東西,一些業(yè)內(nèi)人士甚至呼吁暫停開發(fā)更強(qiáng)大的算法。 Hassabis 認(rèn)為,AI 的潛在好處,如在健康或氣候等領(lǐng)域的科學(xué)發(fā)現(xiàn),使得人類必須繼續(xù)發(fā)展這項(xiàng)技術(shù)?!叭绻龅谜_,它將是對(duì)人類最有益的技術(shù)。我們必須大膽地、勇敢地去追求這些東西?!?/span> 但是,Hassabis 也并不主張不負(fù)責(zé)任、不計(jì)后果地開發(fā) AI 模型,他在上個(gè)月簽署了一份聲明——稱 AI 有一天可能會(huì)帶來(lái)與核戰(zhàn)爭(zhēng)或大流行病相媲美的風(fēng)險(xiǎn)。 在他看來(lái),目前最大的挑戰(zhàn)之一是,確定能力更強(qiáng)的人工智能的風(fēng)險(xiǎn)可能是什么?!拔艺J(rèn)為該領(lǐng)域需要進(jìn)行更多的研究,比如快速地進(jìn)行評(píng)估測(cè)試等工作,從而確定新的 AI 模型的能力和可控性如何?!薄拔蚁M吹綄W(xué)術(shù)界能夠盡早接觸到這些前沿模型?!?/span> Hassabis 表示,沒(méi)有人真正知道 AI 會(huì)成為一個(gè)主要的危險(xiǎn)。但他可以肯定的是,如果繼續(xù)以目前的速度開發(fā) AI 模型,就沒(méi)有多少時(shí)間來(lái)開發(fā)保障措施。 參考鏈接: |
|