平地一聲雷,GPT-4 重磅來襲。 3 月 14 日,OpenAI 正式上線新一代人工智能大模型 GPT-4,它是一個(gè)大型多模態(tài)模型,可以接受圖像和文本輸入,同時(shí)返回文本輸出。就像這樣: 用戶:這幅畫有什么好笑的地方?逐一描述它的板塊。 圖片來源:https://www./r/hmmm/comments/ubab5v/hmmm/ GPT-4:圖片顯示的是一個(gè) 'Lightning Cable '適配器的包裝,有三個(gè)板塊: 板塊1:一部智能手機(jī),VGA 連接器(通常用于電腦顯示器的大型藍(lán)色 15 針連接器)插在其充電端口。 板塊2:'Lightning Cable '適配器的包裝上有一張 VGA 接口的圖片。 板塊3:VGA 連接器的特寫,末端是一個(gè)小的 Lightning 連接器(用于為 iPhone 和其他蘋果設(shè)備充電)。 這張圖片的幽默感來自于將一個(gè)大的、過時(shí)的 VGA 連接器插入一個(gè)小的、現(xiàn)代的智能手機(jī)充電端口的荒謬性。 不得不說,一個(gè)示例足以證明了 GPT-4 與過往大模型的不同之處,是不是很強(qiáng)大? 與此同時(shí),微軟宣布 Bing Chat 一直在 GPT-4 上運(yùn)行。 當(dāng)前,OpenAI 計(jì)劃通過 ChatGPT 及其商業(yè) API 發(fā)布 GPT-4 的文本功能,但是想要直接用上,還需要先加入一波等待名單(https:///waitlist/gpt-4-api)耐心等候。不過,ChatGPT Plus 用戶倒是可以直接上手 GPT-4 的體驗(yàn):https://chat./chat GPT-4 驚喜上線 雖然此前 OpenAI 首席技術(shù)官 Mira Murati 不斷給大家打預(yù)防針,希望外界能夠?qū)ο乱淮?GPT(即 GPT-4)的技術(shù)水平更加冷靜務(wù)實(shí)一些,少一些炒作會更好些,但是當(dāng) GPT-4 真正到來時(shí),大家還是坐不住了。 “我們花了 6 個(gè)月的時(shí)間,利用對抗性測試項(xiàng)目以及 ChatGPT 的經(jīng)驗(yàn),反復(fù)調(diào)整 GPT-4,結(jié)果在真實(shí)性、可操作性以及拒絕超出道德等邊界方面取得了有史以來最好的結(jié)果(盡管遠(yuǎn)非完美)”,OpenAI 分享道。 GPT-4:可以達(dá)到應(yīng)試者的前 10% 水平、一張草圖生成網(wǎng)站 為讓眾人更加清楚地了解 GPT-4,OpenAI 官方不僅上線了介紹性的網(wǎng)頁(https:///research/gpt-4),還發(fā)布了一篇技術(shù)論文(https://cdn./papers/gpt-4.pdf),詳細(xì)分享了 GPT-4 強(qiáng)大的功能,以及其存在的局限性。 從技術(shù)維度上來看,GPT-4 是一個(gè)基于 Transformer 的模型,經(jīng)過預(yù)訓(xùn)練,可以預(yù)測文檔中的下一個(gè) token。這個(gè)項(xiàng)目的一個(gè)核心部分是開發(fā)了基礎(chǔ)設(shè)施和優(yōu)化方法。這使 OpenAI 能夠根據(jù)不超過 GPT-4 的 1/1000 的計(jì)算量訓(xùn)練的模型,準(zhǔn)確地預(yù)測 GPT-4 的某些方面的性能。 也正如昨天 CSDN 報(bào)道的,微軟的 Azure 與 OpenAI 共同設(shè)計(jì)了一臺超級計(jì)算機(jī),搭載了英偉達(dá)上萬顆 A100 芯片?;谶@臺超算,OpenAI 在一年前將 GPT-3.5 作為系統(tǒng)的第一次“測試運(yùn)行”進(jìn)行了訓(xùn)練,在修復(fù)一些 Bug 并提高理論基礎(chǔ)之上,OpenAI 基于此又訓(xùn)練出了首個(gè)能夠提前準(zhǔn)確預(yù)測其訓(xùn)練性能的大模型 GPT-4。 更長的上下文,上限為 2.5 萬個(gè)字 在性能上,GPT-4 超越了過往的模型,它可以遵循自然語言的復(fù)雜指令、生成技術(shù)或創(chuàng)意作品,支持生成和處理多達(dá) 32,768 個(gè) token(約 25,000 字的文本),這使得 GPT-4 能有更長的上下文,允許長篇內(nèi)容創(chuàng)建、擴(kuò)展對話以及文檔搜索和分析等用例。 GPT-4 可以直接上一個(gè)好大學(xué) 在分析 GPT-4 的能力時(shí),OpenAI 還讓該模型參加了統(tǒng)一律師考試、法學(xué)院入學(xué)考試(LSAT)、研究生入學(xué)考試(GRE)的定量、口頭推理、分析寫作考試以及和各種 AP 科目考試等測試。 考試問題包括選擇題和自由解答題,OpenAI 為每種形式設(shè)計(jì)了單獨(dú)的提示,并在需要輸入的問題中加入了圖片??偡质峭ㄟ^結(jié)合選擇題和自由回答題的分?jǐn)?shù)來確定的,使用的是每個(gè)考試的公開方法。 最終結(jié)果如下: GPT-4 在大多數(shù)這些專業(yè)和學(xué)術(shù)考試中表現(xiàn)與人類水平相當(dāng)。這意味著,如果 GPT-4 是一個(gè)僅憑應(yīng)試能力來判斷的人,它可以進(jìn)入法學(xué)院,而且很可能也能進(jìn)入許多大學(xué)。 多模態(tài)能力,通過視覺輸入看世界 正如文章開頭示例展現(xiàn)的一樣,GPT-4 可以接受圖像作為輸入并生成標(biāo)題、分類和分析。 這意味著 GPT-4 實(shí)際上將看到現(xiàn)實(shí)世界,為此,OpenAI 也宣布正在和它的合作伙伴 Be My Eyes 一起測試 GPT-4 的圖像輸入能力,這是一款即將推出的智能手機(jī)應(yīng)用程序,可以直觀地解釋手機(jī)相機(jī)所看到的內(nèi)容。 不過,該功能目前仍限于研究預(yù)覽,沒有公開提供。 超越傳統(tǒng)的大模型 在一套傳統(tǒng)的 NLP 基準(zhǔn)測試中,GPT-4 超過了以前的大型語言模型和大多數(shù)最先進(jìn)的系統(tǒng)(這些系統(tǒng)通常有特定的基準(zhǔn)訓(xùn)練或手工工程)。 在 MMLU(多任務(wù)語言理解)基準(zhǔn)測試中,GPT-4 不僅在英語中以相當(dāng)大的優(yōu)勢勝過現(xiàn)有的模型,而且在其他語言中也表現(xiàn)出強(qiáng)大的性能。在 MMLU 的翻譯變體上,GPT-4 的性能優(yōu)于 GPT-3.5 和其他 LLM(Chinchilla,PaLM)的英語性能,包括低資源語言,如拉脫維亞語、威爾士語和斯瓦希里語。 生成代碼、改 Bug 的最佳小能手 除此之外,OpenAI 通過開源評估框架(Eval,https://github.com/openai/evals),用于自動評估 AI 模型性能的框架,允許任何人報(bào)告模型中的缺點(diǎn),以幫助指導(dǎo)進(jìn)一步改進(jìn)。 與此同時(shí),GPT-4 對代碼有超強(qiáng)的理解能力,可以幫助程序員生成代碼,遇上 Bug 時(shí),甚至只要你把錯(cuò)誤信息或者代碼異常的截圖發(fā)給 GPT-4,它就能幫你給出相應(yīng)的提示。 只需幾秒,一張手畫草圖,GPT-4 直接幫你生成網(wǎng)頁 更讓人驚奇的是,在官方演示的視頻中,手繪一張網(wǎng)站草圖: 把它拍照發(fā)給 GPT-4,GPT-4 甚至可以自動生成網(wǎng)站的原型圖。它從圖片中提取文字信息并輸出到 HTML,一個(gè)網(wǎng)站就有了,整個(gè)過程只有幾秒鐘的時(shí)間: 另外,GPT-4 也能處理復(fù)雜的稅務(wù)問題。 一系列操作下來,驚呆眾人。在上手體驗(yàn)之后,不少網(wǎng)友現(xiàn)身說法: 我不在乎它不是 AGI,GPT-4 是一項(xiàng)令人難以置信的變革性技術(shù)。我在 60 秒內(nèi)重新創(chuàng)建了 Pong 游戲。這是我的第一次嘗試。 據(jù)悉,所有的代碼都是 HTML 實(shí)現(xiàn)的。 甚至有人看到了 GPT-4 的強(qiáng)大,開始暗戳戳地暗示起 GPT-5 的模樣: 不足之處 OpenAI 表示,他們的目標(biāo)是開發(fā)能夠在任何智力任務(wù)方面取代人類的 AGI,盡管 GPT-4 還沒有達(dá)到這個(gè)目標(biāo)。 盡管有這樣的能力,GPT-4 與早期的 GPT 模型有類似的局限性:它不是完全可靠的,比如,它也會對事實(shí)產(chǎn)生“幻覺”,推理出錯(cuò)誤的結(jié)果。 對此,OpenAI 首席執(zhí)行官 Sam Altman 在推特上說:'它(GPT-4)仍然有缺陷,仍然有局限性,但它在首次使用時(shí)仍然能給你留下深刻印象。' 在使用 GPT-4 的輸出時(shí),應(yīng)該小心謹(jǐn)慎,特別是在專業(yè)性要求非常高的重要場景中。 微軟:新 Bing 早用上了 GPT-4 這也是事實(shí),GPT-4 遠(yuǎn)非完美。不過根據(jù) OpenAI 的說法,研究人員納入了更多的人類反饋,包括 ChatGPT 用戶提交的反饋,用來改善 GPT-4 的行為。此外,OpenAI 公司還聘請了 50 名人類專家,在人工智能安全方面提供反饋。 如今微軟同時(shí)宣布自家產(chǎn)品早已第一時(shí)間用上了 GPT-4。'我們很高興地確認(rèn),新的 Bing 正在 GPT-4 上運(yùn)行,為搜索而定制,'微軟在一篇博客文章中寫道。'如果你在過去六周的任何時(shí)候使用過預(yù)覽版的新 Bing,你已經(jīng)提前看到了 OpenAI 的最新模型的力量。隨著 OpenAI 對 GPT-4 及以后的更新,Bing 從這些改進(jìn)中受益,以確保我們的用戶擁有最全面的副駕駛功能。' 壓力給到國外的 Google,國內(nèi)的百度 雖然上周 OpenAI 早已預(yù)告過 GPT-4 會在本周到來,但是真正到來時(shí),還是讓很多人猝不及防。而之所以選擇此時(shí)發(fā)布,似乎也是為微軟將在 3 月 16 號的 AI 最新進(jìn)展做一定的鋪墊,這樣微軟可以在明天輕松開上一場發(fā)布會了。不過,處于同賽道的其他玩家可能得連夜加班了。 這不,就在這一天,Google CEO 皮查伊親自下場官宣開放預(yù)訓(xùn)練大模型(PaLM,https://www./ai-models/pretrained-models/PaLM)的 API 商業(yè)接口,這是 Google 在 2022 年 4 月發(fā)布的自然語言預(yù)訓(xùn)練大模型,最高參數(shù)為 5400 億。 與此同時(shí),百度早在此前便宣布將會在 3 月 16 日帶來文心一言,最終成果不可避免地會與最新的 GPT-4 一較高下,究竟會如何,我們也將在明天揭曉。 參考資料: https:///research/gpt-4 https://www./watch?v=outcGtbnMuQ |
|