OpenAI 又是被搶頭條的一天。 發(fā)布會前夕,Deepmind 搶先發(fā)布了與 o1 模型類似的 Gemini 2.0 Flash Thinking 模型,在大模型競技場 LMSYS 上殺瘋了。 而隨后 OpenAI 發(fā)布會則重點(diǎn)展示了桌面版 ChatGPT 與 Mac 應(yīng)用的深度集成能力。 可以說,桌面版 ChatGPT 正有望成為你最靠譜的生產(chǎn)力搭子。 搶先實(shí)測 Google 版 o1,效果大出所料 沒有人比 Google 更懂「狙擊」。 今天凌晨,Google 重磅推出了 Gemini 2.0 Flash Thinking 模型,從名字上就可以看出,這是一款類似于 OpenAI o1 的推理模型。 轉(zhuǎn)投 Google 陣營的 Logan Kilpatrick 在 X 平臺上發(fā)文稱: 「就在你以為一切都結(jié)束了的時(shí)候… 我們推出了 Gemini 2.0 Flash Thinking。 這是一種新的實(shí)驗(yàn)?zāi)P?,可以解鎖更強(qiáng)的推理能力并展示其思考過程,能夠以閃電般的速度解決復(fù)雜問題,以及還有更多功能。」 在大模型競技場 LMSYS 上真·戰(zhàn)績可查。 當(dāng)然,旁人說得再好,不如親自上手體驗(yàn)。 我們也第一時(shí)間上手實(shí)測了這款新模型,先來「9.11 和 9.8 哪個(gè)大」的經(jīng)典問題,結(jié)果新模型輕松拿捏,甚至還能用錢舉例。 「strawberry 中有幾個(gè) r」也手拿把掐, 點(diǎn)開后還能看到其清晰的「思考」步驟。 面對職場分水難題「你有 4 杯水,來了 5 個(gè)領(lǐng)導(dǎo)你該怎么辦?」,Google 版 o1 又會如何應(yīng)對?滿分十分,你給這個(gè)答案給幾分? 向左內(nèi)容 對于「有軌電車難題」的回答,除了前面有條不紊的回答,我更喜歡這位新選手最后一句高情商的回答: 「理解你的思考過程比得到一個(gè)『正確』答案更重要?!?/p> 向左內(nèi)容 為了考察新模型是否「偏科」,我也上傳了一道考研數(shù)學(xué)熱門題,并讓它和 OpenAI o1 模型同時(shí)作答。 省去繁瑣的運(yùn)算過程后,兩者得出的結(jié)果一致,但 Google 版 o1 只花了 27.5 秒,相比之下,OpenAI o1 花了足足 1 分 32 秒。 向左內(nèi)容 當(dāng)然,最好的評價(jià)還是親自上手。附上體驗(yàn)地址 ??: https://aistudio.google.com/prompts/new_chat 關(guān)注 AI 第一新媒體,率先獲取 AI 前沿資訊和洞察 給 Mac 裝上最強(qiáng)大腦,這才是真正的人機(jī)交互 在被搶頭條后,OpenAI 也不慌不忙地如期舉行了發(fā)布會。 全新桌面版 ChatGPT 將超越單純的問答,能夠通過與 30 多種應(yīng)用協(xié)作來輔助提升你的寫作和編程能力。 使用方式也十分簡單,用戶只需確保目標(biāo)應(yīng)用正在運(yùn)行,然后在 ChatGPT 聊天欄中點(diǎn)擊「與應(yīng)用協(xié)作」(Work With Apps)按鈕并選擇相應(yīng)應(yīng)用即可。 聊天欄上方會顯示當(dāng)前協(xié)作的應(yīng)用程序,用戶可以隨時(shí)查看 ChatGPT 將要處理的內(nèi)容范圍。 這些互動記錄會保存在用戶賬戶中,直到被刪除或經(jīng)過 30 天自動清除。 在實(shí)際演示中,OpenAI 工作人員通過 Mac 版 ChatGPT 展示了多項(xiàng)實(shí)用功能。 以 Warp 控制臺為例,ChatGPT 能夠根據(jù)演示人員要求快速生成 Git 命令來統(tǒng)計(jì)代碼庫的每日提交次數(shù),并將其數(shù)據(jù)可視化為富有圣誕節(jié)氣氛的柱狀圖。 在這個(gè)過程中,它正是充分使用了 Advanced Data Analysis(高級數(shù)據(jù)分析)等內(nèi)置功能。 為保護(hù)用戶隱私,OpenAI 演示人員表示只會訪問用戶明確授權(quán)的應(yīng)用內(nèi)容。 但在查閱 OpenAI 官網(wǎng)后發(fā)現(xiàn),這些交互數(shù)據(jù)可能會被用于模型訓(xùn)練,因此你需要在設(shè)置中調(diào)整數(shù)據(jù)使用權(quán)限,甚至按需禁用應(yīng)用協(xié)作功能。 「它還告訴我們這個(gè)文本字段有 37 行,我們可以向下檢查確認(rèn)是否是 37 行?!? 有趣的是,演示過程再次上演翻車場面。 當(dāng)要求 ChatGPT 添加「觀察者」功能,選擇變化加載文本區(qū)域時(shí),o1 生成的代碼在 Xcode 運(yùn)行失敗,直到修正過后才成功。 值得一提的是,這項(xiàng)功能不僅支持 Xcode,還覆蓋了 VS Code、Jetbrains 全家桶等主流開發(fā)工具。 寫作場景是日常最實(shí)用的場景之一。 Mac 版 ChatGPT 也將支持 Notes、Notion 和 Quip 等多款應(yīng)用,為用戶帶來全新的寫作協(xié)作體驗(yàn)。 作為舊金山徒步歷史導(dǎo)覽員,OpenAI 演示人員通過自己正在設(shè)計(jì)的導(dǎo)覽項(xiàng)目生動展示了這些新功能。 比如說,在 Notion 文檔中,他正嘗試編寫關(guān)于舊金山歷史人物「諾頓皇帝」的介紹,但如何描述歷史人物的生平,如何挖掘有趣細(xì)節(jié)等等都是一門不小的學(xué)問。 借助搜索功能,ChatGPT 能夠 查證歷史文獻(xiàn)和研究資料,快速補(bǔ)充諾頓皇帝在舊金山的活動軌跡、與當(dāng)?shù)鼐用竦幕拥壬郊?xì)節(jié),并對其過往行為進(jìn)行深入解讀。 為了減少 AI 的機(jī)器味,我們也能要求其模仿 Notion 文檔中的語言表達(dá)方式和敘述節(jié)奏,對內(nèi)容進(jìn)行調(diào)整,使其更加流暢自然。 除了文本交互,ChatGPT 高級語音模式 還有新玩法。 作為一名職業(yè)薩克斯演奏家,OpenAI 演示人員還能與前不久剛推出的「圣誕老人」限定語音討論節(jié)日派對曲目的選擇。 演示人員還即興演奏了一段動聽的薩克斯樂曲。 目前,上述提到的新功能已在 macOS ChatGPT 最新版本中上線,而 Windows 版本很快也會推出。 不妨再耐心等待一下。 發(fā)布會最后,OpenAI CPO Kevin Weil 還預(yù)告明天將會發(fā)布 「令人興奮」的新產(chǎn)品。 而 Google、Anthropic 等公司面對年底最后一輪 AI 狂歡,是否又會再次放大招「狙擊」? 一切都值得拭目以待。 APPSO 也將在明天凌晨第一時(shí)間送上最新報(bào)道。 |
|