Google 深夜發(fā)布免費(fèi)版 o1「暴打」OpenAI，實(shí)測解題快 3 倍，這句高情商回答絕了

monicyuan 2024-12-20

展開全文

OpenAI 又是被搶頭條的一天。

發(fā)布會前夕，Deepmind 搶先發(fā)布了與 o1 模型類似的 Gemini 2.0 Flash Thinking 模型，在大模型競技場 LMSYS 上殺瘋了。

而隨后 OpenAI 發(fā)布會則重點(diǎn)展示了桌面版 ChatGPT 與 Mac 應(yīng)用的深度集成能力。

可以說，桌面版 ChatGPT 正有望成為你最靠譜的生產(chǎn)力搭子。

搶先實(shí)測 Google 版 o1，效果大出所料

沒有人比 Google 更懂「狙擊」。

今天凌晨，Google 重磅推出了 Gemini 2.0 Flash Thinking 模型，從名字上就可以看出，這是一款類似于 OpenAI o1 的推理模型。

轉(zhuǎn)投 Google 陣營的 Logan Kilpatrick 在 X 平臺上發(fā)文稱：

「就在你以為一切都結(jié)束了的時(shí)候… 我們推出了 Gemini 2.0 Flash Thinking。

這是一種新的實(shí)驗(yàn)?zāi)Ｐ?，可以解鎖更強(qiáng)的推理能力并展示其思考過程，能夠以閃電般的速度解決復(fù)雜問題，以及還有更多功能。」

在大模型競技場 LMSYS 上真·戰(zhàn)績可查。

當(dāng)然，旁人說得再好，不如親自上手體驗(yàn)。

我們也第一時(shí)間上手實(shí)測了這款新模型，先來「9.11 和 9.8 哪個(gè)大」的經(jīng)典問題，結(jié)果新模型輕松拿捏，甚至還能用錢舉例。

「strawberry 中有幾個(gè) r」也手拿把掐，點(diǎn)開后還能看到其清晰的「思考」步驟。

面對職場分水難題「你有 4 杯水，來了 5 個(gè)領(lǐng)導(dǎo)你該怎么辦？」，Google 版 o1 又會如何應(yīng)對？滿分十分，你給這個(gè)答案給幾分？

向左內(nèi)容

對于「有軌電車難題」的回答，除了前面有條不紊的回答，我更喜歡這位新選手最后一句高情商的回答：

「理解你的思考過程比得到一個(gè)『正確』答案更重要?！?/p>

向左內(nèi)容

為了考察新模型是否「偏科」，我也上傳了一道考研數(shù)學(xué)熱門題，并讓它和 OpenAI o1 模型同時(shí)作答。

省去繁瑣的運(yùn)算過程后，兩者得出的結(jié)果一致，但 Google 版 o1 只花了 27.5 秒，相比之下，OpenAI o1 花了足足 1 分 32 秒。

向左內(nèi)容

當(dāng)然，最好的評價(jià)還是親自上手。附上體驗(yàn)地址 ??：

https://aistudio.google.com/prompts/new_chat

關(guān)注 AI 第一新媒體，率先獲取 AI 前沿資訊和洞察

給 Mac 裝上最強(qiáng)大腦，這才是真正的人機(jī)交互

在被搶頭條后，OpenAI 也不慌不忙地如期舉行了發(fā)布會。

全新桌面版 ChatGPT 將超越單純的問答，能夠通過與 30 多種應(yīng)用協(xié)作來輔助提升你的寫作和編程能力。

使用方式也十分簡單，用戶只需確保目標(biāo)應(yīng)用正在運(yùn)行，然后在 ChatGPT 聊天欄中點(diǎn)擊「與應(yīng)用協(xié)作」（Work With Apps）按鈕并選擇相應(yīng)應(yīng)用即可。

聊天欄上方會顯示當(dāng)前協(xié)作的應(yīng)用程序，用戶可以隨時(shí)查看 ChatGPT 將要處理的內(nèi)容范圍。這些互動記錄會保存在用戶賬戶中，直到被刪除或經(jīng)過 30 天自動清除。

在實(shí)際演示中，OpenAI 工作人員通過 Mac 版 ChatGPT 展示了多項(xiàng)實(shí)用功能。

以 Warp 控制臺為例，ChatGPT 能夠根據(jù)演示人員要求快速生成 Git 命令來統(tǒng)計(jì)代碼庫的每日提交次數(shù)，并將其數(shù)據(jù)可視化為富有圣誕節(jié)氣氛的柱狀圖。

在這個(gè)過程中，它正是充分使用了 Advanced Data Analysis（高級數(shù)據(jù)分析）等內(nèi)置功能。

為保護(hù)用戶隱私，OpenAI 演示人員表示只會訪問用戶明確授權(quán)的應(yīng)用內(nèi)容。

但在查閱 OpenAI 官網(wǎng)后發(fā)現(xiàn)，這些交互數(shù)據(jù)可能會被用于模型訓(xùn)練，因此你需要在設(shè)置中調(diào)整數(shù)據(jù)使用權(quán)限，甚至按需禁用應(yīng)用協(xié)作功能。

「它還告訴我們這個(gè)文本字段有 37 行，我們可以向下檢查確認(rèn)是否是 37 行?！?

有趣的是，演示過程再次上演翻車場面。

當(dāng)要求 ChatGPT 添加「觀察者」功能，選擇變化加載文本區(qū)域時(shí)，o1 生成的代碼在 Xcode 運(yùn)行失敗，直到修正過后才成功。

值得一提的是，這項(xiàng)功能不僅支持 Xcode，還覆蓋了 VS Code、Jetbrains 全家桶等主流開發(fā)工具。

寫作場景是日常最實(shí)用的場景之一。

Mac 版 ChatGPT 也將支持 Notes、Notion 和 Quip 等多款應(yīng)用，為用戶帶來全新的寫作協(xié)作體驗(yàn)。

作為舊金山徒步歷史導(dǎo)覽員，OpenAI 演示人員通過自己正在設(shè)計(jì)的導(dǎo)覽項(xiàng)目生動展示了這些新功能。

比如說，在 Notion 文檔中，他正嘗試編寫關(guān)于舊金山歷史人物「諾頓皇帝」的介紹，但如何描述歷史人物的生平，如何挖掘有趣細(xì)節(jié)等等都是一門不小的學(xué)問。

借助搜索功能，ChatGPT 能夠查證歷史文獻(xiàn)和研究資料，快速補(bǔ)充諾頓皇帝在舊金山的活動軌跡、與當(dāng)?shù)鼐用竦幕拥壬郊?xì)節(jié)，并對其過往行為進(jìn)行深入解讀。

為了減少 AI 的機(jī)器味，我們也能要求其模仿 Notion 文檔中的語言表達(dá)方式和敘述節(jié)奏，對內(nèi)容進(jìn)行調(diào)整，使其更加流暢自然。

除了文本交互，ChatGPT 高級語音模式還有新玩法。

作為一名職業(yè)薩克斯演奏家，OpenAI 演示人員還能與前不久剛推出的「圣誕老人」限定語音討論節(jié)日派對曲目的選擇。

演示人員還即興演奏了一段動聽的薩克斯樂曲。

目前，上述提到的新功能已在 macOS ChatGPT 最新版本中上線，而 Windows 版本很快也會推出。不妨再耐心等待一下。

發(fā)布會最后，OpenAI CPO Kevin Weil 還預(yù)告明天將會發(fā)布「令人興奮」的新產(chǎn)品。

而 Google、Anthropic 等公司面對年底最后一輪 AI 狂歡，是否又會再次放大招「狙擊」？

一切都值得拭目以待。

APPSO 也將在明天凌晨第一時(shí)間送上最新報(bào)道。

本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自： monicyuan > 《待分類》

舉報(bào)/認(rèn)領(lǐng)