小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

Google 深夜發(fā)布免費(fèi)版 o1「暴打」OpenAI,實(shí)測解題快 3 倍,這句高情商回答絕了

 monicyuan 2024-12-20

OpenAI 又是被搶頭條的一天。

發(fā)布會前夕,Deepmind 搶先發(fā)布了與 o1 模型類似的 Gemini 2.0 Flash Thinking 模型,在大模型競技場 LMSYS 上殺瘋了。

而隨后 OpenAI 發(fā)布會則重點(diǎn)展示了桌面版 ChatGPT 與 Mac 應(yīng)用的深度集成能力。

可以說,桌面版 ChatGPT 正有望成為你最靠譜的生產(chǎn)力搭子。

搶先實(shí)測 Google 版 o1,效果大出所料

沒有人比 Google 更懂「狙擊」。

今天凌晨,Google 重磅推出了 Gemini 2.0 Flash Thinking 模型,從名字上就可以看出,這是一款類似于 OpenAI o1 的推理模型。

轉(zhuǎn)投 Google 陣營的 Logan Kilpatrick 在 X 平臺上發(fā)文稱:

「就在你以為一切都結(jié)束了的時(shí)候… 我們推出了 Gemini 2.0 Flash Thinking。

這是一種新的實(shí)驗(yàn)?zāi)P?,可以解鎖更強(qiáng)的推理能力并展示其思考過程,能夠以閃電般的速度解決復(fù)雜問題,以及還有更多功能。」

在大模型競技場 LMSYS 上真·戰(zhàn)績可查。

當(dāng)然,旁人說得再好,不如親自上手體驗(yàn)。

我們也第一時(shí)間上手實(shí)測了這款新模型,先來「9.11 和 9.8 哪個(gè)大」的經(jīng)典問題,結(jié)果新模型輕松拿捏,甚至還能用錢舉例。

「strawberry 中有幾個(gè) r」也手拿把掐, 點(diǎn)開后還能看到其清晰的「思考」步驟。

面對職場分水難題「你有 4 杯水,來了 5 個(gè)領(lǐng)導(dǎo)你該怎么辦?」,Google 版 o1 又會如何應(yīng)對?滿分十分,你給這個(gè)答案給幾分?

向左內(nèi)容

對于「有軌電車難題」的回答,除了前面有條不紊的回答,我更喜歡這位新選手最后一句高情商的回答:

「理解你的思考過程比得到一個(gè)『正確』答案更重要?!?/p>

向左內(nèi)容

為了考察新模型是否「偏科」,我也上傳了一道考研數(shù)學(xué)熱門題,并讓它和 OpenAI o1 模型同時(shí)作答。

省去繁瑣的運(yùn)算過程后,兩者得出的結(jié)果一致,但 Google 版 o1 只花了 27.5 秒,相比之下,OpenAI o1 花了足足 1 分 32 秒。

向左內(nèi)容

當(dāng)然,最好的評價(jià)還是親自上手。附上體驗(yàn)地址 ??:

https://aistudio.google.com/prompts/new_chat

關(guān)注 AI 第一新媒體,率先獲取 AI 前沿資訊和洞察

給 Mac 裝上最強(qiáng)大腦,這才是真正的人機(jī)交互

在被搶頭條后,OpenAI 也不慌不忙地如期舉行了發(fā)布會。

全新桌面版 ChatGPT 將超越單純的問答,能夠通過與 30 多種應(yīng)用協(xié)作來輔助提升你的寫作和編程能力。

使用方式也十分簡單,用戶只需確保目標(biāo)應(yīng)用正在運(yùn)行,然后在 ChatGPT 聊天欄中點(diǎn)擊「與應(yīng)用協(xié)作」(Work With Apps)按鈕并選擇相應(yīng)應(yīng)用即可。

聊天欄上方會顯示當(dāng)前協(xié)作的應(yīng)用程序,用戶可以隨時(shí)查看 ChatGPT 將要處理的內(nèi)容范圍。 這些互動記錄會保存在用戶賬戶中,直到被刪除或經(jīng)過 30 天自動清除。

在實(shí)際演示中,OpenAI 工作人員通過 Mac 版 ChatGPT 展示了多項(xiàng)實(shí)用功能。

以 Warp 控制臺為例,ChatGPT 能夠根據(jù)演示人員要求快速生成 Git 命令來統(tǒng)計(jì)代碼庫的每日提交次數(shù),并將其數(shù)據(jù)可視化為富有圣誕節(jié)氣氛的柱狀圖。

在這個(gè)過程中,它正是充分使用了 Advanced Data Analysis(高級數(shù)據(jù)分析)等內(nèi)置功能。

為保護(hù)用戶隱私,OpenAI 演示人員表示只會訪問用戶明確授權(quán)的應(yīng)用內(nèi)容。

但在查閱 OpenAI 官網(wǎng)后發(fā)現(xiàn),這些交互數(shù)據(jù)可能會被用于模型訓(xùn)練,因此你需要在設(shè)置中調(diào)整數(shù)據(jù)使用權(quán)限,甚至按需禁用應(yīng)用協(xié)作功能。

「它還告訴我們這個(gè)文本字段有 37 行,我們可以向下檢查確認(rèn)是否是 37 行?!?

有趣的是,演示過程再次上演翻車場面。

當(dāng)要求 ChatGPT 添加「觀察者」功能,選擇變化加載文本區(qū)域時(shí),o1 生成的代碼在 Xcode 運(yùn)行失敗,直到修正過后才成功。

值得一提的是,這項(xiàng)功能不僅支持 Xcode,還覆蓋了 VS Code、Jetbrains 全家桶等主流開發(fā)工具。

寫作場景是日常最實(shí)用的場景之一。

Mac 版 ChatGPT 也將支持 Notes、Notion 和 Quip 等多款應(yīng)用,為用戶帶來全新的寫作協(xié)作體驗(yàn)。

作為舊金山徒步歷史導(dǎo)覽員,OpenAI 演示人員通過自己正在設(shè)計(jì)的導(dǎo)覽項(xiàng)目生動展示了這些新功能。

比如說,在 Notion 文檔中,他正嘗試編寫關(guān)于舊金山歷史人物「諾頓皇帝」的介紹,但如何描述歷史人物的生平,如何挖掘有趣細(xì)節(jié)等等都是一門不小的學(xué)問。

借助搜索功能,ChatGPT 能夠 查證歷史文獻(xiàn)和研究資料,快速補(bǔ)充諾頓皇帝在舊金山的活動軌跡、與當(dāng)?shù)鼐用竦幕拥壬郊?xì)節(jié),并對其過往行為進(jìn)行深入解讀。

為了減少 AI 的機(jī)器味,我們也能要求其模仿 Notion 文檔中的語言表達(dá)方式和敘述節(jié)奏,對內(nèi)容進(jìn)行調(diào)整,使其更加流暢自然。

除了文本交互,ChatGPT 高級語音模式 還有新玩法。

作為一名職業(yè)薩克斯演奏家,OpenAI 演示人員還能與前不久剛推出的「圣誕老人」限定語音討論節(jié)日派對曲目的選擇。

演示人員還即興演奏了一段動聽的薩克斯樂曲。

目前,上述提到的新功能已在 macOS ChatGPT 最新版本中上線,而 Windows 版本很快也會推出。 不妨再耐心等待一下。

發(fā)布會最后,OpenAI CPO Kevin Weil 還預(yù)告明天將會發(fā)布 「令人興奮」的新產(chǎn)品。

而 Google、Anthropic 等公司面對年底最后一輪 AI 狂歡,是否又會再次放大招「狙擊」?

一切都值得拭目以待。

APPSO 也將在明天凌晨第一時(shí)間送上最新報(bào)道。

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多