'又一個(gè)AI大模型發(fā)布會(huì)?' 這是我收到火山引擎Force原動(dòng)力大會(huì)開(kāi)發(fā)者論壇邀請(qǐng)函時(shí)的第一反應(yīng)。 作為一個(gè)經(jīng)歷了從ChatGPT爆火、Claude崛起到Gemini發(fā)布的開(kāi)發(fā)者,我對(duì)各類(lèi)AI發(fā)布會(huì)已經(jīng)產(chǎn)生了一絲'審美疲勞'。 畢竟,現(xiàn)在誰(shuí)不在講AI呢?從大廠到創(chuàng)業(yè)公司,從技術(shù)大會(huì)到產(chǎn)品發(fā)布,AI似乎成了一個(gè)萬(wàn)能的標(biāo)簽??烧嬲茏岄_(kāi)發(fā)者眼前一亮的產(chǎn)品和工具, 又有多少? 當(dāng)我認(rèn)真聽(tīng)完整場(chǎng)分享時(shí), 才發(fā)現(xiàn)自己的偏見(jiàn)。 主論壇饕餮盛宴這次火山引擎Force原動(dòng)力大會(huì)開(kāi)發(fā)者論壇是在10點(diǎn)開(kāi)始拉開(kāi)帷幕的,基本上坐得滿(mǎn)滿(mǎn)當(dāng)當(dāng),還好來(lái)的早一些,我坐到了靠近中間的位置,也因此,有幸整個(gè)分享都聽(tīng)得、看得很清楚。 start with 豆包,大模型時(shí)代來(lái)了何謂普惠,即讓普通人得到實(shí)惠。 在這個(gè)大模型時(shí)代,開(kāi)發(fā)者的定義正在被重新定義。不再局限于傳統(tǒng)意義上的程序員,任何想要借助AI提升工作效率的人,都可能成為一名'開(kāi)發(fā)者'。從設(shè)計(jì)師到教育工作者,從運(yùn)營(yíng)到產(chǎn)品經(jīng)理,AI正在讓創(chuàng)造力突破技術(shù)門(mén)檻的限制。 開(kāi)場(chǎng)的例子確實(shí)極好地展示了這一點(diǎn)——和府撈面的設(shè)計(jì)師、2人團(tuán)隊(duì)基于扣子,搭建了顧客點(diǎn)評(píng)分析智能體,將客情分析的運(yùn)維活全包了;而設(shè)計(jì)師則利用圖像流能快速試錯(cuò),更輕易地嘗試不同的靈感和創(chuàng)意。 所以,百萬(wàn)級(jí)別的營(yíng)銷(xiāo)成果,竟然兩個(gè)人就夠了。 火山方舟應(yīng)用實(shí)驗(yàn)室:讓專(zhuān)業(yè)的產(chǎn)品做專(zhuān)業(yè)的事情火山方舟應(yīng)用實(shí)驗(yàn)室我確實(shí)沒(méi)有用過(guò),但是這次的展示讓我眼前一亮。 作為一套開(kāi)源的高代碼SDK和企業(yè)級(jí)示例模板,它不僅提供了完整的場(chǎng)景化解決方案,更重要的是降低了大模型開(kāi)發(fā)的門(mén)檻。 一個(gè)讓我印象深刻的例子是視頻生成。傳統(tǒng)上,一段高質(zhì)量的動(dòng)畫(huà)制作往往需要十幾個(gè)工作日,需要美工、策劃的密切配合。而現(xiàn)在,基于方舟的模型和模板應(yīng)用,只需要幾分鐘就能完成。這就是他們所說(shuō)的'高難度、高代碼、高價(jià)值'。 更讓我驚喜的是它的靈活性。方舟團(tuán)隊(duì)說(shuō)'我們先走 80%,剩下 20% 由客戶(hù)自定義'。比如客戶(hù)想在生成的視頻中加入背景音樂(lè),只需要在開(kāi)源代碼基礎(chǔ)上插入幾行音樂(lè)生成的邏輯即可。 這種思路太棒了,因?yàn)榭蛻?hù)永遠(yuǎn)比平臺(tái)更了解自己的業(yè)務(wù)——比如,我更知道自己的孩子希望在讀AI 繪本時(shí)聽(tīng)什么聲音,而平臺(tái)相當(dāng)于把這些擴(kuò)展的自定義能力下放給我自己,又給了我足夠的基礎(chǔ)支持。 火山方舟接口 API:更高的定制API 更多就是針對(duì)我們開(kāi)發(fā)者,而作為開(kāi)發(fā)者,我特別關(guān)注它的幾個(gè)核心能力:
聽(tīng)完分享后,我意識(shí)到,火山方舟應(yīng)用實(shí)驗(yàn)室和火山方舟接口 API 的設(shè)計(jì),從這里開(kāi)始就考慮了可審計(jì)問(wèn)題,這也非常ToB,是從有到優(yōu)的重要實(shí)踐。一件事做到是能力到了,一件事做好,就是整體方案的考慮了。 雖然作為個(gè)人開(kāi)發(fā)者,我可能用不上這么專(zhuān)業(yè)的功能,但是我能看到它對(duì)企業(yè)級(jí)應(yīng)用的巨大價(jià)值。特別是在教育行業(yè),像'小熊遇到了什么問(wèn)題'這樣的短片生成一條龍服務(wù),讓優(yōu)質(zhì)教育內(nèi)容的生產(chǎn)變得更加高效。 火山方舟 AI 搜推引擎:從搜索開(kāi)始,所有人的剛需搜索幾乎是所有人的剛需,我捏的第一個(gè) Agent就是為了解決自我的搜索問(wèn)題,現(xiàn)在每一個(gè)搜索引擎在最上面都加了一個(gè) “AI搜索”的結(jié)果。 但是火山引擎的交互讓我很驚喜,它支持的輸入端顯而易見(jiàn)的更多——文本、圖像、音頻、視頻等多模態(tài)對(duì)話(huà)式,而演講中提到了性能的強(qiáng)大。 ToC的搜索,豆包已經(jīng)做得比半年前好了太多,我感覺(jué)火山方舟 AI 搜推引擎更重要地是把“推薦”同時(shí)放了進(jìn)來(lái),像抖音一樣,更懂我們。 不過(guò)這一項(xiàng)大規(guī)模的更多應(yīng)當(dāng)用在 ToB, 據(jù)說(shuō)在電商領(lǐng)域有特別的沉淀,非常期待能繼續(xù)聽(tīng)到它的應(yīng)用案例。 豆包MarsCode + 扣子 1.5 :普惠下行我很認(rèn)可分享者的這句話(huà),“開(kāi)發(fā)工具的提升是因?yàn)樽匀徽Z(yǔ)言和開(kāi)發(fā)語(yǔ)言的邏輯抽象性不同,自然語(yǔ)言有不可拼接性,但開(kāi)發(fā)語(yǔ)言不是?!?/span> 最讓我興奮的是扣子1.5版本的重大更新。作為一個(gè)重度用戶(hù),我親眼見(jiàn)證了它從簡(jiǎn)單的對(duì)話(huà)機(jī)器人平臺(tái),進(jìn)化成了一個(gè)完整的AI應(yīng)用開(kāi)發(fā)平臺(tái):
另外,把扣子和豆包MarsCode 放在一起看,我有了新的期待 - 如果能把豆包MarsCode 的代碼能力和扣子的代碼節(jié)點(diǎn)相結(jié)合,對(duì)于我們這樣的普通開(kāi)發(fā)者來(lái)說(shuō),將是又一次降低門(mén)檻的重大突破。 扣子 1.5的發(fā)布和豆包MarsCode 的加持,真的是大大降低了開(kāi)發(fā)門(mén)檻。 而且另一個(gè)讓我有想象力的事情是,既然視頻模型也上了,那么直接看屏幕、再進(jìn)行troubleshooting或者編碼,這就變得順滑又可擴(kuò)展——屏幕讀取 + 圖像/視頻理解 + AI代碼填充,一個(gè)沒(méi)那么專(zhuān)業(yè)、但講的清楚自己需求的產(chǎn)品經(jīng)理,或許都已經(jīng)能夠站在真正用戶(hù)的立場(chǎng)上,開(kāi)發(fā)出好的新產(chǎn)品了。 另外,豆包MarsCode在代碼補(bǔ)全、Bug 修復(fù)、代碼問(wèn)答等編程的各個(gè)階段提供協(xié)助支持,確實(shí)用起來(lái)很絲滑,只是,直接搜'MarsCode'容易搜到很多類(lèi)似產(chǎn)品,這里把網(wǎng)址放上大家可以一起玩: https://www./workbench DataLeap:用開(kāi)放生態(tài)建設(shè),為數(shù)據(jù)研發(fā)提效字節(jié)系的數(shù)據(jù)能力建設(shè)一向是做得非常好的,但是作為站在外面、只是聽(tīng)說(shuō)的人,沒(méi)想到他們做得這么好。 作為支撐數(shù)據(jù)飛輪2.0的核心產(chǎn)品,DataLeap的全新開(kāi)放平臺(tái)讓我眼前一亮。它提供了完整的IDE和流水線(xiàn)插件體系,以及豐富的開(kāi)放能力。最棒的是,開(kāi)發(fā)者只需要按照開(kāi)發(fā)手冊(cè),就能低成本、快速完成插件開(kāi)發(fā)。 插件、百寶箱意味著可以復(fù)用現(xiàn)成的能力,而它的數(shù)據(jù)管理方法論也做得非常好 - 流水線(xiàn)擴(kuò)展、數(shù)據(jù)研發(fā)、治理的能力都可以極簡(jiǎn)部署。其中提到的“智能運(yùn)維助手”,對(duì)運(yùn)維人員來(lái)說(shuō),這是個(gè)巨大的利好,能實(shí)現(xiàn)主動(dòng)解析錯(cuò)誤日志、進(jìn)行任務(wù)錯(cuò)誤診斷、變慢診斷等,進(jìn)一步釋放了運(yùn)維基礎(chǔ)工作,有效提升效率。 曾經(jīng)厚顏研究過(guò)一點(diǎn)點(diǎn)數(shù)據(jù)平臺(tái),我意識(shí)到,如果Dataleap真的和演講分享里展現(xiàn)得這樣利好,它真的就讓我充滿(mǎn)想象力了——這幾乎是將團(tuán)隊(duì)協(xié)作和行業(yè)knowhow讓客戶(hù)自己來(lái),但是其他字節(jié)的數(shù)據(jù)研發(fā)、治理能力,都作為產(chǎn)品和模板沉淀下來(lái)了,真的是太厲害了。 作為一個(gè)經(jīng)常和數(shù)據(jù)打交道的開(kāi)發(fā)者,我已經(jīng)迫不及待想嘗試這些新功能了。DataLeap不僅讓團(tuán)隊(duì)協(xié)作變得更容易,更重要的是把字節(jié)積累的knowhow都通過(guò)產(chǎn)品和模板的形式開(kāi)放出來(lái),這才是真正的技術(shù)普惠。 邊緣場(chǎng)景:端邊云協(xié)同的到位支持一直看的終端,這把是第一次了解邊緣場(chǎng)景的特性。 因?yàn)樗懔?wèn)題和真實(shí)的速度成本限制,大模型跑在端上是一件很費(fèi)勁的事情,所以最好是在云上使用、然后結(jié)果返回到端。 當(dāng)認(rèn)真聽(tīng)了這段分享之后,才發(fā)現(xiàn)邊緣場(chǎng)景不止于此,它不止是服務(wù)器,更多是整個(gè)平臺(tái)的能力。比如邊緣智能平臺(tái)和物聯(lián)網(wǎng)平臺(tái),顯然把字節(jié)對(duì)行業(yè)、對(duì)資源的使用效率和方法論包了進(jìn)去。雖然我是第一次接觸邊緣場(chǎng)景,但在分享里我得知,這已經(jīng)是再次升級(jí)的成果。 這是個(gè)策略問(wèn)題——將所有邏輯推理全放到云也成本高的,甚至也沒(méi)必要。因?yàn)榇竽P偷奈⒄{(diào)本質(zhì),就是各個(gè)垂類(lèi)的訓(xùn)練,再加上在垂直領(lǐng)域的切割——這種方式可以極好地降低模型部署的大小。 而要更快一步的話(huà),可以放在“邊”上。查過(guò)之后我了解到,這個(gè)和運(yùn)營(yíng)商部署基站算一個(gè)原理。 工程化部署的模板和優(yōu)化基本都已經(jīng)有了,幾個(gè)例子也挺有意思的。 比如游戲高光時(shí)刻,就是推理在邊緣+ 展示在終端,畢竟作為游戲里的陪練和高光切割,響應(yīng)一定要快,不然游戲的那個(gè)劇情點(diǎn)就過(guò)去了。 另一個(gè)例子是座艙里所有傳感器收集信息,做車(chē)載智能體了解整個(gè)車(chē)?yán)锸裁辞闆r。涉及到隱私問(wèn)題,分別處理邊和端也很有道理。 原來(lái)我認(rèn)為這個(gè)離開(kāi)發(fā)者有點(diǎn)遠(yuǎn),現(xiàn)在我意識(shí)到,可能并沒(méi)有這么遠(yuǎn),而這些基建的提升,意味著AI和物理世界的鏈接會(huì)越來(lái)越快地被打通。 另外從這個(gè)邊緣場(chǎng)景來(lái)看,下一步的爆發(fā)感覺(jué)工廠、工業(yè)化會(huì)有一波好的應(yīng)用。 RTC:打通真正和人“交流”這塊的分享重點(diǎn)應(yīng)該在多模態(tài)了,相當(dāng)于實(shí)時(shí)對(duì)話(huà)。 again, 對(duì)人類(lèi)來(lái)說(shuō),打字和說(shuō)話(huà)是兩種完全不同的輸出和思考方式,2秒響應(yīng)和10秒響應(yīng)的感受是完全不一樣的,所以我非??春眠@一塊的發(fā)展。 但是因?yàn)檫@一切都是包裝起來(lái)的,作為個(gè)人開(kāi)發(fā)者視角,這一部分的分享,我更多只看到的是功能展示,所以專(zhuān)門(mén)去看了一下具體的落地案例。 但是前面有一個(gè)非常好的例子,其實(shí)已經(jīng)提過(guò)了,就是游戲的陪玩。 如果陪玩跟不上用戶(hù)的操作,那確實(shí)就變得沒(méi)有意義了。但是如果能在2-3 秒內(nèi)及時(shí)響應(yīng),甚至可以指導(dǎo)玩家的技術(shù)了。我發(fā)揮一下想象力,有針對(duì)菜鳥(niǎo)玩家的溫柔款和針對(duì)進(jìn)階老鳥(niǎo)的高級(jí)提升版,那門(mén)檻略高的游戲?qū)?huì)迎來(lái)一次門(mén)檻革新。 另外還有一個(gè)我很驚艷的例子,不是在上午的分享里、反而是下午的扣子開(kāi)發(fā)者日,我看到了貓王的案例——為自己搭建一個(gè)專(zhuān)屬智能體音響。這個(gè)音響又可以自定義聲音,所以異地的孩子、父母?jìng)湔娴姆浅P枰@款沒(méi)有屏幕點(diǎn)擊、而是用語(yǔ)音驅(qū)動(dòng)的產(chǎn)品。 從以上幾個(gè)例子來(lái)說(shuō),依靠火山引擎 RTC 技術(shù)超低延時(shí)-更流暢、智能打斷-更自然、抗弱網(wǎng)-更可靠 3個(gè)特點(diǎn),至少我直觀地感受到,它潛力巨大。 早鳥(niǎo)的隨便逛逛展區(qū)打卡 ——火山引擎的優(yōu)秀應(yīng)用這次的主論壇開(kāi)始時(shí)間是10點(diǎn),從9點(diǎn)就到了的我開(kāi)始提前逛展區(qū)。因?yàn)榍耙惶煊惺挛吹?,所以錯(cuò)失了18號(hào)的盛會(huì),聽(tīng)小伙伴提過(guò)展區(qū)會(huì)非常擁擠,早來(lái)的好處就是讓我慢慢逛完了整個(gè)展區(qū),并且提前打好了7個(gè)打卡點(diǎn),領(lǐng)到了我的小杯子~ 首先我們就說(shuō)道說(shuō)道這個(gè)打卡和整個(gè)會(huì)議議程小程序,其實(shí)挺精美的,我當(dāng)時(shí)覺(jué)得一次性的東西,搞得這么精美,定位、圖冊(cè)都上了是不是有點(diǎn)浪費(fèi),但事后在扣子分論壇的時(shí)候,我才曉得這個(gè)就是快速拿扣子搭出來(lái)的——試想,這是個(gè)模板的話(huà),是不是以后所有的展商活動(dòng),這塊的運(yùn)營(yíng)成本就一下子下來(lái)了呢? 所以會(huì)后給官方提的第一個(gè)小建議就是這個(gè)小程序的模板求發(fā)布~期待官方聽(tīng)到我的聲音 :) 語(yǔ)音的震撼——豆包語(yǔ)音大模型,擁有自己的專(zhuān)屬音色是的,展臺(tái)其實(shí)很多,而且全部都是火山引擎系列產(chǎn)品,走馬觀花第一輪下來(lái),我印象最深刻的展區(qū)其實(shí)是豆包大模型區(qū)域右側(cè)的“語(yǔ)音大模型”。 那里有個(gè)小姐姐在唱歌,我對(duì)音樂(lè)本身興趣就很大,之前也是suno(大模型生成音樂(lè))的重度用戶(hù),于是湊近了細(xì)看,然后就被工作人員介紹,可以給十年后的自己打電話(huà)——這我就來(lái)勁了,我每一年都會(huì)給未來(lái)的自己寫(xiě)一封信、給過(guò)去的自己回一封信,用的電子郵件,來(lái)得早沒(méi)人跟我搶?zhuān)谑俏乙材闷鹆诉@個(gè)電話(huà)。 哈哈下面這個(gè)拿電話(huà)的不是我,但是就是這個(gè)展位,在唱歌的小姐姐背后。 我隨意說(shuō)了一句“你好啊,在嗎?”,大約等待時(shí)間是5-6秒,我確實(shí)聽(tīng)到了話(huà)筒那端傳來(lái)了我的聲音。后面才知道,這和之前展區(qū)打卡一樣,是扣子做的,真的很神。 其實(shí)聲紋復(fù)制早在7月試著開(kāi)發(fā)一些科普性的bot時(shí),就有考慮過(guò),但是一則是價(jià)格,一則是方便程度,讓我放棄了實(shí)踐的打算。 是的,在當(dāng)時(shí),復(fù)制一個(gè)聲音的音色大概需要錄制二十幾句話(huà),行業(yè)價(jià)格大概在100塊左右,這就性?xún)r(jià)比不高了。但是現(xiàn)在,我震驚地發(fā)現(xiàn),已經(jīng)這么便捷高效了——一句不是默認(rèn)、預(yù)設(shè)的話(huà),一個(gè)打招呼,它在5秒鐘之內(nèi)就給我復(fù)制好了,真的特別厲害。 不算新點(diǎn)子,畢竟各種導(dǎo)航就可以錄制聲音來(lái)使用,我爸爸的導(dǎo)航系統(tǒng)用的就是我的聲音,畢竟這種能力完全依賴(lài)APP,錄制起來(lái)也不方便,甚至一度是收費(fèi)功能。 在豆包大模型將成本和便捷程度降到這個(gè)程度時(shí),我當(dāng)時(shí)就有無(wú)限的想象了,作為一個(gè)滬飄,作為一個(gè)為了給爸媽科普AI而開(kāi)始使用扣子的玩家,我多么希望我捏給爸媽的bot可以直接使用我的音色呢? 同理可證,這可是實(shí)實(shí)在在的剛需。 耳機(jī)——豆包LLM能力的再次擴(kuò)展展區(qū)實(shí)在是太豐富了,一一列舉根本說(shuō)不完,像是圖像理解和拍照一鍵AI這個(gè)已經(jīng)是常規(guī)操作了,而視頻大模型的發(fā)布更深一步增加了信息處理的水平和數(shù)量,但作為日常不怎么處理圖片和視頻的我來(lái)說(shuō),震撼卻沒(méi)有太多的實(shí)踐經(jīng)驗(yàn)。 但是與聲音結(jié)緣的我,還有一個(gè)印象深刻的東西——對(duì),就是下面這款耳機(jī)。 這個(gè)耳機(jī)我是從豆包APP的界面知道的——豆包APP設(shè)置里面有連接特定耳機(jī)“Ola Friend”,當(dāng)我使用的時(shí)候還好奇過(guò),這會(huì)兒總算是用上了。不是入耳式,佩戴感挺好,后臺(tái)打開(kāi)豆包APP就可以喚醒。我一開(kāi)始覺(jué)得這有點(diǎn)像初級(jí)的語(yǔ)音硬件產(chǎn)品,真切試下來(lái)發(fā)現(xiàn)還是不一樣的,就搜個(gè)氣溫、天氣、百度搜索的問(wèn)題,豆包本身順滑程度就吊打主流常見(jiàn)語(yǔ)音硬件產(chǎn)品,再加上模型能力,復(fù)雜的問(wèn)題一點(diǎn)點(diǎn)能用語(yǔ)音跟它聊,怎么不是一種真切的想象力呢? ——畢竟,對(duì)人類(lèi)來(lái)說(shuō),打字和說(shuō)話(huà)是兩種完全不同的輸出和思考方式,至少我自己在說(shuō)話(huà)的時(shí)候迸發(fā)出來(lái)的靈感比打字還要多。 乘興而來(lái),興盡而歸下午是一群開(kāi)發(fā)者聚會(huì)在一起,我因?yàn)槭强圩拥挠?/span>戶(hù),所以選擇了扣子的專(zhuān)場(chǎng)分享。分論壇可謂爆滿(mǎn),畢竟有些來(lái)得晚的小伙伴甚至只能站著。 在下午這場(chǎng)分享中,我和其他開(kāi)發(fā)者腦暴了一個(gè)小產(chǎn)品,聽(tīng)到了2個(gè)真正個(gè)人開(kāi)發(fā)者的成功案例,鏈接到30+的個(gè)人開(kāi)發(fā)者,甚至在發(fā)言環(huán)節(jié)有幸得到了一個(gè)“Ola Friend” ——親測(cè)好用,有機(jī)會(huì)之后再分享,哈哈哈。 因?yàn)閷?zhuān)門(mén)分享過(guò)一次扣子開(kāi)發(fā)者日了,所以這里就不再贅述,只是這張照片,我想留句在分享中聽(tīng)到的話(huà): 這是一群扣子的研發(fā)人和扣子精神股東間的共同進(jìn)步! 饕餮盛宴就這樣結(jié)束,甚至有點(diǎn)意猶未盡。 大模型的能力、迭代、飛速發(fā)展,讓我之前搭建的代碼和工作流都變得及其容易復(fù)制。但是就是這是在這樣的浪潮里,我意識(shí)到持續(xù)迭代、持續(xù)學(xué)習(xí)的重要性,同時(shí)也讓我看到AI普惠普通人的一天越來(lái)越近。 我不想灌什么雞湯; 但是技術(shù)的進(jìn)步就是時(shí)代最大的浪潮。 皆為逐浪而來(lái),何妨共看潮頭! |
|
來(lái)自: 長(zhǎng)沙7喜 > 《AI有關(guān)》