這年頭,算法工程師/準(zhǔn)算法工程師們的“課余生活”可真是越來越豐富了。 那邊頂會Challenge,這廂企業(yè)黑客松,往往獎勵豐厚,面試直達,還能五湖四海呼朋引伴,豈不快哉? 不過說實在話,如今的技術(shù)崗位都非常重視你的項目經(jīng)驗,通過參與賽事,一方面有利于在實踐中鞏固學(xué)業(yè)知識,另一方面也可以在應(yīng)聘的時候,作為簡歷中的加分項。但如今賽事多如牛毛,如何在其中選擇到更有價值、含金量高、全行業(yè)認可的算法比賽? 如下幾個標(biāo)準(zhǔn)供大家參考:
綜上所述,已成功舉辦五年的騰訊廣告算法大賽就是一個完美的選擇:獎金池超百萬人民幣,具有前瞻性和實用性的賽題,以及免費的計算資源加持,在資源的投入上,這場算法大賽也可以說是逐年加碼。 這不,單從獎金規(guī)模上看,此次第五屆比賽就又創(chuàng)新高。 去年有三個人BERT一番,拿走7萬美元(近50萬人民幣)獎金。今年,最高冠軍獎金直接再加3萬,達到10萬美元。 至于算力等資源方面的投入,說是調(diào)動騰訊全公司之力亦不為過。 一方面,有歸屬CSIG云與智慧產(chǎn)業(yè)事業(yè)群的騰訊云智能鈦機器學(xué)習(xí)平臺(TI-One),提供AI算法平臺支持,從數(shù)據(jù)預(yù)處理、模型構(gòu)建、模型訓(xùn)練、模型評估到模型服務(wù),給予選手全流程的開發(fā)部署幫助。 還有來自TEG技術(shù)工程事業(yè)群的騰訊大數(shù)據(jù)團隊,提供自研、開源的高性能分布式機器學(xué)習(xí)框架Angel,幫助選手進行算法開發(fā)測試,在算法資源方面給予支援。 另一方面,騰訊高校資源、騰訊招聘也為比賽加碼。 不過,能吸引到海內(nèi)外如此多程序員的關(guān)注,百萬獎金池還只是一方面。 更重要的是,每一屆騰訊廣告算法大賽,都是基于真實的業(yè)務(wù)場景來設(shè)計賽題,并且能提供海量真實脫敏數(shù)據(jù)作為訓(xùn)練集。 這樣背靠騰訊廣告業(yè)務(wù)的實景挑戰(zhàn),機會確實難得。 并且今年,在視頻廣告秒級語義解析賽道排名前三的隊伍,還有機會參與ACM MULTIMEDIA 2021 GRAND CHALLENGE SESSION,站上國際賽場施展拳腳。 這次“玩”什么?那么重點來了,今年,騰訊廣告又從實際業(yè)務(wù)里挖出了什么樣的難題,擺在了選手們面前? 眾所周知,視頻已成為當(dāng)下最流行的內(nèi)容載體。對于廣告業(yè)務(wù)來說,視頻廣告也憑借更豐富的內(nèi)容、更有沖擊力的展示形式,迎來了爆發(fā)式的增長。 在這個時間節(jié)點上,無論是想要依靠AI來精細化捕捉大眾感興趣的創(chuàng)意,還是讓廣告能在最合適的時間點推送給最感興趣的人、最大化傳播效果,都離不開對視頻廣告內(nèi)容的深度理解。 因此,2021騰訊廣告算法大賽設(shè)置了兩大賽道:視頻廣告秒級語義解析和多模態(tài)視頻廣告標(biāo)簽。 不妨一起來研究研究這回到底應(yīng)該怎么玩~ 總體來說,這次的兩個賽道都是要求選手給出能夠理解視頻內(nèi)容的AI模型,并對視頻進行時序解構(gòu),添加語義標(biāo)簽。 具體詳情,先來看難度等級更高一些的視頻廣告秒級語義解析賽道。 賽題要求,對于給定測試視頻樣本,通過算法將視頻在時序上進行精細到秒級別的場景分段。也就是說,搞清楚視頻的鏡頭語言,但同時不能把片段切得過于稀碎,干擾視頻敘事結(jié)構(gòu)的表達。 同時,賽題要求預(yù)測出每一段在“呈現(xiàn)形式”、“場景”、“視覺風(fēng)格”等三個維度上的標(biāo)簽,最后使用Mean Average Precision(mAP)進行評分。 也就是說,AI要在秒級別解析出視頻的情節(jié)段落,對視頻內(nèi)容進行更精準(zhǔn)的把控。 另一道賽題多模態(tài)視頻廣告標(biāo)簽,同樣是對于視頻語義標(biāo)簽的預(yù)測。 不過相較賽道一,它的難度更小一些,對于給定的輸入視頻,在時序上不要求模型精準(zhǔn)到每一個情節(jié)段落,只要預(yù)測出視頻在“呈現(xiàn)形式”,“場景”,“視覺風(fēng)格”等三個維度上的標(biāo)簽即可。最后會使用GAP來進行評分。 兩個賽道的任務(wù)輸入都包括視頻、音頻、文本三種模態(tài)。 在數(shù)據(jù)集方面,騰訊廣告此次會在比賽數(shù)據(jù)集中提供上萬條帶標(biāo)簽的真實視頻廣告,以幫助選手訓(xùn)練出更加精準(zhǔn)高效、具有應(yīng)用價值的算法。 這樣的賽題,在技術(shù)上充滿挑戰(zhàn),同時也再次延續(xù)了騰訊廣告算法大賽一直以來“務(wù)實”的風(fēng)格——快節(jié)奏但又需要包含豐富信息的視頻廣告,無論是在節(jié)奏把控還是在內(nèi)容串聯(lián)上,都對廣告主提出了更高的要求。 而對于在這種把控力上有所欠缺的廣告主,深度視頻內(nèi)容理解能挖掘出用戶在視頻廣告播放時序上產(chǎn)生的行為數(shù)據(jù),進而讓廣告主能有的放矢去優(yōu)化視頻內(nèi)容,提升廣告投放效果。 為什么要玩“視頻廣告”?其實在廣告行業(yè),長久以來一直存在一個痛點:
隨著5G時代的到來,以視頻為載體的內(nèi)容越來越受到用戶歡迎,而視頻廣告也乘風(fēng)而起,以多視角拍攝、情景真實感、語音BGM等元素成為最能吸引用戶、展現(xiàn)創(chuàng)意的廣告形式。 說起來是簡簡單單一句話,但事實上,系統(tǒng)是否能深入理解視頻廣告的內(nèi)容及其中多維度的信息,對最終達成的廣告效果有至關(guān)重要的影響。 因此能夠深度理解視頻廣告內(nèi)容,挖掘其潛在價值,無疑成了當(dāng)下廣告業(yè)發(fā)展的一個殺手锏。 而從此次騰訊廣告算法大賽所設(shè)置的兩大賽題來看,迎合的正是當(dāng)下廣告行業(yè)這樣的迫切訴求。 具體而言,在創(chuàng)意分析中,將秒級別的用戶行為數(shù)據(jù)與視頻內(nèi)容關(guān)聯(lián),一方面能提供、展現(xiàn)清晰的內(nèi)容分析脈絡(luò);另一方面,也有利于準(zhǔn)確地定位用戶轉(zhuǎn)化及流失的原因。 在視頻創(chuàng)作中,細粒度理解視頻時序內(nèi)容,能夠幫助AI訓(xùn)練出批量生產(chǎn)廣告創(chuàng)意的技能,大幅降低廣告創(chuàng)作投放成本。 而在廣告推薦環(huán)節(jié),個性化的標(biāo)簽則能讓系統(tǒng)更加高效地匹配上“對的人”,提升廣告推薦效果。 這是此次大賽對廣告行業(yè)能夠產(chǎn)生的影響。 但通過大賽的名字,不難看出,除了“廣告”這個關(guān)鍵詞之外,“算法”也是另外一個重點詞。 騰訊廣告算法大賽歷來的一大特色便是,真實場景數(shù)據(jù)。 講真,這與在高校等環(huán)境中研究算法,可不太一樣。 真實場景之下,數(shù)據(jù)的量之大、維度之多,以及還存在著各種錯綜復(fù)雜的細節(jié)因素。 這就要求算法需要具備更強的泛化能力和穩(wěn)定性。 而要達到這種效果,算法本身還不能是old-fashion的那種,需是緊隨最前沿的技術(shù)。 例如在去年的大賽中,斬獲冠軍的隊伍,便是憑借當(dāng)時最流行的預(yù)訓(xùn)練模型BERT,將真實場景業(yè)務(wù)性能提高到了一定高度。 由此可見,騰訊廣告算法大賽也是與時俱進地在推動產(chǎn)學(xué)交流融合、前沿算法技術(shù)的現(xiàn)實應(yīng)用。 但其實,一手抓廣告,一手抓算法,并不是騰訊廣告第一次這么做。 從以往的大賽成果來看,便已然是如此:
但今年除了延伸往屆大賽在廣告、算法界的優(yōu)勢之外,還有一大亮點:
這不僅僅是對賽題本身的一種認可,更長遠的,是對騰訊廣告算法大賽多年來,于廣告行業(yè)、于算法界影響力的一種認可。 …… 給你資源,給你數(shù)據(jù),還給你錢,做出的結(jié)果還能在業(yè)界發(fā)光發(fā)熱,這樣的算法大賽當(dāng)真不一般。 怕錯過? 別急,大賽還在進行時。 詳情可戳下方海報~ |
|