作者:Mika 數(shù)據(jù):真達(dá) 【導(dǎo)讀】 今天教大家用Python分析《沉默的真相》的17萬條彈幕。公眾號后臺,回復(fù)關(guān)鍵字“沉默”獲取完整數(shù)據(jù)。 距離上一部國產(chǎn)良心劇《隱秘的角落》刷屏還不到2個(gè)月,“禿頭?!?、“爬山梗”還讓人記憶猶新。 之前我們也分析過《隱秘的角落》彈幕,回顧請點(diǎn)擊: ?????? 分析20萬條彈幕告訴你,8.9分的高分劇《隱秘的角落》到底好看在哪兒?緊接著又一部爆款國產(chǎn)劇來了,那就是最近口碑炸裂的《沉默的真相》。 同樣是來自愛奇藝針對懸疑短劇的“迷霧劇場”,《沉默的真相》根據(jù)紫金陳的小說《長夜難明》改編,講述了檢察官江陽歷經(jīng)多年,付出無數(shù)代價(jià)查清案件真相的故事。 開播當(dāng)天《沉默的真相》在豆瓣開分8.8分,隨著劇集的播出,該劇口碑勢不可擋,一路走高,播出六集后,豆瓣評分沖到了9.2分,成功超越了它的前浪《隱秘的角落》。要知道,這種高開高走的趨勢,在國產(chǎn)劇里是非常罕見的。 許多網(wǎng)友在最初刷劇時(shí)根本不信自己會哭,結(jié)果看到大結(jié)局才發(fā)現(xiàn),這也太好哭了吧,看到主角江陽的舍命燃燈,真的讓人哭出蘭州拉面… 01 豆瓣 9.2分! 超越前浪《隱秘的角落》 上一部被稱為年度爆款國劇的還是《隱秘的角落》,改編自紫金陳的推理小說--《壞小孩》,《隱秘的角落》一經(jīng)播出就帶著"小白船","爬山梗","禿頭梗"熱鬧了一整個(gè)夏天。 在豆瓣已有78萬余人進(jìn)行評分,最終收官8.9分,是非常驚艷的成績。 誰知僅過去2個(gè)月,又一部懸疑劇《沉默的角落》憑借著逆天的口碑火了!同樣改編自作者紫金陳的小說《長夜難明》,一開播豆瓣就達(dá)到8.8分。隨著播出分?jǐn)?shù)越來越高,如今已有20萬余人評分,高達(dá)9.2分,已經(jīng)超過了前浪《隱秘的角落》。 豆瓣總體評分分析 近一步分析觀眾評分,我們發(fā)現(xiàn): 92.8%的觀眾給出了五星滿分,這口碑在國產(chǎn)劇中已經(jīng)達(dá)到標(biāo)桿的水準(zhǔn)。 豆瓣短評詞云 然后我們再看到豆瓣的短評詞云。 我們可以看到,觀眾在短評中討論最多的就是主角"江陽",他的堅(jiān)定和執(zhí)著真可謂可歌可泣。"演員的演技","劇情",對"原著"的還原度,都得到了廣泛的認(rèn)可與好評。 02 刷劇《沉默的真相》 17萬條彈幕都在說些什么 那么刷劇時(shí),大家都在說些什么呢?接下來我們用Python分析了《沉默的真相》前10集的視頻彈幕,共計(jì)173226條。 前十集彈幕走勢圖 從圖中可以看到,看劇時(shí)大家都特別愛發(fā)彈幕,前十集中:
接著我們再看看劇中主要角色的彈幕詞云: 江陽彈幕詞云 由白宇飾演的江陽,原本年輕有為,但是為了探求真相堅(jiān)持正義,付出了自己的生命。像"正義"、"厲害"、"演技"等都在詞云中頻頻出現(xiàn)。 李靜彈幕詞云 關(guān)于譚卓飾演的李靜,在刷劇時(shí)很多人都會聯(lián)想到她在《延禧攻略》中高貴妃的角色。無論是從“高貴妃”到《我不是藥神》中的劉思慧,還是這次的李靜,譚卓的演技都讓人有目共睹。 嚴(yán)良彈幕詞云 從最初官宣影帝廖凡,就有不少觀眾表示沖著廖凡也得看《沉默的真相》,果不其然,劇集一播出,粉絲就夸他是“免檢產(chǎn)品”,妥妥的~ 張超彈幕詞云 飾演張超的寧理老師是迷霧劇場的老朋友了,之前在《無罪之證》中他演的社會"豐田哥"人狠話不多,"反向抽煙"實(shí)在是太深入人心了。從《無證之罪》到《隱秘的角落》,再到《沉默的真相》,嚴(yán)良都換了三個(gè)人了,真是流水的嚴(yán)良,鐵打的李豐田。 03 手把手教你 如何用Python分析彈幕 我們使用Python獲取并分析愛奇藝《沉默的真相》前十集的彈幕數(shù)據(jù),整個(gè)數(shù)據(jù)分析的流程分為以下三個(gè)部分:
1. 數(shù)據(jù)獲取 關(guān)于愛奇藝的彈幕數(shù)據(jù)獲取程序之前文章中已經(jīng)做過闡述。 2. 數(shù)據(jù)讀入和預(yù)處理 首先導(dǎo)入所需包,其中pandas用于數(shù)據(jù)讀入和數(shù)據(jù)處理,os用于文件操作,jieba用于中文分詞,pyecharts和stylecolud用于數(shù)據(jù)可視化。 # 導(dǎo)入庫 將爬取的數(shù)據(jù)存放在data文件夾下,使用os操作獲取需要讀取的csv文件列表并循環(huán)讀入文件。 # 讀入數(shù)據(jù) (173226, 6) 彈幕數(shù)量一共有173226條,預(yù)覽一下數(shù)據(jù): df_all['name'] = df_all.name.str.strip() 3. 數(shù)據(jù)可視化 分集的彈幕數(shù)代碼解說: repl_list = { # 產(chǎn)生數(shù)據(jù) x_data = ['第' + str(i) + '集' for i in danmu_num.index] 彈幕角色-江陽 詞云圖# 定義分詞函數(shù) # 獲取分詞結(jié)果 CDA數(shù)據(jù)分析師 本文出品:CDA數(shù)據(jù)分析師(ID: cdacdacda) |
|