事實(shí)上,對(duì)于大多數(shù)生物背景的朋友或者日常工作為濕實(shí)驗(yàn)的朋友,最實(shí)用,最簡(jiǎn)單的繪制一張熱圖或者直觀地展示基因表達(dá)趨勢(shì)的方式是使用Excel直接繪制一張熱圖。 雖然現(xiàn)在已經(jīng)有很多網(wǎng)頁(yè)版的或者是本地版的工具,但是對(duì)于快速的察看一些基因的表達(dá)趨勢(shì)來(lái)說(shuō),或許直接在Excel上繪制會(huì)更簡(jiǎn)單方便。 故寫(xiě)下這個(gè)博文,希望對(duì)有需要的朋友有一點(diǎn)幫助。 需要的軟件只有Excel 是必須的,版本應(yīng)該在2010或者以上 可選項(xiàng)還有Adobe Illustractor,可用于得到矢量圖 準(zhǔn)備數(shù)據(jù)在生信數(shù)據(jù)中,最常見(jiàn)的繪制熱圖場(chǎng)景,就是多個(gè)基因在多個(gè)樣本中的表達(dá)量矩陣,具體如下圖,第一列是基因標(biāo)簽,第一行是樣本標(biāo)簽,其他格子中為基因的RPKM或者FPKM更或者其他指標(biāo)
使用到的數(shù)據(jù) 繪制熱圖隨后整理一個(gè)簡(jiǎn)單的熱圖 一個(gè)比較粗糙的熱圖
優(yōu)化接下來(lái),我們要優(yōu)化一下,這張圖直接使用了原始的表達(dá)量值,不能很好的展現(xiàn)基因在不同樣之間的表達(dá)變換,也可能掩蓋了表達(dá)量比較低或者表達(dá)量比較高的基因的表達(dá)變化。所以,一般在熱圖繪制中,會(huì)采用兩種兩種標(biāo)準(zhǔn)化方法, 1.對(duì)數(shù)轉(zhuǎn)換:轉(zhuǎn)換之后,可以更好的顯示出低表達(dá)基因的表達(dá)變換,也可以比較不同基因之間的表達(dá)量 2.基因在不同樣本中的表達(dá)量,進(jìn)行正態(tài)標(biāo)準(zhǔn)化,這種標(biāo)準(zhǔn)化操作后,突出地展現(xiàn)了基因在不同樣本中的表達(dá)變化(注意,此時(shí)不用基因之間的值沒(méi)有可比性,當(dāng)然這個(gè)常常并不被關(guān)注) 3.基因在不同樣本中的表達(dá)量,做0-1標(biāo)準(zhǔn)化,將最小值映射到0,最大值映射到1,按比例整理即可 上述第一種標(biāo)準(zhǔn)化方法和第三種標(biāo)準(zhǔn)化方法都比較簡(jiǎn)單,這里不加以說(shuō)明,僅演示第二種標(biāo)準(zhǔn)化方法,其對(duì)應(yīng)的公式是,具體可參考百度u是標(biāo)準(zhǔn)化后的值,X是原始值,μ是均值,δ是標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)化之后的值 = (原始值 - 均值)/ 標(biāo)準(zhǔn)差
所以還是比較簡(jiǎn)單,使用Excel的兩個(gè)內(nèi)置函數(shù)和自動(dòng)映射功能, 在單元格中輸入=avergae( ,手動(dòng)選擇一行,回車(chē)即可計(jì)算均值,
分別計(jì)算均值,和標(biāo)準(zhǔn)差 雙擊箭頭指向的單元格右下角的點(diǎn),或者點(diǎn)擊拖住下拉
自動(dòng)映射,得到所有均值 自動(dòng)計(jì)算標(biāo)準(zhǔn)差,與均值的操作類似,使用的函數(shù)是=STDEV()
自動(dòng)映射,得到每個(gè)基因的標(biāo)準(zhǔn)差 隨后,可以直接計(jì)算標(biāo)準(zhǔn)化后的值,按照正態(tài)標(biāo)準(zhǔn)化的公式,如下,注意添加的美元符號(hào),輸入完公式之后,回車(chē)即可完成一個(gè)單元格的計(jì)算
基于正態(tài)標(biāo)準(zhǔn)化的公式,進(jìn)行計(jì)算,得到標(biāo)準(zhǔn)化后的值 由于加了美元符號(hào),此處可以直接進(jìn)行行和列的自動(dòng)映射,點(diǎn)擊單元格的右下角,向右拖拽,選擇了行,再向下進(jìn)行整行映射
一個(gè)單元格映射到一行,一行映射到多行 對(duì)于得到的標(biāo)準(zhǔn)化后的矩陣,復(fù)制列名 和 行名,即可得到標(biāo)準(zhǔn)化后的熱圖,可以明顯看到,基因在不同樣本中的表達(dá)變化趨勢(shì)
標(biāo)準(zhǔn)化之前的熱圖 和 標(biāo)準(zhǔn)化之后的熱圖
到此,相對(duì)能看的熱圖基本完成,但是熱圖太丑,所以我們需要進(jìn)行美化 - 邊框太丑,去掉
- 標(biāo)簽文字居中會(huì)好看點(diǎn),調(diào)整
- 單元格中標(biāo)準(zhǔn)化之后的數(shù)值太丑,不好看,去掉
進(jìn)一步美化以上,第一點(diǎn)直接進(jìn)項(xiàng)顏色填充,填充為白色,第二點(diǎn)文字居中,搞定,第三點(diǎn)比較麻煩,所以這里直接演示最后一點(diǎn) 掩蓋數(shù)字 如此,即可得到這樣的熱圖
完成了,可直接復(fù)制黏貼到報(bào)告文檔 至此,我們已經(jīng)完成了常見(jiàn)的熱圖繪制和整理,那么問(wèn)題來(lái)了,
得到矢量圖如何得到矢量圖,畢竟,清晰度很關(guān)鍵啊,或許要放到論文里面… 這個(gè)操作就比較簡(jiǎn)單了, 1.選擇Excel中對(duì)應(yīng)的熱圖,復(fù)制(或者鼠標(biāo)右鍵復(fù)制,或者鍵盤(pán)Ctrl+C) 2.打開(kāi)Adobe Illustractor,黏貼(或者鼠標(biāo)右鍵黏貼,或者鍵盤(pán)Ctrl+V)
|