下面來(lái)看一看,瞧一瞧,學(xué)習(xí)怎么利用公司的標(biāo)準(zhǔn)流程分析報(bào)告發(fā)文章~ 首先是文章的實(shí)驗(yàn)設(shè)計(jì),僅僅是給了一個(gè)表格取樣為 來(lái)自 自5個(gè)妊娠期糖尿病患者和匹配的5個(gè)對(duì)照組的皮下和大網(wǎng)膜脂肪組織(AT),展示了這10個(gè)patient的一些年齡、BMI、胰島素等指標(biāo)。 接著是 樣本的實(shí)驗(yàn)指標(biāo)如RIN值比如轉(zhuǎn)錄組建庫(kù)的時(shí)候要求的 RNA 濃度、RIN值(一般建庫(kù)要求RIN>8,表示RNA是否發(fā)生降解)。 數(shù)據(jù)量展示接著文章給出了 每個(gè)樣本的數(shù)據(jù)量,包括測(cè)序前的原始測(cè)序數(shù)據(jù)量,以及過(guò)濾后的數(shù)據(jù)量,過(guò)濾前后的數(shù)據(jù)損失比例。 這里的數(shù)據(jù)量一般指 fq數(shù)據(jù) 中 每個(gè)樣本測(cè)了多少條read,使用M=1000,000來(lái)表示,每個(gè)樣本測(cè)了 多少個(gè)堿基,使用G=1000,000,000 表示。 數(shù)據(jù)量在我們的轉(zhuǎn)錄組授課中進(jìn)行了特別強(qiáng)調(diào),因?yàn)楹芏嗳硕?搞不清楚 fq的物理存儲(chǔ)大小的G(即所占磁盤(pán)空間),以及 測(cè)序數(shù)據(jù)量的G(即10億)。 原始fq的fastqc質(zhì)控圖第一個(gè)圖展示了fq數(shù)據(jù)的每個(gè)每個(gè)堿基質(zhì)量值分布,第二圖為每條序列的平均堿基質(zhì)量值分布,第三幅圖為每條序列的GC含量密度曲線圖。這些圖片的詳細(xì)解釋也在我們的 轉(zhuǎn)錄組授課 中進(jìn)行了非常詳細(xì)的介紹,數(shù)據(jù)質(zhì)量好的時(shí)候不好的時(shí)候都呈現(xiàn)一個(gè)什么樣的分布。 Hisat2比對(duì)結(jié)果展示A圖為hisat2數(shù)據(jù)總比對(duì)率的柱狀圖,B圖為featurecount定量指標(biāo)的堆積柱狀圖。一般樣本的數(shù)據(jù)總比對(duì)率高于90%,還需要關(guān)注一下唯一比對(duì)率。 樣本相關(guān)性指標(biāo)圖定量完后拿到一張樣本表達(dá)矩陣,就可以進(jìn)行下游分析了,比如差異分析前檢查一下樣本分組,使用樣本相關(guān)性熱圖,樣本PCA分析圖。除此之外,我們的轉(zhuǎn)錄組課程還介紹了層次聚類(lèi),樣本表達(dá)總體分布的箱線圖、小提琴圖、密度曲線圖。 這里的一個(gè)重要指標(biāo)為:樣本的組內(nèi)相關(guān)性一定高于組間。 差異分析結(jié)果展示每種組織的單獨(dú)PCA分析以及差異結(jié)果的MA圖展示(可以看得出來(lái),每次差異分析里面的組間差異不明顯,反而是組內(nèi)的樣品異質(zhì)性很大,這樣的話就會(huì)導(dǎo)致差異基因很少很少,所以 有些差異本來(lái)就是不應(yīng)該很明顯) 功能富集分析展示每種組織的差異分析結(jié)果使用hallmark 通路進(jìn)行功能富集分析,看到這里 我不禁懷疑,這個(gè)作者 知道hallmark通路里面都是什么生物學(xué)相關(guān)的通路嗎? 妊娠期糖尿病患者并不是腫瘤,理論上不需要的hallmark通路注釋,所以說(shuō)發(fā)這個(gè)期刊做這樣的文章壓根就不需要什么生物學(xué)背景!三張表格,五張圖片,文章到此,戛然而止!全部分析流程如下: 我們隨便網(wǎng)上找一篇公開(kāi)的示例標(biāo)準(zhǔn)分析報(bào)告可能都比這強(qiáng)?。?span style="color: rgb(0, 82, 255);">https://www./cloudir/reports/transcriptome/%E7%BB%93%E9%A2%98%E6%8A%A5%E5%91%8A.html 最后好奇這個(gè)雜志搜了一下:《Scientific Data》是一本專注于數(shù)據(jù)的同行評(píng)審開(kāi)放獲取期刊,由Springer Nature出版商出版。該期刊創(chuàng)刊于2014年,主要發(fā)表描述具有科學(xué)價(jià)值的數(shù)據(jù)集以及促進(jìn)科學(xué)數(shù)據(jù)共享和再利用的研究。以下是關(guān)于《Scientific Data》的一些關(guān)鍵信息:
《Scientific Data》以其開(kāi)放獲取政策和對(duì)數(shù)據(jù)共享的重視,為全球科研人員提供了一個(gè)發(fā)布、發(fā)現(xiàn)和重用研究數(shù)據(jù)的平臺(tái),促進(jìn)了科學(xué)研究的透明度和可重復(fù)性。 不過(guò),它的審稿人也不是小數(shù)目了,現(xiàn)在(2025年01月)好像是2000美元,雖然比NC低不少,但是一年也可以賺一個(gè)小目標(biāo)!詳見(jiàn):輕輕松松年入五個(gè)億!清北復(fù)交中科院的最?lèi)?ài) 好了,看完這篇文獻(xiàn),你思路打開(kāi)了嗎? 文末友情宣傳強(qiáng)烈建議你推薦給身邊的博士后以及年輕生物學(xué)PI,多一點(diǎn)數(shù)據(jù)認(rèn)知,讓他們的科研上一個(gè)臺(tái)階: |
|
來(lái)自: 健明 > 《待分類(lèi)》