本系列推送旨在帶領(lǐng)生信零基礎(chǔ)的科研人一起入門單細(xì)胞(核)轉(zhuǎn)錄組數(shù)據(jù)分析。 在本系列的推送中,我們之前給大家分享了: ①單細(xì)胞(核)RNA測序的原理 ②基于Cellranger的上游分析 ③數(shù)據(jù)下載/導(dǎo)入/合并 ④數(shù)據(jù)質(zhì)控(包括細(xì)胞質(zhì)控和基因質(zhì)控) ⑤細(xì)胞注釋前幾個(gè)數(shù)據(jù)處理技能(包括細(xì)胞周期矯正、去批次、差異分析) ⑥細(xì)胞注釋 ⑦細(xì)胞注釋結(jié)果可視化(UMAP,氣泡圖) 上一期分享(第25期. 單細(xì)胞亞群細(xì)分),我們主要講解了為什么要對(duì)細(xì)胞亞群進(jìn)行更細(xì)致的分型,以及如何實(shí)現(xiàn)和展示某一類細(xì)胞的細(xì)分。完成了對(duì)細(xì)胞進(jìn)行了定義和注釋之后,還有一步很重要的內(nèi)容,就是去探究不同細(xì)胞的生物學(xué)功能,從而為后續(xù)的研究提供方向,這也就引出了我們今天的內(nèi)容:富集分析。1)為什么進(jìn)行富集分析(Why) 2)富集分析結(jié)果有哪些呈現(xiàn)形式(What) 3)如何完成富集分析并展示(How) 在單細(xì)胞組學(xué) | 第22期. 單細(xì)胞數(shù)據(jù)分析的靈魂,學(xué)起來!的內(nèi)容中,我們學(xué)會(huì)了如何進(jìn)行差異分析。但是大家會(huì)發(fā)現(xiàn),FindAllMarkers得到的marker基因,少則幾百,多則成千上萬。如何從眾多的marker基因中去推導(dǎo)其反應(yīng)的生物學(xué)功能,這就是富集分析解決的問題—幫助識(shí)別某些基因在特定條件下的共同功能,揭示潛在的生物學(xué)機(jī)制,從而驗(yàn)證實(shí)驗(yàn)結(jié)果的生物學(xué)合理性,并且?guī)椭覀兏嗅槍?duì)性地設(shè)計(jì)后續(xù)研究。1. GO富集分析(Gene Ontology Enrichment Analysis):分析確定基因列表在GO分類的生物過程(BP)、分子功能(MF)和細(xì)胞組分(CC)中的富集情況,幫助理解這些基因的功能和在細(xì)胞內(nèi)的定位。 2. KEGG通路富集分析(KEGG Pathway Enrichment Analysis):確定基因列表在KEGG(Kyoto Encyclopedia of Genes and Genomes)通路中的富集情況,幫助理解這些基因在代謝和信號(hào)傳導(dǎo)等生物學(xué)過程中的作用。 3. Reactome通路富集分析(Reactome Pathway Enrichment Analysis):類似于KEGG,但使用的是Reactome數(shù)據(jù)庫。富集分析的展現(xiàn)形式往往是柱狀圖或者點(diǎn)圖,但是這些圖形往往只能展示某一個(gè)細(xì)胞群體的富集結(jié)果。當(dāng)需要同時(shí)分析和展示多種細(xì)胞的富集結(jié)果時(shí)就顯得尤為不便,今天我們教大家用一個(gè)函數(shù)—compareCluster輕松搞定單細(xì)胞富集分析!##按照active_identity求DEGs all_markers_major <- FindAllMarkers(Hu_AO_db_QC2, only.pos = T, #只會(huì)去找某一群特定上調(diào)的基因 logfc.threshold=0.25,#倍數(shù)的對(duì)數(shù)的閾值,默認(rèn)是0.25 min.pct = 0.25) ##選擇top DEGs(比如top100) top100_markers_majorcelltype <- all_markers_major %>% group_by(cluster) %>% top_n(n = 100, wt = avg_log2FC) %>% as.data.frame()
1. GO分析 得到了基因列表,接下來使用clusterProfiler進(jìn)行富集分析。clusterProfiler是個(gè)功能非常強(qiáng)大的R包,對(duì)于常見的富集分析,都可以用當(dāng)中的compareCluster()這一個(gè)函數(shù)完成。之前說到GO分析可以分為生物過程(BP)、分子功能(MF)和細(xì)胞組分(CC),這里我們用BP舉例:##GO富集分析,并作圖,可使用Gene symbol BP = compareCluster(gene~cluster,data=top100_markers_majorcelltype, fun='enrichGO', OrgDb = 'org.Hs.eg.db', keyType = 'SYMBOL', ont="BP")#ont參數(shù)可選擇"BP","MF"和"CC",keyType可選擇使用GeneSymbol還是ENTREZID dotplot(BP, showCategory=2, color = "p.adjust", font.size = 8)+# showCategory可以選擇每類細(xì)胞展示的條目個(gè)數(shù),也可以選擇自己感興趣的條目進(jìn)行展示 theme(axis.text.x = element_text(angle=45, hjust=1))+ coord_flip()#將坐標(biāo)軸翻轉(zhuǎn)
2. KEGG分析 由于KEGG分析無法使用Gene Symbol分析,所以要將Gene Symbol轉(zhuǎn)換為ENTREZID,但仍然使用compareCluster()和dotplot()分析和作圖。##將Gene Symbol轉(zhuǎn)換為ENTREZID genelist <- bitr(top100_markers_majorcelltype$gene, fromType="SYMBOL", toType="ENTREZID", OrgDb='org.Hs.eg.db') top100_markers_majorcelltype=left_join(top100_markers_majorcelltype,genelist,by=c('gene'="SYMBOL"))#將genelist中的ENTREZID合并至分析表格中 KEGG=compareCluster(ENTREZID~cluster, data=top100_markers_majorcelltype,fun="enrichKEGG", organism='hsa', pvalueCutoff=0.05) dotplot(KEGG, showCategory=2, color = "p.adjust", font.size = 10)+ # showCategory可以選擇每類細(xì)胞展示的條目個(gè)數(shù),也可以選擇自己感興趣的條目進(jìn)行展示 theme(axis.text.x = element_text(angle=45, hjust=1))+ coord_flip()#將坐標(biāo)軸翻轉(zhuǎn)
以上就是本期推送的全部內(nèi)容,大家對(duì)于推送內(nèi)容有任何問題或建議可以在公眾號(hào)菜單欄“更多--讀者的話”欄目中提出,我們會(huì)盡快回復(fù)!Han B, Zhou S, Zhang Y, Chen S, Xi W, Liu C, Zhou X, Yuan M, Yu X, Li L, Wang Y, Ren H, Xie J, Li B, Ju M, et al. Integrating spatial and single-cell transcriptomics to characterize the molecular and cellular architecture of the ischemic mouse brain. Science Translational Medicine. 2024;16(733):eadg1323.期待已久~|R語言與組學(xué)互助交流群來啦! (歡迎大家入群交流~
|