麻将游戏在线玩|联网麻将游戏下载

高大上的甲基化和表達譜聯合分析熱圖展示實例

隨著時代的發展,單一研究轉錄組、蛋白代謝、甲基化等已經難以滿足研究者越來越高的研究期望,大家更多地期望聯合多種數據進行多組學聯合分析。那么這時候,一種好的展示結果的方式無疑會為發表高分文章增光添彩。

誠然,小編的上一篇(如何讓你的圖變得高大上之ComplexHeatmap())結局得太匆匆,因此,本篇奉上作圖代碼實例。

本次,我們將展示一個甲基化與表達譜聯合分析的熱圖。本著先學習再創造的態度,小編做了一下知識的搬運工,本篇所有代碼均引用自:Zuguang Gu, Roland Eils and Matthias Schlesner,?Complex heatmaps reveal patterns and correlations in multidimensional genomic data,?Bioinformatics, 2016。

我們先上效果圖:

其實代碼并不長,關鍵在于如何準備作圖所用數據以及對代碼的理解上,所以下面將著重對這兩點進行解釋說明。

>library(ComplexHeatmap)
>library(circlize)
#為了測試方便,用setwd設置工作路徑
setwd(“/media/bmk/***/Meth_Exp”)
#rds格式是一種保存了數據的數據類型和結構的格式,可以用函數saveRDS()來生成這種格式的文件。meth.rds文件來自R包示例文件,如需查看這個文件中都是什么,請參考(看不清熱圖的聚類結果怎么辦)的方法。另外,文件中只包含了DMR關聯基因的甲基化和表達量呈現負相關的DMR
>res_list?=?readRDS(“data/meth.rds”)

#顯示樣本是腫瘤樣本還是正常樣本的標簽
>type?=?res_list$type
(20個正常樣本和20個腫瘤樣本)
#矩陣,其中行對應差異甲基化區域(DMR),矩陣中的值是每個樣品中DMR中的平均甲基化水平。
>mat_meth?=?res_list$mat_meth

 

#矩陣,其中行對應于與DMR相關的基因(即與DMR最近的基因,也可以叫做DMR關聯基因),矩陣中的值是每個樣品中每個基因的表達水平(對樣品中的每個基因的表達進行了標準化)。
>mat_expr?=?res_list$mat_expr

 

#甲基化變化的方向(hyper表示腫瘤樣本中高甲基化,hypo表示腫瘤樣本中低甲基化)
>direction?=?res_list$direction
#甲基化與甲基化關聯基因相關性p值
>cor_pvalue?=?res_list$cor_pvalue
#基因類型(如蛋白編碼基因或lincRNA等)
>gene_type?=?res_list$gene_type
#DMR注釋到基因的功能區間(如intergenic/intragenic或者TSS
>anno_gene?=?res_list$anno_gene
#DMR到關聯基因TSS的距離
>dist?=?res_list$dist
#與增強子重疊的DMR的部分
>anno_enhancer?=?res_list$anno_enhancer

##首先計算甲基化矩陣的列聚類,以便可以將表達矩陣中的列調整為具有與甲基化矩陣中相同的列順序。
>column_tree?=?hclust(dist(t(mat_meth)))
>column_order?=?column_tree$order

#顏色定義參見上一篇(如何讓你的圖變得高大上之ComplexHeatmap())
>library(RColorBrewer)
#定義甲基化表達水平顏色,從0/blue-0.5/white-1/red漸變
>meth_col_fun?=?colorRamp2(c(0,?0.5,?1),?c(“blue”,?“white”,?“red”))
#定義甲基化變化方向對應顏色
>direction_col?=?c(“hyper”?=?“red”,?“hypo”?=?“blue”)
#定義表達水平顏色
>expr_col_fun?=?colorRamp2(c(-2,?0,?2),?c(“green”,?“white”,?“red”))
#定義相關性p值顏色
>pvalue_col_fun?=?colorRamp2(c(0,?2,?4),?c(“white”,?“white”,?“red”))
#定義基因類型顏色
>gene_type_col?=?structure(brewer.pal(length(unique(gene_type)),?“Set3”),
names?=?unique(gene_type))
#定義注釋model顏色
>anno_gene_col?=?structure(brewer.pal(length(unique(anno_gene)),?“Set1”),
names?=?unique(anno_gene))
#定義距離顏色
>dist_col_fun?=?colorRamp2(c(0,?10000),?c(“black”,?“white”))
#定義增強子相關顏色
>enhancer_col_fun?=?colorRamp2(c(0,?1),?c(“white”,?“orange”))

##我們首先定義兩個列注釋,然后制作復雜的熱圖。
#ht_global_opt()是一個可選函數,它會全局控制一些參數。我們可以通過此全局函數同時為所有熱圖/注釋設置一些參數。需要注意的是,一定將它放在熱圖代碼(也就是Heatmap())之前,并在繪制熱圖后重置所有選項值以消除對下一個熱圖的影響。
#可以通過?ComplexHeatmap::ht_global_opt查看此函數的幫助
>?names(ht_global_opt())????????#可查看該函數可定義的參數
[1]?“heatmap_row_names_gp”
[2]?“heatmap_column_names_gp”
[3]?“heatmap_row_title_gp”
[4]?“heatmap_column_title_gp”
[5]?“heatmap_legend_title_gp”
[6]?“heatmap_legend_title_position”
[7]?“heatmap_legend_labels_gp”
[8]?“heatmap_legend_grid_height”
[9]?“heatmap_legend_grid_width”
[10]?“heatmap_legend_grid_border”
[11]?“annotation_legend_title_gp”
[12]?“annotation_legend_title_position”
[13]?“annotation_legend_labels_gp”
[14]?“annotation_legend_grid_height”
[15]?“annotation_legend_grid_width”????[16]?“annotation_legend_grid_border”
[17]?“fast_hclust”

>ht_global_opt(
heatmap_legend_title_gp?=?gpar(fontsize?=?8,?fontface?=?“bold”),
heatmap_legend_labels_gp?=?gpar(fontsize?=?8),
heatmap_column_names_gp?=?gpar(fontsize?=?8),
heatmap_column_title_gp?=?gpar(fontsize?=?10),
heatmap_row_title_gp?=?gpar(fontsize?=?8)
)
#利用HeatmapAnnotation()對行或列注釋。HeatmapAnnotation()函數會生成一個注釋用的list對象。該函數的主要格式是HeatmapAnnotation(df/數據框, name/注釋名稱, col/注釋顏色列表, show_legend/是否顯示數據框中每一列的圖例)
#樣本類型注釋,Tumor樣本為pink,Control樣本為royalbule,名稱在左邊
>ha?=?HeatmapAnnotation(type?=?type,
col?=?list(type?=?c(“Tumor”?=?“pink”,?“Control”?=?“royalblue”)),
annotation_name_side?=?“left”)
#不顯示圖例名稱
>ha2?=?HeatmapAnnotation(type?=?type,
col?=?list(type?=?c(“Tumor”?=?“pink”,?“Control”?=?“royalblue”)),
show_legend?=?FALSE)

#Heatmap()實際上是單一熱圖的類構造函數。如果需要組合超過一個熱圖,用戶可以通過+操作符添加熱圖。默認情況下,將兩個熱圖通過+連接后,第二個熱圖的行聚類樹會去掉,行的順序會與是第一個熱圖的順序保持一致。
>ht_list?=?Heatmap(mat_meth,?name?=?“methylation”,?col?=?meth_col_fun,
column_order=?column_order,
top_annotation?=?ha,?column_title?=?“Methylation”)?+

#方向部分
Heatmap(direction,?name?=?“direction”,?col?=?direction_col)?+

#表達部分
Heatmap(mat_expr[,?column_tree$order],?name?=?“expression”,
col?=?expr_col_fun,
column_order?=?column_order,
top_annotation?=?ha2,?column_title?=?“Expression”)?+

#p值部分
Heatmap(cor_pvalue,?name?=?“-log10(cor_p)”,?col?=?pvalue_col_fun)+

#基因類型部分
Heatmap(gene_type,?name?=?“gene?type”,?col?=?gene_type_col)?+

#基因注釋部分
Heatmap(anno_gene,?name?=?“anno_gene”,?col?=?anno_gene_col)?+

#距離部分
Heatmap(dist,?name?=?“dist_tss”,?col?=?dist_col_fun)?+

#增強子部分
Heatmap(anno_enhancer,?name?=?“anno_enhancer”,?col?=?enhancer_col_fun,
cluster_columns?=?FALSE,?column_title?=?“Enhancer”)

#以上熱圖相加后得到的是

#可以看到,整個熱圖是單個熱圖從左到右依次相加,圖例是從上到下依次相加,除了第一個熱圖的行聚類樹保留了之外,其他的都默認被去除掉,順序和第一個熱圖保持一致。
#熱圖相加的返回值是一個HeatmapList對象。直接允許ht_list對象會默認調用draw()方法。通過顯式地調用draw()方法,你可以進行更多的控制,例如圖例和標題。
#可以通過??`draw,HeatmapList-method`來查看draw的幫助
#分兩個cluster進行聚類,按hyper和hypo進行分裂,加上整張熱圖的名稱,設置圖例位置等
>draw(ht_list,?km?=?2,?split?=?direction,
column_title?=?“Comprehensive?correspondence?between?methylation,
expression?and?other?genomic?features”,
column_title_gp?=?gpar(fontsize?=?12,?fontface?=?“bold”),
merge_legends?=?TRUE,?heatmap_legend_side?=?“bottom”)
#重置全局參數消除影響
>ht_global_opt(RESET?=?TRUE)

復雜的熱圖顯示高度甲基化的DMR富含基因間和基因內區域,很少與增強子重疊。相反,低甲基化的DMR富含轉錄起始位點(TSS)和增強子。

知識點總結

1.ComplexHeatmap可實現單個熱圖的相加以實現數據之間的聯合。

2.ht_global_opt()函數可實現整個熱圖的全局控制,但要注意使用結束后進行重置。

3.draw()函數在返回值是HeatmapList對象可以實現更多的控制。

 

推薦文章
麻将游戏在线玩 重庆时时彩组选包胆下324中了中多少钱 十大信誉搏彩排行 河北时时计算公式 稳赚时时彩准确率99%杀两码 网络上骰子猜单双有技巧吗 三公游戏平台代理 时时彩胜率最高的买法 万人炸金花官方下载 大发快三大小单双技巧规律 棋牌游戏下载