网易首页 > 网易号 > 正文 申请入驻

R语言学习笔记(五)——曼哈顿图

0
分享至

导 语

全基因组关联分析(Genome-wide association study)是生物领域挖掘功能基因的常用方法。GWAS的最重要的结果展示就是曼哈顿图,本期给大家介绍两个画曼哈顿图的R包qqman和CMplot,并对二者做一个简单小结。

01GWAS简介

全基因组关联分析最早是在人类疾病研究中被应用,随后在动物和植物研究中也大放异彩。从2005年第一篇GWAS研究开始到现在已经16年了,很多重要的基因都已经被挖掘出来了,但值得注意的是每年仍然有不少高水平的GWAS相关文章。尤其是近年来转录组、蛋白组、代谢组等多组学的兴起,可能会大大扩展GWAS的研究边界,让GWAS焕发出第二春。

关于GWAS具体的分析流程网上的资料很多,在这里不做更多的介绍。这里只介绍GWAS的结果展示方式,即曼哈顿图和qq图。其中曼哈顿图显示所有SNP位点的p-value,可以理解为每个SNP与表型的关联程度;qq图的纵轴是SNP位点的p-value值,横轴是则是均匀分布的p-value值,显示了每个SNP位点p-value实际值与理论值(假设SNP与表型不相关)的差异。

02qqman

这个包的用法比较简单,这里用包中自带的示例文件gwasResults展示

> install.packages("qqman")> library(qqman) #加载qqman包> library(RColorBrewer) #用于颜色变化> str(gwasResults)> head(gwasResults)SNP CHR BP P1 rs1 1 1 0.91480602 rs2 1 2 0.93707543 rs3 1 3 0.28613954 rs4 1 4 0.83044765 rs5 1 5 0.64174556 rs6 1 6 0.5190959

可以看到数据一共4列,分别是SNP标记的名称、染色体、染色体位置、P值。我们先不调参数画个最简单的曼哈顿图

> manhattan(gwasResults)

从曼哈顿图可以看到只有3号染色体上有一个很高的峰,这几乎是最理想的GWAS结果。

同样,我们画出相应的qq图:

> qq(gwasResults$P) #qq图只需要一列p值的数据

这种翘尾巴的形式也是最理想的qq图结果,可以看到从横坐标大于2开始,GWAS结果的p值与均匀分布的p值就有了明显的差距,说明表型和基因型之间确实存在显著的相关关系。

最后看一下曼哈顿图的相关参数

manhattan(x, chr = "CHR", bp = "BP", p = "P", snp = "SNP",col = c("gray10", "gray60"), chrlabs = NULL,suggestiveline = -log10(1e-05), genomewideline = -log10(5e-08),highlight = NULL, logp = TRUE, annotatePval = NULL,annotateTop = TRUE, ...)

这里只介绍几个常用的参数,col是调整颜色,suggestiveline是p的阈值,genomewideline是第二条阈值线,highlight是标记某个或某些SNP。

> manhattan(gwasResults,col = c("red", "blue"),annotatePval = 0.0001)

03CMplot

这个包实际上只有一个函数CMplot,但集成了SNP密度图、曼哈顿图和qq图多种图形的画法。这个函数的参数有很多,这里列举一些常用的参数。

CMplot(Pmap, col=c("#377EB8", "#4DAF4A", "#984EA3", "#FF7F00"),bin.size=1e6, bin.max=NULL, pch=19, band=1, cir.band=0.5, H=1.5,ylim=NULL, cex.axis=1, plot.type="b", multracks=FALSE, cex=c(0.5,1,1),r=0.3, xlab="Chromosome", ylab=expression(-log[10](italic(p))), xaxs="i",yaxs="r", outward=FALSE, threshold = NULL, threshold.col="red",threshold.lwd=1, threshold.lty=2, amplify= TRUE, chr.labels=NULL,signal.cex = 1.5, signal.pch = 19, signal.col="red", signal.line=1,cir.chr=TRUE, cir.chr.h=1.5, chr.den.col=c("darkgreen", "yellow", "red"), cir.legend=TRUE, cir.legend.cex=0.6, cir.legend.col="black",LOG10=TRUE, box=FALSE, conf.int.col="grey", file.output=TRUE,file="jpg", dpi=300, memo="")

col 设置颜色cex/pch 设置点的大小/形状

bin.size 设置SNP密度图中的窗口大小

cex.axis 设置坐标轴字体和标签字体的大小

plot.type 设置不同的绘图类型,可以设定为 "d", "c", "m", "q" or "b",其中d是SNP密度图,c是环形曼哈顿图,m是曼哈顿图,q是qq图,b是同时画环形曼哈顿图、曼哈顿图和qq图。

threshold/ threshold.col/ threshold.lwd/ threshold.lty 设置阈值并添加阈值线/阈值线的颜色/宽度/类型

signal.cex/signal.pch/signal.col 设置显著点的大小/性状/颜色

cir.legend/cir.legend.cex/cir.legend.col 设置是否显示图例/图例字体大小/图例颜色

3.1 SNP密度图

> #install.packages(CMplot)> library(CMplot)> data = pig60K> head(data) SNP Chromosome Position trait1 trait2 trait31 ALGA0000009 1 52297 0.7738187 0.51194318 0.511943182 ALGA0000014 1 79763 0.7738187 0.51194318 0.511943183 ALGA0000021 1 209568 0.7583016 0.98405289 0.984052894 ALGA0000022 1 292758 0.7200305 0.48887140 0.488871405 ALGA0000046 1 747831 0.9736840 0.22096836 0.220968366 ALGA0000047 1 761957 0.9174565 0.05753712 0.05753712

可以看到示例数据pig60K有6列,前3列是SNP信息,后三列是表型数据。我们自己用CMplot包作图时,可直接保留列名,将数据替换成自己的数据即可。

> CMplot(pig60K,plot.type = "d",bin.size = 1e5, col = c("blue","red","yellow"), file.output = F)

3.2 曼哈顿图

单性状曼哈顿图

> CMplot(pig60K,plot.type = "m", threshold = c(0.01,0.05)/nrow(pig60K), amplify = T, signal.cex = c(1,1), signal.pch = c(20,20), signal.col = c("red","blue"), multracks = F, file.output = F)

上面的图片是trait1的曼哈顿图,若绘制多性状曼哈顿图则是这样的:

> CMplot(pig60K,plot.type = "m", threshold = c(0.01,0.05)/nrow(pig60K), amplify = T, signal.cex = c(1,1), signal.pch = c(20,20), signal.col = c("red","blue"), multracks = F, file.output = F)

可以看到由于不同的信号叠加到一起显得非常拥挤,所以常规的曼哈顿图不适合展示多性状的GWAS结果。那用什么展示呢,环形曼哈顿图!

环形曼哈顿图

> CMplot(pig60K,plot.type="c",r=0.5,threshold=c(1e6, 1e6),cex = 1, threshold.col = c("red","blue"),cir.chr.h = 2,signal.cex = c(2,2), signal.col=c("red","green"),file.output = F)

可以看到环形的曼哈顿图能够同时显示3个性状的GWAS结果。

3.4 qq图

qq图的做法比较简单,一般只需要把作图类型改成q,设置阈值,调整一下字体大小即可。

> CMplot(pig60K,plot.type = "q",threshold = 0.05)

04小 结

本期给大家介绍了用于展示GWAS结果曼哈顿图和qq图的R包qqman和CMplot,其中qqman的用法比较简单,功能也相对单一。而CMplot除了曼哈顿图和qq图,还能够画SNP密度图,并且能够用环形曼哈顿图同时展示多个GWAS结果,推荐大家使用!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
光纤大利好!外资最新重仓3家低价光纤股,最高6元,最低5元

光纤大利好!外资最新重仓3家低价光纤股,最高6元,最低5元

长风价值掘金
2026-05-09 17:04:58
抓了那么多贪官,钱呢?跟我们有关系吗?

抓了那么多贪官,钱呢?跟我们有关系吗?

细说职场
2026-05-08 22:15:45
4战国乒吞0-12!法国男团放话:中国队已不可怕 我们将首次赢他们

4战国乒吞0-12!法国男团放话:中国队已不可怕 我们将首次赢他们

风过乡
2026-05-09 17:29:03
汪峰森林北被曝分手,森林北立即断舍离,自嘲是汪峰5任中最差的

汪峰森林北被曝分手,森林北立即断舍离,自嘲是汪峰5任中最差的

露珠聊影视
2026-05-09 22:16:53
太心酸!国乒女团3-0横扫罗马尼亚,斯佐科斯赛后发言句句戳心!

太心酸!国乒女团3-0横扫罗马尼亚,斯佐科斯赛后发言句句戳心!

田先生篮球
2026-05-09 22:47:39
这出黑色幽默,没人笑得出来

这出黑色幽默,没人笑得出来

梳子姐
2026-05-09 09:23:35
随着日本2-1,亚洲杯最新积分榜出炉:中国男足垫底,濒临出局

随着日本2-1,亚洲杯最新积分榜出炉:中国男足垫底,濒临出局

侧身凌空斩
2026-05-10 02:01:34
41岁知名“特型演员”侯京健大婚!曝妻子身份,多次主持联欢晚会

41岁知名“特型演员”侯京健大婚!曝妻子身份,多次主持联欢晚会

裕丰娱间说
2026-05-09 12:02:30
别吃!寄生虫多达6000条,上海近期正大量出现,严重可致死

别吃!寄生虫多达6000条,上海近期正大量出现,严重可致死

新民周刊
2026-05-09 13:15:09
驻加尔各答总领馆再次提醒中国公民避免自尼泊尔误入印度国境

驻加尔各答总领馆再次提醒中国公民避免自尼泊尔误入印度国境

环球网资讯
2026-05-09 21:42:17
员工人均奖金达610万人民币?SK海力士回应

员工人均奖金达610万人民币?SK海力士回应

第一财经资讯
2026-05-09 16:50:23
香港富豪孙女被绑架,绑匪拿到2800万后逃跑,警方最新透露:女事主镇定、有条理,一个线索成破案关键

香港富豪孙女被绑架,绑匪拿到2800万后逃跑,警方最新透露:女事主镇定、有条理,一个线索成破案关键

南方都市报
2026-05-09 15:00:26
致命倒计时开始!朝鲜内部细节曝光:7个月后,半岛再无回头路

致命倒计时开始!朝鲜内部细节曝光:7个月后,半岛再无回头路

真的好爱你
2026-05-09 15:52:00
黄瓜立大功?医生发现:经常吃黄瓜的人,不出半年,或有4大改善

黄瓜立大功?医生发现:经常吃黄瓜的人,不出半年,或有4大改善

芹姐说生活
2026-05-09 21:08:03
震惊!桂林《印象·刘三姐》演员被质疑擦边低俗,此前曾全裸出境

震惊!桂林《印象·刘三姐》演员被质疑擦边低俗,此前曾全裸出境

火山詩话
2026-05-09 07:37:50
近10年学术不端名单:协和“4+4”董袭莹、“首席科学家”郭伟、“不知知网”翟天临

近10年学术不端名单:协和“4+4”董袭莹、“首席科学家”郭伟、“不知知网”翟天临

网易新闻出品
2026-05-09 18:38:13
商务部:中俄贸易连续三年突破2000亿美元

商务部:中俄贸易连续三年突破2000亿美元

界面新闻
2026-05-09 10:17:43
1-2不敌日本,中国男足遭遇亚洲杯2连败,晋级仅存理论可能

1-2不敌日本,中国男足遭遇亚洲杯2连败,晋级仅存理论可能

侧身凌空斩
2026-05-10 01:54:50
尴尬!网红神裤成审美灾难,网友称市场有需求,有些人恨不得裸奔

尴尬!网红神裤成审美灾难,网友称市场有需求,有些人恨不得裸奔

火山詩话
2026-05-09 19:50:52
“寻天”商标注册!小米欲成立汽车独立子品牌?官方未作回应

“寻天”商标注册!小米欲成立汽车独立子品牌?官方未作回应

每日经济新闻
2026-05-09 19:47:07
2026-05-10 03:20:49
投必得专业论文编译
投必得专业论文编译
学术论文润色编辑及翻译
1409文章数 619关注度
往期回顾 全部

科技要闻

美国政府强力下场 苹果英特尔达成代工协议

头条要闻

演员文章面馆大火后又开酒吧 多位明星到场母亲也现身

头条要闻

演员文章面馆大火后又开酒吧 多位明星到场母亲也现身

体育要闻

成立128年后,这支升班马首夺顶级联赛冠军

娱乐要闻

50岁赵薇脸颊凹陷沧桑得认不出!

财经要闻

多地号召,公职人员带头缴纳物业费

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

旅游
健康
艺术
教育
家居

旅游要闻

不用长途奔波!北京城区随处是治愈人心的初夏花海

干细胞能让人“返老还童”吗

艺术要闻

深圳终究失去“中国第一高楼”,华润接手地块!

教育要闻

天津女教师怼家长!完整录音曝光,老师很嚣张,饭碗恐不保了

家居要闻

菁英人居 全能豪宅

无障碍浏览 进入关怀版