基于R语言绘制韦恩图和多集合的UpSetPlot

绘制多维韦恩图和UpSetPlot图

韦恩图简介

韦恩图(Venn plot),又称文氏图,是英国的哲学家和数学家约翰·维恩(John Venn)在1881年发明的,主要是用于展示在不同的事物群组(集合)之间的数学或逻辑联系,尤其适合用来表示集合(或)类之间的“大致关系”,它也常常被用来帮助推导(或理解推导过程)关于集合运算(或类运算)的一些规律。在我们常用的领域,简单来说就是多个集合之间取交集。


制作venn图的方法

绘制韦恩图有很多方式,R,Python,Perl等,这里主要是用R来展示;在R语言中,绘制venn图有很多包可以实现:Venn, Vennplot, VennDiagram, VennDetail, ggvenn,gplots等。

此文主要展示一下用VennDiagram包绘制高纬度的韦恩图。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
rm(list = ls())
#加载R包
library(VennDiagram)

##VennDiagram输入数据的格式是2~5个向量组成的list
#创建5个小学字母组成的随机向量
set.seed(727)
V1 <- sample(letters,size = 20)
V2 <- sample(letters,size = 20)
V3 <- sample(letters,size = 20)
V4 <- sample(letters,size = 20)
V5 <- sample(letters,size = 20)

#绘图
venn.diagram(x=list(GUO=V1,
                    FU=V2,
                    YA=V3,
                    SE=V4,
                    WANG=V5),
                    filename = 'test_venn.tiff')

这样一个简单的GUOFUYASEWANG(国服亚瑟王)的韦恩图就画出来,通过参数给他加点颜色,美观一下。

1
2
3
4
5
6
7
8
venn.diagram(x=list(GUO=V1,
                    FU=V2,
                    YA=V3,
                    SE=V4,
                    WANG=V5),
                    fill=c('red','yellow','blue','grey','green'),#填充一下配色
                    margin = 0.05,#设置一下间距
                    filename = './test_venn2.tiff')

增加配色之后好看了不少。

网站绘制韦恩图

除了用R绘制韦恩图,还可以用网站实现。http://www.interactivenn.net/可以绘制2-6维的韦恩图,不需要学会R也能绘制韦恩图。同学们可以自行探索。

绘制UpSetPlot图

有时候自己需要取交集的数据集太多,韦恩图满足不了,可以采用UpSetplot,它可以将交集数目通过柱状图的方式呈现。以UpSetR包里的movies文件做示例:

1
2
3
4
5
6
7
8
rm(list = ls())
#加载R包
library(UpSetR)
#载入movies数据集
movies <- read.csv( system.file("extdata", "movies.csv", package = "UpSetR"), header=TRUE, sep=";" )
#查看一下movie数据集
view(movies)
dim(movies)

这是一个3883行,21列的数据集,包含了1995上映的电影具体情况(如Action是否是运动电影,0表示不是运动电影,1表示是运动电影,以此类推)

1
2
3
4
#简单绘制UpSetplot
upset(movies, nsets = 7, #绘制的集合数目
      mb.ratio = c(0.5, 0.5)#调整上下两部分的比例
      order.by = c("freq"))#为按频率排序

该图中黑色表示该位置有数据,灰色的点表示没有,不同点连线表示存在交集, 不同柱状图表示不同的数目

Hoang的简书地址:https://www.jianshu.com/u/1fd4ff43abdc