boxplot ⽤于绘制箱线图,我们都知道boxplot ⽤于展⽰⼀组数据的总体分布,在R语⾔中,⽀持两种输⼊数据的⽅式第⼀种:x , 这个参数指定⽤于绘制箱线图所⽤的数据,是⼀个向量代码⽰例:
boxplot(1:100)
效果图如下:
第⼆种, 通多formala 和 data 两个参数指定,适合展⽰多组数据的分布代码⽰例:
dataset <- data.frame(value = rep(1:100, times = 2), group = factor(rep(c(\"A\boxplot( value ~ group, dataset)
效果图如下:
下⾯详细解释⼏个常⽤的参数:
1)widh : 控制箱体的宽度,当图中有多个箱⼦时才会发挥作⽤,其值为长度和箱体个数相同的向量,指定了不同箱体的相对宽度代码⽰例:
dataset <- data.frame(value = rep(1:100, times = 2), group = factor(rep(c(\"A\boxplot( value ~ group, dataset, width = c(1, 2))
效果图如下:
从图中可以看出,第⼆个箱⼦的宽度是第⼀个箱⼦的两倍
2) varwidth : 逻辑值,控制箱体的宽度, 只有图中有多个箱体时才发挥作⽤,默认为FALSE, 所有箱体的宽度相同,当其值为TRUE时,代表每个箱体的样本量作为其相对宽度代码⽰例:
dataset <- data.frame(value = rep(1:100, times = 2), group = factor(rep(c(\"A\boxplot( value ~ group, dataset, varwidth = T)
效果图如下:
从图中可以看出,两个箱体的宽度不同,因为两组数据的样本量不同;3)notch : 逻辑值, 代码⽰例:
par(mfrow = c(1, 2))
boxplot(1:100, notch = T, main = \"notch = T\")boxplot(1:100, notch = F, main = \"notch = F\")
效果图如下:
4)col : 箱体的填充⾊代码⽰例:
dataset <- data.frame(value = rep(1:100, times = 2), group = factor(rep(c(\"A\boxplot( value ~ group, dataset, col = c(\"green\
效果图如下:
5) border : 箱体中线条的颜⾊,默认为⿊⾊代码⽰例:
dataset <- data.frame(value = rep(1:100, times = 2), group = factor(rep(c(\"A\boxplot( value ~ group, dataset, border = c(\"red\
效果图如下:
6)names: 每个箱体下⾯的标签代码⽰例:
dataset <- data.frame(value = rep(1:100, times = 2), group = factor(rep(c(\"A\boxplot( value ~ group, dataset, names = c(\"red\
效果图如下:
下⾯我们讨论下,箱线图中箱体的位置是如何决定的?
默认情况下每个箱体的中⼼点和箱体的位置是⼀定的,⽐如第⼆个箱体对应的中⼼点的x坐标就是2默认情况下每个箱体的宽度是多少呢?
当图中只有⼀个箱体时,看下⾯代码的运⾏结果:
boxplot(1:100)
abline(v = 0.8, lty = 2)abline(v = 1.2, lty = 2)axis(side = 1)
结果如下:
从图中可以看出,因为只有⼀个箱体,所以中⼼点为1, 两边的宽度各位0.2, 所以左边的x轴坐标是0.8, 右边的x轴坐标为1.2当图中有多个箱体时,看下⾯代码的运⾏结果:
dataset <- data.frame(value = rep(1:100, times = 2), group = factor(rep(c(\"A\boxplot( value ~ group, dataset)abline(v = 0.6, lty = 2)abline(v = 1.4, lty = 2)abline(v = 1.6, lty = 2)abline(v = 2.4, lty = 2)
结果如下:
从图中我们可以发现,每个箱体的宽度为0.8
因篇幅问题不能全部显示,请点此查看更多更全内容