R语言做单变量可视化分析?

By 陆勤 at 2019-04-02 • 0人收藏 • 199人看过

单变量可视化分析,研究数据点或者样本集中单个连续变量或者离散变量的分布情况,通过可视化的工具来做探索性分析。


一 柱状图

代码:

# R包
library(mlbench)
library(tidyverse)

# 数据集
data("BreastCancer")

# 数据集检视
glimpse(BreastCancer)
BreastCancer %>% 
  head %>% 
  View

# 第2个变量到第9个变量的分布图
par(mfrow=c(2,4))
for(i in 2:9){
  counts <- table(BreastCancer[,i])
  name <- names(BreastCancer)[i]
  barplot(counts, main = name)
}

结果:

1.png

二 盒箱图

代码:

# 数据集
data(iris)
# 变量1到变量4的盒箱图
par(mfrow=c(1,4))
for(i in 1:4) {
  boxplot(iris[,i], main=names(iris)[i])
}

结果:

2.png

三 直方图

代码:

# 数据集
data(iris)
# 变量1到变量4的直方图
par(mfrow=c(1,4))
for(i in 1:4) {
  hist(iris[,i], main=names(iris)[i])
}

结果:

3.png

四 核密度曲线图

代码:

# R包
library(lattice)
# 数据集
data(iris)
# 变量1到变量4的核密度曲线图
par(mfrow=c(1,4))
for(i in 1:4){
  plot(density(iris[,i]), main = names(iris)[i])
}

结果:

4.png

五 变量集缺失值可视化

代码:

# R包
library(Amelia)
library(mlbench)

# 数据集
data("Soybean")
# 变量集缺失值可视化
missmap(Soybean, col = c("black", "grey"), legend = FALSE)

结论:

5.png

登录后方可回帖

信息栏
数据人网是数据人学习、交流和分享的平台,专注于从数据中学习,努力发觉数据之洞见,积极利用数据之价值
Loading...