R语言做多变量可视化分析?

By 陆勤 at 2019-04-03 • 0人收藏 • 123人看过

多变量可视化分析是一种利用可视化手段探索多个变量之间关系或者模式的一种分析方法。


一 基于不同类型的连续变量的盒箱图


代码:

# R包
library(caret)
# 数据集
data(iris)
x <- iris[,1:4]
y <- iris[,5]

# 不同类型下特征集的可视化
featurePlot(x=x,y=y, plot = "box")

结果:

1.png


二  连续变量集的相关图

连续变量集相关系数矩阵的可视化

代码:

# R包
library(corrplot)
# 加载数据集
data(iris)
# 计算相关系数
correlations <- cor(iris[,1:4])
# 创建相关图
corrplot(corr = correlations, method = "number")

结果:

2.png

提示:相关图的更多表示,请阅读corrplot()函数的帮助文档 ,help(corrplot)。


三 不同类型下的连续变量的核密度曲线图


代码:

# R包
library(caret)
# 加载数据集
data(iris)
# 不同类别下的变量核密度图
x <- iris[,1:4]
y <- iris[,5]

scales <- list(x=list(relation="free"), y=list(relation="free"))
featurePlot(x=x, y=y, plot = "density", scales=scales)

结果:

3.png

四 多变量集的矩阵散点图

代码:

# 数据集
data(iris)
# 成对的散点图
pairs(iris)

结果:

4.png


五 考虑类别的多变量集矩阵散点图

代码:

data(iris)
pairs(Species ~., data = iris, col = iris$Species)

结果:

5.png

登录后方可回帖

信息栏
数据人网是数据人学习、交流和分享的平台,专注于从数据中学习,努力发觉数据之洞见,积极利用数据之价值
Loading...