xgboost模型实现代码片段

By 陆勤 at 2019-05-09 • 0人收藏 • 67人看过

利用xgboost库和scikit-learn库完成xgboost模型构建和评估。

# 导入所需库
from numpy import loadtxt
from xgboost import XGBClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix
import warnings
warnings.filterwarnings('ignore')

# 加载数据集
dataset = loadtxt('pima-indians-diabetes.csv', delimiter=",")
# 数据集分成特征集矩阵X和目标变量Y
X = dataset[:,0:8]
Y = dataset[:,8]
# 数据集划分训练集和测试集
seed = 7
test_size = 0.33
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=test_size, random_state=seed)
# 拟合xgboost模型
model = XGBClassifier()
model.fit(X_train, y_train)
# 在测试集上面做预测
y_pred = model.predict(X_test)
predictions = [round(value) for value in y_pred]
# 模型预测结果评价
accuracy = accuracy_score(y_test, predictions)
print("Accuracy: %.2f%%" % (accuracy * 100.0))
# 测试集模型的混淆矩阵
print(confusion_matrix(y_test, predictions))

结果

image.png


登录后方可回帖

信息栏
数据人网是数据人学习、交流和分享的平台,专注于从数据中学习,努力发觉数据之洞见,积极利用数据之价值
Loading...