首页 > 决策树算法与随机森林 阅读数:2

决策树方法实战:红酒分类

本节中我们将把决策树应用到红酒分类中。

1) 导入相关模块

这里使用了datasets中的wine数据集。
In [1]: from sklearn import datasets
   ...: from sklearn.model_selection import train_test_split
   ...: from sklearn import tree

2) 导入相关数据

In [2]: wine = datasets.load_wine()

3) 分割为训练集和测试集

这里仍然选用 20% 的数据作为测试集。
In [3]: X_train, X_test, y_train, y_test = train_test_split(wine.data, wine.target, test_size=0.2)

4) 创建决策树分类器

In [4]: dt = tree.DecisionTreeClassifier()

5) 训练模型

In [5]: dt = dt.fit(X_train, y_train)

6) 模型评分

In [6]: dt.score(X_test,y_test)
Out[6]: 0.8888888888888888 

优秀文章