以下是一个简单的使用决策树分类器的 Python 代码示例:
from sklearn import tree # 创建决策树分类器 clf = tree.DecisionTreeClassifier() # 训练数据集 X = [[0, 0], [1, 1]] y = [0, 1] clf.fit(X, y) # 预测新数据 print(clf.predict([[2., 2.]]))
在这个例子中,我们首先使用 sklearn
中的 tree
模块创建了一个决策树分类器,并将其存储在变量 clf
中。接着,我们使用 fit()
方法训练了分类器,其中 X
是一个二维数组,存储了训练数据的特征,y
是一个一维数组,存储了训练数据的分类标签。
最后,我们使用 predict()
方法对一个新数据进行分类,并输出分类结果。在这个例子中,新数据是 [2., 2.]
,我们希望将其分类为 1
。输出结果是 [1]
,与我们的预期相符。
需要注意的是,决策树分类器也可以处理多类别分类问题,可以在创建分类器时指定 criterion='entropy'
或 criterion='gini'
参数,以根据信息增益或基尼系数选择最佳分裂点。此外,决策树分类器还支持对特征进行加权,以提高某些特征的重要性。
评论