今天我们要介绍的是决策树,所谓的决策树简单来说就是将一项东西去做分类,比如说下雨的机率,而会下雨可能是因为大气中的湿度大气压力,那将资料丢进去分析会不会下雨时就会将其分类,湿度大於多少会下雨小於多少不会下雨,大气压力多少会下雨多少不会下雨。
我们将用iris的资料集去做简单的分析。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree
首先我们先将需要用到的套件载入。
pip3 install 套件名称
如果有缺少的套件则可以在终端机上下载缺少的套件。
data = datasets.load_iris()
x = pd.DataFrame(data['data'],columns = data["feature_names"])
print(x)
y = pd.DataFrame(data["target"],columns = ["tar"])
print(y)
data_iris = pd.concat([x,y], axis = 1)
print(data_iris)
data_iris = data_iris[["sepal length (cm)","petal length (cm)","tar"]]
print(data_iris)
data_iris = data_iris[data_iris['tar'].isin([0,1])]
print(data_iris)
接下来我们将iris资料集载入,并将资料合并。
X_train, X_test, Y_train, Y_test = train_test_split(data_iris[["sepal length (cm)","petal length (cm)"]],data_iris["tar"], random_state=0)
接下来我们将资料分成测试与训练集。
tre = DecisionTreeClassifier(max_depth = 2, random_state = 0 )
tre.fit(X_train , Y_train)
接下来我们训练决策树的模型。
tree.plot_tree(tre)
接下来我们将决策树视觉化。
以上就是简易的决策树做法,明天我们将介绍随机森林。
<<: <Day18>什麽是K棒?如何用API取得历史K棒资料?
>>: Day18 - Interpreting Machines - 1 :什麽是 Interpret ?
tags: 铁人赛 蚵仔面线 萝卜丝饼 开发环境 env virtualenv 美食与废言 前阵子常...
前言: 这一两天我一直很想把.h5档案或是.pb档案 直接转成Xcode可用的.mlmodel档案 ...
一、前言 认真使用 Obsidian 也已经 1 年了,这一路上学习到相当多的内容,才慢慢打造出今天...
处理申购 VC 的资料,是由 StockSubscriptionModel 处理的。 在前面,我们在...
一讲到Flyweight,它最主要工作就是要减少记忆体的使用量,至於要怎麽做来能达到这样的效果呢...