Day 18 决策树

今天我们要介绍的是决策树,所谓的决策树简单来说就是将一项东西去做分类,比如说下雨的机率,而会下雨可能是因为大气中的湿度大气压力,那将资料丢进去分析会不会下雨时就会将其分类,湿度大於多少会下雨小於多少不会下雨,大气压力多少会下雨多少不会下雨。

决策树

我们将用iris的资料集去做简单的分析。

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 
import seaborn as sns 
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree

首先我们先将需要用到的套件载入。

pip3 install 套件名称

如果有缺少的套件则可以在终端机上下载缺少的套件。

data = datasets.load_iris()
x = pd.DataFrame(data['data'],columns = data["feature_names"])
print(x)
y = pd.DataFrame(data["target"],columns = ["tar"])
print(y)
data_iris = pd.concat([x,y], axis = 1)
print(data_iris)
data_iris = data_iris[["sepal length (cm)","petal length (cm)","tar"]]
print(data_iris)
data_iris = data_iris[data_iris['tar'].isin([0,1])]
print(data_iris)

接下来我们将iris资料集载入,并将资料合并。

X_train, X_test, Y_train, Y_test = train_test_split(data_iris[["sepal length (cm)","petal length (cm)"]],data_iris["tar"], random_state=0)

接下来我们将资料分成测试与训练集。

tre = DecisionTreeClassifier(max_depth = 2, random_state = 0 )
tre.fit(X_train , Y_train)  

接下来我们训练决策树的模型。

tree.plot_tree(tre)

接下来我们将决策树视觉化。

以上就是简易的决策树做法,明天我们将介绍随机森林。


<<:  <Day18>什麽是K棒?如何用API取得历史K棒资料?

>>:  Day18 - Interpreting Machines - 1 :什麽是 Interpret ?

【Day 28】设置开发环境 & 开发

tags: 铁人赛 蚵仔面线 萝卜丝饼 开发环境 env virtualenv 美食与废言 前阵子常...

IOS、Python自学心得30天 Day-20 .h5 to .tflite to .mlmodel

前言: 这一两天我一直很想把.h5档案或是.pb档案 直接转成Xcode可用的.mlmodel档案 ...

Day 30: 总结篇 — 30 天的 Obsidian 学习之旅

一、前言 认真使用 Obsidian 也已经 1 年了,这一路上学习到相当多的内容,才慢慢打造出今天...

D33 - 用 Swift 和公开资讯,打造投资理财的 Apps { 台股申购功能扩充.4 }

处理申购 VC 的资料,是由 StockSubscriptionModel 处理的。 在前面,我们在...

IT铁人DAY 19-Flyweight 享元模式

  一讲到Flyweight,它最主要工作就是要减少记忆体的使用量,至於要怎麽做来能达到这样的效果呢...