Day15-seaborn(3)盒须图boxplot、热力图heatmap

盒胡图
可用来观察资料的分布情形
最大值、最小值、中位数、四分位数
一样使用Titanic资料集做示范

使用seaborn的boxplot绘制长条图
长方形最上面那条线为第三四分位数,资料从小到大的第75%资料
长方形中间那条线为第二四分位数,资料从小到大的第50%资料,也就是中位数
长方形最下面那条线为第一四分位数,料从小到大的第25%资料
最上面以及最下面分别为最大值、最小值,其他点则为离群值
https://ithelp.ithome.com.tw/upload/images/20210829/20140416LxrzhUa45U.png

热力图
可用来观察数值间的系数关系
通常会配合pandas的corr方法使用
corr会算出各值之间的系数关系,会自动过滤掉遗失值或不是数字型态的值
会介於-1~1之间,越靠近1就表示愈成正比,越靠近-1就表示愈成反比,越靠近0表示愈没有关系
https://ithelp.ithome.com.tw/upload/images/20210829/20140416DwfqeUf7N3.png

使用seaborn的heatmap绘制热力图
https://ithelp.ithome.com.tw/upload/images/20210829/201404165zmuA5HdRm.png

可将参数annot设位Ture,可直接观察数字
https://ithelp.ithome.com.tw/upload/images/20210829/20140416rkseR6Fi9x.png

使用seaborn的pairplot可直接观察各数值之间的关系

sns.pairplot(data_set,hue='Survived')

我将Survived放入hue做分类来观察
https://ithelp.ithome.com.tw/upload/images/20210829/20140416nnomnJNFpi.png

送上colab连结,可自行在上面多做点练习更加熟悉seaborn
https://colab.research.google.com/drive/1cEqnvujTRBvO7AvljWl021mgs7zL8yMv?usp=sharing
Titanic资料下载
https://www.kaggle.com/c/titanic/overview


<<:  Day2 NiFi 架构与 Component 简介

>>:  Day 2 重新设计 - 检视与分析页面问题

成员 19 人:

撰写中 在求发展的道路上,又过了一日...... 这时,成员 19 人。 ...

[Lesson9] Firebase

首先到下列的网站 https://console.firebase.google.com/?hl=z...

Angular建立专案(三)(Day18)

还记得我们昨天说到的主程序区块吗 ? 让我们把app资料夹打开来,可以看到里面的内容物长这样。 接着...

铁人赛 Day1 -- HTML基本架构

哎呀,自学了两个月後刚好碰到2021的铁人赛开打,顺便来分享一下我的学习过程好了,有错的在劳烦各位大...

【Day 7】机器学习基本功(五)

误差(Error)来自什麽地方? 来自於偏差(Bias) 来自於方差(Variance) 假设我们需...