Day7 最近邻居法(K-Nearest Neighbors)

最近邻居法是什麽?

简称KNN,讲人话就是在现有历史资料的基础上,对於想预测的新资料,直接比对特徵最接近的K笔历史资料,看他们分别属於哪种分类,再以投票的方式决定新资料的所属分类。

浅谈最近邻居法

最近邻居法是监督式学习中的分类演算法,能用一句话代表大概就是物以类聚了吧!举个例子来说,假设你的邻居朋友里面,十个有八个都是单身狗,那你也很有可能也是单身狗,差不多是这个概念,再来说明此演算法的步骤:

(一)计算距离
(二)进行投票
(三)决定类别

计算距离的方式有三种:
(一)欧基里德距离 (Euclidean distance)
https://chart.googleapis.com/chart?cht=tx&chl=D%3D%20%5Csqrt%7B(x_1-y_1)%5E2%2B(x_2-y_2)%5E2%2B......%2B(x_n-y_n)%5E2%7D
(二)曼哈顿距离 (Manhattan distance)
https://chart.googleapis.com/chart?cht=tx&chl=D%3D%7Cx_1-y_1%7C%2B%7Cx_2-y_2%7C%2B......%2B%7Cx_n-y_n%7C
(三)明氏距离 (Minkowski distance)
https://chart.googleapis.com/chart?cht=tx&chl=D%3D(%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%7Cx_i-y_i%7C%5Ep)%5E%7B%5Cfrac%7B1%7D%7Bp%7D%7D
KNN的优点:

1.易理解
2.用途广

KNN的缺点:

1.计算量大
2.样本数不平均时,易产生误差

<<:  Ruby on Rails Route 起步走

>>:  【把玩Azure DevOps】Day1 前言

DAY17-EXCEL统计分析:T检定介绍

T检定: 什麽时候会用到T检定呢? 当我们不知道母体变异数为多少时就是用T检定 T检定的公式为: (...

props

昨天介绍了component,也知道要使用component要先注册才能使用,而今天我们要介绍的是p...

Progressive Web App Notifications API (21)

什麽是 Web Notifications API? 透过 Web Notifications AP...

[Day12] 策略最佳化模组改造(2)

现在要来处理上一篇文章的红框部分,输入N个np.arange让他跑for loop。今天在网路上看了...

Day35 ( 电子元件 ) LED 显示温湿度 ( DHT11 )

LED 显示温湿度 ( DHT11 ) 教学原文参考:LED 显示温湿度 ( DHT11 ) 这篇文...