Day6：最邻近点规则(k-Nearest Neighbor，KNN

　　最邻近点规则(以下简称为KNN，因为每个人对此的中文称呼不一样)是在一个地方上有很多个点，将所有点都分类好，而产生不同的区域。若之後有新的点加入，则计算该未知点至其他的所有已知点的距离，得知该点较为偏向哪种区域。
　　举例来说，有一个二维座标，上面6个样本，每个样本分布在不同的游戏种类，目前就两个种类分别是动作类以及爱情类，x轴象徵格斗，y轴象徵交往，分数越高表示其在游戏中比例越重。其比重以及分布如下。

　　如今有个样本G加入，其格斗15，交往4，计算它与A、B、C、D、E、F之间的距离分别为：3、4、5、14、13、12，若取前四个接近的样本，则有三个为动作类，一个是爱情累，因此判断G距离动作类较为接近，把 G归类在动作类游戏。
　　这方法用在归类上很方便，但是如果其中一个种类的样本数很多，可能在一定距离以内，该种类样本数较多，因此就被归类在较多的样本数中了，但并非有最接近的样本，示意图如下：中间正方形是未知的样本，可以看到红圈是距离下AB有的样本数，显然A有更接近正方形，可是其样本数反而B比较多，因此未知的样本就会被归类在B区。

　　用这方法可以很轻松的机器学习，但如果当样本数多、区域多的时候，可能分类的效果就没那麽好了。