Day11 K平均演算法(K-means clustering algorithm)

什麽是K平均演算法?

讲人话就是从所有资料当中乱数选择K个中心点,把个别资料依照最近的中心点分成K群,将每群的平均值当成新K个中心点,再分成K群,最终资料会收敛成K个彼此接近的群体。

浅谈K平均演算法

"物以类聚,人以群分",K平均演算法是属於非监督学习的一种,主要用於分群,要如何知道K值的起始值(随机给予的中心点)?使用K-means++,会让起始值尽量保持较远的距离,加快收敛的速度。要如何选择K值?假如能很明确知道要分成几类,K值就很容易选择了,假如不明确的话,网路上应该有方法(我没查)。要如何选择合适的距离计算方式?只要你觉得合理几乎都可以用(好像有讲跟没讲一样)。

优点:

速度快且易解释。
资料已排除极端值,结果较不易受到影响。
资料皆为数值型。
样本规模差异不大。

<<:  鬼故事 - 我是不是来过这里

>>:  [Day17] 藉由DialogFlow Fulfillment 实践对话流设计

[Day 22]从零开始学习 JS 的连续-30 Days---阵列操作介绍 (下篇)

阵列操作介绍 (下篇) 介绍四种阵列运用: map filter find findlndex 3....

[Day14] Object and Arrays - Reference VS Copy

[Day14] Object and Arrays - Reference VS Copy 物件 阵...

利用Cloudflare API关闭Cloudflare IPv6兼容性功能

在使用一段时间Cloudflare加速后,发现网站程序并不兼容IPV6,目前厂家未作升级处理,整了好...

[Day12] TS:什麽!型别还有递回(recursion)的概念?用组合技实作 SnakeToCamelCase

这是我们今天要聊的内容,老样的,如果你已经可以轻松看懂,欢迎直接左转去看我同事 Andy 精彩的文...

[Day 3] Reactive Programming - Functional Programming

前言 并不是说Reactive 一定要搭配Functional,只是搭配起来更好用,而後面介绍到的R...