[DAY 28] 章节3-8: 前往农场前夕- k-means(k平均分类演算法) (2/2)

3-8 前往农场前夕

「设定的方法有很多种,如果是已经知道群数的话,就可以设定k为该群数,让k-means自己找出各群的中心点。如果不确定确切群数的话,可以用The Elbow Method,这个方法的看法有点像之前说的PCA,与PCA不同的是,x轴的数量指的分群的群数,而PCA指的是所要选用前几个eigenvector的数量。看法一样是观察 转折点 ,也就是看在某个点之後的y值变得比较平缓後,该点x就是建议k-means群数的k值。这边的y轴指的是 在限定k群下每个点到最近的中心点的SSE(Sum of Square Error,也就是距离的平和) ,所以说当y的变化趋近不明显时,表示再增加一个新的中心点时,不会有甚麽太大的效益。」飞哥仔细的说明着应用方式。
https://ithelp.ithome.com.tw/upload/images/20201013/20130640RrtjanEEuJ.png
(参考下方网址资料,图片好大不会改大小......)

「喔喔喔!原来是这样啊,没想到虽然跟PCA的图很像,但是却有不同的解释意涵。」小博点头道。

「对啊,还有其他方法可以检定说k-means的k值用多少比较适合,对每个k值都能给出一个p-value。不过这部分的想法跟上面的方法比就是多了检定的步骤,能给出统计上较客观的说法。」飞哥拿着鸡群的分布图说明着。

「理解完的话就准备收拾行李吧!明天一大早还要坐车去南投呢!」飞哥催促着小博。

「好咧!我这就去收。」小博迅速的应答着。

小博一溜烟的跑进休息室,整理着资料跟行李,准备迎接明天的南投乌骨鸡农场。


後记:铁人赛接近尾声,飞哥即将迎来最後一次的旅程,这次的乌骨鸡农场会有甚麽发展,且看明日的文章!

资料参考:
https://medium.com/analytics-vidhya/how-to-determine-the-optimal-k-for-k-means-708505d204eb


<<:  Day 29 QuickSight 连接 Redshift - Part 2

>>:  见习村28 - Find the missing letter

Day19-部署篇(一)Amazon EC2

大家好~ 接下来要把我们的 Echo bot 部署上 Amazon EC2 啦~ Amazon EC...

软件工程师(ASP.NET)面试心得分享

这是我自己面谈後的反省心得,有些要注意的地方真的是讲到烂了,网路上应该也很多面谈教学,但还是想整理...

[Lesson13] OkHttp

添加 OkHttp 依赖库 要使用 OkHttp,必须在 gradle (Module) 层级的 d...

触价单

触价单的设定是,先决定「触发价」,这是交易人要动作(停损)的价格,再设定「取价」,这是指当市场价格触...

Day 03:观察资料夹

建好专案之後,来看看专案里已经帮你准备好哪些档案吧!先大致认识每个资料夹如何分门别类的规则,日後自己...