DAY17聚类演算法

昨天介绍完支持向量机,今天就要来介绍甚麽是分类和聚类:
通过将资料通过分类的方法分成不同的组别或者更多的集别,使在同一个子集或组别中的物件都有相似的一些属性,而组别外的资料差异性会很大-->
分类(class):通常会用拥有一组x和目标(类别)y-->然後透过某个模型去进行学习-->然後就可以把test_X样本带模型里,而求出test_y
聚类(cluster): 通常会用拥有一组x但不知道y-->所以就要利用相似性或是资料之间距离来决定谁为同一组通常组内的相似性越大,组间差别越大,聚类就越好-->简单来说就是帮一组资料找寻y
而今天主要会聚焦在聚类方法上主要会实作两个方法,一个是
1.(K-means)K-means clustering
2. (DBSCAN)Density-based spatial clustering of applications with noise
而今天主要先介绍K-means方法
首先是它在维基百科上说明:
https://ithelp.ithome.com.tw/upload/images/20211001/20141654KZbLtAI4rL.png

(来源:维基百科)
意思也就是说要找到一个中心点,使得那一类到中心点距离最小-->
而k-means在使用会需要先告知你想要分成几群(因为这个方法是需要决定有几点中心点)
以下是它的演算法:
1.首先,先从一笔资料内随机取d个中心点
2.再把资料去对d个中心点去做最短距离配饰-->谁距离短,它就属於哪类(一样则随机分在同样的类之其中一组)
3.把分好类的资料个别找出新的d个中心点
4.接下来重复2,3直到分类过资料都不再变动为止
(这样子,就可以求得y为何)-->至於距离一般来说会使用欧式距离
EX:
https://ithelp.ithome.com.tw/upload/images/20211001/20141654XrWmqL6SC0.png

所以明天实际做的时候,会使用欧是距离作示范
好,今天讲解完关於kmeans演算法,明天就要开始实际操作程序

小木屋旁,狐狸用他的爪子,摀住他受伤的身体,鲜血从伤口不断地涌出,男子看着狐狸,同时伸出舌头舔着刀子上的鲜血,原本男子想往狐狸的喉咙刺下去,但所幸狐狸反应快,他一个跳跃躲过了致命的一击,但男子还是刺到了他的身体,狐狸觉得再这样下去不行,至少它要拉着男子同归於尽,於是狐狸冲向男子,男子一个侧身闪过了冲击,被抓准时机往狐狸刺了下去,男子笑了笑,但他突然发现自己不能动,原来狐狸在被刺瞬间,同时用尾巴将它缠住,狐狸拖着男子往小木屋冲了过去

		--|一起燃烧吧,这是最後的最後,余烬|--  MS.CM

<<:  第二十六天:在 TeamCity 上显示 API 文件

>>:  Day 17 - [语料库模型] 05-实体对应

[Golang]恢复panic(recover、defer)-心智图总结

1. 如何让panic,包含一个值 在呼叫panic函数时,把某个值做为参数传给该函数就可以了。pa...

Day 23 云上大数据分析

随着时代变化,「Data」彷佛变成兵家必争之地,从零售、传产、工业、科技等等产业来看,会发现几乎每...

英文能力重要吗?

过去有份工作,在刚进入公司时,在公司内部用不到英文,但是随着组织异动,与外国客户以及跨国团队沟通。而...

Rust-结构体(Struct)

struct 是命名并封装数个栏位数值所组合的自订型别 struct 有 3 种类型 元组结构体(t...

Day.2 「欢迎来到网页这个世界!」 —— 认识网页架构

网页世界是由什麽组成? 上一篇有讲到网页三兄弟,其中有一个老大哥负责撑起这个世界,那就是 HTML...