[Day-25] R语言 - 分群应用(五) 分群预测 - 资料清洗 ( data cleaning in R.Studio )

您的订阅是我制作影片的动力
订阅点这里~/images/emoticon/emoticon39.gif

影片程序码(延续昨天)

#步骤一: na补值&相异点or离群值侦测
library(naniar)#前置1: chk NA
library(clustMixType)
any_na(data) 
data_num <- data[,c(6,13:24)]
data_num <- as.data.frame(scale(data_num)) #前置2: standard norm 标准化
data_cla <- data[,c(2:5,7:12)]
data_cla <- lapply(data_cla, factor)
data_use <- cbind(data_num,data_cla)
kp <- kproto(data_use, 10)
kp_out <- as.data.frame(kp$cluster) #大好
final <- cbind(data,kp_out)

out <- final %>% 
  group_by(`kp$cluster`) %>% 
  summarise(笔数=n())

done <- final %>% 
  subset(`kp$cluster`!=10&`kp$cluster`!=6) 

若内容有误,还请留言指正,谢谢您的指教/images/emoticon/emoticon07.gif


<<:  从 JavaScript 角度学 Python(24) - 继承

>>:  DAY10-EXCEL统计分析:信赖区间

mac, windows 安装 scrapy 失败解法摘要

今天安装 scrapy 时,在两个系统下都出现长篇红字错误,在此做个解决纪录。两个系统者皆在终端跟 ...

EP 28 - [Ruby on Rails] 付款非同步通知

Youtube 频道:https://www.youtube.com/c/kaochenlong ...

DAY23:Service背景服务之实作

这次的实作主要就是凸显Service的功能,画面设计上会相对简单许多,这次是利用Service来启动...

Day06:绝对要有的Git观念与习惯

一、前言   先前有提到,我在转职後、进到现职公司前,其实还有录取过另外一份PHP後端工程师之职缺,...

[第二十七只羊] 迷雾森林舞会XVI 整理客厅,首页列表介面

天亮了 昨晚是平安夜 关於迷雾森林故事 悍跳 兔兔就这样使出吃奶的力气让大家停下舞步 兔兔暴怒地大喊...