今天要接续DataFrame的介绍
这篇文章会分成两个部分:
会利用kaggle上的开源资料进行更多的pandas练习
Kaggle: Your Machine Learning and Data Science Community
kaggle是资料科学世界常用的开源网站
上面提供大量且即时的资料档案可以方便学习者练习
也有教学的课程可以针对自己有兴趣的方面学习
还会举办资料科学的相关竞赛
更提供各种的讨论空间让大家可以在上面交流想法跟解决疑惑
如果想做project
上面也会有很多很好的idea可以参考
总而言之就是对想学资料科学的人来说
非常万能的平台
看的课程还是Coursera上的 Introduction to Data Science in Python
Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera
练习是利用上述课程里教的搭配以前在学校学过的知识
整里并且搭配实际的资料档
整理出来的笔记
这里练习的dataframe是沿用上篇文章里使用到的顾客资料
先来看看dataframe原本的样子
df
.drop()
当我们想要删除特定row里的值,可以使用.drop()
,这种用法是回传删掉特定row的新DataFrame
要注意的是并不会更动原始的资料表
假如现在不想要顾客2的资料
df.drop("customer2")
https://i.imgur.com/UeJP6BP.png
可以看到删掉顾客二後剩下的资料
现在来检查原本的资料表有没有任何变化
df
原始的资料并不会因为drop.( )
而改变,
但是当想要更改到资料表内的原始值
通常会在drop内加上参数,
inplace=True代表要替换到原始值,
而axis则是要更动的维度,0是row,1是column
先复制Dataframe,利用copy.( )
copy_df = df.copy()
#再来加上参数
copy_df.drop("City",inplace=True,axis=1)
copy_df
可以看到成功删除"City"的column
del
第二种可以直接透过indexing operator删除的方式,利用del
del copy_df["Age"]
copy_df
这个方法会直接更改到原始的资料
[ ]
[ ]
里可以放指定的list,或是统一的值
假如现在想要放每个顾客购买的品项
先建立一个资料值全为null的column
df["Items"] = None
df
现在利用list指定每个顾客买的商品品项
df["Items"] = ["computer","headphone","water bottle"]
df
可以看到成功加上每个顾客购买的品项
今天练习的部分处理到资料的新增或删除
要很小心的是
在pandas里有些资料的语法虽然用途一样
但有的可能会更动到原始dataframe,有的不会
像是有的会直接复制一个新的dataframe进行指定操作再回传
有的则是会更新到原始资料
所以根据想要操作的方式
需要搭配不同的语法
在练习的时候也要格外小心该语法是否会更动到资料的原始数值
记得使用这个参数:inplace=True
>>: [Day 30] 模仿 Node 的非同步实验兼完赛心得
一、前言 上一篇文章提到了网页如何检测无障碍规范,但很多事情防范胜於未然,可以注意一下基本无障碍...
Dart是什麽? Dart 是一个静态强型别的语言,同时支援物件导向程序设计(OOP)及函数式程序设...
这几个月使用下来 除了要维护正常的Aras群组、角色、部门、部门主管 渐渐地还有要整合BPM的签核权...
「给你一个凭证,证明你是一个工具人。」 今天是一个户外教学。 我们要来去网站上实际把证书抓出来看看。...
回圈 loop 昨天小光更进一步的认识了逻辑判断式,也开始自己开发了一个心情显示器,不过如果要表现1...