【Day03-表格】为什麽熊猫(pandas)是用来处理表格的工具？

前两天我们稍微说明了一下对於看待资料的一些基本观念
那今天就来开始实际对资料做一些操作吧

环境需求：

python程序环境

程度需求：

对python有基本认知

有使用过Excel或其他试算表软件

这边我们将会使用pandas套件来进行处理
而这里的pandas其实是panel data的缩写的意思
基本上可以想像成是python界中的Excel(但可以做到的事情更多)

实际操作

读取资料

import pandas as pd # 使用pandas套件来处理表格

df = pd.read_excel("sample.xlsx") # 读取档案到资料框(DataFrame)里面
df

选择资料

场景：
小美表示今天早上她量的体重明明只有49.9，为什麽可以写50.1呢
那我们要怎麽修改呢？

如果是在Excel上的话，当然就是滑鼠移过修改就好了

那在python里面要怎麽选择呢？

使用`df.iloc`数位置

就像是国中时候教过的二维座标的表示方式，即(第几row，第几col)
以这边场景的例子，我们需要找到(1,3)的资料，因此这样即可找到我们要的资料

df.iloc[1,3] # 使用位置来选择
# 50.1

补充说明：
台湾和中国对於行和列的定义是相反的
因此如果在Google到相关的资料的时候记得自己转换一下

row：台湾为列，中国为行

col：台湾为行，中国为列

造成这样差异的原因是最早的中文书写方式都是直式
而书写的方向自然就定义为行
但後来文字受到西方文化的影响逐渐改为横式为主流
此时中国的做法是另新的文字方向为行
而台湾的做法则是沿用原本的方向当作行，但更改文字方向
因此就造成了两边用法的差异
笔者自己是为了避免混淆，都尽量用column, row来描述

使用`df.loc`给名称

就像是Excel里面可以用D3来选择这一格
我们也可以用名称的方式来选择，即(哪个row，哪个col)

df.loc[1,"体重"] # 使用名称来选择
# 50.1

修改资料

那有了上面的找到对应的位置之後，要修改就不是什麽问题了

# 方法1
df.iloc[1,3] = 49.9

# 方法2
df.loc[1,"体重"] = 49.9

# 检查一下
df

计算资料

sum(df["身高"])/len(df) # 平均身高
sum(df["体重"])/len(df) # 平均体重

产生新的column

这边我们想要计算一下大家的BMI，根据BMI = 身高 / 体重^2

df["BMI"] = df["体重"] / (df["身高"]/100)**2 # 计算BMI
df["BMI"]

参考资料

Why is the pandas Python library named pandas? - Quora

今天很基本的讲解了一下要如何用pandas在表格中选取资料
虽然很基本但却是很容易搞混iloc和loc两个用法的地方
因此使用的时候要稍微注意一下哦> <

<<: [Day 13] 非同步的操作资料库？谈 suspendedTransactionAsync

>>: D3 - pycharm基本使用

[Day01] 序章- 参赛主题说明及未来挑战技术探讨

杂谈

[Android Studio 30天自我挑战] RecyclerView元件介绍

杂谈

[Day22]-用python处理影像档案

杂谈

[从0到1] C#小乳牛练成基础程序逻辑 Day 3 - Hello World

杂谈

【Day-30】我们是怎麽开始的？：一间传统软件公司从 0 开始建置的 DevOps 文化（总结篇）

杂谈

【Day 06】致不灭的 DLL - DLL Injection

环境与工具 Windows 10 21H1 Process Explorer v16.32 Visu...

【Day 17】for 回圈的范例讲解

今天，我们先来看看阶乘要怎麽写～我的程序码长这样： #include<stdio.h>...

30天轻松学会unity自制游戏-添加音效

现在再加上一点音效做装饰，先给一个背景音乐，直接在Hierarchy按右键开启Audio->A...

Day 1 Java基本功（数）

第一篇我要来介绍程序设计一些基本的知识，首先跟大家报备，我使用的平台是JAVA开发者常使用的ecpl...

D-8. Rails 用Postman测试自己的WEB API && Valid Parentheses

请先安装Postman 今天完成整个CRUD，简单介绍操作Postman。接续昨天文章 9.修改r...

实际操作

读取资料

选择资料

使用df.iloc数位置

使用df.loc给名称

修改资料

计算资料

产生新的column

参考资料

使用`df.iloc`数位置

使用`df.loc`给名称