认识强大的Python套件:Pandas(下)

今天我们接着继续和DataFrame继续奋斗!先把套件和档案载入:

import pandas as pd
df = pd.read_csv('档案名')

条件选择

  • 单一条件筛选,搭配运算子
df['colum'] #筛选栏位名称
df.loc[[index],[colum]] #筛选栏位名称及行数
df[df['colum'] == "value"]] #筛选某个栏位的特定值
df[df['colum'] > "value"]]
  • 多条件筛选,运用& (And)与| (Or)
A = df['colum1'] == "value1"] #筛选某个栏位的特定值
B = df['colum2'] > "value2"]
df[A & B] #筛选同时满足A与B条件
  • 去除重复值
A = df.drop_duplicateds(subset=['colum'], keep='first') #保留某栏位的第一个值(预设)

资料整理

新增资料:

  • insert():在指定的栏位位置新增资料
  • append():将资料一笔一笔传入(以字典的形式)
  • concat():合并两组资料

筛除资料:

  • drop():axis=1筛除栏,axis=0删除列

资料排序:

  • sort_index():依照索引进行排序
  • sort_values():依照栏位内容进行排序

资料群组

在Pandas一样有Excel枢纽分析表的功能,我们可以将资料进行分组运算:

df.groupby('colum').sum()

多栏位运算:

df.groupby(['colum1','coium2').sum()

以上是Pandas的简单介绍,还有好多功能等着我们去发掘,下面提供更多阅读资料,如果有兴趣的朋友可以在更加深入研究看看!


更多延伸资料:

https://pandas.pydata.org/docs/user_guide/index.html

https://leemeng.tw/practical-pandas-tutorial-for-aspiring-data-scientists.html

Pandas也可以视觉化

https://allaboutdataanalysis.medium.com/资料视觉化-一篇文章详细解读pandas视觉化图表-9bb663bae0cd

参考资料:

http://notebookpage1005.blogspot.com/2018/12/python-pandas.html


<<:  Day30 WebRTC 一对多连线

>>:  成为工具人应有的工具包-29 TurnedOnTimesView

AutoCAD ActiveX #5-2 Selection Filters (-4)

filtertype -4 Grouping code filterdata remarks &q...

Day 15:如何解决 PowerShell 无法使用 Angular 指令的问题?

学习 Angular 的过程中,遇到了一些教学资源不见得会遇到的问题,还真是家常便饭,而且你个人电脑...

Day 34 (MySQL)

1.除错 MySQL02影片00:01 2.MAD利用命令列进入MySQL $ % = 终端机 (1...

用 Python 畅玩 Line bot - 26:爬虫(一)

这次要尝试的是将爬虫与 line bot做结合,那你可以使用 line bot 就能够查询到本周上映...

Day16 - Shioaji X Backtesting - 参数最佳化

上一篇介绍如何在Backtesting写策略,这篇会和大家介绍如何做参数的最佳化。 什麽是参数最佳化...