[第30天]30天搞懂Python-spark

前言

使用pyspark函式库实作 word count程序。

程序实作

安装 pyspark函式库

pip install pyspark

https://ithelp.ithome.com.tw/upload/images/20201015/20107143itKUOZXokV.jpg

import sys
 
from pyspark import SparkContext, SparkConf
 
if __name__ == "__main__":	
	# 建立 Spark context
	sc = SparkContext("local","PySpark Word Count")	
	# 自 imput.txt 读出
	words = sc.textFile("/Users/allen/Dropbox/Code_Section/CodeWS/30/input.txt").flatMap(lambda line: line.split(" "))
	# 计算每个字的次数
	wordCounts = words.map(lambda word: (word, 1)).reduceByKey(lambda a,b:a +b)
	# 将计数输出
	wordCounts.saveAsTextFile("/Users/allen/Dropbox/Code_Section/CodeWS/30/output/")

程序执行成果

https://ithelp.ithome.com.tw/upload/images/20201015/20107143V6jWRvnINE.jpg


<<:  拯救资工系学生的基本素养—程序除错的心得&方法

>>:  DAY30 - 切版的下一步

【JavaScript】 日期转换为 年/月/日 字串

JavaScript 有许多处理日期的方法,toLocaleDateString() 可以将日期的标...

Day 3 彩色照片转黑白

彩色照片转黑白 教学原文参考:彩色照片转黑白 这篇文章会介绍使用 GIMP 的颜色调整功能,将一张彩...

DAY29-ASP.NET网页切换导向及状态管理-趴水

ASP.NET网页切换导向及状态管理-趴水 今天来做做看 在网页输入资料後 按下按钮 可以将资料导向...

初学者跪着学JavaScript Day2

JavaScript 由 Netscape 公司发明,此公司曾经是浏览器王者後来输给了Interne...

[11] 建立进入页面和流程控制

这边你需要自己制作一个流程控制 不了解的话建可以画个图来确认现在在哪个流程 基本上都会回到主要操控介...