Day 27 Spark local mode

Spark local mode

Environment

Ubuntu

  • HP Z230
  • 数量: 1
  • Ubuntu: 16.04 / 18.04
  • CPU: E3-1230_V3 ^ 1
  • RAM: 16GB
  • Disk: 250 GB (HDD)
  • Network: 1Gbps

Download Spark package

wget http://apache.stu.edu.tw/spark/spark-2.4.7/spark-2.4.7-bin-hadoop2.7.tgz
tar -xvf spark-2.4.7-bin-hadoop2.7.tgz
mv spark-2.4.7-bin-hadoop2.7 spark

ref:http://spark.apache.org/downloads.html

Set Spark Path

vim ~/.bashrc

export SPARK_HOME=/home/ubuntu/spark
export PATH=$PATH:$SPARK_HOME/bin

source ~/.bashrc

Install Java

sudo apt install openjdk-8-jdk openjdk-8-jre
java -version

Set Java Path

vim ~/.bashrc

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
export JRE_HOME=/usr/lib/jvm/java-8-openjdk-amd64/jre

source ~/.bashrc

Install Pyspark

sudo apt-get install python3
sudo apt-get install python3-pip

pip3 install pyspark

Set Python Path

vim ~/.bashrc

export PYTHONPATH=$SPARK_HOME/python:$SPARK_HOME/python/lib/py4j-0.10.7-src.zip:$PYTHONPATH
export PYSPARK_PYTHON=python3

source ~/.bashrc

<<:  Day 29 - 台湾5G发展元年的科普书阅读笔记

>>:  [Day 28] Laravel+MongoDB+Vue CRUD - part 1

[Day24]DDL语句建立资料表

资料表的命名规则: 名称开头一定要是文字,第二个字以後才可以使用文字、数字或其他符号。 长度在1~3...

Day 0 [PV]: 原生 vs 跨平台框架

哇哇哇,挑战第一天我就没准备好,只能很赶的生出一篇文章。 不负责任预告一下:我中文不是很好所以要是文...

D23 - 「不断线的侏罗纪」:有一只小恐龙在跑步

来建立我们的主角小恐龙吧。 建立组件 建立小恐龙组件 dino.vue src\components...

Day1 30天计画总览

今日要点 起源 介绍 起源 购入了奔跑吧linux套书,为了强迫自己每天推进一点进度,决定参与铁人赛...

Python海关三旬汇率 - Python练习题三

公司需要使用到海关的三旬汇率 海关提供目前汇率与历史三旬汇率 目前汇率(TXT):https://p...