Day 28 Spark on kubernetes

Spark on kubernetes

Environment

Ubuntu

  • HP Z230
  • 数量: 3
  • Ubuntu: 16.04 / 18.04
  • CPU: E3-1230_V3 ^ 1
  • RAM: 16GB
  • Disk: 250 GB (HDD)
  • Network: 1Gbps

Architecture

https://ithelp.ithome.com.tw/upload/images/20201013/20121070tuJXEX8uyo.png

Download Spark package

wget http://apache.stu.edu.tw/spark/spark-2.4.7/spark-2.4.7-bin-hadoop2.7.tgz
tar -xvf spark-2.4.7-bin-hadoop2.7.tgz
mv spark-2.4.7-bin-hadoop2.7 spark

http://spark.apache.org/downloads.html

Build Docker Images

$ cd spark-2.4.7-bin-hadoop2.7/
$ ./bin/docker-image-tool.sh -r <repo> -t my-tag build
$ ./bin/docker-image-tool.sh -r <repo> -t my-tag push

https://ithelp.ithome.com.tw/upload/images/20201013/20121070cl7pR0pqZj.png

https://ithelp.ithome.com.tw/upload/images/20201013/20121070WCAmQeCDkL.png

Submitting Applications to Kubernetes

$ bin/spark-submit \ 
      --master k8s://https://<k8s-apiserver-host>:<k8s-apiserver-port> \  
      --deploy-mode cluster \ 
      --name spark-pi \ 
      --class org.apache.spark.examples.SparkPi \ 
      --conf spark.executor.instances=5 \ 
      --conf spark.kubernetes.container.image=<spark-image> \ 
      local:///path/to/examples.jar

kubectl logs pods-name

Accessing Driver UI


<<:  Day28 laravel todolist 建立使用者群组 下篇

>>:  [ Day 30 | CSS ] 用 clip-path 绘制多边形

申请海外新创加速器好难

今年申请了两个加速器:Y Combinator、Berkley SkyDeck 这两个加速器在国际上...

第二十八天:文字排版

金鱼都能懂的网页切版:22、23、24、25 文字排版 在文字排版里,html版面基本是一模一样,只...

Day36 参加职训(机器学习与资料分析工程师培训班),网站设计与网页工程技术

上午: 网站设计与网页工程技术 # 连接资料库 import sqlite3 import nump...

马可夫模型

马可夫模型 (Markov Model) 会用来表达状态以及转移机率及它们的随机过程使用的模型,或许...

Day.21 从零开始 - 实务需求学SQL_2

延续昨天的内容介绍活动的新增改删以及表之间的查询。 新增活动资料 语法: INSERT INTO ...