博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Linux配置Spark
阅读量:5059 次
发布时间:2019-06-12

本文共 776 字,大约阅读时间需要 2 分钟。

下载预构建好的Spark压缩包

进入下载你需要的安装包,这里我选择预构建好的、现在最新的压缩包-Download Spark: spark-2.3.2-bin-hadoop2.7.tgz

下载:wget https://www.apache.org/dyn/closer.lua/spark/spark-2.3.2/spark-2.3.2-bin-hadoop2.7.tgz
解压: tar zxvf spark-2.3.2-bin-hadoop2.7.tgz

添加环境变量

export PATH=$PATH:home/sy/spark-2.3.2-bin-hadoop2.7/bin

可以先进入解压后的目录,然后输入pwd获取当前目录
如果需要永久开机配置,在用户名目录下输入ls -a,有一个.bashrc文件,使用vi打开,添加环境变量如下:
gfd.PNG
保存后,source .bashrc,使得环境变量立即生效。

Java环境

输入java -version,显示:

openjdk version "1.8.0_161"OpenJDK Runtime Environment (build 1.8.0_161-b14)OpenJDK 64-Bit Server VM (build 25.161-b14, mixed mode)

说明java环境已经配置成功,如果没有的话,可能需要配置一下。

检查配置是否成功

输入spark-shell,显示下面信息说明配置成功

spark.PNG

安装pyspark

pip install pyspark

测试

我们测试这个链接中的例子:

新建pca.py文件,输入代码后执行python pca.py即可,输出如下:
QQ图片20180929160209.png

转载于:https://www.cnblogs.com/sunyanqinyin/p/9787958.html

你可能感兴趣的文章
网络爬虫Heritrix源码分析(一) 包介绍
查看>>
__int128的实现
查看>>
Problem - 1118B - Codeforces(Tanya and Candies)
查看>>
jdk1.8 api 下载
查看>>
svn 图标不显示
查看>>
getElement的几中属性介绍
查看>>
iOS 使用Quartz 2D画虚线 【转】
查看>>
平面最接近点对
查看>>
HTML列表,表格与媒体元素
查看>>
PHP、Java、Python、C、C++ 这几种编程语言都各有什么特点或优点?
查看>>
感谢青春
查看>>
Jquery Uploadify4.2 falsh 实现上传
查看>>
雨林木风 GHOST_XP SP3 快速装机版YN12.08
查看>>
linux基础-命令
查看>>
java对象的深浅克隆
查看>>
Hadoop流程---从tpch到hive
查看>>
数据结构3——浅谈zkw线段树
查看>>
Introduction to my galaxy engine 2: Depth of field
查看>>
V2019 Super DSP3 Odometer Correction Vehicle List
查看>>
Python 3.X 练习集100题 05
查看>>