Spark的应用有一个过程:
其实就是数据分析的过程——接收、处理、输出一步到位的过程!
使用Spark最简单的方法是直接在你的机器上使用Pyspark。
它的前提是需要安装Python。
然后去Spark官网下载Spark的安装包。
Spark支持很多语言,包括Python和Java/Scala/R。
安装后可以打开PySpark的交互界面,在里面输入一个简单的案例,就可以看到运行结果。
我关注我的原创视频,短短3分29秒你就知道怎么用Spark了。