为了更好的学习和理解spark,也为了记录自己学习过程中遇到的各种问题,方便以后查询,故写了相关博客,也公开了代码和数据,代码基本都可以本地(local)运行。论文部分由于是ppt,故没有放上来。
SparkLearning博客:http://blog.csdn.net/bob601450868/article/category/5730447
SparkLearning代码和数据:https://github.com/xubo245/SparkLearning
书籍和视频等学习资料推荐: Spark学习资料汇总
SparkLearning是在spark上运行的,spark搭建等请见spark官网或其他网站。
SparkLearning运行环境:
Spark-1.5.2
eclipse-4.3.2
scala-2.10.4
jdk1.7
idea 15.04
spark-assembly-1.5.2-hadoop2.6.0.jar(下载地址: http://pan.baidu.com/s/1hrSxiDI)
SparkLearning项目带有数据,下载会比较慢,如果只想下载部分文件夹,可以使用svn。另外也在20160810弄了一个没有数据的project,方便下载:https://github.com/xubo245/SparkLearning_NoData
SparkBaseLearning文档
SparkBaseLearning代码
SparkCodeLearning文档
SparkCodeLearning代码
MLlibLearning文档
MLlibLearning代码
SparkSQLLearning文档
SparkSQLLearning代码
SparkRLearning文档
SparkRLearning代码
SparkStreamingLearning文档
SparkStreamingLearning代码
GraphXLearning文档
GraphXLearning代码
SparkAvroLearning文档
SparkAvroLearning代码
AlluxioLearning文档
AlluxioLearning代码
SparkCsvLearning文档
SparkCsvLearning代码
SparkSourceLearning文档
SparkSourceLearning代码
If you have any questions or suggestions, please write it in the issue of this project or send an e-mail to me: [email protected]
Wechat: xu601450868
QQ: 601450868