- 博客(0)
- 资源 (12)
- 收藏
- 关注
Spark 源码编译完整教程(maven编译+sbt编译+编译工具包+操作步骤笔记+依赖包下载镜像设置)
自己学习并应用Spark一段时间后,由于需要改源代码,就研究了下怎么编译源码,成功编译后,记录下了编译的步骤和遇到的问题,例如编译过程中,下载大量的依赖包,默认从国外下载,非常慢,可能要编译好几个小时,通过设置国内镜像,10分钟就能编译好了,资料里面包含详细的镜像设置方法以及注意事项等。另外编译使用的工具可以是maven,也可以是sbt,我都研究过了,两种编译方法都予以描述,可根据自身喜好选用。
2018-03-08
大数据部署离线安装CDH操作指南(环境准备+Cloudera manager安装+CDH部署)
自己整理的CDH离线部署安装指南,可依据此部署步骤开发一键部署脚本程序,从而省去手动部署敲命令的繁琐过程。由于一键部署包好几个G,就不发出来了。
2018-03-08
Sqoop数据采集工具简介、安装、使用学习笔记(配合Hive和Hbase)
学习数据采集工具(ETL)Sqoop并使用多年后,写的一个学习笔记,整理了基本的要点,和操作使用手册,方便初学者快速掌握。
2018-03-08
Flume采集数据到Kafka,然后从kafka取数据存储到HDFS的方法思路和完整步骤
自己研究大数据多年,写的一个日志数据采集方案笔记,可快速熟悉Flume,Kafka,Hdfs的操作使用,以及相互的操作接口。
2018-03-08
《scala编程》第3版英文版&第3版源码
资源包含《Scala编程》第3版英文版和第3版源代码,Scala编程第3版,目前是最新版,支持Scala 2.11以上。《Scala编程》是Scala语言的创始人参与编写的,涵盖的语法特性非常全面,并且作者解释了为什么这么设计,有怎样的考虑,开发者应该以什么样的方式使用。 因此学习这本书,不单单是学会了scala语言本身,更重要的是扩展了视野,提升了思维能力和培养了考虑问题的思维方式方法。
2018-03-08
R语言学习笔记.doc(全面学习R语言后归纳整理,可提供命令和方法速查)
自己学习R语言编程后归纳整理的笔记,从R的下载、安装、设置、帮助系统的使用到R的数据结构、编程结构、面向对象编程、绘图、文件读写、数学运算等都有涵盖,所有命令都在R-3.2.0下亲测过,针对每个数据结构包括了所有的创建方法和操作方式。该笔记特别适合初步学习了R后记不住命令或者不知道使用什么命令实现自己操作意图的读者,如果您从未学习过R,可能这个笔记不是特别适合您入门,毕竟很多名词未作解释,建议您阅读入门书籍。既然是笔记嘛,你懂的,是用来复习、总结和速查的。
2016-07-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人