自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 MapReduce原理梳理

mapReduce 实际是一个分布式计算的框架,其核心功能就是将用户的业务逻辑代码整合成一个完整的分布式运算程序,并发运行在hadoop集群上。分布式计算框架提出的原因是因为海量数据在单机环境下由于资源限制而无法完成。如果直接将一个普通的java程序优化成分布式版本,会增加程序的复杂度与设计难度引入mapreduce框架之后,开发人员只需要关注业务逻辑的实现而将其中复杂的重复逻辑交由框架...

2019-01-24 17:51:08 130

原创 分布式事务基础概念

分布式事务相比本地事务有很多额外的情况产生交互异常:分布式中某个机器宕机网络异常发布的消息丢失发送的消息不保证接受顺序(消息在传递与传输过程中产生不确定延迟)数据错误不可靠的TCP连接某个节点的存储数据丢失等本地事务一般通过先写日志(redo), 后写数据库的方式避免一些异常发生,或者根据日志回滚数据.本地数据库的ACID原则本地数据库有ACID原则:原子性,一致性,隔离性...

2019-01-24 15:32:14 122

原创 hive中shuffle 与 spark shuffle 中的异同

由于目前的项目有强制的资源限制,hive任务不能满足要求,需要将hiveSQL 改成spark 的scala脚本运行,但是再过程中遇到了很多坑,这里记录一下可能涉及到的原理问题。由于hive SQL 是使用SQL实现,再逻辑非常复杂的情况下,只能将任务分成多个阶段,同时尽量减少job数 来提高效率。在这种情况下,有可能出现复算以及计算无效数据的情况,需要衡量计算无效数据的效率以及避免计算而出现的...

2019-01-21 16:37:57 4757

原创 Linux 基础命令 与 基础知识

基础命令cd 跳转命令,用于目录跳转,可以是绝对路径也可以是相对路径ls

2017-04-13 23:35:44 185

原创 oracle_SQL学习笔记

oracle 数据库特征与MySQL的区别oracle是大型数据库,MySql是中小型数据库。oracle支持大并发,大访问量,是OLTP最好的工具oracle数据库安装完成后占用空间打,和其他机器性能操作上的区别 主键 Mysql一般使用自动增长类型,在创建表时只要指定表的主键是atuo increment类型。插入记录时,不需要在制定该记录的主键值,Mysql 将自动增长;Oracl

2017-04-04 16:58:17 308

原创 MySQL基础学习

MySQL基础学习修改SQL提示符连接客户端时通过参数指定 shell>mysql -uroot -proot –prompt连接上客户端后,通过prompt 命令修改 mysql>prompt 提示符 参数 描述 \D 完整日期 \d 当前数据库 \h 服务器名称 \u 当前用户MySQL常用指令显示当前服务器版本SELECT VERSION

2017-03-29 13:41:17 259

原创 这是一篇测试博客,linux服务器搭建

由于写跑eeglab的需求,为了日后方便跑RBM。自己的台式电脑配置不能满足需求。正巧实验室有一台戴尔工作站。于是利用起来。首先,在工作站中安装ubuntu桌面版,由于服务器版联网实在成问题,所以选择桌面版。1. 登录vpn从ubuntu官网下载镜像文件。2. 使用UltraISO将光盘镜像写成启动盘,引导区选择 --Syslinux 写入方式选择USB-HDD3. bio

2016-11-30 17:26:21 371

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除