自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (5)
  • 收藏
  • 关注

原创 HBase 简介、架构、工作原理深析——(二)

**HBase的工作流程** 1. 读操作流程 a. Client先访问zookeeper,从meta表读取region的位置,然后读取meta表中的数据。meta中又存储了用户表的region信息。 b. 根据namespace、表名和rowkey在meta表中找到对应的region信息 c. 找到这个region对应的regionserver d. 查找

2017-09-26 10:13:31 234

原创 HBase 简介、架构、工作原理深析——(一)

一、 简介HBase是一种构建在HDFS之上的分布式、面向列的存储系统。在需要实时读写、随机访问超大规模数据集时,可以使用HBase。尽管已经有许多数据存储和访问的策略和实现方法,但事实上大多数解决方案,特别是一些关系类型的,在构建时并没有考虑超大规模和分布式的特点。许多商家通过复制和分区的方法来扩充数据库使其突破单个节点的界限,但这些功能通常都是事后增加的,安装和维护都和复杂。同时,也会影响RD

2017-09-25 15:36:28 731

原创 NoSql

什么是nosql?NoSQL一词最早出现于1998年,是Carlo Strozzi开发的一个轻量、开源、不提供SQL功能的关系数据库。2009年,Last.fm的Johan Oskarsson发起了一次关于分布式开源数据库的讨论[2],来自Rackspace的Eric Evans再次提出了NoSQL的概念,这时的NoSQL主要指非关系型、分布式、不提供ACID的数据库设计模式。因此,对NoSQL最普

2017-09-25 11:16:53 791

原创 java中的线程安全

java中的线程安全: 即线程同步 ,就是当一个程序对一个线程安全的方法或者语句进行访问的时候,其他的不能再对他进行操作了,必须等到这次访问结束以后才能对这个线程安全的方法进行访问什么叫线程安全:如果你的代码所在的进程中有多个线程在同时运行,而这些线程可能会同时运行这段代码。如果每次运行结果和单线程运行的结果是一样的,而且其他的变量的值也和预期的是一样的,就是线程安全的。 或者说:一个类或者程序所

2017-09-22 17:55:32 256

原创 Hive

一、 什么是hive? Apache Hive数据仓库软件提供对存储在分布式中的大型数据集的查询和管理,它本身是建立在Apache Hadoop之上,主要提供以下功能: (1)它提供了一系列的工具,可用来对数据进行提取/转化/加载(ETL); (2)是一种可以存储、查询和分析存储在HDFS(或者HBase)中的大规模数据的机制; (3)查询是通过MapReduce来完成的(并不是所有的查询

2017-09-22 15:39:27 265

原创 Flume

一、 什么是flume flume是由cloudera软件公司产出的可分布式日志收集系统,后与2009年被捐赠了apache软件基金会,为hadoop相关组件之一。尤其近几年随着flume的不断被完善以及升级版本的逐一推出,特别是flume-ng;同时flume内部的各种组件不断丰富,用户在开发的过程中使用的便利性得到很大的改善,现已成为apache top项目之一。 flume是分

2017-09-22 15:26:24 394

原创 storm入门简介、架构原理分析

一、 Storm简介 Storm是由Nathan Marz开发的,一个免费并开源的分布式实时计算系统。 Storm是基于数据流的实时处理系统,提供了大吞吐量的实时计算能力。通过数据入口获取每条到来的数据,在一条数据到达系统的时候,立即会在内存中进行相应的计算;Storm适合要求实时性较高的数据分析场景。 Storm 不处理静态数据,但它处理连续的流数据。二、 Storm的特点 Storm实

2017-09-12 14:58:26 1676

原创 CSS 学习笔记——关于样式表插入的补充

CSS 学习笔记——关于样式表插入的补充 这些是以前学习做的笔记,现在整理一下放到博客上,清理磁盘空间啦~ 1、  样式表允许以多种方式规定样式信息。2、  样式可以规定在单个的HTML 元素中(内联样式),在 HTML 页的头元素中(内部样式表),或在一个外部的 CSS 文件中(外部样式表)。也可以在同一个 HTML 文档内引用多个外部样式表。3、  一般情况下,优先级如

2017-08-15 21:25:38 158

原创 CSS 学习笔记——插入样式表

CSS 学习笔记——插入样式表 这些是以前学习做的笔记,现在整理一下放到博客上,清理磁盘空间啦~ 一、插入样式表的方法1、 内联样式2、 内部样式表3、 外部样式表 二、内联样式——inline style内联样式将内容和样式表现混合在一起,比较混乱,相比较于样式表,优势不足。所以尽量不要使用内联样式。1、 时候可以使用内联样式?当样式仅需要在一个元

2017-08-15 16:01:33 235

原创 CSS 学习笔记——入门

CSS 学习笔记——入门 这些是以前学习做的笔记,现在整理一下放到博客上,清理磁盘空间啦~ 一、什么是CSS?1.      CSS指层叠样式表 (Cascading Style Sheets),用来定义如何显示 HTML 元素。2.      样式通常存储在样式表中,把样式添加到 HTML 中,是为了解决内容与表现分离的问题3.      外部样式表通常存储在 CSS

2017-08-15 15:33:24 496

原创 Git使用方法总结——Git 安装

Git使用方法总结——Git 安装 1、 关于gitGit是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目。Git 是 Linus Torvalds为了帮助管理 Linux内核开发而开发的一个开放源码的版本控制软件。Git 与常用的版本控制工具 CVS, Subversion等不同,它采用了分布式版本库的方式,不必服务器端软件支持。 2、

2017-08-14 11:49:52 261

原创 本渣的Python学习之路——2(基本数据类型)

搭建好Python环境后,就开始学习Python啦就从最基础的数据类型和它们的基本方法入手首先,在学习之前对python中的变量有相应的了解。变量不需要声明变量在使用前都必须赋值变量赋值以后该变量才会被创建。Python中变量就是变量,是内存地址指针,它没有类型,我们所说的”类型”是变量所指的内存中对象的类型。以下是Python中的基本数据类型1. 字符串 Python中有两种字符串类型,

2017-08-13 15:31:00 531

原创 本渣的Python学习之路——1(replay)

本渣的Python学习之路——1前段时间,参与了斌叔的程序媛计划,然而,过了几天,本渣就没兴趣了。然后某天,意外的刷到一个博主自己用python写爬虫,代码不要太简洁哦,于是乎, 本渣就入坑了。这里,就把一些自己的学习成果记录一下喽。认识Python什么是Python? python诞生于上世纪90年代,开发者是Guido van Rossum。是目前最 火的编程语言之一。 特点:目前还没

2017-08-12 10:09:29 840

Hadoop技术内幕 深入解析HADOOP COMMON和HDFS架构设计与实现原理_13236639.pdf

本书是“Hadoop 技术内幕”系列的第3 本书,前面两本分别对Common、HDFS 和MapReduce 进行了深入分析和讲解,赢得了极好的口碑,Hadoop 领域几乎人手一册,本书则对YARN 展开了深入的探讨,是首部关于YARN 的专著。仍然由资深Hadoop 技术专家董西成执笔,根据最新的Hadoop 2.0版本撰写,权威社区ChinaHadoop 鼎力推荐。 本书从应用角度系统讲解了YARN 的基本库和组件用法、应用程序设计方法、YARN 上流行的各 种计算框架(MapReduce、Tez、Storm、Spark),以及多个类YARN 的开源资源管理系统(Corona 和 Mesos);从源代码角度深入分析YARN 的设计理念与基本架构、各个组件的实现原理,以及各种计算 框架的实现细节。

2017-10-20

面向对象软件构造(第二版)中英对照版

从软件构造方法角度详细论述了软件构造模块的品质因素和构造高质量模块的原则,规划和原理;另一方面从数学上抽象数据类型对类型系统描述定义论述了抽象模块和对象模块的正确性、鲁棒性问题以及类型系统的类属、继承、封装、多态等。

2017-10-16

代码大全英文版

代码大全(第二版) 是著名IT畅销书作者Steve McConnell十一年前的经典著作的全新演绎:第二版不是第一版的简单修订增补,而是完全进行了重写;增加了很多与时俱进的内容。这也是一本完整的软件构建手册,涵盖了软件构建过程中的所有细节。它从软件质量和编程思想等方面论述了软件构建的各个问题,并详细论述了紧跟潮流的新技术、高屋建瓴的观点、通用的概念,还含有丰富而典型的程序示例。本书中所论述的技术不仅填补 了初级与高级编程技术之间的空白,而且也为程序员们提供了一个有关编程技巧的信息来源。本书对经验丰富的程序员、技术带头人、自学的程序员及几乎不懂太多编程技巧的学生们都是大有裨益的。可以说,无论你是什么背景,阅读本书都会让你在更短的时间内、更容易地写出更好的程序。

2017-10-16

Hadoop技术内幕:深入解析YARN架构设计与实现原理.pdf

本书从应用角度系统讲解了YARN 的基本库和组件用法、应用程序设计方法、YARN 上流行的各 种计算框架(MapReduce、Tez、Storm、Spark),以及多个类YARN 的开源资源管理系统(Corona 和 Mesos);从源代码角度深入分析YARN 的设计理念与基本架构、各个组件的实现原理,以及各种计算 框架的实现细节。

2017-10-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除