自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (3)
  • 收藏
  • 关注

转载 如何查出同一张表中字段值重复的记录

如何查出同一张表中字段值重复的记录MYSQL查询重复记录的方法很多,下面就为您介绍几种最常用的MYSQL查询重复记录的方法,希望对您学习MYSQL查询重复记录方面能有所帮助。1、查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断 select * from peoplewhere peopleId in (select peopleId from peopl...

2018-09-04 10:47:41 5841

原创 HDFS的NameNode功能

NameNode主要功能:1、NameNode主要功能:接受客户端的读写服务2、NameNode保存metadata信息:      - 文件owership和permissions      - 文件包含哪些块      - Block保存在那个DataNode上(DameNode启动的时候主动把block汇报给NameNode)。3、NameNode的metadata信...

2018-08-15 16:03:36 12775

转载 spark核心编程原理

1、首先我们搭建好了spark集群2、客户端与spark集群建立连接,之后才能提交spark应用程序3、spark提交应用程序到spark集群上4、Spark与MapReduce最大的不同在于,迭代式计算模型:MapReduce,分为两个阶段,map和reduce,两个阶段完了,就结束了。所以我们在一个job里能做的处理很有限,只能在map和reduce里处理。Spark,计算模型...

2018-08-13 09:34:10 1187

转载 RDD基本特性

RDD及其特点1、RDD是Spark提供的核心抽象,全称为Resillient Distributed Dataset,即弹性分布式数据集。2、RDD在抽象上来说是一种元素集合,包含了数据。它是被分区的,分为多个分区,每个分区分布在集群中的不同节点上,从而让RDD中的数据可以被并行操作。(分布式数据集)3、RDD通常通过Hadoop上的文件,即HDFS文件或者Hive表,来进行创建;有时也...

2018-08-13 09:33:55 2732

idea 设置快捷键的 settings.jar

在此给大家提供一个免费资源(在此抱歉,csdn系统默认需5个积分,提交资源无法设置积分,如有积分需要的可以下载,抱歉!!!,如没积分可评论贴邮箱,资源我给发邮箱),idea设置快捷键的settings.jar 。使用方法idea工具点击file->import settings->选择settings.jar 重启idea 完成。

2019-05-27

Hive 学习笔记

Hive 学习笔记希望喜欢hadoop的同学赶紧下载支持一下塞

2014-09-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除