自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

转载 MapReduce的原理及执行过程

MapReduce简介MapReduce是一种分布式计算模型,是Google提出的,主要用于搜索领域,解决海量数据的计算问题。 MR有两个阶段组成:Map和Reduce,用户只需实现map()和reduce()两个函数,即可实现分布式计算。MapReduce执行流程  MapReduce原理   MapReduce的执行步骤:1、Map任务处理  1.1 读...

2018-11-15 10:28:36 227

转载 Hive 中parse_url的使用

1、Hive的parse_url函数parse_url(url, partToExtract[, key]) - extracts a part from a URL解析URL字符串,partToExtract的选项包含[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]。【host,path,query,ref,protocol...

2018-11-14 10:16:44 1395

原创 tableau 连接python

最简单的方式就是装一个现成的环境,anaconda,在里面安装两个包在C盘中搜索startup.bat,放在桌面比较方便,运行弹出此界面即可。 Done!!!参考资料1:https://onlinehelp.tableau.com/current/api/extract_api/en-us/Extract/extract_api_using_python.htm...

2018-08-03 19:11:03 9534 1

原创 五年计划

2018.8-2022.7五年计划1. 成为一个人工智能领域的专家. 2. 说一口流利的英语. 3. 坚持健身,每个月徒步一次或旅行一次. 4. 找个有共同价值观的人结婚.

2018-07-27 09:55:47 514

转载 HIVE知识梳理(转载)

作为个人笔记增加了一些写过的例子,欢迎补充。1、 order by, sort by, distribute by, cluster by 背景表结构 在讲解中我们需要贯串一个 例子,所以需要设计一个情景,对应 还要有一个表结构和填充数据。如下: 有 3 个字段,分别为 personId 标识某一个人, company 标识一家公司名称,money 标识该公司每年盈利收入(单位:万元人民币)per...

2018-06-28 10:17:40 165

py画瀑布图

利用python画瀑布图,瀑布图是由麦肯锡顾问公司所独创的图表类型,因为形似瀑布流水而称之为瀑布图(Waterfall Plot)。此种图表采用绝对值与相对值结合的方式,适用于表达数个特定数值之间的数量变化关系。应用场景:1.解释两个数据值之间的差异是由哪几个因素贡献,每个因素的贡献比例,展示两个数据值之间的演变过程。 举个例子,某网站一月份订单成交额为103万元,二月份121万元(较一月增加18万元),三月份131万元(较二月增加10万元),四月份127万元(较三月减少4万元),五月份152万元(较四月增加125万元),六月份176万元(较五月增加24万元),用瀑布图清晰看到近半年的数据加减关系。 2.两个及以上的数据点之间数量的演变过程时,并最终形成累计值。 举个例子,某企业想了解全年具体的收入、成本分布情况,图表如下,绿色为收入(分产品收入800K,服务收入300K),红色为成本(折扣成本90K,工资性支出300K,航运支出100K),蓝色为全年的总收益(600K)。

2018-05-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除