自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 2021-01-12

https://regexr.com/(.+) .+ COMMENT ‘(.+)’,分栏位

2021-01-12 16:02:02 70

原创 数据仓库设计

1.需求分析,业务流程设计2.概念设计,er图3.逻辑设计4.物理设计5.系统实施6.运维

2021-01-08 22:45:00 103

原创 Hive 常见问题点记录

缺少MySQL驱动包1.1 问题描述Caused by: org.datanucleus.store.rdbms.connectionpool.DatastoreDriverNotFoundException: The specified datastore driver (“com.mysql.jdbc.Driver”) was not found in the CLASSPATH. Pl...

2020-01-20 14:58:15 1092

原创 pandas-profiling

对于探索性数据分析来说,做数据分析前需要先看一下数据的总体概况,pandas_profiling工具可以快速预览数据。1、pandas-profiling安装与调用pip install pandas-profilingimport pandas as pdimport pandas_profiling2、导入数据data=pd.read_csv(“model.csv”)3、直接查看...

2019-10-09 13:56:36 537

原创 Win上安装运行Spark

一、JDK的安装1、1 下载JDK  首先需要安装JDK,并且将环境变量配置好,如果已经安装了的老司机可以忽略。JDK(全称是JavaTM Platform Standard Edition Development Kit)的安装,去Oracle官网下载,下载地址是Java SE Downloads 。上图中两个用红色标记的地方都是可以点击的,点击进去之后可以看到这个最新版本的一些更为详细的...

2019-08-31 20:53:31 223

原创 Win上安装运行Hadoop

1.下载JDK,并设置JAVA_HOME。(使用不带空格的路径,比如Program Files,将在后面的配置中报错!)假设JAVA_HOME路径为C:\Java\jdk1.8.0_732.下载hadoop。下载地址:http://hadoop.apache.org/releases.html如果在当前页中没找到2.8.3版本,可以到所有版本的下载列表中去找:https://archive....

2019-08-31 20:48:05 255

原创 PIP的一些操作

pip install pyspark -i https://pypi.tuna.tsinghua.edu.cn/simple/pip install x -i url

2019-08-31 20:44:28 108

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除