自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 收藏
  • 关注

原创 【SQL】拼表法插入数据

实习过程中学到的一个SQL小技能,把它记录下来。很多时候我们想要在公司的hive表里插入数据,但是没有办法直接导入文件怎么办?拼表法就能解决这个问题。例如,我想要手动插入数据得到下图这样一张表:可以用下面一段代码实现:select *from(select 1 as aa,2 as ab,3 as ac,4 as ad,'拼表' as ae union allselec...

2019-04-26 17:52:52 564

原创 【LeetCode】数据库练习题

LeetCode上面公开的几道SQL题结果,欢迎大家讨论。(https://leetcode-cn.com/problemset/database/) 175. 组合两个表【简单】表1:Person(Id 是主键)+-------------+---------+| 列名 | 类型 |+-------------+---------+| Pers...

2018-08-20 00:08:15 1347

原创 【牛客】网易2018校园招聘数据分析工程师笔试卷

【牛客】网易2018校园招聘数据分析工程师笔试卷解析* 选择题根据牛客网下方讨论整理,三道大题未做,欢迎大家讨论并给予指正。(https://www.nowcoder.com/test/10730167/summary)一、选择题1、某二叉查找树的每个节点存放一个整数,中序遍历该树得到的序列为3,4,5,则该树的画法有多少种情况?答:5 2、字符串有5个字符q,w,...

2018-08-18 21:56:10 2784

原创 【牛客】网易2018实习生招聘笔试题——数据分析师实习生解析

【牛客】网易2018实习生招聘笔试题——数据分析师实习生解析* 选择题根据牛客网下方讨论整理,三道大题均为自己答案,欢迎大家讨论并给予指正。(https://www.nowcoder.com/test/10780714/summary)  第二道sql参考(https://bbs.csdn.net/topics/392421965?page=1)一、选择题1、有2堆宝石,A和B...

2018-08-18 18:51:37 15757 3

原创 【牛客】网易2018校招数据分析师笔试解析

【牛客】网易2018校招数据分析师笔试解析* 选择题根据牛客网下方讨论整理,三道大题均为自己答案,欢迎大家讨论并给予指正。(https://www.nowcoder.com/test/10778804/summary)一、选择题1、有2堆宝石,A和B一起玩游戏,假设俩人足够聪明,规则是每个人只能从一堆选走1个或2个或3个宝石,最后全部取玩的人获胜,假设2堆宝石的数目为12和13,请...

2018-08-18 00:18:35 13973 3

原创 【牛客】摩拜2018校招数据分析工程师笔试解析

【牛客】摩拜2018校招数据分析工程师笔试解析* 选择题都有正确答案,后面五道大题均是我的答案,欢迎大家讨论纠正!(https://www.nowcoder.com/test/11453292/summary)一、选择题1、在Shell编程中,下面哪个表示上一步所运行程序的返回值()答:$? 2、在SQL语言中,子查询是(    ) 答:嵌入到另一个查询语句之中的查...

2018-07-23 10:44:46 3000 1

原创 【牛客】2018京东秋招数据分析工程师笔试解析

【牛客】2018京东秋招数据分析工程师笔试解析* 根据牛客网下方讨论整理(https://www.nowcoder.com/test/10630596/summary)一、选择1、有一个文件user.txt,每行一条user记录,共若干行,下面哪个命令可以实现“统计出现次数最多的前3个user及其次数”?答:sort user.txt | uniq -c | sort -rn | ...

2018-07-20 00:09:40 8496 2

原创 【牛客】剑指offer部分编程题(持续更新......)

【牛客】剑指offer部分编程题(持续更新......) 一、替换空格请实现一个函数,将一个字符串中的每个空格替换成“%20”。例如,当字符串为We Are Happy.则经过替换之后的字符串为We%20Are%20Happy。class Solution: # s 源字符串 def replaceSpace(self, s): # write c...

2018-07-16 23:25:21 506

原创 win10安装spark流程

win10安装spark流程说明安装步骤分为java,scala,spark和hadoop四步,以下是对我整个安装过程的记录。一、安装JDK官网下载了8u172版本。点击打开链接安装完毕以后,添加环境变量JAVA_HOME、增加环境变量path路径。打开cmd键入java -version,看到如下界面说明java安装成功。二、安装scala官网下载了msi格式,并安装成功。点击打开链接增加pat...

2018-05-12 15:38:56 4801 5

原创 python爬豆瓣影评&根据词频生成词云

python爬豆瓣影评&根据词频生成词云通过爬取豆瓣上正在上映的电影影评信息,并根据评论词频生成词云。一、需要的包import warnings # 防止出现future warningwarnings.filterwarnings("ignore")from urllib import request # 用于爬取网页from bs4 import BeautifulSoup a...

2018-05-06 10:11:50 6048

原创 python用matplotlib画条形图初探(单变量,双变量堆叠)

python用matplotlib画条形图初探(单变量,双变量堆叠)一、包import numpy as npimport matplotlib.pyplot as plt二、单变量(垂直)y = [5, 10, 15, 20, 25]index = np.arange(len(y))plt.bar(left=index, height=y, color='r', width=0.5) #...

2018-05-05 16:03:18 10324

原创 git远程操作入门

git远程操作入门 一、建立本地库新建文件夹 -> 改变目录 -> 初始化~/Desktop$ mkdir learngit~/Desktop$ cd learngit~/Desktop/learngit$ git initInitialized empty Git repository in C:/.../Desktop/learngit/.git...

2018-04-22 16:29:52 253

原创 周志华《机器学习》第四章决策树-调用sklearn.tree实现

周志华《机器学习》第四章决策树-调用sklearn.tree实现一、导入需要用的包import csv # 导入文件import pandas as pdfrom sklearn.feature_extraction import DictVectorizer # 用于生成哑变量from sklearn import tree二、导入数据1、利用csv导入数据melon = open(r...

2018-04-14 23:17:19 1008 1

原创 【TIPS】更改jupyter notebook工作空间

【TIPS】更改jupyter notebook工作空间一、打开任意工作目录,图片中显示的是C盘二、shift+点击右键,选择打开powershell窗口三、键入jupyter notebook四、在默认浏览器弹出home界面,显示的都是C盘的内容...

2018-04-14 18:06:36 593

原创 【TIPS】关于matplotlib包plt.show()画图中文字符乱码

关于matplotlib包plt.show()画图中文字符乱码%matplotlib inlineimport matplotlib.pyplot as pltyears = [1950, 1960, 1970, 1980, 1990, 2000, 2010]gdp = [300.2, 543.3, 1075.9, 2862.5, 5979.6, 10289.7, 14958.3]pl...

2018-04-11 21:29:30 1613

原创 markdown使用过程中遇见的问题(持续更新)

markdown使用过程中遇见的问题(持续更新)一、markdownpad2无法正确显示公式解决方法:需要在MarkdownPad2里加入 MathJax CDN,方法如下:工具→选项→高级→HTML Head编辑器,在打开的窗口里输入下面的内容:<script type="text/javascript"   src="http://cdn.mathjax.org/mathjax/late...

2018-04-11 21:25:08 3174

原创 R使用过程中遇见的问题(持续更新)

R使用过程中遇见的问题(持续更新)一、无法安装包并返回如下信息cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'解决方法:更换镜像,使用国内镜像即可。tools-global options-packages-change选择一个距离最近的镜像,重新安装相关包即可。...

2018-04-10 23:08:59 660

原创 Regex Golf 正则表达式练习(持续更新)

Regex Golf 正则表达式练习初步接触正则化表达式,本文记录regex golf(alf.nu/RegexGolf)上题目答案,一些拙见,欢迎指正或给出更好的答案。一、Warmup二、Anchors三、It never ends法一:(?!\w)表示后面没有字母法二:法三:\b为边界匹配,后面不出现字母          \B为边界匹配,后面可接字母四、Ranges其实可以更简洁五、Back...

2018-03-18 15:43:24 7378 6

原创 python使用过程中遇见的问题(持续更新)

python使用过程中遇见的问题(持续更新)一、wordcloud安装问题在使用pip install wordcloud安装wordcloud过程中遇见如下问题即 error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visua...

2018-03-10 17:42:57 1046

原创 图灵程序丛书 —《数据科学入门》— Ch9-Ch10 获取数据、数据工作

Ch9-Ch10  获取数据、数据工作此系列记录《数据科学入门》学习笔记(停止)Chap 9 获取数据(只有9.2)9.2 读取文件9.2.1 文本文件基础# 'r'意味只读file_for_reading = open('reading_file.txt', 'r')# 'r'意味写入,会破坏已存在的文件file_for_writing = open('reading_file.txt'...

2018-03-09 21:09:49 405

原创 图灵程序丛书 —《数据科学入门》— Ch8 梯度下降法

Ch8 梯度下降法此系列记录《数据科学入门》学习笔记8.2 梯度下降的思想梯度下降法只能找到局部最优解,而不是全局最优解;当有多个全局最优解时,可以通过多尝试一些初始点来重复搜索;当一个函数没有最小点时,计算可能会陷入死循环。8.2 估算梯度def sum_of_squares(v): return sum(v_i ** 2 for v_i in v)# 单变量函数的导数可通过差商来定...

2018-03-08 17:54:59 554

原创 图灵程序丛书 —《数据科学入门》— Ch4-Ch7 线性代数、统计学、概率、假设与推断

Ch4-Ch7 线性代数、统计学、概率、假设与推断此系列记录《数据科学入门》学习笔记Ch 4 线性代数4.1 向量# 向量加减法def vector_add(v, m): return [v_i + w_i for v_i, w_i in zip(v, w)]def vector_subtract(v, m): return [v_i - w_i for v_i, w_i ...

2018-03-05 17:59:06 380

原创 图灵程序丛书 —《数据科学入门》— Ch3 可视化数据(matplotlib)

Ch3 可视化数据此系列记录《数据科学入门》学习笔记3.1 matplotlib%matplotlib inlineimport matplotlib.pyplot as pltyears = [1950, 1960, 1970, 1980, 1990, 2000, 2010]gdp = [300.2, 543.3, 1075.9, 2862.5, 5979.6, 10289.7, 149...

2018-02-27 16:54:42 371

原创 MySQL入门(终结)- 常用语句简单总结

MYSQL简单总结SQL的分类数据查询语言(DQL - data querylanguage):select(针对表中数据)数据操纵语言(DML - datamanipulation language):insert、delete、update(针对表中数据)数据定义语言(DDL - data definitionlanguage):create、drop、alter(针对表的结构)事务控制语言(...

2018-02-24 20:34:52 412

原创 MySQL入门(12)- 索引&视图&导入/导出

索引&视图&导入/导出此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                                       员工表emp(empno工号、ename员工姓名、job职位、mgr...

2018-02-24 15:46:12 918

原创 MySQL入门(11)- 事务

事务此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                                       员工表emp(empno工号、ename员工姓名、job职位、mgr直属领导工号、          ...

2018-02-24 15:40:20 318

原创 MySQL入门(10)- 存储引擎

存储引擎此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                                       员工表emp(empno工号、ename员工姓名、job职位、mgr直属领导工号、        ...

2018-02-24 15:36:29 358

原创 MySQL入门(9)- 34道练习题(内含bjpowernode.sql数据)

34道练习题(内含bjpowernode.sql数据)此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末。* 该数据有三张表:部门表dept(deptno部门编号、dname部门名称、loc位置)、                             员工表emp(empno工号、ename员工姓名、job职位、mgr直属领导工号、          ...

2018-02-24 10:07:47 11985 11

原创 MySQL入门(8)- 约束——主键约束&外键约束&级联更新/删除

约束——主键约束&外键约束&级联更新/删除此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                                       员工表emp(empno工号、ena...

2018-02-23 11:12:36 1340

原创 MySQL入门(7)- 约束——非空约束&唯一性约束

约束——非空约束&唯一性约束此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                                       员工表emp(empno工号、ename员工姓名、job职...

2018-02-23 11:00:53 3828

原创 MySQL入门(6)- 创建表、表的复制、增/删/改 表结构

创建表、表的复制、增/删/改 表结构此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                                       员工表emp(empno工号、ename员工姓名、job职...

2018-02-23 10:49:09 985

原创 MySQL入门(5)- 子查询&union&limit&case...when...then...when...then...end

子查询&union&limit&case...when...then...when...then...end此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                    ...

2018-02-23 10:27:25 740

原创 MySQL入门(4)- 连接查询、跨表查询

连接查询、跨表查询此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,我也没有,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                                       员工表emp(empno工号、ename员工姓名、job职位、mg...

2018-02-21 21:03:10 951 1

原创 MySQL入门(3)- 分组函数(count、sum、avg、max、min)&分组查询(groupby、orderby)

分组函数&分组查询此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                                       员工表emp(empno工号、ename员工姓名、job职位、mgr...

2018-02-21 20:50:03 3060

原创 MySQL入门(2)- 排序&数据处理函数&日期处理函数

排序&数据处理函数&日期处理函数此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                                       员工表emp(empno工号、ename员工姓...

2018-02-20 21:32:59 429

原创 MySQL入门(1)- SQL语句分类&查询语句

SQL语句分类&查询语句此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、                                       员工表emp(empno工号、ename员工姓名、job职位、...

2018-02-20 21:21:46 683

原创 图灵程序丛书 —《数据科学入门》— Ch2 Python 速成

Ch2 Python 速成此系列记录《数据科学入门》学习笔记2.1 基础内容2.1.3 空白形式python使用缩进的形式分隔代码块,可利用‘Tab’键快速找到键入位置。for i in [1, 2, 3, 4, 5]: print(i) for j in [1, 2, 3, 4, 5]: print(j) print(i + j) prin...

2018-01-31 18:14:16 312

原创 图灵程序丛书 —《数据科学入门》— Ch1 导论

Ch1 导论此系列记录《数据科学入门》学习笔记1.3.1 寻找关键联系人1、定义users字典listusers = [ {'id': 0, 'name': 'Hero'}, {'id': 1, 'name': 'Dunn'}, {'id': 2, 'name': 'Sue'}, {'id': 3, 'name': 'Chi'}, {'id': 4, 'na...

2018-01-30 16:03:27 339

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除