自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 资源 (6)
  • 收藏
  • 关注

原创 使用sqoop在mysql和hive中导数

hive的数据导入mysql通过Sqoop将Hive表数据导入到Mysql通常有两种情况。第一种是将hive上某张表的全部数据导入到mysql对应的表中。第二种是将hive上某张表中的部分数据导入到mysql对应的表中。两种方式的区别在于第二种情况需要指定要导入数据的列名称。两种情况的导入方式分别如下:1.全部导入Sqoop export --connect  jdbc...

2018-12-10 21:38:09 522

转载 关于linux定时的代码

linux 系统则是由 cron (crond) 这个系统服务来控制的。Linux 系统上面原本就有非常多的计划性工作,因此这个系统服务是默认启动的。另 外, 由于使用者自己也可以设置计划任务,所以, Linux 系统也提供了使用者控制计划任务的命令 :crontab 命令。一、crond简介crond 是linux下用来周期性的执行某种任务或等待处理某些事件的一个守护进程,与window...

2018-12-10 21:20:23 188

原创 give me some credit 信用预测

Pandas —— 唯一值unique( ),计数值value_counts( )及成员资格isin( )首先将数据变成DataFrame的形式a = pd.DataFrame(traindata) a['age'].value_counts()     a['age'].unique()a['age'].isin([20,21,22]) #去重python...

2018-12-10 19:55:19 1260

转载 Navicat Premium

来源网址:https://www.jianshu.com/p/42a33b0dda9c1、按步骤安装Navicat Premium,如果没有可以去官网下载:http://www.navicat.com.cn/download/navicat-premium2、安装好后下载激活文件:https://pan.baidu.com/s/1kVgTd6R  提取密码:t1yp3、下载好后解压文件,可以看到如...

2018-06-29 09:42:16 267

转载 python 使用K-Means算法对数据进行聚类

K-Means是聚类算法的一种,以距离来判断数据点间的相似度并对数据进行聚类。前面的文章中我们介绍过K-Means聚类算法的原理及实现。本篇文章使用scikit-learn库对数据进行聚类分析。准备工作开始之前先导入要使用的各种库文件,首先是scikit-learn库,然后是数值计算numpy和科学计算pandas库,以及用于绘制图表的matplotlib库文件。1234from sklearn....

2018-05-20 15:24:21 56198 7

转载 python 使用scikit-learn对数据进行预处理

数据对于算法和模型的表现至关重要。原始数据中会包含各种各样的问题,我们在使用这些数据前要预先对这些问题进行处理。数据预处理的内容包括数据的清洗,如缺失值和零值的填充,数据标准化,二值化和哑编码等等。本篇文章介绍如何使用sklearn中的数据预处理库(preprocessing)对数据进行标准化处理。准备工作开始前的准备工作包括三个部分,首先导入需要使用的库,这里包括常规的数值计算库numpy和pa...

2018-05-20 15:23:28 1754 1

转载 使用R进行数据提取

数据提取是数据分析日常工作中遇到最多的需求,本篇文章介绍如何通过R按特定的维度或条件对数据进行提取,完成数据提取需求。读取并创建数据表首先第一步是读取数据,并创建名称为loandata的数据表。后面我们将从这个表中进行数据提取。12#读取并创建数据表loandata=data.frame(read.csv('loan_data.csv',header = 1))将数据表中的用户ID列设置为索引列,...

2018-05-20 15:22:11 23804 1

转载 使用R进行数据匹配

R中的merge函数类似于Excel中的Vlookup,可以实现对两个数据表进行匹配和拼接的功能。与Excel不同之处在于merge函数有4种匹配拼接模式,分别为inner,left,right和outer模式。 其中inner为默认的匹配模式。本篇文章我们将介绍merge函数的使用方法和4种拼接模式的区别。函数功能介绍merge函数的使用方法很简单,以下是官方的函数功能介绍和使用说明。merge...

2018-05-20 15:21:18 15785 2

转载 使用R进行数据清洗

数据清洗是整个数据分析过程中一个非常重要的环节。数据清洗的目的有两个,第一是通过清洗让数据可用。第二是让数据变的更适合进行后续的分析工作。本篇文章将介绍几种简单的使用R进行数据清洗的方法。读取并创建数据表首先将数据读取到R中,并创建名为loan的数据表。后面我们将对这个数据表进行清洗。12#读取并创建数据表loan=data.frame(read.csv('loan.csv',header = 1...

2018-05-20 15:19:46 6470

转载 使用R读取并查看数据

本篇文章介绍如何使用R读取并查看数据,包含一些最基础的函数使用方法和说明。后面还会陆续介绍数据清洗,匹配和提取等相关的操作。查看函数帮助对于新手来说,在使用R时最重要的是了解不同函数的使用方法。很多时候我们都是边用边学的状态,拿到一个函数如何快速的使用起来,最快捷的方法就是查看函数的帮助。在R中查看函数的帮助有两种方法,第一种是使用help,第二种是直接在函数前加问号(?)。R会直接显示出这个函数...

2018-05-20 15:06:52 35534

转载 RStudio快捷键

转自:http://www.cnblogs.com/muziyunxuan/p/4588460.html使用R语言-RStudio快捷键控制台功能Windows & LinuxMac移动鼠标到控制台Ctrl+2Ctrl+2控制台清屏Ctrl+LCommand+L移动鼠标至第一行HomeCommand+Left移动鼠标至最后一行EndCommand+Right历史记录翻滚Up/DownUp/...

2018-05-03 14:48:07 977

转载 pycharm 安装和使用

转自:http://www.cnblogs.com/muziyunxuan/p/7985265.htmlPyCharm 是我用过的python编辑器中,比较顺手的一个。而且可以跨平台,在macos和windows下面都可以用,这点比较好。首先预览一下 PyCharm 在实际应用中的界面:(更改了PyCharm的默认风格)  安装首先去下载最新的pycharm 2.7.3,进行安装。可以直接在官网下...

2018-05-03 14:45:58 165

转载 pycharm的一些快捷键

编辑类:Ctrl + Space 基本的代码完成(类、方法、属性)Ctrl + Alt + Space 类名完成Ctrl + Shift + Enter 语句完成Ctrl + P 参数信息(在方法中调用参数)Ctrl + Q 快速查看文档Shift + F1 外部文档Ctrl + 鼠标 简介Ctrl + F1 显示错误描述或警告信息Alt + Insert 自动生成代码Ctrl + O 重新方法C...

2018-05-03 14:44:15 145

原创 小象学院金融数据分析第二期

课程大纲: 第一课:数据分析基本知识复习(2课时)      1.  数据分析的基本概念          a.  目的          b.  数据获取和清理          c.  数据的描述性统计与可视化     2.  数据分析的常用模型          a.  监督式模型:(广义)线性回归,决策树,随机森林,支持向量机,神经网络          b.  非监督式模型:聚类分析,因...

2018-05-03 10:06:01 840

原创 MySQL 第六天学习笔记

第十七章 组合查询创建组合查询(UNION)需要价格小于等于5的所有物品的一个列表,而且还想包括供应商1001和1002生产的所有物品(不考虑价格)同样的,用WHERE也可实现union在实现的过程中,会自动取消重复的行,如果想要改变,可以用union all第十八章  全文本搜索首先,并非所有的引擎都支持全文本搜索。MySQL最常用的两个引擎是MyISAM和InnDB其中,MyISAM支持全文本...

2018-05-01 17:00:08 169

原创 MySQL 第五天学习笔记

第十三章  分组数据数据分组从products表中,返回供应商vend_id = 1003 对应的产品总数也可以创建分组  GROUP  BY 过滤分组GROUP BY 只能完整分组用HAVING 可以过滤分组,用法类似于WHERE同时用WHERE 和 HAVING找出products 表中,具有2个及以上、价格为10及以上的产品的供应商分组(group by)和排序(order by)总计订单价...

2018-04-30 19:58:36 202

原创 MySQL 第四天学习笔记

第十一章 使用数据处理函数函数第十章学过RTrim()函数,目的是去除串尾空格文本处理函数 Upper( ) 将文本转换为大写soundex在customers表中,有一个顾客Coyote Inc.  他的联系名为Y Lie  ,但是在输入时输入成了Y Lee想找Y Lie,找不到可以通过Soundex  它匹配所有发音类似于Y Lie 的联系名  搜索Y Lie ,搜到了Y Lee日期和时间处理...

2018-04-27 20:01:42 243

原创 MySQL 第三天学习笔记

第十章  创建计算字段拼接字段 Concat把 vendors表中的vend_name,vend_country  拼接成  vend_name(vend_country)拼接删除空格  RTrim  去掉右边的所有空格               LTrim  去掉左边的所有空格               Trim    去掉左右两边的空格同时可用AS取别名,重新命名执行算术计算orderit...

2018-04-26 21:57:11 111

原创 MySQL 第二天学习笔记

五一完整的时间把Python爬虫学完,这几天先学MySQL,争取入门第五章 排序检索数据:(order by  默认升序,降序需要在后面加DESC)按多个列排序指定排序方向找最大值,最小值(按照大小排序后,限定只出一行,就是最大最小值)第七章  过滤数据(用WHERE)等于小于列出价格小于10美元的产品不等于  (可用  <>  也可用  !=   )范围 BETWEEN AND思考:...

2018-04-24 20:50:47 180

转载 【转载】Navicat Premium 常用功能讲解

Navicat Premium 常用功能讲解1.快捷键 1.1. F8 快速回到当前对象列表 1.2. Ctrl + q 打开查询界面 1.3. Ctrl + d 快速修改当前的表结构 1.4. Ctrl + r 运行当前查询界面里面的 sql 语句 1.5. Ctrl + shift + r 运行当前选中的 sql 语句2.快速查看表结构 2.1.右键表信息->选择对象信息 2.2.右键表...

2018-04-24 15:10:45 1213

原创 MySQL 第一天学习笔记

说明:MySQL不区分大小写,但是为了清晰可见,命令语句都用大写,表名,行名都用小写查看一下现在有几个数据库:SHOW DATABASES;选择数据库USE xiaowei;查看xiaowei这个数据库里有什么表SHOW TABLES;查看customers这个表的内容,即看customers这个表的表名,也就是表列SHOW COLUMNS FROM customers;检索数据:检索单个列:SE...

2018-04-23 22:17:53 110

原创 MySQL必知必会前言

首先是下载MySQL没有安装成功,需要完全卸载干净了再安装,卸载过程见上一篇博客,安装过程参考《MySQL5.7从入门到精通》,书中有详细介绍。在开始学习前,从官网下载两个文件后续要学习的数据库,操作的表,都是以这个作为例子怎么导入?我是参考了一位博主的方法,非常不错https://blog.csdn.net/zoroday/article/list/2需要安装Navicat Premium,连接...

2018-04-23 21:36:51 210

转载 【转载】MySQL卸载干净

方法一:1.首先找到任务管理器(快捷键Ctrl+Alt+Delete),点上边的服务,找到MySQL右键停止服务。2.删除你在电脑上的MySQL安装的文件夹。3. 检查C:\WINDOWS目录下是否有my.ini文件,将其删除;找到安装MySQL时的数据存储文件(注:不是安装文件),我的是在C:\ProgramData目录下(也有人是在C:/Documents and Settings/AllUs...

2018-04-23 19:44:48 503

原创 Python 第十九天学习笔记

爬取网站  http://www.fishc.comimport urllib.requestresponse = urllib.request.urlopen("http://www.fishc.com")html = response.read()                                             response是一个对象,要把对象读出来print(ht...

2018-04-22 16:21:47 418

原创 Python 第十八天学习笔记

迭代器提供迭代方法的容器称为迭代器,通常接触的迭代器有序列(列表,元组,字符串)和字典字典:   {键:项}links = {"爸爸":"father",\         "妈妈":"mother",\         "妹妹":"sister"}for each in links:    print("%s -> %s" % (each,links[e

2018-04-21 18:48:00 285 2

原创 Python 中的列表推导式

列表推导式是Python基础,好用,而又非常重要的功能,也是最受欢迎的Python特性之一,可以说掌握它是成为合格Python程序员的基本标准。本质上可以把列表推导式理解成一种集合了变换和筛选功能的函数,通过这个函数把一个列表转换成另一个列表。注意是另一个新列表,原列表保持不变。看示例:对a中每个元素求立方求a中偶数元素的立方  求a中大于5的偶数的元素的立方多层for循环,将一个嵌套列表转化成...

2018-04-21 15:11:41 435

原创 Python % 汇总

python中用%代表格式符,表示格式化操作,常用的操作有%s,%d,%r等.1.%s,%r,%d分别表示字符串以str(),rper(),以及十进制整数表示,%f表示结果为浮点型,更多见下表:...

2018-04-21 10:52:31 24725 1

原创 Python 第十七天学习笔记

调缩进:ctrl + [     左             ctrl + ]     右属性访问property()  可以用属性去访问属性?什么意思。。。>>> class C: def __getattribute__(self,name): print("getattribute") return super().__getattribute__(name) def ...

2018-04-18 21:42:23 267

原创 Python 第十六天学习笔记

鸭子类型:class Nstr(str): def __sub__(self,other): return self.replace(other,'')     >>> a = Nstr("I love you aaaaaa")>>> b = Nstr("a")>>> a - b                   'I love you '

2018-04-17 21:57:13 418

原创 Python 第十五天学习笔记

今天终于要开始学习魔法方法了,上周一的讨论班时就开始看, 到今天才正式能看进去。。温故知新,稳扎稳打,不要急第十二章  魔法方法__init__(self) 方法需要注意两点:class Rectangle:    def __init__(self,x,y):                 首先要对变量进行这样的一个调用说明        self.x = x        self.y = ...

2018-04-16 19:46:12 304

原创 Python 第十四天学习笔记

今天去面试数据分析师,遇见的是本科北交大硕士中科院学工业工程的同学。真的是压力山大。面试被问到了SQL。最近都不要投简历关注实习了,先充电,学完Python再学SQL。今天做第十一章类和对象的习题0.对象中的属性和方法,在编程中实际是什么?变量属性,函数方法1.类和对象是什么关系?对象是类的实例化,类是抽象的,对象是具体的2.如果我们定义了一个猫类,那你能想象出“猫”类实例化的对象有哪些?叮当猫,...

2018-04-14 20:47:43 1480 1

原创 Python 第十三天学习笔记

0. 请写一个密码安全性检查的脚本代码:check.py1. # 密码安全性检查代码2. #3. # 低级密码要求:4. #   1. 密码由单纯的数字或字母组成5. #   2. 密码长度小于等于8位6. #7. # 中级密码要求:8. #   1. 密码必须由数字、字母或特殊字符(仅限:~!@#$%^&*()_=-/,.?<>;:[]{}|\)任意两种组合9. #   2....

2018-04-11 21:31:09 181

原创 Python 第十二天学习笔记

0. 设计一个验证用户密码程序,用户只有三次机会输入错误,不过如果用户输入的内容中包含"*"则不计算在内。count = 3password = input("您的密码是:")while count:    passwd = input("请输入您的密码:")    if passwd == password:        print("密码输入正确")        break    elif...

2018-04-10 20:36:51 391

原创 Python 第十一天学习笔记

0. if not (money < 100): 这行代码相当于?   if money >=1001. assert 的作用是什么?断言,assert这个关键字我们称之为“断言”,当这个关键字后边的条件为假的时候,程序自动崩溃并抛出AssertionError的异常。什么情况下我们会需要这样的代码呢?当我们在测试程序的时候就很好用,因为与其让错误的条件导致程序今后莫名其妙地崩溃,不如...

2018-04-08 20:37:37 244

原创 python 第十天学习笔记

清明小长假,北京下雨下雪下冰雹,还有好多作业,做了一天作业,出去玩了一天,断更了两天从今天开始从第一章开始写课后习题第一课:5. 如果我需要在一个字符串中嵌入一个双引号,正确的做法是?你有两个选择:可以利用反斜杠(\)对双引号转义:\",或者用单引号引起这个字符串。例如:' I l"o"ve fishc.com '。>>> print('I "love" you')I "love...

2018-04-07 16:43:59 226

原创 python 第九天学习笔记

昨天晚上做小组作业断了一天,还错过了度厂的在线笔试由于装不上easygui,先不学图形界面,今天学习类和对象#一个对象的特征成为“属性”,一个对象的行为称为“方法”class Turtle:    color = "green"    weight = 10    legs = 4    shell = True    mouth = "大嘴"    def climb(self):       ...

2018-04-03 21:43:07 189

原创 python 第八天学习笔记

异常处理:AssertionError 断言assert语句失败>>> my_list = ["我爱小甲鱼"]>>> assert len(my_list) >0>>> my_list.pop()                              pop()   默认弹出最后一个元素,且删除'我爱小甲鱼'>>&am

2018-04-01 20:04:30 252

原创 python 第七天学习笔记

文件系统:返回当前工作目录 getcwd()>>> import os>>> os.getcwd()'C:\\Users\\lenovo\\AppData\\Local\\Programs\\Python\\Python36'创建单层目录>>> os.mkdir("C:\\A")>>> os.mkdir("C:\

2018-04-01 14:46:16 136

原创 python 第六天学习笔记

用{}括起来,但是没有体现映射关系,则为集合,集合即唯一,无序>>> set1 = {1,2,3,4}>>> set2 = set([1,2,3,4])               set()  : 工厂函数   ()里可以是列表list[]  也可以是元组 tuple()>>> set1 == set2利用集合的唯一性去除列表中重复的元素li...

2018-03-30 19:51:15 122

原创 python 第五天学习笔记

今天学习第七章 字典和集合dict2 = {"a":"one","b":"two","c":"three"}dict2["b"]结果是“two”定义字典用{}定义空字典     empty={}这三种方法得到的结果一样:dict1 = {"F":70,"i":105,"s":115,"h":

2018-03-29 18:27:00 194

机器学习实战,中+英pdf+全套代码

机器学习实战,中+英pdf+全套代码 机器学习实战,中+英pdf+全套代码 机器学习实战,中+英pdf+全套代码 机器学习实战,中+英pdf+全套代码

2018-05-29

MySQL 运维16部 视频+代码全套

MySQL 运维16部 视频+代码全套 MySQL 运维16部 视频+代码全套 MySQL 运维16部 视频+代码全套 MySQL 运维16部 视频+代码全套

2018-05-08

利用python进行数据分析 课本+代码+数据 全套

利用python进行数据分析 课本+代码+数据 全套 利用python进行数据分析 课本+代码+数据 全套 利用python进行数据分析 课本+代码+数据 全套 利用python进行数据分析 课本+代码+数据 全套

2018-05-08

MySQL 轻快掌握 视频+ppt+代码+数据 全套

MySQL 轻快掌握 视频+ppt+代码+数据 全套 MySQL 轻快掌握 视频+ppt+代码+数据 全套 MySQL 轻快掌握 视频+ppt+代码+数据 全套 MySQL 轻快掌握 视频+ppt+代码+数据 全套

2018-05-08

方差分析案例分析

方差分析案例分析

2018-03-26

小甲鱼python视频代码课件课后题全套打包

小甲鱼python视频代码课件课后题全套打包 零基础学习python,全套资源,一套就够

2018-03-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除