自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 hadoop 安装入门教程

学习的网站:Hadoop集群系列,以及零基础学习hadoop到上手工作线路指导(编程篇)。

2019-03-08 16:37:57 225

转载 在虚拟机上安装centOS

1.创建虚拟机打开虚拟机软件VMware,选择文件–新建虚拟机,选择典型安装,下一步,选择稍后安装操作系统,下一步,客户机操作系统选择Linux,下一步,设置好虚拟机的名称和位置,进入下一步,下一步,点击自定义硬盘按钮,可根据需要,修改内存、硬盘和处理器的大小等。点击CD/DVD这一项,浏览选择系统CentOS系统镜像,确定,完成。2.开启虚拟机2.1 点击开启此虚...

2019-03-08 16:33:45 248

转载 python CGI编程----环境搭建与运行

1.公共网关接口CGI是外部应用程序(CGI程序)与WEB服务器之间的接口标准,是在CGI程序和Web服务器之间传递信息的过程。CGI(Common Gateway Interface,通用网关接口),在物理上是一段程序,运行在服务器上,提供同客户端HTML页面的接口。一个实际例子:现在的个人主页上大部分都有一个留言本。留言本的工作是这样的:先由用户在客户端输入一些信息,如评论之类的东西。接着...

2019-02-20 15:58:32 1714 2

原创 Python文件I/O及File方法

模式rr+ww+aa+读++++写+++++创建++++覆盖++指针在开始++++指针在结尾++实例#打开--操作--关闭文件#尝试一:#打开file1=open(r'C:\Users\Adamin\Desktop\liuyan.xls...

2019-01-15 13:33:56 880

转载 Python数据类型(Dictionary)----字典内置方法

方法描述备注dict.clear()删除字典内所有元素无返回值,删除dict.copy()返回字典的浅复制注意copy和直接赋值的区别, 复制dict.fromkeys()创建一个新字典,以序列seq中元素做字典的键,新建dict.update(dict2)把字典dict2的键值对更新到dict里添加dict.get(...

2019-01-11 14:38:51 277

转载 Python数据类型(List)----列表方法

方法描述list.append(obj)在列表末尾添加新的对象list.count(obj)list.extend(seq)list.index(obj)list.insert(index,obj)list.pop()list.remove(obj)list.reverselist.sort()...

2019-01-11 11:01:05 363

转载 Python数据类型(String)----字符串内建方法

方法描述转换类string.capitalize()把字符串的第一个字符大写string.lower()转换string中所有大写字符为小写string.upper()转换string中的小写字母为大写string.swapcase()翻转string中的大小写string.title()返回“标题化”的string,就是说所有单词都是...

2019-01-10 11:16:55 371

转载 python运算符----之逻辑运算符

逻辑运算符 , 其实就是True和False的判断 , 而在python中 , 一切非 0 的对象 , 都被当做True ,所以六种类型(数字,字符串,列表,元组,字典,集合)都支持该运算符。python语言支持逻辑运算符,以下假设变量a为10,b为20:运算符逻辑表达式描述实例andx and y布尔“与”–如果x为False,x and y 返回False,否则...

2019-01-07 15:36:09 511 1

转载 python运算符----之位运算符

位运算符按位运算符是把数字看作二进制来计算的。Python中按位运算法则如下:操作符描述实例&按位与运算符,当且仅当两个操作数的某一位都非0时,该位的结果才为1。(A&B)得12,即0000 1100|按位或运算符,只有两个操作数的某一位有一个非0时,该位的结果才为1。(A|B)得61,即0011 1101^按位异或运算符,两个操作...

2019-01-04 16:27:21 249 1

转载 oracle 分析函数之一

分析函数和聚合函数相似,但是对于每一组记录,无论多少行,聚合函数只返回一行值,而分析函数对其中每一条记录都返回值。1.排名几种排名需求:排名无并列,且每个排名与紧接着的下一个排名都是连续的;----row_number排名有并列,且并列的排名与紧接着的下一个排名不连续;----rank排名有并列,且并列的排名与紧接着的下一个排名连续;----dense_rank-- 把2013年4...

2018-11-13 14:15:02 153

原创 oracle 字符串类单行函数

------字符类单行函数1.大小写转换2.字符与ASCII码转换3.字符串连接4.字符串填补5.字符串修剪6.取子串7.查找替换1.大小写转换INITCAP:每个单词的第一个字母转为大写。LOWER:全部转为小写。UPPER:全部转为大写。select UPPER('where is my book?') from dual;select lower('WHERE ...

2018-11-12 16:44:55 175

原创 Oracle日期类函数

日期类型变量的定义:to_date()函数select to_date('2018年11月9日 23时24分24秒','yyyy"年"mm"月"dd"日" hh24"时"mi"分"ss"秒"')

2018-11-12 11:22:42 604

原创 Navicat中Oracle执行计划

explain plan for 要执行的语句;select * from table(dbms_xplan.display);

2018-11-06 10:35:32 10324 1

转载 oracle12c的下载与安装

1.下载在Oracle官网下载压缩文件,File1和File2两个文件都要下载,并且 两个同时选中解压到一个文件夹里面。2.安装2.1解压后的目录下,双击setup.exe,稍等一会。2.2 点击下一步,并选择是2.3销售报表...

2018-11-02 16:05:24 6394

转载 mysql密码修改及用户设置

一、修改root密码在知道root密码时,可以使用ALTER USER 'root'@'localhost' IDENTIFIED BY '123456';指令来修改root用户的密码。一、mysql用户设置如果你需要添加mysql用户,你需要在mysql数据库中的user表添加新用户即可。以下为添加用户的实例,用户名为guest,密码为guest123,并授权用户进行SELECT...

2018-10-30 13:40:31 434

转载 mysql的下载与安装

一、下载1.进入网址:mysql downloads2.选择: 3.进入后,点击:4.选择需要的平台和版本(安装版和免安装版),进行下载,此处我下载的是免安装版的“Windows(x86,64-bit),ZIP Archive”二、安装1.下载后,将zip包解压到相应的目录,这里我将解压后的文件夹放在 G:\application-1029 下。2.接下来我们需要配置下mysq...

2018-10-30 10:32:25 141

原创 字符串和datetime相互转换中的strftime和strptime

datetime.datetime.strftime():接受日期/时间,输出为字符串,即把时间对象格式化为字符串datetime.datetime.strptime():接受字符串,输出日期/时间,即把字符串转化为日期/时间辅助记忆:strftime: str_foramt_timestrptime: str_parse_time若实在记不住,可在pychcarm中 view->...

2018-10-10 12:05:11 2136

原创 numpy中数组的数组型索引和布尔型索引

本文参考Indexing-arrays,在理解该文的基础上,本文列出了四维布尔型索引,可加深对布尔型索引的理解。1.数组型索引数组型索引的数组,其返回的是原始数据的副本,不是视图。数组型索引取值必须是整数。索引中的每个值指示数组中使用哪个值代替索引。但索引值不能越界。>>> x=np.arange(10,1,-1)>>> x[np.array...

2018-09-17 15:25:54 6023

原创 编码Unicode与解码

  1.编码(Unicode)            unicode(统一码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。        最早的计算机在设计时采用8个比特(bit)作为一个字节(1字节=8位,即1个字节对应8位二进制数),一个字节能表示的最...

2018-08-27 15:59:26 3255

原创 python--识别图片中的文字

本篇文章主要参考了 python图像处理之识别图像中的文字 这篇文章,在实现的过程中出现了些偏差,特此记录。因为此时笔者不是第一次安装,所展示的结果会和首次安装的结果有所差别。1.安装PIL以管理员的身份打开命令提示符,输入:pip install pillow.(注:PIL是python平台事实上的图像处理标准库,但PIL仅支持到python2.7,加上年久失修,于是在PIL的基础上...

2018-08-24 11:53:28 87359 14

原创 《python数据分析与挖掘实战》第11章应用系统负载分析与磁盘容量预测的程序实现--时间序列分析

1.数据抽取本案列抽取的是2014-10-01到2014-11-16财务管理系统中某台服务器的磁盘的相关数据。在此要检验discdata.xls是否符合提取的要求。import pandas as pdimport datetimefrom pandas import Seriesdata=pd.read_excel(r'D:\file\book_pythonDADM\chapte...

2018-08-02 15:38:20 1850

原创 matplotlib绘图时汉字,符号显示问题

1.作图时汉字显示为方块的问题在用matplotlib进行作图时,如果含有中文标签,会发现不能正常显示,这是因为matplotlib的默认字体是英文字体,解决它的办法是,在作图前手动指定默认字体为中文字体,如黑体(SimHei)。import matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] #...

2018-07-30 14:14:09 4022

原创 字符串中的反斜杠\问题 (Python)

如果字符串中含有反斜杠,此时要在反斜杠前加一个反斜杠。data['ENTITY']的取值如下,此时要选取值为C:\的数值,则相应的命令为:data[data['ENTITY']=='C:\\']如果字符串中出现两个反斜杠,此时要在反斜杠前加两个反斜杠。...

2018-07-30 13:35:12 9520

原创 TensorfFlow在window下的安装

本次安装是按照博客TensorFlow在window下的安装进行的,只是在安装的过程中存在一些细微的差别,特此记录一下。 1.Anaconda的安装与相关配置1.1 tensorflow是基于python脚本语言,本次是基于Anaconda来进行安装的,需要先安装Anaconda并配置好环境变量。由于此前博主已经安装好了Anaconda,在此关于Anaconda的安装就略过了。在c...

2018-07-18 10:51:41 740

原创 keras在window下的安装配置

安装前提条件是已经安装好了Anaconda3,并配置好了环境。(本文的路径是以笔者的anaconda安装路径为准,读者需要根据自己的安装路径填写)1.安装MinGw。打开C:\Window\System32\cmd.exe(以管理员的身份运行),输入命令conda install mingw libpython,等几分钟即可安装好包libpython和mingw。此时就会有D:\liuyan\an...

2018-07-16 14:00:27 1739

原创 线性回归学习

进行线性回归的步骤:1.构建线性回归模型及目标,约束条件目标函数,即,使得到的模型为残差平方和最小,而Lasso回归是构建一个惩罚函数,即回归系数绝对值之和小于一个常数。2.参数估计3.模型检验模型的检验有:拟合优度检验,回归方程的显著性检验,解释变量的显著性检验,经济意义检验F检验用来检验拟合的模型的显著性,t检验用来检验拟合的模型系数的显著性4.经济预测线性回归相关的知识点:最小二乘估计,岭回...

2018-07-10 14:06:12 601

原创 《python数据分析与挖掘实战》第12章协同过滤推荐算法程序实现

本文是作者首次根据实际数据进行的一次完整的数据分析,所以在程序的实现上是尽量选择自己熟悉的语句,笔者认为应先能用一种方法解决问题,然后再结合别人的分析思路,优化自己的解决方案。1.连接数据库,获得原始数据import pandas as pdimport pymysqlconn = pymysql.connect(host='localhost', user='root', password=...

2018-06-26 10:08:29 1228

原创 python--NumPy/Pandas 数据赋值时的视图和副本问题

1.NumPy数组的切片、赋值将一个标量赋值给一个切片(如arr[5:8]=12)时,该值会自动传播到整个选区。跟列表最重要的区别在于,数组切片是原始数组的视图。即数据不会被复制,视图上的任何修改 都会直接反映到源数组上。注:如果想要得到的是ndarray切片的一份副本而非视图,就需要显式地进行复制操作,如arr[5:8].copy()。2.pandas--DataFrame数据切片、赋值通过索引...

2018-05-28 17:13:44 2000 1

原创 re模块-字符串的提取

问题:若想把翻页网址'http://www.lawtime.cn/info/gongsi/falvzr/20111222131560_8.html'进行还原为'http://www.lawtime.cn/info/gongsi/falvzr/20111222131560'可以从以下三个角度进行,即直接匹配字符串,替换获得字符串,拆分获得字符串。解答:1.直接匹配字符串re模块里用来匹配特定字符串的...

2018-05-25 16:59:53 7960

原创 数据预处理----数据清洗

1.DataFrame删除满足特定条件的行    #删除含有'yi'的行ly=DataFrame([['huahua',1,2],['yimu',3,4]],columns=['name','a','b'])ly[~ly['name'].str.contains('yi')]2.

2018-05-24 17:27:32 826

原创 第一份BI分析项目总结

BI分析项目总结 1. 结合业务了解数据       首先要对相关业务有一定的了解和认知,这样结合业务可以更高效的去了解数据库中包含了哪些数据,这些数据对应的业务是什么,即数据的作用。哪些是基础表(数据),哪些是次要数据,以及这些数据之间的业务关系。在查看数据的同时,要留意数据是否符合条件,如时间戳,颗粒度不够等问题,因为只有数据符合最基本的条件,这样的数据才有价值。只有对数据有了整体的把控后,才...

2018-03-13 21:20:35 2171 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除