自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 Python绘制柱形图

#柱形图import pandasimport numpyimport matplotlib from matplotlib import pyplot as plt#导入数据data_columns=pandas.read_csv('D://Python projects//reference data//6.4//data.csv')#定义中文格式font={'fam...

2019-07-23 14:24:31 15428 1

转载 Python报表自动化

1.案例场景作为企业的数据统计岗,每天都需要做很多报表,日报、周报、季报、月报。如果我们能利用Python的数据分析功能把这些常规的流程标准化的报表自动化,那么我们将能有更多的时间集中于数据背后的业务发展及逻辑的分析上,这样才能被称为是企业的数据分析师,而不是简单的数据搬运工。下面我们通过一个简单的案例来看看Python报表自动化的建模过程。某银行贷款业务部门数据分析员每天需要根据系统生成的个...

2019-07-23 11:20:21 449

原创 数据分析资料汇总(含python、爬虫、数据库、大数据、tableau等)

一、Python基础Python简明教程(Python3) Python3.7.4官方中文文档 Python标准库中文版 廖雪峰 Python 3 中文教程 Python 3.3 官方教程中文版 Python3 Cookbook 中文版 笨办法学 Python(PDFEPUB) 《Think Python 2e》最新版中文 Python 核心编程 第二版 中文 菜鸟教程 P...

2019-07-23 11:10:58 935

原创 Python绘制饼图和直方图

#饼图,常与结构分析结合使用import pandasimport numpyimport matplotlibimport matplotlib.pyplot as pltimport matplotlib.font_manager as font_manager#导入数据plot_pie=pandas.read_csv('D://Python projects//ref...

2019-07-19 16:15:20 773

原创 python绘制散点图和折线图

#散点图,一般和相关分析、回归分析结合使用import pandasimport matplotlibimport matplotlib.pyplot as pltplot_circle=pandas.read_csv('D://Python projects//reference data//6.1//data.csv')#定义主题颜色maincolor=(47/...

2019-07-19 14:40:41 1439

原创 Python的矩阵分析

import pandasimport matplotlibimport matplotlib.pyplot as plt#设置颜色,最后一位表示透明度maincolor=(42/256,87/256,141/256,1);#设置字体为中文,大小为20,字体为雅黑font={ 'family':'SimHei', 'size':20}matplotlib...

2019-07-18 16:10:52 499

原创 Python的相关分析和RFM分析

import pandas wa=pandas.read_csv('D://Python projects//reference data//5.6//data.csv')#查看两列之间的相关度wa['人口'].corr(wa['文盲率'])#查看两两之间的相关度#选择多列的方法wa[['人口','平均收入','文盲率','超市购物率','网上购物率']]wa[...

2019-07-17 14:55:39 299

原创 python的基本统计和分组分析和分布分析和交叉分析和结构分析

import pandas fa=pandas.read_csv('D://Python projects//reference data//5.1//data.csv')#查看学生分数的描述性统计结果fa.score.describe()#计数fa.score.sizefa.score.max()fa.score.min()fa.score.sum()#求平均值fa.s...

2019-07-15 17:48:09 1033

原创 时间处理,时间抽取和虚拟 变量

import pandas fa=pandas.read_csv('D://Python projects//reference data//4.16//data.csv', encoding='utf8')#字符串转成时间格式fa['时间']=pandas.to_datetime( fa.注册时间, ...

2019-07-15 13:18:23 752

原创 数据标准化与分组

import pandasda=pandas.read_csv('D://Python projects//reference data//4.14//data.csv')#round是保留多少位小数da['scale']=round((da.score-da.score.min())/(da.score.max()-da.score.min()),2)输出结果...

2019-07-12 16:29:29 529

原创 记录合并,字段合并,字段匹配

#数据合并,类似unionimport pandas ab=pandas.read_csv('D://Python projects//reference data//4.10//data1.csv' ,sep='|')ac=pandas.read_csv('D://Python projects//reference data//4.10//da...

2019-07-12 13:23:40 221

转载 Python自动发邮件

思路:python发邮件需要掌握两个模块的用法,smtplib和email,这俩模块是python自带的,只需import即可使用。smtplib模块主要负责发送邮件,email模块主要负责构造邮件。smtplib模块主要负责发送邮件:是一个发送邮件的动作,连接邮箱服务器,登录邮箱,发送邮件(有发件人,收信人,邮件内容)。email模块主要负责构造邮件:指的是邮箱页面显示的一...

2019-07-12 10:42:04 145

原创 记录抽取及随机抽样及分层抽样

import pandasba=pandas.read_csv('D://Python projects//reference data//4.8//data.csv')bc=ba['id|comments|title'].str.split('|',3,True)#单条件抽取bc.columns=['id','comments','title']#将字符型转成整数型bc['...

2019-07-11 14:42:06 538

原创 字段的抽取、拆分,和自定义函数替换

#字段抽取from pandas import read_csvab=read_csv('D://Python projects//reference data//4.6//data.csv')#将数字型转换成字符型ab['tel']=ab['tel'].astype(str)#运营商bands=ab['tel'].str.slice(0,3)#地区areas=ab['tel'...

2019-07-11 11:02:16 197

原创 重复值和缺失值和空格值的处理

#重复值处理from pandas import read_csvak=read_csv('D://Python projects//reference data//4.3//data.csv')#找出重复的位置al=ak.duplicated()#根据某些列判断是否重复ao=ak.duplicated('id')ai=ak.duplicated(['id','key'])#提取重...

2019-07-10 16:46:01 465

原创 python的导入与导出

#数据导入#导入csv文件from pandas import read_csvak=read_csv('D://Python projects//reference data//4.1 数据导入//1.csv')#导入txt文件#无表头版from pandas import read_tablear=read_table('D://Python projects//referenc...

2019-07-03 15:12:54 787

原创 Python中向量化运算

#生成等差数列#一般的赋值需要通过for函数r1_10=range(1,10,1)for i in r1_10: print(i) import numpynumpy.arange(2,10,3)r=numpy.arange(2,10,3)#向量化运算r+rr-rr*rr/r#函数的向量化次方运算numpy.power(r,3)#向量化运算,比较运算r...

2019-07-02 15:19:46 1310

原创 python中关于索引和数据框的使用

#生成一个带有自定义索引的数据框from pandas import DataFramedf=DataFrame({ 'age':[22,23,24], 'name':['Penny','Frank','Dylan'] }, index=['第一','第二','第三'])#按列访问df['age']df[['age','na...

2019-07-02 13:32:33 4572

转载 如何通俗易懂的解释卷积

以下内容全部是转载来自作者:palet链接:https://www.zhihu.com/question/22298352/answer/637156871来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。仅用于本人学习对卷积的困惑卷积这个概念,很早以前就学过,但是一直没有搞懂。教科书上通常会给出定义,给出很多性质,也会用实例和图形进行解释,但...

2019-07-01 17:32:19 341 1

原创 python中Series序列的使用(注意区分大小写)

#如何定义一个序列from pandas import Seriesx=Series( ['a',True,1] )#重置序列号x=Series( ['a',True,1], index=['first','second','third'] )#通过序列快速访问值x[2]x['first']#不能越界访...

2019-07-01 17:15:32 1540

原创 python中与或非的运算、浮点数越界问题、反斜杠符的运用

#基本的逻辑运算 x=1 y=2 z=x>y t=True f=False #基本的布尔运算 #与运算 True & True True & False False & False #或运算 True | True True | False False | False...

2019-07-01 14:56:33 374

原创 Python的format函数与math的初识

#format函数的第一种用法a=0.2+0.3print('0.2+0.3的和是{}'.format(a))print()#format函数的第二种用法b=0.1+0.2print(f'0.1+0.2的和是{b}')print()#向下取整,int函数c=14523.785print(f'14523.785向下取整是{int(c)}')#四舍五入,round函数print...

2019-06-28 16:58:05 267

原创 Python的变量与常量与基本命名规则

#变量与常量my_name="刘德华"print (my_name)#再次赋值my_name="周杰伦"print (my_name)#大小写敏感My_name="吴彦祖"print (My_name)#变量名只能以字母或者下划线开头,不能用空格#4_clock="This is a log"#print (4_clock)-----------------...

2019-06-26 15:52:17 1495

转载 学习使用turtle在屏幕上绘制图形

import turtleturtle.pensize(4)turtle.pencolor('red')turtle.forward(100)turtle.right(90)turtle.forward(100)turtle.right(90)turtle.forward(100)turtle.right(90)turtle.forward(100)turtle.main...

2019-05-21 15:57:39 1911

原创 需要同时取多行数据,把ireport填报数据抽到MYSQL数据库里

#将《L1_HOTEL_ROOM_INFO酒店房间基础信息》按日志表更新历史数据失效UPDATE   DISNEY_EDW.L1_HOTEL_ROOM_INFO C,  (SELECT DISTINCT     A.BBQ_   FROM    IRPT.ES10_LOG A   WHERE A.OPERNAME_ = '上报数据'     AND A.USERID_ = 'DISNEY'    ...

2018-03-20 11:02:30 281

原创 关于tableau表格,百分比无法加权汇总

把百分比的字段用sum的方式进行计算,ifnull 用于把空数据置为0如:IFNULL(sum([已出租面积(审核通过)])/sum([总可租赁面积]),0)这样在表格汇总小计数据的时候,百分比的数据就不会直接相加,而是加权获得了。

2017-12-12 16:20:39 2497

原创 在SQL server 中创建一个班级学生信息

1.    创建一个学生班级信息create databaseschool on primary(Name=school_data,filename='E:\software\exercise\school.mdf',size=5mb,maxsize=unlimited,filegrowth=10%)log on (Name=school_log,f

2017-09-25 18:02:28 4580

转载 SQL server数据库的一些基本操作

1.    创建数据库-- dropdatabase db_study; /*删除数据库*/createdatabase db_study on  primary -- 默认就属于primary文件组,可省略(/*--数据文件的具体描述--*/    name='stuDB_data',  -- 主数据文件的逻辑名称    filename='E:\Study\SQLS

2017-09-25 18:00:41 555

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除