自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (1)
  • 收藏
  • 关注

原创 echarts中的地图与Axure交互

1.将echarts中的地图嵌入Axure中实现可视化https://echarts.apache.org/examples/zh/editor.html?c=map-polygon.2.将echarts中的图加载到Axure中,步骤:https://www.pmyes.com/thread-35460.htm3.将echarts中https://echarts.apache.org/examples/zh/editor.html?c=map-polygon.的地图下载到本地,然后转存成svg格式,

2020-08-10 15:01:06 1800

原创 pandas 实现excel数据透视表维度转换

1.pivot_table() 实现三维数据行列转换,将左边数据格式转换成右边显示格式首先将宽表变成长表,用pd.melt()其中主要参数有id_vars:不需要被转换的列名var_values:需要被转换的列名,如果剩下的列名都需要被转换,则可以忽略不写;var_name和value_name对应转换的自定义列名https://pandas.pydata.org/pandas-docs/version/0.19.0/generated/pandas.melt.htmlim

2020-07-05 22:31:19 1472

原创 python -----datetime总结

1.pd.to_datetime()函数:pandas数据框读取Excel中的数据时,日期格式为年月日 时间,将其转换成日期格式tiems = pd.read_excel(r'D:\test.xlsx')tiems['实际结束日'] = tiems['实际结束日'].apply(lambda x:pd.to_datetime(x))print(tiems['实际结束日'])...

2020-06-20 23:40:06 393

原创 pandas 和Excel交互中 相关总结

1.pandas从Excel中读取数据并且在第一行插入数据import pandas as pdimport numpy as nptest = pd.DataFrame({'C1':['a','b','c','d'],'C2':[43,56,63,32]})print(test)#修改一下列名将列名修改为'指标','北京'test.columns = ['指标','北京']...

2020-03-16 17:26:03 366

原创 powerbi中同比和环比的应用

1.计算环比新建度量值函数DATEADDhttps://www.powerbigeek.com/understanding-dateadd/函数DATEADD 用于选择时间的偏移 第一个字段,时间指标,第二个字段指返回作为第一参数的时间列中的日期,第三个参数指平移时间参考,有天,月和年,本文参考指标以月为参照对象;上期销售额指上月销售额,计算同比将month换成year...

2020-02-12 17:52:34 3575

原创 POWERBI数据处理-二维转换成一维数据,数据填充及提取

1.将二维数据表格式转换成一维;将数据导入powerbi中同时选中利润中心,一级科目,二级科目然后点击逆透视其他列,然后数据转换成一维数据2.powerbi中数据的填充及数据提取对于部门字段下数据填充填充结果对于员工编号,源数据中为文本格式编号为4位数,对员工编号使用Text.PatStart(需要填充的字段名,需要填充的位数,填充值)该公式子填充的时...

2020-02-02 17:14:06 5778

原创 GM(1,1)灰色预测模型

1.灰色预测模型在数据分析领域,人们根据数据系统的特点将数据系统分为白色系统,黑色系统和灰色系统。白色系统是说系统内部特征清楚明了,信息完全透明,黑色系统意味着外界对系统内部完全不了解,只能通过外界的联系加以观察研究,灰色系统介于黑白之间,信息属于半透明状态,只有一部分信息是已知的且系统内各因素间有不确定的关系。灰色预测法是一种预测灰色系统的方法。通过鉴别系统因素之间(即:模型参数之间)发...

2019-10-31 17:31:44 9353 5

原创 python-pandas 实现多行转换成一行

1.数据2、代码import pandas as pddf = pd.read_excel(r'./data.xlsx')df['m'] = df['con']+'*'+df['tet']dd = df.groupby('ID')['m'].agg('*'.join)print(dd)使用agg函数使用join连接连接符使用*,保存成excel数据,使用分列符分割...

2019-10-30 22:28:43 9606 1

原创 python中分组排序--groupby(),rank()

1.python 中分组统计1.1按性别统计出年龄最大,最小,平均值import pandas as pddf = pd.read_excel(r'./data.xlsx')print(df)ages = df.groupby(['gender'])['age']ages_min = ages.min()ages_max = ages.max()ages_mean = a...

2019-10-21 17:57:01 31387 1

原创 python爬虫-北京租房可视化分析

目的使用scrapy框架爬取租赁信息,对数据进行处理利用python中的seaborn,matplotlib库进行可视化分析,最后查看昌平区待租量排前十小区对应地铁站点,及其平均租房价格。1.爬虫使用scrapy框架爬取beike租房信息,将获取的数据存入到MySQL中,其中使用正则匹配出小区的经纬度信息,用于地图可视化分布;一共获取了26000多条数据,获取时间为19年8月...

2019-09-08 17:46:16 3591 2

原创 python下安装pytesseract,tesseract-ocr

1.首先安装pytesseractpip install pytesseract2.安装 tesseract-oct链接:https://pan.baidu.com/s/1chjCJnWNlmBgp32YkpcSmw提取码:wfb4按照默认值安装,安装完成后将安装目录添加环境变量3.安装完成后测试cmd 打开命令窗口输入命令检测安装是否成功4.识别图片中内容...

2019-09-03 22:26:55 1095

原创 python在金融领域的应用-信用卡评分模型

一、背景 信用卡评分是以大量数据的统计结果为基础,根据客户提供的资料和历史数据对客户的信用进行评估,评分卡模型一般分为三类:A卡:申请评分卡,B卡:行为评分卡,C卡:催收评分卡。 本文主要涉及的为申请评分卡,申请评分卡的目标主要是区分好客户和坏客户,评分卡的结果为高分数的申请人意味着比低分数的申请人的风险低。二、项目流程数据源分析数据源自于kagg...

2019-08-28 22:32:32 2758 2

原创 pandas - 时间天数计算-实现excel中IF(ROUNDDOWN(),,)函数

1.根据开始日和结束日计算天数2.pandas 实现过程import pandas as pd#1.读取数据df = pd.read_excel(r'./data/time.xlsx')print(df)#2.时间格式转换df['开始日'] = pd.to_datetime(df['开始日'])df['结束日'] = pd.to_datetime(df['结束日'...

2019-06-14 14:24:26 1655

原创 python-pandas-模糊匹配 读取Excel后 获取指定指标

1.首先读取Excel文件数据代表了各个城市店铺的装修和配置费用,要统计出装修和配置项的总费用并进行加和计算;2.pandas实现过程import pandas as pd#1.读取数据df = pd.read_excel(r'./data/pfee.xlsx')print(df)cols = list(df.columns)print(cols)#2...

2019-06-14 13:43:05 6846 1

原创 Python-pandas-DataFrame-多层索引转换

frame_1123=pd.DataFrame({'a':range(4),'b':range(4,0,-1),'c':['one','one','two','two'],'d':[0,1,2,3]})frame_1123Out[55]: a b c d0 0 4 one 01 1 3 one 12 2 2 two 23 3 1 two

2018-05-07 20:15:12 6450

原创 Python-pandas-多层索引

多层索引可以切片,但是:1.外层标签必须是经过排序的;2.每个索引的外层标签第一个字母必须得一致,要么全是大写,要么全是小写Series_123=pd.Series(np.random.randint(10),index=[['apple','apple','apple','apricot','apricot','apricot','banana','banana','blackber

2018-05-07 18:59:03 8791

原创 python-pandas-多层索引

series_1=pd.Series(np.random.randn(12),index=[['r1','r1','r1','t1','t1','s1','s1','s1','s1','p1','q1','q1'],[9,8,7,6,5,4,3,2,1,0,12,11]])series_1Out[75]: r1 9 1.522556 8 0.059487

2018-05-07 18:41:34 582

原创 python笔记-字符串函数(join(),split(),strip(),lstrip(),rstrip())应用

1.split()函数:使用指定的字符,将字符串进行切割操作,函数的返回值为列表;2.join()函数:将容器数据中的字符串使用指定的字符进行连接成一个字符串;3.strip()函数:去掉左右两侧连续的字符,不指定符号,删除空格,返回值为字符串;4.lstrip(),rstrip()去掉左侧连续的字符,不指定符号删除空格;去掉右侧连续的字符,不指定符号删除空格

2018-01-14 21:10:54 1328 1

ARIMA模型 Python

关于ARIMA模型时间序列分析,以及该模型在Python中的相关使用

2018-07-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除