自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 资源 (1)
  • 收藏
  • 关注

原创 lstm单变量预测

############导入必要的库#########import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.preprocessing import MinMaxScalerfrom keras.models import Sequentialfrom keras.layers import Dense, LSTM, Dropout, GRUfrom keras.optimizers i

2022-03-21 21:26:41 4725 3

原创 pandas关于date的处理与读取

在使用pandas读取文件的时候,可以使用index_col将数据的某一列直接设置为列索引;parse_date这个参数可以将某一列数据自动解析为时间格式。google = pd.read_csv("../datasets/GOOGL_2006-01-01_to_2018-01-01.csv", index_col='Date', parse_dates=['Date'])google.head(5) Open High Low Close Volume

2021-12-02 22:42:30 3275

原创 经典时间序列的学习(二)时间序列的基础

1. 时间序列模型(加法模型和乘法模型)基于原始的时间序列的趋势项和季节项,时间序列模型可以被分为加法模型和乘法模型.乘法型:时间序列值 = 趋势项 * 季节项 * 误差项。加法型:时间序列值 = 趋势项 + 季节项 + 误差项。2. 时间序列的模式分解对时间序列的分解,可以从趋势项、季节项、 误差项的乘法和加法的角度进行。****代码方面,我们使用statsmodels包的seasonal_decompose函数。# 导入包from statsmodels.tsa.seasonal i

2021-12-02 20:04:28 2575

原创 经典时间序列的学习(一)简单的认识时间序列

1. 什么是时间序列同一统计指标数值按照时间先后顺序排列而成的数据。本质上是反映一个变量随时间序列变化的趋势。简单的例子就像是学生每一年的身高数据,这个也是一个时间序列。变量是我们的身高;每一年都不一样。我们支付宝或者微信的零钱,每一天每一个月都有一个实际的值。2. 在python中如何导入时间序列数据`from dateutil.parser import parse #关于时间的函数import matplotlib as mplimport matplotlib.pyplot as

2021-12-02 17:53:41 2034

原创 python可视化学习(二十二)组成图#饼图,树形图,条型图

import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as pltimport seaborn as snsimport warnings; warnings.filterwarnings(action='once')large = 22; med = 16; small = 12params = {'axes.titlesize': large, 'le

2021-11-30 11:08:07 726

原创 python可视化学习(二十一)组成图#华夫饼图

import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as pltimport seaborn as snsimport warnings; warnings.filterwarnings(action='once')large = 22; med = 16; small = 12params = {'axes.titlesize': large, 'le

2021-11-29 20:02:49 984

原创 python可视化学习(二十)分布式包点图

分布式包点图可以显示按组划分的点的分布图,点的颜色越暗说明该区域点的集中度越高,通过对中位数进行不同的着色,组的真实定位也会表达的很明细###待修改在这里插入代码片#创建画布fig, ax = plt.subplots(figsize=(14,8), dpi= 60) #画布和子图分开#根据每个制造商所产汽车的城市里程均值大小,绘制水平线图ax.hlines(y=df.index, xmin=0, xmax=40, color='gray', alpha=0.5, linewidth=.5, li

2021-11-29 19:55:08 309

原创 python可视化学习(十九)joy plot

joy plot允许不同组的密度曲线折叠,这是一种可视化大量分组数据彼此数据分布的方法%%cmdconda install joypyimport pandas as pdimport numpy as npimport seaborn as sns import matplotlib.pyplot as pltimport joypy%matplotlib inline#如果用jupyter notebook则需要这行代码让你的图像显示,如果是jupyterlab则不需要plt.

2021-11-29 19:53:03 4915

原创 python可视化学习(十八)直方密度曲线图

#直方密度曲线图#就是直方图与密度图的结合,将两图放入到同一个图形,就可以分析出直方图与密度图传达的信息import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as plt%matplotlib inline#如果用jupyter notebook则需要这行代码让你的图像显示,如果是jupyterlab则不需要plt.rcParams['font.sans-serif']=['Si

2021-11-29 19:48:32 3164 1

原创 python可视化学习(十七)密度图

#认识绘制密度图的函数#密度图是一种直方图和密度图的对比#大多数密度估计是和密度的估计,核计算是比较复杂了#通俗讲,纵坐标是相对用于不同类别的值#构造数据,满足正态分布data=np.random.rand(1000)#画一个简单的密度图sns.kdeplot(data);**sns.kdeplot()**> 函数功能>> 拟合并绘制单变量或双变量核密度估计值 > 重要参数 >> data:数据集,可以只输入一个,也可以输入两个

2021-11-29 19:43:15 8064 1

原创 python可视化学习(十六)分布图-连续变量的分布图

#分布图,连续变量的分布图#导入包import numpy as npimport matplotlib.pyplot as pltimport pandas as pdimport seaborn as sns#matplottib inlineplt.rcParams['font.sans-serif']=['Simhei']#显示中文plt.rcParams['axes.unicode_minus']=False #显示负号#认识函数plt.hist?#导入绘图的数据集d

2021-11-29 19:34:58 4778

原创 管理博文 python可视化学习(十五)排序图-坡度图与哑铃图

#####b坡度图#坡度图非常适合对比两种不用取值圊下的最佳图像,最适合比比较人/项目/数据/之前和之后的数据 变化#认识两个函数,一个是创造直线的分对象的函数,以及将直线对象添加到画布的函数matplotlib.lines.Line2D#重要的参数#xdata 横坐标#ydata 纵坐标#market 点的形状#marketsize 用于连接点的尺寸#add_line()#导入数据import numpy as npimport pandas as pdimport matpl

2021-11-29 19:19:10 2627

原创 python可视化学习(十四)排序图-棒棒图和包点图

#棒棒图和包点图#除了长相不一样,本质和条形图一摸一样import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline#导入数据df_raw=pd.read_csv('mpg_ggplot2.csv')df=df_raw[['cty','manufacturer']].groupby('man

2021-11-29 19:12:45 423

原创 python可视化学习(十四)排序图-柱状图

#排序图 它的主要作用就是帮助我们比较变量的大小,典型的排序图有:柱状图,坡度图,哑铃图…#先来认识柱状图的函数plt.vlines():vertical line. 就是绘制竖线的函数 #重要的参数 x:横坐标 ymin :条形图的起点,最下方 ymax:y轴的终点,也是长条的最上边#认识数据df_raw =pd.read_csv('mpg_ggplot2.csv')df_raw.head(20)#注:一个汽车的品牌有不同的车型,每个车型都有自己的里程/加论,所以不同的车型对应着去许多不同的

2021-11-29 18:13:08 4462

原创 python可视化学习(十三)面积图

面积图作用#面积图:不仅可以强调波峰与地谷,还可以强调高点与低点持续时间,持续时间越长,#面积的函数plt_fill_between函数功能:填充两条水平曲线之间的区域x:定义x轴y1,y2:定义两条曲线的y轴的坐标where:定义被填充o的区域interpolate:控制交叉点位置的填充(仅在设定where并且两条曲线相交时起作用)#认识数据集##df=pd.read_csv('economics.csv',parse_dates=['date'])#parse_datasd的作用

2021-11-29 17:48:45 2637

原创 python可视化学习十三(棒棒图)

棒棒图就是条形图与散点图的结合plt.hlines重要的参数y:绘图分y轴xmin/xmax 条形图的起始点与终止点color:条形的颜色plt.scatter重要的参数x,y是横纵轴s:散点的大小c:散点的颜色market:散点的形状import numpy as npimport importlib as mplimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt%matplotl

2021-11-25 21:53:57 1702

原创 python可视化学习十二(发散性的包点图)

`###绘制简单的散点图data=np.random.randn(10)plt.figure(figsize=(8,5))plt.scatter(range(10),data,s=300,c='b',alpha=0.5)for x,y in zip(range(10),data): plt.text(x,y,round(y,1),fontdict={'size':10,'color':'w'},horizontalalignment='center',verticalalignment =.

2021-11-25 21:48:15 432

原创 python可视化学习十一(发散型文本图)

import numpy as npimport importlib as mplimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt%matplotlib inline#数据的准备df =pd.read_csv('mtcars.csv')x=df.loc[:,['mpg']]#提取想要的数据df['mpg_z']=(x-x.mean())/x.std() #标准化的处理df['color']=

2021-11-25 21:45:20 220

原创 python可视化学习十(水平条形图)

#########第二部分###### #偏差图(deviation):指的是单个特征中的所有值与特定值之间的关系图,他反应的是所有值偏离特定值的距离 #典型的偏差的图:发散性条形图,面积图 #什么时候用到偏差图呢?1数据探索与数据解读: 探索某一特征的分布,探索该特征偏离某个特定值(均值/方差等)的程度2 结果展示与报告呈现#如果你想根据单个指标查看项目的变化情况,并可视化此差异的数量与差异,那发散条形图是一个好的工具,有助于快速区分中组的性能,很直观import numpy as npimp

2021-11-25 21:41:55 1201

原创 python可是化学习九(成对分析图)

#####成对分析图###特征少时用特征分析图#第一部分:导入绘图库import numpy as np import importlib as mplimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline###################预设的一些参数每次绘图可能需要的参数设置##################large=23; small=12; med=1

2021-11-25 10:29:13 1010

原创 python可是化学习八(热力图)

####关联图像最后一个############ 关联图的目标,展示的是一个变量随着另一个变量的变化而变化,但之前的折线图或折线图只能够分析俩变量的关系df=pd.read_csv('mtcars.csv')df.head()name=['英里/加仑','气缸数量','排量','总马力','驱动轴比','重量','1/4英里所用的时间','引擎','变速器','前进挡数','化油器的数量','用油是否高效','汽车','汽车名称']df.columns=namedf.head()#其中的汽

2021-11-25 10:25:26 1058

原创 python可视化学习七(边缘箱型图)

边缘箱线图箱图是用来显示变量分布的统计图,直方图更看重与在取值范围内的分布,而箱线图更看重于观察变量间的重要分割点箱线图能够显示数据分布的关键数据的节点,常用来作为查找异常值的方式1当直方图的分布越接近正态分布,箱线图就会越对称2直方图的柱子越高的地方,就是箱线图的箱子所在的地方3箱线图所显示的中位数一般都接近直方图的最高的柱子##重要的参数详解##########sns.boxplot()重要的参数x:需要绘制的箱线图的变量y:需要绘制箱线图的子图orient:箱线图的子图,可选填‘

2021-11-25 10:19:03 916 4

原创 python可视化学习(六)边缘直方图

边缘直方图:是使用散点图探索横纵坐标的基础上,还使用直方图对横坐标和纵坐标分别进分布探索的图像这个图像在统计学的探索性分析(EDA)中常用,以探索数据是否符合统计学中的一系列的特性,比如线性回归要求残差满足正态分布在机器学习的过程中,我们也会探索数据是否处于偏态,以指导数据是否进行归一化和标准化的处理1准备工作plt.figure, plt.GridSpec与fig.add_subplot!@plt.figure,是构建画布,figsize:画布的大小,dpi:该图像的分辩率plt.Gridsp

2021-11-23 21:52:18 1725

原创 python可视化学习五(抖动图与计数图)

#########抖动的带状图与技数图#############04与05import numpy as np import importlib as mplimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inlinedf=pd.read_csv('mpg_ggplot2.csv')df.head()df.loc[:,['cty','hwy']] #会发现有许多的横纵

2021-11-23 20:53:57 1315

原创 python可视化学习四(线性拟合)

##############线性回归######################### 最佳拟合线(或趋势线)是一条直线,它被认为是最能代表散点图上数据的直线 这条直线可以通过一些散点,也可以不通过一些散点 拟合线可以帮助我们发现不太明显的趋势####1.导入需要的绘图库import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as pltimport seaborn as sns

2021-11-23 16:16:04 3332

原创 python可视化学习三(逻辑回归)

############数据探索(利用逻辑回归来探索标签与特征的关系)########midwest[midwest['area']>0.1]midwest['category'].value_counts()分别运行的结果如下:midwest['c1'] =midwest['category'].apply(lambda x:x[0])midwest['c2'] =midwest['category'].apply(lambda x:x[1])midwest['c3'] =midw

2021-11-22 21:01:09 1722

原创 python可视化学习二(复杂的散点图)

import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline#导入数据midwest = pd.read_csv("midwest_filter.csv")#查看数据midwest.head()midwest.columnsmidwest['category']#提取标签中的类别c

2021-11-22 09:59:33 1964

原创 python可视化学习一(散点图)

import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline##########简单的散点图########################x1=np.random.randn(10) #取随机数x2=x1+x1**2-10##确定画布的大小plt.figure(figsize=(8,4)

2021-11-21 21:17:54 1873

原创 python学习

第一题:法一total=0for i in range(1,5): for j in range(1,5): for k in range(1,5): if(i!=j)and(j!=k)and(i!=k): print(i,j,k) total+=1print(total)法二import itertools #itertools是一种迭代器total=0a=[1,2,3,4]for i

2021-11-16 23:00:19 308

数据学习可视化学习的自用的

python学习

2021-11-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除