自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (1)
  • 收藏
  • 关注

原创 4种数据去量纲化方法—标准化、归一化、正则化

对正项序列进行变换,原始序列中的每一个值比上所有值之和。将数据缩放到(0,1)范围内。首先计算出全体数据x的均值µ与标准差σ,然后将每个x带入公式进行标准化。主要目的将不同量级的数据统一转化为同一个量级。L2正则化,将每个样本缩放到单位范数,依照特征矩阵的行处理。将数据缩放到(0,1)范围内,且不改变数据的分布形状。用python对数据进行z-score标准化。用python对数据进行min-max标准化。即每行都转化为“单位向量”,会改变分布形态。用python对数据进行正则化。...

2022-08-02 15:35:55 6933

原创 【python】pandas.DataFrame实现“一行拆多行”和“多行并一行”

一行转多行稍微复杂一些,需要先将一个单元格中包含多个元素的长字符串根据分隔符切割,以含有最多个元素的行为准,分成对应个数的列,其余不足最多个数的行所余出列用null填充,分为多列后,再将行索引转变成列索引,一行数据就变成了两层结构多行数据,重置索引后与原数据合并即可。多行转一行就很简单,只需要定义一个拼接dataframe的值的函数,再将整个dataframe分组聚合拼接即可。httpshttpshttpshttpshttpshttpshttps。...

2022-07-18 15:38:42 6870

原创 statsmodels线性回归中的Jarque-Bera指标检验残差是否服从正态分布

统计学线性回归中的Jarque-Bera指标检验残差是否服从正态分布

2022-06-27 16:13:53 3268 3

hadoop-windows本地库版

本地库本地库本地库本地库本地库本地库本地库本地库本地库本地库本地库本地库本地库本地库本地库本地库本地库

2018-05-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除