自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(55)
  • 资源 (1)
  • 收藏
  • 关注

原创 python 层次分析(AHP)

传统定性分析方法类似专家打分、专家判断等,仅能将指标简单地划分为几个层级(类似非常重要、比较重要、一般、比较不重要、非常不重要),这样导致部分存在差别但是不大的指标得到了同样的权重,受主观因素影响,无法对最终决策做出更好的帮助。计算权重向量以及一致性检验.(步骤如上文,为了简便文章,本次计算采用python代码,以和积法求解权重,下文将详细介绍)计算权重向量以及一致性检验.(步骤如上文,为了简便文章,本次计算采用python代码,以和积法求解权重,下文将详细介绍)其中,n为矩阵阶数,此处n=4。

2024-02-22 22:41:37 1474 1

原创 python 扩展数据(补全缺失日期)

【代码】python 扩展数据(补全缺失日期)

2023-11-27 13:21:54 659

原创 Excel 分组排名

此处空值参与排名;不参与排名则公式改为:=IF(C2=“”,“”,SUMPRODUCT((A:A=A2)*(C:C>C2)) +1):相同值的项将获得最小排名、排名会断层。

2023-08-23 21:34:16 1554 1

原创 Excel 条件去重计数

【代码】Excel 条件去重计数。

2023-08-22 20:52:23 260

原创 python 数据分析面试题:求分组排第n名的记录数据

遇到相同值的情况,返回结果可能与预期不一致,如原数据中,数学成绩=99的有两位学员,此时当n=2时,只返回其中一位学员的记录;n=3才会返回两位学员的记录数。:该函数作用是返回每一列中最大值的索引(所以为什么前文的数据处理中需要重置索引)。:该方法可以延伸至求分组排名、分组排第n名的记录数据等问题,是比较完善的答案。:返回指定列排序后的前 N 个最大值所对应的行。:df.idxmin() 取最小。

2023-08-03 15:19:19 630

原创 python Pandas.rank() 排名函数详解

【代码】Pandas.rank() 函数详解。

2023-08-01 23:53:29 3221

原创 卡方检验笔记

卡方检验属于非参数检验,由于非参检验不存在具体参数和总体正态分布的假设,所以有时被称为自由分布检验。原假设H0H_{0}H0​:观察频数与期望频数没有显著性差异。

2023-06-14 18:45:56 863

原创 python 时间序列分解案例——加法分解seasonal_decompose

加法分解模型适用于随着时间推移趋势和季节性变化不断累加,并且随机波动比较稳定的时间序列数据。YtStRtYt​St​Rt​其中,YtY_{t}Yt​:实际观测值TtT_{t}Tt​:趋势(通常用指数函数来表示)StS_{t}St​:季节指数(一般通过计算每个季节的平均值得到)RtR_{t}Rt​:残差(无法被趋势和季节性解释的部分)

2023-04-10 10:33:21 4391 4

原创 python 获取日期特征(工作日/周末/节假日等)

【代码】python 获取日期特征(工作日/周末/节假日等)

2023-04-06 12:12:06 2513 9

原创 python 词云图 WordCloud

python 词云图 wordcloud

2022-12-07 15:35:23 1064

原创 python T检验

本文主要介绍使用python实现T检验的过程

2022-12-03 15:45:18 10124 1

原创 python plt.scatter:四维气泡图

【代码】python plt.scatter:四维气泡水图。

2022-12-01 15:46:51 1609

原创 python seaborn 折线图

【代码】python seaborn 折线图。

2022-12-01 14:16:05 1051

原创 Backtrader案例:简单双均线

买入:MA5 上穿 MA20卖出:MA5 下穿 MA20回测对象:上证指数起始时间:2020.1.1截止时间佣金:双边各 0.03%滑点:双边各 0.01%

2022-11-26 20:00:00 738 1

原创 pyecharts 主题:颜色渐变实例(线性渐变)

【代码】pyecharts 主题:颜色渐变实例(线性渐变)

2022-11-05 14:01:59 2820

原创 python 全国内地中高风险地区数量查询与可视化(分省)

python 全国内地中高风险地区数量查询与可视化(分省)

2022-11-01 18:30:21 432

原创 python 全国内地高风险地区数量查询与可视化(分省)

python 全国内地高风险地区数量查询与可视化(分省)

2022-10-31 15:08:16 643

原创 python 爬取国内各省份新冠疫情历史数据(来自腾迅疫情)

【代码】python 爬取国内各省份新冠疫情历史数据(来自腾迅疫情)

2022-10-22 11:19:25 3175 9

原创 python 共现矩阵

【代码】python 共现矩阵。

2022-10-09 20:30:00 2496

原创 python Matplotlib.pyplot.title 绘图设置标题

【代码】python Matplotlib.pyplot.title 绘图设置标题。

2022-09-23 14:00:23 6107

原创 python Matplotlib 画图字体种类 family

【代码】python Matplotlib 画图字体种类 family。

2022-09-23 13:52:00 1587

原创 python matplotlib绘图:解决X轴密集问题

【代码】python matplotlib绘图:解决X轴密集问题。

2022-09-20 12:01:06 7832

原创 python pandas.pivot_table透视表函数

采用字典方法通过 lambda 方法可以传入自定义函数。

2022-09-16 20:30:00 3195

原创 python 天天基金数据接口

【代码】python 天天基金数据接口。

2022-09-16 20:00:00 5439 4

原创 python 全国行政地区信息爬取-腾迅位置服务平台

【代码】python 全国行政地区信息爬取-腾迅位置服务平台。

2022-09-14 20:00:00 860

原创 python 排序算法:插入排序

摘自:python 排序算法——插入排序

2022-07-01 20:30:00 6533 2

原创 python pandas 求DataFrame中各数值的百分比

首先,需要学习下DataFrame.div()函数的用法。参考:Python Pandas dataframe.div()用法及代码示例例题新建一个DataFrame(索引是编号)import pandas as pddf = pd.DataFrame( {"a":[1,2,3], "b":[4,5,6]}, index=["001","002","003"])按列求百分比df / df.sum()按行求百分比df.div(df.sum(a.

2022-05-06 19:45:00 6266

原创 Adaboost分类算法原理及代码实例 python

Adaboost分类算法原理及代码实例一、Adaboost 简介一、Adaboost 算法过程二、简单实例三、python 实现3.1 sklearn.AdaBoostClassifier 参数说明3.2 导入相关库与数据集3.3 划分训练集、预测集3.4 Adaboost模型训练3.5 模型预测与评价一、Adaboost 简介     集成学习(Ensemble Learning) 是机器学习领域表现最强的一大分支,主要原理是将多个弱机器学习器结合,构建一个有较强性能的机器学习器。集成学习方法可以分为

2022-04-28 20:00:00 5999 2

原创 python 二项分布

一、定义1.1 0-1分布也称伯努力分布若随机变量X只有两个可能的取值0和1,其概率分布为P(X=xi)=pxi(1−p)1−xi,xi=0,1P(X=x_{i}) = p^{x_{i}}(1-p)^{1-x_{i}} \qquad,x_{i}=0,1P(X=xi​)=pxi​(1−p)1−xi​,xi​=0,11.2 二项分布二项分布是指在只有两个结果的n次独立的伯努利试验中,所期望的结果出现次数的概率,记B(n,k,p)=Cnkpk(1−p)n−kB (n,k,p)=

2022-04-24 14:31:13 3516

原创 python 决策树分类 泰坦尼克生存预测

决策树二分类之泰坦尼号克生存预测一、项目简介1.1 项目背景1.2 目标问题1.3 字段描述二、训练集(train)建模2.1 导入相关库2.2 自定义函数2.3 特征工程2.3.1 数据导入2.3.2 数据初探(1)特征信息(2)特征缺失值比例统计(3)数值特征描述统计2.3.3 单特征可视化分析与处理(1)Survived 是否存活(2)Pclass 乘客等级(3)Name 乘客姓名(4)Sex 性别(5)Age 年龄(6)SibSp 堂兄弟妹个数(7)Parch 父母与小孩的个数(8)Ticket 船

2022-04-24 00:14:45 4760 1

原创 手撸梯度下降和python实现

文章目录一、梯度下降概念1.1 梯度1.2 梯度下降1.2.1 梯度下降相关概念1.2.2 梯度下降的详细算法(1)代数描述(2)矩阵描述二、案例实战2.1 手撸2.1.1 代数形式2.1.2 矩阵形式2.2 python 实现2.2.1 代数形式2.2.2 矩阵形式一、梯度下降概念1.1 梯度从几何意义上讲,梯度就是函数变化增加最快的地方.在微积分里面,对多元函数的参数求 ∂\partial∂ 偏导数,把求得的各个参数的偏导数以向量的形式写出来,就是梯度。如函数 f(x,y)f(x,y)f(x,

2022-03-20 18:00:32 1692

原创 python 皮尔森相关系数(Pearson)

文章目录一、概述二、定义2.1 总体样本定义2.2 估算样本定义2.3 两种计算方式2.4 皮尔森距离三、python 实现3.1 生成随机数据集3.2 绘制散点图3.3 计算相关系数3.3.1 自定义函数(无显著性检验)3.3.2 python 函数(1)pandas.corr 函数(无显著性检验)(2)scipy.stats.pearsonr 函数 (有显著性检验)(3)pandas.corr 加 scipy.stats.pearsonr 获取相关系数检验P值矩阵一、概述皮尔森相关系数也称皮尔森积

2022-03-16 14:19:08 47120 1

原创 python re.sub() 正则替换(多字符串替换)

一、参数解析re.sub( pattern, # 正则中的模式字符串 repl, # 替换的字符串,也可为一个函数 string, # 要被查找替换的原始字符串 count = 0 # 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配)二、案例import reimport pypinyinstr_ = "这是我的老婆--云韵" # 案例1: 将云韵改为美杜莎result = re.sub(r'云韵', "美杜莎", str_

2022-03-15 14:19:09 9508 2

原创 python pandas ewm 一次指数加权移动平均

文章目录一、公式二、DataFrame.ewm() 参数comspanhalflifealphamin_periodsadjustignore_naaxis三、python 案例一、公式yt=(1−α)yt−1+αxt y_{t} = (1-\alpha) y_{t-1} + \alpha x _{t} yt​=(1−α)yt−1​+αxt​其中,xxx 是实际观测值二、DataFrame.ewm() 参数alpha、span、com、halflife 这四个参数必须选一指定DataFram

2022-03-14 17:33:19 11375

原创 python 信息熵(含联合熵、条件熵)

三、python 实现import mathfrom collections import Counterdef Entropy(DataList): ''' 计算随机变量的熵 ''' counts = len(DataList) # 总数量 counter = Counter(DataList) # 每个变量出现的次数 prob = {i[0]:i[1]/counts for i in counter.items()} ..

2022-03-11 15:01:56 6112

原创 python 信息熵

文章目录一、熵的概念与定义二、python 实现一、熵的概念与定义熵概念  熵,在信息论中是用来刻画信息混乱程度的一种度量。熵最早源于热力学,后应广泛用于物理、化学、信息论等领域。1850年,德国物理学家鲁道夫·克劳修斯首次提出熵的概念,用来表示任何一种能量在空间中分布的均匀程度。1948年,Shannon在Bell System Technical Journal上发表文章“A Mathematical Theory of Communication”,将信息熵的概念引入信息论中。本文所说的熵就

2022-03-11 11:51:09 4392

原创 python 关联规则

文章目录一、基本概念定义1. 记录(事务)定义2. 事务集定义3. 项目(项)定义4. 项目集(项集)定义5. k项集定义6. 支持度(Support)定义7. 置信度(Confidence)定义8. 最小支持度(min Support)定义9. 最小置信度(min Confidence)定义10. 提升度定义11. 频繁K项集定义12. 候选K项集定理1定理2二、Apriori 算法流程三、Apriori 算法小案例py一、基本概念例表定义1. 记录(事务)如 {ABCD}, {ABCE}

2022-03-06 21:33:47 5461

原创 python pandas 五位整数与日期之间互相转换

import pandas as pddef Time2Num(Time): ''' 日期转五位整数 ''' delta = pd.to_datetime(Time) - pd.to_datetime("1899-12-30") return delta.daysdef Num2Time(NumberTime): ''' 五位整数转日期 ''' delta = pd.Timedelta(str(Numb

2022-03-01 17:54:23 1973

原创 python二维列表转一维列表

list_ = [[1,2,3], [5,8], [7,8,9]]法一[i2 for i1 in list_ for i2 in i1]法二from tkinter import _flattenlist(_flatten(list_))参考:Python二维列表转换为一维列表

2022-02-26 14:17:38 1910

原创 python DataFrame isin() 与 ~isin()

文章目录一、生成测试数据集二、isin()2.1 单一条件筛选2.2 多个条件筛选三、~isin()一、生成测试数据集import randomimport pandas as pdnames = ['南宫婉','雅菲','余靖秋','姜立','小舞','胡列娜','比比东','云韵','美杜莎','焰灵姬']df = pd.DataFrame( { "name" :names, "age" :[random.randint(18,25) for i

2022-02-26 14:03:19 13014 1

泰迪杯2019年A题(题目pdf+参考文献pdf高清+机器学习源代码)

泰迪杯2019年A题(题目pdf+统计学习方法李航.pdf+华泰证券-人工智能选股框架及经典算法简介.pdf+多因子系列之一:华泰多因子模型体系初探.pdf+多因子Alpha系列报告之(七)——大浪淘金,Alpha因子何处寻?.pdf)+《机器学习实战:基于Scikit-Learn和TensorFlow 》高清中文.pdf+源代码

2019-03-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除