一瑞111-CSDN博客

原创【机器学习】集成算法——特牛逼的XGBoost流程和使用方法

原谅我字太丑……

2020-10-14 18:14:45 941

原创【机器学习】集成算法——Boosting中的AdaBoost算法原理及sklearn应用

（写在前面：集成算法中基评估器可以是分类模型也可以是回归模型，因为个人习惯称基评估器为弱分类器，全文的弱分类器其实是指基评估器，而写基评估器就是基评估器，写到后面才发现这点不太严谨，后面逐步更改。另外要注意：随机森林的基评估器必定是决策树，可以是回归树也可以是分类树。XGBoost属于GBDT中的范畴，GBDT属于Boosting，Boosting的基评估器可以是回归和分类模型，而GBDT基评估器一定是回归模型，但GBDT模型虽然基是回归，但仍然可以解决分类问题，sigmoid函数）Boosting的核

2020-10-13 13:45:12 460

原创【机器学习】集成算法——Bagging中的随机森林详细描述及sklearn应用

（写在前面：集成算法中基评估器可以是分类模型也可以是回归模型，因为个人习惯称基评估器为弱分类器，全文的弱分类器其实是指基评估器，而写基评估器就是基评估器，写到后面才发现这点不太严谨，后面逐步更改。另外要注意：随机森林的基评估器必定是决策树，可以是回归树也可以是分类树。XGBoost属于GBDT中的范畴，GBDT属于Boosting，Boosting的基评估器可以是回归和分类模型，而GBDT基评估器一定是回归模型，但GBDT模型虽然基是回归，但仍然可以解决分类问题，sigmoid函数）

2020-10-13 13:32:00 264 2

原创【机器学习】决策树详细原理及sklearn简单应用

2020-10-11 13:04:25 128

原创【机器学习】逻辑回归公式推导及sklearn实现logistic regression

2020-10-03 13:18:26 332

原创【机器学习】梯度下降

2020-10-03 13:11:44 85

原创【机器学习】线性回归——最小二乘和正则化

2020-10-03 13:04:26 520

原创【机器学习】朴素贝叶斯

2020-09-23 17:23:58 66

原创【机器学习】KNN算法

2020-09-18 19:10:05 108

原创【机器学习】聚类算法——K-Means（上）

import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as plt%matplotlib inlinefrom sklearn.datasets import make_blobsfrom sklearn.datasets import load_iris import warnings warnings.filterwarnings('ignore')...

2020-09-11 13:26:09 322

原创【数据挖掘数学基础】11回归分析（下）

【Excel回归分析案例】：该案例应用到相关分析和回归分析（上、下）三章：链接:https://pan.baidu.com/s/1bcfVPfDahM8U8aSWyY1lLg 密码:qmvy

2020-09-08 16:30:26 139

原创【数据挖掘数学基础】11回归分析（上）

【Excel回归分析案例】：该案例应用到相关分析和回归分析（上、下）三章：链接:https://pan.baidu.com/s/1bcfVPfDahM8U8aSWyY1lLg 密码:qmvy

2020-09-08 16:22:18 108

原创【数据挖掘数学基础】10相关分析

【Excel回归分析案例】：该案例应用到相关分析和回归分析（上、下）三章：链接:https://pan.baidu.com/s/1bcfVPfDahM8U8aSWyY1lLg 密码:qmvy

2020-09-08 16:15:20 106

原创【数据挖掘数学基础】09方差分析

【案例】链接:https://pan.baidu.com/s/1Gyj3DY8_Uz8Q0SGSiw6YHw 密码:hxd7

2020-09-08 16:06:08 231

原创【数据挖掘数学基础】08列联分析

【更多案例—— Excel函数CHITEST()】链接:https://pan.baidu.com/s/1sx4YcxyLamug2Pg4PrwVeA 密码:h8xp

2020-09-08 15:59:01 176

原创【数据挖掘数学基础】07矩阵（下）

【注意】很多软件解出来的特征向量是不一样的，正负号不一样，但大多解出来的特征向量是单位向量（即内积=1）

2020-09-08 15:49:01 135

原创【数据挖掘数学基础】07矩阵（中）

EViews矩阵运算软件包：https://pan.baidu.com/s/1MRJsJtvdOxobln9bSMyRbQ 密码:w387EViews教程和练习:https://pan.baidu.com/s/1QECOwURxosplWRjOeQV6Gg 密码:g2dh2、矩阵的几何意义：矩阵的加减法：两两矩阵的合并或抵消矩阵（向量）乘法：其可以平移、旋转、缩放【案例】链接:https://pan.baidu.c...

2020-08-17 14:25:01 180

原创【数据挖掘数学基础】07矩阵（上）

2020-08-17 14:15:39 85

原创【数据挖掘数学基础】06行列式（下）

2020-08-17 14:13:38 101

原创【数据挖掘数学基础】06行列式（中）

所以D1=D1+D2

2020-08-17 14:03:16 114

原创【数据挖掘数学基础】06行列式（上）

6、行列式通式计算缺点是对于高阶行列式来说其计算量会很大，那我们有没有其他办法计算呢。

2020-08-17 13:56:17 148

原创【数据挖掘数学基础】05导数

2020-08-17 13:50:11 118

原创【数据挖掘数学基础】04假设检验（下）

本章节主要案例为主。数据下载地址: https://pan.baidu.com/s/1kkDh16Y1kcdHtyE0sBO-Tw 密码:7fcs

2020-08-17 13:44:39 149

原创【数据挖掘数学基础】04假设检验（上）

5、左侧检验和右侧检验合称单侧检验。双侧检验和单侧检验为统计假设检验中的两种检验形式。

2020-07-23 19:23:53 121

原创【数据挖掘数学基础】03 估计（下）

六、【案例分享】这章《估计》理论知识是比较玄乎，实际如何运用，我们可以拿一个案例出来举例。以下是数据下载地址：https://pan.baidu.com/s/1W7o3ahpcOBzu31dIQRVpeQ 密码:az2t

2020-07-23 19:14:27 111

原创【数据挖掘数学基础】03 估计（中）

2020-07-23 18:00:16 90

原创【数据挖掘数学基础】03 估计（上）

假设某厂里生产了一万个零件，我们想知道这一万多个零件中有多少零件不合格，我们有两个方法，1个是全部检查一遍，另一种方法是随机抽一组零件检查来估计整体的情况，这就是我们这章主要讲的“估计”问题。第二天甲方爸爸过来收货了，厂长说，我们产品的合格率99.9%呀，甲方爸爸一听是不是很开心直接就收货，不，他们还得验货，需要检验合格率是否达标，这就是“检验”的问题。检验没问题了，厂长说，我们百年老店，质量过硬，你下次过来订货，合格率一样是99.9%。这就是“预测”的问题。估计：就是我们已经知道的样本信息来推断总体的

2020-07-23 17:45:22 169

空空如也

空空如也