bug飞飞女儿泪-CSDN博客

原创精益数据分析——我们该关心哪些指标？

众所周知，数据分析需要我们具备三种思维：结构化思维、公式化思维、业务化思维。结构化就是能将问题拆解、分门别类并逐次分析。公式化思维即能够将问题数学化，即指标化。业务化思维当然就是和业务紧密相连，毕竟一切都是服务于业务和营收。那么接下来我会介绍精益数据分析中的指标部分的知识。一、什么样的指标应该被关心？举个例子：门口卖水果的大爷告诉你，今天卖了1000元，总共卖了5,60斤。那么你能够通过...

2020-04-13 23:40:56 246

原创剑指Offer——顺时针打印矩阵（C++）

其实这道题很简单，但是我走了点弯路，所以记录下。输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字，例如，如果输入如下4 X 4矩阵： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 则依次打印出数字1,2,3,4,8,12,16,15,14,13,9,5,6,7,11,10.那么面对一道题，我们先画出来矩阵1 2 3 45 6 ...

2020-02-18 19:41:41 194

原创深度学习——正则化

正则化是深度学习最常用到的概念，那么首先，我们先了解一下，为什么要用正则化？一、为什么要正则化？看下图，引用吴恩达老师课程中的“房价预测问题”的曲线图，我们可以看到，左侧你和程度不是很好，也就是偏差较大；右图则过拟合，也就是曲线几乎穿过了每一个点，这样的结果是**“泛化”能力很差，泛化是指将当前模型引用于新模型时的表现力，过拟合其实也就是我们说的...

2020-02-18 18:55:11 409

原创机器学习总结——必须知道的那些概念

对于机器学习，必须知道以下的概念。 - 贝叶斯分类器 - 0-1损失 - 理解判别式函数和线性判别式 - 生成模型和判别式模型 - 分对数变换和logistics判别式 - softmax判别式**以下是对以上内容的一一总结式发言。**一、贝叶斯分类器1，贝叶斯法则：（1）概率论中，P(h∣D)=P(D∣h)P(h))P(D)P(h|D)=\frac{P(D|h)P(h...

2020-02-17 17:06:35 273

原创机器学习与数理统计——点估计

对于分布函数的形式已知，对于其中的未知参数，应用样本X1、X2…Xn所提供的信息去对其一个或者多个未知参数进行估计，这类问题称为参数估计问题。参数估计在机器学习中的应用最为广泛。接下来就做一个简单的介绍学习。一、矩估计设θ1,θ2,...θk\theta _1,\theta _2,...\theta _kθ1,θ2,...θk为待估参数，X1,X2,...XnX_1,X_2,...X...

2020-02-14 15:55:18 610

原创机器学习与统计学——数理统计基本概念

一，随机变量的数学期望1，定义：设离散型随机变量的分布律为：P{X=xk}=pk,k=1,2,3P\left \{ X=x_k\right \}=p_k, k=1,2,3P{X=xk}=pk,k=1,2,3如果级数∑k=1∞xkpk\sum_{k=1}^{\infty }x_kp_k∑k=1∞xkpk 绝对收敛，则级数∑k=1∞xkpk\sum_{k=1}^{\infty ...

2020-02-14 10:08:51 191

转载【转载】深入浅出梯度下降法

超好的文章，分享给大家https://www.jianshu.com/p/c7e642877b0e

2020-02-12 22:26:18 83

转载【转载】为什么是SoftMax？

SOFTMAX 长什么样子？如下图所示从图的样子上看，和普通的全连接方式并无差异，但激励函数的形式却大不一样。

2020-02-12 13:09:45 87

原创 KMeans算法+代码

一、KMeans算法损失函数该loss公式无法直接求解，需要使用迭代的方式。二、Kmeans算法流程第一阶段第二阶段KMeans算法注意点：最后的聚类结果高度依赖于初始均值向量的选择比较适合连续属性的特征向量聚类代码如下：from math import sqrtfrom random import randintclass Cluster(object): ...

2020-02-10 12:57:15 563

原创度量距离的几种方法

距离度量了两个特征向量xix_ixi,xjx_jxj的远近距离（或相似程度）一、闵可夫斯基距离公式如下：1，欧氏距离（Eculidean Distance）当p=2时，就是我们熟知的欧氏距离欧式距离是在m维空间中两个点之间的真实距离2，曼哈顿距离当p=1时，成为曼哈顿距离首先介绍一下曼哈顿，曼哈顿是一个极为繁华的街区，高楼林立，街道纵横，从A地点到达B地点没有直线路径...

2020-02-10 10:21:03 1016 1

转载为什么Python中函数里要再次定义函数

转载链接：https://www.zhihu.com/question/25950466“在Python中，函数本身也是对象”1，python中一切皆对象对于Python中的list, tuple, dict等内置数据结构，当你执行：alist = [1, 2, 3]你就创建了一个列表对象，并且用alist这个变量引用它同理你创建一个类def，然后创建一个类的对象来引用，结构也同上...

2020-02-09 14:28:02 1263

原创深度学习——回归算法Regression

同样是监督算法，回归是求解连续值的相关关系，分类是对离散值的划分。图1如图1，我们想要模拟离散点的走势。一、一元线性回归一元线性回归就是假设拟合曲线是一条直线，现在求解这条直线方程。假设那么如何使得这条曲线拟合，那么就要提出均方误差二、均方误差均方误差就是用二次方来衡量真实值和预测值直接的距离，然后再在所有样本上取平均。公式如下：为什么是均方误差？基本假设g(x)是...

2020-02-07 18:23:08 4727

原创深度学习——决策树

一、什么是决策树？决策树（Decision Tree）是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于0的概率，评价项目风险，判断其可行性的决策分析方法，是直观运用决策分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干，故称决策树看图1的举例，用通俗的语言来说决策树，就是将样本不停的按照条件判断，知道能够准确的分类到某一类中。图1决策树可以解决回归和分...

2020-02-04 18:42:22 1808

原创深度学习基础——特征工程（二）

依然贴出概述图，接下来对多个特征部分的预处理详细解说。一，特征降维——PCA（主成分分析）我们在数据处理的过程中，丰富的特征提供信息的同时也提供了干扰，但是盲目减少指标又会丢失信息。因此，需要选择最有效的特征并且尽可能的减少信息丢失，这就是PCA的目标。1，先讲数据降维。为什么数据能够降维？看下面图1，图1显示的是在空间中的数据，这些数据可以分到x,y,z三个特征轴上，但是我们可以看到这些...

2020-02-03 18:06:05 215

原创深度学习基础——特征工程(一)

首先给出特征工程的概述图，如下图。然后接下来，会就其中的内容详细学习。一，单个特征归一化归一化就是指当每个特征的数值之间相差太大，无法很好的相互映射时，通过函数处理使其落在同一数量级的区间的方式。归一化的方式通常有两种：StandardizationStandardization又称为Z-score normalization，量化后的特征将服从标准正态分布：μ和δ分别为对应特征...

2020-02-02 19:08:17 1174

qq_35470020的博客