自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(0)
  • 资源 (19)
  • 收藏
  • 关注

空空如也

高斯混合模型聚类(GMM)算法(Python)

高斯混合模型聚类(Gaussian Mixture Mode,GMM)是一种概率式的聚类方法,它假定所有的数据样本x由k个混合多元高斯分布组合成的混合分布生成。 使用场景:用于平坦的结合结构,对密度估计很合适

2019-05-31

层次聚类(AGNES)算法(Python)

层次聚类(AGNES)算法(Python) 是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。AGNES是常用的一种层次聚类算法 使用场景:用于簇的数量较多,有连接约束等情况

2019-05-31

密度聚类(DBSCAN)算法(Python)

DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种很典型的密度聚类算法,和K-Means,BIRCH这些一般只适用于凸样本集的聚类相比,DBSCAN既可以适用于凸样本集,也可以适用于非凸样本集。这类密度聚类算法一般假定类别可以通过样本分布的紧密程度决定。同一类别的样本,他们之间的紧密相连的,也就是说,在该类别任意样本周围不远处一定有同类别的样本存在。 使用场景: 用于不均匀的簇大小,以及非平坦的集合结构

2019-05-31

K均值聚类(KMeans)算法(Python)

K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。 使用场景:通用聚类方法,用于均匀的簇大小,簇的数量不多的情况。

2019-05-31

K近邻(K-Nearest Neighbors, KNN)回归算法(Python)

K近邻(K-Nearest Neighbors, KNN)算法既可处理分类问题,也可处理回归问题,其中分类和回归的主要区别在于最后做预测时的决策方式不同。KNN做回归预测时一般采用平均法,预测结果为最近的K个样本数据的平均值。

2019-05-31

K近邻(K-Nearest Neighbors, KNN)分类算法(Python)

K近邻(K-Nearest Neighbors, KNN)算法既可处理分类问题,也可处理回归问题,其中分类和回归的主要区别在于最后做预测时的决策方式不同。KNN做分类预测时一般采用多数表决法,即训练集里和预测样本特征最近的K个样本,预测结果为里面有最多类别数的类别。

2019-05-31

局部线性嵌入(Locally Linear Embedding,LLE)(Python)

局部线性嵌入(Locally Linear Embedding,LLE)也是非常重要的降维方法。和传统的PCA,LDA等关注样本方差的降维方法相比,LLE关注于降维时保持样本局部的线性特征,由于LLE在降维时保持了样本的局部特征,它广泛的用于图像图像识别,高维数据可视化等领域。

2019-05-31

等度量映射(Isomap)(Python)

等度量映射(Isomap)是最经典的非线性映射降维方法之一,它在MDS的基础上引入了“测地距离”的概念,直接解决了MDS使用欧氏距离无法应对非线性流形的问题。

2019-05-31

多维缩放(multidimensional scaling ,MDS)(Python)

多维缩放(multidimensional scaling ,MDS),是另外一种线性降维方式,与主成分分析法和线性降维分析法都不同的是,多维缩放的目标不是保留数据的最大可分性,而是更加关注与高维数据内部的特征。多维缩放算法集中于保留高维空间中的“相似度”信息,而在一般的问题解决的过程中,这个“相似度”通常用欧式距离来定义。

2019-05-31

核主成分分析(Kernel Principal Component Analysis, KPCA)(Python)

核主成分分析(Kernel Principal Component Analysis, KPCA) PCA方法假设从高维空间到低维空间的函数映射是线性的,但是在不少现实任务中,可能需要非线性映射才能找到合适的低维空间来降维。 非线性降维的额一种常用方法是基于核技巧对线性降维方法进行核化(kernelized)。这是对PCA的一种推广。

2019-05-31

主成分分析(Principal components analysis)(Python)

主成分分析(Principal components analysis)是最常用的降维方法 算法步骤: (1)对所有样本进行中心化操作 (2)计算样本的协方差矩阵 (3)对协方差矩阵做特征值分解 (4)取最大的d个特征值对应的特征向量,构造投影矩阵

2019-05-31

朴素贝叶斯法(Python)

朴素贝叶斯法,使用 scikit-learn 自带的 digits 数据集

2019-05-30

伯努利贝叶斯分类器(BernoulliNB)(Pyhton)

伯努利贝叶斯分类器(BernoulliNB),它假设特征的条件概率分布满足二项分布

2019-05-30

多项式贝叶斯分类器(MultinomialNB)(Python)

多项式贝叶斯分类器(MultinomialNB),它假设的条件概率分布满足多项式分布

2019-05-30

首届全国大学生大数据技能竞赛指导手册.pdf

首届全国大学生大数据技能竞赛指导手册

2019-05-28

sklearn 决策树回归使用案列

sklearn 决策树回归使用案列,数据集随机生成,完美运行

2018-08-11

sklearn决策树分类案列

##sklearn决策树分类使用案列,使用自带的 iris 数据集

2018-08-11

Solid.Converter.PDF_V7(转换) PDF转换器

Solid.Converter.PDF_V7(转换) PDF转换器,值得分享,,

2018-03-01

疯狂java讲义 第二版 源码

疯狂java讲义第二版随书源码,值得分享。相互学习!!!!

2018-03-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除