- 博客(0)
- 资源 (19)
- 收藏
- 关注
高斯混合模型聚类(GMM)算法(Python)
高斯混合模型聚类(Gaussian Mixture Mode,GMM)是一种概率式的聚类方法,它假定所有的数据样本x由k个混合多元高斯分布组合成的混合分布生成。
使用场景:用于平坦的结合结构,对密度估计很合适
2019-05-31
层次聚类(AGNES)算法(Python)
层次聚类(AGNES)算法(Python) 是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。AGNES是常用的一种层次聚类算法
使用场景:用于簇的数量较多,有连接约束等情况
2019-05-31
密度聚类(DBSCAN)算法(Python)
DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种很典型的密度聚类算法,和K-Means,BIRCH这些一般只适用于凸样本集的聚类相比,DBSCAN既可以适用于凸样本集,也可以适用于非凸样本集。这类密度聚类算法一般假定类别可以通过样本分布的紧密程度决定。同一类别的样本,他们之间的紧密相连的,也就是说,在该类别任意样本周围不远处一定有同类别的样本存在。
使用场景: 用于不均匀的簇大小,以及非平坦的集合结构
2019-05-31
K均值聚类(KMeans)算法(Python)
K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。
使用场景:通用聚类方法,用于均匀的簇大小,簇的数量不多的情况。
2019-05-31
K近邻(K-Nearest Neighbors, KNN)回归算法(Python)
K近邻(K-Nearest Neighbors, KNN)算法既可处理分类问题,也可处理回归问题,其中分类和回归的主要区别在于最后做预测时的决策方式不同。KNN做回归预测时一般采用平均法,预测结果为最近的K个样本数据的平均值。
2019-05-31
K近邻(K-Nearest Neighbors, KNN)分类算法(Python)
K近邻(K-Nearest Neighbors, KNN)算法既可处理分类问题,也可处理回归问题,其中分类和回归的主要区别在于最后做预测时的决策方式不同。KNN做分类预测时一般采用多数表决法,即训练集里和预测样本特征最近的K个样本,预测结果为里面有最多类别数的类别。
2019-05-31
局部线性嵌入(Locally Linear Embedding,LLE)(Python)
局部线性嵌入(Locally Linear Embedding,LLE)也是非常重要的降维方法。和传统的PCA,LDA等关注样本方差的降维方法相比,LLE关注于降维时保持样本局部的线性特征,由于LLE在降维时保持了样本的局部特征,它广泛的用于图像图像识别,高维数据可视化等领域。
2019-05-31
等度量映射(Isomap)(Python)
等度量映射(Isomap)是最经典的非线性映射降维方法之一,它在MDS的基础上引入了“测地距离”的概念,直接解决了MDS使用欧氏距离无法应对非线性流形的问题。
2019-05-31
多维缩放(multidimensional scaling ,MDS)(Python)
多维缩放(multidimensional scaling ,MDS),是另外一种线性降维方式,与主成分分析法和线性降维分析法都不同的是,多维缩放的目标不是保留数据的最大可分性,而是更加关注与高维数据内部的特征。多维缩放算法集中于保留高维空间中的“相似度”信息,而在一般的问题解决的过程中,这个“相似度”通常用欧式距离来定义。
2019-05-31
核主成分分析(Kernel Principal Component Analysis, KPCA)(Python)
核主成分分析(Kernel Principal Component Analysis, KPCA)
PCA方法假设从高维空间到低维空间的函数映射是线性的,但是在不少现实任务中,可能需要非线性映射才能找到合适的低维空间来降维。
非线性降维的额一种常用方法是基于核技巧对线性降维方法进行核化(kernelized)。这是对PCA的一种推广。
2019-05-31
主成分分析(Principal components analysis)(Python)
主成分分析(Principal components analysis)是最常用的降维方法
算法步骤:
(1)对所有样本进行中心化操作
(2)计算样本的协方差矩阵
(3)对协方差矩阵做特征值分解
(4)取最大的d个特征值对应的特征向量,构造投影矩阵
2019-05-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人