自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 windows+sublime+latex

1. 基本要求TeXlive 或者 MiKTeX (本文以 TeXlive 2015 为例)Sublime Text 3LaTeXTools 插件TeXlive 和 Sublime Text 的安装这里不再赘述,需要注意的一个事情是,安装之后需要将 TeXlive 的 bin 目录(C:\texlive\2015\bin\win32)和 添加到系统的环境变量(PATH)中。下面再稍...

2018-12-05 16:30:13 1162

原创 K-D Tree 算法详解及Python实现

K-D Tree 算法  k−d treek−d tree\mathrm{k-d\ tree}即k−dimensional treek−dimensional tree\mathrm{k-dimensional\ tree},是一种分割k维数据空间的数据结构,常用来多维空间关键数据的搜索(如:范围搜素及近邻搜索),是二叉空间划分树的一个特例。通常,对于维...

2018-03-08 10:25:42 6107 1

原创 密度聚类之DBSCAN及Python实现

密度聚类密度聚类,即基于密度的聚类(density-based clustering),此类算法假设聚类结构能通过样本分布的紧密程度确定。前面所讲的原型聚类及层次聚类等都是把距离(欧式距离,闵科夫斯基距离,曼哈顿距离等)作为两个样本或者两个簇之间相似度的评价指标,因此导致了最终聚类结构大都是球状簇或者凸形集合,对任意形状的聚类簇比较吃力,同时对噪声数据不敏感,而基于密度的聚类算法可以发现任意形...

2018-03-08 10:23:30 16833 1

原创 层次聚类之AGNES及Python实现

层次聚类层次聚类,顾名思义,就是一层一层的进行聚类,它试图在不同层次对数据集进行划分,可以由上向下把大的类别分割,即“自顶向下”的分拆策略(见下面AGNES部分),也可以由下向上对小的类别进行聚合,即“自底向下”的聚合策略:开始把所有的样本都归为一类,然后逐步将他们划分为更小的单元,直到最后每个样本都成为一类。在这个迭代的过程中通过对划分过程中定义一个松散度,当松散度最小的那个类的结果都小于一...

2018-03-08 10:22:14 8069 1

原创 原型聚类之高斯混合聚类及Python实现

高斯混合模型聚类(Gaussian Mixture Mode,GMM)高斯混合模型是一种概率式的聚类方法,它假定所有的数据样本 xxx由kkk个混合多元高斯分布组合成的混合分布生成。 p(x)=∑i=1kαi⋅p(x|μi,Σi)(1.1)(1.1)p(x)=∑i=1kαi⋅p(x|μi,Σi)p(x)=\sum_{i=1}^{k}\alpha _{i}\cdot p(x | \mu _{i...

2018-03-08 10:20:14 5856 2

原创 原型聚类之学习向量量化及Python实现

学习向量量化(Learning Vector Quantization)学习向量量化(Learning Vector Quantization,简称LVQ)属于原型聚类,即试图找到一组原型向量来聚类,每个原型向量代表一个簇,将空间划分为若干个簇,从而对于任意的样本,可以将它划入到它距离最近的簇中,不同的是LVQ假设数据样本带有类别标记,因此可以利用这些类别标记来辅助聚类。 学习向量量化算法如...

2018-03-08 10:19:19 3041 4

原创 原型聚类之K均值算法及Python实现

原型聚类(prototype-based clustering)原型聚类,此类算法假设聚类结构能通过一组原型刻画,在现实聚类任务中极为常用,通常情形下,算法先对原型进行初始化,然后对原型进行迭代更新求解,采用不同的原型表示,不同的求解方式,将产生不同的算法,主要有:K均值算法、学习向量量化和高斯混合聚类。K均值算法K均值算法,顾名思义,可知将一组数据D={x1,x2,...,xm}...

2018-03-08 10:17:48 1028

原创 聚类之距离计算及Python实现

距离计算我们通常采用计算“距离”的方法来度量不同样本之间的相似性,进而判断该样本的大致类别。距离首先是一个几何概念,用dist(⋅,⋅)dist(⋅,⋅)\mathrm{dist}(\cdot,\cdot)表示,其中最为任熟悉的是二维和三维几何空间的欧几里德距离,随着数据维度的增大,距离在维数、幂次数等方面被推广了,距离被抽象为满足一些基本性质: 非负性:dist(xi,xj)≥0;(...

2018-03-08 10:16:38 8184

原创 聚类之性能度量详解

概念简述聚类是什么呢?我们都听说过“物以类聚”,即把“志同道合”的 数据分到一起归为一类,不同类之间在”志向“上具有较大分歧。举个栗子,茫茫人生中,我们普通大众会被God根据缘分进行聚类,缘分好的话,会成为朋友,甚至成为了可以互诉衷肠,”余生请指教“的男女盘友,那缘分不好的应该是一生从未谋面或者一面之缘或者是如《再见前任3》中那样成为了最熟悉的陌生人…好像扯远了。 言归正传,用标准的普通话来...

2018-03-08 10:15:32 1951

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除