自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 ubuntu下安装crf++遇到的一个问题

遇到过两次,在网上也找了许多资料,但是大多数都是忽悠人的,在这里写下我自己的解决方法。对于这个问题的处理网上很多说在path.h或者在node.cpp中引入#include,是的,引入之后是能解决这个问题,但是新的问题又会出来:找不到stdlib.h。正确的解决方法应该是在node.cpp中加入#include 和#include "node.h",要放在引入列表的最前边,如下图所示

2018-01-08 18:02:40 577

原创 Python 简单实现KNN算法

数据集是自己下载的mnist的手写识别的数据,有一个train.csv文本,一个test.csv测试文本,还有一个submission.csv文本(存放的是test.csv的标签),不多说了,KNN原理很简单,直接上代码吧#autor:zhouchao#date:2017-12-07 11:13#description:use knn to recognize numimpor

2017-12-07 15:32:34 777

原创 用.sql文件通过navicat导数据到mysql中,大文本会显示BLOB的问题

用.sql文件通过navicat导数据到mysql中,大的文本会出现如下图所示的显示,就是不显示内容,只显示一个BLOB具体的修改方法,右键表-》设计表,将相应的列的的类型改成text,再把字符集和排序规则修改,最后保存,按照以下格式修改就可以了。

2017-10-26 11:36:59 2685

原创 聚类系列-谱聚类(spectral clustering)

聚类讲到此,也是我聚类系列的最后一篇博客了,最后一篇的话我们就来讲一下谱聚类。    谱聚类(spectral clustering)是一种基于图论的聚类方法,主要思想是把所有的数据看做空间中的点,这些点之间可以用边连接起来。距离较远(或者相似度较低)的两个点之间的边权重值较低,而距离较近(或者相似度较高)的两个点之间的边权重值较高,通过对所有数据点组成的图进行切图,让切图后不同的子图间边权重

2017-06-05 09:45:55 24393 4

原创 聚类系列-Affinity Propagation

今天我们来讨论一个新的聚类算法-Affinity Propagation,可以翻译成中文名字“亲和传播”(或许翻译的不准确)。顾名思义,亲和传播涉及到两个方面,一个是亲和度,一个是传播,下边我们就围绕这两个方面来介绍这个算法,并且附上Java代码。    AP(Affinity Propagation)算法是一个基于图的聚类算法,图中的点就是待聚类的数据点,点之间的连线表示的是点之间的关系(一

2017-05-03 15:35:09 1532

原创 聚类系列-层次聚类(Hierarchical Clustering)

上篇k-means算法却是一种方便好用的聚类算法,但是始终有K值选择和初始聚类中心点选择的问题,而这些问题也会影响聚类的效果。为了避免这些问题,我们可以选择另外一种比较实用的聚类算法-层次聚类算法。顾名思义,层次聚类就是一层一层的进行聚类,可以由上向下把大的类别(cluster)分割,叫作分裂法;也可以由下向上对小的类别进行聚合,叫作凝聚法;但是一般用的比较多的是由下向上的凝聚方法。本文会对分裂法

2017-03-23 10:17:44 80909 17

原创 聚类系列-KMEANS

k-means聚类算法是聚类算法中应用非常广泛的一种算法。它是属于划分法的一种,是一种基于距离的聚类方法,在聚类的开始需要指定一个K值,表示需要聚类的数目。    k-means聚类算法的思想非常容易理解:拿到待聚类的N个样本和需要聚类的数目K(K算法的形式表示为:          设定聚类数目K;          在N个样本中随机的选择K个样本点作为初始的聚类中心点;

2017-03-16 10:30:43 1502

原创 聚类系列-概述

本系列要讲解一下本人这一段时间工作中 使用聚类来做的一些事情,第一次写博客大家不喜勿喷,有错误请及时指出,本人一定改正。         聚类,在百度百科中的介绍是将物理或抽象对象的集合分成由类似的对象组成的多个类的过程,其实在我们NLP领域所说的聚类跟这个如出一辙。聚类是一种无监督(unsupervised)的机器学习方法,何为无监督,最简单的理解就是不需要你标注训练的语料,直接将你要做

2017-02-27 16:12:54 1337

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除