nanaliv-CSDN博客

排序：: 按最后发布时间; 按访问量; RSS订阅

空空如也

文本聚类结果描述研究综述

文本分类可以把未标注类别的文档分到预先定义好的类别中去。图1.1 是文本分类的示意图。一般来说，文本分类系统是采用有指导学习(Supervised Learning)方法来构造一个分类器(Classifier)。首先，提供一些标注 Fig. 1.1 The Frame of Text Categorization 好类别的训练样本文档集合；然后，基于这些训练样本，训练分类模型的参数；这样就构造一个文本分类系统，它可以对新文档进行分类。

2010-05-20

wawatextcluster

java 实现，简单的文本聚类算法实现，源代码

2010-05-18

基于K-means的算法研究

本数据高维性和稀疏性的特点使得文本对象间的相似度不易度量，根据文本间的相似度为k-means算法选择的始聚类中心时可能不能很好的代表整个文本集。针对该缺点，对k．means算法中的初始化问题，提出一个改进的初始聚类中心选择方法。实验表明改进的方法选择到初始聚类中心比较分散且代表性好。

2010-05-17

改进性文本聚类资源研究

经典的文本聚类算法很多，K均值聚类算法是目前比较流行的一种基于划分的算法。该算法中文档相似度计算通常采用向量空间模型，它们在假设术语间相互独立的基础上，通过逻辑表达式或向量间的内积反映用户查询和文档的相似度，将查询结果按相似度的降序排列后提供给用户[1]。它们对用户的查询项进行精确匹配，因此只能反映用户所要检索内容的某一方面，无法保证语义概念上的匹配。而且算法效果与样本输入的次序和词频相关，只有当句子包含的词数足够多时，相关的词才会重复出现，其效果才能体现出来，因此该算法只适合于词频较大的大文档_2]。对于小文本文档，K均值聚类算法很难反映出其语义特征，检索效果较差。为此，笔者提出了一种改进型的K均值聚类算法，解决中小文档聚类问题。

2010-05-17

话费管理系统关于话费的服务系统

话费服务系统话费服务系统话费服务系统话费服务系统话费服务系统话费服务系统话费服务系统话费服务系统话费服务系统

2010-03-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人