zymsearch-CSDN博客

排序：: 按最后发布时间; 按访问量; RSS订阅

空空如也

搬砖程序-liveStrategyEngine-master

搬砖程序-liveStrategyEngine-master，供学习参考。

2019-03-16

K近邻、支持向量机两个分类算法

目前，机器学习牵涉的编程语言十分多样，包括了MATLAB、Julia、R、Perl、Python、Ruby等等。小组内部之前对MATLAB较为熟悉，但考虑到拓展知识面、方便学习等因素，最后选择Python语言。原因包括：Python是解释语言，写程序很方便；Python用途很广，特点是在Web应用方面，以后可以方便地扩展到其它应用用途；用Python开发比较快，Python提供了NumPy、Theano、scikit-learn、matplotlib等强大的机器学习程序包；Python的效率不差；使用广泛，存在大量的开发文档等。为了能够把精力集中在机器学习本身上，小组直接选了，在Windws操作系统上，利用anaconda的spyder开发环境，其理由为方便、简单。学习《Python3程序开发指南.第二版》，学习Python程序开发，并了解NumPy、Theano、scikit-learn、matplotlib等程序包。

2017-03-18

文档主题的半监督分类问题-pyhon-机器学习

打开网站链接http://archive.ics.uci.edu/ml/，点击链接 view all data sets，打开所有数据页面，点击Instances，按照研究实例由多到少排序，我们小组选择了“Bag of Words Data Set”单词袋子的形式文本数据集。本次作业解决问题具体化为：文档主题的半监督分类问题。二、数据分析（一）认识数据数据集描述：对于每个文本数据集，D文档的数量，W是文档字典集中单词数量，N是数据中所有单词数量（NNZ为非零数据的数量），在分词器、去无用词之后，去重字典。 Bag of Words Data Set数据集网站提供了两个，这里我们选择数量较小的一组“mini_newsgroups”，该数据共包括20个分类，其中每个类包括100个文档，共包括2000个文档。

2017-03-18

机器学习字母分类-python

打开网站链接http://archive.ics.uci.edu/ml/，点击链接 view all data sets，打开所有数据页面，点击Instances，按照研究实例由多到少排序，选择任务为Classification的数据集，最后我们小组选择了“Letter Recognition Data Set”字母识别数据集。二、数据分析字母识别数据集每个对象有16个特征，共包括20000个数据对象，每个特征的取值都为整数，于1991年1月1日提供，主要用来进行数据分类试验。分类的目标是识别由黑白像素组成矩形的图像，代表26英文字母哪个字母。这些图像基于20种不同字体，并经过随机变形生成的20000个模拟实例。每个实例转化成16个原始数字特征，其中10000用于训练，另外10000个用于字母预测。因为每个样本都有明确的类标识，所以这个一个监督学习过程。

2017-03-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人