自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(0)
  • 资源 (4)
  • 收藏
  • 关注

空空如也

搬砖程序-liveStrategyEngine-master

搬砖程序-liveStrategyEngine-master,供学习参考。

2019-03-16

K近邻、支持向量机两个分类算法

目前,机器学习牵涉的编程语言十分多样,包括了MATLAB、Julia、R、Perl、Python、Ruby等等。小组内部之前对MATLAB较为熟悉,但考虑到拓展知识面、方便学习等因素,最后选择Python语言。原因包括:Python是解释语言,写程序很方便;Python用途很广,特点是在Web应用方面,以后可以方便地扩展到其它应用用途;用Python开发比较快,Python提供了NumPy、Theano、scikit-learn、matplotlib等强大的机器学习程序包;Python的效率不差;使用广泛,存在大量的开发文档等。 为了能够把精力集中在机器学习本身上,小组直接选了,在Windws操作系统上,利用anaconda的spyder开发环境,其理由为方便、简单。 学习《Python3程序开发指南.第二版》,学习Python程序开发,并了解NumPy、Theano、scikit-learn、matplotlib等程序包。

2017-03-18

文档主题的半监督分类问题-pyhon-机器学习

打开网站链接http://archive.ics.uci.edu/ml/,点击链接 view all data sets,打开所有数据页面,点击Instances,按照研究实例由多到少排序,我们小组选择了“Bag of Words Data Set”单词袋子的形式文本数据集。 本次作业解决问题具体化为:文档主题的半监督分类问题。 二、数据分析 (一)认识数据 数据集描述:对于每个文本数据集,D文档的数量,W是文档字典集中单词数量,N是数据中所有单词数量(NNZ为非零数据的数量),在分词器、去无用词之后,去重字典。 Bag of Words Data Set数据集网站提供了两个,这里我们选择数量较小的一组“mini_newsgroups”,该数据共包括20个分类,其中每个类包括100个文档,共包括2000个文档。

2017-03-18

机器学习字母分类-python

打开网站链接http://archive.ics.uci.edu/ml/,点击链接 view all data sets,打开所有数据页面,点击Instances,按照研究实例由多到少排序,选择任务为Classification的数据集,最后我们小组选择了“Letter Recognition Data Set”字母识别数据集。 二、数据分析 字母识别数据集每个对象有16个特征,共包括20000个数据对象,每个特征的取值都为整数,于1991年1月1日提供,主要用来进行数据分类试验。分类的目标是识别由黑白像素组成矩形的图像,代表26英文字母哪个字母。这些图像基于20种不同字体,并经过随机变形生成的20000个模拟实例。每个实例转化成16个原始数字特征,其中10000用于训练,另外10000个用于字母预测。因为每个样本都有明确的类标识,所以这个一个监督学习过程。

2017-03-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除