自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

转载 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化

一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std  计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:使用sklearn.preprocessing.scale()函数,可以直接将给定数据进行标准化。

2016-04-10 12:21:43 488

转载 关于缺失值(missing value)的处理

在sklearn的preprocessing包中包含了对数据集中缺失值的处理,主要是应用Imputer类进行处理。首先需要说明的是,numpy的数组中可以使用np.nan/np.NaN(Not A Number)来代替缺失值,对于数组中是否存在nan可以使用np.isnan()来判定。使用type(np.nan)或者type(np.NaN)可以发现改值其实属于float类型,代码如下:

2016-04-10 12:20:24 1803

转载 libsvm使用技巧

LIBSVM数据格式需要----------------------决策属性 条件属性a条件属性b ...2 1:7 2:5 ...1 1:4 2:2 ...数据格式转换----------------------当数据较少时,可以用formatdatalibsvm轻松地将文本数据转换成为svm工具使用的数据。使用方法为:1,打开FormatDataLibsvm

2016-04-05 15:23:02 382

转载 libsvm使用心得

svmutil中主要包含了以下几个函数:svm_train(): train an SVM modelTrain ( 训练 ) data. 跑 SVM 被戏称为 " 开火车 " 也是由于这个程序名而来 . train 会接受特定格式的输入 , 产生一个 "Model" 檔 . 这个 model 你可以想象成 SVM 的内部数据 , 因为 predict 要 model 才能 predi

2016-04-04 22:04:14 4340 1

原创 python libsvm 使用中问题

>>>import os#地址是libsvm里面的python文件夹目录>>>os.chdir(‘/home/huangjiaheng/下载/libsvm-3.21/python’)>>>from svmutil import *

2016-04-04 21:49:08 379

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除