- 博客(5)
- 收藏
- 关注
转载 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:使用sklearn.preprocessing.scale()函数,可以直接将给定数据进行标准化。
2016-04-10 12:21:43 488
转载 关于缺失值(missing value)的处理
在sklearn的preprocessing包中包含了对数据集中缺失值的处理,主要是应用Imputer类进行处理。首先需要说明的是,numpy的数组中可以使用np.nan/np.NaN(Not A Number)来代替缺失值,对于数组中是否存在nan可以使用np.isnan()来判定。使用type(np.nan)或者type(np.NaN)可以发现改值其实属于float类型,代码如下:
2016-04-10 12:20:24 1803
转载 libsvm使用技巧
LIBSVM数据格式需要----------------------决策属性 条件属性a条件属性b ...2 1:7 2:5 ...1 1:4 2:2 ...数据格式转换----------------------当数据较少时,可以用formatdatalibsvm轻松地将文本数据转换成为svm工具使用的数据。使用方法为:1,打开FormatDataLibsvm
2016-04-05 15:23:02 382
转载 libsvm使用心得
svmutil中主要包含了以下几个函数:svm_train(): train an SVM modelTrain ( 训练 ) data. 跑 SVM 被戏称为 " 开火车 " 也是由于这个程序名而来 . train 会接受特定格式的输入 , 产生一个 "Model" 檔 . 这个 model 你可以想象成 SVM 的内部数据 , 因为 predict 要 model 才能 predi
2016-04-04 22:04:14 4341 1
原创 python libsvm 使用中问题
>>>import os#地址是libsvm里面的python文件夹目录>>>os.chdir(‘/home/huangjiaheng/下载/libsvm-3.21/python’)>>>from svmutil import *
2016-04-04 21:49:08 379
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人