黄佳恒-CSDN博客

转载关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化

一、标准化（Z-Score），或者去除均值和方差缩放公式为：(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性（按列进行）减去其均值，并处以其方差。得到的结果是，对于每个属性/每列来说所有数据都聚集在0附近，方差为1。实现时，有两种不同的方式：使用sklearn.preprocessing.scale()函数，可以直接将给定数据进行标准化。

2016-04-10 12:21:43 488

转载关于缺失值（missing value）的处理

在sklearn的preprocessing包中包含了对数据集中缺失值的处理，主要是应用Imputer类进行处理。首先需要说明的是，numpy的数组中可以使用np.nan/np.NaN（Not A Number）来代替缺失值，对于数组中是否存在nan可以使用np.isnan()来判定。使用type(np.nan)或者type(np.NaN)可以发现改值其实属于float类型，代码如下：

2016-04-10 12:20:24 1803

转载 libsvm使用技巧

LIBSVM数据格式需要----------------------决策属性条件属性a条件属性b ...2 1:7 2:5 ...1 1:4 2:2 ...数据格式转换----------------------当数据较少时，可以用formatdatalibsvm轻松地将文本数据转换成为svm工具使用的数据。使用方法为：1，打开FormatDataLibsvm

2016-04-05 15:23:02 382

转载 libsvm使用心得

svmutil中主要包含了以下几个函数：svm_train(): train an SVM modelTrain ( 训练 ) data. 跑 SVM 被戏称为 " 开火车 " 也是由于这个程序名而来 . train 会接受特定格式的输入 , 产生一个 "Model" 檔 . 这个 model 你可以想象成 SVM 的内部数据 , 因为 predict 要 model 才能 predi

2016-04-04 22:04:14 4340 1

原创 python libsvm 使用中问题

>>>import os#地址是libsvm里面的python文件夹目录>>>os.chdir(‘/home/huangjiaheng/下载/libsvm-3.21/python’)>>>from svmutil import *

2016-04-04 21:49:08 379

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化

转载 关于缺失值（missing value）的处理

转载 libsvm使用技巧

转载 libsvm使用心得

原创 python libsvm 使用中问题

空空如也

空空如也

转载关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化

转载关于缺失值（missing value）的处理