自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 问答 (1)
  • 收藏
  • 关注

原创 RMSE、MAPE、准确率、召回率、F1、ROC、AUC数据挖掘中的性能指标总结

RMSE(root mean square error)均方根误差单纯统计误差的值。 MAPE(mean absolute percentage error) 平均百分比误差存在一个和原始数据相比较的过程。 准确率(precision)P:P=TP/(TP+FP)TP(true positive) FP(false positive)P是代表预测为真...

2018-03-06 16:43:07 28779 5

原创 异或运算

异或是计算机中的逻辑运算用^表示,在异或运算时需要转换成二进制运算且:1 ^ 1 = 0; 1 ^ 0 = 1; 0 ^ 0 = 0; 0 ^ 1 = 1int a = 3; b = 4a ^ b = 7a => 011 ; b => 100 ; a ^ b = 011 ^ 100 = 111 => int 7运算规律 1、x ^ y = y ^ x2...

2018-01-06 16:11:19 1559

原创 装饰器的使用

类似于想要在函数在运行前打印函数名方便调试程序,这种在函数调用前运行的内容,可以称之为函数的装饰,而实现装饰的函数可以称之为装饰器。首先自己定义一个函数:def now(*args,**kw): print(args) print('2018-1-5') 想要now函数print之前打印函数名可以的做法: def decorator(fun): ...

2018-01-05 13:17:17 1063

原创 fun中*args和**kw的含义

*args和**kw都代表不确定的函数变量,即在函数调用时可以选择传入或者不传入参数,都不影响函数运行。其中*args将传入对象当成是元组对待;**kw将传入对象当成字典对待。例:def fun(*args): print(args)fun(1,2,3)(1,2,3)def fun(**kw): for k in kw: print(k...

2018-01-04 21:39:07 2375

原创 pandas.DataFrame.prod()

DataFrame中的prod()函数是返回不同维度上的乘积prod函数有几个参数axis(0 or 1)分别代表在纵轴和横轴上进行乘积运算skipna(Boolean)计算时是否忽略空值levelint or level name, default NoneIf the axis is a MultiIndex (hierarchical), count along a p...

2018-01-03 11:00:03 5367

原创 Principal component analysis(PCA)主成分分析

PCA是将原始数据X通过数学方法降维,得到产生该形式数据的内在原因。主要步骤为:1)求原始数据X的协方差矩阵S2)求S的最大特征值对应的K个特征向量并构成权重矩阵W3)将W与X内积得到降维数据Z代码如下:# -*- coding: utf-8 -*-"""Created on Sat Oct 7 20:21:05 2017@author: wjw"""impor

2017-10-08 19:07:57 456

原创 基于DNN的semi-supervised learning

半监督学习:就是通过部分有label的数据,学习得到其余没有label数据的label。本文用的方法是 low-density separation (低密度的边界分类)中 self-training 方法;low-density separation 是按照“非黑即白”的观念进行分类。在对已有label数据建立模型时,本文采用的是DNN。整体基本步骤如下:repeat:1)将已有la

2017-09-25 16:27:11 435

原创 连续数值属性的CART decision tree

划分数据集:Iris;数据形如:       a    b    c    d           class0    5.1  3.5  1.4  0.2     Iris-setosa1    4.9  3.0  1.4  0.2     Iris-setosa2    4.7  3.2  1.3  0.2     Iris-setosa3    4.6  3.1  1

2017-09-22 15:36:57 828

原创 keras深度学习入门

目标:完成对Iris数据集分类Iris是4维数据,所以第一层的neuron的数目时4;定义两个hidden-layer,每层有10个neuron;因为要对Iris数据分成3类,所以最后一层的neuron数目为3,且activation函数为softmax,将输出结果normalized到0-1之间。重要函数:keras.utils.to_categorical(),将数据转换成one-

2017-09-16 19:21:32 297

原创 multi-class logestic regression的python实现

logestic 多分类问题原理:每一维上都进行回归,每一维上进行gradient descent不多说了贴代码:# -*- coding: utf-8 -*-"""Created on Sun Sep 10 20:47:58 2017@author: wjwlogestic regression 来分类就是通过已有data来估计数据的分布模型,然后将test数据

2017-09-15 11:50:15 707

原创 gradient descent 的python实现

从模拟数据集到曲线拟合# -*- coding: utf-8 -*-"""Created on Tue Sep 5 21:21:58 2017@author: wjw模拟产生数据集,然后再进行拟合"""def nomalization(X):#不归一化时梯度下降时数值太大,报错 maxX = max(X) minX = min(X) normaliz...

2017-09-07 20:57:12 3742

原创 二分K-means的python实现

前两天无意间看到”zouxy09“大牛的机器学习算法与Python实践之(六)二分k均值聚类讲解,我感觉很受启发啦,但是又看到下面的评论里说出了一些不足,然后就抱着试一试的心态去做了一下,所以数据还是用的”zouxy09“的,链接在下面贴出来了。下面放代码啦~#coding:utf-8#二分K-means算法import numpy as npimport randomimport m

2016-12-25 10:30:05 1270 4

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除