- 博客(38)
- 资源 (7)
- 收藏
- 关注
转载 数值型数据和标称型数据
在学习机器学习的工程中,发现有一种名为标称型的数据,具体如下:标称型:一般在有限的数据中取,而且只存在‘是’和‘否’两种不同的结果(一般用于分类)数值型:可以在无限的数据中取,而且数值比较具体化,例如4.02,6.23这种值(一般用于回归分析)...
2018-03-28 20:21:47 656 2
转载 数据预处理
https://www.cnblogs.com/serena45/p/5559122.html.原始数据存在的几个问题:不一致;重复;含噪声;维度高。2.数据预处理包含数据清洗、数据集成、数据变换和数据归约几种方法。3.数据挖掘中使用的数据的原则应该是从原始数据中选取合适的属性作为数据挖掘属性,这个选取过程应参考的原则是:尽可能赋予属性名和属性值明确的含义;统一多数据源的属性值编码...
2018-03-26 20:30:36 704
转载 python map
*map* map(function, iterable, …)对可迭代函数’iterable’中的每一个元素应用‘function’方法,将结果作为list返回。 注意: Python 2.x 返回列表。 Python 3.x 返回迭代器。如果函数有多个参数, 但每个参数的序列元素数量不一样, 会根据最少元素的序列进行...
2018-03-23 08:42:07 502
转载 input() 和raw_input()
在Python3.X版本中,input()函数接收所有输入,并默认将所有的输入都看作字符串来处理,返回字符串类型。python3删除了raw_input()函数在python2.x中raw_input( )和input( ),两个函数都存在,其中区别为 raw_input( )—将所有输入作为字符串看待,返回字符串类型input( )—–只能 接收“数字”的输入,在对待纯数字输入时具有自...
2018-03-22 22:17:10 212
转载 if __name__ == '__main__'
if name == ‘main‘的意思是:当.py文件被直接运行时,if name == ‘main‘之下的代码块将被运行;当.py文件以模块形式被导入时,if name == ‘main‘之下的代码块不被运行。在Python中,一个.py文件就是一个模块,一般情况下,模块的名字就是文件名(不包括扩展名.py)。...
2018-03-22 21:34:45 177
转载 isinstance,issubclass
issubclass函数与isinstance 函数比较接近,isinstance 函数是判断一个实例对象与类的关系,issubclass函数判断类与类的关系。 并且isinstance 函数可以接受任何类型实例,但issubclass函数不行,会输出TypeError异常...
2018-03-19 20:50:42 335
转载 numpy的tile()函数
http://blog.csdn.net/wy250229163/article/details/52453201 侵删
2018-03-15 21:09:51 179
转载 reload()
在python2中,reload()是内置函数,能够直接使用。但是在python3中,直接使用reload()会报错,需要从imp中导入
2018-03-15 17:12:25 782 1
转载 readline() read() readlines()
https://www.cnblogs.com/qi09/archive/2012/02/10/2344964.html 读取文本对象的三种方法。 每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 .read() 每次读取整个文件,它通常用于将所有的文件内容放到一个字符串变量中。readline() 和 .readlines() 之间的差异是后者一次读取整个文件,...
2018-03-15 17:12:01 1682
原创 numpy
两行四列的矩阵 在python命令提示符下,引入python文件的时候,不加后缀名。 数组的size()函数 如何创建数组采用np.array()创建时需要几个维度就要用几个[ ]括起来,这种创建方式要给定数据shape()函数...
2018-03-15 15:35:15 119
转载 协方差与相关系数
参考自知乎https://www.zhihu.com/question/20852004协方差公式: 协方差表示两个变量X和Y的同向变化情况,如果是正的,表示同向变化,负的表示反向变化,越大表示相关性越大。 如果某一时刻的协方差为负数,也不一定说明他们反向运动,具体要结合整体情况来判断。 协方差很像点积相关系数公式: 相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标...
2018-03-12 22:09:07 8363
原创 unhashable type: 'list'
def loadDataSet(): postingList = [['my', 'dog', 'has', 'flea', 'problem', 'help', 'please'], ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'], [...
2018-03-06 19:50:43 2198
转载 keys(), values(), items()
Python3的keys(), values(), items()返回的都是迭代器,如果需要像Python2一样返回列表,只要传给list就行了
2018-03-06 15:22:37 293 1
原创 待研究的东东
朴素贝叶斯和贝叶斯估计得区别(统计学习方法 47页提到)P问题,NP问题。。统计学习方法57页提到https://www.zhihu.com/question/23468713?sort=created 可微和可导的区别http://jacoxu.com/jacobian%e7%9f%a9%e9%98%b5%e5%92%8chessian%e7%9f%a9%e9%98%b5/ 雅克...
2018-03-06 14:48:47 178
转载 进程 线程 协程
进程就是一个程序在一个数据集上的一次动态执行过程。 进程一般由程序、数据集、进程控制块三部分组成。我们编写的程序用来描述进程要完成哪些功能以及如何完成;数据集则是程序在执行过程中所需要使用的资源;进程控制块用来记录进程的外部特征,描述进程的执行变化过程,系统可以利用它来控制和管理进程,它是系统感知进程存在的唯一标志。线程是在进程之后发展出来的概念。 线程也叫轻量级进程,它是一个基本的CPU执行...
2018-03-05 21:10:56 98
转载 近似误差 与 估计误差
统计学习方法中说:k值越小,学习的近似误差(approximation error)越小,估计误差(estimation error)越大,反之则相反http://blog.csdn.net/weixin_37895339/article/details/78794190 近似误差:可以理解为对现有训练集的训练误差。 估计误差:可以理解为对测试集的测试误差。*近似误差关注...
2018-03-05 16:59:53 5245
原创 最长公共子序列 待研究
def lcs_len(a,b): c = [[0 for j in b] for i in a] for i in range(len(a)): for j in range(len(b)): if i==0 or j==0: continue if a[i]==b[j]:...
2018-03-04 20:24:26 136
转载 utf-8 和 cp936的区别
链接:https://www.zhihu.com/question/35609295/answer/63780022 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。CP936和UTF-8本身和Python是毫无关联的。 CP936其实就是GBK,IBM在发明Code Page的时候将GBK放在第936页,所以叫CP936。至于GBK,百度百科就说的很...
2018-03-04 15:27:28 36532
转载 联合概率分布 条件概率分布 边缘概率分布 待修改
http://blog.csdn.net/thither_shore/article/details/52192553
2018-03-02 15:51:05 578
转载 python 推导式
http://blog.csdn.net/chenKFKevin/article/details/74753072举例说明 “`
2018-03-02 14:01:04 122
转载 编码问题总结 utf-8 ASCII Unicode
https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431664106267f12e9bef7ee14cf6a8776a479bdec9b9000
2018-03-01 21:04:31 157
转载 python 命名
http://blog.sina.com.cn/s/blog_62f28d560100xpva.htmlPython把以两个或以上下划线字符开头且没有以两个或以上下划线结尾的变量当作私有变量。私有变量会在代码生成之前被转换为长格式(变为公有)。转换机制是这样的:在变量前端插入类名,再在前端加入一个下划线字符。这就是所谓的私有变量轧压(Private name mangling)。”py...
2018-03-01 10:20:00 179
原创 除法不同
Python2 中除法默认向下取整,因此 1/2 = 0,为整型。For (plain or long) integer division, the result is an integer. The result is always rounded towards minus infinity: 1/2 is 0, (-1)/2 is -1, 1/(-2) is -1, and (-1)/(...
2018-02-28 21:37:13 169
原创 range函数
python3中:range() 函数返回的是一个可迭代对象(类型是对象),而不是列表类型,。list() 函数是对象迭代器,把对象转为一个列表。返回的变量类型为列表。
2018-02-28 11:21:38 514 1
转载 true-positive,false-positive,true-negative,false-negative差别
考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。如果一个实例是正类并且也被 预测成正类,即为真正类(True positive),如果实例是负类被预测成正类,称之为假正类(False positive)。相应地,如果实例是负类被预测成负类,称之为真负类(True negative),正类被预测成负类则为假负类(false n
2017-12-23 16:31:29 720
原创 双系统安装问题
安装win8+ubuntu,安装完成后直接进入ubuntu系统,解决办法:在ubuntu终端运行:sudo update-grub重启解决
2017-11-14 21:58:18 126
转载 linux学习
安装ubuntu时候,分区,提示分区不可使用:方法:分区的时候先创建交换空间、逻辑分区的/boot和/home,这3个分区创建好了再创建主分区的/,就可以了只设置一个/ ,也可以安装完成...
2017-11-14 21:56:57 121
转载 python小白入坑
空白在Python中是重要的。事实上行首的空白是重要的。它称为缩进。在逻辑行首的空白(空格和制表符)用来决定逻辑行的缩进层次,从而用来决定语句的分组。这意味着同一层次的语句必须有相同的缩进。每一组这样的语句称为一个块。我们将在后面的章节中看到有关块的用处的例子。
2017-03-14 14:39:26 176
prefixspan 算法实现 python3
2018-05-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人