- 博客(5)
- 收藏
- 关注
转载 numpy
import numpy as np 为提高运算效率,ndarray数组值的类型默认相同,创建时自动指定默认数据类型(内存占用最大的值类型) 默认浮点类型(float) numpy方法 解释 np.dtype 指定当前numpy对象的整体数据, 见下一个表格 np.itemsize 对象中每个元素的大小, 单位字节 np.size 对象元素的个数, 相当于np.shap...
2019-01-09 17:09:27 184
转载 使用sklearn进行数据挖
1 使用sklearn进行数据挖掘1.1 数据挖掘的步骤 数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sklearn做单机特征工程》中,我们最后留下了一些疑问:特征处理类都有三个方法fit、transform和fit_transform,fit方法居然和模型训练方法f...
2018-12-25 00:16:33 80
转载 pipeline_1221
本节参考与文章:用 Pipeline 将训练集参数重复应用到测试集 pipeline 实现了对全部步骤的流式化封装和管理,可以很方便地使参数集在新数据集上被重复使用。 pipeline 可以用于下面几处: 模块化 Feature Transform,只需写很少的代码就能将新的 Feature 更新到训练集中。 自动化 Grid Search,只要预先设定好使用的 Model 和参数的候选,就能自动...
2018-12-21 13:02:29 89
原创 1221_reviews
Python enumerate() 函数 enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中 语法 以下是 enumerate() 方法的语法: enumerate(sequence, [start=0]) 返回 enumerate(枚举) 对象 ...
2018-12-21 10:04:43 81
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人