自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 pandas的sort_index()及单列、多列sort_values()

目录pandas的sort_index()及单列、多列sort_values()1.sort_index()2.单列sort_values()3.多列sort_values()小结pandas的sort_index()及单列、多列sort_values()pandas可以通过使用sort_index()及sort_values(by=‘col1’)或者sort_values(by=[‘col1...

2019-09-26 14:58:41 3027

原创 pandas的apply() | map() | applymap()的使用

文章目录简述示例展示apply方法:map方法:applymap方法:总结简述pandas中的apply、map、applymap都是利用lambda函数对DataFrame中的数据进行处理,几个方法之间的异同如下:pandas的两种数据结构即dataframe和series 中都可以使用apply方法,dataframe中的apply方法需要指定axis参数(axis默认为0即使用lam...

2019-09-05 10:33:31 406 1

原创 pandas创建DataFrame的几种方式

pandas创建DataFrame的几种方式pandas简介pandas数据结构DdtaFrame的创建总结pandas简介Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。本文重点对pandas的DataFrame创建的不同方式进行展示,并分析其使用场景。pandas数据结构1.DataFra...

2019-08-16 15:25:54 1548

原创 从源码的角度解释调用sklearn.metrics中roc_curve()方法的疑惑

关于roc_curve的疑惑和解释前言疑惑1:len(thresholds)的长度为什么比len(y_pre_pro)大1?疑惑2:其返回一个大于1的阈值,如何不影响最终roc和auc曲线图疑惑3:对于多个阈值相近,为了使图像更加清楚,可以使用什么技巧?总结前言模型训练完成后,在计算ks值以及绘制roc曲线和auc曲线时候,我们方便的调用sklearn.metrics中的ric_curve(y...

2019-05-06 16:56:00 2465 2

原创 pandas的is in和not in

pandas的is in和not in简介代码使用总结简介pandas按条件筛选数据时,除了使用query()方法,还可以使用isin和对isin取反进行条件筛选.代码 import pandas as pd df = pd.DataFrame({'a':[1, 2, 3, 4, 5, 6], 'b':[1, 2, 3, 4, 5...

2019-04-27 13:53:20 13139 1

原创 pandas查询函数query的使用

pandas查询函数query的使用query() 函数简介代码示例使用总结query() 函数简介pandas的query()方法是基于DataFrame列的计算代数式,对于按照某列的规则进行过滤的操作,可以使用query方法。代码示例import pandas as pddf = pd.DataFrame({'a':[1, 2, 3, 4, 5, 6], ...

2019-04-27 13:22:05 13068

转载 Python之日期与时间处理模块(date和datetime)

Python之日期与时间处理模块(date和datetime)https://blog.csdn.net/p9bl5bxp/article/details/54945920

2019-04-27 10:45:04 831

原创 F检简介及代码

F检简介及代码1.介绍2.计算3.代码:1.介绍名叫做联合假设检验(英语:joint hypotheses test),此外也称方差比率检验、方差齐性检验。它是一种在零假设(null hypothesis, H0)之下,统计值服从F-分布的检验。2.计算(1)样本标准偏差的平方,即:两组数据就能得到两个S2值。(2)F=S2/S2’(3)然后计算的F值与查表得到的F表值比较,如果...

2019-04-26 15:14:22 1069

原创 pandas groupby + unstack的使用

pandas groupby + unstack的使用概述代码说明1.仅对数据进行分组聚合2.对分组聚合后的数据进行unstack3.对分组聚合后的某列进行unstack概述groupby()可以根据DataFrame中的某一列或者多列内容进行分组聚合,当DataFrame聚合后为两列索引时,可以使用unstack()将聚合的两列中一列值调整为行索引,另一列的值调整为列索引。代码说明tes...

2019-04-26 15:10:19 5201

原创 lgb+随机搜索流程及代码

lgb+随机搜索流程及代码LightGBM简介随机搜索简介lgb+RandomSearchCV使用代码:LightGBM简介LightGBM是一个梯度Boosting框架,使用基于决策树的学习算法,他的特点是分布和高效的,他主要有以下优势:1)更快的训练效率2)低内存使用3)更高的准确率4)支持并行化学习5)可以处理大规模数据随机搜索简介随机搜索的思想和网格搜索比较相似,只是不再...

2019-04-26 15:06:36 1396

原创 xgb+网格调参流程及代码

xgb+网格调参流程及代码XGB简介网格调参简介网格调参代码总结Xgb的特点:XGB简介XGBoost是一个优化的分布式梯度增强库,旨在实现高效,灵活和便携。 它在Gradient Boosting框架下实现机器学习算法。 XGBoost提供了并行树提升(也称为GBDT,GBM),可以快速准确地解决许多数据科学问题。 相同的代码在主要的分布式环境(Hadoop,SGE,MPI)上运行,并且可以...

2019-04-26 15:03:27 1648

转载 lgb--贝叶斯调参及代码

lgb--贝叶斯调及代码概述1.目标函数 objective():注:2.域空间 space:注:3.优化算法 algo注:4.结果历史记录 result:总结:概述贝叶斯优化问题有四个部分:目标函数 objective():我们想要最小化的内容,在这里,目标函数是机器学习模型使用该组超参数通过交叉验证计算损失值。域空间 space:要搜索的超参数的取值范围。优化算法 algo:构造替代...

2019-04-26 14:53:03 4315 1

原创 python多进程执行方法apply_async简单使用

python多进程执行方法apply_async简单使用apply_async简介apply_async使用简明代码使用总结:apply_async简介python在同一个线程中多次执行同一方法时,该方法执行耗时较长且每次执行过程及结果互不影响,如果只在主进程中执行,效率会很低,因此使用multiprocessing.Pool(processes=n)及其apply_async()方法提高程序...

2019-04-26 11:10:45 10427

原创 图解python.pandas groupby & pivot_table

图解python.pandas groupby & pivot_table图解:pandas groupby( )pandas groupby( )代码图解:pandas pivot_table( )pandas pivot_table( )代码常用的统计函数:图解:pandas groupby( )pandas groupby( )代码import pandas as pdte...

2019-04-26 11:03:55 617 2

原创 python pandas [rename, map, merge] 的简明使用

python pandas [rename, map, merge] 的简明使用列重命名:python.pandas.rename样本数据映射:python.pandas.map合并两个Dataframe:python.pandas.merge列重命名:python.pandas.renamedf.rename(columns={'A':'a', 'B':'b', 'C':'c'}, inpl...

2019-04-26 10:50:28 951

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除