自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

转载 数据分析入门-pandas工具学习

第3章 分组一、SAC过程1. 内涵SAC指的是分组操作中的split-apply-combine过程其中split指基于某一些规则,将数据拆成若干组,apply是指对每一组独立地使用函数,combine指将每一组的结果组合成某一类数据结构2. apply过程在该过程中,我们实际往往会遇到四类问题:整合(Aggregation)——即分组计算统计量(如求均值、求每组元素个数)变换(...

2020-04-26 21:22:46 308

转载 数据分析入门-pandas学习之路(二)

第二章 索引引入pandas支持包引入函数import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv',index_col='ID')df.head()一、单级索引1. loc方法、iloc方法、[]操作符最常用的索引方法可能就是这三类,其中iloc表示位置索引,loc表示标签索引,[]也具有很大...

2020-04-23 17:38:07 831

原创 数据分析入门-pandas学习之路

第1章 Pandas基础预先安装pandas和numpy支持包一、文件读取与写入pandas中文件读取的方法都是read_格式名称csv格式:df=pd.read_csv('文件夹/csv文件名')txt格式:df=pd.read_table('文件夹/txt文件名')excel(需预先安装xlrd支持包):df=pd.read_excel('文件夹/xlsx文件名')文件写...

2020-04-20 19:42:26 402

转载 Datawhale 零基础入门数据挖掘-Task4 建模调参(小白学习之路)

写在最开头的话:对于纯小白的我来说,这一张的只是已经超过我的知识储备范围,只能完全引用大佬的文章来打卡,以便将来再拿出来学习建模与调参学习目标了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程完成相应学习打卡任务内容介绍线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时间序列...

2020-04-01 20:57:27 201

原创 Datawhale 零基础入门数据挖掘-Task3 特征工程(纯小白学习之路)

特征工程此部分为零基础入门数据挖掘的 Task3 特征工程 部分,了解各种特征工程以及分析方法,如果有做的不对的地方希望大家指出来,我会学习并改正赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:赛题地址特征工程目标对于特征进行进一步分析,并对于数据进行处理完成对于特征工程的分析,并对于数据进行一些图表或者文字总结并打卡。内容介绍常见的特征工程包括:1.异常处理:通过箱线...

2020-03-28 20:29:31 237

原创 DateWhale数据挖掘-纯小白

数据挖掘-Task2 数据分析EDA-数据探索EDA目标内容介绍载入各种数据科学以及可视化库载入数据判断数据缺失和异常预测值的分布类型特征分析用pandas_profiling生成数据报告代码示例载入各种数据科学以及可视化库载入数据载入训练集和测试集;2) 简略观察数据(head()+shape)1) 通过describe()来熟悉数据的相关统计量2) 通过info()来熟悉数据类型1) 查看每列...

2020-03-24 13:05:19 805

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除