自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

菜鸟打怪升级副本

在这里记录了我的学习笔记,为了随时随地查看,学习进步需要日积月累,以及要建立一个终身学习的信念。最初的学习就是搬砖,一定要动手搬,搬的时候多思考,自然就会学会盖房子,慢慢来,这里记录了我的进步。

  • 博客(32)
  • 资源 (2)
  • 收藏
  • 关注

原创 机器学习算法工程师成长之路

迷茫了就进来看看努力到哪个阶段了,瞬间就理清思路了!!!

2019-06-09 20:47:01 803

原创 关于阅读顺序、数据获取和笔记的逻辑。欢迎大家一起学习,共同成长。

事情再多,一件一件来,永远只有一件事情;乱七八糟的状态哪怕只有一件事,也会晕得七荤八素的。条理。理性。

2019-01-14 12:08:28 308

原创 2.excel—if、vlookup(hlookup)、match函数

最近在某五百强公司做数据分析的实习工作,除了一些sql以外,发现需要在excel里面的操作很频繁,包括一些函数、数据有效性,插件等,笔记一一补起来。

2019-07-24 15:17:08 1311

原创 5.【笔记】统计学习方法—EM算法

1.EM是什么1.1 E:求期望1.2 M:极大2. 代码

2019-06-11 11:04:45 307

原创 4.[笔记]统计学习方法—提升办法AdaBoost算法

1.AdaBoost算法原理;2.算法核心部分代码。

2019-06-09 22:14:30 283

原创 6.python基础(三)

模块、类、对象、继承、组合

2019-06-09 15:50:50 175

原创 3.统计学习方法—logistic regression

1.逻辑回归和最大熵模型。2.简单的基本原理。3.代码实现。

2019-06-01 21:23:10 308

原创 9.sklearn——logistic regression 参数解释 及 案例

sklearn logistic regression;参数;案例;混淆矩阵。

2019-05-31 17:40:10 10049

原创 5.python~递归(em......)

最近的学习总是绕不开递归的这个东西了,我决定学一下这个东西,刚接触还是理解有点问题,感觉理解了,也就那么回事,可是合上书,关掉博客,自己一写就一脸懵逼。多写写应该会好点,练上二十到题我再来BB。1.递归问题,从整数阶乘引入该问题。设函数 f(n)=n!=1∗2∗3∗⋅⋅⋅∗(n−1)∗nf(n)=n!=1 * 2 * 3 * ···* (n-1) * nf(n)=n!=1∗2∗3∗⋅⋅⋅∗(n...

2019-04-17 22:42:05 282

原创 4. 一份回炉重造的python基础练习(二)

不会就学啊,健忘就反复学啊,甭管什么,学它就完事儿了

2019-04-06 11:44:35 237

原创 2. 数据结构——串(python描述)

参考文献:[1]张光河.数据结构——python语言描述[M]. 北京:人民邮电出版社,2018,161-185.[2]文章目录1. 串1.1 串的基本概念1.2 串的顺序存储及运算1.3 串的链式存储及运算1. 串字符串通常被称为串。顺序存储链式存储模式匹配1.1 串的基本概念长度:字符个数空串:string="",长度为0空格串:stringBlank=" ",仅...

2019-04-01 21:37:12 1810 2

原创 【实习总结】特征工程、降维、随机森林调参(思维脑图)

非常感谢实习期间带我的师兄对我的指导。这个思维脑图是有道云笔记做出来的,没有图片分享功能,但是可以网页链接分享,全图看这里:点击这里!传送门!然后我这个总结基本上是我实习干的工作,在总结的时候有参考以下几篇博客:第一篇:阿里云栖社区-特征工程,点击!传送门第二篇:新闻?点这儿查看原文第三篇:标准化和哑变量处理、无监督分箱,传送门!以上。...

2019-03-29 14:54:41 1288 1

原创 3.python的几个函数:itertools.combinations()排列组合、zip()压缩打包、format、enumerate、np.linalg.norm求范数

1.itertools.combinations()排列组合2.combinations_with_replacement(),可重复组合3.zip()压缩打包4.format()5.enumerate()6.np.linalg.norm求范数

2019-03-26 12:02:11 1174

原创 2.【笔记】统计学习方法——sklearn之knn

统计学习方法——KNN【笔记】,附代码实现。

2019-03-25 17:27:13 505

原创 1.【笔记之】统计学习方法概论

统计学习方法第一章笔记总结,附案例实现及代码。

2019-03-24 22:37:57 242

原创 jupyte使用方法(清华镜像暂时停用,改配置中科大镜像)

1.清华镜像站的配置。2,jupyter 的默认文件夹配置。3.jupyter的常用快捷键。

2019-03-24 16:46:37 2916

原创 1.数据结构与算法(基础讲解笔记)

链表、线性表、栈、队列、二叉树、完全二叉树、满二叉树、查找、排序,时间复杂度

2019-03-20 17:41:53 1650

原创 8.关于python里面的混淆矩阵(confusion_matrix)排列问题,与教科书、R语言、SPSS都反着的!!!

python里面的混淆矩阵(confusion_matrix)排列问题,true 和 predict 的位置是反着的,并且positive 和negative也反着排列的!!!与教科书、R语言、SPSS都反着的!!!如果是从R转过来使用python的话,这个小偏差会造成巨大巨大巨大的损失!

2019-03-08 14:06:35 2852 1

原创 7.关于ADASYN使用中出现两种类型的报错

1.在使用ADASYN自适应综合过采样处理不平衡数据的时候遇到一个错误: No samples will be generated with the provided ratio settings.2.TypeError:fit_resample() missing 1 required positional argument: 'y'

2019-03-05 18:18:17 1798

原创 6.sklearn(机器学习)—简介分类和回归

现在的机器学习这么火,无论是推荐算法还是预测模型。本质上无非就是回归与分类两个问题。回归问题离不开均方误差,分类问题离不开距离公式、混淆矩阵、损失函数。本文简介常用的回归和分类算法。

2019-01-30 18:11:04 666

原创 5.sklearn之转换器(划分训练集和测试集、以及标准化、归一化数据会用transform,独热编码也会用到)

在sklearn中划分训练集和测试集、以及标准化、归一化数据

2019-01-29 17:04:19 4766 1

原创 4.sklearn—kmeans参数、及案例(数据+代码+结果)

完整的案例,数据+代码+加注释+结果。详细!

2019-01-28 19:46:44 42154 13

原创 3.sklearn—聚类分析详解(聚类分析的分类;常用算法;各种距离:欧氏距离、马氏距离、闵式距离、曼哈顿距离、卡方距离、二值变量距离、余弦相似度、皮尔森相关系数、最远(近)距离、重心距离)

聚类分析的分类;常用算法;各种距离:欧氏距离、马氏距离、闵式距离、曼哈顿距离、切比雪夫距离、卡方距离、二值变量距离、Jaccard距离、余弦相似度、汉明距离、皮尔森相关系数、最远(近)距离、重心距离、ward方法(离差平方和距离)、组间平均链锁距离、组内平均链锁距离;

2019-01-25 17:19:01 11659 2

原创 2.sklearn—评价指标大全(平均误差、均方误差、混淆矩阵、准确率、查全率、查准率、召回率、特异度,F1-score、G-mean、KS值、ROC曲线、AUC值、损失函数、结构风险最小)

平均误差、均方误差、混淆矩阵、准确率、查全率、查准率、召回率、特异度,F1-score、G-mean、KS值、ROC曲线、AUC值、损失函数、经验风险最小、结构风险最小

2019-01-23 17:27:13 33622 8

原创 1.关于scikit-learn简介

说明:这个sklearn系列的笔记,在我的分类scikit-learn里面,主要介绍常用的模型的参数,并且附带数据、案例、代码、结果。这个系列的笔记不会限于sklearn,还会包括一些时间序列(StatsModels)、词云(jieba & wordcloud)、LDA(NLP的最最最简单部分)。笔记整理自一下书目(同时推荐这些书,书中有交叉知识,我个人比较喜欢第一本):张良均,王...

2019-01-22 12:59:46 726

原创 4.pandas数据预处理(完)(数据清洗:重复值、异常值、缺失值;标准化、哑变量、离散化、无监督分箱)

整理完了。附带数据、代码、结果。

2019-01-14 17:57:35 8987 12

原创 3.Matplotlib数据可视化基础(下)(散点图、折线图、直方图、饼图、箱线图)

接上文笔记说明:本文是我的学习笔记,大部分内容整理自 黄红梅,张良均等.Python数据分析与应用[M].北京:人民邮电出版社,2018:52-77. 还有部分片断知识来自网络搜索补充。可视化这块的内容我以后会专门学习一本参考书然后整理笔记的,现在仅仅是整理上述参考书的一个章节的基础知识。接上文的目录2.2折线图两个栗子!2.2折线图plt.plot()参数名称说明...

2019-01-14 11:49:30 1979

原创 3.Matplotlib数据可视化基础(上)(pyplot、rc参数、散点图、折线图)

笔记说明:本文是我的学习笔记,大部分内容整理自 黄红梅,张良均等.Python数据分析与应用[M].北京:人民邮电出版社,201852-77. 还有部分片断知识来自网络搜索补充。可视化这块的内容我以后会专门学习一本参考书然后整理笔记的,现在仅仅是整理上述参考书的一个章节的基础知识。

2019-01-10 17:50:54 2050

原创 2.pandas统计分析基础(读取数据、dataframe、索引)

笔记说明:本文是我的学习笔记,大部分内容整理自 黄红梅,张良均等.Python数据分析与应用[M].北京:人民邮电出版社,2018,80-130. 还有部分片断知识来自网络搜索补充。推荐 这个博客帖子https://blog.csdn.net/hhtnan/article/details/80080240文章目录1.读写文本文件1.1文本读取1.2文本文件储存1.3读写excel2. 掌握da...

2019-01-09 17:59:02 1016 1

原创 2.python基础知识(分支循环、列表、元组、字典、集合、函数)(一)

笔记说明:这是我的学习笔记,这部分内容整理自小甲鱼的python零基础入门,但不限于小甲鱼。目录文章目录目录基础知识分支循环列表、元组、字典、集合、函数列表、元组函数字典与集合基础知识import osos.getcwd()os.chdir('D:\codes\python')print('i love python \n' *3)"""---小甲鱼说这是一个游戏,哈哈哈哈哈-...

2019-01-09 00:54:00 278

原创 1.python3数据读取、新建sheet写入数据

pd.read_excel()和load_workbook()

2019-01-08 17:56:29 6722

原创 1.Numpy数值计算基础(随机数、索引、数组形状、矩阵、去重、排序)

笔记说明:本文是我的学习笔记,大部分内容整理自 黄红梅,张良均等.Python数据分析与应用[M].北京:人民邮电出版社,2018,21-49. 还有部分片断知识来自网络百度。一个目录1.数组对象ndarray1.1创建数组类型1.1.1数组属性1.1.2数组创建1.2生成随机数1.3索引访问数组1.3.1一维数组的索引1.3.2多维数组的索引1.4变换数组的形态1.4.1 改变数组形状1.4....

2019-01-08 16:19:08 708

pandas数据预处理数据

数据是4.pandas数据预处理配套的数据,原始数据下载自泰迪杯睿思数据的网站,侵删!我在博客开头就申明了,参考文献来源于这本书,黄红梅,张良均等.Python数据分析与应用[M].北京:人民邮电出版社,2018,的第三章附带数据。原网站也是免费共享的,所以我就也共享出来了。如侵权,请聊系我,倾删!!

2019-01-14

国民经济核算季度分数

来源于这本书,黄红梅,张良均等.Python数据分析与应用[M].北京:人民邮电出版社,2018,的第三章附带数据。原网站也是免费共享的,所以我就也共享出来了。如侵权,请聊系我,倾删!!

2019-01-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除