自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 问答 (1)
  • 收藏
  • 关注

原创 机器学习理论——KNN

K近邻算法(k-nearnest neighbors)可做回归和分类,两者的区别在于最后做预测的决策方式不同;回归是选择平均法,即最近的k个样本的样本输出值的平均值作为回归的预测值;分类是多数表决法,即训练集中和预测的样本特征最近的k个样本,预测为里面有最多类别数的类别。(1)KNN算法三要素KNN算法三要素:k值的选择,距离的度量方式和分类决策规则k值的选择:一般根据样本分布,选择较小的...

2019-09-19 11:51:05 1920

原创 机器学习理论——朴素贝叶斯

大部分分类算法都是判别方法,即直接学习出特征输出Y和特征X之间的关系,要么是决策函数Y=f(x)Y=f(x)Y=f(x),要么是条件概率分布P(Y∣X)=P(Y,X)/P(X)P(Y|X)=P(Y,X)/P(X)P(Y∣X)=P(Y,X)/P(X);而朴素贝叶斯算法是生成方法,即直接找出特征输出Y和特征X之间的联合概率分布P(Y,X)P(Y,X)P(Y,X),然后用P(Y∣X)=P(Y,X)/P(...

2019-09-19 11:50:54 185

原创 机器学习理论——CART决策树

行文思路:CART分类树(重点比较与C4.5算法异同)——CART回归树(重点比较与CART分类树异同)——CART树建树和剪枝算法——总结决策树的优缺点CART分类树算法...

2019-09-01 22:05:05 370

原创 机器学习理论——决策树ID3和C4.5

(1)决策树ID3算法的信息论基础熵在物理学中是度量分子运动的不确定性,分子运动不确定性越大熵越大。而在信息论中,熵度量事件的不确定性,越不确定的事件,熵越大。离散随机变量X的熵:H(X)=−∑i=1npilogpiH(X)=-\displaystyle\sum_{i=1}^{n}p_ilogp_iH(X)=−i=1∑n​pi​logpi​,其中n是离散随机变量的n种不同离散值,pip_ipi...

2019-08-30 11:45:45 181

原创 机器学习理论——知识前提、回归和感知机

前言:所有数学值的大写形式无特殊说明均表示向量形式。梯度下降法:超参数:步长α和各方向梯度下降距离ξ损失函数:J(θ) = 12∗(Xθ−Y)T(Xθ−Y)\frac{1}{2}* (Xθ-Y)^T(Xθ-Y)21​∗(Xθ−Y)T(Xθ−Y)下降距离=梯度*步长:∂J(θ)∂θ∗α\frac{\partial J(θ)}{\partial θ} * α∂θ∂J(θ)​∗α 其中a初始值一...

2019-08-29 16:23:12 313

原创 Numpy,Pandas和matplotlib的知识点总结

Numpy1. 数组的基本属性data.shape 了解数组的结构data.dtype 了解数组的数据类型2.创建数组np.array([1,2,3,4,5,6])data1 = [[1,2,3],[4,5,6]]np.array(data1)np.zeros([3,4])np.ones([5,6])np.arange(6) #创建一个从0到5的数组np.arange...

2018-10-28 21:38:08 781

原创 对数据分析师岗位进行数据分析

1. 爬取数据利用GitHub上的现成包(需要的话可以留言),修改参数后获得XX网关于“数据分析师”的数据。爬取完成后为一个txt的文本,内容如下:总体来说关于职位的信息已经比较齐全了。2.数据预处理引入EXCEL后的状态,所有数据都在一列中,导致数据共8W行。。。。。。对原始数据进行操作Created with Raphaël 2.2.0开始删除--------------依靠定...

2018-10-26 15:41:18 714

转载 csdn怎么快速转载别人的文章

首先确定原文允许转载在文章开头处一般有版权声明,如图转载时要注明出处和作者如何转载用谷歌浏览器加载文章地址,打开文章F12打开Developer Tools,并打开Elements页面将文章开头部分的文字作为关键字在Elements界面搜索以此文为例:http://blog.csdn.net/aggressive_snail/article/details/5437587...

2018-10-25 15:55:07 156

原创 《Python编程从入门到实践》常用知识点的复习

第二章 变量与简单数据类型2.2 变量变量名只包含数字,字母和下划线,且数字不打头2.3 字符串修改字符串大小写:str.title(), str.upper(), str.lower()合并字符串:str1 + str2添加空白:‘\tPython\nJava’ (\t:制表符,\n:换行符)删除空白:str.rstrip(删除末尾空白),str.lstrip(删除开头空白)...

2018-10-25 15:46:40 263

原创 Leetcode刷题以及CSDN中sql常用习题练习有感

知识点补充:交换同一列两个值A,B的位置:update tb_name set col_name = (if col_name = A, B, A) 或者 update tb_name set col_name = (case when col_name = A then B else A end)union 组合了多个select语句结果,不包含重复值;union all 组合了多个sel...

2018-10-23 21:28:14 460

原创 SQL常用语句的学习小结

@目录SQL常用语句的学习小结之前学习SQL的基本操作的知识,现在隔一段时间后对其进行总结。下列语句中,[]表示可有可无的语句1. SQL最基本的命令1.1 数据库的基本操作通过命令提示符对数据库进行操作(后期直接用Navicat对数据库操作更加方便):连接数据库:mysql -u用户名 -p密码创建数据库并确定编码方式:create database db_name char...

2018-10-22 17:18:13 528

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除