自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 机器学习算法:根据幸福感问卷调查做预测

阿里云 快来一起挖掘幸福感!项目实战项目地址1,数据准备问卷调查数据主要包含的个人信息有职业,婚姻状况,收入,学历等40个features,label就是幸福感。首先对数据进行预处理(一) 第二列是数据特征,先独立抽取出来。(二) 第七列是时间,本身对结果影响不大,又由于是字符串,暂时删除不用。(三) 数据本身包含20197个空缺,对数据进行补充。2,训练和预测给定的数据包含train和test两部分,先用train分成两部分对建立的模型进行训练评分,最后对test预测。3,代码实战3

2021-01-10 19:38:51 876 1

原创 机器学习算法-K近邻(KNN)算法(三):马绞痛数据--kNN数据预处理+kNN分类pipeline(代码附详细注释)

step 1:加载所需要的数据集和导入库函数# 下载需要用到的数据集!wget https://tianchi-media.oss-cn-beijing.aliyuncs.com/DSW/3K/horse-colic.csv# 下载数据集介绍!wget https://tianchi-media.oss-cn-beijing.aliyuncs.com/DSW/3K/horse-colic.names# 导入库函数import numpy as npimport pandas as pd#

2020-12-29 12:34:01 2075 3

原创 机器学习算法-K近邻(KNN)算法(二):二维数据,鸢尾花,模拟数据-算法实战(代码附详细注释)

二维鸢尾花数据-KNN分类step 1:库函数导入import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn import datasetsstep 2:数据导入#使用莺尾花数据集的前两维数据,便于数据可视化iris = datasets.

2020-12-25 11:29:54 1371

原创 机器学习算法-K近邻(KNN)算法(一):KNN的介绍,原理和应用

KNN的介绍kNN(k-nearest neighbors),中文翻译K近邻。我们常常听到一个故事:如果要了解一个人的经济水平,只需要知道他最好的5个朋友的经济能力, 对他的这五个人的经济水平求平均就是这个人的经济水平。这句话里面就包含着kNN的算法思想。示例 :如上图,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果K=5,由于蓝色四方形比例为3/5,因此绿色圆被赋予蓝色四方形类。KNN建立过程1 给定测试样本

2020-12-24 19:53:45 1230 2

原创 机器学习算法-朴素贝叶斯(三):朴素贝叶斯-原理简析

机器学习算法-朴素贝叶斯(一):朴素贝叶斯简介和鸢尾花分类实战(代码附详细注释)机器学习算法-朴素贝叶斯(二):模拟离散数据集–贝叶斯分类(代码附详细注释)接上篇文章step 1:结果分析,详解alpha=1的含义alpha=1这个参数表示什么?我们知道贝叶斯法一定要计算两个概率:条件概率: ????(????(????)=????(????)|????=????????) 和类目 ???????? 的先验概率: ????(????=????????) 。对于离散特征:我们可以看出就是对每

2020-12-24 16:55:55 582 1

原创 机器学习算法-朴素贝叶斯(二):模拟离散数据集--贝叶斯分类(代码附详细注释)

step 1:库函数导入import randomimport numpy as np# 使用基于类目特征的朴素贝叶斯from sklearn.naive_bayes import CategoricalNBfrom sklearn.model_selection import train_test_splitstep 2:数据导入和分析# 模拟数据rng = np.random.RandomState(1) #随机数生成种子设置为“1”,确保别人和我自己的生成数字相同# 随机生成600

2020-12-24 16:05:12 593

原创 机器学习算法-朴素贝叶斯(一):朴素贝叶斯简介和鸢尾花分类实战(代码附详细注释)

朴素贝叶斯朴素贝叶斯的介绍朴素贝叶斯算法(Naive Bayes, NB) 是应用最为广泛的分类算法之一。它是基于贝叶斯定义和特征条件独立假设的分类器方法。由于朴素贝叶斯法基于贝叶斯公式计算得到,有着坚实的数学基础,以及稳定的分类效率。NB模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。当年的垃圾邮件分类都是基于朴素贝叶斯分类器识别的。我们用一句话理解贝叶斯:世间很多事都存在某种联系,假设事件A和事件B。人们常常使用已经发生的某个事件去推断我们想要知道的之间的概率。 例如,医生在确诊的时候

2020-12-24 10:30:03 4570 1

原创 机器学习算法-逻辑回归(三)、逻辑回归分类重要知识点总结

逻辑回归 原理简介:Logistic回归虽然名字里带“回归”,但是它实际上是一种分类方法,主要用于两分类问题(即输出只有两种,分别代表两个类别),所以利用了Logistic函数(或称为Sigmoid函数),函数形式为:其对应的函数图像可以表示如下:import numpy as npimport matplotlib.pyplot as pltx = np.arange(-5,5,0.01)y = 1/(1+np.exp(-x))plt.plot(x,y) #该函数把点(x, y)用线连起

2020-12-23 21:47:28 350

原创 机器学习算法-逻辑回归(二)、基于鸢尾花(iris)数据集的逻辑回归分类实践(代码具有详细注释)

step 1:导入库函数# 基础函数库import numpy as npimport pandas as pd#绘图函数库import matplotlib.pyplot as pltimport seaborn as sns本次我们选择鸢花数据(iris)进行方法的尝试训练,该数据集一共包含5个变量,其中4个特征变量,1个目标分类变量。共有150个样本,目标变量为 花的类别 其都属于鸢尾属下的三个亚属,分别是山鸢尾 (Iris-setosa),变色鸢尾(Iris-versicolor)

2020-12-22 22:39:46 6598

原创 机器学习算法-逻辑回归(一):基于逻辑回归的分类预测(代码附详细注释)

1 逻辑回归的介绍和应用1.1 逻辑回归的介绍逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型,并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热,但实则这些传统方法由于其独特的优势依然广泛应用于各个领域中。而对于逻辑回归而且,最为突出的两点就是其模型简单和模型的可解释性强。逻辑回归模型的优劣势:优点:实现简单,易于理解和实现;计算代价不高,速度很快,存储资源低;缺点:容易欠拟合,分类精度可能不高1.2

2020-12-21 21:19:28 1320

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除