自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Macsen's Blog

人生不过是片刻的欢愉和痛苦,剩下的都是似水流年的虚无

  • 博客(10)
  • 收藏
  • 关注

原创 线性回归、岭回归、逻辑回归、聚类

分类算法的目标值是离散型的 如果目标值是连续型的值,就需要回归算法 比如房价预测、销售额预测、贷款额度预测等回归算法-线性回归分析举个栗子期末成绩:0.7×考试成绩+0.3×平时成绩(各个特征跟某个值组合在一起去预测)西瓜好坏:0.2×色泽+0.5×根蒂+0.3×敲声(把回归问题转换为分类问题)线性关系模型一个通过属性的线性组合来进行预测的函数:为权重,称为偏置项,可以理解为:线性回归定义:线性回归通过一个或者多个自变量与因变量之间之间进行建模的回归分析。其.

2021-03-15 19:15:40 1035

原创 分类算法-决策树、随机森林

决策树认识决策树信息论基础-银行贷款分析决策树的生成泰坦尼克号乘客生存分类认识决策树决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-then结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法比如:你母亲要给你介绍男朋友,是这么来对话的:女儿:多大年纪了?母亲:26。女儿:长的帅不帅?母亲:挺帅的。女儿:收入高不?母亲:不算很高,中等情况。女儿:是公务员不?母亲:是,在税务局上班呢。女儿:那好,我去见见。银行贷款数据ID年龄有工作

2020-09-03 12:38:33 238

原创 机器学习基础、sklearn数据集、转换器与预估器

机器学习基础机器学习开发流程机器学习算法分类机器学习模型是什么需要明确几点问题:算法是核心,数据和计算是基础找准定位大部分复杂模型的算法设计都是算法工程师在做,而我只是一个调包侠分析很多的数据分析具体的业务应用常见的算法特征工程、调参数、优化我们应该怎么做学会分析问题,使用机器学习算法的目的,想要算法完成何种任务掌握算法基本思想,学会对问题用相应的算法解决学会利用库或者框架解决问题机器学习模型是什么定义:通过一种映射关系将输入值到输出值机器学

2020-08-27 10:03:29 815

原创 数据的特征预处理、特征选择、主成分分析

数据的特征处理特征处理是什么通过特定的统计方法(数学方法)将数据转换成算法要求的数据数值型数据:标准缩放:归一化标准化缺失值类别型数据: one-hot编码时间类型:时间的切分sklearn特征处理APIsklearn. preprocessing归一化特点:通过对原始数据进行变换把数据映射到(默认为[0,1])之间公式:X′=x−minmax−minX^{'} = \frac{x-min}{max-min}X′=max−minx−min​X′=X′∗(mx−m

2020-08-26 23:14:36 1301

原创 机器学习概述、特征工程、Scikit-learn

先来拜见一下祖师爷(祖师爷真帅)“人工智能之父” 艾伦.图灵 图灵测试(1950)马文·李·闵斯基(英语:Marvin Lee Minsky,1927年8月9日-2016年1月24日),科学家,专长于认知科学与人工智能领域,麻省理工学院人工智能实验室的创始人之一,著有几部人工智能和哲学方面的作品。1969年,因为在人工智能领域的贡献,获得图灵奖。图片艺术化 GAN神经网络这就说明了Python天下第一开个玩笑,语言只是工具,我写Java的时候也说Java天下第一,PHP才是世界上最

2020-08-20 22:46:02 228

原创 pandas基本使用(二)

pandas常用统计方法假设现在我们有一组从2006年到2016年1000部最流行的电影数据,我们想知道这些电影数据中评分的平均分,导演的人数等信息,我们应该怎么获取?数据来源:https://www.kaggle.com/damianpanek/sunday-eda/dataimport pandas as pdfrom matplotlib import pyplot as pltimport numpy as npfile_path = "./IMDB-Movie-Data.csv"d

2020-08-18 22:59:01 277

原创 pandas基本使用(一)

什么是pandaspandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language.这次复制个英文的,显得专业,反正我也看不懂。为什么要学习pandas那么问题来了:numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据

2020-08-18 22:57:55 249

原创 numpy基本使用

什么是numpy​ 一个在Python中做科学计算的基础库,重在数值计算,也是大部分PYTHON科学计算库的基础库,多用于在大型、多维数组上执行数值运算。为什么要学习numpy快速方便科学计算的基础库国际惯例,以上都是我复制的,保住了我cv程序员的尊严。numpy创建数组(矩阵)创建数组import numpy as npa = np.array([1, 2, 3, 4, 5])b = np.array(range(1, 6))# 上面a, b, c内容相同,注意ara

2020-08-14 01:55:13 550

原创 matplotlib基本使用(二)

上一篇我们净玩折线图了,这一篇简单的把其他常用的图画一画,当然我离大佬们绘制二元函数还有很长的路要走…这些还暂时够用绘制散点图假设通过爬虫你获取到了北京2016年3,10月份每天白天的最高气温(分别位于列表a,b),那么此时如何寻找出气温和随时间(天)变化的某种规律?a = [11, 17, 16, 11, 12, 11, 12, 6, 6, 7, 8, 9, 12, 15, 14, 17, 18, 21, 16, 17, 20, 14, 15, 15, 15, 19, 21, 22, 22, 2

2020-08-12 15:03:25 222

原创 matplotlib基本使用(一)

matplotlib是最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建为什么要学习matplotlib?能将数据进行可视化,更直观的呈现使数据更加客观、更具说服力好了我摊牌了,以上全都是我复制的[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YkEpsZzt-1597215072031)(http://124.70.66.191/wp-content/uploads/2020/08/2019051216214

2020-08-12 14:54:13 398

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除