自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

转载 数据挖掘知识体系汇总,实用的入门指南

数据挖掘知识体系汇总,实用的入门指南以下文章来源于Datawhale,作者Datawhalehttps://mp.weixin.qq.com/s/ec2vUtLFETcS8qfHfc_4mQDatawhale一个专注于AI领域的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。转自:Datawhale入门数据挖掘,必须理论结合实践。本文梳理了数据挖掘知识体系,帮助大家了解..

2020-05-29 15:43:08 896

原创 人工智能自学线路——自用

人工智能开发一般从Python开始,不过对数学与统计学有要求,尤其是概率统计。1.不过Python仅仅是编程语言,你应该首先还要选择一个发展方向,学习特定方向的Python模块,比如数据分析与挖掘、爬虫工程师、Web开发、自动化运维、自动化测试,甚至人工智能。Web开发小型是PHP居多,中大型Web应用Java独霸天下Python很难抗衡。自动化测试与运维已经脱离了软件开发主方向,工资与发展的话相比来说没有开发与数据分析好。总体来讲用Python做数据分析甚至人工智能是最好的方向,不过人工智能难度要高,

2020-05-25 22:51:12 459

原创 TensorFlow安装(2.1.0版)

TensorFlow没有windows 32位的,只支持64位!!!我这老机器,32位的,好麻烦,升64位还得重装系统。下面这些安装教程都不错,先存下,换好了系统再来装https://zhuanlan.zhihu.com/p/102324325https://blog.csdn.net/cliukai/article/details/102051891https://blog....

2020-03-10 22:06:02 907

原创 机器学习算法——小结

监督学习: 回归分析 K最近邻 支持向量机 决策树 随机森林 神经网络 调节参数 正则化参数(针对套索回归和岭回归) 最近邻数量 软间隔常数 核参数 不敏感参数 终端节点的最小尺寸 终端节点的最大数量 最大树深度 ...

2020-03-08 21:48:19 183

原创 监督学习算法——线性模型——《python机器学习基础教程》

监督学习算法常用的监督机器学习算法有:1.K近邻(kNN,k-NearestNeighbor)2.线性模型3.朴素贝叶斯(Naive Bayesian)4.决策树(Decision Tree)5.决策树集成6.核支持向量机(SVM,Support Vector Machine)7.神经网络线性模型线性模型是在实践中广泛使用的一类模型,几十年来被广泛研究,它可以追溯到一...

2020-03-04 21:47:14 567

原创 监督学习算法——K近邻——《python机器学习基础教程》

监督学习算法常用的监督机器学习算法有:1.K近邻(kNN,k-NearestNeighbor)2.线性模型3.朴素贝叶斯(Naive Bayesian)4.决策树(Decision Tree)5.决策树集成6.核支持向量机(SVM,Support Vector Machine)7.神经网络一.K近邻(KNN,k-NearestNeighbor)K-NN算法可以说是最简单的...

2020-03-02 23:34:33 688 1

原创 决策树模型——鸢尾花分类

构建一个决策树分类模型,实现对鸢尾花的分类1.lris数据集介绍:鸢尾花数据集是机器学习领域中非常经典的一个分类数据集。数据集全名为:Iris Data Set,总共包含150行数据。每一行由4个特征值及一个目标值(类别变量)组成。其中4个特征值分别是:萼片长度、萼片宽度、花瓣长度、花瓣宽度目标值为3种不同类别的鸢尾花:山鸢尾、变色鸢尾、维吉尼亚鸢尾2.读取数据Iris...

2020-02-26 22:01:49 20667 3

原创 Python数据挖掘与机器学习实战——回归分析——逻辑回归

逻辑回归:逻辑回归也被称为广义线性回归模型,它与线性回归模型的形式基本上相同,最大的区别就在于它们的因变量(y)不同,如果是连续的,就是多重线性回归;如果是二项分布(0或1、是或否等),就是逻辑回归。Logistic回归虽然名字里带“回归”,但是它实际上是一种分类方法,主要用于两分类问题(即输出只有两种,分别代表两个类别)。逻辑回归就是这样的一个过程:面对一个回归或者分类问题,建立代价函数...

2020-02-25 22:32:47 570 1

原创 Python数据挖掘与机器学习实战——3.5 基于线性回归的股票预测

3.5 基于线性回归的股票预测

2020-02-24 23:51:50 4974 1

原创 Python数据挖掘与机器学习实战——回归分析——线性回归及实例

回归分析回归分析(Regression Analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法 ,是一种预测性的建模技术。线性回归:简单而言,就是将输入项分别乘以一些常量,再将结果加起来得到输出。线性回归包括一元线性回归和多元线性回归。一元线性回归线型回归分析中,如果仅有一个自变量与一个因变量,且其关系大致上可用一条直线表示,则称之为简单回归分析(...

2020-02-24 22:22:03 5716 1

原创 机器学习分类及机器学习算法概览

机器学习分类及机器学习算法概览机器学习可分为3类:(监督学习、无监督学习、强化学习)1.监督学习:监督学习表示机器学习的数据是带标记的,这些标记可以包括数据类别、数据属性及特征点位置等。这些标记作为预期效果,不断修正机器的预测结果。每当想要根据给定输入预测某个结果,并且还有输入/输出示例时,都应该使用监督学习。具体实现过程是:通过大量带有标记的数据来训练机器,机器将预测结果与期...

2020-02-22 20:53:50 858

原创 Python机器学习基础教程——1.7第一个应用:鸢尾花分类——学习笔记

1.7 第一个应用:鸢尾花分类假设有一名植物学爱好者对她发现的鸢尾花的品种很感兴趣。她收集了每朵鸢尾花的一些测量数据:花瓣的长度和宽度以及花萼的长度和宽度,所有测量结果的单位都是厘米。 她还有一些鸢尾花分类的测量数据,这些花之前已经被植物学专家鉴定为属于setosa(山鸢尾)、versicolor(杂色)或virginica(维尔吉妮卡)三个品种之一。对于这些测量数据,她可以确定...

2020-02-21 18:29:16 3344 1

原创 python数据分析与挖掘实战——第五章-数据挖据建模——5.13-Logistic逻辑回归模型实例

一. 逻辑回归在前面讲述的回归模型中,处理的因变量都是数值型区间变量,建立的模型描述是因变量的期望与自变量之间的线性关系。比如常见的线性回归模型:而在采用回归模型分析实际问题中,所研究的变量往往不全是区间变量而是顺序变量或属性变量,比如二项分布问题。通过分析年龄、性别、体质指数、平均血压、疾病指数等指标,判断一个人是否换糖尿病,Y=0表示未患病,Y=1表示患病,这里的响应变量是一个两...

2020-02-20 22:52:40 1329

原创 Logistic 回归(Logistic Regression)

二分类Logistic回归模型介绍:知识点1.Logit变换:取对数假设在p个独立自变量x1,x2,⋯,xp作用下,取“1”的概率是p,则取“0”的概率是1-p,取1和0的概率之比为p/(1-p),称为事件的优势比(odds:“几率,发生比,胜算,赔率”),对odds函数取对数(取对数操作也叫Logit变换)就得到Logit(p)函数:知识点2.Logistic函数 Logist...

2020-02-20 22:39:25 6059

原创 python数据分析与挖掘实战——第五章-数据挖据建模——分类预测5.1——笔记

根据挖掘目标和数据形式可以建立以下几种模型:分类与预测 聚类分析 关联规则 时序模式 离群点检测5.1分类预测5.1.1实现过程比如说我们现在要进行预测的分析,首先第一步,我们先要基于一定数量的样本来训练出一个训练模型,这个模型训练的如何,我们还要对其进行检测一下,如何测试的样本数据与我们想象中的差别太大,那么我们就要重新进行训练这个预测模型,但是如果我们的预测模型符合我...

2020-02-18 23:09:45 691

转载 三大统计相关系数:Pearson、Spearman秩相关系数、kendall等级相关系数

Pearson(皮尔逊)相关系数皮尔逊相关也称为积差相关(或积矩相关)是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。假设有两个变量X、Y,那么两变量间的皮尔逊相关系数可通过以下公式计算:公式一:公式二:公式三:公式四:以上列出的四个公式等价,其中E是数学期望,cov表示协方差,N表示变量取值的个数。Spearman Rank(斯皮尔曼等...

2020-02-17 21:49:35 2567

原创 如何快速成为数据分析师?

转载大佬:https://www.zhihu.com/question/29265587/answer/246178411,感谢作者“量子数据”、转载大佬:https://www.zhihu.com/org/datacastle-90,感谢“DataCastle”的分享自己又总结了一下,学习路线,方便自己以后看目录数据分析师职位要求:如何快速成为数据分析师?1. 统计学...

2020-02-16 17:41:30 3515 1

原创 《利用python进行数据分析》——第6章 数据加载、存储与文件格式——读书笔记

第6章 数据加载、存储与文件格式6.1 读写文本格式的数据

2020-02-15 20:36:00 465

原创 《利用python进行数据分析》——5 pandas入门——读书笔记

《利用python进行数据分析》——5 pandas入门——读书笔记1.pandas简介:Pandas是Python的一个数据分析包,该工具为解决数据分析任务而创建 pandas是《利用python进行数据分析》后续内容的首选库。 pandas含有使数据清洗和分析工作变得更快更简单的数据结构和操作工具 Pandas是字典形式,基于NumPy创建,让NumPy为中心的应用变得更加简单...

2020-02-14 21:32:54 525

原创 数据挖掘建模过程概览

1.数据挖掘:从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模型和趋势,并用这些知识和规律建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程,就是数据挖掘;它利用各种分析工具在大量数据中寻找其规律和发现模型与数据之间关系的过程,是统计学、数据库技术和人工智能技术的综合。2.数据挖掘的基本任务:包含利用分类与预测、聚类分析、关联规则、时序模型、偏差检测、...

2020-02-11 13:46:23 2012

原创 《利用python进行数据分析》——4.3 利用数组进行数据处理——np.meshgrid方法——读书笔记

《利用python进行数据分析》——4.3 利用数组进行数据处理——np.meshgrid方法1.numpy.meshgrid()是什么numpy.meshgrid()方法定义:np.meshgrid()函数接受两个一维数组,并产生两个二维矩阵(对应于两个数组中所有的(x,y)对)numpy.meshgrid(*xi, **kwargs)Return coordinate mat...

2020-02-10 19:39:57 446

原创 《利用python进行数据分析》——4.1 NumPy的ndarray一种多维数组对象——数组转置和轴对换——读书笔记

4.1 NumPy的ndarray一种多维数组对象数组转置和轴对换转置是重塑的一种特殊形式,它返回的是源数据的视图(不会进行任何复制操作)。数组不仅有transpose方法,还有一个特殊的T属性:In [126]: arr = np.arange(15).reshape((3, 5))In [127]: arrOut[127]:array([[ 0, 1, 2, 3, 4...

2020-02-08 20:11:27 609 1

原创 《利用python进行数据分析》——3.2函数——生成器generator——读书笔记

1. 生成器定义一边循环一边计算的机制,称为:生成器(generator)生成器(generator)是构造新的可迭代对象的一种简单方式。一般的函数执行之后只会返回单个值,而生成器则是以延迟的方式返回一个值序列,即每返回一个值之后暂停,直到下一个值被请求时再继续。生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器2. 为什么要有生成器pyt...

2020-02-07 20:05:34 267

原创 《利用python进行数据分析》——3.1数据结构和序列——元组、列表、字典、集合——读书笔记

第3章 Python的数据结构、函数和文件3.1 数据结构和序列Python中常见的数据结构可以统称为容器。序列(如列表和元组)、映射(如字典)以及集合(set)是三类主要的容器。1.元组——tuple元组是一个固定长度,不可改变的Python序列对象。 元组与列表一样,也是一种序列,唯一不同的是元组不能被修改(字符串其实也有这种特点) 元组Tuple,一经初始化,就不能修改...

2020-02-06 20:33:52 410

原创 利用python进行数据分析——第三章range实例——0到99999中3或5的倍数求和——小记

《利用python进行数据分析》第三章range介绍时,有这么一个例子:可以使用list来存储range在其他数据结构中生成的所有整数,默认的迭代器形式通常是你想要的。下面的代码对0到99999中3或5的倍数求和:sum = 0for i in range(100000): # % is the modulo operator if i % 3 == 0 or i % ...

2020-02-05 22:40:57 1576

原创 进入jupyter notebook报错,显示 No module named 'pysqlite2'的解决方法

用命令行输入jupyter notebook后报错,问题界面如题所示:解决方法:1、去sqlite3官网,根据自己的系统和位数(32位还是64位)下载对应的插件:sqlite3官网地址:https://www.sqlite.org/download.html如果是64位Windows系统,则上图三个中的第二个插件。2、下载完后,解压缩,将文件复制到Anaconda的DLL...

2020-02-05 01:39:47 2053 1

原创 NG-ZORRO下的全国省市区三级联动

NG-ZORRO下的全国省市区三级联动.html<!-- 地址级联选择器--><nz-cascader formControlName="position" [nzPlaceHolder]="'请设置位置'" [nzSize]="'large'" [nzChangeOnSelect]="true" [nzShowSearch]="true" [nzOptions]="_options"

2017-10-18 14:41:07 4641

原创 记录并推荐一下NG-ZORRO

记录并推荐一下NG-ZORRONG-ZORRO是阿里构建的 Ant Design 的 Angular 4.0 实现,开发和服务于企业级后台产品。好东西,期待发展。githubhttps://github.com/NG-ZORRO/ng-zorro-antd/blob/master/README-zh_CN.mdNG-ZORRO控件介绍https://ng.ant.design/#/docs/angu

2017-10-17 09:52:29 4551

原创 Angular2 遇到的问题及解决办法

Angular2——个人遇到的问题及解决办法遇到的问题有局限性和个性,自己记录一下解决办法,不一定能帮到大家1. 左侧二级菜单点击切换时第一下会闪烁,第二下才正常//调用Http服务获取数据,给左侧菜单赋值this.navigationService.getMenus() .subscribe( responseDomain => { this.menus =

2017-08-10 19:43:05 2622

原创 Angular2上应用基于jQuery的Bootstrap 3 - iconpicker

Iconpicker是一个用于Bootstrap 3 的jQuery图标选择器插件,允许您在工具提示类似的弹出界面中从多个图标集中选择并选择一个图标。参考: http://www.jqueryscript.net/other/jQuery-Based-Icon-Picker-For-Bootstrap-3-iconpicker.html https://victor-valencia.githu

2017-07-26 11:19:10 756

转载 Angular2图标选择器——jQuery asIconPicker

图标选择器插件——jQuery asIconPicker参考:http://www.jqueryscript.net/other/Feature-rich-Font-Icon-Picker-Plugin-For-jQuery-asIconPicker.html https://npm.taobao.org/package/jquery-asIconPicker 1.需要先下载jquer

2017-07-21 14:31:15 1926

原创 Angular2使用ng2-file-upload上传文件

Angular2使用ng2-file-upload上传文件ng2-file-upload是一个功能比较全面的上传文件的支持库 (参考:http://www.jianshu.com/p/0741186f60ab https://segmentfault.com/a/1190000007886391) Angular2使用ng2-file-upload上传文件:1、安装ng2-file-uploa

2017-07-07 20:09:34 9524 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除