自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 判别分析|R语言

判别分析(discriminant analysis)属于一种分类方法,根据已知类别的样本提供的信息,总结出分类的规律性,建立判别准则,新的样本将按照这种判别准则进行分类。根据判别的类别来分,判别分析分为两组判别和多组判别。常见的三种判别方法:距离判别、Bayes判别、Fisher判别。本文将通过数据集介绍这三种方法的R语言实现。

2017-06-16 17:22:15 11031 1

原创 PCA

PCA 数据降维一、主成分的计算步骤1- 对原始数据进行标准化处理,消除量纲2- 计算标准化数据的相关系数矩阵3- 计算标准化数据的相关系数矩阵的特征根及对应的特征向量4- 选出最大的特征根,对应的特征向量等于第一主成分的系数;选出第二大的特征根,对应的特征向量等于 第二主成分的系数;以此类推5- 计算累积贡献率,选择恰当的主成分个数6- 解释主成分:写出前k个主成分的表达式7- 确定各样本的主成分

2017-05-26 10:31:24 920

原创 stringr数据处理

stringer数据处理前言:在数据处理阶段,主要用到的是dplyr包,但随着数据的多样性和复杂性,对字符串的处理越来越重要,R语言基础的数据处理能力一般,且使用不够方便。为此,学习stringr包能解决字符串处理的所有问题,它建华了R语言中字符串的转换,搜索,辨识,定位,匹配,替换,提取,分离等操作,同时封装了一些复杂的字符串处理函数。一、字符串拼接函数1.word()函数:从句子中提取词组 -

2017-05-23 21:48:33 1952

原创 dplyr_DataProcess

讲解dplyr包在数据处理中的使用,此包将原本plyr包中的ddply()等函数进一步分离强化, 专注接受 ‘dataframe’对象, 大幅提高了处理数据的速度, 并且提供了更稳健的与其它数据库对象间的接口。

2017-05-11 10:40:19 1122

原创 广义线性模型

这一节我们主要介绍两种重要的广义线性模型:Logistic regression(分类变量)和Possion regression(计数变量)。广义线性模型是线性模型的推广,它可以写成如下形式:

2017-04-25 21:35:00 3228

原创 方差分析

方差分析前言之前的预测问题都是基于量化的预测变量和响应变量,当预测变量是因子或者解释性变量的时候,回归模型无法很好的解释,此时,我们利用方差分析来解释不同组的差别(ANOVA)。这一章节涉及的软件包有gplots,car,multcomp,HH等,请自行下载。

2017-04-22 07:41:29 1220

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除