自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 问答 (3)
  • 收藏
  • 关注

原创 SAS 关联规则

/* 关联规则算法的实现 *//* 读入关联数据,列代表项目集中的一个项目,行代表一个记录集,每行在某列上的值为0表示该记录集不含该项目,为1代表包含该项目 */data test; input id 1 class1 3 class2 5 class3 7 class4 9 class5 11 class6 13 class7 15 ;cards;1 0 0 1 1 0

2017-02-28 18:39:21 3639

原创 SAS 主成分分析

data cor1; input x1-x4; cards;40 2.0 5 2010 1.5 5 30120 3.0 13 50250 4.5 18 0120 3.5 9 5010 1.5 12 5040 1.0 19 40270 4.0 13 60280 3.5 11 60170 3.0 9 60180 3.5 14 40220

2017-02-28 18:34:31 3970

原创 SAS 因子分析

/* 12项智力指标的因子分析 */DATA IND (type=corr); /*指定输入数据为相关系数矩阵*/ infile cards missover; /*读取数据时,输入指针遇到短数据不会跳到下一行来读取,且没有数据的变量会自动设为缺失*/ input _name_ $3.x1-x12; _type_='Corr';

2017-02-28 18:32:43 7074

原创 SAS 生存分析

/*--------------------生存分析--------------------*//*------寿命表法-----*/data sc; input lt@@; /*输入变量lt*/ if lt<0 then censor=1; /*若lt小于0(代表数据删失),则变量censor赋值为1,否则,赋值为0*/ else

2017-02-28 18:31:20 10046 3

原创 SAS 判别分析

分三个数据集: 1. DATA XDT; INPUT c x1-x5 @@; CARDS;1 8.11 251.01 13.23 5.46 7.311 9.36 185.39 9.02 5.66 5.99 1 9.85 249.58 15.61 6.06 6.111 2.55 137.13 9.21 6.11 4.35 1 6.01 231.34 14.27

2017-02-28 18:28:36 9929

原创 SAS 方差分析

/*-----------------单因素方差分析 - PROC ANOVA -------------------*/data retime; input medicine $ hours @@; datalines;A 7 A 5 A 3 A 1B 6 B 5 B 3 B 3C 7 C 9 C 9 C 9D 4 D 3 D 4 D 3;ods graphi

2017-02-28 18:27:28 5830

原创 SAS 典型相关分析

/*--------------------典型相关分析-----------------------------------*//*-----用力肺活量指标和呼气流速指标的相关关系------*/data hq(type=corr); /*指定输入数据为相关系数矩阵*/ input _name_$3.x1 x2 y1-y4; /*依次输入6个指标变量*/

2017-02-28 18:26:13 7052 1

原创 SAS t检验

/*----------------- 一.单样本t检验 -----------------*//*有原始数据的t检验*/DATA TEMP; INPUT X@@; Y=X-20.7; CARDS; 20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.42 20.90 22.99 23.12 20.89 ;TITLE 'T检

2017-02-28 18:21:59 11161

原创 SAS逻辑回归之多分类

数据集Car(1728个观测值,6个自变量,因变量Car有unacc\acc\good\very good 4个取值。分两个过程实现,代码如下: 1. PROC LOGISTIC 过程实现: /*逻辑回归数据集Car(1728个观测值,每个含6个属性,目标变量Car(unacc\acc\good\very good))*//*导入数据集australian到逻辑库work中

2017-02-28 11:00:00 12656 28

原创 SAS逻辑回归之二分类

数据集这里用的是australian,有14个自变量Xi,一个因变量Y,Y值只取0或1。代码如下: /*逻辑回归数据集australian(690个观测值,每个含14个属性,目标变量y(0、1))*//*导入数据集australian到逻辑库work中*/proc import out=aus datafile="\\vmware-host\Shared Folders\桌

2017-02-28 10:55:51 10228 4

原创 R语言聚类分析

自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》聚类分析是一类将数据所研究对象进行分类的统计方法,这一类方法的共同特点是:事先不知道类别的个数和结构,据以进行分析的数据是对象之间的相似性或相异性的数据。将这些相似(相异)性数据看成是对象之间的“距离”远近的一种度量,将距离近的变量归为一类,

2017-02-27 17:10:27 51797 3

原创 R语言判别分析

自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》本文中分三个方法介绍判别分析,Bayes判别,距离判别,Fisher判别。前两种判别方法都要考虑两个、或多个总体协方差(这里是算方差,方差是协方差的一种)相等或不等的情况,由var.equal=的逻辑参数表示,默认是FALSE,表示认为两总体

2017-02-27 17:07:54 30773 3

原创 R语言生存分析

自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》生存分析是研究生存时间的分布规律,以及生存时间和相关因素之间关系的一种统计分析方法。生存分析在医学科学研究中具有广泛而重要的应用价值,它对人群寿命的研究,各种慢性疾病的现场追踪研究,临床疗效试验和动物试验等研究中随访资料的处理骑着举足轻重的作

2017-02-27 17:05:43 26842 2

原创 R语言关联规则

#                            Apriori算法实现关联规则挖掘#======================= MODEL1. 输入数据集为transaction类型 ======================#install.packages("arules")    #Apriori算法程序包library(arules)data

2017-02-27 17:02:38 4800

原创 R语言主成分分析

自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》解决自变量之间的多重共线性和减少变量个数根据主成分分析的原理,它一方面可以将k个不独立的指标变量通过线性变换变成k个相互独立的新变量,这是解决多重共线性问题的一个重要方法;另一方面。主成分分析可以用较少的变量取代较多的不独立的原变量,减少分析

2017-02-27 17:00:13 27852 1

原创 R语言典型相关分析

自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》1 关键点:典型相关分析典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系例如 研究生入学考试成绩与本科阶段一些主要课程成绩的相关性将研究两组变量的相关性问题转化为研究两个变

2017-02-27 16:40:46 24771 4

原创 R语言因子分析

自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》因子模型: X=μ + A*F* + ε 其中F=[(f1,f2,…,fm)]^T为公共因子向量,[ε=(ε1,ε2,…,εp)]^T为特殊因子向量,A=[(aij)]^(p×m)为因子载荷矩阵。I.参数估计为了建立因子模型,需要要得到因

2017-02-27 16:31:08 21080 1

原创 R语言方差分析ANOVA

I. 单因素方差分析#用data frame的格式输入数据medicine <- data.frame( Response=c(7,5,3,1,6,5,3,3,7,9,9,9,4,3,4,3), Treatment=factor(c(rep(1,4),rep(2,4),rep(3,4),rep(4,4))) ) #各组样本大小table(medicine$Treat

2017-02-27 16:23:18 69048 12

原创 R语言t检验

自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。I.单样本t检验例1. 有原始数据的t检验已知某水样中含碳酸钙的真值为20.7mg/L,现用某法重复测定该水样12次,碳酸钙的含量分别为..问该法测定碳酸钙含量所得的均值与诊治有无显著差异?x <- c(20.99,20.41,20.10,20.00,20.91,22.60,20.99,20

2017-02-27 16:09:06 112369 12

原创 R语言逻辑回归、ROC曲线和十折交叉验证

自己整理编写的逻辑回归模板,作为学习笔记记录分享。数据集用的是14个自变量Xi,一个因变量Y的australian数据集。1. 测试集和训练集3、7分组australian <- read.csv("australian.csv",as.is = T,sep=",",header=TRUE)#读取行数N = length(australian$Y)

2017-02-27 15:49:35 136070 64

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除