自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

塔里木博客

关注IT资讯,IT技术,CUDA

  • 博客(38)
  • 资源 (7)
  • 收藏
  • 关注

原创 发现了一个数据挖掘用Applet

今天浏览数据挖掘相关的网站时,想起2周前老师提起过Jason( Department of Computer Science,Johns Hopkins University )的一个ASVMApplet,似乎是个好东东,不过折腾了了一回,没弄明白具体有什么优势,但感觉数据分类和可视化分析方面是个值得参考的好工具。地址http://cs.jhu.edu/~jason/tutorials/SVM

2013-10-26 10:28:49 599

转载 matlab画图

Matlab画图强大的画图功能是Matlab的特点之中的一个,Matlab提供了一系列的画图函数,用户不须要过多的考虑画图的细节,仅仅须要给出一些基本參数就能得到所需图形,这类函数称为高层画图函数。此外,Matlab还提供了直接对图形句柄进行操作的低层画图操作。这类操作将图形的每个图形元素(如坐标轴、曲线、文字等)看做一个独立的对象,系统给每个对象分配一个句柄,能够通过句柄对该图形元素进行操作

2016-05-11 17:48:17 1230

转载 matlab 聚类

原网址:http://blog.sina.com.cn/s/blog_62f3c4ef01014wz1.htmlcited from:cited from:http://hi.baidu.com/coralliu/blog/item/dbde033b168fedeb15cecbe5.htmlhttp://bbs.sciencenet.cn/blog-41996-450513.htm

2016-04-26 20:13:33 9878

转载 matlab 降维工具

降维工具箱drtool  这个工具箱的主页如下,现在的最新版本是2013.3.21更新,版本v0.8.1bhttp://homepage.tudelft.nl/19j49/Matlab_Toolbox_for_Dimensionality_Reduction.html      这里有两个这个工具箱的简单介绍:【Matlab】数据降维工具箱drtoolbox

2016-04-26 20:09:50 11595

转载 数据标准化方法

http://blog.sina.com.cn/s/blog_6b1c9ed50101byeu.html数据规范中的归一化与标准化:A.归一化 vs. 标准化   归一化:要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。一般指将数据限制在[01]之间。      》把数变为(0,1)之间的

2016-04-26 17:41:29 1096

转载 遥感数据下载地址

1 AVHRR、DEM、EO-1数据下载地址http://earthexplorer.usgs.gov/2 ASTER、MOIDS、EO-1数据下载地址http://glovis.usgs.gov/3 EO-1 Hyperion 数据介绍网址http://eo1.gsfc.nasa.gov/new/extended/sensorWeb/general.html4 室内的高光

2015-12-17 20:21:27 1314

转载 空间自相关及其SAM软件使用

空间自相关是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖性,如生物多样性指数较高只是因为周边的值较高影响所致,所以要尽量避免这一效应,虽然最近有文章探讨排除与否好像不是很大……言归正传,排除的方法很多,在R里面有相应的包,但是往往数据整理需要一定功夫,不如SAM(http://www.ecoevol.ufg.br/sam/)软件来的快,所以本文讲述一下如何用SAM软件来做。 

2015-12-09 22:25:40 5377 4

转载 Frontier4.1简介

Frontier是一款专门用于完成随机前沿分析的软件,它可以用最大似然法估计随机前沿成本模型(Stochastic Frontier Cost Model)和随机前沿生产模型(Stochastic Frontier Production Model)。 在这里,我们主要简单介绍一下Frontier的使用方法,暂时不对随机前沿这个方法做详细的展开。 程序解包后,最主要的是4个文件,F

2015-11-14 20:35:08 10159 2

转载 libsvm-mat-加强工具箱介绍

libsvm-mat-加强工具箱介绍由于libsvm的matlab版本的工具箱libsvm-mat并没有给出寻参的函数模块,而无论利用libsvm工具箱进行分类还是回归,参数的选取是十分重要的,鉴于此libsvm-mat-加强工具箱在libsvm-mat-2.89-3的基础上给出相应的辅助函数插件,方便用户来选取最佳的参数,该加强工具箱可以在MATLAB中文论坛上下载,现对该加强工具箱里主要的

2015-11-01 19:37:37 2047

转载 lssvm实例

clc ;clear;close all%---------------------------------------------------% 产生训练样本xn_train1 =1:2:200;                 % 训练样本,每一列为一个样本xn_train2 = 1:1:100;dn_train1 =xn_train1+2*xn_train2;

2015-10-31 12:42:20 8126 3

转载 Matlab拟合工具箱的几个误差参数说明

 拟合工具箱的几个误差参数说明拟合,工具箱, 误差参数说, sse, mse使用过Matlab的拟合、优化和统计等工具箱的网友,会经常遇到下面几个名词:SSE(和方差、误差平方和):The sum of squares due to errorMSE(均方差、方差):Mean squared errorRMSE

2015-10-30 17:32:29 6818

转载 Matlab提供的两种聚类分析方法

一种是利用 clusterdata函数对样本数据进行一次聚类,其缺点为可供用户选择的面较窄,不能更改距离的计算方法; 另一种是分步聚类:(1)找到数据集合中变量两两之间的相似性和非相似性,用pdist函数计算变量之间的距离;(2)用 linkage函数定义变量之间的连接;(3)用 cophenetic函数评价聚类信息;(4)用cluster函数创建聚类。 1.Matla

2015-07-08 16:22:39 1956

转载 指标权重确定方法之熵权法

一、熵权法介绍      熵最先由申农引入信息论,目前已经在工程技术、社会经济等领域得到了非常广泛的应用。      熵权法的基本思路是根据指标变异性的大小来确定客观权重。      一般来说,若某个指标的信息熵越小,表明指标值得变异程度越大,提供的信息量越多,在综合评价中所能起到的作用也越大,其权重也就越大。相反,某个指标的信息熵越大,表明指标值得变异程度越小,提供的信息量也越少,在

2015-06-29 17:20:56 26193 2

转载 matlab与神经网络

本文以Fisher的Iris数据集作为神经网络程序的测试数据集。Iris数据集可以在http://en.wikipedia.org/wiki/Iris_flower_data_set  找到。这里简要介绍一下Iris数据集:有一批Iris花,已知这批Iris花可分为3个品种,现需要对其进行分类。不同品种的Iris花的花萼长度、花萼宽度、花瓣长度、花瓣宽度会有差异。我们现有一批已知品种的

2015-05-13 11:33:19 1834

转载 主成分分析(Principal components analysis)-最大方差解释

在这一篇之前的内容是《Factor Analysis》,由于非常理论,打算学完整个课程后再写。在写这篇之前,我阅读了PCA、SVD和LDA。这几个模型相近,却都有自己的特点。本篇打算先介绍PCA,至于他们之间的关系,只能是边学边体会了。PCA以前也叫做Principal factor analysis。1. 问题     真实的训练数据总是存在各种各样的问题:1、 比如拿到一个汽车的样

2015-02-04 01:06:28 659

转载 EM算法介绍

EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。下面主要介绍EM的整个推导过程。1. Jensen不等式      回顾优化理论中的一些概念。设f是定义域为实数的函数,如果对于所有的实数x,,那么f是凸函数。当x是向量时,如果

2015-01-29 00:09:59 449

转载 SVM算法介绍

又有很长的一段时间没有更新博客了,距离上次更新已经有两个月的时间了。其中一个很大的原因是,不知道写什么好-_-,最近一段时间看了看关于SVM(Support Vector Machine)的文章,觉得SVM是一个非常有趣,而且自成一派的方向,所以今天准备写一篇关于关于SVM的文章。关于SVM的论文、书籍都非常的多,引用强哥的话“SVM是让应用数学家真正得到应用的一种算法”。SVM对于大部分的普

2015-01-29 00:07:47 662

转载 TF-IDF及其算法

TF-IDF及其算法概念     TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-ID

2014-12-24 22:30:50 408

转载 聚类算法k-means、k-modes和k-prototype介绍

聚类算法k-means、k-modes和k-prototype介绍之前分享了数学宅通过数据分析方法约会女神的故事,大家会不会觉得很酷呢!该宅所用的贝尔实验室k-modes算法看起来不明觉厉,那么我们今天就和大家讨论一下这个算法。同时,我们还会介绍另两个类似的算法,k-means和k-prototype。由于k-means更容易理解,所以我们从它开始。k-means聚类算法简单易行,时间复杂

2014-12-22 17:10:49 16581

转载 ID3 C4.5 C5.0

ID3算法是决策树的一个经典的构造算法,在一段时期内曾是同类研究工作的比较对象,但通过近些年国内外学者的研究,ID3算法也暴露出一些问题,具体如下:    (1)信息增益的计算依赖于特征数目较多的特征,而属性取值最多的属性并不一定最优。    (2)ID3是非递增算法。    (3)ID3是单变量决策树(在分枝节点上只考虑单个属性),许多复杂概念的表达困难,属性相互关系强调

2014-12-22 00:59:43 2180

转载 从决策树学习谈到贝叶斯分类算法、EM、HMM

目录(?)[+]从决策树学习谈到贝叶斯分类算法EMHMM引言分类与聚类监督学习与无监督学习第一部分决策树学习什么是决策树ID3算法决策树学习之ID3算法哪个属性是最佳的分类属性ID3算法决策树的形成C45算法读者点评第二部分贝叶斯分类什么是贝叶斯分类拼写纠正贝叶斯的应用newsgroup文档集介绍与预处理特征词的选取贝叶斯算法描述及实现朴素贝叶斯算法对new

2014-11-21 10:40:13 2742

转载 R语言为Hadoop注入统计血脉

R语言为Hadoop注入统计血脉RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析。Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现。有了RHadoop可以让广大的R语言爱好者,有更强大的工具处理大数据1G, 10G, 100G, TB, PB。 由于大数据所带来的单机性能问题,可能会一去不复

2014-11-20 12:23:00 500

转载 决策树与R语言(RPART)

关于决策树理论方面的介绍,李航的《统计机器学习》第五章有很好的讲解。传统的ID3和C4.5一般用于分类问题,其中ID3使用信息增益进行特征选择,即递归的选择分类能力最强的特征对数据进行分割,C4.5唯一不同的是使用信息增益比进行特征选择。特征A对训练数据D的信息增益g(D, A) = 集合D的经验熵H(D) - 特征A给定情况下D的经验条件熵H(D|A)特征A对训练数据D的信息增益比r

2014-11-19 23:33:27 37354

转载 Decision tree ID3

决策树的id3算法是之前学机器学习的一个作业,今天拿出来复习了一遍,想了想,贴到博客里共享吧先把id3算法的过程贴出来[html] view plaincopyID3(Examples, Target_attributes, Attributes)  Examples are the training examples. Target

2014-11-14 18:06:36 883

转载 如何用SPSS对数据进行标准化处理?

SPSS统计分析软件是我最早接触的数据分析工具,我的博客将陆续介绍SPSS统计分析软件的相关内容,这类文章将统一按照在标题或者正文第一段出现  SPSS案例分析 + 编号   的形式组织,便于读者朋友们快速查询、收集,今天是第一篇,即 SPSS案例分析1,后文将不再说明。 -------------------------------------------------------

2014-11-07 10:54:15 66137 2

转载 ID3算法

ID3算法是J. RossQuinlan在1975提出的分类预测算法,当时还没有数据挖掘吧,哈哈哈。该算法的核心是“信息熵”,属于数学问题,我也是从这里起发现数据挖掘最底层最根本的不再是编程了,而是数学,编程只是一种实现方式而已,数学才是基础,如:朴素贝叶斯分类,小波聚类,尤其是我正在搞的支持向量机,它就是高等代数,空间解析几何,概率统计的综合应用。记得读本科时,朱琛学姐说过,数学学得再好也不为过

2014-09-22 13:38:09 601

转载 语音识别系统 Sphinx-4 介绍

sphinx系统是一个拥有悠久历史的语音识别系统,传说中是第一个实用的10数字语音系统。是由卡奈基.美隆大学研发。sphinx3.x是基于C语言的最新版本,sphinx和sphinx2请大家不要去研究了。sphinx for ppc是一个在PocketPc上实现的嵌入式语音识别系统。而sphinx4是完全用JAVA编写实现的语音识别系统,因为JAVA的特性,在平台间移植方便

2013-11-24 09:51:23 4381

转载 R绘图

一、直方图绘制直方图函数:hist()对x1进行直方图分析> hist(x$x1)>二、散点图散点图绘制函数:plot()探索各科成绩的关联关系> plot(x1,x2)> plot(x$x1,x$x2)>三、柱状图列联表分析列联函数table():统计每个分数的人数;柱状图绘制函数:barplot()

2013-11-20 14:41:39 1562

原创 永久修改R语言工作目录

默认情况下R语言工作目录每次启动都需要重新设定,为了省事,我们可以把它用命令方式写入到配置文件中,这样每次启动时可以自动设置。具体方法:Setting the working directory in R permanently1)The getwd() command gives the current working directory for R. The  setwd()

2013-11-19 04:27:19 15216 3

转载 9本优秀的R语言教程

本文向你推荐 9 本优秀的 R 语言相关的免费电子书:1. The R Inferno网址:www.burns-stat.com/documents/books/the-r-inferno/作者:Patrick Burns格式:PDF页数:126 2. Introduction to Probability and Statistics Using R网址:

2013-11-18 09:05:17 1333

原创 Machine Learning Resources

Machine Learning Resourceshttp://m.sciencemag.org/site/feature/data/compsci/machine_learning.xhtml

2013-11-04 12:02:43 566

转载 离群点检测方法综述

离群点检测方法综述异常对象被称作离群点。异常检测也称偏差检测和例外挖掘。常见的异常成因:数据来源于不同的类(异常对象来自于一个与大多数数据对象源(类)不同的源(类)的思想),自然变异,以及数据测量或收集误差。异常检测的方法:(1)基于模型的技术:首先建立一个数据模型,异常是那些同模型不能完美拟合的对象;如果模型是簇的集合,则异常是不显著属于任何簇的对象;在使用回归模型时,异常是相对远离

2013-11-04 04:27:00 3887

转载 R语言与数据挖掘学习笔记

投稿人/作者: @商业分析-数据挖掘 发布时间:2013-04-24 06:20:59  投稿到ChinaKDD今天发现一个很不错的博客(http://www.RDataMining.com), 博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整个流程,看了这个博客的内容,心里久久不能平静。决定从今天 开始,只要晚上能在11点之前把碗洗好,就花一个

2013-10-26 07:27:20 1106

转载 Ubuntu命令大全

Ubuntu常用命令大全查看软件xxx安装内容#dpkg -L xxx查找软件#apt-cache search 正则表达式查找文件属于哪个包#dpkg -S filename apt-file search filename查询软件xxx依赖哪些包#apt-cache depends xxx查询软件xxx被哪些包依赖#apt-cache rdepends

2013-10-19 08:06:31 1640

转载 MillionDollarHomePage.com:100万美元的网页

MillionDollarHomePage.com:100万美元的网页来源: 网易科技报道  价值100万美元的网页今天所介绍的网站往并非是个新网站,但却在当时创造了奇迹,即便是在今天的我们看来,也会为这个网站的创意所折服。MillionDollarHomePage.com(中文名:百万美元的首页),2005年8月26日由21岁的英国大学生Alex Tew所创建,在短短5个

2013-10-19 05:19:47 4592

转载 Tor 介绍

Tor(The Onion Router)是第二代洋葱路由(onion routing)的一种实现,用户通过Tor可以在因特网上进行匿名交流。最初该项目由美国海军研究实验室(US Naval Research Laboratory)赞助。2004年的后期,Tor成为电子前哨基金会(Electronic Frontier Foundation,EFF)的一个项目。2005年后期,EFF不再赞

2013-10-19 05:11:18 7644 1

转载 灯光上网"技术江苏已实现 仍难取代无线宽带

“一种利用屋内可见光传输网络信号的国际前沿通讯技术,在实验室成功实现。”昨天,复旦大学计算机科学技术学院传出的“灯光上网”好消息,引起网友们的浓厚兴趣。  据介绍,研究人员将网络信号接入一盏1W的LED灯珠,灯光下的4台电脑即可上网,最高速率可达3.25G,平均上网速率达到150M。下个月,10台样机将亮相2013年上海工博会。  “‘灯光上网’日本做得最早,德国物理学家哈拉尔德·哈斯则是

2013-10-19 04:51:23 832

转载 在Ubuntu 12.04上安装GNOME实现XRDP远程桌面访问ubuntu

为了解决Windows远程桌面访问Ubuntu 12.04 之一 中提到的VNC远程桌面的缺点(见http://www.linuxidc.com/Linux/2012-07/64801.htm),我们采用第二种方法XRDP,该方法支持多用户登录并远程桌面。1、首先在Ubuntu 12.04 中安装GNOME桌面:sudo apt-get install gnome-panel

2013-10-19 04:25:49 7476

arcgis10下载、安装教程、许可文件

arcgis10下载源、安装教程和许可文件,这个资源包含以下资源: Arcgis10.0安装说明.doc Arcgis10下载地址迅雷的.txt ESRI.ArcGIS.10.CS.iso.torrent service.txt(用于许可)本人亲测,可以用。

2015-11-28

基于asp+access的教学质量评估系统

适合大中院校的基于asp+access的教学质量评估系统,,内附安装说明,

2010-12-05

联想隐藏分区删除工具1.0

联想隐藏分区删除工具联想隐藏分区删除工具

2010-11-28

联想一键恢复4.7 有制作隐藏分区功能。

想一键恢复4.7,通过实践,被证实完全能用。

2010-11-28

毕业生信息管理系统

2010-10-28

学生就业管理系统学生就业管理系统

源代码,说明等 就业管理系统学生就业管理系统,

2010-10-28

ASP学生学籍管理系统

ASP学生学籍管理系统ASP学生学籍管理系统ASP学生学籍管理系统ASP学生学籍管理系统ASP学生学籍管理系统ASP学生学籍管理系统

2010-07-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除