自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 矩阵分解(MATRIX FACTORIZATION)在推荐系统中的应用

前言最近一段时间隐语义模型(Latent Factor Model,LFM)在推荐系统中的应用越来越广泛,本文所介绍的矩阵分解方法也是基于这个隐语义模型。 这里需要说明的一点是,这里所说的矩阵分解并不是SVD,之前在这个问题纠结了很久,因为网上很多人还有周围的人都把矩阵分解就当成了SVD,实际上SVD也是矩阵分解的一种技术(SVD在推荐系统中的应用见http://blog.csdn

2014-10-11 18:48:48 7134 1

原创 Topic Model

1.  文本建模我们平时所见的文档都是一个个词语构成的,但是在理解文档的时候,我们需要考虑文档主题,但是如果每个文档都需要人工理解的话代价太高,因此就产生了文本建模。文本建模的主要目的是追问我们所观察的语料库中的文本次序是怎样生成的。然后发现蕴藏于其中的主题,主题间的联系,以及主题随时间的演变,最后完成文档的自动标注。 人类所产生的文档都可以看作是一个上帝掷骰子所产生的,我们看到只是游戏的

2014-10-04 19:59:56 1055

转载 Vim的Python编辑器详细配置过程 (Based on Ubuntu 12.04 LTS)

为什么要用vim编辑py文件?因为在Linux命令行中,缺少图形界面的IDE,vim是最佳的文本编辑器,而为了更好的编辑py文本,所以配置vim。 1. 安装完整版vimvi和vim的区别?在Linux自带有vi编辑器,而vim是指vi improved,即vi升级版。区别在于vi指令和功能较vim简单,正因如此才有了vi improved。Ubuntu自带

2014-10-04 19:57:13 630

原创 Xshell登录Ubuntu12.04

安装完Ubuntu后需要远程登录系统,通常使用ssh协议登录,这里使用的客户端为Xshell 4 。连接具体步骤如下:Ubuntu安装ssh服务:sudo apt-get install openssh-server打开Xshell,选择“新建”,“连接”设置里选择SSH,主机填入需要连接的主机的IP地址。在“用户身份验证”中填入可用的登录Ubuntu的

2014-10-04 19:54:07 1133

原创 Ubuntu新建账户终端显示不正常问题

最近实验室服务器重新安装系统,新建账户后发现终端不是常见的形式,而且缺少很多的命令,如下:于是网上查找资料,请教周围的人终于发现了问题,原来是使用的shell问题,具体原因如下图:从图中我们可以发现,原来默认使用的是sh,所以显示不正常,这里我们修改成bash即可。 PS:sh是最原始的shell, bash是advance的shell, 多了很多扩展和功能

2014-10-04 19:52:12 1066 1

原创 逻辑回归(logistic regression)

logistic regression可以解决分类问题,即输出的结果只有0和1两种,比如,对于邮件的判断只有是或者否。这种分类问题使用传统的线性回归并不能很好的解决。一个小例子例如,当我们根据肿瘤的大小判断一个肿瘤是不是良性的时候,输出结果只有是或者否,用1和0表示,给定的样本点,并且我们使用传统的线性回归问题解决拟合的函数图像如下:图像中我们可以根据拟合曲线,当输出值

2014-05-31 22:06:48 2271

原创 局部权重线性回归(Locally weighted linear regression)

在线性回归中,由于对参数个数选择的问题是在问题求解之前已经确定好的,因此参数的个数不能很好的确定,如果参数个数过少可能拟合度不好,产生欠拟合(underfitting)问题,或者参数过多,使得函数过于复杂产生过拟合问题(overfitting)。因此本节介绍的局部线性回归(LWR)可以减少这样的风险。欠拟合与过拟合首先看下面的图 对于图中的一系列样本点,当我们采用y

2014-05-30 19:30:35 7454

原创 线性回归与梯度下降

线性回归(Linear Regression)从这篇文章开始,主要介绍机器学习的一些列基本算法,本文介绍线性回归问题,以及利用最小均方和梯度下降解决线性回归问题。(以下内容是根据斯坦福大学ng教授的机器学习公开课总结的内容)监督学习:即训练数据中既包含了输入数据又包含了对应于这个是输入数据的正确的输出结果。 回归问题:当给出了输入数据后,预测正确的输出结果。

2014-05-28 01:23:05 1321 1

原创 软件漏洞分析:crack小实验

开始正式研究软件漏洞分析,首先学习一下基本知识,看的书是《0day安全:软件漏洞分析技术》,在本书的第一章的结尾是一个crack小实验,在这里记录一下实验过程。首先自己写一段C语言的小代码,为下一步的crack提供资源,代码的主要功能是炎症密码的正确性,并进行跳转,代码如下:123456789101112131

2014-05-04 19:48:05 1795

原创 PE文件简介

PE(Portable Execute)文件是WIN32下可执行文件遵循的数据格式,也是反汇编调试必不可少的文件,常见的pe文件有.exe和.dll文件。本文主要介绍pe文件的结构和虚拟内存地址转换到文件地址的方法。pe文件的基本结构基本的pe文件主要包括以下部分:如下图.text节:由编译器产生,村反击本的二进制机器码,我们调试很烦会变得而主要对象。.data节:数据块,宏定

2014-05-04 19:43:51 942

转载 结构化风险

经验风险用损失函数来计算。对于模式识别问题的损失函数来说,经验风险就是训练样本错误率;对于函数逼近问题的损失函数来说,就是平方训练误差;而对于概率密度估计问题的损失函数来说,ERM准则就等价于最大似然法  “支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上”结构化风险结构化风险 = 经验风险 + 置信风险经验风险 =  分类器在给定样本上的误差

2014-04-04 21:32:25 2802

转载 VC维度

Vc维度是针对某个分类器而言。Vc维度与分类器的复杂度有关。在学习分析时候,把分类器看做是来自于某类分类器集合,从而进行误差分析。直观来讲,分类器的复杂度正比于它所在的集合的元素个数,而元素个数与参数的个数由关。例如某个分类器有d个参数,每个参数由32位表示,那么可以推得分类器集合包含了个不同的元素,也就是参数越多分类器复杂度越高。但这仅仅是最直观的理解,如何精确定义分类器的复杂度?这就涉及到了v

2014-04-04 20:48:57 3184

原创 javascript学习之三:数组和对象

复合数据类型和简单数据类型是不同的,因为他不仅可以保存一个值。符合数据类型有两种:数组和对象。数组(arryay):包含一个或多个其他的数据类型。对象(object):包含一个对象的一个引用。主要包含三个:String,Date,MathString对象创建显示创建:var myString=new String("xq");隐式创建:var

2014-02-05 16:14:09 511

原创 javascript学习之二:基本数据类型

数据是所有的“智能”程序的基础。这篇博客就是介绍javascript的基本数据类型以及对这些数据类型的基本操作。基本数据类型在javascript有三种基本的数据类型字符串:例如“hello xq”数字:例如20布尔值:例如true,false上面的三中数据类型被称作是基本(primary)数据类型,能够保存单个的值。还有两个不同的数据类型。不用做保存信息,而是有时

2014-02-04 21:26:03 594

原创 javascript学习之一:介绍以及入门

从很久之前就打算学习javascript这个东西了,但是由于时间的问题,一直就是拖啊拖,终于在这个假期有了时间来学习它了。因此,用本帖作为学习的第一天,看的书籍为图灵系列的《深入浅出JavaScript》从这里开始记录学习进度,也用这种方式监督一下自己。JavaScript产生的原因其实每个新事物产生的原因必然是因为有需要它的地方,也说明了旧事物有了一些缺点需要弥补。javascript的

2014-01-30 11:23:18 634

原创 JAVA抓取网页的简单实现

最近在做java的爬虫,由于刚开始的时候使用的是httpclient,但是逐渐发现,有的功能不能实现,因此,自己利用java的net包做了一个爬虫,实现网页的基本抓取,其中考虑了浏览器的伪装,gzip格式的解码等困扰比较久的问题。代码如下/** * @author houlaizhexq * @function:依靠java自己的net包实现的爬虫,解决浏览器伪装,gzip解码等问题 *

2013-12-06 23:01:50 1042

原创 HttpClient基本操作

HttpClient请求HttpClient支持HTTP/1.1这个版本定义的所有Http方法:GET,HEAD,POST,PUT,DELETE,TRACE和OPTIONS。对于每一种http方法,HttpClient都定义了一个相应的类:HttpGet,HttpHead,HttpPost,HttpPut,HttpDelete,HttpTrace和HttpOpquertions。Httpc

2013-12-03 21:56:25 753

原创 C#学习总结2013.10.31——2013.11.06

java项目打成jar包的方法第一步:选中要打jar包的工程第二步:鼠标右击,选择Export...第三步:选择java中的Runnable JAR file 第四步:(1)在Launch configuration:选择要打jar包的main所在的类名;                (2)在Export destination:选择要存放jar的名称和地址 

2013-11-10 19:31:57 591

原创 C#学习总结2013.10.24—2013.10.30

1.C#进行sql查询时候是用参数在sql语句中,有的时候需要进行参数的动态赋值,比如插入语句中的values的值,但是当value中有单引号,双引号之类的值得时候会产生很多麻烦,而且也会产生sql注入问题,因此,c#提供参数赋值的方法。例子:       cmd.CommandText = "insert intophone(StartNo,EndNo,Name) values(@S

2013-11-03 00:00:32 600

原创 C#学习初级总结

命名规范Pascal命名法,将标识符的首字母和后面连接的每个单词的首字母都大写。Camel命名法,标识符的首字母小写,而每个后面连接的单词的首字母都大写。 C#类命名用Pascal方法,JAVA与此相同。C#方法命名Pascal方法,JAVA使用Camel方法。C#方法命名Pascal方法,JAVA使用Camel方法。面向对象部分1. 给private属性提供访问方

2013-10-12 17:28:48 669

原创 c#学习中关于vs 2010遇到的中文注释,解决方案管理等器问题

由于项目的要求,最近开始学习c#,因为是从java转过来学习c#的,所以对于vs2010使用还不是特别习惯,在此记录一下遇到的困难及解决方法。1,个人感觉vs2010的操作简单性远远比不上eclipse,首先在代码不全的问题上,不够强大,比如说括号自动补全问题,因此,在网上下载了一个小插件,visual assistant x,但是由于这个软件是收费的,所以下载的破解版,下载地址

2013-09-30 00:10:16 1088

原创 小米手机图标消失问题

前几天因为需要代理上网,所以把小米手机刷机成为开发版本,但是,上课的时候玩手机突然发现没有了一页图标,当然不是程序被卸载了,就开始找原因,网上有人解答说设置—程序—程序管理—全部—启动器—强制关闭—点击一下房子可以,但是我发现米2手机是miui v5系统,不存在上面的路径,因此,继续百度,终于发现在v5中设置方法是:系统设置-》应用-》系统桌面-》清除数据或者结束运行,即可实现图标找回。

2013-09-28 22:15:12 3916 1

原创 WIN7 做wifi热点

到学校后发现联通的WIFI信号不是很给力,有需要手机上网,所以用笔记本做一个热点,步骤如下:1,开始-》输入cmd-》以管理员身份运行。2,启动虚拟网卡,在命令行里输入,netsh wlan set hostednetwork mode=allow ssid=xqwifi  PC key=210210210,ssid表示wifi名称,key表示密码。 3,启动网络共享,控制面板

2013-09-22 21:26:11 748

原创 正则表达式的应用—爬取网页上的email地址

一个用java正则表达式实现的爬取网页上的email地址的小程序import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.util.regex.*;public class Test {public static void main(Stri

2013-09-15 23:52:32 699

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除