自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

tbinjiayou

(授我以鱼,不如授我以渔)

  • 博客(49)
  • 资源 (5)
  • 收藏
  • 关注

原创 ubuntu下解决sublime2中文输入问题

1. 安装 fcitx输入框架sudo add-apt-repository ppa:fcitx-team/nightlysudo apt-get updatesudo apt-get install fcitx-sogoupinyin2. 编译共享内存1) 保存如下代码到任意目录,将其命名为 sublime-imfix.c /*sublime-imfix.cUse

2013-06-29 18:26:42 2106

原创 在CodeIgniter中创建自己的类

application存放与具体某个网站相关的所有数据,在该目录下包含以下文件夹:cache:存放缓存文件。config:网站的配置文件目录。controllers:控制文件的目录。core:应该是用于重写 systesms/core 中相应文件用的把。errors:里面主要是定义了一些展示错误信息的页面。helpers:存放实现一些辅助函数,或者修改、扩展 systems

2013-06-27 22:26:41 2891

原创 CodeIgnite快速入门

CodeIgnite是一个轻量级的PHP开发框架。使用它可以减轻开发负担,并且实现良好的MVC模式。现在记录一下用其搭建一个简单网站的教程:1. 上官方网站下载最新版源代码, 官网:http://codeigniter.org.cn;2. 将源代码解压到www目录,按照说明配置 application/config 中的配置文件,通过浏览器即可访问到最初欢迎页面网页;3. 在 appl

2013-06-27 16:58:58 1818

原创 php扩展安装mbstring

linux系统下扩展安装mbstring1. 进入php的源码包的ext/mbstring目录$ cd /home/php/ext/mbstring2. 运行php安装目录下的phpize$ /usr/local/lib/php/bin/phpize3. 在mbstring目录下编译mbstring$ ./configure --with-php-config=/usr/l

2013-06-19 21:31:03 1289

转载 GitHub详细教程

GitHub详细教程Table of Contents1 Git详细教程1.1 Git简介1.1.1 Git是何方神圣?1.1.2 重要的术语1.1.3 索引1.2 Git安装1.3 Git配置1.3.1 用户信息1.3.2 高亮显示1.3.3 忽略特定的文件1.3.4 使用.gitkeep来追踪空的文件夹1.4 开始操作Git1

2013-06-19 14:47:57 98005 49

原创 使用gist管理代码

gist可用于管理只包含几个文件的小型代码库,或者几个代码片段。一、安装与配置1.安装下载gist的ruby库 https://github.com/defunkt/gist解压gist包后运行 $gem install gist注:首先需要安装ruby,在ubuntu下,运行:$sudo apt-get install ruby$sudo apt-get instal

2013-06-19 14:21:44 4229

原创 python生成缩略图

一、环境配置确保系统安装了libjpeg libjpeg-dev libfreetype6 libfreetype6-dev zlib1g-dev如果系统未安装,则会出现  JPEG support not available的异常。 安装libjpeg-dev需要注意对安装的库文件生成链接,即执行:# ln -s /usr/lib/i386-linux-gnu/libjpeg.s

2013-06-18 21:24:29 2893

转载 HTML解析工具beautiful soup

http://www.cnblogs.com/twinsclover/archive/2012/04/26/2471704.html序言  之前用python爬取网页的时候,一直用的是regex或者自带的库sgmllib里的SGMLParser。但是遇到复杂一点的情况时,SGMLParser往往就不那么给力了!(哈,难道说我 too native了?毕竟beautifulSou

2013-06-17 19:12:53 904

原创 python包管理工具pip

1. Pip介绍Pip 是安装python包的工具,提供了安装包,列出已经安装的包,升级包以及卸载包的功能。Pip 是对easy_install的取代,提供了和easy_install相同的查找包的功能,因此可以使用easy_install安装的包也同样可以使用pip进行安装。2. Pip安装安装PipPip的安装可以通过源代码包,easy_inst

2013-06-16 14:45:22 9115

原创 Github使用指南

一、创建共用信息1.创建账户:进入https://www.github.com/网站创建账户。2.设置git的全局信息:在命令行模式下输入以下命令git config --global user.name 'Account Name'git config --global user.email 'Email Address'通过 git config --list 命令可

2013-06-16 11:43:11 2375

原创 python读取CSV文件

具体的就不说了,说几个注意点:1.传递给csv.reader或者DictReader的是一个打开的文件流;2.异常“line contains NULL byte”可以对打开的文件作如下处理,csvfile = open(filepath,"rb"); #打开一个csv文件reader = csv.DictReader((line.replace('\0','') for line

2013-04-15 18:29:15 12370

原创 python调用新浪微博API

前提:在新浪微博应用开发平台成功创建一个应用,并获得可用APP_KEY、APP_SECRET、CALLBACK_URL。1.下载OAuth2的python版SDK,https://github.com/michaelliao/sinaweibopy,其中封装的新浪微博API的文件是weibo.py;2.使用SDK开发微博应用程序,直接上源码:#!/usr/bin/env pytho

2013-04-15 10:32:47 1923

原创 ubuntu安装程序

1.下载软件包并解压;2.将软件解压到合适的目录,一般为以下几个候选目录:          1)/usr/lib或者/usr/local/lib目录下。一般情况下,前者是系统程序的安装目录,后者是用户程序的安装目录;          2)/opt目录下;          3)~/apps类似的用户自定义目录下关键是目录要统一,不要随意放置。3.创建命令行快捷方式:$

2013-04-15 09:56:57 699

转载 Ubuntu下SVN的使用方法[整理]

SVN作为日常开发中不可缺少的工具,今天终于开始在Ubuntu下使用了。1、首先需要安装SVN。Ubuntu下的SVN安装十分简单,sudo apt-get install subversion,然后根据提示一步一步,就完成了SVN的安装;2、检出文件(checkout)。     使用命令:svn co http://{svn repository url} /desti

2013-04-13 20:37:28 814

原创 多项分布

多项分布的概念多项分布是最重要的离散型多维分布,假设A1,A2,...,An是某一试验下的完备事件群,即事件两两互斥,且其和为必然事件(即每次试验有且仅有一个事件Ai发生),分别以p1,p2,...,pn记为事件A1,A2,...,An发生的概率,pi>0,p1+p2+...+pn=1。现将试验独立重复N次,以Xi记为在N次试验中事件Ai出现的次数,X=(X1,X2,...,Xn)为n维随机向

2013-04-01 16:49:32 8306

原创 泊松分布

泊松分布的概念若随机变量X的可能取值为0、1、2、...,且概率分布为则称X服从泊松分布,记为X~P(t),其中t>0且为一常数。泊松分布多出现在当X表示在一定时间或者空间内罕见事件出现个数的场合。它是二项分布样本空间趋于无限,事件A发生概率p较小时的推导。泊松分布的推导假设某一时间段内,某交通路口发生事故的概率是p,为求该时间段内交通路口发生的事故个数。假设所观察的时间为

2013-04-01 15:53:10 21701

原创 二项分布

二项分布的概念当随机事件是只具有两种互斥结果的离散型随机事件时,称为二项分类变量(dichotomous variable),如对病人治疗结果的有效与无效,某种化验结果的阳性与阴性,接触某传染源的感染与未感染等。二项分布(binomial distribution)就是对这类只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。 二项分布的推导假设某事件A在一次试验中发生的

2013-04-01 15:12:26 3588

转载 信息检索和网络数据挖掘领域论文技术基础

信息检索和网络数据领域(WWW, SIGIR, CIKM, WSDM, ACL, EMNLP等)的论文中常用的模型和技术总结引子:对于这个领域的博士生来说,看懂论文是入行了解大家在做什么的研究基础,通常我们会去看一本书。看一本书固然是好,但是有一个很大的缺点:一本书本身自成体系,所以包含太多东西,很多内容看了,但是实际上却用不到。这虽然不能说是一种浪费,但是却没有把有限力气花在刀口上。我所

2013-03-31 13:05:17 671

原创 极大似然估计

基本思想         通过最大化样本的出现概率,使得求出的参数值的概率也最大。具体说就是,假设总体有分布(概率密度或概率函数)。X1, X2, ...,Xn为从整体中抽取的独立同分布的样本,则样本的分布为,极大似然估计的思想就是在给定样本(X1,...,Xn)的情况下,最大化样本出现的概率,由此求出的未知参数的值作为该未知参数的估计值。它的思想是通过最大化抽取出的样本出现的概率来求解未知参

2013-03-25 15:27:03 1652

原创 参数估计

含义:假设某个统计总体的概率(密度)函数为f(x; 1, 2, ..., k),其中i是未知参数,x为样本。参数估计问题就是通过从总体中抽出的样本X1,X2,...,Xn(独立同分布)代入该函数中,对这些未知的参数做出估计,可以估计未知参数的全部、部分或者未知参数的函数。统计量是只与样本有关的函数,而与未知参数无关。以下是几个未知参数估计的方法矩估计极大似然

2013-03-25 11:15:06 761

原创 矩估计

假设总体分布的k阶原点矩为uk,k阶中心矩为hk,当样本大小n较大时,总体矩接近于样本矩,即uk  ak,hk  mk。因此可以通过样本矩来估计总体矩,而总体矩中包含未知参数,可以通过求解方程组的方法来求解未知参数。样本的k阶原点矩是总体k阶原点矩的无偏估计,而中心矩一般不是无偏的,有时可以通过一些参数修正为无偏估计。例如S2 = nm2/(n-1),就将有偏的二阶中心矩修正为无偏的方差。下面

2013-03-25 11:14:44 4395

原创 文本分类性能评价指标

文本分类的性能评价指标主要是召回率(recall)、准确率(precision)、F1-measure,以及用于评价全局性能的宏平均(macro-average)和微平均(micro-average)。意义与计算公式假定:类别ci的分类结果中,正确分为该类的样本数目是a,错误划归为该类的样本数目是b,将该类错误划归为它类的样本数目是c,总共包含C类。召回率:recall= a / (a

2013-03-21 10:43:20 8719

原创 Apriori算法

挖掘频繁模式是挖掘频繁出现在数据集中的模式。Apriori算法是用于挖掘频繁项集的经典方法。所谓频繁项集也就是出现频度不低于最小支持度阈值support的项集,support可以是绝对支持度(频度),也可以是相对支持度(频率)。支持度support:包含该项集或者模式的样本在全体样本中出现的次数(绝对)或所占的比例(相对)。Apriori算法原理         为了挖掘频繁K项集,用Lk

2013-03-20 19:32:39 1230

原创 贝叶斯分类

基本原理       贝叶斯分类是基于贝叶斯公式的一种分类方法,它是通过先验知识和似然函数来估计后验概率。其公式如下:P(H | X) = P(X | H)*P(H) / P(X),其中H是假设,在分类中也就是判定的某种类别,X是证据向量,在分类中也就是n维的特征向量值,一般写作X=(x1, x2, ..., xn)。       因此对于一个给定的X,我们可以通过贝叶斯公式针对每种假设H

2013-03-19 16:08:24 4365 1

原创 K-means聚类算法

算法思想为了将集合S分成k个类,可以先选取k个中心点,将S中样本划分到其中的某个类别中,然后对划分的k个类重新选择中心点,进而重新划分,直至中心点稳定。算法伪代码List K_means(DataSet S, int k){ List new_centrio_list = Select_init_centriole(S, k); // 选取初始的k个中心点 do { ce

2013-03-15 11:33:15 5969 1

原创 决策树算法

采用递归的分治法构造决策树,每次依据最优划分属性的属性值,将当前层的全集S划分为若干个子集,并采用相同方法对子集构造决策树。决策树算法包括两部分:树的构建和树的剪枝。怎样的决策树才是最优的?基本的原则是使最后构造出的决策树规模最小。基于这个基本原则,我们启发式地定义规则为使分割后得到的子节点纯度最大。于是属性选择规则问题就转化为了纯度定义的问题。利用熵(Entropy)的概念去描述“不

2013-03-13 15:51:17 8442

原创 信息熵

信息熵是对不确定性或者所包含信息的一种度量。例如:抛掷一枚均匀的硬币,正面和反面出现的概率相等都是1/2,那么通过熵的计算公式,抛掷一次的熵为1bit,抛掷两次的熵为2bit。也就是说,为了标记抛掷的结果,我们需要一个比特位,如用0标记正面,1标记反面,此时不确定性也就最大。如果是一枚不均匀的硬币,那么通过熵的计算公式,其值必然小于1,也就是说我们预测结果的不确定性降低了,这种硬币抛掷后所蕴含的信

2013-03-12 23:37:50 1415

原创 使用Bundle进行VIM插件的管理

1.安装git:sudoapt-get install git2.安装Bundle:gitclone https://github.com/gmarik/vundle.git~/.vim/bundle/vundle3.在.vimrc文件中添加如下语句setnocompatible " 设置vim为不兼容vi模式filetypeoff " requiredsetrtp+=~/

2013-03-09 21:37:10 38189 5

原创 MPI入门实例讲解

1.一个简单的hello world程序 mpi_hello.cpp #include #include "mpi" int main(int argv,char* argc[]){ MPI_Init(&argv,&argc); cout<<"hello world"<<endl; MPI_Finalize(); ret

2013-03-07 11:02:36 27812 2

原创 C++内存分配及字符串赋值

本文介绍在Ubuntu12.10,g++环境下C++内存分配问题。并由此解释在用g++编译时,字符串常量赋值给字符指针类型时提示“warning:deprecated conversion from string constant to 'char *'”警告的原因。一、C++内存分配       C++编译器将应用程序的内存空间分成四个部分,从内存低地址开始依次为:代码和常量区(

2013-03-02 16:38:52 8049 2

原创 Ubuntu下Boost的安装

本文介绍Ubuntu12.10下Boost1.53版本的安装。1.安装SVN客户端:sudoapt-get install subversion2.下载Boost最新版:svnco http://svn.boost.org/svn/boost/trunk boost-trunk3.安装GCC、G++编译器:sudoapt-get install build-essentia

2013-03-01 20:00:46 2290

原创 Google Custom Search API的使用

本文将介绍如何使用GoogleCustom Search API,调用Google的搜索结果。最后提供了一个用PHP编写的简单示例。一、获取Google的授权1.注册Google帐号,网址链接:https://accounts.google.com/NewAccount。2.开启Custom Search功能:打开网址https://code.google.com/apis/c

2013-03-01 19:21:52 5278 2

原创 传指针和传引用的一个问题

int main() { Tree tree; tree.Add(5); } class Tree { public: Tree(Node* root=NULL); void Add(int data); private: Node root; void add(Node* root,Node *node); } Tree::Tree(Nod

2012-08-01 16:12:11 1005

原创 使用SCP拷贝文件

在本地主机拷贝远程服务器上的文件,可以使用如下命令scp [options] username@sourceIP:filename username@desIP:filename例如:scp -r tbin@****.****.****.****:~/Algorithm/Tree /home/tbin-r表示拷贝整个文件夹,该操作就是将服务器上的Tree目录中的文件拷贝到本地的tb

2012-07-31 10:06:45 756

原创 C++中模板的使用

1.类模板格式head文件template // typename或者class都可以class A{public: A(); A(T data); void Print();protected: string message;}; /*以下三句话是必须加的,当前的编译器不支持模板类

2012-07-30 21:33:44 708

原创 简单实现框架菜单

main.html企业信息管理系统 left.html<!--function show(){ parent.document.getElementById("I2").src = "login.html"; //parent为middle.html,获取其document对象,再通过getElem

2011-06-07 15:11:00 923

原创 操作----调用DLL

调用DLL函数的步骤是:1、创建DLL;2、在需要引用DLL的地方进行函数声明,例如:using System;using System.Runtime.InteropServices;    //DllImport所在的命名空间class DllImportTest{    [DllImport("hashMain.dll")]    public static extern v

2011-06-04 22:15:00 898

转载 异常----- 异常来自 HRESULT:0x800736B1

异常信息:“Error:无法加载DLL ”xxx.dll":由于应用程序配置不正确,应用程序未能启动。重新安装应用程序可能会纠正这个问题。(异常来自:HRESULT:0x800736B1) 在程序中通过以下方式[DllImport("mwhrf_bj.dll", EntryPoint = "Open_USB", SetLastError = true,         CharSe

2011-06-04 21:46:00 13277 1

原创 网站架设

C:/WINDOWS中的temp文件夹的User账户的读写、修改权限未开启:导致文件无法上传到服务器,asp网站无法正常浏览;站点-属性-应用程序设置-配置-选项-启用父路径未打勾:asp网站无法浏览,或者asp网站的子文件夹下的网页无法浏览;

2010-07-21 10:59:00 697

转载 SQLServer常见查询问题

<br />这是CSDN论坛中一个帖子的内容,我把它copy到博客里面,方便以后查阅。感谢文章的作者feilniu<br />1. 生成若干行记录<br />有用指数:★★★★★<br /><br />常见的问题类型:根据起止日期生成若干个日期、生成一天中的各个时间段<br /><br />《SQL Server 2005技术内幕:T-SQL查询》作者建议在数据库中创建一个数据表:SQL code --自然数表1-1MCREATETABLE Nums(n intNOTNULLPRIMARYKEYCLUSTE

2010-06-02 17:50:00 729

Git相关资源

收集整理的一些git相关资源。基本上就是靠这些掌握的git。

2013-06-21

强大的验证控件SuperAuthenticationCode

SuperAuthenticationCode+(1_3_0_0)一个强大的验证控件,包含详细的使用说明

2010-05-22

Wrox.Beginning.Visual.C#.2005.Nov.2005

wrox的经典c#教程,很多学校学校的c#课程就是用的这本书

2009-04-05

Applied Microsoft .Net Framework Programming

众所周知的.NET的最好教程,其重要性我就不多说了,看了自然会知道

2009-04-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除