自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(154)
  • 资源 (9)
  • 收藏
  • 关注

转载 利用dmesg和addr2line来重现bug

利用dmesg和addr2line来重现bug有些时候,我们的程序crash了,但是我们没有保存core dump信息,这时如果我们想要知道程序在哪个位置出错,就不是那么容易了。下面有一种方法,可以大致判断出程序出错的大致位置。1.用dmesg查找出错的代码段地址。命令格式:[plain] view plaincopyprint?

2015-10-16 13:28:42 743

原创 算法相关网站

leetcode.com

2014-02-07 13:31:22 1105

转载 卡特兰数

卡特兰数又称卡塔兰数,是组合数学中一个常出现在各种计数问题中出现的数列。由以比利时的数学家欧仁·查理·卡塔兰 (1814–1894)命名。目录1简介2原理3应用▪ 括号化 ▪ 出栈次序 ▪ 凸多边形三角划分 ▪ 给定节点组成二叉树 4扩展5C++应用1简介编辑卡特兰数又称卡塔兰数,英文名Catalan

2014-02-07 13:25:49 1052

转载 初探数据挖掘中的十大经典算法

以下就是从参加评选的18种候选算法中,最终决选出来的十大经典算法:一、C4.5C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。C4.5相比于ID3改进的地

2013-08-12 11:16:14 663

转载 数据挖掘十大经典算法(10) CART: 分类与回归树

如果一个人必须去选择在很大范围的情形下性能都好的、同时不需要应用开发者付出很多的努力并且易于被终端用户理解的分类技术的话,那么Brieman, Friedman, Olshen和Stone(1984)提出的分类树方法是一个强有力的竞争者。我们将首先讨论这个分类的过程,然后在后续的节中我们将展示这个过程是如何被用来预测连续的因变量。Brieman等人用来实现这些过程的程序被称为分类和回归树(CART

2013-08-12 11:13:44 905

转载 数据挖掘十大经典算法(9) 朴素贝叶斯分类器 Naive Bayes

贝叶斯分类器  贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。目前研究较多的贝叶斯分类器主要有四种,分别是:Naive Bayes、TAN、BAN和GBN。  贝叶斯网络是一个带有概率注释的有向无环图,图中的每一个结点均表示一个随机变量,图中两结点 间若存在着一条弧,则表示这两结点相对

2013-08-12 11:11:36 949

转载 数据挖掘十大经典算法(7) AdaBoost

Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器 (强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权 值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。

2013-08-12 11:09:51 649

转载 数据挖掘十大经典算法(6) PageRank

PageRank是Google算法的重要内容。2001年9月被授予美国专利,专利人是Google创始人之一拉里·佩奇(Larry Page)。因此,PageRank里的page不是指网页,而是指佩奇,即这个等级方法是以佩奇来命名的。  Google的 PageRank根据网站的外部链接和内部链接的数量和质量俩衡量网站的价值。PageRank背后的概念是,每个到页面的链接都是对该页面的一次投

2013-08-12 11:09:06 683

转载 数据挖掘十大经典算法(5) 最大期望(EM)算法

在统计计算中,最大期望(EM,Expectation–Maximization)算法是在概率(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variabl)。最大期望经常用在机器学习和计算机视觉的数据集聚(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),也就是将隐藏变量象能够观测

2013-08-12 11:07:39 847

转载 数据挖掘十大经典算法(4) The Apriori algorithm

Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。 Apriori演算法所使用的前置统计量包括了:最大规则物件数:规则中物件组所包含的最大物件数量最小支援:规则中物件或是物件组必顸符合的最低案例数最小信心水准:计

2013-08-12 11:06:45 886

转载 数据挖掘十大经典算法(3) Support vector machines

支持向量机,英文为Support Vector Machine,简称SV机(论文中一般简称SVM)。它是一种監督式學習的方法,它广泛的应用于统计分类以及回归分析中。支持向量机属于一般化线性分类器.他们也可以认为是提克洛夫规范化(Tikhonov Regularization)方法的一个特例.这族分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区.因此支持向量机也被称为最大边缘区分类

2013-08-12 11:05:08 713

转载 数据挖掘十大经典算法(2) The k-means algorithm

k-means algorithm算法是一个聚类算法,把n的对象根据他们的属性分为k个分割,k   假设有k个群组Si, i=1,2,...,k。μi是群组Si内所有元素xj的重心,或叫中心点。  k平均聚类发明于1956年, 该算法最常见的形式是采用被称为劳埃德算法(Lloyd algorithm)的迭代式改进探索法。劳埃德算法首先把输入点分成k个初始化分组,可以是随机的或者使用一些

2013-08-12 11:03:38 923

转载 数据挖掘十大经典算法(1) C4.5

机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。从数据产生决策树的机器学习技术叫做决策树学习, 通俗说就是决策树。决策树学习也是数据挖掘中一个普通的

2013-08-12 11:02:32 723

转载 Linux下搭建Android开发环境

为什么要在Linux搭建开发环境呢?从直观来说,Android虚拟机在Linux下运行速度更快,而且性能更稳定。  我使用的Linux环境是ubuntu-10.10-desktop-i386。安装前所需要准备的软件:       1. JDK(jdk-6u27-linux-i586.bin)      2. AndroidSDK(android-sdk_r12-linux_x86)

2013-07-27 11:25:07 558

转载 Linux动态库搜索路径

众所周知,Linux动态库的默认搜索路径是/lib和/usr/lib。动态库被创建后,一般都复制到这两个目录中。当程序执行时需要某动态库,并且该动态库还未加载到内存中,则系统会自动到这两个默认搜索路径中去查找相应的动态库文件,然后加载该文件到内存中,这样程序就可以使用该动态库中的函数,以及该动态库的其它资源了。在Linux 中,动态库的搜索路径除了默认的搜索路径外,还可以通过以下三种方法来指定

2013-07-16 12:32:55 620

转载 wget命令镜像网站

1、Linux下的wget命令:               wget  :下载工具。详细参数可以man一下。         下载基本的文件:可以 直接:  wget  -c   http://  ×××  或者wget -c   ftp://××     参数:  wget  -c:continue 表示断点续传..                         -b  

2013-07-15 23:31:04 2101

转载 建立SSH隧道(SSH端口转发)

ssh隧道功能,也就是端口转发功能非常好用,可以实现一些代理功能或者是穿透内网功能。ssh的端口转发(或者叫做隧道)命令分为三种:本地:ssh -C -f -N -g -L listen_port:DST_Host:DST_port user@Tunnel_Host远程:ssh -C -f -N -g -R listen_port:DST_Host:DST_port user@Tu

2013-07-15 23:18:24 982

转载 WebDriver配置Firefox代理服务器

这玩意儿网上很多,但是坑更多,现在记录一个肯定能用的。我的环境是Python 2.6 + Selenium 2.6from selenium import webdriverprofile = webdriver.FirefoxProfile()profile.set_preference('network.proxy.type', 1)profile.set_pre

2013-05-21 14:49:52 3470

转载 How to make dmesg timestamp human readable

dmesg|perl -ne 'BEGIN{$a= time()- qx!cat /proc/uptime!};s/\[(\d+)\.\d+\]/localtime($1 + $a)/e; print $_;'-----------------------#!/usr/bin/perl use strict;use warnings; my @dmesg_new = ();m

2013-01-10 17:05:59 1060

转载 Linux 2.6 中的页面回收与反向映射

简介: 本文主要介绍 Linux 2.6 中的页面回收机制是如何工作的,反向映射是如何设计并实现的,以及 Linux 操作系统如何利用反向映射机制进行页面地回收。 Linux 2.6 中关于反向映射和页面回收的代码在不断地更新,不同版本的内核在这部分的代码上会有很大差异,本文将基于 2.6.18.1 版本的内核来探讨 Linux 中的反向映射和页面回收。为什么要进行页面回收

2012-12-31 11:56:01 410

转载 几个简单有趣的算法

闲来无事总结3个我认为比较好的算法,很简单,但有趣。我们应该学会欣赏简单的东西,拒绝钻进复杂的东西里面,比如股市... 这三个算法分别为大数乘法,求交集算法,将一个数拆成连续整数和算法以及8位倒置算法。这些算法都非出自本人,但是本人实现了一个。 1.大数乘法:这个算法很著名,它可以突破计算机的限制从而计算一些很大的数,它的效率是重要的,但本文仅仅从逻辑角度来分析,先不分析时间空间复杂性。

2012-12-31 11:51:10 493

转载 linux内核内存管理中的pagevec结构体

linux内核的内存管理中有一个2.6内核才加入的并不很张扬的结构体,那就是pagevec:struct pagevec {    unsigned long nr;    unsigned long cold;    struct page *pages[14];};以往要加入到lru链表的page都要加入到这个pagevec了,并不再直接往lru中加入了。可是不加入lr

2012-12-31 11:35:24 673

转载 Linux内核代码华人贡献统计

http://www.remword.com/kps_result/ 这个站点对Linux内核代码补丁进行了详细的统计,感兴趣的童鞋可以看一下。    在这里给大家看一下2005年4月16日至今各个国家贡献的补丁统计数据(从中可以看出咱们华人的贡献还是很大的):Total patch sets of this kernel release: 29925155 countrie

2012-12-31 11:33:13 9885

转载 Cpulimit

目录 [隐藏] 1 功能2 语法3 补充说明4 参数5 安装方法6 实例7 相关链接功能限制一个进程的 CPU 占用率。语法cpulimit TARGET [OPTIONS...]补充说明cpulimit用来限制一个进程的 CPU 占用率(以%表示,而不是CPU时间。)原理在于发送了SIGSTOP和SIGCONT信息。参数

2012-12-27 17:03:23 1246

转载 Top 10 Illusions in 2012

Just like in 2011, let's wrap up 2012 with some of the most mind-bending photos or artworks we came across this year. Though an illusion is defined in several different ways, we like it when it's de

2012-12-27 16:59:58 502

转载 使用 google-perftools 剖析程序性能瓶颈

简介: google-perftools 是一款优秀的 Linux C/C++ 程序的性能剖析及优化工具,它提供了将目标程序运行时所消耗的 CPU 时间片进行剖析和图形化输出剖析结果的功能。本文将从零开始,一步一步引导读者搭建并运行一个 google-perftools 的剖析环境,并用一个示例来演示如何使用该工具找到目标程序的性能瓶颈。google-perftools 简

2012-12-26 16:49:01 399

转载 R语言学习由浅入深路线图

现在对R感兴趣的人越来越多,很多人都想快速的掌握R语言,然而,由于目前大部分高校都没有开设R语言课程,这就导致很多人不知道如何着手学习R语言。对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是——看书。目前,市面上介绍R语言的书籍很多,中文英文都有。那么,众多书籍中,

2012-12-26 14:41:36 1158 1

转载 R语言为Hadoop集群数据统计分析带来革命性变化

导读:R现在还可以运行在HBase这种非关系型的数据库以及面向列的分布式数据存储之上。其主要模仿了Google的BigTable。这基本上等同于使用Hadoop来持有结构化数据的数据库。就像Apache软件基金会Hadoop项目的子项目HBase一样。  维基百科指出,R语言是主要用于统计分析、绘图的语言和操作环境。R本来是由来自新西兰奥克兰大学的Ross Ihaka和Ro

2012-12-26 14:29:32 737

转载 Ticket Servers: Distributed Unique Primary Keys on the Cheap

Ticket Servers: Distributed Unique Primary Keys on the CheapFebruary 8th, 2010(re-published from the Flickr Code Blog)This is the first post in the Using, Abusing and Scaling MySQL at Flic

2012-12-20 12:18:03 594

转载 数据库分库分表(sharding)系列

数据库分库分表(sharding)系列 作者:黄钧航 ,发布于2012-11-22,来源:CSDN 目录;(一) 拆分实施策略和示例演示(二) 全局主键生成策略(三) 关于使用框架还是自主开发以及sharding实现层面的考量(四) 多数据源的事务处理(五) 一种支持自由规划无须数据迁移和修

2012-12-20 12:13:23 1298

转载 C++ const_cast问题阐述

本文对const_cast进行了更深入的研究.-------------------------------------------------------------------------------------------------------和上一篇文章一样了,还是提起一下大约一年前我来公司面试所遇到的一道题目,题目很简单:C++有多少种cast,它们的名称和功能各是什么。(

2012-12-13 16:56:23 368

转载 svn代码回滚命令

取消对代码的修改分为两种情况: 第一种情况:改动没有被提交(commit)。这种情况下,使用svn revert就能取消之前的修改。svn revert用法如下:# svn revert [-R] something其中something可以是(目录或文件的)相对路径也可以是绝对路径。当something为单个文件时,直接svn revert

2012-11-16 12:45:02 435

转载 如何使进程运行在后台

在Linux中,如果要让进程在后台运行,一般情况下,我们在命令后面加上&即可,实际上,这样是将命令放入到一个作业队列中了:$ ./test.sh &[1] 17208$ jobs -l[1]+ 17208 Running ./test.sh &对于已经在前台执行的命令,也可以重新放到后台执行,首先按ctrl+z暂停已经运行的进程,然后使用bg命令将停止的作业放到后台

2012-10-30 14:53:29 729

转载 文本去重之SimHash算法

说到文本相似性计算,大家首先想到的应该是使用向量空间模型VSM(Vector Space Model)。使用VSM计算相似度,先对文本进行分词,然后建立文本向量,把相似度的计算转换成某种特征向量距离的计算,比如余弦角、欧式距离、Jaccard相似系数等。这种方法存在很大一个问题:需要对文本两两进行相似度比较,无法扩展到海量文本的处理。想想像Google这种全网搜索引擎,收录了上百亿的网页,爬虫

2012-10-12 19:02:21 637

原创 Linux:如何查看一个进程的详细的启动时间

ps -A -opid,stime,etime,args 其中:-A: Select all processes. Identical to -e.-o: user-defined format.pid: 列出进程号stime: start timeetime: elapse timeargs: 命令信息当然,也可以到/proc/pid中查看.

2012-09-18 18:16:28 856

转载 Python图像处理库(PIL)--Image,ImageDraw等基本模块介绍

常用操作合成 Image.blend(i1,i2,a)/Image.composite(i1,i2,mask)缩略图 thumbnail(size,filter=None)  Modifies in-place,Preserves aspect ratio>>> myImage.thumbnail ((128, 128), Image.ANTIALIAS)剪切 crop(b

2012-09-14 10:17:51 4841

转载 用Python做图像处理

最近在做一件比较 evil 的事情——验证码识别,以此来学习一些新的技能。因为我是初学,对图像处理方面就不太了解了,欲要利吾事,必先利吾器,既然只是做一下实验,那用 Python 来作原型开发再好不过了。在 Python 中,比较常用的图像处理库是 PIL(Python Image Library),当前版本是 1.1.6 ,用起来非常方便。大家可以在http://www.pythonware

2012-09-13 11:09:26 914

转载 用python爬虫抓站的一些技巧总结

用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过在discuz论坛中自动登录自动发贴的脚本,写过自动收邮件的脚本,写过简单的验证码识别的脚本,本来想写google music的抓取脚本的,结果有了强大的gmbox,也就不用写了。-这些脚本有一个共性,都是和web相关的,总要用到获取链接的一些方法,再加上simplecd这个半爬虫半网站的项目,累积不少爬虫抓站的经验,在此总结一下,

2012-09-11 18:11:21 955

转载 Python内建函数用法!

abs()dict()help()min()setattr()all()dir()hex()next()slice()any()divmod()id()object()sorted()ascii(

2012-09-11 17:41:21 2294

原创 selenium范例:python登录webqq

from selenium import webdriverfrom selenium.common.exceptions import NoSuchElementExceptionfrom selenium.webdriver.common.keys import Keysimport timefrom pprint import pprint username="username"

2012-09-11 17:14:45 1663

libxml2-2.7.6.tar.gz

安装php5所需要的基本支持库,安装方法可参考http://blog.csdn.net/starstarstone/article/details/6894842

2012-08-23

httpd-2.4.2.tar.gz

apache安装文件,安装方法可参考http://blog.csdn.net/starstarstone/article/details/6894842

2012-08-23

php-5.4.6.tar.bz2

php5安装文件,安装方法可参考http://blog.csdn.net/starstarstone/article/details/6894842

2012-08-23

Linux下如何使用3G网卡

文档描述了在Linux下使用3G网卡上网的方法,涉及命令:lsusb,usb_modeswitch,wvdialconf,wvdial等

2011-12-02

新浪微博组件_转发按钮使用说明

在网站中使用微博分享,有助于提升网站流量及外链数。

2011-09-30

Mastering Perl.pdf

Learning Perl,Intermediate Perl,和Mastering Perl共同组成所谓的Perl入门三部曲

2011-07-19

Intermediate Perl.pdf

Intermediate Perl,俗称羊骆驼书,介绍perl面向对象、模块等高级内容。

2011-07-19

Learning.Perl.5th.Edition.Jul.2008.pdf

Perl语言入门(第五版),俗称小骆驼书,经典的perl学习书籍。

2011-07-19

c#版五子棋(人机对弈模式)

最近在学习C#,写了个五子棋的小游戏,把原代码也传给大家。 电脑选择下棋点的主要算法分为两部:1.将每个落子点进行评分(有棋或禁手点评为最低);2.从第一部中选出5个得分最高的落子点,采用回溯算法求得最佳落子点。(代码中有注释) 希望大家有什么建议或者发现了Bug告诉我啊! 我这几天有时间会进一步完善这个小游戏,到时再传上来。

2007-03-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除