自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(144)
  • 问答 (1)
  • 收藏
  • 关注

原创 多表join的一个优化思路

big table:streamed small table:buffered reduce the memory need and job count and w/r 

2012-11-20 11:24:47 1011

原创 SecureCRT突然卡死的问题

SecureCRT作为著名的SSH客户端,经常用于登陆远程服务器。在上面编辑文本,特别是用vi打开两个文本,并且需要切换时,很容易出现卡死的现象,不能接受任何的键盘输入。很是郁闷。以前每次遇到这个问题,我只有关掉那个session重新打开一个。这次又遇上,是在不能忍,试着解决一下。仔细观察会发现,在vi下切换文本“ctrl+w+w”时,很容易输入成”ctrl+s”。随便拿一个sessio...

2012-11-16 18:48:21 509

原创 cross join and right join

19:53:03什么事 corss join? 什么是 right join 啊?19:59:43交叉连接就是指等值连接吧,将两边在key上都相等的连接起来,要求两边都相等。右连接是指右边的表里面如果有null的,也连接起来。20:00:30右连接举个例子?如果右表的key为null  就把这个key当作和左边key相等?20:06:05不应该这样说。...

2012-10-24 20:50:30 176

原创 python smtp 发邮件代码

#!/usr/bin/env python# -*- coding: gbk -*-#导入smtplib和MIMETextimport smtplibfrom email.mime.text import MIMEText##############要发给谁,这里发给2个人mailto_list=["[email protected]","[email protected]"]#######...

2012-10-18 16:37:42 153

原创 nohup linux command

nohup command > myout.file 2>&1 &   2>&1  2代表标准错误 1代表标准输出  将标准错误和输出都重定向到myout.file查看实时打印信息:tail -f nohup.outappending output to nohup.out...

2012-10-17 10:15:13 94

原创 shell 的一些技巧

 一、字符串:1.求字符串长度:STRING="Noah's Ark"# echo ${#STRING}10 2.截取子字符串:# echo ${STRING:7:3}Ark 3.模式匹配# : 删除最小匹配前缀## : 删除最大匹配前缀% : 删除最小匹配后缀%% :删除最大匹配后缀# FILENAME=/opt/osmu/goodluck...

2012-10-11 11:13:42 96

原创 [Python]文件的创建与追加

一、用Python创建一个新文件,内容是从0到9的整数, 每个数字占一行:#python >>>f=open('f.txt','w')    # r只读,w可写,a追加>>>for i in range(0,10):f.write(str(i)+'\n').  .  .>>> f.close()二、文件内容追加,从0到9的10个随机整数:#py...

2012-10-11 11:12:17 873

原创 python import模块方法

python包含子目录中的模块方法比较简单,关键是能够在sys.path里面找到通向模块文件的路径。下面将具体介绍几种常用情况:(1)主程序与模块程序在同一目录下:如下面程序结构:`-- src    |-- mod1.py    `-- test1.py    若在程序test1.py中导入模块mod1, 则直接使用import mod1或from mod1 import *;(2)主程序所在目...

2012-10-08 11:00:33 108

原创 编程环境

gccgdb:GUN Debugger   什么是core文件?GDB常用命令–载入程序和core –断点  break 行号 函数 条件断点  指定地址  info delete disable enable–流程控制 run cont(continue)next(n)step(s)finish–查看代码 list list function_name / 15 ...

2012-10-04 16:37:58 102

原创 C++ 头文件

1. 头文件一般包括类的定义,extern变量的声明,函数的声明2. 头文件是声明,定义由具体文件实现3. struct 和 class 定义类的区别是默认的访问权限,前者public,后者是private4. 减少头文件的编译时间,支持预编译头文件...

2012-10-04 11:15:07 88

原创 pythoncomplete.vim

where is vimvim7.3中自带里自动补全插件pythoncomplete.vim或者可以在这里下,放在~/.vim/autoload/下。在vimrc中添加autocmd FileType python set omnifunc=pythoncomplete#Complete...

2012-09-28 10:34:35 244

原创 shell 判断文件,目录,存在,权限

myPath="/var/log/httpd/" myFile="/var /log/httpd/access.log" #这里的-x 参数判断$myPath是否存在并且是否具有可执行权限 if [ ! -x "$myPath"]; then mkdir "$myPath" fi #这里的-d 参数判断$myPath是否存在 if [ ! -d "$myPath"]; then mkdir "$m.

2012-09-28 10:11:22 111

原创 linux 截取文件中连续某几行

sed -n ’5,10p’ /etc/passwd

2012-09-27 16:36:53 296

原创 python 易混地带

每门编程语言都有易混淆的部分,下面列举出一些Python的易混淆知识点。== 和 is 的区别 在Python中,"==" 操作符测试值的相等性; "is"表达式测试对象的一致性,即是否指向同一个对象。list1 = [1,('a',3)]list2 = [1,('a',3)]list1 == list2, list1 is list2   #(True,False)说明...

2012-09-25 12:59:10 121

原创 Python 内置对象及模块

Python作为一种高效的脚本语言,内置了很多实用的函数,同时也提供了丰富的工具模块。 下面是总结的几种内置对象及函数的应用技巧。 1、强大的列表解析功能对列表元素的简单操作:例如将列表的每个元素乘以2list1 = [1,2,3,4]list1 = [x*2 for x in list1]       #[2,4,6,8]对文件的操作:例如只收集文件中以'p'开头的行...

2012-09-25 12:58:15 146

原创 python 特点

1、Python以模块文件的方式组织代码。 Python每个模块为一个对象,引用模块里对象的属性时首先要导入模块(例如 import Module1,Module1.attr) 2、Python的列表(类似于数组)支持列表解析 列表解析的功能非常强大,也很常用。如 表达式: list1 = [x+2 for x in [1,2,3]]文件操作: lines = [line.rst...

2012-09-25 12:56:27 121

原创 VI下删除文本中的^M

:% s/\r//g

2012-09-24 16:45:48 90

原创 好的网站

1. http://www.cnblogs.com/luchen927/archive/2012/01/16/2323448.html2. 

2012-09-20 22:17:39 122

原创 alias

 alias l="ls"alias ll="ls -l"alias la="ls -a"~/.bashrc 

2012-09-20 15:18:44 99

原创 C++内联函数(Inline)介绍

  介绍内联函数之前,有必要介绍一下预处理宏。内联函数的功能和预处理宏的功能相似。相信大家都用过预处理宏,我们会经常定义一些宏,如#define TABLE_COMP(x) ((x)>0?(x):0)  就定义了一个宏。  为什么要使用宏呢?因为函数的调用必须要将程序执行的顺序转移到函数所存放在内存中的某个地址,将函数的程序内容执行完后,再返回到转去执行该函...

2012-09-20 09:44:17 102

原创 虚函数

A * a = new B(); //父类引用指向子类对象a->foo(); // 在这里,a虽然是指向A的指针,但是被调用的函数(foo)却是B的!虚函数虚就虚在所谓“推迟联编”或者“动态联编”上,一个类函数的调用并不是在编译时刻被确定的,而是在运行时刻被确定的。由于编写代码的时候并不能确定被调用的是基类的函数还是哪个派生类的函数,所以被成为“虚”函数。纯虚函数...

2012-09-20 09:34:24 65

原创 JDK配置

JAVA_HOME  C:\Program Files\Java\j2sdk1.5.0 (JDK的安装路径)PATH  %JAVA_HOME%\bin;%JAVA_HOME%\jre\binCLASSPATH  .;%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar

2012-09-19 14:13:47 65

原创 E: 安装源配置文件“/etc/apt/sources.list”第 58 行有错误(发行版解析) E: 无法读取源列表。...

E: 安装源配置文件“/etc/apt/sources.list”第 58 行有错误(发行版解析)E: 无法读取源列表。 原因:sudo add-apt-repository "deb http://archive.canonical.com/ lucid partner"红色 lsb_release –a 查看codename 注意红色前后有空格,否则会导致上述错误 ...

2012-09-12 20:56:09 3642 3

原创 学会shell(二)

cat sample.js | tr -d '\n\t' | tr -s ' '| sed 's:/\*.*\*/::g'while read line;doecho $line;done < file.txtcat file.txt | (while read line ; do echo $line ; done)(for w in $line;do echo $...

2012-09-12 16:59:34 105

原创 豆瓣:流行的秘密

看《豆瓣:流行的秘密》 传统认为传播是一级的,即公众媒介到公众那菲尔德提出的两级认为:公众媒介到舆论领袖到公众,而舆论领袖则是创新扩散曲线起飞的关键人。  “记着,‘希望’是件好东西,‘没准儿’时间最好的东西,而且从没有一样好东西会消逝!”  ---《肖申克的救赎》 创新扩散人群分类:创新者(Innovators)早期采用者(Early Adopters)...

2012-09-11 19:46:16 90

原创 为什么聚类不成功

现在终于知道以前的tag 聚类为什么不成功。具体是要对利用用户标注的tag对电影进行聚类。1.  没有考虑没中算法的适用范围,当时就抱着那个能出结果就用哪个,就过聚类的结果极不平衡。我们首先要把item表示成tag上的一个向量分布,有就为1没有则为0,布尔性数据。直接采用K-means,错误的选择,K-means极不适合非数值型属性。2.  没有考虑数据量大小,之知道数据很大,像DBS...

2012-09-11 17:40:02 1510

原创 学会用shell

以前要提取文件中某一些列的内容,用Java写,定义类,BufferedReader  split 或者StringToniker用shell呢?可能只是一行的命令。比如cut   :  cut  -f m,n  -d ";"awk  :    awk '{print $m,$n....}'awk特殊变量:NR:行数NF:每一行字段数$0  $1  $2 ......

2012-09-11 17:21:41 60

原创 Linux shell 常用

查找符合正则表达式的单词egrep -o "\b[[:alpha:]]+\b" m12.txt合并文件:cat * > m.txtuniqsortsed  stream editorecho this THis this | sed 's:this:THIS:g'(global)echo this THis this | sed 's:this:THIS:g'se...

2012-09-11 17:15:02 83

原创 命名类、属性和方法

 类名通常由大写字母打头。这是标准惯例,可以帮助你识别类,特别是在实例化过程中(有时看起来像函数调用)。还有,数据属性(译者注:变量或常量)听起来应当是数据值的名字,方法名应当指出对应对象或值的行为。另一种表达方式是:数据值应该使用名词作为名字,方法使用谓词(动词加对象)。数据项是操作的对象、方法应当表明程序员 想要在对象进行什么操作。在上面我们定义的类中,遵循了这样的方针,数据值像“name...

2012-09-10 16:50:50 173

原创 import 语句的模块顺序

 我们推荐所有的模块在 Python 模块的开头部分导入。 而且最好按照这样的顺序:     Python 标准库模块     Python 第三方模块     应用程序自定义模块 然后使用一个空行分割这三类模块的导入语句。 这将确保模块使用固定的习惯导入, 有助于减少每个模块需要的 import 语句数目。如果在一个模块的顶层导入, 那么它的作用域就是全局的; 如果...

2012-09-10 16:08:11 398

原创 c++ 学习(一)

1. 避免使用char* 多用string2. cout<<(void *) 打印其地址3. pair 函数需要两个返回值 需要成对元素4. stream buffer5. 多用位运算 

2012-09-09 23:39:43 70

原创 Java abstract class interface 区别

1.abstract class 表示的是一种继承关系,并且只能是单继承。但是,一个类却可以实现多个interface。2.abstract class 中可以有自己的数据成员,也可以有非abstarct的成员方法,而在interface中,只能有静态的不能被修改的数据成员(static final,不过在 interface中一般不定义数据成员),所有的成员方法都是abstract的。3.a...

2012-09-09 23:35:33 95

原创 Linux Shell 之个人觉得最难学shell command

是难学同时也是最重要的findxargsgrepawksedtr

2012-09-09 10:42:41 245

原创 Linux shell 牛刀小试之注意事项

1. 赋值操作符之间不能有空格,否则变成比较2. if while 条件比较语句,【】之间要有空格,且字符串比较时用双中括号3. test 条件检测 避免过多中括号  if  test  $vat -lt 5;4. cmd    echo $?5. 子shell (cd/bin ; ls)不会改变父shell进程    cmd=$( ) cmd = ` `6. IFS   sp...

2012-09-08 16:05:14 80

Hadoop 任务流程

简单的来说分为四个阶段:InputFormat/MapTask/Shuffle/ReduceTaskInputFormat:   输入文件 --> 转化 --> <K, V>MapTask :       <K, V>  --> map处理 --> <K', V'>Shuffle :         <K', V'> --&g...

2012-09-07 16:18:12 100

原创 python 文件操作

python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()返回指定目录下的所有文件和目录名:os.listdir()函数用来删除一个文件:os.remove()删除多个目录:os.removedirs(r“c:\python”)检验给出的路径是否是一个文件...

2012-09-07 11:07:52 128

原创 Ubuntu:unable to boot - please use a kernel appropriate for your cpu

This kernel requires the following features not present on the CPU:Unable to boot – please use a kernel appropriate for your CPU.步骤:对应虚拟系统——设置——系统——处理器——扩展特性 ------启用 PAE/NX关于 PAE/NXPAE 是让 CPU 支...

2012-09-06 22:41:00 622

原创 聚类综述

无监督学习:不需要事先根据训练数据去train聚类器,也可以称作不带类标记的(目标输出)的机器学习。cost function:即最小化所有数据与其聚类中心的欧氏距离和。 假设出现这种情况,怎么理解??一定是代码错误或者其他错误,不可能出现这种情况!回归问题中有可能因为学习率设置过大产生随着迭代次数增加,cost function反倒增大的情况。但聚类是丌会产生这样的问题...

2012-09-06 11:41:11 141

原创 Python 函数参数

1. 函数参数2. 函数引用3. * Tuple 非关键字参数 4. 缺省参数 5. ** Dict 关键字参数别表 注意:位置参数 缺省参数 非关键字参数 关键字参数

2012-09-05 11:25:28 64

原创 Python 标准文件

Python中, 只要程序一执行, 便可以访问三个标准文件:标准输入(一般是键盘), 标准输出(到显示器的缓冲输出)和标准错误(到屏幕的非缓冲输出). (这里所说的"缓冲"和"非缓冲"是指 open() 函数的第三个参数.) 这些文件沿用的是 C 语言中的命名, 分别为 stdin , stdout 和 stderr . 我们说"只要你的程序一执行就可以访问这三个标准文件", 意思是这些文件已经被...

2012-09-01 23:05:30 227

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除