自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

shangwen_的专栏

计算机相关技术,Java,Python,Hadoop

  • 博客(46)
  • 资源 (5)
  • 收藏
  • 关注

原创 新博客

点击这里

2015-04-22 21:00:23 764

原创 基于GraphX实现的community detection算法--Label Propagation分析

最近Label Propagation(LPA)算法

2014-09-06 14:24:39 11372 1

原创 用图的存储结构实现ItemCF

其实,网上有很多基于物品的xie

2014-08-31 01:37:07 1568

原创 浅谈GraphX

最近在学Spark的Graphx,希望

2014-08-18 22:53:43 5728

原创 Spark的Graphx学习笔记--Pregel

hi

2014-08-11 21:27:17 11853 6

转载 sublime text 2 快捷键

sublime text 2 快捷键本文内容来自于互联网Ctrl+W 关闭当前页签,很通用。Ctrl+Shift+W关闭所有页签,估计能猜到。Ctrl+Shift+v 粘贴并且格式化,比较实用。Ctrl+[ 减少缩进Ctrl+] 增加缩进Ctrl+k,Ctrl+u 先按Ctrl+K,再按Ctrl+U,大

2014-03-15 14:48:04 1009

转载 Linux对比文件,很好用的图形界面

1. Without GUI1.1 diffdiff可以比较2个文件夹语法:diff [选项] file1 file2说明:该命令告诉用户,为了使两个文件file1和file2一致,需要修改它们的哪些行。如果用“- ”表示file1或fiie2,则表示标准输入。如果file1或file2是目录,那么diff将使用该目录中的同名文件进行比较。例如: diff

2014-03-14 17:08:31 6066

原创 windows去掉休眠功能

如果你不是经常需要休眠电脑,把休眠功能去掉能去掉几G的C盘空间,至于休眠和睡眠有什么不一样呢?自己Google吧开始:管理员权限运行CMD输入 powercfg -h off 按下enter在重启或者直接去看C盘就可以看出效果,我的清空了4G的容量如果想恢复吧off 替换成on就可以了!

2013-11-30 19:33:37 1171

原创 虚拟机类加载机制

本篇文章讲述虚拟机如何加载Class文件和Class文件中的信息进入到虚拟机后会发生什么变化1.类加载的时机类被加载到虚拟机的内存中,他的整个生命周期包含了:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(Unloading)七个阶段,其中验证、准备和解

2013-10-23 02:16:00 930

原创 计算机网络基础知识

TCP和UDP有什么区别?TCP是传输控制协议,提供的是面向链接、可靠的字节流服务,当客户和服务器交换数据之前,必须先在双方建立一个TCP的链接,之后才能传输数据,TCP提供超时重传机制,丢失重复数据、检验数据、流量控制等功能,保证数据能从另一端传到另一端。UDP是用户数据报协议,是一个简单的面向数据报的运输协议,UDP不提共可靠性,他只是吧应用层传给他的数据传给IP层发送出去,由于在传送

2013-10-19 01:57:02 1211

原创 ubuntu下关闭独立显卡

tang@ubuntu:~$ sudo su[sudo] password for tang: 可以先查看显卡的状态root@ubuntu:/home/tang# cat /sys/kernel/debug/vgaswitcheroo/switch 0:IGD:+:Pwr:0000:00:02.01:DIS: :Pwr:0000:01:00.0root@ubun

2013-10-17 15:26:58 2261

原创 JVM垃圾收集器和内存分配侧策略

垃圾收集器和内存分配侧策略很多人会有疑问,为什么垃圾收集的机制已经实现了自动化,我们还需要去了解GC和内存分配的么?回答的答案就是:当需要排查各种内存溢出、内存泄漏问题的时候,当垃圾收集成为系统达到更能高并发量的瓶颈的时候,我们就需要对这些所谓的自动化进行调节。如何判断对象已死?由于堆里面放着Java对象的实例,在垃圾收集器对堆进行回收之前,首先就要确定这些对象还有哪些

2013-10-17 14:38:40 1020

原创 hadoop学习笔记-HDFS原理

文章内容摘自书籍,互联网和个人的理解。HDFS原理hadoop提供了可靠的共享存储和分析的系统,HDFS实现存储,MapReduce实现分析处理,这两部分是hadoop的核心,由于HDFS是为了高数据吞吐量而优化的,是以高时间延迟为代价,所以要求低延迟的数据访问应用不适合在HDFS上运行。概念:HDFS和操作系统一样,也是按块来存储的,但块会比操作系统的的大的多,默

2013-10-17 01:22:54 3066

原创 给定一个整数N,那么N的阶乘N!末尾有多少个零呢?

题目:给定一个整数N,那么N的阶乘N!末尾有多少个零呢?末尾有几个零?如果我们从哪些数相乘可以的出10,这个角度来解决这个问题,这就会变成简单。对质因数进行分解由于10=2*5,即每一对2和5就可以产生一个10,如果我们求出N!中,2和5的分别的次方数,假设为X,Z,取决于两个数中最小的那个数,于是有公式,M=min(X,Z),M为零的个数,由于在阶乘中,2出现的概率比5的高,所以公式

2013-10-03 21:57:19 2529

原创 给定两个正整数A和B,把A变成B需要几位?也就是说A和B之间的位数有多少个是不同的?

给定两个正整数A和B,把A变成B需要几位?也就是说A和B之间的位数有多少个是不同的?本文的解决思路来自于互联网和一些自己的理解:编程语言为:Java首先求出两个数有多少个位数是相同的,即求出A和B的交集其次,求出A和B一共在占了几位在同一个数中,即求出A和B的或运算再次,对上面的结果进行异或,原理就是在A和B一共所占的位数(或运算)减去相同的(交运算)然后在对得出的

2013-10-03 17:21:34 2247 2

原创 求二进制中1的个数

题目:求二进制中1的个数实现这个题目的方式有很多,求余的那种方法不在这里描述方法一:对value中的数和00000001相与,当最低位为1时,相与为1,因此num+=1,最低位为0时,num+=0, 然后每次右移一位,重复进行操作,直至整个value为0时跳出循环,返回计数值缺点:程序主要是计算二进制中一的个数,这个程序把零的操作也计算进去了publ

2013-10-03 16:23:03 1248

转载 Ubuntu下中文输入法

Ubuntu下安装google拼音输入法 安装方法如下:sudo apt-get install git-coregit clone git://github.com/tchaikov/scim-googlepinyin.git    //下载google拼音cd scim-googlepinyinsudo apt-get ins

2013-03-23 22:05:31 1017

原创 解决Ubuntu的PDF文档中文无法显示的问题

Ubuntu中的pdf的文档中文显示不全,可以尝试一下命令在终端的模式下输入命令:sudo apt-get install xpdf-chinese-simplifiedsudo apt-get install xpdf-chinese-traditional然后重新打开PDF即可

2013-03-05 00:09:49 1090

转载 Eclipse快捷键大全(转载)

Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对

2013-02-27 20:58:00 678

转载 Ubuntu解压方法

Ubuntu下解压文件的方法本文来自于互联网ubuntu 下rar解压工具安装方法:压缩功能安装 sudo apt-get install rar卸载 sudo apt-get remove rar解压功能安装 sudo apt-get install unrar卸载 sudo apt-get remove unrarubuntu

2013-02-25 15:38:04 955

转载 深入Java集合学习系列:HashMap的实现原理

1.    HashMap概述:   HashMap是基于哈希表的Map接口的非同步实现。此实现提供所有可选的映射操作,并允许使用null值和null键。此类不保证映射的顺序,特别是它不保证该顺序恒久不变。 2.    HashMap的数据结构:   在java编程语言中,最基本的结构就是两种,一个是数组,另外一个是模拟指针(引用),所有的数据结构都可以用这

2013-01-19 20:14:56 958

转载 Linux下安装maven

Linux下安装maven1.首先到Maven官网下载安装文件,目前最新版本为3.0.3,下载文件为apache-maven-3.0.3-bin.tar.gz,下载可以使用wget命令;2.进入下载文件夹,找到下载的文件,运行如下命令解压tar -xvf  apache-maven-2.2.1-bin.tar.gz解压后的文件夹名为apache-maven-3.0.

2013-01-05 22:30:48 713

原创 HTML5 的Drawing Path

理解绘制路径 Drawing Path上 一篇文章中说过,我们绘制的图形是先绘制到一个抽象的上下文对象中(其实就是内存中),然后再将上下文对象输出到显示设备上,这个输出到显示设备的过程不 需要我们操心。但是有时候我们并不想立刻输出每一次绘制动作,也许我想让一组绘制动作完成以后,再集中一块输出, 比如一个围棋棋盘有19×19条直线组成,正常情况下需要向想显示设备输出19×19次,但是如果我们先暂

2012-11-27 00:35:18 830

转载 优化Linux的内核参数来提高服务器并发处理能力

在服务器硬件资源额定有限的情况下,最大的压榨服务器的性能,提高服务器的并发处理能力,是很多运维技术人员思考的问题。要提高Linux系统下的负载能力,可以使用Nginx等原生并发处理能力就很强的Web服务器,如果使用Apache的可以启用其Worker模式,来提高其并发处理能力。除此之外,在考虑节省成本的情况下,可以修改Linux的内核相关TCP参数,来最大的提高服务器性能。当然,最基础的提高负载问

2012-11-04 21:29:40 691

转载 MySQL索引详解

索引是快速搜索的关键。MySQL索引的建立对于MySQL的高效运行是很重要的。下面介绍几种常见的MySQL索引类型。在数据库表中,对字段建立索引可以大大提高查询速度。假如我们创建了一个 mytable表:CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL ); 我们随机向里面插入了10000条记录

2012-09-17 19:15:44 984

转载 Linux/ubuntu目录解释

/bin:bin是binary(二进制)的缩写。这个目录是对UNIX系统习惯的沿袭,存放着使用者最经常使用的命令。例如:cp,ls,cat。/boot:这里存放的是启动LINUX时使用的一些核心文件。/dev:dev是device(设备)的缩写。这个目录下是所有LINUX的外部设备,其功能类似DOS下的.sys和Win下的.vxd。在LINUX中设备和文件是用同种方法访问的。例如:

2012-09-02 15:22:04 1097 1

转载 wget 使用技巧

wget 是一个命令行的下载工具。对于我们这些 Linux 用户来说,几乎每天都在使用它。下面为大家介绍几个有用的 wget 小技巧,可以让你更加高效而灵活的使用 wget。$ wget -r -np -nd http://example.com/packages/这条命令可以下载 http://example.com 网站上 packages 目录中的所有文件。其中,-np 的作

2012-09-02 15:09:49 701

原创 修改environment导致重启不能登录的问题解决

按ALT+CTRL+F1或者其他控制台,输入/usr/bin/sudo /usr/bin/vi /etc/environment 按dd删掉你想要的就可以了

2012-08-27 11:25:54 831

转载 linux配置java环境变量

在网上找了很久,终于成功了,本文来自博客园linux配置java环境变量(详细) 一. 解压安装jdk 在shell终端下进入jdk-6u14-linux-i586.bin文件所在目录, 执行命令 ./jdk-6u14-linux-i586.bin 这时会出现一段协议,连继敲回车,当询问是否同意的时候,输入yes,回车。之后会在当前目录下生成一个jdk1.6.0_14目录,你可

2012-08-26 22:25:37 8267

原创 MySQL 全文搜索笔记

理解全文本检索     MySQL支持的几种基本数据库引擎,并非所有的引擎都支持本书多描述的全文本搜索,最常用的MyISAM和InnoDB,只有前者支持。LIKE表达式和正则表达式,虽然这些搜索机制非常有用,但存在几个重要的限制。1、性能——通配符和正则表达式匹配通常要求MySQL尝试匹配表的所有行(这些搜索极少用到表的索引),因此,被搜索引行数不断增加,这些搜索可

2012-08-26 17:15:48 803

原创 Java 数组

数组与其他容器之间的区别有三个方面:效率、类型、和保存基本类型的能力。Java中,数组是一种效率最高的储存和随机访问对象引用序列的方式。缺点:数组对象大小被固定,在其生命周期不可改变,而使用ArrayList动态分配,这种弹性需要开销,效率会比较低。数组的标志符其实只是个引用,指向在堆中创建的一个真实对象,这个数组的对象以保存指向其他对象的引用。对象

2012-08-01 22:27:20 1018

转载 Java 移位运算符

移位运算符就是在二进制的基础上对数字进行平移。按照平移的方向和填充数字的规则分为三种:>(带符号右移)和>>>(无符号右移)。   在移位运算时,byte、short和char类型移位后的结果会变成int类型,对于byte、short、char和int进行移位时,规定实际移动的次数是移动次数和32的余数,也就是移位33次和移位1次得到的结果相同。移动long型的数值时,规定实际移动的次数是移动

2012-07-28 15:25:12 739

原创 Java内存管理的小技巧

1.尽量使用直接量    当需要使用字符串,还有Byte,Short,Long,Float,Double,Boolean,Character包装类的实例时,程序不应该采用New的方式来创建对象,而应该直接采用直接量来创建它们,程序需要“hello”字符串时,应该采用String str=“hello”;如果以上述方式创建字符串,JVM的字符串缓存池会缓存这个字符串。而用String str=n

2012-07-14 19:46:35 695

转载 UBUNTU命令

本文来自互联网查看软件xxx安装内容dpkg -L xxx查找软件库中的软件apt-cache search 正则表达式查找软件库中的软件aptitude search 软件包查找文件属于哪个包dpkg -S filename查找文件属于哪个包apt-file search filename查询软件xxx依赖哪些包apt-cache depe

2012-03-02 16:40:11 828

转载 cmd命令大全

本文来自ITEYE命令简介cmd是command的缩写.即命令行 。  虽然随着计算机产业的发展,Windows 操作系统的应用越来越广泛,DOS 面临着被淘汰的命运,但是因为它运行安全、稳定,有的用户还在使用,所以一般Windows 的各种版本都与其兼容,用户可以在Windows 系统下运行DOS,中文版Windows XP 中的命令提示符进一步提高了与D

2011-12-08 17:35:21 967

转载 在同一台机器上运行多个MySQL服务器

在一些情况下,你可能想要在同一台机器上运行多个mysqld服务器。你可能想要测试一个新的MySQL发布,同时不影响现有产品的设置。或者,你可能想使不同的用户访问来访问不同的mysqld服务器以便他们自己来管理。(例如,你可能是一个Internet服务提供商,希望为不同的客户来提供独立的MySQL安装)。要想在一个单独的机器上运行多个服务器,每个服务器必须有唯一的各运行参数值。这些值可以在命

2011-12-08 17:09:18 2213

转载 [科普文] 关于浏览器内核的一些小知识,明明白白选浏览器!

一、浏览器内核 (排版引擎/渲染引擎)首先解释一下浏览器内核是什么东西。英文叫做:Rendering Engine,中文翻译很多,排版引擎、解释引擎、渲染引擎,现在流行称为浏览器内核,至于为什么流行这么称呼,请自行领悟。Rendering Engine,顾名思义,就是用来渲染网页内容的,将网页的代码转换为最终你看得见的页面。因为是排版,所以肯定会排版错位等问题。为什么会排版错位呢?有的是由

2011-12-04 15:52:23 1190

原创 怎样选择合适的字符集

我们建议在能够完全满足应用的前提下,尽量使用小的字符集。因为更小的字符集意味着能够节省空间、减少网络传输字节数,同时由于存储空间的较小间接的提高了系统的性能。有很多字符集可以保存汉字,比如utf8、gb2312、gbk、latin1 等等,但是常用的是gb2312 和gbk。因为gb2312 字库比gbk 字库小,有些偏僻字(例如:洺)不能保存,因此在选择字符集的时候一定要权衡

2011-11-29 23:14:54 1053

原创 关于数据库

1.什么是数据库数据库软件应称为DBMS(数据库管理系统),数据库是通过DBMS创建和操纵的容器,数据库可以是保存在硬件设备上的文件,但也可以不是,因为你并不直接访问数据库,你使用的是DBMS,他替你访问数据库。2.表表是某种特定特定类型数据的结构化清单。储存在表中的数据是一种类型的数据或者一个清单,绝不应该把顾客的清单与订单存储在同一个数据库表中,这样将会使以后的检索和访问很

2011-11-26 01:11:21 872

转载 abstract class和interface

abstract class和interface是Java语言中对于抽象类定义进行支持的两种机制,正是由于这两种机制的存在,才赋予了Java强大的面向对象能力。abstract class和interface之间在对于抽象类定义的支持方面具有很大的相似性,甚至可以相互替换,因此很多开发者在进行抽象类定义时对于abstract class和interface的选择显得比较随意。其实,两者之间还是有很

2011-11-20 22:44:58 660

Java-NIO.pdf

Java NIO详细解析,是深入Java必不可少的工具

2012-08-02

servlet.jar

javax.servlet servlet开发必不可少的Jar包

2012-07-26

SVN使用教程

SVN使用教程SVN使用教程SVN使用教程

2011-12-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除