自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 收藏
  • 关注

突然发现的HDFS与GFS在实现上的一些不同

GFS:Google File System HDFS:Hadoop Distribute File System 首先,有一点要确认的是,作为GFS的一个最重要的实现,HDFS设计目标和GFS是高度一致的。在架构、块大小、元数据等的实现上,HDFS与GFS大致一致。但是,在某些地方,HDFS与GFS又有些不同。如:  1、 快照(Snapshot): GFS...

2012-05-13 21:41:37 430

日记 or 小小说 :想进腾讯的师弟师妹们,别学我 (四)

请原谅我用这样的标题将你们的注意力引来,其实这只是因为我想不到更好的标题了。 突然想起来文章可能会涉及到个人隐私(虽然我一直宣称是小说,文中人物是虚构的,但骗自己有意思么?),再加上最近发生的某些事,这个主题就不打算继续下去了。 虽然可能是我理解问题,也可能是我太过于敏感,甚至是我个人的异想天开,反正我是没心情没动力写下去了。难道我会当众说是我才华有限没有灵感写不下去的原因么?...

2012-05-02 08:24:36 166

原创 日记 or 小小说 :想进腾讯的师弟师妹们,别学我 (三)

建议您先看:日记 or 小小说 :想进腾讯的师弟师妹们,别学我 (一)(二)~~~~~~~~~~~~~~~~~~~~~我是分割符号~~~~~~~~~ 每一个值得被历史铭记的时刻总是会出现一些不能用科学来解释的现象的,比如,刘邦起义时杀了一条白龙,比如,孔子出生时死了一条麒麟,又比如,我在一面的时候,天上竟然出现了一个圆圆的、发着刺眼亮光的东西,直到傍晚才慢慢消失... 不...

2012-04-26 20:03:42 169

日记 or 小小说 :想进腾讯的师弟师妹们,别学我 (二)

建议您先看:日记 or 小小说 :想进腾讯的师弟师妹们,别学我 (一)~~~~~~~~~~~~~~~~~~~~~我是分割符号~~~~~~~~~   请先允许我介绍下下文可能出现的配角(注意,可能而已,配角就要有配角的觉悟!!) 小峰子:猥琐四眼文艺男,此人来自中国著名的犯罪之乡,却有着一颗出污泥而不染的心。平常关注过我并且仔细研读过我文章的同学可能知道,此人有一个特殊...

2012-04-25 21:28:29 135

原创 日记 or 小小说 :想进腾讯的师弟师妹们,别学我 (一)

      应该说,这一次的武汉之旅是一个临时而仓促的决定。      大约在十天之前,我混在一个约50人的团队中参加了腾讯在武汉举行的实习生笔试。那次,虽然我们一行人都极力克制自己(比如,我们游玩黄鹤楼都没买门票..),但是,我们仍然为武汉市的GDP的发展提供了一个强有力的增长点,使得武汉市更加接近“国际大都市”这个称谓了,从这一点讲,我们对不起长沙..      从武汉回来之后就是等待。我发现...

2012-04-25 20:53:53 142

各位师兄妹,来刷腾讯了,好多经验...

  在经历了多次打击(其中金山那次尤为严重),蛰伏闭关一个月后,我们再次踏上了征程,组团去刷超级大BOSS----腾讯实习生招聘。       这次去武汉的团队规模较之上次更为庞大,DPS+Tank+奶妈,近50人了。而且,一个让队伍中别的寂寞男生异常兴奋的消息是,这次队伍中女孩子的比例非常大哦...       首先鄙视下分组,极端鄙视,原因就不说了。PS:某某某,我都这样了...

2012-04-16 13:30:48 304

原创 浅谈云计算中的平台无关性

云计算,这个词汇越来越成为IT企业的一种趋势,甚至于可能在未来的十年到二十年成为人们生活的一个重要组成部分。在2012年的博鳌亚洲论坛上,主持人这样形容:云计算将改变企业,社会,文化的关系,甚至于改变文明本身。  云计算,是一种集中管理服务资源的方式,这些资源包括计算能力、数据存取、软件服务等。峰子@风子柒认为未来的云计算会和另一个热门词汇“物联网”结合起来,理由很简单,物联网的实现背后...

2012-04-04 22:56:40 207

软件测试战略_测试那些事

 这几天看了一些关于软件工程里面软件测试方面的书籍,感觉蛮有收获,试与诸君共分享之。    软件测试,对我这个才进入软件领域两年不到的菜鸟来说是一个既熟悉又陌生的词汇。每个软件行业的人不可能没听说过软件测试,但是,我相信大多数和我一样的菜鸟都没有真正对自己写的软件程序做过系统的测试工作。 说到这里,有很多同学都不乐意了。我怎么没测试了?!!我都是写一段代码就run一下,保证一段...

2012-03-21 16:35:23 258

金山的两次笔试题目

都是2012金山在武昌招聘时的笔试题。都是考试完了自己回忆的,可能有误差 第一个是正式招聘的题目: 1:String、StringBuild、StringBuffer的区别 2:想让基类不被子类继承,用什么方法 3:Java为什么可以在不同平台上运行?(Java的跨平台性) 4:给定一个数组,求第二大数 5:用递归和非递归实现Fib(K,n)函数,Fi...

2012-03-14 11:15:39 212

大武汉游记——金山历练

大武汉组团刷副本升级归来啦!!!  真心不知道该用什么样的词汇来形容这次的武汉之旅。悲催?伤心?应该不是,算起来除了久等面试通知不至那天心情很是低落以外,自己一直是很意气风发的,毕竟武汉的四天之旅阳光普照,春风和煦,MM众多,一扫长沙连续一个多月的阴霾湿气。那么,胜利欢呼?哎,被人无视的感觉也不好受啊...  重拾那些天的记忆,应该被记住的事情其实蛮多的。 首先,...

2012-03-14 11:10:52 132

OpenCV——Mat、CvMat、IplImage类型浅析

OpenCV中常见的与图像操作有关的数据容器有Mat,cvMat和IplImage。 一、Mat类型:矩阵类型,Matrix。       在openCV中,Mat是一个多维的密集数据数组。可以用来处理向量和矩阵、图像、直方图等等常见的多维数据。       Mat有3个重要的方法:         1、Mat mat= imread(const String* fi...

2012-02-17 16:50:27 219

hadoop单机转伪分布笔记

<!-- @page { margin: 2cm } PRE.cjk { font-family: "文泉驿微米黑", monospace } P { margin-bottom: 0.21cm } --> 一、伪分布(Pseudo-Distributed)与分布式(Fully-Distribute...

2012-02-12 14:27:26 148

Linux相关__Linux目录配置标准FHS

    目录配置标准?虾米意思?         大多数Window用户对目录的概念就是C、D、E、F盘和树形目录,他们(也许是你们)对于文件目录管理有着个性的想法,甚至毫不关心。比如,读者们的JVM程序放在什么地方。相信答案会千奇百怪。        那么,这样的做法有什么问题没有?应该说是没什么大问题的。因为WIndow是单用户OS,也就是说它是“个人的”,...

2012-02-12 14:24:47 140

hadoop错误汇总

该文件记录学习hadoop过程中碰到的一系列问题(1)、hadoop测试中碰到的log4j:NULLAppender问题前面安装hadoop单机版,碰到一个问题,一直没解决,就是在用hadoop versione命令查询hadoop版本的时候,出现log4j:ERROR Could not find value for key log4j.appender.NullAppe...

2012-01-15 12:51:26 574

Search Engine_从网络爬虫到PageRank算法

今天开始研究搜索引擎——2011_12_12,不知道能坚持到什么时候??  要研究搜索引擎,我觉得必须要简单的了解如何获取网页和最简单的网页排名算法——PageRank算法。 一、Spider程序  蜘蛛、爬虫、机器人或者其它的别的名字,这些东西是搜索引擎的基础。这些程序会在网络上巡逻,在网络中的各个网页中穿梭,将收集到的网页内容(文本、链接等等)存储到数据库中,作为搜索引...

2011-12-13 20:41:09 541

《JavaScript Bible》_创建新窗口和对话框

这篇日志都是一些JavaScript的基础,熟悉JavaScript的请出门左转。  一、创建新窗口 创建新窗口的应用一般在:创建一个新的窗口显示网页。其格式是:window.open(URL,TargetName, sizeInfo);  例子: <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transition...

2011-11-30 22:26:17 149

《Google三大论文》_The Google File System

关于预期和实现: 在Google的面向大规模的数据密集型的分布式运用中,GFS都是关键和基础。同时,开源的hadoop File System 与GFS也是很相似的。  与传统的文件系统相比,GFS在设计上有以下几种特点:  一、组件失效被认为是常态,而不是意外 这很好理解,Google 的应用动辄数百甚至数千台机器,访问量又是巨大的。在系统集群工作期的任何时间点都有可能...

2011-11-29 23:53:43 213

《Google 三大论文》_MapReduce

MapReduce是Google三大论文中与应用方面最接近的一层,应该说,也是我们在学习和应用分布式系统基础架构(如hadoop)时唯一关心的。 简单点说,MapReduce是一种编程模型,在处理和生成TB级数据时非常有用:通过简单的接口来实现自动的并行化合大规模的分布式运算,并且不用考虑容错、负载均衡等等繁琐而麻烦的细节。 MapReduce借用了函数式编程的概念,它的实现的思...

2011-11-29 20:40:48 556

《JavaScript Bible》_基于W3C的基本对象模型

在学习了Java、C++这类面向对象编程语言之后,学习JavaScript的朋友可能会有一个很让人费解的疑问:我怎么可以用到一些我明明没有创建的对象?  的确,在正式转向(也有人是第一次学习“语言”)JavaScript之前,应该对编程的对象有一个初步的了解。 首先有一点需要知道,在不远的以前,由于浏览器品牌与版本之间的相互不兼容,浏览器中定义的文档对象模型(DOM)是有很大的差...

2011-11-25 23:57:30 125

《Thinking in Java》_类型信息与反射机制

首先介绍一个本文后面会频繁提到的概念:RTTI(Runtime Type Information,或者,Run-Time Type Identification),运行时类型信息。简单来说,就是指程序能够在运行时发现和使用类型信息。       RTTI能做什么??它解放了程序在编期间执行的面向类型的操作,不管是程序的安全性还是可扩展性和可维护性,都得到了大大的加强。  ...

2011-11-01 21:15:02 157

11-10-09 一个小例子带来的思考

今天上课,老师出了一个据说是面试题目的东东:编写一个虚数类(a+bi),并提供相加和相减的方法。 题目一出来,众皆不屑,这是什么题目,顺手拈来。 public class imaginaryNumber{ private int a ; //实数部分 private int b ; //虚数部分  public imaginaryNu...

2011-10-09 21:35:51 105

《深入Java虚拟机》_类型的生命周期_Version2

LastUpdataTime:11.11.14  首先,要弄清楚的是,本文记录的是“类型”的生命周期,而非“对象”的生存周期方面的笔记。当然,对象的生存周期实际上属于类型的生命周期问题的一部分。  何为类型的生命周期?简单的讲,就是Java类型(类或接口)进入JVM开始到最终退出。从大体上讲,可以分为三个部分:开始阶段的装载、连接、初始化,占绝大多数时间的对象实例化、对象的...

2011-09-19 21:34:32 113

《TCP/IP详解》_卷一_主机对接收帧的过滤

前面写了一些关于广播和多播的笔记,这里加上一点主机在信道的帧过滤过程简介,可能会对理解产生帮助。 帧过滤过程有一个很大的特点,就是:它和帧信息解析一样,都有分层的概念。 过程简单的介绍下:1、首先是链路层。链路层分为2大块。a)接口卡(网卡),它会检测帧中的地址:通常,只有地址为本地网卡地址或者广播地址的数据才会被接收。当然,现在市面上的多数网卡也支持地址为多播地址或者子网...

2011-09-01 22:19:55 268

《TCP/IP详解》_卷一_广播和多播

在前面学习IP地址的概念的时候,我们会了解到IP地址分为三类:单播地址、广播地址和多播地址。单播地址我们实际上接触的非常多,这里就记录一些广播和多播的学习笔记。 在普通的以太网单播通信时,每个以太网帧包括了目的主机和源主机的地址,并发给单个的目的主机。这样的二个主机之间的通信不会干扰同一个网络中的其他主机(当然,也有一些特殊情况,比如通道争夺,即抢网速)。 然而,我们有时确实需要向...

2011-09-01 20:21:56 96

《TCP/IP详解》_卷一_ARP和RARP协议

首先,我们要弄明白一个概念:网络实现当中的地址。 在网络中,只要提到地址,我们会马上想到IP地址。实际上,数据在以太网上传输的时候,并不是直接根据IP地址确定目的接口的,而是根据一个叫做以太网地址的东西确定 的。 设备驱动程序从不检查IP数据报中的目的IP地址!! 和IP地址类似,以太网地址是一个48bit的序列号。每个生产厂商在生产网络硬件接口的时候,都会为它配...

2011-08-31 20:44:05 133

Web_数据库与SQL

数据库,对每一个对计算机有兴趣的人来说,都是学习或应用练习的重中之重。记得在刚进大学那会,导师就强调..、...、...、数据库、...、...等七门课是要重点研究的。果真,大一的时候就开了好几门数据库的前导课程,由此可见数据库的重要性。  那么,什么数据库呢??  以下是wiki的解释:数据库是以一定组织方式储存在一起的,能为多个用户共享的,具...

2011-08-11 22:46:27 228

《TCP/IP详解》_卷一_IP与路由的选择

毫无疑问,IP是整个TCP/IP体系中最为重要的,也是最核心的协议。在体系中,IP直接连接硬件接口,对上,所有的TCP、UDP、ICMP、IGMP数据都以IP数据报格式传输。 IP的传输有两大特征:不可靠和无连接。不可靠性意味着它不能保证IP数据报一定会成功的达到目的地,只负责传输,而不保证什么。记住,任何可靠性的保证都要由上层服务来提供,如TCP。无连接这个术语的意思是IP并不维护任何关...

2011-08-05 21:58:25 192

《TCP/IP详解》_卷一_链路层及其协议简述

链路层,有时也被称为数据链路层或网络接口层。它是TCP/IP协议族中四个分层中的最底层,通常包括操作系统中的设备驱动程序和计算机中对应的网络接口卡。 功能和作用:为上层模块发送和接受数据,如:IP数据报,ARP应答,和RARP应答,其中最重要的是IP数据报。从总体上来看,链路层帮我们屏蔽了所有关于电缆(或其他任何传输媒介)的物理接口细节。因此,我们在传输数据的时候可以忽略网络使用的硬件:是...

2011-07-28 20:53:46 236

《TCP/IP详解》_卷一_TCP连接的正常建立与关闭

TCP是一个面向连接的协议。这就意味着,通信双方之间有一个虚拟的,看不见的管道将之连起来,数据可以在管道中双向的同时传递。 TCP连接的建立与UDP不同,后者无需任何的预先的握手。 TCP的连接分为三步:1、请求端(客户端)发送一个SYN段(在前一篇日志中输了,SYN是用来发起一个连接的)指明客户打算连接的服务器的端口,以及初始序号ISN.ISN是客户端选择的,它随时间而变化,...

2011-07-26 21:23:18 117

《TCP/IP详解》_卷一_TCP简介和报文段结构简介

此乃《TCP/IP详解》这本书的第一篇笔记。 关于概述,链路层,IP层等部分,盖因阅读时间距今较久,内容有点模糊,暂时先不写,以后复习的时候补上。现直接跳至TCP这章。  TCP:传输控制协议。与UDP一样,使用相同的网络层(IP协议),但TCP却向应用层提供与UDP完全不同的服务。TCP是一种面向连接的,可靠的字节流服务。  TCP在建立连接之后,通过以下方式提供...

2011-07-26 20:08:55 180

通信__协议的那点事!!

我们的“协议”:  到目前为止,我们已经简单了解了通信的基本模型,Server—Client模型,这里以简单聊天工具为例:1、服务端启动——2、客户端启动,并试图与服务端建立连接——3、服务端根据条件(通常是根据客户端发送过来的某种特殊消息,分析其中的账号,密码)发送响应给发送请求的客户——4、若同意,客户端获得某种使用功能的权利——5、服务端发送包含特定接收对象的聊天消...

2011-07-23 22:27:34 106

《深入Java虚拟机》_平台无关性与程序的最佳可移植性

在前面的日志中,我简单分析了Java的体系结构对Java在开发网络环境下软件的绝佳支持,主要有三点:平台无关性,安全特性,和可移植性。那么,Java 是如何做到这一点的呢?  任何一个学习软件,接触到Java的人都应该知道Java的一大卖点(文雅的叫法是优势)便是它的平台无关性——它宣称同样的Java程序能在不同的OS上面运行,而这又是传统语言,如C,C++等做不到的。...

2011-07-23 20:51:21 424

《深入Java虚拟机》_Java体系结构

Java体系结构:   当程序员编写和运行一个Java程序时,会同时体验到四种独立但相关的技术。 一、用Java编程语言编写源代码 二、将之编译成Java Class文件 三、在Java虚拟机(JVM)上运行Class文件 四、当编写程序时,通过调用类(这些类实现了Java API)中的方法来访问系统资源(比如I/O)。运行程序时,通过调用Java Class文件中实现Java AP...

2011-07-21 21:06:32 125

通信__一个程序还是二个程序?

通信阶段的学习伊始,自己总有个习惯没有转变过来:我总是习惯性的将Server端和Client端放在一起编写,将它们的.java文件放在同一个package当中去。  这不仅是一个不好的编程方式,而且,更严重的是,有的时候它会导致一些难以预料的错误。  今天,这个不好的习惯就给我带来了很衰的恶果。 我将Server端和Client端发送消息的方法全部写成...

2011-07-20 21:29:42 99

原创 通信__Socket是什么玩意?

前面讲了,网络连接分为TCP连接和UDP连接,相应的,一般的网络编程分为TCP和UDP编程。作为一个初学者,首先需要了解的是TCP编程。  那么TCP编程到底是神马玩意?  TCP编程又叫做Socket编程(UDP也有Socket,但比较特殊,叫数据报式Socket,与这里的Socket有很大的不同。这里的Socket是流式Socket)。简单的说,TCP编程就...

2011-07-19 22:42:04 147

原创 通信__第一眼就看上了你

七月流火,八月怀人,暑假到了,通信也到了... 终于告别了那寂寞如雪、孤芳自赏的单机日子,从今天开始,Java学习就正式步入一个新的阶段——网络大航海时代... 什么叫通信?通信的学习、编程与过去有什么不一样的地方?? 在以前,我们总是在一台机子,一个程序上面折腾,不管是画画,压缩文件,或是坦克大战的小程序,程序所涉及到的数据都不能...

2011-07-16 23:06:17 118

平台无关性——七个步骤保证程序的最佳可移植性

1、选择程序要运行的主机和设备的集合(你的“目标宿主机”)2、在目标主机中选择自认为足够好的Java平台版本,在该版本上编写、运行程序3、对于每个目标宿主机,选择一些程序要运行的Java平台实现(你的“目标运行时环境”)4、编写程序,使它只通过Java API的标准库来访问计算机(不要调用本地方法,或者开发商专有的那些调用本地方法的库)5、编写程序,使它不依赖垃圾收...

2011-05-27 00:43:56 534

平台无关性——Java体系结构对平台无关性的支持

Java体系从四个方面对它的平台无关性进行了支持1、Java平台 Java平台是体系结构对平台无关性最重要的支持 Java平台实际上是扮演了Java运行程序和操作系统之间的缓冲的角色 无论Java程序放在哪里,它运行时都只需和Java平台进行交互就行了,而不需知道了解具体的操作系统或者是底层的硬件 2、Java语言 Java语言确定了几本数据类型在各种不同操作系统上...

2011-05-27 00:42:52 211

原创 并发基础

在一个程序中,独立运行的程序片断叫作“线程”(Thread),利用它编程的概念就叫作多线程处理,也叫并发。 编程中的相当大的部分可以通过顺序编程来解决。然而,对于某些问题,如果能够并行地执行程序中的多个部分,则会变得非常方便甚至非常必要,即使大多数并发程序是不安全和不可靠的。 对许多像我一样的初学者来说,当我们第一次接触并发的概念时,我们会第一时间想到并发对执行速度的极...

2011-05-18 23:24:40 100

原创 数组和容器基础

几乎所有的计算机语言都会用到数组的概念。 一维数组被定义成含有固定数量的相同类型对象的集合,且这些数据(对象)按一定的顺序排列。就这些数据之间而言,是呈线性排列的。 多维数组的定义被看成一维数组的递归定义。即一维数组中的每个元素都是一个数组。数据一旦被定义,它的维数和大小就被限定了,不再改变。因此,出了结构的初始化和销毁外,数组只能存取元素和修改元素值得操...

2011-05-18 23:17:50 94

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除