自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

写作使人严谨。

  • 博客(41)
  • 收藏
  • 关注

原创 Java中的反射机制复习

1 Java反射机制概述Java反射机制主要提供了以下功能: 在运行时判断任意一个对象所属的类;在运行时构造任意一个类的对象;在运行时判断任意一个类所具有的成员变量和方法;在运行时调用任意一个对象的方法;生成动态代理。这种动态获取的信息以及动态调用对象的方法的功能称为Java语言的反射机制。2 Java反射程序示例package captain;import java.lang

2016-05-16 21:40:23 432

原创 论坛日志分析:Flume+MapReduce+Hive+Sqoop+MySQL

(1)使用Flume-ng的spooldir类型的source来监听Linux文件系统上的一个目录,使用hdfs类型的sink将日志收集到hdfs上。这个flume-ng的agent配置文件a4.conf的内容如下。#定义agent名, source、channel、sink的名称a4.sources = r1a4.channels = c1a4.sinks = k1#具体定义sou

2016-04-27 09:54:11 1886

原创 HBase的Java接口基本操作:创建表插入查询删除

package captain.hbase;import java.util.ArrayList;import java.util.List;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop.hba

2016-04-27 09:53:54 1493

原创 MapReduce原理和程序

1 MapReduce原理图2 WordCount程序package captain.hadoop.mr;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.

2016-04-27 09:53:35 415

原创 RPC和HDFS文件读写(下载上传)过程

1 RPCRPC——远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在,如TCP或UDP,为通信程序之间携带信息数据。在OSI网络通信模型中,RPC跨越了传输层和应用层。RPC使得开发包括网络分布式多程序在内的应用程序更加容易。RPC采用客户机/服务器模式。请求程序就是一个客

2016-04-27 09:53:01 3417

原创 HDFS原理、命令行接口和Java接口

1 HDFS的设计目标我们都知道,Hadoop是一种用来进行海量数据存储和计算的分布式系统基础架构,它具有高效、低成本、高可靠(容错)及高扩展(可伸缩)等优点。HDFS作为Hadoop的核心之一,

2016-04-27 09:52:32 4738

原创 JS定时器简单时钟案例复习

JavaScriptDemo3 function timer(){ //获取当前时间 var date = new Date(); //将当前时间对象转化为本地字符串形式 var dateformat = date.toLocaleString(); //将时间对象放到div中显示 var div1 = document.getEl

2016-03-20 15:44:08 787

原创 JS基本类型与Java的区别复习

JavaScriptDemo2 //注意JS中的number类型是不区分整数和小数的. var a = 123; alert(123/1000*1000);//结果为123 /* 注意JS中的string类型在作+运算时相当于java中的字符串连接, 而作-运算时是数值上的相减(若字符串不是数值则结果为NaN) */ var str1 = "2

2016-03-20 15:39:57 395

原创 HTML表单标签复习

Document 手机号码: 创建密码: 性别:男 女 爱好:唱歌 乒乓球 羽毛球 文件: 生日: 请选择 1991 1992 1993 自我描述: 隐藏项:

2016-03-20 15:33:32 466

原创 HTML常用标签复习

HTML常用标签使用演示 顶部 这是一行文字! 这是一行文字! 这是一行     文字! 标题一 标题二 这是一个链接 商品 服饰 食品 图书 服饰 食品 图书 服饰 食品 图书

2016-03-20 15:29:49 322

原创 Linux开发环境复习

熟悉Linux开发环境一、Linux简介1 Linux概述Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的UNIX工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。2 Linux基本思想

2016-01-08 18:06:11 516

原创 云计算初识

1 云计算简述云计算(cloud computing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。因此,云计算甚至可以让你体验每秒10万亿次的运算能力,拥有这么强大的计算能力可以模拟核爆炸、预测气候变化和市场发展趋势。用户通过电脑、

2016-01-07 14:07:13 370

原创 k最近邻(KNN)——实践

# -*- coding: utf-8 -*-"""Created on Tue Sep 15 09:50:33 2015@author: Administrator"""from numpy import *from os import listdirimport operatordef createDataSet(): group = array([[1.0, 1

2016-01-06 15:11:19 387

原创 决策树——实践

# -*- coding: utf-8 -*-"""Created on Tue Sep 08 10:10:15 2015@author: Administrator"""import operator #为了能够处理叶子节点的类标签仍然不唯一的情况。from math import log#计算训练数据集的香农熵def calcShannonEnt(dataSet):

2016-01-06 15:08:57 323

原创 决策树——理论

一、机器学习绪论1.机器学习的定义广义:任何计算机程序通过经验来提高某任务处理性能的行为。一般:对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E学习。2.学习问题的三个特征    任务的种类;衡量任务提高的标准;经验的来源。3.机器学习系统的模块总体来看,系统设计就是产生执行系统、鉴定器、泛化器和

2016-01-06 14:51:08 2528

原创 Python数据分析笔记

第一章 NumPy基础:数组和矢量计算1.Numerical Python是高性能科学计算和数据分析的基础包。它提供了一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组ndarray;用于对整组数据进行快速运算的标准数学函数(无需编写循环);用于读写磁盘数据的工具以及用于操作内存映射文件的工具;线性代数、随机数生成以及傅里叶变换功能;用于集成由C、C++、Fortran等语言编写的代

2016-01-06 14:39:47 11510 1

原创 Python入门基础

Python基础1.Python说明可以通过help()函数查询帮助文档,id()函数查内存地址。个人觉得Python的语法和环境与MATLAB有点像。2.Python特点解释性,面向对象,高阶动态,跨平台可移植,易扩展,胶水,开源,可嵌入性。3.基本输入输出语句输入函数:raw_input( )函数输出函数:print( )函数4.Python中的变量

2016-01-06 14:37:35 358

原创 Python环境搭建

Python环境搭建                                            1.Python解释器       可以在www.python.org 官方网站上下载相应的标准解释器CPython,即Python,自带一个交互式shell和一个简单的集成开发环境IDLE,其中只有Python标准库。       也可以下载IPython解释器,是pyth

2016-01-06 14:30:53 321

原创 MATLAB入门基础

Matlab基础(数值计算、符号计算和绘图)第一章 MATLAB帮助1.常用的帮助命令Help  lookfor which  set/get  doc type  edit  helpin 2.帮助窗口3.演示系统 第二章 MATLAB基础1.MATLAB特点基本计算单元是矩阵、向量,功能的扩展性(除了基本部分外还有专业扩展部分)2.MATLAB组成M

2016-01-05 23:53:47 577

原创 Java语言实现的简单网络爬虫复习

1 网络爬虫概述

2015-12-25 21:45:21 531

原创 Java中的网络编程复习

1 网络通信要素(1) IP地址:为实现网络中不同设备之间的通信,每个设备的唯一标识就是IP地址,本地回环地址为127.0.0.1。(2) 端口号:用于标识进程的逻辑地址,不同进程的标识。端口号范围为0~65535,其中0~1023为系统使用或保留端口。(3) 传输协议:传输协议就是通信的规则,常用的传输层协议为TCP和UDP。UDP协议将数据及源和目的封装到数据报中,不需要建立连接,

2015-12-24 15:53:56 316

原创 Java中的I/O流复习

1 流概述流是一组有序的数据序列,根据操作的类型,可分为输入流和输出流两种。I/O(Input/Output)流提供了一条通道程序,可以使用这条通道把源中的字节序列送到目的地。Java中的I/O类都被放在java.io包中,所有输入流类都是抽象类InputStream(字节输入流)或抽象类Reader(字符输入流)的子类,而所有输出流都是抽象类OutputStream(字节输出流)或抽象类Wr

2015-11-23 20:55:34 1435

原创 Java语言实现的装饰设计模式复习

1 装饰设计模式概述在不必改变原类文件和使用继承的情况下,动态地扩展一个对象的功能。它是通过创建一个包装对象,也就是装饰来包裹真实的对象。当想要对已有的对象进行功能增强时,可以定义一个类,将已有的对象传入,基于已有的功能来提供加强功能,这个自定义的类就被称为装饰类。装饰类通常会通过其构造方法接收被装饰类的对象,并基于被装饰类对象的功能提供更强的功能。2 装饰设计模式的特点(1)装饰

2015-11-20 16:33:43 368

原创 Java中的枚举和泛型复习

1 枚举JDK 1.5加入了枚举类型,可以使用该功能取代以往定义常量的方式,同时枚举类型还赋予程序在编译时检查类型的功能。在以往设置常量时,通常将常量放置在接口中,这样在程序中就可以直接使用,并且该常量不能被修改,因为在接口中定义常量时,该常量的修饰符为static和final。而使用枚举类型定义和使用常量的程序示例如下。package captain;//枚举类型定义和使用常量的演示

2015-11-16 15:48:56 488

原创 Java集合框架复习

1 集合类概述java.util包中提供了一些集合类,这些集合类又被称为容器,提到容器不难会想到数组,集合类与数组的不同之处是,数组的长度是固定的,集合的长度是可变的;数组用来存放基本类型的数据,集合用来存放对象的引用。常用的集合有List集合、Set集合、Map集合,其中List接口与Set接口继承了Collection接口。各接口还提供了不同的实现类。2 集合框架体系

2015-11-11 22:03:29 499

原创 Java中的线程同步及线程死锁复习

1 线程安全在单线程程序中,每次只能做一件事情,后面的事情需要等待前面的事情完成后才可以进行,但是如果使用多线程程序,就会发生多个线程抢占资源的问题,从而产生线程安全问题。实质上线程安全问题来源于多个线程在操作共享的数据,并且操作共享数据的代码有多条,即当一个线程在执行操作共享数据的多条代码过程中,其他线程参与了运算。解决思路:将多条操作共享数据的线程代码封装起来,当有线程在执行这些代码的时候

2015-10-29 10:24:59 504

原创 Java中创建线程的两种方式及线程的状态复习

1 多线程概述Java语言提供了并发机制,程序员可以在程序中执行多个线程,每一个线程完成一个功能,并与其他线程并发执行,这种机制被称为多线程。一个线程是进程中的执行流程,一个进程中可以同时包括多个线程,每个线程也可以得到一小段程序的执行时间,这样一个进程就可以具有多个并发执行的线程。在单线程中,程序代码按调用顺序依次往下执行,如果需要一个进程同时完成多段代码的操作,就需要产生多线程。在Java

2015-10-28 14:55:12 2244

原创 Java语言实现的单例设计模式复习

1 单例设计模式概述设计模式(Design pattern)是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。使用设计模式是为了可重用代码、让代码更容易被他人理解、保证代码可靠性。毫无疑问,设计模式于己于他人于系统都是多赢的;设计模式使代码编制真正工程化;设计模式是软件工程的基石脉络,如同大厦的结构一样。它是对问题行之有效的解决方式和思想。单例(单个实例)设计模式可以保证

2015-10-26 22:22:44 570

原创 Java中的异常复习

1 异常概述异常是一个在程序执行期间发生的事件,它中断了正在执行的程序的正常指令流。Java语言是一门面向对象的编程语言,因此,异常在Java中也是作为类的实例的形式出现的。当在某一方法中发生错误时,这个方法创建一个对象,并且把它传递给运行时系统。这个对象就是异常对象。通过异常处理机制,可以将非正常情况下的处理代码与程序的主逻辑分离,即在编写代码主流程的同时在其他地方处理异常。Java中已经定

2015-10-23 13:25:01 354

原创 Java数组常用排序算法实现复习

1 冒泡排序冒泡算法由双层循环实现,其中外层循环用于控制排序轮数,一般是要排序的数组长度减1次,因为最后一次循环只剩下一个数组元素,不需要对比,同时数组已经完成排序了。而内层循环主要用于对比数组中每个相邻元素的大小,以确定是否交换位置,对比和交换次数以排序轮数而减少。算法实现:package captain;public class BubbleSortDemo { publi

2015-10-20 20:39:05 556

原创 Java中的Arrays工具类的应用复习

Arrays类是Java API中提供的类,在java.util包中,Arrays类中提供的方法可直接实现数组的排序、搜索等。常用方法如下:1、toString转换数组:将指定数组内容转换为字符串形式。2、fill给数组赋值:通过fill方法。3、sort对数组排序:通过sort方法,默认按升序。4、equals比较数组:通过equals方法比较数组中元素值是否相等

2015-10-20 16:21:29 507

原创 Java中遍历数组的三种方式复习

1 for循环遍历通常遍历数组都是使用for循环来实现。遍历一维数组很简单,遍历二维数组需要使用双层for循环,通过数组的length属性可获得数组的长度。程序示例:package captain;public class ArrayDemo { public static void main(String[] args) { // TODO Auto-generated

2015-10-20 16:07:02 50666 2

原创 Java中的String类和StringBuilder类复习

1 String类的常用方法说明:1.字符串str中字符的索引从0开始,范围为0到str.length()-12.使用indexOf进行字符或字符串查找时,如果匹配返回位置索引;如果没有匹配结果,返回-13.使用substring(beginIndex ,endIndex) 进行字符串截取时,包括beginIndex位置的字符,不包括endIndex位置的字符4

2015-10-20 11:11:15 639

原创 Java正则表达式基础应用复习

1 regex的概念正则表达式regex通常被用于判断语句中,用来检查某一字符串是否满足某一格式。正则表达式是含有一些具有特殊意义字符的字符串,这些特殊字符称为正则表达式的元字符。例如,“\\d”表示数字0-9之中的任意一个,“\\d”就是一个元字符;“\\w”表示可用作标识符的元字符,但不包括美元符号$。注意:在正则表达式中“.”表示任何一个字符,因此在正则表达式中如果想使用普通意义的点字符

2015-10-19 21:48:22 577

原创 数学之美--笔记7

余弦定理与新闻(文档)分类1.基于TF-IDF的文档特征向量化2.基于余弦定理的文档相似性度量3.基于两种算法的文档分类

2015-05-18 11:43:12 380

原创 数学之美--笔记6

地址分析和有限状态机全球导航和动态规划

2015-05-03 18:05:24 436

原创 数学之美--笔记5

TF-IDF算法与网页的查询相关性

2015-04-30 22:10:55 320

原创 数学之美--笔记4

稀疏矩阵与网页排序算法PageRank

2015-04-29 22:27:34 336

原创 数学之美--笔记3

图论与网络爬虫

2015-04-29 21:58:30 375

原创 数学之美--笔记2

布尔代数和搜索引擎的索引

2015-04-29 21:26:09 343

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除