Winterto1990-CSDN博客

原创 Apache MINA

是什么？一个网络通信应用框架，基于TCP/IP、UDP/IP协议栈的通信框架。做啥用？快速开发高性能、高扩展性的网络通信应用。啥优势？Mina 提供了事件驱动、异步(底层JAVA NIO、上层异步)基于 Apache MINA 的网络应用有三个层次，分别是 IoService、IoProcessor、IoFilter、IoHandler和IoSession：IoService： I/O 服务用来执行实际的 I/O 操作。MINA 已经提供了一系列支持不同协议的 ...

2020-11-12 08:21:52 247 1

原创 ProcessOn 在线作图，真香指南

你还在为没有破解Visio而烦恼？因为准备PPT画图毫无头绪？来看看一款在线产品ProcessOn轻松制作流程图、思维导图、UI、UML等类型作图。登录模块登录模块比较清爽，且支持微信 QQ 微博 Google第三方平台登录，方便。首页登录之后，是个人模块，左侧功能栏有文件管理，中间是文件及文件夹内容展示，上侧是团队协作、个人模块、人气推荐(大部分付费可克隆)、模板。文件管理新建文件夹支持新建文件夹支持直接新建空白画布 ...

2020-09-06 10:21:15 2073 1

原创 Typora 从入门到熟练使用

Typora动态显示效果图上图酷炫的操作效果便是Typora，下面带你了解一下神器typora。认知有没有考虑过哪天你也能使用Markdown（一种可以使用普通文本编辑器编写的标记语言）溜溜的，除了尽显逼格之外，也为我们在记录所学的知识点提供了便捷的途径。Markdown logoMarkdown的语法因不同的解析器或编辑器而异，Typora使用的是Markdown的语法因不同的解析器或编辑器而异，Typora使用的是GitHub Flavored Markdown...

2020-09-06 10:18:28 650

原创树莓派raspberryPI使用goproxy实现内网穿透

树莓派raspberryPI使用goproxy实现内网穿透。对于树莓派，需要使用轻量级的工具实现功能，毕竟资源太有限，省着点儿用得。内网穿透既可以用frp，也可以goproxy.下面主要讲的是使用goproxy内网穿透。初衷有这样的情况，树莓派启动后网络环境大部分可能是在一个路由器下的局域网(内网)，但是我们需要在其他网络(异地)环境访问树莓派资源(22端口)，这时候goproxy站...

2019-05-14 16:00:42 3251

转载 python写入csv文件的几种方法总结

最常用的一种方法，利用pandas包import pandas as pd#任意的多组列表a = [1,2,3]b = [4,5,6] #字典中的key值即为csv中列名dataframe = pd.DataFrame({'a_name':a,'b_name':b})#将DataFrame存储为csv,index表示是否显示行名，default=Truedataframe...

2018-03-08 17:17:39 37993 7

转载 shell中if操作手册

一简介 1 字符串判断str1 = str2　　　　　　当两个串有相同内容、长度时为真 str1 != str2　　　　　当串str1和str2不等时为真 -n str1　　　　　　　当串的长度大于0时为真(串非空) -z str1　　　　　　　当串的长度为0时为真(空串) str1　　　　　　　　当串str1为非空时为真\ >

2018-01-08 09:30:47 1138

转载 linux中使用shell进行数据库各种操作

下面附上通过shell命令行非交互式的操作数据库的方法：mysql -hhostname -Pport -uusername -ppassword -e 相关mysql的sql语句，不用在mysql的提示符下运行mysql，即可以在shell中操作mysql的方法。#!/bin/bashHOSTNAME="127.0.0.1" #数据库信息PORT="3306"

2018-01-08 08:49:37 6335

转载 python的二维数组操作

需要在程序中使用二维数组，网上找到一种这样的用法：123456#创建一个宽度为3，高度为4的数组#[[0,0,0],# [0,0,0],# [0,0,0],# [0,0,0]]myList= [[0]* 3]* 4

2016-10-27 15:23:56 2111

转载 Spark RDD API详解(一) Map和Reduce

RDD是Spark中的抽象数据结构类型，任何数据在Spark中都被表示为RDD。从编程的角度来看，RDD可以简单看成是一个数组。和普通数组的区别是，RDD中的数据是分区存储的，这样不同分区的数据就可以分布在不同的机器上，同时可以被并行处理。因此，Spark应用程序所做的无非是把需要处理的数据转换为RDD，然后对RDD进行一系列的变换和操作从而得到结果。本文为第一部分，将介绍Spark RDD中与Ma

2016-10-20 13:46:29 1560

原创 Ubuntu系统上集群之间ssh实现无密码登录

准备条件：安装ssh-serversudo apt-get install openssh-server安装ssh-clientsudo apt-get install openssh-client这个操作是要让Master节点可以无密码SSH登陆到Slave节点上。首先生成 Master 的公匙，在 Master 节点终端中执行：cd

2016-10-19 10:29:00 1901

原创在windows上安装python的机器学习包numpy scipy scikit_learn matplotlib

最近想要安装python的机器学习库，发现这个安装过程很容易走弯路，自己也是折腾了好久才找到一条捷径，现在分享出来给大家。准备条件：安装python软件，这里两种可选2.7.x或者3.5.x（这里使用2.7.x为例），将python的安装路径添加到环境变量中。安装步骤：1. nose => 2.numpy =>3.scipy =>4.scikit_learn =>5.

2016-10-13 20:42:20 1253

转载伟大是熬出来的

今天偶然的机会看到一篇文章，很好，应该让它在csdn上，让更多的朋友看到。伟大都是熬出来的！熬：是真面问题，如果有问题，去解决他而不是逃避；熬代表这坚持。就像爬山，熬过艰难的攀登过程，只有经历了前面，才能真正体会到后面的愉悦。痛苦是男人必须经历的东西，经历过才会慢慢成长，慢慢积淀毅力、勇敢、包容、智慧。熬是一个成功男人必经的过程，坚持下来的人都是有着坚定的理

2016-09-13 19:23:29 948

转载 c++中vector的用法详解

vector(向量): C++中的一种数据结构,确切的说是一个类.它相当于一个动态的数组,当程序员无法知道自己需要的数组的规模多大时,用其来解决问题可以达到最大节约空间的目的. 用法: 1.文件包含: 首先在程序开头处加上#include以包含所需要的类文件vector 还有一定要加上using name

2016-08-16 15:11:12 2563

转载 Scala Actor并发编程

Java中的并发编程主要通过线程实现的，通过共享资源的机制实现并发，但会面临着死锁的问题。在Scala中，是通过消息传递来实现并发的，而Actor正是实现消息传递的。Scala的actor提供了一种基于事件的轻量级线程。只要使用scala.actors.Actor伴生对象的actor方法，就可以创建一个actor。它接受一个函数值/闭包做参数，一创建好就开始运行。用！（）方法给acto

2016-08-04 10:10:32 1595

转载 Scala 文件 I/O

Scala Option(选项)类型用来表示一个值是可选的（有值或无值)。Option[T] 是一个类型为 T 的可选值的容器：如果值存在， Option[T] 就是一个 Some[T] ，如果不存在， Option[T] 就是对象 None 。接下来我们来看一段代码：// 虽然 Scala 可以不定义变量的类型，不过为了清楚些，我还是// 把他显示的定义上了 val

2016-08-03 23:17:54 814

转载 Scala 异常处理

Scala 的异常处理和其它语言比如 Java 类似。Scala 的方法可以通过抛出异常的方法的方式来终止相关代码的运行，不必通过返回值。抛出异常Scala 抛出异常的方法和 Java一样，使用 throw 方法，例如，抛出一个新的参数异常：throw new IllegalArgumentException捕获异常异常捕捉的机制与其他语言中一样

2016-08-03 23:11:26 1002

转载 Scala基础语法

如果你之前是一名 Java 程序员，并了解 Java 语言的基础知识，那么你能很快学会 Scala 的基础语法。Scala 与 Java 的最大区别是：Scala 语句末尾的分号 ; 是可选的。我们可以认为 Scala 程序是对象的集合，通过调用彼此的方法来实现消息传递。接下来我们来理解下，类，对象，方法，实例变量的概念：对象 - 对象有属性和行为。例如：一只狗的状

2016-08-03 19:04:23 1217

转载 Scala之旅-class和object详解

1.classscala的类和C#中的类有点不一样，诸如：声明一个未用priavate修饰的字段 var age，scala编译器会字段帮我们生产一个私有字段和2个公有方法get和set ，这和C#的简易属性类似；若使用了private修饰，则它的方法也将会是私有的。这就是所谓的统一访问原则。细节的东西太多，还是上代码在注释里面细讲吧[java] view

2016-08-03 18:27:28 968

转载 Scala中常见的容器 Iterator (迭代器)

Scala Iterator（迭代器）不是一个集合，它是一种用于访问集合的方法。迭代器 it 的两个基本操作是 next 和 hasNext。调用 it.next() 会返回迭代器的下一个元素，并且更新迭代器的状态。调用 it.hasNext() 用于检测集合中是否还有元素。让迭代器 it 逐个返回所有元素最简单的方法是使用 while 循环：object Te

2016-08-03 17:34:56 7958

转载 Scala中常见的容器 Option(选项)

2016-08-03 17:26:18 5587 2

转载 Scala中常见的容器元组 Tuple

与列表一样，元组也是不可变的，但与列表不同的是元组可以包含不同类型的元素。元组的值是通过将单个的值包含在圆括号中构成的。例如：val t = (1, 3.14, "Fred") 以上实例在元组中定义了三个元素，对应的类型分别为[Int, Double, java.lang.String]。此外我们也可以使用以上方式来定义：val t = new Tuple3(1,

2016-08-03 17:21:45 5537

转载 Scala中常见的容器 Map

Map(映射)是一种可迭代的键值对（key/value）结构。所有的值都可以通过键来获取。Map 中的键都是唯一的。Map 也叫哈希表（Hash tables）。Map 有两种类型，可变与不可变，区别在于可变对象可以修改它，而不可变对象不可以。默认情况下 Scala 使用不可变 Map。如果你需要使用可变集合，你需要显式的引入 import scala.

2016-08-03 17:07:21 6295 1

转载 Scala中常见的容器 set

Scala Set(集合)是没有重复的对象集合，所有的元素都是唯一的。Scala 集合分为可变的和不可变的集合。默认情况下，Scala 使用的是不可变集合，如果你想使用可变集合，需要引用 scala.collection.mutable.Set 包。默认引用 scala.collection.immutable.Set，不可变集合实例如下：val set = S

2016-08-03 17:02:14 2952

转载 Scala中常见的容器 List

为何选择Scala？Scala是一门混合了函数式和面向对象的语言。用Scala创建多线程应用时，你会倾向于函数式编程风格，用不变状态编写无锁代码。Scala提供一个基于actor的消息传递模型，消除了涉及并发的痛苦问题。运用这个模型，你可以写出简洁的多线程代码，而无需顾虑多线程间的数据竞争，以及处理加锁和释放带来的痛苦。下面介绍一下在Scala中常见的容器. ListList

2016-08-03 16:28:14 3953

转载 21款最优秀的开源数据库

摘要：几乎所有软件项目的开发都需要数据库的支持，目前，随着开源技术的迅速发展，越来越多的数据供应商选择开源数据库，为开源事业添砖加瓦。作为一名软件开发人员或DBA，其中一份必不可少的工作就是与数据库打交道，比如MS SQL服务器、MySQL、Oracle、PostgreSQL、MongoDB等等。众所周知，其中MySQL是目前使用最广泛最好的免费开源数据库，此外，还有一些你不知道或者没

2016-07-26 21:48:03 26483

转载 Redis高级实用命令详解--安全和主从复制

一、安全性为redis设置密码：设置客户端连接后进行任何其他指定前需要实用的密码。警告：因为redis速度非常快，所以在一台较好的服务器下，一个外部用户可以在一秒钟进行150k次的密码尝试，这意味着你需要指定非常非常强大的密码来防止暴力破解。修改密码的方法：只需要在redis的配置文件redis.conf中开启requirepass就可以了，比如我设置我的访问密码是

2016-07-25 21:35:09 1114

原创 Redis中基本数据结构

Redis简介源自Redis实战redis是一个远程内存数据库，它不仅性能强劲，而且还具有复制特性以及为解决问题而生的独一无二的数据模型。redis是一个非常快的非关系型数据库，它可以存储键(key)与5种不同类型的值(value)之间的映射(mapping)，可以将存储在内存的键值对数据持久化到硬盘，可以使用复制特性来扩展读性能，还可以使用客户端分片来扩展写性能，下面主要介绍一下re

2016-07-25 20:40:11 811

转载 Python Twisted介绍

原文链接：http://www.aosabook.org/en/twisted.html作者：Jessica McKellarTwisted是用Python实现的基于事件驱动的网络引擎框架。Twisted诞生于2000年初，在当时的网络游戏开发者看来，无论他们使用哪种语言，手中都鲜有可兼顾扩展性及跨平台的网络库。Twisted的作者试图在当时现有的环境下开发游戏，这一步走的非常

2016-07-23 11:24:26 1002

转载分布式爬虫：使用Scrapy抓取数据

Scrapy是Python开发的一个快速,高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。官方主页： http://www.scrapy.org/中文文档：Scrapy 0.22 文档GitHub项目主页：https://github.com/scrapy/scrapyScrapy 使用了 T

2016-07-23 10:57:32 2999

原创 php开发环境搭建 XAMPP

1.安装git并配置下载git并安装打开git-bash程序，添加git配置文件，执行命令 vim ~/.gitconfig，复制以下配置到文件中并保存[alias] co = checkout br = branch ci = commit st = sta

2016-07-23 10:18:00 1643

原创 PHP关于time date strtotime mktime 基础解析

最近使用PHP有关时间处理的频率比较高，现在整理一下知识点。time()time() 函数返回当前时间的 Unix 时间戳。$t=time();echo($t . "");这里的$t对象输出的是一个数字，这个数字表示从1970-01-01到现在共走了多少秒。感觉没啥用啊，这时候需要使用date函数将该对象转化为我们需要的日期了。date(format,,tim

2016-06-25 11:32:37 1340

转载 redis 3.0的集群部署

文章转载自：http://blog.csdn.net/myrainblues/article/details/25881535最近研究Redis-cluster,正好搭建了一个环境,遇到了很多坑,系统的总结下,等到redis3 release出来后，换掉memCache 集群.一:关于redis cluster1:redis cluster的现状reids-cl

2016-06-14 10:23:02 665

转载 keepalived工作原理和配置说明

keepalived是什么keepalived是集群管理中保证集群高可用的一个服务软件，其功能类似于heartbeat，用来防止单点故障。keepalived工作原理keepalived是以VRRP协议为实现基础的，VRRP全称Virtual Router Redundancy Protocol，即虚拟路由冗余协议。虚拟路由冗余协议，可以认为是实现路由器高可用的

2016-06-08 10:47:24 1055

转载探索PHP

PHP的相关进程，随着Apache的启动而运行的；PHP通过mod_php 5.so模块和Apache相连（具体说来是SAPI，即服务器应用程序编程接口）；php总共分为三个模块：php内核、Zend引擎、扩展层。php内核用来处理请求、文件流和错误处理等相关操作。Zend引擎负责将原文件转化为机器语言，然后在虚拟机上运行。扩展层是一组函数、类库和流，php用它们进行一些特殊的

2016-05-26 12:16:39 1137

原创 vim基础学习

学习vim时候整理了一下常用的命令行，一起学习。介绍一下vim的三种常见状态模式：命令模式，插入模式，正常模式。正常模式：一般的，打开Vim都是正常模式。在任何模式下，只要按下 Esc 键就可以返回正常模式。插入模式：插入模式则用来向文本中添加内容的。命令模式：命令模式则多用于操作文本文件（而不是操作文本文件的内容），例如保存文件；或者用来改变编辑器本身

2016-05-14 19:53:38 1133

转载 casperjs的高级应用

Casper class：可以通过这个模块的create()方法来获取这个模块的一个实例，这是最容易的：var casper = require('casper').create();我们也可以通过实例化主方法的方式获得一个自身的实例：var casper = new require('casper').Casper();提示：如果扩展caspe

2016-04-27 20:03:25 7339 1

原创 python中urllib2高级应用使用代理模拟浏览器 cookie

之前的文章分享了一下python中requests如何使用代理以及如何处理乱码问题，还有使用cookies的问题，有感兴趣的可以查看。下面解决的问题是如何在urllib2中使用代理：proxies={"http":"114.244.112.220:8118"} #设置你想要使用的代理proxy_s=urllib2.ProxyHandler(proxies) opener=u

2016-04-23 13:19:53 11880

原创 python中requests使用代理proxies

学习网络爬虫难免遇到使用代理的情况，下面介绍一下如何使用requests设置代理：如果需要使用代理，你可以通过为任意请求方法提供 proxies 参数来配置单个请求:import requests proxies = { "http": "http://10.10.1.10:3128", "https": "http://10.10.1.10:1080", } requests.g

2016-04-22 15:06:46 248139 12

原创 python中requests爬去网页内容出现乱码的解决方案

最近在学习python爬虫，使用requests的时候遇到了不少的问题，比如说在requests中如何使用cookies进行登录验证，这可以查看博客内容。这篇博客要解决的问题是如何避免在使用requests的时候出现乱码。import requests res=requests.get("https://www.baidu.com") print res.content以上就是使用re

2016-04-22 09:54:12 18393

原创 python的requests在网络请求中添加cookies参数

哎，好久没有学习爬虫了，现在想要重新拾起来。发现之前学习爬虫有些粗糙，竟然连requests中添加cookies都没有掌握，惭愧。废话不宜多，直接上内容。我们平时使用requests获取网络内容很简单，几行代码搞定了，例如：import requestsres=requests.get("https://cloud.flyme.cn/browser/index.jsp")print r

2016-04-21 22:21:37 136086 6

Java 基础核心总结.pdf

它是javac编译器的一个环境变量。它的作用与import、package关键字有关。当你写下improt java.util.*时，编译器面对import关键字时，就知道你要引入java.util这个package中的类

2020-10-13

《Java面试手册》.pdf

利用空余时间整理了一份《Java面试手册》，初衷也很简单，就是希望在面试的时候能够帮助到大家，减轻大家的负担和节省时间。

2020-10-13

sybase数据库jdbc驱动jar包

需要使用jdbc连接sybase数据库的同学们可以下载使用了

2018-11-16

scipy-0.18.1-cp27-27m-win_amd64.whl

python2.7.x 64位操作系统 python安装scipy包wheel文件由于文件较大存于百度云盘 http://pan.baidu.com/s/1jHNbtGi

2017-02-24

weka-3.6.11

WEKA-3.6

2016-07-17

weka-3-6-11

WEKA-3.6.11版本.

2016-07-17

casperjs.pdf

casperjs官方开发文档，内容是英文版的但英文简单易懂，这是最新的版本。

2015-10-15

SAS编程技术与金融数据处理

2015-09-23

云计算

这是有关云计算的PDF文档，希望能够对想要学习云计算的同事有所帮助。

2015-09-22

phantomjs-2.0.0

phantomjs-2.0.0-windows

2015-09-18

基于selenium2的自动化测试

2015-08-31

贝叶斯思维：统计建模的Python学习法

2015-08-15

phantomjs-1.9.1

phantomjs-1.9.1-windows.zip

2015-07-19

bootstrap.min css js

压缩包中既有bootstrap.css,bootstrap.min.css,bootstrap-responsive.css, bootstrap-responsive.min.css又有bootstrap.min.js

2015-07-18

scripy爬虫 for python

这是有关python中scripy爬虫的简单的例子可以去尝试学习学习，学习python并行化爬虫的方便。

2015-07-06

xml-apis.jar

xml-apis.jar 包含xml建立及解析所涉及的函数

2015-06-14

httpcore-4.4.1.jar

httpcore-4.4.1.jar包含了httpcore各函数

2015-06-14

dom4j-1.6.1.rar

dom4j完整jar包包括 dom4j-1.6.1.rar

2015-06-14

Python For Data Analysis

This book is concerned with the nuts and bolts of manipulating, processing, cleaning, and crunching data in Python. It is also a practical, modern introduction to scientific computing in Python, tailored for data-intensive applications. This is a book about the parts of the Python language and libraries you’ll need to effectively solve a broad set of data analysis problems. This book is not an exposition on analytical methods using Python as the implementation language.

2015-05-22

Hadoop实战中文版

《Hadoop实战》作为云计算所青睐的分布式架构，Hadoop是一个用Java语言实现的软件框架，在由大量计算机组成的集群中运行海量数据的分布式计算，是谷歌实现云计算的重要基石。《Hadoop实战》分为3个部分，深入浅出地介绍了Hadoop框架、编写和运行Hadoop数据处理程序所需的实践技能及Hadoop之外更大的生态系统。《Hadoop实战》适合需要处理大量离线数据的云计算程序员、架构师和项目经理阅读参考。书籍目录：第一部分 Hadoop——一种分布式编程框架　第1章 Hadoop简介　　1.1 为什么写《Hadoop 实战》　　1.2 什么是Hadoop 　　1.3 了解分布式系统和Hadoop 　　1.4 比较SQL 数据库和Hadoop 　　1.5 理解MapReduce 　　1.5.1 动手扩展一个简单程序　　1.5.2 相同程序在MapReduce中的扩展　　1.6 用Hadoop统计单词——运行第一个程序　　1.7 Hadoop历史　　1.8 小结　　1.9 资源　第2章初识Hadoop 　　2.1 Hadoop 的构造模块显示全部信息第一部分 Hadoop——一种分布式编程框架　第1章 Hadoop简介　　1.1 为什么写《Hadoop 实战》　　1.2 什么是Hadoop 　　1.3 了解分布式系统和Hadoop 　　1.4 比较SQL 数据库和Hadoop 　　1.5 理解MapReduce 　　1.5.1 动手扩展一个简单程序　　1.5.2 相同程序在MapReduce中的扩展　　1.6 用Hadoop统计单词——运行第一个程序　　1.7 Hadoop历史　　1.8 小结　　1.9 资源　第2章初识Hadoop 　　2.1 Hadoop 的构造模块　　2.1.1 NameNode 　　2.1.2 DataNode 　　2.1.3 Secondary NameNode 　　2.1.4 JobTracker 　　2.1.5 TaskTracker 　　2.2 为Hadoop 集群安装SSH 　　2.2.1 定义一个公共账号　　2.2.2 验证SSH安装　　2.2.3 生成SSH密钥对　　2.2.4 将公钥分布并登录验证　　2.3 运行Hadoop 　　2.3.1 本地（单机）模式　　2.3.2　伪分布模式　　2.3.3 全分布模式　　2.4 基于Web 的集群用户界面　　2.5 小结　第3章 Hadoop组件　　3.1 HDFS 文件操作　　3.1.1 基本文件命令　　3.1.2 编程读写HDFS 　　3.2 剖析MapReduce 程序　　3.2.1 Hadoop数据类型　　3.2.2 Mapper 　　3.2.3 Reducer 　　3.2.4 Partitioner：重定向Mapper输出　　3.2.5 Combiner：本地reduce 　　3.2.6 预定义mapper和Reducer类的单词计数　　3.3 读和写　　3.3.1 InputFormat 　　3.3.2 OutputFormat 　　3.4 小结第二部分实战　第4章编写MapReduce基础程序　　4.1 获得专利数据集　　4.1.1 专利引用数据　　4.1.2 专利描述数据　　4.2 构建MapReduce 程序的基础模板　　4.3 计数　　4.4 适应Hadoop API 的改变　　4.5 Hadoop 的Streaming 　　4.5.1 通过Unix命令使用Streaming 　　4.5.2 通过脚本使用Streaming 　　4.5.3 用Streaming处理键/值对　　4.5.4 通过Aggregate包使用Streaming 　　4.6 使用combiner 提升性能　　4.7 温故知新　　4.8 小结　　4.9 更多资源　第5章高阶MapReduce 　　5.1 链接MapReduce 作业　　5.1.1 顺序链接MapReduce作业　　5.1.2 具有复杂依赖的MapReduce链接　　5.1.3 预处理和后处理阶段的链接　　5.2 联结不同来源的数据　　5.2.1 Reduce侧的联结　　5.2.2 基于DistributedCache的复制联结　　5.2.3 半联结：map侧过滤后在reduce侧联结　　5.3 创建一个Bloom filter 　　5.3.1 Bloom filter做了什么　　5.3.2 实现一个Bloom filter 　　5.3.3 Hadoop 0.20 以上版本的Bloom filter 　　5.4 温故知新　　5.5 小结　　5.6 更多资源　第6章编程实践　　6.1 开发MapReduce 程序　　6.1.1 本地模式　　6.1.2 伪分布模式　　6.2 生产集群上的监视和调试　　6.2.1 计数器　　6.2.2 跳过坏记录　　6.2.3 用IsolationRunner重新运行出错的任务　　6.3 性能调优　　6.3.1 通过combiner来减少网络流量　　6.3.2 减少输入数据量　　6.3.3 使用压缩　　6.3.4 重用JVM 　　6.3.5 根据猜测执行来运行　　6.3.6 代码重构与算法重写　　6.4 小结　第7章细则手册　　7.1 向任务传递作业定制的参数　　7.2 探查任务特定信息　　7.3 划分为多个输出文件　　7.4 以数据库作为输入输出　　7.5 保持输出的顺序　　7.6 小结　第8章管理Hadoop 　　8.1 为实际应用设置特定参数值　　8.2 系统体检　　8.3 权限设置　　8.4 配额管理　　8.5 启用回收站　　8.6 删减DataNode 　　8.7 增加DataNode 　　8.8 管理NameNode 和SNN 　　8.9 恢复失效的NameNode 　　8.10 感知网络布局和机架的设计　　8.11 多用户作业的调度　　8.11.1 多个JobTracker 　　8.11.2 公平调度器　　8.12 小结第三部分 Hadoop也疯狂　第9章在云上运行Hadoop 　　9.1 Amazon Web Services 简介　　9.2 安装AWS 　　9.2.1 获得AWS身份认证凭据　　9.2.2 获得命令行工具　　9.2.3 准备SSH密钥对　　9.3 在EC2 上安装Hadoop 　　9.3.1 配置安全参数　　9.3.2 配置集群类型　　9.4 在EC2 上运行MapReduce 程序　　9.4.1 将代码转移到Hadoop集群上　　9.4.2 访问Hadoop集群上的数据　　9.5 清空和关闭EC2 实例　　9.6 Amazon Elastic MapReduce 和其他AWS 服务　　9.6.1 Amazon Elastic MapReduce 　　9.6.2 AWS导入/导出　　9.7 小结　第10章用Pig编程　　10.1 像Pig 一样思考　　10.1.1 数据流语言　　10.1.2 数据类型　　10.1.3 用户定义函数　　10.2 安装Pig 　　10.3 运行Pig 　　10.4 通过Grunt 学习Pig Latin 　　10.5 谈谈Pig Latin 　　10.5.1 数据类型和schema 　　10.5.2 表达式和函数　　10.5.3 关系型运算符　　10.5.4 执行优化　　10.6 用户定义函数　　10.6.1 使用UDF 　　10.6.2 编写UDF 　　10.7 脚本　　10.7.1 注释　　10.7.2 参数替换　　10.7.3 多查询执行　　10.8 Pig 实战——计算相似专利的例子　　10.9 小结　第11章 Hive及Hadoop群　　11.1 Hive 　　11.1.1 安装与配置Hive 　　11.1.2 查询的示例　　11.1.3 深入HiveQL 　　11.1.4 Hive小结　　11.2 其他Hadoop 相关的部分　　11.2.1 HBase 　　11.2.2 ZooKeeper 　　11.2.3 Cascading 　　11.2.4 Cloudera 　　11.2.5 Katta 　　11.2.6 CloudBase 　　11.2.7 Aster Data和Greenplum 　　11.2.8 Hama和Mahout 　　11.2.9 search-hadoop.com 　　11.3 小结　第12章案例研究　　12.1 转换《纽约时报》1100 万个库存图片文档　　12.2 挖掘中国移动的数据　　12.3 在StumbleUpon 推荐最佳网站　　12.3.1 分布式StumbleUpon 的开端　　12.3.2 HBase 和StumbleUpon 　　12.3.3 StumbleUpon 上的更多Hadoop 应用　　12.4 搭建面向企业查询的分析系统——IBM的ES2 项目　　12.4.1 ES2 系统结构　　12.4.2 ES2 爬虫　　12.4.3 ES2 分析　　12.4.4 小结　　12.4.5 参考文献附录A HDFS文件命令

2015-05-19

mysql,sqlserver.oracle.jar

包含mysql sqlserver oracle 三种数据库的开发包

2015-05-19

SQLite权威指南

全书首先从 SQLite 最初起源、特性、设计理念、实际应用讲解开始，逐步深入、全面地介绍了在各个平台如何使用SQLite。接着，介绍SQLite 的一般SQL 和高级功能的SQL，采取举例说明，使得本书内容生动有趣。然后，全面介绍了各种语言如何与SQLite 进行编程交互，重点介绍SQLite 原生语言C 语言中的API，使得使用者可以不管扩展SQLite 的功能。本书还介绍了目前火热的IOS 和Android 开发中如何使用SQLite，并给出实际例子。最后，介绍了SQLite 内部架构设计，使得读者可以深入理解SQLite，高级开发者可以进一步参与SQLite 开发或者开发自己的SQLite。

2015-05-19

机器学习和模式识别-PRML

PRML是模式识别和机器学习领域的经典著作，出版于2007年。该书作者 Christpher M. Bishop 是模式识别和机器学习领域的大家，其1995年所著的“Nerual Networks for Pattern Recognition”也是模式识别、人工神经网络领域的经典著作。 PRML深入浅出地介绍了模式识别与机器学习的基本理论和主要方法，同时还涵盖了模式识别与机器学习领域的一些最新进展，不仅适合初学者学习，而且对专业研究人员也有很大的参考价值。全书共738页，分为14章，循序渐进，前后呼应、表达清晰、理解深刻。每章都有相应的习题及答案，有助于学习和教学。

2015-05-14

精通Windows.API-函数、接口、编程实例

《精通Windows API-函数、接口、编程实例》是一系列函数、宏、数据类型、数据结构的集合，运行于windows系统的应用程序，可以使用操作系统提供的接口来实现需要的功能。《精通Windows API-函数、接口、编程实例》由浅入深、循序渐进地教授读者如何使用windows api进行windows应用程序开发。

2015-05-13

随机森林代码-matlab

随机森林的代码，matlab.m格式的代码，希望能帮到需要帮助的。

2015-05-12

机器学习实战.

对计算机学习的成功理解将开辟出许多全新的应用领域，并使其计算能力和可定制性上升到新的层次。同时，透彻理解机器学习的信息处理算法，也会有助于更好地理解人类的学习能力及缺陷。

2015-05-11

O'Reilly：社交网站的数据挖掘与分析

Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据，但是怎样才能找出谁通过社交媒介正在进行联系？他们在讨论些什么？或者他们在哪儿？本书简洁而且具有可操作性，它将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术，如何通过可视化帮助你找到你一直在社交世界中寻找的内容，以及你闻所未闻的有用信息。　　《社交网站的数据挖掘与分析》每章都介绍了在社交网络的不同领域挖掘数据的技术，这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。

2015-05-11

[改变未来的九大算法

Google得出的搜索结果是如何产生的？百度为何会陷入“搜索门”，又是什么机制使然？身处在大数据时代的我们，究竟该如何应对变化莫测的世界？ …… 没有满篇的专业术语，第一次让我们通过简单明了的语言、生动的例证了解支撑计算机王国的灵魂支柱——9大算法，包括人工智能、数据压缩，以及Google著名的PageRank等。本书精彩地介绍了搜索引擎、PageRank、公开密钥加密、纠错码、模式识别、数据压缩、数据库、数字签名等内容。在解释这些算法的同时，作者也向我们展示了充满科学原创精神的计算机世界：因为每一种算法的提出不但延伸了虚拟世界的领域，同时也是人类智慧的彰显，可以被广泛运用于众多领域。在读完本书后，你不会成为一名更加熟练的计算机用户，但你会更珍视自己每天在所有计算设备上不停使用的思想的美。

2015-05-11

TA关注的人

Java 基础核心总结.pdf

《Java面试手册》.pdf

sybase数据库jdbc驱动jar包

scipy-0.18.1-cp27-27m-win_amd64.whl

weka-3.6.11

weka-3-6-11

casperjs.pdf

SAS编程技术与金融数据处理

云计算

phantomjs-2.0.0

基于selenium2的自动化测试

贝叶斯思维：统计建模的Python学习法

phantomjs-1.9.1

bootstrap.min css js

scripy爬虫 for python

xml-apis.jar

httpcore-4.4.1.jar

dom4j-1.6.1.rar

Python For Data Analysis

Hadoop实战中文版

mysql,sqlserver.oracle.jar

SQLite权威指南

机器学习和模式识别-PRML

精通Windows.API-函数、接口、编程实例

随机森林代码-matlab

机器学习实战.

O'Reilly：社交网站的数据挖掘与分析

[改变未来的九大算法

mysql-connector-java-5.1.6-bin.jar

R语言实践.PDF

asp.net中ajax技术是否可以实现停止服务器端正在运行的按钮事件