自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

跳舞的驴子

技术点滴

  • 博客(127)
  • 资源 (2)
  • 收藏
  • 关注

转载 浏览器、apache的连接超时详解

浏览器、apache的连接超时详解前言要理解浏览器和apache之间的连接超时问题,需要先明白http的keep-alive属性。先简单介绍keep-alive,您可以从网上查找更加详细的介绍。浏览器和apache都是基于http协议的。而http协议中的keep-alive属性通俗的解释就是浏览器和apache第一次建立TCP连接,传输完数据不会立刻断开这

2014-08-21 21:15:50 1559

转载 debug技巧

不论是什么行业里,能让人最兴奋的事情通常都是解决新奇的、高难度问题带来的刺激。在我的工作中,经常会遇到很多bug,乍一看,它们都是不可能的。不是不可能解决,而是完全不可能出现。就好象最前沿的科技揭示了一个新的奇怪的逻辑现象,以至于人的大脑完全无法理解。当然,这里我总结的这些bug都是很独特的,如果你想说是否能有某种最先进的系统性的方法能将这些bug归类,统一解决,那是愚蠢的,就好象一个人无

2014-08-07 14:25:00 554

转载 从BAT看企业构建大数据体系的六层级

本文将企业大数据体系的构建分为六个层级,但并非是线性过程,每个层级之间或有基础关系,但并不是说一定要逐层构建。例如创业型公司,在缺乏数据研发实力的时候,多数会借助第三方平台进行数据上报与分析。下面一张图,是本文的精华概括,后面一一展开与大家探讨。一、数据基础平台基础的数据平台建设工作,包含数据平台建设,数据规范,数据仓库、产品数据规范,产品ID,用户ID,统一SDK

2014-06-29 16:14:26 1041

转载 用搜索神器Everything定位Webshell木马后门

Everything是速度最快的文件名搜索软件。其速度之快令人震惊,百G硬盘几十万个文件,可以在几秒钟之内完成索引;文件名搜索瞬间呈现结果。它小巧免费,支持中文,支持正则表达式,可以通过HTTP或FTP分享搜索结果。Everything搜索工具的最大优点是速度。其速度不是快,是极快;用户不是满意,而是震惊。因为Everything的索引无需逐一扫描硬盘文件,而是直接读取NT

2014-06-27 08:56:30 1041

转载 技术人,不要总在很初级的层面上谈管理

无意间瞄到《[畅言]管理是权力的游戏吗?》,引起了我一些“新仇旧恨”,就也来吐槽一把。但吐槽的点倒不是权力不权力的,这是一点意思也没有的问题,在大多数人这个层次上(包括大多管理者)谈权力,形象来讲就和一般人老想象皇帝每天吃猪肉炖粉条一样,差太远,扯下去也没意思。我想说的是技术人对管理的认知。遇到问题谈问题 层次性很差最常见的谈管理场景是一个人从技术转到管理岗位,接下来实践了

2014-06-25 10:11:24 693

转载 Spring中的jar包详解

下面给大家说说spring众多jar包的特点吧,无论对于初学spring的新手,还是spring高手,这篇文章都会给大家带来知识上的收获,如果你已经十分熟悉本文内容就当做一次温故知新吧。spring.jar 是包含有完整发布的单个jar包,spring.jar中除了spring-mock.jar里所包含的内容外其他所有jar包的内容,因为只有在研发环境下才会用到spring-mock.jar来

2014-06-17 09:56:33 394

原创 centos tomcat 自动启动

启动Tomcat  首先为Tomcat编辑一段启动脚本,并置于/etc/rc.d/init.d目录下,让Tomcat和httpd一样作为一项系统服务,并随系统自动启动。#!/bin/bash## Startup script for the tomcat## chkconfig: 345 80 15# description: Tomcat is a Servlet

2014-06-14 09:33:13 470

转载 怎样写一个解释器-- 记录一下,请勿删

(王垠 yinwang.org 版权所有,未经许可,请勿转载)这是一篇解释器的入门教程。虽然我试图从最基本的原理讲起,尽量让这篇文章不依赖于其它知识,但是这篇教程并不是针对编程的入门知识,所以我假设你已经学会了最基本的 Scheme 和函数式编程。我不是很推崇函数式编程,但它里面确实包含了很重要的一些方法。如果你完全不了解这些,可以读一下 SICP 的第一,二章(或者接下去读 The Litt

2014-06-08 11:02:38 549

转载 100个数据集

在寻找数据集?这里给你准备了100多个最有趣的,从柏拉图式的爱情到政治竞选再到死刑囚犯,应有尽有。 个人对“信息时代”这个名词非常不感冒,就好像随便来了个人,往过一坐,然后说:“当下的信息已经非常多了,我们该如何形容?我觉得‘信息时代’这个词不错。”个人认为这是极度不负责的,没有创意,命名者太懒了;其次,如此多的数据带来更多的是处理上的无助和绝望,用“drinking from

2014-06-08 09:33:41 5459

转载 酒店房间和 C++ 局部变量的作用域

问题:Can a local variable’s memory be accessed outside its scope? 有一段局部变量的内存,可以从其范围之外访问它么?如下代码:12345678910111213int*foo(

2014-06-06 10:00:29 506

原创 linux 查看版本号

1)[root@localhost ~]# cat /proc/versionLinux version 2.6.18-194.el5 ([email protected]) (gcc version 4.1.2 20080704 (Red Hat 4.1.2-48)) #1 SMP Fri Apr 2 14:58:14 EDT 20102)[ro

2014-06-05 15:38:25 621

转载 一次JVM内存调优的分享

一次JVM内存调优的分享这篇文章是关于最近一次性能调优的经历。跟往常一样,开始的时候总会有一些模糊的征兆。这次的现象看起来是”应用程序运行缓慢,但是我们无法获取到对应的源代码。我们该如何来解决这个问题“。仔细观察下这个应用会发现它运行着一些批量任务。分析下性能相关的指标会发现它在运行某个特定任务的时候花费的时间太长了。进一步分析我得出了一个可量化的优化目标。我需要将这个

2014-06-04 14:51:30 444

转载 关于Spring的69个面试问答——终极列表

本文由 ImportNew - 人晓 翻译自 javacodegeeks。欢迎加入Java小组。转载请参见文章末尾的要求。这篇文章总结了一些关于Spring框架的重要问题,这些问题都是你在面试或笔试过程中可能会被问到的。下次你再也不用担心你的面试了,Java Code Geeks这就帮你解答。大多数你可能被问到的问题都列举在下面的列表中了。所有的核心模块,从基础的Spring功能(

2014-06-03 17:13:11 423

转载 week3 决策树分析 R语言实现

library(tree)#读入数据soybean = read.table("soybean-large.data", header=F, sep=",")soybean_df = data.frame(soybean)header = paste("att", 1:36, sep="")names(soybean_df) = headerattach(s

2014-06-03 16:54:11 1161

转载 Week3 作业

本帖最后由 罗伊斯 于 2014-5-27 21:00 编辑决策树模型其实是从ID3开始,慢慢的发展到C4.5,CART等优化进行的。详细介绍可以看这里 http://zh.wikipedia.org/wiki/决策树看到这个数据集,里面很多NA,很多?,感觉如果是数据分析师或者数据挖掘师,都会感到头疼的,因为有时候建模都是需要花大量时间来进行数据清洗。

2014-06-03 16:51:17 650

转载 数据挖掘主要解决的四类问题

数据挖掘最重要的要素是分析人员的相关业务知识和思维模式。丰富的业务知识是设计有效的相关变量的必要条件,而分析人员的思维模式从另外一个方面也保障了设计变量的结构化和完整性。所以我们在掌握丰富的业务知识同时,如果能够按照正确的思维模式去思考问题,将会发现解决问题并不是很困难的。一般来说,数据挖掘主要侧重解决四类问题:分类、聚类、关联、预测。数据挖掘非常清晰的界定了它所能解决的几类问题。这是一个高度的归

2014-06-03 16:45:48 962

转载 数据挖掘入门必看10个问题

NO.1 Data Mining 和统计分析有什么不同?  硬要去区分Data Mining和Statistics的差异其实是没有太大意义的。一般将之定义为Data  Mining技术的CART、CHAID或模糊计算等等理论方法,也都是由统计学者根据统计理论所发展衍生,换另一个角度看,Data  Mining有相当大的比重是由高等统计学中的多变量分析所支撑。但是为什么Dat

2014-06-03 16:42:32 739

转载 电影推荐系统的建模

11336241 叶均明一、概述由MovieLens评分数据集作为训练集(含943名用户对1682部电影的评分),根据用户信息和过往打分进行电影推荐,即允许用户对自己所看过的电影进行打分,并且根据用户历史的打分信息,为用户预测他对其他未观看的电影的打分,或预测他对其他电影的评分分类,将预测分值高的电影推荐给用户,认为这些电影是用户下一步感兴趣的电影。二、思路

2014-06-03 16:24:24 3006

转载 如何通过数据挖掘做O2O

今天非常高兴有机会跟大家分享,我主要讲一下O2O产品怎么应用大数据?O2O是前一段时间炒的一直比较火的概念,Online和Offline的概念,Offline是我们做平台,整合原有的固有的线下服务。所以,我们如何通过大数据驱动这种新的应用模式的出现呢?简单先谈一谈易到用车,易到用车实际上它做的是一方面整合了所有的全国的租赁公司,因为我们看到租赁公司,或者出租公司有很多车,包括出租车,包括租赁车。什

2014-06-03 16:23:23 987

转载 R语言 基本数据分析

本文基于R语言进行基本数据统计分析,包括基本作图,线性拟合,逻辑回归,bootstrap采样和Anova方差分析的实现及应用。不多说,直接上代码,代码中有注释。1. 基本作图(盒图,qq图)[plain] view plaincopy#basic plot  boxplot(x)  qqplot(x

2014-06-02 19:56:29 791

转载 MC, MCMC, Gibbs采样 原理&实现(in R)

本文用讲一下指定分布的随机抽样方法:MC(Monte Carlo), MC(Markov Chain), MCMC(Markov Chain Monte Carlo)的基本原理,并用R语言实现了几个例子:1. Markov Chain (马尔科夫链)2. Random Walk(随机游走)3. MCMC具体方法:     3.1 M-H法     3.2 G

2014-06-02 19:54:38 1270

转载 K近邻(KNN):分类算法

K近邻(KNN):分类算法* KNN是non-parametric分类器(不做分布形式的假设,直接从数据估计概率密度),是memory-based learning.* KNN不适用于高维数据(curse of dimension)* Machine Learning的Python库很多,比如mlpy(更多packages),这里实现只是为了掌握方法* MA

2014-06-02 19:52:02 921

转载 决策树的实现

本文基于python逐步实现Decision Tree(决策树),分为以下几个步骤:加载数据集熵的计算根据最佳分割feature进行数据分割根据最大信息增益选择最佳分割feature递归构建决策树样本分类关于决策树的理论方面本文几乎不讲,详情请google keywords:“决策树 信息增益  熵”将分别体现于代码。本文只建一个.py文件,所有代码

2014-06-02 19:50:08 794

转载 OAuth2.0指南

OAuth2.0指南(一)引言OAuth2.0是一种应用之间彼此访问数据的开源授权协议。比如,一个游戏应用可以访问Facebook的用户数据,或者一个基于地理的应用可以访问Foursquare的用户数据等。下面是一张阐述该概念的图:OAuth2.0怎么通过应用共享数据的例子,用户访问web游戏应用,该游戏应用要求用户通过Facebook登录。用户登录到了Face

2014-06-02 09:22:56 742

转载 怎样快速学习一门新技术

前几天fork了Ruby China的源码,面对陌生的Ruby技术栈,一头雾水。我fork它并不单为了学习,而是要在最短的时间搭建起我脑海中的社区网站。所以我不可能针对每一门新技术都去买一本书来读上半个月。我在本机运行起Ruby China,新注册一个用户,发现不能发帖,提示说要注册一个月以上才可以。于是我去找相关代码: # 是否能发帖 def newbie? ret

2014-06-02 08:22:55 648

转载 数据挖掘导论

数据挖掘作为一个新兴的多学科交叉应用领域,正在各行各业的决策支持活动扮演着越来越重要的角色。数据挖掘(Data Mining)与数据库知识发现(Knowledge Discovery from DataBase)的基本知识,以及从大量有噪声、不完整、甚至是不一致数据集合中,挖掘出有意义的模式知识所涉及的概念与技术方法。 人类的各项活动都是基于人类的智慧和知识,即对外

2014-05-24 22:24:38 1110

原创 kettle 连接mysql 失败

解决方案:/etc/init.d/mysql stop (service mysqld stop ) /usr/bin/mysqld_safe --skip-grant-tables 另外开个SSH连接 [root@localhost ~]# mysql mysql>use mysql mysql>update user set password=password(

2014-05-23 17:09:29 978

原创 Racket- 计算周工资。 输入列表,返回列表

递归列表项, 生成新的列表;; wages(define (wages hours) (* 12 hours) );; hours->wages list-of-number -> list-of-number;; 计算周工资表(define( hours-wages a-list-of-week-hours ) (cond [(empty? a-list

2014-05-23 14:18:40 689

原创 Racket- list

上段代码, 计算列表是否包含某个值

2014-05-23 11:28:20 1118

原创 drracket的完整文法

2014-05-23 09:14:16 1069

转载 Linux安装Oracle JDK替换OpenJDK详解

众所周知,由于Oracle公司的JDK的版权问题,大多数Linux发行版在安装时都会附带开源的无版权问题的OpenJDK,以支持某些java程序软件。但是如果我们在Linux下做一些java语言的开发,很可能还是需要安装和使用Oracle公司的原版JDK(以下简称“JDK”)。如何安装JDK并替换掉OpenJDK呢?今天旸仔做一个详细的解答:毋庸置疑,如果一个系统内同时存在一个以上的j

2014-05-22 17:57:12 706

原创 Racket 入手第一天

开始入手racket。一下子被一个例子迷住了:

2014-05-15 19:56:10 940

转载 上海率先开放政府数据 医院床位车位信息均可查

■包括医院床位、候诊人数、道路交通、停车场库、搬场名录等190项数据  ■国内首个政府数据服务网www.datashanghai.gov.cn作为开放统一入口  ■今年将重点建设政府移动APP门户,将各类公众服务APP“一网打尽”  本报讯 (记者 徐瑞哲)住院难,求床位——当市卫计委向社会开放全市3级以上医院的床位类别、空余数量等数据,任何个人或企业都可据此开发A

2014-05-15 14:57:56 1299

转载 Java 8的元空间

本文我们将会介绍JVM的一个更新,这就是持久代的移除。我们会介绍为什么需要移除持久代,以及它的替代者,元空间(metaspace)。这是上一篇文章内存管理之垃圾回收的续集。Java 6中的堆结构是这样的:持久代持久代中包含了虚拟机中所有可通过反射获取到的数据,比如Class和Method对象。不同的Java虚拟机之间可能会进行类共享,因此持久代又分为只读区和读写区。

2014-05-14 20:19:13 986

转载 Spring MVC源码分析——初始化过程

1.      概述对于Web开发者,MVC模型是大家再熟悉不过的了,SpringMVC中,满足条件的请求进入到负责请求分发的DispatcherServlet,DispatcherServlet根据请求url到控制器的映射(HandlerMapping中保存),HandlerMapping最终返回HandlerExecutionChain,其中包含了具体的处理对象handler(也即我们

2014-05-14 16:15:09 528

转载 JSR 356, Java API for WebSocket

学习如何整合WebSocket到你的应用中。对于许多基于Web的客户服务端应用,以前的HTTP请求-响应模型有它的限制。信息必须要在响应时被从服务端传送到客户端,不仅仅是请求。过去有许多技巧可以用于解决这个问题,如长连接和Comet。然而,需要一个标准的,双向的,全双工的在客户和服务器之间的通道的需求在持续增长。2011年,IETF将WebSocket协议标准化为RFC64

2014-05-14 16:02:38 1666

转载 Websocket java api (jsr 356) study notes

websocket 下一代即时通讯的技术前沿.java 方面的规范jsr 356 已经正式通过,最近着重研究此项技术,尝试在项目中使用websocket技术.(一)先看下 Java Websocket API以下是简要的api class diagram解释一下规范中的基本名词:Endpoint: 端点, websocke一端

2014-05-14 14:44:21 1136

转载 深入理解JVM内部结构

(译文,原先发在本人的csdn博客上)这篇文章主要是解释java虚拟机(JVM)的内部结构。下图显示了符合Java SE 7 版本的Java虚拟机规范的一个典型JVM中的关键内部组件。       图中显示的组件将会在下面两部分中进行逐一的解释。第一部分涉及JVM为每一个线程都会创建的组件;第二部分则是独立于线程进行创建的组件。1. Thread

2014-05-14 14:32:55 531

转载 Spring MVC源码分析——初始化过程

1.      概述对于Web开发者,MVC模型是大家再熟悉不过的了,SpringMVC中,满足条件的请求进入到负责请求分发的DispatcherServlet,DispatcherServlet根据请求url到控制器的映射(HandlerMapping中保存),HandlerMapping最终返回HandlerExecutionChain,其中包含了具体的处理对象handler(也即我们

2014-05-14 11:25:40 566

转载 Spring MVC源码分析(续)——请求处理

在之前的“Spring MVC实现分析——初始化”中分析了spring mvc的初始化过程,接下来将分析其请求处理过程。在找请求处理的入口时,我们需要先知道Servlet的编程规范,对应不同的请求(如POST、GET等)的实现方法在FrameworkServlet中,分别是doPost、doGet等,看这一系列方法的具体实现可以知道,请求的处理跳转到了processRequest函数中,最

2014-05-14 11:25:13 444

阿里云 amp 一键安装包

阿里云一键安装包。 个人搭建服务器环境是可以使用

2014-09-25

pentaho sample data mysql

pentaho 安装sample data

2014-03-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除