自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(96)
  • 收藏
  • 关注

原创 RxJava学习笔记(1) - RxJava简介

Rx即Reactive Extension, 是一个集观察者模式、迭代器模式和函数式编程的响应式编程模型,为开发者处理异步数据流提供了一致的编程接口。 Rx库最初由微软开发,目前由ReactiveX社区维护(http://reactivex.io/), 已支持几乎所有的流行编程语言。RxJava则是Rx库Java平台的扩展,对可观察的对象 (Observable) 进行了抽象并提供了相关的高阶函数。

2016-02-17 14:03:19 1460

原创 移动网络广告优化(速度优化篇)

在之前的文章介绍到RTP实时竞价, 那对于移动/网络广告如何优化,提高用户的体验和满意度呢?一般而言,如果能做到下面三点,那这个广告在一定程度上是可以被接受的:1.实用性。根据用户平时浏览,搜索的信息进行广告的精准投放。用户经常浏览体育信息说明这个用户很可能是一个年轻人,经常参加体育运动,因此在他手机上投放体育用品的广告。2.短时性。时间不要太长,这样反而引起用户的反感。3.趣味性。每

2016-02-25 18:04:26 1766

原创 入门的JAVA爬虫实现(附代码)

在写文章之前,我想先申明一下。我是一个刚刚开始学习JAVA的新手,所有我写的文章可能会很基础,而且还可能会出现一些低级错误,如果各位前辈发现任何错误,欢迎留言指出,小弟在此感激不尽。      首先,我和大家说一下我的思路。我是用的最简单的方法实现从网页上提取有用的信息的。①写一个类读取网页的HTML代码的全部内容②然后用对应的正则表达式获取你需要的对应的内容③最后写了一个类把获取

2016-02-04 16:06:53 1814

原创 手把手带你入门之Swagger UI

关于Swagger UI,从官网找来一段介绍。 简单的来讲, Swagger UI就是API文档生成和测试利器。Swagger UI is a dependency-freecollection of HTML, Javascript, and CSS assets that dynamically generatebeautiful documentation and sandbox fro

2016-01-04 15:33:40 19348 1

原创 Shiro集成Spring

本篇博客主要讲述的是两者的集成,不涉及到各自的具体细节和功能。 由于官方给出的文档不够详细,对新手而言通过官方文档还不能够很快的搭建出SpringShiro的web工程,本博客将通过实际的案例提供具体的教程。 案例分析: 项目名称:假期系统组织机构:部门 > 小组角色:Admin, SeniorManager,TeamLeader, Developer资源:假期Le

2015-12-22 16:22:57 973

原创 Kraken项目中如何巧用Q.allSettled装饰nodejs代码的门面

若你是以krakenjs作为编写nodejs项目的框架, 这里简单介绍下models的概念。Kraken将datamodels从controller逻辑中分离出来,从而能有cleaner更有条理的代码。Datamodels置于models文件夹中。当一个新的controller创建了,该框架也会将为你创建一个简单的model.关于Q.allSettled方法,q包的官方文档里这么介绍说:I

2015-12-22 15:33:44 1708

翻译 《实体解析与信息质量》 - 4.1.3 优化选择操作符的精准性

EBDI的一个常见问题是优化集成选择操作符的精准性,事实上对一个来自不同数据源的属性而言既是一个问题也是一个机会。问题是选择哪个值,机会是通过获得更多的选择提高整合资源的整体精准性。如果至少有一个数据源提供正确的值,并且该值被选择了,那么组合数据源的精准性会超过任何一个单独资源的精准性。 举个简单的例子,假设两个数据源都只有两个实体,并且每个数据源的第一个实体和第二个实体都是相等的,从而形

2015-12-09 09:16:03 1000

原创 python实现布隆过滤器对数据去重

一、直观的数据去重方式通常我们采用如下算法对一组长度为n的数据d进行去重时。S1.在数据中取出第x个数据(1≤xS2.在数据中取出第y个数据(xS3.比较d[x]和d[y],若相同丢弃d[y],重复S2,S3直到y=nS4.重复S1,S2,S3直到x=n-1 此算法时间复杂度近似T(n)=O(1/2n²),空间需求为size(d)。假设现有一组数据d,单条长度500

2015-11-13 14:39:30 5106

翻译 《实体解析与信息质量》 - 4.1.2 描述EBDI的形式化框架

这里给出的EBDI的形式化描述继承了上一章中ER流程的代数模型(Talburt,Wang, Hess, Kuo, 2007),该ER流程是为了实体引用集上的等价关系(Holland,Talburt, 2009; Talburt,Hashemi, 2008)所定义的。EBDI的形式描述始于一个集成环境的概念。该集成环境提供了一个明确的机制来描述一个信息源集合中的实体等价(ER部分)和属性等价

2015-11-11 18:02:03 948

原创 Spring 定时任务quartz配置及代码示例详解

前段时间做公司项目,有个需求定期清理一些超过时限的文件。谈到处理定时任务,quartz应该是目前比较成熟,使用较为广泛的java任务调度框架了,功能强大配置灵活,在企业应用中占重要地位。现在就跟大家一起学习下如何在项目中使用quartz。首先了解下Quartz的背景    Quartz是opensymphony组织专攻job scheduling领域又一个开源利器,可以到http://

2015-11-05 16:47:55 1410

原创 开源内存数据库H2 实现单元测试用例的独门独户

背景部门逐渐规范代码质量,要求单元测试用例代码覆盖率要达到50%,所以最近大家渐渐养成了写单元测试用例的习惯。由于系统功能主要就是增删改查,所以当大家的单元测试用例使用同一个数据库时发生数据冲突,经常造成单元测试不通过的情况,影响了代码进度。所以对于每一个测试用例需要一个独立的数据库,这时候Lu同学经过研究发现了h2内存数据库,解决了之前的问题。 简介H2是一个开源的内存数据库,支

2015-11-03 11:06:33 4960

原创 基于WebDriver&TestNG 实现自己的Annotation @TakeScreenshotOnFailure

相信用过Selenium WebDriver 的朋友都应该知道如何使用WebDriver API实现Take Screenshot的功能。在这篇文章里,我主要来介绍对failed tests实现 take screenshot的功能, 并且我们也高大上一回,做成注解的形式。 效果如下: 目录 前提 Maven 配置

2015-10-19 10:21:57 1408

翻译 《实体解析与信息质量》 - 4.1.1 介绍

ER通常只是在比较大的基于实体的数据集成(EBDI)流程中的一个中间步骤。EBDI是整合和合理化与等价实体相关的信息集体的过程。每个引用可能只提供关于一个实体的一小部分信息,但是结合其他等价引用中的信息可以合并成一个更加全面的实体数据集。当然,等价引用所提供的一些信息可能是相同的属性,也就是既有正面又有负面影响的情况。当属性值一致时,它往往会增加信心水平认为该值是正确的。但是从另一方面来说,当它们

2015-10-16 16:57:28 774

原创 敏捷/Scrum 之看板初体验

1.   看板简介看板管理,常作Kanban管理(来自日语“看板”,カンバン,日语罗马拼写:Kanban),是丰田生产模式中的重要概念,指为了达到JIT(Just in Time, 及时生产)方式控制现场生产流程的一种工具。几乎每个学习丰田TPS(Toyota Production System)的企业都会不自觉的把看板当作第一个引入的模式,因为它直观有效。将流程可视化·

2015-10-08 16:21:52 6377

翻译 《实体解析与信息质量》 - 3. 1.6总结

Fellegi-Sunter模型是第一个基于记录链接的背景来建立关于实体解析的正式理论知识的尝试, 它同时也提供了关于构建和分析模糊匹配规则的实践指导。而SERF模型则是一个更加通用的ER模型,它并未预定义好关于引用是否等价的一系列方法,相应的,该模型将关注点放在为了确保ER系统的唯一输出原则,链接和整合过程所必须满足的各种条件。 同时, 它还介绍了在实体管理和实体捕获中的主要部分:整合引用这一术

2015-09-21 11:56:33 998

原创 spring security 基础入门(配置详解)

Spring Security 是为Java EE项目提供全面安全服务的框架。支持基于配置文件,JDBC,LADP和自定义的验证方式。能够通过URL路径等途径提供安全服务。本文将介绍通过自定义的验证方式,通过URL拦截来使用springsecurity提供的安全服务。

2015-09-09 17:19:54 10617

翻译 《实体解析与信息质量》 - 3.1.5复习题

完成复习题1,2,3需要以下信息:请访问ERIQ实验室站点(ualr.edu/eriq/)并下载数据集ListOne.txt,ListTwo.txt以及TruthFile.txt。ListOne.txt包含284条记录,每条记录分别有两个字段:·        字段1为记录号(1 到284)。·        字段2代表该记录的四个身份属性。每个属性的可能值为从A到G的字符值。举例说明

2015-09-01 15:00:01 633

原创 Tomcat 启动异常深度剖析

最近在使用tomcat 部署应用是遇到异常如下:Caused by: java.lang.IllegalStateException: Unable to complete the scan for annotations for web application [/xxxx] due to a StackOverflowError. Possible root cau

2015-08-24 10:53:36 6633

翻译 《实体解析与信息质量》 - 3.1.4 ENRES 元模型

为了更好的描述ER模型,Malin和Sweeny(2005)发表了一篇关于名为ENRES的语义上的框架的文章,该框架并不算是真正意义上的ER模型。 它是由实体,属性,以及属性值元组(队列)等概念构成。关于实体引用中的元组概念,我们已经在第一章中阐明。模型中的属性根据语义被划分为以下三类:·        Personal – 与实体本身有关的属性·        Locational

2015-08-24 10:13:31 1091

原创 AngularJS 从入门到精通(过滤器(Filter) )

过滤器(Filter),故名思议,源数据通过特定的规则,转换成需要的数据格式, 这个规则,我们统称为过滤器。AngularJs 的Filter 功能非常强大,并且使用方便。它能够使得页面分组,查询,排序,以及数据转换等操作变的异常简单,同时还可以自定义过滤器实现更复杂的功能。格式:{{expression | filter}} 或 {{expression | filt

2015-08-19 15:03:46 2928

原创 【LeetCode-面试算法经典-Java实现】【05-Longest Palindromic Substring(最大回文字符串)】

背景最近开始研究算法,于是在leetcode上做算法题,第五题Longest Palindromic Substring便是关于回文子串的。什么是回文字串回文字符串是指将该字符串前后颠倒之后和该字符串一样的字符串。例如:a,aaaa,aba,abba…最长回文子串要求最长回文子串,就需要遍历每一个子串,时间复杂度是O(N²);判断字串是不是回文,时间复杂度是

2015-08-18 09:37:53 1465

翻译 《实体解析与信息质量》 - 3.1.3 Algebraic模型

代数模型(AlgebraicModel)尽管一个ER处理流程的实现存在着一定的复杂性,譬如在Fellegi-Sunter模型和Swoosh算法中所描述的,它的结果可以简单的用术语等价关系来描述,该术语是抽象代数中的基本概念(Rotman,2005)。代数模型首次提出作为一个方法来为实体解析实现信息质量指标(Talburt,Wang,Hess,Kuo,2007),并已经被扩展成第四章所提到的包括

2015-08-11 10:26:50 1561

原创 程序猿(媛)Shell脚本必备技能之一: 在Linux下如何自动备份mysql数据

作者:荀彧(花名)Background:鉴于QAS数据库曾遭到毁灭性损害,极其桑心L。为了避免这种玉石俱焚的状况再度发生,于是我们找出了一种应对方案。这里给大家分享一下如何实现定时备份mysql数据库的脚本。 Target:每天对QAS数据库进行数据及表的备份并且删除掉10天之前的备份文件。 Working:三个步骤搞定。Step 1: 准备两个文件建备份文件夹qa

2015-08-10 09:26:08 1285

原创 JAVA实现全角半角相互转化 (full2Half & half2Full)

说明:1.全角:指一个字符占用两个标准字符位置。汉字字符和规定了全角的英文字符及国标GB2312-80中的图形符号和特殊字符都是全角字符。一般的系统命令是不用全角字符的,只是在作文字处理时才会使用全角字符。2.半角:指一字符占用一个标准的字符位置。通常的英文字母、数字键、符号键都是半角的,半角的显示内码都是一个字节。在系统内部,以上三种字符是作为基本代码处理的,所以用户输入命令和参数时

2015-08-07 09:45:38 11556

原创 技术那么多,你想看看JSON Schema的测试吗?

目录1. 什么是JSON Schema?2. 如何定义一个JSON Schema3. 如何测试JSON Schema a) 使用JSON Schema validator GUI b) 在Java code里使用JSON Schema validator 4.参考文档  什么是JSON Schema?JSON模式是基于JSON格式定义J

2015-08-05 14:06:39 2486

翻译 《实体解析与信息质量》 - 3.1.2 SERF模型

斯坦福实体解析框架(SERF)是由HectorGarcia-Molina领导的研究小组(Benjelloun, Garcia-Molina, Kawai, Larson, Menestrina,Su, Thavisomboon, and Widom, 2006)在斯坦福信息实验室开发出来的。SERF模型中,两个引用的成对解析被抽象成一个匹配方法(match function M),该方法通过操

2015-07-27 11:26:55 1240

原创 Spring @Transaction配置示例及发生不回滚原因深度剖析

背景最近在公司做的一个项目,用的是SpringMVC框架,数据库用的是MySql,刚开始并没有加入事务,其实主要原因是本人没有使用过SpringMVC的事务。问题的产生和解决使用事务,直接问百度,我选择的是注解的方式。在配置文件中配置事务管理器和驱动: <bean id="transactionManager"

2015-07-24 16:13:49 2893 1

原创 AngularJS 基础入门(指令篇)

一、介绍     AngularJS 是google 开发者设计的一个前端开发框架,它是由是由javascript 编写的一个JS框架。通常它是用来在静态网页构建动态应用不足而设计的。    AngularJS特点如下:    REST Client: RestFul 是主流的接口模式,而AngularJS实现RestFul 接口客户端只需要一行代码即可。

2015-07-23 17:12:28 1241

翻译 《实体解析与信息质量》 - 3.1.1 Fellegi-Sunter模型

Fellegi-Sunter模型从历史上来看,政府人口普查、福利和税收统计计划是第一个解决实体解析问题的组织,他们开始尝试着汇总和总结大量的居民和企业信息。想要收集关于人口的精确数据,那么确定两条在不同的时间或者被不同机构所收集的数据记录是否为同一个实体就显得尤为的重要。1969年,在加拿大统计局工作的统计学家I.P.fellegi和A.B.Sunter出版了一篇论文,论文名为记录链接理论,这

2015-07-20 11:20:41 3002 4

原创 Java生产消费者模式之项目实践

浅谈生产消费者模式在项目中的一次应用案例

2015-07-15 16:01:55 1265 1

原创 玩转单元测试之DBUnit

DBunit 是一种扩展于JUnit的数据库驱动测试框架,它使数据库在测试过程之间处于一种已知状态,如果一个测试用例对数据库造成了破坏性影响,它可以帮助避免造成后面的测试失败或者给出错误结果。

2015-07-14 09:35:53 2402

翻译 《实体解析与信息质量》 - 3.1.0 概述

本章将要介绍三种ER模型,这些模型分别涵盖了ER流程的不同层面,相互之间进行补充。第一个也是最先被讨论的模型是Fellegi-Sunter模型,该模型讨论的是如何利用直接匹配进行等价引用链接的方法。为处理概率匹配下的等价匹配问题,Fellegi-Sunter模型还提供了一种特殊的算法。我们要讨论的第二个模型是斯坦福实体解析框架(SERF),该模型针对ER的一般处理流程,定义出一系列通用术语,其中包

2015-07-13 09:37:22 1105

原创 AWS之VPC、Subnet与CIDR

什么是CIDR?CIDR是英文Classless Inter-Domain Routing的缩写,中文是无类别域间路由,是一个在Internet上创建附加地址的方法,这些地址提供给服务提供商(ISP),再由ISP分配给客户。CIDR将路由集中起来,使一个IP地址代表主要骨干提供商服务的几千个IP地址,从而减轻Internet路由器的负担。为什么要选择CIDR,CIDR?主要

2015-07-10 11:13:30 9373

原创 Spring MVC原理及实例基础扫盲篇

最近 项目中刚接触了SpringMVC,就把这几天看的跟实践的东西写出来吧。一、首先,先来了解一下SpringMVC到底是个什么样的框架?Spring Web MVC是一种基于Java的实现了Web MVC设计模式的请求驱动类型的轻量级Web框架,即使用了MVC架构模式的思想,将web层进行职责解耦,基于请求驱动指的就是使用请求-响应模型,框架的目的就是帮助我们简化开发。二、S

2015-07-09 10:10:56 2795

原创 实时竞价(RTB) 介绍(基础篇)

前言:说到“实时竞价”大家一定都不陌生,那么为何现在实时竞价发展这么迅猛,当然这个主要得益于整体移动互联网环境的成熟,以及中国本地移动广告市场出现爆发式增长。那么究竟什么是实时竞价?这个流程是怎样的呢?下面会从业务角度做一个简单的介绍。 简介: RTB模式是网络广告行业新型的购买模式,与传统的PPC广告(根据用户数量计费)、CPM广告(一千次浏览计费)、CPC广告(每点击一次计

2015-07-08 09:56:16 9298 1

原创 初识ThreadLocal

最近公司在进行Java开发人员的招聘活动,其中有一道面试题是这样的:“请简单描述一下ThreadLocal类的作用。” 结果发现有很多的面试者没有听说过ThreadLocal或者听说过却不知道这个类究竟是用来做什么的。 因此这里写一篇博客来介绍一下ThreadLocal这个类。 在我们日常的项目开发中,ThreadLocal并不是一个经常使用的类。它更多的是被用在诸如Spring,

2015-07-07 14:15:26 752

原创 《实体解析与信息质量》 - 2.2.1 复习题

1.      从财务的角度上如何定义“资产”?信息在哪些角度符合这样的定义?又在哪些角度不符合?2.      信息质量的度量单位是什么?3.      举例来说明这样一种情况:同一条信息在它的其中一个应用中具有较高质量,在另一个应用中的质量则较低。4.      找到一篇关于信息质量或数据质量的多维度框架的文章或书籍。解释它与Wang-Strong框架的区别以及相同之处。5. 

2015-07-06 09:59:48 913

转载 java7中的ThreadLocalRandom

本文转载自:http://mabusyao.iteye.com/blog/1362826今天早上看到一个关于java7中的ThreadLocalRandom的用法的帖子,说是比Math.Random()速度要快一倍,转过来学习一下 : When I first wrote this blog my intention was to introduce

2015-07-03 16:36:57 1763

原创 边走边学Nodejs (基础入门篇)

1.什么是Node.jsNodejs ,或者node, 是一个基于ChromeJavaScript运行时建立的平台,用于方便地搭建响应速度快、易于扩展的网络应用。Node.js 使用事件驱动, 非阻塞I/O 模型而得以轻量和高效,非常适合在分布式设备上运行的数据密集型的实时应用。Node.js开创了javascript模块化开发的先河,早期的javascript需求都很简单,基本都是写成函

2015-07-02 16:23:45 1229 1

原创 获取两个字符串所有公共的子串算法

应用场景: 获取两个字符串所有公共的子串。思路: 1. 先获取两个子串的交集             2. 遍历交集子串,从最短子串到最长子串public static List getAllCommonSubStrings(String str1, String str2) { //TODO null check. Strin

2015-07-01 17:38:23 3934

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除