自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 资源 (1)
  • 收藏
  • 关注

原创 LeetCode 5. Longest Palindromic Substring

Descripition:Given a string s, find the longest palindromic substring in s. You may assume that the maximum length of s is 1000.Example 1:Input: “babad”Output: “bab”Note: “aba” is also a valid an...

2018-11-03 22:33:49 181

翻译 字符串系列6 最长回文子串

Descripition:Given a string s, find the longest palindromic substring in s. You may assume that the maximum length of s is 1000.Example 1:Input: “babad”Output: “bab”Note: “aba” is also a valid an...

2018-11-03 22:32:33 316

原创 字符串系列3 最长公共子串

这里总结了几种常见的解决最长公共子串问题的方法。方法1:暴力求解最简单的方法当然是暴力啦,遍历一个字符串的所有子串,然后查看其它字符串是否都含有这个子串,从所有字符串都含有的子串中选一个最大的即可,这适合对时间要求不太紧的情况。POJ 3080 AC代码:public static void main(String[] args) { Scanner in = new Scann...

2018-11-03 17:31:09 496

原创 约瑟夫问题

问题描述:n个人,编号0 ~ (n-1),从1开始报数,报到m的人退出,下一个人继续从0开始报数,求胜利者的编号。6->8->7->5->2->1->4->3假设总共有8个人,然后报30,我们来看一下过程0 1 2 3 4 5 6 7,

2018-11-03 15:52:44 1881

原创 Kafka集群错误汇总

本人的Kafka版本是最新版kafka_2.11-2.0.0,集群环境一台ubuntu16.04,两台centos7,使用win7编写代码,下面总结一些使用Kafka过程遇到的一些坑。LEADER_NOT_AVAILABLE现象:刚搭建完集群之后,建立一个Topic,命令行提示创建成功,但是Kafka Server的日志一直报类似于如下错误:this server is not the l...

2018-08-07 17:13:28 1450

转载 Python 中的字符串与字符编码

阅读目录:一、前言二、相关概念1. 字符与字节2. 编码与解码三、Python中的默认编码1. Python源代码文件的执行过程2. 默认编码3. 最佳实践四、Python2与Python3中对字符串的支持Python2Python3五、字符编码转换Python2中的字符串进行字符编码转换过程是:Python3中定义的字符串默认就是unic...

2018-03-06 11:20:11 2872

原创 字符串系列N 后缀树和Boyer-Moore 算法和 AC 自动机

后缀树好理解,但是线性时间构造后缀树其实比较复杂,后缀树在竞赛或者实际应用中用得也比前几种算法少,因此这里只放一些写得比较好的博客,有时间再研究吧。后缀树系列一:概念以及实现原理( the Ukkonen algorithm) 后缀树系列二:线性时间内构建后缀树(包含代码实现) 后缀自动机与线性构造后缀树 维基百科:Suffix tree 后缀树 - 匠心十年 - 博客 算法系列之二...

2018-03-01 11:24:27 775

原创 字符串系列4 后缀数组

阅读目录:简介倍增法DC3最长前缀附录倍增法 C++ 实现( hiho 1403 )通过DC3算法 C++ 实现( hiho 1403 )通过简介后缀数组就是把一个文本串的所有后缀按字典序从小到大排放的数组。由于线性构造后缀树比较复杂,因此后缀数组和后缀自动机都是替代方案,也能完成大部分功能。那么这三个算法和之前介绍那么多算法有什么区别呢,之前介绍的算法...

2018-02-23 22:14:52 490

转载 字符串系列5 后缀自动机

阅读目录:后缀自动机简介后缀自动机相关概念SAM 的 StatesSAM 的 Suffix LinksSAM 的 Transition Function线性时间构造后缀自动机情况一:最简单情况情况二:maxlen(v)+1=maxlen(x)情况三:maxlen(v) + 1 < maxlen(x)时间复杂度证明附录HiHo1445 C++ AC ...

2018-02-13 08:55:24 545

转载 字符串系列2 Manacher 算法

原博主已经写得非常清楚了,这里我只是将原文转过来,原博文如下:Manacher算法总结Manacher算法介绍Manacher 算法是查找一个字符串的最长回文子串的线性算法。在介绍算法之前,首先介绍一下什么是回文串,所谓回文串,简单来说就是正着读和反着读都是一样的字符串,比如 abba,noon 等等,一个字符串的最长回文子串即为这个字符串的子串中,是回文串的最长的那个。 计算字符串

2018-02-07 21:05:32 275

原创 LeetCode 4. Median of Two Sorted Arrays

Descripition:There are two sorted arrays nums1 and nums2 of size m and n respectively.Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).Example 1:

2018-02-01 21:34:06 187

原创 LeetCode 3. Longest Substring Without Repeating Characters

Descripition:Given a string, find the length of the longest substring without repeating characters.Examples:Given “abcabcbb”, the answer is “abc”, which the length is 3.Given “bbbbb”, the answ

2018-02-01 20:27:30 213

原创 LeetCode 2. Add Two Numbers

Descripition:You are given two non-empty linked lists representing two non-negative integers. The digits are stored in reverse order and each of their nodes contain a single digit. Add the two numbe

2018-02-01 11:39:04 190

原创 LeetCode 1. Two Sum

Descripition:Given an array of integers, return indices of the two numbers such that they add up to a specific target.You may assume that each input would have exactly one solution, and you may no

2018-02-01 11:06:21 173

原创 字符串系列1 Rabin-Karp, 有限自动机, KMP, 扩展 KMP

阅读目录:算法导论的四种字符串匹配算法朴素字符串匹配算法Rabin-Karp算法利用有限自动机进行字符串匹配确定有限自动机简介利用有限自动机进行字符串匹配KMP算法其他字符串相关算法KMP 优化拓展 KMP 算法附录这篇博客总结了几种常见的字符串匹配的处理方法,并使用 python 实现,参考了算法导论以及其他博客。算法导论的四种字符串匹配

2018-01-29 17:38:55 861 1

原创 Zeppelin源码分析-独立解释器 JVM 相关分析(4)

RemoteInterpreterServer 类该类由 interpreter.sh 脚本启动,在运行时会判断是否是 spark 解释器,如果是的话则使用 spark-submit 命令启动该类,否则则使用普通的 java 命令启动该类。if [[ "${INTERPRETER_ID}" == "spark" ]]; then该类的 main 方法根据端口号构造了一个 Remot

2017-08-02 20:18:13 498

原创 Zeppelin源码分析-独立解释器 JVM 相关分析(3)

InterpreterContext 类InterpreterContext 类可以说是一个 ParaGraph 运行时的上下文。在一个 ParaGraph 运行时,主进程 JVM 和 解释器 JVM 都会这个类的对象。 + 这个类中有一些属性 noteId、replName、paragraphId 等属性是运行时候的一些基本信息。 + 其中 out 属性就是专门负责流的写入,这在流相关分

2017-08-02 20:17:40 497

原创 Zeppelin 源码分析-独立解释器 JVM 相关分析(2)

和流相关的类有 InterpreterOutput,InterpreterResultMessageOutput,InterpreterOutputStream,InterpreterResultMessageOutputListener。这些类的对象虽然在主进程中也存在,但是其实是没什么作用的,因此这里直接以解释器 JVM 的角度来对这几个类进行说明。InterpreterOutputL

2017-08-02 20:16:56 473

原创 Zeppelin 源码分析-独立解释器 JVM 相关分析(1)

Zeppelin 是将所有的消息都封装在 RemoteInterpreterEvent 类中,它在 thirft 协议文件中定义如下,其中有一个数据类型字段和数据字段:struct RemoteInterpreterEvent { 1: RemoteInterpreterEventType type, 2: string data // json serialized d

2017-08-02 20:16:15 711

原创 Zeppelin 源码分析-调度和资源分析(2)

Scheduler 类Scheduler 类是调度类的抽象类,其中定义了很多关键方法,比如 submit 方法等,并且是一个线程类,一直运行在主进程或者独立 JVM 进程。 RemoteScheduler 类RemoteScheduler 类是运行在主进程的调度类,支持并发操作,实现的方式就是之前说过的将 Job 封装成 RemoteScheduler.JobRunner 类

2017-08-02 20:14:16 827

原创 Zeppelin 源码分析-调度和资源分析(1)

Job 类Job 类是一个抽象类,其中定义了五种状态,其中 PENDING 状态基本是在你一次点击了很多 ParaGraph 时才会出现的情况,这时有一些任务虽然被提交但是依然没有在运行,五种状态详细信息如下:READY - Job is not running, ready to run.PENDING - Job is submitted to scheduler. but not

2017-08-02 20:13:46 1295

原创 Zeppelin 源码分析-Interpreter 相关类(3)

和 Interpreter 直接相关类有以下几个: Interpreter, InterpreterFactory, RemoteInterpreter, InterpreterGroup, InterpreterSetting。 由于篇幅有限,这里分开介绍。InterpreterFactor 类InterpreterFactor 类是 Interpreter 接口的工厂类,各种

2017-08-02 20:12:53 709

原创 Zeppelin源码分析-Interpreter 相关类(2)

和 Interpreter 直接相关类有以下几个: Interpreter, InterpreterFactory, RemoteInterpreter, InterpreterGroup, InterpreterSetting。 由于篇幅有限,这里分开介绍。InterpreterSettingInterpreterSetting 类存储解释器相关设置,每个 Interprete

2017-08-02 20:10:08 1086

原创 Zeppelin 源码分析-Interpreter 相关类(1)

和 Interpreter 直接相关类有以下几个: Interpreter, InterpreterFactory, RemoteInterpreter, InterpreterGroup, InterpreterSetting。 由于篇幅有限,这里分开介绍。Interpreter 类及其子类Interpreter 是一个接口,所有的子类如下(只列举出 SparkInterpr

2017-08-02 20:08:31 670

原创 Flume+Kafka 将不同类别日志发往不同分区的三种方式的比较

方法1:不修改Flume源码,只使用Flume配置文件这种方法的核心思想就是使用selector将不同级别的的日志发往不同的channel,然后再用四个不同的sink去发往不同的channel,然后再使用不同的sink去接不同的channel的event并发往指定分区。具体配置见下图(mutiline_regex_extractor 是自定义的多行拦截器): 需要注意的地方是拦截器截取出的字段

2017-05-11 02:35:26 5810 7

原创 Flume 实时收集日志问题

在写Flume+Kafka实时收集Mapreduce日志时,将原来的INFO级别修改为DEBUG之后,突然发现不能正确输出,此时我的内心是崩溃的,难道说Flume不支持DEBUG级别的日志?下图即是有问题的log4j配置文件: 不信邪的我点开了源码,然后发现源码给的栗子是可以有DEBUG的呀: 追溯到源码,讲真,没看懂,不懂为什么卡住了,以后有时间需要再次深入探究源码,无奈之下

2017-05-10 22:36:09 1148

arcpy addin工具包

python地理包arcpy工具中的addin,提供强大地理数据的处理功能

2018-07-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除