自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

业余程序员的成长轨迹

做真实的自己,坚持每天进步一点点!

  • 博客(20)
  • 资源 (3)
  • 收藏
  • 关注

转载 java 线程方法join的简单总结

 一、作用  Thread类中的join方法的主要作用就是同步,它可以使得线程之间的并行执行变为串行执行。具体看代码:public class JoinTest { public static void main(String [] args) throws InterruptedException { ThreadJoinTest t1 = new ThreadJoinT...

2018-04-09 10:05:23 150

原创 docker 了解

原理:“集装箱”、标准化解决问题:部署问题,方便运维环境搭建:https://cloud.tencent.com/developer/labs/lab/10054学习园地:https://cloud.tencent.com/developer/article/1004996...

2018-04-03 16:01:19 280

转载 准确率 精确度 召回率

真正(TP):分到类A且真的属于类A的实例数量 ;真负(TN):没有分到类A且真的不属于类A的实例数量;假正(FP):分到类A但不属于类A的实例数量;假负(FN):没有分到类A但属于类A的实例数量;精确度=(TP+TN)/(TP+TN+FP+FN)准确率=TP/(TP+FP)召回率=TP/(TP+FN)链接:https://www.zhihu.com/question/19645541/answe...

2018-03-29 15:00:21 471

转载 文本分类一定要先对文本分词吗?

NO,我们可以顺序选取文中相邻的两个字,作为一个“词”(术语叫bigram)。这两个字在数量很多的时候可以反映文章的主题(参考清华大学2016年的一篇论文《Zhipeng Guo, Yu Zhao, Yabin Zheng, Xiance Si, Zhiyuan Liu, Maosong Sun. THUCTC: An Efficient Chinese Text Classifier. 2016...

2018-03-27 14:01:55 1879

转载 分词的种类和原理介绍

目前的分词方法归纳起来有3 类:第一类是基于语法和规则的分词法。其基本思想就是在分词的同时进行句法、语义分析, 利用句法信息和语义信息来进行词性标注, 以解决分词歧义现象。因为现有的语法知识、句法规则十分笼统、复杂, 基于语法和规则的分词法所能达到的精确度远远还不能令人满意, 目前这种分词系统还处在试验阶段。第二类是机械式分词法(即基于词典)。机械分词的原理是将文档中的字符串与词典中的词条进行逐一...

2018-03-26 17:30:01 2532

原创 Unsupported major.minor version 52.0 类似解决办法

一般出现“Unsupported major.minor version {数字}”是由于编译环境高,运行环境低所造成的,下面列出对应的解决办法:J2SE 8 = 52.0,J2SE 7 = 51.0,J2SE 6.0 = 50.0,J2SE 5.0 = 49.0,JDK 1.4 = 48.0,JDK 1.3 = 47.0,JDK 1.2 = 46.0,JDK 1.1 = 45.0比如,你的程序出...

2018-03-14 16:18:59 605

原创 搜索引擎分类

1、传统搜索:        抓取互联网上一切有价值的信息,统一建立索引内容,然后按关键匹配的方式进行匹配检索,将展示内容按照标题和内容作为展示内容。2、垂直搜索:        专区某一专题内容,比如:汽车、娱乐等。只抓取与主题相关信息,根据主题特点有针对性的建立相应的索引检索方式,筛选方式,以及展现方式。比如:车搜网,地图搜索...

2018-03-13 11:07:11 1276

原创 文章关键词提取

方法:1、统计学原来(statistics)特点:有相应的参照指标(a)tf-idf:反应不了词汇与内容的关系(b)pagerank:网格模型,表现比tf-idf好2、rule(基于规则)特点:用机器学习的方法,基于语料的,需要有人工标注关键词的文章作为语料,用神经网络进行模型训练。(趋势)参考:https://zhuanlan.zhihu.com/p/27889420...

2018-03-08 16:42:11 1525

转载 term weight 相关

对query分词后,我们需要对计算query中各个term的权重。Term weighting在文本检索,文本相关性,核心词提取等任务中都有重要作用。 举例来说:“荷尔蒙是什么?”如果分词之后直接进行搜索,可能出来的效果并不是很理想,在不能完全匹配的情况下,”什么“ ”是“ 这样的term对query结果干扰很大。 我们人工进行分析,term weighting结果可能是: “什么 0.1,是0....

2018-03-08 08:54:53 1514

转载 关于spring的理解

1、spring是什么?    Spring是一个开源的轻量级Java SE(Java 标准版本)/Java EE(Java 企业版本)开发应用框架,其目的是用于简化企业级应用程序开发。应用程序是由一组相互协作的对象组成。而在传统应用程序开发中,一个完整的应用是由一组相互协作的对象组成。所以开发一个应用除了要开发业务逻辑之外,最多的是关注如何使这些对象协作来完成所需功能,而且要低耦合、高内聚。业务...

2018-03-03 17:31:20 440

转载 关于web.xml中url-pattern的设置问题

目录前言现象源码分析实战例子总结参考资料前言今天研究了一下tomcat上web.xml配置文件中url-pattern的问题。这个问题其实毕业前就困扰着我,当时忙于找工作。 找到工作之后一直忙,也就没时间顾虑这个问题了。 说到底还是自己懒了,没花时间来研究。今天看了tomcat的部分源码 了解了这个url-pattern的机制。  下面让我一一道来。

2018-01-07 18:20:45 10789

转载 死锁的理解---产生条件、避免方法、死锁解除

死锁:指多个进程因竞争共享资源而造成的一种僵局,若无外力作用,这些进程都将永远不能再 向前推进。安全状态与不安全状态:安全状态指系统能按某种进程顺序来为每个进程分配其所需资源,直 至最大需求,使每个进程都可顺利完成。若系统不存在这样一个序列, 则称系统处于不安全状态。 产生死锁的原因:(1)竞争系统资源 (2)进程的推进顺序不当产生死锁的必要条件:互

2018-01-05 10:55:45 420

原创 关于线程----使用、状态

1、线程的创建方式:(1)new Thread():override run方法(2)implement Runnable:实现run方法两者的区别,Runnable更灵活。2、线程的状态:线程在一定条件下,状态会发生变化。线程一共有以下几种状态:1、新建状态(New):新创建了一个线程对象。2、就绪状态(Runnable):线程对象创建后,其他线程调用

2018-01-05 10:50:50 127

转载 并发队列ConcurrentLinkedQueue、阻塞队列AraayBlockingQueue、阻塞队列LinkedBlockingQueue 区别 和 使用场景总结

三者区别与联系: 联系,三者 都是线程安全的。区别,就是 并发  和 阻塞,前者为并发队列,因为采用cas算法,所以能够高并发的处理;后2者采用锁机制,所以是阻塞的。注意点就是前者由于采用cas算法,虽然能高并发,但cas的特点造成操作的危险性,怎么危险性可以去查一下cas算法(但一些多消费性的队列还是用的它,原因看下边使用场景中的说明) 后2者区别:联系,第2和第3都是阻塞队

2018-01-04 22:50:01 159

转载 CAS无锁算法与ConcurrentLinkedQueue

CAS:Compare and Swap 比较并交换java.util.concurrent包完全建立在CAS之上的,没有CAS就没有并发包。并发包借助了CAS无锁算法实现了区别于synchronized同步锁的乐观锁。因为对于CAS算法来说,就是在不加锁的前提下而假设没有冲突去完成某个操作,如果因为冲突而导致操作失败,那么就进行重试,直到成功为止。CAS有三个操作数:真实的内存值V、预期

2018-01-04 17:09:40 240

原创 zookeeper,CuratorFramework,springMVC整合相关问题

zookeeper 相关问题zookeeper的安装zookeeper的安装请参考: (http://www.abao365.cn/zk/index.html)zookeeper相关命令1、启动、停止、重启zk(bin目录下) 启动:zkServer.sh start 停止:zkServer.sh stop 重启:zkServer.sh restart2、连接zookeeper 连接本地:

2016-04-05 18:42:39 5367

转载 15 个必须知道的 Chrome 开发工具技巧

在Web开发者中,Google Chrome是使用最广泛的浏览器。六周一次的发布周期和一套强大的不断扩大开发功能,使其成为了web开发者必备的工具。你可能已经熟悉了它的部分功能,如使用console和debugger在线编辑CSS。在这篇文章中,我们将分享15个有助于改进你的开发流程的技巧。一、快速切换文件如果你使用过sublime text,那么你可能不习惯没有Go to

2015-10-05 22:54:01 275

原创 资源网站

各种云盘资料:http://wangpansou.com/?bid=tcs查看web服务器和操作系统的份额http://news.netcraft.com/archives/2013/06/13/the-meteoric-rise-of-digitalocean.html

2015-07-23 08:40:43 424

原创 spark启动

1、启动spark环境(1)作为主机(master)启动:sh start_master.sh(在sbin目录下)(2)作为从机(slave):sh  start_slave.sh   主机名(spark://SY-0309:7077)2、启动Scala开发环境在spark安装目录的bin目录下,用spark-shell命令启动

2015-07-11 12:01:57 757

原创 算法类资源集合

视频计算广告学之搜索引擎广告原理:有助于了解搜索广告系统的原理http://wenku.baidu.com/course/view/1a4bd4bbfd0a79563c1e728d  计算广告学http://study.163.com/course/introduction.htm?courseId=321007斯坦福大学--机器学习公开课http://v.163.com/

2015-07-03 11:41:44 544

搜狗词库爬取程序

搜狗词库爬取程序,搜狗词库爬取程序搜狗词库爬取程序搜狗词库爬取程序搜狗词库爬取程序

2018-03-29

Kohana+v2.2+中文手册.chm

Kohana+v2.2+中文手册.chm

2015-05-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除