自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(52)
  • 资源 (15)
  • 收藏
  • 关注

原创 Solr6.2.1 学习笔记(二)从数据库导入数据

一直想写一个Solr系列,但自己并没有实施的很好,一是身为一个大三学生,平时专业课较多,又具有一定难度,要想学好已属不易,二是本学期选的课题都用不到Solr,只能去先学习掌握课题有关知识,才能继续自己的爱好。今天有网友问我是否了解数据库导入方面的问题,就顺便写一下自己的学习笔记。1.查看配置 Solr6.2.1 学习笔记(一)搭建运行环境(两种方式)中我们创建了mycore,选中mycore,点击D

2016-12-16 16:40:10 4012

转载 Java Web项目中解决中文乱码方法总结

一、了解常识:1.UTF-8国际编码,GBK中文编码。GBK包含GB2312,即如果通过GB2312编码后可以通过GBK解码,反之可能不成立; 2、web tomcat:默认是ISO8859-1,不支持中文的 3.Java.nio.charset.Charset.defaultCharset() 获得平台默认字符编码; 4.getBytes() 是通过平台默认字符集进行编码;二、引入在学习任何

2016-12-14 22:26:11 1197

转载 防止爬虫被墙的几个技巧(总结篇)

爬虫的目的就是大规模地、长时间地获取数据,跟我们正常浏览器获取数据相比,虽然机理相差不大,但总是一个IP去爬网站,大规模集中对服务器访问,时间一长就有可能被拒绝。关于爬虫长时间爬取数据,可能会要求验证码,即便是多个账号轮流爬取仍然会出现要求输入验证码的情况。技巧一:设置下载等待时间/下载频率  大规模集中访问对服务器的影响较大,爬虫可以短时间增大服务器负载。这里需要注意的是:设定下载等待时间的范围控

2016-12-11 13:11:26 4869

转载 Java程序在Linux中实现后台运行

1、运行脚本程序的目录结构如下[root@bogon SocketDxpTaxi]# lsconfig lib logs run.sh SocketDxpTaxi.jar[root@bogon SocketDxpTaxi]# find../run.sh./lib./lib/spring-data-commons-1.9.0.RELEASE.jar./lib/aspectjrt-

2016-12-11 12:57:09 1858

原创 tomcat中设置默认项目

有两种方法。 方法一:将项目拷贝到webapps下,并将项目名称改为ROOT; 方法二:设置虚拟路径。修改tomcat/conf/server.xml的Context配置项<Context path="" debug="0" docBase="你项目的决定路径" reloadable="true"></Context>。 方法二还需要删除webapps下的root目录,否则存在两个contex

2016-12-09 19:05:22 600

转载 设置Tomcat监听80端口

一开始看网上的教程直接设置tomcat目录的server.xml,发现并没有起作用,后面才得知这是因为只有root用户才可访问1024以下的端口。不过最后还是找到一种方法解决问题了。 解决方法:不用修改server.xml中的8080端口为80,直接在shell中执行如下命令即可:sudo iptables -t nat -A PREROUTING -p tcp --dport 80 -j RE

2016-12-04 09:51:37 608

原创 本地连接腾讯云Mysql失败问题

经过一番折腾,终于在腾讯云的Centos7环境下配置好了Mysql,而且在服务器上已经测试,能够提供服务,但是本地却连接不上服务器Mysql,真是令人着急啊,下面给出解决方案。1.检查网络 在本地ping 远程服务器 数据包正常传输,说明网络正常 2. 检查用户访问权限   MySQL建用户的时候会指定一个host,默认是127.0.0.1/localhost,那么这个用户就只能本机访问

2016-12-01 17:38:31 5218

原创 腾讯云Centos7系统tomcat7安装和测试

在 腾讯云Centos7.0 服务器上配置java开发环境一节中简单介绍了java开发环境的配置,那么本节就学习tomcat的安装和简单测试。 1.安装tomcat 安装命令如下: yum install tomcat tomcat7-webapps tomcat7-admin-webapps 安装之后tomcat目录信息如下: 配置信息在目录:/usr/share/tom

2016-12-01 16:27:48 3059

原创 腾讯云Centos7系统mysql server安装

首先,我们检测一下系统中是否已安装mysql的相关服务 命令: rpm -qa | grep mysql,无输出则证明未安装 然后yum检测查找系统自带的mysql安装文件 CentOS7的yum源中未找到mysql服务。所以,我们要先下载mysql的repo源。下载命令:wget http://repo.mysql.com/mysql-community-release-el7-5.no

2016-12-01 16:05:31 644

原创 腾讯云Centos 7.0 服务器上运行Java脚本和jar文件

1.运行java脚本编辑java源文件vim HelloWorld.java 创建并打开HelloWorld.java文件,编辑内容如下:public class HelloWorld { public static void main(String[] args){ System.out.println("hello world");

2016-11-30 23:33:26 3434

原创 腾讯云Centos7.0 服务器上配置java开发环境

1.前言  软工实验大项目(社交好友分析)包含一个java爬虫工程,因此需要单独部署在服务器上,那么第一步就是部署开发环境。所需工具如下:Centos 7.0 64位服务器java JDKyum库(腾讯云Centos 7.0 64位服务器上自带)2.配置java环境查看是否联网ping www.hit.edu.cn 数据传输正常,说明已经联网 2. 查看yum库中的Java安装

2016-11-30 23:07:06 3745

转载 利用infinitest的Continuous Testing插件实现Eclipse环境自动单元测试

当你Eclipse环境中修改项目中的某个方法时,你可能由于各种原因没有运行单元测试,结果代码提交,悲剧就可能随之而来。  所幸infinitest(http://infinitest.github.io/)提供了一个Continuous Testing插件,以及时自动运行单元测试,不过会占用一些CPU资源。安装方法有两种:用”Install new software”,输入地址:http://in

2016-11-20 22:30:55 1477

原创 git error: src refspec la5b does not match any.

git 提交本地分支到远程分支,出现error: src refspec la5b does not match any.错误,错误原因可能有以下两个:分支名字写错(我就是lab5b,写成了la5nb)目录中没有文件,空目录是不能提交上去的

2016-11-20 21:48:56 419

原创 常用推荐算法

推荐方法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。 一、基于内容推荐   基于内容的推荐(Content-based Recommendation)是信息过滤技术的延续与发展,它是建立在项目的内容信息上作出推荐的,而不需要依据用户对项目的评价意见,更多地需

2016-11-17 13:27:47 947

原创 Java简单使用jieba分词

1.下载jieba分词包:   下载地址:http://download.csdn.net/detail/wbcg111/9685021 2.配置,使用分词包com.huaban.analysis.jieba和com.huaban.analysis.jieba.viterbi放到src目录下dict.txt、jieba.java.code.style.xml和prob_emit.txt放到s

2016-11-16 20:42:59 28021 15

原创 Java String类型时间串 转SQL Date类型存入数据库

开发过程中经常会遇到Java字符串类型的时间需要存到数据库中,但是Java String 转date得到的结果往往不能直接存到数据库中,因为java与数据库date不太一样,因此还需要进一步的处理,非常麻烦。初学者往往费九牛二虎之力才能解决这一问题。   经过查阅资料,本人发现SQL本身具有一个to_date方法,可以自己把字符串转化为date类型,因此可以利用这一方法,仅需要在存数据库的时候存为

2016-11-16 20:19:54 6629

原创 Solr6.2.1 学习笔记(一)搭建运行环境(两种方式)

1.准备工作目前最新版本6.2.1,下载Solr6.2.1下载Java JDK8 下载并安装jdk1.8(solr6.*是基于JDK1.8开发的)tomcat8.0 下载并解压tomcat82.在jetty服务器下运行solr解压之后目录结构如下: solr5之后发布版本自带jetty服务器,可以自行启动。方式如下: 进入DOS窗口,然后切换到solr解压后的bin目录下(我的目录是

2016-10-13 19:16:55 6042 4

原创 windows下命令行控制 Tomcat

每次启动和关闭tomcat都要打开tomcat/bin目录双击tomcat.exe非常麻烦,作为程序员,当然要寻求命令行操作方式啊,具体步骤如下:windows下进入CMD启动在命令行中输入Tomcat安装的磁盘:E:进入Tomcat的主安装目录:cd Tomcat进入bin文件夹:cd bin查看该文件夹下边的文件目录:dir启动startup.bat 命令行中输入:startup.

2016-10-13 18:32:12 9789 1

原创 eclipse安装checkstyle、PMD、FindBugs、VisualVM

1.前言  Eclipse 安装插件一般都两种方式,一种是自动傻瓜式安装,仅需输入安装网址,即可自动安装;另外一种是下载对应压缩包,拷贝里面的两个文件夹plugins和 features下面的文件分别到eclipse目录下面对应的plugins和features目录。然后重启eclipse,即可使用,本教程主要介绍傻瓜式安装方式。2.安装checkstyleEclipse中,选择Help->Inst

2016-10-10 21:47:38 3727 1

原创 mysql 添加外键约束报错 1452

利用MySQL WorkBench为一张表的字段添加一个外键约束: INSERT INTO `se`.`book` (`ISBN`, `Title`, `AuthorID`, `Publisher`, `PublishDate`, `Price`) VALUES ('24022696', '从你的全世界路过', '3', '湖南文艺出版社', '2013-11', '30.60')执行结果报错:

2016-10-06 20:37:57 28278 3

原创 Eclipse中利用Struts2写出HelloWorld

1.配置Struts2开发环境1.1所需组件  Eclipse for Java EE、MySQL、Struts2(本教程采用的是Struts2的2.3版本,2.5版本有一些修改,不完全适用本教程)1.2环境配置新建一个Web项目,目录结构如下图所示 2. 添加Struts2和MySQL依赖包   在WEB-INF/lib下面添加相关依赖包,除图中标注出的MySQL依赖包,其他均为Strut

2016-09-27 21:04:22 776

原创 github push rejected问题

1、问题在网页上编辑了一下readme.md问件,然后再push本地文件到远程居然无法push,提示[rejected] master -> master (fetch first)。告诉我们需要先合并,然后才能push.2、解决办法git pullgit push -u origin master

2016-07-08 15:31:17 1254

原创 面试夏令营活动心得

一、准备  面试之前一定要好好准备,这个准备一定要有针对性。要明白这个活动需要有什么能力的人,准备简历的时候根据这些要求去准备。就像考试一样,要知道该题的考点,然后寻求该题的解决方法。   当初找辅导员签字时辅导员就说我的个人简历一看就不行,根本没有好好写,就是去充数的。然后在他的指导下经过一番修改,看上去真的立马不一样了。原来自己也有很多事迹可以写啊,为什么之前自己一点都想不到呢?同样一件事为什

2016-07-05 17:19:52 3965

原创 自己动手实现主题搜索引擎

1.前言:   软件设计要写大作业了,好慌啊,写什么好呢,室友居然把Everything实验了,那我也写一个与搜索有关的玩玩吧。突然想到大一时候自学过利用whoosh和solr写过简单的搜索引擎,那么今天就自己动手试一试吧。2.简介  本项目主要实现了一个主题搜索引擎。主题搜索引擎是针对某一个领域的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的

2016-05-30 21:13:57 5595 4

原创 初探MFC之校园导航系统

1.前言:  c++实验课,作死选了个校园导航项目,没办法,只能写界面了,一切从头开始。2.简介  mfc是c++可用的一个开发框架,包括了界面和很多的类库,界面的实现全部是封装的windows api。并且很多类库非常强大。3.简单的校园导航系统3.1项目简介  校园导航系统需要有类似于GPS的导航功能,即突破传统地图的限制性,帮助用户选择出最短路径。为实现此功能,需要用户输入起始地点和终止地点的

2016-05-20 19:11:02 5556 3

原创 error LNK2019: 无法解析的外部符号

第一次写MFC程序,在生成的Dlg.cpp中要加入自己写的工具类,但是引入.h文件之后报错 error LNK2019: 无法解析的外部符号 很是郁闷,经过一番查找,都在说是缺少库文件,项目–》属性–》配置属性–》链接器-》输入–》附加依赖项 在其中加入所需库文件,同时在“链接器–》常规–》附加库目录”中填入相应库名,这样应该就可以了。 但是我都不知道缺哪个库文件怎么办啊,又是一番查找,发现

2016-05-20 16:39:01 394

原创 正整数的中文读法(C++ Python)

基本思路(1)数字到中文的映射(2)每四位作为一个单元处理(3)从简入手,逐步细化映射中文读法中会出现的汉字如下: 零;一、二、… 、九;十、百、千;万、亿零比较特殊,单独存储一、二、…、九是计数的基本数字,存为一个数组十、百、千是每个万组里面的单位,存为一个数组万、亿是更大单位,存为一个数组基本处理通过循环得到正整数各个位的数字,数据保存到数组data[]中通过取模运算和除法运算

2016-04-17 00:07:01 2579

原创 优化的三叉哈夫曼树

1. 背景 在通讯、计算机网络、数据压缩、图像处理中,哈夫曼编码是一项极其重要的技术。哈夫曼编码是建立在二叉哈夫曼树的基础上,如果能够找到比二叉哈夫曼树更好的数据结构,那么对数据压缩等将起到促进作用。本文通过论述二叉哈夫曼树编码算法以及普通的三叉哈夫曼树编码算法,给出一种优化的三叉哈夫曼编码算法。2. 哈夫曼编码2.1 哈夫曼编码 哈夫曼编码是根据每个字符出现的频率进行编码的,依据字符出现

2016-03-28 16:08:46 14924 8

转载 线索二叉树的原理以及创建和遍历(c++)

这是一篇非常好的关于线索二叉树的文章,内容详细到位,叙述清晰。作者是以为很认真、信息的人,估计花了不少时间和精力,向作者致敬!引用地址:http://waret.iteye.com/blog/709779PROCEDURE INTHREAD(BT,h) IF BT != 0 THEN { INTHREAD(L(BT),h) I

2016-03-26 10:31:12 3878

转载 Skip List(跳跃表)原理详解与实现

Skip List(跳跃表)原理详解与实现 本文内容框架:§1 Skip List 介绍§2 Skip List 定义以及构造步骤 §3 Skip List 完整实现§4 Skip List 概率分析§5 小结   §1 Skip List 介绍 Skip List是一种随机

2016-03-10 21:00:11 492

原创 JAVA 时间格式转换

时间和日期中常用到的几个类:java.util.Date, java.util.Calendar, java.util.GregorainCalendar, java.text.DateFormat, java.text.SimpleDateFormat java.util.Date : 表示特定瞬间,精确到毫秒 一天是 24 * 60 * 60 = 86400

2016-03-10 15:10:55 502

转载 稀疏矩阵的压缩存储及其两种转置算法

1  什么是稀疏矩阵       有较多值相同元素或较多零元素,且值相同元素或者零元素分布没有一定规律的矩阵称为稀疏矩阵。假设在mXn的矩阵中,有t个元素不为零,令c=t/mXn则称为矩阵的稀疏因子,通常认为c2 稀疏矩阵的压缩存储(只讨论有较多零元素矩阵的压缩存储);如何进行稀疏矩阵的压缩存储?稀疏矩阵的压缩存储有多种方法,本文主要介绍三元组顺序表这种存储方式。1)三元组表

2016-03-08 21:38:50 8650

转载 优先队列及最小堆最大堆

1 堆    1.1 简介n个关键字序列Kl,K2,…,Kn称为(Heap),当且仅当该序列满足如下性质(简称为堆性质):(1)ki=号。//k(i)相当于二叉树的非叶结点,K(2i)则是左孩子,k(2i+1)是右孩子若将此序列所存储的向量R[1..n]看做是一棵完全二叉树的存储结构,则堆实质上是满足如下性质的完全二叉树:树中任一非叶结点的关键字均不大于(或不小于)其左右孩子(

2016-03-08 17:07:16 551

转载 从头到尾彻底理解KMP

作者:July   原文:http://blog.csdn.net/v_july_v/article/details/7041827时间:最初写于2011年12月,2014年7月21日晚10点 全部删除重写成此文,随后的半个多月不断反复改进。后收录于新书《编程之法:面试和算法心得》第4.4节中。1. 引言    本KMP原文最初写于2年多前的2011年12月,因当时

2016-03-07 19:45:04 524

转载 SolrCloud

SolrCloud 是基于 Solr 和 Zookeeper 的分布式搜索方案,是正在开发中的 Solr4.0 的核心组件之一,它的主要思想是使用 Zookeeper 作为集群的配置信息中心。它有几个特色功能:①集中式的配置信息 ②自动容错 ③近实时搜索 ④查询时自动负载均衡。下面看看 wiki 的文档:1、SolrCloudSolrCloud 是指 Solr 中一套新的潜

2015-12-26 15:20:26 584

原创 Solr 配置中文分词smartcn

solr的同步发行包smartcn可进行中文切词,smartcn的分词准确率不错,但就是不能自己定义新的词库,不过smartcn是跟solr同步的,所以不需要额外的下载,只需在solr的例子中拷贝进去即可。第一步: 找到如上目录下面的smartcn包,复制。 粘贴到上图目录下即可。第二步:在schema.xml中注册分词器: 上图所示即为注册。 上图所示使用分词器即可大功告成。

2015-09-30 21:34:59 2215

翻译 使用PSFTP工具传输文件的命令使用方法

本文翻译自PuTTY官方文档 Using PSCP to transfer files securely1.安装PSFTP在PUTTY官方网站www.putty.org上可以下载PUTTY的所有工具,其中一项就是PSFTP。下载地址: http://www.chiark.greenend.org.uk/~sgtatham/putty/download.html http://the.earth.

2015-09-28 17:23:38 14658 4

原创 SolrCloudpy 学习笔记

转载请声明出处:http://blog.csdn.net/wbcg111/article/details/48090969solrcloudpy简介solrcloudpy是python与solrcloud进行交互的一个库。这个库目的在于利用solr的以下优势:分布式索引与检索和清晰的故障分析完整JSON API集中式索引管理近实时搜索这个API在某种程度上与pymongo的API十分相似。

2015-08-29 20:27:58 1613

原创 Solr 查询参数

solr常用查询参数q:查询关键词。支持 AND,OR ,*,?。支持多字段查询,模糊匹配。fq:filter query,过虑查询。sort:排序规则。默认按score排序。start, rows:分页参数。start:开始的位置,rows:返回条数(page size)。fl: 用来指定文档结果中应返回的 Field 集。默认为 “*”,指所有的字段。用逗号分隔的列表。df:默认的查

2015-08-22 20:38:47 1848

翻译 sunburnt 学习笔记 (八)管理索引

转载请声明出处:http://blog.csdn.net/wbcg111/article/details/47452101在之前的介绍中,我们提到了commit()方法,它具有三个可选参数:waitSearcherexpungeDeletessoftCommit详情见:http://wiki.apache.org/solr/UpdateXmlMessagesOptimizing(优化)更新数

2015-08-12 21:51:06 627

哈工大 研究生 人工智能原理课程相关材料及历年考题

哈工大 研究生 人工智能原理课程相关材料及历年考题

2020-12-27

哈工大 研究生 最优化课程相关材料

哈工大 研究生 最优化课程相关材料 哈工大 研究生 最优化课程相关材料 哈工大 研究生 最优化课程相关材料

2020-11-27

哈工大 研究生 《数理统计》课堂笔记

哈工大 研究生 《数理统计》课堂笔记

2020-09-16

数理统计课本答案参考.pdf

哈工大研究生《数理统计》课后参考答案,pdf版本,非扫描版本

2020-09-16

ik+mmseg分词器

ik+mmseg分词器,适用于solr6.1版本,内附说明 亲测可用!!!

2017-11-14

微博分类语料

4万条微博数据,详细分为21类

2017-07-11

utf8与gb312编码互相转换

utf8与gb312编码互相转换,有ASCII编码是可能存在bug

2017-03-13

jieba分词资源包

结巴分词用到的资源文件,使用方式见博客

2016-11-16

xilinx ISE14.7 license

2016-07-08

校园导航系统

c++实现校园导航系统 ,算法采用Dijkstra,GUI采用MFC

2016-05-30

自己动手制作主题搜素引擎

自己动手制作主题搜索引擎,包含数据抓取和搜索,数据抓取采用启发式爬虫,搜索利用正常思路

2016-05-30

中文分词词典

含有43万条非重复语料

2016-05-30

《Python Cookbook》第三版中文

最新的python cookbook,学习python的必读经典

2016-03-07

putty使用方法

非常详细的Putty文档,各种操作命令一应俱全,值得拥有!

2015-10-22

solr in action

solr in action 的完整版本,值得一看

2015-07-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除