自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 简单理解 Java I/O 模型

在理解java的I/O 模型之前先来看下基础的I/O 模型1.BIO 阻塞型I/O: 顾名思义在进程发出I/O请求后,进程阻塞,在操作系统I/O操作完成,即数据准备就绪后,进程恢复运行2 NIO 非阻塞型I/O:进程进行I/O请求后 立刻返回,如果数据没有准备好,则返回空,在使用时需要以轮询的方式反复进行I/O请求,确保数据到达。3 I/O 多路复用(IO multiplexing)...

2020-01-14 10:42:56 143

原创 爬虫技术 selenium 入门 ----模拟百度搜索

1获取方式1.1maven 构建的依赖 <dependency> <groupId>org.seleniumhq.selenium</groupId> <artifactId>selenium-java</artifactId> <version>3.12.0</vers...

2018-06-12 19:55:13 338

原创 爬虫技术之 htmlunit 使用入门

1 htmlunit简介 htmlunit是java实现的开源无界面浏览器,可以有效的加载动态页面。2 htmlunit的获取2.1 maven 构建<dependency> <groupId>net.sourceforge.htmlunit</groupId> <artifactId>htmlunit</artifactId>...

2018-06-10 16:22:51 1138 1

原创 爬虫技术 httpclient模拟发包

1 http数据包的组成     作为一个去模拟发包的程序猿,在实际发包之前,你首先要知道的是,数据包中你需要关注的东西。1.1 url     这个不用多说,就是发出去的请求1.2 请求类型   常见的如get put delete post 等1.3 请求头      包含一些请求头字段 比如爬虫中经常用到的 User-Agent等1.4 请求体    主要是post 请求中附带的参数,如提交...

2018-06-06 20:36:40 1364

原创 java爬虫 httpclient htmlunit selenium 比较

简单介绍。1 httpclient     httpclient 是 HttpClient 是 Apache Jakarta Common 下的子项目 ,支持常用的各种协议,相对比较底层,很多java项目的互联网编程都是依赖于该包 。2 htmlunit  相当与一个没有ui的浏览器,本身就是对httpclient进行封装。3 selenium    这个最早是基于firfox的自动化测试软件,现...

2018-06-05 20:12:39 3528

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除