自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 问答 (1)
  • 收藏
  • 关注

原创 selenium webdriver方法qiut()close()区别

最近在研究chrome headless 版本号59+ 但是selenium的webdriver最新版本最高支持chrome58。driver.close()调试过程出现bug:raise exception_class(message, screen, stacktrace)selenium.common.exceptions.WebDriverException: Message:

2017-06-12 11:36:36 3722

原创 hive和hbase的关系

HIVE和HBASE区别1. 两者分别是什么?   Apache Hive是一个构建在Hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被转化为Map/Reduce. 虽然Hive提供了SQL查询功能,但是Hive不能够进行交互查询--因为它只能够在Haoop上批量的执行Hadoop。

2017-06-07 13:44:20 1778

原创 \r,\n,\r\n的区别

本文导读:‘\r’是回车,’\n’是换行,前者使光标到行首,后者使光标下移一格,通常敲一个回车键,即是回车,又是换行(\r\n)。Unix中每行结尾只有“<换行>”,即“\n”;Windows中每行结尾是“<换行><回车>”,即“\n\r”;Mac中每行结尾是“<回车>”。\n是换行,英文是New line,表示使光标到行首\r是回车,英文是Carriage return,表示使光标下移一格\

2017-04-25 16:12:55 334

原创 《机器学习实战》第二章 k-近邻算法

概述k-近邻算法(kNN)采用测量不同特征值之间的距离进行分类优点:精度高、异常值不敏感。缺点:计算复杂度高、空间复杂度高。适用范围:数值型和标称型 工作原理:新数据与样本数据的特征进行比较,提取出最相似(距离最近的k个数据)的数据所对应的分类标签,选择k个最相似数据中出现最多的分类。

2017-04-23 16:27:05 324

原创 《机器学习实战》第一章 机器学习基础

第一章 机器学习基础

2017-04-23 15:05:37 363

原创 selenium+python+phantomjs爬虫博客排行榜

#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time : 2017/4/11 19:21# @Author : wanghaitao# @File : spider.py# @Software: PyCharmimport codecsfrom selenium import webdriverfrom selenium.webdriver.com

2017-04-12 13:38:18 371

转载 Intellij IDEA快捷键使用

Intellij IDEA中有很多快捷键让人爱不释手,stackoverflow上也有一些有趣的讨论。每个人都有自己的最爱,想排出个理想的榜单还真是困难。以前也整理过Intellij的快捷键,这次就按照我日常开发时的使用频率,简单分类列一下我最喜欢的十大快捷-神-键吧。1 智能提示Intellij首当其冲的当然就是Intelligence智能!基本的代码提示用Ctrl+Space,

2017-01-11 14:22:43 211

原创 Java访问权限修饰符详解

对Java中的修饰符一直记不住,现在结合网上的一些资料进行总结,并重点说明一下protected修饰符。一. Java中的访问修饰符  Java面向对象的基本思想之一是封装细节并且公开接口。Java语言采用访问控制修饰符来控制类及类的方法和变量的访问权限,从而向使用者暴露接口,但隐藏实现细节。访问控制分为四种级别:  (1)public: 用public修饰的类、类属变量及

2017-01-10 17:36:27 381

原创 Java n选k程序

写一个小程序,实现n个数据里面随机选择k个,想到了两种方式:数据放在数组中,随即产生一个index,将最后一个元素挪到index的位置,并n–,保证已经被抽到的数值不会被在此抽到。把数据放在set中,随机选择一个数据,并在set中remove即可,对于如何随机删除set中的一个元素,待解决。上代码:package CoreJava;import java.util.Arrays;import

2016-11-23 17:44:01 692

原创 Java大数-BigInteger BigDecimal

今天接触第一次接触java大数,写个双色球的demo吧,期间出了很多问题,主要是BigDecimal的divide方法,即除法运算。通过BigDecimal的divide方法进行除法时当不整除,出现无限循环小数时,就会抛异常的。异常如下: java.lang.ArithmeticException: Non-terminating decimal expansion; no exact rep

2016-11-22 17:06:19 311

转载 Java输入输出流

1.什么是IO      Java中I/O操作主要是指使用Java进行输入,输出操作. Java所有的I/O机制都是基于数据流进行输入输出,这些数据流表示了字符或者字节数据的流动序列。Java的I/O流提供了读写数据的标准方法。任何Java中表示数据源的对象都会提供以数据流的方式读写它的数据的方法。        Java.io是大多数面向数据流的输入/输出类的主要

2016-11-22 13:38:02 283

原创 Java代码点和代码单元

java代码点和代码单元的区别。java打印所有汉字

2016-11-21 17:35:23 284

原创 数据基础

大数据产业大数据产业生产流程: 数据收集,数据存储,数据建模,数据分析,数据变现。大数据方向: 架构、分析、开发数据基础数据的定义: 必须承载一定的信息;取决于读者的主观视角信息的定义: 信息是用来消除不确定性的东西(香农)。商业智能: 应用应用基于事实的支持系统来辅助商业决策的制定。概率统计论古典概型: 随机试验结果是有限的且每个事件发生的概率相同。这种试验叫做拉普拉

2016-11-20 21:34:19 288

原创 《数学之美》--文字和语言vs数字和信息

文字和语言vs数字和信息1、语言和数学的产生都是为了一个目的:记录和传播信息。2、文字本身的载体是纸张还是石头不重要,它所承载的信息才是最重要的。3、信息的冗余是信息安全的保障;双语或者多语的预料对翻译至关重要,它是我们从事机器翻译研究的基础。4、从象形文字到拼音文字是一个飞跃,因为人类在描述物体的方式上,从物体的外表进化到了抽象的概念,同时不自觉的采用了对信息的编码。5、常用字笔划短,生

2016-11-14 11:49:19 314

翻译 正则表达式总结

概念是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。在很多文本编辑器或其他工具里,正则表达式通常被用来检索和/或替换那些符合某个模式的文本内容。许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex”,单数

2016-10-27 11:47:05 161

原创 判断一个图是否有环

对于无向图算法1我们知道对于环1-2-3-4-1,每个节点的度都是2,基于此我们有如下算法(这是类似于有向图的拓扑排序):求出图中所有顶点的度,删除图中所有度如果还有度最后如果还存在未被删除的顶点,则表示有环;否则没有环时间复杂度为O(E+V),其中E、V分别为图中边和顶点的数目,这个算法我们稍后分析算法3的时候再分析。 算法2深度优先遍历该

2016-10-19 17:25:14 17551 1

转载 STL list,vector,deque区别

list,vector,deque有什么区别  vector表示一段连续的内存区域每个元素被顺序存储在这段内存中对vector的随机访问比如先访问元素5 然后访问15然后再访问7等等效率很高,因为每次访问离vector起始处的位移都是固定的。但是在任意位置而不是在vector末尾插人元素则效率很低 ,因为它需要把待插入元素右边的每个元素都拷贝一遍。类似地删除任意

2016-05-12 14:05:48 624

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除