自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (1)
  • 收藏
  • 关注

原创 准确率(Accuracy) 精确率(Precision) 召回率(Recall)和F1-Measure

先验知识  我们首先将数据的类别统一分为两类:正类和负类。例如:一个数据集中的数据一共有3类,小学生、中学生、高中生。我们的目标是预测小学生,那么标记为小学生的数据就是正类,标记为其他类型的数据都是负类。  数据有两种状态:测试集数据和预测结果数据。  对一批测试数据进行预测,结果可以分成四种。TP(True Positive): 原本是正类,预测结果为正类。(正确预测为正类)...

2018-04-02 16:37:06 7930 2

原创 50行读懂Python编码

编码格式  世界上的任意字符在计算机中,都是用一串二进制的数字来表示的,只不过同一个字符在不同的编码格式下,对应的数字不同,长度也不一样。ASCII  ASCII 是最早的编码规范,但是只能表示128个字符。扩展ASCII码  后来有了扩展ASCII码,扩展到了256个字符。Unicode  世界上的字符辣么多,256个就够了吗?Unicode 包含了世界上...

2018-03-27 14:15:25 678

原创 朴素贝叶斯

更好的阅读体验,点我移步到我的个人博客朴素贝叶斯贝叶斯定理设\( X \)是代表一条数据,由\( n \)个属性构成;\( H \)为某种假设,如数据\( X \)属于某个特定的类\( C \)。\( P(H|X)\) 是在已知\( X \)的几个属性下,\( X \)属于某个类\( C \)的概率。贝叶斯定理如下: P(H|X)=P(X|H)P(H)P(X) P(H|X) = \frac{P(

2017-06-01 15:22:06 470

原创 机器学习笔记---决策树

决策树

2017-05-25 18:40:58 643

原创 (*:update) Conflicting cross-version suffixes in: org.scala-lang.modules:scala-xml

异常如下:// 所有jar包依赖的Scala版本号必须一致,// 即所有以2.11结尾的jar(如spark-core_2.11)都依赖2.11.x版本的Scala,所以必须用2.11.x版本的Scala,否则会出现Scala包依赖冲突[info] Loading project definition from D:\IdeaProjects\spark-practice\project

2017-05-18 19:22:27 2813

原创 Scala String.replaceALL() 替换 '\' 字符

Exception in thread "main" java.util.regex.PatternSyntaxException: Unexpected internal error near index 1

2017-05-16 15:14:51 17914

原创 mongo-spark-connector笔记

记一次神奇的mongo-spark-connector

2017-05-12 20:33:17 5077 3

原创 Gson笔记

将Bean类转换成Json字符串val jsonStr = new Gson().toJson(bean)将Json字符串转换成对象val beanObject = new Gson().fromJson(jsonStr,beanClass)// 例如:将json字符串转换成map对象(Scala写法)val map:Map[String,Object] = new Gson().fromJ

2017-05-12 19:52:15 337

转载 TCP/IP三次握手四次挥手流程解析及TCP/IP四层模型

TCP/IP三次握手四次挥手流程解析: http://www.2cto.com/net/201310/251896.html TCP/IP四层模型: http://www.cnblogs.com/BlueTzar/articles/811160.html OSI七层模型: http://blog.csdn.net/superjunjin/article/details/7841099/

2017-04-24 23:12:13 468

原创 MongoDB:将Json数据直接写入MongoDB的方法

Json转BsonMongoDB中是以Bson数据格式进行存储的,Json字符串没有办法直接写入MongoDB 可以将Json字符串转换成DBObject或者Document,然后写入MongoDB1、将Json字符转换成com.mongodb.DBObject(准确的说是BasicDBObject)scala版本import com.mongodb.DBObject...

2017-04-01 18:01:50 23453 5

原创 在linux服务器上部署自己的git库,并配置IDEA上传项目到git库

linux服务器上搭建自己的git库,并配置IDEA上传项目到git库中

2017-02-28 11:32:18 2618

原创 Linux常用命令

linux常用命令以及简介。最近在公司学习大数据,少不了和linux打交到,下面是半年来使用过的linux相关的命令,想起来的就整理了一下,以供查阅,并督促自己时常整理所学知识。 也可以帮初学者梳理一下~

2017-02-23 09:40:43 523

原创 如何用idea打jar包

idea build artifacts, Library File和Extracted Directory的区别

2017-01-17 17:03:40 2324

原创 sbt编译出现(*:ssExtractDependencies) java.lang.IllegalStateException

[error] (*:update) java.lang.IllegalStateException: impossible to get artifacts when data has not been loaded. IvyNode = com.google.guava#guava;11.0.2

2017-01-16 16:49:55 1394

原创 Spark sbt-assembly 打包

因为要用spark2.0,而集群上cdh5.7.1的spark版本是1.6的,在单独使用spark2.0的时候出现了hbase包找不到的问题,因为spark-submit –jars属性引的包太多,就干脆直接用sbt将相关的jar包打成fat-jar,期间遇到了一些问题,在此记录一下。开发环境使用的是idea,装了sbt插件后以为就可以直接在terminal命令窗口中直接运行sbt了,但实际上会告

2017-01-16 12:46:48 5692

翻译 欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2017-01-13 14:01:02 223

原创 Scala变长数组

Scala变长数组ArrayBuffer

2017-01-11 13:15:16 1050

原创 MLlib-Kmeans遇到的异常

java.lang.IllegalArgumentException: requirement failed

2016-11-30 22:23:39 1699

原创 windows下配置JDK环境变量,java -version版本却不改变解决办法?

windows下配置JDK环境变量,java -version版本却不改变解决办法?

2016-11-29 23:52:09 809 1

原创 hadoop集群搭建

VM12安装centos7,hadoop集群搭建。未完,有空就写点。

2016-11-29 21:16:47 227

Xshell个人版(personal)

Xshell个人版,免费版本免费版本免费版本免费版本免费版本免费版本!

2018-02-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除