- 博客(20)
- 资源 (1)
- 收藏
- 关注
原创 准确率(Accuracy) 精确率(Precision) 召回率(Recall)和F1-Measure
先验知识 我们首先将数据的类别统一分为两类:正类和负类。例如:一个数据集中的数据一共有3类,小学生、中学生、高中生。我们的目标是预测小学生,那么标记为小学生的数据就是正类,标记为其他类型的数据都是负类。 数据有两种状态:测试集数据和预测结果数据。 对一批测试数据进行预测,结果可以分成四种。TP(True Positive): 原本是正类,预测结果为正类。(正确预测为正类)...
2018-04-02 16:37:06 7930 2
原创 50行读懂Python编码
编码格式 世界上的任意字符在计算机中,都是用一串二进制的数字来表示的,只不过同一个字符在不同的编码格式下,对应的数字不同,长度也不一样。ASCII ASCII 是最早的编码规范,但是只能表示128个字符。扩展ASCII码 后来有了扩展ASCII码,扩展到了256个字符。Unicode 世界上的字符辣么多,256个就够了吗?Unicode 包含了世界上...
2018-03-27 14:15:25 678
原创 朴素贝叶斯
更好的阅读体验,点我移步到我的个人博客朴素贝叶斯贝叶斯定理设\( X \)是代表一条数据,由\( n \)个属性构成;\( H \)为某种假设,如数据\( X \)属于某个特定的类\( C \)。\( P(H|X)\) 是在已知\( X \)的几个属性下,\( X \)属于某个类\( C \)的概率。贝叶斯定理如下: P(H|X)=P(X|H)P(H)P(X) P(H|X) = \frac{P(
2017-06-01 15:22:06 470
原创 (*:update) Conflicting cross-version suffixes in: org.scala-lang.modules:scala-xml
异常如下:// 所有jar包依赖的Scala版本号必须一致,// 即所有以2.11结尾的jar(如spark-core_2.11)都依赖2.11.x版本的Scala,所以必须用2.11.x版本的Scala,否则会出现Scala包依赖冲突[info] Loading project definition from D:\IdeaProjects\spark-practice\project
2017-05-18 19:22:27 2813
原创 Scala String.replaceALL() 替换 '\' 字符
Exception in thread "main" java.util.regex.PatternSyntaxException: Unexpected internal error near index 1
2017-05-16 15:14:51 17914
原创 Gson笔记
将Bean类转换成Json字符串val jsonStr = new Gson().toJson(bean)将Json字符串转换成对象val beanObject = new Gson().fromJson(jsonStr,beanClass)// 例如:将json字符串转换成map对象(Scala写法)val map:Map[String,Object] = new Gson().fromJ
2017-05-12 19:52:15 337
转载 TCP/IP三次握手四次挥手流程解析及TCP/IP四层模型
TCP/IP三次握手四次挥手流程解析: http://www.2cto.com/net/201310/251896.html TCP/IP四层模型: http://www.cnblogs.com/BlueTzar/articles/811160.html OSI七层模型: http://blog.csdn.net/superjunjin/article/details/7841099/
2017-04-24 23:12:13 468
原创 MongoDB:将Json数据直接写入MongoDB的方法
Json转BsonMongoDB中是以Bson数据格式进行存储的,Json字符串没有办法直接写入MongoDB 可以将Json字符串转换成DBObject或者Document,然后写入MongoDB1、将Json字符转换成com.mongodb.DBObject(准确的说是BasicDBObject)scala版本import com.mongodb.DBObject...
2017-04-01 18:01:50 23453 5
原创 在linux服务器上部署自己的git库,并配置IDEA上传项目到git库
linux服务器上搭建自己的git库,并配置IDEA上传项目到git库中
2017-02-28 11:32:18 2618
原创 Linux常用命令
linux常用命令以及简介。最近在公司学习大数据,少不了和linux打交到,下面是半年来使用过的linux相关的命令,想起来的就整理了一下,以供查阅,并督促自己时常整理所学知识。 也可以帮初学者梳理一下~
2017-02-23 09:40:43 523
原创 sbt编译出现(*:ssExtractDependencies) java.lang.IllegalStateException
[error] (*:update) java.lang.IllegalStateException: impossible to get artifacts when data has not been loaded. IvyNode = com.google.guava#guava;11.0.2
2017-01-16 16:49:55 1394
原创 Spark sbt-assembly 打包
因为要用spark2.0,而集群上cdh5.7.1的spark版本是1.6的,在单独使用spark2.0的时候出现了hbase包找不到的问题,因为spark-submit –jars属性引的包太多,就干脆直接用sbt将相关的jar包打成fat-jar,期间遇到了一些问题,在此记录一下。开发环境使用的是idea,装了sbt插件后以为就可以直接在terminal命令窗口中直接运行sbt了,但实际上会告
2017-01-16 12:46:48 5692
翻译 欢迎使用CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2017-01-13 14:01:02 223
原创 MLlib-Kmeans遇到的异常
java.lang.IllegalArgumentException: requirement failed
2016-11-30 22:23:39 1699
原创 windows下配置JDK环境变量,java -version版本却不改变解决办法?
windows下配置JDK环境变量,java -version版本却不改变解决办法?
2016-11-29 23:52:09 809 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人