自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 VaklueError:Object arrays cannot be loaded when allow_pickle=False 问题处理

在anaconda中用Numpy读取npz文件时出现如上错误,一般是Numpy的版本问题,需要更换numpy版本。下面是我解决问题的方法,亲测简单且有效在anaconda中找到environment搜索找到Numpy,选中前面的绿框,选择 特定版本安装,选择1.16.1版本,然后apply等待一会儿,查看是否成功安装上1.16.1版本(也有可能要多安装几遍才成功)安装完...

2020-04-27 23:28:20 155

原创 Kmeans-Mapreduce实现邮件分类

TF-IDF向量计算TF-IDF是针对文本统计的方法。其主要思想在于将每个文档视为一个向量,而其每个分量是由某个单词计算出的数据。TF-IDF对单词的统计包含两个方面,一个是词频一个是逆文档频率。词频即是一个单词在文档中出现的频率,逆文档频率是一个单词在全部文档中出现的频率,它相当于对单词的加权,在众多文档中出现频率较高的无关词比如冠词,介词等虚词的逆文档频率较低,使其在衡量文档相似度中做出的贡...

2019-03-24 23:32:25 668

原创 面试经典问题整理(持更)

文章目录操作系统1. 进程和线程的区别2. 内存中的进程结构3. 进程状态4. 进程间的通信如何实现5. 死锁6.作业调度7. 临界区和临界资源8.线程共享数据的方式数据库1. 事务四大特性2. 索引优缺点3. join4. 视图5. 游标6. 主键和外键7. 常用语句计网1.Http和Https的区别2.三次握手与四次挥手3.为什么TCP需要三次握手,两次不可以么4. TCP与UDP的区别5. ...

2019-03-24 23:02:13 248

原创 hadoop入门·wordcount

MapReduce实现wordcountMapreduce实现主要是通过继承map和reduce类完成。在map中,让每一个节点对其邮件资源进行单词计数,构成键值对输出;reduce中接受键值对,对键相同的对进行合并,即可将各个节点的统计信息加以汇总。将文件传到hdfs上就可以进行wordcount统计啦,下面是代码: import java.io.IOException; im...

2019-03-24 22:25:05 124

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除