ahawdy-CSDN博客

原创 VaklueError:Object arrays cannot be loaded when allow_pickle=False 问题处理

在anaconda中用Numpy读取npz文件时出现如上错误，一般是Numpy的版本问题，需要更换numpy版本。下面是我解决问题的方法，亲测简单且有效在anaconda中找到environment搜索找到Numpy，选中前面的绿框，选择特定版本安装，选择1.16.1版本，然后apply等待一会儿，查看是否成功安装上1.16.1版本（也有可能要多安装几遍才成功）安装完...

2020-04-27 23:28:20 155

原创 Kmeans-Mapreduce实现邮件分类

TF-IDF向量计算TF-IDF是针对文本统计的方法。其主要思想在于将每个文档视为一个向量，而其每个分量是由某个单词计算出的数据。TF-IDF对单词的统计包含两个方面，一个是词频一个是逆文档频率。词频即是一个单词在文档中出现的频率，逆文档频率是一个单词在全部文档中出现的频率，它相当于对单词的加权，在众多文档中出现频率较高的无关词比如冠词，介词等虚词的逆文档频率较低，使其在衡量文档相似度中做出的贡...

2019-03-24 23:32:25 668

原创面试经典问题整理(持更)

文章目录操作系统1. 进程和线程的区别2. 内存中的进程结构3. 进程状态4. 进程间的通信如何实现5. 死锁6.作业调度7. 临界区和临界资源8.线程共享数据的方式数据库1. 事务四大特性2. 索引优缺点3. join4. 视图5. 游标6. 主键和外键7. 常用语句计网1.Http和Https的区别2.三次握手与四次挥手3.为什么TCP需要三次握手，两次不可以么4. TCP与UDP的区别5. ...

2019-03-24 23:02:13 248

原创 hadoop入门·wordcount

MapReduce实现wordcountMapreduce实现主要是通过继承map和reduce类完成。在map中，让每一个节点对其邮件资源进行单词计数，构成键值对输出；reduce中接受键值对，对键相同的对进行合并，即可将各个节点的统计信息加以汇总。将文件传到hdfs上就可以进行wordcount统计啦，下面是代码： import java.io.IOException; im...

2019-03-24 22:25:05 124

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 VaklueError:Object arrays cannot be loaded when allow_pickle=False 问题处理

原创 Kmeans-Mapreduce实现邮件分类

原创 面试经典问题整理(持更)

原创 hadoop入门·wordcount

空空如也

空空如也

原创面试经典问题整理(持更)