- 博客(4)
- 收藏
- 关注
原创 Task5
前馈神经网络原理BP神经网络讲解from keras.layers.core import Dense, Activation, Dropoutfrom keras.layers.normalization import BatchNormalizationfrom keras import Sequentialmodel = Sequential()model.add(Dense(2...
2019-03-11 19:37:27 131
原创 task4
原理:带你理解朴素贝叶斯分类算法利用朴素贝叶斯模型进行文本分类from sklearn.naive_bayes import MultinomialNB# 将文本进行tf-idftfv = TfidfVectorizer()tfv.fit(list(xtrain) + list(xvalid))xtrain_tfv = tfv.transform(xtrain) xvalid_t...
2019-03-09 21:17:11 170
原创 Task3笔记+代码
TF-IDF原理参考文章:阮一峰的网络日志这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,但是出乎意料的是,有一个非常简单的经典算法,可以给出令人相当满意的结果。它简...
2019-03-07 20:19:57 238
原创 TASK2笔记+代码
中文分词之正向最大匹配法 逆向最大匹配法 双向最大匹配法1.正向最大匹配法:摘自link分词算法设计中的几个基本原则:1、颗粒度越大越好:用于进行语义分析的文本分词,要求分词结果的颗粒度越大,即单词的字数越多,所能表示的含义越确切,如:“公安局长”可以分为“公安 局长”、“公安局 长”、“公安局长”都算对,但是要用于语义分析,则“公安局长”的分词结果最好(当然前提是所使用的词典中有这个词)...
2019-03-05 17:59:36 294
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人