weixin_45557267-CSDN博客

原创 NLP常见任务小记

根据判断主题的级别, 将所有的NLP任务分为两种类型: 1.token-level task: token级别的任务. 如完形填空(Cloze), 预测句子中某个位置的单词; 或者实体识别; 或是词性标注; SQuAD等. 2.sequence-level task: 序列级别的任务, 也可以理解为句子级别的任务. 如情感分类等各种句子分类问题; 推断两个句子的是否是同义等. token-level task Cloze task 即BERT模型预训练的两个任务之一, 等价于完形填空任务, 即给出句子中其他

2020-07-25 18:58:32 159

原创 NLP一般流程小记

NLP一般流程小记 1.获取语料语料，是NLP任务所研究的内容，通常用一个文本集合作为语料库（Corpus）来源：已有语料，积累的文档，下载语料 2. 语料预处理 1）语料清洗：留下有用的，删掉噪音数据常见的数据清洗方式：人工去重、对齐、删除和标注等，或者规则提取内容、正则表达式匹配、根据词性和命名实体提取、编写脚本或者代码批处理等。 2）分词：将文本分成词语常见的分词算法：基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法和基于规则的分词方法 3）词性标注：给词语打词类标签，如形容

2020-07-20 17:22:47 237

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_45557267的博客

原创 NLP常见任务小记

原创 NLP一般流程小记

原创动手学深度学习笔记03

原创动手学深度学习笔记2

原创伯禹课程动手学深度学习笔记1

空空如也

空空如也

原创 NLP常见任务小记

原创 NLP一般流程小记

原创 动手学深度学习笔记03

原创 动手学深度学习笔记2

原创 伯禹课程 动手学深度学习笔记1

空空如也

空空如也

原创动手学深度学习笔记03

原创动手学深度学习笔记2

原创伯禹课程动手学深度学习笔记1