- 博客(6)
- 收藏
- 关注
原创 NLP修行之路day06-Bert
BERT全称是Bidirectional Encoder Representations from Transformers,即基于Transformers的双向编码器。光从名称上就可以看出来是Transformers的升级版。
2020-08-04 21:48:00 139
原创 NLP修行之路-day5 用自定义的TextCNN做新闻分类
最近有点忙,没时间搞,为了打卡,所以先写个简简单单的TextCNN模型,以后有空了再来补充复杂的干货,代码如下。# 绘图案例 an example of matplotlib%matplotlib inlineimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_splitfrom keras.preprocessing.sequence import pa
2020-07-30 20:46:19 148
原创 NLP修行之路-day4 用自定义的FastText做新闻分类
鉴于天池实验室不是很方便安装python工具包,这次用FastText来做文本分类任务的话,就用自定义一个简单的模型,下面开始附上代码。# 绘图案例 an example of matplotlib%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_splitfrom keras.p
2020-07-27 15:16:04 118
原创 NLP修行之路-day3 机器学习模型Sklearn实战
话不多说,直接上代码,先导入各个后续打算使用的python库。%matplotlib inlineimport matplotlib.pyplot as pltimport pandas as pd import sklearn.preprocessingimport sklearn.model_selection as model_selectionfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn
2020-07-25 22:06:05 145
原创 NLP修行之路-day2
datawhale新闻文本分析磨刀不误砍柴工,工欲善必先利其器。在NLP任务中,文本特征分析是非常重要的一环。良好的数据特征处理,会大大提升模型的精准度。#使matplotlib可以在jupyter中可以正常显示图片%matplotlib inline import pandas as pd import matplotlib.pyplot as pltdf=pd.read_csv('train_set.csv',sep='\t') #有些csv文件以,分割 我们这个文件以制表符分割df.
2020-07-22 23:42:04 98
原创 NLP修行之路-day1
一入编程深似海,时光荏苒,不知不觉已从事软件行业五年。作为一个懒人,未为社区做半分贡献,账号已荒芜多年。若不是参与DataWhale社区的组团训练营,怕是我的账号仍旧一片白板。废话少说,进入正题。 训练营本期的练手项目是阿里天池上面的新闻分类任务,传送门:零基础入门NLP - 新闻文本分类有兴趣的同学也可以参与一下。首日的任务对赛题进行剖析 要求:对14个类别的新闻进行分类建模 标准:以F1分数作为评估模型优良的标准 目标:在测试集上的F1越大越好 未知:源文本,语言类别...
2020-07-20 16:01:04 154
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人