自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 如何利用深度学习做好文本分类(text classification)

目录1.简述2.分析任务3.构建baseline模型3.1数据清洗与预处理3.2选取合适的模型 3.2.1模型选取方法GELE模型做为baseline模型4. 评估指标5.baseline的优化5.1 label smoothing5.2 数据增强和数据噪音的容忍5.3 损失函数的选择5.4 引入先验知识1.简述文本分类是自然语...

2020-05-04 15:10:09 9868 4

原创 事件抽取-事件类型抽取以及元素抽取一览表

事件抽取论文一览表 论文标题 模型简称 会议 发表时间 摘要 备注 代码链接 Joint Event and Temporal Relation Extraction with Shared Representations and Structured Prediction EMNLP 2019 事件的时序性 Document-Level Event Role Filler Extraction using Mul...

2020-10-27 16:52:29 2290

原创 《Heterogeneous Graph Neural Networks for Extractive Document Summarization》论文阅读笔记(抽取式摘要)

抽取式摘要的目标是从原文章中选出最为重要的若干个句子,并且将它们重组成摘要。因而,如何构建句子之间的关系,并得到更好的句子表示,就成为抽取式摘要的核心问题。这种方法天然的在语法、句法上错误率低,保证了一定的效果。该论文提出了我们提出了一种基于异构图的神经网络,用于提取摘要(HETERSUMGRAPH),其中包含句子以外的不同粒度级别的语义节点。 这些额外的节点充当句子之间的中介,并丰富了跨句关系。此外,论文图结构通过引入文档节点,从单文档扩展到多文档摘要抽取。

2020-07-11 11:49:27 756

原创 skip-gram训练word2vec论文阅读笔记

本篇博客将介绍使用skip-gram训练wordembedding,以及如何利用负采样和子采样进行大规模训练wordembedding。

2020-06-10 15:44:35 2063

原创 BP神经网络算法以及梯度反向传播算法理论推导

BP神经网络算法梯度反向传导算法理论推导,关于深度学习的梯度反向传导算法可以进行类推。

2020-06-09 15:41:35 715

原创 jieba / hanlp / ltp / standforCorenlp 分词器对比

为了验证分词效率的,数据统一采用网信微博数据,共3379kb,共3382条。所有样本先采用规则分句,再进行分词和实体识别,standfordCorenlp部署的服务自带分句,则没有进行分句,分词和实体识别运行时间不计算初始化模型时间。分词运行效率对比处理电脑的cpu 配置为:Intel(R) Core(TM) i5-8400 CPU @ 2.80GHz\ 分词工具 算法 分词 / 实体识别 测试样本大小/kb 测试样本总数 运行时间/ms 平均每秒运行k

2020-05-12 15:14:35 3123

转载 深度学习各类激活函数简介

深度学习各类激活函数激活函数激活函数的定义:激活函数的定义sigmodtanhRELU如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入激活函数激活函数的定义:激活函数的主要作用是提供网络的...

2020-05-04 09:25:04 309

原创 文本分类-text classification 推荐论文

文本分类论文一览表 文章题目 发表年限 杂志 网络结构 创新点 多标签文本分类一览表 ...

2020-04-19 11:56:11 3616

原创 实战:采用字mask和wwm mask在中文领域内finetune bert模型

随着google发布bert模型,bert改进版本已经到来,bert-wwm、 bert-wwm-ext、 Roberta-wwm-ext、ENRIE、XLNET各种变种版本都出现了,本人主要这对google开源的bert版本,修改其源码,数据处理上上采用字mask和wwmmask,框架依然采用tensoflow,但是将源码中estimator显式训练,个人认为estimator训练过程是个黑盒子...

2020-04-16 12:03:30 938 1

原创 教你用python 编译pyc文件,一键生成压缩包

教你用python 编译pyc文件,一键生成压缩包pyc文件是py文件编译后生成的字节码文件(byte code)。pyc文件经过python解释器最终会生成机器码运行。所以pyc文件是可以跨平台部署的,类似Java的.class文件。一般py文件改变后,都会重新生成pyc文件。 对于为什么要生成pyc文件,主要是不想把源代码暴露出来。这里教你如何将python工程一键生成可以部署pyc...

2020-04-16 11:51:33 499

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除