自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (2)
  • 收藏
  • 关注

原创 window 更新node.js安装失败?

n模块是不支持window系统,window系统升级node就只有到node官网下载window安装包来覆盖之前的node......

2021-03-02 11:21:21 124

原创 Django CSS样式加载不出来

1、 {% load static %}2、 <link href={% static “home/vendor/bootstrap/css/bootstrap.min.css” %} rel=“stylesheet”>3、 %} rel=“stylesheet”>之间空格…

2020-08-12 10:00:42 1432

原创 【NLP】天池新闻文本分类——基于深度学习的文本分类3(BERT)

目录理论Transformer原理基于预训练语言模型的词表示基于Bert的文本分类Bert PretrainBert Finetune理论Transformer原理Transformer是在"Attention is All You Need"中提出的,模型的编码部分是一组编码器的堆叠(论文中依次堆叠六个编码器),模型的解码部分是由相同数量的解码器的堆叠。我们重点关注编码部分。他们结构完全相同,但是并不共享参数,每一个编码器都可以拆解成两部分。在对输入序列做词的向量化之后,它们首先流过一个self

2020-08-02 16:33:19 742

原创 【NLP】天池新闻文本分类——Task5 基于深度学习的文本分类2

目录Word2Vec的使用和基础原理Skip-grams原理和网络结构Skip-grams训练Word pairs and "phases"对高频词抽样Negative samplingHierarchical Softmax霍夫曼树Hierarchical Softmax过程代码实现使用TextCNN、TextRNN进行文本表示TextCNNkeras实现TextRNNkeras实现使用HAN网络结构完成文本分类Word2Vec的使用和基础原理Skip-grams原理和网络结构Word2Vec模型中

2020-07-31 15:27:45 283

原创 【NLP】天池新闻文本分类——Task4 基于深度学习的文本分类1(fastText)

目录FastText交叉验证Fasttext实现基于keras基于fasttext包FastTextOne-hotBag of WordsN-gramTF-IDF等文本表示方法存在一定缺陷转,换得到的向量维度很高,需要较长的训练实践;没有考虑单词与单词之间的关系,只是进行了统计。与这些表示方法不同,深度学习也可以用于文本表示,还可以将其映射到一个低纬空间。其中比较典型的例子有:FastText、Word2Vec和Bert。在本章我们将介绍FastText,将在后面的内容介绍Word2Vec和

2020-07-27 17:13:22 268

原创 【NLP】天池新闻文本分类——基于机器学习的文本分类

目录文本表示方法one-hotBag of WordsN-gramTF-IDF文本表示方法在自然语言领域,上述方法却不可行:文本是不定长度的。文本表示成计算机能够运算的数字或向量的方法一般称为词嵌入(Word Embedding)方法。词嵌入将不定长的文本转换到定长的空间内,是文本分类的第一步。one-hot这里的One-hot与数据挖掘任务中的操作是一致的,即将每一个单词使用一个离散的向量表示。具体将每个字/词编码一个索引,然后根据索引进行赋值。One-hot表示方法的例子如下:句子1:我 爱

2020-07-25 21:15:29 1342 2

原创 【WSL】win10子系统保姆级安装配置指南

业务需要Linux系统,虚拟机太卡双系统太麻烦,WSL装装卸卸好多次,汇总并参考了很多文章,记录一下我觉得最合适的打开方式。如果过程有不会的地方请点击这里。目录WSL安装安装前准备下载安装安装LxRunOffline常用LxRunOffline命令备份wsl配置换源图形界面pycharm配置WSL安装最头疼的问题大概就是之间从应用商店安装不能安装其他盘,但是其实是可以的。找了网上教程,大多都是用lxrunoffline,如果用lxrunoffline会在配置pycharm时识别不到wsl,就算改了py

2020-07-23 17:53:17 624

原创 天池新闻文本分类——数据读取与数据分析

目录数据读取数据分析句子长度分析新闻类别分布字符分布统计数据分析的结论作业数据读取赛题数据虽然是文本数据,每个新闻是不定长的,但任然使用csv格式进行存储。因此可以直接用Pandas完成数据读取的操作。import pandas as pdtrain_df = pd.read_csv('data/train_set.csv', sep='\t', nrows=100)read_csv由三部分构成:读取的文件路径,这里需要根据改成你本地的路径,可以使用相对路径或绝对路径;分隔符sep,为每列分

2020-07-22 17:28:50 870

原创 【NLP】天池新闻文本分类——赛题理解

目录引言数据说明评价指标解题思路思路一:TF-IDF + 机器学习分类器思路二:FastText思路三:WordVec + 深度学习分类器思路四:Bert词向量引言赛题名称:零基础入门NLP之新闻文本分类赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。数据说明赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、

2020-07-20 10:03:10 622

原创 停车场二维码导航

【问题描述】 用户在指定的停车场里停车时,能够对自己停放车辆的位置进行拍照记录,然后再取车时可以利用本软件进行拍照定位。本软件的定位全部依赖于停车场中到处部署的二维码,用户可以随时用手机拍照并获得自己的位置。本软件还能够自动提示用户停车的计费情况等信息。【基本要求】一个完整的系统应具有以下功能:(1)能够对停车场位置信息进行统一管理。对其停车位和停车地点利用二维码拍照来定位查看。即需首先对整个停车...

2018-03-23 10:47:21 3511 4

近世代数试卷2019—2020还原.pdf

北邮罗守山老师的近世代数2019-2020学期的试卷,仅供参考 课程特点: 内容抽象、应用广泛 《近世代数》是以研究代数系统的性质与构造为中心的一门学科,是现代科学技术的数学理论基础之一,在计算机科学、信息科学、数字通信(开关电路、编码、密码)、系统工程、近代物理与近代化学等方面有广泛的应用。 培养代数思想方法、抽象思维和逻辑推理的能力素质。

2019-12-28

AWL词汇列表-表格版.doc

英语AWL词汇,学术写作、四六级基础必背。表格版。AWL (ACADEMIC WORD LIST) 和 NAWL (NEW ACADEMIC WORD LIST) 分别是由语言学家Dr Averil Coxhead 和Browne, C., Culligan, B., and Phillips, J.等人分别汇总的单词表,它们的内容涵盖了学术交流与论文最为常用的单词。 AWL包含以词根形式的词根-衍生表和各个词根下最常用词的单词表。共计570词。

2019-12-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除