自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(107)
  • 资源 (4)
  • 收藏
  • 关注

原创 程序人生 | (1)“Apple of my eyes”(博客笔记导航)

不知不觉读研已经快两个月了,抱着对NLP极大的兴趣,每天都是学习新的东西,但是最后发现学完什么也没有收获,依旧是以前喜欢学东西,不去深入的毛病。但值得欣慰地是自己却没有像以前一样失去对NLP的兴趣。于是在总结之后以及最近看到一位NLP直博大佬的博客,觉得要有一个明确的NLP学习计划和路线才能不至于陷入迷茫,以及一种“学而不思则罔,思而不学则殆”的误区。同时参考大佬的博客对自己的做一个大翻新,不仅仅作为自己博客的导航,同时也是自己在这个领域的笔记和技能树,希望在后期慢慢地去点亮。计划选择了“Appl

2020-11-15 09:59:26 405

原创 Pytorch项目(1)| 预测泰坦尼克号船上的生存乘客

前言为了使得自己的知识成为体系,首先明确一点,知识不需要去记忆,有个印象即可,不记得就去百度,重要的是锻炼思维以及编程能力(拿到问题如何解决问题的能力。)那么,从这个时间点开始,便开始首先搞定基础,python基础已经有了,接着就是深度学习框架pytorch的基础,所有的基础我们都不去纠结它里面有什么东西,找一个问题,去解决,干就完事了,重要的是训练解决问题的能力。好了,废话,就这么多了。一般来说,个人认为,深度学习的”hello world“就是泰坦尼克号了,于是我们入门的第一个项目就是泰坦尼

2022-04-04 13:49:18 3592 1

转载 BERT | (4)Bert生成句向量_pytorch

原文地址:Bert生成句向量(pytorch)本文主要讲如何调用transformers这个包来提取一个句子的特征。Transformers是TensorFlow2.0和PyTorch的最新自然语言处理库Transformers(以前称为pytorch-transformers和pytorch-pretrained-bert)提供用于自然语言理解(NLU)和自然语言生成(NLG)的最先进的模型(BERT,GPT-2,RoBERTa,XLM,DistilBert,XLNet,CTRL …) ,.

2021-03-29 16:11:32 3806 4

转载 算法其他 |(2)动态规划

原文:告别动态规划,连刷 40 道题,我总结了这些套路,看不懂你打我(万字长文)动态规划难吗?说实话,我觉得很难,特别是对于初学者来说,我当时入门动态规划的时候,是看 0-1 背包问题,当时真的是一脸懵逼。后来,我遇到动态规划的题,看的懂答案,但就是自己不会做,不知道怎么下手。就像做递归的题,看的懂答案,但下不了手,关于递归的,我之前也写过一篇套路的文章,如果对递归不大懂的,强烈建议看一看:为什么你学不会递归,告别递归,谈谈我的经验对于动态规划,春招秋招时好多题都会用到动态规划,一气之下,再 .

2021-03-28 23:33:44 462 1

原创 BERT |(3)BERT模型的使用--pytorch的代码解释

参考代码:https://github.com/649453932/Bert-Chinese-Text-Classification-Pytorch从名字可以看出来这个是做一个中文文本分类的的任务,具体就是做新闻文本分类的任务,具体有以下几个类,属于多分类的问题目录一、如何让你下载的代码跑起来二、bert模型的使用模型代码学习-CLS文本分类-Bert-Chinese-Text-Classification-Pytorch代码学习-训练并测试过程模型代码学习-CLS文本分类-Be

2021-03-13 21:42:40 10218 23

转载 BERT |(2)BERT的原理详解

在写这一篇的时候,偶然发现有一篇博客,相比于我之前的一篇写得更详尽,这一篇也参考这篇博客来继续写写自己的笔记总结。原博客地址:一文读懂BERT(原理篇)一、什么是Bert?二,bert的原理从创新的角度来看,bert其实并没有过多的结构方面的创新点,其和GPT一样均是采用的transformer的结构,相对于GPT来说,其是双向结构的,而GPT是单向的,如下图所示elmo:将上下文当作特征,但是无监督的语料和我们真实的语料还是有区别的,不一定的符合我们特定的任务,是一种双向的特征

2021-03-13 10:37:03 1764

原创 BERT |(1)BERT的先修--Transformer

一、自然语言处理通用解决方案1、需要熟悉word2vec,RNN网络模型,了解词向量如何建模2、重点在于Transformer网络架构,BERT训练方法,实际应用3、开源项目,都是现成的,套用进去就OK了4、提供预训练模型,基本任务拿过来直接用都成二、TransformerTransformer的基本组成依旧是机器翻译模型中常见的Seq2Seq网络。输入输出都很直观,其核心架构就是中间的网络设计了。至于具体是如何设计的,请往下看2.1 RNN根据下面的传统RNN的模型框架.

2021-03-13 10:07:33 342

原创 Flask(1) | Flask的部署

一、[傻瓜式一步到位] 阿里云服务器Centos上部署一个Flask项目哇,这个部署真的弄了好久,网上的教程也是一堆,这个很好的解决了我的问题原地址:https://www.cnblogs.com/Sugar-Chl/p/9497901.html我入手的服务器是阿里云的轻量应用服务器,系统是Centos 7.3.使用的相关软件是PuTTY(用于远程连接到服务器),PSFTP(用于将本地文件上传至服务器),Navicat for Mysql(数据库可视化工具)。有一些...

2021-03-12 10:49:34 680

转载 问题解决(3)| 关于pycharm使用的一些事儿

1.Pycharm中的terminal无法使用bash命令解决办法原地址解决办法:(需要提前下好git,git网上教程很多,这里不赘述)打开Pycharm,File---->Settings----->Tools----->Terminal,如下图选择git安装目录下,bin文件中的bash.exe即可点击OK之后,去Terminal中看,就可以看到界面的变化(如下),然后你就可以使用bash命令了。...

2021-03-12 10:16:34 131

原创 问题解决(2)| 关于pytorch安装的一些事儿

1.使用官网命令安装pytorch官网地址:https://pytorch.org/get-started/previous-versions/(因为我一直是安装旧版本)这里只提供1.6.0的安装方法:v1.6.0CondaOSX# condaconda install pytorch==1.6.0 torchvision==0.7.0 -c pytorchLinux and Windows# CUDA 9.2conda install pytorch==1.6.0

2021-03-12 10:13:09 869

原创 LaTeX学习 | (16)关于表格的那些事儿

目录1.将Excel表格转化为Latex表格——采用Excel2LaTeX2.How to center the table in LatexLatex: 使 tabular 居中3.latex设置表格每一列的宽度、表格内容居中综述方法效果注释4.LaTeX 使用longtable制作(跨页)长表格4.1 如何制作长表格(超过一页)遇到的问题arydshln包和longtable包的冲突longtable 小问题5.latex表格线的加粗及合并两.

2021-03-12 09:46:47 2534 1

原创 Autoencoding neural models to extract word representations

Autoencoding neural models can be used to extract word representations, such as BERT and Autoencoding neural models can be used to extract word representations, such as BERT and VAE. 自动编码神经模型可以用来提取单词表示,如BERT和VAE。

2021-01-18 22:17:52 922

原创 LaTeX学习 |(15)LaTeX 自定义环境和命令

LaTeX自定义环境和命令%导言区\documentclass{ctexart}%ctexbook ctexrep% \newcommand 定义命令% 命令只能由字母组成,不能以\end开头%[]内为可选参数% \newcommand<命令名称>[<参数个数>][<首参数默认值>]{<具体定义>}%\newcommand可以是简单字符串替换,例如:%\emph{text}表示强调%使用\PRC 相当于 People'...

2020-12-02 21:01:49 2498

原创 LaTeX学习 |(14)LaTex中的参考文献BibLaTex

LaTex中的参考文献BibLaTex1.首先在设置 中的构建里面将默认文献工具设置为Biber 在当前目录下创建一个 .bib文件 在百度学术或者谷歌学术中搜索论文中引用的文献,查看引用: 点击 Bibtex ,复制BibTex内容到 .bib文件中: 注:其他的文献也是这种操作,最后在 .bib文件中就包含了所有我们要引用的文献的Bibtex:(注意:最后参考文献的排序并不是 .bib文件中文献的顺序,他有自己的...

2020-12-02 21:00:54 2922

原创 LaTeX学习 |(13)LaTex中的参考文献BibTex

LaTex中的参考文献BibTex1.首先在设置 中的构建里面将默认文献工具设置为BibTex 在当前目录下创建一个 .bib文件 在百度学术或者谷歌学术中搜索论文中引用的文献,查看引用: 点击 Bibtex ,复制BibTex内容到 .bib文件中: 注:其他的文献也是这种操作,最后在 .bib文件中就包含了所有我们要引用的文献的Bibtex: 然后在 .tex文件中进行引用,代码如下:...

2020-12-02 20:59:30 767 1

原创 LaTeX学习 |(12)LaTeX数学公式的多行公式

LaTeX数学公式的多行公式%导言区\documentclass{ctexart} %ctexbook ctexrep%\usepackage{ctex}\usepackage{amsmath}\usepackage{amssymb}%正文区\begin{document}%可以使用gather环境实现多行公式排版%内部可以使用\\换行%带编号\begin{gather}a + b = b + a \\...

2020-11-24 15:03:37 3368

原创 LaTeX学习|(11)LaTeX数学公式的矩阵

LaTeX数学公式的矩阵%导言区\documentclass{ctexart} %ctexbook ctexrep%\usepackage{ctex}\usepackage{amsmath} %包含matrix环境%定义一个新命令 \adots 以特定的方式排列三个点\newcommand{\adots}{\mathinner{\mkern2mu%\raisebox{0.1em}{.}\mkern2mu\raisebox{0.4em}...

2020-11-24 15:02:46 3494

原创 LaTeX学习 |(10)LaTeX数学公式初步

LaTeX数学公式初步%导言区\documentclass{ctexart}\usepackage{amsmath}%正文区\begin{document}\section{简介}\LaTeX{}将排版分为文本模式和数学模式。文本模式用于普通文本排版,数学模式用于数学公式排版。\section{行内公式}\subsection{美元符号}%一对单个$符号进行排版交换律是 $a+b=b+a$,如 $1+2=2+1$。...

2020-11-24 15:01:57 447

原创 LaTeX学习 |(9)LaTeX中的浮动体

LaTeX中的浮动体浮动体可以实现: 灵活分页(避免无法分割的内容产生的页面留白) 给图表加标题 交叉引用 figure环境(table环境与之类似)\begin{figure}[<允许位置>]<任意内容>\end{figure}<允许位置>参数(默认tbp) h,此处(here) - 代码所在的上下文位置 t,页顶(top) - 代码所在页面或之后页面的顶部 b,页底(bottom...

2020-11-24 15:00:49 1030

原创 LaTeX |(8)LaTeX中的表格

LaTeX中的表格%导言区\documentclass{ctexart}%ctexart等价于使用article类 然后再导入ctex宏包%\usepackage{ctex}%用tabular环境产生表格%\begin{tabular}[<垂直对齐方式>]{<列格式说明>}%<表项> & <表项> & <表项> & ...&<表项>\\%...%\end...

2020-11-24 14:59:55 435

原创 LaTeX学习 |(7)LaTeX中的插图

LaTeX中的插图\documentclass{article}\usepackage{ctex}%导言区:需要导入 \usepackage{graphicx} 宏包%语法:在正文区输入 \includegraphics[<可选项>]{<文件名(可以加后缀也可以不加)>}%文件格式:EPS,PDF,PNG,JPEG,BMP,JPG\usepackage{graphicx}\graphicspath{{figures/},{pics/}} %图片存储路径用{

2020-11-24 14:58:16 490

原创 LaTeX学习 |(6)LaTeX中的特殊字符

LaTeX中的特殊字符%导言区\documentclass{article}\usepackage{ctex} %中文处理宏包\usepackage{xltxtra}%提供了针对XeTeX的改进并且加入了XeTeX的LOGO\usepackage{texnames}\usepackage{mflogo}%正文区(文稿区)\begin{document}\section{空白符号}%输入一段英文和中文%在英文中添加任意多个空格 结果中只有一个...

2020-11-24 14:57:29 1549

原创 LaTeX学习 |(5)LaTeX的篇章结构

LaTeX的篇章结构设置提纲% 导言区\documentclass{article}\usepackage{ctex}%正文区(文稿区)\begin{document}%section subsection subsubsection 等命令可以设置提纲\section{引言}%插入一段正文 空行代表另起一段有缩紧(多个空行相当于一个);\\代表换行没有缩紧;\par相当于空行另起一段 一般为了结构清晰 更多使用空行有这么一...

2020-11-24 14:55:15 1348 1

原创 LaTeX学习 |(4)LaTeX的字体字号的设置

LaTeX的字体字号的设置在Latex中字体有五种属性,分别是:字体编码,字体族,字体系列,字体形状和字体大小。他们都可以通过命令来进行设置。首先是字体族的设置 有罗马字体,无衬线字体和打字机字体三种。有字体命令和字体声明两种方式。通过大括号来限定范围。\textrm{Roman Family}%也可以通过声明,可以通过大括号来声明作用文本范围\rmfamily Roman Family字体系列和形状设置,通过以下命令:粗细 :\textm...

2020-11-24 14:53:11 4447

原创 LaTeX学习 | (3)LaTeX的中文处理方法

LaTeX的中文处理方法1.首先打开工具栏的option,然后在构建里面将默认编译器设置为Xelatex2.接着在默认字体编码中将,字体编码设置为UTF-83.接着在导言区加一句 \usepackage{ctex}接着便可以使用中文进行编译此外,扩充两个知识点:1.\begin{equation}f(x) = 3x^2 + 1\end{equation}可以产生带编号的行间公式...

2020-11-24 14:51:15 1046

原创 LaTeX学习 | (2)LaTeX源文件的基本结构

LaTeX源文件的基本结构%导言区(主要是设置文本类,标题,作者,时间等)\documentclass{article}% book,report,letter\title{文章标题}\author{作者的名字}\date{\today} % today表示今天的时间\usepackage{ctex}% 要养成写注释的好习惯\begin{document}\maketitle % 表示输出标题等信息% 注意letter类没有这个...

2020-11-23 20:17:31 145

原创 LaTeX学习 | (1)LaTeX软件的安装与配置

LaTeX软件的安装与配置LaTeX安装 首先下载Textlive2018,加载iOS 右键点击advance.bat,管理员模式运行 提示有开启病毒管理软件,要先将杀毒软件关闭 去掉不必要的语言包以及老版本的编辑器如下所示: 安装完成 验证是否安装正确 输入tlmgr update –all进行更新 但是一般是无法进行更新 然后接着下载安装TeXstudio就可以进行使用了,可以直接新建保存,然后运行查看就行

2020-11-23 20:16:11 468

原创 文本的表示技术 | (4)句向量

5.4 句向量5.4.1 基于句向量的平均SIF Embedding (Smooth Inverse Frequency Embedding):5.4.2 沿用Word2Vec思想Skip-Thoughts:5.4.3 有监督方式InferSent应用了SNLI(Stanford Natural Language Inference)数据集进行有监督的句子表征学习。...

2020-11-23 18:37:14 228

原创 文本的表示技术 | (3)改进后的词表征

5.3 改进后的词表征5.3.1 Glove模型5.3.2 FastText模型5.3.3 ELMo

2020-11-23 18:24:59 133

原创 文本的表示技术 | (2)Word2Vec词向量

5.2 Word2Vec词向量5.2.1 Word2Vec的基本原理词嵌入(Word Embedding):Word2Vec包含两种深度学习的模型:1.CBOW(Continuous Bag-of-Words):2.Skip-Gram5.2.2 Word2Vec模型细节及代码演示Word2Vec的三大创新:1.将常见的单词组合(或者说词组)当做一个单词来处理:2.对高频词进行抽样处理:3.负采样:5.2.3 应用工具训练Word2Vecgensim中的W.

2020-11-23 15:25:53 160

原创 文本的表示技术 | (1)词袋模型

5.1 词袋模型(Bag-of-Words,BOW)5.1.1 基于频次的词袋模型假设数据集为两个经过预处理且分好词的句子:1.你/站在/桥上/看/风景/看/风景/的/人/在/楼上/看/你2.明月/装饰/了/你/的/窗子/你/装饰/了/别人/的/梦可得到对应长度为15的词典如下:[里面包含15个词]如此可以将两个句子向量化如下:1.[2,1,1,3,2,1,1,1,1,0,0,0,0,0,0]2.[2,0,0,0,0,2,0,0,0,1,2,2,1,1,1]基于频次的

2020-11-23 15:14:53 577

原创 文本预处理 |(7)数据不平衡的处理

到了这一章,里面的东西就更看不懂了,所以这一节,就做一个简单的大纲,以后慢慢学习再慢慢完善常见方法1.改变性能评估方式2.为模型添加特殊的惩罚/代价机制3.数据重采样(Re-sampling)4.合成样本5.使用k-fold交叉验证这个简单就是将原始数据划分为K个部分,选择其中一个作为测试数据集,剩余的作为训练数据集。交叉验证就是,将以上过程重复K次,最后取平均结果。但是这个和处理数据不平衡有什么关系呢?6.采用不同的分类器最后作者说,对于不平衡数据的处理本身便.

2020-11-23 01:31:58 427

原创 文本预处理 |(6)关键词提取

(这部分,因为自己的知识不足,实在是没有看得太懂,无奈强迫症,求一个完整,所以还是写出来了!)下面我们在来讲关键词提取,其实关键词提取可以当作获取特征的一种方式。具体获得关键词的方式有很多种,我们依次介绍一下:1 基于特征统计词频:一般来说,一个词在文本中出现次数越多,表明作者越想表达这个词,因此可以通过对词频的简单统计便可以评估出词语的重要性。 TF-IDF(term frequency–inverse document frequency):综合考虑了词在文本中的词频以及普遍重要性,直观地

2020-11-23 01:13:11 1075

原创 文本预处理 | (5)文本纠错的简单案例

上一节我们留下了,一个小问题,就是如何对给定的英文文本语料,来进行拼写纠错。首先,我们给定一个语料文本“beyes_train_text.txt”,然后统计语料中各单词的出现情况。import re,collections# 提取语料库中的所有单词并且转化为小写def words(text): return re.findall("[a-z]+", text.lower())# 若单词不在语料库中,默认词频为1,避免先验概率为0的情况def train(features):

2020-11-23 00:57:54 1012

原创 文本预处理 |(4)文本纠错

一般有两种文本纠错的类型:1.Non-word拼写错误首先看一下Non-word的拼写错误,这种错误表示此词汇本身在字典中不存在,比如把“要求”误写为“药求”,把“correction”误拼写为“corrction”。寻找这种错误很简单,例如分完词以后找到哪个词在词典中不存在,那么这个词就可能是错误拼出来的的词。操作步骤• 找到候选词• 接着基于特定算法找出与错拼词关联最高的一个或多个单词作为纠正选项如何确定候选项呢?• 英文:编辑距离• 中文:拼写相近、字形相近如何找出最关联项

2020-11-23 00:38:30 1079

原创 文本预处理 | (3)分词

一、分词的几大难点1.未登录词的识别由于新词的不断出现,不存在一个词表能够收录所有的词汇。所以此时就无法将这个词给识别出来。2.切词产生歧义比如“羽毛球拍卖完了”就存在两种分词的方式:一种是,羽毛球/拍卖/完了;另一种是,羽毛球拍/卖/完了3.词的界限无统一标准比如“自然语言处理”可以看做一个词语,也可以看三个词语“自然”,“语言”,“处理”二、常用的分词方法1.机械分词法基于词典资源的一种分词方法,对文本中的字符串进行匹配,若能在词典中找到,则识别出该词。一般分为.

2020-11-22 23:38:30 1211

原创 文本预处理 | (2)语义分析

4.1.2 语义分析词性标注词性标注的工具有很多,在中文中jieba,哈工大的LTP,他们各自的词性标注的标准都不一样,使用方法也各不相同,输出的形式也不相同,暂时笔者只接触了这这两种工具的分词以及词性标注。(后期补代码,和教程地址)命名实体识别(Named-entity recognition,NER):目的在于识别文本中具有特定意义的实体,比如:人名,地点名,组织机构名,时间等。(笔者暂时未接触中文的命名实体识别的工具,后补!!!)from nltk import word_.

2020-11-22 21:28:51 568 1

原创 文本预处理 | (1)文本规范化

参考书籍胡盼盼《自然语言处理从入门到实战》4.1.1文本规范化大写字母转小写# 输入文本input_str = "The 5 biggest countries by population in 2019 are China, India, United States, Indonesia, and Brazil."# 转为小写output_str = input_str.lower()print(output_str)# 输出结果为:# the 5 biggest countri

2020-11-22 21:18:08 442

原创 心理学 | (1)焦虑症和恐惧症--一种认知的观点

今天不想学习,也不想出门,在宿舍一天看完了一本心理学书籍《焦虑症和恐惧症--一种认知的观点》,本书是认知治疗之父艾伦·T·贝克经典著作,被誉为治疗焦虑症的“黄金标准”,首先谈一下,我初步快速读完的感觉。本书分为两个部分,第一部分讲解了焦虑和恐惧在临床上的观点,第二部分介绍了临床的治疗方法。通过对第一部分的阅读,作者将焦虑和恐惧分为许多不同的种类,但其中不免有许多定义不是太明确。第二部分的治疗方式也较多。但是个人初步看来,认知疗法,就是首先要去正视焦虑,接纳焦虑,面对焦虑以及重复学习等等。以下还是按照自己的习

2020-11-21 23:37:12 2744 1

原创 知识图谱 | (2)Neo4j的安装配置以及一些问题

首先大家一定安装桌面版,不要装社区版(里面各种坑!!!)首先这里是桌面版的安装配置(没有经过别人的同意,就不复制过来了)然后你可能会出现,无论如何都登不上浏览器版本的账号问题,这个是解决办法。其实安装很简单的,以后在整理一下。...

2020-11-20 21:40:18 282

831真题.zip

数据结构831真题,考数据结构的可以下载来看一下

2019-11-02

广东工业大学831数据结构与C831.rar

广东工业大学831数据结构与C831

2019-11-02

代码以及规则.rar

基于Python的动物识别专家系统--20180515人工智能作业的代码以及文档

2019-09-06

tf-nightly

nightly安装包是TensorFlow团队2017年下半年推出的安装模式。适用于在一个全新的环境下进行TensorFlow的安装。在安装TensorFlow的同时,默认会把需要依赖的库也一起装上,是非常快捷的安装方式。

2018-12-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除