L枷锁T-CSDN博客

原创深度学习之优化函数

在计算出模型的损失之后，就需要利用损失值进行模型参数的优化。在在计算出模型的损失之后，就需要利用损失值进行模型参数的优化。在实践操作中最常用到的是一阶优化函数，典型的一阶优化函数包括GD、SGD、 Momentum、Adagrad、Adam 等等。一阶优化函数在优化过程中求解的是参数的一阶导数，这些一阶导数的值就是模型中参数的微调值。这里引入了一个新的概念：梯度。梯度其实就是将多元函数的各...

2020-02-21 21:54:51 1902

原创卷积神经网络

卷积神经网络卷积神经网络（ Convolutional Neural Networks，简称 CNN ）可以说是深度神经网络模型中的“明星 ”网络架构，在计算机视觉方面贡献颇丰。一个标准的卷积神经网络架构主要由卷积层、池化层和全连接层等核心层次构成，卷积层、池化层和全连接层不仅是搭建卷积神经网络的基础，也是我们需要重点掌握和理解的内 ...

2020-02-20 09:55:28 692 1

1.统计学数据度量标准（平均数、中位数（一组数据中，最中间位置的数）、众数（一组数据中出现数据次数最多的数）、期望（均值）、方差（衡量一组随机变量的离散程度）、标准差（方差的算术平方根））图形可视化（饼图、条形图、热力图、折线图、箱线图、散点图、雷达图、仪表盘）概率分布（几何分布、二项分布、正态分布(高斯分布，期望为0，标准差为1的是标准正态分布)、泊松分布）统计假设检验2.线性代数向量、矩阵、距离计算（余弦距离、欧式距离、曼哈顿距离、明可夫斯基距离、切比雪夫距离、杰卡德距离、汉明距离、标准欧

2022-10-28 15:08:52 215

原创机器学习之决策树

决策树（本文参考西瓜书，作为自己学习的记录）基本流程决策树(decision tree) 是一类常见的机器学习方法.以二分类任务为例，我们希望从给定训练数据集学得一个模型用以对新示例进行分类，这个把样本分类的任务，可看作对"当前样本属于正类吗?“这个问题的"决策"或"判定"过程.顾名思义，决策树是基于树结构来进行决策的，这恰是人类在面临决策问题时一种很自然的处理机制.例如，我们要对"这...

2020-03-08 17:52:06 309

原创模型评估指标

1.混淆矩阵混淆矩阵是监督学习中的一种可视化工具，主要用于比较分类结果和实例的真实信息。矩阵中的每一行代表实例的预测类别，每一列代表实例的真实类别。真正（True Positive,TP):被模型预测为正的正样本；假正（False Positive, FP）:被模型预测正的负样本；假负（False Negative, FN）:被模型预测为负的正样本；真负（True Negative, ...

2020-02-22 12:15:14 342

原创常用的激活函数

引言如果没有激活函数，而我们只是一昧地加深模型层次，则搭建出来的神经网络数学表示如下：可以看出，上面的模型存在一个很大的问题，它仍然是一个线性模，如果不引入激活函数，则无论我们加深多少层，其结果都一样，线性模型在应对非线性问题时会存在很大的局限性。激活函数的引入给我们搭建的模型带来了非线性因素，非线性的模型能够处理更复杂的问题，所以通过选取不同的激活函数便可以得到复杂多变的深...

2020-02-18 22:25:36 598

原创深度学习之loss function

机器通过损失函数进行学习。这是一种评估特定算法对给定数据建模程度的方法。如果预测值与实际结果偏离较远，损失函数会得到一个非常大的值。通过梯度下降算法来优化损失函数，使预测值逼近真实值。#平方损失函数平方误差是预测值与真实值之差的平方和其公式如下：#均方误差，MSE(mean squared error)均方误差是预测值与真实值之差的平方和的平均值，即#0-1损失(zero-on...

2020-02-12 17:06:53 623

原创文本相似度

编辑距离编辑距离，英文叫做 Edit Distance，又称 Levenshtein 距离，是指两个字串之间，由一个转成另一个所需的最少编辑操作次数，如果它们的距离越大，说明它们越是不同。编辑操作有三种，插入；删除；替换。其效果如下图所示，编辑距离更加注重句子形式上的一致，并未考虑其含义。from time import *import distanceimport jsond...

2019-08-30 13:04:14 413

原创 Joint entity and relation extraction based on a hybrid neural network论文研读

作者： Suncong Zheng， Yuexin Hao等人论文地址： https://doi.org/10.1016/j.neucom.2016.12.075摘要：实体和关系抽取是一个可以从无结构的文本中联合检测实体和识别实体间的语义关系的任务。*我们提出了一个混合的神经模型，在没有任何手工特征的情况下抽取实体以及它们之间的关系。*这个混合的神经网络模型包含了一个用来实体抽取的novel...

2019-03-14 11:58:19 1670

原创 Stanford NLP的用法

在这里我记录下 stanford nlp 的用法，stanford nlp不仅支持英文，还支持中文。在其官网上有支持不同语言的模型文件我这里以英文的作为说明，其模型文件下载地址stanfor nlp第一步：下载对应语言的模型文件第二步：然后安装Python接口，!pip install stanfordcorenlp -i http://pypi.mirrors.ustc.edu.cn/...

2019-03-13 21:27:39 1565

原创实体关系抽取入门

引言：信息抽取(Information Extraction,IE)旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息。信息抽取的主要任务有：命名实体识别、实体关系抽取、事件抽取、实体消歧。关系抽取(Relation Extracion,RE)是其中的重要子任务之一，主要目的是从文本中识别实体并抽取实体之间的语义关系。实体关系抽取解决了原始文本中目标实体之间的关系分类问题，它也是构建复杂知识...

2019-03-13 16:52:39 13757 1

原创正则表达式基础

简介：**在自然语言处理中，文本数据通常含有很多无关和无意义字符，比如链接、@符号等，通常叫做噪声，这些噪声会影响我们的nlp任务，所以我们一般会用正则表达式去匹陪字符并删除。在使用正则表达式的时候需要导入re模块，本次使用re.search匹配字符串。正则表达式匹配字符串：在python中，我们使用re.search(regex,string)方法匹配字符串，通过这个方法，我们可以查看st...

2018-12-14 09:42:10 199

原创哈工大语言技术平台LTP的用法

@[枷L锁]哈工大语言技术平台LTP的用法简介：哈工大的语言技术平台（LTP）提供了中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、高效、精准的自然语言处理技术。用法：官方提供了Java、C++、python、C#、Ruby接口，这篇使用方法是关于python接口pyltp的。首先需要下载模型文件,然后就是安装pyltp，模型文件下载地址：https://pan.ba...

2018-12-11 18:44:45 3369 1

qq_28886195的博客