咕叽咕叽小菜鸟-CSDN博客

原创 BiLSTM-CRF实现中文命名实体识别（NER）

BiLSTM-CRF实现命名实体识别（NER）完整代码地址参考本博客中使用到的完整代码请移步至: 我的github：https://github.com/qingyujean/Magic-NLPer，求赞求星求鼓励~~~HMM系列文章：条件随机场（CRF）原理小结（1）条件随机场（CRF）原理小结（2）BiLSTM-CRF实现命名实体识别（NER）完整代码地址完整代码请移步至: 我的github：https://github.com/qingyujean/Magic-NLPer，求赞求星求鼓

2021-02-11 00:35:06 5394 32

原创 transformer（上）论文解读+pytorch实现

self-attention && transformer（上）论文解读和模型原理1. 背景2. 模型架构2.1 scaled dot-product attention2.2 multi-head attention2.3 transformer使用的3种attention2.4 point-wise feed-forward net2.5 positional embedding2.6 maskingencoder-layer以及encoderdecoder-layer以及decoder

2020-12-16 17:17:22 3864 8

原创 ELMo论文笔记+源码分析

ELMo论文笔记+源码分析1. 论文精读1.1 阶段1：预训练过程1.2 阶段2：应用到下游NLP task1.3 ELMo优势2. 源码分析2.1 使用elmo能得到什么2.2 elmo内部执行流程3. ELMo应用到文本分类4. 参考1. 论文精读1.1 阶段1：预训练过程ELMo的预训练过程就是常见的语言模型（Language Model，简称LM）的训练过程：从句子中学习预测next word，从而学习到对语言的理解的任务。语言模型的学习通常得益于海量的无需标注的文本数据。ELMo是双向语言

2020-11-29 20:32:29 3877 3

原创实体链指（3）EL：End-to-End

前面已经由一篇综述大致了解了Entity Linking的定义和任务框架，以及对Disambiguation-Only 的2篇具有代表性的论文进行了介绍，本篇主要介绍End-to-End的两篇代表性论文。

2022-09-04 21:18:25 459 1

原创实体链指（2）EL：Disambiguation-Only

本篇主要了介绍了Disambiguation-Only实体链指任务的具有代表性的2篇论文：《Neural Cross-Lingual Entity Linking》和《Scalable Zero-shot Entity Linking with Dense Entity Retrieval》

2022-09-04 16:47:40 666 1

原创实体链指（1）Entity Linking 综述

实体链接（entity linking）任务是指识别出文本中的提及（mention）、确定mention的含义并消除其可能存在的歧义，然后建立该mention到知识库（KB）中实体（entity）的链接，从而将非结构化数据连接到结构化数据的过程。

2022-09-03 18:59:48 2429

原创 transformer（下）机器翻译+pytorch实现

transformer（下）机器翻译（pytorch实现）说在前面实验环境1.加载数据建立input pipeline2.位置编码 positional encoding3.掩码 masking4.scaled dot product attention5.multi-head attention6.point wise feed forward network7.encoder layer8.decoder layer9.encoder10.decoder11.搭建transformer12.设置超参1

2021-03-07 14:05:03 11172 27

原创论文笔记-Vanilla Transformer：Character-Level Language Modeling with Deeper Self-Attention

论文笔记-Vanilla Transformer：Character-Level Language Modeling with Deeper Self-Attention1. 介绍2. Character Transformer Model3. 3种辅助loss3.1 Multiple Positions3.2 Intermedia Layer Losses3.3 Multiple Targets4. 实验4.1 训练和数据4.2 结果（消融实验）4.3 Qualitative Analysis 定性分析参

2021-03-03 12:37:48 3604

原创统计机器学习相关概念总结（下）

统计机器学习相关概念总结（下）5. 泛化能力5.1 泛化误差5.2 泛化误差上界6. 生成模型与判别模型7. 方差与偏差8. 多分类学习9. 类别不均衡（class-imbalance）问题完整代码地址参考ML相关概念总结系列文章：统计机器学习相关概念总结（上）统计机器学习相关概念总结（中）统计机器学习相关概念总结（下）5. 泛化能力5.1 泛化误差泛化误差：学到的模型对未知数据预测的误差：Rexp(f^)=Ep[L(Y,f^(X))]=∫X×YL(Y,f^(X))P(x,y)dxdy

2021-02-16 23:28:22 242

原创统计机器学习相关概念总结（中）

统计机器学习相关概念总结（中）4. 模型评估与模型选择4.1 模型评估分类问题评估（1）error rate（2）accuracy（3）precision & recall（4）P-R曲线（5）F1值 & FβF_\betaFβ（6）宏平均（macro-avg）& 微平均（micro-avg）（7）ROC曲线 & AUC回归问题评估4.2 模型选择（1）正则化（2）交叉验证完整代码地址参考ML相关概念总结系列文章：统计机器学习相关概念总结（上）统计机器学习相关概念总

2021-02-16 23:13:36 324

原创统计机器学习相关概念总结（上）

统计机器学习相关概念总结（上）1. 统计学习分类1.1 基本分类（1）监督学习（2）无监督学习（3）强化学习1.2 按模型种类分类（1）概率模型与非概率模型（2）线性模型与非线性模型1.3 按算法分类（1）在线学习（2）批量学习1.4 按技巧分类（1）贝叶斯学习（2）核方法2. 统计学习三要素2.1 模型2.2 策略（学习的准则）2.2.1 损失函数和风险函数损失函数的期望2.2.2 经验风险最小化与结构风险最小化（1）经验风险最小化（2）结构风险最小化2.3 算法3. 监督学习方法特点总结完整代码地址参考

2021-02-16 23:08:23 426

原创集成学习原理小结（AdaBoost & lightGBM demo）

集成学习原理小结（AdaBoost & lightGBM demo）1. 集成学习概述1.1 集成学习是什么？1.2. 为什么要进行集成学习？2. 常见的集成学习算法2.1 Boosting2.1.1 AdaBoost算法算法描述算法说明算法训练误差分析学习算法—前向分步算法算法评价2.1.2 梯度提升树2.2 Bagging随机森林3. 常见的结合策略3.1 平均法3.2 投票法3.3 学习法（Stacking）4. 如何增强多样性？5. 代码示例5.1 AdaBoost demo5.2 ligh

2021-02-15 17:30:12 869 1

原创条件随机场（CRF）原理小结（2）

条件随机场（CRF）原理小结（2）6. 线性链CRF的3个基本问题6.1 问题1：概率计算问题6.1.1 前向-后向算法6.1.2 概率计算6.1.3 期望值的计算6.2 问题2：学习问题6.2.1 改进的迭代尺度法6.2.2 梯度下降法6.3 问题3：预测问题维特比算法描述模型评价完整代码地址参考本博客中使用到的完整代码请移步至: 我的github：https://github.com/qingyujean/Magic-NLPer，求赞求星求鼓励~~~HMM系列文章：条件随机场（CRF）原理小结（

2021-02-10 17:34:05 326 1

原创条件随机场（CRF）原理小结（1）

条件随机场（CRF）原理小结（1）1. CRF学习方法简要概括2. 相关概念2.1 概率图模型2.1.1 有向概率图模型（贝叶斯网）2.1.2 无向概率图模型（马尔科夫网）2.1.3 有向图、无向图模型比较2.2 生成式模型 vs 判别式模型两种模型比较2.3 RF→\rightarrow→MRF→\rightarrow→CRF→\rightarrow→linear chain CRF2.3.1 随机场（RF）2.3.2 马尔科夫随机场（MRF）2.3.3 条件随机场（CRF）2.3.4 线性链条件随机场（

2021-02-10 16:53:49 879 1

原创手撸HMM实现词性标注（Part-of-speech）

手撸HMM实现词性标注（Part-of-speech）1. 环境准备2. 使用HMM 实现词性标注2.1 句子开始和结束标记2.2 问题2--HMM参数估计：统计词频计算概率（1）发射概率估计（2）转移概率估计（3）初始状态概率分布问题1--求解观测序列概率2.3 问题3--预测问题：vitervi算法实现（1）初始化（2）递推（3）终止（4）最优路径回溯完整代码地址本博客中使用到的完整代码请移步至: 我的github：https://github.com/qingyujean/Magic-NLPer，求

2021-02-02 21:05:32 1678

原创隐马尔科夫模型（HMM）原理小结（2）

隐马尔科夫模型（HMM）原理小结（2）4. 基本问题二：学习问题模型参数估计 λ=(A,B,π)\lambda=(A,B,\pi)λ=(A,B,π)4.1 监督学习方法（1）转移概率aija_{ij}aij的估计（2）观测概率bj(k)b_j(k)bj(k)的估计（3）初始状态概率πi\pi_iπi的估计4.2 无监督学习方法：Baum-Welch算法（EM）4.2.1 确定完全数据的对数似然函数4.2.2 E步：求QQQ函数Q(λ∣λˉ)Q(\lambda|\bar{\lambda})Q(λ∣λˉ

2021-02-02 21:04:20 582

原创隐马尔科夫模型（HMM）原理小结（1）

隐马尔科夫模型（HMM）原理小结1. 什么是马尔科夫链1.1 马尔科夫过程1.2 k阶马尔科夫链1.3 1阶马尔科夫链2. 什么是隐马尔可夫链（HMM）2.1 HMM基本定义2.2 HMM的2个基本假设（1）齐次马尔科夫性假设（2）观测独立性假设2.3 观测序列的生成过程2.4 HMM的3个基本问题3. 基本问题一：观测序列概率P(O∣λ)P(O|\lambda)P(O∣λ)计算3.1 直接计算3.2 前向算法3.3 后向算法3.4 前向-后向概率统一表示P(O∣λ)P(O|\lambda)P(O∣λ)3

2021-02-02 21:02:44 625

原创 EM（Expectation Maximization）算法原理小结

EM（Expectation Maximization）算法原理小结1. EM 算法1.2 为什么需要EM算法?1.2 EM 算法推导EM算法关键：下边界函数EM算法解释QQQ函数的定义EM算法1.3 算法总结参考适用问题：概率模型参数估计模型特点：含有隐变量的概率模型模型类型：-损失函数：对数似然损失学习策略：极大似然估计，最大后验概率估计学习算法：迭代算法1. EM 算法EM算法是一种迭代算法，用于含有隐变量的概率模型参数的极大似然估计或极大后验概率估计。EM算法的每次迭代分2步：

2021-01-30 21:16:28 270

原创朴素贝叶斯（naive bayes）原理小结

朴素贝叶斯原理小结1. 支持向量回归（SVR）分类算法2. 模型评价完整代码地址参考本博客中使用到的完整代码请移步至: 我的github：https://github.com/qingyujean/Magic-NLPer，求赞求星求鼓励~~~1. 支持向量回归（SVR）分类算法2. 模型评价SVM系列至此就介绍完了，这里对该模型做一个评价总结。评价内容摘自刘建平老师的支持向量机原理(五)线性支持回归：SVM算法是一个很优秀的算法，在集成学习和神经网络之类的算法没有表现出优越性能前，SVM基本

2021-01-27 22:59:17 984

原创支持向量机（SVM）原理小结（3）支持向量回归SVR

支持向量机（SVM）原理小结（3）支持向量回归SVR1. 支持向量回归（SVR）1.1 学习算法—对偶形式（1）求min⁡w,b,ξ,ξ^L(w,b,ξ,ξ^,α,α^,μ,μ^)\min\limits_{w,b,\xi,\hat\xi} L(w, b, \xi, \hat\xi, \alpha, \hat\alpha, \mu, \hat\mu)w,b,ξ,ξ^minL(w,b,ξ,ξ^,α,α^,μ,μ^)（2）求min⁡w,b,ξ,ξ^L(w,b,ξ,ξ^,α,α^,μ,μ^)\min\lim

2021-01-24 04:51:33 8409 5

原创支持向量机（SVM）原理小结（2）非线性支持向量机

支持向量机（SVM）原理小结（2）非线性支持向量机1. 非线性支持向量机1.1 图示举例1.2 核技巧1.3 核技巧在支持向量机中的应用1.4 常用核函数1.5 学习算法1.6 联想：多项式回归（线性回归推广）2. 代码示例：使用非线性kernel SVM解决非线性问题完整代码地址参考本博客中使用到的完整代码请移步至: 我的github：https://github.com/qingyujean/Magic-NLPer，求赞求星求鼓励~~~1. 非线性支持向量机什么是非线性分类问题：通过利用非线性模型

2021-01-24 04:32:36 2374

原创支持向量机（SVM）原理小结（1）线性支持向量机

支持向量机（SVM）原理小结1. 线性可分支持向量机（硬间隔SVM）2. 线性支持向量机（软间隔SVM）3. 非线性支持向量机4. 支持向量回归（SVR）5. 代码示例6. 模型评价完整代码地址参考本博客中使用到的完整代码请移步至: 我的github：https://github.com/qingyujean/Magic-NLPer，求赞求星求鼓励~~~1. 线性可分支持向量机（硬间隔SVM）线性可分训练数据集的最大间隔超平面是存在且唯一的。2. 线性支持向量机（软间隔SVM）3. 非线性

2021-01-24 03:58:29 1230

原创感知机（Perception）原理小结

感知机（Perception）原理小结1. 感知机模型2. 感知机学习策略3. 感知机学习算法3.1 感知机学习算法的原始形式3.2感知机学习算法的对偶形式4. 模型评价系列博客地址参考完整系列博客请移步至: 我的github：https://github.com/qingyujean/Magic-NLPer，求赞求星求鼓励~~~感知机是二类分类的线性分类模型，对应于特征空间中将实例划分为正负两类的分离超平面，属于判别模型。感知机学习算法有原始形式和对偶形式。适用问题：二类分类模型特点：

2021-01-17 15:06:59 4950

原创 k近邻法（KNN）原理小结

k近邻法（KNN）原理小结1. k 近邻法算法2. k 近邻法模型2.1 k值的选择2.2 距离度量2.3 分类决策规则3. k 近邻法实现：kd（k-dimension）树3.1 构造kd树3.2 搜索kd树3.3 kd 树预测4. 代码示例5. 模型评价完整代码地址参考本博客中使用到的完整代码请移步至: 我的github：https://github.com/qingyujean/Magic-NLPer，求赞求星求鼓励~~~1. k 近邻法算法k-nearest neighbors （k-NN），

2021-01-07 12:07:51 1755

原创 XGBoost使用

XGBoost使用1. XGBoost原理简介2. XGBoost参数说明3. 使用示例完整代码地址参考1. XGBoost原理简介XGBoost本质上还是GBDT，但它把算法的速度和效率做到了极致，所以叫X(Extreme)GBoost。XGBoost主要从以下方面做了优化：算法本身的优化弱学习器的选择上，除了树模型，还支持线性模型等。在损失函数上，加入了正则化项。算法运行效率的优化算法健壮性的优化2. XGBoost参数说明3. 使用示例完整代码地址完整代码请移步至:

2020-12-27 19:26:59 1703 1

原创梯度提升树（GBDT）原理小结

梯度提升树（GBDT）原理小结1. boosting2. 提升树（boosting tree）2.1 提升树模型2.2 提升树算法：前向分步算法2.3 分类问题的提升树算法2.4 回归问题的提升树算法3. 梯度提升树（gradient boosting）3.1 分类问题的梯度提升树算法3.2 回归问题的梯度提升树算法4. 代码示例5. 模型评价完整代码地址参考接着之前的决策树章节和随机森林章节，接下来还会继续介绍一些基于决策树的，具有代表性的集成模型，如GBDT，XGBoost以及lightGBM

2020-12-12 16:04:19 2869

原创随机森林（Random Forest）原理小结

随机森林（Random Forest）原理小结1. bagging2. 随机森林（RF）2.1 RF 分类2.2 特征重要性2.3 RF 回归3. 模型评价4. 参考接着上一章节的决策树模型，接下来会介绍一些基于决策树的，具有代表性的集成模型，如随机森林（RF），GBDT，XGBoost以及lightGBM。本章主要介绍随机森林（Random Forest，简写RF），RF是bagging集成模型的扩展变体，所以前面会简要介绍一些关于bagging的内容，后面会有专门的“集成学习”的章节来重点介绍bag

2020-11-23 22:43:58 11323 4

原创决策树（Decision Tree）原理小结

决策树（Decision Tree）原理小结1. 决策树1.1 决策树基础概念1.2 决策树的学习1.3 决策树学习的3个步骤2. ID3算法2.1 特征选择准则：信息增益2.2 决策树生成算法2.3 决策树剪枝算法3. C4.5算法3.1 特征选择准则：信息增益比3.2 决策树生成算法3.3 决策树剪枝算法4. CART算法4.1 特征选择准则：基尼系数4.2 决策树生成算法4.3 决策树剪枝算法5. 决策树延伸6. 参考1. 决策树1.1 决策树基础概念1.2 决策树的学习1.3 决策树学习的3

2020-11-20 22:22:28 1478

ABBREV.txt--用于做python数据库实验的营养数据源

用于做python数据库实验的营养数据源

空空如也