子颠三号倒四-CSDN博客

原创 LeetCode刷题 --哈希表与字符串【2020第一版】

1.哈西表1.1 哈希表概述\quad哈西表(hash table,也叫散列表)，是根据关键字值(key)直接进行访问的数据结构，它通过把关键字映射到表中一个位置(数组下标)来直接访问，以加快查找关键字值的速度。这个映射函数叫做哈西(散列)函数，存放记录的数组叫做哈西（散列）表。//哈西排序：实践复杂度O(表长+n) n为元素个数int random[10] = {999,1,44,555,666,8,12,902,11,520}; //在0-1000中的随意取值int hash_map[100

2020-06-17 19:46:35 323 1

原创 leetcode---二分搜索和BST【2020第一版】

#诗经·秦风·蒹葭蒹葭苍苍，白露为霜。所谓伊人，在水一方。溯洄从之，道阻且长。溯游从之，宛在水中央。蒹葭凄凄，白露未晞。所谓伊人，在水之湄。溯洄从之，道阻且跻。溯游从之，宛在水中坻。蒹葭采采，白露未已。所谓伊人，在水之涘。溯洄从之，道阻且右。溯游从之，宛在水中沚。...

2020-06-13 08:38:16 197

原创 leetcode树（图）的广度优先和深度优先---2020第一版

#诗经·秦风·权舆於我乎，夏屋渠渠，今也每食无奈。于嗟乎，不承权舆。於我乎，梅食四簋，今也每食不饱。于嗟乎，不承权舆。0.树

2020-06-10 10:45:37 311

原创 NLP文本处理之分词实现---维特比和暴力

余华《活着》 1. 检验一个人的标准，就是看他把时间放在了哪儿。别自欺欺人；当生命走到尽头，只有时间不会撒谎。 2. 这两只鸡养大了变成鹅，鹅养大了变成羊，羊大了又变成牛。我们啊，也就越来越有钱啦。#2020-6-7晚读了一遍活着，虽然自己现在技术远不如人，#但我愿意为了NLP的技术学习而“活”，这又何尝不是一种活着呢。#近来学习有感，一定要重视基础的算法及数据结构，任何时候，任何场合，任何对象，#都能用到，今天的博文将会用到<动态规划>及<回溯递归>

2020-06-08 10:48:40 375

原创 LeetCode刷题---递归回溯分治【2020第一版】

0.摘要\qquad递归的原则:当前步骤处理当前的问题，递归处理后续问题；\qquad回溯：探索到某一步时，发现原先选择达不到目标，则后退一步重新选择，走不通就退回再走；\qquad分治：1.回溯法#include<vector>vector<vector<int>> subsets(vector<int>& nums){ vector<vector<int>> result; vector<int&

2020-06-06 14:40:56 199

原创 leetCode刷题---贪心算法【2020第一版】

0.贪心算法概述\qquad从问题的初始状态出发，设定某种规律，不断进行贪心选择取得当前最优，最终得到整个问题的(一个)最优解。1.分糖果Q:A:设定贪心规律：s[i]不能满足某个g[j],则不能满足g[j+1]及后续；g[j]如果能用s[i]满足，则不需要用s[i+1]及后续更大来满足，因此可以保留更大的来满足后续的g[j+1]；【贪心】对g[j]从小到大满足，优先配给小的g[j].【贪心】#include<algorithm>int findContent(vector

2020-06-02 08:30:10 354

原创 LeetCode刷题--栈，队列，堆

例4，栈和队列综合#include<stack>#include<queue>bool check_is_valid_order(std::queue<int> &order){ std::stack<int> s; int n=order.size(); for(int i=1; i<=n; ++i) { s.push(i); while(!s.empty() && order.front()==s.

2020-05-26 21:44:30 371

原创 SVM中的对偶问题原理

0.摘要本文仅从SVM的“对偶问题”出发去阐述优化求解问题中的数学原理。1.“对偶原理”1.1 原问题：minimize:f0(x)minimize: f_0(x)minimize:f0(x)s.t.gi(x),i=1,2...,ms.t. \quad g_i(x),i=1,2...,ms.t.gi(x),i=1,2...,mhj(x),j=1,2,...n\qquad h_j(x),j=1,2,...nhj(x),j=1,2,...n原问题在于将生活中的优化问题和其需要满足的条件以一

2020-05-20 11:58:35 738

原创 LeetCode刷题----链表【2020第一版】

0.摘要链表应该是面试中被问得最频繁的数据结构。原因：①链表通过指针将若干个节点连接成链状结构，其"增删改查"操作易于实现。②链表需要对指针的操作，需要较好的编程功底。1. 8道经典链表题目1.1 链表逆序(eazy)Q: 已知链表头节点指针head,将链表逆序。(不可申请额外空间)A1:（非递归结构）思路: 从前到后改变next指针所指的方向ListNode *reverseList(ListNode* head){ ListNode* newhead = NULL; while

2020-05-16 11:21:23 238

原创 NLP---信息抽取

Information Extraction简介抽取实体(entities):·通用性：人(person), 地名(location),时间(time)·专业性：医疗领域(蛋白质，疾病，药物)抽取关系(relations)·位于（located in), 工作在(work at), 部分(is part of)基于规则的方法，基于监督学习的方法，boostrap方法，distant-supervision方法，无监督学习·实现消歧 ·实现统一 ·指代消

2020-05-12 18:45:51 948

原创 NLP项目实战---基于检索的问答系统

import jsonfrom matplotlib import pyplot as pltimport reimport stringimport nltkfrom nltk.corpus import stopwordsfrom nltk.tokenize import word_tokenizefrom nltk.stem.porter import PorterStemme...

2020-05-12 18:39:32 2561 3

原创 NER--关系抽取常用算法

关系抽取通常的做法：基于规则(工业大多数用)监督学习半监督&无监督学习·Bootstrap（Snowball）·Distant Supervision·无监督学习1.基于规则的方法—“is-a”目标：找出尽可能多的拥有"is-a"关系的实体对(entity,is-a,entity)比如文本：“…apple is a fruit…”“…fruit such as apple…”“…fruit including apple, banala…”基于上述文本，人为设定规则：

2020-05-12 11:08:24 1952 1

原创优化问题无处不在，机器学习核心所在

optimization is the core of machine learningAI问题 = 模型 + 优化任何一个优化问题，都可以写成如下形式：Minimizef0(x)Minimize f_0(x)Minimizef0(x)s.t.fi(x)<=0,i=1,2...,Ks.t. f_i(x)<=0,i={1,2...,K}s.t.fi(x)<=0,i=1,2...,Kgj(x)=0,j=1,2,...Lg_j(x)=0,j={1,2,...L}gj(x)=0

2020-05-08 18:34:08 201

原创 LASSO回归之特征选择

MLE --framework – MAPMLE:argmaxP(D∣θ)MLE:argmax P(D|\theta)MLE:argmaxP(D∣θ)MAP:argmaxP(θ∣D)MAP:argmaxP(\theta|D)MAP:argmaxP(θ∣D) = argmaxP(D∣θ)P(θ)argmax P(D|\theta)P(\theta)argmaxP(D∣θ)P(θ)MAP 是在M...

2020-05-07 20:28:28 7330

原创机器学习--模型复杂度及正则化

逻辑回归会倾向于学习到ω\omegaω最大的值，怎么解决这个问题在损失函数中引入正则项：L(θ)=∑i=1Nyilog(11+exp⁡(−ωTx))+(1−yi)log(exp⁡(−ωTx)1+exp⁡(−ωTx)+12λω2L(\theta) = \sum_{i=1}^N y_{i}log(\frac{1}{1+\exp(-\omega^Tx)})+(1-y_{i})log(\frac{\e...

2020-05-06 20:14:36 486

原创逻辑回归模型及梯度下降法收敛性分析

逻辑回归logistic 回归即对数几率回归，名字虽然叫“回归”，却是一种用于二分类的分类算法，通过训练样本学到一条线，去把不同类别的样本区别开，而不是通过拟合数据点，用sigmoid函数估计样本属于正样本的概率。逻辑回归因其易于实现，强解释性，以及容易扩展，被广泛用于点击率预估（CTR），计算广告(CA)以及推进系统(RS）等任务中。学习输入到输出的映射：f:X→Yf: X \righta...

2020-05-06 18:12:26 1833

原创 AI的两大分支---基于规则推理的专家系统和基于概率的系统

基于规则推理的专家系统专家系统：也叫符号主义，基于规则推理，特别是没有数据集或数据量很少时，例如：金融风控领域搭建专家系统的流程：1.需要一批领域的专家，输出工作经验2.需要知识工程师，将专家的经验转换成计算机可识别的形式编码专家经验，形成知识库3.基于知识库，由算法工程师来编写推理引擎。专家系统的特性：1.处理不确定性2.知识的表示3.可解释性4.可以做知识推理知识的表...

2020-05-04 16:40:35 2104

原创 NLP预处理阶段----拼写纠错实战

错误的输入:s正确的写法：c基于朴素贝叶斯的Noisy channel Model：c=argmaxc∈candidatep(c∣s)=argmaxc∈candidatep(c∣s)∗p©c=argmax_{c\in candidate}p(c|s)=argmax_{c\in candidate}p(c|s)*p©c=argmaxc∈candidate p(c∣s)=argmaxc...

2020-05-02 20:56:47 649 4

原创 NLP--语言模型及文本处理技术

并不是出现的越多就越重要，并不是出现的越少就越不重要！

2020-05-02 11:30:48 425

原创动态规划【2020第一版】

动态规划的基本思想将给定问题分解成不同部分(子问题)，通过合并子问题的解来得到原问题的解。通过构建状态列表将子问题的解记忆化储存。再解决临近子问题时通过查表避免重复计算，从而降低时间复杂度。动态规划的三个步骤确定目标问题确定子问题及状态opt[n]子问题必须具有最优子结构，使得动态规划能够抵达全局最优解而不是如贪心算法一样只关注局部最优解。子问题必须具有无后效性，当前多个最优解的取得与...

2020-05-01 20:09:48 161

原创基于统计学习方法的自然语言处理概述

NLP课程（一，NLP概述和应用场景）AI 工程师核心技能：现实生活中问题 —> 数学优化问题 —> 通过合适的工具来解决。what is NLPNLP = NLU +NLG· NLU：语音 / 文本 --> 意思（understanding）· NLG: 意思 —> 文本/语音 (generate)NLP is Harder(vs Computer...

2020-04-30 21:43:25 1420

"禅达牛车"的博客