自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(133)
  • 资源 (1)
  • 收藏
  • 关注

原创 GRU和GRUCell

GRU和GRUCell最直观的图解一、API1.1 GRU官方计算方式如下:rt=σ(Wirxt+bir+Whrh(t−1)+bhr)zt=σ(Wizxt+biz+Whzh(t−1)+bhz)nt=tanh⁡(Winxt+bin+rt∗(Whnh(t−1)+bhn))ht=(1−zt)∗nt+zt∗h(t−1)r_t = \sigma(W_{ir} x_t + b_{ir} + W_{hr} h_{(t-1)} + b_{hr}) \\ z_t = \sigma(W_{iz}

2020-06-17 21:47:09 6081 4

原创 pyTorch 导入预训练词向量

pyTorch 导入预训练词向量现在的预训练词向量很多,如glove,word2vec等。在做实验时,这次词向量基本能够满足自己的需求,只需要从特定的网址把预训练词向量下载下来即可。笔者就是遇到了这样的一个需求,在torch中使用预训练的词向量。于是写下此份笔记,便于后面查询。...

2020-04-24 13:13:37 3840 2

原创 C++项目之演讲比赛模拟

演讲系统(SpeechContext)小结前记最近把C++ 的知识点过了一遍,虽然说不能完全的了解C++语言的特性,但是也发现了它的美,后面想要学习C++的热情高涨,故完成了一个小项目,来达到温故知新的效果吧。主要涉及知识点:类、STL等需求1.比赛规则学校举行一场演讲比赛,共有12个人参加。比赛共两轮,第一轮为淘汰赛,第二轮为决赛。每次比赛共有10名裁判分别对每个选手进行打分。...

2019-09-30 17:25:16 888

原创 特征工程

特征衍生特征衍生是现有的特征进行某种组合,生成新的具有含义的特征。一般情况下,对于给的数据中,缺少必要的条件,我们需要将已知的特征进行组合,然后得到新的特征,这样能够让我们对数据的认识更加清晰。比较好的例子查看怎么样才能使用到我们的任务中特征选择对于总体的特征选择来说,主要可以划分为三种选择方法过滤法:按照发散性或者相关性对各个特征进行评分,设定阈值,选择特征。常见的过滤方式包括方...

2019-08-09 18:07:16 315

原创 数据挖掘之预处理

Task 1:数据预处理预处理:code前记这个系列的任务主要是记录了datawhale 组织的关于 data mining的学习的记录,学习完这个系列的内容,可以基本了解数据分析的技能。简介这个任务任务主要是关于以下内容的完成:数据类型的分析无关特征删除数据类型转换缺失值处理数据切分主要是对于pandas相关函数的学习。数据类型的分析关于数据的分析,其实从导入数据的...

2019-08-05 17:47:55 382

原创 Attention

前记现在的深度学习中,特别是在NLP领域里面,几乎attention已经成为了每个模型的标配,因为attention模型在序列建模上面有着天然的优势,能够将注意力集中到特定的部分。1 Attention的提出​ 在机器翻译(NMT)的任务中,为解决RNN中的Encoder-Decoder的基础上target端输入固定长度的问题,提出了Align方式,这也是Attention的开始。这篇pa...

2019-07-15 20:43:59 973

原创 循环神经网络

循环神经网络(RNNs)1 RNN结构RNN(Recurrent neural network)是为了解决什么一个问题的呢?因为一般情况下序列的信息决定事件本身。如果我们试图使用这类数据得到有用的输出,就需要一个这样的网络:能够访问一些关于数据的先前知识(prior knowledge),以便完全理解这些数据。因此,RNN就出现了。在最原始的情况下,RNN的网络结构如下图:其中,U是输入...

2019-07-12 15:47:55 430

原创 CNN学习记录(二)

CNN学习记录(二)之前写过关于CNN的基础知识总结,在这里也就不再重复这些问题,需要查看基础的请点击。CNN用于文本分类原理我们知道,CNN广泛的用在了图像领域,是图像领域的一个重大利器。但是现在,随着循环神经网络RNNs在长距离文本处理的缺点,人们开始使用CNN来提取特征,CNN提取的方式可以从下图来解释:假设我们一句话是:wait for the video and don't ...

2019-07-09 18:22:18 162

原创 文本分类与LDA

文本分类实战本文主要是针对实战来进行设置的,假设你之前已经了解了朴素贝叶斯和支持向量机(SVM)的基础知识了。现在想从代码的层面去实战文本分类,那么这篇文章可以加深你对这两个算法的理解。1.使用朴素贝叶斯进行文本分类在sklearn的实现中,涉及到朴素贝叶斯的主要是三个类:1.1 GaussianNB类GaussianNB假设特征的先验概率为正态分布,即满足下式:P(Xj=xj∣Y=C...

2019-06-30 18:12:51 2012 2

原创 Top 100 Linked Question 修炼------第338题

338.Counting Bits题目链接题目解释:给出一个非负整数num.对于每个数字i而言,计算从0~num中每个数字在二进制中包含1的个数。最后的结果通过数组返回。Example 1:Input: 2Output: [0,1,1]Example 2:Input: 5Output: [0,1,1,2,1,2]Follow up:很自然的想到时间复杂度...

2019-06-27 21:52:54 183 1

原创 使用互信息进行特征选择

特征提取1.TF-IDF学习之前已经总结过TF-IDF相关的内容了。这里就不再重复编写了,需要的话请参看:https://blog.csdn.net/sir_TI/article/details/88135434。本质内容就是一个公式的问题。然后现在主要总结的就是关于TF-IDF相关的代码分析。先总结出特征提取的流程,然后将相关的内容以代码的形式体现出来。具体请参见我的github2.互...

2019-06-27 18:14:19 13340 5

原创 Top 100 Linked Question 修炼------第337题

337.House Robber III题目链接题目解释:小偷又找到了一个新的偷窃场所啦。到达这个区域只有唯一的入口,这个入口叫做“root",与根相邻的位置,每一个房间只有一"双亲房间",在逛了一遍之后,这个聪明的小偷发现,所有的房屋连接起来是一棵二叉树。如果直接相连的两个房子在同一天晚上被破门而入的话,警察就会到来。求:在不惊动警察的情况下,这个小偷一天晚上能够偷到的最大数量的钱...

2019-06-23 21:08:53 128

原创 基于规则的中文分词方法

基于规则的中文分词方法前记目前,常见的中文分词方法可以分为三类:基于字典、词库匹配的分词方法(基于规则)这种方法是将待分的句子与一个充分大的词典中的词语进行匹配。常用的有:正向最大匹配,逆向最大匹配,最少切分法。实际应用中,将机械分词作为初分手段,利用语言信息提高切分准确率。优先识别具有明显特征的词,以这些词为断点,将原字符串分为较小字符串再机械匹配,以减少匹配错误率,或将分词与词类...

2019-06-23 15:51:52 3738

原创 机器学习相关评价指标

相关指标学习前记在机器学习或者深度学习中,避免不了使用指标去评价某个模型的好坏。通常情况下,一个模型的好坏,是由多个指标来共同决定的,那么有必要去学习他们之间的定义以及关联。在学习模型的评价标准之前,我们需要先定一个基础知识,这些是你必须了解的。通过这些基础知识的了解,我们才可以将模型的评价标准了解的更加透彻。True Positives,TP:预测为正样本,实际也为正样本的特征数...

2019-06-21 19:10:15 262

原创 tensorflow之基本操作

Tensorflow 基本操作前记之前一直想学习tensorflow的,但是苦于tensorflow的操作实在是复杂,计算图、定义图这一套流程走下来感觉也是无比艰难的,于是转投到pytorch门下,无比的感叹pytorch的实用性,但是考虑到现在tensorflow还是主流的深度学习框架,也是需要学习的对象,那么借着Datawhale第八期的机会,开始学习一下tensorflow的基本操作。...

2019-06-20 17:09:33 209

原创 Top 100 Linked Question 修炼------第322题

322.Coin Change题目链接题目解释您将获得不同面额的硬币和总金额。 编写一个函数来计算构成该数量所需的最少数量的硬币。 如果这笔钱不能由任何硬币组合弥补,则返回-1。Example 1:Input: coins = [1, 2, 5], amount = 11Output: 3 Explanation: 11 = 5 + 5 + 1Example 2...

2019-06-14 16:13:18 128

转载 Top 100 Linked Question 修炼------第312题

312.Burst Balloons题目链接题目解释给出n个气球,他们的角标从0到n-1。每个气球上面都画有数字,代表数组中的元素。现在要求你将所有的气球都爆破,如果你选择爆破第i个气球,那么你就会获得nums[left]*nums[i]*nums[right]枚硬币。在这里left和right是和i相邻的角标。在爆破第i个气球之后,left和right代表的气球变成相邻。你如何...

2019-06-13 10:05:05 153

转载 python获取当前目录路径和上级路径

在使用python的时候总会遇到路径切换的使用情况,如想从文件夹test下的test.py调用data文件夹下的data.txt文件:└── folder ├── data │ └── data.txt └── test └── test.py一种方法可以在data文件下加入__init__.py然后在test.py中import da...

2019-06-11 22:12:09 717

原创 Top 100 Linked Question 修炼------第309题

309.Best Time to Buy and Sell Stock with Cooldown题目链接题目解释假设你有一个数组,数组里面的第i个元素是第i天的股票的价格。设计一个算法找到最大的收益,你可以完成任意次数的交易(即可以买卖一个股票多次),但是存在如下的限制:你不能一次进行多个交易(比如:你在买股票之前必须卖掉股票) 在卖了你的股票之后,你在卖股票的下一天不能...

2019-06-11 16:45:05 127

原创 Top 100 Linked Question 修炼------第301题

301.Remove Invalid Parentheses题目链接题目解释:删除最少的括号使得输入的括号匹配(有效),返回所有有效的括号匹配方式注意:输入的字符中不仅仅只是有括号,也存在字符。Example 1:Input: "()())()"Output: ["()()()", "(())()"]Example 2:Input: "(a)())()"Out...

2019-06-10 15:33:33 144

原创 Top 100 Linked Question 修炼------第300题

300.Longest Increasing Subsequence题目链接题目解释:给出一个没有排序的整型数组,找到最长的升序序列的长度。Example:Input: [10,9,2,5,3,7,101,18]Output: 4 Explanation: The longest increasing subsequence is [2,3,7,101], therefo...

2019-06-10 11:22:08 138

原创 Top 100 Linked Question 修炼------第297题

297.Serialize and Deserialize Binary Tree题目链接题目解释:序列化是一个将数据结构或者对象转换为一个序列化的比特的过程,在进行这个操作之后,数据能够被存储到文件中或者内存缓冲区,或者通过网络连接链路传输,以便稍后在相同或另一个计算机环境中重建。设计一个算法,去序列化和解序列化一个二叉树,关于你的算法是如何序列化/反序列化工作的没有限制,你仅仅需...

2019-06-01 22:13:06 187

原创 Top 100 Linked Question 修炼------第283题、第287题

283.Move Zeroes题目链接题目解释:给出一个nums数组,写一个方法将所有的0移动到数组的末尾,但是不改变原来数组中其他元素的顺序。Example:Input: [0,1,0,3,12]Output: [1,3,12,0,0]Note:你必须是采用就地调换,空间复杂度为O(1) 最小话元素的操作。题目分析:首先,不考虑其他注意事项,我们可以申请一...

2019-05-31 20:52:58 130

原创 Top 100 Linked Question 修炼------第240题、第279题

240.Search a 2D Matrix II题目链接题目解释:写出一个高效的算法,在mxn的数组中找到给定的元素,这个数组有以下特点:在每一行,元素都是按照升序进行排列的; 在每一列,元素都是按照升序进行排列的Example:考虑给定以下的数组:[ [1, 4, 7, 11, 15], [2, 5, 8, 12, 19], [3, 6,...

2019-05-28 17:00:24 137

原创 【深度学习实战】---TensorBoard网络可视化

【深度学习实战】—TensorBoard网络可视化前记为了能够更加深层次的理解我们的网络结构,不必要是画一份简简单单的网络的草图(如【深度学习实战】迈出第一步------编写第一个神经网络),那么我们可以借助TensorFlow上面的可视化工具TensorBoard来可视化我们网络结构。只能说用了一次这样的工具,你会发现,你对网络中数据的流动会更加的清楚,上面还有一系列的维度表示,可以清楚的让...

2019-05-26 18:06:33 4154 8

原创 Top 100 Linked Question 修炼------第238题、第239题

238.Product of Array Except Self题目链接题目解释:给出一个含有n个整数的数组(n>1),返回这样一个数组:数组中的元素为除可当前角标的元素外的所有元素之积。Example:Input: [1,2,3,4]Output: [24,12,8,6]注意:解决这个问题的时候不能采用除法,并且时间复杂度需要为O(n).更进一步:你能...

2019-05-23 15:03:32 119

原创 Top 100 Linked Question 修炼------第226题、第234题

226.Invert Binary Tree题目链接题目解释:翻转一棵二叉树。Example:Input: 4 / \ 2 7 / \ / \1 3 6 9Output: 4 / \ 7 2 / \ / \9 6 3 1题目分析:首先最简单的就是采用递归的方式:我们需要...

2019-05-16 15:05:57 126

原创 Top 100 Linked Question 修炼------第221题

221.Maximal Square题目链接题目解释:给出一个二维数组,里面的元素全都是0和1,找到最大的正方形的面积(全部由‘1’组成的面积)。Example:Input: 1 0 1 0 01 0 1 1 11 1 1 1 11 0 0 1 0Output: 4题目分析:实际来说,本题刚看过来是没有具体的思路的,然后分析题目可得,我们要求最大的正方形面积,...

2019-05-15 16:00:31 111

原创 Top 100 Linked Question 修炼------第215题

215.Kth Largest Element in an Array题目链接题目解释:在未排序的数组中找到第k大的数。注意:第k大的数是指在排序中的第k大的数,而不是在原始数据中的第k个数。Example 1:Input: [3,2,1,5,6,4] and k = 2Output: 5上面的最后一句话的解释到具体例子中就是找到第2大的数,将输入排序为[1,2,3,...

2019-05-14 09:16:25 96

原创 Top 100 Linked Question 修炼------第208题

208.Implement Trie (Prefix Tree)题目链接题目解释:完成一个triez这样的数据结构,要求其具备有插入(insert)、查找(search)、开始元素(startsWiths)方法。Example:Trie trie = new Trie();trie.insert("apple");trie.search("apple"); //...

2019-05-10 12:50:36 116

原创 Top 100 Linked Question 修炼------第207题

207.Course Schedule题目链接题目解释:总共有n种的课你需要去上,这些课标号从0到n-1。你上某些课程之前需要有一些先修课程,如你想要参加课程0,那么你必须先学习完课程1,这个可以采用一个配对来表示:[0,1]。给出总的课程数以及先修课程匹配对,判断一下,你是否能修完所有的课程?Example 1:Input: 2, [[1,0]] Output: tru...

2019-05-10 10:35:18 134

原创 Top 100 Linked Question 修炼------第200题、第206题

200.Number of Islands题目链接题目解释:给出一个二维的数组,里面只是包含字符‘0’和字符‘1’,其中字符‘0’代表水,字符‘1’代表岛屿。岛屿是被水所环绕同时也是被垂直或者水平方向的岛屿相连接。假设所有边缘的部分都是被水所环绕Example 1:Input:11110110101100000000Output:1解释:上面的所有的字符‘1’...

2019-05-08 16:23:55 98

原创 Top 100 Linked Question 修炼------第169题、第198题

169.Majority Element题目链接题目解释:给出一个长度为n的数组,找到主元素。这个主元素是在这个数组中出现的次数超过了数组长度的一半。假设这个数组非空以及主元素是存在的。Example 1:Input: [3,2,3]Output: 3Example 2:Input: [2,2,1,1,1,2,2]Output: 2题目分析:数组的长度我们可以...

2019-05-06 12:53:08 120

原创 Top 100 Linked Question 修炼------第155题、第160题

155.Min Stack题目链接题目解释:设计一个栈的数据结构,使得这个数据结构能够支持入栈、出栈、取得栈顶元素以及在线性时间内找到最小的元素。push(x) -- 将x元素入栈 pop() -- 将栈顶元素从栈中移除 top() -- 获取栈顶元素 getMin() -- 在栈中找到最小的元素Example:MinStack minStack = new MinSt...

2019-04-29 10:42:50 130

原创 【深度学习实战】迈出第一步------编写第一个神经网络

前记其实刚开始记录这个内容的时候,自己的内心是很纠结的,因为这本就不是我应该纠结的内容,coding是一个程序员必备的技能,不管他是处在一个什么岗位,但是自己貌似走入了一个误区,关于DeepLearning这一块,我一直在跑别人的代码,自认为理论熟悉了,代码写起来不就是小case么,自己是错了,因为,自己在写的时候,发现根本就写不出来,神经网络就是个黑盒子,看的轮子再多,自己没造一个轮子的话,...

2019-04-28 20:37:37 486

原创 Top 100 Linked Question 修炼------第148题、第152题

148.Sort List题目链接题目解释:将一个链表进行排序,要求时间复杂度为O(nlogn),空间复杂度为O(1)Example 1:Input: 4->2->1->3Output: 1->2->3->4Example 2:Input: -1->5->3->4->0Output: -1->0-&...

2019-04-26 11:15:26 125

原创 Top 100 Linked Question 修炼------第142题

142.Linked List Cycle II题目链接题目解释:给出一个链表,如果这个链表有环的话,那么找到环的入口点,如果链表没有环,那么返回NULL为了表示给定的链表里面是否有环,我们给定一个标志位pos,如果pos等于0,最后一个结点是指向头结点,如果pso= -1,那么这个给定的链表里面没有环。Example 1:Input: head = [3,2,0,-4],...

2019-04-24 16:19:50 157

原创 Top 100 Linked Question 修炼------第139题、第141题

139.Word Break题目链接题目解释:给出一个非空的字符串和一个包含多个单词的wordDict,判断s是否能够被划分为包含wordDIct中的单词的序列。注意:在划分的过程中,在词典中相同的单词可能会被使用多次; wordDict中不包含重复的元素Example1Input: s = "leetcode", wordDict = ["leet", "code"]...

2019-04-24 10:28:14 137

原创 CART分类与回归

CART分类树与回归树前记本篇文章不会大幅度去介绍CART是怎么来的,以及CART与其他不同的地方,但是会着重的讲解在面试过程中遇到的问题,知识点的话会简单点的温习一下,本文是按照博主学习CART的过程俩编写,本文假设读者已经知道了ID3已经C4.5算法,若写的有问题,请指出,谢谢.1. 为什么会有CART我们已经知道在ID3中,我们是使用信息增益去作为分类的基准的,在现场面试中,面试官曾...

2019-04-21 16:14:32 1791

原创 Top 100 Linked Question 修炼------第128题、第136题

128.Longest Consecutive Sequence题目链接题目解释:给出一个未排序的数组,找到最长的连续元素序列的长度。要求:算法的时间复杂度为O(n)Example:Input: [100, 4, 200, 1, 3, 2]Output: 4Explanation: The longest consecutive elements sequence is...

2019-04-19 09:51:11 209

机器学习-吴恩达作业练习

斯坦福大学吴恩达教授的课件上的同步练习题,每个章节都有对应的习题。

2018-04-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除