路啦路-CSDN博客

原创《剑指offer》python版本分类刷题（下）

7/30用两个栈实现队列题目描述用两个栈来实现一个队列，完成队列的Push和Pop操作。队列中的元素为int类型。解题思路队列的Push就是直接进栈；Pop:节点进入stack1，然后再stack1的元素pop出，push到stack2中，stack2再pop出来就是先进先出的顺序了。步骤：判断stack2是否为空，不为空就pop将stack1的节点pop出，然后push进stack2，再将stack2的元素pop。class Solution: def __init__

2020-07-30 16:02:17 254

原创《剑指offer》python版本分类刷题（上）

列表列表反转：class Solution: # 返回从尾部到头部的列表值序列，例如[1,2,3] def printListFromTailToHead(self, listNode): # write code here if not listNode: return [] stack = [] p = listNode while p: stack.a

2020-07-10 10:33:34 271

原创使用图计算进行金融犯罪和欺诈检测：应用注意事项和展望

论文：Financial Crime & Fraud Detection Using GraphComputing: Application Considerations & Outlook摘要：文章概述了金融犯罪领域的最新技术发展趋势。讨论了图算法在金融犯罪和欺诈检测应用中存在的困难。2013年-2018 年，中国的移动支付增长超过 120%（复合年增长率）。另一一方面，在这种新的快速发展的数字支付格局下欺诈犯罪活动也迅速演变。全球金融犯罪量估计约为每年 1.4-3.5 万

2021-09-24 15:06:21 847

原创 0-1背包

https://leetcode-cn.com/problems/partition-equal-subset-sum/solution/416-fen-ge-deng-he-zi-ji-dong-tai-gui-hu-csk5/

2021-07-22 16:14:11 127

原创 leetcode

https://leetcode-cn.com/problems/product-of-array-except-self/solution/cheng-ji-dang-qian-shu-zuo-bian-de-cheng-ji-dang-q/

2021-07-17 22:50:14 159

转载岛屿类问题的通用解法、DFS 遍历框架

https://leetcode-cn.com/problems/course-schedule/solution/course-schedule-tuo-bu-pai-xu-bfsdfsliang-chong-fa/

2021-07-07 19:10:38 98

原创 leetcode刷题-回溯法学习和总结

描述：回溯算法实际上一个类似枚举的搜索尝试过程，主要是在搜索尝试过程中寻找问题的解，当发现已不满足求解条件时，就 “回溯” 返回，尝试别的路径。回溯法是一种选优搜索法，按选优条件向前搜索，以达到目标。但当探索到某一步时，发现原先选择并不优或达不到目标，就退回一步重新选择，这种走不通就退回再走的技术为回溯法，而满足回溯条件的某个状态的点称为 “回溯点”。许多复杂的，规模较大的问题都可以使用回溯法，有“通用解题方法”的美称。回溯算法的基本思想是：从一条路往前走，能进则进，不能进则退回来，换一条路再试。

2021-04-07 20:51:23 126

原创 15. 三数之和

给你一个包含 n 个整数的数组 nums，判断 nums 中是否存在三个元素 a，b，c ，使得 a + b + c = 0 ？请你找出所有和为 0 且不重复的三元组。注意：答案中不可以包含重复的三元组。示例 1：输入：nums = [-1,0,1,2,-1,-4]输出：[[-1,-1,2],[-1,0,1]]示例 2：输入：nums = []输出：[]n = len(nums) nums.sort() res = [] if n < 3

2021-04-07 19:37:53 84

原创 415. 字符串相加

给定两个字符串形式的非负整数 num1 和num2 ，计算它们的和。提示：num1 和num2 的长度都小于 5100num1 和num2 都只包含数字 0-9num1 和num2 都不包含任何前导零你不能使用任何內建 BigInteger 库，也不能直接将输入的字符串转换为整数形式链接：https://leetcode-cn.com/problems/add-stringsclass Solution(object): def addStrings(self, num1, num2

2021-04-07 17:46:50 55

转载树的前序、中序、后序遍历——容易记忆的方法

在树的深度优先遍历中（包括前序、中序、后序遍历），递归方法最为直观易懂，但考虑到效率，我们通常不推荐使用递归。栈迭代方法虽然提高了效率，但其嵌套循环却非常烧脑，不易理解，容易造成“一看就懂，一写就废”的窘况。而且对于不同的遍历顺序（前序、中序、后序），循环结构差异很大，更增加了记忆负担。因此，我在这里介绍一种“颜色标记法”（瞎起的名字……），兼具栈迭代方法的高效，又像递归方法一样简洁易懂，更重要的是，这种方法对于前序、中序、后序遍历，能够写出完全一致的代码。其核心思想如下：使用颜色标记节点的状态，新

2021-04-06 22:47:30 479

转载集成学习task2——基本回归模型

2. 使用sklearn构建完整的机器学习项目流程一般来说，一个完整的机器学习项目分为以下步骤：明确项目任务：回归/分类收集数据集并选择合适的特征。选择度量模型性能的指标。选择具体的模型并进行训练以优化模型。评估模型的性能并调参。2.1 使用sklearn构建完整的回归项目(1) 收集数据集并选择合适的特征：在数据集上我们使用我们比较熟悉的Boston房价数据集，原因是：第一个，我们通过这些简单的数据集快速让我们上手sklearn，以及掌握sklearn的相关操作。第二个，我们用

2021-03-18 00:30:33 202

转载集成学习（一）—— 机器学习基础

1.导论什么是机器学习？机器学习的一个重要的目标就是利用数学模型来理解数据，发现数据中的规律，用作数据的分析和预测。数据通常由一组向量组成，这组向量中的每个向量都是一个样本，我们用xix_ixi来表示一个样本，其中i=1,2,3,...,Ni=1,2,3,...,Ni=1,2,3,...,N,共N个样本，每个样本xi=(xi1,xi2,...,xip,yi)x_i=(x_{i1},x_{i2},...,x_{ip},y_i)xi=(xi1,xi2,...,xip,yi)共p+1个维度，前p个维

2021-03-15 22:29:45 291

转载深度学习文本匹配

https://www.cnblogs.com/ZhangHT97/p/13391689.html

2021-01-31 10:47:54 385

原创 leetcode235. 二叉搜索树的最近公共祖先

二叉搜索树的最近公共祖先给定一个二叉搜索树, 找到该树中两个指定节点的最近公共祖先。百度百科中最近公共祖先的定义为：“对于有根树 T 的两个结点 p、q，最近公共祖先表示为一个结点 x，满足 x 是 p、q 的祖先且 x 的深度尽可能大（一个节点也可以是它自己的祖先）。”例如，给定如下二叉搜索树: root = [6,2,8,0,4,7,9,null,null,3,5]示例 1:输入: root = [6,2,8,0,4,7,9,null,null,3,5], p = 2, q = 8输.

2021-01-22 13:20:01 62

原创 leetcode104. 二叉树的最大深度

题目描述：给定一个二叉树，找出其最大深度。二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。说明: 叶子节点是指没有子节点的节点。示例：给定二叉树 [3,9,20,null,null,15,7]， 3 / \ 9 20 / \ 15 7返回它的最大深度 3 。解题：方法一：递归这是一道简单题，解法也比较多，递归的思路很好理解，树的深度等于左子树和右子树中深度较大的那个深度加1。# Definition for a binary tree

2021-01-22 11:30:45 84

转载一个框架看懂优化算法之异同 SGD/AdaGrad/Adam

https://zhuanlan.zhihu.com/p/32230623

2021-01-13 23:38:05 165

原创 leetcode22. 括号生成，32. 最长有效括号（python）

括号生成数字 n 代表生成括号的对数，请你设计一个函数，用于能够生成所有可能的并且有效的括号组合。示例：输入：n = 3输出：[“((()))”,“(()())”,“(())()”,“()(())”,“()()()”]深度优先搜索：class Solution: def generateParenthesis(self, n: int) -> List[str]: res = [] cur_str = '' .

2020-10-13 19:54:29 110

转载 seq2seq

https://kexue.fm/archives/5861

2020-08-26 10:51:10 84

原创 8/25动态规划下

5. Leetcode72. 编辑距离给定两个单词 word1 和 word2，计算出将 word1 转换成 word2 所使用的最少操作数。题目描述你可以对一个单词进行如下三种操作：插入一个字符删除一个字符替换一个字符示例 1:输入: word1 = "horse", word2 = "ros"输出: 3解释: horse -> rorse (将 'h' 替换为 'r')rorse -> rose (删除 'r')rose -> ros (删除 'e')

2020-08-25 22:03:21 116

原创 8/24 动态规划

1. 最长上升子序列题目描述给定一个无序的整数数组，找到其中最长上升子序列的长度。示例:输入: [10,9,2,5,3,7,101,18]输出: 4 解释: 最长的上升子序列是 [2,3,7,101]，它的长度是 4。说明:可能会有多种最长上升子序列的组合，你只需要输出对应的长度即可。你算法的时间复杂度应该为 O(n2) 。def lengthOfLIS(self, nums: List[int]) -> int: if not nums:return 0 #

2020-08-24 20:42:07 109

原创分类刷题2——动态规划

动态规划常常适用于有重叠子问题和最优子结构性质的问题，动态规划方法所耗时间往往远少于朴素解法。主要思想若要解一个给定问题，我们需要解其不同部分（即子问题），再根据子问题的解以得出原问题的解。动态规划往往用于优化递归问题，例如斐波那契数列，如果运用递归的方式来求解会重复计算很多相同的子问题，利用动态规划的思想可以减少计算量。动态规划法仅仅解决每个子问题一次，具有天然剪枝的功能，从而减少计算量，一旦某个给定子问题的解已经算出，则将其记忆化存储，以便下次需要同一个子问题解之时直接查表。动态规划模板步骤：

2020-08-20 18:03:52 392

原创数组中的逆序对（python）

数组中的逆序对这个题就是在归并排序的合并的过程中，加入逆序对的统计。在看归并排序时先做一道简单题，合并两个有序数组。题目说明：给你两个有序整数数组 nums1 和 nums2，请你将 nums2 合并到 nums1 中，使 nums1 成为一个有序数组。解题思路：设置两个指针分别指向两个数组，这两个指针指向的数字谁比较小就把它移到新数组种，同时指针往前1个位置class Solution: def merge(self, nums1, nums2): # 设置两个指针分别指向两

2020-08-20 16:13:10 852

原创 bert4keras快速使用以及对抗训练

文章目录1. bert4keras快速上手2.对抗训练1. bert4keras快速上手下面是一个调用bert base模型来编码句子的简单例子：from bert4keras.models import build_transformer_modelfrom bert4keras.tokenizers import Tokenizerimport numpy as npconfig_path = '/root/kg/bert/chinese_L-12_H-768_A-12/bert_conf

2020-08-18 22:11:40 5527 4

原创分类刷题1——分治

文章目录分治引文主要思想分治算法的步骤分治法适用的情况伪代码举个栗子算法应用[169. 多数元素](https://leetcode-cn.com/problems/majority-element/)[53. 最大子序和](https://leetcode-cn.com/problems/maximum-subarray/)[50. Pow(x, n)](https://leetcode-cn.com/problems/powx-n/)参考资料分治引文MapReduce（分治算法的应用）是 Goo

2020-08-17 15:55:22 179

原创常见激活函数总结

1. sigmoid公式：sigmoid(z)=11+e−z sigmoid(z) = \frac {1} {1+e^{-z }} sigmoid(z)=1+e−z1sigmoid能够把输入映射到0和1之间，在物理上最接近神经元，可以被表示成概率，或者用于数据的归一化。但是它有两个严重的缺陷：其一，梯度消失——导数 f’(x)=f(x)(1-f(x))，当x趋于无穷时，f(x)的两侧导数逐渐趋于0。在后向传递时，sigmoid向下传递的梯度包含了一个 f’(x)因子，因此，一旦落入.

2020-08-12 16:37:05 139

转载 word2vec原理

https://www.cnblogs.com/peghoty/p/3857839.html

2020-08-06 11:39:04 104

原创数据不均衡常用处理方法及NLP中的数据增强

所谓的不平衡指的是不同类别的样本量差异非常大，或者少数样本代表了业务的关键数据(少量样本更重要)，需要对少量样本的模式有很好的学习。样本类别分布不平衡主要出现在分类相关的建模问题上。样本类别分布不均衡从数据规模上可以分为大数据分布不均衡和小数据分布不均衡两种:大数据分布不均衡——整体数据规模较大，某类别样本占比较小。例如拥有1000万条记录的数据集中，其中占比5万条的少数分类样本便于属于这种情况。小数据分布不均衡——整体数据规模小，则某类别样本的数量也少，这种情况下，由于少量样本数太少，

2020-08-05 22:58:15 4708 1

原创 Task06-基于深度学习的文本分类04

基于Bert的文本分类Bert Pretrain预训练过程使用了Google基于Tensorflow发布的BERT源代码。首先从原始文本中创建训练数据，由于本次比赛的数据都是ID，这里重新建立了词表，并且建立了基于空格的分词器。class WhitespaceTokenizer(object): """WhitespaceTokenizer with vocab.""" def __init__(self, vocab_file): self.vocab = load_

2020-08-05 10:34:26 304

原创 Task5 基于深度学习的文本分类2

学习目标学习Word2Vec的使用和基础原理学习使用TextCNN、TextRNN进行文本表示学习使用HAN网络结构完成文本分类

2020-07-31 23:41:49 146 6

转载机器阅读理解整理

机器阅读理解整理经典模型整理笔记后Bert时代机器阅读理解后续自己论文整理已经分类整大的实验室:UCL MRC_Group:AI2:微软:THU:PKU:数据集文章ROPES | Reasoning Over Paragraph Effects in SituationsarXiv: https://arxiv.org/abs/1908.05852Leadboard: https://leaderboard.allenai.org/ropesNoteLab

2020-07-30 11:45:44 4302

原创机器阅读理解笔记（上）——机器阅读理解模型架构

4.1 总体架构一般分为编码层、交互层和输出层。机器阅读理解模型的输入为文章和问题。因此，首先要对这两部分进行数字化编码，将其变成可以被计算机处理的信息单元。在编码的过程中，模型需要保留原有语句在文章中的语义。因此，每个单词、短语和句子的编码必须建立在理解上下文的基础上。我们把模型中进行编码的模块称为编码层。接下来，由于文章和问题之间存在相关性，模型需要建立文章和问题之间的联系。例如，如果问题中出现关键词“河流”，而文章中出现关键词“长江”，虽然两个词不完全一样，但是其语义编码接近。因此，文章中“

2020-07-28 11:27:43 1825

空空如也

空空如也