自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 收藏
  • 关注

原创 《剑指offer》python版本 分类刷题(下)

7/30用两个栈实现队列题目描述用两个栈来实现一个队列,完成队列的Push和Pop操作。 队列中的元素为int类型。解题思路队列的Push就是直接进栈;Pop:节点进入stack1,然后再stack1的元素pop出,push到stack2中,stack2再pop出来就是先进先出的顺序了。步骤:判断stack2是否为空,不为空就pop将stack1的节点pop出,然后push进stack2,再将stack2的元素pop。class Solution: def __init__

2020-07-30 16:02:17 254

原创 《剑指offer》python版本 分类刷题(上)

列表列表反转:class Solution: # 返回从尾部到头部的列表值序列,例如[1,2,3] def printListFromTailToHead(self, listNode): # write code here if not listNode: return [] stack = [] p = listNode while p: stack.a

2020-07-10 10:33:34 271

原创 使用图计算进行金融犯罪和欺诈检测:应用注意事项和展望

论文:Financial Crime & Fraud Detection Using GraphComputing: Application Considerations & Outlook摘要:文章概述了金融犯罪领域的最新技术发展趋势。讨论了图算法在金融犯罪和欺诈检测应用中存在的困难。2013年-2018 年,中国的移动支付增长超过 120%(复合年增长率)。另一一方面,在这种新的快速发展的数字支付格局下欺诈犯罪活动也迅速演变。全球金融犯罪量估计约为每年 1.4-3.5 万

2021-09-24 15:06:21 847

原创 0-1背包

https://leetcode-cn.com/problems/partition-equal-subset-sum/solution/416-fen-ge-deng-he-zi-ji-dong-tai-gui-hu-csk5/

2021-07-22 16:14:11 127

原创 leetcode

https://leetcode-cn.com/problems/product-of-array-except-self/solution/cheng-ji-dang-qian-shu-zuo-bian-de-cheng-ji-dang-q/

2021-07-17 22:50:14 159

转载 岛屿类问题的通用解法、DFS 遍历框架

https://leetcode-cn.com/problems/course-schedule/solution/course-schedule-tuo-bu-pai-xu-bfsdfsliang-chong-fa/

2021-07-07 19:10:38 98

原创 leetcode刷题-回溯法学习和总结

描述:回溯算法实际上一个类似枚举的搜索尝试过程,主要是在搜索尝试过程中寻找问题的解,当发现已不满足求解条件时,就 “回溯” 返回,尝试别的路径。回溯法是一种选优搜索法,按选优条件向前搜索,以达到目标。但当探索到某一步时,发现原先选择并不优或达不到目标,就退回一步重新选择,这种走不通就退回再走的技术为回溯法,而满足回溯条件的某个状态的点称为 “回溯点”。许多复杂的,规模较大的问题都可以使用回溯法,有“通用解题方法”的美称。回溯算法的基本思想是:从一条路往前走,能进则进,不能进则退回来,换一条路再试。

2021-04-07 20:51:23 126

原创 15. 三数之和

给你一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?请你找出所有和为 0 且不重复的三元组。注意:答案中不可以包含重复的三元组。示例 1:输入:nums = [-1,0,1,2,-1,-4]输出:[[-1,-1,2],[-1,0,1]]示例 2:输入:nums = []输出:[]n = len(nums) nums.sort() res = [] if n < 3

2021-04-07 19:37:53 84

原创 415. 字符串相加

给定两个字符串形式的非负整数 num1 和num2 ,计算它们的和。提示:num1 和num2 的长度都小于 5100num1 和num2 都只包含数字 0-9num1 和num2 都不包含任何前导零你不能使用任何內建 BigInteger 库, 也不能直接将输入的字符串转换为整数形式链接:https://leetcode-cn.com/problems/add-stringsclass Solution(object): def addStrings(self, num1, num2

2021-04-07 17:46:50 55

转载 树的前序、中序、后序遍历——容易记忆的方法

在树的深度优先遍历中(包括前序、中序、后序遍历),递归方法最为直观易懂,但考虑到效率,我们通常不推荐使用递归。栈迭代方法虽然提高了效率,但其嵌套循环却非常烧脑,不易理解,容易造成“一看就懂,一写就废”的窘况。而且对于不同的遍历顺序(前序、中序、后序),循环结构差异很大,更增加了记忆负担。因此,我在这里介绍一种“颜色标记法”(瞎起的名字……),兼具栈迭代方法的高效,又像递归方法一样简洁易懂,更重要的是,这种方法对于前序、中序、后序遍历,能够写出完全一致的代码。其核心思想如下:使用颜色标记节点的状态,新

2021-04-06 22:47:30 479

转载 集成学习task2——基本回归模型

2. 使用sklearn构建完整的机器学习项目流程一般来说,一个完整的机器学习项目分为以下步骤:明确项目任务:回归/分类收集数据集并选择合适的特征。选择度量模型性能的指标。选择具体的模型并进行训练以优化模型。评估模型的性能并调参。2.1 使用sklearn构建完整的回归项目(1) 收集数据集并选择合适的特征:在数据集上我们使用我们比较熟悉的Boston房价数据集,原因是:第一个,我们通过这些简单的数据集快速让我们上手sklearn,以及掌握sklearn的相关操作。第二个,我们用

2021-03-18 00:30:33 202

转载 集成学习(一)—— 机器学习基础

1.导论什么是机器学习?机器学习的一个重要的目标就是利用数学模型来理解数据,发现数据中的规律,用作数据的分析和预测。数据通常由一组向量组成,这组向量中的每个向量都是一个样本,我们用xix_ixi​来表示一个样本,其中i=1,2,3,...,Ni=1,2,3,...,Ni=1,2,3,...,N,共N个样本,每个样本xi=(xi1,xi2,...,xip,yi)x_i=(x_{i1},x_{i2},...,x_{ip},y_i)xi​=(xi1​,xi2​,...,xip​,yi​)共p+1个维度,前p个维

2021-03-15 22:29:45 291

转载 深度学习文本匹配

https://www.cnblogs.com/ZhangHT97/p/13391689.html

2021-01-31 10:47:54 385

原创 leetcode235. 二叉搜索树的最近公共祖先

二叉搜索树的最近公共祖先给定一个二叉搜索树, 找到该树中两个指定节点的最近公共祖先。百度百科中最近公共祖先的定义为:“对于有根树 T 的两个结点 p、q,最近公共祖先表示为一个结点 x,满足 x 是 p、q 的祖先且 x 的深度尽可能大(一个节点也可以是它自己的祖先)。”例如,给定如下二叉搜索树: root = [6,2,8,0,4,7,9,null,null,3,5]示例 1:输入: root = [6,2,8,0,4,7,9,null,null,3,5], p = 2, q = 8输.

2021-01-22 13:20:01 62

原创 leetcode104. 二叉树的最大深度

题目描述:给定一个二叉树,找出其最大深度。二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。说明: 叶子节点是指没有子节点的节点。示例:给定二叉树 [3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7返回它的最大深度 3 。解题:方法一:递归这是一道简单题,解法也比较多,递归的思路很好理解,树的深度等于左子树和右子树中深度较大的那个深度加1。# Definition for a binary tree

2021-01-22 11:30:45 84

转载 一个框架看懂优化算法之异同 SGD/AdaGrad/Adam

https://zhuanlan.zhihu.com/p/32230623

2021-01-13 23:38:05 165

原创 leetcode22. 括号生成,32. 最长有效括号(python)

括号生成数字 n 代表生成括号的对数,请你设计一个函数,用于能够生成所有可能的并且 有效的 括号组合。示例:输入:n = 3输出:[“((()))”,“(()())”,“(())()”,“()(())”,“()()()”]深度优先搜索:class Solution: def generateParenthesis(self, n: int) -> List[str]: res = [] cur_str = '' .

2020-10-13 19:54:29 110

转载 seq2seq

https://kexue.fm/archives/5861

2020-08-26 10:51:10 84

原创 8/25动态规划下

5. Leetcode72. 编辑距离给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。题目描述你可以对一个单词进行如下三种操作:插入一个字符删除一个字符替换一个字符示例 1:输入: word1 = "horse", word2 = "ros"输出: 3解释: horse -> rorse (将 'h' 替换为 'r')rorse -> rose (删除 'r')rose -> ros (删除 'e')

2020-08-25 22:03:21 116

原创 8/24 动态规划

1. 最长上升子序列题目描述给定一个无序的整数数组,找到其中最长上升子序列的长度。示例:输入: [10,9,2,5,3,7,101,18]输出: 4 解释: 最长的上升子序列是 [2,3,7,101],它的长度是 4。说明:可能会有多种最长上升子序列的组合,你只需要输出对应的长度即可。你算法的时间复杂度应该为 O(n2) 。def lengthOfLIS(self, nums: List[int]) -> int: if not nums:return 0 #

2020-08-24 20:42:07 109

原创 分类刷题2——动态规划

动态规划常常适用于有重叠子问题和最优子结构性质的问题,动态规划方法所耗时间往往远少于朴素解法。主要思想若要解一个给定问题,我们需要解其不同部分(即子问题),再根据子问题的解以得出原问题的解。动态规划往往用于优化递归问题,例如斐波那契数列,如果运用递归的方式来求解会重复计算很多相同的子问题,利用动态规划的思想可以减少计算量。动态规划法仅仅解决每个子问题一次,具有天然剪枝的功能,从而减少计算量,一旦某个给定子问题的解已经算出,则将其记忆化存储,以便下次需要同一个子问题解之时直接查表。动态规划模板步骤:

2020-08-20 18:03:52 392

原创 数组中的逆序对(python)

数组中的逆序对这个题就是在归并排序的合并的过程中,加入逆序对的统计。在看归并排序时先做一道简单题,合并两个有序数组。题目说明:给你两个有序整数数组 nums1 和 nums2,请你将 nums2 合并到 nums1 中,使 nums1 成为一个有序数组。解题思路:设置两个指针分别指向两个数组,这两个指针指向的数字谁比较小就把它移到新数组种,同时指针往前1个位置class Solution: def merge(self, nums1, nums2): # 设置两个指针分别指向两

2020-08-20 16:13:10 852

原创 bert4keras快速使用以及对抗训练

文章目录1. bert4keras快速上手2.对抗训练1. bert4keras快速上手下面是一个调用bert base模型来编码句子的简单例子:from bert4keras.models import build_transformer_modelfrom bert4keras.tokenizers import Tokenizerimport numpy as npconfig_path = '/root/kg/bert/chinese_L-12_H-768_A-12/bert_conf

2020-08-18 22:11:40 5527 4

原创 分类刷题1——分治

文章目录分治引文主要思想分治算法的步骤分治法适用的情况伪代码举个栗子算法应用[169. 多数元素](https://leetcode-cn.com/problems/majority-element/)[53. 最大子序和](https://leetcode-cn.com/problems/maximum-subarray/)[50. Pow(x, n)](https://leetcode-cn.com/problems/powx-n/)参考资料分治引文MapReduce(分治算法的应用) 是 Goo

2020-08-17 15:55:22 179

原创 常见激活函数总结

1. sigmoid公式:sigmoid(z)=11+e−z sigmoid(z) = \frac {1} {1+e^{-z }} sigmoid(z)=1+e−z1​sigmoid能够把输入映射到0和1之间,在物理上最接 近神经元,可以被表示成概率,或者用于数据的归 一化。但是它有两个严重的缺陷:其一,梯度消失——导数 f’(x)=f(x)(1-f(x)), 当x趋于无穷时,f(x)的两侧导数逐渐趋于0。在后 向传递时,sigmoid向下传递的梯度包含了一个 f’(x)因子,因此,一旦落入.

2020-08-12 16:37:05 139

转载 word2vec原理

https://www.cnblogs.com/peghoty/p/3857839.html

2020-08-06 11:39:04 104

原创 数据不均衡常用处理方法及NLP中的数据增强

所谓的不平衡指的是不同类别的样本量差异非常大,或者少数样本代 表了业务的关键数据(少量样本更重要),需要对少量样本的模式有 很好的学习。样本类别分布不平衡主要出现在分类相关的建模问题上。 样本类别分布不均衡从数据规模上可以分为大数据分布不均衡和小数 据分布不均衡两种:大数据分布不均衡——整体数据规模较大,某类别样本占比较 小。例如拥有1000万条记录的数据集中,其中占比5万条的少 数分类样本便于属于这种情况。小数据分布不均衡——整体数据规模小,则某类别样本的数量 也少,这种情况下,由于少量样本数太少,

2020-08-05 22:58:15 4708 1

原创 Task06-基于深度学习的文本分类04

基于Bert的文本分类Bert Pretrain预训练过程使用了Google基于Tensorflow发布的BERT源代码。首先从原始文本中创建训练数据,由于本次比赛的数据都是ID,这里重新建立了词表,并且建立了基于空格的分词器。class WhitespaceTokenizer(object): """WhitespaceTokenizer with vocab.""" def __init__(self, vocab_file): self.vocab = load_

2020-08-05 10:34:26 304

原创 Task5 基于深度学习的文本分类2

学习目标学习Word2Vec的使用和基础原理学习使用TextCNN、TextRNN进行文本表示学习使用HAN网络结构完成文本分类

2020-07-31 23:41:49 146 6

转载 机器阅读理解整理

机器阅读理解整理经典模型整理笔记后Bert时代机器阅读理解后续自己论文整理已经分类整大的实验室:UCL MRC_Group:AI2:微软:THU:PKU:数据集文章ROPES | Reasoning Over Paragraph Effects in SituationsarXiv: https://arxiv.org/abs/1908.05852Leadboard: https://leaderboard.allenai.org/ropesNoteLab

2020-07-30 11:45:44 4302

原创 机器阅读理解笔记(上)——机器阅读理解模型架构

4.1 总体架构一般分为编码层、交互层和输出层。机器阅读理解模型的输入为文章和问题。因此,首先要对这两部分进行数字化编码,将其变成可以被计算机处理的信息单元。在编码的过程中,模型需要保留原有语句在文章中的语义。因此,每个单词、短语和句子的编码必须建立在理解上下文的基础上。我们把模型中进行编码的模块称为编码层。接下来,由于文章和问题之间存在相关性,模型需要建立文章和问题之间的联系。例如,如果问题中出现关键词“河流”,而文章中出现关键词“长江”,虽然两个词不完全一样,但是其语义编码接近。因此,文章中“

2020-07-28 11:27:43 1825

原创 task4-fasttext文本分类

在上一章节,我们使用传统机器学习算法来解决了文本分类问题,从本章开始我们将尝试使用深度学习方法。基于深度学习的文本分类与传统机器学习不同,深度学习既提供特征提取功能,也可以完成分类的功能。从本章开始我们将学习如何使用深度学习来完成文本表示。学习目标学习FastText的使用和基础原理学会使用验证集进行调参文本表示方法 Part2现有文本表示方法的缺陷在上一章节,我们介绍几种文本表示方法:One-hotBag of WordsN-gramTF-IDF也通过sklean进行了相

2020-07-27 23:04:31 175

原创 task3-基于机器学习的文本分类

学习目标学会TF-IDF的原理和使用使用sklearn的机器学习模型完成文本分类文本表示方法 Part1One-hot这里的One-hot与数据挖掘任务中的操作是一致的,即将每一个单词使用一个离散的向量表示。具体将每个字/词编码一个索引,然后根据索引进行赋值。One-hot表示方法的例子如下:句子1:我 爱 北 京 天 安 门句子2:我 喜 欢 上 海首先对所有句子的字进行索引,即将每个字确定一个编号:{‘我’: 1, ‘爱’: 2, ‘北’: 3, ‘京’: 4, ‘

2020-07-25 15:10:06 159

原创 2.条件循环结构

条件语句1. if 语句if expression: expr_true_suiteif 语句的 expr_true_suite 代码块只有当条件表达式 expression 结果为真时才执行,否则将继续执行紧跟在该代码块后面的语句。单个 if 语句中的 expression 条件表达式可以通过布尔操作符 and,or和not 实现多重条件判断。【例子】if 2 > 1 and not 2 > 3: print('Correct Judgement!')#

2020-07-23 22:53:14 157

原创 NLP入门赛Task2-数据读取与分析

数据读取使用pandas读取数据from google.colab import drivedrive.mount('/content/drive')Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3

2020-07-22 21:55:01 134

原创 python基础task1-变量、运算符、数据类型及位运算

练习题怎样对python中的代码进行注释?python有哪些运算符,这些运算符的优先级是怎样的?python 中 is, is not 与 ==, != 的区别是什么?python 中包含哪些数据类型?这些数据类型之间如何转换?1. 怎样对python中的代码进行注释?在python中,# 表示单行注释,‘’’’’'或者""""""用于区间注释2. python有哪些运算符,这些运算符的优先级是怎样的?算术运算符、比较运算符、逻辑运算符、位运算符、三元运算符优先级:一元运算符

2020-07-22 11:23:26 101

原创 二叉树的前序遍历、中序遍历、后序遍历,python递归及非递归实现

这块一直有点迷,梳理梳理。1. 中序遍历1.1 递归实现每次递归,只需要判断节点是不是None,否则按照左中右的顺序打印出节点value值。class Solution: def inorderTraversal(self, root): if not root: return None return self.inorderTraversal(root.left) + [root.val] + self.inorderTraversa

2020-07-20 14:56:41 362

原创 NLP入门赛Task1-赛题理解

赛题名称:零基础入门NLP之新闻文本分类比赛链接:https://tianchi.aliyun.com/competition/entrance/531810/introduction赛题数据评测指标评价标准为类别f1_score的均值,选手提交结果与实际测试集的类别进行对比,结果越大越好。可以通过sklearn完成f1_score计算:from sklearn.metrics import f1_scorey_true = [0, 1, 2, 0, 1, 2]y_pred = [0,

2020-07-20 11:16:53 137

原创 动手深度学习task2——文本预处理

文本预处理读入文本import collectionsimport redef read_time_machine(): with open ('timemachine.txt', 'r') as f: lines = [re.sub('[^a-z]+', ' ',line.strip().lower()) for line in f] return li...

2020-02-14 21:51:24 126

原创 动手深度学习task1——线性回归、softmax、多层感知机

softmax与分类模型[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lXrlQNpD-1581673070121)(attachment:image.png)]torchvision包主要用来构建计算机视觉模型。1.torchvision.datasets: 一些加载数据的函数及常用的数据集接口2.torchvision.models:包含常用的模型结构(...

2020-02-14 17:38:30 185

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除