自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 docker操作

docker一些常用的命令kube集群登陆认证安装方式(在自己的本地机器上安装)登录验证查看 log查看IP查看 bedin 环境的 log查看 maxwell 环境的 log查看端口查看要运行镜像登录测试环境docker相当于windows下的一个虚拟机器,一个完整的环境,我们把自己项目所需要的环境全部打包进去,这个docker放在任意机器上直接就可以运行起来。目前这个东西直接放在k8s上,好处是在其上的虚拟机器,死了就自己起来了,自动的扩容和收缩。代码部署也是放在git上,从git上拉下来直接用。一

2021-08-02 15:17:29 189

原创 leetcode 位运算

位运算lc 461. 汉明距离lc 338. 比特位计数lc 461. 汉明距离class Solution: def hammingDistance(self, x: int, y: int) -> int: z = x^y cnt = 0 while z!=0: if z&1==1: cnt+=1 z=z>>1 retur

2021-07-18 18:33:05 185

原创 leetcode 面试遇到

数学lc 238. 除自身以外数组的乘积lc 238. 除自身以外数组的乘积class Solution: def productExceptSelf(self, nums: List[int]) -> List[int]: lr = [1] length = len(nums) rl = [1]*length answer = [] for i in range(length):

2021-07-12 23:36:30 114 1

原创 leetcode 数组与矩阵

哈希表lc 283. 移动零lc 283. 移动零class Solution: def moveZeroes(self, nums: List[int]) -> None: """ Do not return anything, modify nums in-place instead. """ cnt = 0 i = 0 while i!=len(nums): if

2021-07-04 20:34:03 136

原创 rasa 2

1.init rasa2.rasa train nlu3.rasa shell 对话4.rasa run actions 让端口运行rule和story内容不要冲突,可以重复如何写一个故事https://rasa.com/docs/rasa/writing-storiesrasa -x 安装pip3 install -i https://pypi.rasa.com/simple rasa-x==0.37.0 --extra-index-url https://pypi.tuna.tsing

2021-06-22 23:25:03 455

原创 leetcode 哈希表

哈希表一级目录二级目录三级目录一级目录二级目录三级目录

2021-06-01 23:06:14 97

原创 leetcode 数学

leetcode 数学与其他 问题最大交换 lc 670最大交换 lc 670给定一个非负整数,你至多可以交换一次数字中的任意两位。返回你能得到的最大值。class Solution: def maximumSwap(self, num: int) -> int: if num < 10: return num nList = [int(i) for i in str(num)] n = len(nList)

2021-02-28 15:38:16 301

原创 leetcode 贪心

贪心问题分发饼干 lc 455分发饼干 lc 455对每个孩子 i,都有一个胃口值 g[i],这是能让孩子们满足胃口的饼干的最小尺寸;并且每块饼干 j,都有一个尺寸 s[j] 。如果 s[j] >= g[i],我们可以将这个饼干 j 分配给孩子 i ,这个孩子会得到满足。你的目标是尽可能满足越多数量的孩子,并输出这个最大数值。输入: g = [1,2,3], s = [1,1]输出: 1解释:你有三个孩子和两块小饼干,3个孩子的胃口值分别是:1,2,3。虽然你有两块小饼干,由于他们的尺寸

2021-02-22 22:43:37 248 1

原创 leetcode 图

图问题判断二分图 lc 785判断二分图 lc 785给定一个无向图graph,当这个图为二分图时返回true。如果我们能将一个图的节点集合分割成两个独立的子集A和B,并使图中的每一条边的两个节点一个来自A集合,一个来自B集合,我们就将这个图称为二分图。graph将会以邻接表方式给出,graph[i]表示图中与节点i相连的所有节点。每个节点都是一个在0到graph.length-1之间的整数。这图中没有自环和平行边: graph[i] 中不存在i,并且graph[i]中没有重复的值。class

2021-02-22 20:38:34 112

原创 leetcode 归并

为运算表达式设计优先级 lc 241给定一个含有数字和运算符的字符串,为表达式添加括号,改变其运算优先级以求出不同的结果。你需要给出所有可能的组合的结果。有效的运算符号包含 +, - 以及 * 。输入: “23-45”输出: [-34, -14, -10, -10, 10]解释:(2*(3-(45))) = -34((23)-(45)) = -14((2(3-4))5) = -10(2((3-4)5)) = -10(((23)-4)*5) = 10class Solution:

2021-02-22 00:05:46 134

原创 leetcode 二分

二分问题开根号 lc 69寻找比目标字母大的最小字母 lc 744有序数组查找一个数,或者转化为查找一个数都用这个方法。开根号 lc 69class Solution: def mySqrt(self, x: int) -> int: if x<=1: return x start, end = 0, x // 2 while 1: #找到了就返回,要不然一直找

2021-02-18 23:35:16 104

原创 文本增强

综述直接可用的edapip install textdafrom textda.data_expansion import * print(data_expansion('生活里的惬意,无需等到春暖花开'))

2021-02-18 20:26:39 151

原创 图谱的框架

图谱的框架伪码单轮对话机器人建设图谱单轮对话机器人建设图谱连接图数据库。把

2021-02-09 19:59:39 197 2

原创 leetcode 双指针

平方数之和 lc 633给定一个非负整数 c ,你要判断是否存在两个整数 a 和 b,使得 a2 + b2 = c 。class Solution: def judgeSquareSum(self, c: int) -> bool: for i in range(0,int(c**0.5)+1): for j in range(i,int(c**0.5)+1): if i**2+j**2==c:

2021-01-22 00:02:51 160

原创 leetcode 堆栈与队列

栈的压入与弹出序列 剑指 offer 31eg:pushed = [1,2,3,4,5],poped = [4,5,3,2,1] Truepushed = [1,2,3,4,5],poped=[4,3,5,1,2] Falseclass Soultion: #给什么条件就纯模拟该过程即可 def validateStackSequences(self,pushed,popped): stack = [] start = 0 for i i

2021-01-17 14:35:43 192

原创 剑指offer

找到重复的数字 剑指offer 3[2,3,1,0,2,5,3] 输出2或者3class Soultion: def find(self,lst): dic = dict() for i in lst: if i not in dic: dic[i] = 1 else: return i很简单,最少也要遍历一次,用hashmap。在有序矩阵中找到目标值 剑指offer 4class Soultion: def findnumin2darray(sel

2021-01-13 21:01:47 95

原创 leetcode 字符串

文本双循环最长不重复子串 leetcode 3class Solution: def lengthOfLongestSubString(self,str): start = 0 mark = set() max_length = float('-inf') for end in range(len(str)): while start<=end and str[end] in mark:

2021-01-12 10:44:50 274 2

原创 NLP项目相关的算法代码

会话形式把相同角色,相邻的话拼接在一起,形成纯对话形式。实例:[{C:xxx},{C:yyy},{S:aaa},C:QQQ,S:bbb]–>C:xxxyyy,S:aaa,C:QQQ,S:bbbfor sentence in sentences:

2021-01-11 20:50:16 297

原创 leetcode 链表相关

链表合并leetcode 21 合并2个有序链表#class ListNode:# def __init__(self,x):# self.val = x# self.next = Noneclass Solution: def mergeTwoList(self,l1,l2): ''' l1: ListNode l2: ListNode rtype: ListNode ''' curr = dummy = ListNode(0) while l1 and l

2021-01-05 21:03:37 194

原创 机器学习

GBDT1.生成多个树,每一次新树都是前面的残差,在预测时候一批数据同时要喂入n颗树,最后对应的每一条数据对根节点进行求和。样本在某棵树只在一个叶子节点有输出。2.因为是树,所以对应下来,每个节点都是n个新的特征组合。3.核心的思想是,已经训练好的树 T[1] ~ T[]t-1] 不再调整。根据目标函数最小原则,新增树 T[t],表示如下:4.模型复杂度表示为:节点个数(树深度,每个叶子结点的数据量),每个叶子结点能表示的值大小。允许让每一个树不复杂,让更多树参与进来,所以这些参数是用来学习和控制的

2020-11-23 14:36:44 126

原创 pyspark

我们去关注这个人,他的pyspark写的很好。

2020-11-20 16:58:36 82

原创 对抗学习

对抗学习主体内容参考再embending上加入一个扰动,满足扰动最大但是求解的loss还是最小。其中扰动最大在函数外部做好了,认为沿着梯度上升的方向是扰动最大方向。因为梯度下降是最好的,那上升就是破坏最严重的。先去改变了embending的值,方法是embending+梯度上升。最后更新的时候恢复embending的值data。让正常的参数的梯度加上扰动的参数梯度。等效于加入扰动。对pytorch训练模型三部必须操作理解更深刻。参考, loss.backward()仅仅是求解梯度。

2020-11-09 15:38:10 192

原创 pytorch

torch.mean()mean()函数的参数:dim=0,按列求平均值,返回的形状是(1,列数);dim=1,按行求平均值,返回的形状是(行数,1),默认不设置dim的时候,返回的是所有元素的平均值。tmp = tensor([0., 1., 2., 3., 4.])#对列做,现在就是一行。torch.mean(tmp,axis = 0)#等价于torch.mean(tmp)...

2020-11-06 10:14:20 116

原创 numpy

高维数组的矩阵操作模型要输出6个标签,相互不互斥,每个子标签又三个结果分别是0,1,2互斥。所以模型出的结果用list将6个tensor进行append。这6个tensor每一个都是一个batch(体现gpu批量加速,批量前提是是执行相同的操作),输出该标签下的结果。实例:class Model(nn.Module): def __init__(self,config): super(Model,self).__init__() self.bert = Ber

2020-11-04 18:07:57 771 1

原创 pandas

groupbygroupby之后得到的是多个dataframe相同电话id的相同标签的文本聚合。并且保留对应的标签df.groupby(['call_id',v])['sentence'].apply(lambda x:x.str.cat(sep='')).reset_index()v是各个子标签。如果文本是有顺序,如电话说话有语序需要先按照sentence的发生顺序排序,而后进行拼接。如果用代码实现的思路是:(1)遍历一遍所有的文本,建立一个符合dict的数据结构。(2)最外面的dic

2020-11-04 14:11:56 125

原创 hive

单独使用groupbyselect max(cate_id) as cate_id,count(cate_id) as numfrom hdp_mis_yxzn_defaultdb.vip_cate_title_dy2mvwhere partition_dt=‘20180817’group by cate_idorder by num descLIMIT 1000select后的内容只能是groupby的内容以及该内容的统计量。如果想要对某些字段进行联合排序,且select后面出现更多的内容

2020-11-02 15:24:33 190

原创 BFS与DFS

BFS广度优先搜索一层一层地进行遍历,每层遍历都是以上一层遍历的结果作为起点(队列实现),遍历一个距离能访问到的所有节点。需要注意的是,遍历过的节点不能再次被遍历。每一层遍历的节点都与根节点距离相同。设 di 表示第 i 个节点与根节点的距离,推导出一个结论:对于先遍历的节点 i 与后遍历的节点 j,有 di <= dj。利用这个结论,可以求解最短路径等 最优解 问题:第一次遍历到目的节点,其所经过的路径为最短路径。应该注意的是,使用 BFS 只能求解无权图的最短路径,无权图是指从一个节点到另一个

2020-10-28 20:10:44 407

原创 leetcode 搜索与回溯

DFS与BFS回溯回溯三步走:设置现场,dfs,恢复现场组合求和 lc 39given candidate set [2, 3, 6, 7] and target 7,A solution set is: [[7],[2, 2, 3]]class Solution: def combinationSum(self,candidates,target): if not candidates: return [] def dfs(

2020-10-27 09:46:27 294

原创 leetcode 排序

数组内求最佳给定一个list,和一个数字k,求这个list中两个数之和最接近k的一个数对。[1,2,7,3,10] 14 ——>(3,10)import mathdef func(nums,k): nearest = float('inf') flag = 0 for i in range(len(nums)-1,0,-1): for j in range(i-1,0,-1): if math.fabs(k-(nums[j]+

2020-10-24 14:32:35 218 1

原创 leetcode 常规dp问题通解思路

leetcode 最长递增子序列2. 一组整数对能够构成的最长链3. 最长摆动子序列二、使用步骤1.引入库2.读入数据总结# 最长递增子序列## 1. 最长递增子序列 leetcode 300class Solution: def lengthOfLIS(int[] nums): dp=[1]*len(nums) for i in range(1,len(nums)): for j in range(i): if nums[i]&gt

2020-10-15 17:28:48 2021

原创 leetcode 树相关问题

树相关问题使用递归和遍历解耦树问题创建树遍历bfs递归形式的遍历predfsindfsafterdfs使用递归和遍历解耦树问题树的创建与基本的遍历,这是后面大部分问题的基础创建树class Node: def __init__(self,val): self.val = val self.right = None self.left = None def __repr__(self): return f'val: {s

2020-10-14 13:44:34 801 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除