自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 资源 (1)
  • 收藏
  • 关注

原创 Confidence Regularized Self-Training 阅读笔记

领域自适应研究的最新进展表明,深度自训练是实现无监督领域自适应的有效手段。这些方法通常涉及到一个迭代过程,即在目标域上进行预测,然后将自信的预测作为伪标签进行再训练。然而,由于伪标签可能是嘈杂的,自我训练可能会将过度自信的标签信念放在错误的类中,从而导致带有传播错误的偏离解决方案。为了解决这个问题,我们提出了一个自信正则化自我训练(CRST)框架,它被表述为正则化自我训练。我们的方法将伪标签视为通过交替优化共同优化的连续潜在变量。我们提出了两种置信度正则化:标签正则化(LR)和模型正则化(MR)。

2023-07-10 12:32:30 398

原创 时序预测相关技术分享

时序预测是指对时间序列数据进行预测,以预测未来的趋势或行为。在实际生产和应用中,时序预测广泛应用于金融、电力、交通等领域。时序预测可以帮助人们更好地理解和掌握未来的趋势和规律,从而做出更明智的决策。

2023-04-28 11:23:07 1925 1

原创 摸鱼必备,BossSensor

bosssenosr

2022-12-12 20:26:44 413

原创 windows docker desk 踩坑记录

docker基础操作

2022-11-08 15:55:04 452

原创 记录:好文搬运

2022-09-14 22:23:48 165

原创 一些常用的sql命令记录

sql

2022-09-13 11:06:47 401

原创 力扣系列题,回溯专场

递归

2022-09-05 12:15:18 212

原创 Transformer详解

transformer详解

2022-09-04 12:09:35 3021 6

原创 招商2022FinTrch精英训练营数据赛道方案线下Rank1

招商2022FinTrch精英训练营数据赛道开源Rank37背景我个人是十分懒的,一直觉得写这些太麻烦了,而且名次也不高,不过既然进面了,咱就好好准备一下。客户流失预测,经典的二分类问题,评价指标为AUC,数据脱敏,字段只能靠猜数据只给了train单表,类别特征基本没啥用,零零总总50列。一天提交三次,不能组队,参赛队伍大概700多?听说以前是前200进面,今年实际情况是前50,有兴趣的朋友注意一下。不过没进面也没关系,招行奖金给的还是挺香的。正题这比赛本质还是考察选手对数据的敏感度和对特征

2022-05-14 12:00:28 1133 4

原创 PCA与SVD

PCA与SVD本文属于查缺补漏,因为简历内容的原因,连续两次被问到SVD细节,赶紧来复习一下先贴上本文参考链接后面公式涉及到大量矩阵打起来实在不方便,就贴图了一、起因其起因在于我们常说的维度灾难,许多学习的方法都会涉及到距离计算,而高维空间会给距离计算带来很多麻烦。数据样本稀疏、距离计算困难等问题是所有机器学习方法共同面临的严重障碍,即我们常说的维度灾难为解决该问题,主要提出了两种解决方法监督降维方法: 线性判别分析 LDA无监督降维方法: PCA对应的评估方法: 比较前后学习器性能

2022-04-28 20:14:01 1385

原创 手撕机器学习系列一---线性回归(np,torch分别实现)

手撕机器学习系列一—线性回归(np,torch分别实现)一、 前言虽然前几个系列都还没做完,但是最近面试发现很多地方都开始要求手撕xxx了,周围同学也有些笔试题开始考这东西了,因此再开一坑,之后慢慢填。二、问题背景随便给个函数 y=4.5∗x1+2∗x3+5y = 4.5*x_1 + 2*x_3 + 5y=4.5∗x1​+2∗x3​+5,给你一些列数据和label预测这里的三个系数三、np实现import numpy as npfrom sympy import true# 生成数据集n

2022-04-26 21:47:19 1708

原创 一篇文章吃透背包问题---python版

一篇文章吃透背包问题—python版原文来自一篇文章吃透背包问题因为其代码是c++写的,这里我重新整理并用python重写了一遍,供大家参考当然,想要了解更多可以看看背包九讲。背包问题背包定义给定一个背包容量target,再给定一个数组nums(物品),能否按一定方式选取nums中的元素得到target注意:1、背包容量target和物品nums的类型可能是数,也可能是字符串2、target可能题目已经给出(显式),也可能是需要我们从题目的信息中挖掘出来(非显式)(常见的非显式target

2022-04-07 16:40:40 2094 2

原创 关于笔试中的标准输入输出

关于笔试中标准输入输出习惯了力扣那种直接写算法return的模式,结果发现很多笔试里都要求自己写输入输出,太久没用一时间还有些生疏,在此整理一下方式一:input()/ print()Python3.x 中 input() 函数接受一个标准输入数据,返回为 string 类型。Python2.x 中 input() 相等于 eval(raw_input(prompt)) ,用来获取控制台的输入。raw_input() 将所有输入作为字符串看待,返回字符串类型。而 input() 在对待纯数字输入时

2022-03-27 19:45:52 826

原创 Hadoop,hive,spark分别都是什么

Hadoop,hive,spark在大数据生态圈的位置如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系?这篇文章写的通俗易懂,很适合对Hadoop形成一个初步的认识1、Hadoop缘起:谷歌的三篇论文:GFS(大数据的存储),MapReduce(数据分析),BigTable(存储非结构化数据)结构化数据:是高度组织和整齐格式化的数据。它是可以放入表格和电子表格中的数据类型,存储与关系型数据库中关系型数据库:表名,字段,比如Mysql(SQL是一种用于操

2022-02-22 16:42:04 4515

原创 Spark SQL之SQL优化

Spark SQL之SQL优化主要关注于执行性能问题1、避免使用不必要的UDF函数UDF:用户定义函数,可以直接在SQL语句中计算的函数,如:count、sum、avg、max、min等2、没有指定数据分区SQL-1: SELECT date FROM test_table WHERE date = '20170829' and value = 1;SQL-2: SELECT date FROM test_table PARTITION(p_20170829) p WHERE value = 1

2022-02-22 15:17:47 4652

原创 leetcode系列题七----快速幂

leetcode系列题七----快速幂

2022-02-11 11:50:50 6029

原创 leetcode系列题五----位运算

leetcode系列题五----堆排序数据流的中位数数组中的第K个最大元素前 K 个高频元素面试题40. 最小的k个数代码模板大根堆小根堆的问题:python自带库中的heap只是小根堆,没有直接建大根堆的模块,处理时直接将值取反用小根堆即可常见的问题是100w的数取前k,由于基数很大,其他的排序算法会很慢,但是堆排序对这类问题比较有优势.堆排序的算法时间复杂度为O(nlogn)当只找前k个数时是O(nlogk),当k很小时,时间复杂度去向于O(n)虽然python有内建库,但是面试往往

2022-02-10 15:41:03 787

原创 leetcode系列题八----二叉树的遍历

二叉树的遍历前言本来觉得对这个已经挺熟悉啦,就没有单独开一章记录,没想到几个月没刷题,连这个写的都很生疏,因此在这里整理记录一下,以便之后复习。二叉树的前中后层序遍历前中后遍历都是一个模板def dfs(root): if not root: return None #前 dfs(root.left) #中 dfs(root.right) #后 print(root.val)层序遍历层序遍历需要使用到队列,对应会有很多变化def bfs(root): if not r

2022-02-08 11:36:38 186

原创 SQL与spark.sql时间处理格式不一致的问题

起因这应该是一个非常常见的bug,事情起因如下:我们在sql中需要让某个日期往前推三天,所以在sql中我使用了如下语句select date_sub(tdbank_imp_date, 7) as tdbank_imp_datefrom table该语句在sql中运行正常,也得到了预期的结果之后我们把代码贴到saprk.sql中运行发现变为了空值原因其原是日期格式的问题,YYYYMMDD这种格式对于sql和spark.sql来说都是不规范的,但是在sql中这种不规范被漫长的版本迭代中给容错

2022-01-20 17:18:17 2790

原创 Spark dataframe 学习笔记

Spark scala dataframe 学习笔记前言在处理PB级的数据时,有时候会使用到pyspark来分析数据,首先贴上官网链接

2021-12-22 20:18:03 961

原创 SQL学习笔记

SQL学习笔记SQL基础参考教程:https://www.w3school.com.cn/sql/sql_intro.asp一、简介SQL 是一门 ANSI 的标准计算机语言,用来访问和操作数据库系统。SQL 语句用于取回和更新数据库中的数据。二、目标及规划懒得一个个命令去学,这样效率太低了,贴一段经常用到的代码,来了解一些实际过程中常用到的操作SELECT tdbank_imp_date, industry_idx, ka_id, open_id,

2021-12-22 19:34:43 1736

原创 leetcode系列题六----遍历排列组合

leetcode系列题六----遍历排列组合两种,一种是保持顺序的连续组合 【1,2,3】-》【1,2】【2,3】所有可能顺序的组合 【1,2,3】-》【1,2】【2,1】【1,3】.。。。。剑指 Offer 38. 字符串的排列(所有可能的组合)剑指 Offer II 080. 含有 k 个元素的组合(保持原数组顺序的组合)两种组合递归解法的模板保持原数组顺序的组合:res = []path = []# 从后向前寻找所有排列组合def dfs(idx): if len(path) =

2021-11-19 21:29:37 361

原创 leetcode系列题四----排序

leetcode系列题四----排序已经很少见考冒泡的了,重点关注快排和归并912.排序数组 (快排、归并)913.对链表进行插入排序 (插入排序)914.合并两个有序链表 (归并排序)148.排序链表 (归并排序)剑指 Offer 51. 数组中的逆序对 (归并排序)#快排模板def quick_sort(l,r): if l >= r: return ids = random.randrange(l,r+1) nums[l],nums[ids] = nums[ids],nu

2021-11-05 19:12:51 232

原创 leetcode系列题三----自动机

leetcode系列题一----自动机剑指 Offer 67. 把字符串转换成整数剑指 Offer 20. 表示数值的字符串图片来源https://leetcode-cn.com/leetbook/read/illustration-of-algorithm/5dkal2/思路不难,麻烦的是狗杂合法状态class Solution: def isNumber(self, s: str) -> bool: states = [ { ' ': 0

2021-11-01 15:36:19 180

原创 leetcode系列题二----查找最大最小值

leetcode系列题二----查找最大最小值这类的题一般的思路为:创建->复杂度O(1)查找最大最小值面试题30. 包含 min 函数的栈 (额外stack非严格降序方式来保存最小值,时间复杂度O(1),空间复杂度O(n))剑指 Offer 59 - I. 滑动窗口的最大值(其他刷到再补充,好像还有一道用小顶堆做的题,忘记题号了,遇到再补上)通用思路这种对查找有时间复杂度限制的情况一般是要求你在创建数据时是有序创建,否则的话无论是使用max还是其他方法复杂度都是O(n)以包含 min

2021-10-31 22:13:18 408

原创 leetcode系列题一----n数之和

n数之和leetcode 1 号算法题:两数之和 (哈希表 时间O(n),空间O(n))leetcode 167 号算法题:两数之和Ⅱ - 输入有序数组 (二分 O(nlogn),O(1) 双指针O(n), O(1))leetcode 170 号算法题:两数之和Ⅲ - 数据结构设计leetcode 653 号算法题:两数之和Ⅳ - 输入 BST (由于是BST,中序遍历+双指针或哈希)leetcode 15 号算法题:三数之和 (排序+双指针 O(n^2), O(1))剑指 O

2021-10-26 21:53:16 180

原创 推荐算法实习生面试经验

OPPO推荐算法实习生面试打比赛的菜鸡,第一次投实习面试,过了但没去=_=离学校有点远面试问题介绍一下简历中某个比赛的过程这部分有啥说啥了你对哪些模型比较熟悉?着重讲讲面试官根据你的简历内容进行提问,凡是出现的,面试管必定都会问细节,面试前简历上的东西一定要弄熟deepfm了解多少,说说看CTR中对于特征组合部分来说主要有两大类,fm系列和tree系列目的: 为了降低人工进行特征交叉的任务量,解决在数据系数的情况下,特征组合的问题,不同于LR的线性模型fm可以自动组合二阶特征。相比于LR

2021-09-10 09:47:39 347

原创 conda环境迁移

conda环境迁移最近在打比赛的时候发现环境配置着实麻烦,尤其是在使用tensorflow的时候,其cuda,cudnn,tensorflow对应的版本问题实在麻烦。这里提供一种非常省事儿的将本地环境迁移到服务器上的方法把自己的conda环境迁移到tione:conda env export > environment.yml生成yml文件,然后在服务器上运行如下命令conda env create -f environment.yml --prefix /home/tione/noteb

2021-07-13 15:32:27 338

原创 MARL学习篇----MADDPG

MARL学习篇----MADDPG前言MADDPG是DDPG在多智能体任务中的一种扩展,其基础思想为:集中式学习,分散式执行(CTDE)。简单来说,在训练的时候,引入可以观察全局的critic来指导actor训练,而测试的时候只使用有局部观测的actor采取行动。。你可以这么理解:每一个agent都有一个全知全能的老师指导,而在做决策的时候,agent只需要根据自己对环境的观察做出正确的动作。这种思想简单粗暴但方法却行之有效,可见这其中的trick应该不少。算法简介传统强化学习方法很难用在mul

2021-04-02 17:23:20 15498 3

原创 进阶篇---TD3(Twin Delayed DDPG)

进阶篇—TD3(Twin Delayed DDPG)这篇文章研究了actor-critic类算法里面消除overestimation bias的方法。同时,还研究了target network在TD update中消除累积误差的作用。1、消除overestimation bias与Double DQN类似,使用两个网络交替更新由于agent每次都会选择价值高的动作,因此高估的估计误差会累积起来,因此,我们宁可低估不可高估2、target network当policy固定不变的时候,是否使用ta

2021-03-07 19:55:18 980

转载 分支定界---branch and bound

分支定界—branch and bound定义分支定界算法始终围绕着一颗搜索树进行的,我们将原问题看作搜索树的根节点,从这里出发,分支的含义就是将大的问题分割成小的问题。大问题可以看成是搜索树的父节点,那么从大问题分割出来的小问题就是父节点的子节点了。分支的过程就是不断给树增加子节点的过程。而定界就是在分支的过程中检查子问题的上下界,如果子问题不能产生一比当前最优解还要优的解,那么砍掉这一支。直到所有子问题都不能产生一个更优的解时,算法结束。由此可见,其实分支定界有一股很大的枚举意味在里面,只不过加

2021-03-07 18:48:34 3191

原创 进阶篇---Soft Actor-Critic (SAC)

进阶篇—Soft Actor-Critic (SAC)SAC是一个off-policy + actor critic + maximum entropy的RL算法。比DDPG,SVG等方法稳定并且效果更好。代码参见我的GitHub前言1、on-policy 与 off-policy:on-policy:“边交互边学习” ,每一次参数更新时,都需要与环境交互,因而当遇到复杂任务时,需要的更新步骤更多,增大了复杂度off-policy :“重用过去的经验”,典型的就是经验池策略的方法,比如DQN,DD

2021-03-04 18:12:35 1535 9

原创 入门篇---Actor-Critic系列(pytorch)

入门篇—Actor-Critic系列(pytorch)A3C算法理论与传统的Actor-Critic算法相比,A3C算法有更好的收敛性,同时避免了经验回访相关性过强的问题,做到了异步并发的学习模型。优化部分主要有三点:异步训练框架,网络结构优化,Critic评估点的优化。其中异步训练框架是最大的优化。异步训练框架主要框架为一个公共神经网络,下面有n个子网络。他们的网络架构和初始参数都是完全一样的。区别在于,每个子网络独立的在环境中进行交互,但是每隔一段时间子网络会将自己的累计梯度更新公共部分的

2021-03-03 18:44:39 5087 5

原创 进阶篇---DQN的改良

进阶篇—DQN的改良代码参见我的GitHubDDQN也叫 Double DQN。之前我们提到的DQN方法目标Q值是通过贪婪法直接得到的,虽然使用max虽然可以快速让Q值向可能的优化目标靠拢,但是很容易过犹不及,导致过度估计。为了解决这个问题, DDQN通过解耦目标Q值动作的选择和目标Q值的计算这两步,来达到消除过度估计的问题。简单来说,就是通过多增加一个网络来降低迭代过程中Q网络的关联性,其余步骤和传统DQN方法基本没有区别。Prioritized Replay DQN之前的DQN方法中,

2021-03-01 19:50:14 2228 2

原创 进阶篇---PPO代码逐行分析

进阶篇—PPO代码逐行分析一、TRPO、PPO、DPPOPG (Policy gradient)最常用的策略梯度估计其表达形式如下TRPO(Trust Region Policy Optimization)这是一种具有单调递增性质的PG算法,构造了一个带有约束的目标函数在对目标进行线性近似并对约束进行二次近似后,可以使用共轭梯度算法有效地解决该问题。。PPO(Proximal Policy Optimization)DPPO(Distributed Proximal Policy Opt

2021-03-01 11:52:09 7658 1

原创 入门篇---DDPG代码逐行分析(pytorch)

入门篇—DDPG代码逐行分析(pytorch)在上一篇中我们简单整理了一下DQN的代码,这一篇则是解决连续状态,连续动作的问题----DDPG算法优化了代码框架,修正了一些小错误。之后打算更新一些做项目使用的DRL算法,最后会将代码上传到我的gihub中import mathimport randomimport gymimport numpy as npimport torchimport torch.nn as nnimport torch.optim as optimimport

2021-02-28 15:51:25 10342 24

原创 入门篇---DQN代码逐行分析(pytorch)

pytorch版DQN代码逐行分析前言如强化学习这个坑有一段时间了,之前一直想写一个系列的学习笔记,但是打公式什么的太麻烦了,就不了了之了。最近深感代码功底薄弱,于是重新温习了一遍几种常用的RL算法,并打算做一个代码库,以便之后使用。正文这是第一站-----DQN的代码解读源代码:https://github.com/higgsfield/RL-Adventure无奈,这个代码库里的代码实在有点古老-_-!!,而且存在一些小错误,加上代码结构我很不喜欢。。。于是重新整理了一下,同时添加了大量注

2021-02-26 21:44:34 4771 2

原创 WARN: A->p (column pointers) not strictly increasing, column 231 empty

在使用cvxpy时遇到警告 WARN: A->p (column pointers) not strictly increasingprob = cvx.Problem(cvx.Maximize(cvx.real(cvx.trace(R @ X))), constr) with warnings.catch_warnings(): warnings.simplefilter('ignore') prob.solve()在使用cvxpy模块求解凸优化问题时遇

2020-10-19 09:36:11 274 2

原创 服务器上Python和matlab混编时,遇到问题:‘matlab‘ is not a package的解决方法

服务器上使用import matlab.engine 命令遇到’matlab’ is not a package的解决方法前言最近在服务器上使用python和matlab混编时遇到了这个问题网上很多解决方案,一一试了过去,发现并不好用(动不动就劝人卸载重按-_-)我的matlab版本是2020a,python版本的话3.6和3.7我都试了都可以,现在也不存在一些回答中的版本支持问题(都0202年了)解决过程与大多的回答一样,以下几步是必须的:在matlab软件安装路径下,找到文件目录“./e

2020-10-06 20:56:44 2783

原创 nvidia官网下载linux版的cudnn不是.tgz文件

linux版的cudnn不是.tgz文件今天下载cudnn发现现在的文件是.solitairetheme8文件。最骚的是在Windows系统下,双击文件打开,出现的是这个:没错,你没看错,微软纸牌。。。。。。。我到现在没弄明白为什么。。。。。。。。。。。。。解决方案:mv cudnn-9.2-linux-x64-v7.5.0.56.solitairetheme8 cudnn-9.2...

2020-04-14 20:40:29 847 1

TeslaV100.pdf

白嫖百度AITeslaV100GPU 的操作方法,现在这个真的是越来越难用了,早上10点就已经抢不到了,不建议新人入坑,此处资源仅供个人不时之需,以上

2020-04-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除