自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 问答 (1)
  • 收藏
  • 关注

原创 强化学习初学实验:TD(0)半梯度方法 CartPole(OpenAI gym)

方法介绍TD(0)的更新TD(0)是一种强化学习方法,又被称为单步时序拆分。价值函数的估计表按照以下方式更新:Qt+1(st,at)=Qt(st,at)+α(Rt+1+γQt(st+1,at+1)−Qt(st,at))Q_{t+1}(s_t,a_t) = Q_t(s_t, a_t ) + \alpha (R_{t+1} +\gamma Q_t(s_{t+1},a_{t+1}) -Q_t(s_t, a_t))Qt+1​(st​,at​)=Qt​(st​,at​)+α(Rt+1​+γQt​(st+1​,a

2020-09-16 16:01:19 1156 2

原创 【做练习】The Die Is Cast (搜索)

题目大意: 每个case给你一个h×wh \times wh×w的点阵,表示一幅包含了若干骰子的顶部图像。每个点,也就是像素,有三种可能:背景像素骰子像素(但不是骰子面上的点)骰子点像素我们认为,一个极大的互相连通非背景像素集合是同一个骰子。此处像素(p1, p2)的互相连通是指:p1和p2之间存在一条路径,p1->…->p2使得两两相邻(斜对角相邻不算),且路径上也都是非背景像素。同理,一个极大的互相连通的骰子点像素同一个骰子点。现在,你需要计算所给点阵中出现的所有骰子的各自

2020-06-27 14:03:49 284

原创 【做练习】炮兵阵地(状态压缩动态规划)

题目总时间限制: 2000ms 内存限制: 65536kB描述司令部的将军们打算在NM的网格地图上部署他们的炮兵部队。一个NM的地图由N行M列组成,地图的每一格可能是山地(用"H" 表示),也可能是平原(用"P"表示),如下图。在每一格平原地形上最多可以布置一支炮兵部队(山地上不能够部署炮兵部队);一支炮兵部队在地图上的攻击范围如图中黑色区域所示:如果在地图中的灰色所标识的平原上部署一支炮兵部队,则图中的黑色的网格表示它能够攻击到的区域:沿横向左右各两格,沿纵向上下各两格。图上其它白色网格均攻击不

2020-06-23 19:40:50 465

原创 【做练习】棋盘问题(深度优先搜索)

题目总时间限制: 1000ms 内存限制: 65536kB描述在一个给定形状的棋盘(形状可能是不规则的)上面摆放棋子,棋子没有区别。要求摆放时任意的两个棋子不能放在棋盘中的同一行或者同一列,请编程求解对于给定形状和大小的棋盘,摆放k个棋子的所有可行的摆放方案C。输入输入含有多组测试数据。每组数据的第一行是两个正整数,n k,用一个空格隔开,表示了将在一个n*n的矩阵内描述棋盘,以及摆放棋子的数目。 n <= 8 , k <= n当为-1 -1时表示输入结束。随后的n行描述了棋盘的

2020-06-23 02:07:16 420

原创 【做练习】螺旋加密(字符串)

题目总时间限制: 1000ms 内存限制: 65536kB描述Chip和Dale发明了一种文本信息加密技术。他们事先秘密约定好矩阵的行数和列数。接着,将字符按如下方式编码:所有文本只包含大写字母和空格。每个字符均赋予一个数值:空格=0,A=1,B=2,……,Y=25,Z=26。按照下图所示的方式,将每个字符对应数值的5位二进制数依次填入矩阵。最后用0将矩阵补充完整。例如,对于信息“ACM”,行列数均为4时,矩阵将被填充为:将矩阵中的数字按行连起来形成数字串,完成加密。例子中的信息最终会被加

2020-06-22 02:34:12 333

原创 【做练习】ACM Computer Factory(网络流 Dinic算法)

题目描述As you know, all the computers used for ACM contests must be identical, so the participants compete on equal terms. That is why all these computers are historically produced at the same factory.Every ACM computer consists of P parts. When all these

2020-06-19 17:53:29 287

原创 【做练习】Currency Exchange(Bellman-Ford算法判定负环)

题目总时间限制: 1000ms 内存限制: 65536kB描述Several currency exchange points are working in our city. Let us suppose that each point specializes in two particular currencies and performs exchange operations only with these currencies. There can be several points spe

2020-06-18 10:51:13 347

原创 【做练习】SPF(图论求割点,Tarjan割点算法)

题目总时间限制: 1000ms 内存限制: 65536kB描述Consider the two networks shown below. Assuming that data moves around these networks only between directly connected nodes on a peer-to-peer basis, a failure of a single node, 3, in the network on the left would prevent s

2020-06-16 12:36:35 494

原创 【做练习】单词序列(搜索)

题目总时间限制: 1000ms 内存限制: 1024kB描述给出两个单词(开始单词和结束单词)以及一个词典。找出从开始单词转换到结束单词,所需要的最短转换序列。转换的规则如下:1、每次只能改变一个字母2、转换过程中出现的单词(除开始单词和结束单词)必须存在于词典中例如:开始单词为:hit结束单词为:cog词典为:[hot,dot,dog,lot,log,mot]那么一种可能的最短变换是: hit -> hot -> dot -> dog -> cog,所以返回的

2020-06-15 23:12:51 265

原创 【做练习】Trie图(AC自动机)模板

实现了一个Trie图(AC自动机)的模板。Trie图用于多模式串匹配。当模式串数量为1,它退化为KMP自动机。以下类Trie即为AC自动机模板类。Trie<int numChar>(char** strs, int nstr, int (*ch2idx)(char))构造一个AC自动机。numChar为AC自动机中所用的字符集合的字符个数。strs为若干个模式串nstr为模式串的数量ch2idx为转换方法,可将一个字符变为它在字符集合里的索引序号。使用Match(char*

2020-06-15 04:57:14 129

原创 【做练习】Sequence(二叉树,堆)堆的原理和实现

1. 题目总时间限制: 3000ms 内存限制: 65536kB描述给定m个数字序列,每个序列包含n个非负整数。我们从每一个序列中选取一个数字组成一个新的序列,显然一共可以构造出nm个新序列。接下来我们对每一个新的序列中的数字进行求和,一共会得到nm个和,请找出最小的n个和输入输入的第一行是一个整数T,表示测试用例的数量,接下来是T个测试用例的输入每个测试用例输入的第一行是两个正整数m(0 < m <= 100)和n(0 < n <= 2000),然后有m行,每行有n个数

2020-06-14 02:24:53 488

原创 【做练习】K-th Number(线段树)线段树的原理

1. 题目描述You are working for Macrohard company in data structures department. After failing your previous task about key insertion you were asked to write a new data structure that would be able to return quickly k-th order statistics in the array segment.

2020-06-13 15:05:33 365

原创 【做练习】最大上升子序列(树状数组) 树状数组的原理及应用详解

1. 题目总时间限制: 1000ms 内存限制: 65536kB描述一个数的序列bi,当b1 < b2 < … < bS的时候,我们称这个序列是上升的。对于给定的一个序列(a1, a2, …, aN),我们可以得到一些上升的子序列(ai1, ai2, …, aiK),这里1 <= i1 < i2 < … < iK <= N。比如,对于序列(1, 7, 3, 5, 9, 4, 8),有它的一些上升子序列,如(1, 7), (3, 4, 8)等等。这些子序列

2020-06-11 11:43:07 614 1

原创 【做练习】宗教信仰(并查集)

题目描述世界上有许多宗教,你感兴趣的是你学校里的同学信仰多少种宗教。你的学校有n名学生(0 < n <= 50000),你不太可能询问每个人的宗教信仰,因为他们不太愿意透露。但是当你同时找到2名学生,他们却愿意告诉你他们是否信仰同一宗教,你可以通过很多这样的询问估算学校里的宗教数目的上限。你可以认为每名学生只会信仰最多一种宗教。输入输入包括多组数据。每组数据的第一行包括n和m,0 <= m <= n(n-1)/2,其后m行每行包括两个数字i和j,表示学生i和学生j信仰同一

2020-06-10 16:41:08 496

原创 【做练习】附近编号最大的城市(有源最短路Dijkstra算法)

这是在openjudge百练上看到的一道练习题,我看到通过率有点儿低,以为会有点儿难度。实际上是个送分题。题目描述有N(不大于10)座城市,编号为1至N,已知任意两个城市间直接距离(不超过1000的非负整数)。求距离(直接或间接)城市1不超过K(K为小于100的正整数)的所有城市中编号最大的是哪座。输入第一行输入一个整数n第二行输入一个整数K之后n行,每行n个整数,描述了城市间距离的...

2020-03-16 11:46:25 401

原创 【做练习】最佳加法表达式 (动态规划、长整数加法)

一点题外话这是我首个blog。大三下学期了要推免,需要上机做题。虽然听学长说上机的题目傻子都能过,但还是要刷刷才安心。所以定期上 openjudge 白练做一两个题(搞了一两年机器学习结果这些大一学的算法都快搞忘了)等半年后保完研了,我可能会写一些和DL、CV相关的博客。题目这次的题目是百练上的4152题,链接 http://bailian.openjudge.cn/practice/41...

2020-03-15 13:47:39 345

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除