自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

嗯,就是Ta了

想学知识的笨小孩

  • 博客(5)
  • 资源 (7)
  • 收藏
  • 关注

原创 强化学习导论(Reinforcement Learning: An Introduction)读书笔记(二):多臂赌博机(Multi-arm Bandits)

研究困难的问题之前先要解决简单的问题,本章以多臂赌博机作为问题对象。多臂赌博机是一类非常简单的问题,它只包含一种情景,但可以说明强化学习中的一些基本方法。1.多臂赌博机 多臂赌博机是指一类问题,这类问题重复的从 kk 个行为(action)中选择一个,并获得一个奖励(reward),一次选择的时间周期称为一个时间步(time-step)。当选择并执行完一个行为后,得到一个奖励,我们称奖励的期望为这次

2017-01-14 22:16:07 6372 10

原创 强化学习导论(Reinforcement Learning: An Introduction)读书笔记(一):强化学习介绍

因为课题需要研究强化学习的内容,因此开始读这方面的书,Reinforcement Learning: An Introduction(Richard S. Sutton and Andrew G.Barto)第二版作为主要学习的资料,因为英语读起来不仅速度慢,而且理解的也没那么深入,因此为了记录学到的知识,并加深理解,同时也抱着分享的态度,开始写此系列的博客。首先从第一章开始,第一章主要是对强

2017-01-14 12:43:47 11792

转载 凸壳与线性可分

本篇博客是对《统计学习方法》中习题2.3的证明。

2016-08-15 14:14:22 8489 7

原创 拉格朗日对偶性

在支持向量机中,需要用拉格朗日对偶性将原始问题转换成对偶问题,解得对偶问题的解从而得到原始问题的解。在此简单介绍拉格朗日对偶性的基本原理和方法。原始问题假设f(x)f(x),ci(x)c_{i}(x),hj(x)h_{j}(x) 是定义在Rn\textbf{R}^n上的连续可微函数。考虑约束最优化问题 minx∈Rnf(x)s.t.ci(x)hj(x)≤0,i=1,2,⋯,k=0,j=1

2016-08-09 11:01:22 951 1

原创 向量空间 内积空间 线性空间 欧氏空间 希尔伯特空间

简单说明数学中的各种空间概念

2016-08-08 11:11:42 11289 3

pl语言扩充

包括详细的实验报告以及扩充代码,适用于科大的编译原理实验

2014-07-16

编译原理实验_扩充pl语言

编译原理的大实验,pl语言扩充,包括详细的实验报告

2014-07-16

编译原理实验_pl语言扩充

编译原理的大作业,pl语言的扩充,包括多种语句的扩充和数据类型的添加

2014-07-16

编译原理实验

这是编译原理实验的pl语言扩充部分,包括添加数据类型,识别字符串,添加注释,去除小写限制,扩充for,repeat,case语句等,内容完整,值得参考

2014-07-16

编译原理大作业

这是科大编译原理的实践作业,内容包括bison,flex,javacc的实践源代码以及编译结果,有了这份代码,你的编译原理实验就不用愁了

2014-07-16

n皇后问题c++实现

n皇后问题,基于深搜的c++描述,算法入门。。。

2013-01-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除