自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

转载 增强学习(四) ----- 蒙特卡罗方法(Monte Carlo Methods)

1. 蒙特卡罗方法的基本思想蒙特卡罗方法又叫统计模拟方法,它使用随机数(或伪随机数)来解决计算的问题,是一类重要的数值计算方法。该方法的名字来源于世界著名的赌城蒙特卡罗,而蒙特卡罗方法正是以概率为基础的方法。一个简单的例子可以解释蒙特卡罗方法,假设我们需要计算一个不规则图形的面积,那么图形的不规则程度和分析性计算(比如积分)的复杂程度是成正比的。而采用蒙特卡罗方法是怎么计算的呢?首

2017-06-20 16:57:01 495

转载 增强学习(三)----- MDP的动态规划解法

上一篇我们已经说到了,增强学习的目的就是求解马尔可夫决策过程(MDP)的最优策略,使其在任意初始状态下,都能获得最大的Vπ值。(本文不考虑非马尔可夫环境和不完全可观测马尔可夫决策过程(POMDP)中的增强学习)。那么如何求解最优策略呢?基本的解法有三种:动态规划法(dynamic programming methods)蒙特卡罗方法(Monte Carlo methods)

2017-06-20 16:54:46 516

转载 增强学习(二)----- 马尔可夫决策过程MDP

1. 马尔可夫模型的几类子模型大家应该还记得马尔科夫链(Markov Chain),了解机器学习的也都知道隐马尔可夫模型(Hidden Markov Model,HMM)。它们具有的一个共同性质就是马尔可夫性(无后效性),也就是指系统的下个状态只与当前状态信息有关,而与更早之前的状态无关。马尔可夫决策过程(Markov Decision Process, MDP)也具有马尔可夫

2017-06-20 16:47:28 329

转载 增强学习(Reinforcement Learning)

机器学习算法大致可以分为三种:    1. 监督学习(如回归,分类)    2. 非监督学习(如聚类,降维)    3. 增强学习什么是增强学习呢?增强学习(reinforcementlearning, RL)又叫做强化学习,是近年来机器学习和智能控制领域的主要方法之一。定义: Reinforcement learning is learning w

2017-06-20 16:43:29 253

转载 NS-2.35添加MFlood协议

学习NS2有两个多月了,因为是Linux和NS的新手,在很多很简单的问题上纠结了过多的时间。这让我想把自己学习的过程记录下来,供没有基础仍学习NS2的人做个参考。  系统:Ubuntu 12.04.2 LTS,NS-2.35       我是参照黄化吉、冯穗力、秦丽娇、陆宏治编著的《NS网络模拟和协议仿真》第11章洪泛路由协议的移植来做的,MFlood协议也是该书上的版本。同时参考了以下网

2016-01-27 10:53:56 2339

转载 博导给各位博士和准博士一点建议

本文转自上海交大饮水思源BBS,作者:thylacine(纳米热学?)。看了后觉得说得很中肯,所以,就转过来了。            1. 读博最重要的一件事情是选一个好导师。这个无比重要的事情,可能被很多同学忽略了,即使在交大的光环和荣耀之下,也千万记住这是影响你今后五年甚至后半辈子的大事。找老师人品和学术能力是最重要的。至于研究方向职称名誉等等,不要看得太重。另外,轻松的课题组未必是

2016-01-23 21:09:09 1264

转载 NS-2.35中添加gpsr

http://blog.sina.com.cn/s/blog_6735526a0101fkha.html     1、在$HOME/ns-allinone-2.35/ns-2.35下新建gpsr文件夹,然后将修改后的协议中的文件:gpsr.cc,gpsr.h, gpsr.tcl, gpsr_neighbor.cc, gpsr_neighbor.h, gpsr_packet.h,gpsr_s

2016-01-21 16:40:37 934

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除