自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

风雨潇潇一书生

因为害怕自己并非明珠而不敢刻苦琢磨,又因为有几分相信自己是明珠,而不能与瓦砾碌碌为伍,遂逐渐远离世间,疏避人群,结果在内心不断地用愤懑和羞怒饲育着自己懦弱的自尊心。世上每个人都是驯兽师,而那匹猛兽,就是每人各自的性情。

  • 博客(59)
  • 资源 (5)
  • 收藏
  • 关注

原创 智能机动决策——专栏

开启新的专栏,该专栏主要梳理利用强化学习完成对抗博弈过程中机动决策问题,仿真框架由简单到复杂,算法随着问题进一步深化,希望该专栏能够一直更新下去,有同方向或是感兴趣的朋友一起学习实践。。。...

2021-02-01 16:29:45 848 1

原创 (一)Eclipse学习总结

一、Eclipse版本问题1、Eclipse IDE for Java EE Developers该版本集成了Java ee开发常用插件,方便动态web网站开发。适合Java web开发者使用。集成了XML编辑器、数据库查看工具,提供jsp可视化编辑器。2、Eclipse IDE for Java Developers该版本适合Java开发者,集成CVS、Git、XML编辑器、Mylyn、Maven integration和WindowBuilder等插件3、Eclipse-JD...

2022-04-30 16:17:03 1659

原创 【知识小记】Word转化为高清PDF

知识小记,Word、PDF技巧

2022-03-30 16:05:32 1857

原创 【论文阅读】Hierarchical Reinforcement Learning for Air-to-Air Combat 基于分层强化学习的空战决策

Title:Hierarchical Reinforcement Learning for Air-to-Air Combat来源:https://www.researchgate.net/publication/351298817作者:Adrian P. Pope∗, Jaime S. Ide 等AbstractArtificial Intelligence (AI) is becoming a critical component in the defense ind...

2022-03-03 19:54:44 3416 4

原创 分层强化学习资料学习汇总

分层强化学习资料汇总

2022-02-23 23:19:35 591

原创 【小技巧】如何将PPT的图保持高分辨率导入到Word中

将PPT的图保持高分辨率导入到Word中

2021-12-31 09:40:56 16039 6

原创 【论文笔记】遗传模糊树及其在无人机对抗中的运用

论文:Genetic Fuzzy Trees and their Application Towards Autonomous Training andControl of a Squadron of Unmanned Combat Aerial Vehicles时间:2015.05地址:https://www.researchgate.net/publication/277020517主题:遗传模糊树、协同控制、自主、智能系统、UCAVoperations...

2021-10-14 09:17:45 1320

原创 博弈决策---蒙特卡洛搜索过程(三):推广与思考

。。。

2021-09-13 20:28:52 196

原创 博弈决策---蒙特卡洛搜索过程(二):代码

。。。

2021-09-13 20:28:18 183

原创 博弈决策---蒙特卡洛搜索过程(一):原理

MCTS 本身是结合随机采样的最佳优先搜索,能够求解状态空间较大的问题。同时,其在推理过程中考虑了敌我双方的可能行动,在此基础上形成对不同方案的评估,这种方式非常适合分析类似作战这种存在动态对抗的环境。...

2021-09-13 20:27:31 2113

原创 博弈决策---蒙特卡洛搜索过程(二):代码

主要关注代码如何实现

2021-09-13 20:24:26 141

原创 博弈决策---围棋AlphaGo原理:从论文到代码(二)

记录代码的理解

2021-09-13 20:22:34 189

原创 博弈决策---围棋AlphaGo原理:从论文到代码(一)

记录对Alpha的研究过程,从原始的论文资料开始

2021-09-13 20:21:31 255

原创 【阅读笔记】Implementation of tactical maneuvers with maneuver libraries

Title:Implementation of tactical maneuvers with maneuver libraries 利用机动库实现战术机动来源:航空学报英文版CSAA 2019出版作者:School of Aerospace Information Engineering, Konkuk University摘要1、Introduction[机动自动化的意义:]The required maneuvers for an entire ...

2021-05-25 23:14:53 300

原创 【兰德公司科技报告--AI可行性分析】Air Dominance Through Machine Learning

原文全称:Air Dominance Through Machine Learning:A Preliminary Exploration of Artificial Intelligence–Assisted Mission Planning网络解读:1、国防科技要闻 2、搜狐新闻3、桌面战争4、英文版原文,可以网路下载:researchgate、CSDN下载解读后续更新。。。...

2021-03-24 17:56:30 444

原创 【论文笔记】Air Combat Strategy using Approximate Dynamic Programming 基于近似动态规划的空战策略

论文:Air Combat Strategy using Approximate Dynamic Programming (2010年)下载链接目录论文阅读总结论文阅读分析I. IntroductionI.A. Approach Summary 论文方法总结I.B. Literature Review 文献回顾II. Approximate Dynamic Programming Method 近似动态规划方法II.A. Dynamic Programming ...

2021-03-02 18:43:18 1450 10

原创 csv数据的保存和导入

问题描述:在网络训练过程中或是记录强化学习的回报函数,可以使用csv格式,可读性比TXT强,并且可以在编辑器中直接查看。需要的第三方库:pandas、csv一,使用pandas1、保存数据import pandas as pdimport random# generate datatest_save_data =[]for episode in range(10): for step in range(20): loss = random.random()

2021-02-06 18:15:37 1392

原创 解决搜狗截图屏幕放大问题

问题描述:在使用搜狗输入法自带工具箱中的搜狗截图工具时,电脑屏幕会自动放大,如何保持不变进行截图。主要原因在于设置了电脑的缩放不是100%,因此在截图时,该工具会在原来的屏幕基础上再次进行缩放。解决方法:找到截图的可执行程序,在该路径下:C:\Program Files (x86)\SogouInput\Components\ScreenCapture\1.0.0.196版本不同路径会有所变化,最只要是找到screencapture.exe,点击右键属性--->兼容性——.

2020-12-16 11:17:27 1934 1

原创 04强化学习——Actor-Critic(AC)进阶篇(minibatch-MC-AC)

AC

2020-12-09 09:06:13 1021

原创 05 强化学习——Trust Region Policy Optimization(TRPO)论文解读

论文地址:http://proceedings.mlr.press/v37/schulman15.pdf推荐几篇关于论文解读博客:英文:https://blog.csdn.net/xyp99/article/details/109378848https://spinningup.openai.com/en/latest/algorithms/trpo.html中文:https://blog.csdn.net/qq_28385535/article/details/104892071

2020-12-06 16:12:26 551

原创 03 强化学习——Actor-Critic(AC)基础篇(TD-AC)

一、算法描述根据上一章PG算法可以得知对于策略梯度下降的方法我们关注的是:因此从广义的策略理论上,策略梯度可以写成:可以表示为一下几种1、,轨迹的总回报。2、,动作后的总汇报(从该动作往后算,可以看成前期的对后面没有影响)3、,加入基线的累计回报4、,状态-值函数5、,优势函数6、,TD误差将广义的策略梯度分开来看,是一个评价器(critic),评估策略的好坏(策略为actor),在PG中使用的是一条轨迹的累计回报来评价策略的好坏,但这种评价比较粗糙,不够精确

2020-12-04 23:32:46 3825

原创 02 强化学习——策略梯度法(PG)(连续动作)

一、PG回顾1、对于离散动作,策略搜索使用神经网络来参数化随机策略中的动作概率,网络的输入是智能体的当前状态,网络输出为当前所有动作的概率,该网络是一种分类网络。网络训练使用数据为一个episode数据(s,a,r). 参考https://blog.csdn.net/weixin_40493501/article/details/1103848942、对于连续性动作来说,一般使用随机高斯策略,网络的输入是智能体当前状态,网络的输出的高斯策略的均值和标准差,网络是一个拟合网络。无论是连续动作还是离

2020-12-04 19:34:31 5261 9

原创 01 强化学习——策略梯度法(Policy Gradient PG)(离散动作)

一、来源和定位1.1 PG算法在强化学习方法中的定位策略梯度是基于策略搜索方法中最基础的方法,要理解AC,DDPG需要先学习策略梯度。1.2 策略梯度直观理解策略梯度是将智能体的策略转换成参数的非线性函数,通过寻优参数找到函数的最值,从而使回报值最大。如下图所示,假设有三条路径(每一条路径理解为一个策略)回报分别为1,3,-1.最直观的做法是尽量选择第二条路径,即增加该策略的概率,使最终的回报最大。二、问题数学表示主要思想是使最终的回报最大,即一个完成的交互episode(从

2020-11-30 19:57:27 3678 7

原创 noteexpress文献导入到endnotes中

问题:将noteexpress所有文献导入到endnote中一、从noteexpress中导出为TXT文本,选择如下:二、从endnote中导入TXT文本,选择如下:

2020-11-17 15:37:36 6997

原创 计算两个向量的夹角(分逆时针与顺时针)

问题:两个向量,求解一个向量旋转到另一个向量的角度,逆时针为正,顺时针为负。【两向量的夹角,角度带正负号】def CalAngle(v1, v2): # v1旋转到v2,逆时针为正,顺时针为负 # 2个向量模的乘积 TheNorm = np.linalg.norm(v1) * np.linalg.norm(v2) # 叉乘 rho = np.rad2deg(np.arcsin(np.cross(v1, v2) / TheNorm)) # 点乘

2020-10-03 23:31:40 7572

原创 pytorch基本操作与基本流程

1、网络构建2、网络训练3、网络结构和参数的保存4.保存文件的重新导入import torchimport matplotlib.pyplot as pltimport numpy as npx = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1) # x data (tensor), shape=(100, 1)y = x.pow(2) + x.pow(5) + 0.2*torch.rand(x.size()) # noi

2020-08-29 11:43:15 628

原创 PyTorch项目代码与资源列表

PyTorch即 Torch 的 Python 版本。Torch 是由 Facebook 发布的深度学习框架,因支持动态定义计算图,相比于 Tensorflow 使用起来更为灵活方便,特别适合中小型机器学习项目和深度学习初学者。但因为 Torch 的开发语言是Lua,导致它在国内一直很小众。一、入门系列教程1.PyTorch Tutorialshttps://github.com/MorvanZhou/PyTorch-Tutorial.git著名的“莫烦”PyTorch系列教程的源码。2

2020-08-28 10:49:04 689

原创 【编程问题】TensorFlow导入出错

在python3.6中使用的TensorFlow是1.13.1,当导入TensorFlow时出现以下问题:import tensorflow as tfC:\Users\DELL\AppData\Local\Programs\Python\Python36\lib\site-packages\tensorflow\python\framework\dtypes.py:526: Future...

2020-08-27 10:40:45 608

原创 python实现飞行控制仿真(二)——三自由度仿真

一、问题:利用python实现三自由度【总结不对的地方请评论或私信我,谢谢!】三自由度中简化的几个问题1、3个控制量,(相比较6自由度中会使用4个控制量),三自由度中一般使用推力、升力和滚转角来控制,或使用其变形模式2、三自由度中不考虑攻角和侧滑角,假设其为0,3、速度方向和机体方向近似重合二、求解过程三自由度模型中主要包含速度、角度及其变化的模型,不包含力学和力矩关系方程。上图方程中的x,y,z为惯性坐标系下的位置坐标,v为飞行器的速度,为飞行器轨迹的航迹角,.

2020-08-04 00:42:03 9891 11

原创 python实现飞行控制仿真(一)——PyFME(Python Flight Mechanics Engine)

一、PyFME安装【目前关于PyFME的介绍比较少,利用很长时间才摸索整理出来,如需转载请标注来源】因为PyFME不是标准的第三方库,无法使用pip直接安装(目前pip直接安装的是0.1版本的),可以直接去GitHub网站下载源代码进行安装和使用,源码网址:​​​​​​​https://github.com/AeroPython/PyFME1、首先在pycharm中创建虚拟环境,创建过程参考https://blog.csdn.net/weixin_40493501/article/details

2020-07-28 19:54:55 4454 2

原创 pycharm中虚拟器的构建与第三方库的安装

一、问题1、在pycharm中如何构建虚拟环境(虚拟的python解释器),及其参数设置、影响、含义2、如何在本机的解释器和虚拟解释器进行切换,以及第三方库安装在哪个解释器下面,哪个文件夹下面3、梳理出安装第三方库的方法(在线安装,离线安装,以及如何利用GitHub中的源代码进行安装和使用)二、虚拟解释器构建1、Virtualenv Environment2、Coda Environment3、System Interpreter4、Pipenv Environmen..

2020-07-28 16:40:30 884

原创 【知识小记】Word中英文字母无法转换成time new Roman问题

问题描述:使用Word时有时会产生上面的问题,第一行英文或数字字体是time new Roman格式,第二行是宋体格式,但第二行如何都不能转换成time new Roman,即使选中换成time后依旧显示为宋体,主要原因不在于字体格式,在于全角和半角的,第一行使用的是半角,第二行使用的是全角,可以用“shift+空格”的方式来切换。全角:输入一个字符占用两个字符半角:输入一个字符占用1个字符无论哪种模式,汉字占两个字符。...

2020-07-04 16:46:44 13622 4

原创 TensorFlow基本问题

1、会话tf.InteractiveSession():它能让你在运行图的时候,插入一些计算图,这些计算图是由某些操作(operations)构成的。这对于工作在交互式环境中的人们来说非常便利,比如使用IPython。可以先构建一个session然后再定义操作(operation)tf.Session():需要在启动session之前构建整个计算图,然后启动该计算图。在会话构建之前定义好全部的操作,会话后的操作无效...

2020-06-08 22:45:17 104

原创 Github下载系列问题

1、只下载个别文件有时候不需要全部项目下载,只需下载其中的某一个文件方法一(有时候有效有时候无效)https://www.itsvse.com/downgit/#/home方法二需要下载安装SVNhttps://tortoisesvn.net/downloads.html安装完成后在一个文件夹中启动window shellpower(如果没有选定文件夹会保存在C盘中,使用shift+右键启动)找到需要下载的网址,将“tree/master”改成“trunk”使用命令:

2020-06-06 16:33:43 155

原创 Python字典保存(方便读取)

使用环境:Python3问题:字典保存到文件中1、使用numpy,保存为.npy文件import numpy as np # Savedict = {'a':1,'b':2,'c':3}np.save('my_file.npy', dict) # 注意带上后缀名 # Loadload_dict = np.load('my_file.npy').item()print(load_dict['a']) 2.使用pickle,保存为.pkl文件# 字典保存dict = {

2020-05-28 15:52:37 52258 6

原创 【读书】少有人走的路---自律(斯科特 派克)

少有人走的路---自律 第一次以文字形式写下书评并公开分享,落笔之时,想起了课堂上一位教授说的话,她提倡我们读书时应采取与作者对话的形式,与作者的思想互动,而不是对作者的观点、结论加以夸耀和迎合。上她的课时不长,但这种要求和建议让我铭记,这也是在提醒我们读书不仅要梳理清作者的行文逻辑和思路,更要对文字背后蕴含的思想加以思考和互动。“学而不思则罔”,学而不思,主动地学就变成了无意识的...

2020-04-28 22:48:38 470

原创 【日常感悟】For Myself

写给自己第一次在CSDN上写一些非专业技术知识的东西,用来记录一些生活学习感悟,点滴之间汇成自己的一个轨迹。本想开通自己的一个网页博客,但鉴于操作有点麻烦,本人又比较懒,也不知道这种记录方式会持续多久。多少年后的自己又会在哪里,是否还会在这条科研之路上还未可知,权当做一时兴起,或是一种自我鞭策,聊做记载。今天刚好是世界读书日,就从读书开始说吧。读书主要是从研究生阶段开始,本科期间读书并不多。要...

2020-04-23 17:33:25 315 2

原创 【时序分割】【未完成】Greedy Gaussian Segmentation of Multivariate Time Series(贪心高斯时序分割---GGS)

文章题目:Greedy Gaussian Segmentation of Multivariate Time Series(2018年4月)作者:David Hallac; Peter Nystrup; Stephen Boyd期刊:Advances in Data Analysis and Classification(2区)文章代码:https://github.com/cvxgrp/G...

2020-04-21 11:54:18 1174 7

原创 【时序分割】2017KDD时序分割聚类TICC代码分析

TICC算法的代码有网络公开版本,下载地址https://github.com/davidhallac/TICCTICC-master文件夹下面有这几个部分:output_folder、paper code、src、UnitTest_Data、example.py、example_data.txt、README.md、TICC_solver.py、UnitTest.py一、所需环境64...

2020-03-24 12:25:47 3635 9

原创 【时序聚类】论文解读k-Shape: Efficient and Accurate Clustering of Time Series

k-Shape: Efficient and Accurate Clustering of Time Series【论文解读有不正确之处欢迎指正】论文来源:https://dl.acm.org/doi/10.1145/2949741.2949758论文来自于2016年ACM SIGMOD(有说是2015年,没具体去查),论文下载:http://www.cs.columbia.edu...

2020-03-04 18:58:02 6683 6

反演法提取超材料结构的等效参数.m

轨道角动量仿真源程序及S参数反演算法程序

2021-12-03

Air Dominance Through Machine Learning.pdf

【兰德公司报告】通过机器学习获得空中优势—人工智能辅助任务规划的初步探索 Air Dominance Through Machine Learning:A Preliminary Exploration of Artificial Intelligence–Assisted Mission Planning

2021-03-24

fly_contral_pyfme.rar

目前关于PyFME的介绍比较少,利用很长时间才摸索整理出来,包含全部的虚拟环境和测试代码,运行环境为python3.6,pycharm,文件中包含虚拟环境中的所有第三方库,使用可以参考https://blog.csdn.net/weixin_40493501/article/details/107632104

2020-07-28

missile六自由度三维轨迹实验仿真程序与报告-MATLAB.mdl

missile六自由度三维轨迹实验仿真程序与报告-MATLAB 目标在惯性坐标系下的匀速或变速机动,导弹以比例导引法接近目标,根据运动学和动力学规律,建立相应的模型,运用MATLAB中simulink进行仿真,得出导弹运动轨迹和目标距离

2019-08-28

人工神经网络求解TSP问题的改进算法研究

在算 法 优化 问 题 的 研 究 中 , 旅 行 商 问题 是 组合优化领域里 的 一 种 描 述 简 单而 难 以 处 理 的 完 全难 题 , 为 解决神 经 网络 求解 问 题 时 易 出 现无效解 和 收敛性 能差 的 问 题 , 提 出 一 种 对 能 量 函 数 “ 行 ” 、 “ 列 ” 项 进 行 严 格 约 束并在神 经元动 态 方程 中 使 用 软 限幅 函 数 的 改 进算 法 。 在 参数优化方 面进行 了 分析并选 取 了 最 优参数值 , 与 经 典 神 经网络 求解 方 法进行 比较 。 对 】 个城 市仿真研究 , 实验结果表 明 : 改 进算 法 能 使 网 络 函 数 迖 到 全 局 搜 索从 而 避免 无 效解 的 产 生 , 求 得 的最优解个 数 多 于 原 始算 法 , 迭 代 次 数 少且 易 达 到 有效 解

2018-04-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除