PilviMannis-CSDN博客

原创【python】已知起始点经纬度坐标、偏转角、距离，求终点经纬度坐标

import mathdef get_end_lonlat(lon, lat, angle, distance): R = 6371.393 # 地球半径 AB = distance # 行进距离（单位：km） ang = math.radians(angle) # 弧度转角度 lat0 = math.radians(lat) nAB = AB / R ab = R * math.sin(nAB / 2) * 2 ac = a.

2021-09-22 19:24:12 1240 3

原创 IMPALA（Importance Weighted Actor-Learner Architectures）

IMPALA（Importance Weighted Actor-Learner Architectures）策略梯度方法已成功地应用于许多复杂的强化学习问题。然而，政策梯度法存在方差大、收敛速度慢、探索效率低等问题。在这项工作中，我们引入了一个最大熵策略优化框架，它明确地鼓励参数探索，并表明这个框架可以简化为一个贝叶斯推理问题。在此基础上，我们提出了一种新的Stein变分策略梯度方法(SVPG)，该方法结合了现有的策略梯度方法和一个排斥函数来生成一组多样化但表现良好的策略。SVPG对于初始化是健壮的，

2021-02-24 15:55:48 560 1

原创 DataParallel layers (multi-GPU, distributed) torch分布式函数

DataParallel layers (multi-GPU, distributed)DataParallelclass torch.nn.DataParallel(module, device_ids=None, output_device=None, dim=0)在模块级实现数据并行。此容器通过在批处理维度中分块(其他对象将在每个设备上复制一次)，在指定的设备上分割输入，从而并行化给定模块的应用程序。在正向传递过程中，模块被复制到每个设备上，每个副本处理输入的一部分。在向后传递过程中，每个副

2021-02-24 15:35:15 399

翻译 SEED RL：SCALABLE AND EFFICIENT DEEP-RL WITH ACCELERATED CENTRAL INFERENCE 翻译

SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference，该论文是谷歌2020年提出的IMPALA中Actor用CPU，Learner使用GPU存在的缺点：1、Actor前推在CPU，计算效率较低，当模型较大时，推理时间会延长，若是通过增加Actor的数量，则会增加成本，同时也将影响模型的收敛速度。2、资源的利用率较低，Actor需要在两个任务（环境step和网络推理）之间进行切换，而两个人物之间的计算需求是.

2021-02-24 15:22:38 606

原创 python -m spacy download en 提示服务器连接一直失败安装不上

解决方案：我在这一步的时候卡住了，运行不了转到https://github.com/explosion/spacy-models/tags，这个Git项目中包含了很多spacy的model，可自行选择一个对应的en和de，这里我选的是de_core_news_sm-2.2.5.tar.gz和en_core_web_sm-2.2.5.tar.gz，这里尽量让这两个包的版本一致，不然运行的时候对spacy的版本要求不一致会报错。/// 执行下面指令对en和de进行安装pip install de_cor

2020-12-30 18:03:06 2107

原创离散数据作为神经网络的输入，我们该如何进行处理

离散数据归一化处理离散型数据处理方式one-hot（原因总结如下）：使用one-hot编码，将离散特征的取值扩展到了欧式空间，离散特征的某个取值就对应欧式空间中的某个点；将离散的特征通过one-hot编码映射到欧式空间，是因为在回归、聚类、分类等机器学习算法中，特征之间距离的计算或者相似度的计算是非常重要的，而我们常用的距离或者相似度的计算都是在欧式空间的相似度计算，计算余弦相似性，基于的就是欧式空间。将离散型特征使用one-hot编码，确实会让特征之间的距离计算更加合理。比如，有一个离散型特征，

2020-12-21 11:06:16 4429 3

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

星际争霸pysc2API汇总

transformer解读.rar

基于tensorflow的简单GAN算法.rar

强化学习算法汇总.rar

GRPC_demo.rar

ckpt_2_pb.rar

十三种图像特征提取代码合集（吐血整理）

TRPO、PPO解读.docx

bicnet_详细代码.rar

BicNet.rar

CNN+DDPG代码，主要实现了倒立摆的控制

KNIME教程加demo

数据挖掘与分析

机器人控制系统的设计与MATLAB仿真

计算机视觉.中的数学方法,.吴福朝,.科学出版社,.2008

机器人技术基础(熊有伦)

学习OpenCV(中文书签版)

python简明教程中文

深入理解OpenCV 实用计算机视觉项目解析

机器人操作系统ROS-典型功能代码详解

梯度图生成

BP神经网络 手写体

iris数据库+自编BP+RBF

Bilateral filter(双边滤波)代码

MATLAB基于BP神经网络的手写数字识别代码

空空如也

BP神经网络手写体