hanx0204-CSDN博客

原创 IMDB python库电影信息搜索

Getting movie ID from searched movies# importing the moduleimport imdb# creating instance of IMDbia = imdb.IMDb()# namename = "Udta punjab"# searching the namesearch = ia.search_movie(name)# loop for printing the name and idfor i in range(

2021-08-12 19:17:59 533

原创 Bert 文本对齐

搜了半天的Bert文本对齐方法发现还没Huggingface的transformers里的方法好用from transformers import BertTokenizertokenizer = BertTokenizer.from_pretrained("bert-base-cased")sequence_a = "This is a short sequence."sequence_b = "This is a rather long sequence. It is at least

2021-07-18 17:07:23 511

原创 cpp vector queue stack常用操作

queue 操作queue 和 stack 有一些成员函数相似，但在一些情况下，工作方式有些不同：front()：返回 queue 中第一个元素的引用。如果 queue 是常量，就返回一个常引用；如果 queue 为空，返回值是未定义的。 back()：返回 queue 中最后一个元素的引用。如果 queue 是常量，就返回一个常引用；如果 queue 为空，返回值是未定义的。 push(const T& obj)：在 queue 的尾部添加一个元素的副本。这是通过调用底层容器的成员函数

2021-03-01 14:27:08 564

原创 Mujoco安装最简单方法

试了很多种方法, 现在总结出来一种最简单的方式申请账号什么的就不说了需求: python >= 3.71. 下载mujoco_200 放在~/.mujoco文件夹下面, 把mjkey.key放在对应位置2. pip安装mujoco-py里面的requirements.txt 和requirement.dev.txt3. 使用pip install mujoco_py==2.0.2.8安装mujoco_py, 安装gym==0.17.0, 添加环境变量vim ~/.bashrc

2021-01-31 20:28:52 3267

原创一些主题文章集合

一些论文集合Batch RLBCQ(icml’19, nipsDRLW’19), BEAR(nips’19), REM(iclr’20 rej), ABM(iclr’20), BRPO(2002.icml?), BRAC-QL (iclr’20 rej), BAIL(icml’20 under review), D4RL (2004.sergey.dataset)作者：爱笑的Groza链接：https://zhuanlan.zhihu.com/p/14329164

2021-01-31 20:28:06 484

原创 Pearl

用task encoding解决一下问题：如何从过去学习的任务中针对新的任务获取有效的信息如何对新任务的uncertainty作出更准确的判断背景：借用了POMDP的状态推理与学习分开的思想；使用了SAC框架主要工作：本文Meta-learning的流程为，通过Meta-training过程，对过去积累的tasks experience进行encoding，相当于train出一个task encoder。随后，在Meta-testing的过程中，利用encoder来encodi..

2020-10-27 15:42:16 210

转载 Distral: Robust multitask reinforcement learning.

作者：张楚珩链接：https://zhuanlan.zhihu.com/p/51091244来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。中Distral是Distill & transfer learning的缩写。原文传送门Teh, Yee, et al. "Distral: Robust multitask reinforcement learning." Advances in Neural Information Processing .

2020-10-14 21:17:13 758

原创强化学习@AAAI2019

Fully Convolutional Network with Multi-Step Reinforcement Learning for Image Processing具有多步强化学习的全卷积网络用于图像处理Ryosuke Furuta@The University of TokyoNaoto Inoue@The University of TokyoToshihiko Yamasaki@The University of Tokyo古田凉介@东京大学井上直人@东京大学山崎俊彦@东京大学AAA

2020-10-08 16:50:45 9346

原创 linux通过ftp服务器与ipad 传输文件

前提：linux机器与ipad在一个局域网内（ipad能找到linux的ip就行）linux作为ftp服务器python -m http.server查找linux使用的ip地址ifconfigipad 上打开网址 192.168.**.**:8000（默认）

2020-09-13 13:46:30 836 1

翻译 Self-Supervised Visual Planning with Temporal Skip

摘要：为了能够自主学习各种复杂技能，机器人必须能够在无需人工监督的情况下从自己的自主收集数据中学习。预测始终可用于自主收集的数据的一种学习信号。如果机器人可以学习预测未来，则可以使用此预测模型采取行动以产生期望的结果，例如将物体移动到特定位置。但是，在复杂的开放世界场景中，难以设计用于预测的表示形式。在这项工作中，我们的目标是通过直接视频预测来实现自我监督的机器人学习：我们没有尝试设计良好的表示方式，而是直接预测机器人接下来会看到什么，然后使用该模型来实现期望的目标。用于机器人操纵的视频预测中的关键挑战

2020-08-21 11:19:30 140

转载 2020-08-20 One-Shot Visual Imitation Learning via Meta-Learning 中的双头网络的理解

以下内容来自这个blog4.1Two-Head Architecture: Meta-Learning a Loss for Fast Adaptation 在标准的MAML框架中，在“前梯度更新”和“后梯度更新”中，使用的网络是相同的，都输出的是action，并且都使用标准的loss function。本文中，我们做出了这样的尝试：“前梯度更新”和“后梯度更新”依旧共用前面所有的架构，只是输出动作之前的最后一个隐藏层不再共享，而是一人一个隐藏层，称之为两个不同的“head”。【这里的prea..

2020-08-20 16:30:34 252

原创 Deepmimic安装避坑指北

系统环境： ubuntu18.04python环境：anaconda创建的虚拟环境，预装tf14和pytorch1.15第一坑：makefile设置以下仅适用于conda环境：EIGEN_DIR = /home/***your path***/eigen-eigen-323c052e1731BULLET_INC_DIR = /home/***your path***/bullet3-2.88/srcPYTHON_INC = /home/***yuor username***/...

2020-08-01 15:14:23 517 1

原创 ubuntu安装deepin-wine2.18-22环境和依赖的方法

deepin-wine不升级到2.18-19，无法安装最新版本的微信dpkg: 依赖关系问题使得 deepin.com.wechat:i386 的配置工作不能继续：deepin.com.wechat:i386 依赖于 deepin-wine (>= 2.18-19)；然而：系统中 deepin-wine 的版本为 2.18-12。#!/bin/bashmkdir /tmp/d...

2019-11-28 16:06:49 8803 4

原创实现sutton强化学习引论中的k摇臂赌博机问题

from numpy import randomimport matplotlib.pyplot as pltK = [1,2,3,4,5] # 总共的摇臂数有5个R = {1:2,2:3,3:5,4:1,5:9} # 各个摇臂对应的奖赏prob = {1:0.6,2:0.5,3:0.2,4:0.7,5:0.05} #各个摇臂对应的概率吐币的概率T = 2000count = ...

2019-09-23 16:52:36 174

原创 python调用linux命令行ping多个网站

import oslist = ["c31s1.jamjams.net", "c31s2.jamjams.net", "c31s3.jamjams.net", "c31s4.jamjams.net", "c31s5.jamjams.net"]for url in list: cmd = "ping -c 2 " + url print(cmd) result = os...

2019-09-21 09:58:16 612

原创 ROS Moveit 的抓取中的参数的含义

1 trajectory_msgs/JointTrajector pre_grasp_posture 这定义了在我们进入抓握之前末端执行器组中关节的轨迹位置。4 trajectory_msgs/JointTrajectorgrasp_posture 这定义了末端执行器组中用于抓取对象的关节的轨迹位置2 geometry_msgs/PoseStampedgrasp_pose 末端执行...

2019-08-29 16:16:22 608

翻译 ROS 环境配置 PlanningScene

设置可以使用RobotModel或URDF和SRDF轻松设置和配置PlanningScene类。但是，这不是实例化PlanningScene的推荐方法。 PlanningSceneMonitor是使用机器人关节和机器人上的传感器创建和维护当前计划场景（并在下一个教程中详细讨论）的推荐方法。在本教程中，我们将直接实例化一个PlanningScene类，但这种实例化碰撞检测自身碰撞检测...

2019-08-24 16:48:35 1042

翻译 Robot Model and Robot State

通过Cpp接口使用Moveit动力学两个核心库接近机器人动力学RobotModel类包含所有链接和关节之间的关系，包括从URDF加载的关节极限属性。RobotModel还将机器人的连杆和关节分成SRDF中定义的规划组。在这里可以找到关于URDF和SRDF的单独教程:URDF和SRDF教程URDF (Universal Robot Description Format)通用机器人说...

2019-08-22 20:22:26 617

翻译量化金融基本概念

1.统计套利随着信息技术，信息处理，自动交易等的发展，市场效率始终接近100％但从未达到100％。我们寻求从这种低效率中获利。很难预测一只股票的未来回报。但如果我们每天在很多股票上下注并且经常是正确的，那么我们可以从统计上预期随着时间的推移而获利。由于噪声数据导致的一个库存错误不会损害整个性能。根据财务数据模式投注多个股票的过程称为统计套利，这就是WebSim所做的。统计套利也...

2019-04-12 17:56:09 7655

原创无向图搜索割点

无向图搜索割点c++中科大复试1704#include <iostream>#include <fstream>using namespace std;int gra[21][21]= {0};void gprint(int k) //print graph{ for(int i=1; i<=k; i++) { ...

2019-03-11 22:12:14 198

原创用c++的string 处理时间记录 18-2

string 的切分，转字符，getline 用法按行读入未实现：转字符串文件输出？#include<fstream>#include<iostream>#include<string>#include<algorithm>/*#include<stdlib.h>#include<ctype.h> ...

2019-03-07 22:56:10 212

原创日期相隔多少天是周几的问题 2018-1

#include<stdio.h>#include<stdlib.h>#include<iostream>using namespace std;int mon[13] = { 0,31,28,31,30,31,30,31,31,30,31,30,31 };int Isyeap(int a){ if (a % 4 != 0) return 0...

2019-03-06 22:30:00 367

转载警告：Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA

问题：安装TensorFlow（CPU版本），使用pip install tensorflow安装，安装一切顺利，但是在跑一个简单的程序时，遇到如下情况：这里写图片描述大概意思是：你的CPU支持AVX扩展，但是你安装的TensorFlow版本无法编译使用。原因：除了通常的算术和逻辑，现代CPU提供了许多低级指令，称为扩展，例如， SSE2，SSE4，AVX等来自维基百科： ...

2019-01-12 22:15:07 102

转载 pycharm安装指南

点击进入原文Pycharm.jpg今天小编给大家分享如何在本机上下载和安装Pycharm，具体的教程如下：1、首先去Pycharm官网，或者直接输入网址：http://www.jetbrains.com/pycharm/download/#section=windows，下载PyCharm安装包，根据自己电脑的操作系统进行选择，对于windows系统选择下图的框框所包含的安装包。2...

2019-01-11 23:56:35 118

转载 anaconda 环境设置

点击进入原文环境相关activate // 切换到base环境activate learn // 切换到learn环境conda create -n learn python=3 // 创建一个名为learn的环境并指定python版本为3(的最新版本)conda env list // 列出conda管理的所有环境conda list // 列出当前环境的所有包con...

2019-01-11 23:42:42 108

原创二叉树实验报告

实验报告实验题目：二叉树实验目的： 1、熟悉二叉树的结点类型和二叉树的基本操作。 2、掌握二叉树的前序、中序和后序遍历的算法。 3、加深对二叉树的理解，逐步培养解决实际问题的编程能力。基本要求： 1.编写程序bitree.cpp实现ADTBiTree，要求使用二叉链表存储。实现基本操作： InitBiTree(&T); DestroyBiTree(&T); PreOrde

2017-06-10 18:43:33 28098

qq_33254440的博客