自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (1)
  • 收藏
  • 关注

原创 傻瓜式提取网页数据的油猴脚本(JavaScript 代码)

一次性提取任意网站的布局类似的数据,例如 淘宝的商品价格、微博的热搜标题、必应搜索的图片链接。使用JavaScript实现,配置到Tampermonkey(油猴)中即可使用。

2023-11-17 17:12:34 2670

原创 Win10 设置共享文件夹

整个完整过程分为三步: 1. 允许Guest用户对本机的连接 2. 对指定的文件夹设置可共享的用户 3. 从局域网的另外一个电脑访问共享文件夹 注: 不要按照某些教程所说的创建新用户。否则强迫症每次看见一个无用的新用户会难受的。目录1. 允许Guest用户对本机的连接2.对指定的文件夹设置可共享的用户3. 从局域网的另外一个电脑访问共享文件夹1. 允许Guest用户对本机的连接(1)对桌面的“此电脑”图标:...

2021-09-28 15:52:19 925 1

原创 pytorch 中的 CrossEntropyLoss 与 NLLLoss

官网是这么介绍CrossEntropyLoss 的:This criterion combines LogSoftmax and NLLLoss in one single class.它将 LogSoftmax 与 NLLLoss 结合在单个类中.用相应的函数进行验证:import torchimport torch.nn.functional as FN = 32num_class = 1000input = torch.randn(N, num_class)targe.

2021-07-27 14:33:23 263

原创 python -m spacy download en_core_web_sm 连接被拒绝

spacy 1.7之后,支持将en_core_web_sm 可以通过“spacy download”的方式下载,也可以通过pip install 的方式进行安装。

2021-06-16 14:23:13 5217 1

原创 Multi-Agent Task-Oriented Dialog Policy Learning with Role-Aware Reward Decomposition 笔记

目录一 引入1.1 论文针对的问题1.2 论文的贡献二 算法2.1 对话中用户与系统的角色2.2 算法总体结构图2.3 用户与系统的policy网络(即两个actor)2.3.1 用户的policy网络2.3.2 系统的policy网络2.4 reward 的计算方法2.5Hybrid Value Network(即critic)2.6Hybrid Value Network的损失函数2.7算法训练流程三 实验3.1 数据集3.2 bas...

2021-04-11 21:30:37 680 2

原创 pycharm连接服务器运行时提示Can‘t get remote credentials for deployment server

pycharm通过 ssh 连接服务器端的python运行程序时偶尔出现错误Can't get remote credentials for deployment server。目前大部分的解决办法都是删掉解释器和deployment重新配置。这确实有用,不过太麻烦了。更方便的解决办法如下图:...

2021-03-27 18:50:56 2910 4

原创 windows 10 使用conda连接网络出现错误(CondaHTTPError: HTTP 000 CONNECTION FAILED for url)

问题:使用清华源时,conda 也报错CondaHTTPError: HTTP 000 CONNECTION FAILED for url试了将 https 改为 http,并删除default后,没有解决。一度以为自己的电脑出问题了。解决办法:1. 删除.condarc 文件,令其使用默认的国外源2. 给自己电脑开个梯子,然后在 cmd 中用下面命令设置临时代理set http_proxy=http://ip:端口set https_proxy=http://ip:端口...

2021-03-18 17:07:15 454

原创 利用tensorflow_hub调用bert(tensorflow 1.x)

我试图在 tensorflow 2.x 下调用 bert 。一直没有找到正确的代码(有些博客标明可用tensorflow 2.0 + tensorflow_hub 调用bert,但我运行时却发现各种错误)。最终还是选择了 tensorflow 1.x 版本。先安装需要的包:pip install "tensorflow>=1.15,<2.0"pip install --upgrade tensorflow-hubpip install bert-tensorflow==1.0.1

2020-10-01 22:13:56 2037 17

翻译 查看 github 上项目的创建时间

可使用 github 的 api 查询项目创建时间: 格式:https://api.github.com/repos/{:owner}/{:repository} 例子:https://api.github.com/repos/tensorflow/hub 请求api可以得到一个 JSON 格式的信息。其中有个字段为created_at。例如在浏览器地址栏输入 https://api.github.com/repos/,搜索 created_at,可以看到对应的创建时间为...

2020-10-01 17:36:37 5517 1

原创 java EE 8u1 SDK 包和 java EE 8 API 文档包

java ee 8u1 SDK 包链接: https://pan.baidu.com/s/1lGCgNkpaIlpsZMwb-CXrIA 提取码: wgptJava ee 8 api 文档链接: https://pan.baidu.com/s/1oV5HWx0fVva_RosOTXKT6g 提取码: 2g4y

2020-09-27 10:27:17 637 1

原创 python按关键字爬取必应高清图片

通过查询前人的博客,发现必应可通过url按关键字查找图片:https://www.bing.com/images/async?q=查询关键字&first=图片编号&count=图片数量&mmasync=1基于该url,我写了一个爬虫类,实现了按关键字下载固定数量的必应高清图片。调用时只需要一条python语句即可(由于使用了线程池并发请求图片,所以下载速度较快,一分钟300张高清图片没问题):# 关键词:电脑壁纸# 需要的图片数量:100# 图片保存路径:'.

2020-09-08 17:20:25 3611 11

原创 爬虫之网页数据提取

爬虫流程: 指定URL 发请求 收响应 解数据 存数据数据解析方法分类: 正则(各编程语言都可以用) bs4(python独有) xpath(重点,各种编程语言都可用)bs4.BeautifulSoup 提供的方法和属性: 实例化BeautifulSoup的方法 本地html文件 例 BeautifulSoup(file) 通过url获取到的html文本 .

2020-09-03 22:20:23 752 2

原创 爬虫之请求网页基础

python中用于requests的库有两个: - urllib:相对更老,使用更繁琐 - requests:更新,使用更简单requests库中最常用的方法有两个: - requests.get():对应了http协议的 GET request,常用参数是url,params,headers, - requests.post():对应了http协议的 POST request,常用参数是url,data,headers,这两个方法的返回类型都是requests.Re.

2020-09-01 22:22:58 344

原创 解决 tensorboard 空白页面 的问题

启动 tensorboard 后,http://localhost:6006/页面完全空白。我将 tensorboard 2.1 卸载,安装tensorboard 2.0后问题解决。pip uninstall tensorboardpip install tensorboard==2.0.0安装期间出现 ERROR: tensorflow 2.1.0 has requiremen...

2020-03-19 16:05:14 1666

原创 利用 Keras 的类 Tokenizer 对原始文本数据进行单词级 one-hot 编码

from keras.preprocessing.text import Tokenizertext_corpus = ['The cat sat on the mat.', 'The dog ate my homework.'] #语料库tokenizer = Tokenizer(num_words=12) #只标记出现次数最多的num_words个单词tokenizer.fit_on...

2020-03-18 11:37:47 520

原创 管道 消息队列 共享内存 的比较(优缺点)

Linux下的进程间通信方式有如下几种:低级通信 - 控制信息的通信:信号、信号量。高级通信 - 数据信息的通信:管道、信息队列、共享内存、套接字。其中只有套接字可用于不同主机的进程通信。 谁负责同步 方向是否固定 进程是否需亲缘关系 是否存在消息边界 数据大小是否受限 速度 生命周期随什么 无名管道 内核 是 ...

2020-03-08 15:39:04 2780

原创 python实现艾宾浩斯抗遗忘曲线(记忆曲线)

用python实现艾宾浩斯抗遗忘曲线(记忆曲线)学习复习计划表,代码如下from datetime import date, timedeltatimes = [2, 5, 8, 15, 30, 60] #复习间隔,以天数为单位for a in times: review_time = date.today() - timedelta(a) #应复习的时间点 print...

2020-02-02 22:50:17 4352 2

原创 vscode中使用mingw-w64运行c++程序

MinGW-w64 与 MinGW 的区别在于 MinGW 只能编译生成32位可执行程序,而 MinGW-w64 则可以编译生成 64位 或 32位 可执行程序。vscode中使用mingw-w64运行c++程序的教程见下方链接:https://code.visualstudio.com/docs/cpp/config-mingw...

2020-01-22 17:39:42 688

原创 C++ 中设置输出的精度

C++设置小数点后保留位数的代码如下: double a = 12.123; cout << "1: " << a << endl; cout.setf(ios::fixed); //使用固定符号生成浮点类型 cout.precision(2); //设置小数点精度为两位 cout << "2: " << a &...

2020-01-04 16:14:17 1600

原创 C++笔记

1. c++中判断输入结束的的两种方法while (getline(cin, line) && line != "")while (cin >> word)2. c++通用算法中,函数名中的_copy表示操作后的元素放入 dest 容器,_if 表示用提供的形参进行判断3. sort算法实现顺序排序,若需逆序排序,则 使用反向迭代器rbe...

2020-01-03 21:11:58 135

原创 c++中几种常用的输入函数比较

gets_s等带_s(s代表安全)的函数是VS特有的,其他编译器不承认scanf、cin 均不可读入空白字符串,空白字符串会被作为读取结束的标志getline 可读入空白字符串fgets 会读入换行符getline 不会读入换行符cin.fail()与cin.eof()是不相同的应用cin.fail()而不是cin.eof()来代替scanf("%s", str)==EO...

2020-01-02 21:34:31 261

原创 《算法笔记》学习中需注意的点

1. getline的调用方法,例如 getline(cin, str);2. 浮点数的比较,由于存在表示精度的问题,需要与极小数(例如1e-8)比较,例如const double eps = 1e-8; //误差#define Equ(a,b) (fabs((a)-(b))<eps) //判相等3. 对于一般的OJ(online judge)系统,一秒能承受的运算是10^...

2020-01-01 23:46:43 169

原创 熟悉C++

今天学习记录:1. 熟悉VS开发环境2. 试着编写浙工大online judge 题1001,失败,猜测需要一行一行读入再提取,不能直接使用cin读取多个输入(此时会跨行读取),于是开始借鉴他人准备机试的方法3. 喜获pcxxxxxx分享的《算法笔记》,打算先练习该书前七章题目,熟悉C++编程4. 用过vim,emacs,故学习了vs的一些快捷键。注:ThinkPad的键盘确实...

2019-12-31 23:26:01 254

转载 解决 java “错误:编码GBK 的不可映射字符”

代码:public class HelloWorldwww{                 public static void main(String args[])         {                   int num ; // 声明一个整型变量num                   num = 3 ; // 将整型变量赋值为3 // 输出字...

2018-08-11 16:09:57 18472

原创 Java学习笔记(2018.8.11下午 one)

在Java中,对 System.out.println(a) 语句,输出结果有如下情况:1、如果 a 为非 char 型数组,将输出 a 的引用;如果 a 为 char 型数组,将输出 a 的全部元素值。2、要输出 char 型数组的引用,需要让字符型数组和字符串做并置运算。3、对于非数组类型,上述语句将输出 a 的值。如下所示:1、源码/* char 型数组数据的输出测试...

2018-08-11 16:07:53 263

time_to_review.py

用python实现艾宾浩斯抗遗忘曲线(记忆曲线)学习复习计划表。 运行后会调用系统窗口打印出应该复习的时间点,默认复习间隔是2、5、8、15、30、60天,可通过修改times变量调整复习间隔

2020-02-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除