自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 在bert的基础模型上训练自己的数据(只是过程源码解析后面更新)

1.第一步从github上下载bert的源码链接,并且下载BERT模型链接2.第二步准备数据中文数据样式如图所示:(每一句话一行)3.第三步使用bert/create_pretraining_data.py来做数据的预处理主要是修改改文件的FLAGS.参数即可4.第四步运行bert/run_pretraining.py 同样只要修改FLAGS.参数 即可到这就可以了...

2020-06-19 15:32:24 4513 4

原创 模拟浏览器爬虫

模拟流浪器爬取近义词,并通过BeautifulSoup 和正则将近义词解析出来import urllib.parseimport urllib.requestfrom bs4 import BeautifulSoup as bsurl = 'http://jinyici.xpcha.com/'user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64...

2019-05-21 11:33:49 716

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除