自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 SearchUI线程关闭&微软小娜占用CPU&Windows家庭版关闭微软小娜

SearchUI又出bug了win10家庭版改注册表没用,手快点结束进程的时候把‪文件名改了就行了。EG:1Microsoft.Windows.Cortana_cw5n1h2txyewy(加了个1)路径:C:\Windows\SystemApps\1Microsoft.Windows.Cortana_cw5n1h2txyewy...

2020-04-07 18:50:45 815 1

原创 网络爬虫的合法性讨论

摘要:随着大数据时代的到来,数据已经渗透导生活和工作的各个领域,“网络爬虫”在大数据时代是一种不可或缺的高效获取海量数据的重要工具。 爬虫作为一种计算机技术就决定了它的中立性,因此爬虫本身在法律上是不被禁止的,但是利用爬虫技术获取数据这一行为是具有违法甚至犯罪的风险的。1.网络爬虫和相关基本概念1.1网络爬虫的概念网络爬虫(又称为网页蜘蛛,网络机器人)是一种按照一定的规则,自动的抓取万维网信...

2020-03-15 13:05:43 1285

原创 类vgg网络实现端到端识别验证码

#项目起因大二在做weibo爬虫帮学长用于情感分析抓取语料时遇到了模拟登陆的问题,其中关键的一环就是验证码识别。由于当时专业知识有限选择了对接打码平台来解决这个痛点,在时间不充分情况下这是效率最高的方法但这也在我心中埋下了一个小小的种子。大二暑假在校听了邹老师的课程后,抱着学习的态度我把weibo验证码识别做为了我的软件工程课设题目同时也是我的第一个深度学习实战项目。#为什么采用端到端的方式...

2020-03-07 17:44:13 425

原创 使用keras 搭建Gans在Mnist数据集上训练总结

Gan的基本介绍GAN(Generative Adversarial Networks)被Lan Goodfellow提出以后,各种Gan遍地开花,GAN掀起了一场技术革命在各个领域的应用都取得了重大突破, 图灵奖得主Yann LeCun也称近Gan是20年来深度学习领域最棒的想法。身为小白的我也久仰Gan的大名,在寒假期间终于有时间能实操一下Gan的训练(期待的搓搓小手) Gan在近些年来的...

2020-03-01 18:14:40 694

原创 机器学习项目前(java)后端(python)进程通信问题

本篇开门见山,在做机器学习项目时有时会遇到前后端的交互问题。以本地打码平台为例,在模型训练好之后前端是由java写的,模型则是由python完成,前后端的交互实际上就是前后端两个程序所在线程的交互,所以将python所在线程实现ServerSocket,Java线程实现Socket则可实现交互。Python:import socketimport sysimport thread...

2020-03-01 10:12:15 1752 3

原创 Pycharm 报错 Process finished with exit code -1073740940 (0xC0000374) 已解决

今天用Pycharm pandas读取csv文件(1.3g)时 报错Process finished with exit code -1073740940 (0xC0000374)但是用Spyder运行代码时能正常运行,所以说应该是Pycharm内存爆了解决方案:pandas包更新到最新版 pycharm中后缀为vmoptions的配置文件里Xms、Xmx的值调大文...

2019-09-17 22:11:51 6833 7

原创 Deep Learning 激活函数总结

引入激活函数的意义: 激活函数是用来加入非线性因素的,提高神经网络对模型的表达能力,解决线性模型所不能解决的问题(比如线性不可分的问题)。 激活函数的作用: 在没有激活函数的神经网络中所有的变换都是线性的,所以无论网络结构如何输出总是输入的线性组合 用多个感知机来进行组合, 获得更强的分类能力所以在面对线...

2019-08-26 15:42:51 607

原创 天涯论坛搜索爬虫

需求:获取天涯论坛上某关键字搜索出来的所有页面里面的每个帖子的楼主id和评论id获取id间的对应关系,用于粒子群算法。(实际上已匹配出用户id,评论内容,用户名等信息,需要的话自己改一下return 就行了)分析:天涯论坛所有界面都是静态页面,没有发现反爬机制。 没有速度限制,但是还是请合理采集不要过度占用网站资源(我爬的时候,速度快了服务器会反应不过来。。多试几次就行了)...

2019-03-02 00:02:43 1097

原创 爬虫抓包模拟登陆新浪微博获取cookies

模拟登陆就是获取新浪服务器返回的登陆参数(cookies等),然后添加到爬虫的post请求中来伪装用户提交给新浪访客系统首先感谢 Bgods(https://blog.csdn.net/songzhilian22/article/details/48396545)敲代码的耗子(http://www.cnblogs.com/mouse-coder/archive/2013/03/03/294...

2019-02-15 17:16:44 3821

原创 python redis3.0 更新踩坑 zadd zincrby

在维护代理池时报错1:zincrby(REDIS_KEY,proxy,-1)redis.exceptions.ResponseError: value is not a valid float查看文档后发现zincrby()跟新为zincrby(self, name, amount, value)解决方案: zincrby(REDIS_KEY,-1,proxy) ...

2019-01-28 12:15:38 4912 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除