自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(58)
  • 资源 (11)
  • 收藏
  • 关注

原创 从一心进大厂到银行科技部,我这一路的薪路历程(终于想起CSDN密码了,此次更新2021年5月14日)

零、题记屌丝逆袭亘古不变的话题,芸芸众生津津乐道的话题,如何从一个普通的屌丝逆袭呢?如果你早个20年问这个问题,可能是去学土木工程,就好像现在众屌丝纷纷涌向了计算机的相关行业。无疑,高新技术是最能刺激消费的地方,因而也是最能来钱的地方,因此众屌丝们无一不渴望通过学习计算机技术,升职加薪,赢取白富美,走上人生巅峰。难以避俗的是,博主也是这浮沉大海中的一撮小浪花,毕竟,谁还和钱能过不去啊。一、...

2020-04-12 22:14:09 5967 8

原创 小渣渣互联网求职记(内含各大厂招聘网址)

今天是2019年3月6日,在经历了京东的行业测试之后,心里有些难受,没想到行业测试还不简单,时间很紧,蒙了好多,估计是凉凉了。不过没有经历过就没有进步,先来总结下春招投递情况。1.字节跳动:日常实习和暑期实习都投递了,有推荐工程师实习岗,算法机器学习实习岗,数据实习生。网址:https://job.bytedance.com/internLandingPagehr平时岗位联系很快给打了...

2019-03-06 21:27:17 5621 11

原创 几道笔试题总结

1.Python不支持的数据类型char(1)Number(数字)---不可变数据类型1)int:python2中有int和long。a、/:python2中1/2=0,python3中1/2=0.5b、//:1//2=0,1.0//2=0.5,1//2.0=0.5c、%:1%2=12)float: 浮点型由整数部分与小数部分组成,浮点型也可以使用科学计数法表示(2.5e2 = 2.5 x 102 = 250)。3)bool:False、True。False的值是0,Tru.

2020-07-28 15:48:29 692

原创 什么是接口幂等性?怎么做到接口幂等性?

这个问题由来以及,只是最近工作再次发现这个问题世纪工作中还遇到的挺多。之前在做前端的时候,经常遇到一个问题,在点击提交按钮的时候,或是因为接口调用时间过长,或是由于网络波动,亦或是只是遇到一个没有什么耐心的客户,他不仅仅点了一次提交按钮,你要是不快点把结果页面展示出来,他能给你把按钮点烂。那么在极短的时间里,接受了多次提交请求,你的数据还能保持正确吗?这就是幂等性接口需要面对的问题。百度百科:在编程中一个幂等操作的特点是,其任意多次执行所产生的影响均与一次执行的影响相同。...

2020-07-08 22:05:17 945

原创 从SVN服务器上拉下maven项目后没有Maven配置或结构

1.可能是新建的workspace没有配置好maven首先进入 preferences的installtion选项,add添加,选择到安装maven的文件夹。然后在user setting里把conf文件夹下的setting.xml配置好,这里会自动显示你文件中配置好的本地maven库路径。如果你之前新建的工作空间,可能这个地址会显示c盘的默认user文件夹下,导致找不到Maven库。2.点击右上角带加号的视窗标签打开SVN资源库研究视窗,配置好项目文档地址,就可以看项目的同时,方便的切

2020-05-12 14:18:45 1038

原创 如何从一个普通的屌丝逆袭为一个程序员屌丝?(连载)

屌丝逆袭亘古不变的话题,芸芸众生津津乐道的话题,如何从一个普通的屌丝逆袭呢?如果你早个20年问这个问题,可能是去学土木工程,就好像现在众屌丝纷纷涌向了计算机的相关行业。无疑,高新技术是最能刺激消费的地方,因而也是最能来钱的地方,因此众屌丝们无一不渴望通过学习计算机技术,升职加薪,赢取白富美,走上人生巅峰。难以避俗的是,博主也是这浮沉大海中的一撮小浪花,毕竟,谁还和钱能过不去啊。一、前世可以...

2020-04-09 23:15:32 863

原创 9012年都过去了,你还没给你的爱机装上固态吗?

疫情过后,每天如霍金一样躺着刷手机的日子一去不复返,机器们许久没开工了,趁着没啥重要文件,赶紧给它们装个固态重新做一个系统。台式机之前的文章介绍过了,笔记本是dell的7559,也四年多了,出于尴尬的中年期。我这里给台式机买的是影驰的铁甲战将480G版,在够用的同时价格还便宜,给笔记本买的是M.2接口的三星860evo250G,如果不像博主一样家境贫寒建议都入三星。不过最近疫情固态价格有所...

2020-04-09 21:55:08 222

原创 数据可视化问题记录

1.中文不显示,变方块#解决中文变为方块mpl.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体,也可以填写其他字体名称参数mpl.rcParams['axes.unicode_minus'] = Falsempl.rcParams['font.size'] = 162.画条形图并加入百分比标记数字def sector(to...

2019-10-24 16:09:01 430

原创 Hadoop问题实录

1.使用Hadoop用户启动start-dfs.sh,显示访问不了log文件,这是因为Hadoop文件夹权限归属不对,可能当时是root用户创建的,所以更改文件夹所属即可,sudo chown -R hadoop:hadoop hadoop-2.7.7。把文件夹权限交给Hadoop组下的hadoop用户。2.免密登录在hadoop用户下ssh-keygen,生成密钥,ssh-copy-id...

2019-08-01 21:39:22 280

原创 从零开始读Java源码--Collections篇

最近看了一篇讲程序员的知识架构的博文,那些知识有种熟悉但是具体也说不上个所以然的感觉,尤其是涉及到并发开发的这些Java包,但是上路永远不晚,我的老伙计。目前主要是源码笔记加上一丢丢个人理解。一 Collection接口java.util 包下的接口,超顶层级别接口,同其他接口一样无任何实现方法,所有集合类型的数据结构的必经之路。那么先从List搞起来,可以这么说List从Co...

2019-04-23 21:52:04 256

转载 转载自陈树义 工作五年的java知识体系

转载自https://www.cnblogs.com/chanshuyi/p/take_about_my_java_tech_system.html聊聊我的知识体系目录JDK源码 集合源码 并发集合源码 并发包源码 阻塞队列源码 线程池源码 JVM原理 框架源码 Web框架 RPC框架 一致性框架 消息队列 缓存框架 网络框架 ...

2019-04-23 17:46:36 233

原创 台式机DIY后半年的使用心得---装机时要考虑哪些事

博主大概在去年双十一买了现在用的这太台式机,用了半年多了,感觉还蛮好的,就是有很多不便利的地方,感觉买电脑的时候没有考虑到。首先申明,博主贴出的都是自己买的配置。我买的主板CPU套装是Z390加上9700K,当时共4300大洋,现在搞活动应该整体能便宜一点。问题一来了:我是买盒装CPU还是散片CPU呢?所谓散片其实也是正经货带盒子的,但是它不带CPU散热器,我个人感觉散片比较好,...

2019-03-23 21:16:09 1426

原创 程序员笔试题集与答案python版(持续更新)

题目主要来自于平时的刷题,注释内为直觉解法,不体现算法功底和高效。对比使用算法思想的解法,从而不断进步。争取每天都更新几道,加油。1.给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。说明:你的算法应该具有线性时间复杂度。 你可以不使用额外空间来实现吗?class Solution: def singleNumber(se...

2019-03-01 12:36:59 1095

原创 python 函数定义后的箭头什么意思?函数参数和返回值的注解形式

def isValid(s: 'str') -> 'bool':    return s这里的参数:‘注解内容’ 和 箭头‘注解内容’的用法是为标注了参数和返回值的类型,使代码更具有阅读性和 def isValid(s):        return s效果上其实没有区别...

2019-02-23 15:45:00 10553

转载 什么是P问题、NP问题和NPC问题

转载自 matrix67的博客,对于NP问题的来龙去脉讲解的非常好。这或许是众多OIer最大的误区之一。    你会经常看到网上出现“这怎么做,这不是NP问题吗”、“这个只有搜了,这已经被证明是NP问题了”之类的话。你要知道,大多数人此时所说的NP问题其实都是指的NPC问题。他们没有搞清楚NP问题和NPC问题的概念。NP问题并不是那种“只有搜才行”的问题,NPC问题才是。好,行了,基本上这...

2019-01-14 16:57:41 605

原创 GitHub查看连接到哪个远程库命令以及更换远程库命令

查看连接到哪个远程库git remote -v 删除存在的已连接的远程库并加入新库地址git remote rm origingit remote add origin [email protected]:xxx/xxxx.git Git建库注意对于频繁使用的库,在文件夹里git init如果建立一个外层文件夹,存放不经常使用的项目,就要注意远程库的地址,分项目提交到...

2019-01-11 17:29:34 1508

原创 python 从list创建dict 以及 使用sorted对dict进行排序

使用两个list创建dicta = ['math','english','art']b = ['99','78','66']c = dict(zip(a,b))创建指定list为键名的dictc = {}.fromkeys([keylist],默认值) 使用sorted对字典进行排序,本质上还是sorted函数的使用sorted(iterable, key=None...

2019-01-09 11:28:37 827

原创 朴素贝叶斯进行非结构化文本分类

朴素贝叶斯非结构化文本分类英语单词大概有1百万左右,如果分别计算每个词在当前位置出现的概率来计算整篇文章的概率的话,是不现实的因此我们采取另一种简化方法,即转化积极文档的第n个位置是单词x的概率为单词x在积极文档中出现的概率。一般步骤如下1.确定词汇表的大小,即积极文档和消极文档中出现的所有独立单词的个数。对于每个单词计算积极消极两种假设的概率    1.1 将积极文档合并成一个文件,...

2019-01-04 17:20:52 342

原创 使用k近邻和朴素贝叶斯处理分类问题

属性分类距离问题,当使用1,2,3,4表示喜怒哀乐的话,喜和怒的距离明显比喜和乐的距离要远。解决这个问题,我们可以把特征转化为1-5的区间,例如这部电影有多少喜剧的成分。那么推荐的原因是什么呢?我们不应该因为取值处于低端的值而采取错误的结果,即他们都没有什么什么而去推荐,相反地我们应该对那些在高端的公共特征。下一步,当你加入了其他区间远大于1-5的特征时,你要注意由于设计到距离的计算,所以...

2019-01-04 14:53:42 1118

转载 转载:欧姆社 漫画学习统计学

最近学习数据挖掘实践指南,里面推荐了一本书,把数学原理用漫画的形式讲出来,学习不进去的时候可以看看漫画还能不不基础知识。·https://manhua.dmzj.com/oumushexueximanhua/55360.shtml#@page=1 ...

2018-12-28 16:09:45 953

原创 使用字典创建DataFrame 报错if using all scalar values,you must pass an index

1.从字典创建DataFrame 报错if using all scalar values,you must pass an indexmy_dict ={1:'zhangsan',2:'lisi',3:'wangwu'}pd.DataFrame.from_dict(my_dict)应加入pd.DataFrame.from_dict(my_dict,orient='index')...

2018-12-27 16:44:06 2414

原创 pandas中map,apply,applymap的区别

 基于Series数据结构的操作pandas.Series.applySeries.map对元素进行按元素操作For element-wise operationsSeries.agg官网注明只能使用聚合类型的操作,如sum,count,mean,std,prod,first,last,可以使用多个only perform aggregating type operations...

2018-12-27 16:17:39 852

原创 python实现基于物品的隐式协同过滤,使用movielens数据集测试

# 在distance里我们使用的主要是基于用户的协同过滤,但是这样存在两个主要的问题# 1.扩展性问题,随着用户量变多计算量也会增长,当上百万用户时扩展性就会成为一个问题# 2.稀疏性,稀疏性,例如网上有上百万本书,用户评价过的只占一小部分,所以可能找不到最近邻居# 因此,可以使用基于物品的过滤# 调整余弦分布 减去了用户的平均评分# consine(item1,item2) = 用户...

2018-12-27 13:37:44 1875

原创 spark中的时序算法

spark2.4.0 MLIib官网没提供时序模型APIhttp://spark.apache.org/docs/latest/mllib-guide.html#去GitHub上扒Spark-TimeSeries使用方法 2017年04月24日教程参考:https://blog.csdn.net/qq_30232405/article/details/70622400 时间序列包h...

2018-12-27 13:34:37 1716

原创 pandas使用小技巧--那些不为注意的默认参数

1.按行插入aa =pd.DataFrame([1,2,3])aa   00  11  22  3 aa.append([4])   00  11  22  30  4 aa.append([4],ignore_index=True)   00  11  22  33  42.定位到某行某列aa.at[0,0]13.写入csv不带in...

2018-12-27 13:33:25 405 1

原创 协同过滤学习笔记(一)

import numpy as npusers = {'zhangsan': {'book1': 2.0, 'book2': 3.5, 'book3': 4.0, 'book5': 3.0}, 'lisi': {'book1': 1.5, 'book3': 3.0, 'book4': 5.0}, 'wangwu': {'book2': 3.0, 'book...

2018-12-24 16:25:52 235

原创 pandas数据处理:处理标签类型数据

Pands在进行数据处理是往往会遇到标签型数据,比如省份【北京,上海,广州】,有些模型需要使用数字型进行计算,很自然的我们想将其转化为【0,1,2】的数字来表示,但是,这样会造成一个问题,数字是有大小的,而且是有顺序的,但是我们的数据没有大小的意义,数字映射并不符合原来特征的意义。为了解决这个问题,引入了独热编码也就是One-hot,也就是说,北上广,三种可能性,对应的三个互斥的编码,001,...

2018-12-21 16:30:32 1676 1

原创 github使用流程笔记

使用github断断续续有一些时间了,但是每次重新配置都要查,所以记录一下流程,基本篇。首先安装git,去官网下对应的版本安上就好,然后打开gitbash。本地库设置: git config --global user.name "username" git config --global user.email "youremail" ...

2018-12-18 17:06:25 181

原创 显卡识别为Microsoft基本显示适配器,安装9700k核芯显卡HD630驱动或安装其他核显驱动

在不安装独立显卡只装备了具备核心显卡的cpu的情况下,windows自带的驱动无法很好的支持高清分辨率,双屏幕或是一些核显就能带动的游戏,需要去下载对应版本的核心显卡驱动,以下是9700k的下载地址。https://downloadcenter.intel.com/zh-cn/download/28404/Intel-Graphics-Windows-10-DCH-Drivers不然会显卡...

2018-12-17 21:12:58 32424

原创 pands 使用unstack和nunique()统计 同一id下某类出现的次数

灵活使用unstack和nunique真的是相当的强大,遇到了统计套牌车的一个需求。第一部我们使用分组函数统计车牌号,并将其展开成一个映射表,统计出现次数,使用unstack(0)是指将第几个列名抬上去,由双主键变为一列,一序号。cartype = df.groupby(['车牌号', '车型'])['车型'].count().unstack(level=0)unstack前车牌...

2018-12-14 17:25:02 618

原创 pandas value_counts 和value_counts()的区别

value_counts(values, sort=True, ascending=False, normalize=False, bins=None, dropna=True)    Compute a histogram of the counts of non-null values.        Parameters    ----------    values : ndar...

2018-12-14 17:00:38 6124

原创 使用PyQt5从零进行大数据app构建(零)申请软件著作权-用户手册

前言:想写一个应用好久了,独立开发大概是每个程序员的梦想。自从之前写了一个数据挖掘的小模型,一直想封装一下,故而上路,所以此系列算不上教程,只是记录分享这个过程的坑点和经验,力求有头有尾,网上抄来抄去的教程真的看的头疼,己所不欲勿施于人,在封装完毕之后我会将完整的代码贴出来与大家分享。教程合集地址:https://blog.csdn.net/infent/column/info/30927...

2018-12-13 10:23:58 2532 1

原创 使用PyQt5从零进行大数据app构建 允许远程登录MySQL

在打包结束后,想让别人来测试一下,所有要更改数据库连接权限,我采用的是授权式,也可以采用允许所有。在你的navicat中输入以下命令:GRANT ALL PRIVILEGES ON *.*  TO 'root'@被授权ip IDENTIFIED BY '123456' WITH GRANT OPTION;FLUSH PRIVILEGES;具体的原理如下:Mysql为了安全性,在默认情...

2018-12-13 09:54:03 1172

原创 使用PyQt5从零进行大数据app构建(十二)打包问题:AttributeError: 'str' object has no attribute 'items'

在打包的时候遇到了如下问题:AttributeError: 'str' object has no attribute 'items',经过研究后发现是setup-tools包和pyinstaller不匹配,由于我安装的是3.4的pyinstall,而我的tools包是老版本的,使用pip install -U setuptools 安装对应版本的包就行了。同理安装上pywin32和torna...

2018-12-13 09:43:42 1682

原创 使用PyQt5从零进行大数据app构建(十三)pyinstaller打包讲解 -F,-D,-w,-c,以及--hidden-import的用法

教程合集地址:https://blog.csdn.net/infent/column/info/30927代码下载地址:https://download.csdn.net/download/infent/10846010最终应用来到了打包阶段,这里坑点居多,因此拿出一节来记录一下我这两天的历程。我只能说没有解决不了的问题只有定义不清晰的问题,只要方向对了,问题会随着了解的加深而迎刃而解。...

2018-12-12 17:46:32 50829 7

原创 使用PyQt5从零进行大数据app构建(十二)项目优化

本来上一节就想结束的,但是打包的时候遇到各种问题,索性就重新优化一下,顺便记录下打包时候解决的问题,尤其是打包问题,我会在下一节详细记录一下方法。首先我们把项目进行了重构。主体模块为lvtonguilogic.py 为程序入口,其余四个模块依次负责读文件,应用开始界面,数据库交互,业务模型。代码下载地址:https://download.csdn.net/download/infe...

2018-12-12 17:13:24 1048

原创 使用PyQt5从零进行大数据app构建(十一)给多线程任务加入进度条

不知不觉都已经做完了,最后我们加入一个QProcess作为结束吧。首先还是在QtDesigner中加入一个进度条,然后把它的初始值设定为0,然后pyuic更新一下我们继承到的界面。如果你还不清楚工作流请看app构建第一节。教程合集地址:https://blog.csdn.net/infent/column/info/30927这里我们主要使用的是在任务线程中,循环发射自定义信号给进度条...

2018-12-11 19:15:07 1214

原创 使用PyQt5从零进行大数据app构建(十)从UI分离耗时业务到子线程,数据库交互模式与sql异常捕获

前言:想写一个应用好久了,独立开发大概是每个程序员的梦想。自从之前写了一个数据挖掘的小模型,一直想封装一下,故而上路,所以此系列算不上教程,只是记录分享这个过程的坑点和经验,力求有头有尾,网上抄来抄去的教程真的看的头疼,己所不欲勿施于人,在封装完毕之后我会将完整的代码贴出来与大家分享。教程合集地址:https://blog.csdn.net/infent/column/info/30927...

2018-12-11 10:56:39 634

原创 使用PyQt5从零进行大数据app构建(九)用户登录身份验证

前言:想写一个应用好久了,独立开发大概是每个程序员的梦想。自从之前写了一个数据挖掘的小模型,一直想封装一下,故而上路,所以此系列算不上教程,只是记录分享这个过程的坑点和经验,力求有头有尾,网上抄来抄去的教程真的看的头疼,己所不欲勿施于人,在封装完毕之后我会将完整的代码贴出来与大家分享。教程合集地址:https://blog.csdn.net/infent/column/info/30927...

2018-12-07 17:12:07 1757

原创 使用PyQt5从零进行大数据app构建(八)关联规则挖掘与展示 使用基于apriori的pymining包

前言:想写一个应用好久了,独立开发大概是每个程序员的梦想。自从之前写了一个数据挖掘的小模型,一直想封装一下,故而上路,所以此系列算不上教程,只是记录分享这个过程的坑点和经验,力求有头有尾,网上抄来抄去的教程真的看的头疼,己所不欲勿施于人,在封装完毕之后我会将完整的代码贴出来与大家分享。教程合集地址:https://blog.csdn.net/infent/column/info/30927...

2018-12-07 16:58:44 833

东北大学软件著作权专属模板

东北大学软件著作权申请模板,包含使用说明书,源代码,登记信息表模板,专利申请表模板。

2018-12-14

PyQt5编写的大数据应用-高速公路违章判断

高速公路绿色通道是为绿色农产品开设的收费口,但是经常有车辆贪图收费优惠,既影响了正常车辆,又浪费了人力,因此本应用将从零开始,搭建一个辅助检测应用。详细搭建步骤请看我的专题从零进行大数据app构建--高速公路大数据辅助检测应用。https://blog.csdn.net/infent/column/info/30927

2018-12-12

java题库终极整理版

包含从java基础到进阶的题目,包含从类到动态代理的考试的全部内容。

2018-10-16

天池大数据竞赛LSTM预测算法分享

资源为今年八月份参加天池大数据竞赛a股公司营收预测使用的预处理后的数据和对应的算法文件

2018-09-28

Geoplotlib: a Python Toolbox for Visualizing Geographical Data

这是一个geoplotlib的使用说明,仅作为交流备忘使用。

2018-09-28

spark大数据日志分析pom配置文件idea

spark 大数据日志分析项目所使用的配置文件,对应的编译器为idea2018社区版

2018-09-28

病情分析数据

爬取自120ask,的 病情分析文本

2018-08-28

计算机硕士开题报告模板

开题报告模板。 计算机应用型硕士 计算机类

2018-08-28

家具城购物数据

用于做预测和用户聚类的家具购物数据。 通过线下收集。

2018-08-28

神经网络入门ppt附IMDB影评感情倾向全连接神经网络分析案例(自编)

神经网络入门ppt附IMDB影评感情倾向全连接神经网络分析案例(自编)

2018-04-27

东北大学考研数据结构资料

东北大学辅导班C语言和数据结构讲义ppt,包括算法类和应用类设计题,适用于软件和计算机类复习使用。

2016-01-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除