自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

GhostLWB的博客

要做就做到最好

  • 博客(63)
  • 资源 (12)
  • 收藏
  • 关注

原创 超全面的后端开发C/C++面经整理分享含详细参考答案 包括简历分享

本文为博主2020年秋招提前批的c/c++后端开发面经整理,包括C/C++语言基础,计网,数据库,linux,操作系统,场景题,智力题和hr常问题。面试问题来自前人的工作和博主面试时遇到的值得记录的问题,其中面试题答案多为博主自行解答(并且面试的时候也基本是这样回答的),回答中都附上了参考资料的链接,全文共七万余字,仅供大家作为面试准备材料的参考。希望大家在准备面试的时候都能建立一个属于自己的题库,自己从网上寻找问题,然后自己进行解答,并且记录下来,这样在面试的时候就能行云流水般的回答上来。因此我把这份面

2020-08-26 14:03:20 85099 57

原创 链家全国房价数据分析 : 数据分析及可视化

相关文章:链家全国房价数据分析 : 数据获取上一回我们提到了用爬虫爬取链家的新楼盘和二手房数据信息,这回我们来看看如何对他们进行分析。新楼盘数据分析因为我们爬的时候是一个个城市爬的,现在我们要把他们合在一起,首先呢我们需要知道一共爬了哪些城市。url='https://gz.fang.lianjia.com/loupan/pg1/'html=getHTML(url)selector=e...

2018-11-27 14:44:11 22057 7

原创 链家全国房价数据分析 : 数据获取

最近一直在看论文,也有很久没有coding了,感觉对爬虫的技术有些生疏,我觉得即使现在手头没有在做这方面的东西,经常爬点对技术保鲜还是很重要的。所以这次我打算爬链家的房价数据,目的主要是对爬虫和Python的东西作一个巩固,然后做一个分析。以链家广州为例查看网页结构,可以看到它是下图这样的:看起来内容元素的结构十分清晰,分类很好,都是我们想要的东西。链家对爬虫的容忍度挺高的,不会封IP,也...

2018-11-27 11:05:34 17904 11

原创 python可视化之seaborn

数据可视化的文章我很久之前就打算写了,因为最近用Python做项目比较多,于是就花时间读了seaborn的文档,写下了这篇。 数据可视化在数据挖掘中是一个很重要的部分,将数据用图表形式展示可以很直观地看到数据集的特点(比如正态分布,长尾分布,聚集等),方便下一步怎么对数据进行处理。这里我用的是Python来进行可视化,因为Python的框架相对较多而且使用的也较广泛。我们在这里用的是seab...

2018-08-11 16:57:58 11305 4

原创 scrapy爬取豆瓣电影教程

最近在做爬虫,也很久没更博客了,这篇长文就算是一个开更礼吧,Duang在爬取之前,你得确保你已经有以下的条件: python3 环境 (在我的机子上是python 3.6.5) scrapy 已经安装 有一个Python的IDE 我这里是Spyder为了方便调试,在这里我们先在Windows10系统进行编码,然后在阿里云服务器上运行需求分析在这里呢我们要爬...

2018-04-13 15:50:37 7988 4

原创 Titanic:数据挖掘入门的第一步

关键词: 数据挖掘 机器学习 预测 Python这是一篇超长图文教程来自kaggle经典数据挖掘项目:Titanic

2017-12-22 22:18:44 5798 4

原创 二进制炸弹实验binarybomb 拆弹

写在前面这个实验是系统级编程的课程实验,非常有意思,给定一个可执行文件bomb.exe,这个程序打开之后需要用户输入一些东西,只有输入指定的字符串或者数字才能到达下一个步骤,一共有7个步骤,如果输入错误,屏幕会显示boom!!并退出程序,意味着你引爆了这个炸弹。你需要反汇编这个可执行文件来找到拆弹的线索。老师给我们提供了两种方法:使用GDB+objdump来反汇编;使用IDA 来反汇编做本实验采用的

2017-10-31 14:54:56 32249 27

原创 手把手教你配置阿里云服务器搭建网站

出于好奇,我用学生优惠租了一台阿里云服务器,打算做一些Java web的开发,但是毕竟是第一次接触这样的东西,还是比较懵逼,在这个过程中遇到了一些问题(肯定会遇到问题的),但是呢,在网上搜解决办法的时候,总是历经波折才能找到我最后想要的东西,所以我想把我配置阿里云的时候踩过的坑填一下,如果你按照我的方法成功解决的问题,别忘了给我点个赞

2017-10-16 09:22:46 141050 17

原创 校招生的中场战事:意向书,offer选择与三方

关键词秋招 校招流程 谈薪 offer选择 拒绝offer 三方 薪资argue写在前面关于校招,我发现目前网上可参考的资料一般都是面试注意事项和面试经验,关于面试通过之后要怎么做的经验特别少。比方说面完hr面我该干嘛?谈薪的时候是怎么谈的?收到意向书是不是就可以什么都不管了?有这么多offer我该怎么选?我要拒绝offer最好什么时候说?跟谁说?怎么说?有没有模板?等等。对于大多数人来说,我们都是第一次拿到offer,甚至是第一次参加面试,对于这些相关的流程一窍不通。但是用人单位呢,他们大多已经举办

2020-12-09 20:54:46 18358 5

原创 Windows下C++使用thread时无法识别thread和mutex相关库的解决

问题描述今天我在Windows下打算尝试C++多线程编程,在CLion上进行编码。CLion的C++编译器是正常的,以前也跑过好几个项目,使用其他STL库函数也正常,唯独使用thread时报无法识别的错,所有thread都划上了红线。如下图所示:其他错误信息包括但不限于:thread未定义No member named ‘thread’ in namespace ‘std’;‘thread’ undefined找不到threadmutex contiditional_variable未定义

2020-07-06 13:17:20 13452 3

原创 深度学习知识点盘点(一)

最近博主在学习深度学习,选择的是看吴恩达的DeepLearning课程,因为Coursera上完成课程要申请助学金不然要钱(白嫖警告),并且要完成作业。博主没那么多时间也没那么多钱,所以选择了b站上刷视频。刷视频的时候就边看边作总结,本来找了一些比较著名的笔记,一看发现还是字幕比较多,不利于复习,所以对部分常用的深度学习概念做了一些知识点盘点,然后又决定发到博客上,所以我尽量以看得懂的形式记录,希...

2019-12-12 22:31:29 1076

原创 AlphaGo是如何炼成的:解读论文 "Mastering the game of Go with deep neural networks and tree search"

这篇发表在nature 2016年1月27日上的文章题目为:"Mastering the game of Go with deep neural networks and tree search"来自Google deep mind,它阐述了AlphaGo的模型过程和训练方法,让我们对这篇论文进行解读,看看为何AlphaGo可以成为迄今最强大的围棋对弈程序吧。论文地址为:Mastering th...

2019-12-09 12:57:45 1849

原创 MATLAB 实现zigzag扫描(z字形扫描)

今天在做多媒体作业的时候需要实现JPEG压缩,其中一步就是将量化后的块做zigzag扫描。我在网上找了很久,发现反复流传的就一份MATLAB代码,无奈这份代码跑起来结果和我预料的不一致,于是进行了修改,下面是修改后的代码。function b=zigzag(a)% 输入是一个8*8的矩阵,输出一个1*64的矩阵(行向量)% 这是参照 University of California 提供的 ...

2019-12-06 22:18:39 9365 4

原创 MySQL没有启动成功,没有报告任何错误

问题描述:在使用"net start mysqld" 的时候出现:MySQL 服务正在启动…MySQL 服务无法启动。服务没有报告任何错误。的情况我们通过data文件夹里面的 [计算机名].err文件查看错误消息可以看到提示我们已经有一个进程占用了3306端口,而我们的mysql是默认运行在这个端口的。我们打开CMD窗口 用netstat -ano|findstr “3306”...

2019-07-15 17:25:40 1121

原创 Stanford 机器学习(吴恩达)课程小笔记

机器学习的定义“A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with exper...

2018-12-28 16:23:09 1082

原创 推荐系统 recommender system

使用场景消费者C={user1,user2,user3,…,usernu}C=\{user_1,user_2,user_3,\dots,user_{n_u}\}C={user1​,user2​,user3​,…,usernu​​},一共有nun_unu​个样本商品G={prod1,prod2,…,prodnp}G=\{prod_1,prod_2,\dots,prod_{n_p}\}G={pro...

2018-12-21 21:33:17 1003

原创 异常检测 anomaly detection

异常检测的应用欺诈检测工业质量监测计算机集群监测等等定义给定一些数据集D={x1,x2,…,xm}D=\{x_1,x_2,\dots,x_m\}D={x1​,x2​,…,xm​},注意这些样本是unlabel的,构建一个模型p(x)p(x)p(x),对于一个新的样本xtestx_{test}xtest​,判断该样本是否异常。当p(xtest)≤ϵp(x_{test})\le \ep...

2018-12-21 21:17:58 1413

原创 K近邻聚类算法

概述随机选择K个聚类中心,在每一次迭代中,先为每个点确定其最近的聚类中心,这一步称为集群分配(cluster assignment),然后计算每个类中所有点的中心点,将该类的聚类中心移动到中心点,这一步称为中心移动(move centroid),得到这k个聚类中心的新位置,进行下一次迭代,直到每个聚类中心点正确分布在每个类的中心。算法的输入有两个参数:聚类中心的数量K和一系列训练集X={x1,...

2018-12-10 21:04:09 5119

原创 神经网络初步与反向传播算法

层数表示输入数据的层叫输入层(input layer)输出结果的层叫输出层(output layer)除了这两层之外的层都叫隐藏层(hidden layer)激活函数每个结点的激活函数,通常都是sigmoid函数g(x)=11+e−xg(x)=\frac{1}{1+e^{-x}}g(x)=1+e−x1​表示方法denote通常,上标表示层数,下标表示该层的第几个。在输入层,输...

2018-11-16 16:49:25 803

原创 逻辑回归 logistic regression 算法原理及优化

概述逻辑回归也叫对数几率回归“逻辑回归”虽然叫回归,但是却是一种分类方法,跟线性回归(linear regression)有着显著的不同。优点:无需事先假设数据分布,可以避免假设分布不准确带来的问题;不是预测出类别,而是给出近似概率;对率函数是任意阶可导的凸函数,有很好的数学性质。缺点:算法推导给定训练数据集D={(xi,yi)}i=1mD=\{(x_i,y_i)\}_{i=1}...

2018-11-13 16:49:31 2690

原创 K最近邻(k-Nearest Neighbor,KNN)分类算法

概述K最近邻(k-Nearest Neighbor,KNN)分类算法是最简单的机器学习算法。它没有训练的过程,它的学习阶段仅仅是把样本保存起来,等收到测试集之后再进行处理,属于“懒惰学习”。反之,在训练阶段就对样本进行学习的算法属于“急切学习”。它本质上是衡量样本之间的相似度。口头描述给定测试集里某个点,基于某种距离度量计算它与训练集中每个点的距离,按照距离递增依次排序,选取与当前点距离...

2018-10-22 13:08:41 1054

原创 线性回归 linear regression 原理及推导

概述优点:容易计算,易于理解和实现缺点:容易欠拟合适用数据类型:数值型和标称型口头描述线性回归试图构造一个线性函数,去拟合尽可能多的样本点。重点是如何确定线性函数的参数,使得该函数尽量穿过样本点,一般使用均方误差最小化来作为参数拟合效果的标准。算法推导(解方程的方法)给定训练数据集D={(xi,yi)}i=1mD=\{(x_i,y_i)\}_{i=1}^mD={(xi​,yi​...

2018-10-22 13:04:34 825

原创 SVM支持向量机算法原理

特点概述优点: 泛化性能好,计算复杂度低,结果容易解释缺点: 对参数和核函数选择敏感,原始分类器不加修改仅适用于二分类问题适用数据类型:数值型和标称型数据口头描述SVM认为可以使用一个超平面将数据集分隔开来,距离超平面最近的点称为支持向量,SVM的目标是确定超平面使得支持向量到它的距离最大化。求解的算法有很多种,一般使用SMO算法, 它将大优化问题转化为小优化问题进行求解。SVM推...

2018-10-06 19:54:46 528

原创 特征工程笔记

虽然说特征工程很大程度上是经验工程,跟具体业务相关,但是我们可以根据一些思路来进行,以下是我在实践过程中总结出来的一些思路,希望能给大家带来一点启发。思路与过程0.概览数据使用数据可视化工具对数据进行概览0.1 对原始数据进行概览常用的概览方法: 1. dataset.describe(): 查看每种属性的总数,平均值,标准差,25%,50%,75% 2. d...

2018-10-05 20:04:35 229

原创 保研夏令营回顾

从去年十一月份开始打算保研,到现在夏令营结束,我一路上参考了不少资料,也得到过不少朋友们的帮助和鼓励,我觉得我应该留下点什么,去为下一届或者以后有志向保研的同学们,所以我在这里把我的经验写一写,主观成分很多,并不代表学校实际情况。先说明一下我的情况,四川大学软件学院2015级本科生,其实大一大二的时候我是没有想到过保研,我是打算直接工作的,毕竟软件的本科生工作也那么好找,但是大二下的时候辅导员...

2018-08-09 12:52:17 7978 15

原创 剑指offer 把数组排成最小的数

题目描述输入一个正整数数组,把数组里所有数字拼接起来排成一个数,打印能拼接出的所有数字中最小的一个。例如输入数组{3,32,321},则打印出这三个数字能排成的最小数字为321323。解题思路3 32 321 先转化成string数组,从第一位开始,对数组遍历,找出第i位最小的数,如果都一样,就再次遍历,找出第i+1位最小的数,找到就将这个数从数组汇中删去代码...

2018-06-30 17:37:19 165

原创 剑指offer 丑数

题目描述把只包含因子2、3和5的数称作丑数(Ugly Number)。例如6、8都是丑数,但14不是,因为它包含因子7。 习惯上我们把1当做是第一个丑数。求按从小到大的顺序的第N个丑数。解题思路丑数不难找,关键是如何让他们从小到大找到 下一个丑数总是由以前的某个丑数乘以2或3或5得到,我们只要每次找到以前的丑数中的一些数,然后乘以2,3,5,将其中最小的那个加入集合,再重复以上过...

2018-06-30 17:36:40 160

原创 剑指offer 第一个只出现一次的字符

题目描述在一个字符串(1<=字符串长度<=10000,全部由字母组成)中找到第一个只出现一次的字符,并返回它的位置解题思路我们遍历这个字符串,假设每个当前字符都是只出现一次的,我们分别向前和向后考察是否存在相同字符 向前考察:保存一个vector里面存放所有已知的已经重复过的字符,如果当前字符跟这个vector里面的字符相同,那必然不是只出现一次的 向后考察:遍历当...

2018-06-30 17:34:28 246

原创 剑指offer 数字在排序数组中出现的次数

题目描述统计一个数字在排序数组中出现的次数。解题思路一个数字在排序数组中的分布一定是连续的,题目其实是一个在排序数组中查找数字的意思,我使用二分查找代码class Solution {public: int GetNumberOfK(vector<int> data ,int k) { int length=data.size(...

2018-06-30 17:33:42 161

原创 剑指offer 二叉树的深度

题目描述输入一棵二叉树,求该树的深度。从根结点到叶结点依次经过的结点(含根、叶结点)形成树的一条路径,最长路径的长度为树的深度。解题思路使用递归来遍历二叉树,返回左右子节点树较大的深度代码/*struct TreeNode { int val; struct TreeNode *left; struct TreeNode *right; ...

2018-06-30 17:33:00 203

原创 剑指offer 平衡二叉树

题目描述输入一棵二叉树,判断该二叉树是否是平衡二叉树。解题思路平衡二叉树是这样定义的: 平衡二叉树(Balanced Binary Tree)又被称为AVL树,具有以下性质:它是一 棵空树或它的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。 所以算法分为两部分:计算左右子树高度(即为深度),和左右子树是否仍为AVL树对每个节点,计算它的左右子树...

2018-06-30 17:32:18 153

原创 剑指offer 数组中只出现一次的数字

题目描述一个整型数组里除了两个数字之外,其他的数字都出现了两次。请写程序找出这两个只出现一次的数字。解题思路我们利用异或的特性,异或两个相同的数字的结果为零,第一遍对数组进行异或的结果是 两个只出现一次的数字的异或值(a^b),并不是我们想要的,所以我们根据这个异或值找到一位为1的位数 (a和b的这个位上的值肯定是不相同的),按照原始数组中所有数字的这个位是否为1分成两组,这样两组...

2018-06-30 17:31:35 157

原创 剑指offer 和为S的两个数字

题目描述输入一个递增排序的数组和一个数字S,在数组中查找两个数,是的他们的和正好是S,如果有多对数字的和等于S,输出两个数的乘积最小的。输出描述:对应每个测试案例,输出两个数,小的先输出。解题思路先找到1/2S的值所在的位置pivot,从这个位置开始往左右两边遍历,设置两个指针i和j,I指向pivot的位置,j往右遍历,一旦array[i]+array[j]>S ,则进入下一...

2018-06-30 17:30:35 162

原创 剑指offer 扑克牌顺子

题目描述LL今天心情特别好,因为他去买了一副扑克牌,发现里面居然有2个大王,2个小王(一副牌原本是54张^_^)…他随机从中抽出了5张牌,想测测自己的手气,看看能不能抽到顺子,如果抽到的话,他决定去买体育彩票,嘿嘿!!“红心A,黑桃3,小王,大王,方片5”,“Oh My God!”不是顺子…..LL不高兴了,他想了想,决定大\小 王可以看成任何数字,并且A看作1,J为11,Q为12,K为13。...

2018-06-30 17:23:02 208

原创 剑指offer 圆圈中最后剩下的数

题目描述每年六一儿童节,牛客都会准备一些小礼物去看望孤儿院的小朋友,今年亦是如此。HF作为牛客的资深元老,自然也准备了一些小游戏。其中,有个游戏是这样的:首先,让小朋友们围成一个大圈。然后,他随机指定一个数m,让编号为0的小朋友开始报数。每次喊到m-1的那个小朋友要出列唱首歌,然后可以在礼品箱中任意的挑选礼物,并且不再回到圈中,从他的下一个小朋友开始,继续0…m-1报数….这样下去….直到剩下...

2018-06-30 17:21:46 194

原创 剑指offer 和为S的连续正数列

题目描述小明很喜欢数学,有一天他在做数学作业时,要求计算出9~16的和,他马上就写出了正确答案是100。但是他并不满足于此,他在想究竟有多少种连续的正数序列的和为100(至少包括两个数)。没多久,他就得到另一组连续正数和为100的序列:18,19,20,21,22。现在把问题交给你,你能不能也很快的找出所有和为S的连续正数序列? Good Luck!输出描述:输出所有和为S的连续正...

2018-06-20 22:23:25 204

原创 C++返回vector/将vector作为参数传递

在C++里很多时候我们会遇到函数想返回两个以上结果的情况,这时候可以用数组(vector)、类来作为容器返回,也可以声明一个全局变量的数组,将数值存放在数组里解决。但是绝不能在函数中声明一个vector然后将这个vector返回,这是因为在函数内声明的变量为局部变量,该变量在函数执行时是保存在函数栈中的,在函数执行完毕后会进行出栈操作,此时该内存会被清空,你所返回的变量就不存在了,主调函数当然就取...

2018-06-20 11:49:59 51215 14

原创 Spark算子总结

Spark算子总结spark 算子分为两类:transformation和Action1.常用spark action val rdd1 = sc.parallelize(List(1,2,3,4,5), 2)collect 将rdd转化成数组(Array) rdd1.collectreduce 按照一定的方法将元素进行合并 val rdd2...

2018-03-16 10:42:02 1255

原创 Python 学习小笔记

Python Learning 这是我在入门Python的时候边学边记的一些笔记,如果你发现笔记很乱很没逻辑那很正常 字符串字符串不能被更新数据集里面的元素都可以是不同数据类型的 都可以被索引和切片 查看一个变量的数据类型使用type(obj)方法 如type(tup1) 列表 列表使用[]括起来,里面的元素可以是不同数据类型的,中间用逗号隔开

2018-01-26 12:13:30 580 3

原创 http代理服务器实现(web cache)

关键词:web cache 代理服务器 计网 计算机网络 socket http这个项目是计算机网络的课程项目之一,要求使用socket编程实现http代理服务器,能够同时服务两个以上客户端同时访问,允许用户自行设置工作区。而我在这里使用的是比较熟悉的Java实现。 如果同学们有幸搜到了这篇文章,请有限制的借鉴,毕竟课程项目的初衷就是为了让同学们在时间中巩固知识,而不是交差拿高分。 本项

2018-01-24 15:15:03 6047 16

JPG图像压缩MATLAB代码

JPG图像压缩 MATLAB代码 亲测可以运行 包含压缩编码过程以及解码过程 包括了分块,DCT,量化,Zigzag扫描,游长编码,熵编码以及它们的逆过程 代码整洁 注释详细

2020-01-09

数字图像处理小抄 半开卷考试资料 中山大学 研究生 本科生

数字图像处理课程的知识点,小抄,半开卷考试让带的资料,大小为一张A4纸大小 包含.pdf格式和.pptx格式,用ppt做的

2020-01-09

LaTeX IEEE模板

IEEE会议必须使用的LaTeX模板,官方网站2019年10月份最新版。 由于在一般情况下无法下载,所以在此附上下载资源

2019-11-22

系统级编程所有课件打包集合

这是四川大学软件学院系统级编程课程的所有课件,完整版,1到16周

2018-01-26

网络数据挖掘课本中文版和英文版

网络数据挖掘课程教材,中文版完整,英文版完整,打包下载,阮树骅老师,大数据入门教材

2018-01-26

网络数据挖掘课件

网络数据挖掘的课程课件,1到10,少了个9,全英文,阮树骅老师

2018-01-26

计网选择题一到五章集合

计网选择题,所有选择题答案,期末复习,平时作业自检等。

2018-01-26

计算机网络2013-2016年历届考题

计算机网络历年考题,包括2013-2016年度的期末试题,没有答案

2018-01-26

四川大学计算机网络课件一到五章集合

计算机网络一学期课程所有课件打包下载,林峰老师课件

2018-01-26

project2013模板包(一共11个 )

这是project常用模板的集合,包括企业信息化项目群,视频保安系统项目,项目变更案例(变更后),项目变更案例(变更前),项目计划变更记录,项目群案例,优化类项目计划模板,邮件系统合并项目,全是.mpp格式的文件,适合Microsoft project 2013及以上版本使用

2018-01-26

二进制炸弹代码及gdb调试工具

这是二进制炸弹博客的文章所需内容,里面包括bomb.exe,可直接打开运行,并且带有GDB工具和objdump工具,还有它们的文档。 改成0积分下载

2017-10-30

C语言中级课件

数据类型 内存 输入输出 数组 指针 函数 预处理 位操作 以及相关习题

2017-02-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除