自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 四个案例解析R剖面指数和期望值(牙膏的真假效用和产品的主要客户)

下面介绍四个案列,来讲解基本的统计学知识和剖面指数和期望值 第一个是分析男女对不同饮料的倾向 #设置工作路径setwd("D:\\数据分析\\R语言基础")Lst<-scan("drink.data",what=list("sex","type"))#table统计频数a<-table(Lst)margin.table(a,1)prop.table(a,1)...

2018-09-17 12:56:21 1321

原创 用scrapy框架抓取51job销售职位信息实战

scrapy实战之spider篇 在我看来,使用scrapy框架相较于直接用python爬虫库的优点有两个 第一是scrapy更加有效率,而爬虫自然最注重的是效率 第二是scrapy将爬虫的过程分成模块化,使爬虫抓取过程更加清晰 scrapy主要有三个模块spider,pipeline,items.其中items代表的是容器(储存所需要爬取的数据), spider代表的是爬虫模块(将爬取...

2018-08-21 22:46:24 737

原创 BugkuCTF-Web 前八题

web2打开题目发现全是越来越快的滑稽笑脸,并没有很明显的提示,所以打开F12看源码,用快捷键ctrl+F来搜索Flag,在源码中轻松找到Flag:计算器打开题目发现要求求两个二位数之和且和必然为三位数,但结果输出框只能输出一位数字,这意味html源码中input的maxlen限制成了一位,将一位改为三位再输出正确答案即可获得Flag。web基础$_GET考察php语言的基础用法,get在url上面获得数据,较为不安全,这里的php代码要求我们输入what=flag的数据即可根据p..

2020-11-22 17:13:36 486

原创 Leetcode(3) 判断字符串是否有效 及栈结构复习

在考虑这个问题前,我们首先复习数据结构中的栈,因为编译器中括号匹配就是通过栈来实现的:栈:栈:是一种先进后出的数据结构;其本质也就有特殊限制的链表(先进后出,栈顶),提起栈我们首先会想到什么呢?当然是进栈(push)和出栈(pop),下面我们通过代码来实现进栈和出栈过程:我们要重视栈顶这个部分:栈顶(top),我们要保证栈顶只有一个节点,并且链接到下面的节点,具体的实现方式是,构建一个新节点...

2019-12-10 22:12:44 272

原创 链表两数相和 (2)--Leetcode

题目描述:给出两个 非空 的链表用来表示两个非负的整数。其中,它们各自的位数是按照 逆序 的方式存储的,并且它们的每个节点只能存储 一位 数字。如果,我们将这两个数相加起来,则会返回一个新的链表来表示它们的和。您可以假设除了数字 0 之外,这两个数都不会以 0 开头。转自:力扣(LeetCode)题目分析:根据题目,我们要复习关于链表的基础知识,链表作为数据结构的基本非线性数据结构,...

2019-11-28 20:49:21 299

原创 leetcode 两数之和各种算法解析

问题描述:版本一:首先最常见也是最不可取的通过暴力for循环求解,得到的结果自然时间复杂度和空间度都高class Solution(object): def twoSum(self, nums, target): for i in range(len(nums)): for j in range(len(nums)): ...

2019-11-13 19:20:49 266

原创 leetcode 学习反思(1)

(1)Python 类引用自bloghttps://blog.csdn.net/hlang8160/article/details/79012259类定义类似于函数定义,不调用就作为一个域空间存在那里,只有调用才会使空间生效,类对象提供两种操作,属性引用和实例化。 属性引用使用标准句法:obj.name. 有效的属性名是类对象创建时类的名称空间内的所有名字。引用自简书:https:...

2019-11-11 18:41:01 106

原创 针对iris数据集 SVM 不同核函数的比较

思路为:利用不同的核函数来训练不同的分类器,再通过分类器的预测准确率和运行时间来比较分类器的优劣。需要用到的库为:numpy,pandas,matplotlib,time,sklearn.svm实现代码用的:jupyter需要记住的函数为:1.pd.Categorical().codes将文本数据转化为易分析的数字。2.train_test_split(random_state,trai...

2019-01-13 19:45:06 2837 1

原创 C语言实现栈的中缀表达式转化为后缀表达式,并且计算后缀表达式

因为数据结构老师布置了栈的后缀表达式实验,经过思考,有以下反思。中缀表达式转换为后缀表达式关于括号,直接将括号里面的符号加入后缀表达式。关于数字,直接推入后缀表达式遇到±符号,如果栈为空或者栈顶为“(”,直接将符号推入栈,如果栈不为空,且栈顶不为“(”,则推出栈顶符号。再将±符号推入符号栈。如果遇到“/”符号,如果如果栈为空或者栈顶为“(”,直接推入栈,如果栈不为空,且栈顶符号优先级大...

2018-11-07 19:37:59 14078 5

原创 心路历程

大一刚接触IT时,总羡慕那些开发人员能够用着一个个听不懂的专业词汇,创造着一个个智能化,自动化的工程。接触数据库时,总想着数据库是多么复杂的互联网产物,而实际上它仅仅是一个二维表罢了。接触虚拟机,Linux时,觉得自己就能一跃成技术大牛,实际上就现在的水平,虚拟机,Linux只能供自己吹牛而已。现在想来,开发人员也只是应用数学知识去解决工程,模糊的IT工程变得清晰,它就是用利用电脑的运算速度和工程...

2018-10-17 15:38:21 211

原创 R聚类分析航空公司数据(筛选出不同的客户类别)

通过k-means算法分析出不同的客户类群,并且分析出特征属性,从而针对不同客户类群进行个性化营销和服务,增加服务营收和服务质量

2018-10-04 21:26:06 2982

原创 机器学习浅思

什么是机器学习呢?在我初次接触的机器学习的时候,我的想法便是机器学习一定是很高大上,很难的技术。但实际是任何高深的技术都是人类从小的方面思考过来的,都暗含着人类的经验和思考。机器学习也这样,我们可以把这个过程想象成幼儿成长的过程。机器学习的数据就是孩童成长的经验,所谓的算法是我们培养孩子的方法。所谓机器学习就是培养一个孩子,我们孩子最后的优秀程度,取决于我们给予它的经验(数据)和培养它的方法(...

2018-09-23 10:17:04 237 3

原创 R语言探索性分析及plyr数据转换包

R包dplyr可用于处理R内部或者外部的结构化数据,相较于plyr包,dplyr专注接受dataframe对象, 大幅提高了速度,并且提供了更稳健的数据库接口。 下面针对一些具体的例子介绍探索性分析和plyr数据转换包 统计diamonds(R语言自带的数据集)在不同克拉的数量#%>%管道运算符,用于传递数据集diamonds %>% count(cut_width(...

2018-09-15 22:40:07 645

原创 R作图之ggplot2包

ggplot2使用的基本框架 下面逐一介绍 1.data data是我们需要可视化的数据,在学习中,我们经常使用R语言自带的diamonds和flights数据源。在data框的范围我们也可以使用mapping(映射),在data框范围使用的属性在后面镶嵌的图层中为默认属性。exampleggplot(data=mpg,mapping=aes(y=hwy,x=class))+ ...

2018-09-14 09:27:36 1839

原创 计算思维,工程思维,数学思维的思考

在计算机基础课上,老师跟我们讲了关于数学思维,计算思维,逻辑思维的区别和联系。老师说在古希腊时代就有数学存在,可见数学思维是人类与生俱来的天赋和思维,也是人类成为万物之灵的根基,在现实生活中可以随时随地的见到这种思维,数学思维体现在我们对一件事物的权衡,能轻松解决鸡兔同笼的问题,能够在任何情况下都能准确说出1+1=2就是数学思维培养的结果关于工程思维,工程思维体现的是一种实践思想,例如基础学科...

2018-09-12 20:49:52 5575

原创 R语言构造扑克牌自动发牌,洗牌

在R语言构建自动洗牌,发牌 要求:自动洗牌、发牌 任务一:创建一副牌。学会如何使用R的数据类型和数据结构。 任务二:编写发牌和洗牌的函数。学习从一个数据集中抽取想要的数值。 首先需要创建一副牌(不包括大小王),从R语言的数据对象来看,数据框最合适。 因为花色是字符串,而点数是数字,所以能够承担数据类型不同的二维数据对象——数据框最合适。下面是创建pkp数据对象的代码pkp<-d...

2018-09-06 21:42:51 4720 6

原创 R语言分析骰子

在我认知的统计学中,任何自然事物在大量的数据统计分析中都会显示一定的规律。下面用R语言随机投掷骰子,并重复很多次,分析骰子在大量数据下分布的规律 先从投一个骰子开始,重复骰子10次,观察点数分布,y坐标是表示骰子点数的频数,x坐标表示骰子的点数 从图中观察,频数分布不均匀,差距较大,貌似是每个骰子的点数机率不是均等的,那如果再加大重复次数呢? 重复骰子100次 图像的频数是不是接近...

2018-09-05 23:37:06 8239 2

原创 R的数据对象的初步概括

在R中,最基础的两个概念是对象和函数 下面介绍R中的数据对象 R的数据对象可以初步划分为数据类型相同的:如向量,因子factors,矩阵matrix,数组array 和数据类型不同的:如列表list和数据框DataFrame 通过Is(),objects()可以查看对象。 通过rm()可以移除对象。 对于向量,向量化是R相较于其他语言最优势莫过于它的向量化,向量化也是R中最有效率的。 ...

2018-09-03 21:45:30 1386

原创 python词云分析top100电影的演员分布

做出的词云图如下 在应用python词云前,需要一些必要的准备工作 第一,我们需要知道python词云是什么? python词云是用字体的大小展示数据应用次数多少的工具,字体越大,代表着数据应用次数越多,反之亦然。 下面图片大家感受一下 在数据分析中,我们常用词云来分析群众对一个事物的印象 比如第一张图片中,对西安的印象第一眼最明显的就是西安和兵马俑,用词云将数据可视化能够使数...

2018-08-31 17:30:01 2105 1

原创 用scrapy框架抓取51job销售职位信息实战之pipelines篇

上面介绍的spider篇主要为网页的抓取和数据在容器的储存 接下来介绍管道篇,涉及数据的初步处理,如去重,清洗和把数据存入mysql数据库 首先思考要导入的模块 将数据存入mysql需要pymysql模块,pymysql模块是用python操作数据库的模块 在去重的时候可能需要DropItem模块,在数据重复的时候直接抛异常 再要思考数据处理的顺序 是先去重还是先清洗?根据逻辑判断去重...

2018-08-26 20:57:20 338

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除