自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 阿里巴巴 数据分析师 2018.3笔试汇总

是的,我又去笔试了,虽然被完虐,但是起码可以知道自己想要从事这一行业,应该要学些什么了。首先,概率论的题占大部分。这部分比较考验人的数学功底,和逻辑能力。其次,就是是数据库了,一道简答题,问题是比较简单的SQL语句。最后就是数据敏感性了。这个比较抽象。话不多说,上真题。首先是选择题:1.每一下午7点钟在10min内打到车的概率是90%,问,一周内至少两天打不到车的概率。2.有20个同学参加面试,其...

2018-05-13 14:07:50 8829 7

原创 2018年4月16日微众银行 INT数据挖掘笔试

先上回忆版原题: 微众笔试1.用手机支付的人数量每天都在增加,把每天的数据综合起来,一年的数据组成一个向量{n1-n365},现在可以知道每天用手机支付的人的数量都比前一天多k,想要知道5.1和10.1的支付人数是否明显和其它时间有差异。2.中位数和均值的差异。中位数小于均值,等于均值,大于均值,分别是什么情况。3.闹市区的一家宠物销售店和学校内餐厅客户消费数据有什么相同点和不同点。说明理由。如果...

2018-04-17 10:21:23 2721 1

原创 2018年3月携程技术笔试 回忆版

应聘了携程的大数据分析师的暑假实习,幸运的进了笔试。看到笔试题目的时候就觉得携程可能与我无缘了。虽说现在R语言口碑很好,但是局限性还是有的,比如携程的在线编程就不能用R语言来做。PYTHON是可以用的,但是版本不是3.0的。java也是可以的,还可以用C语言。可见只掌握R语言还是不行哒,更加坚定了我再学一门编程的决心。python还是要好好学的,目前掌握的知识太少。建议大家去赛码网刷刷题,起码自己...

2018-04-03 12:44:56 1965 1

原创 机器学习实战 KNN算法 python3实现

1.原理概述 K-近邻算法(KNN)概述     最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有测试对象都会找到与之完全匹配的训练对象呢,其次就是存在一个测试对象同时与多个训练对象匹配,导致一个训练对象被分到了多个类的问题,基于这些问题呢,就产生了KNN。     KNN是通过测量不同特征值之间的距...

2018-03-25 17:04:28 1227

原创 机器学习实战 决策树 python3实现 R语言实现(2)

CART算法实现1.python3本文将构建两种树,一种回归树(regression tree),其每个节点包含单个值;第二种是模型树(model tree),其每个叶节点包含一个线性方程。createTree()伪代码:找到最佳的待切分特征:如果该节点不能再分,将该节点存为叶节点执行二元切分在右子树调用createTree()方法在左子树调用createTree()方法 from numpy i...

2018-03-25 16:57:50 538

原创 机器学习实战 决策树 python3实现 R语言实现(1)

二话不说,上代码:1.python3实现Python实现:ID3算法1.决策树构造:trees.pyfrom math import logimport operator#简单的鉴定函数def createDataSet():    dataSet = [[1, 1, 'yes'],               [1, 1, 'yes'],               [1, 0, 'no'], ...

2018-03-25 16:49:38 718

原创 机器学习实战 SVM python3实现 R语言实现

我很少说原理,但是一些有趣的,可以帮助我们理解算法的小故事再喜欢不过了。这里引用了一个知乎的回答,太让人喜欢了。觉得把高深的东西讲的小孩子都懂得才是真正的大神。这里附上R语言的SVM代码,感兴趣的同学们可以看一下。(在最后面哦。)1.引例在学习SVM时在知乎上看到了一篇有趣的SVM介绍。下面我把它复制过来作为SVM算法的引入案例。作者:简之链接:https://www.zhihu.com/ques...

2018-03-25 16:42:44 1384

原创 机器学习实战 朴素贝叶斯分类器 python3实现

本文所有代码存储在bayes.py文件中,以便于代码测试和程序运行。from numpy import * def loadDataSet():    """功能:词表到向量的转换函数输出:1.进行此条切分后的文档集合。2.类别标签的集合,这些文本类别由人工标注,这些标注信息用于训练程序以便自动检测侮辱性留言。    """    postingList=[['my', 'dog', 'has',...

2018-03-25 16:31:22 1462

原创 机器学习实战 EM算法 python3实现

EM算法送上,网络上原理到处都是,一定写的比我好,大家可以来参考一下python3的代码,原理可以看看别的大神的。 1.算法原理EM 算法是 Dempster,Laind,Rubin 于 1977 年提出的求参数极大似然估计的一种方法,它可以从非完整数据集中对参数进行 MLE 估计,是一种非常简单实用的学习算法。这种方法可以广泛地应用于处理缺损数据,截尾数据,带有噪声等所谓的不完全数据。可以有一些...

2018-03-25 16:23:11 3851

原创 机器学习实战 AdaBoost算法 python3实现 R语言实现

机器学习实战里面对各种算法的解释都比较详尽,但是python的更新导致里面部分代码运行错误。在搜集了众多资料后发现并没有人跑来把机器学习实战这本书的python3写一下。可能大佬们觉得这小菜一碟,所以我在学习的时候把代码整理了一下放到这里希望可以帮助一些和我一样刚刚开始学习python,但是拿着一堆python2的代码无从下手的小码农们。本文原理部分来自网络。如有错误欢迎指正。其实AdaBoost...

2018-03-25 16:05:20 3697

原创 python第三方包pip安装方法

本人计算机小白一枚,发现网上pip算法安装的介绍都比较简略,安装的十分痛苦。所以想在这里整理一下,供大家参考。我的python安装在D:\python中。可根据自己python目录进行调整。红色字体为要输入的命令。1.   下载pip2.   网址:https://pypi.python.org/pypi/pip将匹配下载到Scripts中,解压,产生dist文件夹点进去,找到pip—9.0.1解

2018-01-19 14:27:23 1205

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除