自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

海牛大数据的博客

分享海量大数据技术教程及资料

  • 博客(20)
  • 收藏
  • 关注

转载 技术牛逼也要懂点社交:数据科学家公司生存指南 TOP30 秘诀

(原文转自海牛大数据社区:阅读原文)如需转载  |  请注明出处数据科学家老司机的30个经验之谈,教你如何在公司内获得认同,带你绕过他们曾经踩过的坑。作为一名数据科学家,即便你技术再牛逼,不懂职场社交也会成为你晋升之路上的天花板。为此,我们创建了一份能够确保数据科学团队获得成功的秘诀top 30榜单。不管你的数据科学团队是新组建的,还是经验丰富的,这份榜单都

2018-02-02 14:42:54 384

转载 程序员需要关注的十个大数据技术

大数据已然成为当今最热门的技术之一,正呈爆炸式增长。每天来自全球的新项目如雨后春笋般涌现。幸运地是,开源让越来越多的项目可以直接采用大数据技术,下面就来盘点最受欢迎的十大开源的大数据技术。1. Hadoop ——高效、可靠、可伸缩,能够为你的数据存储项目提供所需的YARN、HDFS和基础架构,并且运行主要的大数据服务和应用程序。2. Spark ——使用简单、支持所有重要的大数据语

2018-02-01 13:12:01 548

转载 教你如何用 Python 来实现一个大数据搜索引擎

搜索是大数据领域里常见的需求。Splunk和ELK分别是该领域在非开源和开源领域里的领导者。本文利用很少的Python代码实现了一个基本的数据搜索功能,试图让大家理解大数据搜索的基本原理。布隆过滤器 (Bloom Filter)第一步我们先要实现一个布隆过滤器。布隆过滤器是大数据领域的一个常见算法,它的目的是过滤掉那些不是目标的元素。也就是说如果一个要搜索的词并不存在与我的

2018-01-26 17:01:02 3265

转载 入行大数据你需要了解关于Hadoop与大数据的12个事实

事实1:Hadoop是由多个产品组成的。人们在谈论Hadoop的时候,常常把它当做单一产品来看待,但事实上它由多个不同的产品共同组成。Russom说:“Hadoop是一系列开源产品的组合,这些产品都是Apache软件基金会的项目。”一提到Hadoop,人们往往将其与MapReduce放在一起,但其实HDFS和MapReduce一样,也是H

2018-01-25 13:37:48 507

转载 搞懂大数据的这5个问题,可迅速入坑大数据!

随着大数据的火热,越来越多的小伙伴开始对大数据产生了兴趣。但是大数据到底是什么?总是让小伙伴们似懂非懂。我们为大家收集整理了五个常见的大数据问题,以帮助大数据相关行业入门的小伙伴迅速入坑。01什么是大数据?在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进

2018-01-24 11:42:57 2467

转载 不懂这25个术语,千万不要说自己是干大数据的!

大数据听起来总是很神秘、很高大上的感觉,让很多人望而却步。如果你掌握了基本理论,对大数据技术的专业术语有所了解的话,相信你会开始慢慢的爱上大数据。让我们一起来了解大数据的25个术语。01算法“算法”如何与大数据相关?即使算法是一个通用术语,但大数据分析使其在当代更受青睐和流行。02分析年末你可能会收到一份来自信用卡公司寄来的包

2018-01-22 15:56:47 1627

转载 Spark为什么能成为大数据分析主流工具?

一.Spark是什么Spark是伯克利大学2009年开始研发的一个项目,它是大数据时代下的一个快速处理数据分析工作的框架。spark发展十分迅速,2014年,Hadoop的四大商业机构均宣称全力支持Spark,今后将全面接收基于Spark编写的数据挖掘与分析算法,多家世界顶级的数据企业例如Google,Facebook等现已纷纷转向Spark框架。近两年,Spark在中国的发展达到了一个前所未有的

2018-01-19 15:43:45 1388

原创 怎么学习大数据,入门大数据要掌握哪些知识?

我在很多平台上都收到过“怎么学习大数据?学大数据要学编程吗?大数据都学什么知识” 等等类似的问题。而近期类似的问题越来越多,2018年将成为大数据人才集中产出的一年,我也应广大网友的要求写了此篇文章,希望可以帮助更多的大数据人。每个人都在说大数据,但是大数据到底是什么?很多人都没有搞清楚。所以大数据学习要学什么知识自然就不是非常清楚了。什么是大数据?其实从字面意义上讲,我们就可以进行简单的了解,大

2018-01-18 12:44:44 1118

转载 新手常见的17个Python运行错误

原文地址:点击阅读原文当初学 Python 时,想要弄懂 Python 的错误信息的含义可能有点复杂。这里列出了常见的的一些让你程序 crash 的运行时错误。1、忘记在 if , elif , else , for , while , class ,def 声明末尾添加 :(导致 “SyntaxError :invalid syntax”)该错误将发生在类

2018-01-08 12:34:50 387

原创 Hadoop 系列教程(三):zookeeper

原文地址:http://hainiubl.com/topics/81#reply371. 复制一个nn2虚拟机并设置好主机名,静态IP,HOST修改crt上的配置文件把当前连接名称改成好识别的,并把登录用户修改成hadoop,尽量少用root操作,这样以后登录都使用hadoop用户验证是否当前为root用户可以用vim打开某个文件查看比如/etc/hosts切换到r

2018-01-04 15:14:38 485

转载 海牛大数据教你Hadoop 如何批量操作多台服务器

原文地址:http://hainiubl.com/topics/80#reply421. 每个虚拟机设置静态IPcd /etc/sysconfig/network-scripts/ifconfig/ip add 查看网卡的硬件名称和基本信息记下这个UUID以下内容回帖刷新可见………………#网卡配置例子TYPE="Ethernet"

2018-01-03 14:32:52 1511 1

转载 海牛 Hadoop 系列教程(一):服务器基础环境

原文:点击打开链接虚拟机linux使用的是centos7操作系统1. 安装sz rz工具,用于以后用rz sz上传下载文件yum install -y lrzsz2. 将原来的yum源配置进行备份mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base_repo_bak以下内容回帖刷新可见………………3. 用rz命令将Cen

2018-01-02 14:54:50 790

原创 大数据到底是干什么的?

大数据这个词已经被炒的满天飞,还有的人说它是泡沫,现在什么东西即使没用大数据技术也要加个大数据概念,要不都觉得落伍了,当然这是迎合宣传的手段,不过搞虚假宣传还是不太好的。那真正使用大数据技术的地方且比较有代表性的产品有那些:云存储:中国比较好的有百度云,国外比较好的有AWS等。正是因为有这些产品的出现,数据在云端的概念才终于变成现实了,大家都不用踹着U盘到处跑了。内容推荐:最具代表性的有今

2017-10-30 19:06:03 2938

原创 开启快乐的程序员之旅

1024程序员节,海牛学院大数据四期班如期而至---让今天打造成为你的专属疯狂之日吧!开班典礼由可亲可敬的杨老师主持,首先向改变世界的程序员致敬,和学员探讨如何正确看待程序员的岗位,自己即将以怎样的方式开启程序员之路呢?杨老师先是带我们一起斗斗图,这些图也是经常被猿们玩儿坏了的,但背后的寓意您能读的懂吗?我们是一群爱学习的猿,IT领域技术更新迭代非常快,只有不断的学习,才能让自己处于不

2017-10-25 11:53:28 1237

原创 大数据就在我们的日常生活中

“大数据”就在我们的日常生活中 我只是一个普通的大数据工作者,对于我而言大数据这个词用表面上的意思来理解,就是非常庞大的数据,只有TB、PB以上的数据才可以称之为大数据。  像今日头条、摩拜单车、花呗、借呗、金融领域、甚至于社交软件中的广告,都是利用大数据来分析预测的,所以大数据不只时存在于大公司,我们生活中也可以接触的到。 下面这些人相信大家不会陌生吧? 一部分是

2017-10-21 17:25:04 3453

原创 2017不一样的大数据

最近几年,大数据这个词忽然变得很火,不只归入阿里巴巴、谷歌等互联网公司的战略规划中,在我国国务院和其他国度的政府报告中屡次提及大数据,大数据无疑成为当今互联网世界中的新宠儿。 “马云的无人超市”,“看李彦宏如何谈AI”等新闻热点,都展现出了人工智能的快速开展,人工智能突飞猛进的停顿是这些年来大数据开展的结果。 那么大数据就业前景怎样样呢?大数据就业前景《大数据人才报告》指出,目前全国的

2017-10-20 19:17:20 507

原创 金山大数据技术总监教您如何零基础学习大数据

日复一日年复一年,当今社会大数据这个词被炒的满天飞,我们迎来了新的大数据时代。随着大数据时代的浪潮拍打,很多零基础学生也开始咨询大数据今天,海牛学院(金山大数据技术总监)教您如何零基础学习大数据。大数据学习路线如下:  大数据学习的第一步,需要学习java第一步完成后我们就需要学习大数据的专业知识了如图所示以上就是海牛学院大数据讲师给零基础学员的大数

2017-10-17 14:05:10 782

转载 那些牛人的结构化思维是如何炼成的?

本文为转载文章,如果有什么不妥请联系我们删除。作者:孙圈圈 来自:公众号圈外(iquanwai)01 结构化思维比你想象得重要一万倍#下图有15个数字,我需要你在3秒钟内看完并记住它们,试试?是不是觉得有点费力?那么,如果我换一下,让你记下面这15个数字,试试?是不是觉得So easy?其实这两组数字是一样的,只是第二组数字的结构更加有规律。为什么你很难

2017-10-16 18:17:28 4412

原创 从小白到大数据技术专家的学习历程

那大数据处置技术怎样学习呢?首先我们要学习Java言语和Linux操作系统,这两个是学习大数据的基础,学习的顺序不分前后。#Java:大家都知道Java的方向有JavaSE、JavaEE、JavaME,学习大数据要学习那个方向呢?只需求学习Java的标准版JavaSE就可以了,像Servlet、JSP、Tomcat、Struts、Spring、Hibernate,Mybatis都是Ja

2017-10-16 18:05:06 1492

原创 那些牛人的结构化思维是如何炼成的?

01 结构化思维比你想象得重要一万倍#下图有15个数字,我需要你在3秒钟内看完并记住它们,试试? 是不是觉得有点费力?那么,如果我换一下,让你记下面这15个数字,试试? 是不是觉得So easy?其实这两组数字是一样的,只是第二组数字的结构更加有规律。为什么你很难记住第一组却能够轻松记住第二组呢?因为它更符合我们大脑的使用习惯。人类大脑在处理信息的时候,有两个规律:第一,不能一次太多,...

2017-10-13 15:42:14 370

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除