自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据创新开发者、大数据技术开发、创新性大数据分享

分享大数据技术、为科技、数据技术风险一份力量

  • 博客(29)
  • 资源 (11)
  • 问答 (1)
  • 收藏
  • 关注

原创 数据仓库-数据模型建设方法总结(全)

数据建模、数据仓库

2023-01-29 14:58:40 4147

原创 java jvm gc 回收机制和原理

java;jvm;gc;垃圾回收

2022-02-11 15:21:53 2295

原创 spark参数调优

spark调优、大数据调优、spark优化

2022-02-09 17:24:52 689

原创 airflow安装部署(python)

在线安装Airflow组件版本:Python 3.7.2Apache airflow 1.10.1Mysql 5.7.24CentOs7.8Python安装Centos7中,Python默认是安装的,输入python 直接可以查看版本号,入下图注意: 如果本机安装了python2,尽量不要管它,使用python3运行python脚本就好,因为可能有程序依赖目前的python2环境,比如yum!不要动现有的python2环境!安装python3依赖命令:.

2020-05-24 21:48:43 3821 1

原创 Elasticsearch等同八大全能型的数据产品对比

Elasticseach从做搜索引擎开始,到现在主攻大数据分析领域,逐步进化成了一个全能型的数据产品,在Elasticsearch诸多优秀的功能中,与很多数据产品有越来越多的交叉竞争,有的功能很有特色,有的功能只是附带,了解这些产品特点有助于更好的应用于业务需求。1、LuceneLucene是一个搜索的核心库,Elastic也是在Lucene基础之上构建,它们之间的竞争关系是由Luce...

2020-05-08 09:47:08 4687 2

原创 谈flink实时流处理

背景:数据量激增传统的时代,不同的业务场景都有大量的业务数据产生,对于这些不断产生的数据应该如何进行有效地处理,成为当下大多数公司所面临的问题。但随着数据的不断增长,新技术的不断发展,人们逐渐意识到对实时数据处理的重要性,企业需要能够同时支持高吞吐、低延迟、高性能的流处理技术来处理日益增长的数据。相对于传统的数据处理模式,流式数据处理则有着更高的处理效率和成本控制。Apache F...

2020-04-23 09:48:00 1451

原创 大数据架构体系(数据仓库)

1、传统大数据架构 优点 缺点 使用场景 简单,易懂,对于BI系统来说,基本思想没有发生变化,变化的仅仅是技术选型,用大数据架构替换掉BI的组件 1、没有BI下如此完备的Cube架构,虽然目前有kylin,但是kylin的局限性非常明显,远远没有BI下的Cube的灵活度和稳定度,因此对业务支撑的灵活...

2020-03-20 16:07:11 2305

原创 有效管理项目团队

1.了解团队对自己的项目团队有充分的了解,这是服务团队的前提。2.善于倾听对于项目经理来说,善于倾听是最明智的做法。项目经理作为管理者要经常认真倾听团队成员的意见、想法,并善于正面引导。引导团队这或许就是通常大家说的「管理团队」,不过两者还是有所区别的。「引导团队」是为了防止团队走错方向,「管理团队」是强迫团队一定要走在正确的道路上。前者有自我成长属性,团队的成长伴...

2020-03-16 10:41:35 230

原创 项目团队绩效

从企业、组织的角度来看,团队绩效是以团队的项目绩效作为基础。从项目立项开始如何预评估,在面对项目过程中各种情况是否需要奖惩,以及在结项时的最终评价,都需要针对不同行业、不同企业文化进行客制化分析。实施绩效考核包括三个层面的含义:1、绩效考核是从企业经营目标出发对员工工作进行考评,并使考评以及考评之后的人力资源待遇管理,推动企业经营目标的实现;2、绩效考核是人力资源管理系统的组成部分...

2020-03-13 09:26:48 357

原创 规划项目成本

对于一个项目来说,能否做好成本管控也是判断项目成功与否的一个重要标准。想要在批准的预算内完成项目,需要对成本进行规划,同时做好估算、预算、融资、筹资、管理和控制的各个过程,从而确保项目在批准的预算内完工。简单的概括这个过程,就是规划成本、估算成本、制定预算和控制成本。首先,我们先要了解成本的范围。成本的范围其实就是我们项目的范围,也包含了整个项目需要完成的所有活动和动作,那 WBS...

2020-03-12 10:42:09 299

原创 项目启动会

1、项目启动会项目启动会是一个非常重要的里程碑事件、意味着我们完成了对项目可行性研究和分析。同时获得组织授权进入规划阶段,并且会逐步增加相关资源推动项目实施。...

2020-03-12 10:32:21 3952

原创 javaAPI-Hbase异步之批量高效写入数据

package cn.ngsoc.hbase.util; import org.apache.commons.lang.StringUtils;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.*;import org.apache.hadoop.hbase.client.*;impor...

2018-07-26 15:56:46 6723

原创 linux查看系统信息命令

系统# uname -a # 查看内核/操作系统/CPU信息# head -n 1 /etc/issue # 查看操作系统版本# cat /proc/cpuinfo # 查看CPU信息# hostname # 查看计算机名# lspci -tv # 列出所有PCI设备# lsusb -tv ...

2018-07-09 14:17:24 206

转载 Spring框架 之 Spring AOP理论基础

一、Spring AOP是什么?    AOP(Aspect-Oriented Programming),被译为“面向切面编程”,是通过预编译的方式或运行时动态代理方法(详见:《Spring框架 之 代理模式》)实现业务中的扩展功能。AOP与OOP两种编程思想共同帮助开发者管理对象之间的数据结构(详见:《Spring框架 之 Spring理论基础》),因此常有人说AOP是OOP思想的一种扩充。  ...

2018-02-26 10:21:05 162

原创 基于ambari搭建hadoop生态圈大数据组件

Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop和Hcatalog等。

2018-01-22 14:18:42 14014 2

原创 windows环境下java开发连接linux环境的hbase数据获取CURD

单节点集群测试初始化连接/** * * 操作hbase数据库简单查询例子 * Created by wan on 17-11-7. */public class HbaseTest {public static Configuration conf;     static {     conf = HBaseConfiguration.c

2017-11-07 12:30:18 894

原创 mule使用案例企业服务总线ESB案例activeMQ转换成xml

企业服务总线mule,esb简单例子介绍,学习过程分享。网上例子介绍,建议可以先看看官方文档。

2017-11-01 11:40:41 1138 1

原创 filebeat接入数据kafka

官方最新下载filebeat  https://www.elastic.co/products/beatstar -zxvf  filebeat-5.5.2-linux-x86_64.tar.gzcd  filebeat-5.5.2-linux-x86_64filebeat主要是对配置文件filebeat.yml  进行修改#==============

2017-09-06 17:14:02 1458

原创 spark-1.2.0 集群环境搭建(完整一套)

spark-1.2.0 集群环境搭建(sprak集群依赖hadoop至上,用的是分布式APACHE系统HDFS)(此处搭建承接文档hadoop搭建,服务地址一样需要修改配置,下面附链接)一、安装jdk(1.7)------查看hadoop环境配置文件里面的jdk配置(一样)二、ssh免验证---------查看hadoop环境配置文件里面的ssh免验证(一样)

2017-08-20 10:26:50 435

原创 elasticsearch集群快速上手搭建

集群搭建ElasticSearch的集群我还是以elasticsearch-2.3.1版本为例。在开始集群搭建之前,我先给大家一点建议,在看elasticsearch-2.3.1的配置文件之前,先看elasticsearch低版本的配置文件,例如:1.6,因为低版本的配置文件的英文解释比较多,而且比较透彻,学习更加简单。下面我们来搭建一个简单的集群。下载es 链接(http://d

2017-08-19 16:20:33 281

原创 kafka集群搭建和参数详细解析

kafka集群搭建,配置参数详细,快速完成,并且附带检测

2017-08-19 11:58:25 626

原创 hive、mysql搭建(简洁明了5分钟完全搞定)

五、hive的安装(不同版本的hadoop尽量找相对应hive版本)1、下载hive安装包---apache-hive-1.1.1-bin.tar2、解压安装到opt下面  tar -zxvf apache-hive-1.1.1-bin.tar -C ~/opt/3、配置环境变量sudo gedit /etc/profile在下面增加export

2017-08-19 08:36:06 2074

原创 hadoop2.6.0搭建(简洁明了10分钟完全搞定)

hadoop2.6环境搭建1,准备环境:虚拟机hadoop01,修改ip地址master (192.168.111.10)slaves1(192.168.111.11)  slave2192.168.111.12) 2,修改主机名字sudo gedit /etc/hostname(三个主机都要该)一、安装jdk(1.7)   注意:jdk版本必须要和系统

2017-08-06 10:15:12 1372 1

原创 Linux查看物理CPU个数、核数、逻辑CPU个数

# 总核数 = 物理CPU个数 X 每颗物理CPU的核数  # 总逻辑CPU数 = 物理CPU个数 X 每颗物理CPU的核数 X 超线程数  # 查看物理CPU个数 cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l  # 查看每个物理CPU中core的个数(即核数) cat /proc/cpuinfo|

2017-08-06 09:53:49 349

原创 Spark调优 Spark Jobs 性能调优

调试资源分配Spark 的用户邮件邮件列表中经常会出现 “我有一个500个节点的集群,为什么但是我的应用一次只有两个 task 在执行”,鉴于 Spark 控制资源使用的参数的数量,这些问题不应该出现。但是在本章中,你将学会压榨出你集群的每一分资源。推荐的配置将根据不同的集群管理系统( YARN、Mesos、Spark Standalone)而有所不同,我们将主要集中在 YARN 上,

2017-08-04 14:22:51 458

原创 Spark On YARN部署模式下的内存分配情况

本文主要了解Spark On YARN部署模式下的内存分配情况,因为没有深入研究Spark的源代码,所以只能根据日志去看相关的源代码,从而了解“为什么会这样,为什么会那样”。说明按照Spark应用程序中的driver分布方式不同,Spark on YARN有两种模式: yarn-client模式、yarn-cluster模式。当在YARN上运行Spark作业,每个Spark

2017-08-02 11:30:13 868

原创 winlogbeat监听windows日志到kafka、hdfs,不同层级取数据

winlogbeat监听windows日志到kafka,查询kafka里面的topic数据,以及从kafka中接入数据到hdfs、logstash不同层级取数据,过滤message.

2017-07-10 16:51:05 7159 1

原创 logstash使用webhdfs插件指定输出字段存储数据到hdfs时间分层(还能保留原来数据)

基于项目新搭建环境-->部分工具版本hadoop 2.6.5 ;hive-1.2.1logstash 2.4.0; impala-2.8; elasticsesarch-5.4.1; spark-2.1.1; scala 2.12.2jdk1.8;kafka 2.10;redis-3.0.7;zookeeper-3.4正文:一个简单需求,就是通过

2017-07-07 09:57:02 2076

原创 logstash传输自定义字段数据到hdfs进行分年月日分区,并且hive可以通过hiveQL快速查询数据

logstash传输自定义字段数据到hdfs进行分年月日分区,并且hive可以通过hiveQL快速查询数据,附带代码

2017-07-06 16:27:26 3238 1

Python毕业生信息审核系统

Python毕业生信息审核系统源码

2023-01-30

火车票分析助手工具(可查询火车票)

火车票抢购工具、查询火车票,分析火车票

2023-01-30

Word助手工具(python3)

(Python3项目开发)Word助手(源码和可执行文件)、办公文件助手工具

2023-01-30

Excel数据分析师工具

(Python3项目开发)Excel数据分析师(源码和可执行文件)、程序助力Excel分析,快速分析

2023-01-30

AI智能联系人管理代码

(Python3项目开发)AI智能联系人管理(源码和可执行文件)、通过AI快速管理联系人和查找

2023-01-30

解析sql对应中目标表对应的引用表(python)

解析sql对应中目标表对应的引用表(python)、解析sql、解析sql中依赖表、数据血缘追踪、数据血缘开发、sql依赖表分析

2023-01-29

查到文件内容中关键字工具(兼容多级多文件夹多文件)

python工具查找文件所属关键字所在的文件信息、查找文件内容、查找文件、查到工具、多级查找

2023-01-29

解析sql目标表工具(python)

解析sql工具、获取select等ddl语句执行的目标表、精准继续sql代码、识别sql对应的依赖表和目标表

2023-01-29

Java面试题、Java技术、程序员面试、Java

Java面试题、Java技术、程序员面试、Java、java内存分析面试题

2023-01-17

python3.7、python、脚本开发、windows开发、python安装工具

python3.7、windows安装程序、exe执行程序、python、脚本开发、爬虫开发

2023-01-17

java、jdklinux版本、jdk,linux、jdk64位、jdk1.8

java、jdklinux版本、jdk,linux1.8、jdk64位、java开发,后端开发、

2023-01-17

jdk1.8工具、windows的jdk版本、java开发工具、jre、jdk

jdk1.8工具、windows的jdk版本、java开发工具、jre、jdk、java开发、后端开发、jdk工具、jre工具、j2ee、java

2023-01-17

dolphinscheduler、调度平台工具、监控工具、大数据监控、数据调度、小海豚、开源调度平台、页面化调度工具

大数据平台调度工具、大数据、小海豚、海豚、dolphinscheduler、ds、大数据开源工具、调度平台、调度工具、大数据监控、流程化、工作流、hadoop、spark、数据采集、数据监控

2023-01-17

CDH6安装包、大数据平台管理工具、大数据、hadoop、CDH6.2

CDH6全套资源安装包、CDH6、大数据平台、hadoop、spark、kafka、大数据技术、数据仓库、hive、hdfs、大数据技术架构、数据平台管理、开源大数据平台、大数据安装包、CDH安装教程

2023-01-17

python基于spark开发插件库、用于离线安装,在线安装都行

基于python的spark核心插件库、因在线下载较慢、所以建议离线安装、pyspark、包含sparkcore sparkstream、机器学习,算法分析等核心技术

2020-05-27

scala-2.11

scala-2.11 支持spark安装,稳定

2017-08-20

elasticsearch-2.3.1.tar.gz

elasticsearch-2.3.1.tar.gz linux版本可用稳定版

2017-08-19

kafka_2.10-0.10.2.0.tgz

kafka_2.10-0.10.2.0.tg安装包,搭建kafka集群

2017-08-19

zookeeper-3.4.6最稳定版本

zookeeper-3.4.6最稳定版本搭建kafka

2017-08-19

PDF转换word破解版

PDF转换word破解版

2017-08-18

mysql安装包liunx

mysql安装包liunx版本

2017-08-10

kafka jar 包

java连接kafka jar包,以及kafka安装jar包

2017-08-10

mysql-connector-java-5.1.15-bin.jar

mysql-connector 链接jar包

2017-08-06

java tomcat 8

java tomcat 8容器

2017-07-20

java jdbc连接hive所需要所有jar包,请测有效。

jdbc连接hive代码所需要jar包,测试有效

2017-07-18

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除