自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 oracle连接方式

sys/aibo是用户名密码,test是TNS服务名,TNS代表透明网络底层(Transparent Network Substrate),这是Oracle客户端处理远程连接的“基础”软件,有了它才有可能建立对等通信。Oracle客户端软件可以从tns连接串TEST得到有用的信息,也就是主机名,主机监听的端口号,主机所连接的数据库服务名,服务名表示具有公共属性、服务级阈值和优先级的应用组。SQL*Plus是Oracle的客户端工具,既可以建立位于数据库服务器上的数据连接,也可以建立位于网络中的数据连接。

2023-03-06 22:51:52 4875

原创 MapReduce详细工作流程

10、Yarn会启动相应数量的reducetask,到map端拉取数据,reduce会发送拉取线程,到map端拉取数据,拉到的数据会先加载到内存,如果内存不够,则写到磁盘,等所有数据拉取完之后,再进行归并排序。12、归并后的文件会进行分组操作,然后数据以组为单位发送至reduce方法,reduce方法做逻辑判断后,调用outputformat,recordwrite方法将数据以kv形式写到HDFS上。8、产生大量溢写文件,溢写文件达到10个,再次调用merge方法,使用归并排序,形成一个大文件;...

2022-08-01 23:27:41 1707

原创 oracle几个概念:数据库、实例、用户、schema

Oracle数据库中不能新创建一个schema,要想创建一个schema,只能通过创建一个用户的方法解决,在创建一个用户的同时为这个用户创建一个与用户名同名的schem并作为该用户的缺省shcema。就算没有磁盘存储,数据库实例也能存在。Oracle当中,如果想访问某个服务器,必须要设置TNS,配置客户端到服务器端的连接服务,包括客户端要连接到的服务器和数据库的配置信息。我们访问Oracle都是访问一个实例,但这个实例如果关联了数据库文件,就是可以访问的,如果没有,就会得到实例不可用的错误。...

2022-07-31 19:35:10 4279

原创 SQL优化技巧

理论上,它会考虑所有可行的执行计划,实际上,除了简单的SQL语句之外,优化器为了保持合理的优化时间,不会考虑太多种组合。hint必须紧随delete、insert、merge、select和update关键字,注释分隔符的第一个字符必须是加号。除非改变执行环境,使用hint你将告诉查询优化器,针对某跳特定SQL语句应该考虑哪些操作或者不应该考虑哪些操作。一般而言,hint的语法错误不会引发报错,如果解析器无法解析它们,就会把它们当做注释。hint是添加到SQL语句中的指令,用来影响查询优化器的判定。...

2022-07-19 23:17:44 443

原创 oracle递归查询用法:start with ...connect by piror

connectbypriorid=parent_id采用自上而下的搜索方式,先找父节点再找叶子节点,查找第二层数据的时候,用第一层数据的id去跟表里记录的parentid字段进行匹配;connectbyid=priorparent_id采用自下而上的搜索方式,先找叶子节点再找父节点,查找第二层数据的时候,用第一层数据的parentid去跟表里记录的id字段进行匹配。level关键字伪列,表示树的层次,第一层是1,第二层是2,以此类推。where对所有返回的记录进行过滤;...

2022-07-18 23:30:29 681

原创 执行计划详解

执行计划描述数据库引擎执行SQL语句时实时的操作。执行计划是一棵树,用来描述SQL引擎执行操作的顺序以及各个操作之间的关系。树中的每个节点是一个行源操作,例如:表扫描、联接或排序。在各操作节点之间,存在这父子关系:1、一个父操作拥有一个或多个子操作;2、一个子操作只有一个父操作;3、唯一没有父操作的操作是树的根操作(顶层操作)。4、子操作跟随着它们的父操作,在右侧缩进排列,同一个父操作下的所有子操作都拥有相同的缩进。5、父操作在子操作之前出现(父操作的ID比子操作的ID要小)。了解父子关系对于理解

2022-07-07 21:59:35 803

原创 oracle表分区

采用“分而治之”的方法,可以将一个表或索引物理地分解为多个更小、更易管理的部分,适用于非常大的表和索引。分区的好处:1、提高数据的可用性;可用性的提高来源于每个分区的独立性,表中的一个分区的可用性不会影响表本身的可用性。如果表是分区的,那么查询优化器就会意识到这点,并且在执行计划中去除不需要的分区。分区从两个方面提高了可用性:① 优化器可以跳过对某些分区的访问;② 出现错误时的停机时间会减少,因为恢复所需的工作量会大幅减少。2、将大段数分解为小段,从而减轻管理的负担;与在一个大对象上执行操作相

2022-07-05 22:52:36 342

原创 shell编程实例练习

通俗理解,shell就是一个命令行解释器,shell脚本就是由shell命令组成的文件,脚本不用编译就可以执行。 #!/bin/bash --在脚本文件中指定脚本解释器

2022-05-10 23:31:26 480

原创 Hadoop简介

Hadoop组成:Hadoop1.x:HDFS(数据存储)、MapReduce(计算+资源调度)Hadoop2.x、Hadoop3.x:HDFS(数据存储)、MapReduce(计算)、Yarn(资源调度)HDFS:Hadoop Distribute File System1、NameNode:管理和存储所有真实数据的元数据(描述数据的数据),如文件名、文件目录结构、文件属性,以及每个文件的块列表和块所在的DataNode等2、DataNode:在本地文件系统存储文件块数据,以及块数据的校验和。

2022-02-27 23:25:55 1127

原创 Linux常用命令详解

Linux命令总共有下面几种:1、帮助命令man 命令help 命令常用快捷键:Ctrl + c 停止进程Ctrl + l 清屏2、文件目录类pwd --显示当前目录ls --列出目录的内容ls -a --(all)列出所有内容,包括隐藏文件ll 等价于 ls -l --(list)列表方式列出cd .. --往上一层cd ~ --当前用户的家目录cd / --根目录cd . --当前目录mkdir xxx --创建目录mkdir -p

2022-01-24 23:59:10 604

原创 一篇文章弄懂:缓慢变化维与拉链表

缓慢变化维SCD(Slowly Changing Dimensions),是指维度表数据不是静态不变的,而是随时间缓慢变化。缓慢变化维的几种解决方法:1、保留原始值:属性值不会发生变化,始终以原始数据为准;2、改写属性值:用新数据覆盖旧数据,只保留最新属性值。此方法易于处理,但无法分析历史数据变化;3、增加维度新行:数仓的目标之一就是保存历史数据,为达到这样的目的,既要保留历史记录,又要增加新的记录,此方法典型代表就是拉链表;4、增加维度新列:在表中增加一个新字段,用来保存变化后的当前值;5、使

2021-07-27 11:18:39 1812

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除