Peasmaster-CSDN博客

原创 IDEA打Jar包

要点：必须保证pom.xml文件有以下内容，否则jar不含包自有代码。 <build> <sourceDirectory>src/main/scala</sourceDirectory> <resources> <resource> <directory>src/main/resources</directory> <filtering>true

2022-05-14 23:07:04 518

概要Hadoop 分布式文件系统 (HDFS) 是一种分布式文件系统，旨在在商用硬件上运行。它与现有的分布式文件系统有很多相似之处。但是，与其他分布式文件系统的区别是显着的。HDFS 具有高度容错性，旨在部署在低成本硬件上。HDFS 提供对应用程序数据的高吞吐量访问，适用于具有大量数据集的应用程序。HDFS 放宽了一些 POSIX(可移植操作系统接口)标准的要求，以启用对文件系统数据的流式访问。HDFS 最初是作为 Apache Nutch （开源Java 实现的搜索引擎）网络搜索引擎项目的基础设施而构

2022-01-10 22:40:36 1389

原创 ClickHouse知识点

介绍ClickHouse是一个用于联机分析（OLAP)的列式数据库管理系统。来自不同列的值被单独存储，来自同一列的数据被存储在一起。特性真正的列式数据库管理系统数据压缩数据磁盘存储多核心并行处理多服务器分布式处理支持SQL向量引擎实时数据更新支持索引适合在线查询支持近似计算支持嵌套的数据结构支持数据复制和数据完整性支持角色权限控制缺陷不支持事务缺少高频修改删除操作，只能批量修改删除数据库引擎数据库引擎允许您使用表。默认情况下，ClickHouse采用At

2022-01-05 22:35:15 624

原创 InfluxDB知识点

介绍InfluxDB是InfluxData在2013年开源的时序数据库（TSDB），是为了存储物联网、DevOps运维这类场景下大量带有时间戳数据而设计的。InfluxDB采用Go语言编写，分为单机版和集群版，单机版免费。InfluxDB1.x采用类SQL的InfluxSQL语言操作数据，2.x采用FLux查询语言。常用场景是监控数据统计，如每秒记录电脑内存使用情况。它具有支持数据的采集、存储、监控和可视化的功能，还提供时间序列数据警报。InfluxDB 支持微秒和纳秒精度，使其成为科学和金融分析的理

2021-12-27 21:39:53 1766

原创 PostgreSQL知识点

简单介绍 PostgreSQL 是一个强大的开源对象关系数据库系统，它使用并扩展了 SQL 语言，并结合了许多安全存储和扩展最复杂数据工作负载的功能。PostgreSQL 的起源可以追溯到 1986 年，作为加州大学伯克利分校POSTGRES项目的一部分，在核心平台上已经有 30 多年的积极发展。 PostgreSQL 可以在所有主要操作系统上运行，自 2001 年以来一直符合 ACID，并且具有强大的附加组件。 PostgreSQL 具有高度的可扩展性。例如，您可以定义自己的数据类型，构建自定义函数

2021-12-26 16:18:14 579

原创 MongoDB知识点

概念MongoDB 是C++编写的NoSQL（非关系型数据库）、分布式文件存储的文档数据库。MongoDB 中的一条记录就是一个文档，它是一种由字段和值对组成的数据结构。MongoDB 文档类似于 JSON 对象。字段的值可能包括其他文档、数组和文档数组。MongoDB将文档存储在集合中，集合类似与关系型数据库中的表。深入理解MongoDB与传统数据库区别：SQL概念MongoDB概念解释databasedatabase数据库tablecollection数据

2021-12-26 15:53:03 223

转载 MySQL知识点

MySQL索引类型-B+树索引是为了加速对表中数据行的检索而创建的一种分散存储的数据格式。二叉树存在遍历一半的节点的可能性，相当于全表扫描，所以不适合作为索引的数据结构。平衡二叉树：1、搜索效率不高，数据量足够大的时候，树的高度比较大。2、查询不稳定，查询的数据在根节点附近速度比较快，但是如果在叶子节点，需要多次IO。3、存储的内容太少，未利用好操作系统与磁盘的交换特性，也未利用好磁盘的预读特性。一次IO只存储了一个数据区、两个节点的引用。多路平衡查找树（Balance Tree）B树是一个绝对平

2021-12-26 14:02:12 102

空空如也

空空如也