自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 资源 (37)
  • 收藏
  • 关注

原创 分布式体系结构之非集中式结构

前言上文介绍了分布式体系结构中的集中式结构,目前很多云上的管理都采用了集中式结构,但是这种结构对中心服务器性能要求很高,而且存在单点瓶颈和单点故障问题。为了解决这个问题,分布式领域中又出现了另一经典的系统结构,即非集中式结构,也叫作分布式结构。1、非集中式结构概述在非集中式结构中,服务的执行和数据的存储被分散到不同的服务器集群,服务器集群间通过消息传递进行通信和协调。也就是说,在非集中式结构中,没有中央服务器和节点服务器之分,所有的服务器地位都是平等(对等)的。相比于集中式结构,非集中式结构就降低了

2020-05-12 14:14:10 979

原创 分布式技术与人工智能

1.什么是人工智能1.1人工智能概述目前人工智能已经广泛渗入到了我们的生活中,比如手机拍照美化、人脸识别、平安城市、自然语言处理、语音识别等。对人工智能的定义一般可划分为四类即:机器“像人一样思考”“像人一样行动”“理性地思考”“理性地行动”。注意:这里的行动,指的是采取行动或制定行动的决策。那么如何让机器像人一样具有智能呢?人并不是天生就会解决问题的,我们经常会听到一句经典的话“见多识广”,人遇到新的问题,是通过学习新知识,然后结合自己的经验去解决问题的。比如,人并不是生来就认识苹果,

2020-05-09 14:38:40 2929 1

原创 分布式技术架构原理解析之协调与同步(五)分布式锁

前言前面的文章详细介绍了“分布式互斥”,解释了同一临界资源(共享资源)同一时刻只能被一个程序访问的问题,也就是说只有获得访问权限的进程才可以访问共享资源,而此时其他进程必须等待拥有该权限的进程释放权限。那么在访问共享资源时,这个权限是如何设置或产生的呢?以及设置或产生这个权限的工作原理是什么?本文就来介绍分布式锁是如何解决这个问题的。...

2020-05-08 16:34:09 221

原创 分布式技术架构原理解析之协调与同步(四)分布式事务

概述通常我们在网上商城购物,对于每一笔订单交易来说,一般会有两个核心的步骤:订单业务:下订单操作库存业务:减库存操作订单业务和库存业务一般会运行在不同的机器上,甚至是运行在不同区域的机器上。针对同一笔订单,当且仅当订单操作和减库存操作一致时,才能保证交易的正确性。也就是说一笔订单,只有这两个操作都完成,才能算做处理成功,否则处理失败,在分布式领域中,这个问题就是分布式事务问题。1、什...

2020-05-07 10:28:46 315

原创 分布式技术架构原理解析之序篇

1 前言分布式技术概念繁多、知识庞杂、新兴技术层出不穷,令许多新手望而却步。即使接触了一段时间分布式系统,仍然是经常各种概念、名词张冠李戴,傻傻的分不清楚;甚至是做了多年技术,也参与了很多分布式技术实践,却无法回答工作中各种分布式技术、组件、框架选型背后的根源。究其原因,主要是知识碎片化、不成体系、见树不见林。小编我就是这样之前作为传统存储工程师只了解产品层面的技术,目前转型分布式系统需要挑战非...

2020-04-28 19:36:21 444 2

原创 对分布式存储系统设计架构的理解

1传统存储今天和大家浅谈一下分布式存储设计方面我个人的一些理解。首先声明我本人不是做研发的,只是一个有着10年左右存储行业经验的普通工程师和产品经理。最早接触存储是在2010年,那时候说起存储大多指的是双控制器的磁盘阵列,比如:EMC、IBM、HDS等,除了双控制器架构还有多控制器的所谓高端存储,这些统称企业级存储。不过不管是中端的还是高端的,对于普通工程师来说都是一个黑盒子,我们并不知道其内部...

2020-04-27 14:00:38 987

原创 分布式存储之分布式数据复制技术

前言在上一篇文章中,介绍了数据分布(也称数据分片)技术,主要用于构建数据索引的关键技术。数据分布的本质是,将原数据集划分为多个数据子集,以存储到不同的地方,在一定程度上体现了数据的可用性和可靠性(一个存储节点故障,只影响该存储节点的数据)。数据分片是确定数据位置,而数据复制是实现数据可靠性的关键方法。在实际情况下,仅考虑数据分片,其实是无法真正应用到生产环境的。因为,故障导致数据丢失和不可用是很常见的情况。因此,在进行分布式数据存储设计时,通常会考虑对数据进行备份,以提高数据的可用性和可靠性,而实现数据

2020-07-17 17:32:14 712

原创 分布式存储之数据分布方式之哈希与一致性哈希

数据分布设计原则数据分布,主要就是数据分片,它解决了确定数据位置的问题。假设,现在有上百 G 数据需要进行分布式存储,也就是要存储到不同的节点上。要实现数据分布其实有很多种方法,比如随机分布、范围分布、映射分布等。那么,我们应该如何选择到底要使用哪种方法呢?在分布式数据存储系统中,存储方案选型时,通常会考虑数据均匀、数据稳定和节点异构性这三个维度。从数据均匀的维度考虑,主要包括两个方面:不同存储节点中存储的数据要尽量均衡,避免让某一个或某几个节点存储压力过大,而其他节点却几乎没什么数据。比如,现在

2020-07-17 16:05:16 678 1

原创 分布式数据存储系统之三要素

什么是分布式数据存储系统?分布式存储系统的核心逻辑,就是将用户需要存储的数据根据某种规则存储到不同的机器上,当用户想要获取指定数据时,再按照规则到存储数据的机器里获取。如下图所示,当用户(即应用程序)想要访问数据 D,分布式操作引擎通过一些映射方式,比如 Hash、一致性 Hash、数据范围分类等,将用户引导至数据 D 所属的存储节点获取数据。上面的这个获取数据的整个过程与到商店购物的过程是不是有些类似呢?顾客到商店购物时,导购会根据顾客想要购买的商品引导顾客到相应的货架,然后顾客从这个货架上获取

2020-07-01 13:20:53 929

原创 分布式存储之CAP理论

什么是 CAP?我们结合电商的例子,来理解 CAP 的含义。假设某电商,在北京、杭州、上海三个城市建立了仓库,同时建立了对应的服务器{A, B, C}用于存储商品信息。比如,某电吹风在北京仓库有 20 个,在杭州仓库有 10 个,在上海仓库有 30 个。那么,CAP 这三个字母在这个例子中分别代表什么呢?C 代表 Consistency,一致性,是指所有节点在同一时刻的数据是相同的,即更新操作执行结束并响应用户完成后,所有节点存储的数据会保持相同。在电商系统中,A、B、C 中存储的该电吹风的数量应该是

2020-06-28 11:06:45 685

原创 分布式通信之消息队列

前言上一篇介绍了分布式通信技术中的发布订阅。总结来说,发布订阅就是发布者产生数据到消息中心,订阅者订阅自己感兴趣的消息,消息中心根据订阅者的订阅情况,将相关消息或数据发送给对应的订阅者。在实际使用场景中,还有一种常用的通信方式,就是将消息或数据放到一个队列里,谁需要谁就去队列里面取。在分布式领域中,这种模式叫“消息队列”。什么是消息队列?在学术电子论文订阅的例子中,出版社或会议方将论文发布到论文网站(或平台)上,然后论文网站再将论文推送给订阅相关论文的老师或学生。这里的论文网站就是消息中心,负责根据订

2020-06-22 14:05:44 599

原创 分布式通信之发布订阅

前言上一篇文章介绍了分布式通信中的远程调用,其核心是在网络服务层封装了通信协议、序列化、传输等操作,让用户调用远程服务如同进行本地调用一样。其实,这种方式就是通过网络服务层的封装实现了不同机器上不同进程之间的直接通信,因为是直接通信,所以通过线程阻塞的方式实现同步调用比较容易,因此通常被用于同步调用。比如,机器 1 上的进程 A 调用机器 2 上的进程 B,进程 A 被挂起,进程 B 开始执行,当进程 B 将值返回给 A 时,A 继续执行。虽然这种方式也可以用于异步通信,但因为进程之间是直接交互的,

2020-06-18 17:39:22 238

原创 分布式通信之远程调用

前言分布式的本质就是多进程协作,共同完成任务。要协作,自然免不了通信。从今天开始就来介绍多个进程之间通信的相关内容,那么首先先介绍分布式通信中的远程调用。什么是远程调用?以电商购物平台为例,每一笔交易都涉及订单系统、支付系统及库存系统,假设三个系统分别部署在三台机器 A、B、C 中独立运行,订单交易流程如下所示:用户下单时,调用本地(机器 A)的订单系统进行下单;下单完成后,会远程调用机器 B 上的支付系统进行支付,待支付完成后返回结果,之后在本地更新订单状态;在本地远程调用机器 C 上的仓库

2020-06-03 17:53:39 799

原创 分布式计算模式之流水线

前言在分布式领域中解决类似具有依赖关系的流水线作业的计算模式,叫作流水线计算模式。其实,流水线计算模式就是将一个任务拆分为多个步骤(子任务),然后多个这样的任务通过对步骤(子任务)的重叠执行,以实现数据并行处理的场景。这种流水线模式在计算机领域中最先用于 CPU 指令设计,后来推广到机器学习领域进行数据处理、模型训练等。在流水线计算模式中,由于前一个子任务执行后,会扔给下一个子任务,由下一个子任务去展现自己的能力,即:前一个任务的结果是另外一个任务的输入。什么是流水线模式?计算机中的流水线(Pipe

2020-06-01 17:50:35 1091

原创 分布式计算模式之Actor

前言前几篇文章介绍了MapReduce 和 Stream 计算模式,虽然这两种计算模式对数据的处理方式不同,但都是以特定数据类型(分别对应静态数据和动态数据)作为计算维度。在接下来两篇文章中,将从计算过程或处理过程的维度,介绍另外两种分布式计算模式,即 Actor 和流水线。分布式计算的本质就是在分布式环境下,多个进程协同完成一件复杂的事情,但每个进程各司其职,完成自己的工作后,再交给其他进程去完成其他工作。而分布式进程那么多,如果需要开发者自己去维护每个进程之间的数据、状态等信息,这个开发量可不是一般

2020-05-27 12:02:40 470

原创 分布式计算模式之Stream

前言上文介绍了分布式计算模式中的 MapReduce 模式。这种模式的核心思想是:将大任务拆分成多个小任务,针对这些小任务分别计算后,再合并各小任务的结果以得到大任务的计算结果。这种模式下任务运行完成之后,整个任务进程就结束了,属于短任务模式。但是任务进程的启动和停止是一件很耗时的事儿,因此 MapReduce 对处理实时性的任务就不太合适了。实时性任务主要是针对流数据的处理,对处理时延要求很高,通常需要有常驻服务进程,等待数据的随时到来随时处理,以保证低时延。处理流数据任务的计算模式,在分布式领域中叫

2020-05-26 11:02:50 542

原创 分布式计算模式之MapReduce

前言前面文章中介绍两层调度时提到,Mesos 的第二层调度是由 Framework 完成的。这里的 Framework 通常就是计算框架,比如 Hadoop、Spark 等。用户基于这些计算框架,可以完成不同类型和规模的计算。那么,在接下来就来介绍分布式计算技术”了。分布式领域的4 种计算模式:MapReduce、Stream、Actor 和流水线。计算问题处理思想之分而治之分而治之的基本思想是将一个复杂的、难以直接解决的大问题,分割成一些规模较小的、可以比较简单的或直接求解的子问题,这些子问题之间

2020-05-25 19:30:33 831 1

原创 分布式调度架构之共享状态调度

前言上文介绍了在两层调度架构中,第二层调度只知道集群中的部分资源,无法进行全局最优调度。而要解决全局最优调度的问题需要共享状态调度。什么是共享调度集群中需要管理的对象主要包括两种:资源的分配和使用状态;任务的调度和执行状态;单体调度和两层调度实现集群对象管理的方式和问题单体调度:这两种对象都是由单体调度器管理的,因此可以比较容易地保证全局状态的一致性,但问题是可扩展性较差(支持业务类型受限),且存在单点瓶颈问题。两层调度:这两种对象分别由第一层中央调度器和第二层Framework 调度

2020-05-22 11:34:10 1195

原创 分布式调度架构之两层调度

前言上一篇文章中,介绍了单体调度。单体调度的核心是,所有节点的资源以及用户的任务均由中央服务器统一管理和调度。因此,中央服务器很容易成为单点瓶颈,会直接导致其支持的调度规模和服务类型受限。于是两层调度就出现了。本文主要就来介绍到底什么是两层调度,它是如何设计的,又有哪些调度算法呢?分布式两层调度上文提到单体调度架构,会存在单点瓶颈问题,其会限制调度的效率和支持的任务类型。说会限制任务类型是因为不同的服务具有不同的特征,对调度框架和计算的要求都不一样。比如有的业务最开始时只有批处理任务,后来发展到同时还

2020-05-21 00:33:59 1058 1

原创 分布式调度架构之单体调度

前言通过前两篇文章《分布式体系结构之非集中式结构》和《分布式体系结构之集中式结构》可以看出,分布式系统架构的目的是,将多个服务器资源管理起来,寻找合适的服务器去执行用户任务。而为用户任务寻找合适的服务器这个过程,在分布式领域中叫作调度。在分布式系统架构中,调度器就是一个非常重要的组件。它通常会提供多种调度策略,负责完成具体的调度工作。不同的分布式架构的调度器原理也不一样,最常见或最直观的是单体调度,就是任务和分布式系统中的空闲资源直接进行匹配调度,即:调度器同时管理任务和资源。本文就详细介绍分布式调度

2020-05-15 11:29:51 546

原创 分布式体系结构之集中式结构

前言对于云计算通俗的理解是把多个服务器管理起来,作为一个统一的资源提供服务。而如何组织,就是分布式体系结构的范畴了。在很多场景下请求都会汇总到一台服务器上,由这台服务器统一协调我们的请求和其他服务器之间的关系。这种由一台服务器统一管理其他服务器的方式,就是分布式体系结构中的集中式结构(也称为 Master/Slave 架构),其中统一管理其他服务器的服务器是主,其他服务器是从。下文主要介绍分布式体系结构中的集中式结构。1. 分布式集中式结构概述集中式结构就是,由一台或多台服务器组成中央服务器,系统内的

2020-05-11 12:04:07 2090

原创 分布式技术架构原理解析之协调与同步(三)分布式共识

1、分布式选举与分布式共识之前提到的分布式选举问题,是通过分布式选举算法从多个节点中选出一个主节点。不管是哪种选举算法,几乎都有一个共同特点:每个节点都有选举权和被选举权,当某个节点得到了大部分节点的同意或认可后成为主节点,然后主节点向其他节点宣告主权。从本质上看,分布式选举问题,其实就是传统的分布式共识方法,主要是基于多数投票策略实现的。2、分布式在线记账场景分布式在线记账:在没有集中的发...

2020-05-05 16:56:42 2038

原创 分布式技术架构原理解析之协调与同步(二)分布式选举

1 概述我们大家都知道集群一般是由两个或两个以上的服务器组建而成,每个服务器都是一个节点。也会听到数据库集群、管理集群等概念,也知道数据库集群提供了读写功能,管理集群提供了管理、故障恢复等功能。那么对于一个集群来说,多个节点到底是怎么协同,怎么管理的呢?比如,数据库集群,如何保证写入的数据在每个节点上都一致呢?答案是选一个“领导”来负责调度和管理集群中其他节点。这个“领导”,在分布式中叫做主节点...

2020-04-30 16:16:23 276

原创 分布式技术架构原理解析之协调与同步(一)分布式互斥

分布式互斥通过**《分布式技术架构原理解析之序篇》**,对分布式系统有了一个初步了解。今天,和大家一起分享:分布式协调与同步。学习如何让分布在不同计算机上的程序具有“团队精神”,换句话说就是如何让程序通过协作共同去达成一个业务目标。首先我们来看一下分布式互斥呢。在分布式系统里,对于同一共享资源,在同一时刻只能被一个程序访问,叫作分布式互斥(Distributed Mutual Exclusio...

2020-04-29 16:48:57 482

原创 浅谈存储协议及接口

在存储系统中,我们通常称上层协议为“指令”,一般执行动作是“读出从某某开始的多少长度的扇区”,指令包含三大关键信息:操作码,Operation Code,或者成为OP:比如Write,Read,Control(Inquery,Standby等等)。起始地址:从哪开始读。如果是文件的话,精确到字节。如果是硬盘的话,精确到LBA(扇区)。长度:从起始地址往后多长的一段字节或者扇区。...

2020-04-28 08:43:26 836

原创 简单聊一聊有关就业和职业发展的话题

在当前疫情的背景下想和广大大学生朋友们聊一聊有关就业和职业发展的话题。小编在大学学的是计算机专业,2006年毕业后还算比较顺利的进入了IT行业,做了一名普通的工程师,到现在算起来在这个圈子里也摸爬滚打十几个年头了,把一些我个人的经验和体会分享一下希望对大家有所帮助:除非有特别好的机会,或者特别充分的准备,否则尽量选择对口的行业,且专注于同一行业发展,不要随便跨行业。这一点是小编的真实体会,本人...

2020-04-28 08:29:42 626 1

原创 OpenStack组件架构及部分核心组件解析

1 OpenStack组件架构简介上图 VM是虚拟机,围绕 VM 的那些长方形代表 OpenStack 不同的模块(OpenStack 叫服务,后面都用服务这个术语),下面来分别介绍。**Nova:**管理 VM 的生命周期,是 OpenStack 中最核心的服务;**Neutron:**为 OpenStack 提供网络连接服务,负责创建和管理L2、L3 网络,为 VM 提供虚拟网络和物...

2020-04-27 16:50:34 2644

Ceph工作原理和安装.pptx

RADOS是ceph最关键的技术,它本身就是一个海量对象存储系统,实际上所有Ceph用户数据最终都将存储在这一层中。而Ceph的高可靠性、高扩展性、性能、自动化都是由这一层来实现的。物理上RADOS是由大量的物理存储节点构成,每个节点有自己的资源(CPU、内存、网络、硬盘),并运行着操作系统和文件系统。

2020-04-29

全面解析DDN存储和HPC解决方案.docx

DataDirect Networks成立于1998年,是一家高性能存储产品的厂商,其提供的存储系统主要服务于大容量和高带宽应用。比如高性能计算领域,以及影片和视频的制作及分发等领域。

2020-04-29

IBM GPFS架构特点浅析 IBM GPFS架构特点浅析.pdf

GPFS是 IBM 公司第一个共享文件系统,GPFS 是一个并行 的磁盘文件系统,它保证在资源组内的所有节点可以并行访问整个文件系统。 GPFS 提供 的文件系统操作服务可以支持并行应用和串行应用,它允许任何节点上的并行应用同时访 问同一个文件或者不同的文件,提供统一命名接口。

2020-04-29

华为存储支持OpenStack技术白皮书.pdf

OpenStack在物理基础架构层使用虚拟化技术隐藏服务器、网络 设备、存储系统的实际物理属性,为用户提供抽象且统一的虚拟化计 算、网络和存储环境。虚拟化为OpenStack提供持续可用的基础架构, 同时对基础设施资源的整合和管理,有助于减少企业资源的过度供应 和碎片化。

2020-04-29

大V话存储-长篇原创连载之华为9000.pdf

本文档编辑整理了在华为存储论坛中《大话华为 OCEANSTOR 9000》的连载文章,把原来分散的各个章节内容整合编辑为统一个文档,便于大家阅读学习。

2020-04-29

大话集群文件系统.pdf

本文档编辑了之前冬瓜哥的集群文件系统雄文,另外其中拓扑图又重新画了一遍,便于大家阅读。本文系统介绍了文件系统的技术演技以及各个主流厂商文件系统技术架构和特点,是大家学习入门的好帮手。

2020-04-29

Oracle入门基础理论.pdf

Oracle数据库是Oracle(中文名称叫甲骨文)公司的核心产品,Oracle数据库是一个适合于大中型企业的数据库管理系统。在所有的数据库管理系统中(比如:微软的SQL Server,IBM的DB2等),Oracle的主要用户涉及面非常广,包括:银行、电信、移动通信、航空、保险、金融、电子商务和跨国公司等。Oracle产品是免费的,可以在Oracle官方网站上下载到安装包,另一方面Oracle服务是收费的。

2020-04-29

SSD基础知识及一些技术解析.docx

SSD(Solid State Disk )俗称固态硬盘,相对HDD并无机械部分,由控制芯片和存储芯片组成,简单的说就是用固态电子存储芯片阵列而制成的硬盘所以被人称为固态硬盘。 SSD由控制单元和存储单元(FLASH芯片)组成,存储单元负责存储资料,控制单元负责读取、写入资料。

2020-04-28

Lustre_Manual_cn_0.0.4.pdf

本文档翻译自英文版Lustre操作手册(http://doc.lustre.org/lustre_manual.xhtml)并按照原文相同的许可证免费分享,根据该许可证人和人均可转发、复制、修改该文档,已包含包括商业目的在内的相关用户。

2020-04-28

Linux 性能分析.pdf

针对平常工作会涉及到的一些 Linux 性能分析的问题,主要是 CPU、内存、磁 盘 IO 以及网络这几个部分,本文总结一下常用的一些性能分析手段,仅供参考。

2020-04-28

什么是高性能计算.pdf

最近一段时间,有关超算的话题成为热门,一时间大家都开始讨论超算,各种浮于表面的吹牛,逼格负无穷的装逼。然而,冬瓜哥发现在所有这些讨论中,从没有在任何时间任何地点发现任何人问出就连小学生都经常问的问题:超算到底是怎么算的?不得不说是一件可悲的事情。

2020-04-28

文件系统那些事.pdf

什么是文件系统,文件系统可以进行怎样的分类?这是本篇将要谈论的问题。 文件系统是存储和组织计算机文件和文件中所包含的数据,以方便地找到和存取它们的方法。更加正式地说,文件系统是一个用来存储、分级管理、处理、导航(navigation)、访问和恢复数据的抽象数据种类(例如元数据)的集合。 本篇[ii]从各个方面对诸多常见文件系统进行了对比。 文件系统可以分为磁盘文件系统、网络文件系统和特殊目的的文件系统。进一步的,可以通过以下几个概念对文件系统的概念进行区分。

2020-04-28

浅析GPU通信技术.pdf

GPU 在高性能计算和深度学习加速中扮演着非常重要的角色,GPU 的强大的并行计算能力,大大提升了运算性能。随着运算数据量的不断攀升,GPU 间需要大量的交换数据,GPU 通信性能成为了非常重要的指标。NVIDIA 推出的 GPU Direct 就是一组提升 GPU 通信性能的技术。但 GPU Direct 受限于 PCI Expresss 总线协议以及拓扑结构的一些限制,无法做到更高的带宽,为了解决这个问题,NVIDIA 提出了 NVLink 总线协议。

2020-04-27

六大分布式文件系统分析.pdf

We consider that a thorough study and a comparison including older DFSs is needed to guide users in their choice. In this paper, we give a presentation and a comparison of four new popular and two former DFSs based on three fundamental issues: scalability, transparency and fault tolerance. We make the choice to study popular, used in production and frequently updated DFSs: HDFS [1], MooseFS1, iRODS [2, 3, 4], Ceph [5, 6, 7], GlusterFS [8, 9] and Lustre [10, 11, 12, 13, 14].

2020-04-27

ZFS文件系统.pdf

ZFS 是由 SUN 公司的 Jeff Bonwick 和 Matthew Ahrens 大神于 2001 年领导设计开发,并在 2004 年 2 月 14 日发布的集合了文件系统处理逻辑和卷管理器功能的文件系统。

2020-04-27

Ceph性能测试:纠删码 vs. 三副本?.pdf

Ceph 在今天有多火就不⽤多说了吧。正如许多分布式存储那样,三副本的容量利利 用率始终是个问题,特别是对于海量⾮结构化数据和冷存储这些在意性价比的应用来说。相比之下,纠删码(Erasure Code)能够提供接近于本地 RAID 5/6 的有效磁盘空间,代价是牺牲了性能。纠删码在随机写⼊,特别是改写和重构(Rebuild)时产生的 I/O 惩罚较大,对应的集群网络流量比副本保护模式要大。 那么 Ceph 使⽤用纠删码在各种情况下的性能都⽐比三副本要低吗?答案是否定的。如果您 还⼼心存疑问,请看本⽂文分解。

2020-04-27

生物信息分析平台BIOSTACK_产品白皮书.pdf

针对⽤户的这些核心诉求,极道设计了 BIOStack,一款为了满⾜生物信息分析对于速度、规模和智能化的苛刻需求,打造的高度垂直的、全栈的、专业的生物信息分析系统。BioStack 从根本上解决生物息行业所面临的数据规模问题,充分利用计算和存储资源,灵活高效的解读高复杂度的生物数据关系和结构,让生物数据的价值大放异彩。有别于通用硬件+通用软件堆砌的生物信息分析系统。极道 BioStack 是为⽣物信息专门设计的自底向上的完整的数据系统,一次性解决生物信息数据的存储、数据管理、分析计算和特征数据挖掘。是高度垂直的、全栈的、更更专业的生物信息分析系统。

2020-04-27

对分布式存储系统设计架构的理解.pdf

浅析分布式存储系统架构设计中的层次关系(Base Platform(基础平台)、Platform Service(平台服务)、Data Path(数据路径)和Control Path(控制路径)这几个层面)、核心组件等内容,以及分布式存储和传统存储的区别

2020-04-27

为什么说 ARM 可能是国产计算架构的最优选择.pdf

国产芯片种类繁多,基于 ARM 架构授权的芯片厂商有可能形成创新可信程度高的自主指令集 。ARM 是一个精简指令集家族,预期每 8 年迭代一个架构版本。ARM 架构 是一个精简指令集( RISC)处理 器架构家族, 其广泛应用于 嵌入式系统设 计,特点 为低成 本、高 效能及 低耗电 等,覆 盖消费 性电子 产品、可 携带装 置、电脑附件设备、军用设施等。

2020-06-03

中国云计算产业发展白皮书.pdf

当前,世界正处于从上世纪 80 年代开始的 ICT 产业发展周期后 30 年,信息新技术在各领域加速落地, 互联网、移动互联网、物联网等应用 不断深化,数字经济逐渐兴起并快速 发展。

2020-06-03

2020年中国互联网发展趋势报告.pdf

下沉市场用户争夺战结束,互联网市场进入终场之战 需求不会消失,只会不断迁移,低幼人口及银发群体仍存在增长机会 用户WiFi依赖显著降低,数据流量不再成为制约手机使用场景的因素 5G手机出货量占比达37.3%,5G时代已经来临

2020-06-03

联想HPC-AI-GPU服务器-人工智能技术-V2.pptx

联想 HPC&AI 技术平台解决方案,介绍:人工智能计算系统框架、联想GPU 服务器 、联想人工智能技术平台、利用GPU 加速计算的应用介绍

2020-05-08

联想气象环保HPC解决方案-V3.pptx

联想数值预报解决方案,适用于气象预报、海洋预报、空气质量预报等。联想高性能计算服务。联想具有高性能计算专家团队和服务团队,这些团队可以在项目的各个阶段帮助您

2020-05-08

联想能源行业-典型的石化应用及平台-V3.pptx

联想能源行业高性能计算解决方案,石油勘探高性能计算需求:地震数 据采集、地震数据处理、地震资料解释、油田开发

2020-05-08

HPC背景知识及方案.pdf

浅析讲解HPC高性能计算应用领域,以及解决方案架构构成,性能需求,项目分析。是非常好的HPC入门培训资料。

2020-04-30

联想 HPC与生命科学-V3.pptx

业界一流基础架构及其它组件 享受全面支持的完全集成解决方案 针对主要的商业和开源生命科学应用程序(包括Intel®基因组学和分子动力学代码)进行了优化 性能最佳且极具价值 - 结合最先进组件,面向高性能、成本高效的解决方案 根据您的特定应用程序组合而定制 提供可选的存储分层和归档功能,以满足法规遵循要求 集成服务器领域的公认准则

2020-04-30

华为云数据中心解决方案技术白皮书.pdf

为了应对数据中心面对的挑战并顺应技术发展趋势,华为提出了分布式云数据中心的理念。分布式云数据中心是物理分散,逻辑统一,业务驱动,云管协同,业务感知的数据中心。

2020-04-30

华为视频云存储解决方案技术白皮书.pdf

存储子系统作为承载数据的核心载体,关系到数据的长期保 存与在存基础之上的视频数据的分析与应用,对整个视频监控系统的可用性、稳定性起 到至关重要的作用。但是建设视频监控存储系统却并非易事,面临诸多挑战。

2020-04-30

华为媒体存储解决方案技术白皮书.pdf

本文以媒体业务为切入点,讲述电视台媒体存储解决方案设计模型,典型业务解决方案, 旨在突出华为存储产品独有的特点以及为客户带来的价值。

2020-04-30

用户态文件系统fuse概念学习.docx

FUSE,全称为Filesystem in Userspace,中文名为用户空间文件系统。在某些操作系统中,包含了FUSE内核模块,通过FUSE内核模块,开发者可以在用户态实现文件系统。Linux用于支持用户空间文件系统的内核模块名叫FUSE,FUSE一词有时特指Linux下的用户空间文件系统。

2020-04-30

从内核文件系统看文件读写过程.docx

操作系统的主要功能是为管理硬件资源和为应用程序开发人员提供良好的环境,但是计算机系统的各种硬件资源是有限的,因此为了保证每一个进程都能安全的执行,处理器设有两种模式:“用户模式”与“内核模式”。一些容易发生安全问题的操作都被限制在只有内核模式下才可以执行,例如I/O操作,修改基址寄存器内容等。而连接用户模式和内核模式的接口称之为系统调用。

2020-04-30

文件系统磁盘布局与I:O映射.docx

应用程序在访问文件时都会先打开文件,在内核中,对应每个进程,都会有一个文件描述符表表示这个进程打开的文件,但是用户程序不能直接访问内核中的文件描述符表,而只能使用文件描述符表的索引(一个整数),这些索引就被称为文件描述符

2020-04-30

Intel CPU微架构简介.docx

CPU core部分:各个core以及独占的L1指令cache、L1数据cache、L2 cache、L3 cache等,其中L1 cache通过虚拟地址空间寻址,L2\L3通过线性地址空间寻找。 uncore部分主要是system agent:包含PCU(电源控制单元)、DMI控制器与ICH(类似南桥)连接、QPI控制器与其他CPU连接、内存控制器。

2020-04-29

[分享]Nebula Genomics白皮书非官方中文版.pdf

DTG个人基因组公司传统的商业模式如图所示。个人付费对齐基因组进行测序或分型。个人基因组公司存储基因组数据,将其卖给药厂或者生物技术公司用于研发。

2020-04-29

分布式事务与一致性算法 Paxos & raft & zab.pdf

服务发现工具的主要目标是用来服务查找和相互对话,为此该工具需要知道每个服务,这不是一个新概念,在Docker之前就已经存在很多类似的工具了,然而,容器带给了这些工具一个全新水平的需求。

2020-04-29

分布式系统基石-etcd.pdf

etcd 是一个高可用的键值存储系统,主要用于共享配置和服务发现。etcd 是由 CoreOS 开发并维护的,灵感来自于 ZooKeeper 和 Doozer,它使用 Go 语言编写,并通过 Raft 一致性算法处理日志复制以保证强一致性。

2020-04-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除