融合详细对⽐:市⾯各主流超融合产品及⼚商优劣势解密
随着超融合在国内市场兴起并逐步成为主流,⼀场针对于IT基础架构的技术变⾰悄然⽽⾄。沿⽤⼆⼗多年的传统IT架构⾯临着新⼀代架构的严重冲击。近⼏年来,⾯对巨⼤的市场机遇,超融合⼚商也如⾬后春笋,不断涌现。企业⽤户的数字化转型发展得益于超融合架构的创新推动,但同时也⾯临着如何评测和遴选优质⼚商及产品的难题。
这些主流国内外超融合⼚商到底有哪些区别?他们产品有何优劣势?到底应该从那⼏⽅⾯去评测超融合架构才能拨开迷雾?本篇⽂章便要深度对⽐分析市场各主流超融合和⼚商,帮助超融合⼊门⽤户全⾯⽽深⼊地理解超融合概念,并能从核⼼关键⽅⾯来了解不同⼚商及产品的特点,从⽽结合企业的情况进⾏有针对性的评估与选择。
⼀、超融合到底是⼀个概念还是⼀门技术?
超融合是⼀种 IT 基础架构构建⽅式,其核⼼思想是使⽤通⽤硬件,⽤软件定义来实现 IT 基础架构的各项服务,包括:计算,存储,灾备,运维管理等,并且这些服务都在统⼀的平台上。
超融合概念包含三个要素:
1.使⽤通⽤硬件:具体说就是 x86 服务器,所以如果出现专有硬件的 IT 平台的就不属于超融合。⽐如,
传统集中式存
储⾥的存储控制器就属于专有硬件;
2.软件定义:即超融合 IT 服务是通过 x86 服务器⾥运⾏的软件实现的,如:分布式存储软件实现数据存储服务;相⽐
之下,传统 IT 服务⼤多是⽤专有硬件且功能逻辑写死在固件⾥;
3.统⼀平台:所有的 IT 服务要在⼀个平台下,⾪属于同⼀个软件栈,这⾥区别于以往 IT 服务架构⽅式,各服务会属于
不同的平台;需要特别区分的是,市⾯上将存储设备,服务器,⽹络交换机放在⼀个机柜⾥整体交付的融合⽅案,如:VCE Vblock,和超融合完全不同。
可见超融合是⼀个概念,⽽不是⼀个技术,明确这⼀点对于理解超融合本⾝⾮常重要。不同超融合产品和⼚商的区别或差距不在概念本⾝,⽽在超融合背后的技术和实现⽅式。⼀个简单的类⽐:“汽车”就是⼀个概念,字典⾥的解释是:“通常为四轮的⾃动车,⽤于街道和公路运输”。这⾥⾄于如果实现这个概念并没有做规定和限制,所以⽆论是纯电动的特斯拉,福⽥⼩卡,⾼尔夫球车,都是满⾜上⾯的定义,但是使⽤场景和背后的实现,可谓天壤之别。
⼆、评估超融合平台到底需要关注哪些核⼼问题?
明⽩了超融合只是概念,进⼀步的问题:各⼚商超融合产品的实现有哪些不同?这个问题才是选择超融合真正的关注点,展开来有四个⼦问题:
1.超融合平台整合了哪些 IT 服务?
1)分布式存储打破数据孤岛
虽说超融合通过软件定义的⽅式整合了多个 IT 服务,但其中软件定义存储是基⽯。这⾥需要说明⼀下:池化服务器的本地存储,要求软件定义存储必须是分布式的,且能被虚拟机挂在成虚拟卷使⽤,不加特殊的说明,超融合平台⾥的软件定义存储指的是分布式块存储。
没有稳定可靠的分布式块存储,就⽆法对外提供统⼀的存储资源抽象,没有统⼀的抽象,各个服务器的本地存储就是⼀个个数据孤岛,与传统的单机存储没有区别。所以,讨论超融合平台却不讨论分布式块存储,⽽避重就轻的展⽰平台 IT 服务的种类,更甚者竟然⽤⽀持 IT 种类的多少作为超融合的代数标准,基本可以判定是⼀种“误导”,本质是这类⼚商不具备超融合与分布式存储的研发能⼒。主流核⼼⼚商都⽆⼀例外的在分布式块存储上有着核⼼的竞争⼒和⾃主研发能⼒,⽐如:Nutanix Acropolis Enterprise Storage (内部之前叫 NDFS), VMware VSAN ,SmartX ZBS等都是对应超融合平台⾥的核⼼分布式存储。
会议纪要的格式
2)虚拟化计算同样不可或缺
虚拟化计算是超融合平台另⼀个不可或缺的服务,有了存储和计算就有了最基本的 IT 基础架构,很多⼚商也会⼀部分⽹络服务的功能纳⼊到虚拟化计算。由于 Hypervisor 的技术相对成熟,⽆论是闭源的 VMware ESXi 还是开源的KVM,⽆论功能还是性能都通过了很多年市场验证。所以虚拟化计算服务在超融合平台上基本集中在 VMware 产品和基于 KVM ⾃研的产品,如:Nutanix 的 AHV(基于 KVM),VMware 的 vSphere(基于 ESXi),SmartX 的 Elf(基于 KVM)等。当然 Nutanix 和 SmartX 也同样⽀持 VMware 虚拟化计算平台,⽽且借助其强⼤的存储服务,整体超融合平台的表现甚⾄还要优于 VMware。
合平台的表现甚⾄还要优于 VMware。
3)⼀个平台管理多个IT服务,运维简化是趋势
随着单个服务器计算能⼒越来越强,越来越多的 IT 服务其实都可以通过软件定义的⽅式来实现,如:灾备服务、全闪存、容器服务、⽹络服务、安全服务等。
⼀个平台上有多个 IT 服务是⼀种趋势,伴随着⾰命性的变化就是:传统架构下需要运维管理多个 IT 平台,在超融合下,⼀套管理平台就够了,这就为从全新的⾓度审视 IT 运维,提供了极⼤的想象空间。卷发棒用法
同时,在超融合架构下实现强⼤好⽤的统⼀管理平台,其重要性和优先级也被提升到前所未有的⾼度。像超融合领导⼚商 Nutanix,SmartX 等,在运维管理平台上都下⾜了功夫,分别推出了智能强⼤的管理平台:Nutanix Prism 和 SmartX Fisheye,极⼤的提升系统的易⽤性。
人不彪悍枉少年 演员表总结⼀下就是,超融合平台⾥分布式块存储、虚拟化计算和统⼀运维管理平台是最⼩,也是最核⼼的集合,缺少任何⼀个都⽆法称作超融合平台。但随着硬件的发展,更多的服务势必会在超融合平台⾥实现。
2.这些IT服务是如何实现的?
评测超融合产品,关键不是看包含了哪些 IT 服务,向超融合这个“盒⼦”⾥塞更多的 IT 服务远不如塞进“盒⼦”IT 服务的质量重要。⼀些⼚商借助客户对超融合市场认知的不成熟,会⼀味的拼超融合平台上服务和功能的数量。通常的做法就是拿开源的项⽬,如:“OpenStack + 开源分布式存储 (Ceph/GlusterFS…)” 搭⼀个功能看似⼤⽽全的“超融合平台”快速推向市场。可以看到,⼏乎没有⽤户最终能够真正的⽤起来,原因在于这种拼凑的“超融合”产品往往各个服务组件的质量⽆法过关,在可靠性,稳定性,性能⽅⾯问题多多,加上开源社区基本不在这些⼚商的控制之下,所谓的售后⽀持形同虚设,很难达到⼀个产品应该拥有的市场准备度。
1)实现机制是核⼼
服务的核⼼在于实现它的技术和机制。举⼀个⼿机电池的例⼦,为了实现⼿机长续航的能⼒,⼀家⼚商简单的增加电池块的容量,另⼀家公司采⽤的是优化⼿机软件的电池管理算法,即便最后的测试下来都能续航两天,但第⼀家⼿机在续航的实现机制上是不如第⼆家的,因为增加电池块会引起⼿机发烫,并且有电池爆炸的风险,但这些缺陷⽆法在测试续航时间这个指标⾥得以体现。
同样的道理适⽤于超融合产品。超融合产品⽐拼最重要的必然是分布式块存储、虚拟化计算、运维管理平台的实现。
重中之重是软件定义存储,它是超融合平台的基⽯。当前市场⾥各家超融合平台分布式块存储的实现⽆⾮是两个途径:
•⾃主研发,如:Nutanix NDFS,VMware VSAN,SmartX ZBS,华为 Fusion Storage;
•直接采⽤开源的分布式存储或在开源基础上⼩幅改造,如,Ceph,GlusterFS;
开源最⼤的好处是产品上市的周期可极⼤的缩短,最⼤的风险除了存储的稳定性没有保障,还有就是⼚商对存储的控制⼒和维护能⼒⼏乎没有,存储系统不⽐其它系统,守护着企业最重要的数据,⼀旦发⽣问题就会陷⼊束⼿⽆策的失控境地,给企业带来的损失是惨重⽽不可估量。
这⾥有⼀个不可忽视的事实,国外知名超融合⼚商⽆⼀例外的都⾛了⾃主研发的道路,也证实了在成
熟的市场环境下,⽤户会理性的选择⾃主可控且有保障的产品。纵观 IT 发展的历史,甚⾄没有⼀家存储公司,使⽤开源的存储项⽬来实现⾃家的存储产品,并取得产品和商业的成功。再次验证了,存储关乎业务的连续性、数据的可靠性和安全性。没有⼀家企业客户“敢”把⾃⼰的业务托付给不可控的存储产品。
市场上所有的分布式块存储架构基本可以收敛到两种,⼀种数据放置和分布依赖元数据服务,另⼀种数据放置和分布依赖⼀致性哈希。但就分布式块存储本⾝⽽⾔,两种数据架构各有千秋。但在超融合场景上,元数据服务的⽅式有更多的优势,数据的放置更灵活可控,如:VM 数据本地化能缩短 I/O 路径,⼤⼤减少⽹络流量。采⽤这种架构的产品有Nutanix NDFS 和 SmartX ZBS。
其次是虚拟化计算,与存储不同的是,虚拟化的核⼼技术 Hypervisor 相对成熟。各超融合产品更多⽐拼的是虚拟化平台的⽀持能⼒。⽀持多种虚拟化平台意味着更少的⼚商绑定的风险。此外,是否⽀持虚拟化的特殊接⼝也是很重要的指标,它直接影响使⽤体验和维护⽀持,⽐如:VMware VAAI/VVol,Citrix Ready 等。这块⽐较优秀的国外⼚商是Nutanix,⼏乎⽀持所有的虚拟化平台;国内⼚商 SmartX、华为⽀持除 Hyper-v 以外的所有虚拟化平台;VMware 只⽀持⾃家的虚拟化平台,开源超融合⽅案⼀般只⽀持 KVM。
持⾃家的虚拟化平台,开源超融合⽅案⼀般只⽀持 KVM。
KVM 作为开源的 Hypervisor 被很多⼚商选⽤,但各家需要实现⾃⼰的虚拟化计算管理平台,除了基本的 VM ⽣命周期管理,还⾄少需要实现企业级常⽤的功能,如:VM HA、、虚拟分布式交换机、共享盘等。
除了存储和计算,其他 IT 服务或多或少会依赖以上两类核⼼服务,⽐如:容灾和备份依赖存储服务;容器编排依赖计算服务。
2)资源消耗需着重评估
除了服务的实现机制,超融合平台有⼀项特殊的要求:资源消耗要尽可能的⼩。超融合场景下,消耗⼤量的资源是绝对不能接受的,每个物理服务器除了运⾏存储、计算等多个 IT 服务,还要把剩余的资源分配留给业务应⽤,IT 服务占⽤资源越⼤,留给业务应⽤的资源就越⼩,甚⾄挤压到业务⽆法运⾏。资源消耗不仅节省 TCO 的指标,更是影响超融合实⽤性的重要变量。
以下收集了各⼚商分布式块存储产品的资源消耗情况。
3. 服务如何进⾏整合与管理?
1)各有利弊的三类服务整合⽅式
服务整合⼴义是超融合平台上各服务的结合⽅式,但业内讨论更多的是存储与虚拟化的整合。⼤致可以分为三类:
•存储服务作为内核模块运⾏在 Hypervisor 内部。最典型的代表是 VxRail,存储服务 VSAN 作为 ESXi/vSphere 内核模块被整合。这种架构下存储服务不经过Hypervisor直接访问存储设备,⼏乎⽆性能损耗,理论上本地 I/O 性能可以充分发挥,遗憾的是 VSAN 的实际性能在超融合产品⾥并不突出,应该是存储软件的优化相⽐其它⼚商还有差距。这种紧耦合架构存在以下风险:
•⼚商锁定的风险,如 VMware 超融合平台虚拟化计算锁死了 vSphere;
•计算和存储⽆法独⽴升级;
•存储或虚拟化计算服务任何⼀个发⽣问题都可能会影响对⽅的正常⼯作。
•存储服务运⾏于 Hypervisor 上独⽴的虚拟机⾥,该虚拟机实际起到虚拟存储设备 VSA(Virtual Storage
Applicance)的作⽤,所以也称为控制虚拟机(Nutanix 称 CVM)或者存储控制虚拟机(SmartX 称 SCVM)。
金世佳老婆
VSA 需要通过 Hypervisor 访问物理硬件资源,⼀般为了降低性能的开销,VM 会以直通的⽅式访问硬件资源,如:HDD,SSD,⽹卡等。这种架构⾥虚拟化与存储解耦,互不影响,可以独⽴升级,甚⾄ VSA 发⽣故障不⼯作,也不会影响该物理节点,通过 I/O 路由的技术,VSA 故障节点上的 VM 会通过其他正常的 VSA 访问存储资源。当然,给⽤户带来的最⼤收益还有消除了 Hypervisor 锁定的风险,VSA 可以⽀持多种虚拟化计算平台。采⽤这种整合的产品有 Nutanix,SmartX Halo for VMware。
•存储服务运⾏在 Hypervisor 外部,但与 Hypervisor ⾪属于同⼀个软件栈。这种架构适⽤于 KVM 超融合平台。⽐如,SmartX Halo 超融合平台⾃带的虚拟化平台 Elf 基于 KVM 实现,分布式块存储 ZBS 与 Elf 都在 Halo (SmartX OS)软件栈上。这种整合的最⼤优势在于:
•性能相⽐ VSA 的⽅式要好;
•存储或者 Hypervisor 出现故障互不影响。
2)管理与运维好才能发挥出超融合的优势
吴彦祖lisa由于涉及⽐传统平台更多的 IT 服务,超融合更加强调管理平台的重要性和易⽤性。强⼤好⽤的管理平台能⼤⼤提升运维效率,降低运维成本,将超融合架构敏捷的特性发挥得淋漓尽致。
超融合⼚商产品家的管理平台⼀览:
⼀个优秀的超融合管理平台应该涵盖产品从交付到⽇常运维的⽅⽅⾯⾯:
•基于 Web 管理 UI 应该是超融合平台的标配,同时 Web 管理服务也是超融合服务的⼀种,需要考虑管理控制台的的⾼可⽤;Nutanix Prism 和 SmartX Fisheye 都是分布式的管理平台,没有单点故障,相⽐之下 VMware vCenter 就存在单点故障的风险;弦子的照片
•集服务管理,包括:存储,虚拟化,⽹络等管理;更进⼀步,由于采⽤了软件定义的技术,管理平台也应该能展⽰并洞察更细粒度服务,⽐如:软件定义存储⾥的分布式组件服务;
•基于事件、性能的监控、分析和报警,可以说各家的产品或多或少都在这块有⽀持,但是仔细研究会发现功能丰富度和易⽤性各产品差别巨⼤。这块做得⾮常突出的是 Nutanix 和SmartX的产品,两家都能在全局集、物理服务器、虚拟机三个层⾯提供丰富的性能和事件的监控、分析和报警。
•⾃动化、图形化的安装⼯具。简易安装和部署不仅是系统快速上线的关键,也是超融合作为软件交付的必要前提,像 Nutanix Foundation和SmartX Tuna 都提供了⾮常⽅便的 UI 安装和部署⼯具,整个部署过程通常能在 1 个⼩时内完成;
•系统硬件管理,好的管理平台也应该能⽀持数据中⼼硬件的拓扑管理和配置,这⽅⾯ VMware,Nutanix,SmartX 都⾮常优秀,尤其是 Nutanix 和 SmartX 都提供了基于集拓扑的管理。
4.产品有哪些交付⽅式?
超融合依托标准的 x86 服务器,⼀般可以是安装了超融合软件的⼀体机或者是独⽴的软件授权。当前主流⼚商⽀持的交付⽅式如下: