对于企业用户来说,选择固态盘(SSD)的重要一条是“ 久经考验 ”,这样才能给业务系统最大的保证。
Solidigm虽然在2021年底才宣布成立,但是在SSD上的技术底蕴却可以追溯到30多年前的英特尔*时期。1986年,英特尔提出了闪存卡的概念,并成立了专门的部门,1988年推出其首款商用闪存芯片,1989年与微软合作推出针对闪存的文件系统。长期以来,英特尔一直坚持在闪存领域的长期投入,是SSD技术发展最重要的贡献者之一,比如发起NVMe规范并积极参与具体规范的制定和更新,还有在更符合企业用户使用习惯的U.2接口等方面的创新。
(2020年10月SK海力士与英特尔签订协议,收购后者的NAND和固态硬盘(SSD)业务,并在2021年正式成立独立子公司Solidigm)
尤其是对性能、可靠性以及安全性要求更为苛刻的数据中心市场,Solidigm继续保持在NAND专利领域不断创新,是诸多互联网及企业用户的主流选择。2022年3月,Solidigm发布了新公司成立后的首款产品D7-P5530,紧接着,在4月底又发布了D7 系列PCIe 4.0 高性能SSD,包括主打数据中心和企业级应用的D7-P5520 和D7-P5620。
Solidigm固态盘的命名规则
对于产品型号,很多人的直观感受是一串冷冰冰的字符,实际上每个字母和数字都有独特的含义。下面咱们一起来了解一下Solidigm数据中心级固态盘的命名规则:
命名原则
1、Solidigm 传承原英特尔SSD的命名规则 ,使用Solidigm Dx Xxxxx Series (其中“X”为字母,“x”为数字)来对产品系列命名。
2、Solidigm NVMe 固态盘 以D加数字开头 ,代表产品是定位性能还是性价比导向。如数字7代表性能导向的NVMe SSD,数字5代表性价比导向的NVMe SSD,而数字3则代表SATA SSD。
3、Xxxxx中,“X”为字母 P 代表PCIe/NVMe接口固态盘;为 S 代表SATA固态盘;为 D 则代表Dual Port NVMe即双端口NVMe固态盘。
字母后第一位数字代表控制器的“代“数,如5代表第5代控制器;
字母后第二位数字代表寿命等级,数字越大,写入量越大;
字母后第三位数字代表NAND闪存介质的迭代;
字母后第四位数字代表其他特性,如0为普通,1为低功耗,2为性能优化,6为大容量 IU(Indirection Unit,如16K或64K),8为PCIe x8 AIC。
举例来说,Solidigm D7-P5510产品是定位性能导向,采用第5代(控制器)架构、标准寿命的主流NVMe固态盘产品,而D7-P5520相对于P5510在架构上相同,主要做了NAND闪存介质的迭代。
SolidigmD7-P5620产品则是定位性能导向,同为第五代架构、重度写场景的高写入寿命的主流NVMe固态盘产品。
多种形态 适用不同场景
通过了解Solidigm固态盘的命名规则,相信大家对它的产品应用场景和市场定位有了更加清晰的认识。而SSD的形态五花八门,对应接口形态也多种多样。
关于SSD的接口与形态,我们之前的《SSD新范式|从SATA到NVMe》上、下篇已有介绍,后续还会有相关内容,本文不再重复。此次发布的新产品系列中,作为高写入场景的SolidigmD7-P5620只有U.2一种形态,容量规格包含1.6TB、3.2TB、6.4TB、12.8TB四种。而主打读多写少应用场景的SolidigmD7-P5520则拥有多达四种形态,除了常规的U.2外,还有EDSFF标准规范的两款(不同厚度的)E1.S及一款E1.L。
高写入场景:SolidigmD7-P5620

来源:Solidigm™内部数据
定位于高写入场景的SolidigmD7-P5620拥有业内领先的随机写入性能。其中的6.4TB型号在4KB随机读写测试中达到了39万IOPS。随机读性能则突破了百万大关,达到110万IOPS。在混合读写(70%读、30%写)测试中的成绩接近60万IOPS。

来源:Solidigm™内部数据
在高负荷之下,SSD能否提供稳定的性能表现也很重要,长尾读写延迟应尽量减少。在体现稳定性的IOPS一致性方面,SolidigmD7-P5620为读90%、写85%,可以提供符合预期的良好表现。
在 可管理性方面 ,SolidigmD7-P5620支持NVMeMI 1.1规范,包含MCTPOver SMBus、MCTPOver PCIe VDM。

来源:Solidigm™内部数据
混合读写场景:SolidigmD7-P5520
主打混合读写(读多写少)访问场景的SolidigmD7-P5520拥有四种形态,即U2、9.5mm厚E1.S、15mm厚E1.S、9.5mm厚度E1.L,其中:
- U.2产品容量规格包含1.92TB、3.84TB、7.68TB、15.36TB;
- 两个厚度的E1.S产品容量规格均为1.92TB、3.84TB、7.68TB;
- 加长款的E1.L产品特点是容量大,只有15.36TB一款。

SolidigmD7-P5520 的形态
来源:Solidigm™内部数据
高性能SSD的体型通常较大,那是因为需要更多的颗粒组成更多的读写通道,早期的SSD可以看到PCB上挤满颗粒。随着封装技术的进步,多颗NADNFlashDie(如4、8颗die)可以封装为一颗芯片,若干芯片再焊接在PCB,即使较为紧凑的空间内,也可以提供足够多数量的读写通道。随着3DNAND技术的发展,达到同样的容量所需的NAND颗粒不断减少,现在低容量的SSD性能常会明显低于同时代的其他型号,大概率就是受通道数量不足的影响,这种差异在消费类SSD上更为明显。
反过来看,为了保证性能(更多的通道、颗粒),那么高性能SSD的容量通常也会比较大,譬如上一篇中分析的SolidigmD7-P5510,它采用144层3DNAND介质,起跳容量为3.84TB,而上一代的DCP4510/4511的起跳容量为1TB。这就导致在新旧交替时期,新产品在1~2TB的小容量段中出现了空白。
从D7-P55201.92TB的起跳容量可以惊喜地看到,虽然与D7-P5510同为144层3DNAND介质,但为了满足用户需求,Solidigm在这一代提供了更多的容量选择。Die的数量减少,而性能依然有保障,要归功于若干技术革新,例如透过BBD(BlockBy Deck)和独立多平面读操作(IMPRO)等技术特性以提升介质本身的性能。

来源:Solidigm™内部数据
在BBD架构中,Solidigm将较大的阵列分为3个Deck,用虚拟层将每个Deck分开。为了更有效地擦除区块,每块Deck可以被擦除而不触及存储在其他Deck上的数据。每个Deck可以按不同的模式(SLC、QLC)运作,用以更好满足固体盘的设计需求。除了直接提升性能,BBD对垃圾回收也有极大的帮助,并能显著提高服务质量(QoS)。
为了提升随机读取性能,Solidigm还开发了独立多平面读操作(IMPRO)技术,通过将四个平面分割成可以异步读取的两个双平面组,使固态硬盘可以同时独立接收和执行读取命令,从而使读取操作的性能翻倍。这些性能改进需要配合NAND介质的一系列优化,譬如IMPRO的异步操作会产生噪音耦合,为了减轻这种影响,Solidigm配置了电荷泵、字线/位线调节器和降压(LDO)调节器,以驱动每个平面组中的独立负载。

来源:Solidigm™内部数据
性能,依旧是性能
在衡量SSD的可靠性时,通常会提到QoS(Qualityof Service,服务质量)。SSD的服务质量(QoS)是指在服务读/写工作负载时的延迟和IOPS性能的一致性和可预测性。QoS指标证明,对于特定时间段内测试的最坏情况的工作负载,SSD的延迟和IOPS状况处于特定范围内(通常为在预定时间段内多达至少99%的数据点),而不存在导致应用性能突然下降的意外异常值。QoS表现越好,意味着其性能越稳定,这对于现代企业应用有着非常重要的意义,比如证券等金融行业,其不仅要低延迟,还要求稳定的低延迟,突发的高延迟极大地增加了经济损失风险。
同时,QoS还对大规模数据中心有着无比重要的意义,在一个拥有数千台甚至数万台服务器的集群内,单个SSD的QoS性能表现,哪怕只有0.1%的差距,也会给大规模系统的稳定性带来极大的影响。
通过对DCP4510、D7-P5510和D7-P5520这三代产品的相同容量进行性能对比,可以直观地看到近年来的技术升级给用户应用所带来的性能增长。
4KB随机读取性能
相较早期产品提升多达57%,4KB随机写入提升多达80%,在4KB读写比为70/30的提升也达到了25%。
128KB顺序读取性能
较早期产品提升多达123%,128KB顺序写入提升了37%。从QoS也能看出D7-P5520性能一致性的表现非常出色。

来源:Solidigm™内部数据
由此我们可以看到,升级后的D7-P5520在以数据读取为主的应用场景中可以显著加速。
通过对DCP4610和D7-P5620的相同容量进行性能对比,可以看到无论是4KB随机读取或是写入,性能提升都多达50%以上,128KB顺序读取性能则较早期产品提升了2倍,128KB顺序写入也提升了20%。

来源:Solidigm™内部数据
由此我们可以看到,升级后的D7-P5620在以数据写入为主的应用场景中也有了非常明显的性能提升。
质量与可靠性嵌入式设计
一流的质量和可靠性始于原始设计。Solidigm在云计算和企业领域拥有数十年的经验,再加上源自英特尔的DNA,使Solidigm能够以全面的方式进行高质量的设计。

来源:Solidigm™内部数据
1、 关键组件设计
所有关键组件的设计,如控制器,NAND,固件等均由Solidigm亲自掌控。
2、 质量保证+第三方组件的内部认证
Solidigm通过全面的质量保证计划对第三方组件进行额外的质量检查,包括供应商可靠性审查和配合评估、供应商制造测试/偏差管理和持续的质量保证监控,以及第三方组件的全面内部鉴定(电应力、机械测试、架构验证)。
3、 增强型突然断电防护固件设计
几乎每个SSD供应商都会在重启时检查是否有足够的电量来恢复驱动器,但他们默认数据保存准确。Solidigm在固件检查中进行了设计,以额外验证数据在电源恢复时是否准确保存。这一点很重要,因为突然断电重启事件的发生频率比通常理解的要高,这可能会导致用户数据的损坏。
4、 强大、全面的端到端数据路径保护
未被检测到的数据损坏(Undetecteddatacorruption,也称为静默错误)发生的频率比感知到的要高,成本也非常高昂,某些控制器元件可能容易受到影响。为了更好地防止这种情况,Solidigm设计了额外的保护级别,包括:
- 内置冗余的ECC和CRC两种校验可以同时激活;
- 保护控制器内的所有关键存储配置:指令缓存、数据缓存、间接缓冲区和物理层缓冲区;
- SRAM的ECC覆盖率提高到99%以上,这是业界最高的覆盖率之一;
- 如果不确定是否发生了静默错误,可以重新启动驱动器。
Solidigm固态盘经过了超越行业规范以及行业惯例的严苛测试。
5、 持续改进已知和新的失效机制
DFMEA(designfailure mode and effectanalysis,设计失效模式和影响分析)是一个在设计过程中寻找潜在或概念性失效的过程,这些错误可能还没有发生就已经有了针对性的设计。在这个关键阶段,Solidigm的设计经验和深入的客户参与为该功能提供了极大的帮助。
结语
PCIe4.0倍增的带宽充分释放了当前NANDFlash和控制器的性能,也使得x4lane为基础的甜点形态延续了生命力。在SolidigmP5520、5620上,新控制器和介质还带来了IOPS的大幅提升,扩展了容量选择范围,并进一步完善了安全、远程操作等方面的可管理性。可以说这是一次面子和里子都令人满意的迭代。可以看出,无论是性能、QoS还是设计方面,Solidigim能够更好地支撑性能需求苛刻的应用场景,同时还有助于降低规模部署SSD后的运营成本。
当然,Solidigm不仅有SSD硬件产品,同时还提供诸多帮助用户监控、管理以及分析SSD的工具,比如VROC,其通过与英特尔处理器上的VMD技术相结合,在处理器层面,不以牺牲NVMeSSD的性能为前提,针对存储在NVMeSSD上的数据进行有效保护,后续我们会逐一介绍,敬请关注。
*文中涉及的其他名称及商标属于各自所有者资产
∨
所有明确列出的产品、计算机系统、日期和数字都是基于当前预期的初步设计,如有更改,恕不另行通知。
测试记录了特定测试中组件在特定系统中的性能。硬件、软件或配置上的差异将影响实际性能。在考虑购买时,请查询其他信息来源以对性能进行评估。
性能结果根据截至配置中所示日期已进行的测试得出,可能不会反映所有可公开获取的更新。有关详细信息,请参阅配置披露信息。没有任何产品或组件是绝对安全的。
Solidigm对非Solidigm产品的优化可能无法达到对Solidigm编译器或其他产品的优化程度。
Solidigm技术可能需要启用硬件、软件或服务激活。
在不同情况下,您的成本和结果可能会不同。
© Solidigm. “Solidigm”是SK hynix NAND Product Solutions Corp的商标。“Intel”是英特尔公司的注册商标。其他名称和品牌可能是其他公司的财产。