首页 / 专利库 / 资料储存系统 / 非易失性存储器 / 使用交叉写入分开晶片平面

使用交叉写入分开晶片平面

阅读:591发布:2020-05-11

专利汇可以提供使用交叉写入分开晶片平面专利检索,专利查询,专利分析的服务。并且本 发明 题为“使用交叉写入分开晶片平面”。在一个实施方案中,固态设备包括 控制器 和非易失性 存储器 。 非易失性存储器 包括多个晶片。每个晶片包括多个平面。第一 超平面 块 是由多个晶片的第一平面结构化。第二超平面块是由多个晶片的第二平面结构化。多个存储器操作指令在被控制器执行时使控制器接收第一数据流、将第一数据流写入第一超平面块、接收第二数据流以及将第二数据流写入第二超平面块。,下面是使用交叉写入分开晶片平面专利的具体信息内容。

1.一种固态设备,包括:
控制器
非易失性存储器,所述非易失性存储器包括多个晶片,每个晶片包括多个平面;
第一超平面,所述第一超平面块由所述多个晶片的第一平面结构化;
第二超平面块,所述第二超平面块由所述多个晶片的第二平面结构化;和多个存储器操作指令,所述多个存储器操作指令在被所述控制器执行时使所述控制器:
接收第一数据流;
将所述第一数据流写入所述第一超平面块;
接收第二数据流;以及
将所述第二数据流写入所述第二超平面块。
2.根据权利要求1所述的固态设备,其中所述多个存储器操作指令还使所述控制器将所述第一数据流的第一奇偶校验信息写入所述第一超平面块的XOR晶片的第一平面并且将所述第二数据流的第二奇偶校验信息写入所述第二超平面块的所述XOR晶片的第二平面。
3.根据权利要求1所述的固态设备,其中所述多个存储器操作指令还使所述控制器同时将所述第一数据流写入所述第一超平面块并且将所述第二数据流写入所述第二超平面块。
4.根据权利要求1所述的固态设备,其中所述多个晶片包括四层存储器单元。
5.根据权利要求1所述的固态设备,其中所述第一超平面块和所述第二超平面块形成可擦除单元。
6.根据权利要求1所述的固态设备,还包括逻辑页面高速缓存,其中所述多个存储器操作指令还使所述控制器将所述第一数据流刷新到所述第一超平面块并且将所述第二数据流刷新到所述第二超平面块。
7.一种固态设备,包括:
非易失性存储器,所述非易失性存储器包括具有多个平面的多个晶片;和控制器,所述控制器耦接到所述非易失性存储器,所述控制器被配置为:
将所述非易失性存储器结构化成多个超平面块,每个超平面块跨越所述多个晶片的分开平面;以及
将多个数据流写入所述多个超平面块中。
8.根据权利要求7所述的固态设备,其中所述多个数据流中的每个数据流被写入所述多个超平面块中的一个或多个。
9.根据权利要求8所述的固态设备,其中被写入所述多个超平面块的数据流的数量等于或小于所述平面的数量。
10.根据权利要求7所述的固态设备,还包括随机化所述超平面块的所述平面。
11.根据权利要求7所述的固态设备,还包括:
将多个数据流存储到逻辑页面高速缓存;以及
以基本上填充所述多个超平面块的尺寸刷新所述逻辑页面高速缓存。
12.根据权利要求11所述的固态设备,其中所述逻辑页面高速缓存选自主机高速缓存、SSD SRAM高速缓存、SSD DRAM高速缓存、SSD NAND闪存高速缓存以及它们的组合。
13.根据权利要求7所述的固态设备,其中所述非易失性存储器包括多个用户数据晶片和XOR晶片,其中所述控制器还被配置为:
将第一数据流的奇偶校验信息写入所述XOR晶片的第一平面;以及
将第二数据流的奇偶校验信息写入所述XOR晶片的第二平面。
14.根据权利要求13所述的固态设备,其中所述第一数据流和所述第二数据流在所述多个用户数据晶片上不交叉并且其中所述第一数据流的所述奇偶校验信息和所述第二数据流的所述奇偶校验信息在所述XOR晶片的所述第一平面和所述第二平面上交叉。
15.根据权利要求13所述的固态设备,其中所述控制器还被配置为:
将所述非易失性存储器结构化成第一超平面块和第二超平面块,所述第一超平面块跨越每个用户数据晶片的第一平面并且所述第二超平面块跨越每个用户数据晶片的第二平面;
将所述第一数据流写入所述第一超平面块;以及
将所述第二数据流写入所述第二超平面块。
16.根据权利要求15所述的固态设备,其中所述第一数据流和所述第二数据流在所述多个用户数据晶片上交叉并且其中所述第一数据流的所述奇偶校验信息和所述第二数据流的所述奇偶校验信息在所述XOR晶片的所述第一平面和所述第二平面上交叉。
17.根据权利要求15所述的固态设备,其中所述控制器还被配置为:
使被写入所述第一超平面块的所述第一数据流的所述奇偶校验信息无效;以及擦除所述第一数据流的所述奇偶校验信息而不导致所述第二数据流的所述奇偶校验信息的垃圾回收。
18.一种固态设备,包括:
控制器;
数据流支持装置,所述数据流支持装置用于在NAND闪存存储器上同时写入分开的数据;和
多个存储器操作指令,所述多个存储器操作指令在被所述控制器执行时使所述控制器同时将分开的数据写入所述数据流支持装置。
19.根据权利要求18所述的固态设备,其中所述分开的数据是来自数据流的用户数据。
20.根据权利要求18所述的固态设备,其中所述分开的数据是来自数据流的奇偶校验信息。

说明书全文

使用交叉写入分开晶片平面

[0001] 相关申请的交叉引用
[0002] 本专利申请要求于2018年10月18日提交的美国临时专利申请序列号62/747,525的权益,该美国临时专利申请以引用方式并入本文。

背景技术

技术领域

[0003] 本公开的实施方案整体涉及用于写入多个数据流的非易失性存储器(NVM)的固态设备(SSD)管理。
[0004] 相关技术的描述
[0005] SSD由于NAND操作的块擦除性质而受到写入放大的负面影响。SSD通过垃圾回收过程释放无效页面所消耗的存储空间。为了释放既具有有效(现有)数据又具有无效数据(被标记为要擦除的数据)的块中的空间,SSD擦除整个块并将有效数据移动或重写入新的块。与SSD的逻辑容量相比,重写有效数据的过程消耗更多物理容量,并放大SSD所执行的总写入。SSD被预留空间,来补偿这个与逻辑容量相比更多物理容量的需求。根据SSD上预留空间的量,写入放大因子可以从几乎1到无穷大的任何位置
[0006] 数据流是SSD从主机接收的顺序工作负荷,用于提高SSD的吞吐量。但是,如果多个数据流被一起写入SSD的同一块池或超块,则顺序工作负荷改变成随机化工作负荷,从而导致SSD性能劣化以及SSD的写入放大增大。因此,需要SSD的NVM块的经改进结构以及操作SSD的经改进方法。发明内容
[0007] 本文实施方案通常包括到超平面块的多个数据流的工作负荷跨越用户数据晶片和/或一个或多个XOR晶片的不同平面。
[0008] 在一个实施方案中,固态设备包括控制器非易失性存储器。非易失性存储器包括多个晶片。每个晶片包括多个平面。第一超平面块是由多个晶片的第一平面结构化。第二超平面块是由多个晶片的第二平面结构化。多个存储器操作指令在被控制器执行时使控制器接收第一数据流、将第一数据流写入第一超平面块、接收第二数据流以及将第二数据流写入第二超平面块。
[0009] 在另一实施方案中,固态设备包括控制器、数据流支持装置、和多个存储器操作指令。数据流支持装置用于在NAND闪存存储器上同时写入分开的数据。多个存储器操作指令在被控制器执行时使控制器同时将分开的数据写入数据流支持装置。
[0010] 在一个实施方案中,一种操作固态设备的方法包括将非易失性存储器结构化成第一超平面块和第二超平面块。第一超平面块由多个晶片的第一平面结构化,并且第二超平面块由多个晶片的第二平面结构化。第一数据流被写入第一超平面块。第二数据流被写入第二超平面块。
[0011] 在另一实施方案中,一种操作固态设备的方法包括提供包括具有多个平面的多个晶片的非易失性存储器。该非易失性存储器被结构化成多个超平面块。每个超平面块跨越多个晶片的分开的平面。多个数据流被写入到多个超平面块中。
[0012] 在另外一实施方案中,一种操作固态设备的方法包括提供包括多个用户数据晶片和XOR晶片的非易失性存储器。第一数据流的奇偶校验信息被写入在第一平面上或者XOR晶片的第一组平面上。第二数据流的奇偶校验信息被写入在第二平面上或者XOR晶片的第二组平面上。附图说明
[0013] 因此,通过参考实施方案,可以获得详细理解本公开的上述特征的方式、本公开的更具体描述、上述简要概述,所述实施方案中的一些在附图中示出。然而,应当注意的是,附图仅示出了本公开的典型实施方案并且因此不应视为限制其范围,因为本公开可以允许其他同等有效的实施方案。
[0014] 图1是示出包括主机和固态设备的系统的某些实施方案的示意图。
[0015] 图2是示出存储器阵列的某些实施方案的示意图。
[0016] 图3是示出四层单元(QLC)的阈值电压分布的某些实施方案的示意图。
[0017] 图4是示出将非易失性存储器结构化成多个超块的示意图。
[0018] 图5A是示出将非易失性存储器结构化成跨越具有两个平面的晶片的两个超平面块的某些实施方案的示意图。
[0019] 图5B是示出将非易失性存储器结构化成跨越具有四个平面的晶片的四个超平面块的某些实施方案的示意图。
[0020] 图6是在图5A和/或图5B的非易失性存储器的超平面块中支持两个数据流的某些实施方案的示意图。
[0021] 图7是能够独立地无效/垃圾回收或在没有垃圾回收的情况下擦除的超平面块结构化的SSD的某些实施方案的示意图。
[0022] 图8是示出在平面之间切换流的某些实施方案的示意图。
[0023] 图9是示出SSD超平面块被合并成超块的某些实施方案的示意图。
[0024] 图10A至图10B是示出具有八个超平面块的八平面晶片组织的SSD对多个数据流清除缓存的某些实施方案的示意图。
[0025] 图11是示出由于NVM的超平面块所提供的经改善效率而减小的较小逻辑页面高速缓存结构化的SSD的某些实施方案的示意图。
[0026] 图12是示出将数据流的奇偶校验信息写入在XOR晶片的分开平面上的某些实施方案的示意图。
[0027] 为了有助于理解,在可能的情况下,使用相同的参考标号来表示附图中共有的相同元件。可以设想是,在一个实施方案中公开的元件可以有利地用于其他实施方案而无需具体叙述。

具体实施方式

[0028] 在下文中,参考本公开的实施方案。然而,应当理解的是,本公开不限于具体描述的实施方案。相反,思考以下特征和元件的任何组合(无论是否与不同实施方案相关)以实现和实践本公开。此外,尽管本公开的实施方案可以实现优于其他可能解决方案和/或优于现有技术的优点,但是否通过给定实施方案来实现特定优点不是对本公开的限制。因此,以下方面、特征、实施方案和优点仅是说明性的,并且不被认为是所附权利要求书的要素或限制,除非在一条或多条权利要求中明确地叙述。同样地,对“本公开”的引用不应当被解释为本文公开的任何发明主题的概括,并且不应当被认为是所附权利要求书的要素或限制,除非在一条或多条权利要求中明确地叙述。
[0029] 术语“包括/包含”包括“由…构成/基本上由…构成”的子集含义,并且包括“由…构成/由…组成”的子集含义。
[0030] 结构化非易失性存储器的某些实施方案可扩展支持多个数据流的固态设备的耐用性、可靠性和/或性能。在某些实施方案中,到超平面块的多个数据流的工作负荷跨越用户数据晶片和/或一个或多个XOR晶片的不同平面就减小了写入放大因子、减小了写入同一平面的晶片争用、减小了超平面块的可擦除单元、简化了XOR操作和数据恢复,和/或减小了数据流高速缓存的大小和成本。
[0031] 图1是示出包括主机101和固态设备(SSD)102的系统100的某些实施方案的示意图。SSD 102包括非易失性存储器(NVM)110。NVM 110被配置用于信息的长期数据存储,并在通电/断电循环之后保持信息。NVM 110包括非易失性存储器设备的一个或多个阵列,诸如多个存储器晶片111-1至111-N。NVM 110可包括一种或多种类型的存储器设备。存储器设备的示例包括闪存存储器、相变存储器、ReRAM存储器、MRAM存储器、电可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、和其他固态存储器。NVM设备也可具有不同的配置。例如,闪存存储器设备可以NAND配置或NOR配置进行配置。由于与NOR闪存相比,NAND闪存的低成本以及高性能,NAND闪存存储器在企业应用中用于写入和读取大量数据。一个或多个存储器晶片111-1至111-N可表示被布置用于存储经由通道105-1至105-N可访问的数据的任何配置或任何类型的存储器晶片或设备。
[0032] SSD 102通过用于从主机101到SSD 102的通信进入以及从SSD 102到主机101的通信离开的主机接口103(诸如包括mac和phy部件)与主机101进行操作。SSD 102可为可移除存储器诸如存储卡的形式、可为嵌入式存储器系统的形式、或可为任何合适的形状因数。
[0033] SSD 102包括控制器140,用于控制NVM 110。主机接口103和NVM接口158可被视为控制器140的一部分。控制器140控制经由通道105-1至105-N对存储器晶片111-1至111-N的编程/写入、读取和擦除操作。控制器130可包括易失性存储器130,用于在SSD 102操作期间的短期存储或临时存储器。如果断电,则易失性存储器130不保持所存储的数据。易失性存储器的示例包括动态随机存取存储器(DRAM)132、静态随机存取存储器(SRAM)134和其他形式的易失性存储器。系统100可将数据流高速缓存或排队在主机101中的高速缓存中和/或SSD 102中的高速缓存中,诸如SRAM 134、DRAM 132和/或NVM。
[0034] 控制器140包括闪存转换层(FTL)160。FTL 160确定与主机命令和存储设备任务的逻辑块地址(LBA)相关联的物理块地址(PBA)。FTL 160可被存储在NVM 110中并被加载或部分加载到易失性存储器130。FTL 160可包括逻辑-物理(或虚拟-物理)数据地址映射162。主机设备101可利用逻辑数据地址来指代数据单元,并且控制器140可利用映射162指示将数据写入NVM 110以及从NVM读取数据。FTL 160可包括垃圾回收表164,用于将有效数据从所选择的具有无效数据的块移动到打开块或部分填充块并擦除所选择的块。FTL 160可包括耗损均衡计数器166,用于记录块的编程擦除循环的数量,以均衡NVM 110的块的使用。FTL 160可包括空闲块池168,其列出打开用于编程或可供用于编程的块。
[0035] 控制器140还可包括仲裁器150,该仲裁器有利于在对存储器晶片111的编程/写入、读取和擦除操作中在主机101和SSD 102之间的数据传输。控制器140还可包括错误校正模块136,该错误校正模块用于校正从存储器阵列所取的数据。错误校正模块136可在软件硬件中实现。错误校正模块136计算要写入NVM 110的主机数据的奇偶校验信息,诸如异或(XOR)奇偶校验信息或冗余校验和奇偶校验信息。奇偶校验信息和解码算法一起验证并校正从存储器阵列所取的数据。错误校正模块所使用的解码的示例包括Hamming、Reed-Solomon、Bose-Chaudhuri-Hocquenghem、和低密度奇偶校验解码。控制器140还包括错误代码校正模块154。
[0036] 本文所述的技术也可实施或编码在包括被编码以指令的计算机可读存储介质的制品中。嵌入或编码在包括计算机可读存储介质的制品中的指令可使一个或多个可编程处理器或其他处理器实施本文所述的一种或多种技术,诸如当包括或编码在计算机可读存储介质中的指令被一个或多个处理器执行时。计算机可读存储介质可包括随机存取存储器(RAM)、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、闪存存储器、硬盘、光盘ROM(CD-ROM)、软盘、盒、磁介质、光学介质或其他计算机可读介质。在一些示例中,制品可包括一个或多个计算机可读存储介质。在一些示例中,计算机可读存储介质可包括非暂态介质。术语“非暂态”可指示存储介质不是在载波或传播信号中实现。
[0037] 在某些实施方案中,控制器140执行计算机可读程序代码(例如,软件或固件)可执行指令(在本文中称为“指令”)。指令可以由控制器140的各种部件执行,该各种部件诸如处理器、神经网络、逻辑开关、专用集成电路(ASIC)、可编程逻辑控制器、嵌入式微控制器以及控制器140的其他部件。
[0038] 图2是示出存储器阵列310的某些实施方案(诸如图1的存储器晶片111的存储器阵列)的示意图。如图所示,存储器阵列310为3D或垂直NAND存储器阵列或位成本可缩放(BiCS)单元阵列,但也可使用其他存储器阵列。存储器阵列310由多个页面390构成。每个页面390包括一组NAND串350(示出四个NAND串)。每组NAND串350共同连接到位线380。每个页面390具有其自身的位线380,该位线根据页面390的数量从BL0编号到BLM。每个NAND串350包括选择栅极漏极晶体管(SGD)、多个存储器单元360A-360N、和选择栅极源极晶体管(SGS)。一行存储器单元共同连接到字线(WL)370。字线(WL0,WL1等)的数量取决于NAND串350中存储器单元的数量。每个SGS晶体管的源电极沿线385耦接在一起。
[0039] 存储器单元360A-360N由具有电荷存储元件用于存储表示存储器状态的给定量电荷的晶体管构成。存储器单元360A-360N可在每个单元存储一个存储器位的单层单元(SLC)、每个单元存储两个存储器位的多层单元(MLC)、每个单元存储三个存储器位的三层单元(TLC)、每个单元存储四个存储器位的四层单元(QLC)、或每个单元存储任意数量的位的任何类型的存储器单元中操作。页面390是作为组被编程和读取的一组存储器单元。多个页面390构成块395。单个块395中的存储器单元通常一起擦除。
[0040] 本文所述的实施方案不限于图2中所述的三维存储器阵列,而是涵盖所有相关的存储器结构。其他阵列也是可能的,诸如以U形状形成的三维NAND串、二维存储器阵列、或由任何存储级存储器构成的其他存储器阵列。多个存储器阵列诸如相同类型或混合类型的存储器阵列可在分开的晶片上形成,然后被封装在一起。
[0041] 图3是示出四层单元(QLC)362(诸如构成图1的一个或多个存储器晶片111的图2的存储器单元360)的阈值电压分布的某些实施方案的示意图。QLC 362每个单元存储四个位,如由可能阈值电压364所划界,被划分成十六个区域以划界十六个可能的存储器状态。示出了由十六个可能存储器状态364表示的4位格雷编码366的一个示例,但是若干其他4位格雷编码也是可能的。十六个存储器状态中的每一个表示高位、中高位、中低位、和低位的四元组。存储器阵列的四个代码位(即,高位、中高位、中低位、和低位)的阈值电压可在多个巡回中被读取或编程。例如,在读取期间,表示存储器阵列的低位的阈值电压可在一个巡回中被读取,并且表示高位的阈值电压可在另一巡回中被读取。例如,在编程中,存储器阵列的阈值电压可在多个巡回中被编程和验证,直到达到最终期望的阈值电压。由于多个可能阈值电压电平,QLC存储器单元的执行时间比TLC存储器单元的执行时间长。TLC存储器单元的执行时间比MLC存储器单元的执行时间长。MLC存储器单元的执行时间比SLC存储器单元的执行时间长。
[0042] 每当存储器单元被编程时,存储器栅极就会被耗损或损坏。对于操作多个阈值电压状态(即,每个单元存储两个或更多个位)的存储器单元,由于实现最终期望阈值电压状态所需的多个巡回编程,存储器栅极经历高平的耗损。类似地,对于每个单元存储更多位的存储器单元,对存储器栅极由于多个阈值电压状态和阈值电压状态之间的测量阈值而导致的误差的容限较小。存储多个阈值电压电平单元的存储器栅极由于阈值电压的伴随移位而对电荷泄漏具有较低容限。由于存储器栅极上的耗损并且由于对测量阈值电压状态中的误差的容限较低,QLC存储器单元的耐久性(即,存储器设备寿命期间的编程/擦除循环的数量)低于TLC存储器单元的耐用性。TLC存储器单元的耐用性低于MLC存储器单元。MLC存储器单元的耐用性低于SLC存储器单元。
[0043] 图4-12是示出结构化NVM以支持将数据流(即,顺序工作负荷)从主机写入SSD的各种实施方案的示意图,诸如利用图3的QLC存储器单元的图1的系统100,并且为了便于描述,为元件使用类似标号。各种实施方案也适用于其他系统和其他类型的存储器设备/单元。将流数据从主机101写入SSD 102的NVM 110可以来自主机101的高速缓存,来自SSD 102的高速缓存,和/或数据从主机101直接写入SSD 102而没有高速缓存(诸如当SSD 102充当主机101的虚拟存储器时)。数据流可通过流ID来标识,以帮助管理数据流。
[0044] 图4是示出将NVM 110结构化成多个超块50A的示意图。每个晶片111-1至111-N包括多个平面10。图4示出了每个晶片111两个平面10,但晶片可包括任意数量的平面,诸如2、4、6、8或更多个平面。并行操作可在每个平面10上进行。每个平面10包含多个块20,这些块通常是可被擦除的最小单元。每个块包含多个页面30,这些页面通常是可被编程或读取的最小单元。
[0045] SSD可结构化在超块50中,以提供专用流支持以提高SSD的性能。例如,如图4所示,超块50包括在晶片111-1至111-N中的每一者的每个平面10上条带化的一个或多个块20,用于存储数据流以提高SSD的性能和带宽。对于高性能SSD,数据流被同时或并行地写入超块50的多个晶片111上的多个页面30。类似地,可同时或并行地执行超块50的多个晶片111上的页面30的读取操作。
[0046] 超块50通过将所有通道105-1至105-N跨越在NVM接口158和NVM 110之间以使得能够实现对NVM 110上的晶片111-1至111N的并行操作。并行操作提高SSD的性能。超块50还可存储用于逻辑-物理地址映射的元数据,以减少FTL 160的工作负荷,从而进一步提高SSD的性能。
[0047] 奇偶校验信息诸如异或(XOR)奇偶校验信息可以与超块50中的数据流存储在同一晶片上,或者在超块50中的单独晶片上组合在一起。在SSD的企业应用中,希望提供完全晶片冗余以在其中一个晶片发生故障或不可读取的情况下保护用户数据。可通过将奇偶校验信息存储在与用户数据分开的一个或多个晶片上来提供完全晶片冗余。例如,如图4所示,数据流52被存储在超块50的第一组用户数据晶片72中,并且数据流的奇偶校验信息54被组合在一起并存储在超块50的单独一个或多个XOR晶片74中。如果存储数据流52的用户数据晶片72中的一个晶片发生故障,则可从一个或多个XOR晶片74上的奇偶校验信息54恢复数据流52。如果数据流52和奇偶校验信息54被写入在同一晶片上,则在晶片发生故障的情况下,数据流将不可恢复。
[0048] SSD可提供多个超块50以支持多个数据流。例如,超块50A可支持数据流52A,并且超块50B可支持数据流52B。支持多个数据流52的多个超块50的一个缺点是多个流数据对同一晶片111的同一平面10的操作(即,编程、读取、擦除)的晶片争用。例如,在两个数据流诸如数据流52A和数据流52B被写入同一晶片111上的同一平面10的情况下,数据写入的执行不能同时发生于同一平面10。相反,SSD将数据流52A的一部分写入平面10,然后SSD将数据流52B的一部分写入平面10,然后SSD将数据流52A的一部分写入平面10。写入执行在写入数据流52A和写入数据流52B到平面10之间来回切换。因为SSD 102不能同时将两个数据流从主机101写入同一晶片111的同一平面10,所以数据流52A、52B的一部分在这两个数据流的写入执行之间来回切换期间被高速缓存在主机101中或被高速缓存在SSD 102中,从而导致性能损失。晶片争用可能不良地导致晶片111的性能降低约20%。
[0049] 在SSD的企业应用中,大量流数据被存储在超块50中。由每个单元存储多个位的NAND存储器设备(诸如QLC单元或TLC单元)构成的SSD具有适于存储大量数据的更高容量。期望SSD的高每秒输入/输出操作(IOPS)性能以改善主机和SSD的整体系统的性能。随着NAND存储器设备每个单元存储更多位,编程、读取和擦除的执行时间不良地増大。另外,随着NAND存储器设备每个单元存储更多位,NAND设备的耐用性(即,寿命期间的编程/擦除循环的数量)不良地降低。包括来自QLC单元的超块50的SSD由于晶片争用而遭受降低的性能。
[0050] 由于QLC单元具有低的写入性能和低的耐用性,因此希望将整个超块50作为一个单元擦除而没有任何垃圾回收。超块50的任何垃圾回收通过添加读取和写入操作将有效数据移动到打开页面而降低晶片的性能,并且通过添加到超块50的块20的耗损而降低耐用性。
[0051] 图5A是示出将NVM 110结构化成跨越具有两个平面的晶片的两个超平面块60的某些实施方案的示意图。每个晶片111-1至111-N包括多个平面10。图5A示出了每个晶片111两个平面10,但晶片111可包括任意数量的平面,诸如2、4、6、8或更多个平面。并行操作可在每个平面10上进行。每个平面10包含多个块20,这些块通常是可被擦除的最小单元。每个块包含多个页面30,这些页面通常是可被编程或读取的最小单元。
[0052] 在某些实施方案中,超平面块60包括跨越晶片111-1至111-N中每一者的某个平面10的一个或多个块20,用于存储流数据以提高SSD 102的性能。例如,如图5A所示,超平面块
60包括在晶片111-1至111-N中每一者的每个平面10上条带化的一个或多个块20,用于存储数据流以提高SSD的性能。对于SSD 102的高性能,数据流被同时或并行地写入超平面块60的多个晶片111上的多个页面30。类似地,可同时或并行地执行超平面块60的多个晶片111上的页面30的读取操作。
[0053] 超平面块60使得能够实现对NVM 110上的晶片111-1至111-N的并行操作。并行操作提高SSD的性能。超平面块60还可存储用于逻辑-物理地址映射的元数据,以减少FTL 160的工作负荷,从而进一步提高SSD 102的性能。
[0054] 在某些实施方案中,数据流的奇偶校验信息64诸如异或(XOR)奇偶校验信息被一起组合在超平面块60中与超平面块60中的数据流分开的晶片上以实现完全晶片冗余,但在其他实施方案中,奇偶校验信息可被存储在与数据流相同的晶片上。在SSD的企业应用中,希望提供完全晶片冗余以在其中一个晶片发生故障或不可读取的情况下保护用户数据。可通过将奇偶校验信息存储在与用户数据分开的一个或多个晶片上来提供完全晶片冗余。例如,如图5A所示,数据流62被存储在超平面块60的一组用户数据晶片72中,并且数据流的奇偶校验信息64被组合在一起并存储在超平面块60的单独一个或多个XOR晶片74中。如果存储数据流62的用户数据晶片72中的一个晶片发生故障,则可从一个或多个XOR晶片74上的奇偶校验信息64恢复数据流62。如果数据流62和奇偶校验信息64被写入在同一晶片上,则在晶片发生故障的情况下,数据流将不可恢复。
[0055] 在某些实施方案中,NVM 110可由不同类型的晶片111构成。例如,存储数据流62的用户数据晶片72可包括每个单元存储多个位的存储器单元,诸如QLC或TLC存储器单元。存储奇偶校验信息64的一个或多个XOR晶片74可包括与用户数据晶片72的存储器单元相比每个单元存储更少位的存储器单元。例如,一个或多个XOR晶片74可包括MLC或SLC存储器单元,使得奇偶校验信息64被写入较高耐用性存储单元,以防在存储数据流62的用户数据晶片72的晶片发生故障的情况下发生数据恢复。
[0056] SSD 102可提供多个超平面块60以支持多个数据流。例如,对于具有两个平面的晶片,平面10A和平面10B在图5A中示出,超平面块60A包括跨越所有用户数据晶片72的平面10A的一个或多个块20,并且超平面块60B包括跨越所有用户数据晶片72的平面10B的一个或多个块20。超平面块60A、60B可支持两个数据流:数据流62A和数据流62B,其中操作同时被执行到同一晶片,因为操作正在不同的平面10A、10B上发生。
[0057] 由于数据流62A和数据流62B被写入在不同的平面10A、10B上,因此不存在任何由于对同一平面执行操作的切换而导致不期望的数据高速缓存的晶片争用。SSD 102可在所有用户数据晶片72上将两个数据流62A、62B的页面30写入分开的平面10A、10B。数据流62A和数据流62B在NVM接口158和NVM 110的用户数据晶片72之间的所有通道105上交叉,以提供高性能SSD 102,而没有由于从不同数据流对同一平面的并发操作所导致的晶片争用。数据流62A的奇偶校验信息64A和数据流62B的奇偶校验信息64B在NVM接口158和NVM 110的一个或多个XOR晶片74之间的所有通道105上交叉,以提供高性能SSD 102,从而避免由于从不同数据流对同一平面的并发操作所导致的晶片争用。超平面块60A和超平面块60B的并发交叉操作帮助提高包括每个存储器单元存储多个位的用户晶片72(诸如QLC或TLC存储器单元)的NVM的SSD 102的性能。
[0058] 尽管图5A中示出了两个平面,平面10A和平面10B,但是晶片111可包括任意数量的平面,诸如2、4、6、8或更多个平面。例如,每个晶片111具有四个平面的SSD 102可具有四个超平面块60,如图5B所示。图5B是示出将非易失性存储器结构化成跨越具有四个平面10的晶片111的四个超平面块60的某些实施方案的示意图。超平面块60A、60B、60C、60D分别跨越平面10A、10B、10C、10D。四个或更少的数据流可被写入到超平面块60A、60B、60C、60D的用户数据晶片72中。四个或更少的数据流的奇偶校验信息可被写入到超平面块60A、60B、60C、60D的XOR晶片74中。例如,每个晶片111具有六个平面的SSD 102可具有六个超平面块60。例如,每个晶片具有八个平面的SSD 102可具有八个超平面块。
[0059] 图5A和5B的每个超平面块60A-N可在被写入到此类超平面块60中的数据流的无效或更新的情况下作为擦除单元被擦除。将超平面块60作为擦除单元进行擦除可提供来自垃圾回收的零数据重定位。作为擦除单元的超平面块60被擦除而没有数据重定位,并且被标记为空闲块或空闲平面池中的可用块。将超平面块60作为擦除单元进行擦除就将写入放大因子减小至1,因为SSD 102不执行任何附加的写入。总NAND闪存写入被减少,并且因此提高SSD 102的性能和耐用性要求。
[0060] 在某些实施方案中,超平面块60的擦除单元的尺寸等于晶片111的平面10的尺寸乘以超平面块60的晶片的数量。例如,对于具有两个平面的晶片111,超平面块60的擦除单元等于晶片111的尺寸乘以超平面块60的晶片的数量的一半。例如,对于具有四个平面的晶片111,超平面块60的擦除单元等于晶片111的尺寸乘以超平面块60的晶片的数量的1/4。例如,对于具有六个平面的晶片111,超平面块60的擦除单元等于晶片111的尺寸乘以超平面块60的晶片的数量的1/6。例如,对于具有八个平面的晶片111,超平面块60的擦除单元等于晶片111的尺寸乘以超平面块60的晶片的数量的1/8。在SSD的企业应用中,最小化擦除单元的尺寸就提高SSD的性能,因为晶片111的平面10的数量越多,需要被刷新到超平面块60的主机101或SSD 102的高速缓存尺寸越小。相比之下,类似容量晶片的平面的数量越多,图4的超块50的擦除单元越大。
[0061] 图6是图5A和/或图5B的NVM 110的超平面块60中支持两个数据流的某些实施方案的示意图,并且为了便于描述,为元件使用类似的数字。当系统100需要新的超平面块60时,平面10被从平面空闲池70获取并被条带化在一起作为超平面块60。例如,平面空闲池70A包含晶片111的平面10A,其被条带化在一起形成超平面块60A。平面空闲池70B包含晶片111的平面10B,其被条带化在一起形成超平面块60B。
[0062] 形成超平面块60A和超平面块60B就在不同平面10上交叉在用户数据晶片72的通道105上写入数据流62A和数据流62B,从而消除晶片争用。超平面块60A和超平面块60B可以以分开的数据流62A和数据流62B写入,同时避免将两个数据流的数据写入同一平面。这两个数据流被写入同一组用户数据晶片72和一个或多个XOR晶片74,而不必为不同数据流在同一平面上的同一晶片上的块20之间切换。在某些实施方案中,数据流62A始终在平面10A上,并且数据流62B始终在平面10B上。在某些实施方案中,数据流62A可在每个用户数据晶片72上并行写入平面10A,同时数据流62B在每个用户数据晶片72上并行写入平面10B。来自同一平面上多个数据流之间切换的晶片争用被避免,并且SSD的性能被提高。在某些实施方案中,到同一晶片的分开平面10上的并行块的两个数据流提供另一性能増强,因为共享的信号命令可用于对这些块进行编程、读取或擦除。
[0063] 在某些实施方案中,形成超平面块60A和超平面块60B就在不同平面10上交叉XOR晶片74的通道105上数据流62A和数据流62B的奇偶校验信息64A,消除用于将奇偶校验信息64写入到一个或多个XOR晶片74中的晶片争用。数据流62A的奇偶校验信息64A被写入在超平面块60A的XOR晶片74的平面10A中,并且数据流62B的奇偶校验信息64B被写入在XOR晶片
74的平面10B中。XOR晶片74与存储流数据的用户数据晶片72分开以用于完全晶片冗余,以防用户数据晶片72或XOR晶片74发生故障。
[0064] 图7是被结构化以超平面块60的SSD的某些实施方案的示意图,超平面块可独立地无效/垃圾回收或擦除而没有垃圾回收,诸如图5A和图5B的超平面块60,并且为了便于描述,为元件使用类似的数字。
[0065] 超平面块60A、60B是独立的。超平面块60A可独立于超平面块60B或其他超平面块(如果在系统100中有两个以上的超平面块(即,四个、六个、八个或更多个超平面块)的话)被无效/垃圾回收或者被擦除而没有垃圾回收。即使数据流被同时写入,也可以发生独立的无效/垃圾回收或擦除。
[0066] 如果主机101覆写或无效被存储在超平面块60A中的数据流62A的一部分,则超平面块60A的块20可被垃圾回收和擦除,并且释放被置于空闲块池或空闲平面池中的块。由于两个数据流分别被存储在超平面块60A和超平面块60B中,所以覆写或无效被写入在超平面块60A中的数据流62A并不导致被写入在超平面块60B中的数据流62B的垃圾回收。覆写或无效被写入在超平面块60B中的数据流62B并不导致被写入在超平面块60A中的数据流62A的垃圾回收。由于一个数据流的有效数据并不由于另一数据流的无效数据而被移至新块,因此写入放大被减小。
[0067] 超平面块避免SSD 102将多个数据流写入在图4的跨越同一平面10的多个超块50中。将所有数据流写入到同一平面10或超块50中将导致在一个特定数据流被新数据覆写的情况下其他有效数据流的垃圾回收。如果多个数据流被写入图4的跨越同一平面10的多个超块50,则写入放大因子变得大于1,并且可变得与随机工作负荷的情况一样高。
[0068] 图8是在平面10诸如图5A和图5B的平面10之间随机化流的某些实施方案的示意图,并且为了便于描述,为元件使用类似的数字。当超平面块60被形成并被映射到数据流时,超平面块60的平面10被改变/或随机化以帮助NVM 110的晶片111之间的耗损均衡。在平面之间随机化数据流就减少单个数据流支配任何特定平面以及导致平面的不均匀耗损或对平面的不均匀操作。
[0069] 例如,第一超设备810由来自晶片111上的两个超平面块60A、60B形成。数据流62A被写入晶片的平面10A上的超平面块60A,并且数据流62B被写入晶片111的平面10B上的超平面块60B。在第一超设备810的一个或两个超平面块60被擦除并且在平面空闲池中之后,第二超设备820由来自NVM晶片上的两个超平面块60A、60B形成。数据流62A被写入晶片111的平面10B上的超平面块60A,并且数据流62B被写入晶片的平面10A上的超平面块60B。在第二超设备820的一个或两个超平面块60被擦除并且在平面空闲池中之后,第三超设备830由来自晶片111上的两个超平面块60A、60B形成。数据流62A被写入晶片111的平面10A上的超平面块60A,并且数据流62B被写入晶片111的平面10B上的超平面块60B。
[0070] 虽然图8示出了数据流62A、62B在新的超设备形成之后交替地分配给平面10A、10B,但数据流62A、62B可被分配给随机化平面(即,与在先超设备相同的平面或不同的平面)。
[0071] 图9是示出超平面块(诸如图5A-5B的超平面块60)被合并成超块(诸如图4的超块50)的某些实施方案的示意图,并且为了易于描述,为元件使用类似的数字。初始写入910分别将数据流A和数据流B写入NVM110的超平面块60A、60B。
[0072] 在某些实施方案中,NVM的后续写入920(诸如当超平面块60A、60B已被关闭或被完全写入时)将超平面块60A、60B重新映射到在晶片111的所有平面10上条带化的超块50A、50B中,具有来自垃圾回收的零数据重定位。被重新映射到超块50A、50B中的数据流将流数据保持在一起,这可能被一起无效。
[0073] 在某些实施方案中,NVM的后续写入920,诸如当被存储在超平面块60A中的数据流62A被随机无效时,对超平面块60A执行垃圾回收,其中有效数据被移动到超块50A中。如果被存储在超平面块60B中的数据流61B被随机无效,则对超平面块60B执行垃圾回收,其中有效数据被移动到超块50B中。如果被存储在超平面块60B中的数据流6B被关闭或被完全写入,则超平面块60B被重新映射到超块50B中,具有来自垃圾回收的零数据重定位。
[0074] 图10A-10B是示出以具有八个超平面块(诸如图5A和图5B的超平面块60)的八平面晶片组织的SSD对多个数据流(诸如来自主机101或SSD102的高速缓存)清除缓存的某些实施方案的示意图,并且为了便于描述,为元件使用类似的数字。
[0075] 图10A示出某些实施方案,其中八个数据流A-H正以相同速率或大致相同速率被写入超设备并且正以相同速率或大致相同速率填充每个超平面块60A-60H。
[0076] 图10B示出某些实施方案,其中五个数据流正以不同速率被写入超设备。不同的速率可以是由来自主机101的数据流的停滞或各种其他导致一些数据流比其他数据流更快地被传输的因素导致。控制器140可将数据流分配给多个超平面块60,而不是仅一个超平面块。例如,如图10B所示,数据流A正以比数据流E更快的速率被写入。数据流E正以比数据流F、数据流G、或数据流H更快的速率被写入。数据流A被分配给三个超平面块60A-1、60A-2、60A-3。数据流E被分配给两个超平面块60E-1、60E-2。数据流F、G、H分别被分配给一个超平面块60F、60G、60H。
[0077] 被写入超平面块60的超设备的并行数据流的数量是超设备的用户数据晶片72的平面10的数量的函数。如果用户数据晶片72具有两个平面10,则两个并行数据流或一个数据流可被写入超平面块60的超设备。如果用户数据晶片72具有四个平面10,则四到两个并行数据流或一个数据流可被写入超平面块60的超设备。如果用户数据晶片72具有六个平面10,则六到两个并行数据流或一个数据流可被写入超平面块的超设备。如果用户数据晶片
72具有八个平面10,则八到两个并行数据流或一个数据流可被写入超平面块的超设备。SSD 
102将每个数据流分别写入到一个或多个平面10中就使得给定数据流的任何覆写不导致其他数据流的垃圾回收,由此减小写入放大。
[0078] 图11是示出以由于NVM的超平面块60所提供的经改善效率而减小的较小逻辑页面高速缓存结构化的SSD的某些实施方案的示意图。在某些实施方案中,NVM 110(即,被高速缓存在SLC存储器单元中的NAND)、易失性存储器130(即,被高速缓存的DRAM/SRAM)、和/或主机101的易失性存储器被用作逻辑页面高速缓存1110。系统100的性能是逻辑页面高速缓存1110可如何有效地被使用的函数。系统100的成本与逻辑页面高速缓存1110的大小逆反。由于成本而希望逻辑页面高速缓存1110小,但小的逻辑页面高速缓存1110可能在将多个数据流提取到NVM 110的用户数据晶片72以用于长期存储中是效率低下的。为了NAND存储器单元的有效操作,每个数据流的多个数据页面需要被提取到NAND存储器单元的NVM 110。
[0079] 在某些实施方案中,用户数据晶片72包括每个单元存储较高位的存储器单元,诸如QLC、TLC或MLC存储器单元。具有高数据存储容量的用户数据晶片72使得整个逻辑页面高速缓存1110能够被刷新到SSD的用户数据晶片72的超平面块60。在某些实施方案中,等值多个数据流的整个超平面块60可以被刷新到SSD。每个超平面块60可被作为在超平面块中的整个数据流被覆写或无效的情况下被一起擦除的可擦除单元来对待。超平面块60具有由于数据流在不同平面上的交叉而具有高性能的属性,并且具有作为晶片平面数量的函数的尺寸减小的可擦除单元的属性。每个数据流需要被分阶段在逻辑页面高速缓存1110中的数据的量减少。对于慢数据流(或所有流以相同速率或大致相同速率写入),需要被聚结在逻辑页面高速缓存1110中以填充NAND存储器设备的可擦除单元的最小数据量减小晶片111中的平面10的数量(即,在八平面NAND中减小因子8)。相比而言,图4的超块50的可擦除单元的尺寸随平面数量而増大。
[0080] 由于包括每单元存储更高位的存储器单元(诸如QLC、TLC或MLC存储器单元)的用户数据晶片72具有更高的容量,因此可以使逻辑页面高速缓存1110更小,因为逻辑页面高速缓存1110的全部内容可被刷新到超平面块60中的NVM的用户数据晶片72,而没有晶片争用。
[0081] 图12是示出在分开的平面10A、10B或者在一个或多个XOR晶片74的分开组的平面诸如图5A和图5B的超平面块60上写入数据流的奇偶校验信息的某些实施方案的示意图,并且为了便于描述,为元件使用类似的数字。不同的数据流62A、62B被写入不同的用户数据晶片72,但奇偶校验信息64A、64B被存储在相同的一个或多个XOR晶片74上,但被存储在不同的平面10上或不同组平面上。数据流62A、62B不交叉,但奇偶校验信息64A、64B交叉。奇偶校验信息64A、64B被保持与用户数据晶片72分开,以提供完全晶片冗余。奇偶校验信息64A、64B在不同平面10A、10B上或在XOR晶片或XOR晶片组的不同组平面上交叉,以消除一个或多个XOR晶片的晶片争用。例如,对于具有两个以上平面的XOR晶片(诸如四平面NAND晶片或八平面NAND晶片),奇偶校验信息64A被写入在第一组平面上,并且奇偶校验信息64B被写入在不同于第一组平面的第二组平面上。
[0082] 可能需要不同的用户数据晶片72,这是由于在晶片111的不同NVM组1210A、1210B中结构化NVM 110以提供服务质量隔离区域,其中对一个晶片的操作不影响另一晶片的操作。图12所示的NVM组1210A、1210B通过将XOR奇偶校验信息在一个或多个XOR晶片74上分开的平面10A、10B上交叉来提供完全晶片冗余和XOR晶片的提高的性能。
[0083] 在不同平面10A、10B上或在不同组平面上交叉数据流62A、62B的奇偶校验信息64A、64B就消除了在对一个或多个XOR晶片74的操作期间的晶片争用。此外,不同平面10A、
10B上或不同组平面上数据流62A、62B的奇偶校验信息64A、64B减少了垃圾回收以及一个或多个XOR晶片74的写入放大。例如,如果被存储在NVM组1210A中的数据流62A的一部分被覆写或更新,则奇偶校验信息64A被更新,而不导致数据流62B的奇偶校验信息64B的垃圾回收。如果被存储在NVM组1210B中的数据流62B的一部分被覆写或更新,则奇偶校验信息64B被更新,而不导致数据流62A的奇偶校验信息64A的垃圾回收。另外,将奇偶校验信息64A、
64B写入在分开的平面10A、10B上或一个或多个XOR晶片74的分开组平面上就避免将不同数据流62A、62B的奇偶校验信息异或在一起以及为了数据恢复而对不同数据流的奇偶校验信息进行反异或。
[0084] 结构化非易失性存储器的某些实施方案可扩展支持多个数据流的固态设备的耐用性、可靠性和/或性能。在某些实施方案中,到超平面块的多个数据流的工作负荷跨越用户数据晶片和/或一个或多个XOR晶片的不同平面就减小写入放大因子。覆写或更新一个数据流并不导致另一数据流和/或另一数据流的奇偶校验信息的垃圾回收。在某些实施方案中,到超平面块的多个数据流的工作负荷跨越用户数据晶片和/或一个或多个XOR晶片的不同平面就减少写入同一平面的晶片争用。不同数据流的写入可同时或并行发生到晶片的不同平面,而不导致在对同一平面的数据流写入执行之间来回切换。在某些实施方案中,到超平面块的多个数据流的工作负荷跨越用户数据晶片和/或一个或多个XOR晶片的不同平面就减小超平面块的可擦除单元。随着晶片的平面的数量増加,可一起擦除的整个超平面块的可擦除单元变得更小。在利用每个单元存储较高位的NAND存储器单元诸如QLC存储器单元的企业应用中,较小的可擦除单元是理想的。较小的可擦除单元允许来自数据流的较小单位的数据在被刷新到超平面块之前被存储到高速缓存。擦除整个超平面块就避免垃圾回收并且由于较低的写入放大而提供经改善的耐用性。在某些实施方案中,到超平面块的多个数据流的工作负荷跨越一个或多个XOR晶片的不同平面就简化了XOR操作以及在用户晶片发生故障的情况下的数据恢复。更新一个数据流的奇偶校验信息并不导致另一数据流的奇偶校验信息的垃圾回收。将多个数据流的组合奇偶校验信息写入一个或多个XOR晶片的分开的平面上就避免了组合奇偶校验信息的异或/反异或操作。在某些实施方案中,到超平面块的多个数据流的工作负荷跨越用户数据晶片和/或一个或多个XOR晶片的不同平面就减小数据流高速缓存的大小和成本。整个数据流高速缓存被刷新到超平面块,从而提高数据流高速缓存的更高效率。
[0085] 在一个实施方案中,固态设备包括控制器和非易失性存储器。非易失性存储器包括多个晶片。每个晶片包括多个平面。第一超平面块是由多个晶片的第一平面结构化。第二超平面块是由多个晶片的第二平面结构化。多个存储器操作指令在被控制器执行时使控制器接收第一数据流、将第一数据流写入第一超平面块、接收第二数据流以及将第二数据流写入第二超平面块。
[0086] 在另一实施方案中,固态设备包括控制器、数据流支持装置、和多个存储器操作指令。数据流支持装置用于在NAND闪存存储器上同时写入分开的数据。多个存储器操作指令在被控制器执行时使控制器同时将分开的数据写入数据流支持装置。
[0087] 在一个实施方案中,一种操作固态设备的方法包括将非易失性存储器结构化成第一超平面块和第二超平面块。第一超平面块由多个晶片的第一平面结构化,并且第二超平面块由多个晶片的第二平面结构化。第一数据流被写入第一超平面块。第二数据流被写入第二超平面块。
[0088] 在另一实施方案中,一种操作固态设备的方法包括提供包括具有多个平面的多个晶片的非易失性存储器。非易失性存储器被结构化成多个超平面块。每个超平面块跨越多个晶片的分开平面。多个数据流被写入到多个超平面块中。
[0089] 在另外一实施方案中,一种操作固态设备的方法包括提供包括多个用户数据晶片和XOR晶片的非易失性存储器。第一数据流的奇偶校验信息被写入在XOR晶片的第一平面上。第二数据流的奇偶校验信息被写入在XOR晶片的第二平面上。
[0090] 虽然前述内容针对本公开的实施方案,但是可以在不脱离本公开的基本范围的情况下设想本公开的其他和另外的实施方案,并且本公开的范围由所附权利要求书确定。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈