html
固态硬盘以其相当强的耐用性而闻名,具有 没有活动部件、没有易损的读写头,也没有旋转的盘片。大多数情况下,这种声誉是准确的。但当SSD确实发生故障时,往往是突然发生的,而监控工具在预测故障方面的帮助有限。
大多数SSD并不是因为制造质量差而损坏,而是因为它们被用于未曾优化的方式。现代存储速度足够快,你的不良习惯可以悄无声息地隐藏多年,悄悄地在后台积累磨损,而你对此一无所知。当性能下降或出现故障时,损害可能早已发生。以下是人们在不知情的情况下缩短SSD寿命的五种最常见方式。
始终接近满容量运行
保留一些空间
SSD上的空闲空间不仅仅是等待被填充的空间。它也是驱动器保持健康所需的工作区域。SSD依赖于备用块在内部移动数据,均匀地将数据写入NAND中,并清理部分使用的页面。当这种缓冲空间不再存在时,写入放大现象急剧上升,这意味着因为缺乏空间,你的SSD必须写入比实际需要的更多数据。
一旦 SSD 的使用率大约在 80% 到 85% 以上时,它在这个范围内花费大部分时间,每次写入的内部成本变得更高。控制器可用的空闲块减少,因此它不得不更频繁地移动数据,为新的写入腾出空间。性能下降是最明显的影响,但对寿命影响更大的问题是 NAND 本身的加速磨损。这在有大型游戏库、虚拟机镜像或创意工作负载的系统中尤其常见,因为文件会随着时间的推移而自然增长。
让后台写入密集型工作负载失控
让人担心的是那些你看不见的东西
大多数人认为 SSD 的磨损来自于安装游戏、复制文件、导出视频或重新安装操作系统等大而明显的操作。实际上,最严重的罪魁祸首往往是你从未想到的事情。后台工作负载会不断产生小而随机的写入,这比大规模的顺序写入更具破坏性。
遥测服务、索引引擎和云同步工具等都对这种背景活动有所贡献。即使电脑看起来闲置时,SSD 仍可能每分钟进行数千次小数据写入。随着时间的推移,这些写入的总量会远远超过大多数用户的预期。这种行为对无 DRAM 的 SSD 和低端 QLC 驱动器影响尤其明显,因为它们在随机工作负载下已经面临写入放大的问题。
将消费级 SSD 用于类似服务器的工作负载
这样做可能没问题,但其实还有更好的选择
消费级 SSD 在它擅长的领域表现非常出色:短暂的活动后通常会有很长的闲置期。这种模式非常适合桌面使用,但如果让它执行类似服务器的任务,就不太理想了。
虚拟机、容器卷和数据库可以产生持续的写入压力,这种压力几乎是持续不断的。消费级SSD可以在一段时间内应对这种压力,如果工作负载足够轻,这就是为什么这些配置在初期通常表现良好的原因。但以总写入字节数衡量的耐久性评级并不能完全说明问题;它们并没有考虑到持续的写入放大、热应力以及固件在24/7负载下的表现。明确说,您完全可以在服务器上成功使用消费级SSD,但有些工作负载会迅速降低它们的性能。
当问题出现时,硬盘的使用寿命已经远远超过了它的设计承受范围。企业级SSD的存在并不是因为消费级SSD不行,而是因为持续的工作负载需要不同的固件调优、耐久性特征和断电处理方式。
忽视SSD的运行温度
热量对SSD来说是一个非常实际的担忧
SSD并不需要达到危险温度就会受到长期损害。持续的高温,即使没有触发热关机,也会加速NAND的退化。不幸的是,许多系统将M.2驱动器放在一些最糟糕的位置,通常是在热GPU下,几乎没有气流。
当SSD长时间处于高温状态时,控制器被迫降频、重试写入,并更积极地进行错误校正。这额外的工作加剧了磨损,增加了内部压力,即使在日常使用中性能看起来还算可以。
SSD磨损可能会悄悄出现
固态硬盘并不脆弱,但如果长时间被滥用,它们还是可能会出现故障。它们的速度和短时间内承受滥用的能力掩盖了故障的潜在风险。保持足够的空闲空间,控制后台写入,确保温度在合理范围内。如果你将消费级固态硬盘用于服务器,记得控制工作负载在合理范围内,这样就没问题了。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.