top of page
Writer's pictureCông Ty Trần Sang

RAID SSD: Tăng hiệu năng SSD bằng công nghệ RAID

Updated: Aug 8, 2019


RAID SSD: Tăng hiệu năng SSD bằng công nghệ RAID.

Mảng RAID đã được ứng dụng cách đây hơn 30 năm nhằm mục đích gia tăng hiệu năng của các hệ thống lưu trữ ổ cứng (HDD). Nhưng ngày nay, một mảng RAID ổ đĩa thể rắn (SSD) có thể cung cấp hiệu năng tương đương với nhiều mảng RAID HDD. Do đó RAID SSD được xem như một giải pháp thay thế cho RAID HDD. Khi so sánh giữa HDD và SSD, rõ ràng RAID SSD nổi trội hơn hẳn về hiệu năng.


Một số cấu hình RAID SSD cũng có thể được sử dụng để bảo vệ dữ liệu trong trường hợp hỏng ổ đĩa. Mặc dù SSD mang xu hướng đáng tin cậy hơn HDD bởi chúng không chứa các bộ phận chuyển động, nhưng chúng vẫn có khả năng gặp hư hỏng. Bộ nhớ lưu trữ flash cũng tồn tại những thách thức của riêng nó. Vì lý do đó, RAID SSD đóng vai trò vô cùng hữu ích đối với những ứng dụng đề cao tầm quan trọng của việc bảo vệ dữ liệu.


Mục đích của RAID:


Mục đích của RAID.

Thuật ngữ RAID bắt nguồn từ cụm từ "Redundant Array of Inexpensive Disks" (Mảng Ổ đĩa Rẻ tiền Dự phòng), và có lẽ từ quan trọng nhất trong cụm từ này là "Inexpensive" (Rẻ tiền). Đó là vì RAID được giới thiệu vào năm 1987 bởi các nhà khoa học máy tính, những người muốn chứng minh rằng các ổ đĩa tiêu chuẩn và rẻ tiền khi được cấu hình thành một mảng RAID phù hợp, chúng có thể tạo ra hiệu năng vượt trội so với các ổ đĩa hiệu năng cao đắt tiền hiện hữu tại thời điểm đó.


Nhưng việc sử dụng mảng ổ đĩa cho hệ thống máy tính như một thiết bị lưu trữ đơn đã trở nên phổ biến trước khi thuật ngữ trên được đặt ra, phần lớn dùng cho mục đích bảo vệ dữ liệu. Cấu hình mảng đơn giản nhất giúp bảo vệ dữ liệu là mảng mirror: dữ liệu lưu trữ trên một ổ đĩa được sao chép sang một ổ đĩa khác, sao cho mỗi ổ đĩa đều là ảnh gương của ổ đĩa kia.


Điểm mấu chốt ở đây là sự cân đối giữa hai lợi ích: RAID có thể được dùng để tăng hiệu năng ổ đĩa, và/hoặc cung cấp khả năng bảo vệ phòng tránh mất dữ liệu trong trường hợp một (hoặc nhiều) ổ đĩa trong mảng bị hỏng hoàn toàn, hoặc hỏng một phần. Bằng cách sử dụng các cấp độ RAID khác nhau, chúng có thể được dùng để đem lại cả hai lợi ích trên, theo những tỷ lệ khác nhau.


[Để tìm hiểu chi tiết về từng loại RAID, vui lòng đọc bài viết Giải thích các cấp độ RAID].


SSD và RAID:


SSD và RAID.

Đây là cách RAID và SSD được kết hợp với nhau để phòng tránh hư hỏng / mất dữ liệu:


SSD có xu hướng đáng tin cậy cao bởi chúng không chứa các bộ phận chuyển động và thải ra ít nhiệt hơn HDD, vì vậy chúng không bị hao mòn do vấn đề nhiệt độ. Mặc dù sự cố hỏng hoàn toàn ổ đĩa rất hiếm gặp, nhưng việc mất dữ liệu trên SSD vẫn có thể xảy ra. Đó là do sự hư hỏng của các bit riêng lẻ được lưu trữ trong từng cell NAND, thông qua sự nhiễu loạn giữa các cell hoặc thậm chí là do sử dụng quá nhiều.


Đối với cấu hình RAID 1 SSD, nếu một ổ đĩa hỏng, dữ liệu sẽ không bị mất vì dữ liệu đã được sao chép sang ổ đĩa khác trong mảng. RAID 1 còn giúp nâng cao hiệu năng đọc, do bất kỳ hoạt động đọc nào cũng đều được xử lý bởi mọi ổ đĩa có trong mảng.


Nhược điểm chính của mảng RAID 1 SSD là:

  • Người dùng chỉ sử dụng được một nửa tổng dung lượng của hai ổ đĩa (hiệu quả lưu trữ 50%).

  • Công suất tiêu hao tăng gấp đôi so với hệ thống ổ đĩa đơn (tuy nhiên SSD tiết kiệm điện hơn nhiều so với HDD, vì vậy điểm này ít quan trọng hơn đối với mảng RAID SSD).


Trong thực tế, có nhiều cấu hình RAID khác sử dụng nhiều ổ đĩa và nhiều kỹ thuật khác nhau, chẳng hạn như mảng stripe (chia dữ liệu sang nhiều ổ đĩa) và lưu trữ bit parity. Những cấu hình RAID này mang đến sự kết hợp khác nhau về lợi ích hiệu năng, khả năng bảo vệ dữ liệu và hiệu quả lưu trữ.


RAID HDD vs RAID SSD:


RAID HDD vs RAID SSD.

Khi xét đến tính hấp dẫn tương đối của RAID HDD và RAID SSD, có hai điểm đáng chú ý sau đây:

  • HDD dễ bị hỏng hơn.

  • HDD cho hiệu năng thấp hơn.


Điều này rất quan trọng, do mảng RAID có thể giúp bạn có được hiệu năng tốt hơn và/hoặc bảo vệ dữ liệu tốt hơn.


Trong môi trường lưu trữ HDD, những tình huống mà hiệu năng ổ đĩa đơn không thể đáp ứng một khối lượng công việc nhất định sẽ thường xuyên xảy ra hơn là trong môi trường lưu trữ SSD, đơn giản bởi HDD có hiệu năng thấp hơn. Điều tương tự cũng đúng khi bạn xét đến yếu tố bảo vệ dữ liệu thay vì hiệu năng ổ đĩa.


Từ những lý do trên, mảng RAID là một giải pháp hợp lý cho vấn đề lưu trữ đối với những công ty đòi hỏi hiệu năng đặc biệt cao và có hạ tầng SSD tại chỗ.


Khi so sánh giữa RAID HDD và RAID SSD, ta nên nhớ điều này: RAID HDD có thể tăng hiệu năng từ mức thấp đến mức chấp nhận được, trong khi RAID SSD có khả năng tăng từ mức chấp nhận được lên mức rất cao.


Thời gian tái tạo RAID SSD:


Bảng so sánh thời gian tái tạo của RAID 1, RAID 5 và RAID 6 đối với loại ổ đĩa HDD trên hệ thống lưu trữ lai NetApp E2800.

Bảng so sánh thời gian tái tạo của RAID 1, RAID 5 và RAID 6 đối với loại ổ đĩa HDD trên hệ thống lưu trữ lai NetApp E2800.


Bảng so sánh thời gian tái tạo của RAID 1, RAID 5 và RAID 6 đối với loại ổ đĩa SSD trên hệ thống lưu trữ lai NetApp E2800.

Bảng so sánh thời gian tái tạo của RAID 1, RAID 5 và RAID 6 đối với loại ổ đĩa SSD trên hệ thống lưu trữ lai NetApp E2800.


Cả RAID HDD và RAID SSD đều cung cấp các tùy chọn bảo vệ dữ liệu, tuy nhiên có sự khác biệt lớn giữa hai mảng. Sự khác biệt này xuất phát từ thực tế: SSD có hiệu năng tốt hơn. Nghĩa là khi một ổ đĩa trong mảng RAID SSD bị hỏng, hệ thống sẽ bắt đầu tái tạo dữ liệu từ những ổ đĩa còn lại, thời gian tái tạo diễn ra nhanh hơn rất nhiều so với trường hợp của mảng RAID HDD.


Về bản chất, HDD ít tin cậy hơn SSD. Nghĩa là, mảng RAID HDD có thể gặp phải những hư hỏng khác trong quá trình tái tạo, nguy cơ này cao hơn đáng kể so với trường hợp của mảng RAID SSD.


Các loại RAID SSD khác nhau:


Các loại RAID SSD khác nhau.

Mảng RAID SSD có thể cung cấp khả năng bảo vệ phòng tránh mất dữ liệu và nâng cao hiệu năng. Câu hỏi lớn là: Bạn nên áp dụng cấp độ RAID nào trong mảng RAID SSD?


RAID 0 SSD và RAID 1 SSD:


RAID 0 không được dùng để bảo vệ dữ liệu, bởi nó sử dụng kiểu ghi stripe vào hai ổ đĩa nhằm gia tăng hiệu năng mà không có ổ đĩa dự phòng. Trái lại, RAID 1 cho phép dự phòng hoàn toàn nhưng lợi ích hiệu năng chỉ ở mức khiêm tốn, do đó nên cân nhắc nếu việc nâng cao hiệu năng không phải là yếu tố chính khi ứng dụng RAID SSD.


RAID 5 SSD và RAID 6 SSD:


Những phương án thay thế phổ biến có hỗ trợ dự phòng là RAID 5 (stripe dữ liệu cùng với một bit parity, yêu cầu tối thiểu 3 ổ đĩa) và RAID 6 (stripe dữ liệu cùng với hai bit parity, yêu cầu tối thiểu 4 ổ đĩa). Các cấp độ này đem lại lợi ích là cho phép hư hỏng một ổ đĩa (RAID 5) hoặc hai ổ đĩa (RAID 6) bất kỳ mà không bị mất dữ liệu. Cả hai cấu hình đều giúp tăng hiệu năng, nhưng không tốt bằng sự khác biệt giữa mảng RAID 0 SSD và ổ đĩa SSD đơn (không phải là thành phần của mảng RAID SSD).


Vấn đề đối với RAID 5 và RAID 6 trong mảng RAID SSD là cả hai hệ thống đòi hỏi số lượng lớn hoạt động ghi ổ đĩa để tạo nên thông tin parity. Cụ thể, RAID 6 cần đến hai parity mỗi khi dữ liệu được ghi vào. Trong khi các cell NAND của SSD lại có số lần ghi hữu hạn trước khi chúng bị hao mòn hết, điều này khiến cho RAID 5 và RAID 6 ít phù hợp với mảng RAID SSD.


RAID 10 SSD:


Đây là phương án thay thế tốt hơn RAID 5 và RAID 6. RAID 10 sử dụng stripe (kích thước thông dụng 128KB hoặc 256KB) và mirror để cung cấp khả năng chịu lỗi, yêu cầu tối thiểu 4 ổ đĩa. Ưu điểm của RAID 10 SSD là hiệu năng rất cao, nhưng hiệu quả lưu trữ thấp (50% đối với mảng RAID có 4 ổ đĩa).


Hiệu năng RAID SSD:


Kết quả benchmark hiệu năng tăng lên đáng kể khi có nhiều ổ đĩa SSD tham gia vào mảng RAID 0.

Kết quả benchmark hiệu năng tăng lên đáng kể khi có nhiều ổ đĩa SSD tham gia vào mảng RAID 0.


Kết nối nhiều SSD vào bộ điều khiển RAID để tạo nên một mảng RAID SSD theo các cấu hình nhất định có thể tác động lớn đến hiệu năng, với điều kiện hiệu năng tối đa bị giới hạn bởi thông lượng của chính bộ điều khiển RAID. Cấp độ RAID cho hiệu năng tốt nhất là RAID 0.


RAID 0 SSD vs SSD đơn:


Như đã đề cập ở trên, một mảng RAID 0 với 2 SSD sử dụng kỹ thuật stripe dữ liệu, giúp tăng gấp đôi hiệu năng so với một SSD đơn lẻ, mặc dù cấu hình này không có khả năng chịu lỗi.


Nếu việc bảo vệ dữ liệu không phải là vấn đề, khi đó mảng RAID 0 với 4 SSD sẽ cung cấp hiệu năng nhanh gấp 4 lần (so với hiệu năng của ổ đĩa chậm nhất trong mảng). Vấn đề duy nhất là sự giới hạn của bộ điều khiển RAID SSD.


Các cấp độ RAID SSD khác như RAID 1 cũng mang lại lợi ích nhỏ về hiệu năng - một mảng RAID 1 SSD được thiết kế chủ yếu để bảo vệ dữ liệu, nhưng khi cả hai ổ đĩa được đọc cùng một lúc sẽ giúp cải thiện tốc độ đọc (không có lợi ích đối với hoạt động ghi).


RAID 10, sự kết hợp của RAID 0 (stripe) và RAID 1 (mirror), có thể làm tăng đáng kể hiệu năng, tuy nhiên nó có hiệu quả lưu trữ thấp hơn và lợi ích hiệu năng chỉ bằng một nửa so với RAID 0.


RAID SSD có đáng giá?


RAID SSD có đáng giá?

Mục đích của mảng RAID SSD là cung cấp khả năng bảo vệ phòng tránh mất dữ liệu và/hoặc gia tăng hiệu năng ổ đĩa.


Khi đề cập đến việc bảo vệ dữ liệu, nhiều cấp độ RAID phù hợp có thể đáp ứng được và điều này đúng với cả mảng RAID HDD và RAID SSD.


Còn về hiệu năng, nếu không cần ổ đĩa dự phòng, khi đó cấu hình RAID SSD như RAID 0 là cách đáng tin cậy nhất để nâng cao hiệu năng. Đây được xem là giải pháp thay thế cho SSD Intel Optane hoặc NVMe over Fabrics (NVMe-oF).


Điểm yếu lớn nhất của mảng RAID SSD (bên cạnh sự giới hạn tốc độ của bộ điều khiển RAID SSD) là giá thành. Tính trên mỗi Gigabyte, SSD đắt tiền hơn HDD. Do đó việc sử dụng cấu hình RAID SSD có hiệu quả lưu trữ 50% như mảng RAID 1 với 2 SSD, hoặc RAID 10 với 4 SSD sẽ làm chi phí đội lên gấp 2 lần.


Cuối cùng, khi nói đến việc sử dụng RAID SSD để gia tăng hiệu năng, tương lai được dự báo bởi yếu tố kinh tế. Nếu các công nghệ lưu trữ bất biến mới hơn và nhanh hơn có thể đem lại hiệu năng tốt hơn, trong khi giá thành tương đương hoặc thấp hơn, lúc đó sẽ không cần dùng đến các mảng SSD tiêu chuẩn.


(Nguồn: Enterprise Storage Forum, NetApp...)


bottom of page