Kết quả khảo sát này được xuất bản trên blog của Backblaze Inc. vào ngày 9/5/2017, được viết bởi Andy Klein.
Trong bản cập nhật này, chúng tôi sẽ đánh giá tỷ lệ hỏng trong quý 1 năm 2017 (Q1 2017) và trọn đời ổ cứng, áp dụng cho tất cả model hiện tại của Backblaze, và chúng tôi cũng sẽ đánh giá tương đối một loại ổ đĩa mới - ổ cứng doanh nghiệp. Chúng tôi sẽ chia sẻ những quan sát và nhận biết của chúng tôi, như thường lệ, bạn có thể tải xuống dữ liệu thống kê ổ cứng mà chúng tôi sử dụng để tạo nên báo cáo này.
Nguồn dữ liệu ổ cứng của chúng tôi
Backblaze hiện đang ghi và lưu số liệu thống kê ổ cứng hàng ngày từ những ổ đĩa trong trung tâm dữ liệu của chúng tôi hơn 4 năm qua. Dữ liệu này bao gồm các thuộc tính SMART được báo cáo bởi mỗi ổ đĩa, cùng với thông tin liên quan như số sêri và tình trạng lỗi. Tính đến ngày 31/3/2017, chúng tôi có 84.469 ổ cứng hoạt động. Trong đó có 1.800 ổ khởi động và 82.669 ổ dữ liệu. Trong bản đánh giá của chúng tôi, các model số lượng dưới 45 ổ sẽ được bỏ qua, còn lại 82.516 ổ cứng để chúng tôi phân tích cho báo cáo này. Hiện có 17 model ổ cứng khác nhau, dung lượng từ 3 đến 8TB. Tất cả đều là ổ 3.5 inch.
Thống kê độ tin cậy ổ cứng trong Q1 2017
Kể từ bản báo cáo trong Q4 2016 vừa qua của Backblaze, chúng tôi đã bổ sung 10.577 ổ cứng, nâng tổng số ổ đĩa lên con số 82.516. Chúng tôi sẽ bắt đầu bằng cách xem số liệu thống kê trong khoảng thời gian từ ngày 1/1/2017 đến 31/3/2017 - tức Q1 2017. Báo cáo này áp dụng cho các ổ đĩa hoạt động trong khoảng thời gian đó, dung lượng từ 3 đến 8TB như liệt kê dưới đây.
Những quan sát và ghi chú về bản đánh giá trong Q1 2017
Bạn sẽ thấy rằng một số model ổ cứng có tỷ lệ hỏng là "0" (không). Ở đây, tỷ lệ hỏng bằng không có nghĩa là không có ổ cứng nào hỏng đối với model đó trong Q1 2017. Sau đó, chúng tôi sẽ đánh giá những model ổ đĩa này trong trọn đời của chúng. Tại sao dữ liệu hàng quý lại quan trọng? Chúng tôi sử dụng nó để tìm bất cứ điều gì bất thường. Ví dụ, trong Q1, model ổ cứng Seagate 4TB: ST4000DX000, có tỷ lệ hỏng cao 35,88%, trong khi tỷ lệ hỏng trung bình hàng năm trọn đời của model này lại thấp hơn nhiều, 7,51%. Trong trường hợp model này, chúng tôi chỉ có 170 ổ đĩa, do đó tỷ lệ hỏng không đáng kể về mặt thống kê, nhưng thông tin như vậy có thể hữu ích nếu chúng tôi sử dụng model này với số lượng hàng ngàn ổ đĩa.
Có tổng cộng 375 ổ cứng hỏng trong Q1. Ổ đĩa được coi là hỏng nếu gặp phải một hoặc nhiều điều kiện sau:
Ổ đĩa không quay hoặc không kết nối với hệ điều hành.
Ổ đĩa không đồng bộ, hoặc không duy trì đồng bộ trong mảng máy chủ RAID (xem ghi chú ngay bên dưới).
Thông số SMART của ổ đĩa vượt quá ngưỡng cho phép.
Ghi chú:
Backblaze có các Storage Pod độc lập sử dụng RAID 6, còn trung tâm dữ liệu sử dụng phương pháp erasure coding Reed-Solomon mã nguồn mở riêng để thay thế. Cả hai kỹ thuật này đều có khái niệm về ổ đĩa không đồng bộ hoặc không duy trì đồng bộ với các ổ đĩa thành viên khác trong nhóm của nó.
Erasure coding (EC) là một phương pháp bảo vệ dữ liệu, trong đó dữ liệu được chia thành nhiều phần, mở rộng và mã hoá cùng với dữ liệu dự phòng, và được lưu trữ ở những nơi hoặc thiết bị lưu trữ khác nhau. Mục đích của EC là để cho phép dữ liệu - sẽ bị lỗi ở một số điểm nào đó trong quá trình lưu trữ - được tái tạo bằng cách sử dụng thông tin dữ liệu đã được lưu trữ ở những nơi khác trong mảng.
EC thường được dùng thay cho RAID truyền thống nhờ khả năng giảm bớt thời gian và chi phí cần thiết để khôi phục lại dữ liệu. Hạn chế của EC là nó có thể tiêu tốn nhiều tài nguyên CPU, và do đó có thể làm cho độ trễ tăng lên.
EC hữu ích với số lượng dữ liệu lớn và bất kỳ ứng dụng hay hệ thống nào cần khả năng chịu lỗi, chẳng hạn như hệ thống mảng ổ đĩa, mạng lưới dữ liệu, ứng dụng lưu trữ phân tán, kho lưu trữ và lưu trữ đối tượng. Trường hợp sử dụng EC phổ biến hiện nay là lưu trữ đám mây dựa trên đối tượng.
Tỉ lệ hỏng ổ cứng hàng năm cho Q1 trong kho ổ đĩa hiện tại của chúng tôi là 2,11%. Con số này cao hơn một chút so với quý trước, nhưng có thể đây là kết quả từ việc chúng tôi bổ sung 10.577 ổ đĩa mới trong Q1. Chúng tôi nhận thấy rằng tỷ lệ hỏng ổ cứng cao hơn một chút vào thời điểm đầu, trước khi ổ đĩa "dần dần thích nghi" trong môi trường mới.
Hơn 10.577 ổ cứng
Có 10.577 ổ cứng được bổ sung, nhưng thực sự ban đầu là 11.002 ổ, 425 ổ còn lại đã bị loại ra. Trong số những ổ bị loại ra, có 375 ổ được đánh dấu hỏng và đã được thay thế. 425 ổ này chủ yếu bị loại ra do sự chuyển đổi sang dùng ổ đĩa dung lượng cao hơn.
Bảng dưới đây cho thấy những loại ổ cứng bị hỏng trong Q1 2017, tính theo dung lượng.
Tỷ lệ hỏng trọn đời ổ cứng áp dụng cho tất cả ổ đĩa hiện tại
Bảng dưới đây cho thấy tỷ lệ hỏng của các model ổ cứng mà chúng tôi sử dụng tính đến ngày 31/3/2017. Tỷ lệ này được thống kê trong khoảng thời gian bắt đầu vào tháng 4/2013 và kết thúc ngày 31/3/2017. Nếu bạn quan tâm đến tỷ lệ hỏng ổ cứng áp dụng cho tất cả ổ đĩa mà chúng tôi đã sử dụng trong nhiều năm qua, vui lòng tham khảo bài viết đánh giá ổ cứng năm 2016 của chúng tôi.
Tỷ lệ hỏng hàng năm của tất cả model ổ cứng được liệt kê ở trên là 2,07%. Con số này nhỉnh hơn một chút so với 2,05% của cùng model ổ đĩa vào cuối Q4 2016. Mức tăng này cũng dễ hiểu do có sự gia tăng tỷ lệ hỏng trong Q1 2017 so với quý trước như đề cập ở trên. Không có model mới nào được bổ sung và cũng không có model cũ nào bị loại ra trong suốt quý hiện tại.
Backblaze đang triển khai ổ cứng doanh nghiệp
Một số bạn có thể thấy chúng tôi hiện có số lượng ổ cứng doanh nghiệp đáng kể trong trung tâm dữ liệu, cụ thể là 2.459 ổ Seagate 8TB, model ST8000NM055. Ổ HGST 8TB là ổ đĩa doanh nghiệp đầu tiên được sử dụng làm ổ dữ liệu trong trung tâm dữ liệu của chúng tôi, nhưng chúng tôi chỉ có 45 ổ. Vậy, tại sao chúng tôi lại đột nhiên quyết định mua hơn 2.400 ổ đĩa doanh nghiệp Seagate 8TB? Có một khoảng thời gian rất ngắn, khi Seagate giới thiệu các model ổ đĩa mới và loại bỏ dần model ổ đĩa cũ, điều này khiến cho giá thành trên mỗi terabyte của ổ đĩa doanh nghiệp 8TB phù hợp với ngân sách của chúng tôi. Trước đây chúng tôi đã mua 60 ổ đĩa này để thử nghiệm trong một Storage Pod và hài lòng khi chúng có thể hoạt động trong môi trường của chúng tôi. Khi có cơ hội để sở hữu những ổ đĩa doanh nghiệp này với mức giá như mong muốn, chúng tôi không thể cưỡng lại.
Đây là bảng so sánh giữa ổ cứng tiêu dùng 8TB và ổ cứng doanh nghiệp 8TB:
Chúng tôi đã nhận biết được điều gì cho đến thời điểm này...
Còn quá sớm để so sánh tỷ lệ hỏng - Ổ cứng doanh nghiệp lâu nhất của chúng tôi cũng chỉ mới được triển khai khoảng 2 tháng, hầu hết được đưa vào sử dụng ngay trước khi kết thúc Q1. Ổ đĩa doanh nghiệp trong kho lưu trữ Backblaze vẫn chưa lưu đầy dữ liệu. Sẽ cần ít nhất 6 tháng trước khi chúng tôi có thể bắt đầu so sánh tỷ lệ hỏng vì dữ liệu rất dễ biến động. Ví dụ: nếu ổ đĩa doanh nghiệp hiện tại chỉ hỏng 2 lần trong Q2, khi đó tỷ lệ hỏng hàng năm trọn đời của chúng sẽ khoảng 0,57%.
Ổ cứng doanh nghiệp truy xuất dữ liệu nhanh hơn - Kho lưu trữ Backblaze có chứa ổ đĩa doanh nghiệp truy xuất dữ liệu (trung bình 140TB mỗi ngày) nhanh hơn so với kho lưu trữ Backblaze chứa ổ đĩa tiêu dùng (trung bình 100TB mỗi ngày).
Ổ cứng doanh nghiệp sử dụng nhiều điện năng hơn - Không có gì ngạc nhiên vì theo thông số kỹ thuật của Seagate, ổ đĩa doanh nghiệp sử dụng trung bình 9W ở chế độ nghỉ và 10W khi đang hoạt động. Trong khi ổ đĩa tiêu dùng, những con số này lần lượt trung bình là 7,2W và 9W. Với ổ đĩa đơn, điều này có vẻ không đáng kể, nhưng khi bạn gắn 60 ổ đĩa vào một thùng máy chủ Storage Pod 4U và đặt 10 thùng máy chủ này vào trong một rack, sự khác biệt sẽ tăng lên nhanh chóng.
Ổ cứng doanh nghiệp có một số tính năng tốt - Ổ đĩa doanh nghiệp 8TB của Seagate mà Backblaze sử dụng có công nghệ PowerChoice, cho phép chúng tôi tùy chọn để tiết kiệm điện hơn. Thời gian truy xuất dữ liệu như đề cập ở trên đã được ghi nhận sau khi chúng tôi thay đổi sang chế độ công suất thấp hơn. Nói chung, ổ đĩa doanh nghiệp khi hoạt động ở chế độ công suất thấp vẫn lưu trữ nhiều hơn 40% dữ liệu tính trung bình mỗi ngày so với ổ đĩa tiêu dùng.
Mặc dù các ổ cứng doanh nghiệp có thể truy xuất dữ liệu nhanh hơn, nhưng tốc độ ổ đĩa không bao giờ gặp tình trạng thắt cổ chai trong hệ thống của chúng tôi. Một hệ thống có thể truy xuất dữ liệu nhanh hơn sẽ lưu trữ thường xuyên hơn và đầy nhanh hơn. Chúng tôi thường xuyên bổ sung ổ đĩa mới và luôn có thêm dung lượng để đáp ứng nhu cầu lưu trữ của khách hàng.
Tổng kết
Backblaze sẽ tiếp tục theo dõi các ổ cứng doanh nghiệp 8TB và duy trì thông báo những phát hiện của chúng tôi.