웨스턴디지털의 WD10EACS, WD5000AACS Green 일부 HDD 제품에서 비정상적인 성능 하락 이슈가 있었다.
리눅스 서버에 해당 HDD를 장착하여 사용중 일부 제품에서 I/O 발생시 응답이 지연되어 CPU Waiting 100% 가 발생되서 시스템 전체가 느려지는 현상이 발생된 사례가 몇차례 있었다. 해당 HDD는 Raid가 아닌 단일 디스크로 사용시에 증상이 나타났으며 smart 유틸리티로 확인하면 배드섹터 등의 에러값, SATA 및 전원케이블 등엔 특별한 이상이 없었다. 그런데 대부분의 동일 모델들은 별다른 증상이 없지만 일부에서 매우느린 응답속도를 보인다는 것이다. 스토리지 업계에서는 Green 시리즈가 Raid와 잘 부합되지 않으므로 권장하지 않는것이 가변 RPM에 따른 안정성과 성능하락 이유 때문인 듯 하다.
한때 WD3200AAJS 모델이 1년 넘어서부터 급사율이 좀 높아서 문제가 되었다.
그리고 2년여 전 부터 많이 사용했던 Seagate의 STx000DM001 (ST2000DM001, ST3000DM001) 시리즈 모델이 1년내 고장률이 좀 높다. 1년 워런티가 적용된 제품은 특히나 더 고장률이 높은거 같다. 개인적인 생각에 태국 홍수 복구 직후 생산된 모델들이 더 그런듯 하다. 그것이 부품의 질로 인한 문제인지 다른 문제인지는 알 수 없지만 고장률이 평균보다 좀 높은건 사실이다. 그리고 펌웨어 업데이트도 그 어떤 HDD 시리즈보다 잦았다. 현재도 펌웨어는 수정버젼이 나오고 있다. 성능은 좋지만 전송속도가 들쑥날쑥하고 스토리지 업계에서도 해당 디스크는 레이드로 묶으면 고장률이 높아 추천을 안하는 편이다.
10여년 동안 다양한 모델의 HDD 수천개를 사용해보면서 느낀거는 완벽한 제품은 없으며 모델별로 조금의 편차는 있지만 HDD는 복불복이고 언제 사망할지 예측하기 힘든 장치라는 것이다. 통상 전원이 안정적이면 좀 더 오래 사용 가능하며, SATA 초창기 저용량 모델들이 오히려 더 고장률이 적었다고 생각된다. 그리고 EIDE나 SCSI 보다 SATA 인터페이스 데이터케이블이나 전원케이블 불량률이 높다. 케이블류 불량은 PC 기준으로 봤을때 그렇고, 엔터프라이즈급의 케이블은 인터페이스에 관계없이 불량률이 낮다.
서버 운영에서 가장 중요한 요소 중 하나는 안정성이다. 그 중에서 사용자 데이터 보호는 무엇보다 중요하다 할 수 있다. 다른 것들은 다시 구해서 쓰면 되지만 사용자의 유니크한 데이터가 손실되면 그 어디에서도 다시 구할 수 없기 때문이다. 많은 이들이 레이드 기술이 데이터를 완벽에 가깝게 보호해 줄 수 있다고 생각하지만, 레이드는 하드웨어적인것만 커버를 해주고 파일시스템 에러등의 소프트웨어적인 에러에 대해서는 데이터를 보호해 주지 못한다. 레이드 또한 데이터 보호엔 완벽하지 않으므로 백업본을 두는것만이 스토리지 장애에서 손실을 최소화 할 수 있겠다.