SAS(Serial Attached SCSI)에 대하여 알기
참고; http://www.adaptec.com/pdfs/SASWhitepaper_lo.pdf
참고: 파코즈에서 퍼왔습닏k.
소개
이전까지 서버 저장장치의 규격화된 인터페이스(엔터프라이즈 환경은 SCSI, 데크스탑 환경은 저렴한 ATA)는 데이터 전송이 병렬전송방식이었습니다. 하지만 병렬전송방식의 신호는 어긋남, 혼선, 신호 터미네이션의 한정, 케이블과 커넥터 제한, 및 디베이스의 주소할당능력의 제약으로 시스템과 애플리케이션의 진보를 가로막고 있었습니다.
SAS와 SATA
직렬 전송 방식의 SAS (Serial Attached SCSI) 와 SATA (Serial ATA)는 더욱 빠른 속도를 가져다주었으며, 신뢰성과 확장성에 대한 해결책을 제시하였습니다. SATA가 구성의 단순성과 최상의 가격/효능을 요구하는 스토리지 환경에 탁월한 선택이며 데스크탑을 위해 고안 됐다면 SAS는 서버와 엔터프라이즈 저장장치가 요구하는 고성능과 범용성, 및 확장성을 제공하였습니다. SAS는 고사용율, 온라인 쇼핑몰과 은행업무와 같은 즉각적인 데이터 입출력을 요구하는 곳에 매우 적합합니다.
SAS만이 다음과 같은 증명된 SCSI의 신뢰성과 기능성의 결합을 통해 강력한 직렬전송방식을 통해 다음과 같은 특성과 효능을 가져옵니다.
성능 - 1.5Gb/s에서 3Gb/s까지 대역폭 향상, 광범위한 포트를 통한 대역폭 집중, 전이중방식, 포트 집중화, 진보된 SCSI 설정의 rich command
범용성 - 물리 디베이스의 광범위한 주소체계로, 작은 커넥터와 긴 길이의 케이블로 인한 외장형 스토리지 시스템과의 연결성 제공
신뢰성과 이용률 - point to point 연결, 다중 이니시에이터를 통한 동시 접근, Dual- Active 포트 제공
유연성 - 물리적이며 소프트웨어 호환성의 SAS와 SATA 드라이브, 그리고 SCSI소프트웨어와 미들웨어에 대한 하위호환성 제공
성능
제1세대 SAS는 3Gb/s의 전송률을 제공하며 다음 세대에 기술과 애플리케이션 진보에 보조를 맞추기 위해 12Gb/s까지의 대역폭을 향상시킬 것입니다. 또한, SAS는 무장애를 위해 디자인된 다중 point to point 연결방식을 제공합니다.
SAS의 전이중방식과 point to point 연결의 특성으로 인해 다중 이니시에이터와 고성능 SAS target 사이에 활발한 동시연결을 가능하게 해줄 것입니다. 장치들은 링크비율의 사용가능한 대역폭을 2배로 늘리기 위해 2가지 방향으로 즉시 데이터를 전송할 수 있습니다. Narrow 포트는 단일의 시리얼 링크를 지원하는 반면, Wide 포트는 다중링크를 지원하여 8개의 SAS 또는 SATA Target으로 총 사용 대역폭을 24Gb/s로 늘릴수 있습니다.(아래 그림: Wide SAS ports)
다중 물리적 장비를 함께 결합시킴으로써, Wide 포트는 규모가 큰 SAS 토폴로지가 요구하는 중요한 대역폭 지원할 수 있도록 만들어졌습니다.
SCSI와 같이 SAS는 256 queue(대기행렬)를 포함하고 있으며, head queue와 out of order queue를 통해 최고의 데이터 핸들링의 특징을 제공해드릴 것입니다. 이러한 대기행렬들의 특징은 엔터프라이즈 애플리케이션에 중요한 요소로 작용하며, 시스템에 추가주문을 허락하며, 우선적인 Command 인터페이스입니다.
규모가 큰 고성능 토플로지는 SAS를 위한 캐이블링을 하는데 좀 더 실용적으로 만들어졌습니다. SAS는 wide 68-pin 케이블과 분리할 수 있는 8미터까지 확장 가능한 단일 4-wire SAS 전원케이블, 치밀한 디자인으로 인한 인클루저와 Hot-plug연결의 향상을 가져다줄 것입니다.
유연성
SAS의 중요한 장점은 SAS의 백플레인 디자인과 프로토콜 인터페이스로 인해서 같은 시스템 내에서 SAS와 SATA 드라이브의 사용이 가능해졌다는 점이다. 비록 각각의 드라이브형태는 다른 애플리케이션에서 사용되는 것이 일반적이지만, 대부분의 엔터프라이즈 사용자들은 두 드라이브 종류가 있어야 한다는 것이다. 드라이브에 대한 혼용과 match의 능력은 디자이너와 사용자들에게 강력한 장점이다.
SATA 드라이브는 아마도 가격대 성능비가 높은 bulk 스토리지를 위해 첫째로 디자인될 것입니다. 규모의 경제를 달성하기 위해, SATA 드라이브는 스핀들 속도(spindle speed)가 더 낮을 뿐만 아니라 (일반적으로 7,200rpm), 평균 무고장 비율과 가격이 낮은 것이 특징입니다. 결론적으로, SATA드라이브는 트랜잭션비율이 낮고 데이터 이용률이 크게 중요하지 않은 곳에 적합합니다.
반면, SAS 드라이브는 고성능, 고가용성에 사용됩니다. SAS드라이브는 데이터 무결성을 보장하기 위해 회전진동에 대한 보상으로 더 높은 spindle 속도에서 (10,000 to 15,000 rpm) 작동될 것입니다. 또한, 더 높은 신뢰성을 위해 만들어짐. SAS 드라이브는 데이터 부피가 크고 데이터 가용성이 필수적인 환경에서 사용될 것입니다. SATA 커넥터 신호는 SAS신호의 부분집합이기 때문에, SATA 드라이브는 SAS controller와의 완전한 호환이 가능합니다.
SAS controller는 SAS 안에 포함된 SATA Tunneled Protocol(STP)로써 SATA command를 통해 SATA드라이브를 통과합니다. SAS 커넥터는 그 자체가 single uniform backplane으로 다자인 됐기 때문에, 두 종류의 드라이브를 가지고 시스템을 디자인하는 것은 간단합니다. 이러한 호환성으로 인해 비용을 줄이고 스토리지 디자인의 복잡성을 해결할 수 있게 되었습니다. 이로 인해 다자인 선택에 대한 다양성이 증가하였습니다.
또한, 이 호환성 때문에 시스템 builder 들은 보통의 커넥터와 cabling을 사용하여 혼용의 스토리지 시스템을 디자인할 수 있게 되었습니다. 같은 시스템에서 SATA 또는 SAS를 설치하고 업그레이드하는 것은 하나의 드라이브 형태를 다른 것으로 교체하는 단순한 문제입니다. - SAS backplane 커넥터가 SAS와 SATA를 함께 받을 수 있기 때문입니다. 그러나 SATA backplane은 SATA 장치에만 연결하는 반면, backplane은 최고의 시스템 디자인 유연성을 공급하기 위해 SAS 커넥터를 사용해야 합니다.
범용성
병렬 버스의 범용성은 제한적입니다. 왜냐하면, 병렬 버스는 연결경로를 공유하기 때문이며, multiple initiator에 더 많은 버스를 추가한다고 해서 제한된 공유능력이 확장되지 않기 때문입니다. SAS는 대형 외장형 스토리지 시스템의 구성을 단순화시키기 위한 교환기로써 expander 하드웨어를 사용합니다. 이런 large external 스토리지 시스템은 증가한 업무량을 위한 대역폭을 보존하는 동안 최소의 대기시간으로 쉽게 측정될 수 있습니다.
예를 들어, fan out expander는 initiators, SAS 와 SATA 드라이브, Edge expanders 와 다른 Fan Out expanders를 포함하여 좁고 넓은 format으로 128 device까지 연결될 수 있습니다. 이 추가적인 Fan out과 Edge expander는 추가적인 연결 노드(node)를 공급하면서, 번갈아서 다른 호스트와 드라이브에 연결될 수 있습니다. SAS내에서 SCSI운영 프로토콜(SMP)은 토폴로지에서 point to point 연결로 운용되어 집니다. (아래 그림)
신뢰성
Multiple initiator는 multiple 호스트를 통한 디스크 드라이브 액세스를 제공, HBA(Host Bus Adapter) 또는 양쪽 모두 디스크 드라이브 접근을 제공하고 실패할 경우를 대비하여 계속적인 데이터 접근을 보장하기 위해 엔터프라이즈 컴퓨팅을 하는데 오랫동안 사용되어 왔습니다. 그러나, 병렬기술구성에 있어서 multiple initiator의 single point 구성은 블록이 장비에 접근할 수 없는 실패의 원인을 가지고 왔습니다. SAS의 dual porting의 특징은 single point의 실패 없이 고이용 시스템을 구축할 수 있습니다.
SAS를 통해 무장애 시스템을 높이는 다른 방법은 expander를 사용하여 multiple device를 multiple initiator에 연결하는 것이며 이는 많은 장치가 동시에 작동을 할 수 있도록 합니다. Command는 무장애시스템을 높이기 위해 별도의 연결에서 다론 곳에 돌아온 자료와 하나의 링크를 보낼 수 있습니다.
SAS expander의 특징은 Dual-port SAS 드라이브와 SATA 드라이브 2-port이며, 혼합된 SAS ex 최대의 무장애시스템에 대한 예비 여분의 시스템을 디자인하는데 용이하다는 점입니다. 2.5인치 dual-ported SAS 드라이브는 추가로 표준 3.5-inch 드라이브를 이용할 수 있으며, 애플리케이션에서 완전한 무장애 시스템 디자인을 가능하게 해드릴 것입니다. 높은 범위성과 신뢰적인 연결은 엔터프라이즈 레벨의 토폴로지에서 자동적인 장애극복 가용성 또는 절대적으로 필요한 시스템 어플리케이션에 필수적인 부하조절을 위한 multi-node 클러스터링을 지원합니다.
결론
SAS의 장점은 주목하지 않을 수 없습니다. 과거 serial 기술이 도입하기 이전에는, 서버성능과 애플리케이션 필요성이 증가할 경우 시스템 디자이너들은 스토리지의 기가바이트당 가격과 드라이브 신뢰성, 범용성과 유용성을 가진 I/O당 가격 사이의 상충관계를 조심스럽게 조절해야만 했습니다. 추가로, 병렬인터페이스로 인해 사용자들은 각각 드라이브 형태에 대한 별도의 시스템을 구현해야 했으며, 추가적인 서버, 드라이브와 지원에 대한 비용을 부담해야 했습니다.
그러나 현재 SAS와 SATA를 위한 균일한 인터페이스 플랫폼이 나오게 됨에 따라, 사용자들은 이런 모든 요소가 추가 시스템이 없이 공존할 수 있고 스토리지 시스템을 쉽고 빠르게 개발할 수 있게 될 것이며, 엔터프라이즈 스토리지의 수요가 변함에 따라 다른 드라이브 형태가 hot-plugged 되고 엔터프라이즈의 스토리지는 변화가 필요하였습니다.
Serial Attached SCS는 차세대 SCSI의 진보와 I/O interface의 구조의 결정적 진보를 나타냅니다. 2004년 시장에 출현하였을 때 , SAS는 유연성이 높고 무장애시스템인 스토리지 토플로지로 인하여 사용자가 쉽게 스토리지를 디자인할 수 있도록 스토리지 전망에 변화가 시작될 것입니다.
SAS 하드 외형
SAS 하드의 커넥터 부위
SAS, SCSI, Raptor 하드를 회전속도 10000RPM, 용량 74G을 기준으로 비교해 보았습니다.
SAS와 SCSI는 회전속도가 15000RPM인 제품이 나와 있고, 랩터는 아직없습니다. 기본 성능은 거의 비슷하다고 보입니다. 하지만 SAS는 특히 대역폭과 확장성 면에서 발전 가능성이 높습니다.
1 | SAS | SCSI | SATA |
연결방식 | Serial Attached SCSI | 울트라320 SCSI | Serial ATA |
커넥터 | SAS | 68pin Wide LVD | SATA |
포멧용량 | 73.5GB | 73.5GB | 73.355GB |
원판/헤드 갯수 | 플래터 한장/헤드 2개 | 플래터 한장/헤드 2개 | 플래터 한장/헤드 2개 |
원판 회전속도 | 10,000rpm | 10,000rpm | 10,000rpm |
캐시메모리 | 16MBytes | 8MBytes | 16MBytes |
예상수명 | 140만 시간 MTTF | 140만 시간 MTTF | 120만 시간 MTTF |
평균탐색시간 | 읽을때4.0ms/쓸때4.5ms | 읽을때4.0ms/쓸때4.5ms | 읽을때4.6ms/쓸때5.2ms |
트랙간탐색시간 | 읽을때 0.3ms / 쓸때 0.5ms | 읽을때 0.3ms / 쓸때 0.5ms | 0.4ms |
전체 행정시간 | 읽을때 11ms / 쓸때 12m | 읽을때 11ms / 쓸때 12ms | 10.2ms |
평균지연 시간 | 3ms | 3ms | 2.99ms |
최대 전송속도 | 320MB/s | 320MB/s | 150MB/s |
최대 처리속도 | 270MB/s | 270MB/s | 1 |
연속 쓰기속도 | 89MB/s | 89MB/s | 72MB/s |
SAS 대역폭 | 600MByte/s | 1 | 1 |
SAS의 하드웨어적인 컨트롤러
참고; http://support.ap.dell.com/support/edocs/storage/RAID/PERC5/ko/index.htm
http://www.acnc.com/04_01_00.html
Dell PERC(PowerEdge Expandable RAID Controller) 5/E의 외형은 SCSI 컨트롤러인 320-2e(perc 4e/dc)와 유사합니다.
RAID 레벨 요약
RAID 0은 특히 어떤 환경에서 데이터 중복을 필요로 하지 않는 큰 파일에 높은 데이터 처리량을 제공하기 위해 디스크 스트라이핑을 사용합니다.
RAID 1은 디스크 미러링을 사용하여 하나의 물리 디스크에 기록되는 데이터를 동시에 다른 물리 디스크에 쓸 수 있습니다. 이 기능은 적지만 완전한 데이터 중복 용량을 필요로하는 소규모 데이터베이스나 기타 응용 프로그램에 적합합니다.
RAID 5는 모든 물리 디스크에서 디스크 스트라이핑 및 패리티 데이터 (분산 패리티)를 사용하여 특히 규모가 작은 무작위 액세스를 위해 높은 데이터 처리량 및 데이터 중복성을 제공합니다.
RAID 0과 RAID 1의 조합인 RAID 10은 미러링 처리된 스팬에서 디스크 스트라이핑을 사용합니다. 높은 데이터 처리량과 완벽한 중복 데이터를 제공합니다.
RAID 0과 RAID 5로 구성된 RAID 50은 분산 데이터 패리티와 디스크 스트라이핑을 사용하며, 높은 시스템 가용성, 높은 요구 속도, 높은 데이터 전송률, 중간~대용량을 필요로 하는 데이터를 이용한 작업에 최적입니다.
RAID 용어
디스크 스트라이핑
디스크 스트라이핑은 단 하나의 물리 드라이브 대신 여러 물리 디스크에 데이터를 기록하는 것입니다. 디스크 스트라이핑은 종종 스트라이프 크기로 설명되는 8 KB ~ 128 KB의 크기로 변경이 가능한 스트라이프에 각각의 물리 디스크 저장 공간을 분할하는 작업을 나타냅니다. 이 스트라이프들은 반복되는 연속적인 방법으로 상호배치됩니다. 단일 물리 디스크에서 스트라이프 부분을 스트립이라 합니다.
예를 들어, RAID 레벨 0에서와 같이 디스크 스트라이핑만 사용하는 4 디스크 시스템에서 세그먼트 1은 디스크 1에 기록되고 세그먼트 2는 디스크 2에 기록되는 방식으로 기록됩니다. 디스크 스트라이핑을 사용하면 여러 개의 물리 디스크가 동시에 접근되므로 성능이 향상됩니다. 디스크 스트라이핑은 데이터 중복성을 제공하지 않습니다.
아래 그림에서 디스크 스트라이핑(Raid0)의 예를 보여 줍니다.
디스크 미러링
RAID 1에서처럼 미러링을 사용하면 하나의 디스크에 기록되는 데이터가 다른 디스크에도 동시에 기록됩니다. 하나의 디스크가 고장나면 다른 디스크의 내용을 사용하여 시스템을 실행하고 실패 물리 디스크를 복구할 수 있습니다. 디스크 미러링의 주요 장점은 100%의 데이터 중복성을 제공한다는 점입니다. 디스크 내용이 두 번째 디스크에 다시 전체적으로 기록되므로 디스크 중 하나가 고장나더라도 문제가 되지 않습니다. 두 디스크에는 항상 같은 데이터가 포함되어 있습니다. 하나의 물리 디스크는 운영 체제용 물리 디스크로 사용될 수 있습니다.
디스크 미러링은 100% 중복성을 제공하지만 시스템의 각 물리 디스크를 모두 복사해야 하므로 많은 비용이 소모됩니다. 그림 1-2에서는 디스크 미러링의 예를 보여 줍니다.
주: 미러링 처리된 물리 디스크는 읽기 로드 균형을 통해 읽기 성능을 향상시킵니다.
아래 그림은 디스크 미러링의 예 (RAID 1)
패리티
패리티는 둘 이상의 상위 데이터 세트로부터 중복 데이터 세트를 생성합니다. 중복 데이터는 상위 데이터 세트 중 하나를 복구하는 데 사용될 수 있습니다. 패리티 데이터는 상위 데이터 손실 발생시 그러한 데이터를 복제하는데 사용될 수 있지만 상위 데이터 세트를 완전히 복제하지 않습니다. RAID에서 이 방법은 하나의 물리 디스크 그룹의 모든 물리 디스크에 대한 전체 물리 디스크 또는 스트라이프에 적용됩니다.
패리티 데이터는 시스템의 하나 이상의 물리 디스크에 분산됩니다. 하나의 물리 디스크가 고장나면 패리티와 나머지 물리 디스크의 데이터를 사용하여 실패 드라이브를 복구할 수 있습니다. RAID 레벨 5는 그림 1-3에서와 같이 분산 패리티를 디스크 스트라이핑과 조합합니다. 패리티는 전체 물리 디스크의 내용을 복제하지 않고 하나의 물리 디스크 장애에 대한 중복성을 제공합니다. 그러나, 패리티 생성은 기록 과정의 속도를 저하시킬 수 있습니다.
아래 그림은 분산 패리티의 예 (RAID 5)