ブロケードさんから今後普及していくことが有望視されているDCB/FCoE製品であるDCB/FCoEスイッチのBrocade 8000(以降BR8000)とConverged Network Adapter(以降CNA)のBrocade 1020(以降BR1020)をお借りできたので、評価してみました。 DCBもFCoEも新しい技術ですので、いろいろと勉強しながら設定等を進めていきました。
構成
評価システムは以下のような構成です。
1Uサーバ ハードウェア仕様
本体 | Dell R610 | |
CPU | Intel Xeon X5570 2.93GHz | x2 |
メモリ | 24GB | 4GB x 6 |
ストレージ ハードウェア仕様(Linux SCST softwareターゲット) 1号機
本体 | HP DL380G5 | |
HBA | Qlogic QLE2460 | 4GbitFC 1port x2 |
2号機
本体 | HP BL460cG1 | |
HBA | QLogic QMH2462 | 4GbitFC 2port x1 |
構成解説
今回の評価では、BR1020を搭載した1UサーバからBR8000を経由してFibre Channel(以下FC)ストレージ装置にアクセスを行い、その性能を計測しました。 ここで問題となったのが弊社に常設されているFCストレージシステムでは、10GbEのFCoEが持つと予想される帯域幅やIO性能を十分に発揮させることができないということでした。 通常、この手の試験では、この問題を回避するため、SANBlaze Technology社のターゲットエミュレーションシステムを利用することで、超高速なストレージ装置をエミュレートして性能測定を行います。ですが、今回はLinux SCST(Software SCSI target)のNULLIO modeを利用することで、この問題を回避しました。
測定方法
測定は、1UサーバにOSとしてMicrosoft Windows Server 2008 R2 Enterpriseを導入後、ベンチマークツールであるIOmeter(2008-06-22-rc2)を利用して行いました。 帯域幅の測定は、1MB単位でシーケンシャルなアクセスを行うワーカー(ディスクへのIOを実際に行うIOmeterのプロセス)をターゲットごとに動作させて行いました。 ※ターゲットは、各ストレージハードウェアのFCポート毎に作成したため4つです。よってワーカーの数も4つです。各ワーカーのQueue Depthは1に設定
IO性能(IOPS)の測定は、4KB単位でランダムなアクセスを行うワーカーを1Uサーバに搭載されているコア数である8つ動作させて行いました。 ※各ワーカーのQueue Depthは8に設定
測定結果
以下の測定結果は、BR1020の1ポートだけを利用した場合の値です。 (2ポートの場合は、ターゲット側の性能不足で正しい計測値が得られませんでした)
種別 | 結果 | CPU利用率 |
---|---|---|
帯域幅 | 1063MB/sec | 1.5% |
IOPS | 259326 | 29.1% |
測定結果解説
帯域幅の測定結果は、10GbEの持つ帯域幅をほぼ使い切る性能があることを示しています。またCPU負荷も非常に低く抑えられています。 IO性能(IOPS)の測定結果は、アクセス単位が4KBなことを考えると、10GbEの持つ帯域幅が律速となる最大IOPS性能を持っていることを示しています。 CPU負荷も同時に計測を行った他社の10GbE NICと比較すると半分近くに抑えられておりDCB及びFCoE処理をすべてカード側で行うBR1020の優位性が確認できました。
まとめ
10GbE 1ポート及び4Gb FC 4ポートのみでのテストでしたが、Brocade8000がDCB(CEE)及びFCoEに対応したスイッチとして高い性能を持っていることが伺える測定結果が得られました。 また、CNAであるBrocade 1020がDCB及びFCoE処理をホスト側にほとんど負荷を掛けずに行え、10GbEの持つ帯域をフルに活用できる性能を持っていることが確認できました。