Tải bản đầy đủ (.pdf) (94 trang)

Công nghệ mạng lưu trữ và vấn đề hiệu suất, thiết kế, duy trì mạng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.92 MB, 94 trang )





ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ




Nguyễn Anh Tiến



CÔNG NGHỆ MẠNG LƯU TRỮ VÀ VẤN ĐỀ
HIỆU SUẤT, THIẾT KẾ, DUY TRÌ MẠNG


LUẬN VĂN THẠC SĨ








Hà nội, 2007





ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ



Nguyễn Anh Tiến


CÔNG NGHỆ MẠNG LƯU TRỮ VÀ VẤN ĐỀ
HIỆU SUẤT, THIẾT KẾ, DUY TRÌ MẠNG

Ngành: Công nghệ Điện tử - Viễn thông
Mã số: 2.07.00

LUẬN VĂN THẠC SĨ

Người hướng dẫn khoa học:
PGS.TS. Vương Đạo Vy




Hà nội, 2007







MỤC LỤC
LỜI CẢM ƠN 3
DANH MỤC HÌNH VẼ SỬ DỤNG 7
DANH SÁCH CÁC KÝ HIỆU, TỪ NGỮ VIẾT TẮT 9
MỞ ĐẦU 10
1 CHƢƠNG 1: GIỚI THIỆU VỀ MẠNG LƢU TRỮ DỮ LIỆU (STORAGE
AREA NETWORK– SAN) 12
1.1 Tổng quan về SAN 12
1.2 Lợi ích của lƣu trữ SAN 16
1.2.1 Đảm bảo tính sẵn sàng cao: 16
1.2.2 Tập trung thiết bị lưu trữ 17
1.2.3 Giảm nghẽn mạng khi sao lưu dữ liệu (backup) 17
1.2.4 Giảm tải cho máy chủ khi sao lưu dữ liệu 18
1.2.5 Tăng tốc độ truy cập dữ liệu 18
1.2.6 Đảm bảo khả năng kháng cự với sự cố: 19
2 CHƢƠNG 2: CƠ BẢN VỀ KÊNH QUANG 20
2.1 Kiến trúc của SAN và các thuật ngữ căn bản: 20
2.2 Phân tầng kênh quang 24
2.3 Các mức dịch vụ và điều khiển luồng dữ liệu 30
2.3.1 Mức 1 ( class 1) 30
2.3.2 Mức 2 (class 2) 30
2.3.3 Mức 3 (class 3) 31
2.3.4 Mức 4 (class 4) 32
2.3.5 Mức F (class F) 33
2.4 Topo mạng lƣu trữ: 34
2.4.1 Cách gọi tên port trên mạng 34
2.4.2 Mô hình kết nối điểm tới điểm 36
2.4.3 Mô hình kết nối vòng lặp có trọng tài phân xử (FC- AL) 37
2.4.3.1 Cơ chế thâm nhập mạng FC-AL 38
2.4.3.2 Đánh địa chỉ trên mạng FC-AL 39

2.4.4 Mô hình Switch Fabric 40
2.4.4.1 Switch Fabric làm việc như thế nào? 40
2.4.4.2 Các dịch vụ trên Fabric: 42
2.4.4.3 Đánh đia chỉ trên fabric 43
2.4.4.4 Trình tự đăng nhập fabric của node (Fabric –login sequence) 43
2.4.4.5 Thủ tục N_port login (PLOGIN- Port login) 44
2.5 Cáp truyền dẫn 46
2.5.1 Cáp đồng: 46
2.5.2 Cáp quang đa mode: 47
2.5.3 Cáp đơn mode 47
2.6 Đầu nối cáp (cable connector) 48
2.6.1 Đầu nối cáp đồng DB-9 48
2.6.2 Đầu kết nối HSSDC (High Speed Serial Data Connector) 49
2.6.3 Đầu nối cáp quang SC. 49




2.6.4 Đầu nối cáp quang mật độ cao- LC 50
2.6.5 Đầu GBIC 50
2.6.6 Card HBA (Host Bus Adapter) 51
2.7 Hub cho kênh quang 52
2.7.1 Hub không có chức năng quản lý (Unmanaged Hub): 52
2.7.2 Hub có chức năng quản lý (managed hub): 52
2.8 Switch trên kênh quang: 52
2.9 So sánh SAN với các công nghệ lƣu trữ khác 53
2.9.1 Ưu điểm của SAN so với DAS 54
2.9.2 Ưu điểm của SAN so với NAS 54
3 CHƢƠNG 3: HIỆU SUẤT LƢU TRỮ SAN 56
3.1 Các nhân tố hiệu năng: 56

3.1.1 Tốc độ dữ liệu: 56
3.1.2 Thời gian đáp ứng (Response Time): 57
3.1.3 Hiệu năng của đĩa cứng: 57
3.2 Nhiễu, suy giảm tín hiệu trên kênh quang 59
3.2.1 Suy hao (Attenuation): 59
3.2.2 Tán sắc (Dispersion): 59
3.2.3 Trễ (Latencies): 59
3.3 Đặc thù môi trƣờng: 60
3.3.1 Các mức RAID và chọn lựa: 60
3.3.2 Các mức RAID : 60
3.3.3 So sánh giữa các mức RAID 61
3.3.4 Tương quang hiệu năng của RAID với thao tác đọc ghi 62
3.3.5 Một số môi trường ứng dụng tiêu biểu: 62
3.3.5.1 SQL Server 2000: 62
3.3.5.2 Oracle 8 : 63
3.3.5.3 Exchange server: 63
3.4 Lên kế hoạch cho thiết bị lƣu trữ 63
3.4.1 Luật 1: Sử dụng tổ hợp đĩa (disk array): 63
3.4.2 Luật 2: phân tách vật lý dữ liệu tuần tự với dữ liệu ngẫu nhiên. 63
3.4.3 Luật 3: chia datafile lên càng nhiều đĩa càng tốt 64
3.4.4 Luật 4: không dùng RAID 5 cho các ứng dụng có tỷ lệ thao tác ghi cao. 64
3.4.5 Luật 5: sử dụng raid 1 vật lý cho các redo log file, và raid 5 cho data file.
64
3.4.6 Luật 6 cân bằng lượng IO cho cả tổ hợp đĩa 64
3.4.7 Công nghệ Disk caching 65
3.4.7.1 Read- ahead Caching: 65
3.4.7.2 Write – back Caching: 66
3.4.7.3 Ảnh hưởng của cache: 67
4 CHƢƠNG 4: THIẾT KẾ, TRIỂN KHAI VÀ DUY TRÌ HOẠT ĐỘNG CHO
SAN 69

4.1 Kiến thức căn bản khi thiết kế SAN: 69
4.2 Quan điểm thiết kế SAN của HP (Hewlett-Packard) : 69
4.2.1 Tiếp cận với thiết kế đơn giản của HP 70
4.2.1.1 Thiết kế và triển khai một SAN sử dụng bản thiết kế đơn giản sẵn có
của HP. 70
4.2.1.2 Một số biến thể của thiết kế sẵn có: 70
4.2.1.3 Thay đổi thiết kế SAN sử dụng các quy định thiết kế: 70
4.3 Xác định các yêu cầu của cơ sở hạ tầng: 71
4.3.1 Vấn đề tồn tại lớn nhất cần giải quyết là gì? 72




4.3.2 Yêu cầu hoạt động nào cần có giải pháp? 72
4.3.3 Các server kết nối với SAN như thế nào? 73
4.3.4 SAN sẽ hỗ trợ, thúc đẩy những ứng dụng nào? 74
4.3.5 Thiết bị nào trong giải pháp đã có ? 74
4.3.6 Thiết bị nào đang chạy chính thức (in Production) ? 74
4.3.7 Thiết bị, thành phần nào cần xây dựng mô hình và thử nghiệm? 75
4.3.8 Thiết bị nào có sẵn để thử nghiệm mô hình? 75
4.3.9 Các phiên backup được tiến hành khi nào và thực hiện như thế nào? 75
4.3.10 Đặc điểm hiệu năng hiện tại như thế nào? 75
4.3.11 Thời gian ngừng cung cấp dịch vụ là bao nhiêu ? 76
4.3.12 Thời gian hoàn thành từng việc của đề án ? 76
4.4 Cân nhắc kế hoạch sau khi thu thập đƣợc thông tin: 77
4.4.1 Cân nhắc hiệu năng 77
4.4.1.1 Quá tải: 77
4.4.1.2 Đặc thù I/O: 77
4.5 Cân nhắc khi cài đặt SAN 78
4.5.1 Đi cáp thế nào để quản lý đơn giản: 78

4.5.2 Cân nhắc khi lắp thiết bị lên tủ: 80
4.5.3 Quản lý in-band hay out-band: 81
4.5.4 Cài đặt các tham số cho switch, dây cáp 82
4.5.5 Nên dùng phiên bản nào của hệ điều hành Fabric ?: 83
4.5.6 Cách quản lý SAN tự động 83
4.5.6.1 Fabric OS API 84
4.5.6.2 Expect Scripting 85
4.5.7 Cân nhắc về phân vùng SAN (SAN zoning) 85
4.6 Một số kinh nghiệm với cấu hình zone: 86
4.6.1 Giảm tương tác không mong muốn: 86
4.6.2 Môi trường phức tạp: 86
4.6.3 Ánh xạ tên (alias): 86
4.6.4 Thêm switch vào fabric: 86
4.6.5 Địa chỉ WWN của node và Port: 86
4.6.6 Sao lưu cấu hình: 87
4.7 Đánh giá Fabric 87
4.7.1 Dựng hỗ sơ ban đầu cho mạng SAN: 87
4.7.2 Mô phỏng sự cố (Fault Injection): 88
4.7.3 Chạy thử tải I/O (Runing I/O load) 88
4.8 Duy trì SAN 88
4.8.1 Duy trì nhật ký cấu hình: 89
4.8.2 Sao lưu và phục hồi cấu hình cho switch: 89
4.8.3 Khởi động fabric: 90
4.8.4 Mở rộng fabric, gộp fabric, thêm switch hoặc thay thế switch 90
KẾT LUẬN 92
TÀI LIỆU THAM KHẢO 94









DANH SÁCH CÁC KÝ HIỆU, TỪ NGỮ VIẾT TẮT
ACL - Access Control List
ATM – Asynchronous Tranfer Mode
CRC - Cyclic Redundant Check
DAS - Direct Attached Storage
DES - Data Encryption Standard
EOF - End of Frame
FC - Fibre Channel
FC-AL - Fibre Channel Arbitrated Loop
FCP - Fibre Channel Protocol
FCIP - Fibre Channel over IP
FDDI - Fiber Distributed Data Interface
GBIC - Gigabit Interface Converters
HBA - Host Bus Adapter
HA- High availability
HSSDC -High Speed Serial Data Connector
HiPPI - High- Performance Parallel Interface
ID - Identification
iFCP - Internet Fibre Channel Protocol
I/O - Input/Output
IOPS - Inputs/Outputs Per Second
IP - Internet Protocol
iSCSI - Internet Small Computer System Interface
ISL - Inter-Switch Link
iSNS - Internet Storage Name Services
JBOD - Just a Bunch of Disks

LAN - Local Area Network
NAS - Network Attached Storage
NIC - Network Interface Card
OLTP - Online Transaction Processing
RAID - Redundant Array of Independent Disk
SAN - Storage Area Network
SNS - Simple Name Server
SCSI - Small Computer System Interface
SOF - Start of Frame
TCP - Transmission Control Protocol
UDP - User Datagram Protocol
ULP - Upper Layer Protocol
VI - Virtual Interface
WWN - World Wide Name
WWPN - World Wide Port-Name





DANH MỤC HÌNH VẼ SỬ DỤNG
Hình 1.1 Bus kết nối SCSI song song 13
Hình 1.2 Sử dụng kênh quang để tăng khoảng cách 14
Hình 1.3 Vòng kết nối nhiều máy chủ với thiết bị lưu trữ 15
Hình 1.4 Kết nối máy chủ với thiết bị lưu trữ qua chuyển mạch kênh quang 15
Hình 1.5 Mô hình mạng lưu trữ dữ liệu hiện đại 16
Hình 2.1 Thiết bị lưu trữ gắn liền với server 21
Hình 2.2 Thiết bị lưu trữ trên SAN 21
Hình 2.3 Một Fabric tiêu biểu 23
Hình 2.4 Phân tầng kênh quang 24

Hình 2.5 Mã hóa và giải mã tại mức FC-1 25
Hình 2.6 Tiêu đề của khung 26
Hình 2.7 mô tả hoạt động của dịch vụ mức 1 31
Hình 2.8 mô tả hoạt động dịch vụ mức 2 32
Hình 2.9 mô tả hoạt động dịch vụ mức 3 32
Hình 2.10 các topo của mạng lưu trữ dữ liệu - SAN 35
Hình 2.11 Mô hình vòng lặp FC-AL 36
Hình 2.12 Mô hình kết nối điểm điểm 37
Hình 2.13 Mô hình kết nối vòng lặp có trọng tài phân xử 37
Hình 2.14 cơ chế hoạt động của LPSM 38
Hình 2.15 Cấu trúc địa chỉ của mạng FC-AL 39
Hình 2.16 Một mạng Fabric 41
Hình 2.17 Phân vùng trên fabric 41
Hình 2.18 Quá trình đăng nhập fabric của node 44
Hình 2.19 Thủ tục PLOGIN 45
Hình 2.20 Các thành phần khác nhau trên SAN 46
Bảng 2.1 Ước tính tốc độ truyền với khoảng cách cho cáp đồng 47
Bảng 2.2 Điểm khác biệt của khoảng cách truyền trên 02 loại cáp 48
Bảng 2.3 khoảng cách và tốc độ truyền với cáp đơn mode 48
Hình 2.21 đầu nối DB-9 cho kênh quang 49
Hình 2.22 đầu nối HSSDC 49
Hình 2.23 Hai loại đầu nối cáp SC 49
Hình 2.24 Ảnh thực của 02 loại đầu đấu nối 50
Hình 2.25 Đầu GBIC và đầu nối cáp quang 51
Hình 2.26 Hình ảnh bên ngoài của HBA 52
Hình 2.27 Mô hình lưu trữ DAS 53
Hình 2.28 Mô hình lưu trữ NAS 53
Hình 2.29 Mô hình lưu trữ SAN 54
Hình 3.1 Kết quả thống kê giữa kích thước I/O và tốc độ dữ liệu 56
Hình 3.2 Minh họa hiện tượng nghẽn cổ chai 57

Hình 3.3 Các yếu tố ảnh hưởng đến hiệu năng của đĩa cứng 58
Hình 3.4 Mô tả hiệu năng của tủ với mức RAID và số lượng đĩa trên tủ 58
Hình 3.5 tương quan hiệu năng với thao tác đọc ghi 62
Hình 3.6 So sánh hiệu năng của hệ thống thường với hệ thống sử dụng read ehead
caching 66
Hình 3.7 Write – back caching 66
Hình 3.8 hiệu năng của read ahead caching và write – back caching 68
Hình 4.1 một ví dụ về đi cáp ISL gọn gàng 79




Hình 4.2- Cách bố trí không tiện cho quản lý và vận hành 79
Hình 4.3 cách bố trí tốt hơn cho các thiết bị trên hình 4.2 79
Hình 4.4 cách đi cáp đẹp, thuận tiện trong vận hành và bảo trì 80
Hình 4.5 lắp rack và nguồn cho thiết bị High Availibility 81
Hình 4.6 kết nối quản lý in-band 82
Hình 4.7 Khác biệt giữa hard zoning và soft zoning 87






MỞ ĐẦU
Mạng lưu trữ (SAN- Storage Area Network) ngày càng phát triển cùng
với sự phát triển của các ứng dụng có yêu cầu lưu trữ số lượng lớn, ví dụ như hệ
thống dữ liệu tài chính, ngân hàng, hệ thống lưu trữ quốc gia.
SAN là một mạng nhỏ có tốc độ truyền dữ liệu cao và khả năng chia sẻ
thiết bị trên cùng mạng như tủ đĩa, tủ tape. SAN cho phép kết nối máy chủ, máy

trạm với thiết bị lưu trữ trên nền các các công nghệ kết nối như Fibre Channel,
SCSI (Small Computer System Interface). Công nghệ kết nối Fibre Channel
cung cấp một băng thông ổn định với hiệu suất cao trên một khoảng cách xa,
khả năng tạo các đường kết nối dự phòng và cân bằng tải nhằm đảm bảo tính
sẵn sàng cao cho hệ thống.
Kiến trúc SAN được xây dựng sao cho tất cả các máy chủ, máy trạm đều
có thể truy cập đến các thiết bị lưu trữ. Do dữ liệu được lưu trữ riêng biệt không
nằm trên máy chủ nên máy chủ được tập trung để xử lý yêu cầu cho ứng dụng.
Giống như mạng cục bộ (LAN- Local Area Network), các thành phần trên SAN
cũng bao gồm SAN switch, router, các máy chủ, máy trạm và các thiết bị lưu
trữ. SAN hỗ trợ truyền tốc độ cao giữa các máy chủ và thiết bị lưu trữ theo các
phương thức: máy chủ đến thiết bị lưu trữ, máy chủ đến máy chủ, thiết bị lưu
trữ đến thiết bị lưu trữ. SAN cung cấp khả năng linh hoạt chưa từng có về quản
lý và cấu hình, đem lại khả năng sẵn sàng, độ tin cậy cao nhất.
Mạng lưu trữ là một đề tại phong phú về nội dung, nhưng do thời gian có
hạn đề tài chỉ xin phép được đề cấp khái quát về cấu trúc mạng và đi sâu vào
đánh giá hiệu năng, cách thức thiết kế, duy trì mạng SAN. Để phản ánh được
các tiêu chí này, đề tài sẽ được chia thành 04 chương như sau:
- Chương 1: Giới thiệu chung về mạng lưu trữ dữ liệu
- Chuơng 2: Cơ bản về kênh quang
- Chương 3: Hiệu suất lưu trữ SAN
- Chương 4: Thiết kế SAN, triển khai và duy trì hoạt động cho SAN





12




1 CHƢƠNG 1: GIỚI THIỆU VỀ MẠNG LƢU TRỮ DỮ LIỆU
(STORAGE AREA NETWORK– SAN)
Trong những năm đầu của thập kỷ 80, các hệ thống lưu trữ dữ liệu đính kèm trực
tiếp (Direct – Attach Disk Storage) dựa trên công nghệ SCSI (Small Computer
Systems Interface) là chuẩn kết nối tiêu biểu giữa máy chủ và thiết bị lưu trữ. Cách
kết nối này giúp hệ thống máy chủ làm việc ổn định, kết nối với tủ đĩa với tốc độ và
hiệu suất cao.
Tuy nhiên, với sự ra tăng về tốc độ của các hệ thống máy tính và yêu cầu dung
lượng của thiết bị lưu trữ làm cho kiến trúc kết nối SCSI song song bắt đầu chạm phải
ngưỡng tối đa công suất và khoảng cách truyền dữ liệu. Đáp ứng lại yêu cầu này kênh
quang (fiber- channel) được phát triển. Kênh quang có khả năng hỗ trợ giao thức SCSI
cho thiết bị lưu trữ , hỗ trợ giao thức IP cho mạng máy tính và hỗ trợ giao diện ảo
(Virtual Interface) cho cluster. Kênh quang cho phép khoảng cách truyền xa đến 10km
với tốc độ truyền ở đơn vị gigabit. Với tất cả các tính năng này kênh quang hiện đang
được sử dụng trong hầu hết các thiết bị lưu trữ cấp cao (hi-end), với dung lượng lớn.
Nhờ các tính năng và sự chấp nhận của thị trường, kênh quang đang dần thay thế
các giao diện SCSI song song trong các thiết bị lưu trữ. Cũng dựa trên kênh quang
một kỹ thuật mới được sinh ra là Mạng lưu trữ dữ liệu kênh quang (Fibre Channel
Storage Area Network –SAN). SAN là một mạng gồm có thiết bị lưu trữ dữ liệu và
các thành phần của hệ thống ( ví dụ như máy chủ, card quang, switch…) SAN có khả
năng cung cấp đường kết nối có hiệu năng cao cho các thiết bị, cung cấp đường dự
phòng cho thiết bị lưu trữ, tăng tốc cho công tác sao lưu dữ liệu và hỗ trợ các hệ thống
cluster khả dụng cao (high- availability)
1.1 Tổng quan về SAN
Trong suốt những năm của thập niên 1980, cách thức kết nối truyền thống giữa
máy tính (host) với thiết bị lưu trữ là điểm tới điểm (point to point), hay còn gọi là gắn
trực tiếp vào máy tính (Direct- Attached) thông qua các chuẩn giao tiếp như IDE
(Integrated Drive Electronics) hoặc SCSI song song. Trong đó SCSI song song thường
có tốc độ truyền dẫn là 5 hoặc 10 Mbit/giây giữa host với thiết bị lưu trữ. Các hệ

thống lưu trữ trong thời gian này cũng đã cho phép kết nối nhiều đĩa tới một host
thông qua một giao diện duy nhất [1,4,5].
13




Hình 1.1 Bus kết nối SCSI song song
Với khả năng làm việc khá ổn định, tốc độ kết nối cao, và khả năng cho phép
người quản trị kết nối các thiết bị lưu trữ trong và ngoài một cách đơn giản. SCSI song
song đã đáp ứng được yêu cầu của thị trường trong những năm 1980. Tuy nhiên khi
dung lượng hệ thống lưu trữ ngày một lớn hơn, máy chủ có tốc độ xử lý ngày càng
nhanh hơn thì một vấn đề nảy sinh là các thiết bị lưu trữ ngoài (external storage device)
bắt đầu lớn lên. Các thiết bị lưu trữ dựa trên SCSI ngày càng yêu cầu tăng thêm dung
lượng. Khoảng cách giữa máy chủ với thiết bị lưu trữ cũng đòi hỏi ngày một xa hơn.
Tốc độ truy cập vào ra (I/O rate) cũng phải tăng lên. Để đáp ứng một phần các yêu cầu
này một số biến thể (variant) của chuẩn SCSI được phát minh để hỗ trợ khoảng cách
giữa máy chủ và thiết bị lưu trữ xa hơn. Tuy nhiên yêu cầu về tốc độ truyền dẫn luôn
gặp khó khăn với giao tiếp SCSI song song, để đáp ứng đầy đủ các yêu cầu này các
giải pháp dần dần được phát triển. Một trong hướng phát triển là xây dựng thiết bị lưu
trữ truyền dữ liệu nối tiếp với bộ truyền nhận tốc độ cao, kháng nhiễu, đơn giản trong
ghép nối, nhiều công ty đã tiến hành thí nghiệm việc truyền dẫn nối tiếp trên các môi
trường khác nhau và đã có nhiều mạch tốc độ cao cho phép tốc độ truyền dẫn lên đến
100Mbit/giây ra đời [1].
Công nghệ kênh quang được sử dụng lần đầu tiên vào kết nối thiết bị lưu trữ chỉ để
giải quyết việc tăng khoảng cách, đơn giản việc nối cáp. Việc tăng khoảng cách truyền
này đã căn bản thay thế các thiết bị sử dụng kết nối SCSI cũ bằng kênh truyền nối tiếp
quang tốc độ cao.
14






Kết nối kênh quang cung cấp các giao diện kết nối có tốc độ cao hơn, đơn giản về
việc đấu nối (cabling), có thể đấu nối server với các thiết bị lưu trữ ở xa đến 10km
hoặc 30km khi có hỗ trợ của thiết bị mở rộng.
Các thiết bị lưu trữ kênh quang ban đầu sử dụng giao thức Fibre Channel
Arbitrated Loop (FC-AL). Giao thức này cho phép các đĩa trong cùng một vòng tự
thỏa thuận địa chỉ với nhau trước khi trao đổi dữ liệu trên vòng kết nối. (Hình 1.3).
FC-AL giúp việc gắn nối, mở rộng các thiết bị lưu trữ trở nên đơn giản, giúp phân
cách thiết bị lưu trữ ra khỏi máy chủ. Việc ghép nối giữa máy chủ với thiết bị lưu trữ
còn linh hoạt hơn với sự trợ giúp của các thiết bị ghép nối như hub kênh quang
(Fiber- channel hub) hoặc switch kênh quang (Fiber – channel switch). Các thiết bị kết
nối làm giảm lỗi trên mạng và tăng cường tín hiệu trên đường truyền [4,5,6].

Hình 1.2 Sử dụng kênh quang để tăng khoảng cách
15



Hình 1.3 Vòng kết nối nhiều máy chủ với thiết bị lƣu trữ


Hình 1.4 Kết nối máy chủ với thiết bị lƣu trữ qua chuyển mạch kênh quang
Ngày nay mạng lưu trữ -SANcó cấu trúc giống như mạng máy tính. Các thiết bị cơ
sở hạ tầng bao gồm hub, switch, bridge và router cũng đóng vai trò chuyển tiếp hoặc
định hướng dữ liệu đi trên mạng. Giao diện giao tiếp giữa máy chủ với mạng lưu trữ
giờ được gọi là Host Bus Adapter- HBA[1].
16





Hình 1.5 Mô hình mạng lƣu trữ dữ liệu hiện đại
1.2 Lợi ích của lƣu trữ SAN
1.2.1 Đảm bảo tính sẵn sàng cao:
Dữ liệu số hóa, dữ liệu của các ứng dụng Internet, ngân hàng, điện lực
đều tăng theo hàm mũ với biến là thời gian. Có khá nhiều kỹ thuật cũng được
đưa ra để đáp ứng với sự gia tăng này như web caching, web load balancer,
distributed server cluster. Tuy nhiên các kỹ thuật này không thể áp dụng vào
cho các ứng dụng quan trọng như lưu trữ ảnh, email, cơ sở dữ liệu cho các ứng
dụng ngân hàng, tài chính hay thương mại điện tử. Các ứng dụng này đòi hỏi
phải đáp ứng khả năng cung cấp thông tin, giá cả trực tuyến. thông tin phải
trung thực, chính xác. Chính vì vậy độ khả dụng cao với những hệ thống này là
17



cực kỳ quan trọng, việc ngừng cung cấp dịch vụ của hệ thống trong khoảng
thời gian ngắn sẽ gây ra những tổn thất lớn lao.
Ví dụ: Với phần mềm email server nổi tiếng của microsoft là Exchange
Server, việc sử dụng lưu trữ SAN sẽ giúp cho Exchange có khả năng sử dụng
cơ sở dữ liệu có kích thước lớn, đáp ứng được sự gia tăng về số người dùng
cũng như dung lượng của từng hòm thư trong doanh nghiệp. Các lỗi tại một
điểm (single point of failure) được khắc phục bởi tính dự phòng toàn bộ của
SAN và các giải pháp Cluster ứng dụng của microsoft.
Các hệ thống có độ an toàn cao (HA- High availability) ngày này được sử dụng
phổ biến trong thiết kế đảm bảo khả năng kháng lỗi cho thiết bị lưu trữ.
Nhìn chung với tính sẵn sàng cao trong thiết bị lưu trữ, đường kết nối và

các thiết bị khác. SAN cho phép các máy chủ kết nối đến thiết bị lưu trữ bằng
nhiều đường khác nhau và cung cấp khả năng dự phòng cho từng đường, linh
hoạt, đơn gian hơn trong việc quản lý vùng lưu trữ.
1.2.2 Tập trung thiết bị lưu trữ
Dữ liệu của một hệ thống sẽ gia tăng cùng với thời gian, việc gia tăng
cũng gây khó khăn trong việc quản lý các thiết bị lưu trữ đơn lẻ được gắn cùng
server. Để quản lý được sự gia tăng vùng lưu trữ các nhà quản trị hệ thống bắt
đầu tập trung các thiết bị lưu trữ. Xu hướng sử dụng thiết bị lưu trữ lớn xuất
hiện nhiều hơn việc sử dụng các thiết bị lưu trữ cục bộ đơn lẻ.
Do các tính năng nổi bật của lưu trữ SAN các nhà quản trị hệ thống đã
nhận thấy rằng mặc dù nhu cầu của cơ quan, công ty mình hiện chưa cần
chuyển sang lưu trữ SAN nhưng cũng cho rằng việc triển khai SAN vào hệ
thống của mình là đúng lúc. Ví dụ : Web server đang thiếu vùng lưu trữ dữ
liệu trong khi một server bên cạnh – Database server lại còn trống hàng trăm
Gigabyte. Với các thiết bị lưu trữ cũ không có cách nào để giải quyết được yêu
cầu này nên nhiều trường hợp người sử dụng phải trả chi phí lớn cho việc dự
toán vùng lưu trữ không hợp lý.
1.2.3 Giảm nghẽn mạng khi sao lưu dữ liệu (backup)
Hầu hết các nhà quản trị hệ thống phải đối đầu với việc mạng tắc nghẽn
khi thực hiện sao lưu dữ liệu bởi đa số các phần mềm backup (như VERITAS
18



NetBackup, Legato NetWorker) đều chuyển dữ liệu qua giao thức Internet
Protocol (IP), vì vậy mỗi khi thực hiện backup đường mạng Ethernet sẽ dần
dần bị chậm đi. Mặc dù có cân nhắc đến thời gian backup vào thời điểm ít hoặc
không có người dùng trên mạng nhưng một số doanh nghiệp (Ngân Hàng, Tài
Chính, Viễn thông …) vẫn phải thực hiện backup thường xuyên để đáp ứng
được với sự thay đổi của nội dung dữ liệu.

Một trong những kỹ thuật cho phép loại bỏ nghẽn mạng khi backup là
dùng giao thức internet trên kênh quang (IP over Fibre channel). Khi IP được
truyền trên kênh quang sẽ không ảnh hưởng đến tải trên đường mạng và thừa
hưởng được các đặc tính ưu việt của kênh quang.
1.2.4 Giảm tải cho máy chủ khi sao lưu dữ liệu
Với phần mềm backup chạy trên giao thức internet đều phải nhờ đến
server khi sao lưu, dữ liệu cần sao lưu phải đi qua bộ nhớ của máy chủ, hơn
nữa máy chủ phải giành CPU để xử lý việc này.
Với sao lưu dữ liệu qua kênh quang, các phần mềm backup có thể điều
khiển dữ liệu chạy từ thiết bị lưu trữ đến kênh quang sau đó về thiết bị sao lưu
mà không qua máy chủ. Chính vì ưu điểm này nên đã có khá nhiều công ty,
doanh nghiệp đã mua thiết bị chuyển đổi từ kênh SCSI sang kênh quang để tận
dụng các ưu điểm của kênh quang, tối ưu lại việc sử dụng các thiết bị cũ hiện
đang có.
Intel, Microsoft và Compag đưa ra giao thức VI (Virtual Interface) nhằm
giảm sự điều khiển của CPU khi truyền dữ liệu qua đường mạng. Giao thức
này cũng được sử dụng rộng rãi trong các phần mềm cluster của HP và IBM.
VI giảm sự phức tạp của IP bằng cách sử dụng DMA (Direct Memory Access)
của các thiết bị phần cứng. Chuẩn FC- VI là việc triển khai của chuẩn VI
( Virtual Interface cho Ethernet) trên giao thức FC. FC-VI cung cấp đường
truyền với tốc độ trễ thấp (low- latency) cho các ứng dụng cluster [1].
1.2.5 Tăng tốc độ truy cập dữ liệu
Truyền dữ liệu từ máy chủ đến thiết bị lưu trữ qua kênh quang được đánh
giá là kỹ thuật có tốc độ nhanh và hiệu quả nhất hiện nay. Một số công ty đã
dùng công nghệ lưu trữ dựa trên nền tảng IP cũng có xu hướng chuyển công
19



nghệ mạng Ethernet hiện tại lên Gigabit Ethernet, tuy nhiên có cùng tốc độ là

Gigabit nhưng hiệu năng của Gigabit Ethernet không thể bằng hiệu năng của
kênh quang.
1.2.6 Đảm bảo khả năng kháng cự với sự cố:
Một trong những ưu điểm của kênh quang là hiệu năng cao, khả năng
truyền xa. Ban đầu công nghệ SAN được sử dụng để kéo dài khoảng cách giữa
các tòa nhà hoặc các khu với nhau. Tuy nhiên gần đây công nghệ SAN được sử
dụng để cung cấp giải pháp kháng sự cố: đảm bảo an toàn cho hoạt động ngay
cả khi có sự cố với cơ sở hạ tầng thiết bị. Khác với mạng LAN, SAN có thể
cung cấp rất nhiều tính năng cho các hệ thống đòi hỏi khả năng dự phòng cao
như phân chia tải (load sharing), đường dự phòng (stanby path).

20



2 CHƢƠNG 2: CƠ BẢN VỀ KÊNH QUANG
Cơ sở hạ tầng của SAN được xây dựng trên các công nghệ mới, nó là kết quả kế
thừa của một số công nghệ như SCSI, IP. Giống như các chuẩn mạng máy tính khác
FC cũng có các tầng giao thức (từ FC0 đến FC4). Mỗi tầng của giao thức xác định các
chức năng làm việc khác nhau của giao thức FC.
2.1 Kiến trúc của SAN và các thuật ngữ căn bản:
Mục đích chính của SAN là cung cấp cơ sở hạ tầng cho các hệ thống có lượng lớn
dữ liệu cần trao đổi từ máy chủ đến thiết bị lưu trữ (tủ đĩa, tủ tape…). Ngoài ra SAN
còn cho phép chia sẻ các thiết bị lưu trữ trên mạng SAN khi có nhiều máy chủ có yêu
cầu truy cập đến cùng một thiết bị lưu trữ.
Thiết bị lưu trữ SAN (SAN Storage) cho phép tập trung các thiết bị lưu trữ đơn lẻ
thành một mạng riêng hoặc tham gia vào mạng đã tồn tại, cung cấp tốc độ truy cập
giữa các khối trong mạng nhanh, hầu hết các giao thức được triển khai trong SAN là
giao thức kênh quang. Giao thức này hoạt động chủ yếu ở tốc độ 1 Gbits/giây hoặc 2
Gbits/giây. Một số thiết bị hiện đại đã cho phép tốc độ truyền lên đến 10Gbits/giây.

SAN cung cấp thiết bị lưu trữ cho máy chủ khác với mô hình thiết bị lưu trữ đính
kèm server – DAS (Direct Attached Storage), SAN tránh được nghẽn cổ chai khi có
nhiều server gửi dữ liệu đến thiết bị lưu trữ (Hình 2.1 và hình 2.2 ). Giảm được chi phí
khi mở rộng hoặc giảm bớt các thiết bị trên SAN.
Khi nói đến SAN, chúng ta thường liên tưởng đến việc truyền tải dữ liệu SCSI
qua kênh quang. Mặc dù đây là ví dụ phổ biến của SAN, kênh quang còn hỗ trợ nhiều
giao thức khác như HiPPI (High- Performance Parallel Interface ), IP (Internet
Protocol), FDDI (Fiber Distributed Data Interface), VI (Virtual Interface) và ATM.
Trong đó có IP, SCSI, VI được sử dụng phổ biến [1]
21




Hình 2.1 Thiết bị lƣu trữ gắn liền với server


Hình 2.2 Thiết bị lƣu trữ trên SAN

Một SAN được xây dựng từ ba thành phần chính là: thiết bị đích, thiết bị khởi tạo
và thiết bị kết nối. Trong đó thiết bị đích thường là thiết bị lưu trữ như tủ RAID, tủ
nhóm đĩa JBOD (Just a Bunch of Disks). Trong nhóm này còn có thiết bị sao lưu
( Backup device) được sử dụng phổ biến cho các thiết bị lưu trữ nhằm sao lưu cơ sở
dữ liệu hoặc file dữ liệu. Các đĩa của JBOD không hiển thị trên SAN mà được gán
22



một địa chỉ và được quản lý bởi các khối điều khiển. Các khối điều khiển này gộp các
đĩa thành một hoặc nhiều đĩa lớn hơn và có thể có thêm RAID cho các đĩa này sau đó

mới cho phép máy chủ truy cập vào. Điều này có nghĩa rằng máy chủ chỉ truy cập
theo đĩa logic (nhóm các đĩa vật lý) chứ không làm việc với từng đĩa đơn lẻ [8,9]
Thiết bị khởi tạo (initiating device) là thiết bị tương tác với thiết bị đích. Ví dụ
máy chủ hoặc máy trạm (thông thường được gọi là host) yêu cầu truy cập thông tin
trên nhóm đĩa. Sự khác biệt giữa thiết bị khởi tạo và thiết bị đích là thiết bị khởi tạo
chủ động tìm kiếm thiết bị đích và khởi tạo việc giao tiếp trong khi thiết bị đích là
thiết bị bị động.
Thành phần không kém phần quan trọng của SAN là thiết bị kết nối
(interconnecting device), được đặt tên là chuyển mạch (switch). Switch tạo nên nền
tảng của truyền dẫn quang bằng cách cung cấp các đường kết nối tốc độ cao phục vụ
việc định tuyến và vận chuyển các khung dữ liệu. Khi liên kết các switch với nhau thì
switch còn cung cấp các dịch vụ trên Fabric. Khi có một nhóm nhiều switch kết nối
với nhau sẽ được gọi là một Fabric (Hình 2.3).
Có hai thiết bị kết nối khác có thể xuất hiện trên SAN là hub và router. Hub trên
mạng SAN có chức năng giống như hub trên mạng Ethernet. Hub là một hộp gồm
nhiều cổng cung cấp kết nối đến các thiết bị khác. Băng thông của hub là 1 Gbits/giây
và được chia sẻ cho tất cả các thiết bị tham gia kết nối tới hub.
Có ba kiểu kết nối (topology) chính để kết nối các hai thiết bị . Kiểu thứ nhất là
điểm tới điểm (point to point). Kiểu này được sử dụng để kết nối thẳng giữa hai thiết
bị. Trong mô hình này các thiết bị kết nối không có địa chỉ. Tất cả các frame đi trên
mạng được ngầm hiểu là gửi đến thiết bị còn lại. Mô hình kết nối thứ hai được gọi là
vòng lặp phân xử (arbitrate loop). Trong mô hình này các thiết bị được kết nối với
nhau thành một vòng (loop). Arbitrate Loop Physical Address (AL-PA) sử dụng 8 bit
để đánh địa chỉ các thiết bị tham gia trên vòng loop. Mô hình kết nối thức ba được gọi
là Switch Fabric, mô hình này cho phép kết nối nhiều nhất số lượng thiết bị tham gia
trên mạng. Với Switch Fabric các thiết bị có thể gắn vào fabric hoặc bỏ ra mà không
làm ảnh hưởng đến hoạt động của các thiết bị khác [1].

23






Hình 2.3 Một Fabric tiêu biểu
Thông tin gửi trên mạng dưới dạng các frame, frame chứa tiêu đề (header) và dữ
liệu (payload). Tiêu đề chứa thông tin định tuyến, nó quy định dữ liệu đến từ đâu, kiểu
frame là gì, đi đến đâu… Frame được bắt đầu bằng trường khởi đầu khung (Start of
Frame – SOF) và kết thúc bởi trường kết thúc khung (End of Frame – EOF). Ngoài ra
một khung còn chứa nhiều trường khác.
Mỗi node trên mạng SAN đều có một địa chỉ WWN (worldwide name), địa chỉ
này được gán định bởi nhà sản xuất giống như địa chỉ MAC của card mạng. Khác với
địa chỉ MAC, địa chỉ WWN không được sử dụng để truyền khung dữ liệu trên mạng.
Trên SAN, WWN được sử dụng để cấu hình phân vùng SAN.
24




2.2 Phân tầng kênh quang
Khi tìm hiểu về kênh quang, các đơn giản là chia cấu trúc kênh thành nhiều tầng.
Người ta cũng dùng cách tiếp cận theo từng tầng khi gỡ rối (khắc phục sự cố) trên
kênh quang. Kênh quang được chia thành 05 tầng được đánh tên từ FC-0 đến FC-4 từ
tầng môi trường truyền dẫn vật lý đến tầng các giao thức mức trên. Hình 2.4 là mô
hình phân tầng tiêu biểu

Hình 2.4 Phân tầng kênh quang

So sánh giữa mô hình kênh quang với mô hình OSI được thực hiện ở bảng sau.
Mô hình kênh quang

Mô hình OSI
Tên
Tầng
Tầng
Tên
Application
FC-4
7
Application


6
Presentation
Common Services
FC-3
5
Session
Framing Protocol
FC-2
4
Transport


3
Network
Encoding/Decoding
FC-1
2
Link
Physical Variants

FC-0
1
Physical
I
I
P
P
I
I


S
S
C
C
S
S
I
I


H
H
I
I
P
P
P
P
I

I


S
S
B
B
C
C
C
C
S
S


8
8
0
0
2
2
.
.
2
2


I
I
P

P


A
A
T
T
M
M


F
F
C
C
-
-
4
4


C
C
o
o
m
m
m
m
o

o
n
n


S
S
e
e
r
r
v
v
i
i
c
c
e
e
s
s


F
F
C
C
-
-
3

3


F
F
r
r
a
a
m
m
i
i
n
n
g
g


P
P
r
r
o
o
t
t
o
o
c

c
o
o
l
l


/
/


F
F
l
l
o
o
w
w


C
C
o
o
n
n
t
t
r

r
o
o
l
l


F
F
C
C
-
-
2
2


E
E
n
n
c
c
o
o
d
d
e
e



/
/


D
D
e
e
c
c
o
o
d
d
e
e


F
F
C
C
-
-
1
1


F

F
C
C
-
-
0
0


1
1
3
3
3
3


M
M
b
b
i
i
t
t
s
s
/
/
s

s


N
N
e
e
t
t
w
w
o
o
r
r
k
k
s
s


C
C
h
h
a
a
n
n
n

n
e
e
l
l
s
s


N
N
o
o
d
d
e
e


P
P
o
o
r
r
t
t


2

2
6
6
6
6


M
M
b
b
i
i
t
t
s
s
/
/
s
s


5
5
3
3
1
1



M
M
b
b
i
i
t
t
s
s
/
/
s
s


1
1
0
0
6
6
3
3


M
M
b

b
i
i
t
t
s
s
/
/
s
s


2
2
1
1
2
2
5
5


M
M
b
b
i
i
t

t
s
s
/
/
s
s


4
4
2
2
5
5
0
0


M
M
b
b
i
i
t
t
s
s
/

/
s
s


25




Trong mô hình phân tầng của kênh quang, tầng FC-0 là tầng thấp nhất, đây cũng là
tầng dễ phân biệt nhất bằng cách nhìn sự khác biệt của môi trường truyền dẫn, kiểu,
kiểu đầu kết nôi… Tầng này quy định việc ánh sáng truyền trong cáp quang như thế
nào. Các thiết bị truyền và nhận hoạt động ra sao. Hầu hết các công việc ở tầng này là
làm việc với các khối của bộ thu hoặc phát.
Tầng FC-1 quy định việc mã và giải mã dữ hiệu. Khi gộp cả tầng FC-0 và FC-1
thì người ta thường gọi chung hai tầng này là tầng giao diện tín hiệu (signaling
Interface). Tầng này nhận chuỗi các tín hiệu sau đó mã thành các ký tự có thể sử dụng.
Mã hóa sử dụng là mã 8/10 bits – trong 10 bits có 8 bit là dữ liệu thực còn 2 bit được
sử dụng làm bit chẵn lẻ. (Hình 2.5)


Hình 2.5 Mã hóa và giải mã tại mức FC-1
Tầng FC-2 chịu trách nhiệm xây dựng khung dữ liệu và điều khiển kênh truyền. FC-2
là tầng thực hiện việc chuyển các khung (Frame) giữa nơi gửi và nơi nhận. khung được
phân loại thành khung dữ liệu và khung điều khiển kết nối.
Nếu một khung là khung điều khiển kết nối thì trường dữ liệu của nó có giá trị
bằng 0. Còn nếu là khung dữ liệu thì trường dữ liệu có thể có kích thước từ 0 đến
2112 byte. Khung dữ liệu có thể được sử dụng dưới dạng khung dữ liệu - kết nối
(Link-Data frame) và khung dữ liệu - thiết bị (Device-Data frame). Khung điều khiển

kết nối được phân ra thành các loại: khung xác nhận Acknowldge (ACK) và khung trả
lời liên kết Link-Response (Busy and Reject) [1].
26



Chức năng cơ bản của Fabric là nhận các khung từ cổng nguồn và định tuyến
chúng đến cổng đích. Đây là nhiệm vụ của mức FC-2 để chia dữ liệu cần truyền thành
các khung và tập hợp các khung.
Cấu trúc của một khung được mô tả như hình 2.6. Mỗi khung bắt đầu bằng
trường SOF và kết thúc bằng EOF. Header nằm ngay sau SOF được sử dụng để điều
khiển các ứng dụng kết nối, điều khiển sự chuyển giao các giao thức và phát hiện sự
thiếu hoặc sai thứ tự các khung. Một header phụ có thể chứa nhiều thông tin điều
khiển kết nối khác. Tải tin tối đa 2112 byte chứa các thông tin chính cần truyền giữa
cổng nguồn và cổng đích. 4 byte CRC nằm trước EOF, CRC được sử dụng để phân
tích các lỗi truyền dẫn.

Hình 2.6 Tiêu đề của khung
Như vậy, một khung gồm có sáu phần cơ bản sau:
- Thứ nhất là đầu khung (SOF). SOF chiếm 4 byte, dấu phẩy và 3 byte chỉ ra
loại dịch vụ kết nối.
- Thứ hai là Frame Header (FH). Chứa thông tin điều khiển hoạt động kết nối,
thực hiện định tuyến, xử lý giao thức và phát hiện lỗi hoặc sai thứ tự của
khung. Một trong những chức năng chính của FH là xác định duy nhất các
khung đang hoạt động. Một frame được xác định duy nhất bởi các trường sau:
S_ID, D_ID, OX_ID, RX_ID, SEQ_ID và SEQ_CNT. Sequence Qualifier sẽ
xác định các chuỗi đang hoạt động và đang mở. Sequence Qualifier bao gồm
tất cả các trường trên trừ trường SEQ_CNT. SEQ_CNT được sử dụng để xác

×