Tải bản đầy đủ (.docx) (26 trang)

Tổng quan về Windows Failover Clustering, Storage Area Network (SAN) và Cấu trúc mạng Storage Area Network

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (457 KB, 26 trang )

MỤC LỤC


DANH MỤC CÁC HÌNH


Chương 1
Tổng quan về Windows Failover Clustering
1.1. Giới thiệu
1.1.1. Windows failover clustering
Windows failover clustering là công nghệ của Microsoft để cung cấp tính
sẵn sàng cao tại cấp độ máy chủ. Windows failover clustering cơ bản là liên
quan đến việc sử dụng nhiều server trong một nhóm hoặc cụm (cluster). Nếu
một trong các server trong cluster có một lỗi từ hệ thống, khi đó một trong các
server khác trong cluster sẽ đảm nhận khối lượng công việc của server bị lỗi đó.
Mỗi server vật lý trong cluster được gọi là một node, và các node làm việc cùng
nhau để tạo thành cluster. Tất cả các node trong một failover cluster liên tục giao
tiếp với nhau. Nếu một trong các node trong cluster mất liên lạc với các node
khác trong cluster thì một trong những node khác sẽ tự động nhận nhiệm vụ của
mình là đảm nhận các dịch vụ của node bị mất liên lạc đó. Quá trình này được
gọi là failover. Node bị hỏng đó sẽ được khôi phục lại. Quá trình này được gọi là
failback. Khi hệ thống có node bị downtime, Windows failover cluster sẽ khởi
động lại các dịch vụ bị lỗi hay các ứng dụng trên một trong các node còn lại.
Thời gian cần thiết để hoàn thành failover phụ thuộc một phần vào phần cứng
được sử dụng và phần còn lại là vào chất lượng của dịch vụ hoặc ứng dụng.
1.1.2. Cluster
Clustering là một kiến trúc nhằm đảm bảo nâng cao khả năng sẵn sàng cho
các hệ thống mạng máy tính. Clustering cho phép sử dụng nhiều máy chủ kết
hợp với nhau tạo thành một cụm có khả năng chịu đựng hay chấp nhận sai
sót (fault-tolerant) nhằm nâng cao độ sẵn sàng của hệ thống mạng. Cluster là
một hệ thống bao gồm nhiều máy chủ được kết nối với nhau theo dạng song


song hay phân tán và được sử dụng như một tài nguyên thống nhất. Nếu một
máy chủ ngừng hoạt động do bị sự cố hoặc để nâng cấp, bảo trì, thì toàn bộ công
việc mà máy chủ này đảm nhận sẽ được tự động chuyển sang cho một máy chủ
khác (trong cùng một cluster) mà không làm cho hoạt động của hệ thống bị ngắt
hay gián đoạn. Quá trình này gọi là “fail-over”; và việc phục hồi tài nguyên của
một máy chủ trong hệ thống (cluster) được gọi là “fail-back”.
Cluster: được dùng cho các ứng dụng Stateful applications (các ứng dụng
hoạt động thường xuyên trong thời gian dài) bao gồm các database server như là
Microsoft MySQL Server, Microsoft Exchange Server, File and Print Server…
Tất cả các node trong Cluster dùng chung 1 nơi lưu trữ dữ liệu có thể dùng công
nghệ SCSI hoặc Storage Area Network (SAN). Windows Sever 2003 Enterprise
và Datacenter hỗ trợ cluster lên đến 8 node trong khi đó Windows 2000 Advance
Server hỗ trợ 2 node còn Windows 2000 Datacenter Server được 4 node.
1.1.3. Failover
Failover: Quá trình failover có thể xảy ra một cách tự động. Khi một node
trong Cluster bị hỏng, các resource group của nó sẽ được chuyển tới một hay
3


nhiều node trong Cluster mà còn hoạt động được. Quá trình tự động failover
tương tự như lập kế hoạch cho việc tái chỉ định quyền sở hữu các resource.
Failover yêu cầu xác định các resource group nào đang chạy trên node bị
hỏng và các node nào nên giữ quyền sở hữu các resource group đó. Tất cả các
node trong Cluster mà có khả năng giữ các resource group đó tiến hành đàm
phán với nhau để lấy quyền sở hữu. Quá trình đàm phán dựa trên khả năng của
node, tải hiện hành, khả năng phản hồi ứng dụng hay danh sách node ưu tiên.
Danh sách node ưu tiên là một phần của các thuộc tính trong resource group và
được dùng để chỉ định một resource group tới một node. Khi việc đàm phán
quyền sở hữu resource group được hoàn tất, tất cả các node trong Cluster cập
nhật database của chúng và tiếp tục theo dõi node sở hữu resource group đó.

1.2. Các thành phần của Windows Failover Clustering
1.2.1. Cluster Node
Mỗi server tham gia trong cluster được gọi là một cluster node. Chúng cần
được kết nối với nhau. Các cluster node phải liên lạc thường xuyên với nhau để
xác định tình trạng của từng node. Kết nối này được gọi là cluster heartbeat. Tất
cả cluster node cần phải chạy cùng một phiên bản của Windows Server. Ví dụ,
tất cả đều phải chạy Windows Server 2012.
Cluster: Là một hệ thống song song và được phân phối bởi một nhóm các
server dành riêng để chạy những ứng dụng đặc biệt nào đó và kết nối với nhau
để cung cấp khả năng chịu lỗi (faul tolerance) và load balance. Cluster dùng để
cung cấp tính luôn sẵn sàng cho việc truy cập.
Node: Là một server thuộc một Cluster nào đó mà trên đó các ứng dụng và
Cluster service được cài đặt
1.2.2. Cluster Service
Cluster Service là thành phần chính để điều khiển hoạt động của failover
cluster. Cluster Service chạy trên tất cả cluster node và được quản lý bởi
Failover Cluster Manager.
Cluster service chạy trên mỗi node trong server cluster và điều khiển mọi
hoạt động của server cluster. Cluster service bao gồm nhiều thành phần software
làm việc cùng với nhau. Các thành phần này thực hiện việc theo dõi, duy trì tính
ổn định và vận chuyển các resource từ một node qua một node khác
- Resource DLLs: cho mỗi ứng dụng chịu trách nhiệm theo dõi và điều
khiển ứng dụng đó. Ví dụ Resource DLL sao lưu và phục hồi các thuộc tính của
ứng dụng trong Cluster database, mang resource online và offline và kiểm tra
trạng thái của resource đó. Khi cần thiết phải thực hiện failover, Resource
DLL làm việc cùng với Resource Monitor và Failover Manager để đảm bảo quá
trình failover được thực hiện dễ dàng.

4



- Checkpoint Manager: Để đảm bảo cho việc Cluster service có thể phục
hồi từ một resource bị lỗi, Checkpoint Manager kiểm tra các khóa registry khi
một resource được mang online và ghi dữ liệu checkpoint lên quorum resource
khi resource này offline. Một vài ứng dụng chứa thông tin cấu hình tại cục bộ
thay cho việc chứa thông tin trong cơ sở dữ liệu cấu hình Cluster. Nếu một ứng
dụng yêu cầu chứa đựng cục bộ thông tin có thể failover, Checkpoint
Manager cung cấp cho yêu cầu này bằng cách duy trì một bản sao của thông tin
cục bộ hiện hành này trên Quorum resource. Đối với các ứng dụng chứa thông
tin cấu hình trong registry trên server, Checkpoint Manager theo dõi dữ liệu này
khi ứng dụng đang online. Khi có sự thay đổi xảy ra, Checkpoint Manager cập
nhật quorum resource với dữ liệu cấu hình hiện hành.
- Database Manager: chạy trên mỗi node và duy trì một bản sao lưu cục bộ
của cơ sở dữ liệu cấu hình Cluster - chứa những thông tin về những thực thể vật
lý và logic trong một Cluster. Những thực thể này bao gồm bản thân Cluster, các
node thành viên, các resource group, các loại resource và những mô tả của các
loại resource đặc biệt như là các ổ đĩa và địa chỉ IP.
Database Manager dùng Global Update Manager cho việc cập nhật lẫn
nhau (replicate) tất cả những thay đổi tới các node khác trong cluster. Theo cách
này, những thông tin cấu hình được duy trì qua Cluster ngay cả khi một node bị
hỏng và khi Administrator thay đổi cấu hình Cluster trước khi node đó quay trở
lại phục vụ. Database Manager cũng cung cấp một interface chứa những thay
đổi trong cơ sở dữ liệu cấu hình Cluster thông qua các thành phần Cluster
service khác như là Failover Manager và Node Manager. Interface này dùng để
tạo ra những thay đổi tương tự như interface dùng để tạo ra những thay đổi tới
registry qua Windows Programming Interface (API). Những thay đổi khác này
được database manager tiếp nhận để cập nhật cho các node khác trong Cluster
qua Global update Manager.
- Event Log Replication Manager: là một phần của Cluster service làm việc
cùng với Event Log Service để sao chép các event log tới tất cả các node trong

Cluster. Các sự kiện này được đánh dấu để cho thấy node nào mà sự kiện xảy ra
trên đó.
Các sự kiện được ghi lại trên một node được sắp xếp, củng cố và gửi
qua Event Log Replication Manager để broadcast tới các node đang hoạt động
khác. Nếu một vài sự kiện được ghi lại trong một khoảng thời gian, mỗi sự kiện
có thể broadcast một cách riêng lẻ, nhưng nếu nhiều sự kiện được ghi lại trong
một khoảng thời gian ngắn, chúng được kết hợp với nhau trước khi broadcast.
Các sự kiện được dán nhãn để cho biết node nào chúng được xảy ra. Các node
khác tiếp nhận các sự kiện và ghi chúng lên local log.
- Failover Manager: quản lý các resource và các resource group. Nó chịu
trách nhiệm tắt hay khởi động các resource, quản lý các resource liên quan và
5


chuẩn bị cho một quá trình failover các resource group. Để thực hiện các hoạt
động này, nó tiếp nhận resource và thông tin trạng thái hệ thống từ các thành
phần Cluster trên một node và từ Resource Monitors. Resource Monitors cung
cấp môi trường thực hiện cho resource DLLs và cung cấp sự giao tiếp giữa
resource DLLs và Failover Manager. Failover Manager xác định node nào trong
Cluster nên sở hữu resource group. Khi cần thiết phải failover một resource
group, Failover Manager trên mỗi node trong Cluster làm việc cùng nhau để tái
chỉ định quyền sở hữu cho resource group đó. Dựa trên cách mà resource group
được cấu hình, Failover Manager có thể cục bộ khởi động lại resource bị hỏng
hay có thể làm cho resource đó offline đối với các resource liên quan với nó và
sau đó chuẩn bị cho một quá trình failover.
- Global Update Manager: được dùng bởi các thành phần bên trong cluster
như là Failover Manager hay Database Manager để mang những cập nhật thay
đổi tới mỗi node trong Cluster. Khi quá trình cập nhật xảy ra, nó bắt đầu tại một
node client và một node khác được bổ nhiệm theo dõi việc cập nhật để đảm bảo
việc cập nhật được xảy ra trên tất cả các node. Node client yêu cầu node này gửi

tới một global lock để thực hiện cập nhật. Nếu lock này chưa sẵn sàng, nó sẽ
chờ. Khi lock này sẵn sàng node giám sát sẽ gán cho node client và chỉ định cập
nhật tại cục bộ. Nếu node này cập nhật thành công mà quá trình update bị lỗi
trên một node khác thì node này sẽ bị loại bỏ khỏi danh sách các node đang hoạt
động và sự cập nhật tiến hành trên các node còn hoạt động khác. Nếu việc này
xảy ra, quorum log sẽ được ghi lại để đảm bảo rằng node bị lỗi có thể nhận được
tất cả các thông tin cấu hình cần thiết khi nó quay trở lại hoạt động.
- Log Manager: cùng với Checkpoint Manager tương tác với nhau đảm bảo
rằng recover log trên quorum resource chứa đựng dữ liệu cấu hình mới nhất và
các checkpoint thay đổi. Nếu một hay nhiều node trong Cluster bị hỏng, các
node còn hoạt động khác vẫn có thể thực hiện thay đổi cấu hình. Khi những
node này bị hỏng, Database Manager sử dụng Log Manager để ghi lại sự thay
đổi cấu hình lên Quorum resource. Khi các node bị lỗi quay trở lại phục vụ,
chúng đọc vị trí của quorum resource trong local cluster. Các cơ chế được xây
dựng bên trong sẽ dò tìm trong cơ sở dữ liệu cũ những quorum resource nào
không đúng. Sau đó Database Manager sẽ yêu cầu Log Manager cập nhật bản
sao cục bộ của Cluster sử dụng file checkpoint trong Quorum resource và sau đó
đối chiếu với file log trong Quorum disk. Kết quả là hoàn thành việc cập nhật
Cluster.
- Membership Manager: chịu trách nhiệm duy trì một một cái nhìn nhất
quán về các node trong Cluster hiện đang hoạt động hay bị hỏng tại một thời
điểm nhất định. Trọng tâm của thành phần này là thuật toán regroup được yêu
cầu thực hiện bất cứ khi nào có dấu hiệu của một hay nhiều node bị lỗi.
- Node Manager: chạy trên mỗi node và duy trì một danh sách cục bộ các
node, các network, các network interface trong cluster. Qua sự giao tiếp giữa các
6


node, Node Manager đảm bảo cho tất cả các node có cùng một danh sách các
node đang hoạt động.

Node Manager dùng những thông tin trong cơ sở dữ liệu cấu hình Cluster
để xác định các node nào được thêm vào hay bị loại bỏ khỏi Cluster. Node
Manager trên mỗi node cũng theo dõi các node khác để tìm ra node bị lỗi. Để
thực hiện việc theo dõi, nó gửi và nhận những message gọi là các heartbeat tới
mỗi node trong Cluster. Nếu một node có một sự giao tiếp bị lỗi với một node
khác, nó gửi broadcast một message tới các node khác sao cho tất cả các node
nhận message này để xác nhận lại danh sách các node đang hoạt động trong
cluster. Quá trình này gọi là một regroup event. Node Manager cũng tham gia
vào quá trình một node tham gia vào Cluster. Tại thời điểm một node được thêm
vào Cluster, Node Manager trên node đó thành lập một quá trình giao tiếp với
các Node Manager trên các node khác để thực hiện quá trình chứng thực.
- Resource Monitor: cung cấp một interface giao tiếp giữa resource DLLs
và Cluster service. Khi Cluster cần lấy dữ liệu từ một resource, Resource
Monitor tiếp nhận yêu cầu và đẩy yêu cầu đó tới resource DLL thích hợp.
Ngược lại, khi một resource DLL cần báo cáo trạng thái của nó hoặc thông báo
cho Cluster service một sự kiện, resource đẩy thông tin này từ resource tới
Cluster service
- Backup/Restore Manager:
Cluster service đưa ra một API dùng để backup cơ sở dữ liệu
cluster, BackupClusterDatabase. BackupClusterDatabase trước tiên tương tác
với Failover Manager, sau đó đẩy yêu cầu tới node sở hữu quorum resource.
Database Manager trên node đó sẽ được yêu cầu và sau đó tạo một bản backup
cho quorum log file và các file checkpoint.
Cluster service cũng đưa ra một API khác, RestoreClusterDatabase để
restore cơ sở dữ liệu Cluster từ một backup path. API này có thể chỉ được yêu
cầu tại cục bộ từ một trong các node của Cluster. Khi API được yêu cầu, trước
tiên nó tắt Cluster service, restore cơ sở dử liệu Cluster từ bản backup, tạo một
giá trị registry chứa backup path và sau đó khởi động lại Cluster service. Cluster
service khi khởi động sẽ dò tìm yêu cầu restore và tiến hành restore cơ sở dữ
liệu Cluster từ backup path tới Quorum resource.

1.2.3. Địa chỉ IP ảo và tên của Cluster
Địa chỉ IP ảo và tên cluster được đặt duy nhất cho các cluster, và chúng
khác nhau về giá trị tùy thuộc vào từng cluster node. Địa chỉ IP ảo và tên cluster
là các thông tin mà các client đã kết nối với nhau sử dụng để kết nối với cluster.
Điều này cho phép các client minh bạch trong kết nối với cluster service và
application sau quá trình failover.

7


1.2.4. Cluster Quorum
Mục đích của các cluster quorum là xác định node nào sẽ tham gia vào
cluster trong trường hợp hỏng phần cứng, mạng ngừng hoạt động và các cluster
node không giao tiếp được với nhau.
Windows failover cluster hỗ trợ nhiều loại quorum để giải quyết các cách
sắp xếp cluster và sự khác nhau về số lượng node.
1.2.5. Service và Application
Các service và application của cluster về cơ bản được đĩnh nghĩa là duy
nhất trong failover. Trong các phiên bản trước của failover clustering, chúng đã
được định nghĩa như là các nhóm tài nguyên. Tại bất kỳ thời điểm nào service
hoặc application chỉ được sở hữu bởi một cluster node. Nếu cluster node đó bị
fail thì cluster node khác sẽ sỡ hữu nhóm resource và khởi động trên node đó. Ta
có thể cấu hình các node ưu tiên mà một service hay application sẽ failover. Các
tài nguyên sẽ được kiểm tra trạng thái bằng một công cụ có tên là LooksAlive,
nó sẽ kiểm tra tình trạng hoạt động cho các application. Mặc định thì SQL
Server dùng LooksAlive để test trạng thái 5s/lần.
1.2.6. Shared Storange
Cluster yêu cầu phải có 1 ổ lưu trữ chung vì nó không thể xây dựng bằng
cách truy cập lưu lượng trực tiếp được. Ổ lưu trữ chung ở đây có thể dùng iSCSI
SAN (storage area network) hoặc Fibre Channel SAN. Đối với SQL Server một

shared disk resource chứa tất cả hệ thống và user database, log, các FileStream
và tích hợp file full-text search. Trong trường hợp failover, các đĩa được định vị
vào một backup node, và khi đó dịch vụ SQL Server sẽ được khởi động lại trên
node đó.
1.3. Nguyên tắc hoạt động
Khi một node hay một application trong Cluster bị fail, Server Cluster có
thể phản ứng bằng cách khởi động lại application bị lỗi hay phân tán công việc
từ node bị fail tới các node khác còn hoạt động trong Cluster đó.
Cluster service kiểm tra tình trạng không hoạt động của các resource riêng
biệt hay một node, và tự động di chuyển hay khởi động lại các ứng dụng, dữ liệu
và file resource tới một node còn hoạt động trong Cluster. Quá trình này cho
phép các resource như là database, file share và application duy trì tính sẵn sàng
cao cho các ứng dụng của user và client. Server Cluster đưa ra 2 cơ chế kiểm tra
tình trạng không hoạt động khác nhau:
- Detect Node Failure
Một cách định kỳ, mỗi node trao đổi các gói message với những node khác
trong Cluster sử dụng private cluster network. Những message này được gọi
là Heartbeat. Sự trao đổi Heartbeat cho phép mỗi node kiểm tra tính sẵng sàng
của các node khác và các ứng dụng của chúng. Nếu một server bị fail trong việc
8


phản hồi 1 Heartbeat, các server còn hoạt động bắt đầu một quá trình Failover để
đàm phán quyền sở hữu đối với các tài nguyên và ứng dụng của node bị fail.
Việc đàm phán này sử dụng Challenge và Defense protocol.
Việc bị fail trong quá trình phản hồi Heartbeat có thể xảy ra trong nhiều sự
kiện như là computer failure, network interface failure, network failure, hay
trong lúc hoạt động cao bất thường nào đó. Thông thường, khi tất cả các node
giao tiếp với nhau, Configuration Database Manager gửi Global Configuration
Database update tới mỗi node. Tuy nhiên, khi fail trong quá trình trao đổi

heartbeat xảy ra, Log Manager cũng lưu lại cấu hình database thay đổi
tới Quorum Resource. Nó đảm bảo các node còn hoạt động có thể truy cập
thông tin cấu hình Cluster mới nhất và dữ liệu registry cục bộ trên node trong
quá trình phục hồi
- Detect Resource Failure
Failover Manager và Resource Monitors làm việc cùng với nhau để dò
tìm và khôi phục resource bị fail. Resource Monitors theo dõi trạng thái của
resource bằng cách kiểm tra định kỳ các resource sử dụng Resource DLLs.
Việc kiểm tra vòng gồm hai bước, một query LookAlive lướt qua và một
query lâu hơn, cuối cùng - IsAlive. Khi Resource Monitor dò tìm một resource
bị fail, nó thông báo cho Failover Manager và tiếp tục giám sát resource này.
Failover Manager duy trì trạng thái của các resource và resource group.
Nó cũng chịu trách nhiệm thực hiện việc phục hồi khi một resource bị fail và
sẽ yêu cầu Resource Monitor phản hồi tới user tình trạng hoạt động hay không
hoạt động của resource. Sau khi resource bị fail được tìm thấy, Failover
Manager có thể thực hiện việc phục hồi bằng cách khởi động lại một resource
và các resource hay di chuyển toàn bộ resource group tới một node khác.
Công việc phục hồi xác định đã được thực hiện bởi resource vàresource group
properties và node availability.
Trong quá trình failover, một resource group được coi như là một failover
unit, để đảm bảo resource được phục hồi đúng. Khi một resource được phục
hồi từ trạng thái fail, Resource Monitor thông báo tới Failover Manager để tự
động thực hiện quá trình failback các resource group dựa trên cấu hình
của resource group failback properties.
- Heartbeat
Là một UDP packet chuyển đổi giữa các node mỗi 1.2 giây một lần để
xác định mỗi node trong Cluster vẫn hoạt động. Nếu một node thiếu hụt liên
tiếp 5 heartbeat, node đó sẽ chuẩn bị một quá trình regroup event để đảm bảo
rằng tất cả các node đi tới một sự nhất quán danh sách các node còn đang hoạt
động.

Server Cluster network có thể là private (chỉ có sự giao tiếp giữa các
node với nhau), public (giao tiếp giữa client với node), hay mixed (cả sự giao
tiếp giữa các node và sự giao tiếp giữa client với node). Heartbeat được giao
9


tiếp qua tất cả các loại network, tuy nhiên việc theo dõi heartbeat và cách mà
Cluster thể hiện các heartbeat bị lỗi dựa trên các kiểu network sau:
+ Trên private hay mixed network, cả hai đều có sự giao tiếp giữa các
node, heartbeat được theo dõi để xác định node có hoạt động trong Cluster hay
không.
+ Trên public network, chỉ có sự giao tiếp giữa client với node, heartbeat
được theo dõi chỉ để xác định network adapter của node có hoạt động hay
không.
- Regroup event:
Nếu một node thiếu hụt liên tiếp 5 heartbeat, một quá trình regroup event
được xảy ra. Nếu node vẫn duy trì tính trạng không thể phản hồi, node đó sẽ
được loại bỏ khỏi danh sách các node hoạt động. Nếu node không phản hổi
này đang sở hữu một quorum resource, các node còn lại cũng bắt đầu một quá
trình đàm phán quorum. Sau đó, quá trình failover được bắt đầu.
- Quá trình đàm phán quorum:
Quá trình đàm phán quorum xảy ra khi một node đang sở hữu một
quorum resource bị lỗi hay không hoạt động, và các node còn lại sẽ xác định
node nào sẽ giữ quyền sở hữu quorum resource. Mục đích của quá trình đàm
phán quorum là tại một thời điểm đảm bảo rằng chỉ một node duy nhất được
sở hữu quorum resource.
Việc chỉ cho một node sở hữu quorum resource là rất quan trọng bởi vì
nếu tất cả các giao tiếp giữa 2 hay nhiều node bị lỗi, nó có khả năng chia
Cluster thành 2 hay nhiều phần riêng biệt để giữ cho nó vần tiếp tục hoạt động
(split brain). Server Cluster ngăn ngừa nó bằng cách chỉ cho phép duy nhất

một Cluster tách ra này có chứa node đang sở hữu quorum resource tiếp tục
hoạt động như một Cluster. Bất kỳ node nào không thể giao tiếp với node
đang sở hữu quorum resource, thì node đó sẽ không còn là node thành
viên trong Cluster.
- Cách cluster giữ cho các resource group luôn sẵn sàng:
Cluster giữ cho các resource group luôn sẵn sàng bằng cách theo dõi
trạng thái của các resource, mang các resource online, và tiến hành failover.
- Theo dõi trạng thái các resource:
Resource Monitor đưa ra 2 cách theo dõi trạng thái các resource trên
node mà nó giám sát: Look Alive (resource xuất hiện là online) và
IsAlive (kiểm tra chi tiết trạng thái online và hoạt động của resource là đúng
chức năng).
- Cách Failover xảy ra:
Quá trình failover xảy ra khi một group hay một node đang sở hữu
resource bị lỗi. Một resource bị lỗi có thể là lý do cho một group fail nếu ta
cấu hình Affect the group cho resource đó.
10


- Cách Failback xảy ra:
Failback là quá trình Cluster service chuyển các resource group trả về
node thích hợp hơn sau khi node này online trở lại.
Node mà một group được trả về chuẩn bị một quá trình failback. Failover
Manager trên node đó tương tác với Failover Manager trên node đang sở hữu
group và tiến hành đàm phán sau đó chuyển quyền sở hữu resource group trở
về node thích hợp hơn.

11



Chương 2
Tổng quan về mạng Storage Area Network (SAN)
2.1. Khái quát về mạng Storage Area Network (SAN)
2.1.1. Khái niệm
SAN là hệ thống mạng lưu trữ, thường được sử dụng ở những nơi lưu trữ
nhiều dữ liệu như ngân hàng, các nhà cung cấp dịch vụ viễn thông,…các dữ liệu
này cần độ an toàn, dự phòng rất cao và có thể truy xuất nhanh. SAN giúp việc
sử dụng tài nguyên lưu trữ hiệu quả hơn, dễ dàng hơn trong công việc quản trị,
quản lý tập trung các thao tác tăng độ an toàn, sao lưu, khôi phục khi có sự cố.
Có thể nói mạng SAN là một giải pháp để chia sẻ một thiết bị lưu trữ tới
nhiều máy chủ một cách dễ dàng như: Disk Aray Controllers hay Tape Libraries.
Sự chia sẻ thường được thực hiện bởi các phần mềm mà đi kèm với các thiết bị
lưu trữ. Người dùng cài đặt hệ thốn mạng SAN sử dụng các phần mềm để chia
sẻ một phần của các thiết bị lưu trữ cho máy chủ A, máy chủ B…

Hình 2.1. Mô hình tổng thể hệ thống mạng SAN

Hệ thống mạng SAN gồm 3 thành phần chính:
- Thiết bị lưu trữ: là các tủ đĩa có dung lượng lớn, khả năng truy xuất
nhanh, có hỗ trợ các chức năng RAID, local Replica,… tủ đĩa này là nơi chứa dư
liệu chung cho toàn bộ hệ thống.
- Thiết bị chuyển mạch SAN: đó là các SAN switch thực hiện việc kết nối
các máy chủ đến tủ đĩa.
- Các máy chủ hoặc máy trạm cần lưu trữ, được kết nối đến SAN switch
bằng cáp thông qua HBA card.
2.1.2. Các dạng mạng SAN (Storage Area Network)
SAN được xây dựng với thiết kế dành riêng cho việc lưu trữ và truyền
thông tin. Nó cung cấp khả năng truyền dữ liệu với tốc độ lớn và độ an toàn cao
hơn các giao thức tương ứng như NAS.


12


- Dạng thứ nhất là Fibre Channel SAN được xây dựng bởi Fibre Channel
Switch được kết nối tới các thiết bị thông qua hệ thống cáp quang.
- Dạng thứ hai của SAN là sử dụng giao thức iSCSI, trong đó nó sử dụng
giao thức SCSI trên tầng TCP/IP. Ở dạng này, các switch tương tự nhưu Ethernet
Switchs. Chuẩn iSCSI được giới thiệu năm 2003 và được triển khai rộng lớn
trong quá trình lưu trữ mạng và từ khi ứng dụng cáp quang trong quá trình
truyền dữ liệu mang lại hiệu năng lớn cho iSCSI. Một dạng khác của iSCSI là
ATA-over-Ethernet hay giao thức AoE được xây dựng sử dụng giao thức ATA
trên khung nền tảng Ethernet.
Kết nối SAN sẽ có một hay nhiều máy chủ và một hay nhiều các thiết bị
lưu trữ khác nhau. Trong FC SAN máy chủ cũng sử dụng cáp quang để truyền
dữ liệu, isSCSI SAN sử dụng giao thức Ethernet bình thường thông qua card
mạng hay TOE card.
SAN có hai dạng là: Centralized storage are network và distributed storage
area network.
2.1.3. Hạ tầng hệ thống mạng SAN (Storage Area Network)
SAN thường sử dụng topo có tên switch fabric sử dụng Fibre Channel –
một hạ tầng được thiết kế đặc biệt để xử lý lưu lượng về lưu trữ. Hạ tầng này
cho phép truy nhập nhanh hơn và tin cậy hơn so với các giao thức ở mức cao
hơn mà NAS sử dụng. Một fabric tương ứng với khái niệm phân vùng mạng
trong mạng cục bộ. Một mạng SAN thường được tạo thành bởi một số các bộ
chuyển mạch Fibre Channel.
Ngày nay, hầu hết các nhà cung cấp thiết bị SAN cũng cung cấp giải pháp
định tuyến Fibre Channel cho phép tăng khả năng mở rộng của hệ thống SAN
thông qua việc cho phép dữ liệu được trao đổi giữa các mạng SAN lại thành
một. Các giải pháp này sử dụng các yếu tố giao thức riêng của mỗi hãng và kiến
trúc ở lớp trên cùng khác biệt nhau hoàn toàn. Các giải pháp này thường được

cho phép quy chiếu lưu lượng FibreChannel qua IP hay SONET/SDH.
2.1.4. Môi trường làm việc của Storage Area Network (SAN)
SAN được sử dụng trong môi trường yêu cầu mở rộng nhanh chóng các
thiết bị lưu trữ và yêu cầu đáp ứng công việc cao (truyền dữ liệu với tốc độ cao).
Nó cho phép các thiết bị FC disk driver kết nối trực tiếp đến SAN. SAN như các
mạng bình thường của các thiết bị lưu trữ với dung lượng lớn. SAN là giải pháp
đắt tiền với hệ thống Fibre Channel hay các card chuyên dụng cho các máy tính.
Công nghệ iSCSI SAN là giải pháp đáp ứng được với yêu cầu giá cả của SAN,
nhưng không như công nghệ sử dụng cho mạng doanh nghiệp lớn Data Center.
Các máy con có thể sử dụng giao thức NAS như CIFS hay NFS. Với khả
năng truy cập từ xa và khôi phục dữ liệu nhanh chóng khi xảy ra lỗi. Đáp ứng tốt
cho giải pháp Data Center. Và khả năng của iSCSI đáp ứng với các môi trường
ứng dụng không đòi hỏi khả năng đáp ứng cực lớn. Với FC SAN đáp ứng các
yêu cầu khắt khe nhất về ứng dụng.
13


2.1.5. Những lợi ích khi ứng dụng hệ thống mạng Storage Area Network
(SAN)
Dễ dàng chia sẻ lưu trữ và quản lý thông tin, mở rộng lưu trữ dễ dàng thông
qua quá trình thêm các thiết bị lưu trữ vào mạng không cần phải thay đổi các
thiết bị như máy chủ hay các thiết bị lưu trữ hiện có. Ứng dụng cho các hệ thống
Data center và các Cluster
Mỗi thiết bị lưu trữ trong mạng SAN được quản lý bởi một máy chủ cụ thể.
Trong quá trình quản lý của SAN sử dụng Network Attached Storage (NAS) cho
phép nhiều máy tính truy cập vào cùng một file trên một mạng. Và ngày nay có
thể tích hợp giữa SAN và NAS tạo nên một hệ thống lưu trữ thông tin hoàn
thiện.
SAN được thiết kế dễ dàng cho tận dụng các tính năng lưu trữ, cho phép
nhiều máy chủ cùng chia sẻ một thiết bị lưu trữ.

Một ứng dụng khác của SAN là khả năng cho phép máy tính khởi động
trực tiếp từ SAN mà chúng quản lý. Điều này cho phép dễ dàng thay các máy
chủ bị lỗi khi đang sử dụng và có thể cấu hình lại cho phép thay đổi hay nâng
cấp máy chủ một cách dễ dàng và dữ liệu không hề ảnh hưởng khi máy chủ bị
lỗi và quá trình đó có thể chỉ cần nửa giờ để có một hệ thống Data Center, được
thiết kế với tốc độ truyền dữ liệu cực lớn và độ an toàn của hệ thống được coi là
vấn đề hàng đầu.
SAN cung cấp giải pháp khôi phục dữ liệu một cách nhanh chóng bằng
cách thêm và các thiết bị lưu trữ và có khả năng khôi phục cực nhanh dữ liệu khi
một thiết bị lưu trữ bị lỗi hay không truy cập được (secondary aray). Các hệ
thống SAN mới hiện nay cho phép sao chép hay một tập tin được ghi tại hai
vùng vật lý khác nhau cho phép khôi phục dữ liệu cực nhanh.
Quá trình điều khiển cho SAN trong môi trường doanh nghiệp với sự phát
triển nhanh chóng yêu cầu sự đáp ứng về truyền dữ liệu với tốc độ cực cao tới
các ổ đĩa. Trong quá trình phát triển trước kia, với mạng doanh nghiệp dùng hệ
thống lưu trữ với khả năng đáp ứng cao sử dụng lưu trữ SCSI và RAIDs điều
khiển các mảng đĩa cứng được tích hợp trực tiếp trên máy chủ và bây giờ với
công nghệ mạng trên nền tảng IP và khi các ứng dụng lưu trữ dữ liệu sử dụng
hết toàn bộ các ổ lưu trữ trên các máy chủ và các người dùng cuối yêu cầu phải
thay máy chủ đáp ứng yêu cầu công việc. Nhưng với SAN việc nâng cấp các
thiết bị lưu trữ là rất đơn giản với việc thêm vào mạng các thiết bị lưu trữ mới.
Điều khiển đĩa sử dụng trong môi trường SAN được thiết kế cung cấp với
tốc độ cao, độ tin cậy lớn. Thêm nữa mô hình SANs cho phép tích hợp lẫn các
thiết bị FC SATA và FC SCSI. SATA làm việc với khả năng thấp, có nhiều lỗi
xảy ra nhưng lưu trữ lớn và giá thành rẻ hơn nhiều so với các ổ đĩa SCSI. Nó
cho phép các mạng SANs sử dụng nó như một thiết bị sao lưu dự phòng khi có
lỗi xảy ra và hầu hết các SAN đều sử dụng FC SATA như một thiết bị backup
với lưu trữ lớn và tốc độ nhanh chóng hơn rất nhiều so với tape drivers.
14



2.2. Xây dựng trung tâm cơ sở dữ liệu với Storage Area Network
2.2.1. DAS (Direct-attached storage)
Hai kiểu kết nối tới hệ thống lưu trữ dữ liệu như bên dưới thường được gọi
chung là DAS.
Direct Attached Storage (DAS) là hệ thống lưu trữ mà trên đó các HDD,
thiết bị nhớ được lưu trữ trực tiếp vào Server, nó thích hợp cho mọi nhu cầu nhỏ
đến cao cấp nhất và khả năng chạy cũng cực nhanh.

Hình 2.2. Direct Attached Storage

Trong kiểu kết nối này, các server trong một mạng cục bộ và thiết bị lưu trữ
được tổ chức thành cặp. Do đó, không gian không dung tới trên một server
không thể được dùng bởi các server khác. Đây chính là kiểu kết nối được dùng
chủ yếu trong các hệ thống LAN truyền thống.
Một server với những HDD bên trong, một Client với các HDD bên trong
và truy xuất trực tiếp đến HDD của nó thì đó chính là DAS.

Hình 2.3. Hệ thống chứa DAS
15


Ta thấy rằng DAS cũng chính là NAS nếu nó đặt trên mạng IP mà các
Server/Client truy xuất từ xa đến nó.
2.2.2. SAN (Storage Area Network)
SAN là hệ thống trong đó các thiết bị lưu trữ được tổ chức thành một mạng
riêng, tách rời khỏi hệ thống LAN. SAN là một mạng có tốc độ cao dành riêng
cho việc lưu giữ và quản trị dữ liệu, bao gồm các công nghệ phần cứng, phần
mềm và các thành phần kết nối mang khác để cung cấp các kết nối giữa các
server và thiết bị lưu trữ.


Hình 2.4. Một hệ thống mạng SAN

SNIA định nghĩa SAN là một hệ thống mạng với mục đích chính là chuyển
tải data giữa hệ thống máy tính và các thành phần lưu trữ. SAN bao gồm một cơ
sở hạ tầng truyền thống, cung cấp các kết nối vật lý và một tầng quản trị, tổ chức
các kết nối, các thành phần lưu trữ và hệ thống máy tính nhằm đảm bảo việc
truyền tải data được bảo mật và mạnh mẽ.
Tùy theo nghi thức truyền tải dòng dữ liệu SCSI, có thể chia SAN thành hai
loại:
- Fibre Channel SAN (FC-SAN): Fibre channel được thiết kế để dành riêng
cho việc truyền tải dữ liệu dạng khối. Ngày nay, fibre channel được dùng chủ
yếu cho mục đích truyền tải dòng dữ liệu SCSI trong các hệ thống SAN và các
hệ thống SAN dùng fibre channel được gọi là FC-SAN.
- IP-SAN: Người ta đã định nghĩa một giao thức mới gọi là iSCSI để cho
phép dòng dữ liệu SCSI được đóng gói và truyền tải lên mạng TCP/IP truyền
thống. Một mạng IP dành riêng cho mục đích này được gọi là IP-SAN.

16


Thiết bị lưu trữ SAN storage cho phép khắc phục các nhược điểm đồng
thời bổ sung và tăng cường nhiều tính năng cần thiết cho các hệ thống lưu trữ:
- Tính năng mở rộng: cho phép nhiều server, cluster server hơn đồng thời
kết nối và dùng chung không gian lưu trữ.
- Tăng tính lưu động của hệ thống: cho phép các hoạt động như đồng bộ
hóa dữ liệu giữa các trung tâm cơ sở dữ liệu, di dời dữ liệu sang các nền tảng
phần cứng khác…
- LAN-free backups: cho phép gửi dữ liệu trực tiếp đến các thiết bị sao lưu
trong SAN mà không thông qua LAN.

- Server-free backups: dòng dữ liệu trong quá trình sao lưu dữ liệu được
truyền tải trực tiếp giữa các thiết bị sao lưu bên trong SAN
- Khả năng quản trị không gian lưu trữ hiêu quả và mạnh mẽ: nhanh chóng
phân phối, thu hồi và thay đổi không gian lưu trữ cho các server mà không phải
dùng các server này như đối với các hệ thống lưu trữ đĩa cứng truyền thống.
Những tính năng:
- Lưu trữ được truy cập theo Block qua SCSI
- Khả năng I/O với tốc độ cao
- Tách biệt thiết bị lưu trữ và server
Thực ra SAN cũng như DAS, chỉ khác là SAN có khả năng mở rộng, đặt
chỗ khác và cho nhiều server có thể truy xuất trực tiếp đến chúng. Đặc biệt SAN
thì khối dữ liệu sẽ hiện trong các máy chủ như là những HDD của chính nó.
SAN cung cấp các phương pháp mới cho việc bổ sung thêm tài nguyên lưu
trữ cho các server. Các phương pháp mới này cũng giúp tăng cường hiệu suất và
nâng cao tính sẵn sàng của toàn bộ hệ thống sao lưu dự phòng cho nhiều server
và được dung bởi các cluster server cho mục đích nâng cao tính chịu lỗi và tính
sẵn sàng của hệ thống thông tin của doanh nghiệp.
2.3. Cấu trúc mạng Storage Area Network (SAN)
2.3.1. Tính tương thích và các tiêu chuẩn mạng Storage Area Network
Trước đây, sự tương thích các thành phần mạng SAN là một trong những
vấn đề lớn nhất phải giải quyết. Thiết bị được sử dụng có rất ít sự tương thích,
các chuyển mạch nhất định chỉ làm việc được với một số HBA (Host bus
adapter) nhất định. Sự tương thích của các thiết bị Fibre Channel đã được cải
thiện mặc dù nó vẫn được xem là một trong những thử thách lớn nhất khi thực
hiện mạng SAN. Hiệp hội công nghiệp Fibre Channel (FCIA – Fibre Channel
Industry Asociation) và Hiệp hội công nghiệp mạng lưu trữ (SNIA – Storage
Networking Industry Assciation) đã làm việc trong nỗ lực chung để giải quyết
vấn đề tương thích giữa các thiết bị bằng cách thiết lập các tiêu chuẩn dựa trên
tiêu chuẩn Fibre Channel cho mạng SAN. Quá trình tiêu chuẩn háo cho SAN có
bước chính, trong đó giai đoạn đầu tiên đã được hoàn tất.

17


- Thiết lập tiêu chuẩn mạng cho chuyển dịch dữ liệu và thiết lập các sơ đồ
đặt tên (naming) cho các thành phần và thiết bị: Bước này đã đưuọc hoàn tất khi
các tiêu chuẩn Fibre Channel cung cấp các phương tiện cần thiết cho đặt tên
thiết bị và cấu hình.
- Phát hiện (discovery) thiết bị và topology trong mạng SAN: Sự phát triển
ở bước này tập trung vào việc thực hiện quản lý thiết bị qua cơ sở thông tin quản
lý (MIB – Management Information Base) nằm trên mỗi thiết bị mạng. Quá
trình quản lý thực hiện thu thập thông tin và trạng thái thiết bị. Một số lượng lớn
các nhà sản xuất Fibre Channel đã thực hiện MIB trong thiết bị của mình nhưng
tất cả các thiết bị không thể thực hiện giao tiếp nội bộ.
- Trong bước thứ ba và cuối cùng, tiêu chuẩn cho các tài nguyên của mạng
SAN được thể hiện dưới thuật ngữ hoàn tất gán thiết bị tự động cho các ứng
dụng như dự phòng không có server (serverless backup) và phục hồi sau thảm
họa (disaster recovery).
2.3.2. Topology mạng Storage Area Network (SAN)
Tolopogy mạng SAN có thể được thực hiện bằng nhiều cách phụ thuộc vào
đặc điểm của các ứng dụng và các yêu cầu:
- Quy mô của mạng lưu trữ: Từ các mạng SAN có quy mô nhỏ bao gồm
một chuyển mạch hay một hub đơn lẻ cho tới các mạng SAN lớn với một số
lượng lớn các chuyển mạch và các cổng.
- Đường truyền dữ liệu và nhu cầu truyền dữ liệu.
- Dự phòng dữ liệu từ xa.
- Các topology mạng SAN có thể được thiết lập bằng hai cách:
+ Kiểu tập trung: Các hệ thống lưu trữ được nối tới một chuyển mạch
trung tâm có số lượng cổng lớn trong mạng SAN.
+ Kiểu mạng: Các chuyển mạch được liên kết với nhau tạo thành một
mạng tuyến tính hoặc mạng lưới (mesh) nối các server và thiết bị lưu trữ.

2.3.2.1. Topology điểm – điểm
Topology điểm – điểm là cấu hình đơn giản nhất có thể có cho mạng SAN.
Cấu hình (hình 3) bao gồm một server được nối với một thiết bị lưu trữ đứng
một mình.

Hình 2.5. Topology Điểm – Điểm
18


2.3.2.2. Topology Arbitrated Loop
Topology Arbitrated Loop bao gồm một hub đường trục và các thiết bị
trong mạng được nối với hub tạo thành một mạng hình sao vật lý (hình 4).

Hình 2.6. Topology Arrbitrated Loop

Topology Arbitrated Loop có nhược điểm là tại một thời điểm chỉ có một
thiết bị được truyền dữ liệu trên mạng. Khi số lượng thiết bị trên mạng tăng lên
sẽ gây ra sự sụt giảm chất lượng mạng. Do đó, Topology Arbitrated Loop chỉ
được sử dụng cho các mạng San có quy mô và lưu lượng dữ liệu hạn chế.
2.3.2.3. Topology SAN Fabire
Trong Fibre Channel, thuật ngữ “chuyển mạch nối giữa các thiết bị” được
gọi là Fabric.
Topology SAN Fabric là topology có chỉ tiêu cao nhất và được sử dụng cho
các mạng SAN có quy mô và lưu lượng dữ liệu lớn. Các fabric rất lớn có thế
được xây dựng bằng cách liên kết nhiều chuyển mạch với nhau. Do đó, mạng
SAN dựa trên fabric có thể được mở rộng bằng cách thêm các chuyển mạch vào
mạng.
Topology SAN fabric có các kiểu topology sau:
* Director-Based Fabric
Fabric thực hiện đơn giản nhất là Director Based Fabric. Fabric này hồm có

một chuyển mạch chủ đơn lẻ với một số lượng cổng rất lớn (32, 64 hoặc 128
cổng phụ thuộc vào nhà sản xuất).
Một Director-Based Fabric có các đặc điểm sau:
- Director-Based Fabric đưa ra một kiểu lưu trữ tập trung với tất cả thiết bị
lưu trữ nối tới điểm duy nhất.

19


Tất cả các cổng trong Fabric được sử dụng cho thiết bị, không có cổng nào
được sử dụng cho liên kết các chuyển mạch.
- Nếu chuyển mạch chủ gặp sự cố, toàn mạng sẽ gặp sự cố. Kết quả, tất cả
các server và thiết bị lưu trữ bị mất các kết nối.
- Topology Director-Based Fabric không có tính khả thi cao, một chuyển
mạch chủ lớn không phải luôn luôn là một giải pháp đạt hiệu quả về chi phí. Khi
có sự chuyển đổi về công nghệ sang các công nghệ mới hơn, toàn bộ chuyển
mạch có thể cần phải được thay thế, thay bì chỉ thay thế các thành phần của
mạng lưới (trong trường hợp nhiều chuyển mạch nhỏ hơn được sử dụng).
* Topology chuyển mạch nối tầng (Cascaded Switch Topology)
Topology mạng đa chuyển mạch ít phức tạp nhất là topology chuyển mạch
nối tầng (hình 5). Topology này bao gồm một số lượng tương đối nhỏ các
chuyển mạch được liên kết với nhau theo kiểu tuyến tính.

Hình 2.7. Topology chuyển mạch nối tầng liên kết với 3 chuyển mạch

Chuyển mạch cuối cùng của fabric cũng có thể được liên kết với chuyển
mạch đầu tiên bằng cách sử dụng thêm một đường ISL (Inter-Switch Link) tạo
thành một topology ring. Topology chuyển mạch nối tầng có các đặc điểm:
- Sử dụng số lượng cổng tối thiểu để liên kết các chuyển mạch
- Các chuyển mạch nối tầng không có chuyển mạch dự phòng (nếu chúng

không được đưa vào vòng). Do đó, một chuyển mạch có sự cố sẽ dẫn tới fabric
bị chia tách. Kết quả là các thiết bị được nối với một chuyển mạch này không
thể truy nhập vào các thiết bị trên chuyển mạch khác.
* Topology fabric lưới (Mesh Fabric Topology)
Topology fabric lưới (hình 6) bao gồm các chuyển mạch (3 đến 6 chuyển
mạch) được nối với nhau dưới một số dạng hình học. Tất cả các chuyển mạch
trong fabric được liên kết với nhau. Fabric cung cấp các đường nối dự phòng để
đảm bảo mạng SAN vẫn sẽ hoạt động ngay cả khi một chuyển mạch đơn lẻ
trong mạng gặp sự cố.

20


Hình 2.8. Liên kết giữa các chuyển mạch trong Topology fabric lưới

Topology Fbric lưới có thể được mở rộng bằng cách thêm cách chuyển
mạch khi cần thiết. Ngoài ra, topology này có một số lượng dự phòng bị giới
hạn do các đường dẫn bổ sung giữa các chuyển mạch.
* Topology SAN Building-Block Fabric
Topology SAN Building-Block Fabric (hình 7) được dựa trên nhiều chuyển
mạch nhỏ hơn (gọi là các building-block) được nối với nhau bằng cách sử dụng
một đượng trục (backbone) của một hoặc nhiều chuyển mạch.

Hình 2.9. Liên kết trong Topology SAN Building-Blockfabric

Topology này dễ dàng thực hiện các mạng SAN có quy mô và số lượng
cổng lớn. Mỗi building-Block gồm các đường dẫn dự phòng và được cung cấp
các kết nối chính xác với các chuyển mạch đường trục. Toàn bộ fabric có thể
được thiết lập theo kiểu dự phòng.
Topology này có đặc điểm:

Thực hiện đơn giản khi thiết lập một mạng SAN có quy mô lớn. Mạng
SAN được thiết lập bằng cách đặt các building-block cùng với các chuyển mạch
liên kết. Hình 8 minh họa một mạng SAN với 4 building-block được liên kết với
nhau.

21


Các chuyển mạch đường trục nối giữa các building-block với nhau có thể
được sử dụng như là một điểm tập trung cho các thiết bị được sử dụng chung
một cách thường xuyên (heavily share device) như các ổ băng, thiết bị lưu trữ.
Sử dụng nhiều cổng để liên kết các chuyển mạch gây ra sự lãng phí
cổng.

Hình 2.10. Mạng SAN được dựa trên 4 Building-Block và 7 chuyển mạch liên kết

* Topology SAN Island
Topology SAN Island do công ty BCS (Brocade Communications Systems)
đưa ra. Topology này được sử dụng khii các phòng chức năng trong một trung
tâm muốn có khả năng dùng chung một số thiết bị.
Topology SAN Island được thiết lập bằng cách sử dụng một chuyển mạch
đường trục kết nối mạng SAN của các phòng trong trung tâm với nhau. Tất cả
các thiết bị dùng chung như các ổ băng từ và các thiết bị lưu trữ khác đều được
nối với chuyển mạch đường trục. Bằng cách chia vùng, các mạng SAN ở các
phòng tùy theo nhu cầu, có thể được bảo vệ khỏi sự truy nhập từ bên ngoài hoặc
được thiết lập để dùng chung. Hình 9 minh họa 3 mạng SAN được liên kết với
nhau sử dụng topology SAN Island.

22



Hình 2.11. Liên kết trong topology SAN Island

* Mạng Metropolitan và Wide Area SAN
Mạng Metropolitan và Wide Area SAN sử dụng để kết nối các mạng SAN
ở phạm vi vùng (khoảng cách tới 100km). Khi thực hiện mạng Metropolitan
SAN, tiêu chuẩn Fibre channel được áp dụng bằng cách sử dụng bộ ghép kênh
quang theo bước sóng (DWDM – Dense Wavelength Division Multipexer).
Những bộ DWDM được thiết lập ở biên giới của mạng để kết nối các mạng
SAN với nhau. Các bộ DWDM có thể được liên kết với nhau tạo thành cấu trúc
vòng (ring). Hình 10 minh hạo mạng Metropolitan Area SAN sử dụng ba bộ
DWDM.

Hình 2.12. Mạng SAN mở rộng thành Metropo litan Area SAN sử dụng DWDM
23


Mạng Wide Area SAN sử dụng để kết nối các mạng lưu trữ trong các trung
tâm lưu trữ ở phạm vi quốc gia (nationwide). Phương pháp phổ biến để thực
hiện mạng Wide Area SAN là sử dụng Fibre Channel qua ATM (Assynchronous
Transfer Mode) được truyền tải trên SONET (Synchronous Optical Network)

Hình 2.13. Mạng SAN mở rộng thành Wide Area SAN sử dụng ATM qua SONET

2.3.2.4. Topology mạng dự phòng
* Dự phòng cơ bản:
Dự phòng cơ bản trong mạng lưu trữ có thể được thực hiện bằng một spps
phương pháp khác nhau và được thực hiện ở hai mức cơ bản, hoặc ở mức thiết
bị hoặc ở mức mạng.
Thực hiện dự phòng ở mức thiết bị: Các thành phần thiết bị quan trọng

trong mạng SAN có khả năng chuyển đổi nóng (hot-swappable) để quá trình
thay thế thiết bị không phải tắt nguồn trên thành phần hỏng. Các thành phần
thiết bị có thể được nhân đôi để sự hỏng hóc của thành phần đó sẽ không ảnh
hưởng tới chỉ tiêu của thiết bị. Thành phần thiết bị được nhân đôi là nguồn cấp
điện, bộ điều khiển kép cho các thiết bị RAID, đầu ra điện áp AC kép và hai
quạt làm mát.
Thực hiện dự phòng ở mức mạng: Các server được trang bị với các HBA
kép để mỗi server có thể được nối với hai chuyển mạch khác nhau trong fabric.
Một cách tương tự, các khối lưu trữ có các cổng kép được nối tới hai chuyển
mạch khác nhau trong fabric. Bằng cách này, sự hỏng hóc của một chuyển mạch
trong fabric sẽ không ra sự mất truy nhập vào server và các khối lưu trữ nối với
nó. Nhiều đường dẫn cũng được thiết lập trong fabric để đảm bảo vẫn có các
đường dẫn giữa các chuyển mạch khi chuyển mạch trên đường ngắn nhất bị sự
cố. Trong trường hợp cần thiết, toàn bộ mạng kết nối có thể được nhân đôi để
tạo thành một sự dự phòng hoàn toàn và mạng chống lỗi.
- Topology Remote mirroring
Topology Remote mirroring bổ sung một mức dự phòng khác và thậm chí
tốt hơn về mặt thời gian chuyển đổi từ thiết bị chính sang dự phòng so với các
cấu hình dự phòng đơn giản vì topology này không phụ thuộc vào một vị trí đơn
lẻ.
Các cấu hình dự phòng đơn giản ở mức thiết bị và mức mạng cho dù hoạt
động tốt nhưng vẫn nhạy cảm với một số thảm họa như lửa, động đất và các
24


thiên tai khác. Những thảm họa này có thể làm tê liệt mạng và có thể phá hủy dữ
liệu. Các cấu hình Remote Mirroring cung cấp khả năng chịu được thảm họa
hoàn toàn bằng cách thiết lập một bản sao (duplicate) của mạng SAN tại vị trí
cách xa.


Hình 2.14. Topology Remote mirroring sử dụng Fibre Channal

Tất cả các khối lưu trữ ở mạng chính cũng như đường trục đều được nhân
đôi. Vì có một lưu lượng dữ liệu tương đối lớn truyền giữa mạng cục bộ và
mạng ở xa, do đó cần thiết có nhiều đường dẫn nối giữa chúng. Hai mạng được
nối với nhau có thể sử dụng sợi quang đơn mode cho phép khoảng cách truyền
dẫn lên tới 70km qya các chuyển mạch được nối tầng hay 10hm sử dụng chuyển
mạch đơn lẻ.
Một lựa chọn khác để thực hiện cấu hình remote mirroring là cung cấp kết
nối từ xa qua mạng WAN (Wide Area Network). Khi đó, khoảng cách giữa hai
mạng sẽ còn lớn hơn. Một số các tùy chọn khác nhau cho đường nối từ xa WAN
gồm có ATM hoặc IP qua SONET.

Hình 2.15. Topology Remote mirroring sử dụng WAN cho đường nối ở xa

25


×