Tải bản đầy đủ (.doc) (28 trang)

Bài tập lớn: Hệ thống lưu trữ (Raid)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (325.69 KB, 28 trang )

Lời mở đầu
Máy tính điện tử (MTĐT) ra đời ra đời vào những năm 40 của
thế kỷ 20 và phát triển nh vũ bÃo, làm nên một cuộc cách mạng
trong lĩnh vực tính toán và xử lý thông tin, mở ra một kỷ
nguyên mới trong lịch sử nhân loại Kỷ nguyên MTĐT. Kiến trúc
của MTĐT ngày càng tinh vi và phức tạp, bao gồm nhiều thành
phần khác nhau. Kiến trúc máy tính (KTMT) là nghành khoa học
nghiên cứu việc thiết kế các thành phần cấu thành nên MTĐT
mà ngời lập trình có thể nhận thấy đợc.
MTĐT không chỉ có các thành phần vật lý, thờng gọi là phần
cứng (hardware) mà còn có cả các chơng trình để điều khiển
sự hoạt động của các thành phần phần cứng, chúng đợc gọi là
phần mềm (software). Ngoài ra MTĐT còn cần có một hệ thống
lu trữ để lu trữ các chơng trình, dữ liệu của ngời sử dụng và
hệ thống lu trữ là không thể thiếu trong MTĐT. Vì vậy chúng
em chọn đề tài Hệ thống lu trữ (Raid) làm bài tập lớn môn
Kiến trúc máy tính để hiểu rõ hơn về công nghệ lu trữ trong
hệ thống máy tính hiện nay.
Nội dung của bài viết đựơc chia làm 4 chơng và nội dung
chính của từng chơng nh sau:
- Chơng 1: Lịch sử phát triển và các khái niệm cơ bản
- Chơng 2: Hiệu năng Raid và các vấn đề liên quan
- Chơng 3: Các loại Raid phổ biến
- Chơng 4: Lựa chọn thiết bị, thiết lập và thử nghiệm thực tế


Mặc dù đà cố gắng rất nhiều nhng do thời gian và trình độ,
năng lực còn hạn chế nên nội dung của quyển bài tập lớn này
không thể tránh khỏi nhiều thiếu sót. Vì vậy chúng em mong
các thầy, cô giáo trong khoa giúp đỡ, góp ý cho chúng em để
bài viết của chúng em đợc hoàn thiện hơn.


Chơng I
Lịch sử phát triển và các khái niệm cơ bản
1.1. Lịch sử phát triển.
Vào cuối những năm 1980 và đầu 1990, các nhà cung cấp
dịch vụ công nghệ thông tin phải đối mặt với việc tăng nhanh
một khối lợng khổng lồ các dữ liệu cần đợc lu trữ. Các công
nghệ lu trữ đang trở nên rất đắt để đặt một số lợng lớn ổ
cứng có khả năng cao trên các máy chủ. Raid ra đời để giải
quyết vấn đề trên.
Raid là tõ viÕt t¾t cđa Redundant Array of Inexpensive Disks
(HƯ thèng đĩa dự phòng) là hình thức ghép nhiều ổ đĩa
cứng vật lý thành một hệ thống ổ đĩa cứng có chức năng gia
tăng tốc độ đọc/ghi dữ liệu hoặc tăng thêm sự an toàn của dữ
liệu chứa trên hệ thống đĩa hoặc kết hợp cả hai yếu tố trên.
Lần đầu tiên Raid đợc phát triển năm 1987 tại trờng Đại học
California tại Berkely (Hoa Kỳ) với đặc điểm chỉ ghép các
thành phần đĩa cứng nhỏ hơn thông qua phần mềm để tạo
ra một hệ thống đĩa dung lợng lớn hơn thay thế cho các ổ
cứng dung lợng lớn giá đắt thời bấy giờ.
Trong vài năm trở lại đây từ chỗ chỉ có trên các hệ thống máy
tính lớn, máy trạm, máy chủ. Raid đà đợc đa vào các máy tính
để bàn dới dạng tích hợp đơn giản.
1.2. Các khái niệm cơ bản.


Trớc khi đi sâu vào vấn đề chính của nội dung bài viết
em xin trình bày các khái niệm cơ bản đợc dùng trong kỹ thuật
Raid
1.2.1. DÃy đĩa vật lý, luận lý và bộ điều khiển Raid
a) ổ đĩa vật lý (Physical Drive): là những ổ đĩa cứng

thực sự đợc sư dơng ®Ĩ thiÕt lËp Raid.
b) D·y ®Üa vËt lý (Physical Array) : Một hoặc nhiều ổ
đĩa vật lý hợp lại với nhau tạo thành một dÃy đĩa vật lý. Đa số
các chuẩn Raid đơn giản chỉ cần thiết lập một dÃy đĩa vật lý
để hoạt động, tuy nhiên những chn Raid cao cÊp h¬n thêng
sư dơng tõ hai d·y ®Üa vËt lý trë lªn.
c) D·y ®Üa luËn lý (Logical Array): DÃy đĩa luận lý đợc
thiết lập bằng cách tách hoặc tổng hợp các dÃy đĩa vật lý.
Một dÃy đĩa luận lý cũng tơng tự nh một dÃy đĩa vật lý. Chúng
ta hoàn toàn có thể tổng hợp một dÃy ®Üa ln lý tõ nhiỊu
®Üa vËt lý kh¸c nhau ®Ĩ chạy các chuẩn Raid phức tạp.
d) ổ đĩa luận lý (Logical Drive): Một hoặc nhiều ổ
đĩa phân chia bởi dÃy đĩa luận lý. Nó đợc hiểu nh một ổ
cứng thông thờng trong hệ điều hành.
e) Bộ điều khiển Raid (Raid Controller): Bộ điều
khiển và chịu trách nhiệm quản lý, tổ chức các chế độ Raid
và các dÃy đĩa (vật lý và luận lý) trong hệ thống. Các bộ điều
khiển này thờng dới dạng tích hợp vào bo mạch chủ, card gắn
trong hay một thiết bị phần cong độc lập.
1.2.2. ánh xạ (Mirroring).
Mirroring là một trong hai công nghệ cao cấp đợc sử dụng
trong Raid (ngoài ra còn có công nghệ Parity Raid). Trªn mét hƯ
thèng Raid sư dơng Mirroring, tÊt cả dữ liệu đợc ghi một cách
giả lập trên hai ®Üa cøng nh ®èi víi mét ®Üa. ChÝnh v× lÏ đó,
Mirroring yêu cầu một số chẵn các ổ đĩa trong d·y ®Üa vËt lý
cịng nh ln lý.


Sơ đồ hoạt động của Mirroring.
Bộ điều khiển Raid sao chép các dữ liệu từ mỗi đĩa cứng tới

các đĩa cứng còn lại trong dÃy đĩa.
Lợi ích của Mirroring là toàn bộ dữ liệu luôn đợc đặt trong
tình trang an toàn nhất, bảo đảm cho hệ thống tiếp tục hoạt
động khi một trong hai đĩa cứng gặp lỗi vật lý, đồng thời
đem lại khả năng phục hồi dữ liệu cực nhanh. Công việc cần
làm chỉ là thay đĩa cứng bị hang bởi một đĩa cứng mới.
Từ sơ đồ hoạt động trên, ta thấy Mirroring sẽ cải thiện tốc độ
đọc dữ liệu -

mặc dù tốc độ ghi có phần giảm sút, nhng

không nhiều. Tuy nhiên, Mirroring cũng có nhợc điểm là sÏ l·ng
phÝ khi ph¶i bá chi phÝ tiỊn cho mét ổ cứng có dung lợng lớn
mà hiệu quả sử dụng chỉ có phân nửa.
Công nghệ Mirrorong đợc sử dụng trong Raid 1, cũng nh các loại
Raid tổng hợp có bao gåm Raid 1 (nh Raid 10). Mirroring cịng lµ
nỊn mãng cho kỹ thuật Raid ghép đôi (Duplexing Raid) ra
đời sau này.
1.2.3. Ghép đôi (Duplexing).
Là một chuẩn mở rộng của Mirroring, Duplexing có những
nét tơng tự về mặt công nghệ nh chuẩn Mirroring. Dữ liệu
cũng đợc ghi nh nhau trên hai ổ đĩa. Tuy nhiên có một điểm
khác biệt ỏ đây là Duplexing không chỉ nhân đôi dữ liệu
mà thậm chí còn nhân đôi cả yêu cầu về phần cứng.


Cụ thể chúng ta cần tới hai bộ điều khiển Raid để kết nối hai
ổ cứng dùng trong Dulepxing (mỗi ổ đĩa sẽ đợc kết nối tới một
bộ điều khiển).


Sơ đồ hoạt động của Duplexing.
Duplexing mang tính bảo mật cao hơn Mirroring một bậc,
vì nó có khả năng hạn chế những h hang từ bộ phận điều
khiển. Duplexing cũng là một lựa chọn đáng giá khi bạn muốn
sử dụng Raid 1 cho hệ thống lu trữ của mình, mặc dù có giá
thành cao hơn Mirroring.
1.2.4. Song hành (Strinping).
Là một trong những chuẩn Raid đem lại hiệu quả cao
nhất. Trong một dÃy gồm nhiều ổ đĩa, chúng ta có thể tăng
tốc độ truy cập lên mức tối đa bằng các ghi song song dữ liệu
trên các ổ đĩa này. Theo đó dung lợng ổ đĩa sẽ đợc chia
thành nhiều phần nhỏ giống nh những sọc kẻ(stripe). Dữ liệu sẽ
đợc ghi trên các sọc của từng ổ đĩa. Trong trờng chúng ta
muốn ghi một tập tin lên đĩa cứng, kỹ thuật Strinping sẽ chia
nhỏ tệp này ra rồi ghi mỗi phần của tệp lên một ổ cứng trong
dÃy một cách đồng thời. Theo cách này khi cần đọc dữ liệu bộ
điều khiển cũng sẽ đọc cùng lúc trên tất cả các ổ đĩa, hệ quả
là hiệu năng của hệ thống lu trữ sẽ đợc nâng lên rất nhiều tuỳ
thuộc vào số ổ ®Üa trong d·y.
Striping cã thĨ thùc hiƯn ë cÊp ®é byte, hoặc ở cấp độ các
block dữ liệu. ở cấp ®é byte ®ỵc sư dơng trong Raid 3, tËp tin


sẽ đợc chia thành từng gói nhỏ có kích thớc 1 byte, và bộ điều
khiển sẽ ghi từng byte này lên các ổ đĩa. Trái lại trong cấp độ
block, tuỳ theo kích thớc block mà các phần của tập tin đợc chia
nhỏ sẽ đợc lu và phân bố trên các block này. Hình vẽ dới đây
thể hiện cách ghi dữ liệu của Striping.

Sơ đồ hoạt động của Striping.

Bộ điều khiển Raid chia nhỏ dữ liệu vào các block hoặc
thành từng bit rồi phân bố chúng vào các ổ đĩa cứng. Kích
thớc block xác định kích thớc của từng phần dữ liệu bị chia
nhỏ.
Trong hình vẽ block đầu tiên của dữ liệu đợc ghi lên đĩa 1,
block thứ 2 đợc ghi lên đĩa 2.cho tới block thứ 5 lại đợc ghi lên
đĩa 1, cứ tiếp tục nh vậy cho tới khi ghi hết dữ liệu.
1.2.5. Parity Raid.
Mirroring là một công nghệ ®ỵc sư dơng trong mét sè cÊp ®é
Raid phỉ biÕn (điển hình là Raid 1), cung cấp bảo vệ dữ liệu
trên các dÃy đĩa. Mặc dù vậy, Mirroring cũng gặp một số hạn
chế nh:
- Thứ nhất: nó gây lÃng phí dung lợng đĩa cho ngời dùng


- Thứ hai: khả năng tăng tốc rất ít cho việc lu trữ và sử
dụng dữ liệu.
Chính vì những nguyên nhân đó đà thúc đẩy công nghệ
Raid phát triển không ngừng để cải tiến những hạn chế mà
mỗi công nghệ Raid gặp phải.Các nhà sản xuất trong lĩnh vực
lu trữ đà đa ra một phơng pháp khác để bảo vệ an toàn cho
dữ liệu là sử dụng các thông tin mang tính chẵn lẻ đặc biệt
gọi là Parity Information đợc tính toán thực tế từ các dữ liệu.
Khái niệm chẵn lẻ đợc sử dụng trong cơ chế chống lỗi
của bộ nhớ truy xuất ngẫu nhiên (Ram) máy tính: trớc hết bộ nhớ
kiểm tra chẵn lẻ bằng cách lu giữ một con số nhị phân (0
hoặc 1) cho biết tổng số các bit trong một gói dữ liệu là chẵn
hay là lẻ. Khi gói dữ liệu đợc đọc từ bộ nhớ ra, hoặc nhận đợc
từ một máy tính khác truyền tới, một quá trình kiểm tra chẵn
lẻ xảy ra. Nếu việc kiểm tra chẵn lẻ này khẳng định bit bậc là

không đúng, máy tính sẽ hiển thị một thông báo lỗi.
Nguyên tắc hoạt động của Parity: Trớc hết bộ điều khiển sẽ
lấy gói dữ liệu X làm mẫu, từ đó tính toán các gói dữ liệu
khác. Ví dụ: lấy gói dữ liệu X + 1 rồi ghi chúng lên ổ đĩa thứ
X + 1, cữ nh vậy tiếp tục đến gói X + 2, X + 3,…. NÕu mÊt
bÊt kú gãi dữ liệu nào từ các gói sau này, bộ điều khiển sẽ khôi
phục lại nó dựa trên các tính toán từ gói X, bất chấp gói bị mất
vì lý do gì.
Parity Raid đợc ứng dụng trong công nghệ Striping đà nói ở
phần trên, và gói dữ liệu X tợng trng cho các byte hay block dữ
liệu đợc phân bố cho các ổ đĩa trong dÃy. Việc tính toán
chẵn lẻ đợc thực hiện bởi các hàm luận lý OR và XOR và
đợc thể hiện trong bảng dới đây:

Toán
1
0
0

Input
tử
Toán tử
2
0
1

Output
OR
XOR
0

1

0
1


1
1

0
1

1
1

1
0

Tính toán với các hàm OR và XOR.
Trong đó Input là dữ liệu đợc đa vào, còn Output là kết
quả của phép tính
Lơi ích lớn nhất của Parity Raid là không yêu cầu hệ thống
Raid phải bớt đi phân nửa dung lợng lu trữ để đổi lấy độ an
toàn dữ liệu. Mà chỉ mất đi dung lợng của ổ đĩa X + 1 dành
cho việc khôi phục dữ liệu mà thôi. Tuy nhiên, hạn chế của
công nghệ này là yêu cầu một nền tảng phần cứng thật mạnh,
đặc biệt là bộ vi xử lý, để có thể vừa làm việc, vừa tính toán
các giá trị chẵn lẻ cho công việc lu trữ.
Parity Raid đợc sử dụng cho tất cả các cÊp ®é Raid tõ 3 ®Õn
7, trong ®ã Raid 5 là phổ biến nhất. Cấp độ Raid 2 cũng đợc

sử dụng một cơ chế gần giống nh Parity Raid, tuy nhiên giữa
chúng cũng có nhiều điểm khác biệt.
Chơng 2
Hiệu năng Raid và các vấn đề liên quan
Raid đợc phát triển dành cho nhu bảo vệ an toàn dữ liệu
bằng các cung cấp các cơ chế sửa lỗi đĩa cứng. Hiện nay trong
khi độ tin cậy của các phơng tiện lu trữ ngày càng đựơc
nâng cao nhờ hàng loạt các công nghệ đợc hàng loạt các hÃng
đĩa cứng đa ra thì vấn đề cải thiện hiệu năng đợc chú ý
nhiều.
Đối với ngêi dïng khi thiÕt lËp cho m×nh mét hƯ thèng Raid
thì điều đầu tiên quan tâm đến đó là tốc độ và độ an
toàn dữ liệu. Nh chúng ta đà biết Raid làm tăng tốc độ dữ
liệu, tuy vậy các chuẩn Raid cũng nh cấp độ Raid khác nhau sẽ
có những phơng pháp cũng nh độ hiệu quả tăng tốc khác
nhau.
Dới đây sẽ trình bày các hiệu năng của công nghÖ Raid


2.1. Hiệu năng đọc và ghi dữ liệu.
Đĩa cứng thờng thực hiện hai hoạt động: ghi dữ liệu lên
bề mặt đĩa và đọc lại nó khi có yêu cầu.
Trong đa số các trờng hợp, quá trình biến đổi mang tính
điện tử và vật lý của cả hai hoạt động này khá giống nhau trên
một hệ thống đĩa cứng đơn. Mặc dù vậy, giữa chúng cũng có
một số khác biệt nhỏ. Khi đợc chuyển sang hệ thống Raid, sự
khác biệt này lớn hơn nhiều. Bởi vì tuỳ theo sự sắp xếp của
các ổ đĩa trong dÃy mà sự sắp xếp dữ liệu lên mỗi đĩa cứng
cũng sẽ khác nhau. Hệ quả là mỗi chuẩn Raid khác nhau sẽ cho
ta sự tăng tốc độ đọc và ghi dữ liệu lên hệ thống khác nhau.

2.1.1. Mirroring.
Hiệu năng đọc trong chuẩn Mirroring cao hơn rất nhiều so
với hiệu năng ghi dữ liệu. Nếu nh thực hiện công việc ánh xạ với
2 đĩa cứng trong chuẩn Raid 1. Lúc này tất cả các dữ liệu sẽ
đợc sao chép và chứa vào 2 ổ đĩa. Điều này có nghĩa tất cả
các byte dữ liệu phải đợc ghi cùng lúc lên cả 2 ổ đĩa, làm cho
tốc độ ghi trở lên chậm hơn so với việc ghi lên một ổ đĩa
đơn. Nguyên nhân là do bộ điều khiển Raid phải mất thêm
thời gian để đồng bộ dữ liệu giữa 2 đĩa cứng.
Tuy nhiên hiệu năng đọc dữ liệu trong chuẩn Mirroring lại tăng
lên vì bộ điều khiển lúc này chỉ việc truy xuất vào một ổ
đĩa để đọc dữ liệu. Dữ liệu đợc đọc từ một ổ đĩa duy
nhất, trong khi đĩa cứng còn lại nhận trách nhiệm phục vụ cho
các yêu cầu phát sinh trong quá trình truy cập dữ liệu.

2.1.2. Striing.
Một hệ thống Raid sử dụng công nghệ Striping sẽ mang lại
độ tăng hiệu năng đọc và ghi gần nh bằng nhau. Chính xác
hơn tỉ lệ giữa tốc độ đọc/ghi khi sử dụng Raid so với tốc độ
đọc/ghi tơng ứng trên đĩa đơn là nh nhau. Thông thờng tỉ lệ
này đạt từ 1,4 1,8 lÇn.


2.1.3. Striping kÕt hỵp víi Parity Raid
Gièng nh Mirroring, hiƯu năng ghi mặc dù tăng so với sử
dụng đĩa đơn nhng khi kết hợp Striping với kỹ thuật Parity,
hiệu năng ghi vẫn thấp hơn so với hiệu năng đọc. Nhng bù lại
chúng ta có đợc độ an toàn cần thiết cho những dữ liệu quan
trọng.
Nh vậy hiệu năng đọc và ghi dữ liệu phụ thuộc rất nhiều

vào công nghệ đợc sử dụng trong mỗi chuẩn Raid. Hơn nữa,
đối với mỗi cấp độ Raid cũng có sự khác nhau nhất định, cho
dù các công nghệ đợc sử dụng có giống nhau chăng nữa. Đặc
biệt chuẩn Raid Striping khi kết hợp với kỹ thuật Parity sẽ khắc
phục đợc những khiếm khuyết liên quan đến an toàn dữ liệu,
cho dù hiệu năng ghi dữ liệu có kém hơn. Vì vậy chuẩn Raid
này thích hợp cho một số ứng dụng ít sử dụng tác vụ ghi dữ
liệu lên đĩa. Mà điển hình là các ứng dụng liên quan đến
lĩnh vực mạng và truyền thông của những hệ thống máy chủ
nh: ứng dụng máy chủ web, máy chủ mail, Trái lại, đối với
những ứng dụng cao về tác vụ ghi đĩa nh truy nhập cơ sở dữ
liệu, thiết kế đồ hoạ, phát triển phần mềm, thì những loại
Raid mang tính kết hợp thuần tuý giữa các chuẩn Raid khác
nhau (tiêu biểu nh Raid 10) thích hợp hơn.
2.2. Hiệu năng định vị và dịch chuyển dữ liệu
Ngoài hiệu năng đọc và ghi dữ liệu còn có 2 yếu tố quan
trọng không kém ảnh hởng tới hiệu năng tổng thể của hệ
thống Raid là quá trình và định vị (positioning) và dịch
chuyển (transfer) dữ liệu. Việc truy xuất dữ liệu trên một đĩa
đơn trải qua 2 bớc: xác định vị trí của dữ liệu cần truy cập,
sau đó dịch chuyển dữ liệu từ/tới các rÃnh đĩa. Cả 2 quá
trình này đều có tác dụng không nhỏ tới hiệu năng của hệ
thống lu trữ.
Việc sử dụng nhiều đĩa cong trong môi trờng Raid có tác
dụng tăng tốc quá trình định vị, hoặc quá trình dịch


chuyển dữ liệu, đôi khi là cả 2 quá trình này. Thông thờng,
mỗi công nghệ Raid chọn cho mình một hớng tăng tốc chủ đạo.
Sau đây là các kỹ thuật nhằm tăng tốc hiệu năng định vị

và dịch chuyển dữ liệu trong 2 chuẩn Raid khá phổ biến là
Mirroring và Striping.
*Mirroring
Trong khi đọc dữ liệu, thờng chỉ có một đĩa cứng duy nhất
đợc truy cập đều đặn. Tuy nhiên, bộ ®iỊu khiĨn cã thĨ sư
dơng ®ång thêi c¶ 2 ỉ đĩa cho việc truy cập các dữ liệu độc
lập. Vì vậy, Mirroring sẽ cải thiện hiệu năng định vị một các
dẽ dàng. Dù vậy mỗi khi đà xác định đợc vị trí, dữ liệu sẽ đợc
đọc bởi một ổ đĩa mà thôi, ổ đĩa còn lại sẽ nhận nhiệm vụ
định vị dữ liệu tiếp theo. Do đó hiệu năng định vị trong
Mirroring chỉ tăng trong tác vụ đọc dữ liệu.
*Striping
Đặc điểm của kỹ thuật Striping là dữ liệu đợc chia tách và
ghi vừa đủ vào các block trên trên tất cả các ổ đĩa trong dÃy.
Vì vậy bộ điều khiển cần định vị các phần của dữ liệu sẽ
đợc ghi trên tất cả các ổ đĩa này, do đó hiệu năng định vị
trong Striping sẽ không đợc gia tăng, nhng dữ liệu sẽ đợc đọc
một lần từ tất cả các ổ đĩa, dẫn đến hiệu năng dịch chuyển
dữ liệu từ các rÃnh địa chỉ đựơc cải thiện. Thêm nữa trong
quá trình đọc, nếu dữ liệu có dung lợng nhỏ hơn dung lợng
của block đợc quy định khi thiết lập Striping, bộ điều khiển sẽ
không cần thao tác định vị trên tất cả các ổ đĩa nữa, mà
chỉ cần thực hiện trên ổ đĩa chứa dữ liệu mà thôi. Do đó
Striping giúp tăng tốc dịch chuyển dữ liệu trong khi quá trình
định vị cũng đợc cải thiện mặc dù độ tăng hiệu năng của quá
trình này là không lớn.
Ta nhận thấy tác vụ định vị và dịch chuyển dữ liệu trong 2
kỹ thuật Mirroring và Striping đều có những u và khuyÕt



điểm riêng. Vì vậy tuỳ vào mục đích sử dụng về các ứng
dụng của mình mà ta chọn Mirroring hay Striping cho phù hợp
Nếu với những ứng dụng mà phải làm việc với dữ liệu có
dung lợng lớn thì hiệu năng dịch chuyển dữ liệu sẽ rất cần
thiết, trái lại hiệu năng định vị lại quan trọng hơn đối với các
tập tin có kích thớc nhỏ nh tập tin ảnh, văn bản chẳng hạn.
2.3. Stripe width và Stripe size
Một dÃy đĩa sử dụng kỹ thuật Striping đem lại độ tăng
hiệu năng băng cách chia nhỏ dữ liệu rồi phân bố trên các đĩa
cứng trong dÃy. Đa số các loại Raid sư dơng kü tht Striping cho
phÐp t chØnh 2 th«ng số có ảnh hởng khá lớn đến hiệu năng
của hệ thèng Raid lµ Stripe width vµ Stripe size.
Tríc hÕt chóng ta tìm hiểu về Stripe width. Khái niệm này
chỉ số sọc kẻ có thể đợc đọc và ghi đồng thời tất nhiên là
bằng nhau trên tất cả các đĩa trong d·y. VÝ dơ, mét hƯ thèng
Raid Striping gåm 4 ®Üa cứng có trị số Stripe width là bốn.
Hiệu năng đọc và ghi dữ liệu sẽ tăng nếu Stripe width tăng.
Đây chính là lý do của việc gia tăng số đĩa cứng trong kỹ
thuật Striping đồng nghĩa với gia tăng tốc độ truy xuất dữ
liệu.
Trong đa số trờng hợp, có thể coi Stripe size là kích thớc của
block đợc sử dụng trong Striping. Kỹ thuật Striping trong máy
tính để bàn cho phÐp chóng ta tïy chän c¸c møc Stripe size tõ
2 KB đến 512 KB. ảnh hởng của Stripe size đến hiệu năng của
hệ thống Raid có phần khó hình dung hơn với Stripe width:
- Khi chúng ta giảm Stripe size: Khi Stripe size bị giảm, dữ
liệu sẽ đợc chia nhỏ hơn. Điều này đồng nghĩa với việc cần
nhiều hơn các thao tác ghi dữ liệu lên mỗi ổ đĩa. Hệ quả là
hiệu năng dịch chuyển dữ liệu sẽ tăng, song hiệu năng định
vị lại giảm.

- Khi Stripe size đợc gia tăng: Ngợc lại với việc giảm Stripe
size, trong trờng hợp này hiệu năng định vị sẽ đợc gia tăng,
trong khi hiệu năng dịch chuyển lại giảm sút


Rõ ràng không có một trị số Stripe size nào là phù hợp với tất
cả đối tợng ngời ding. Hiệu năng của hệ thống phụ thuộc vào
từng loại ứng dụng. Do đó chúng ta nên dựa trên nhu cầu sử
dụng thực tế mà chọn Stripe size cho phù hợp.

Chơng 3
Các loại Raid phổ biến
Có rất nhiều loại Raid khác nhau, mỗi cấp độ lại dựa trên
một sự kết hợp nhất định giữa một trong bốn công nghệ:
Mirroring, Duplexing, Striping và Parity.
Trớc khi đi sâu vào từng loại Raid chúng ta so sánh về 2 kỹ
thuật Morroring và Parity Raid.
3.1. Mirroring và Parity.
Những công nghệ đợc sử dụng để tạo nên các cấp độ Raid
chính là nguyên nhân dẫn đến sự khác nhau trong hoạt động
của các cấp độ này. Hai công nghệ đợc sử dụng nhiều nhất
chính là Mirroring và Parity:


- Mirroring: đợc sử dụng trong Rai1, Raid 0 +1 vµ Raid 1 + 0
(Raid 10). Mét biÕn thĨ cđa Raid 1 bao gồm cả ánh xạ bộ điều
khiển Raid dựa trên kỹ thuật Duplexign cũng là một chuẩn
Mirroring mở rộng.
- Striping kết hợp với Parity: các chế độ Raid đơn giản bao
gồm Raid 2, Raid 3, Raid 4, Raid 5, Raid 6, Raid 7 trong ®ã Raid

5 dïng phỉ biến hơn cả. Ngoài ra còn có các loại Raid kÕt hỵp
nh Raid 3 + 0, Raid 0 + 5 và Raid 5 + 0.
- Không sử dụng cả Mirroring và Parity: Raid 0 loại Raid
không cung cấp khả năng bảo vệ dữ liệu và Raid 2.
- Sử dụng cả Mirroring lẫn Parity: các chuẩn Raid kết hợp có
độ an toµn cùc cao nh Raid 5 + 1 vµ Raid 1 + 5.
Lựa chọn loại Raid nào cho hệ thống lu trữ phụ thuộc vào rất
nhiều yếu tố nh: hiệu năng, khả năng chống lỗi, dung lợng lu
trữ hiệu dụng, giá cả
Các loại Raid phức tạp thờng dành cho những hệ thống máy chủ
cao cấp và siêu cao cấp cần tốc độ cũng nh độ bảo mật rất
cao mà đa phần những nhu cầu làm việc phổ thông trong gia
đình cũng nh văn phòng không thể tận dụng hết.

3.2. Các lo¹i Raid phỉ biÕn.
3.2.1. Raid 0.


- Tên thờng dùng: Raid 0
- Công nghệ sử dụng: Striping (không kết hợp Parity).
- Bộ điều khiển yêu cầu: đợc hỗ trợ bởi hầu hết các bộ điều
khiển Raid, bao gồm cả các giao tiếp SCSI, IDE/ATA, SATA, cũng
nh các giải pháp điều khiển bằng phần mềm.
- Số đĩa cứng yêu cầu: từ 2 trở lên (một bộ điều khiển Raid
cao cấp chỉ cần một đĩa cứng để chạy Raid 0, lúc này đĩa
cứng vật lý đợc tách thành 2 đĩa cứng luận lý).
- Tổng dung lợng hiệu dụng = Dung lợng đĩa cứng có kích thớc
nhỏ nhất nhân số đĩa cứng trong dÃy.
- Bảo vệ dữ liệu: không có. Chỉ cần một đĩa cứng h hỏng là
toàn bộ dữ liệu sẽ bị mất.

- Giá cả: thấp nhất trong các loại Raid
- Đặc trng: Dữ liệu trong Raid 0 đợc tách thành từng phần nhỏ
có kích thứơc do ngời dùng quy định (stripe size) rồi đợc ghi
lên mỗi đĩa cứng trong dÃy. Là một trong những loại Raid đợc a
chuộng nhất trong hệ thống máy tính cá nhân bởi vì giá thành
rẻ tốc độ nhanh cho các ứng dụng. Raid 0 thích hợp với những
hoạt động không yêu cầu tính an toàn cao của dữ liệu.
- Khuyến cáo: biên tập hình ảnh, âm thanh, máy chủ web, hệ
thống chơi game, máy tính gia đình hoặc dữ liệu tạm (swap
data) trên những hệ thống máy tính lớn.

3.2.2. Rai 1.


- Tªn gäi thêng dïng: Raid 1, Raid 1 Duplexing
- Công nghệ sử dụng: Mirroring hoặc Duplexing
- Bộ điều khiển yêu cầu: hỗ trợ bởi hầu hết các bộ điều khiển
Raid
- Số đĩa cứng yêu cầu: 2
- Tổng dung lợng hiệu dụng = dung lợng đĩa cứng nhỏ nhất
- Bảo vệ dữ liệu: rất tốt. Đặc biệt bạn còn có thể tăng thêm xác
xuất an toàn khi sử dụng kỹ thuËt Duplexing trong Raid 1
- TÝnh linh ho¹t: rÊt tèt. Có thể thay thế các đĩa cứng trong hệ
thống bất cứ lúc nào cần thiết
- Giá cả: không cao hơn nhiều so với Raid 0, tuy nhiên không
gian lu trữ chỉ bằng nửa so với tổng dung lợng đĩa cứng nên
gây lÃng phí về dung lợng
- Đặc trng: Raid 1 thờng sử dụng kỹ thuật Mirroring. Dữ liệu đợc ghi nh nhau trên tất cả các đĩa cứng trong hệ thống. Khi một
đĩa cứng gặp sự cố, đĩa cứng còn lại tiếp tục làm việc nh
một hệ thống đĩa đơn độc lập cho đến khi đĩa bị lỗi đợc

thay thế. Raid 1 rất phù hợp cho những ngời cần độ tin cậy cao
của dữ liệu mà không chú trọng đến tốc độ
- Khuyến cáo: hệ thống cơ sở dữ liệu vừa và nhỏ, các hệ thống
máy chủ của doanh nghiệp, các nhu cầu bảo vệ dữ liệu với giá
thành thấp nhÊt


3.2.3.

Raid 2.

- Tên thờng dùng: Raid 2
- Công nghệ sử dụng: Striping tốc độ bit
- Bộ điều khiển yêu cầu: chỉ đợc hỗ trợ bởi những bộ điều
khiển Raid đặc biệt
- Số đĩa cứng yêu cầu: ít nhất là 14 đĩa cứng với 10 đĩa dùng
cho lu trữ và 4 đĩa cứng dùng cho việc chống lỗi (ECC Error
Correction Code)
- Tỉng dung lỵng hiƯu dơng = Tỉng dung lỵng đĩa lu trữ
- Bảo vệ dữ liệu: chỉ có thể khôi phục dữ liệu khi có một đĩa
cứng trong hệ thống gặp lỗi
- Giá cả: rất cao
- Đặc trng: Raid 2 không sử dụng bất kỳ công nghệ nào trong
số nh÷ng chuÈn Raid mang tÝnh chÝnh thøc nh Mirroring,
Striping hay Parity. Cơ chế hoạt động của Raid 2 có nhiều đặc
điểm giống với những loại Raid kết hợp Striping và Parity (bao
gồm từ Raid 3 đến Raid 7).
Điểm khác biệt là ngoài các đĩa cứng dùng trong việc lu trữ,
các đĩa cứng còn lại nhận nhiệm vụ tính toán và sửa các lỗi
trong quá trình đọc và ghi đĩa. Raid 2 chỉ đợc đa ra trong lý



thuyết chứ không sử dụng trong thực tế do giá thành quá cao
vì phải dùng tới rất nhiều đĩa cứng (14 đĩa) và bộ điều
khiển Raid rất đắt tiền.
- Khuyến cáo: Không đợc sử dụng trong thực tế

3.2.4. Raid 5.
Trong các loại Raid còn lại (từ Raid 3 đến Raid 7) đều sử
dụng kỹ thuật Striping kết hợp với Parity, do đều có những
đặc điểm về công nghệ tơng tự Raid 5. Vì vậy ta chỉ xét
đến Raid 5 là loại Raid phổ biến nhất trong số này.

- Tên gọi thêng dïng: Raid 5
- C«ng nghƯ sư dơng: Striping cÊp độ block kết hợp Parity
- Bộ điều khiển yêu cầu: yêu cầu các bộ điều khiển Raid cao
cấp
- Số đĩa cứng yêu cầu: tối thiểu là 3, tối đa quy ®Þnh bëi bé
®iỊu khiĨn


- Tổng dung lợng hiệu dụng = dung lợng đĩa cứng nhỏ nhất *
(số đĩa cứng 1)
- Bảo vệ dữ liệu: tốt.
- Tính linh hoạt: rất tốt. Hầu hết các bộ điều khiển Raid đều
hỗ trợ chức năng gắn nóng (Hot plugged-in) mà không ảnh hởng
tới hoạt động của hệ thống. Ngoài ra công việc phục hồi sự cố
cũng khá đơn giản.
- Đặc trng: Một trong những loại Raid cao cấp dành cho máy
tính để bàn. Sử dụng kỹ thuật Striping kết hợp với Parity, Raid 5

đem đến cho ngời dùng tốc độ cao và khả năng linh hoạt cần
thiết. Trớc đây Raid 5 đợc dùng cho hệ thống máy chủ hay máy
trạm làm việc cao cấp. Hiện nay Raid 5 còn dùng cho máy tính
để bàn do có bớc đột phá trong công nghệ chế tạo bo mạch
chủ của các nhà sản xuất.Tuy nhiên Raid 5 lại bị hạn chế trong
hiệu năng ghi dữ liệu.
- Khuyến cáo: dùng cho các hệ thống chơi game cao cấp, các
hệ thống cần ít tác vụ ghi đĩa nh máy chủ web, máy chủ mail,
máy chủ game,
3.2.5. Raid 0 + 1.
Loại Raid kết hợp giữa 2 loại Raid 0 và Raid 1. Khi đó chúng
ta có một hệ thống lu trữ nhanh nh Raid 0 vµ an toµn nh Raid
1.
Raid 0 + 1 yêu cầu tối thiểu phải có 4 ổ cứng, dữ liệu đợc ghi
đồng thời lên 4 đĩa cứng, với 2 ổ dạng Striping tăng tốc và 2 ổ
dạng Mirroring sao lu.
Dung lợng lu trữ của hệ thống = 1/2 tỉng dung lỵng 4 ỉ cøng,
vÝ dơ chóng ta cã 4 ổ cứng dung lợng 80GB thì dung lợng lu trữ
của hệ thống là (4*80)/2 = 160GB.
3.2.6. JBOD.
JBOD (Just a Bunch of Disk) thực tế không phải là một dạng
Raid chính thống, nhng lại có một số đặc điểm liên quan tới
Raid và đợc đa số các thiết bị điều khiển Raid hỗ trợ. JBOD


cho phép gắn bao nhiêu ổ đĩa tùy chọn vào bộ điều khiển
Raid (trong giới hạn cho phép). Sau đó các đĩa cứng đợc kết
hợp lại thành 1 đĩa cứng lín h¬n cho hƯ thèng sư dơng.
VÝ dơ: chóng ta gắn vào bộ điều khiển Raid các ổ cứng 10GB,
20

GB, 30GB thì thông qua bộ điều khiển Raid có hỗ trợ JBOD máy
tính sẽ nhận ra 1 ổ đĩa 60GB.
JBOD không cải thiện về hiệu năng, không mang lại giải pháp
an toàn dữ liệu, chỉ là kết nối và tổng hợp dung lợng mà thôi.
3.2.7. Một số loại Raid khác
Ngoài các loại Raid đợc đề cập ở trên, chúng tao còn gặp
1 số loại Raid khác nhng không đợc sử dụng rộng rÃi mà chỉ giới
hạn trong các hệ thống máy tính phục vụ mục đích riêng nh:
Level 3 (Bit – Inter Leavel Parity), Level 4 (Dedicated Drive),
Level 6 (In dependent Data Diks with Double Parity), Level 10
(Stripe of Mirrors, ngợc lại với Raid 0 + 1), Level 7 ( thơng hiệu
của tập đoàn Storage Computer cho phép thêm bộ đệm Raid
3 và Raid 4), Raid S (phát minh của tập đoàn EMC và đợc sử
dụng trong các hệ thống lu trữ của họ).
Bên cạnh đó còn một số biến thể khác, ví dụ nh Intel Matrix
Storage cho phép chạy Raid 0 + 1 víi chØ 2 ỉ cong hc Raid
1.5 của DFI trên các hệ máy BMC 865, 875. Chúng tuy có nhiều
điểm khác biệt nhng đa phần đều là các bản cải tiến của các
phơng thức Raid truyền thống.

Chơng 4
Lựa chọn thiết bị, thiết lập và thử nghiệm
4.1. Lựa chọn thiết bị.
Để xây dựng một hệ thống Raid, điều cần lu ý đầu tiên
là lựa chọn một bộ điều khiển thích hợp. Các bộ điều khiển
Raid thờng dới dạng Card và đợc giao tiếp với máy tính qua c¸c


khe cắm mở rộng (ví dụ khe cắm PCI) hoặc đợc tích hợp ngay
trong bo mạch chủ duới một trong hai dạng: tích hợp ngay trong

chipset hay sử dụng chip ®iỊu khiĨn Raid cđa h·ng thø 3 nh:
Promise, Technology, Silicon Image, Hiện nay đa số các dòng
chipset nh: Intel 915/925/945/955/965/975 với bộ điều khiển
cầu nam tơng ứng ICH6R/ICH7R cùng các dòng chipset NVIDIA
nForce, ATI Xpress, đều hỗ trợ cho Raid. Công việc cần làm là
mua số lợng đĩa cứng theo đúng yêu cầu của mỗi loại Raid và
thiết lập trong trình điều khiển Raid của bo mạch chủ.

Hiện nay hầu hết các bo mạch chủ chỉ hỗ trợ hai chuẩn
Raid 0 vµ Raid 1. NÕu mn sư dơng Raid 5, hay các loại Raid
mang tính kết hợp khác nh Raid 0 + 1 hay Raid 10 thì phải sử
dụng bo mạch chủ tơng ứng đợc hỗ trợ các chuẩn Raid này.
Đối với ổ cứng nên chọn các loại có giao tiếp tiên tiến nh
SATA/SATA II trở lên để có thể phát huy tối đa hiệu quả của
Raid, tốt hơn nữa là sử dụng ổ cứng chuẩn SCSI.
Tốt nhất các đĩa cứng trong dÃy nên thuộc cùng chủng loại cũng
nh các đặc điểm kỹ thuật nh: dung lợng, tốc độ vòng quay,
chuẩn giao tiếp để hiệu năng của hệ thống là cao nhÊt. VÝ dơ
khi ch¹y Raid 0 víi mét ỉ cøng 80GB SATA 7200rpm vµ mét ỉ
cøng 120GB SATA II 10000rpm thì hiệu năng tổng thể sẽ chỉ
160 GB SATA 7200rpm mà thôi.
Ngoài ra đối với các hệ thống Raid 0 vµ Raid 5, viƯc lùa chän
kÝch thíc block (hay stripe size) cã ý nghÜa rÊt quan träng ®èi
víi hiƯu năng hoạt động, thờng chọn stripe size từ 32 đến
128KB.


Dới đây là bảng so sánh và đánh giá về hiệu năng của những
loại Raid phổ biến.
Raid 0

Đọc ngẫu nhiên

Rất tốt

Tốt

Raid
0 +1/1
+0
Rất tốt

Ghi ngẫu nhiên
Đọc dữ liệu chỉ
định
Ghi dữ liệu chỉ
định
Độ tin cậy dữ liệu

Rất tốt
Xuất
sắc
Xuất
sắc
Kém

Khá
Rất tốt

Tốt
Tốt


Xuất
sắc
Khá
Rất tốt

Khá

Tốt

Khá

Xuất
sắc
50%

Rất tốt

Tốt

(n-1)/n

(n-1)/n

Dung lợng hiƯu dơng 100%
(%)

Raid 1

Rai 5


4.2. ThiÕt lËp Raid.
§Ĩ sư dơng chức năng Raid cho máy tính, cần phải cài
phần mềm trên hệ điều hành , hoặc thông qua các phần cứng
chuyên dụng để điều khiển các dòng dữ liệu di chun tõ
m¸y tÝnh tíi c¸c ỉ cøng.


Việc thiết lập các thông số cho hệ thống Raid tuỳ theo
từng bộ điều khiển hay bo mạch chủ có các đặc điểm khác
nhau, nhng bao gồm các bớc sau:
a). Kết nối các ổ đĩa vào bo mạch chủ hoặc card Raid (nếu
sử dụng bộ điều khiển dới dạng card rời).
b). Kích hoạt chức năng hỗ trợ Raid và các kÕt nèi trong bo m¹ch
chđ (thêng n»m trong Menu Intergrated Peripherals).
c) Lu các thiết lập rồi khởi động lại máy. Lúc này quá trình khởi
động (boot up) của máy sẽ bao gồm thêm một bớc là đồng bộ
các đĩa cứng trong dÃy Raid, nhấn tổ hợp phím đợc yêu cầu
trên màn hình (tuỳ từng loại bo mạch chủ, thông thờng là Ctrl +
F10 hoặc F4) để vào màn hình cài đặt Raid.
Sau khi đà đăng nhập vào màn hình cài đặt, tuỳ từng bộ
điều khiển Raid có thể khác nhau, song các công việc cần làm
chủ yếu bao gồm:
- Chọn loại Raid sử dụng
- Thêm vào (add) các đĩa cứng vào dÃy đĩa Raid
- Thiết lập block size (stripe size)
- Lu lại các thông số và khởi động lại máy.
Bớc cuối cùng là tiến hành định dạng (format) cho ổ đĩa Raid
và cài hệ điều hành.
4.3. Cách Setup Raid cho máy tính để bàn.

Bc 1: Chun b cỏc cụng c và thiết bị
Để xây dựng RAID 1 bạn cần hai ổ cứng giống hệt nhau về model, thương hiệu,
dung lượng ... và một bộ điều khiển RAID. Hầu hết các máy tính mới hiện nay đều
tích hợp sẵn RAID trên bo mạch chủ, nếu khơng có bạn mua bộ điều khiển RAID
cắm thông qua khe PCI hoặc PCI Express.
Trong bài hướng dẫn này, ta sẽ sử dụng các thành phần như sau :


Ổ cứng : Hai ổ Samsung HD160GB



Cáp : hai cáp SATA



Bộ điều khiển RAID: card Adaptec 1220SA hai cổng SATA RAID PCI

Bước 2 : Gắn tất cả các ổ cứng
Một vài PC không cần bất kỳ công cụ trợ giúp nào cho việc gắn ổ cứng. Bạn chỉ


việc đặt khớp lên gờ và đẩy vào. Nếu máy tính bạn cịn trống thì có thể đặt cách
xa để bảo đảm yêu cầu tản nhiệt.

Bước 3 : Kết nối ổ cứng với cổng SATA
Kết nối ổ cứng với cổng SATA 0 và 1, trừ khi tài liệu đi kèm với bộ điều khiển
RAID yêu cầu bạn gắn ở vị trí khác.Nếu bạn có các thiết bị SATA khác, ví dụ như ổ
đĩa DVD thì bạn cần gán cho chúng cổng SATA có số cao hơn. Sau đó cắm dây
nguồn cho ổ cứng.


Bước 4 : Kiểm ra các thiết lập trong BIOS
Vào màn hình BIOS - thơng thường bằng cách nhấn phím Del, F2 hoặc tùy
loại BIOS của bạn. Sau đó kiểm tra để bảo đảm rằng tất cả các cổng SATA mà bạn
cần sử dụng đều được bật (enabled). Kế tiếp, vơ hiệu hóa (disable) các cổng SATA
khơng sử dụng (Một vài card điều khiển RAID gặp lỗi khi các cổng khơng có ổ
cứng) và bật chức năng RAID. Lưu lại các thiết lập và khởi động lại hệ thống.

Bước 5 : Mở tiện ích cấu hình RAID


Sau khi khởi động, hãy quan sát những thông tin xuất hiện trước khi tải Windows
lên. Tìm một thơng điệp phát ra từ bộ điều khiển RAID của bạn để cho phép truy
cập vào tiện ích cấu hình RAID. Trong trường hợp này, ta nhấn Ctrl-I để mở tiện
ích nhưng bạn có thể phải sử dụng tổ hợp phím khác.

Bước 6 : Gán các ổ cứng vào dãy RAID
Sử dụng tiện tích RAID Configuration Utility để chọn các ổ cứng tham gia gia vào
dãy và chọn cấp độ RAID 1. Thao tác này sẽ xóa tồn bộ dữ liệu trên ổ cứng của
bạn, vì vậy bạn cần sao lưu tồn bộ hệ thống trước khi thực hiện. Sau khi tạo
xong dãy RAID, bạn có thể cài đặt Windows hoặc khơi phục lại gói sao lưu.

Bước 7 : Sử dụng phần mềm RAID để quản lý dãy.
Phần mềm Matrix Storage Console của Intel (đi kèm với card điều khiển
RAID) sẽ cho phép bạn quản lý các ổ cứng trong dãy, kiểm tra tình trạng của
chúng, và thậm chí là thêm một ổ cứng mới vào dãy -- tất cả đều thực hiện trong
Windows. Nếu bạn không thấy hết tất cả các ổ cứng trong cửa sổ này, thì hãy mở
Device Manager (gõ devmgmt.msc vào hộp thoại Run) và từ trình đơn Action,
chọn "Scan for hardware changes". Lưu ý, khi dãy đã hoạt động, thì trong Device
Manager và Disk Manager sẽ chỉ thy mt cng.


4.4. Thử nghiệm thực tế.
Thử nghiệm đợc tiến hành trên 3 máy tính cá nhân (PC) có cấu
hình nh nhau:
- Bo mạch chủ DFI NF4 SLI DR Expert sư dơng chipset
NVIDIA nForce 4 SLI.
- Bé vi xö lý AMD Athlon 64 3700 + San Diegeo @ 2.8 GHz.
- Bé nhí chÝnh 2 x 512 MB Corsair XLPT DDR 400 @ DDR
600 CL 2.5-3-3-7.
- Card đồ hoạ Leadtek 7800GT.
- Bộ nguồn Cooler RealPower 550W.
- Hệ điều hành Microsoft Windows XP Media Center Edition
2005.


×