ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
TRIỆU XUÂN HÒA
CÁC PHƯƠNG PHÁP DỰ PHÒNG
NÂNG CAO ĐỘ TIN CẬY CỦA HỆ THỐNG TÍNH TOÁN
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYÊN - 2014
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
TRIỆU XUÂN HÒA
CÁC PHƯƠNG PHÁP DỰ PHÒNG
NÂNG CAO ĐỘ TIN CẬY CỦA HỆ THỐNG TÍNH TOÁN
Ngành: Khoa học máy tính
Mã số: 60.48.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: TS. NGUYỄN VĂN ĐOÀN
THÁI NGUYÊN - 2014
LỜI CAM ĐOAN
Tôi xin cam đoan những nội dung kiến thức trình bày trong luận văn này
là do tôi tìm hiểu tài liệu, nghiên cứu và trình bày theo cách hiểu của bản thân
dưới sự hướng dẫn trực tiếp của TS.Nguyễn Văn Đoàn. Các nội dung nghiên
cứu và kết quả thực nghiệm trong đề tài này hoàn toàn trung thực.
Trong quá trình làm luận văn, tôi có tham khảo đến một số tài liệu liên
quan của các tác giả, tôi đã ghi rõ nguồn gốc tài liệu tham khảo và được liệt
kê tại phần tài liệu tham khảo ở cuối luận văn.
Nếu sai tôi xin hoàn toàn chịu trách nhiệm.
Thái Nguyên, ngày 28 tháng 8 năm 2014
Người cam đoan
Triệu Xuân Hòa
LỜI CẢM ƠN
Trong quá trình học tập và nghiên cứu tại lớp Cao học khóa 11 chuyên
ngành Khoa học máy tính Trường Đại học Công nghệ thông tin và truyền
thông - Đại học Thái Nguyên, tôi đã nhận được rất nhiều sự chỉ bảo, dìu dắt,
giảng dạy nhiệt tình của các thầy, cô giáo Trường Đại học Công nghệ thông
tin và truyền thông - Đại học Thái Nguyên và Viện công nghệ thông tin Việt
Nam. Các thầy cô giáo đã luôn giúp đỡ, tạo điều kiện tốt nhất cho tôi trong
quá trình công tác cũng như học tập. Nhân dịp này tôi xin bày tỏ lời cảm ơn
chân thành tới tập thể các thầy, cô giáo trong Trường Đại học Công nghệ
thông tin và truyền thông - Đại học Thái Nguyên, các thầy cô giáo trong Viện
công nghệ thông tin Việt Nam.
Tôi xin chân thành cảm ơn sâu sắc tới thầy giáo TS. Nguyễn Văn
Đoàn đã cho tôi nhiều ý kiến đóng góp quý báu, đã tận tình hướng dẫn và
tạođiều kiện cho tôi hoàn thành tốt luận văn tốt nghiệp này.
Tôi xin cảm ơn các đồng nghiệp và người thân đã động viên, giúp đỡ
tôi trong quá trình nghiên cứu và thực hiện luận văn.
Quá trình thực hiện đề tài không tránh khỏi các thiếu sót, rất mong tiếp
tục nhận được sự đóng góp ý kiến của các thầy, các cô giáo, các bạn đồng
nghiệp đối với đề tài nghiên cứu của tôi để đề tài được hoàn thiện hơn.
Tôi xin trân trọng cảm ơn!
Thái Nguyên, ngày 28 tháng 8 năm 2014
Học viên
Triệu Xuân Hòa
MỤC LỤC
MỞ ĐẦU ....................................................................................................... 1
CHƯƠNG 1 KHÁI QUÁT VỀ ĐỘ TIN CẬY HỆ THỐNG VÀ BÀI TOÁN
DỰ PHÒNG ................................................................................................... 4
1.1. Khái quát về độ tin cậy của hệ thống .................................................... 4
1.1.1. Khái niệm về độ tin cậy của hệ thống ............................................. 4
1.1.2. Chỉ số độ tin cậy của hệ thống ........................................................ 5
1.1.3. Vai trò độ tin cậy của hệ thống ..................................................... 16
1.2. Bài toán dự phòng trong hệ thống....................................................... 17
1.2.1. Khái niệm ..................................................................................... 17
1.2.2. Các cách tiếp cận của dự phòng hệ thống ..................................... 17
CHƯƠNG 2 NÂNG CAO ĐỘ TIN CẬY CỦA HỆ THỐNG TÍNH TOÁN . 20
2.1. Các bước tính toán độ tin cậy của hệ thống ........................................ 20
2.1.1. Xây dựng sơ đồ logic theo cấu trúc hệ thống ................................ 20
2.1.2. Thuật toán chuyển đổi sơ đồ cấu trúc logic sang đồ thị liên kết .... 21
2.1.3. Thuật toán tìm tất cả các đường đi trong ma trận liên kết: ............ 23
2.1.4. Thuật toán tìm tất cả đường đi của ma trận liên kết theo lý thuyết đồ thị
............................................................................................................... 26
2.1.5. Tối thiểu hóa các toán tử logic...................................................... 28
2.1.6. Trực giao hóa các toán tử logic..................................................... 29
2.1.7. Chuyển đổi mô hình logic sang giá trị đại số ............................... 31
2.2. Tính độ tin cậy của hệ thống có dự phòng .......................................... 32
2.2.1. Hệ thống dự phòng nóng .............................................................. 32
2.2.2. Hệ thống dự phòng lạnh ............................................................... 33
2.2.3. Hệ thống dự phòng theo cơ chế bỏ phiếu (chập 3) ........................ 37
2.2.4. Hệ thống dự phòng bảo vệ tích cực .............................................. 38
2.3. Đảm bảo độ tin cậy của hệ thống ........................................................ 39
CHƯƠNG 3 THỬ NGHIỆM NÂNG CAO ĐỘ TIN CẬY CỦA HỆ THỐNG
MÁY CHỦ NGÂN HÀNG .......................................................................... 43
3.1. Bài toán .............................................................................................. 43
3.2. Sử dụng các phương pháp dự phòng nâng cao độ tin cậy của hệ thống
và xây dựng công thức tính độ tin cậy ....................................................... 46
3.2.1. Sử dụng các phương pháp dự phòng truyền thống ........................ 46
3.2.2 Sử dụng phương pháp chủ động tích cực (Active Protection – AP) 48
3.2.3 Sử dụng kết hợp các phương pháp dự phòng truyền thống và
phương pháp dự phòng bảo vệ tích cực .................................................. 51
3.3. Xây dựng chương trình thử nghiệm .................................................... 52
3.3.1. Yêu cầu của chương trình thử nghiệm .......................................... 52
3.3.2. Một số hình ảnh của chương trình ................................................ 53
3.4. Nhận xét các phương án dự phòng...................................................... 55
KẾT LUẬN.................................................................................................. 59
DANH MỤC CÔNG TRÌNH KHOA HỌC LIÊN QUAN ĐẾN LUẬN VĂN
..................................................................................................................... 60
TÀI LIỆU THAM KHẢO ............................................................................ 61
DANH MỤC KÝ HIỆU, TỪ VIẾT TẮT
Từ viết tăt
Từ tiếng Anh
Từ hoặc cụm từ
AP
Active Protection
Phương pháp dự phòng
chủ động
MTTF
Mean Time To Failure
Thời gian hoạt động an
toàn trung bình
MTBF
Mean Time Between Failure
Thời gian trung bình giữa
hai lần hỏng
MTTR
Mean Time To Repair
Thời gian trung bình sửa
chữa sự cố
DANH MỤC HÌNH ẢNH
Hình 1.1: Biểu diễn hàm mật độ phân phối xác .............................................. 6
Hình 1.2: Biểu diễn hàm phân phối xác suất................................................... 7
Hình 1.3: Biểu diễn độ tin cậy của phần tử ..................................................... 8
Hình 1.4: Biểu diễn hàm phân phối và độ tin cậy ......................................... 10
Hình 1.5: Biểu diễn cường độ hỏng hóc ....................................................... 10
Hình 1.6: Các khoảng cách làm việc và khoảng cách phục hồi ..................... 12
Hình 1.7: Một kịch bản phát hiện lỗi và sửa lỗi ............................................ 15
Hình 2.1: Sơ đồ của hệ các phần tử nối tiếp.................................................. 20
Hình 2.2: Sơ đồ của hệ các phần tử song song .............................................. 20
Hình 2.3: Hệ thống dự phòng nóng .............................................................. 32
Hình 2.4: Hệ thống dự phòng lạnh................................................................ 33
Hình 2.5: Hệ thống dự phòng chập 3 ............................................................ 37
Hình 2.6: Hệ thống dự phòng tích cực .......................................................... 38
Hình 2.7: Cấu hình hệ thống dạng cây .......................................................... 40
Hình 3.1: Sơ đồ cấu trúc hệ thống ngân hàng ............................................... 44
Hình 3.2: Sơ đồ cấu trúc hệ thống mạng máy tính của ngân hàng................. 44
Hình 3.3: Cấu hình hệ thống......................................................................... 45
Hình 3.4: Cấu hình hệ thống với dự phòng ................................................... 46
Hình 3.5: Cấu hình hệ thống với AP............................................................. 48
Hình 3.6: Cấu hình hệ thống với AP và nhân bản. ........................................ 51
Hình 3.7: Đồ thị xác suất khả năng hoạt động không có sự thất bại của hệ
thống với cấu hình số 1, số 16, số 21, số 23 theo thời gian ........................... 56
Hình 3.8: Cấu hình hệ thống với AP và nhân bản dự phòng 3 ...................... 57
Hình 3.9: Đồ thị xác suất khả năng hoạt động không có sự thất bại của hệ
thống với cấu hình số 1, số 21, số 24, số 25 theo thời gian ........................... 58
1
MỞ ĐẦU
1. Lý do chọn đề tài
Việc đánh giá độ tin cậy của hệ thống dựa trên cấu trúc của hệ thống,
thông qua độ tin cậy của từng thành phần hệ thống là một bài toán phức
tạp, để giải nó cần đến các công cụ như lý thuyết xác suất, lý thuyết đồ thị,
logic. Phương pháp đánh giá độ tin cậy của hệ thống dựa trên cơ sở lý
thuyết xác suất và quá trình ngẫu nhiên đã được áp dụng và đạt được những
kết quả khả quan.
Dự báo được độ tin cậy của hệ thống có thể sẽ có hiệu quả cao, liên
quan đến quá trình sản xuất và lập trình dự toán như thế nào, chi phí bảo
trì, các chi phí tối thiểu cấu hình hệ thống, hoặc cách khác, tổng số lợi
nhuận dự kiến sẽ được tối đa nếu độ tin cậy hệ thống được chọn theo một
công thức dựa trên tính toán tuổi thọ của thiết bị, dịch vụ đời sống thực tế
của thiết bị cho đến khi nó không hoạt động tốt. Để nâng cao độ tin cậy của
các yếu tố thành phần, người ta đã sử dụng một kỹ thuật là bổ sung các thành
phần dư thừa, hay còn gọi là hệ thống có dự phòng. Việc sử dụng các thành
phần dự phòng không còn là những hướng nghiên cứu mới, tuy nhiên việc đề
xuất sử dụng chúng trong các hệ thống có cấu trúc khác nhau, như hệ phân
tán, tính toán song song … hiện nay vẫn còn được nhiều nghiên cứu tập trung
phát triển.
Với mục tiêu tìm hiểu về việc nâng cao độ tin cậy của hệ thống, đặc biệt
là việc sử dụng các phương pháp dự phòng, tôi đã lựa chọn đề tài “Các
phương pháp dự phòng nâng cao độ tin cậy của hệ thống tính toán” làm
đề tài cho luận văn tốt nghiệp
2
2. Mục đích nghiên cứu
Mục đích nghiên cứu của đề tài là đưa ra cácphương pháp dự phòng để
nâng cao độ tin cậy của hệ thống tính toán qua cấu trúc hệ thống tính toán.
Nhằm tránh được các sự cố lỗi có thể xảy ra đối với hệ thống.
3. Nhiệm vụ nghiên cứu
Xuất phát từ mục đích trên, nhiệm vụ của đề tài đặt ra như sau:
- Tìm hiểu các khái niệm liên quan đến độ tin cậy của hệ thống, phương
pháp tính độ tin cậycủa hệ thống tính toán.
- Các phương pháp dự phòng nâng cao độ tin cậy của hệ thống tính toán;
- Ứng dụng các phương pháp dự phòng để nâng cao độ tin cậy của hệ
thống vào ví dụ hệ thống phân tán cụ thể (dạng tree).
4. Phương pháp nghiên cứu
Sử dụng phối hợp các phương pháp:
- Phương pháp phân tích, tổng hợp lý luận: Nghiên cứu, tìm hiểu, phân
tích các tài liệu có liên quan đến độ tin cậy của hệ thống cũng như các phương
pháp tính, đánh giá độ tin cậy của hệ thống.
- Phương pháp sử dụng toán học: Sử dụng phương pháp xác suất thống
kê, xử lý các kết quảvà xây dựng đồ thị trực quan.
5. Cấu trúc luận văn
Ngoài phần mở đầu và kết luận, luận văn gồm có3 chương:
Chương 1: KHÁI QUÁT VỀ ĐỘ TIN CẬY HỆ THỐNG VÀ BÀI
TOÁN DỰ PHÒNG
1.1.
Khái niệm về độ tin cậy của hệ thống
1.2.
Bài toán dự phòng
3
Chương 2: NÂNG CAO ĐỘ TIN CẬY CỦA HỆ THỐNG TÍNH TOÁN
2.1. Các bước tính toán độ tin cậy của hệ thống
2.2. Tính độ tin cậy của hệ thống có dự phòng
2.3. Đảm bảo độ tin cậy của hệ thống
Chương 3:THỬ NGHIỆM NÂNG CAO ĐỘ TIN CẬY CỦA HỆ
THỐNG MÁY CHỦ NGÂN HÀNG
3.1. Bài toán
3.2. Sử dụng các phương pháp dự phòng nâng cao độ tin cậy của hệ
thống và xây dựng công thức tính độ tin cậy.
3.3. Xây dựng chương trình thử nghiệm
3.4. Nhận xét các phương án dự phòng
Phần kết luận: Tóm tắt các kết quả đạt được.
4
CHƯƠNG 1 KHÁI QUÁT VỀ ĐỘ TIN CẬY HỆ THỐNG VÀ BÀI
TOÁN DỰ PHÒNG
1.1.Khái quát về độ tin cậy của hệ thống
1.1.1.Khái niệm về độ tin cậy của hệ thống
a.Khái niệm hệ thống, phần tử
“Hệ thống là một tập hợp gồm nhiều phần tử tương tác, có các mối
quan hệ ràng buộc lẫn nhau và cùng hoạt động hướng tới một mục tiêu
chung thông qua chấp thuận các đầu vào, biến đổi có tổ chức để tạo kết
quả đầu ra”.
Hay “Hệ thống là một tập hợp gồm nhiều phần tử có các mối quan hệ
ràng buộc tương tác lẫn nhau để thực hiện một mục đích chung”[3].
Phần tử là một bộ phận tạo thành hệ thống mà trong quá trình nghiên
cứu độ tin cậy nhất định nó được xem như là một tổng thể không chia cắt
được (ví dụ như: linh kiện, thiết bị… ) mà độ tin cậy đã cho trước, hoặc xác
định dựa trên những số liệu thống kê.
b.Khái niệm độ tin cậy
Độ tin cậy P(t) của phần tử hoặc của hệ thống là xác suất để trong suốt
khoảng thời gian khảo sát t phần tử đó hoặc hệ thống đó vận hành an toàn.[4]
P(t) được định nghĩa như biểu thức sau:
P(t) = P{t ≥ t}
Trong đó: t là thời gian liên tục vận hành an toàn của phần tử.
Biểu thức trên chỉ ra rằng phần tử muốn vận hành an toàn trong khoảng
thời gian t thì giá trị của t phải bé hơn giá trị quy định t.
Đồng thời biểu thức trên cũng chỉ rằng phần tử chỉ vận hành an toàn với
một xác suất nào đó (0 ≤ P ≤ 1) trong suốt khoảng thời gian t. Khi bắt đầu vận
hành nghĩa là ở thời điểm t = 0, phần tử bao giờ cũng hoạt động tốt nên P(0)=
1. Ngược lại thời gian càng kéo dài, khả năng vận hành an toàn của phần tử
5
càng giảm đi và tới khi t∞ thì theo quy luật phát triển của vật chất trong tác
động tàn phá của thời gian, nhất định phần tử phải hỏng dó đó P(∞) = 0.
Theo định nghĩa về độ tin cậy đã nói ở trên thì độ tin cậy của hệ thống còn
được gọi theo cách khác là xác suất an toàn.
P(t) = P{t ≥ t}
(1.1)
Theo định nghĩa xác suất [2]thì xác suất không an toàn Q(t) hay còn gọi là
xác suất hỏng của hệ thống sẽ là:
Q(t) = 1-P(t)
(1.2)
1.1.2.Chỉ số độ tin cậy của hệ thống
Các hệ thống, thiết bị kỹ thuật (các phần tử) tồn tại trong thực tiễn thường
tồn tại dưới 2 dạng là phục hồi được và không phục hồi được. Và để dễ xác
định độ tin cậy của các phần tử ta cũng sẽ phân chia các phần tử thành 2 dạng
như trên.
1.1.2.1.Phần tử không phục hồi
Phần tử không phục hồi là phần tử khi được đưa vào sử dụng, nếu bị hư
hỏng thì sẽ loại bỏ ngay mà không tiến hành sửa chữa do không thể hoặc việc
sửa chữa không mang lại hiệu quả, ví dụ như: linh kiện điện trở, tụ điện, IC
… ta chỉ quan tâm đến sự kiện xảy ra sự cố đầu tiên.
Những thông số cơ bản của phần tử không phục hồi gồm có:
a) Thời gian vận hành an toàn t
Giả thiết ở thời điểm t = 0 phần tử bắt đầu hoạt động và đến thời điểm t =
t thì phần tử bị sự cố. Khoảng thời gian t được gọi là thời gian liên tục vận
hành an toàn của phần tử. Vì sự cố không xảy ra tất định nên t là một đại
lượng ngẫu nhiên có các giá trị trong khoảng 0 ≤ t ≤ ∞.
Giả thiết trong khoảng thời gian khảo sát t thì phần tử xảy ra sự cố với
xác suất Q(t). Khi đó:
Q(t) = P{t< t}
6
Vì t là đại lượng ngẫu nhiên liên tục nên:
-
Q(t) được gọi là hàm phân phối của biến ngẫu nhiên liên tục t.
-
q(t) là hàm mật độ phân phối xác suất của t.
q(t)
dQ(t)
0
t
Hình 1.1: Biểu diễn hàm mật độ phân phối xác
suất
Trên hình 1.1, biểu diễn hàm mật độ phân phối xác suất của thời gian
trung bình vận hành an toàn. Theo tính chất của hàm mật độ phân phối xác
suất của biến ngẫu nhiên liên tục, ta có:
q(t)=Q’(t) {Đạo hàm bậc 1của hàm phân phối xác suất }, do đó:
( )=
( )
(1.3)
Trong đó thỏa mãn tính chất:
∞
( ).
=1
Vậy hàm mật độ phân phối xác suất của t là:
( ) = lim
→
1
( < τ ≤ t + t)(1.4)
Có q(t). t là xác suất để thời gian hoạt động t nằm trong khoảng (t t+ t)
với t đủ nhỏ.
7
b) Độ tin cậy của phần tử P(t)
Ta có hàm Q(t) mô tả xác suất sự cố của phần tử, vậy hàm mô tả độ tin
cậy của phần tử được ký hiệu là P(t) và sẽ được tính theo định nghĩa hàm xác
suất:
P(t) = 1 – Q(t) = P{ t ≥ t}
(1.5)
Như vậy P(t) là xác suất để phần tử vận hành an toàn trong khoảng thời
gian t vì ở đây ta đã giả thiết có t ≥ t.
Từ biểu thức (1.3) ta có:
( )=
( ).
(1.6)
Từ biểu thức (1.5) và (1.6) ta có
∞
( )=
( ).
(1.7)
Q(t)
1
P(t0)
Q(t0)
0
t
Hình 1.2: Biểu diễn hàm phân phối xác suất
8
P(t)
1
0
t
Hình 1.3: Biểu diễn độ tin cậy của phần
Từ hai đồ thị trên ta thấy rằng Q(∞) = 1 và P(∞) = 0 chứng tỏ độ tin cậy
của phần tử giảm dần theo thời gian.
c) Cường độ hỏng hóc l(t)
Cường độ hỏng hóc [3] (hay cường độ trở ngại) là một trong những khái
niệm quan trọng khi nghiên cứu độ tin cậy, l(t) là một hàm theo thời gian.
Với t đủ nhỏ thì l(t). t chính là xác suất để phần tử đã hoạt động tốt đến
thời điểm t sẽ hỏng hóc trong khoảng thời gian t tiếp theo. Hay đó chính là
số lần hỏng hóc trên một đơn vị thời gian trong khoảng thời gian t.
( ) = lim
Δ →
( <
< +
1
( <
< +
| > )
(1.8)
| > )là xác suất có điều kiện, là xác suất để phần tử hỏng
hóc trong khoảng thời gian từ t đến ( +
)(sự kiện A) nếu phần tử đó hoạt
động tốt đến thời điểm t (sự kiện B).
Theo lý thuyết xác suất, xác suất nhân giữa hai sự kiện A và B là:
P(AB) = P(A).P(B|A) = P(B).P(A|B)
Hay:
( | )=
( )
( )
9
Nếu
⊂
khi
→ 0 thì ta có: P(AB) = P(A)
(A kéo theo B: Nếu A xảy ra thì B xảy ra) theo giả thiết ban đầu
Và
( <
( <
| > )=
< +
< +
( > )
)
< +
( > )
)
(1.9)
Từ (1.8) và (1.9) suy ra:
1
( ) = lim
Δ →
( ) = lim
Δ →
( )=
1
( <
.
. ( <
).
< +
1
( > )
( )
( )
=
( ) 1
( )
(1.10)
Công thức (1.10) cho ta quan hệ giữa bốn đại lượng: cường độ hỏng hóc, hàm
mật độ xác suất, hàm phân bố xác suất và độ tin cậy của phần tử.
Vậy độ tin cậy của phần tử được tính như sau:
Từ (1.3) và (1.5) ta có:
′(
( )=
′
)= 1
′(
( ) =
( )
)=
(do đạo hàm của 1 bằng 0)
Thay vào (1.10) ta có:
( )=
( )
=
( )
( )
( )
=
( )
<=>
( )
( )| =
=
( )
( )
( )
(0) =
( )
Do P(0) = 1
( )=
∫
( ).
(1.11)
Công thức (1.11) cho phép tính được độ tin cậy của phần tử không
phục hồi khi đã biết cường độ hỏng hóc l(t), mà cường độ hỏng hóc l(t) này
10
xác định được nhờ phương pháp thống kê quá trình hỏng hóc của phần tử
trong quá khứ.
Trong các hệ thống hiện giờ thường sử dụng điều kiện l(t) = l = hằng
số (λ tương đối nhỏ), thực hiện được nhờ bảo quản định kỳ. Khi đó cường độ
hỏng hóc là giá trị trung bình số lần sự cố xảy ra trong một đơn vị thời gian.
Khi đó: ( ) =
l
; ( )=1
l
l
; ( )= l
Biểu diễn mối quan hệ giữa các thông số trên như hình 1.4 sau:
Q(t)
P(t)
1
Q(t)
P(t)
0
t
Hình 1.4: Biểu diễn hàm phân phối và độ tin cậy
l (t)
1
0
2
3
t
Hình 1.5: Biểu diễn cường độ hỏng hóc
11
Theo nhiều số liệu thống kê quan hệ của cường độ hỏng hóc l(t) theo
thời gian thường có dạng như hình 1.5. Đường cong của cường độ hỏng hóc
l(t) được chia làm ba miền:
Miền 1: Mô tả thời kỳ “chạy thử”, những hỏng hóc ở giai đoạn này
thường do lắp ráp, vận chuyển. Tuy giá trị ở giai đoạn này cao nhưng thời
gian kéo dài ít, giảm dần và nhờ chế tạo, nghiệm thu có chất lượng nên giá trị
cường độ hỏng hóc l(t) ở giai đoạn này có thể giảm nhiều.
Miền 2: Mô tả giai đoạn sử dụng bình thường, cũng là giai đoạn chủ
yếu của tuổi thọ các phần tử. Ở giai đoạn này, các sự cố thường xảy ra ngẫu
nhiên, đột ngột do nhiều nguyên nhân khác nhau, vì vậy thường giả thiết
cường độ hỏng hóc l(t) bằng hằng số.
Miền 3: Mô tả giai đoạn già cỗi của phần tử theo thời gian, cường độ
hỏng hóc l(t) tăng dần, đó là điều tất yếu xảy ra sự cố khi t ∞.
d) Thời gian hoạt động an toàn trung bình THD
Thời gian hoạt động an toàn trung bình THD hay còn được gọi là thời gian
trung bình đến lúc hư hỏng (MTTF: Mean Time To Failure) là thời gian mà
phần tử đảm bảo hoạt động tốt.
Thời gian hoạt động được định nghĩa là giá trị trung bình của thời gian
vận hành an toàn t dựa trên số liệu thống kê t của nhiều phần tử cùng loại,
nghĩa là THD là kỳ vọng toán hay còn gọi là giá trị trung bình của biến ngẫu
nhiên t [9] và được xác định:
∞
=
=
(1.12)
t. q(t). dt
Từ (1.3) và (1.5) ta có:
∞
=
=
∞
∞
tQ (t)dt =
t 1
P(t) dt =
t. P (t). dt
12
=
Sử dụng phương pháp tính tích phân từng phần: ∫
|
∫
Đặt u=t; dv=P’(t)dt ta có:
∞
∞
THD =Eτ= -t.P(t)| +
0
∞
P(t).dt =
0
P(t).dt
0
Do – t. ( )| ∞ = 0
l
Vậy với l(t) = hằng số, thì ( ) =
(phân bố hàm mũ)
∞
=
l
=
1
.
l
. dt =
=>
=
l
∞
1
=
0
l
1
(1.13)
l
Trong đó: Người ta thường chọn [l] = 1/giờ và [THD] = giờ
l
( )=
=
1.1.2.2.Phần tử phục hồi
Phần tử phục hồi [6] là phần tử khi đưa vào sử dụng đến khi xảy ra sự cố
có thể được đem đi sửa chữa phục hồi. Trong quá trình vận hành phần tử chỉ
nhận một trong hai trạng thái: Trạng thái hoạt động an toàn và trạng thái sửa
chữa định kỳ hoặc sửa chữa sự cố.
Những thông số cơ bản của phần tử phục hồi gồm có:
a) Thông số dòng hỏng hóc
Thời điểm xảy ra sự cố và thời gian sửa chữa sự cố tương ứng là những
đại lượng ngẫu nhiên, có thể mô tả trên trục thời gian như hình 1.6 dưới
đây.
t1
T1
t2
T2
t3
T3
t4
Hình 1.6: Các khoảng cách làm việc và khoảng cách phục hồi
13
Trong đó:
- T1, T2, T3 … biểu thị các khoảng thời gian hoạt động an toàn của các
phần tử giữa các lần sự cố xảy ra.
- t1, t2, t3 … là thời gian sửa chữa sự cố tương ứng.
Định nghĩa thông số dòng hỏng hóc (là cường độ hỏng hóc đối với các phần
tử không phục hồi):
( ) = lim
1
Δ →
( <
< +
)
(1.14)
Có ( <
< +
) là xác suất để hỏng hóc xảy ra trong khoảng thời gian t
đến ( +
). So với l(t), trong trường hợp này sẽ không đòi hỏi điều kiện
phần tử hoạt động tốt từ đầu đến thời điểm t mà chỉ cần đến thời điểm t phần
tử vẫn hoạt động (điều kiện này luôn luôn đúng vì phần tử là phục hồi).
(t). t là xác suất để hỏng hóc xảy ra trong khoảng thời gian t đến ( +
)
với t đủ nhỏ. Giả thiết xác suất của thời gian hoạt động an toàn THD của phần
tử có phân bố mũ, với cường độ hỏng hóc l = hằng số, khi đó khoảng thời
gian giữa hai lần sự cố liên tiếp là T1, T2 … cũng có phân bố mũ và thông số
dòng hỏng hóc là tối giản. Vậy thông số dòng hỏng hóc là: (t) = l = hằng số.
Vì vậy thông số dòng hỏng hóc và cường độ hỏng hóc thường hiểu là một,
trừ các trường hợp riêng khi thời gian hoạt động không tuân theo phân bố mũ
thì phải phân biệt.
Đối với các phần tử phục hồi thuật ngữ MTBF (Mean Time Between
Failure) được dùng thay thế cho MTTF (Mean Time To Failure).
a. Thời gian trung bình sửa chữa sự cốts
ts là kỳ vọng toán của t1, t2, t3 … là thời gian trung bình sửa chữa sự cố MTTR (Mean Time To Repair).
t =
=
t +t +
n
+t
(1.15)
14
Để đơn giản ta cũng xét xác suất của ts cũng tuân theo luật phân bố mũ.
l
Khi đó tương tự đối với xác suất hoạt động an toàn ( ) =
của phần tử,
ta có thể biểu thị xác suất ở trong khoảng thời gian t phần tử đang ở trạng thái
hỏng hóc – nghĩa là chưa sửa xong.
Xác suất phần tử ở trạng thái hỏng có giá trị là:
( )=
μ
(1.16)
Trong đó = 1/ts là cường độ phục hồi hỏng hóc, (1/giờ).
Xác suất để sửa chữa kết thúc trong khoảng thời gian t, cũng chính là hàm
phân bố xác suất của thời gian ts là:
( )=1
μ
(1.17)
Và hàm mật độ phân bố xác suất là:
′(
( )=
)=
( )
=
μ
(1.18)
Vậy thời gian trung bình sửa chữa sự cố là:
∞
t =
=
( ).
=
1
(1.19)
Phần tử có tính sửa chữa cao khi ts càng nhỏ ( càng lớn) nghĩa là chỉ
sau một khoảng thời gian ngắn phần tử đã có khả năng hoạt động lại.
T là kỳ vọng toán của T1, T2, T3, ..., Tn. Vì thời gian trung bình giữa hai
hư hỏng liên tiếp có một lần sửa chữa ngay nên:
MTBF = MTTR + MTTF T = ts + THD
Với giả thiết T tuân theo luật phân bố mũ, giống như ở trên đã xét ta
có:
1
(1.20)
l
Dựa vào sơ đồ ở hình 1.7 ta có thể thấy được mối quan hệ giữa thời
= (T) =
gian trung bình để bị lỗi, phát hiện lỗi và sửa lỗi:
15
Hình 1.7: Một kịch bản phát hiện lỗi và sửa lỗi
b) Khả năng sẵn sàng hoạt động A (Availability)
Hệ số sẵn sàng A là phần lượng thời gian hoạt động trên toàn bộ thời gian
khảo sát của phần tử:
=
(
)
+
=
+t
=
+
(1.21)
c) Hàm tin cậy của phần tử R(t)
Độ tin cậy là xác suất mà thiết bị đảm bảo hoạt động không hư hỏng trong
thời gian t. Vậy R(t) là xác suất của giao hai sự kiện:
- Làm việc tốt tại t = 0
- Tin cậy trong khoảng 0 đến t
Giả thiết hai sự kiện này độc lập với nhau, ta có:
R(t) = A.P(t)
(1.22)
Theo luật phân bố mũ:
( )= .
Trong đó:
=
l
là hệ số sẵn sàng.
(1.23)
16
1.1.3. Vai trò độ tin cậy của hệ thống
Cuộc cách mạng khoa học kỹ thuật trong lĩnh vực công nghệ đã mở ra
một kỷ nguyên mới và bắt đầu tạo ra các hệ thống tính toán thay thế hoặc hỗ
trợ con người trong kỷ nguyên công nghệ. Nó tạo ra các hệ thống siêu phức
tạp trong các lĩnh vực về khoa học máy tính, giao thông vận tải, năng lượng
và các ngành khác của nền kinh tế. Hệ thống không đơn thuần chỉ là một hệ
thống đơn giản mà là hệ thống được đặc trưng bởi một số lượng lớn các yếu
tố thành phần, có cấu trúc phức tạp với các chương trình tính toán, điều khiển
các hoạt động của nó. Đây chính là những hệ thốngcó tính ứng dụng cao,
tham gia vào trong tất cả các lĩnh vực của đời sống, là toàn bộ cơ sở hạ tầng
của xã hội hiện đại. Tuy nhiên, cũng chính vì các hệ thống này tham gia tất cả
các lĩnh vực trong xã hội nên nền sản xuất xã hội luôn phải đối mặt với nguy
cơ các thiết bị không sẵn sàng để hoạt động một cách chính xác, cùng với việc
thao tác sai và những sai lầm không đáng có trong quá trình thiết kế chế tạo
thiết bị,... đã làm cho cấu trúc hệ thống bị phá vỡ, các chức năng của hệ thống
hoạt động không chính xác. [4]
Từ những nguy cơ đối mặt với các hệ thống không hoạt động, thiết bị
cho kết quả không chính xác,… chúng ta thấy được nguy cơ tiềm tàng xảy ra
đối với mỗi hệ thống. Từ vấn đề trên chúng ta càng hiểu rõ hơn tầm quan
trọng của các vấn đề liên quan đến độ tin cậy, khả năng sống sót của hệ
thống,..
Giải quyết vấn đề này sẽ cho phép giảm tổn thất do hệ thống ngừng
hoạt động, giảm chi phí thay thế, chi phí cho việc duy trì hoạt động, chi phí
sửa chữa. Các hệ thống có độ tin cậy thấp sẽ gây ra mất an toàn trong lao
động đôi khi còn nguy hiểm đến tính mạng con người, đưa đến những hậu quả
không lường hết được về mặt kinh tế. Định lượng độ tin cậy của phần tử hoặc
của cả hệ thống được đánh giá bằng cách phân tích, tính toán các chỉ số của
độ tin cậy, dựa trên hai yếu tố cơ bản là: Tính làm việc an toàn và tính sửa
chữa được.
17
Khi biết được độ tin cậy của hệ thống có thể giúp chúng ta có được kế
hoạch bảo trì, lên kế hoạch dự phòng, nâng cao độ tin cậy, tránh được các sự
cố lỗi có thể gây ra.
Vì vậy, việc cần phát triển nhanh chóng các phương pháp để đảm bảo
nâng cao độ tin cậy của các hệ thống ở tất cả các giai đoạn thiết kế, thử
nghiệm, sản xuất và hoạt động là điều hết sức quan trọng và cần thiết.
1.2. Bài toán dự phòng trong hệ thống
1.2.1. Khái niệm
Dự phòng trong hệ thống hay là nâng cao độ tin cậy hệ thống bằng cách
đưa ra các đối tượng dư thừa là nguồn lực bổ sung để các đối tượng có thể
thực hiện chức năng, nhiệm vụ của mình.
Mục đích dự phòng tronghệ thống - để đảm bảo hệ thống hoạt động
bình thường sau khi xuất hiện của các lỗi trong các thành phần của nó.
1.2.2. Các cách tiếp cận của dự phòng hệ thống
Các thành phần của hệ thống phức tạp thường cho độ tin cậy thấp nên
đòi hỏi chúng ta phải có phương pháp phát triển đặc biệt như thế nào để đảm
bảo tăng cường và duy trì độ tin cậy của những hệ thống phức tạp.Để nâng
cao được độ tin cậy của các hệ thống như thế thì phải bao gồm cả sự phát
triển của phương pháp toán học, tính toán ưu tiên và đánh giá thử nghiệm.
Phương pháp tính toán về độ tin cậy của hệ thống dựa trên cơ sở lý thuyết xác
suất và quá trình ngẫu nhiên đã được áp dụng và đã đạt được những kết quả
khả quan. Từ những thông số về độ tin cậy của hệ thống thì chúng ta sẽ lập
nên các phương pháp dự phòng để nâng cao độ tin cậy của hệ thống.
Độ tin cậy và khả năng hoạt động an toàn của hệ thống là phụ thuộc vào
phần lớn vào cấu trúc hệ thống và độ tin cậy của các thành phần cấu thành hệ
thống. Các phương pháp nâng cao độ tin cậy của hệ thốngdựa trên cấu trúc của
hệ thống thông qua độ tin cậy của từng thành phần hệ thống là một bài toán
phức tạp mà để giải quyết bài toán đó thì cần đến các công cụ như lý thuyết xác