Tải bản đầy đủ (.pdf) (139 trang)

(Luận án tiến sĩ) Nghiên cứu nâng cao độ tương phản ánh theo tiếp cận Đại số gia tử

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.14 MB, 139 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

NGUYỄN VĂN QUYỀN

NGHIÊN CỨU NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH
THEO TIẾP CẬN ĐẠI SỐ GIA TỬ

LUẬN ÁN TIẾN SĨ TOÁN HỌC

Hà Nội – 2018


BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA VÀ CÔNG NGHỆ

NGUYỄN VĂN QUYỀN

NGHIÊN CỨU NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH
THEO TIẾP CẬN ĐẠI SỐ GIA TỬ

Chuyên ngành: Cơ sở Toán học cho Tin học
Mã số



: 9 46 01 10

LUẬN ÁN TIẾN SĨ TOÁN HỌC
NGƢỜI HƢỚNG DẪN KHOA HỌC:
1. TS. TRẦN THÁI SƠN
2. PGS.TS. NGUYỄN TÂN ÂN

Hà Nội – 2018


i

LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả.
Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, không
sao chép từ bất kỳ một nguồn nào và dƣới bất kỳ hình thức nào. Việc tham
khảo các nguồn tài liệu đã đƣợc thực hiện trích dẫn và ghi nguồn tài liệu tham
khảo đúng quy định.

Tác giả luận án

Nguyễn Văn Quyền


ii

LỜI CẢM ƠN
Luận án đƣợc hoàn thành dƣới sự hƣớng dẫn tận tình của TS. Trần Thái
Sơn và PGS.TS. Nguyễn Tân Ân. Lời đầu tiên, xin bày tỏ lòng kính trọng và

biết ơn sâu sắc tới hai Thầy.
Tôi xin chân thành cảm ơn PGS.TSKH. Nguyễn Cát Hồ, TS. Ngô
Hoàng Huy đã đóng góp những ý kiến quý báu cả về học thuật và kinh
nghiệm nghiên cứu giúp đỡ tôi trong suốt quá trình thực hiện luận án.
Tôi xin chân thành cảm ơn Ban lãnh đạo Học viện Khoa học và Công
nghệ, Bộ phận quản lý nghiên cứu sinh - Học viện Khoa học và Công nghệ đã
tạo mọi điều kiện thuận lợi trong quá trình hoàn thành và bảo vệ luận án.
Xin cảm ơn các đồng nghiệp tại Phòng Nhận dạng và Công nghệ tri
thức, Viện Công nghệ Thông tin đã đóng góp những ý kiến thiết thực để tôi
hiệu chỉnh lại các tiếp cận nghiên cứu của mình.
Xin cảm ơn Ban Giám hiệu Trƣờng Đại học Hải Phòng, các đồng
nghiệp tại Phòng Quản lý sau đại học – Trƣờng Đại học Hải Phòng đã luôn
động viên giúp đỡ tôi trong công tác để tôi có thời gian tập trung nghiên cứu
và thực hiện luận án.
Đặc biệt tôi xin bày tỏ lòng biết ơn sâu sắc tới Cha, Mẹ, Vợ và các anh,
chị em trong gia đình, những ngƣời luôn dành cho những tình cảm nồng ấm
và sẻ chia những lúc khó khăn trong cuộc sống, luôn động viên giúp đỡ tôi
trong quá trình nghiên cứu. Luận án cũng là món quà tinh thần mà tôi trân
trọng gửi tặng đến các thành viên trong Gia đình.
Tôi xin trân trọng cảm ơn!


iii

MỤC LỤC
LỜI CAM ĐOAN .............................................................................................. I
LỜI CẢM ƠN ...................................................................................................II
MỤC LỤC ....................................................................................................... III
DANH MỤC CÁC TỪ VIẾT TẮT VÀ KÝ HIỆU ........................................ VI
DANH MỤC CÁC BẢNG.............................................................................. IX

DANH MỤC HÌNH VẼ ................................................................................... X
MỞ ĐẦU ........................................................................................................... 1
1. Tính cấp thiết của đề tài ................................................................................ 1
2. Mục tiêu, phạm vi nghiên cứu của luận án ................................................. 10
3. Phƣơng pháp và nội dung nghiên cứu ......................................................... 10
4. Cấu trúc luận án .......................................................................................... 11
5. Kết quả đạt đƣợc của luận án ...................................................................... 12
CHƢƠNG 1. TỔNG QUAN VỀ NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH VÀ
TIẾP CẬN ĐẠI SỐ GIA TỬ GIẢI HỆ LUẬT MỜ ....................................... 13
1.1. Đại số gia tử: một số vấn đề cơ bản ......................................................... 13
1.1.1. Các khái niệm cơ bản về đại số gia tử .................................................. 13
1.1.2. Vấn đề định lƣợng ngữ nghĩa trong đại số gia tử ................................. 15
1.1.3. Phƣơng pháp lập luận xấp xỉ dựa trên ĐSGT ....................................... 23
1.2. Khả năng xấp xỉ hàm của phƣơng pháp HA-IRMd và ứng dụng ............ 24
1.2.1. Khả năng xấp xỉ hàm............................................................................. 24
1.2.2. Ứng dụng việc xấp xỉ hàm trong xây dựng luật .................................... 26
1.2.3. Phƣơng pháp lập luận tối ƣu dựa trên ĐSGT ....................................... 27
1.2.4. Hệ tham số của phƣơng pháp nội suy gia tử ......................................... 28
1.3. Tổng quan về nâng cao độ tƣơng phản ảnh ............................................. 30
1.3.1. Tăng cƣờng độ tƣơng phản ảnh dựa trên logic mờ ............................... 30
1.3.2. Một số thuật toán tăng cƣờng theo tiếp cận mờ .................................... 30


iv

1.4. Một số thuật toán nâng độ sáng tối của điểm ảnh .................................... 35
1.4.1. Toán tử tăng cƣờng ............................................................................... 35
1.4.2. Tăng cƣờng với toán tử Hyperbol ......................................................... 36
1.4.3. Tăng cƣờng dựa trên suy diễn hệ luật mờ (Fuzzy rule) ........................ 37
1.4.4. Một số độ đo chất lƣợng tăng cƣờng ảnh.............................................. 38

1.5. Thuật toán nâng cao độ tƣơng phản ảnh của Cheng ................................ 38
1.6. Các chỉ số đánh giá .................................................................................. 41
1.7. Tập dữ liệu thực nghiệm .......................................................................... 43
CHƢƠNG 2. BIẾN ĐỔI ẢNH ĐA KÊNH VÀ XÂY DỰNG HÀM BIẾN
ĐỔI CHỮ S THEO TIẾP CẬN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG
CAO ĐỘ TƢƠNG PHẢN ẢNH ĐA KÊNH .................................................. 44
2.1. Biến đổi ảnh đa kênh ................................................................................ 45
2.1.1. Ƣớc lƣợng nhiều dải động mức xám dựa vào phân cụm mờ FCM ...... 45
2.1.2. Lƣợc đồ xám mờ với phân cụm FCM ................................................... 46
2.1.3. Ƣớc lƣợng nhiều dải động mức xám dựa vào lƣợc đồ xám mờ ........... 48
2.1.4. Biến đổi kênh ảnh.................................................................................. 50
2.1.5. Nâng cao độ tƣơng phản ảnh kết hợp với biến đổi ảnh ........................ 51
2.1.6. Thử nghiệm phép biến đổi mờ hóa ảnh sử dụng thuật toán 2.2............ 53
2.2. Thiết kế hàm biến đổi độ xám dạng chữ S với tiếp cận mờ .................... 57
2.2.1. Đánh giá việc xây dựng hàm biến đổi mức xám dạng chữ S ............... 58
2.2.2. Xây dựng toán tử tăng cƣờng dựa trên đại số gia tử ............................. 61
2.2.3. Thực nghiệm ......................................................................................... 67
2.2.4. So sánh với kết quả của các phƣơng pháp gián tiếp ............................. 70
2.3. Kết quả khác ............................................................................................. 75
CHƢƠNG 3. XÂY DỰNG ĐỘ ĐO THUẦN NHẤT MỚI THEO TIẾP CẬN
ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH
ĐA KÊNH ....................................................................................................... 78
3.1. Xây dựng độ đo thuần nhất ...................................................................... 78


v

3.1.1. Độ thuần nhất của Cheng ...................................................................... 78
3.1.2. Độ đo thuần nhất với toán tử t-norm..................................................... 80
3.1.3. Xây dựng độ đo thuần nhất với tiếp cận ĐSGT .................................... 82

3.2. Nâng cao độ tƣơng phản ảnh mầu với độ đo thuần nhất đề xuất ............. 89
3.3. Thực nghiệm ............................................................................................ 93
3.3.1. Tính độ thuần nhất kênh ảnh ................................................................. 93
3.3.2. Đánh giá độ đo HA-HRM ..................................................................... 94
3.4. Các kết quả và luận giải ........................................................................... 94
KẾT LUẬN ................................................................................................... 101
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ .............................................. 102
TÀI LIỆU THAM KHẢO ............................................................................. 103
PHỤ LỤC ...................................................................................................... 112


vi

DANH MỤC CÁC TỪ VIẾT TẮT VÀ KÝ HIỆU
Từ viết tắt
ĐLNN
ĐSGT
ĐTP
NCĐTP
LLXX
ACO

Tên đầy đủ (và tạm dịch)
Định lƣợng ngữ nghĩa
ĐSGT
Độ tƣơng phản
Nâng cao độ tƣơng phản
Lập luận xấp xỉ
Ant Colony Optimization
Tối ƣu đàn kiến


AS
hoặc Ant Colony System
(Hệ kiến)
ACS
AIVHE
Adaptively Increasing the Value of lƣợc đồ xám
(Tăng giá trị lƣợc đồ xám thích ứng)

FAM

Fuzzy Associative Memory
(Bộ nhớ kết hợp mờ)

FCM

Fuzzy C-mean
(Thuật toán phân cụm mờ C-mean)

FMCR

Fuzzy multiple conditional reasoning
(Hệ mờ đa điều kiện)

HA

Hedge algebra
(Đại số gia tử)

HA-IRMd


Hedge Algebras-based Interpolative Reasoning Method
(Phƣơng pháp lập luận nội suy dựa trên đại số gia tử)

HA-HRM
HE

Hedge Algebras – Homogeneity Measure
Histogram equalization
(Cân bằng lƣợc đồ xám)

HIS
HSV
NINT
RGB
SAM

Hệ biểu diễn mầu HIS
Hệ biểu diễn mầu HSV (Hue, Saturation, Value)
New Intensifycation
Hệ biểu diễn mầu RGB (Red, Green, Blue)
Semantic Associative Memory
(Bộ nhớ kết hợp ngữ nghĩa)

SQMs
YIQ

Ánh xạ định lƣợng ngữ nghĩa
Hệ biểu diễn mầu YIQ



vii

Ký hiệu
Ký hiệu

Tên đầy đủ

I

Ảnh đa kênh nói chung

M, N

MxN là kích thƣớc theo pixel của ảnh đầu vào.

I 1, K

K kênh ảnh {I1,I2,…,IK} của ảnh I

IR,IG,IB

Kênh ảnh R, G và B của ảnh mầu trong biểu diễn mầu RGB

IS,IH,IV

Kênh ảnh H, S và V của ảnh mầu trong biểu diễn mầu HSV

Lk,min, Lk,max Miền giá trị mức xám của kênh ảnh thứ k của ảnh đầu vào
Lk,min


Lk,max
H is I

k

Giá trị mức xám nhỏ nhất theo kênh Ik của ảnh I, thông thƣờng
Lk,min = 0
Giá trị mức xám lớn nhất theo kênh Ik của ảnh I, thông thƣờng
Lk,max = 255
Lƣợc đồ xám của một kênh ảnh Ik

H i s I ( g ) = # { ( i ,j ) :I k ( i ,j ) = g }
k

D

dxd là kích thƣớc cửa sổ lân cận có tâm là điểm ảnh (i, j).

f1,f2

f1, f2  (0, 1): Tham số xác định dải động mức xám

K

Số kênh ảnh cần xử lý của ảnh đầu vào

fcut
ij


fcut  (0, 1): Tham số xác định C dải động mức xám của một
kênh ảnh
Giá trị trung bình mức xám tại điểm ảnh (i, j)
Giá trị mức xám không thuần nhất tại điểm ảnh (i, j)
Độ xám tại điểm ảnh (i, j)
Độ tƣơng phản tại điểm ảnh (i, j)

eij

Giá trị cƣờng độ biên tại điểm ảnh (i, j)

vij

Độ lệch chuẩn mức xám lấy tại lân cận điểm ảnh gij

R4,ij

Moment bậc 4 tại điểm ảnh (i, j)

Hij

Giá trị entropy đại điểm ảnh (i, j)


viii
 ij

Đo độ thuần nhất tại điểm ảnh (i, j)

H O ij


Giá trị kết nhập dạng f(Eij, Hij, Vij, R4,ij) tại điểm ảnh (i, j)

 ij

Số mũ khuếch đại tại điểm ảnh (i, j)

CM

Chỉ số độ tƣơng phản ảnh trực tiếp

AX

ĐSGT tuyến tính

AX

ĐSGT tuyến tính đầy đủ

(h), fm(x)

Độ đo tính mờ gia tử h và của hạng từ x



Giá trị định lƣợng theo điểm của giá trị ngôn ngữ



Khoảng tính mờ của giá trị ngôn ngữ


T

t(0, 1): Tham số của phép nâng độ khuếch đại

K

Số kênh ảnh cần xử lý của ảnh đầu vào

C

Số cụm cần phân cụm của tổ hợp kênh ảnh đầu vào.

i,j,c

Giá trị độ thuộc cụm thứ c của điểm ảnh (i, j), đầu ra của thủ
tục phân cụm FCM

fcut

fcut (0, 1): Tham số xác định C dải động mức xám của một
kênh ảnh


ix

DANH MỤC CÁC BẢNG
Số hiệu
bảng


Tên bảng

Trang

2.1

So sánh giá trị Havg trên kênh R, G và B của các ảnh là kết 54
quả của phép mờ hóa – biến đổi ảnh

2.2

Bảng kết quả so sánh các chỉ số khách quan giữa thuật 67
toán trong [17] và thuật toán đề xuất

2.3

So sánh kết quả phép nâng cao ĐTP ảnh mở rộng của Hint 69
(%) và của Cheng áp dụng cho ảnh mầu RGB và HSV

2.4

Giá trị chỉ số Eavg và Havg của ảnh đầu ra khi áp dụng Hint 70
và bốn phƣơng pháp gián tiếp của 27 ảnh trong biểu diễn
mầu HSV, trong đó các giá trị tốt nhất đƣợc in đậm

3.1.

Các phép kết nhập giá trị địa phƣơng khác nhau

82


3.2

Mối quan hệ dấu của các gia tử

84

3.3

Bảng giá trị độ đo tính mờ và SQM tƣơng ứng với AG, 84
AE, AT

3.4

Bảng giá trị tính toán minh họa độ đo tính mờ và SQM 86
tƣơng ứng với AG, AE, AT

3.5

Bảng giá trị các mốc nội suy dựa trên toán tử AND của hệ 87
luật (3.5)

3.6

Các tham số cơ sở của ĐSGT Agr, Aep và Aho

93

3.7


Giá trị chỉ số CMR cho từng ảnh và các phƣơng pháp kết
nhập để tạo giá trị thuần nhất

95

3.8

Giá trị chỉ số CMG cho từng ảnh và các phƣơng pháp kết 95
nhập để tạo giá trị thuần nhất

3.9

Giá trị chỉ số CMB cho từng ảnh và các phƣơng pháp kết
nhập để tạo giá trị thuần nhất

3.10

Giá trị chỉ số Eavg cho từng ảnh và các phƣơng pháp kết 96
nhập để tạo giá trị thuần nhất

3.11

Giá trị chỉ số Havg cho từng ảnh và các phƣơng pháp kết 97
nhập để tạo giá trị thuần nhất

96


x


DANH MỤC HÌNH VẼ
Tên hình vẽ

Số hiệu
hình vẽ

Trang

1

Dạng hàm biến mức xám chữ S trong các phép nâng cao
ĐTP

4

2

Một số thử nghiệm nâng cao ĐTP cho ảnh mầu tiếp cận sử
dụng toán tử tăng cƣờng mờ [72]

5

1.1

Độ đo tính mờ của biến TRUTH

17

1.2


Khoảng tính mờ của các hạng từ của biến TRUTH

20

1.3

Đồ thị toán tử INT

32

1.4

(a) Ảnh gốc, (b), (d) biểu diễn mờ với toán tử INT của kênh
R,G và B tƣơng ứng

32

1.5

Phân cụm FCM với C = 5 cụm, (a) ảnh gốc, (b)-(g) ảnh ma trận
độ thuộc cụm số 1 {µi,j,1} -5 {µi,j,5}

35

1.6

Nguyên tắc chính của tăng cƣờng ảnh mờ [29].

35


1.7

Một số thử nghiệm nâng cao ĐTP sử dụng toán tử tăng
cƣờng

36

1.8

Ảnh kết quả sử dụng suy diễn luật if-then [31] cho ảnh ở

37

hình 1.4.a
2.1

Ảnh gốc #3(a) lƣợc đồ xám kênh R (b), giá trị độ thuộc
{i,j,4}-cụm số 4/5 (c). Lƣợc đồ xám mờ kênh R, cụm số
4/5 (d)

48

2.2

Lƣợc đồ xám của kênh V, cụm số 1 ảnh #4 (C = 5), trục
hoành biểu diễn giá trị xám, trục tung biểu thị tần suất

49

2.3


Lƣu đồ xử lý của thuật toán đề xuất

53

2.4

Ảnh mờ hóa của #1 sử dụng [16] (a), sử dụng thuật toán 2.2
(b)

54


xi

2.5

Kênh B của ảnh biến đổi sử dụng [16] (a), sử dụng thuật
toán (b).

55

2.6

Sử dụng biến đổi ảnh [16] cho ảnh #3(a), #5 (b

55

2.7


Phép mờ hóa, cột bên trái [16], cột bên phải sử dụng thuật
toán 2.2

56

2.8

Dạng hàm biến mức xám chữ S trong các phép NCĐTP

57

2.9

Một số thử nghiệm nâng cao ĐTP cho ảnh mầu tiếp cận sử
dụng toán tử tăng cƣờng mờ [68]

58

2.10

Hàm thuộc của 3 tập mờ dark, bright, gray (a) và của tập
mờ darker, brighter (b).

59

2.11

Nâng cao ĐTP với suy diễn luật mờ if-then (a), luật mờ
nâng cao ĐTP (b)


59

2.12

(a) Hàm thuộc của tập mờ dark, bright, gray và (b) hàm
thuộc của tập mờ darker, brighter.

60

2.13

Các hàm thuộc đƣợc thiết kế đã tạo ra hàm biến đổi hình
chữ S.

60

2.14

Phép NCĐTP sử dụng HA-IRMd cho hệ luật {R1 -R5}

64

2.15

Trƣờng hợp  = 0.6; x = 0.6 > m = 0.4.

65

2.16


Trƣờng hợp  = 0.6; x = 0.5 < m = 0.8.

65

2.17

So sánh đồ thị của hàm biến đổi Cheng và Hint giữa mức
xám đầu vào-đầu ra đã chuẩn hóa về đoạn [0, 1], độ sáng
xung quanh  = 0.6, βX = 0.6,  = 0.5, t = 0.5

65

2.18

Kết quả của [17] cho ảnh #2

68

2.19

Kết quả của Hint sử dụng FCM 5 cụm

68

2.20

Kết quả sử dụng Curvelet [66]

68


2.21

Kết quả sử dụng Hint với FCM 5 cụm

68

2.22

Ảnh đầu ra của ảnh gốc I02 trong tập dữ liệu ảnh TID2013
là kết quả của các toán tử đƣợc quan sát bằng mắt ngƣời

72


xii

2.23

Ảnh đầu ra của ảnh gốc I10 trong tập dữ liệu ảnh TID2013
là kết quả của các toán tử đƣợc quan sát bằng mắt ngƣời

73

2.24

Ảnh đầu ra của ảnh gốc I24 trong tập dữ liệu ảnh TID2013
là kết quả của các toán tử đƣợc quan sát bằng mắt ngƣời

73


2.25

Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc
Định sử dụng các thuật toán gián tiếp và Hint

74

2.26

Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc
Định sử dụng các thuật toán gián tiếp và Hint

75

2.27

75

3.1

Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc
Định sử dụng các thuật toán gián tiếp và Hint
Độ thuần nhất tính theo công thức gốc (3.1) (a) [9] Ảnh
nâng cao độ tƣơng phản kênh R,G và B sử dụng công thức
(3.1) (b)

3.2

{Hij}(a) {Vij} (b) 3 kênh R, G và B với ảnh #5


79

3.3

Độ thuần nhất tính theo công thức (3.2) (a) Ảnh nâng cao
sử dụng công thức (3.2)(b)

80

3.4

Các giá trị nhất của kênh V của ảnh #5 sử dụng [10] (a), giá
trị thuần nhất sử dụng ĐSGT (b)

89

3.5

Lƣu đồ xử lý của thuật toán đề xuất

93

3.6

Thử nghiệm cho ảnh #1 - #6. Ảnh kết quả (cột bên trái ) khi
sử dụng [17], (cột bên phải) sử dụng thuật toán 3.2 với HO7
đề xuất

99


3.7

Ảnh kết quả sử dụng thuật toán 2 với phép kết nhập gốc
[17] H O  E * V * H * R cho ảnh #1 và ảnh kết quả

99

ij

không trơn

ij

ij

ij

4 , ij

79


1

MỞ ĐẦU
1. Tính cấp thiết của đề tài
Nâng cao độ tƣơng phản (ĐTP) ảnh là một vấn đề quan trọng trong xử
lý và phân tích hình ảnh, là một bƣớc cơ bản trong phân tích, phân đoạn ảnh.
Mục đích của việc nâng cao ĐTP ảnh là làm nổi rõ chi tiết của ảnh và tăng độ
sáng của ảnh.

Các kỹ thuật thông dụng để nâng cao ĐTP ảnh đƣợc phân thành hai
tiếp cận chính: (1) Các phƣơng pháp gián tiếp và (2) các phƣơng pháp trực
tiếp [12, 19, 20].
a) Đối với các phƣơng pháp gián tiếp
Phƣơng pháp tăng cƣờng ĐTP gián tiếp chỉ biến đổi lƣợc đồ xám mà
không sử dụng bất kỳ một độ đo tƣơng phản nào. Biến đổi lƣợc đồ xám của
ảnh là phƣơng pháp làm cho lƣợc đồ xám của ảnh kết quả đều hơn, khi đó
ĐTP của ảnh đầu ra đƣợc nâng cao, độ sáng của ảnh đƣợc nâng nên. Trong
phƣơng pháp này những điểm ảnh đầu vào có cùng giá trị mức xám thì ở ảnh
kết quả, giá trị mức xám của những điểm ảnh này cũng bằng nhau, vì thế có
thể làm mất chi tiết ảnh so với ảnh đầu vào.
Có nhiều kỹ thuật đã đề xuất đƣợc tìm thấy trong tài liệu tham khảo [9,
10, 12, 15, 23, 26, 39, 51, 57, 61, 63, 68, 72].
Trong vài năm gần đây, nhiều nhà nghiên cứu đã áp dụng lý thuyết tập
mờ để phát triển các kĩ thuật mới nhằm nâng cao ĐTP của ảnh:
Tăng cƣờng ảnh mờ dựa trên việc ánh xạ mức xám vào miền mờ, sử
dụng hàm biến đổi thành viên [26]. Mục tiêu là sinh một ảnh có ĐTP cao hơn
ảnh gốc bằng việc gán các giá trị mức xám bằng một giá trị mới lớn hơn, gần
hơn với mức xám trung bình của ảnh [26].


2

Manglesh đã đề xuất thuật toán mới sử dụng logic mờ để tăng cƣờng
ảnh màu với chất lƣợng bị suy giảm bởi nhiễu Gaussian. Đầu tiên luật logic
mờ đƣợc sinh, sau đó giá trị RGB của ảnh đƣợc đƣa vào tiếp cận logic mờ.
Ảnh mờ đầu ra sẽ phân biệt giữa các màu mơ hồ [51] Sarode đã giới thiệu
thuật toán NCĐTP ở đó kênh sắc độ mầu đƣợc bảo tồn, chỉ thay đổi các kênh
cƣờng độ mầu sắc và kênh độ bão hoà, sau đó luật logic mờ đƣợc áp dụng.
Dựa trên điều này những quyết định liên quan đến việc phân lớp màu sẽ đƣợc

thực hiện. Ảnh đầu ra sẽ chỉ bao gồm những vùng ảnh rõ, những điểm ảnh
nhiễu bị loại bỏ [63]. Các nghiên cứu này đã đề xuất một phƣơng pháp tăng
cƣờng ĐTP mờ trực tiếp thích ứng mới dựa trên hàm thành viên Sigma để ánh
xạ ảnh từ miền không gian vào miền mờ. Khi chuyển ảnh từ một không gian
màu (RGB) vào không gian màu khác (HSV, HIS, YIQ) sắc độ không bị thay
đổi, chỉ những thành phần cƣờng độ màu và độ bão hoà bị thay đổi. Tuy
nhiên, ảnh sau tăng cƣờng có thể không còn giữ đƣợc chi tiết ảnh. Để khắc
phục vấn đề này, trong [63], Naik đã đƣa ra phƣơng pháp giữ các giá trị mức
xám đƣợc biến đổi trong phạm vi của miền mức xám.
Trong [72], hai kĩ thuật tăng cƣờng ĐTP là tăng cƣờng dựa trên luật mờ
và tăng cƣờng sử dụng toán tử tăng cƣờng áp dụng với ảnh xám ĐTP thấp
đƣợc đề xuất. Kĩ thuật đầu tiên sử dụng hàm ứng với hệ mờ luật if-then, kĩ
thuật thứ hai sử dụng toán tử tăng cƣờng ĐTP mờ để biến đổi mức xám trong
miền mờ. Kết quả thực nghiệm cho thấy, lƣợc đồ xám của ảnh gốc và các ảnh
tăng cƣờng có các đặc trƣng cơ bản giống nhau, điều này không làm đƣợc
trong cân bằng lƣợc đồ xám [72]. Ngoài ra, tăng cƣờng ĐTP sử dụng kĩ thuật
toán tử tăng cƣờng có các giá trị chỉ số đánh giá khách quan mờ thấp hơn so
với kĩ thuật tăng cƣờng ĐTP sử dụng luật mờ. Tuy nhiên, về thời gian xử lý,
kĩ thuật tăng cƣờng ĐTP dựa trên luật mờ yêu cầu thời gian ít hơn kĩ thuật
tăng cƣờng sử dụng toán tử tăng cƣờng.


3

Phƣơng pháp tăng cƣờng mờ đƣợc đề xuất bởi Hanmandlu trong đó
một toán tử tăng cƣờng ĐTP đƣợc giới thiệu. Bằng việc bảo tồn kênh H, chỉ
thay đổi kênh S, kênh V và cực tiểu entropy mờ, chất lƣợng của ảnh đƣợc cải
thiện về mặt trực quan [23]. Hanmandlu cũng đã giới thiệu một hàm thành
viên Gaussian để mờ hoá ảnh màu, cùng với việc tối ƣu entropy mờ của ảnh
thì các tham số đƣợc tối ƣu, ĐTP và độ sáng các ảnh tối đầu vào đã đƣợc cải

thiện [24].
John See đã đề xuất bộ dò tìm cạnh Gaussian dựa trên tập mờ sử dụng
cả thuộc tính toàn cục và cục bộ [38]. Trong giai đoạn tăng cƣờng ĐTP toàn
cục, hàm thành viên Gaussian đƣợc sử dụng. Một hàm tăng cƣờng ĐTP phi
tuyến bao gồm ba tham số đƣợc sử dụng để tăng cƣờng ảnh. Trong giai đoạn
tăng cƣờng ĐTP cục bộ, mặt nạ dò tìm cạnh kiểu Gaussian chứa hai tham số
mờ đƣợc tối ƣu bằng việc sử dụng hàm entropy ảnh mờ. Thuật toán này đã
thể hiện một cải tiến trực quan tƣơng đối hiệu quả.
Palanikumar đã giới thiệu một thuật toán mới dựa trên cân bằng lƣợc
đồ xám (HE) và HE tăng giá trị thích ứng (AIVHE) [60]. Bằng việc sử dụng
phƣơng pháp AIVHE, phép tăng cƣờng ĐTP đƣợc điều khiển bởi hai tham số
beta và gamma, nhƣng xuất hiện vấn đề là thông tin chi tiết ảnh không phải
lúc nào cũng đƣợc bảo tồn. Để khắc phục vấn đề này thuật toán di truyền
đƣợc dùng để tối ƣu giá trị beta và gamma thông qua việc tối ƣu giá trị
entropy [27].
Một ảnh có thể đƣợc nhóm thành các vùng tối, vùng hỗn tạp và vùng
sáng [59]. Ảnh RGB đƣợc chuyển đổi thành ảnh HSV. Sắc độ ảnh đƣợc bảo
tồn còn thành phần độ sáng của ảnh bị thay đổi. Việc mờ hoá đƣợc thực hiện
trên các vùng tối và vùng sáng bằng việc sử dụng hàm thành viên Gaussian
dựa trên điểm giao và tham số tăng cƣờng. Giá trị tối ƣu của các tham số này
đạt đƣợc bởi kĩ thuật lặp tối ƣu hệ kiến [59].


4

Trong [11], Aman Tusia và cộng sự đã thực hiện một phân tích hiệu
năng của hệ thống mờ loại 2 cho việc tăng cƣờng ảnh. Trƣớc khi xử lý, ảnh
đầu vào đƣợc chuyển từ không gian màu RGB về không gian HSV để bảo tồn
thông tin màu sắc. Hai ngƣỡng dƣới và trên đƣợc định nghĩa để cung cấp ƣớc
lƣợng của các vùng tối và vùng sáng trong ảnh. Ảnh đƣợc mờ hoá (loại 2) sử

dụng hàm thành viên Gausian.
Những tiếp cận sử dụng logic mờ để nâng cao ĐTP ảnh nói chung đều
dẫn đến tạo ra một hàm biến đổi mức xám dạng chữ S (Hàm liên tục đơn điệu
tăng, giảm giá trị đầu vào khi đầu vào dƣới ngƣỡng, và ngƣợc lại tăng giá trị
đầu vào khi đầu vào ở trên ngƣỡng).

(a) Toán tử NINT [23]

(b) Dạng đồ thị của hàm
biến đổi mức xám sinh bởi
hệ luật mờ if-then [72]

(c)Dạng đồ thị biến đổi
mức xám của [17]

(d) Ảnh kết quả sử dụng suy diễn luật if-then [72] cho ảnh #5 (Phụ lục C)

Hình 1. Dạng hàm biến mức xám chữ S trong các phép nâng cao ĐTP.


5

(a) Ảnh gốc

(b) Ảnh kết quả sinh bởi
(c) Dạng hàm biến đổi
toán tử tăng cƣờng mờ [72]

(d) Ảnh gốc


(e) Kết quả sinh bởi toán tử
tăng cƣờng mờ [72]

(g) Dạng hàm biến đổi

Hình 2. Một số thử nghiệm nâng cao ĐTP cho ảnh mầu tiếp cận sử dụng toán
tử tăng cƣờng mờ [72]
b) Về phƣơng pháp nâng cao ĐTP trực tiếp
Nâng cao ĐTP ảnh theo phƣơng pháp trực tiếp là xây dựng một phƣơng
pháp biến đổi ĐTP tại một điểm ảnh dựa trên định nghĩa độ đo tƣơng phản
giữa độ sáng điểm ảnh và lân cận xung quanh nó. Bài toán đƣợc phát biểu
nhƣ sau:
Nâng cao ĐTP theo phƣơng pháp trực tiếp là quy trình thực hiện một
dãy biến đổi:  f , b 

C

C

f ,b

'

0C

'

f f ,b ,

 C  1,

'

f ,b

Bƣớc 1: Tính ĐTP tại từng điểm ảnh:
C  C



f ,b 

f b
f b

Bƣớc 2: Nâng ĐTP:

C  C E  C    C ,1 
'

C

Bƣớc 3: Xác định f sao cho
- Nếu

0  f  b

- Nếu

b  f


thì

thì

0  f  f

f  f

'

'

(do

C

f

'



,b  C

(do C

C  C ')

 C ')


'

và:

cụ thể:


6

Nhƣ vậy, quy trình biến đổi

f

f

'

tăng cƣờng tại ngƣỡng b.

Trong một thời gian dài cho đến nay, có rất ít các nghiên cứu theo
phƣơng pháp trực tiếp trong đó biến đổi độ tƣơng phản ảnh dựa trên một độ
đo tƣơng phản xác định tại mỗi điểm ảnh, chẳng hạn các nghiên cứu [16, 17,
18, 19]. Hầu nhƣ chỉ có các nghiên cứu của Cheng và cộng sự là theo hƣớng
tiếp cận này [16, 17].
Các thuật toán của Cheng là cơ sở của phép nâng cao ĐTP ảnh đa cấp
xám. Tuy vậy các thuật toán này vẫn còn tồn tại một số hạn chế sau khi áp
dụng cho ảnh mầu, ảnh đa kênh:
(i) Ảnh nâng cao ĐTP có thể không thay đổi mức độ sáng của mầu so
với ảnh gốc.
(ii) Sử dụng các ảnh đã đƣợc biến đổi theo phƣơng pháp biến đổi ảnh

của Cheng để nâng cao ĐTP ảnh có thể làm mất chi tiết của ảnh gốc.
Về độ đo thuần nhất cho điểm ảnh, Cheng đề xuất cách ƣớc lƣợng giá
trị thuần nhất của điểm ảnh đƣợc kết nhập từ các giá trị địa phƣơng Eij, Hij,
Vij, R4,ij. Khi thử nghiệm với ảnh mầu, tác giả nhận thấy với phép kết nhập này
ảnh kết quả có thể không trơn.
Thực tế giá trị độ thuần nhất của điểm ảnh là một giá trị mờ và chúng ta
có thể áp dụng lập luận mờ để thu nhận giá trị này.
Nếu các đặc trƣng địa phƣơng đƣợc
tính toán với từ thì công thức kết nhập dạng

E ij , H



ij

chuyển cho một tiếp cận

T e h E ij , H

ij

 cần phản ánh luật mờ

nhƣ sau:
Nếu

g r a d ie n t

là cao và


Nếu

g r a d ie n t

là thấp và

Ở đây ký hiệu

g r a d ie n t

của entropy tƣơng ứng.

e n tr o p y
e n tr o p y

là cao thì độ thuần nhất là cao
là thấp thì độ thuần nhất là thấp

là phần bù của gradient và

e n tr o p y

là phần bù


7

Nếu chúng ta bổ sung thêm các luật với từ các gia tử nhƣ “rất”, “ít”,
“vừa” v.v .. với các biến ngôn ngữ nhƣ “homogeneity”, “entropy”, “gradient”

v.v... thì các giá trị thuần nhất có thể đƣợc ƣớc lƣợng bằng suy diễn của con
ngƣời và vì thế sẽ mịn hơn.
Do lý thuyết tập mờ ít quan tâm đến cơ sở hình thức giữa quan hệ của
các biến ngôn ngữ và các tập mờ, cũng nhƣ quan hệ thứ tự giữa các từ nên
cần xem xét sử dụng một phƣơng pháp lập luận luôn đảm bảo thứ tự hoặc yêu
cầu cao hơn là tạo ra một hàm biến đổi mức xám dạng chữ S dựa trên hệ luật
ngôn ngữ.
Hơn nữa, bản thân lý thuyết tập mờ rất khó để mô phỏng hoàn chỉnh
cấu trúc ngôn ngữ mà con ngƣời vẫn sử dụng để suy luận, cho dù cách tiếp
cận này đã đƣợc ứng dụng thành công trên rất nhiều lĩnh vực của cuộc sống.
Vì cấu trúc thứ tự cảm sinh trên các khái niệm mờ biểu thị bằng các giá trị
ngôn ngữ không đƣợc thể hiện trên các tập mờ. Chẳng hạn, về mặt ngữ nghĩa
chúng ta luôn cảm nhận đƣợc “yếu” nhỏ hơn “khỏe”, “cao” lớn hơn “thấp”
nhƣng hàm thuộc của chúng lại không so sánh đƣợc với nhau. Mặt khác, tập
các khái niệm mờ không đóng đối với một số các phép toán trên các tập mờ
[80]. Vì vậy trong quá trình lập luận nhiều khi ngƣời ta cần phải xấp xỉ ngôn
ngữ, tức là phải tìm một giá trị ngôn ngữ mà ý nghĩa của nó xấp xỉ với một
tập mờ cho trƣớc, điều này làm tăng độ phức tạp của thuật toán và sai số cho
quá trình tính toán. Hơn nữa, chúng ta biết rằng một hệ suy diễn xây dựng
trên một ngôn ngữ hình thức đều xác định trên tập các lớp công thức tƣơng
đƣơng một cấu trúc đại số thuộc lớp các đại số trừu tƣợng [6], trong khi lôgíc
mờ giá trị ngôn ngữ (hay lôgíc mờ theo nghĩa Zadeh) còn thiếu một cơ sở đại
số làm nền tảng.
Vì vậy, nhằm khắc khắc phục phần nào những nhƣợc điểm trên, năm
1990, N.C. Ho & W. Wechler trong [29] đã khởi xƣớng phƣơng pháp tiếp cận
đại số đến cấu trúc tự nhiên của miền giá trị của các biến ngôn ngữ. Theo


8


cách tiếp cận này, mỗi giá trị ngôn ngữ của một biến ngôn ngữ nằm trong một
cấu trúc đại số gọi là đại số gia tử (ĐSGT). Dựa trên những tính chất ngữ
nghĩa của ngôn ngữ đƣợc phát hiện, bằng phƣơng pháp tiên đề hóa nhiều tác
giả đã tập trung phát triển lý thuyết ĐSGT với các kết quả nhƣ ĐSGT mở
rộng [29], ĐSGT mịn hóa [32], ĐSGT mở rộng đầy đủ [1], ĐSGT PN-không
thuần nhất [6]. Trong đó, tiêu biểu là ĐSGT mịn hóa cùng với việc trang bị
khái niệm độ đo tính mờ của các giá trị ngôn ngữ và phƣơng pháp định lƣợng
ngữ nghĩa [35]. Trên cơ sở đó, các phƣơng pháp lập luận xấp xỉ dựa trên
ĐSGT và ứng dụng trong một số lĩnh vực đƣợc các tác giả phát triển, có thể
kể đến nhƣ phƣơng pháp lập luận sử dụng mạng nơron trong điều khiển mờ
[4], ứng dụng trong cơ sở dữ liệu mờ [3], lập luận bằng nội suy gia tử có tối

ƣu tham số và ứng dụng trong điều khiển mờ [7], [30], [33] v.v... Tuy nhiên,
việc ứng dụng đại số gia tử vào lĩnh vực xử lý ảnh nói chung và bài toán nâng
cao ĐTP ảnh nói riêng chƣa đƣợc thực hiện.
Qua khảo sát, phân tích và thực nghiệm tác giả đã rút ra kết luận:
Thứ nhất, phép lập luận if-then dựa trên tập mờ rất khó đảm bảo hình
dạng chữ S của hàm biến đổi mức xám. Phép nâng cao ĐTP theo hƣớng tiếp
cận trực tiếp của Cheng sử dụng một hàm biến đổi mức xám dạng chữ S
không đối xứng, giá trị mức xám biến đổi có thể rơi ra ngoài miền giá trị của
độ xám.
Thứ hai, độ đo thuần nhất của Cheng vẫn còn một vài hạn chế, chẳng
hạn ảnh kết quả có thể không trơn.
Thứ ba, sử dụng trực tiếp thuật toán của Cheng trên kênh ảnh gốc thì
độ sáng của ảnh kết quả có thể không thay đổi đáng kể. Để thay đổi đƣợc độ
sáng của ảnh cần phải biến đổi ảnh gốc trƣớc khi áp dụng phép nâng cao ĐTP
của Cheng. Tuy nhiên, phép biến đổi ảnh của Cheng có thể làm mất chi tiết
của ảnh gốc.
Vấn đề nghiên cứu của luận án là:



9

Vấn đề 1: Xây dựng phép mờ hóa ảnh không đánh mất chi tiết ảnh gốc.
Vấn đề 2: Thiết kế hàm biến đổi mức xám dạng chữ S và đối xứng;
Vấn đề 3:Xây dựng độ đo thuần nhất địa phƣơng của ảnh;
Ba vấn đề nghiên cứu của luận án có thể đƣợc khái quát lại theo hình
nhƣ sau:
Ảnh đầu vào:
Ảnh đa cấp xám (Một kênh)
Biến đổi ảnh:
- Sử dụng một DĐMX
- Sử dụng lƣợc đồ xám thƣờng

Ảnh đầu vào:
Ảnh mầu (đa kênh)
Biến đổi ảnh:
- Sử dụng phân cụm FCM
- Sử dụng nhiều DĐMX
- Sử dụng lƣợc đồ xám mờ

Tính các giá trị địa phƣơng:
Eij, Hij, Vij, R4ij

Tính các giá trị địa phƣơng:
Eij, Hij, Vij, R4ij

Tính giá trị thuần nhất:

Tính giá trị thuần nhất:


HO = (1-Eij)*(1- Hij)*(1-Vij)*(1- R4ij)

Dùng hệ luật NN và ĐSGT

Tính giá trị mức xám không thuần
nhất:ij

Tính giá trị mức xám không thuần
nhất:ij

Tính ĐTP:Cij

Tính ĐTP:Cij

Tính số mũ khuếch đại:

Tính số mũ khuếch đại:
Dùng hệ luật NN và ĐSGT (Toán tử Hint)

Nâng ĐTP:

Nâng ĐTP:

Tính giá trị mức xám của điểm
ảnh mới

Tính giá trị mức xám của điểm
ảnh mới


Ảnh nâng cao

Ảnh nâng cao

Phƣơng pháp của Cheng

Phƣơng pháp đề xuất


10

2. Mục tiêu, phạm vi nghiên cứu của luận án
2.1. Mục tiêu chính của đề tài là tập trung chủ yếu ở vấn đề:
Nghiên cứu các vấn đề của xử lý ảnh dƣới tiếp cận của lý thuyết ĐSGT,
cụ thể nhƣ:
- Xây dựng hàm biến đổi mức xám dạng chữ S nâng cao ĐTP cho ảnh
mầu áp dụng ĐSGT.
- Xây dựng độ đo thuần nhất mới bằng đại số gia tử áp dụng nâng cao
ĐTP cho ảnh mầu.
- Xây dựng phép biến đổi mờ hóa ảnh áp dụng cho ảnh đa kênh không
làm mất chi tiết ảnh.
Theo hiểu biết của chúng tôi đây là vấn đề nghiên cứu có tính liên
ngành, hoàn toàn mới trong xử lý ảnh và ĐSGT.
2.2. Phạm vi nghiên cứu
Xuất phát từ mục tiêu trên, phạm vi nghiên cứu của đề tài tập trung vào
các vấn đề sau:
- Biến đổi ảnh mầu, ảnh đa kênh.
- Xây dựng hàm biến đổi mức xám dạng chữ S dựa trên ĐSGT.
- Xây dựng độ đo thuần nhất địa phƣơng cho ảnh dựa trên ĐSGT.
2.3. Đối tƣợng nghiên cứu của luận án:

- Ảnh đa kênh: ảnh mầu RGB (24 bit), kênh ảnh mầu của ảnh viễn
thám.
- Lập luận hệ luật mờ bằng ĐSGT.
- Độ đo tƣơng phản của ảnh mầu RGB (24 bit), kênh ảnh mầu của ảnh
viễn thám.
3. Phƣơng pháp và nội dung nghiên cứu
Phƣơng pháp luận trong nghiên cứu của luận án là kết hợp giữa nghiên
cứu lý thuyết và thực nghiệm. Các tƣ liệu và thông tin liên quan chủ yếu đƣợc


11

thu thập, tổng hợp từ các nguồn tạp chí khoa học chuyên ngành trong và
ngoài nƣớc, qua các buổi seminar hoặc tham gia báo cáo tại các hội thảo khoa
học, qua trao đổi với thầy hƣớng dẫn và các đồng nghiệp cùng lĩnh vực
nghiên cứu v.v…Tổng hợp các thông tin liên quan, lựa chọn các cách tiếp cận
đã đƣợc áp dụng thành công, tiến hành thử nghiệm với tiếng Việt, đánh giá
kết quả, từ đó sẽ tiến hành nghiên cứu sâu hơn về giải pháp cải tiến có thể xây
dựng đƣợc biến đổi ảnh đa kênh, xây dựng đƣợc hàm biến đổi dạng chữ S và
xây dựng độ đo thuần nhất dựa trên ĐSGT.
4. Cấu trúc luận án
Cấu trúc luận án gồm: phần mở đầu, 3 chƣơng nội dung, kết luận, danh
mục tài liệu tham khảo và phụ lục.
Chƣơng 1: Tổng quan về nâng cao ĐTP ảnh và tiếp cận đại số gia tử
giải hệ luật mờ.
Chƣơng này trình bày khái quát kiến thức về ĐSGT, phƣơng pháp giải
hệ luật mờ bằng ĐSGT. Cũng trong chƣơng này trình bày thuật toán nâng cao
ĐTP trực tiếp của Cheng, phân tích những điểm mạnh và điểm hạn chế của
phƣơng pháp làm căn cứ cho các nghiên cứu, đề xuất trong chƣơng 2 và
chƣơng 3.

Chƣơng 2: Biến đổi ảnh đa kênh và xây dựng hàm biến đổi chữ S theo
tiếp cận ĐSGT và ứng dụng nâng cao ĐTP ảnh đa kênh.
Chƣơng này trình bày đề xuất của NCS về xây dựng phép biến đổi mờ
hóa ảnh cho ảnh đa kênh nhƣ ảnh mầu, kênh ảnh mầu của ảnh viễn thám... .
Cũng trong chƣơng này trình bày phƣơng pháp xây dựng hàm biến đổi mức
xám dạng chữ S sử dụng ĐSGT ứng dụng nâng cao ĐTP ảnh đa kênh.
Chƣơng 3. Xây dựng độ đo thuần nhất mới theo tiếp cận ĐSGT và ứng
dụng nâng cao ĐTP ảnh đa kênh


×