Tải bản đầy đủ (.pdf) (146 trang)

một số kỹ thuật cải tiến trong ẩn thông tin trên ảnh số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.88 MB, 146 trang )



I H
C QU

C GIA THÀNH PH

H

CHÍ
MINH

TRNG I HC KHOA HC T NHIÊN







DNG MINH C




MT S K THUT CI TIN TRONG
N THÔNG TIN TRÊN NH S









LUN ÁN TIN S CÔNG NGH THÔNG TIN

















Tp. H Chí Minh − 2014






I H

C QU

C GIA THÀNH PH

H

CHÍ
MINH

TRNG I HC KHOA HC T NHIÊN






DNG MINH C





MT S K THUT CI TIN TRONG
N THÔNG TIN TRÊN NH S
Chuyên ngành: KHOA HC MÁY
TÍNH

Mã s chuyên ngành: 62 48 01
01



Phn bin 1: TS. LÝ QUC NGC
Phn bin 2: TS. LÊ THÀNH SÁCH
Phn bin 3: TS. PHM VN HU
Phn bin đc lp 1: PGS.TS. LNG CHI MAI
Phn bin đc lp 2: TS. NGUYN TUN NAM


Ngi hng dn khoa hc:

PGS.TS. DNG ANH C 




Tp. H Chí Minh −
2014








Li cm n



Lun án này đc thc hin ti khoa Công Ngh Thông Tin, Trng i Hc

Khoa Hc T Nhiên − i Hc Quc Gia Thành ph H Chí Minh.
Lun án đc hoàn thành di s hng dn ca PGS.TS Dng Anh c.
Li đu tiên, tôi xin bày t lòng bit n và kính trng sâu sc Thy Dng Anh
c, ngi đã luôn bên cnh h tr và đng viên tôi trong sut quá trình thc hin
lun án. Thy đã tn tình truyn th kin thc, ch bo và giúp đ tôi vt qua bao
khó khn và th thách đ hoàn thành lun án.
Tôi xin trân trng và bày t lòng bit n chân thành PGS.TS Trn an Th,
PGS.TS Lê Hoài Bc, PGS.TS Nguyn ình Thúc, PGS.TS Lê ình Duy, TS. Trn
Minh Trit, TS. Lê Thành Sách, TS. Trn Thái Sn, TS. inh Bá Tin đã có nhng
nhn xét và đóng góp nhiu ý kin quý báu đ giúp tôi hoàn thin lun án này.
Xin chân thành cám n quý Thy Cô trong khoa Công Ngh Thông Tin, trng
i hc Khoa Hc T Nhiên đã tn tình ging dy, trang b cho tôi nhng kin thc
b ích trong quá trình hc tp và nghiên cu. Tôi cng xin cám n Ban Giám Hiu,
các cán b Phòng Sau i hc Trng i hc Khoa Hc T Nhiên đã to điu kin
và giúp đ tôi trong thi gian hc tp và nghiên cu ti trng.
Tôi xin gi li cám n đn các anh ch em, các bn đng nghip và đc bit là
các anh em trong Phòng Thí Nghim MMLab − UIT đã luôn quan tâm giúp đ, đóng
góp ý kin và h tr tôi trong sut quá trình thc hin lun án.
Tôi xin kính tng lun án này cho Cha M và nhng ngi thân trong gia đình
đã luôn bên cnh chm sóc, yêu thng, chia s và đng viên đ tôi có th tp trung
hoàn thành nhim v ca mình.

Tp. H Chí Minh, tháng 4 nm 2014

Dng Minh c








L
i cam đoan




Tôi xin cam đoan lun án này là công trình nghiên cu khoa
hc ca tôi.
Các kt qu nghiên cu ca lun án là trung thc và
cha tng đc ai khác công b trong bt
k công trình nào khác.


Dng Minh c
i

MC LC

DANH SÁCH HÌNH iv
DANH SÁCH BNG viii
DANH SÁCH THUT NG, T VIT TT VÀ KÍ HIU ix
M U 1
Tóm tt 1
Tng quan 1
Lí do thc hin đ tài 2
Mc tiêu đ tài 3
Phng pháp thc hin 3
Phm vi nghiên cu 3

óng góp chính ca lun án 4
Chng 1. TNG QUAN V K THUT N THÔNG TIN VÀ BIN I
CONTOURLET TRÊN NH S 6
1.1 Gii thiu 6
1.2. Tng quan v n thông tin 6
1.2.1 Các khái nim c bn 6
1.2.2 Phân loi watermark 8
1.2.3 Nhng yêu cu c bn đi vi bài toán n thông tin 10
1.2.4 ng dng ca k thut n thông tin 14
1.3. Các k thut n thông tin trên nh 17
1.3.1. Phng pháp n trên min không gian 18
1.3.2. Phng pháp n trên min bin đi 18

1.4 C s lí thuyt ca phép bin đi contourlet 19
1.4.1 Gii thiu 19
1.4.2 Phng pháp bin đi contourlet 22
1.4.2.1 Các tính cht ca bin đi contourlet 23
1.4.2.2 Mô t thc hin 23
1.4.2.3 Bin đi Laplace Pyramid (LP) 23
1.4.2.4 Dàn lc có hng – Phân tích hng 25
1.4.2.5 Phân tích đa mc và đa hng 27
1.4.3 Phép bin đi contourlet không gim kích thc mu (NSCT) 29
1.4.3.1 Bin đi nonsubsampled pyramid (NP) 30
1.4.3.2 Dàn lc có hng NDFB (Nonsubsampled Directional Filter Banks) 31
1.4.3.3 Bin đi contourlet không gim kích thc mu 32
ii

Chng 2. MÔ HÌNH N THÔNG TIN HAI GIAI ON TRÊN MIN
CONTOURLET 33
2.1. Tng quan 33

2.1.1 Gii thiu 33
2.1.2 S lc thut toán nhúng thông tin điu bin lng t - QIM 36
2.2 Mô hình n thông tin hai giai đon trên min contourlet 40
2.2.1 Qui trình n thông tin c bn trên min contourlet 40
2.2.2 Qui trình n thông tin hai giai đon trên min contourlet 43
2.2.3. Qui trình trích thông tin 47
2.3 ánh giá kt qu thc nghim 49
2.4 Phân tích thc nghim 58
2.5 Kt chng 61
Chng 3.
MÔ HÌNH N THÔNG TIN CI TIN TRÊN MIN CONTOURLET 63
3.1 Gii thiu 63
3.2 Mô hình n thông tin bn vng trc bin đi hình hc trên min contourlet 63
3.2.1 Tng quan v bin đi hình hc trên nh 64
3.2.2 Các vn đ có liên quan 67
3.2.3 Mô hình dùng min bt bin đ chng tn công hình hc 71
3.2.3.1 Qui trình nhúng kt hp chun hóa nh trên min contourlet 72
3.2.3.2 Qui trình trích thông tin Normalize-contourlet 74
3.2.3.3 ánh giá kt qu thc nghim 75
3.2.3.4 Kt lun phn 3.2.3 84
3.2.4 Chng tn công hình hc bng t đng b theo ni dung nh 84
3.2.4.1 Qui trình nhúng thông tin 84
3.2.4.2 Qui trình trích 88
3.2.4.3 ánh giá kt qu thc nghim 89
3.2.4.4 Kt lun phn 3.2.4 94
3.3 Mô hình n thông tin trên min contourlet dung lng cao và bn vng 94
3.3.1 Gii thiu 94
3.3.2 Mô hình n thông tin dung lng cao và bn vng 94
3.3.3 ánh giá kt qu thc nghim 97
3.3.4 Kt lun phn 3.3 103

3.4 ng dng xây dng mô hình n thông tin trên nh y khoa 103
3.5 Kt chng 107
Chng 4. MÔ HÌNH N THÔNG TIN KT HP H M 108
4.1. Gii thiu 108
iii

4.2. Kt hp h m vào mô hình n thông tin 109
4.2.1. Qui trình vn hành 111
4.2.2. Nguyên lí thit k 112
4.3 Thit k b điu khin m 113
4.3.1 Các bin và bin ngôn ng vào/ra 114
4.3.2 Xây dng các tp m và m hóa 114
4.3.3 Xây dng lut hp thành 117
4.3.4 ng c suy din – thit b hp thành 119
4.3.5 Kh m 120
4.4 Vn hành h thng n thông tin m đ gii quyt ba yu t mâu thun 120
4.5 ánh giá kt qu 122
4.6 Kt chng 124
KT LUN 125
DANH SÁCH CÔNG TRÌNH CÔNG B CA TÁC GI 128
TÀI LIU THAM KHO 129

iv

DANH SÁCH HÌNH

Hình 1.1 S đ khi kiu truyn thng (a) và truyn thông tin n (b) [33] 7
Hình 1.2 S đ nhúng thông tin [71] 7
Hình 1.3 S đ trích thông tin [71] 7
Hình 1.4 Watermark "nhìn thy đc" [38] 8

Hình 1.5 Watermark "trong sut" vi thông đip nhúng là logo (Digimarc.com) 9
Hình 1.6 Watermark "trong sut" vi thông đip nhúng là logo [38] 9
Hình 1.7 Mt vài phép bin đi hình hc trên nh [9] 10
Hình 1.8. Thang đo đ trong sut [43] 13
Hình 1.9. Các yêu cu mang tính đi nghch nhau ca mô hình n thông tin 14
Hình 1.10 nh gc và nh đã b thay đi [41] 17
Hình 1.11 S đ b lc khai thác min không gian và min bin đi 17
Hình 1.12 S phân rã hình tháp 20
Hình 1.13 Biu din nh c s wavelet (a) và contourlet (b) ca nh [54] 21
Hình 1.14 Mô hình cu trúc ca phép bin đi contourlet 22
Hình 1.15 V đng cong bng wavelet và contourlet [51] 22
Hình 1.16 Cu trúc dàn lc contourlet LP và DFB [58] 24
Hình 1.17 B lc phân tích tín hiu [58] 24
Hình 1.18 B lc tái to tín hiu [58] 24
Hình 1.19 Mt phng chia min tn s theo các hng [58] 25
Hình 1.20 Minh ha chia ph 2D thành các mnh mn bng DFB [52] 26
Hình 1.21 B lc Quincunx hai kênh [58] 26
Hình 1.22 Phép toán Shearing nh [58] 26
Hình 1.23 Minh ha biên nh khôi phc trn hn so vi wavelet [58] 27
Hình 1.24 Cu trúc dàn lc Pyramid DFB bin đi contourlet ri rc [54] 28
Hình 1.25 Minh ha bin đi contourlet nh Peppers [58] 28
Hình 1.26 Minh ha quá trình phát trin kích thc ca hàm contourlet [58] 29
v

Hình 1.27 B lc nonsubsampled hai kênh [11] 30
Hình 1.28 S đ tháp Nonsubsampled [11] 31
Hình 1.29 Mt phng min tn s đc phân tích [11] 31
Hình 1.30 Dàn lc NDFB [11] 31
Hình 1.31 áp ng tn s ca hai b lc sau khi đã ly mu lên [11] 32
Hình 1.32 Ví d bn hng min tn s [11] 32

Hình 1.33 Biu din Nonsubsampled Contourlet (NSCT) 32
Hình 2.1 Thông đip m nhúng vào vect tín hiu mang × bng hàm s(×,m). 36
Hình 2.2 Các đim đánh du bng × và thuc v 2 b lng t khác nhau 37
Hình 2.3 iu bin dither vi bc nhy đng b [13] 39
Hình 2.4 iu bin dither vi bc nhy không đng b [13] 39
Hình 2.5 Nhúng mt bit/mu bng điu bin dither [13] 39
Hình 2.6 Minh ha các h s contourlet [58] 41
Hình 2.7 Biu din contourlet ca nh Barbara 42
Hình 2.8 Qui trình nhúng bng thut toán QIM trên min contourlet 42
Hình 2.9 Qui trình nhúng thông tin hai giai đon ci tin [5] 44
Hình 2.10.a Các h s kh thi ti subband đm bo b ba ràng buc G1 45
Hình 2.10.b Mô t chn và l 46
Hình 2.11 Qui trình nhúng thông tin giai đon 1 theo đc t chn l [26] 47
Hình 2.12 S đ mô t qui trình trích thông tin [26] 48
Hình 2.13 Qui trình trích thông tin giai đon 1 theo đc t chn l [26] 48
Hình 2.14 nh gc và watermark dùng thc nghim 50
Hình 2.15 So sánh kt qu giá tr PSNR trên cùng nh mc xám 51
Hình 2.16 Giá tr NC hai giai đon khi trích w di tn công JPEG 53
Hình 2.17 Nhúng logo kích thc 64x64 đ kim tra dung lng nhúng 54
Hình 2.18 Giá tr PSNR nhúng hai giai đon vi hai logo (32x32) và (64x64) 54
Hình 2.19 Kt qu trích watermark theo mô hình hai giai đon 54
Hình 2.20  trong sut (PSNR) và bn vng vi JPEG theo delta t ln đn nh 55
Hình 2.21 nh hng ca mt đ nhúng lên đ an toàn. 55
vi

Hình 2.22 S mc phân tích contourlet và dung lng nhúng ti đa tng ng 56
Hình 2.23 Dung lng nhúng các mô hình 57
Hình 2.24 So sánh PSNR ca các mô hình 57
Hình 2.25 Tp nh gc dùng đ phân tích th nghim: 20 nh mc xám 58
Hình 2.26 PSNR các nh sau nhúng logo 64x64 59

Hình 2.27 NC các watermark trích 59
Hình 2.28 NC các watermark trích vi tn công nén JPEG 50% 60
Hình 2.29 NC các watermark trích vi tn công nén JPEG 40% 60
Hình 2.30 Histogram các nh phân tích 61
Hình 3.1 nh Lena b tn công bng Stirmark. 65
Hình 3.2 Mô hình truyn thông ca n thông tin [66] 67
Hình 3.3 Ba đim đc trng tr thành mt sau khi b kéo [14] 70
Hình 3.4 nh Lena gc (a) và nh b bin đi (b) có cùng nh chun hóa (c) [72] . 72
Hình 3.5 Qui trình nhúng dùng chun hóa nh trên min contourlet [21] 73
Hình 3.6 Qui trình trích thông tin Normalize-contourlet [21] 75
Hình 3.7 nh và nh chun hóa 76
Hình 3.8 (a) Quay 30
o
(b) Kéo (c) Kéo và quay 30
o
(d) nh chun hóa 76
Hình 3.9 Tp nh thc nghim 77
Hình 3.10 Kt qu NC sau tn công các loi 83
Hình 3.11 Dung lng n so sánh gia các mô hình 84
Hình 3.12 Nhúng thông tin đng b 86
Hình 3.13 Qui trình nhúng thông tin 88
Hình 3.14 (a) Lena (b) c t chn (c) c t l 89
Hình 3.15 Bn logo nh phân đ nhúng W- 64x64 90
Hình 3.16 Các đim đc trng SIFT đc ánh x đi chiu, quay 60 đ . 90
Hình 3.17 Các đim đc trng SIFT nh Barbara (a) 131 đim (b) 44 đim 91
Hình 3.18 Dung lng nhúng ca các mô hình 92
Hình 3.19 So sánh đ trong sut ca các mô hình 92
Hình 3.20 Ba đim đc trng có ta đ đc dùng làm thông tin t đng b. 93
vii


Hình 3.21 Minh ha bc nhy delta cho hai vùng giá tr contourlet 95
Hình 3.22 Histograms ca mt s h s contourlet subband 95
Hình 3.23 Các chiu quét nh watermark 96
Hình 3.24 Tp nh gc dùng đ th nghim: 20 nh mc xám I
0
(512x512) 99
Hình 3.25 Các watermark W – logo nh phân (64x64) 98

Hình 3.26 So sánh bn vng di tn công 101
Hình 3.27 So sánh NC ca watermerk khi có tn công JPEG vi nh Peppers 101
Hình 3.28 Dung lng nhúng ca các mô hình 102
Hình 3.29 So sánh dung lng nhúng theo t l và PSNR 102
Hình 3.30 Tp nh gc [20] 105
Hình 3.31 Watermark là các logo (64x64) 105
Hình 3.32 So sánh dung lng và PSNR các mô hình 106
Hình 3.33 Watermark trích vi NC tt nht 106
Hình 4.1. Qui trình thc hin nhúng thông tin 111
Hình 4.2. Qui trình thc hin trích thông tin 112
Hình 4.3. B điu khin m MIMO gm nhiu MISO 113
Hình 4.4 Hàm hình thang mô t tp m Phân lp đ trong sut 115
Hình 4.5 Giá tr m ca PSNR = 38 115
Hình 4.6 Các tp m dung lng nhúng 116
Hình 4.7 Các tp m bn vng JPEG 116
Hình 4.8 Các tp m ca bin deltasub 116
Hình 4.9 Các tp m ca bin deltalow 117
Hình 4.10 S đ mô hình n thông tin kt hp h m 121
Hình 4.11 Kt qu thc thi mô hình vi 17 b tham s khác nhau. 122
Hình 4.12 Tp 20 nh gc 512 x 512 th nghim 123
Hình 4.13 Kt qu chng JPEG vi yêu cu ngi dùng 123
Hình 4.14 Tp logo th nghim (64×64) và (256×256) 124


viii

DANH SÁCH BNG

Bng 1.1 Phân loi mc đ tn công [70] 12
Bng 1.2 So sánh k thut n trên min không gian và tn s [56] 19
Bng 2.1 Lng t hóa các h s 40
Bng 2.2 Bng lng t đ gii mã 40
Bng 2.3 So sánh h s tng quan chun NC ( W và W’) sau hai giai đon trích . 51
Bng 2.4 So sánh giá tr h s tng quan chun vi Mohan [12] 52
Bng 2.5 So sánh PSNR vi Mohan [57] theo t l nhúng 56
Bng 3.1 Kt qu chng tn công vi bin đi bng Matlab và Photoshop 78
Bng 3.2 Kt qu chng tn công Stirmark 82
Bng 3.3 Dung lng nhúng 91
Bng 3.4 So sánh giá tr PSNR 92
Bng 3.5 Tính bn vng trc tn công (Sai s là BER) 93
Bng 3.6 Dung lng (Bits) 98
Bng 3.7 PSNR và WSRN 98
Bng 3.8 Thông tin watermark – logo 99
Bng 3.9 Tính đ bn vng sau tn công (da vào giá tr NC ca watermark) 99
Bng 3.10 So sánh kh nng chu đng tn công ti đa 100
Bng 3.11 Tn công (NC ca logo) 100
Bng 3.12 Kt qu trích watermark sau khi tn công (NC/NCC) 100
Bng 3.13 Dung lng nhúng ca h thng (bits) 105
Bng 3.14 Kt qu đo PSNR 105
Bng 3.15 Kt qu sau khi thc hin các dng tn công (NC ca watermark) 106
Bng 3.16 So sánh tn công (NC ca watermark) 107
Bng 4.1. Các tp m trong h thng 117
Bng 4.2. 17 mnh đ hp thành dng MISO cho đu ra deltalow 118

Bng 4.3. 17 mnh đ hp thành MISO cho đu ra s mc l 118
Bng 4.4 Thc nghim tn công vi các b tham s khác nhau 124
ix

DANH SÁCH THUT NG, T VIT TT VÀ KÍ HIU

CT
Bin đi contourlet (Contourlet transform)
DCT
Bin đi cosine ri rc (Discrete Cosine Transform)
DFB
Dàn lc có hng (Directional Filter Bank)
DFT
Bin đi fourier ri rc (Discrete Fourier Transform)
DICOM
nh y khoa (Digital Image and Communication in Medicine)
DWT
Bin đi wavelet ri rc (Discrete Wavelet Transform)
FT
Bin đi fourier (Fourier Transform)
HVS
H thng th giác (Human Visual System)
LP
Tháp Laplace (Laplace Pyramid)
LSB
K thut thay đi bit ít ý ngha nht (Least Significant Bit)
MSE
Sai s bình phng trung bình (Mean Square Error)
NC
H s tng quan chun (Normalized Cross Correlation)

NDFB
Dàn lc hng không gim mu
(Non Subsample Directional Filter Bank)
NPR
H s pixel láng ging (Neighborhood Pixel Ratio)
NSCT
Bin đi contourlet không gim mu
(Non Subsample Contourlet Transform)
PDFB
Dàn lc hng Pyramid (Pyramidal Directional Filter Bank)
PSNR
T s tín hiu đnh trên nhiu (Peak Signal to Noise Ratio)
QFB
Dàn lc Quincunx (Quincunx Filter Bank)
QIM
iu bin lng t (Quantized Index Modulation)
SSM
Tri rng ph (Spread Spectrum Modulation)
SVD
Phân tích giá tr đc bit (Singular Values Decomposition)
TICSCT
Bin đi contourlet đi xng vòng bt bin phép dch
(Translation-invariant circular symmetric contourlet transform)
WSNR
T s tín hiu trng s trên nhiu (Weighted Signal To Noise Ratio)

1

M U


Tóm tt: Ni dung phn m đu gii thiu tng quan v lnh vc n thông tin vào
ni dung đa phng tin, t đó phân tích lí do thc hin đ tài và xác đnh mc tiêu,
phm vi nghiên cu, đóng góp ca lun án. Ni dung tóm tt tng chng cng
đc trình bày  phn này.

Tng quan
Ngày nay, vi s bùng n v công ngh và thông tin thì các d liu s nh nh,
audio, video, phn mm, tài liu s hóa, v.v đc s dng ngày càng ph bin, tr
thành mt phn không th tách ri trong cuc sng và công vic hàng ngày ca
chúng ta. Các d liu s hóa đc truy cp, trao đi hoc phát tán mt cách d dàng
và nhanh chóng trên Internet. T đó, vic sao chép, sa đi hay gi mo ni dung
d liu s bt hp pháp đã tr thành mt vn đ đc nhiu cá nhân và t chc quan
tâm di góc đ ch s hu ln ngi s dng.
Vì vy, các cá nhân và t chc s hu hoc cung cp d liu buc phi có phng
thc bo v ni dung và bn quyn ca mình theo nhiu cách khác nhau. K thut
n thông tin đã đc đ xut nh mt gii pháp h tr hiu qu cho nhu cu cp
thit này. Hi tho quc t v lnh vc này đc t chc ln đu tiên vào nm 1996
[75] đã m đu cho các nghiên cu sâu rng v n thông tin nói chung và k thut
watermarking nói riêng. Hin nay, k thut n thông tin đang đc nghiên cu và
ng dng rng rãi vì nhng kh nng vt tri trong vic bo v ni dung, chng
gi mo và xác thc bn quyn [36, 71].
Các ng dng ca n thông tin đã đc đa t nghiên cu hàn lâm vào thc t kinh
doanh, đc thng mi hóa và phát huy hiu qu trong nhiu h thng thc t [36].
C th, thng kê ca t chc Digimarc cho thy đã có s bùng n trong vic s
dng watermarking  hai lnh vc xut bn tp chí và kinh doanh trên thit b di
2

đng. Nhiu nhà xut bn và công ty qung cáo đã s dng k thut n thông tin đ
nhúng watermark vô hình vào nhng hình nh, ni dung ca bn in. Trong nm
2011-2012, s lng watermark k thut s đc nhúng trong các bài xã lun và ni

dung qung cáo online trên tp chí tng so vi nm 2010 là 486%, riêng đi vi bài
báo online đã tng 300% và phát hành đn hn 37 triu đc gi.
Lí do thc hin đ tài
K thut n thông tin là lnh vc nghiên cu có liên quan đn nhiu lnh vc hc
thut nh: truyn thông, mã hóa, x lí tín hiu s. ã có nhiu kt qu nghiên cu
mi liên tc ra đi trong các lnh vc này. C th, trong lnh vc liên quan đn x lí
nh, đã có nhiu nghiên cu v k thut bin đi nh mi đc đ xut. Và khi có
vn đ mi phát sinh t nhng lnh vc liên quan trên thì k thut n thông tin cng
phi gii quyt các bài toán mi nhm đt đc kt qu tt hn.
Vn đ quan trng cn gii quyt trong k thut n thông tin là đm bo thc hin
thành công ba yu t mâu thun nhau: tính bn vng trc tn công, kh nng
nhúng nhiu thông tin mà vn đm bo tính trong sut. Vì vy, đ thng mi hóa,
các sn phm đc to ra t các phng pháp n thông tin phi tha mãn các ràng
buc v kinh t ln công ngh cho các yêu cu này. iu này cn đc tip tc
nghiên cu đ ngày càng đt đn mc tha mãn cao hn theo nhu cu thc t.

Biu đ th hin s lng công trình khoa hc công b hàng nm trong lnh vc n thông tin [61]
Theo thng kê ca nhóm nghiên cu Hussain Nyeem [61] v s bài báo công b
hàng nm trên các tp chí khoa hc uy tín trong lnh vc n thông tin, đây là lnh
vc thu hút ngày càng nhiu s quan tâm ca các nhà khoa hc vi s lng công
3

trình tng dn qua các nm. ó là do nhu cu s dng k thut n thông tin trong
thc t vn gia tng liên tc và cn đc đáp ng kp thi.
Mc tiêu đ tài
 tài tp trung nghiên cu xây dng và phát trin mô hình n thông tin mù trên nh
s, có kh nng đáp ng các yêu cu v tính bn vng, ci thin dung lng n và
đm bo tính vô hình. Trên c s ca các mô hình đã xây dng, tip tc phát trin
mô hình cho phép tip nhn yêu cu ngi dùng đ h thng đáp ng  mc tt nht
có th. C th nh sau:

1. Nghiên cu đ xut nguyên tc và mô hình nhúng d liu vào nh tnh s dng
bin đi contourlet làm min n thông tin.
2. Xây dng phng pháp ci tin mô hình đ tng kh nng chng tn công, đng
thi gi dung lng nhúng và cht lng hình nh  mc cao.  xut ng dng
k thut n thông tin vào trong thc t.
3. Nghiên cu và xây dng mô hình n thông tin có kh nng vn hành linh hot và
mm do theo yêu cu ca ngi s dng.
Phng pháp thc hin
 Kho sát nhng kt qu và thách thc trong lnh vc n thông tin, các yêu cu đ
xây dng mô hình bn vng.
 Nghiên cu phng pháp chn min n thông tin và k thut nhúng phù hp
nht theo đc trng nh s, xây dng các mô hình ci tin n thông tin trên nh
s gii quyt ba vn đ mâu thun.
 S dng kt qu thc nghim đt yêu cu sau khi sánh vi các kt qu ca các
nghiên cu cùng mc tiêu kt hp h m nhm gii quyt theo yêu cu ng dng
đng thi vn đm bo cân bng ba yu t mâu thun: bn vng, trong sut và
dung lng.
Phm vi nghiên cu
 tài tp trung nghiên cu mô hình n thông tin bn vng, trong sut và đt dung
lng cao trên nh mc xám. Thông tin dùng đ nhúng là nh nh phân. K thut dò
và trích thông tin thc hin theo dng mù. Tính bn vng ca mô hình đc xác
4

đnh da trên kh nng chng tn công x lí tín hiu s và tn công hình hc, tính
trong sut da trên đ đo PSNR. ng dng mô hình n thông tin trên nh y khoa.
Ý ngha khoa hc và thc tin
K thut n thông tin là mt vn đ có ý ngha khoa hc và thc tin, đc xem nh
gii pháp hu hiu đ b sung gii quyt các vn đ liên quan đn an toàn và bo
mt thông tin, đc bit đi vi các d liu dng s hóa. Nhiu nhóm nghiên cu trên
th gii đã và đang tp trung nghiên cu và trin khai thc hin trong lnh vc n

thông tin. Do đó, lun án có ngha khoa hc và thc tin cao, có tính thi s, nht là
trong thi đim hin ti khi các vn đ liên quan đn an ninh, an toàn thông tin 
các quc gia trên th gii nói chung và Vit Nam nói riêng rt đc quan tâm.

óng góp chính ca lun án
Các đóng góp chính ca tác gi bao gm đ xut mô hình n thông tin mù trên min
contourlet, bn vng vi tn công, có dung lng nhúng tt, vô hình, hot đng linh
hot da theo yêu cu ngi dùng; gm các vn đ c th sau:
1.  xut ci tin k thut n thông tin da trên min bin đi contourlet bng vic
phát trin thành công mô hình n thông tin mi, có kh nng gii quyt đc các
yêu cu v n thông tin an toàn và bn vng ([CT2], [CT3], [CT4]).
2.  xut mô hình nhm tng cng kh nng đáp ng các yêu cu ca bài toán n
thông tin trên nh  mc đ cao so vi các tip cn tng t ca các nhóm tác
gi khác v các yu t: bn vng, vô hình và dung lng nhúng ([CT5], [CT6],
[CT8], [CT9], [CT10]).
3.  xut mô hình n thông tin kt hp h m nhm khai thác ti đa nng lc h
thng, có kh nng đáp ng linh hot và đt hiu qu cao hn theo nhu cu ngi
dùng ([CT7]).
Tóm tt b cc và ni dung lun án
 Chng 1 trình bày các khái nim c bn và k thut chuyên sâu liên quan đn
k thut n thông tin trên nh, phép bin đi contourlet.
 Chng 2 trình bày mô hình n thông tin hai giai đon trên min contourlet
dùng thut toán n điu bin lng t QIM. ây là mô hình c bn, xác lp cách
5

thc vn hành QIM trên contourlet  vùng subband và lowband. V dung lng
- đ trong sut - kh nng chng tn công x lí nh, mô hình đt yêu cu khi
đánh giá và so sánh. Mô hình này s đc chúng tôi tip tc phát trin đ gii
quyt các yêu cu khác.
 Chng 3 trình bày các mô hình ci tin  chng 2 đ gii quyt thêm hai vn

đ chng tn công hình hc và tng cng dung lng nhúng. Sau đó, chúng tôi
áp dng mô hình này vào vic n thông tin bnh án cho nh y khoa.
 Chng 4 trình bày v h thng n thông tin kt hp vi h m. Da trên các kt
qu đã đt đc  các mô hình ri rc trong chng 2 và 3, chúng tôi hin thc
hóa và liên kt các mô hình trên thành mt h thng vn hành linh hot và mm
do theo yêu cu n thông tin ca ngi s dng cho mc đích bo v bn quyn
và xác thc ni dung.
 Cui cùng là phn kt lun, trình bày tóm tt nhng kt qu đt đc và hng
phát trin ca lun án.

6

Chng 1

TNG QUAN V K THUT N THÔNG TIN
VÀ BIN I CONTOURLET TRÊN NH S


Tóm tt: Ni dung trình bày tng quan v k thut n thông tin và nhng vn đ
liên quan. K tip là mô t bin đi hai chiu contourlet trên nh và cng là min
n thông tin đc chúng tôi s dng trong các mô hình n thông tin.

1.1 Gii thiu
Trong chng này, sau phn tóm lc v n thông tin và các khái nim liên quan,
chúng tôi s trình bày các phng pháp nhúng thông tin vào nh. Các mô hình n
thông tin chúng tôi đ xut trong các chng tip theo s s dng các kin thc c
s này. Phn k tip gii thiu bin đi contourlet, đây là min n thông tin mà
chúng tôi s dng xuyên sut trong các mô hình ca mình ti chng 2, 3 và 4.
1.2. Tng quan v n thông tin
1.2.1 Các khái nim c bn

Theo Husrev T. Sencar [33], n thông tin (data hiding) là k thut che giu bng
cách nhúng thông tin di dng d liu s vào trong mt tín hiu gc hay còn gi là
vt mang (host/cover signal), mà không to ra s bin đi v ni dung. Mt dng
khác ca n thông tin là steganography – đây là phng thc truyn thông tin da
trên mt kênh (hình 1.1). Tín hiu mang ni dung n (còn gi là stego) s đc lan
truyn qua mng Internet hay bt c mt phng tin nào khác.
7


Hình 1.1 S đ khi v truyn thông kiu truyn thng (a) và truyn thông tin n (b) [33]
Qui trình nhúng và trích thông tin c bn nh hình 1.2 và hình 1.3.




Hình 1.2 S đ nhúng thông tin [71]




Hình 1.3 S đ trích thông tin [71]
• Thông đip nhúng m (watermark signal): là mt thông tin cn nhúng.
• Vt mang I (host/cover signal): Là mt d liu dùng đ cha thông đip nhúng
m (còn gi là vt ch).
• Khóa k (stego-key): là phng tin điu khin tin trình giu d liu. Stego-key
dùng đ tng cng tính an toàn đng thi gii hn s phát hin thông đip mt,
Kênh truyn tín
hiu thông đip
Thông đip
nhn đc

Thông đip
(a) S đ truyn thông truyn thng
(b) Truyn thông bng n d liu
B phi
hp
Tín hiu
gc
Tín hiu
thông đip
Kênh truyn tín
hiu thông đip
B trích
Tín hiu thông
đip trích đc
nh
gc I
B nhúng
Thông đip
nhúng m
Khóa k
nh đã
nhúng W
nh W
B trích
Khóa k
Thông đip
trích m
nh gc I
(không mù)
8


đ phc hi thông đip mt khi có stego-key hoc các khóa dn xut t giá tr
ca stego-key.
• Steganography: K thut n thông tin nhm mc đích truyn thông đip hay tin
tc bí mt bng phng tin truyn thông. Thông đip nhúng m có th cha đng
thông tin quan trng hoc không liên quan gì đn vt mang.
• Watermarking: K thut n thông tin nhm mc đích chng minh s liên quan
đn vt mang nh bn quyn, xác thc đn nhng chi tit nh: tiêu đ, ngày gi
to, thông tin v ni dung, v.v Yêu cu chính ca k thut watermark là phi
bo đm vt watermark đc tìm thy ngay c khi vt mang b thay đi  mt
mc đ chp nhn ngha là không b phá hy hoàn toàn.
• Min n thông tin: Các thut toán n thng nhúng thông đip m trong min
không gian hay min bin đi tùy theo yêu cu và đc đim ca vt mang. Các
thut toán nhúng trên min bin đi thng an toàn và bn vng trc tn công
hn khi so vi min không gian. Các bin đi ph bin thng dùng đ n thông
tin là: DCT, DFT, DWT, v.v
1.2.2 Phân loi watermark
- Da vào tính cht hin hay n:
• Watermark "nhìn thy đc" (visible watermark): là vt thy vân trong các loi
tin giy, logo, ch ký xác nhn bn quyn trên vn bn … d liu nhúng lúc này
luôn đc hin th trên đi tng mang watermark.

Hình 1.4 Watermark "nhìn thy đc" [38]
• Watermark "trong sut" (invisible watermark): thông tin đc nhúng là bí mt và
c tình đ không ai nhn ra s tn ti ca chúng. ây là k thut đc ng dng
rng rãi trong thc t. Trong lun án này, chúng tôi tp trung nghiên cu các mô
hình n thông tin theo dng watermarking trong sut.
9



Hình 1.5 Watermark "trong sut" vi thông đip nhúng là logo
(Ngun: Digimarc.com)

Hình 1.6 Watermark "trong sut" vi thông đip nhúng là logo [38]
− Da vào đ bn vng:
• Watermark “d v” (Fragile-watermark): loi này s b phá hy nu d liu
nhúng b thay đi.
• Watermark "bn vng" (Robust-watermark): k thut nhúng đòi hi tính an
toàn cao, ngi dùng không có quyn s không th trích thông đip, tr khi
phá hy luôn đi tng vt mang.
− Da vào quá trình dò tìm hay trích thông tin:
• Trích không mù (Non-blind watermark): k thut này yêu cu có d liu gc
đ so sánh khi thc hin quá trình dò và trích thông đip.
• Trích mù (Blind watermark): ngc li vi trích không mù, k thut này
không cn d liu gc đ so sánh khi thc hin trích thông đip.
10

1.2.3 Nhng yêu cu c bn đi vi bài toán n thông tin
(a) Tính bn vng (Robustness)
Theo Pierre Moulin [67], mt phng pháp n thông tin đt yêu cu cn bn vng
trc nhng thao tác nhm bin đi vt mang có cha thông đip. Các h thng
đc xây dng trong thc t thng phi xác đnh trc nhng yêu cu v đ mnh
m hay kh nng chu tn công. T đó, h thng có th đa ra gii pháp thc hin
hiu qu nht.
Hn na, tùy thuc vào mc tiêu ca ng dng mà đc tính chng tn công s đc
xây dng trong quá trình thit k h thng n thông tin. Hình 1.7 minh ha dng tn
công bng các k thut bin đi hình hc trên nh, theo Ingemar J. Cox và cng s
[35]. Theo J. Cox, tính bn vng trc tn công hình hc là mt trong nhng thách
thc ln nht ca lnh vc n thông tin trên nh mà hin nay vn cha có nghiên
cu nào tìm ra cách gii quyt toàn vn.


Hình 1.7 Mt vài phép bin đi hình hc trên nh [9]
Khi xem xét đ sai lch t các thay đi do vô tình hay có ch ý, ta có hai loi tn
công sau:
• Loi th nht: cha mt s sai lch có th đc xem nh các dng nhiu b
sung trong d liu s.
• Loi th hai: do thay đi d liu v min không gian hay thi gian vi mc
đích to ra s sai lch.
11

Hai tn công da vào sai lch này thng đc xem là các tn công nhm phá hoi
và tn công đng b.
Tùy vào ng dng - yêu cu n thông tin, loi thông tin cn n - đi tng mang
thông tin n, có th lit kê các sai lch và kiu tn công nh sau [6, 71, 73]:
• Nâng cao cht lng tín hiu (tng đ tng phn, sa màu …).
• Nhiu (Gauss, đng b, lm đm ).
• Lc tuyn tính (lc lowpass, highpass, bandpass).
• Lc phi tuyn (lc morphology, median).
• Nén mt thông tin (JPEG, MP3).
• Các bin đi hình hc (dch, quay, bin đi t l, ).
• Gim d liu (ct, thay đi lc đ xám).
• Chuyn đi đnh dng cu trúc (WAVMP3, GIF  JPEG,…).
• Chuyn đi t dng analog sang digital và ngc li (D/A, A/D ).
• Nhúng nhiu vt watermark (đa watermarking).
Ngoài ra, có th phân loi tn công theo các mc tiêu khác nhau:
• Tn công đn gin: thng da trên nén, cng nhiu, ct và hiu chnh.
• Tn công vô hiu hóa vic phát hin (detection-disabling attacks): các bin
đi hình hc nh phóng to thu nh, dch chuyn hng, quay, ct hay hoán
v pixel, g b (removal) hoc chèn thêm (insertion).
• Tn công nhp nhng (ambiguity attack): loi tn công này thng xy ra

trong các h thng nhúng đa watermark. Có nhiu watermark đc nhúng
vào cùng vt ch, khin không th nhn ra đâu là watermark đu tiên.
• Tn công g b (removal attack): tn công thông đng (collusion), gim
nhiu hoc khai thác các yu đim thuc v khái nim ca thut toán
watermarking.
Fabien Petitcolas [70] đ xut mt s đnh mc đánh giá các dng tn công. Chúng
tôi đã dùng thang đo này làm c s đánh giá mc đ bn vng trong mô hình đ
xut khi đi sánh kt qu thc nghim vi các tác gi khác. Chi tit và phân loi
mc đ tn công đc trình bày trong bng 1.1 di đây.

12

Bng 1.1 Phân loi mc đ tn công [70]
Loi tn công Mc 0 Mc thp Va
Nén JPEG chun 100 – 90 100 – 75 100 – 50
Gim màu (Colour reduction GIF) 256 256 16
Ct (Cropping) 100– 90 % 100– 75 % 100–50 %
Hiu chnh Gamma (Gamma correction)

0,7 – 1,2 0,5 – 1,5
Kéo (Scale)

1/2 – 3/2 1/3 – 2
Quay (Rotate)

± 0 – 2
o
± 0–5, 90
o


Lt ngang (Horizontal flip)

N/A N/A
Nhiu đng b (Uniform noise)

1 – 5 % 1 – 15 %
Tng phn (Contrast)

± 0 – 10 % ± 0 – 25 %
 sáng (Brightness)

± 0 – 10 % ± 0 – 25 %
Lc trung v (Median)

N/A
3 × 3
(b) Tính trong sut/vô hình (Invisible)
Mt trong các yêu cu quan trng ca mt h thng n thông tin là che giu s tn
ti ca thông tin n. Vì th, vic thit k các h thng n nhm khai thác nhc
đim ca h tri giác con ngi, đ nng lng ca thông tin n phi  di hay trên
ngng cm nhn ca con ngi bng th giác và thính giác.
Theo nhóm tác gi Fabien Petitcolas [70], vic đánh giá đ trong sut bng PSNR là
tiêu chun đánh giá  mc thp.  mc cao hn là đánh giá da vào các thang đo
đ cm nhn. Tuy nhiên, trong hu ht các công trình nghiên cu đu dùng PSNR
làm thang đo đ trong sut, nên chúng tôi s dng thang đo này đ thun tin trong
so sánh và đánh giá kt qu thc nghim trong lun án.
Riêng nhóm tác gi Jirka Klaue
[43] đã đ xut thang đo và phân loi tính trong sut
theo PSNR thành bn mc nh sau:



×