1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
DƯƠNG THÚY HƯỜNG
NGHIÊN CỨU PHƯƠNG PHÁP NÂNG CAO
CHẤT LƯỢNG ẢNH TRONG
MIỀN KHÔNG GIAN
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN
HÀ NỘI - 2015
2
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
DƯƠNG THÚY HƯỜNG
NGHIÊN CỨU PHƯƠNG PHÁP NÂNG CAO
CHẤT LƯỢNG ẢNH TRONG
MIỀN KHÔNG GIAN
Ngành: Công nghệ thông tin
Chuyên ngành: Truyền dữ liệu và mạng máy tính
Mã số: Chuyên ngành đào tạo thí điểm
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS – TS NGÔ QUỐC TẠO
Hà Nội - 2015
3
LỜI CAM ĐOAN
Luận văn tốt nghiệp là một sản phẩm quan trọng, là sự tổng hợp các ý kiến
và kiến thức mà em đã được học và nghiên cứu trong suốt quá trình học tập của
mình tại trường. Ý thức được điều đó, với tinh thần làm việc nghiêm túc, tự giác
và sự lao động miệt mài của bản thân cùng với sự hướng dẫn tận tình của thầy
giáo PGS-TS Ngô Quốc Tạo, nay em đã hoàn thành luận văn của mình.
Em xin cam đoan luận văn này là sản phẩm do chính em nghiên cứu và
xây dựng nên. Các kết quả nêu trong luận văn là trung thực và chưa từng được ai
công bố trong bất kỳ công trình nào khác.
Em xin cam đoan rằng các thông tin trích dẫn trong luận văn đều đã được
chỉ rõ nguồn gốc.
Hà Nội, ngày 20 tháng 4 năm 2015
Học viên
Dương Thúy Hường
4
LỜI CẢM ƠN
Em xin chân thành cảm ơn các thầy cô trong Khoa Công nghệ thông tin,
trường Đại học Công nghệ, Đại học Quốc Gia Hà Nội và thầy giáo PGS-TS Ngô
Quốc Tạo đã tạo điều kiện cho em được học tập và nghiên cứu để hoàn thành
luận văn này.
Em cũng xin gửi lời cảm ơn tới các thầy cô, đồng nghiệp trong cơ quan
nơi em đang công tác đã tạo điều kiện cho em được học tập, nghiên cứu và hoàn
thành luận văn này.
Hà Nội, ngày 20 tháng 4 năm 2015
Học viên
Dương Thúy Hường
5
MỤC LỤC
LỜI CAM ĐOAN ................................................................................................1
LỜI CẢM ƠN .....................................................................................................4
MỤC LỤC ..........................................................................................................5
LỜI MỞ ĐẦU .....................................................................................................6
CHƯƠNG ITỔNG QUAN VỀ XỬ LÝ ẢNH SỐ VÀ NÂNG CAO CHẤT
LƯỢNG ẢNH TRONG MIỀN KHÔNG GIAN ..................................................7
1.1 Tổng quan về xử lý ảnh số .........................................................................7
1.1.1 Giới thiệu về xử lý ảnh số...................................................................7
1.1.2 Các ứng dụng của xử lý ảnh số ...........................................................9
1.1.3Các bước cơ bản trong xử lý ảnh số................................................... 10
1.2Nâng cao chất lượng ảnh trong miền không gian ...................................... 12
CHƯƠNG IIHIỆU CHỈNH ÁNH SÁNG HÌNH ẢNH ...................................... 20
2.1 Hiệu chỉnh ánh sáng dựa trên điểm ảnh ................................................ 20
2.1.1 Change-level Brightness ................................................................... 21
2.1.2 Change-level Contrast ...................................................................... 23
2.2 Hiệu chỉnh ánh sáng dựa trên histogram ............................................... 25
2.2.1 Histogram......................................................................................... 25
2.2.2 Cân bằng histogram .......................................................................... 25
2.3 Hiệu chỉnh ánh sáng sử dụng bộ lọc laplace............................................. 28
CHƯƠNG IIIKẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ ............................. 40
3.1 Tập dữ liệu .............................................................................................. 40
3.2 Mục tiêu .................................................................................................. 40
3.2 Đánh giá và so sánh ................................................................................. 40
3.2.1 Công cụ ............................................................................................ 40
3.2.2 Đánh giá và so sánh giữa các công cụ ............................................... 41
KẾT LUẬN ....................................................................................................... 57
TÀI LIỆU THAM KHẢO ................................................................................. 58
6
LỜI MỞ ĐẦU
Xử lý ảnh số là một trong những lĩnh vực phát triển rất nhanh của ngành
Công nghệ thông tin. Trong những năm trở lại đây, phần cứng máy tính và các
thiết bị liên quan xử lý ảnh số đã có sự tiến bộ vượt bậc về tốc độ tính toán, khả
năng lưu trữ và xử lý đã thúc đẩy nghiên cứu xử lý ảnh số ngày một đẩy mạnh
trong cả lý thuyết và ứng dụng. Khái niệm ảnh số đã trở nên thông dụng với hầu
hết mọi người trong xã hội và việc thu nhận ảnh số bằng các thiết bị cá nhân hay
chuyên dụng cùng với việc đưa vào máy tính xử lý đã trở nên đơn giản. Nó được
ứng dụng rộng rãi trong nhiều lĩnh vực khoa học và công nghệ. Chẳng hạn như
thị giác máy tính, rô-bốt, tìm kiếm tài liệu ảnh, hỗ trợ chẩn đoán hình ảnh y học,
thiết kế ảnh, giải trí … Xử lý ảnh số bằng máy tính đã giúp chúng ta thay đổi
cách cảm nhận và sử dụng máy tính, nó đã trở thành những công cụ trực quan
quan trọng không thể thiếu trong đời sống hằng ngày. Vì vậy xử lý ảnh số đã trở
thành một lĩnh vực nghiên cứu quan trọng trong các chuyên ngành Công nghệ
thông tin. Với mong muốn đóng góp nghiên cứu vào lĩnh vực này, em đã chọn đề
tài “Nghiên cứu phương pháp nâng cao chất lượng ảnh trong miền không gian”
làm luận văn tốt nghiệp của mình.
Luận văn được chia làm 3 chương:
Chương I – Tổng quan về xử lý ảnh số và nâng cao chất lượng ảnh trong
miền không gian
Chương II – Hiệu chỉnh ánh sáng hình ảnh
Chương III – Kết quả thực nghiệm và đánh giá
Mặc dù rất cố gắng nhưng luận văn của em chắc chắn không tránh khỏi
những thiếu sót. Em xin trân trọng tiếp thu tất cả ý kiến đóng góp của các thầy
cô.
Hà Nội, ngày20 tháng 4 năm 2015
Học viên
Dương Thúy Hường
7
CHƯƠNG I
TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ VÀ NÂNG CAO CHẤT LƯỢNG ẢNH
TRONG MIỀN KHÔNG GIAN
1.1 Tổng quan về xử lý ảnh số
1.1.1Giới thiệu về xử lý ảnh số
Xử lý ảnh số là một lĩnh vực mang tính khoa học và công nghệ. Nó là một
ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát
triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là
máy tính chuyên dụng riêng cho nó.
Cùng với ngôn ngữ tự nhiên, hình ảnh đã đóng góp một vai trò hết sức
quan trọng trong việc trao đổi thông tin. Tính trực quan của hình ảnh đã giúp cho
con người hiểu rõ và sâu sắc hơn các thông tin cần thu thập. Người ta đã chứng
minh được rằng, trong tất cả các kênh thu nhận thông tin của con người thì lượng
thông tin thu nhận qua kênh thị giác chiếm khoảng 70%. Hình ảnh là kết quả của
việc thu nhận và biểu diễn của năng lượng ánh sáng trải dài từ tia gamma (có
bước sóng nhỏ) đến sóng radio (có bước sóng lớn). Tuy nhiên, mắt người chỉ
cảm nhận được một vùng giới hạn rất nhỏ trong phổ điện từ. Ngược lại, máy tính
có thể đọc được một vùng rất rộng trong phổ điện từ, từ tia gamma đến sóng
radio. Nó có thể biểu diễn và xử lý những bức ảnh được sinh ra bởi những nguồn
mà con người không thể nhận biết được, như ảnh siêu âm, ảnh hồng ngoại, ảnh
trong vùng tia X, … Do đó xử lý ảnh có một phạm vi ứng dụng tương đối rộng.
Xử lý ảnh số là một trong những cách tiếp cận phân tích, tổng hợp hình
ảnh theo ý tưởng và mục đích của người sử dụng. Tuy xử lý ảnh là một trong
những khoa học còn tương đối mới so với nhiều ngành kho học khác, song
những năm gần đây, xử lý ảnh và đồ họa đã phát triển một cách mạnh mẽ và đã
gặt hái được nhiều thành công góp phần vào sự phát triển chung của ngành công
nghệ thông tin.
Các phương pháp xử lý ảnh số bắt nguồn từ hai ứng dụng: nâng cao chất
lượng thông tin hình ảnh đối với mắt người và xử lý số liệu cho máy tự động.
Một trong những ứng dụng đầu tiên của xử lý ảnh là nâng cao chất lượng ảnh báo
8
truyền qua cáp giữa London và NewYork vào những năm 192x. Thiết bị đặc biệt
mã hóa hình ảnh (báo), truyền qua cáp và khôi phục lại ở phía thu. Vấn đề nâng
cao chất lượng hình ảnh lúc đầu có liên quan đến việc lựa chọn quá trình in và
phân bố các mức sáng (tông và độ phân giải của ảnh).
Hệ thống đầu tiên (Bartlane) có khả năng mã hóa hình ảnh với 5 mức
sáng. Khả năng này tăng lên 15 mức vào 1929. Việc nâng cao chất lượng ảnh
bằng các phương pháp xử lý để truyền ảnh được nghiên cứu 35 năm sau đó. Năm
1964, các bức ảnh chụp mặt trăng được vệ tinh Ranger 7 (Mỹ) truyền về trái đất,
được xử lý bằng máy tính để sửa méo (gây ra do camera truyền hình đặt trên vệ
tinh ở các góc độ khác nhau). Các kỹ thuật cơ bản cho phép nâng cao chất lượng
hình ảnh như làm nổi đường biên và lưu hình ảnh.
Từ năm 1964 đến nay, phạm vi xử lý ảnh số lớn mạnh không ngừng. Các
kỹ thuật xử lý ảnh số hiện nay được sử dụng để giải quyết hàng loạt các vấn đề,
nhằm nâng cao chất lượng thông tin hình ảnh.
Trong y học, các thuật toán máy tính nâng cao độ tương phản, hoặc mã
hóa các mức sáng thành các màu để nội suy ảnh X-Quang và các hình ảnh y sinh
học dễ dàng.Các nhà địa vật lý sử dụng kỹ thuật tương tự để nghiên cứu các mẫu
vật chất từ vệ tinh.Các thuật toán nâng cao chất lượng ảnh và khôi phục hình ảnh
được sử dụng để xử lý hình ảnh giảm chất lượng. Trong thiên văn học, các
phương pháp xử lý ảnh nhằm khôi phục hình ảnh bị nhiễu hoặc bị mất do bóng
(artifacts) sau khi chụp. Trong vật lý và các lĩnh vực có liên quan, kỹ thuật máy
tính nâng cao được chất lượng ảnh trong các lĩnh vực như Plamas (có năng lượng
cao) và microscopy điện tử. Tương tự, người ta đã ứng dụng xử lý ảnh có kết quả
tốt trong viễn thám, sinh học, y tế hạt nhân, quân sự, công nghiệp … Nâng cao
chất lượng và khôi phục ảnh bị nhiễu là quá trình xử lý ảnh dùng cho mục đích
nội suy của mắt người. Lĩnh vực ứng dụng quan trọng thứ hai là xử lý ảnh số gắn
liền với việc cảm nhận của máy. Trong lĩnh vực thứ hai, các cố gắng đều tập
trung vào các quá trình trích thông tin ảnh và chuyển thành dạng thích hợp cho
xử lý máy tính. Những vẫn đề tiêu biểu của kỹ thuật xử lý ảnh số được ứng dụng
nhiều trong thực tế, có thể kể như: tự động nhận dạng đặc trưng, máy nhìn công
9
nghiệp để điều khiển và kiểm tra sản phẩm, nhận dạng mục tiêu quân sự, tự động
xử lý vân tay, hiển thị lên màn hình ảnh X-Quang và các mẫu máu, xử lý bằng
máy các hình ảnh chụp từ vệ tinh để dự báo thời tiết, nén ảnh để lưu và truyền
được nhiều hơn tín hiệu ảnh trong thông tin, máy tính, truyền hình thông thường
và truyền hình có độ phân giải cao.
1.1.2 Các ứng dụng của xử lý ảnh số
Xử lý ảnh số có nhiều ứng dụng trong thực tế.Một trong những ứng dụng
sớm nhất là xử lý ảnh từ nhiệm vụ Ranger 7 tại phòng thí nghiệm JetPulsion vào
những năm đầu của thập kỷ 60. Hệ thống chụp hình gắn trên tàu vũ trụ có một số
hạn chế về kích thước và trọng lượng, do đó ảnh nhận được bị giảm chất lượng
như bị mờ, méo hình học và nhiễu nền. Các ảnh đó được xử lý thành công nhờ
máy tính số. Hình ảnh của mặt trăng và sao hỏa mà chúng ta thấy trong tất cả các
tạp chí đều được xử lý bằng những máy tính số. Ngày nay, hầu hết các thông tin
ảnh đều được chuyển sang dạng ảnh số. Vì vậy, trong gần như tất cả các lĩnh vực
của các ngành kỹ thuật đều có ít nhiều liên quan đến ảnh số và sử dụng kỹ thuật
xử lý ảnh số.Ứng dụng của xử lý ảnh có khả năng tác động mạnh mẽ nhất đến
cuộc sống của chúng ta là lĩnh vực y tế. Soi chụp ảnh bằng máy tính dựa trên cơ
sở định lý cắt lớp (project slice) được dùng thường xuyên trong xét nghiệm lâm
sàng, ví dụ phát hiện và nhận dạng u não. Những ứng dụng y khoa khác của xử lý
ảnh gồm cải thiện ảnh X-Quang và nhận dạng đường biên mạch máu từ những
ảnh chụp bằng tia X.
Có những ứng dụng khác gần gũi hơn với cuộc sống gia đình là cải tiến
ảnh tivi. Hình ảnh trên màn hình tivi có các khuyết tật do độ phân giải hạn chế, bị
rung rinh, nhiều nền và trượt hình do đan dòng ở những mức độ khác nhau. Xử lý
ảnh số có tác động quyết định đến việc cải thiện chất lượng hình ảnh của những
hệ truyền hình hiện tại và làm phát triển những hệ truyền hình mới có độ phân
giải cao. Một vấn đề nữa của truyền thông video như hội nghị video, điện thoại
video là cần có dải tần rộng.Việc mã hóa thẳng chương trình video chất lượng
yêu cầu đến 100 triệu bit/giây. Nếu hy sinh một phần chất lượng và dùng các sơ
10
đồ mã hóa ảnh số thì có thể đưa ra thị trường những hệ truyền hình chất lượng đủ
rõ với nhịp bit chỉ dưới 100 nghìn bit/giây.
Người máy càng ngày càng đóng vai trò quan trọng trong công nghiệp và
gia đình. Chúng sẽ thực hiện những công việc rất nhàm chán hoặc nguy hiểm và
những công việc mà tốc độ và chính xác vượt quá khả năng của con người. Khi
người máy trở nên tinh vi hơn, thị giác máy tính sẽ đóng vai trò ngày càng quan
trọng. Người ta sẽ đòi hỏi người máy không những phát hiện và nhận dạng các
bộ phận công nghiệp, mà còn “hiểu” được những gì chúng “thấy” và đưa ra
những hành động phù hợp. Xử lý ảnh số có tác động rất lớn đến thị giác máy
tính.
Ngoài những ứng dụng trên thì còn bao gồm các ứng dụng trong các lĩnh
vực như điện tử gia đình, thiên văn học, sinh vật học, vật lý, nông nghiệp, địa lý,
nhân chủng học và nhiều lĩnh vực khác. Khả năng nhìn và nghe thấy là hai
phương tiện quan trọng nhất để con người nhận thức thế giới bên ngoài, do vậy
không có gì đáng ngạc nhiên khi mà xử lý ảnh số có nhiều khả năng ứng dụng,
không chỉ trong khoa học kỹ thuật mà còn cả trong mọi hoạt động khác của con
người.
1.1.3 Các bước cơ bản trong xử lý ảnh số
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò
quan trọng nhất. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử
lý ảnh và đồ họa phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc
sống.Xử lý ảnh và đồ họa đóng một vai trò quan trọng trong tương tác người máy.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm
cho ra kết quả mong muốn.Kết quả đầu ra của một quá trình xử lý ảnh có thể là
một ảnh “tốt hơn” hoặc một kết luận.
Hình 1.1 Quá trình xử lý ảnh
(Nguồn: Tài liệu tham khảo [1])
11
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như
là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối
tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2, …, cn).
Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều.
Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu
(như Camera, máy chụp ảnh). Trước đây, ảnh thu qua camera là các ảnh tương tự
(loại camera ống kiểu CCIR). Gần đây, với sự phát triển của công nghệ, ảnh màu
hoặc đen trắng được lấy ra từ camera, sau đó nó được chuyển trực tiếp thành ảnh
số tạo thuận lợi cho xử lý tiếp theo. Mặt khác, ảnh cũng có thể tiếp nhận từ vệ
tinh; có thể quét từ ảnh chụp bằng máy quét ảnh.Hình 1.2 dưới đây mô tả các
bước cơ bản trong một hệ thống xử lý ảnh.
Hình 1.2 Các bước cơ bản trong một hệ thống xử lý ảnh
(Nguồn: Tài liệu tham khảo [1])
Sơ đồ này bao gồm các thành phần như sau:
Thu nhận ảnh: Ảnh có thể được thu nhận trong thế giới thực qua máy
chụp hình, từ tranh ảnh thông qua máy quét hoặc từ vệ tinh qua các bộ cảm biến
bằng tín hiệu số hoặc tín hiệu tương tự.Ảnh có thể nhận qua camera màu hoặc
đen trắng. Thường ảnh nhận qua camera là ảnh tương tự (loại camera ống chuẩn
CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng có loại camera đã số hóa (như loại
CCD – Change Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi
điểm ảnh.
Tiền xử lý: Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần
đưa vào bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý
là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn.
12
Trích chọn đặc điểm:Vì lượng thông tin chứa trong ảnh là rất lớn, trong
khi đó đa số ứng dụng chỉ cần một số thông tin đặc trưng nào đó, cần có bước
trích chọn đặc điểm để giảm lượng thông tin khổng lồ ấy. Các đặc trưng của ảnh
thường gồm: mật độ xám, phân bố xác suất, phân bố không gian, biên ảnh.
Hậu xử lý: Nếu lưu trữ ảnh trực tiếp từ các ảnh thô theo kiểu bản đồ ảnh
đòi hỏi dung lượng bộ nhớ lớn, tốn kém mà nhiều khi không hiệu quả theo quan
điểm ứng dụng. Thông thường không biểu diễn toàn bộ ảnh tho mà tập trung đặc
tả các đặc trưng của ảnh như biên ảnh hay vùng ảnh.
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng
điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử
lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo
tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý
ảnh theo cách của con người. Trong các bước xử lý đó, nhiều khâu hiện nay đã
xử lý theo các phương pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri thức –
hệ quyết định được phát huy.
Đối sánh rút ra kết luận: Là quá trình đối sánh, phân lớp ảnh, nhận biết
được tên gọi của đối tượng. Kết quả của quá trình này phục vụ cho các mục đích
và các ứng dụng khác nhau.
1.2 Nâng cao chất lượng ảnh trong miền không gian
Khái niệm miền không gian ở đây được hiểu là tập hợp các điểm ảnh tạo
nên ảnh.Phương pháp xử lý ảnh trong miền không gian là phương pháp tác động
trực tiếp lên các điểm ảnh này. Quá trình xử lý ảnh trong miền không gian có thể
được biểu diễn bởi biểu thức sau:
g(x,y) = T(f(x,y))
(1.1)
trong đó f(x,y) là ảnh đầu vào, g(x,y) là ảnh đã được xử lý và T là một
toán tử trên f được định nghĩa trên một số lân cận của (x,y). Trong một số trường
hợp, T có thể là toán tử tác động lên một tập các ảnh đầu vào, chẳng hạn như tính
tổng tương ứng các điểm ảnh của K ảnh để giảm nhiễu.Nguyên lý để tiếp cận
trong việc xác định lân cận của điểm là sử dụng ảnh con hình vuông hoặc hình
chữ nhật có tâm là (x, y), như hình 1.2.
13
Hình 1.3 Lân cận của điểm ảnh trong hình vuông 3 × 3
(Nguồn: Tài liệu tham khảo [4])
Tâm của ảnh con này di chuyển theo từng điểm bắt đầu từ góc trái phía
trên. Toán tử T được áp dụng tại mỗi vị trí điểm ảnh để có được ảnh đầu ra g
tương ứng tại vị trí nó tác động. Dạng đơn giản nhất của T là tác động lên vùng
lân cận có kích thước 1 × 1 (tác động lên một điểm đơn). Trong trường hợp này,
g chỉ phụ thuộc vào một giá trị của f tại điểm (x,y), và lúc này ta có thể biểu diễn
T dưới dạng một hàm như sau:
s = T(r)
(1.2)
trong đó r và s là các biến tương ứng với cấp xám f(x, y) và g(x,y) tại
điểm (x,y).
Hình 1.4 Hàm biến đổi cấp xám dùng để tăng cường độ tương phản.
(Nguồn: Tài liệu tham khảo [4])
14
Trong hình 3.2(a), thì kết quả của phép biến đổi là một ảnh có độ tương
phản cao hơn ảnh gốc bằng cách làm tối những điểm ảnh có cấp xám nhỏ hơn m
và tăng độ sáng cho những điểm ảnh có cấp xám lớn hơn hoặc bằng m trong ảnh
gốc. Trong Hình 3.2(b) biểu diễn một dạng đặc biệt của hàm T, hàm phân
ngưỡng, là hàm chỉ cho ra kết quả 0 hoặc 1 (ảnh nhị phân).Điểm ảnh nào có cấp
độ xám nhỏ hơn m sẽ bị biến đổi thành phần nền (background, có cấp cám bằng
0) và ngược lại, những điểm ảnh có cấp độ xám lớn hơn hoặc bằng m sẽ được giữ
lại làm chi tiết của ảnh (đối tượng ảnh, có cấp xám bằng 1). Do việc xử lý một
điểm ảnh bất kỳ (trong một bức ảnh) chỉ phụ thuộc vào cấp xám tại điểm đó nên
người ta gọi kỹ thuật này là kỹ thuật xử lý điểm ảnh.
Thao tác xử lý ảnh trong miền không gian càng phức tạp khi lân cận được
áp dụng càng lớn (không chỉ là 1 x 1, 2 x 2 hay 3 x 3 mà là n x n với n ≥ 4).
Thông thường, người ta sử dụng một hàm của các giá trị cấp xám của ảnh f trong
một vùng lân cận xác định trước của mỗi điểm ảnh để xác định giá trị của g. Để
làm được điều này, mặt nạ (hay bộ lọc, hạt nhân, mẫu hoặc cửa sổ) là một công
cụ được sử dụng tương đối phổ biến. Một mặt nạ là một mảng 2 chiều có kích
thước tương đối nhỏ (tùy vào độ lớn của lân cận sử dụng, thường là ma trận 3 × 3
như trong hình 3.1).Các giá trị trong mảng 2 chiều này được gọi là hệ số của mặt
nạ. Kỹ thuật tăng cường ảnh dựa vào mặt nạ được gọi là xử lý mặt nạ hoặc lọc.
Hình 1.5 Một số phép toán toán tử xử lý ảnh phổ biến: (a) ảnh gốc
(b) ảnh tăng cường độ tương phản; (c) thay đổi thuộc tính màu “hue”;
(d) làm mờ ảnh; (e) quay ảnh.
15
1.3 Các không gian màu thông dụng
1.3.1 Màu sắc
Việc cảm nhận màu theo chủ quan thì phụ thuộc vào mắt con người,
cảmnhận màu khách quan phụ thuộc vào một lớp người thông qua chuẩn nào đó.
Mắt người có thể phân biệt được vài chục màu nhưng chỉ có thể cảm nhận được
hàng ngàn màu. Ba thuộc tính của một màu đó là: Sắc (Hue), Độ thuần khiết
(Saturation), và độ sáng hay độ chói (Itensity).
Trong xử lý ảnh và đồ họa, mô hình màu là một chỉ số kỹ thuật của một hệ
tọa độ màu 3 chiều với tập các màu nhỏ thành phần có thể trông thấy được trong
hệ thống tọa độ màu thuộc một gam màu đặc trưng. Ví dụ như mô hình màu
RGB (Red, Green, Blue): là một đơn vị tập các màu thành phần sắp xếp theo
hình lập phương của hệ trục tọa độ Đề các.
Mục đích của mô hình màu là cho phép các chỉ số kỹ thuật quy ước của
một số loại màu sắc thích hợp với các màu sắc của một số gam màu khác. Chúng
ta có thể nhìn thấy trong mô hình màu này, không gian màu là một tập hợp nhỏ
hơn của không gian các màu có thể nhìn thấy được, vì vậy một mô hình màu
không thể được sử dụng để định rõ tất cả có thể nhìn thấy. Sau đây, ta xem xét
một số mô hình hay được sử dụng nhất.
1.3.2 Không gian biểu diễn màu và hệ tọa độ màu
Không gian biểu diễn màu là không gian 3 chiều. Để đo lường một cách
định lượng ta có hệ tọa độ không gian (có nhiều hệ tọa độ không gian).
1.3.2.1 Hệ tọa độ màu RGB (Red, Green, Blue)
Màu đỏ, lục – xanh lá cây, lam – xanh da trời (RGB) được sử dụng phổ
biến nhất. Những màu gốc RGB được thêm vào những màu gốc khác điều đó tạo
nên sự đóng góp riêng của từng màu gốc được thêm cùng nhau để mang lại kết
quả. Tập hợp màu nhỏ thành phần sắp xếp theo khối lập phương đơn vị. Đường
chéo chính của khối lập phương với sự cân bằng về số lượng từng màu gốc tương
ứng với các mức độ xám với đen là (0,0,0), trắng (1,1,1), Màu Red là (1, 0, 0),
màu của Blue là (0, 0, 1), Red + Green = Yellow, Red + Green + Blue = White.
16
Hình 2.13 Mô hình màu RGB
(Nguồn: Tài liệu tham khảo [4])
1.3.2.2 Hệ tọa độ màu YUV (chuẩn PAL)
Hệ tọa độ này có 3 thành phần: Y là độ chói (cường độ sáng), U là độ sắc
màu cảm thụ và V là độ bão hòa. Các thành phần của hệ tọa độ này được biểu
diễn thông qua hệ tọa độ RGB như sau:
Y = 0.299 R + 0.587G + 0.114B
U = 0.493 (B-Y)
V = 0.877 (R-Y)
1.3.2.3 Hệ tọa độ màu YIQ
Hệ màu này được ứng dụng trong truyền hình màu băng tần rộng tại Mỹ,
do đó nó có mối quan hệ chặt chẽ với màn hình raster. YIQ là sự thay đổi của
RGB cho khả năng truyền phát và tính tương thích với ti vi đen trắng thế hệ
trước. Tín hiệu truyền sử dụng trong hệ thống NTSC (National Television
System Committee).
Sau đây là công thức biến đổi từ hệ RGB thành hệ YIQ:
17
Ma trận nghịch đảo của ma trận biến đổi RGB thành hệ YIQ được sử dụng
cho phép biến đổi từ hệ YIQ thành RGB.
1.3.2.4 Hệ tọa độ màu HSV (Hue, Staturation, Value)
Các mô hình màu RGB, CMY được định hướng cho phần cứng trái ngược
với mô hình màu HSV của Smith hay còn được gọi là mẫu HSB với B là
Brightness (độ sáng), được định hướng người sử dụng dựa trên cơ sở nền tảng
trực giác về tông màu, sắc độ và sắc thái mỹ thuật.
Hệ thống tọa độ có dạng hình trụ và tập màu thành phần của không gian
bên trong mô hình màu được xác định là hình nón hoặc hình chóp sáu cạnh như
trong hình 2.14. Đỉnh hình chóp là sáu cạnh khi V= 1 chứa đựng mối quan hệ
giữa các màu sáng và những màu trên mặt phẳng với V= 1 đều có màu sáng. Mô
hình màu này còn được gọi là hệ HSB với B là Brightness (độ sáng) dựa trên cơ
sở nền tảng trực giác về tông màu, sắc độ và sắc thái mỹ thuật.
Hue có giá trị từ 00→ 3600
S, V có giá trị từ 0 → 1
Hình 2.14 Hệ màu HSV
(Nguồn: Tài liệu tham khảo [4]
Ví dụ:
Red được biểu diễn (00, 1, 1)
Green được biểu diễn (1200,1,1)
18
Sắc màu (hue) hoặc H được đo bởi góc quanh trục đứng với màu đỏ là
0o,màu lục là 120o, màu lam là 240o (xem hình 1.7). Các màu bổ sung trong hình
chóp HSV ở 180o
đối diện với màu khác. Giá trị của S là một tập các giá trị đi từ 0 trên đường trục
tâm (trục V) đến 1 trên các mặt bên tại đỉnh của hình chóp sáu cạnh. Sự bão hòa
được đo tương đối cho gam màu tương ứng với mô hình màu này.
Mô hình màu dạng hình chóp sáu cạnh này đường cao V với đỉnh là điểm
gốc tọa độ (0,0). Điểm ở đỉnh là màu đen có giá trị tọa độ màu V= 0, tại các điểm
này giá trị của H và S là không liên quan với nhau. Khi điểm có S= 0 và V= 1 là
điểm màu trắng, những giá trị trung gian của V đối với S= 0 (trên đường thẳng
qua tâm) là các màu xám. Khi S=0 giá trị của H phụ thuộc được gọi bởi các quy
ước không xác định, ngược lại khi S khác 0 giá trị của H sẽ là phụ thuộc.
Như vậy một màu nào đó V= 1, S= 1 là giống như màu thuần khiết trong
mỹ thuật được sử dụng như điểm khởi đầu trong các màu pha trên. Thêm màu
trắng phù hợp để giảm S (không có sự thay đổi V) tạo nên sự thay đổi sắc thái
của gam màu. Sự chuyển màu được tạo ra bởi việc giữ S= 1 và giảm V tạo nên
sự thay đổi về sắc độ và tông màu tạo thành bởi việc thay đổi cả hai S và V.
1.3.2.5 Hệ tọa độ màu HLS
Mô hình màu HLS được xác định bởi tập hợp hình chóp sáu cạnh đôi của
không gian hình trụ.Sắc màu là góc quanh trục đứng cảu hình chóp sáu cạnh đôi
với màu đỏ tại góc 0o. Các màu sẽ xác định theo thứ tự giống như trong biểu đồ
CIE khi ranh giới của nó bị xoay ngược chiều kim đồng hồ: Màu đỏ, màu vàng,
màu lục, màu xanh tím, màu lam và đỏ thẫm. Điều này cũng giống như thứ tự
sắp xếp trong mẫu hình chóp sáu cạnh đơn
HSV.
19
Hình 2.15 Hệ màu HLS
(Nguồn: Tài liệu tham khảo [4])
Chúng ta có thể xem mẫu HLS như một sự biến dạng cảu mẫu HSV mà
trong đó mẫu này màu trắng được kéo hướng lên hình chóp sáu cạnh phía trên từ
mặt V= 1. Như với mẫu hình chóp sáu cạnh đơn, phần bổ sung của một màu sắc
được đặt ở vị trí 180o
hơn là xunh quanh hình chóp sáu cạnh đôi, sự bão hòa được đo xung quanh trục
đứng, từ 0 trên trục tới 1 trên bề mặt. Độ sáng bằng 0 cho màu đen và bằng 1 cho
màu trắng.
20
CHƯƠNG II
HIỆU CHỈNH ÁNH SÁNG HÌNH ẢNH
2.1 Hiệu chỉnh ánh sáng trong ảnh
Hiệu chỉnh ánh sáng trong ảnh là một kỹ thuật máy tính nhằm xử lý ánh
sáng trong ảnh nhằm đạt một mục đích nào đó của người sử dụng. Ánh sáng có
thể được làm tăng, giảm hoặc loại bỏ tác động của nó lên bức ảnh.
Hiệu chỉnh ánh sáng trong ảnh là một bước quan trọng trong hệ thống xử
lý ảnh. Thực hiện hiệu chỉnh ánh sáng tốt có thể tạo ra những lợi thế rất lớn cho
các công việc xử lý ảnh khác sau này.
Ảnh chụp cùng một cảnh có thể thay đổi rất nhiều bởi điều kiện ánh sáng
và góc chụp của camera. Chẳng hạn như chụp thẳng, chụp nghiêng, chụp ngược
sáng… Với điều kiện ánh sáng khác nhau, một số chi tiết trong ảnh sẽ bị biến đổi
màu sắc hoặc thậm chí bị mờ.
-
Nguồn sáng làm thay đổi màu sắc: ánh sáng chiếu vào một vật thể làm
mắt người nhận thấy một phần vật thể hoặc toàn vật thể có màu sắc khác.
-
Ánh sáng quá chói hoặc quá tối: ảnh chụp dưới điều kiện ánh sáng quá
sáng hoặc quá tối có thể gây ra ảnh bị mờ, nhiễu, mất chi tiết.
2.2 Các phương pháp hiệu chỉnh cổ điển
2.2.1Hiệu chỉnh ánh sáng dựa trên điểm ảnh
Hiệu chỉnh ánh sáng dựa trên điểm ảnh đượcmô tả trong hình 2.1 cho thấy
việc hiệu chỉnh ánh sáng dựa trên điểm ảnh được trải qua 2 bước đồng thời: thay
đổi cấp độ sáng và thay đổi độ tương phản của hình ảnh.
Change-level Brightness
Input
Output
Change-level Contrast
Hình 2.1 Hiệu chỉnh ánh sáng dựa trên điểm ảnh
21
Hình 2.2 (a) Ảnh gốc; (b) Ảnh hiệu chỉnh ánh sáng dựa trên điểm ảnh
Ảnh gốc được chụp vào buổi chiều trời nhiều mây âm u nên thiếu ánh
sáng, hiệu chỉnh ánh sáng dựa trên điểm ảnh đã làm cho ảnh tươi sáng hơn, độ
tương phản lớn hơn, hình ảnh sắc nét hơn.
Hình 2.3 (a) Ảnh gốc; (b) Ảnh hiệu chỉnh ánh sáng dựa trên điểm ảnh
2.2.1.1 Change-level Brightness
Một ảnh số được lưu trữ trên máy tính là một ma trận các điểm ảnh (hay
pixel). Ta xét một kiểu ảnh thông thường nhất là ảnh RGB, với ảnh này mỗi pixel
ảnh quan sát được là sự kết hợp của các thành phần màu R (Red), Green (Green)
và B (Blue). Sự kết hợp theo những tỉ lệ R, G, B khác nhau sẽ tạo ra vô số các
màu sắc khác nhau. Giả sử ảnh được mã hóa bằng 8 bit với từng kênh màu, khi
đó mỗi giá trị của R, G, B sẽ nằm trong khoảng [0, 255]. Như vậy ta có thể biểu
diễn tới 255*255*266 ~ 1.6 triệu màu sắc từ ba màu cơ bản trên.
22
Ma trận điểm ảnh của mỗi ảnh sẽ được biểu diễn như sau:
Cột 0
Cột 1
Cột m
Hàng0 0, 0
0, 0
0, 0
0, 1
0, 1
0, 1
0, m
0, m
0, m
Hàng1 1, 0
1, 0
1, 0
1, 1
1, 1
1, 1
1, m
1, m
1, m
Hàng2 2, 0
2, 0
2, 0
2, 1
2, 1
2, 1
2, m
2, m
2, m
Hàngn n, 0
n, 0
n, 0
n, 1
n, 1
n, 1
n,m
n,m
n,m
Hình 2.4 Ma trận điểm ảnh của ảnh RGB
Như vậy, mỗi ảnh sẽ có n hàng và m cột, trong đó m là chiều dài của ảnh
và n là chiều cao của ảnh. Mỗi pixel ở vị trí (i,j) trong ảnh sẽ tương ứng với 3
kênh màu kết hợp trong nó. Để truy xuất tới từng pixel ảnh với những kênh màu
riêng rẽ ta biểu diễn mỗi pixel như sau:
p(i,j)[k]
(2.1)
Trong đó: i, j là pixel ở hàng thứ i là cột thứ j
k là kênh màu, k = 0, 1, 2 tương ứng với kênh màu B, G, R
Giả sử f là một hàm biểu diễn cho một ảnh bất kỳ, f(x,y)[k] là giá trị của
pixel trong ảnh ở vị trí (x,y) với kênh thứ k. Đặt g là đáp ứng ảnh sau khi
Change-level Brightness, g(x,y)[k] có dạng:
g(x,y) = f(x,y)[k] + β
(2.2)
Như vậy, độ sáng của ảnh g đã thay đổi một lượng β. Dựa vào công thức
trên ta có thuật toán Change-level Brightness như sau:
for (i = 0; i < n; i++)
for (j = 0; j < m; j++)
for (k = 0; k < 3; k++)
g(x,y)[k] = f(x,y)[k] + β
(Nguồn: Tài liệu tham khảo [1])
Kết quả hình ảnh khi áp dụng Change-level Brightness
23
Hình 2.5 (a) Ảnh gốc; (b) Ảnh khi áp dụng Change-level Brightness
Ảnh khi áp dụng Change-level Brightness cho kết quả sáng hơn tuy nhiên
giảm độ tương phản và kém sắc nét hơn. Để khắc phục được nhược điểm này em
đã tiến hành thêm kỹ thuật Change-level Contrast để hình ảnh giữ được ưu điểm
sáng ảnh so với ảnh gốc nhưng không bị giảm độ tương phản và sắc nét.
2.2.1.2 Change-level Contrast
Khái niệm độ tương phản: ảnh số là tập hợp các điểm, mỗi điểm có giá trị
độ sáng khác nhau. Độ sáng để mắt người dễ cảm nhận ánh sáng không phải là
quyết định.Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng nhưng đặt trên hai
nền khác nhau cho cảm nhận khác nhau.Như vậy, độ tương phản biểu diễn sự
thay đổi độ sáng của đối tượng so với nền.Nói cách khác, độ tương phản là độ
nổi của điểm ảnh hay cùng ảnh so với nền.
Ảnh với độ tương phản thấp có thể do điều kiện sáng không đủ hay không
đều, hoặc do tính không tuyến tính hay biến động nhỏ của bộ cảm nhận ảnh. Để
điều chỉnh lại độ tương phản của ảnh, ta điều chỉnh lại biên độ trên toàn dải hay
trên dải có giới hạn bằng cách biến đổi tuyến tính biên độ đầu vào (dùng hàm
biến đổi là hàm tuyến tính) hay phi tuyến (hàm mũ hay hàm logarit). Khi dùng
hàm tuyến tính các độ dốc α, β, γ phải chọn lớn hơn một trong miền cần dãn. Các
tham số a, b (các cận) có thể chọn khi xem xét lược đồ xám của ảnh.
24
Lout
vb
va
0
a
b
Lin
Hình 2.6 Hình dạng của hàm biến đổi độ tương phản
Hàm Change-level Contrast có dạng như sau:
α*f(x,y)[k]
g(x,y) = β*f(x,y)[k] + va
0 ≤ f(x,y)[k]
a ≤ f(x,y)[k] < b
γ* f(x,y)[k] + vb
(2.3)
b ≤ f(x,y)[k] < L
(Nguồn: Tài liệu tham khảo [2])
Các giá trị α, β, γ xác định độ tương phản tương đối, L là số mức xám cực đại.
Nếu thay đổi độ tương phản bằng hàm tuyến tính ta có:
α = β = γ=1 ảnh kết quả trùng với ảnh gốc
α, β, γ > 1
tăng độ tương phản
α, β, γ < 1
giảm độ tương phản
Dựa vào công thức trên ta có thuật toán Change-level Contrast như sau:
for (i = 0; i < n; i++)
for (j = 0; j < m; j++)
for (k = 0; k < 3; k++)
g(x,y)[k] = α*f(x,y)[k]
(Nguồn: Tài liệu tham khảo [1])
25
Hình 2.7 (a) Ảnh gốc; (b) Ảnh áp dụng Change-level Contrast
2.2.2 Hiệu chỉnh ánh sáng dựa trên histogram
2.2.2.1 Histogram
Histogram của một ảnh là một biểu đồ nói lên mối quan hệ giữa các giá trị
của pixel ảnh và tần suất xuất hiện của chúng.Nhìn vào biểu đồ histogram ta có
thể đoán được một ảnh sáng tối như thế nào.
Nếu một ảnh có histogram lệch về phía phải biểu đồ, ta nói ảnh đó thừa
sáng.Nếu lệch về phía trái thì ảnh đó thiếu sáng.Hình 2.8 mô tả histogram của
một ảnh màu, ứng với mỗi kênh màu có một biểu đồ histogram riêng.
Hình 2.8 Histogram của ảnh màu RGB với 3 kênh màu
2.2.2.2 Cân bằng histogram
Cân bằng histogram (histogram equalization) là phương pháp làm cho
biểu đồ histogram của ảnh được phân bố một cách đồng đều. Đây là một biến đổi
khá quan trọng giúp nâng cao chất lượng ảnh.
Histogram là một hàm rời rạc đại diện cho tần số xuất hiện của tất cả các
mức xám trong hình ảnh.