Tải bản đầy đủ (.pdf) (61 trang)

Các phương pháp tách màu từ ảnh màu viết chương trình thử nghiệm với ảnh 24 bit

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.45 MB, 61 trang )





























KHOA CÔNG NGH THÔNG TIN
*************




LÊ THANH DIM




T NH MÀU. VI
TH NGHIM VI NH 24 BIT



KHÓA LUN TT NGHII HC








 2015































KHOA CÔNG NGH THÔNG TIN
*************


LÊ THANH DIM





T NH MÀU. VI
TH NGHIM VI NH 24 BIT


KHÓA LUN TT NGHII HC



ng dn khoa hc
ThS. NGUYN MINH HIN


 2015







LI C
Trong suốt thời gian học tập tại trƣờng Đại học Sƣ phạm Hà Nội 2, em
đã nhận đƣợc rất nhiều sự quan tâm, giúp đỡ của quý thầy, cô giáo và bạn bè.
Với lòng biết ơn sâu sắc nhất, em xin gửi lời cảm ơn đến quý thầy, cô giáo
khoa Công nghệ Thông tin đã truyền đạt những kiến thức, kinh nghiệm quý
báu của mình cho sinh viên.
Đặc biệt, em xin chân thành cảm ơn Th.s Nguyễn Minh Hiền, ngƣời
đã bỏ ra rất nhiều thời gian, công sức và nhiệt huyết để giảng dạy cho em
nhiều điều, giúp đỡ cho em không chỉ về kiến thức mà còn cả về tinh thần để

em có thể hoàn thành luận văn tốt nghiệp này.
Cuối cùng, em xin gửi lời cảm ơn chân thành đến gia đình và bạn bè,
những ngƣời luôn ở bên cạnh giúp đỡ cho em.
Đây là lần đầu tiên em làm một bài khóa luận tốt nghiệp nên không thể
tránh đƣợc những sai sót vì vậy rất mong nhận đƣợc sự góp ý của quý thầy,
cô giáo và các bạn để em có thể hoàn thiện tốt bài khóa luận của mình.
Hà Nội, tháng 4 năm 2015
Sinh viên


Lê Thanh Dim








L
Tên em là: LÊ THANH DIỄM
Sinh viên lớp: K37 – Tin học, khoa Công nghệ Thông tin, trƣờng Đại
học sƣ phạm Hà Nội 2.
Em xin cam đoan:
Luận văn là công trình nghiên cứu của cá nhân, dƣới sự hƣớng dẫn của
Thạc sĩ Nguyễn Minh Hiền.
Em cũng xin cam đoan rằng số liệu và kết quả nghiên cứu trong khóa
luận này là trung thực và không trùng lặp với các đề tài khác và các thông tin
trích dẫn trong khóa luận đã đƣợc chỉ rõ nguồn gốc.
Em xin chịu hoàn toàn trách nhiệm về nghiên cứu của mình.

Ngƣời cam đoan


Lê Thanh Dim












MC LC
MỞ ĐẦU 1
CHƢƠNG 1: CƠ SỞ LÝ THUYẾT 4
1.1. Tổng quan về xử lý ảnh số 4
1.1.1. Giới thiệu về xử lí ảnh số 4
1.1.2. Điểm ảnh và quan hệ giữa các điểm ảnh 8
1.1.3. Biểu diễn ảnh trên máy tính 10
1.2. Mô hình màu 10
1.2.1. Mô hình màu RGB (Red - Green - Blue) 11
1.2.2. Biểu thức màu 13
1.3. Kỹ thuật phân cụm ảnh 15
1.3.1. Khái niệm về phân cụm 15
1.3.2. Các yêu cầu của phân cụm 17
1.3.3. Những kỹ thuật tiếp cận trong phân cụm dữ liệu 19

1.3.4. Một số độ đo trong phân cụm 22
1.3.5. Mục đích của phân cụm 23
1.3.6. Tổng quan về phân cụm mờ 23
CHƢƠNG 2: CÁC THUẬT TOÁN TÁCH MÀU TỪ ẢNH MÀU 26
2.1. Thuật toán K - means 26
2.1.1. Mô tả bài toán 26
2.1.2. Thuật toán 26
2.2. Thuật toán Fuzzy c - means 31
2.2.1. Cơ sở thuật toán 31
2.2.2. Thuật toán FCM 32
2.3. Thuật toán Interval TypeII fuzzy c - means 33
2.3.1. Cơ sở thuật toán 33
2.3.2. Thuật toán tìm tâm cụm:
,,
j R L
v v v
35
2.3.3. Thuật toán Interval Type II Fuzzy C - means 36




CHƢƠNG 3: CHƢƠNG TRÌNH THỬ NGHIỆM 37
3.1. Giới thiệu bài toán 37
3.2. Hƣớng giải quyết bài toán 37
3.2.1. Phƣơng pháp chọn lớp màu tƣơng đƣơng 37
3.2.2. Phƣơng pháp tách màu bằng thuật toán phân cụm 41
3.3. Lựa chọn ngôn ngữ cài đặt 46
3.4. Một số kết quả 48
3.4.1. Tách màu bằng phƣơng pháp duyệt tuần tự 48

3.4.2. Tách màu bằng phƣơng pháp K – means 50
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 53
TÀI LIỆU THAM KHẢO 54



















DANH MC CÁC HÌNH V

Hình 1.1. Quá trình xử lý ảnh 4
Hình 1.2. Các bƣớc cơ bản trong một hệ thống xử lý ảnh 5
Hình 1.3. Minh họa về điểm ảnh 9
Hình 1.4. Lân cận các điểm ảnh của tọa độ (x, y) 9
Hình 1.5. Mô hình màu RGB 11
Hình 1.6. Ví dụ về không gian màu RGB 12

Hình 1.7. Sự cảm nhận cƣờng độ sáng của mắt ngƣời 13
Hình 1.8. Biểu đồ màu CIE 14
Hình 1.9. Mô tả phân cụm dữ liệu 16
Hình 2.1. Mô tả của thuật toán K – means 27
Hình 2.2. Chọn các đối tƣợng và trọng tâm ban đầu 28
Hình 2.3. Cập nhật lại vị trí trọng tâm lần 1 29
Hình 2.4. Cập nhật lại vị trí trọng tâm lần 2 30
Hình 3.1. Ma trận điểm ảnh 38
Hình 3.2. “Vết dầu loang” 40
Hình 3.3. Tách màu từ điểm có R = 0, G = 0, B = 0, sai số 0 49
Hình 3.4. Tách màu từ điểm có R = 202, G = 56, B = 20, sai số 20 49
Hình 3.5. Tách màu từ điểm có R = 252, G = 180, B = 89, sai số 80 50
Hình 3.6. Tách màu từ điểm có R = 184, G = 44, B = 17, sai số 120 50
Hình 3.7. Tách màu bằng thuật toán K – means với số cụm là 2 51
Hình 3.8. Tách màu bằng thuật toán K – means với số cụm là 3 51
Hình 3.9. Tách màu bằng thuật toán K – means với số cụm là 4 52
Hình 3.10. Tách màu bằng thuật toán K – means với số cụm là 5 52




1


1. Lí do ch tài
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là
một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhƣng tốc
độ phát triển khá nhanh, trở thành hƣớng nghiên cứu và quan tâm của rất
nhiều nhà khoa học cũng nhƣ ngƣời sử dụng. Sức mạnh của nó là khả
năng làm ngôn ngữ nối liền giữa ngƣời và máy, giữa ngƣời với ngƣời,

không phân biệt quốc gia, dân tộc hay ngôn ngữ. Trên cơ sở đó nó là công
cụ hữu ích cho rất nhiều ứng dụng khác nhau trên các lĩnh vực khác nhau
và nhất là lĩnh vực công nghệ thông tin.
Việc nghiên cứu tách màu từ ảnh màu đóng vai trò cơ sở, nền tảng
để thực hiện các thao tác xử lý ảnh nhƣ nén ảnh, phân đoạn ảnh. Trên thế
giới đã xuất hiện các nghiên cứu tách màu sử dụng nhiều phƣơng pháp
khác nhau với nhiều thuật toán khác nhau song mỗi phƣơng pháp đều có
những ƣu điểm và nhƣợc điểm riêng tùy thuộc vào từng bài toán cụ thể. Ở
Việt Nam, đây vẫn là một lĩnh vực khá mới mẻ cần nhiều thời gian nghiên
cứu để tìm ra phƣơng pháp tách màu tối ƣu nhất.
Sau một thời gian tìm hiểu, nghiên cứu cùng với những kiến thức mà
em đã đƣợc các thầy, cô giáo trong khoa Công nghệ Thông tin trƣờng Đại học
Sƣ phạm Hà Nội 2 trang bị, đặc biệt là đƣợc sự đồng ý của giảng viên hƣớng
dẫn, cô Nguyễn Minh Hiền, em đã chọn đề tài Các phương pháp tách màu
từ ảnh màu. Viết chương trình thử nghiệm với ảnh 24 bit làm khóa
luận của mình.
2. Mm v nghiên cu
- Thấy đƣợc một số ứng dụng thực tế của tách màu trong khoa học và
thực tiễn đời sống.
- Đƣa ra đƣợc một số thuật toán phân cụm dữ liệu phổ biến có trong
phƣơng pháp tách màu từ ảnh màu, đó là thuật toán K - means, Fuzzy C -
means, Interval Type II Fuzzy C - means.


2

- Chỉ ra đƣợc một số phƣơng pháp tách màu: Tách màu bằng phƣơng
pháp chọn lớp màu tƣơng đƣơng và tách màu bằng phƣơng pháp phân
cụm.
- Dựa trên các thuật toán và phƣơng pháp đã nghiên cứu viết chƣơng

trình thử nghiệm với ảnh 24 bit.
u
Phương pháp nghiên cứu lý luận:
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây
dựng cơ sở lý thuyết của đề tài và các biện pháp cần thiết để giải quyết các
vấn đề của đề tài.
Phương pháp chuyên gia:
Tham khảo ý kiến của các chuyên gia để có thể thiết kế chƣơng trình
phù hợp với yêu cầu thực tiễn. Nội dung xử lý nhanh đáp ứng đƣợc yêu cầu
ngày càng cao của ngƣời sử dụng.
Phương pháp thực nghiệm:
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận đƣợc
nghiên cứu và kết quả đạt đƣợc qua những phƣơng pháp trên.
4. ng và phm vi nghiên cu
Đối tượng nghiên cứu:
Đối tƣợng nghiên cứu là ảnh màu và các phƣơng pháp tách màu từ
ảnh màu.
Phạm vi nghiên cứu:
Nói tới tách màu là một thao tác ở mức thấp trong cả một quá trình
xử lý ảnh nhƣng nó lại có phạm vi lớn bởi có rất nhiều thuật toán khác
nhau. Khóa luận chỉ tìm hiểu trong phạm vi một số thuật toán và phƣơng
pháp đơn giản.
5. Ý c và thc tin c tài
- Ngày nay cùng với sự phát triển về các phƣơng tiện thu nhận và
biểu diễn ảnh, các ảnh màu đã hầu nhƣ thay thế hoàn toàn các ảnh mức


3

xám trong việc biểu diễn và lƣu trữ thông tin do các ƣu thế vƣợt trội hơn

hẳn. Do đó, các kỹ thuật, thuật giải mới thực hiện việc tách ảnh trên ảnh
màu liên tục đƣợc phát triển để đáp ứng các nhu cầu mới.
- Ứng dụng thực tế nhất trong việc in ấn, photoshop hay xa hơn là
nhận dạng (nhận dạng trong điều tra tội phạm, nhận dạng vết bớt trên cơ
thể ngƣời)
6. Cu trúc khóa lun
Ngoài phần mở đầu, kết luận và hƣớng phát triển thì cấu trúc khóa luận
gồm có các phần sau:
  lý thuyt
Chƣơng này giới thiệu tổng quan về xử lý ảnh số, mô hình màu và kĩ
thuật phân cụm ảnh.
: Các thut toán tách màu t nh màu
Chƣơng này trình bày một số thuật toán tách màu của kĩ thuật phân
cụm đó là K - means, Fuzzy C - means và Interval Type II Fuzzy C - means.
 nghim
Chƣơng này trình bày hai phƣơng pháp tách màu từ ảnh màu đó là
phƣơng pháp chọn lớp màu tƣơng đƣơng và phƣơng pháp phân cụm, trên cơ
sở đó viết chƣơng trình thử nghiệm với ảnh 24 bit.










4



1.1 . Tng quan v x lý nh s
1.1.1. Gii thiu v x lí nh s
Con ngƣời thu nhận thông tin qua các giác quan, trong đó thị giác đóng
vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần
cứng máy tính, xử lý ảnh và đồ hoạ đã phát triển một cách mạnh mẽ và có
nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan
trọng trong tƣơng tác ngƣời máy.
Quá trình xử lý ảnh đƣợc xem nhƣ là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận.






Hình 1.1. Quá trình xử lý ảnh
Từ “tốt hơn” ở đây mang ý nghĩa rằng ảnh sau khi xử lý sẽ đi theo đúng
ý đồ của chúng ta, tùy trƣờng hợp mà ta sẽ dùng những thuật toán nào để xử
lý ảnh.
Xử lý ảnh là một môn khoa học tƣơng đối mới mẻ so với các ngành
khoa học khác, nhất là trên quy mô rộng lớn. Tuy nhiên trong xử lý ảnh đã bắt
đầu xuất hiện hệ thống chuyên dụng dành riêng cho công tác xử lý ảnh, cũng
nhƣ đã xuất hiện nhiều hệ thống ứng dụng kết quả của hệ thống xử lý ảnh để
đáp ứng nhu cầu cho hệ thống đó.
Để dễ tƣởng tƣợng, xét các bƣớc cần thiết trong xử lý ảnh. Đầu tiên,
ảnh tự nhiên từ thế giới ngoài đƣợc thu nhận qua các thiết bị thu (Camera,
máy chụp ảnh). Trƣớc đây, ảnh thu qua camera là các ảnh tƣơng tự (Camera
Ảnh

Xử lý ảnh
Ảnh “tốt hơn”

Kết luận


5

ống kiểu CCIR). Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen
trắng đƣợc lấy ra từ camera, sau đó nó đƣợc chuyển trực tiếp thành ảnh số tạo
thuận lợi cho xử lý tiếp theo (Máy ảnh số hiện nay là một thí dụ gần gũi). Mặt
khác, ảnh cũng có thể tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy
quét ảnh. Hình 1.2 mô tả các bƣớc cơ bản trong xử lý ảnh.







Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh
Sơ đồ này bao gồm các thành phần sau:
- Phn thu nhn nh:
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thƣờng ảnh nhận qua
camera là ảnh tƣơng tự (Loại camera ống chuẩn với tần số 1/25, mỗi ảnh 25
dòng), cũng có loại camera đã số hoá (Loại CCD - Change Coupled Device)
là loại photodiot tạo cƣờng độ sáng tại mỗi điểm ảnh.
Camera thƣờng dùng là loại quét dòng, ảnh tạo ra có dạng hai chiều.
Chất lƣợng một ảnh thu nhận đƣợc phụ thuộc vào thiết bị thu, vào môi trƣờng
(Ánh sáng, phong cảnh).

- Tin x lý:
Sau bộ thu nhận, ảnh có thể nhiễu độ tƣơng phản thấp nên cần đƣa vào
bộ tiền xử lý để nâng cao chất lƣợng. Chức năng chính của bộ tiền xử lý là lọc
nhiễu, nâng độ tƣơng phản để làm ảnh rõ hơn, nét hơn.
Tiền xử


Phân
đoạn ảnh
Biểu diễn
và mô tả
Nhận
dạng và
nội suy
Thu nhận
Cơ sở tri thức


6

- n hay phân vùng nh:
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để
biểu diễn phân tích, nhận dạng ảnh. Ví dụ: Để nhận dạng chữ hoặc mã vạch
trên phong bì thƣ cho mục đích phân loại bƣu phẩm, cần chia các câu, chữ về
địa chỉ hoặc tên ngƣời thành các từ, các chữ, các số hoặc các vạch riêng biệt
để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ
gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất
nhiều vào công đoạn này.
- Biu din nh:
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh cộng với

mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng
thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính
chất để thể hiện ảnh gọi là trích chọn đặc trƣng gắn với việc tách các đặc tính
của ảnh dƣới dạng các thông tin định lƣợng hoặc làm cơ sở để phân biệt lớp
đối tƣợng này với đối tƣợng khác trong phạm vi ảnh nhận đƣợc. Ví dụ: Trong
nhận dạng ký tự trên phong bì thƣ, chúng ta miêu tả các đặc trƣng của từng ký
tự giúp phân biệt ký tự này với ký tự khác.
- Nhn dng và ni suy nh:
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thƣờng thu
đƣợc bằng cách so sánh với mẫu chuẩn đã đƣợc học từ trƣớc. Nội suy là phán
đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: Một loạt chữ số và nét gạch
ngang trên phong bì thƣ có thể đƣợc nội suy thành mã điện thoại. Có nhiều
cách phân loại ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô
hình toán học về ảnh đƣợc phân theo hai loại nhận dạng ảnh cơ bản:
+ Nhận dạng theo tham số.
+ Nhận dạng theo cấu trúc.
Một số đối tƣợng nhận dạng khá phổ biến hiện nay đang đƣợc áp dụng
trong khoa học và công nghệ là: Nhận dạng ký tự (Chữ in, chữ viết tay, chữ


7

ký điện tử), nhận dạng văn bản, nhận dạng vân tay, nhận dạng mã vạch, nhận
dạng mặt ngƣời…
-  tri thc:
Nhƣ đã nói ở trên, ảnh là một đối tƣợng khá phức tạp về đƣờng nét, độ
sáng tối, dung lƣợng điểm ảnh, môi trƣờng để thu ảnh phong phú kéo theo
nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các
phƣơng pháp toán học đảm bảo tiện lợi cho xử lý, ngƣời ta mong muốn bắt
chƣớc quy trình tiếp nhận và xử lý ảnh theo cách của con ngƣời. Trong các

bƣớc xử lý đó, nhiều khâu hiện nay đã xử lý theo các phƣơng pháp trí tuệ con
ngƣời. Vì vậy, ở đây các cơ sở tri thức đƣợc phát huy.
- Mô t (Biu din nh):
Từ hình 1.2, ảnh sau khi số hoá sẽ đƣợc lƣu vào bộ nhớ, hoặc chuyển
sang các khâu tiếp theo để phân tích. Nếu lƣu trữ ảnh trực tiếp từ các ảnh thô,
đòi hỏi dung lƣợng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng
dụng và công nghệ. Thông thƣờng, các ảnh thô đó đƣợc đặc tả lại hay đơn
giản là mã hoá theo các đặc điểm của ảnh đƣợc gọi là các đặc trƣng ảnh nhƣ:
Biên ảnh (Boundary), vùng ảnh (Region). Một số phƣơng pháp biểu diễn
thƣờng dùng:
+ Biểu diễn bằng mã chạy (Run - length code)
+ Biểu diễn bằng mã xích (Chaine - code)
+ Biểu diễn bằng mã tứ phân (Quad - tree code)
Biểu diễn bằng mã chạy:
Phƣơng pháp này thƣờng biểu diễn cho vùng ảnh và áp dụng cho ảnh
nhị phân. Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:
U(m, n) = 1 nếu (m, n) thuộc R.
U(m, n) = 0 nếu (m, n) không thuộc R.
Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n).Với
cách biểu diễn trên, một vùng ảnh đƣợc mô tả bằng một tập các chuỗi số 0
hoặc 1. Giả sử chúng ta mô tả ảnh nhị phân của một vùng ảnh đƣợc thể hiện


8

theo toạ độ (x, y) theo các chiều và đặc tả chỉ đối với giá trị “1” khi đó dạng
mô tả có thể là: (x, y) r; trong đó (x, y) là toạ độ, r là số lƣợng các bit có giá
trị “1” liên tục theo chiều ngang hoặc dọc.
Biểu diễn bằng mã xích:
Phƣơng pháp này thƣờng dùng để biểu diễn đƣờng biên ảnh. Một

đƣờng bất kỳ đƣợc chia thành các đoạn nhỏ. Nối các điểm chia, ta có các
đoạn thẳng kế tiếp đƣợc gán hƣớng cho đoạn thẳng đó tạo thành một dây xích
gồm các đoạn. Các hƣớng có thể chọn 4, 8, 12, 24,… mỗi hƣớng đƣợc mã hoá
theo số thập phân hoặc số nhị phân thành mã của hƣớng.
Biểu diễn bằng mã tứ phân:
Phƣơng pháp mã tứ phân đƣợc dùng để mã hoá cho vùng ảnh. Vùng
ảnh đầu tiên đƣợc chia làm bốn phần thƣờng là bằng nhau. Nếu mỗi vùng đã
đồng nhất (Chứa toàn điểm đen (1) hay trắng (0)), thì gán cho vùng đó một
mã và không chia tiếp. Các vùng không đồng nhất đƣợc chia tiếp làm bốn
phần theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất. Các mã
phân chia thành các vùng con tạo thành một cây phân chia các vùng đồng
nhất.
1.1.2. m nh và quan h gim nh
a. m nh
Gốc của ảnh là ảnh liên tục về không gian và độ sáng. Để xử lý bằng
máy tính ảnh cần phải đƣợc số hoá. Số hoá ảnh là sự biến đổi gần đúng một
ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (Không gian) và
độ sáng (Mức xám). Khoảng cách giữa các điểm ảnh đó đƣợc thiết lập sao
cho mắt ngƣời không phân biệt đƣợc ranh giới giữa chúng. Mỗi một điểm tùy
ý nhƣ vậy gọi là điểm ảnh hay gọi tắt là pixel. Trong khuôn khổ ảnh hai
chiều, mỗi pixel ứng với tọa độ (x,y).
Điểm ảnh là một phần tử của ảnh số tại tọa độ (x,y) với độ xám hoặc
màu nhất định. Kích thƣớc và khoảng cách giữa các điểm ảnh đó đƣợc chọn
thích hợp sao cho mắt ngƣời cảm nhận đƣợc sự liên tục về không gian và mức


9

xám hoặc màu của ảnh số gần nhƣ thật. Mỗi phần tử trong ma trận đƣợc gọi là
một phần tử ảnh.


Hình 1.3. Minh họa về điểm ảnh
b. Quan h gim nh
Một ảnh số giả sử đƣợc biểu diễn bằng hàm f(x,y). Tập con các điểm
ảnh là S; cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q. Chúng ta có một
số khái niệm sau:
- Các lân cn cm nh (Image neighbors):
Đông Tây
x
Nam

y

Bắc
Hình 1.4. Lân cận các điểm ảnh của tọa độ (x, y)

Giả sử có điểm ảnh p tại tọa độ (x, y), p có 4 điểm lân cận gần nhất theo
chiều đứng và chiều ngang (Có thể coi nhƣ lân cận 4 hƣớng chính Đông, Tây,
Nam, Bắc).
(x – 1, y – 1)
(x, y – 1)
(x + 1, y – 1)

(x – 1, y)
(x, y)
(x + 1, y)
(x – 1, y + 1)
(x, y + 1)
(x + 1, y + 1)



10

{(x - 1, y); (x, y - 1); (x, y + 1); (x + 1, y)} = N
4
(p)
Trong đó: số 1 là giá trị logic; N
4
(p) tập 4 điểm lân cận của p.
- Các lân cn chéo:
Các điểm lân cận chéo N
p
(p) (Có thể coi lân cận chéo là 4 hƣớng
Đông/Nam, Đông/Bắc, Tây/Nam, Tây/Bắc).
N
p
(p) = {(x + 1, y + 1); (x + 1, y - 1); (x - 1, y + 1); (x - 1, y - 1)}
Tập kết hợp: N
8
(p) = N
4
(p) + N
p
(p) là tập hợp 8 lân cận của điểm ảnh p.
1.1.3. ính
Ảnh có thể đƣợc biểu diễn dƣới dạng một ma trận 2 chiều, mỗi phần tử
của ma trận tƣơng ứng với một điểm ảnh. Lấy ví dụ bàn cờ, một bàn cờ gồm 8
ô vuông hàng ngang và 8 ô vuông cột đứng, giả sử mỗi ô tƣợng trƣng cho 1
pixel. Vậy bàn cờ có 8 x 8 = 64 ô vuông hay 64 pixel.
Trên hình 1.3 ta thấy màu sắc của các khối điểm ảnh là khác nhau, điều

này nói lên rằng mỗi điểm ảnh ngoài tọa độ nằm vùng của nó thì nó còn mang
theo một giá trị màu. Các điểm ảnh này đƣợc đặt gần nhau cùng với màu sắc
đi kèm tạo nên một hình ảnh nào đó.
Mỗi điểm ảnh có thể đƣợc biểu diễn bằng n bytes dƣới các hệ màu khác
nhau (RGB, HSV, YCrCb,…). Việc chuyển đổi giữa các hệ màu thông
thƣờng đƣợc thực hiện thông qua các phép biến đổi ma trận. Trong bài này
em sẽ giới thiệu các phƣơng thức chuyển đổi từ ảnh 24 bit RGB, sở dĩ chọn
ảnh 24 bit RGB là vì trong máy tính, ảnh đƣợc hiểu dƣới dạng không gian
màu RGB (Không gian màu số nguyên). Các bạn có thể xem màu điểm ảnh
bất kì bằng photoshop hay paint.
1.2. Mô hình màu
Phân tích ảnh liên quan đến việc xác định các số đo định lƣợng của ảnh
để đƣa ra một mô tả đầy đủ về ảnh. Các kỹ thuật đƣợc sử dụng ở đây nhằm
mục đích xác định biên của ảnh, phân vùng ảnh, Có nhiều kỹ thuật khác
nhau đƣợc sử dụng để tách biên ảnh nhƣ: Tách biên dựa vào lọc vi phân, dò
biên theo quy hoạch động, Tƣơng tự cũng có nhiều kỹ thuật phân vùng ảnh.


11

Từ ảnh thu đƣợc, ngƣời ta tiến hành các kỹ thuật tách hay hợp dựa theo các
tiêu chuẩn đánh giá nhƣ: Màu sắc, cƣờng độ xám,
1.2.1. Mô hình màu RGB (Red - Green - Blue)
Có thể nói đây là mô hình màu thông dụng nhất bao gồm ba màu: Red,
Green và Blue. Tổ hợp của các màu này tạo nên tập các màu khác. Cấu trúc
mô hình màu này đƣợc mô tả nhƣ hình 1.5.

Hình 1.5. Mô hình màu RGB
Khi thay đổi giá trị Red(R), Green(G), hay Blue(B) ta sẽ đƣợc một màu
khác. Giá trị của R, G, B dao động từ 0 - 255, tức là 256 giá trị, vừa bằng 2

8
,
vì vậy trong máy ngƣời ta dùng 1 byte để biểu diễn một giá trị màu R, hoặc
G, hoặc B. Vậy gọi là ảnh 24 bit RGB là vì 3 giá trị màu là 3 byte, mỗi byte là
8 bit vậy ta có 3 x 8 = 24 bit.
Lƣu ý: Trong thực tế, không phải lúc nào thứ tự của 3 bytes trong 1
điểm ảnh cũng là R - G - B, đôi khi thứ tự này có thể là B - G - R.


12


Hình 1.6. Ví dụ về không gian màu RGB
Có tám tính chất cơ bản quyết định hỗn hợp của ba màu:
1. Một điểm màu tổng hợp thì độc lập đối với độ sáng trên một phạm vi
rộng.
2. Độ sáng của một hỗn hợp các màu là tổng của các độ sáng riêng lẻ.
3. Bất kỳ một màu nào cũng đƣợc tạo ra bởi một hỗn hợp không nhiều
hơn ba màu thành phần.
4. Các màu thành phần không thể nhận ra đƣợc bằng mắt.
5. Một điểm màu có thể biểu diễn dƣới dạng biểu thức:
C = R(R) + G(G) + B(B)
Có nghĩa là R là đơn vị của (R), G là đơn vị của (G), B là đơn vị của (B),
khi tính tổng tạo ra một điểm với màu C.
6. Các màu đƣợc kết hợp theo luật cộng. Giả sử C1 kết hợp với C2 kết
hợp C3 kết hợp C4, thì C1 + C3 kết hợp C2 + C4. Quy tắc này đƣợc gọi là
luật Grassman.
7. Các màu kết hợp tuân theo luật trừ.
8. Các màu kết hợp tuân theo luật bắc cầu. Nếu C1 kết hợp C2 và C2 kết
hợp C3 thì C1 kết hợp với C3.



13

1.2.2. 
Các màu riêng RGB: Đỏ (Red), lục (Green), lam (Blue) là các màu
riêng vật lý đƣợc dùng trong các thí nghiệm vật lý thực sự. Các màu riêng này
không phải là duy nhất và ta có thể dùng các màu riêng khác để thay thế. Vào
năm 1938, CIE đã đƣa ra một tập các màu riêng không vật lý, ký hiệu là X, Y,
Z. Cải tiến chính trong tập màu này là độ sáng đƣợc đƣa ra trực tiếp nhƣ là
một màu riêng (Y). Y sẽ cho ta mức xám từ ảnh màu. Các màu riêng này
đƣợc rút ra từ các màu riêng vật lý theo biến đổi tuyến tính cho bởi:
X = 2.7690R + 1.7518G + 1.1300B
Y = 1.0000R + 4.5907G + 0.0601B
Z = 0.0000R + 0.0565G + 5.5943B











Hình 1.7. Sự cảm nhận cường độ sáng của mắt người
Các biểu thức này là đúng cho bất kỳ màu nào. Dựa trên các X, Y, Z sơ
đồ màu CIE đã đƣợc phát triển. Sơ đồ này là một không gian biểu diễn cho tất
cả các màu có phổ và tổng hợp của chúng nhƣ hình 1.7. Toạ độ màu rút ra từ:



(nm)


400 500 600 700
1.0
0.8
0.6
0.4
0.2
0
Tím
Lam
Lục
Vàng cam
Đỏ cam
Đỏ
Quan hệ độ sáng


14

D = X + Y + Z

y z
X Y Z
x
D D D
  


x + y + z = 1











Hình 1.8. Biểu đồ màu CIE
Trong sơ đồ CIE một loạt các màu có phổ đƣợc cho dọc theo đƣờng
cong, các góc biểu diễn cho ba màu riêng: Đỏ, lục, và lam. Gần trung tâm của
miền nằm trong tam giác các màu trở nên ít bão hoà hơn, biểu diễn cho hỗn
hợp màu. Màu trắng nằm tại điểm trung tâm w với toạ độ x = y = 0,3333.
Sơ đồ màu trên chứa các màu với cùng một độ sáng. Nếu độ sáng của
màu đƣợc cho bởi giá trị của z tại góc bên phải của mặt phẳng x - y, tất cả các
màu với độ sáng của nó sẽ có dạng nhƣ hình 1.7. Nếu độ sáng tăng lên, sơ đồ
màu sẽ trở nên rộng hơn và sẽ có nhiều chi tiết màu trông thấy. Tại các mức
.
Lục
(R)
(B)
Lam
Lục lam
Vàng
Đỏ

Trắng
Đỏ tƣơi
Các sắc màu khác
(G)
(G')
.
.
.
x
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
Bƣớc sóng
y



15

độ sáng thấp, các màu trở nên khó phân biệt và sơ đồ sẽ thu hẹp lại một điểm,
biểu diễn cho màu đen.
1.3. 
1.3.1. 
Phân cụm dữ liệu là quá trình nhóm một tập các đối tƣợng trong tập dữ
liệu vào các cụm sao cho các đối tƣợng thuộc cùng một cụm là tƣơng đồng
còn các đối tƣợng thuộc các cụm khác nhau sẽ không tƣơng đồng. Phân cụm
dữ liệu là một ví dụ của phƣơng pháp học không có thầy.
Không giống nhƣ phân lớp dữ liệu, phân cụm dữ liệu không đòi hỏi phải
định nghĩa trƣớc các mẫu dữ liệu huấn luyện. Vì thế, có thể coi phân cụm dữ
liệu là một cách học bằng quan sát, trong khi phân lớp dữ liệu là học bằng ví
dụ… Ngoài ra phân cụm dữ liệu còn có thể đƣợc sử dụng nhƣ một bƣớc tiền xử
lý cho các thuật toán khai phá dữ liệu khác nhƣ là phân loại và mô tả đặc điểm,
có tác dụng trong việc phát hiện ra các cụm.
Phân cụm có ý nghĩa rất quan trọng trong hoạt động của con ngƣời.
Ngay từ lúc bé, con ngƣời đã học cách làm thế nào để phân biệt giữa mèo và
chó, giữa động vật và thực vật và liên tục đƣa vào sơ đồ phân loại trong tiềm
thức của mình. Phân cụm đƣợc sử dụng rộng rãi trong nhiều ứng dụng, bao
gồm nhận dạng mẫu, phân tích dữ liệu, xử lý ảnh, nghiên cứu thị trƣờng Với
tƣ cách là một chức năng khai phá dữ liệu, phân tích phân cụm có thể đƣợc sử
dụng nhƣ một công cụ độc lập chuẩn để quan sát đặc trƣng của mỗi cụm thu
đƣợc bên trong sự phân bố của dữ liệu và tập trung vào một tập riêng biệt của
các cụm để giúp cho việc phân tích đạt kết quả.
Một vấn đề thƣờng gặp trong phân cụm là hầu hết các dữ liệu cần cho
phân cụm đều có chứa dữ liệu nhiễu do quá trình thu thập thiếu chính xác
hoặc thiếu đầy đủ, vì vậy cần phải xây dựng chiến lƣợc cho bƣớc tiền xử lí dữ

liệu nhằm khắc phục hoặc loại bỏ nhiễu trƣớc khi chuyển sang giai đoạn phân
tích cụm dữ liệu. Nhiễu ở đây đƣợc hiểu là các đối tƣợng dữ liệu không chính
xác, không tƣờng minh hoặc là các đối tƣợng dữ liệu khuyết thiếu thông tin


16

về một số thuộc tính Một trong các kỹ thuật xử lí nhiễu phổ biến là việc
thay thế giá trị các thuộc tính của đối tƣợng nhiễu bằng giá trị thuộc tính
tƣơng ứng. Ngoài ra, dò tìm phần tử ngoại lai cũng là một trong những hƣớng
nghiên cứu quan trọng trong phân cụm, chức năng của nó là xác định một
nhóm nhỏ các đối tƣợng dữ liệu khác thƣờng so với các dữ liệu trong cơ sở dữ
liệu, tức là các đối tƣợng dữ liệu không tuân theo các hành vi hoặc mô hình dữ
liệu nhằm tránh sự ảnh hƣởng của chúng tới quá trình và kết quả của phân cụm.
Mục tiêu của phân cụm là xác định đƣợc bản chất nhóm trong tập dữ liệu
chƣa có nhãn. Nhƣng để có thể quyết định đƣợc cái gì tạo thành một cụm tốt, n
ó
có thể chỉ ra rằng không có tiêu chuẩn tuyệt đối “tốt” mà có thể
không phụ thuộc vào kết qủa phân cụm. Vì vậy, nó đòi hỏi ngƣời sử dụng
phải cung cấp tiêu chuẩn này theo cách mà kết quả phân cụm sẽ đáp ứng yêu
cầu.
Quá trình phân chia một tập dữ liệu ban đầu thành các cụm dữ liệu thỏa
mãn:
- Các đối tƣợng trong một cụm “tƣơng tự” nhau.
- Các đối tƣợng khác cụm thì “không tƣơng tự” nhau.
Giải quyết vấn đề tìm kiếm, phát hiện các cụm, các mẫu dữ liệu trong
một tập hợp ban đầu các dữ liệu không có nhãn.

Hình 1.9. Mô tả phân cụm dữ liệu





17

Nếu X là một tập các điểm dữ liệu, Ci là cụm thứ i.
Ta có :

1.3.2. Các yêu cu ca phân cm
Phân cụm là một thách thức trong lĩnh vực nghiên cứu ở chỗ những
ứng dụng tiềm năng của chúng đƣợc đƣa ra ngay chính trong những yêu cầu
đặc biệt của chúng. Sau đây là những yêu cầu cơ bản của phân cụm trong khai
phá dữ liệu:
- Có kh  rng:
Nhiều thuật toán phân cụm làm việc tốt với những tập dữ liệu nhỏ chứa
ít hơn 200 đối tƣợng, tuy nhiên, một cơ sở dữ liệu lớn có thể chứa tới hàng
triệu đối tƣợng. Việc phân cụm với một tập dữ liệu lớn có thể làm ảnh hƣởng
tới kết quả. Vậy làm cách nào để chúng ta có thể phát triển các thuật toán
phân cụm có khả năng mở rộng cao đối với các cơ sở dữ liệu lớn.
- Kh i các kiu thuc tính khác nhau:
Nhiều thuật toán đƣợc thiết kế cho việc phân cụm dữ liệu có kiểu
khoảng (Kiểu số). Tuy nhiên, nhiều ứng dụng có thể đòi hỏi việc phân cụm
với nhiều kiểu dữ liệu khác nhau, nhƣ kiểu nhị phân, kiểu tƣờng minh (Định
danh - không thứ tự), và dữ liệu có thứ tự hay dạng hỗn hợp của những kiểu
dữ liệu này.
- Khám phá các cm vi hình dng bt k:
Nhiều thuật toán phân cụm xác định các cụm dựa trên các phép đo
khoảng cách Euclidean và khoảng cách Manhattan. Các thuật toán dựa trên
các phép đo nhƣ vậy hƣớng tới việc tìm kiếm các cụm hình cầu với mật độ và
kích cỡ tƣơng tự nhau. Tuy nhiên, một cụm có thể có bất cứ một hình dạng

nào. Do đó, việc phát triển các thuật toán có thể khám phá ra các cụm có hình
dạng bất kỳ là một việc làm quan trọng.
- Ti thing tri thc cnh các tham s u vào:
Nhiều thuật toán phân cụm yêu cầu ngƣời dùng đƣa vào những tham
1

j
k ngoailai
i
X C C C
CC
    
  


18

số nhất định trong phân tích phân cụm. Kết quả của phân cụm thƣờng khá
nhạy cảm với các tham số đầu vào. Nhiều tham số rất khó đế xác định, nhất là
với các tập dữ liệu có lƣợng các đối tƣợng lớn. Điều này không những gây trở
ngại cho ngƣời dùng mà còn làm cho khó có thể điều chỉnh đƣợc chất lƣợng
của phân cụm.
- Kh i d liu nhiu:
Hầu hết những cơ sở dữ liệu thực đều chứa đựng dữ liệu ngoại lai, dữ
liệu lỗi, dữ liệu chƣa biết hoặc dữ liệu sai. Một số thuật toán phân cụm nhạy
cảm với dữ liệu nhƣ vậy và có thể dẫn đến chất lƣợng phân cụm thấp.
- Ít nhy cm vi th t ca các d liu vào:
Một số thuật toán phân cụm nhạy cảm với thứ tự của dữ liệu vào, ví dụ
nhƣ với cùng một tập dữ liệu, khi đƣợc đƣa ra với các thứ tự khác nhau thì với
cùng một thuật toán có thể sinh ra các cụm rất khác nhau. Do đó, việc quan

trọng là phát triển các thuật toán mà ít nhạy cảm với thứ tự vào của dữ liệu.
- S chiu ln:
Một cơ sở dữ liệu hoặc một kho dữ liệu có thể chứa một số chiều hoặc
một số các thuộc tính. Nhiều thuật toán phân cụm áp dụng tốt cho dữ liệu với
số chiều thấp, bao gồm chỉ từ hai đến ba chiều. Ngƣời ta đánh giá việc phân
cụm là có chất lƣợng tốt nếu nó áp dụng đƣợc cho dữ liệu có từ ba chiều trở
lên. Nó là sự thách thức với các đối tƣợng dữ liệu cụm trong không gian với
số chiều lớn, đặc biệt vì khi xét những không gian với số chiều lớn có thể rất
thƣa và có độ nghiêng lớn.
- Phân cm ràng buc:
Nhiều ứng dụng thực tế có thể cần thực hiện phân cụm dƣới các loại
ràng buộc khác nhau. Một nhiệm vụ đặt ra là đi tìm những nhóm dữ liệu có
trạng thái phân cụm tốt và thỏa mãn các ràng buộc.
- D hiu và d s dng:
Ngƣời sử dụng có thể chờ đợi những kết quả phân cụm dễ hiểu, dễ lý
giải và dễ sử dụng. Nghĩa là, sự phân cụm có thể cần đƣợc giải thích ý nghĩa

×