Luận văn tốt nghiệp
NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP
PHÁT HIỆN BIÊN VÀ ỨNG DỤNG
Học viên
Mã số
Người hướng dẫn khoa học
: Nguyễn Mai Anh
: CH0302001
: TS. Đỗ Năng Tồn
Nội dung trình bày
Đặt vấn đề
Các phương pháp phát hiện biên
Ứng dụng biên trong xác định góc nghiêng văn bản
Kết luận
2
Đặt vấn đề
Mục tiêu của luận văn là nghiên cứu các phương pháp biểu diễn
biên, hệ thống hóa kiến thức về các phương pháp phát hiện biên,
và ứng dụng của nó trong xử lý ảnh văn bản
Biên là một vấn đề quan trọng trong xử lý ảnh vì các đặc điểm
trích chọn trong q trình phân tích ảnh chủ yếu dựa vào biên.
Điểm biên là nơi có sự thay đổi sự thay đổi đột ngột về mức xám.
Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh.
3
Các phương pháp phát hiện biên
Phương pháp phát hiện biên trực tiếp: làm nổi biên dựa vào sự
biến thiên về giá trị độ sáng của điểm ảnh. Kỹ thuật chủ yếu dùng
phát hiện biên ở đây là kỹ thuật đạo hàm.
Phương pháp phát hiện biên gián tiếp: nếu bằng cách nào đấy,
ta phân được ảnh thành các vùng thì đường phân ranh giữa các
vùng đó chính là biên. Việc phân vùng ảnh thường dựa vào kết
cấu bề mặt của ảnh.
Một số phương pháp khác: Cách tiếp cận theo mơ hình mặt dựa
vào việc thực hiện xấp xỉ đa thức trên ảnh gốc hay ảnh đã thực
hiện phép lọc Laplace. Cách tiếp cận tối ưu nhằm xác định một
hàm, làm giảm phương sai hoặc giảm một số điểm cực trị cục bộ
4
Phương pháp phát hiện biên trực tiếp
Phương pháp Gradient: cho kết quả là ảnh biên dựa vào kỹ
thuật xác định các điểm có mức xám thay đổi đột ngột nhờ kỹ
thuật lấy đạo hàm bậc nhất. Theo định nghĩa, gradient là một
véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm
ảnh theo 2 hướng x và y
f (x + dx, y) − f (x, y)
∂f (x, y)
= fx ≈
dx
∂x
∂f (x, y)
f (x, y + dy) − f (x, y)
= fy ≈
∂y
dy
Kỹ thuật Gradient: dùng toán tử gradient lấy đạo hàm
theo 2 hướng
Kỹ thuật la bàn: dùng toán tử la bàn lấy đạo hàm theo 8
hướng chính B, N, Đ, T, ĐB, TB, ĐN, TN.
5
Phương pháp phát hiện biên trực tiếp
-kỹ thuật gradientToán tử Robert
Áp dụng trực tiếp của công thức đạo hàm tại điểm (x,y). Với mỗi
điểm ảnh I(x,y) của I, đạo hàm theo x, theo y được ký hiệu tương
ứng bởi gx, gy được tính:
⎧ g x = I ( x + 1, y ) − I ( x, y )
⎨
⎩ g y = I ( x, y + 1) − I ( x, y )
Điều này tương đương với việc chập ảnh với 2 mặt nạ H1và H2:
⎡0
H1 = ⎢
⎣− 1
1⎤
0⎥
⎦
⎡− 1
H2 = ⎢
⎣0
0 ⎤
−1⎥
⎦
Áp dụng toán tử Robert với ảnh nguồn I ta có ảnh kết quả Ikq
như sau:
Ikq=I ⊗ H1 + I ⊗ H2
6
Phương pháp phát hiện biên trực tiếp
-kỹ thuật gradientToán tử Sobel
⎡− 1
H 1 = ⎢− 2
⎢
⎢− 1
⎣
⎡− 1
H 2 = ⎢0
⎢
⎢1
⎣
1⎤
2⎥
⎥
⎥
1⎦
0
0
0
−2
0
2
−1⎤
0 ⎥
⎥
1 ⎥
⎦
Toán tử Prewitt
⎡− 1
H 1 = ⎢− 1
⎢
⎢− 1
⎣
1⎤
1⎥
⎥
1⎥
⎦
0
0
0
⎡− 1
H 2 = ⎢0
⎢
⎢1
⎣
−1
−1⎤
0 ⎥
⎥
1 ⎥
⎦
0
0
Toán tử Frei-Chen
⎡ 0
Hr = ⎢ 2
⎢
⎢ 0
⎣
0
0
0
⎡− 1 − 2
⎢
Hc = ⎢ 0
0
⎢1
2
⎣
− 1⎤
2⎥
⎥
− 1⎥
⎦
− 1⎤
⎥
0⎥
1⎥
⎦
7
Phương pháp phát hiện biên trực tiếp
-kỹ thuật la bànToán tử Kirsch
⎡5
H1 = ⎢− 3
⎢
⎢
⎣− 3
5
⎡− 3
H 4 = ⎢− 3
⎢
⎢
⎣− 3
−3
0
−3
0
5
5 ⎤
−3⎥
⎥
⎥
−3⎦
⎡− 3
H 2 = ⎢− 3
⎢
⎢− 3
⎣
5
−3⎤
5 ⎥
⎥
5 ⎥
⎦
⎡− 3
H 5 = ⎢− 3
⎢
⎢5
⎣
−3
⎡5
H 7 = ⎢5
⎢
⎢5
⎣
−3
0
−3
−3⎤
−3⎥
⎥
−3⎥
⎦
0
−3
0
5
5 ⎤
5 ⎥
⎥
−3⎥
⎦
⎡− 3
H 3 = ⎢− 3
⎢
⎢− 3
⎣
−3⎤
−3⎥
⎥
5 ⎥
⎦
⎡− 3
H 6 = ⎢5
⎢
⎢
⎣5
⎡5
H8 = ⎢5
⎢
⎢− 3
⎣
5
0
−3
−3
0
−3
−3
0
5
5⎤
5⎥
⎥
5⎥
⎦
−3⎤
−3⎥
⎥
−3⎥
⎦
−3⎤
−3⎥
⎥
−3⎥
⎦
8
Phương pháp phát hiện biên trực tiếp
-phương pháp LaplaceToán tử Laplace được định nghĩa:
Δ2 f =
∂2 f ∂2 f
+
∂x 2 ∂y 2
≈[2f(x,y)-f(x-1,y)-f(x+1,y)]+[2f(x,y)-f(x,y-1)-f(x,y+1)]
≈f(x+1,y)+f(x-1,y)+f(x,y+1)+f(x,y-1)-4f(x,y)
3 kiểu mặt nạ hay dùng:
⎡0
H1 = ⎢1
⎢
⎢0
⎣
1
−4
1
0⎤
1⎥
⎥
0⎥
⎦
⎡1
H2 = ⎢1
⎢
⎢1
⎣
1
−8
1
1⎤
1⎥
⎥
1⎥
⎦
⎡−1
H3 = ⎢2
⎢
⎢−1
⎣
2
−4
2
−1⎤
2⎥
⎥
−1⎥
⎦
9
Phương pháp phát hiện biên trực tiếp
Original image
Sobel Operator
Laplacian Operator
Prewitt Operator
Frei-Chen Operator
Roberts Operator
Kirsh Operator
Robinson Operator
Hình ảnh nổi biên thu được từ việc áp dụng các toán tử
10
Phương pháp phát hiện biên gián tiếp
Phân vùng ảnh
Dò biên:
11
Phương pháp phát hiện biên gián tiếp
-Các kỹ thuật phân vùng ảnhVùng ảnh là một chi tiết, một thực thể trong tồn cảnh, nó là một
tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đấy:
mức xám, mức màu, độ nhám,…
Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám
tương đối đồng đều hay tính kết cấu (texture) tương đồng
Phân vùng ảnh dựa theo ngưỡng biên độ
Phân vùng theo miền đồng nhất
Phân vùng dựa theo kết cấu bề mặt (texture)
12
Phương pháp phát hiện biên gián tiếp
-Phân vùng ảnh dựa theo ngưỡng biên độĐặc tính đơn giản nhất và có thể hữu ích nhất của ảnh đó là biên độ
của các tính chất vật lý của ảnh như: độ phản xạ, độ truyền sáng, màu
sắc hoặc đáp ứng đa phổ. Như vậy có thể dùng ngưỡng biên độ để
phân vùng khi mà biên độ đủ lớn đặc trưng cho ảnh
Quá trình nhị phân hóa ảnh, T là ngưỡng cần xác định
⎧1
out ( x, y ) = ⎨
⎩0
in( x, y ) > T
in( x, y ) < T
H(k)
L mức xám
T2
T3
T4
T1
Lược đồ hình rắn lượn và cách chọn ngưỡng
13
Phương pháp phát hiện biên gián tiếp
-Phân vùng theo miền đồng nhấtKỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào
các tính chất quan trọng nào đó của miền. Việc lựa chọn các
tính chất của miền sẽ xác định tiêu chuẩn phân vùng. Tính
đồng nhất của một miền của ảnh là điểm chủ yếu xác định
tính hiệu quả của việc phân vùng
Phương pháp phân tách - cây tứ phân (split - quad trees)
Phương pháp hợp (merge)
Phương pháp tách - hợp (split - merge)
14
Phương pháp phát hiện biên gián tiếp
-Phân vùng dựa theo kết cấu bề mặt (texture)Tiếp cận thống kê: các đặc trưng của kết cấu sợi như độ thô,
độ mịn hay hướng có thể ước lượng nhờ các biến đổi ảnh bằng
kỹ thuật lọc tuyến tính.
Tiếp cận cấu trúc: kết cấu sợi có cấu trúc thuần nhất là những
phần tử sợi xác định, mà sự xuất hiện lặp đi lặp lại tuân theo
một luật tất định hay ngẫu nhiên nào đấy
Phân đoạn theo tính kết cấu
ACF
u(m,n)
Trích chọn đặc tính
Lọc dải tương quan
Phân tích lược đồ
Đặc tính sợi
Phân tích kết cấu sợi bằng dải tương quan
15
Phương pháp phát hiện biên gián tiếp
-kỹ thuật dò biênDò biên tổng quát
Bước 1: Xác định cặp nền vùng xuất phát
Bước 2: Xác định cặp nền vùng tiếp theo
Bước 3: Lựa chọn điểm biên
Bước 4: Lặp lại bước 2 cho đến khi gặp cặp nền vùng
xuất phát
16
Phương pháp phát hiện biên gián tiếp
-kỹ thuật dò biênDò biên theo quy hoạch động
"Con đường tối ưu giữa 2 điểm cho trước cũng là tối ưu giữa 2
điểm bất kỳ nằm trên đường tối ưu đó"
B
E
C
C
E
D
A
Minh họa nguyên lý Bellman
17
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GĨC NGHIÊNG VĂN BẢN
Bài tốn phát hiện góc nghiêng văn bản
Phát hiện góc nghiêng và hiệu chỉnh góc nghiêng văn bản dựa vào
chu tuyến ngồi của các đối tượng ảnh và phép biến đối Hough.
18
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GĨC NGHIÊNG VĂN BẢN
Thuật tốn phát hiện góc nghiêng văn bản
Xác định các đối tượng ảnh và
hình chữ nhật nhỏ nhất chứa nó
Lấy điểm trung bình cạnh đáy của
từng hình chữ nhật
XĐ
đường
thẳng
Áp dụng biến đổi Hough để xác định
đường thẳng từ tập điểm vừa tìm
được
T
F
Tìm các đối tượng ảnh mới
và các hình chữ nhật chứa nó
Xoay văn bản với góc
tìm được
Mơ tả thuật tốn phát hiện góc nghiêng văn bản
19
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GĨC NGHIÊNG VĂN BẢN
Sử dụng kỹ thuật dị biên để tìm các hình chữ nhật nhỏ
nhất chứa các đối tượng ảnh
Bước 1: Tìm điểm bắt đầu của một vùng và ta tìm biên
của vùng đó (chữ trên dịng)
Bước 2: Xác định điểm xuất phát của vùng tiếp theo, nếu
gặp một điểm đã xét tìm một điểm ảnh trên cùng dịng có
nhãn bằng với điểm đang xét và tiến trình tiếp tục duyệt
từ đây.
Bước 3: Nếu như chạy ngang đến một giới hạn nào đó
khơng thấy điểm bắt đầu của một vùng mới thì thốt khỏi
việc các hình chữ nhật nhỏ nhất chứa các chữ. Ngược lại
ta quay lại bước 2.
20
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Áp dụng biến đổi Hough xác định góc nghiêng văn bản
R1=x.cosϕ+y.sinϕ
o
y
Hough[ϕ][r1]=3
R2=x.cosϕ+y.sinϕ
ϕ
Hough[ϕ][r2]=4
x
Hình 3.2: Ứng dụng biến đổi Hough trong phát hiện góc nghiêng
21
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Thực nghiệm
Ảnh gốc
22
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Thực nghiệm
Ảnh thu được sau khi dò biên
23
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Thực nghiệm
Ảnh thu được sau khi quay ảnh theo chiều kim đồng hồ
24
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Thực nghiệm
Ảnh thu được sau khi chỉnh góc nghiêng
25
Kết luận
Với mục đích là hệ thống hóa kiến thức về các phương pháp
phát hiện biên và ứng dụng với bài toán xác định góc nghiêng
văn bản. Luận văn đã đạt được một số kết quả như sau:
Trình bày các phương pháp phát hiện biên trực tiếp dựa vào
đạo hàm, phương pháp phát hiện biên dựa trên các kỹ thuật dò
biên, các kỹ thuật phân vùng ảnh
Áp dụng phương pháp dò biên cho bài tốn xác định góc
nghiêng văn bản.
Cài đặt chương trình demo phát hiện góc nghiêng văn bản và
hiệu chỉnh lại văn bản.
26