Tải bản đầy đủ (.doc) (80 trang)

Xử lý tự động phiếu điều tra

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (752.47 KB, 80 trang )

KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
TRβƯỜNG ĐẠI HỌC VINH
KHOA CÔNG NGHỆ THÔNG TIN
***********
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC
Xử lý tự động phiếu điều tra
Giáo viên hướng dẫn : Lê Văn Bằng.
Sinh viên thực hiện : Lê Văn Vinh
Lớp : 43A CNTT
Vinh, 5-2006
--------
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
1
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
Lời nói đầu
Xử lý ảnh là một khoa học còn tương đối mới mẻ so với nhiều ngành
khoa học khác, nhất là trên quy mô công nghiệp, song trong xử lý ảnh đã bắt
đầu xuất hiện những máy tính chuyên dụng. Nhận dạng là một trong những bộ
phận quan trọng của xử lý ảnh và đã được ứng dụng rất hiệu quả trong nhiều lĩnh
vực khác nhau như y tế, quốc phòng, nghiên cứu vũ trụ.
Mục đích của khóa luận này là nghiên cứu và áp dụng xử lý ảnh vào việc
nhận dạng tự động phiếu điều tra. Từ đó làm nền tảng cho việc xây dựng và phát
triển hệ thống tổ chức điều tra.
Trong các cuộc điều tra, chúng tôi nhận thấy rằng: Việc xử lý kết quả điều
tra một cách thủ công thì rất tốn công sức, khả năng nhầm lẫn cao, đặc biệt là
trong các cuộc điều tra quy mô lớn. Ví dụ: trong một cuộc điều tra dân số, số phiếu
điều tra lên tới hàng trăm nghìn bản. Nếu công việc xử lý kết quả điều tra được tự
động hóa thì hiệu quả hơn rất nhiều.
Trên thực tế đã có một số hệ thống nhận dạng được cứng hóa phục vụ cho
một số mục đích nhất định như: các máy xác định kết quả bầu cử tổng thống ở
Mỹ…Và cũng có những sản phẩm phần mềm nhận dạng như : nhận dạng kết quả


chấm thi trắc nghiệm…Tuy vậy, những hệ thống này mang tính đặc thù cao, khó
áp dụng đồng thời cho nhiều mục đích khác nhau.
Do đó chúng tôi có ý tưởng xây dựng một hệ thống nhận dạng tự động phiếu
điều tra nhằm mục tiêu có được một hệ thống nhận dạng dễ áp dụng, dùng chung,
tốc độ nhanh, với độ chính xác cao.
Mặc dù tôi đã hết sức cố gắng trong việc thu thập và nghiên cứu tài
liệu, tìm hiểu ngôn ngữ cài đặt nhưng thời gian không cho phép và trình độ còn
hạn chế, bên cạnh đó thì tài liệu hết sức nghèo nàn nên sẽ không tránh khỏi sai sót.
Vì vậy, tôi rất mong nhận được sự đánh giá đóng góp, bổ sung và khuyến khích
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
2
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
của thầy giáo hướng dẫn, các thầy cô giáo trong khoa Công Nghệ Thông Tin cùng
các bạn để tôi có thể hoàn thành tốt khoá luận của mình.
Cuối cùng tôi xin bày tỏ lòng biết ơn chân thành tới sự hướng dẫn và
chỉ bảo tận tình của thầy giáo Lê Văn Bằng cùng các thầy cô giáo trong khoa
Công Nghệ Thông Tin đã giúp đỡ trong quá trình thực hiện khoá luận này.
Vinh, tháng 5 năm 2006.
Sinh viên thực hiện:
Lê Văn Vinh 43 A CNTT
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
3
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
Tóm tắt
Xử lý ảnh là một trong những lĩnh vực có nhiều ứng dụng thiết thực trong
thực tế. Khoá luận này trình bày một ứng dụng của xử lý ảnh vào tự động nhận
dạng phiếu trả lời trong các cuộc điều tra xã hội.
Chúng tôi nhận thấy đây là một hệ thống có nhiều ý nghĩa thực tiễn và có
khả năng ứng dụng cao.
Khoá luận trình bày về hệ thống xử lý tự động phiếu điều tra, bao gồm các

nội dung sau:
Chương 1 trình bày cơ sở lý thuyết của xử lý ảnh, bao gồm các khái niệm cơ
bản, các kỹ thuật thông dụng trong xử lý và nhận dạng ảnh.
Chương 2 đi sâu vào thiết kế phiếu điều tra và các thuật toán nhận dạng
phiếu điều tra.
Chương 3 khái quát về các chức năng của hệ thống xử lý phiếu điều tra.
Chương 4 trình bày các kết quả thực nghiệm của quá trình thiết kế mẫu và
nhận dạng phiếu trả lời câu hỏi điều tra.
Chương 5 là chương kết luận, nêu một số thành quả thu được và hướng phát
triển trong tương lai của đề tài.
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
4
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
Chương 1: Các vấn đề cơ bản trong xử lý ảnh
1.1. Tổng quan về một hệ thống xử lý ảnh
Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay một
hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta sẽ xem xét
các bước cần thiết trong xử lý ảnh.
Hình 1.1. Các giai đoạn chính trong xử lý ảnh
Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera.
Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu
CCIR), nhưng cũng có thể là tín hiệu số hóa (loại CCD – Charge Coupled Devide).
Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh,
tranh được quét trên scanner. Chi tiết về quá trình thu nhận ảnh sẽ được mô tả
trong mục 1.3. Tiếp theo là quá trình số hóa (Digitalizer) để biến đổi tín hiệu tương
tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển sang
giai đoạn xử lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước hết
là công việc tăng cường ảnh để nâng cao chất lượng ảnh. Do những nguyên nhân
khác nhau: có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu,

ảnh có thể bị suy biến. Do vậy cần phải tăng cường và khôi phục lại ảnh để làm nổi
bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
5
Scanner
Camera
Thu nhận
ảnh
Số hóa
Phân tích
ảnh
Nhận dạng
Hệ quyết
định
Lưu trữ
Lưu trữ
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
gốc – trạng thái trước khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện các
đặc tính như biên, phân vùng ảnh, trích chọn các đặc tính, v.v…
Cuối cùng, tùy theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng, phân
lớp hay các quyết định khác. Các giai đoạn chính của các quá trình xử lý ảnh có
thể mô tả như hình 1.1.
1.2 Các vấn đề cơ bản trong xử lý ảnh
Như đã đề cập trong phần giới thiệu, chúng ta đã thấy được một cách khái
quát các vấn đề chính trong xử lý ảnh. Để hiểu chi tiết hơn, trước tiên ta xem xét
hai khái niệm (thuật ngữ) thường dùng trong xử lý ảnh, đó là Pixel (phần tử ảnh)
và Grey level (mức xám), tiếp theo là tóm tắt các vấn đề chính.
1.2.1. Một số khái niệm
• Pixel (Picture Element): phần tử ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để

có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hóa ảnh. Trong quá trình
số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình
lấy mẫu (rời rạc hóa về không gian) và lượng hóa thành phần giá trị mà về nguyên
tắc bằng mắt thường không phân biệt được hai điểm kề nhau. Trong quá trình này,
người ta sử dụng khái niệm Picture element mà ta quen gọi hay viết là Pixel – phần
tử ảnh. Như vậy, một ảnh là một tập hợp các pixel. Ở đây cũng cần phân biệt khái
niệm pixel hay đề cập đến trong các hệ thống đồ họa máy tính. Để tránh nhầm lẫn
ta tạm gọi khái niệm pixel này là pixel thiết bị. Khái niệm pixel thiết bị có thể xem
xét như sau: khi ta quan sát màn hình (trong chế độ đồ họa), màn hình không liên
tục mà gồm nhiều điểm nhỏ, gọi là pixel. Mỗi pixel gồm một cặp tọa độ (x, y) và
màu.
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
6
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA

a. Ảnh với độ phân giải 72 dpi b. Ảnh với độ phân giải 36 dpi
Hình 1.2. Biểu diễn ảnh với độ phân giải khác nhau
Cặp tọa độ (x, y) tạo nên độ phân giải (resolution). Như màn hình máy tính
có nhiều loại với độ phân giải khác nhau: màn hình CGA có độ phân giải là 320 x
320; màn hình VGA là 640 x 350,…
Như vậy, một ảnh là một tập hợp các điểm ảnh. Khi được số hóa, nó thường
được biểu diễn bởi bảng hai chiều I(n, p): n dòng và p cột. Ta nói ảnh gồm n x p
pixels. Người ta thường ký hiệu I(x, y) để chỉ một pixel. Hình 1.2 cho ta thấy việc
biểu diễn một ảnh với độ phân giải khác nhau. Một pixel có thể lưu trữ trên 1, 4, 8
hay 24 bit.
• Gray level: Mức xám
Mức xám là kết quả sự mã hóa tương ứng một cường độ sáng của mỗi điểm
ảnh với một giá trị số - kết quả của quá trình lượng hóa. Cách mã hóa kinh điển
thường dùng 16, 32 hay 64 mức. Mã hóa 256 mức là phổ dụng nhất do lý do kỹ
thuật. Vì 2^8 = 256 (0, 1, …, 255), nên với 256 mức, mỗi pixel sẽ được mã hóa bởi

8 bit.
1.2.2. Biểu diễn ảnh
Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của ảnh là
pixel. Nhìn chung có thể xem một hàm hai biến chứa các thông tin như biểu diễn
của một ảnh. Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lượng các
tính chất của hàm này. Trong biểu diễn ảnh cần chú ý tính trung thực của ảnh
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
7
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
hoặc các tiêu chuẩn “thông minh” để đo chất lượng ảnh hoặc tính hiệu quả của các
kỹ thuật xử lý.
Việc xử lý ảnh số yêu cầu ảnh phải được mẫu hóa và lượng tử hóa. Thí dụ
một ảnh ma trận 512 dòng gồm khoảng 512 x 512 pixel. Việc lượng tử hóa ảnh là
chuyển đổi tín hiệu tương tự sang tín hiệu số (Analog Digital Convert) của một ảnh
đã lấy mẫu sang một số hữu hạn các mức xám.
Một số mô hình thường được dùng trong biểu diễn ảnh: mô hình toán, mô
hình thống kê. Trong mô hình toán, ảnh hai chiều được biểu diễn nhờ các hàm hai
biến trực giao gọi là các hàm cơ sở. Với mô hình thống kê, một ảnh được coi như
một phần tử của một tập hợp đặc trưng bởi các đại lượng như: kỳ vọng toán học,
hiệp biến, phương sai, moment.
1.2.3. Tăng cường ảnh – khôi phục ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó gồm một
loạt các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu, v.v…
2.2.4. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta
muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc
tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với

nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái,
chữ số, chữ có dấu).
Ngoài ra, hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng
nơron đang được áp dụng và cho kết quả khả quan.
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
8
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
1.3. Thu nhận ảnh
1.3.1. Thiết bị thu nhận ảnh
Các thiết bị thu nhận ảnh có thể cho ảnh trắng đen B/W (Black & White) với
mật độ từ 400 đến 1600 dpi (dot per inch) hoặc ảnh màu 600 dpi. Với ảnh B/W
mức màu là 0 hoặc 1. Với ảnh đa cấp xám, mức xám biến thiên từ 0 đến 255. Ảnh
màu, mỗi điểm ảnh lưu trữ trong 3 bytes và do đó ta có 2
3x8
màu (cỡ 16,7 triệu
màu).
Khi dùng scanner, một dòng photodiot sẽ quét ngang ảnh (quét theo hàng)
và cho ảnh với độ phân giải ngang khá tốt. Đầu ra của scanner là ảnh ma trận số
mà ta quen gọi là bản đồ ảnh (ảnh Bitmap), bộ số hóa (digitalizer) sẽ tạo ảnh vectơ
có hướng.
Trong xử lý ảnh bằng máy tính, ta không thể không nói đến thiết bị monitor
(màn hình) để hiện ảnh. Monitor có nhiều loại khác nhau:
- CGA: 640 x 320 x 16 màu,
- EGA: 640 x 350 x 16 màu,
- VGA: 640 x 480 x 16 màu,
- SVGA: 1024 x 768 x 256 màu.
Với ảnh màu, có nhiều cách tổ hợp màu khác nhau. Theo lý thuyết màu do
Thomas đưa ra từ năm 1802, mọi màu đều có thể tổ hợp từ 3 màu cơ bản: Red
(đỏ), Green (lục) và Blue (lơ).
Thiết bị ra ảnh có thể là máy đen trắng, máy in màu hay máy vẽ (ploter).

Máy vẽ cũng có nhiều loại: loại dùng bút, loại phun mực.
Nhìn chung, các hệ thống thu nhận ảnh thực hiện hai quá trình:
- Cảm biến: biến đổi năng lượng quang học (ánh sáng) thành năng lượng điện.
- Tổng hợp năng lượng điện thành ảnh.
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
9
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
1.3.2. Biểu diễn màu
Ánh sáng màu là tổ hợp của ánh sáng đơn sắc. Mắt người chỉ có thể cảm
nhận được vài chục màu, song lại có thể phân biệt được hàng ngàn màu. Có 3
thuộc tính chủ yếu trong cảm nhận màu:
- Brighness: sắc màu, còn gọi là độ chói.
- Hue: sắc lượng, còn gọi là sắc thái màu.
- Saturation: độ bão hòa.
Với nguồn sáng đơn sắc, độ hue tương ứng với bước sóng λ. Độ bão hòa
thay đổi nhanh nếu ta thêm lượng ánh sáng trắng. Hình 2.3 mô tả mối liên quan
giữa những các đại lượng trên và 3 màu chủ yếu R, G và B.
Với điểm W* cố định, các ký hiệu G, R, B chỉ vị trí tương đối của các phổ
màu đỏ, lục và lơ. Do sự tán sắc ánh sáng mà ta nhìn rõ màu. Theo Maxwell, trong
võng mạc có 3 loại tế bào hình nón cảm thụ 3 màu
cơ bản ứng với 3 phổ hấp thụ S1(
λ
), S2(
λ
) và S3(
λ
);
λ
min
= 380 nm;

λ
max
= 780 nm.
- Một màu bất kỳ sẽ là một điểm trên vòng
tròn.
- Nếu White và Black là như nhau thì đường
tròn là lớn nhất và R là điểm bão hòa.
- S thay đổi theo bán kính
- H thay đổi theo góc
θ
.
- W* là sắc màu. Hình 1.3. Hệ tọa độ màu RGB
1.3.3. Hệ tọa độ màu
Tổ chức y tế về chuẩn hóa màu CIE (Commision Internationalé d’Eclairage)
đưa ra một số các chuẩn để biểu diễn màu. Các hệ này có các chuẩn riêng. Ở đây
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
10
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
chỉ đề cập đến chuẩn mầu CIE-RGB (hệ tọa độ dùng 3 màu cơ bản). Như đã nêu
trên, một màu là tổ hợp của các màu cơ bản theo một tỉ lệ nào đấy. Người ta dùng
hệ tọa độ ba màu R-G-B (tương ứng với hệ tọa độ x-y-z) để biểu diễn màu như
sau:
Hình 1.4. Hệ tọa độ R-G-B
Trong cách biểu diễn này ta có công thức: đỏ + lục + lơ = 1. Công thức này
gọi là công thức Maxwell. Ta cũng có thể chuyển từ hệ tọa độ 3 màu về hệ tọa độ
x-y-z.
1.4. Các kỹ thuật xử lý ảnh cơ bản
Trên đây đã nói các khái niệm cơ bản trong xử lý ảnh, chúng ta sẽ tìm hiểu
một số kỹ thuật xử lý ảnh sẽ được dùng trong nhận dạng phiếu điều tra.
1.4.1. Nhị phân hóa

Nhị phân hóa là thực hiện phép biến đổi ảnh từ ảnh đa cấp xám về ảnh nhị
phân (có 2 cấp xám). Do các kỹ thuật nhận dạng chỉ cẩn ảnh đầu vào là ảnh nhị
phân nên bước này cần thực hiện khi ảnh đầu vào là ảnh đa cấp xám.
Phương pháp đơn giản là dùng một hàm cắt với giá trị ngưỡng θ.
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
11
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA



θ<
θ≥
=
u : 1
u : 0
)u(f
Trong đó u là mức xám của một điểm ảnh.
Ngưỡng θ có thể được chọn trước hoặc thực hiện chọn tự động bằng cách
tính toán các đại lượng thống kê trên lược đồ tần xuất histogram của ảnh, của vùng
ảnh.
1.4.2. Khử nhiễu
Khử nhiễu được tiến hành bằng cách sử dụng các bộ lọc tuyến tính (lọc
trung bình) hoặc phi tuyến (lọc trung vị).
Khử nhiễu bằng các bộ lọc tuyến tính phổ biến là các bộ lọc sau:











1 1 1
1 1 1
1 1 1
9
1










1 1 1
1 1 1
1 1 1
16
1

















1 2 4 2 1
2 4 8 4 2
4 8 16 8 4
2 4 8 4 2
1 2 4 2 1
100
1
Các bộ lọc trên được kết hợp với ảnh bằng phép nhân chập (phép cuộn) và
cho ra ảnh kết quả có độ nhiễu nhỏ hơn ảnh ban đầu.
1.4.3. Làm trơn biên, lấp đầy chỗ trống
Trên thực tế, sau khi khử nhiễu, đường biên chữ không được trơn tru như
ban đầu mà hình thành các đường cong có răng cưa. Khi đó ta phải tiến hành lấp
đầy chỗ trống, xóa đi các điểm giả trên biên chữ. Hai kỹ thuật hay được sử dụng là
Unger và Dineen.
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
12
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
Kỹ thuật Dineen dùng một mặt nạ n x n di chuyển trên tất cả các vị trí trong
ảnh. Một ảnh mới được tạo ra trên đó mỗi phần tử tại tâm cửa sổ được tính lại theo
các phần tử lân cận. Nếu tổng các phần tử trong cửa sổ lớn hơn một ngưỡng

θ
nào
đó thì vị trí tương ứng trong ảnh mới sẽ là 1, ngược lại là 0. Kích thước cửa sổ
thường chọn là 3 x 3 hoặc 4 x 4.
Kỹ thuật Unger dùng một tập luật để lấp đầy chỗ trống. Giả sử P là điểm
đang xét, ta có các điểm lân cận của P như sau:
P
P P
P P P
P P P
Điểm P trên ảnh mới là đen khi và chỉ khi thỏa mãn 1 trong 2 điều kiện sau:
1. P là điểm đen
2. Có ít nhất 3 trong 4 láng giềng P
2
, P
3
, P
6
, P
8
là đen
Để loại bỏ các điểm cô lập sau khi lấp đầy chỗ trống, Unger lại dùng một tập
luật khác:
1. Có ít nhất 1 trong 3 láng giềng P
2
, P
3
, P
4
là đen

2. Có ít nhất 1 trong 3 láng giềng P
6
, P
7
, P
8
là đen
hay
1. Có ít nhất 1 trong 3 láng giềng P
4
, P
5
, P
6
là đen
2. Có ít nhất 1 trong 3 láng giềng P
2
, P
8
, P
9
là đen
1.4.4. Đường thẳng Hough
Chúng ta sẽ dùng biến đổi Hough để tìm các đường thẳng trên ảnh. Kĩ thuật
tìm đường thẳng theo biến đổi Hough sẽ được ứng dụng vào tìm góc nghiêng của
phiếu trả lời.
Ta có phương trình đường thẳng:
12
1
12

1
y-y
y-y

xx
xx
=


ĐẠI HỌC VINH KHOA CÔNG NGHỆ
13
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
Ta sẽ biến đổi phương trình trên thành phương trình tham số của đường
thẳng theo tọa độ cực.
r là khoảng cách từ gốc đến đường thẳng,
θ
là góc giữa véc tơ pháp tuyến
của đường thẳng và trục Ox
Với x
1
= 0 => y
1
=
θ
sin
r
Với y
2
= 0 => x
2

=
θ
cos
r

θ

θ

=

θ

sin
r
0
sin
r
y
0
cos
r
0x

θθθ
=
θ

cos.sin
r

-
cos
r.y

sin
r.x
2
θθθ
cos
y

sin
x

cos
r

+=⇔

r = x.cos
θ
+ y.sin
θ
Phương trình này được gọi là phương trình đường thẳng Hough.
Tư tưởng của nhận dạng đường thẳng Hough là: với mỗi giá trị của các tham
số r và
θ
, ta tính số tọa độ (x, y) thỏa mãn phương trình đường thẳng Hough và là
điểm đen. Nếu số này lớn hơn một ngưỡng th thì tập hợp các điểm đó có thể tạo
nên một đường thẳng.

Thuật toán tìm đường thẳng dựa trên phương trình đường thẳng Hough được
mô tả dưới dạng giả ngôn ngữ như sau:
for r = 0 to
22
heightwidth
+
do
for
θ
= 0 to 360

do
{
count = 0;
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
14
Hình 1.5. Đường thẳng Hough trên
tọa độ cực
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
for x = 0 to width do
{
Tính y;
if (x, y) là điểm đen then
count = count + 1;
}
if count > th then
thông báo có một đường thẳng;
}
Trong đó, width và height là độ rộng và chiều cao của ảnh. Biến count dùng
để đếm số điểm đen ứng với mỗi r và

θ
. Nếu count lớn hơn một ngưỡng th cho
trước thì có một đường thẳng.
Ưu điểm của thuật toán này là có thể tìm được các đường thẳng không liền
nét (các điểm trên đường thẳng rời rạc nhau) với độ chính xác cao. Điều này phù
hợp với thực tế rằng, một ảnh khi quét vào có thể bị nhiễu hoặc đứt nét. Với thuật
toán này, ta cũng có thể tính ngay được góc nghiêng của đường thẳng. Từ đó dễ
dàng chuyển sang bước chỉnh độ nghiêng.
1.4.5. Chỉnh độ nghiêng của ảnh
Trong trường hợp người quét ảnh không cẩn thận, ảnh đầu vào có thể bị
nghiêng đi một góc nào đó so với phương ngang. Khi đó cần xác định góc nghiêng
của văn bản và quay về vị trí 0

. Để xoay ảnh một góc
θ
, ta dùng biến đổi tọa độ
như sau:
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
15
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA








θθ−
θθ

=
cos sin
sin cos
y). (x, )y ,x(
''
Trong đó (x
'
, y
'
) là tọa độ mới sau khi quay.
Chương 2: Nhận dạng phiếu điều tra
2.1. Mô tả bài toán
Bài toán bao gồm các công đoạn:
- Đọc phiếu tự động
- Nhận dạng kết quả tự động
- Thống kê
Để hệ thống có thể nhận dạng được phiếu trả lời, các phiếu này phải có một
khuôn mẫu cố định, sau đó ta áp dụng các kỹ thuật nhận dạng để đọc kết quả trả lời
từ phiếu. Dưới đây sẽ trình bày chi tiết về thiết kế mẫu phiếu trả lời và các kỹ thuật
nhận dạng phiếu.
2.2. Thiết kế mẫu phiếu điều tra
Để hệ thống có thể nhận dạng được các phiếu điều tra, các phiếu này đều
phải tuân theo một mẫu chuẩn. Mẫu này được thiết kế sao cho quá trình nhận dạng
được thực hiện một cách nhanh chóng và chính xác.
Khi nhận dạng, phiếu điều tra được quét bởi scanner, do vậy không thể tránh
khỏi tờ phiếu bị xoay nghiêng. Việc điều chỉnh lại tờ phiếu là rất quan trọng, vì nó
có ảnh hưởng đến quá trình nhận dạng về sau. Để có thể nhận biết độ nghiêng của
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
16
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA

phiếu, chúng ta sẽ thiết kế một đường thẳng nằm ngang song song với mép trên
của phiếu. Ảnh của phiếu trả lời khi được quét qua scanner sẽ có nhiễu và có thể
mất nét vì nhiều lý do (tờ phiếu bị nhàu nát, hoặc đã được phô tô lại,…) nên đường
thẳng này phải được để độ dày một cách phù hợp. Thuật toán nhận dạng đường
thẳng này và điều chỉnh độ nghiêng sẽ được trình bày ở mục 1.4.
Để nhận dạng phiếu điều tra có độ chính xác cao và nhanh, ta cần biết vị trí
tương đối của các ô trắc nghiệm. Ở đây chúng ta dùng các khung để khoanh vùng
các ô trắc nghiệm.
Phần dành cho trắc nghiệm phải được thiết kế đậm để có thể nhận dạng
chính xác.
Ngoài ra mẫu phiếu điều tra phải có tính thẩm mỹ cao và thuận tiện đối với
đáp án viên (người được điều tra). Ở đây, chúng tôi dùng hai mẫu trắc nghiệm, sẽ
được nói chi tiết ở dưới đây. Vùng nhận dạng cần nằm gọn trong tờ giấy, không
được gần mép giấy quá để tránh khi đưa vào máy scanner, vùng nhận dạng không
được quét hết.
Trong điều tra, có thể có các câu hỏi mở, vì vậy ngoài vùng nhận dạng phải
có phần dành cho các câu hỏi mở nếu có.
Ở cuối tờ phiếu, nên có những hướng dẫn cần thiết về quy cách trắc nghiệm
để tránh những lỗi không hợp lệ gây ra bởi người trắc nghiệm.
Từ đó chúng tôi đưa ra hai mẫu phiếu trả lời sau:
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
17
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
PHIẾU TRẢ LỜI CÂU HỎI ĐIỀU TRA
PHẦN TRẢ LỜI
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
18
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
Cách thức trắc nghiệm:
- Bạn không cần ghi họ tên của mình.

- Khi trắc nghiệm, bạn có thể tick, bôi đen vào ô tròn.
- Tờ trắc nghiệm không được bẩn, không được làm dây mực.
- Ngoài ra, tờ trắc nghiệm được coi là không hợp lệ
Hình 2.1. Mẫu phiếu 1
PHIẾU TRẢ LỜI CÂU HỎI ĐIỀU TRA
PHẦN TRẢ LỜI
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C DA B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C DA B C D
A B C D

A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C DA B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
A B C D
19
1
2
3
4
5
6
7

8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37

38
39
40
41
42
43
44
45
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
Cách thức trắc nghiệm:
- Bạn có thể ghi họ tên của mình hoặc không.
- Khi trắc nghiệm, bạn có thể tick, bôi đen vào ô tròn.
- Tờ trắc nghiệm không được bẩn, không được làm dây mực.
- Ngoài ra, tờ trắc nghiệm được coi là không hợp lệ
Hình 2.2. Mẫu phiếu 2
Trong mẫu 1, vùng trắc nghiệm là các ô tròn đậm nét, trong các ô tròn là các
chữ cái A, B, C, D, … tương ứng với các tùy chọn của mỗi câu trả lời. Với mẫu
này, đáp án viên có thể chọn các cách thức trắc nghiệm như tick (√), gạch chéo
hoặc bôi đen các ô trắc nghiệm.
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
20
01 A B C D
02 A B C D
03 A B C D
04 A B C D
05 A B C D
06 A B C D
07 A B C D
08 A B C D
09 A B C D

10 A B C D
11 A B C D
12 A B C D
13 A B C D
14 A B C D
15 A B C D
16 A B C D
17 A B C D
18 A B C D
19 A B C D
20 A B C D
21 A B C D
22 A B C D
23 A B C D
24 A B C D
25 A B C D
26 A B C D
27 A B C D
28 A B C D
29 A B C D
30 A B C D
31 A B C D
32 A B C D
33 A B C D
34 A B C D
35 A B C D
36 A B C D
37 A B C D
38 A B C D
39 A B C D

40 A B C D
41 A B C D
42 A B C D
43 A B C D
44 A B C D
45 A B C D
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
Với mẫu 2, vùng trắc nghiệm là các chữ cái A, B, C, D, … tương ứng với
các tùy chọn của mỗi câu trả lời. Đáp án viên chọn kết quả bằng cách khoanh tròn
hoặc bôi đen các chữ cái.
2.3. Kỹ thuật nhận dạng chung phiếu điều tra
Trong phần này, chúng ta lần lượt xem xét các thuật toán chung trong nhận
dạng phiếu điều tra.
2.3.1. Các tham số cần thiết
Để có thể nhận dạng được định dạng chung của phiếu trả lời, ta cần biết một
số các tham số. Các tham số này được tạo khi hệ thống sinh phiếu trả lời dưới dạng
Word. Dưới đây là các tham số cần thiết:
- Độ phân giải của ảnh (thường là 100 dpi hoặc 150 dpi)
- Kích cỡ ảnh (chiều rộng và chiều cao)
- Độ dài, độ dày của đường thẳng dày
- Độ rộng, cao của khung
- Khoảng cách giữa khung và đường thẳng dày
- Khoảng cách giữa các dòng (chứa các ô trả lời)
- Khoảng cách giữa các ô
- Số khung
- Số câu hỏi mỗi khung
- Số tùy chọn mỗi câu hỏi
2.3.2. Nhận dạng đường thẳng dày
Như đã nói ở mục 2.1.1, để điều chỉnh độ nghiêng của phiếu trả lời, trên
phiếu có một đường thẳng song song với mép trên của phiếu và có một độ dày nhất

ĐẠI HỌC VINH KHOA CÔNG NGHỆ
21
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
định để tránh đường thẳng bị mất nét. Chúng ta sẽ nhận dạng đường thẳng này và
độ nghiêng của nó dựa trên thuật toán Hough.
Một vấn đề dễ nhận thấy là thuật toán Hough chỉ tìm những đường thẳng
mảnh (có độ dày 1 điểm ảnh). Do vậy nếu áp dụng ngay thuật toán Hough thì sẽ đi
đến kết quả không như mong muốn, vì thuật toán này sẽ tìm được rất nhiều đường
thẳng trên đường thẳng dày này với các độ nghiêng không giống nhau.
Để áp dụng được thuật toán Hough, chúng ta quan niệm đường thẳng dày là
tập hợp các đường thẳng mảnh song song và kề cận nhau hợp thành. Thay vì nhận
dạng đường thẳng dày, chúng ta sẽ nhận dạng tập hợp các đường thẳng đó.
Trước tiên, ta có một phát biểu sau: trong vùng của đường thẳng dày, xét tất
cả tập hợp của các đường thẳng mảnh song song với nhau và có độ dài bằng độ dài
đường thẳng dày, khi đó tập hợp mà có các đường thẳng song song với đường
thẳng dày sẽ có số lượng các đường thẳng là lớn nhất.
Ta có thể chứng minh phát biểu này một cách đơn giản như sau:
Giả sử đường thẳng dày có độ dày là a và độ dài là b, ta dễ dàng nhận ra một
tập hợp bao gồm a đường thẳng mảnh song song nhau có độ dài b và song song với
đường thẳng dày, tập hợp các đường thẳng này cũng tạo nên đường thẳng dày. Ta
sẽ chứng minh tập hợp này có số lượng đường thẳng là lớn nhất.
Giả sử có một tập hợp khác bao gồm a’ đường thẳng song song nhau có độ
dài b với a’ > a. Khi đó tổng diện tích các đường thẳng trong tập hợp đó là a’.b >
a.b là diện tích của đường thẳng dày. Điều này vô lý.
Như vậy phát biểu đã được chứng minh.
Từ đó, chúng tôi đề xuất phương pháp nhận đường thẳng dày như sau:
- Tìm tất cả các đường thẳng trên ảnh phiếu có ngưỡng lớn hơn hoặc bằng
ngưỡng của đường thẳng dày.
- Xác định tập hợp các đường thẳng song song (cùng nghiêng một góc giống
nhau) và kề nhau trong các đường thẳng trên.

ĐẠI HỌC VINH KHOA CÔNG NGHỆ
22
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
- Trong các tập hợp trên, tìm tập hợp có số lượng đường thẳng là lớn nhất.
Đó chính là tập hợp tạo nên đường thẳng dày.
Qua thực nghiệm, ngưỡng của đường thẳng dày nên chọn bằng 0.9 độ dài
thực tế của đường thẳng vì lý do chất lượng của ảnh. Thực tế cho thấy tìm đường
thẳng dày bằng phương pháp này cho độ chính xác rất cao cả về vị trí và góc
nghiêng của đường thẳng, đạt 99%.
2.3.3. Chỉnh độ nghiêng
Sau khi tìm được góc nghiêng của đường thẳng dày, ta đến bước điều chỉnh
lại ảnh. Trong bước này ta chỉ thuần túy áp dụng phép quay như đã nói ở mục
1.4.5. Ta cần xét đến trường hợp, khi đưa phiếu vào quét, giấy bị lộn ngược chiều,
tức là đường thẳng dày sẽ được tìm thấy ở gần mép dưới của ảnh. Để nhận biết
được trường hợp này, ta có thể kiểm tra xem vị trí của đường thẳng dày ở nửa trên
hay nửa dưới của ảnh. Nếu đường thẳng dày ở nửa trên của ảnh, ta quay ảnh với
góc nghiêng của đường thẳng dày. Trong trường hợp ngược lại, ta quay ảnh một
góc bằng góc nghiêng của đường thẳng dày cộng với
π
.
Sau khi quay ảnh, ta phải tính lại vị trí của đường thẳng dày (khoảng cách từ
mép trên của ảnh đến đường thẳng), điều này quan trọng vì nó liên quan đến bước
nhận dạng khung.

a. Trước khi xoay b. Sau khi xoay
Hình 2.3. Phiếu trả lời được quét đúng chiều
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
23
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
Đối với trường hợp phiếu trả lời được quét đúng chiều, khoảng cách mới r’

được tính như sau: r’ = ( height – height.sin
θ
– width.cos
θ
) / 2 + r
Trong đó width và height là độ rộng và chiều cao của ảnh.
θ
là góc giữa
véc tơ pháp tuyến của đường thẳng dày với trục Ox. r là khoảng cách của đường
thẳng dày tới gốc tọa độ khi chưa xoay.

a. Trước khi xoay b. Sau khi xoay
Hình 2.4. Phiếu trả lời được quét ngược chiều
Trong trường hợp phiếu điều tra bị quét ngược chiều, r’ được tính theo công
thức sau: r’ = ( height + height.sin
θ
+ width.cos
θ
) / 2 – r
Sau khi xoay ảnh, các biên ảnh có thể không được trơn thu như ảnh gốc,
điều này có thể ảnh hưởng đến quá trình nhận dạng về sau. Do đó cần phải được
làm trơn lại ảnh bằng kỹ thuật làm trơn biên đã được giới thiệu ở mục 2.4.3.
2.3.4. Nhận dạng khung
Nhận dạng khung là bước tiếp sau bước xoay ảnh, việc nhận dạng khung
nhằm mục đích khoanh vùng các ô trả lời. Điều này là cần thiết vì sau khi quét
phiếu trả lời, ta không biết chính xác vị trí của các ô nằm ở đâu. Sau khi đã khoanh
được vùng, ta lần lượt nhận dạng các ô trả lời trong từng vùng đó.
Trên thưc tế, một cuộc điều tra xã hội thường có từ 15 đến 30 câu hỏi, tương
ứng với từ 15 đến 30 câu trả lời trong phiếu điều tra. Vì vậy trong một phiếu trả
ĐẠI HỌC VINH KHOA CÔNG NGHỆ

24
KHÓA LUẬN TỐT NGHIỆP XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA
lời, số lượng khung và số lượng câu trả lời trong một khung được thiết kế như sau:
số khung có thể thay đổi tùy theo số câu hỏi, nhiều nhất là 3 khung với khổ giấy
A4. Trong một khung, số câu trả lời có thể dao động tùy ý, thường là 15 đến 20
câu với khổ giấy A4. Để nhận dạng các khung, ta phải biết số lượng khung, độ
rộng và cao của khung tính theo pixel.
Hình 2.5. Các khung
Nhận dạng khung thực chất là việc xác định tọa độ của góc trên bên trái, độ
rộng và độ cao của khung. Các khung có thể được nhận dạng lần lượt, nhưng ta có
nhận xét rằng, các cạnh trên và cạnh dưới của các khung cùng nằm trên một đường
thẳng. Do đó để nhận dạng các cạnh trên và dưới của các khung, ta sẽ tìm các
đường thẳng nằm ngang nằm phía dưới đường thẳng dày và đi qua các cạnh của
khung. Do phiếu đã được điều chỉnh độ nghiêng, nên đường thẳng này có thể được
coi như nằm ngang hay nói cách khác góc nghiêng của đường thẳng nhỏ hơn 1 độ.
Vì vậy các điểm thuộc đường thẳng này chỉ nằm trên một số ít dòng liền nhau, trên
thực tế thường là 1 đến 3 dòng. Nên ta có thể tìm trong ảnh các dòng kề nhau đó và
thỏa mãn số cột có điểm đen lớn hơn một ngưỡng th = số khung * độ rộng khung *
0.9.
Ta không nên áp dụng thuật toán Hough để tìm đường thẳng này vì thuật
toán Hough tìm đường thẳng khi biết chính xác góc nghiêng là bao nhiêu và tìm
các đường thẳng tuyệt đối, do vậy không thích hợp với việc tìm các đường thẳng
có nét mỏng trong ảnh có nhiễu.
ĐẠI HỌC VINH KHOA CÔNG NGHỆ
25

×