Tải bản đầy đủ (.pdf) (85 trang)

Xây dựng hệ thống chấm điểm thi trắc nghiệm sử dụng camera

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.84 MB, 85 trang )

LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chƣa từng đƣợc ai
công bố trong bất kỳ công trình nào khác.
Tác giả
Tống Thị Lan

1


LỜI CẢM ƠN
Lời đầu tiên tôi xin đƣợc gửi lời cảm ơn tới PGS.TS Nguyễn Tiến Dũng –
giáo viên định hƣớng và hƣớng dẫn đề tài. Sự hƣớng dẫn trong quá trình tiếp cận đề
tài, tài liệu tham khảo cũng nhƣ quá trình hoàn thành luận văn.
Tôi xin gửi lời cảm ơn tới các bạn, các đồng nghiệp đã giúp đỡ tôi trong quá
trình hoàn thành chƣơng trình phần mềm
Tôi xin bày tỏ lòng biết ơn tới Ban Giám Hiệu trƣờng Đại Học Thái Bình
cùng các thầy, cô giáo trong Khoa - nơi tôi công tác đã tạo điều kiện cho tôi theo
khóa học và hoàn thành chƣơng trình phần mềm chấm thi trắc nghiệm sử dụng
camera
Cuối cùng tôi xin bày tỏ lòng biết ơn tới gia đình, thầy cô giáo đã ủng hộ và
động viên tôi trong suốt quá trình hoàn thành luận văn
Tác giả
Tống Thị Lan

2


MỤC LỤC
LỜI CẢM ƠN...... ....................................................................................................... 2
MỤC LỤC……… ....................................................................................................... 3


DANH SÁCH HÌNH VẼ ............................................................................................ 6
MỤC LỤC CÁC BẢNG BIỂU ................................................................................... 7
DANH MỤC TỪ VIẾT TẮT...................................................................................... 8
PHẦN MỞ ĐẦU ........................................................................................................ 9
1. Tính cấp thiết của đề tài .......................................................................................... 9
2. Mục tiêu và nội dung thực hiện của đề tài ............................................................ 10
3. Kết quả đạt đƣợc ................................................................................................... 11
CHƢƠNG 1. TỔNG QUAN VỀ HỆ THỐNG CHẤM ĐIỂM ................................. 12
THI TRẮC NGHIỆM ............................................................................................... 12
1.1. Giới thiệu hệ thống ............................................................................................. 12
1.2. Những hệ thống chấm thi hiện tại ...................................................................... 12
1.2.1. Máy OMR ..................................................................................................... 12
1.2.2. Phần mềm OMR ........................................................................................... 13
1.3. Mô tả hệ thống ................................................................................................... 13
1.3.1. Yêu cầu đặt ra ............................................................................................... 13
1.3.2. Sơ đồ khối hệ thống tự động chấm thi trắc nghiệm ...................................... 14
1.3.3. Cơ chế làm việc............................................................................................. 15
CHƢƠNG 2: CƠ SỞ LÝ THUYẾT ......................................................................... 16
2.1. Những khái niệm cơ bản về ảnh số .................................................................... 16
2.1.1. Pixel.............................................................................................................. 16
2.1.2. Độ xám ......................................................................................................... 16
2.1.3. Cấu trúc ảnh ................................................................................................. 17
2.1.4. Nhiễu ảnh ..................................................................................................... 18
2.2. Những kỹ thuật xử lý ảnh cơ bản ....................................................................... 19
2.2.1. Thiết bị thu nhận ảnh .................................................................................... 19
2.2.2. Lấy mẫu và lƣợng tử hóa (Image Sampling and quantization) .................... 20

3



2.2.3. Xứ lý và nâng cao chất lƣợng ảnh ............................................................... 25
2.2.4. Khôi phục ảnh .............................................................................................. 30
2.2.5. Lấy ngƣỡng .................................................................................................. 30
2.3. Các kỹ thuật xử lý ảnh ....................................................................................... 31
2.3.1. Khái niệm về góc nghiêng ............................................................................ 31
2.3.2. Thuật toán Otsu ............................................................................................. 31
2.3.3. Phƣơng pháp phát hiện biên cục bộ Gradient ............................................... 33
2.3.4. Thuật toán Harris .......................................................................................... 38
2.3.5. Thuật toán xoay ảnh ...................................................................................... 41
CHƢƠNG 3. PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG CHẤM ĐIỂM ................ 45
THI TRẮC NGHIỆM SỬ DỤNG CAMERA .......................................................... 45
3.1. Phân tích hệ thống .............................................................................................. 45
3.1.1. Thuật toán nhận dạng phiếu thi..................................................................... 45
3.1.2. Tìm vùng chứa thông tin trên phiếu thi ........................................................ 47
3.1.3. Nhận dạng thông tin ...................................................................................... 50
3.2. Phần mềm chấm thi trắc nghiệm ........................................................................ 52
3.3. Giới thiệu về thƣ viện mã nguồn mở OpenCV .................................................. 53
CHƢƠNG 4: KẾT QUẢ ĐẠT ĐƢỢC VÀ ĐÁNH GIÁ.......................................... 55
4.1. Mục đích và yêu cầu đề ra.................................................................................. 55
4.2. Kỹ thuật hiệu chỉnh góc nghiêng và chuẩn hóa kích thƣớc ảnh ........................ 55
4.2.1. Hàm lấy ngƣỡng OTSU ............................................................................... 55
4.2.2. Hàm xác định 4 góc: .................................................................................... 56
4.2.3. Hàm xác định góc nghiêng .......................................................................... 57
4.2.4. Hàm xoay ảnh .............................................................................................. 58
4.2.5. Hàm chuẩn hóa kích thƣớc ảnh.................................................................... 60
4.3. Kỹ thuật định vị và nhận dạng thông tin trên phiếu trả lời trắc nghiệm ............ 60
4.3.1. Hàm chuyển dữ liệu ảnh sang mảng hai chiều ............................................. 60
4.3.2. Hàm đánh nhãn cho các đối tƣợng thông tin ................................................ 61
4.3.3. Hàm xác định trọng tâm đối tƣợng ............................................................... 61


4


4.3.4. Hàm xác định số báo danh ............................................................................ 62
4.3.5. Hàm xác định mã đề ..................................................................................... 62
4.3.6. Hàm xác định phần trả lời của thí sinh ......................................................... 62
4.4. Xây dựng phần mềm chấm thi trắc nghiệm ....................................................... 63
4.4.1. Quản lý kỳ thi................................................................................................ 64
4.4.2. Chấm điểm từ file ......................................................................................... 66
4.4.3. Chấm điểm từ camera ................................................................................... 68
4.5. Kết quả của thuật toán ........................................................................................ 69
4.5.1. Dữ liệu ảnh đầu vào ...................................................................................... 69
4.5.2. Kết quả xây dựng thuật toán ......................................................................... 72
4.5.3. Kết quả của thuật toán chấm thi trắc nghiệm đã đề xuất .............................. 80
4.6. Đánh giá kết quả................................................................................................. 81
KẾT LUẬN VÀ KIẾN NGHỊ................................................................................... 83
TÀI LIỆU THAM KHẢO ......................................................................................... 85

5


DANH SÁCH HÌNH VẼ
Hình 1. 1: Sơ đồ khối hệ thống tự động chấm thi trắc nghiệm ...................... 14
Hình 2. 3: Quá trình lƣợng tử hóa ................................................................... 23
Hình 2. 4: Khuông lƣợng tử theo L mức xám ................................................. 24
Hình 2. 5: Lấy mẫu và lƣợng tử hóa ............................................................... 24
Hình 2. 6: Kéo dãn độ tƣơng phản .................................................................. 26
Hình 2. 7: Tách nhiễu và phân ngƣỡng ........................................................... 27
Hình 2. 8: Lấy ngƣỡng .................................................................................... 30
Hình 2. 9: Mặt nạ 8 hƣớng theo Kirsh. ........................................................... 36

Hình 2. 10: Hình ảnh trƣớc và sau bộ tách biên Canny .................................. 38
Hình 2. 11: Vùng giá trị trị riêng .................................................................... 40
Hình 2. 12: Thuật toán xoay ảnh ..................................................................... 41
Hình 2. 13: Chuyển dịch tọa độ ...................................................................... 42
Hình 2. 14: Kết quả xoay ảnh Ánh xạ ngƣợc (A) và Ánh xạ xuôi (B) ........... 44
Hình 3. 2: Thực hiện phép biến đổi phối cảnh để chuẩn hóa phiếu thi .......... 47
Hình 3. 4: Đặc điểm của các vùng chứa thông tin trên phiếu thi .................... 49
Hình 3. 6: Xác định nội dung thông tin vùng số báo danh và mã đề .............. 51
Hình 3. 7: Xác định nội dung thông tin vùng trả lời ....................................... 52
Hình 3. 8: Tổ chức thƣ viện OpenCV ............................................................. 53
Hình 4. 1: Lƣu đồ thuật toán xác định góc...................................................... 56
Hình 4. 2: Lƣu đồ thuật toán xác định góc nghiêng ........................................ 57
Hình 4. 3: Lƣu đồ thuật toán xoay ảnh ........................................................... 59
Hình 4. 4: Sơ đồ khối thực hiện định vị và nhận dạng thông tin .................... 60
Hình 4. 5: Giao diện chính của chƣơng trình .................................................. 63
Hình 4. 6: Giao diện module quản lý kỳ thi .................................................... 64
Hình 4. 7: Các chức năng thêm, sửa, xóa kỳ thi ............................................. 64
Hình 4. 8: Các chức năng thêm, sửa, xóa môn thi .......................................... 64
Hình 4. 9: Chức năng thêm đề thi ................................................................... 65

6


Hình 4. 10: Chức năng sửa đề thi - đáp án ...................................................... 65
Hình 4. 11: Giao diện module “Chấm điểm từ file” ....................................... 66
Hình 4. 12: Cấu trúc file excel ........................................................................ 67
Hình 4. 13: Ứng dụng IP Webcam .................................................................. 68
Hình 4. 14: Giao diện module chấm điểm trực tiếp từ camera ....................... 69
Hình 4. 15: Mẫu không nhận dạng đƣợc vùng phiếu thi ................................ 73
Hình 4. 16: Ảnh gốc và ảnh nhị phân ............................................................. 73

Hình 4. 17: Biên và 4 góc của phiếu thi .......................................................... 74
Hình 4. 18: Ảnh đầu ra của thuật tìm phiếu thi ............................................... 74
Hình 4. 19: Ảnh phiếu thi sau khi chuyển mức xám và lọc nhiễu .................. 75
Hình 4. 20: Ảnh phiếu thi sau khi tăng độ sáng .............................................. 75
Hình 4. 21: Ảnh phiếu thi sau khi thực hiện phép mở .................................... 76
Hình 4. 22: Các vùng chứa thông tin trên phiếu thi ........................................ 76
Hình 4. 23: Vùng số báo danh và vùng mã đề ................................................ 77
Hình 4. 24: Các vùng trả lời ............................................................................ 77
Hình 4. 25: Kết quả nhận dạng thông tin vùng số báo danh ........................... 78
Hình 4. 26: Kết quả nhận dạng thông tin vùng mã đề .................................... 78
Hình 4. 27: Kết quả nhận dạng thông tin vùng trả lời .................................... 79
Hình 4. 28: Kết quả chấm thi trên các mẫu đã chuẩn bị ................................. 80

MỤC LỤC CÁC BẢNG BIỂU
Bảng 4. 1: Dữ liệu bài thi ..........................................................................................70

7


DANH MỤC TỪ VIẾT TẮT

ORM

Optical Mark Recognition (OMR) Machine

ADF

Automatic document feeder

PTLTN


Phiếu trả lời trắc nghiệm

CSDL

Cơ sở dữ liệu

TH

Trƣờng hợp

CV

Computer Vision

8


PHẦN MỞ ĐẦU
1. Tính cấp thiết của đề tài
Phƣơng pháp thi trắc nghiệm từ lâu đã đƣợc các nƣớc có nền giáo dục phát
triển sử dụng nhằm đánh giá năng lực của học sinh. Với những ƣu điểm nổi bật của
việc thi trắc nghiệm là đánh giá kiến thức một cách toàn diện nhất, tránh việc học tủ
học lệch cũng nhƣ các vấn đề gian lận trong kỳ thi. Do bài thi trắc nghiệm có các
đáp án cố định nên giúp việc chấm thi trở nên khách quan, trung thực hơn, kết quả
bài thi sẽ không phụ thuộc vào yếu tố mang tính chất chủ quan của ngƣời chấm. Các
máy chấm thi trắc nghiệm cũng đƣợc thiết kế để phục vụ công tác chấm thi. Việc
chấm thi bằng máy sẽ cho kết quả nhanh, chính xác đồng thời cũng giảm áp lực cho
con ngƣời vì khi chấm bài thi trắc nghiệm bằng tay sẽ rất nhàm chán.
Máy chấm thi trắc nghiệm chuyên dụng, hay còn gọi là Optical Mark

Recognition (OMR) Machine là một loại máy đƣợc thiết kế ra để chấm điểm thi trắc
nghiệm một cách nhanh và chính xác. Máy OMR thƣờng đƣợc sử dụng để đánh giá
kết quả thi thông qua hình thức trắc nghiệm với số lƣợng lớn.
Phƣơng thức mà máy OMR dùng để nhận dạng và quyết định vị trí lựa chọn
của sinh viên trong phiếu thi: Máy OMR sử dụng hàng loạt sensor để nhận dạng dấu
tích của sinh viên – ô tròn đƣợc quy định tô bằng bút chì 2B (trở lên). Loại giấy mà
máy này sử dụng cũng hoàn toàn là một loại giấy „transoptic‟ đặc biệt tƣơng thích
với việc sử dụng sensor để nhận dạng.
Tính ổn định và độ chính xác cao của hệ thống làm cho máy OMR có đƣợc độ
tin cậy cao và thƣờng đƣợc sử dụng ở những tổ chức giáo dục và đánh giá lớn.
Nhƣng những tính năng này cũng tạo nên giá thành cao của hệ thống và cản trở việc
phổ biến máy OMR trên thị trƣờng. Không những giá thành của chúng rất đắt mà
chi phí vận hành phải đi đôi với việc tiêu thụ rất nhiều giấy chuyên dụng. Do đó,
những tổ chức giáo dục vừa và nhỏ, những trƣờng học muốn tổ chức những kỳ thi
trắc nghiệm riêng của họ để tiến hành đánh giá học sinh, sinh viên định kỳ lại không
đủ chi phí mua cũng nhƣ duy trì những chiếc máy nhƣ thế này. Chính vì những lý
do nhƣ thế này mà em đã chọn đề tài “Xây dựng hệ thống chấm điểm thi trắc

9


nghiệm sử dụng camera” với yêu cầu đặt ra là cấu trúc phần cứng nhỏ gọn, xử lý
nhanh, chi phí thấp mà vẫn có khả năng đạt đƣợc hiệu quả nhƣ mong muốn. Hệ
thống này phải có khả năng ứng dụng cao trong các kỳ thi ở mọi cấp bậc, kỳ thi
tuyển sinh đại học, các kỳ thi tiếng Anh quốc tế, giảm thiểu đáng kể những chi phí
không cần thiết cho việc chấm thi thủ công hoặc sử dụng những thiết bị đƣợc nhập
về nhƣ hiện nay.
2. Mục tiêu và nội dung thực hiện của đề tài
Với những hạn chế của các loại máy chấm trắc nghiệm trên, mục tiêu của đề
tài “Xây dựng hệ thống chấm điểm thi trắc nghiệm sử dụng camera” là đề xuất

xây dựng hệ thống chấm điểm trắc nghiệm khắc phục đƣợc những hạn mà một số
phần mềm đã có trên thị trƣờng chƣa giải quyết đƣợc nhƣ:
- Tốc độ lấy mẫu thông qua máy tời giấy nhanh, tính tự động cao, giá thành rẻ.
- Thuật toán xử lý, nhận dạng nội dung phiếu thi phải nhanh, đảm bảo đƣợc độ
chính xác, tin cậy cao. Thuật toán này phải nhận dạng đƣợc cả các phiếu thi in trên
các loại giấy thông dụng, yêu cầu về độ chính xác khi in ấn không cần quá cao.
Do hạn chế về mặt thời gian nên đề tài tập trung giải quyết các vấn đề sau:
- Thực hiện giao tiếp giữa máy tính và camera, hiển thị hình ảnh ghi đƣợc từ
camera lên máy tính.
- Nghiên cứu, đề xuất hệ thống, thuật toán nhận dạng vùng ảnh và xử lý thông
tin của phiếu thi.
- Thiết kế, xây dựng dữ liệu quản lý tham số bài thi phục vụ công tác chuẩn bị
trƣớc khi chấm thi và lƣu trữ thông tin sau khi chấm thi.
Dựa trên các nội dung đó, luận văn này đƣợc chia thành 4 chƣơng với các nội
dụng chính nhƣ sau:
- Chƣơng 1: Tổng quan về hệ thống chấm điểm thi trắc nghiệm
- Chƣơng 2: Cơ sở lý thuyết
- Chƣơng 3: Phân tích và thiết kế hệ thống chấm điểm thi trắc nghiệm sử dụng
camera
- Chƣơng 4: Kết quả đạt đƣợc và đánh giá

10


3. Kết quả đạt đƣợc
Bằng phƣơng pháp thực nghiệm, phần mềm chấm điểm thi trắc nghiệm sử
dụng camera đã hoàn thành và đáp ứng các các yêu cầu đặt ra:
 Module quản lý kỳ thi nhỏ, gọn, trực quan.
 Hiển thị hình ảnh từ camera và chấm điểm.
 Chấm điểm với nhiều file ảnh phiếu thi chụp từ trƣớc.

 Thực nghiệm cho thấy thuật toán đã đề ra đạt độ chính xác 100% với các
mẫu phiếu thi đã chuẩn bị, thời gian chấm thi nhanh.
Để có thể thực hiện và hoàn thành đề tài này, tôi xin đƣợc chân thành cảm ơn
PGS.TS. Nguyễn Tiến Dũng đã tận tình hƣớng dẫn và giúp đỡ trong suốt quá trình
thực hiện đề tài.

Học viên
Tống Thị Lan

11


CHƢƠNG 1. TỔNG QUAN VỀ HỆ THỐNG CHẤM ĐIỂM
THI TRẮC NGHIỆM
1.1. Giới thiệu hệ thống
Từ năm 2007, Bộ giáo dục và Đào tạo đã chuyển một số môn thi của các kỳ
thi cấp Quốc gia nhƣ thi tốt nghiệp Trung học phổ thông, thi tuyển sinh vào các
trƣờng Cao đẳng, Đại học từ hình thức tự luận sang trắc nghiệm. Không chỉ ở
những kỳ thi cấp Quốc gia mà hiện nay nhiều trƣờng trung học, cao đẳng, đại học
cũng đã áp dụng hình thức thi trắc nghiệm ở rất nhiều môn học và đã nhận đƣợc
những phản hồi tích cực từ phía học sinh, sinh viên.
1.2. Những hệ thống chấm thi hiện tại
1.2.1. Máy OMR
Máy chấm thi trắc nghiệm chuyên dụng, hay còn gọi là Optical Mark
Recognition (OMR) Machine [1] là một loại máy đƣợc thiết kế ra để chấm điểm thi
trắc nghiệm một cách nhanh và chính xác. Máy OMR thƣờng đƣợc sử dụng để đánh
giá kết quả thi thông qua hình thức trắc nghiệm với số lƣợng lớn.
Phƣơng thức mà máy OMR dùng để nhận dạng và quyết định vị trí lựa chọn
của sinh viên trong phiếu thi: Máy OMR sử dụng hàng loạt sensor để nhận dạng dấu
tích của sinh viên – ô tròn đƣợc quy định tô bằng bút chì 2B (trở lên). Loại giấy mà

máy này sử dụng cũng hoàn toàn là một loại giấy „transoptic‟ đặc biệt tƣơng thích
với việc sử dụng sensor để nhận dạng.
Tính ổn định và độ chính xác cao của hệ thống làm cho máy OMR có đƣợc độ
tin cậy cao và thƣờng đƣợc sử dụng ở những tổ chức giáo dục và đánh giá lớn.
Nhƣng những tính năng này cũng tạo nên giá thành cao của hệ thống và cản trở việc
phổ biến máy OMR trên thị trƣờng. Không những giá thành của chúng rất đắt mà
chi phí vận hành phải đi đôi với việc tiêu thụ rất nhiều giấy chuyên dụng. Do đó,
những tổ chức giáo dục vừa và nhỏ, những trƣờng học muốn tổ chức những kỳ thi
trắc nghiệm riêng của họ để tiến hành đánh giá học sinh, sinh viên định kỳ lại không
đủ chi phí mua cũng nhƣ duy trì những chiếc máy nhƣ thế này.

12


1.2.2. Phần mềm OMR
Trong khi những chiếc máy OMR làm chủ công nghệ và thị trƣờng phục vụ
nhu cầu đánh giá kỳ thi trắc nghiệm thì vẫn tồn tại những nhu cầu về một thiết bị
nhỏ gọn hơn mà thỏa mãn đƣợc những yêu cầu về độ ổn định và độ chính xác cao.
Phần mềm OMR đƣợc phát triển nhanh chóng nhằm lấp đầy những nhu cầu
trên. Sự ra đời của phần mềm OMR kết hợp với máy scan thực sự đã là một giải
pháp thay thế cho việc chấm thi trắc nghiệm tự động. Đây là một giải pháp phần
mềm, để thực hiện chấm thi đƣợc cần phải kết hợp với một hệ thống máy tính và
máy scan.
Máy scan là một loại thiết bị văn phòng phổ biến và sẵn có với đa dạng chủng
loại cùng giá thành trên thị trƣờng. Có hai loại máy scan cơ bản mà chúng ta cần
chú ý khi kết hợp với phần mềm OMR.
Máy scan ép phẳng (hay còn gọi là flatbed scanner) [2] dùng để quét những
tài liệu nhỏ lẻ hoặc những mẫu đơn rời. Nhƣợc điểm của loại máy scan này là ngƣời
sử dụng phải thao tác bằng tay khi họ muốn scan tài liệu. Điều này đồng nghĩa với
tính tự động và tốc độ của hệ thống chấm thi sử dụng máy scan ép phẳng sẽ rất thấp.

Máy scan tời giấy tự động (hay còn gọi là automatic document feeder –
ADF) [2] là dòng máy scan chuyên nghiệp hơn. Máy ADF có thêm khay tời giấy tự
động có thể đựng đuợc 50 tới 200 tờ giấy và scan lần lƣợt theo thời gian định sẵn.
Khi kết hợp ADF với phần mềm OMR sẽ tạo nên một hệ thống chấm thi khá khả
quan. Tuy nhiên giá thành cho cả hệ thống bao gồm phần mềm OMR, máy tính, và
máy scan ADF rất đắt. Chính vì vậy nên rất nhiều trƣờng trung học phổ thông, đại
học và các tổ chức giáo dục vừa và nhỏ đã không chọn phần mềm OMR kết hợp với
máy scan làm công cụ chấm thi trắc nghiệm tự động.
1.3. Mô tả hệ thống
1.3.1. Yêu cầu đặt ra
Yêu cầu đặt ra là thiết kế một hệ thống đơn giản, giá cả hợp lý mà vẫn đảm
bảo đƣợc độ ổn định, tính chính xác và tốc độ cao trong quá trình hoạt động.
Hệ thống đề xuất cần phải thỏa mãn những yêu cầu cơ bản sau:

13


 Yêu cầu về giá thành và độ phức tạp:
Hệ thống phải có giá thành cũng nhƣ chi phí vận hành rẻ hơn so với hệ thống
máy OMR và hệ thống sử dụng phần mềm OMR đồng thời phải đơn giản và dễ
dàng hơn trong quá trình làm việc cũng nhƣ bảo trì.
 Yêu cầu về chức năng:
- Hệ thống có thể chấm thi tự động với khay đựng đƣợc nhiều giấy.
- Hệ thống nhận dạng và chấm đƣợc điểm thi trắc nghiệm ở nhiều hình thức
khác nhau.
- Hệ thống phải hoạt động ổn định, chính xác ở tốc độ cao.
 Hệ thống tự động chấm thi trắc nghiệm đề xuất:
- Hệ thống tự động chấm thi trắc nghiệm đề xuất gồm 3 thành phần cơ bản:
khay tời giấy, camera độ phân giải cao và hệ thống máy tính.
- Ý tƣởng thực hiện khay tời giấy là một khay có thể tự động tời giấy theo

thời gian đƣợc lập trình. Tời định kỳ theo khoảng thời gian mà camera có thể chụp.
- Camera là thiết bị ghi hình nên yêu cầu có độ phân giải cao và tốc độ chụp
nhanh.
- Hệ thống máy tính có thể là máy để bàn hoặc máy tính xách tay có cài hệ
điều hành Windows và một số phần mềm ứng dụng khác nhƣ Matlab, Office…
1.3.2. Sơ đồ khối hệ thống tự động chấm thi trắc nghiệm
Phần cứng
Phiếu trả lời
trắc nghiệm

Hệ thống tời giấy
tích hợp camera

Phần mềm
Ảnh

Tìm vùng
chứa thông tin
trên phiếu thi

Nhận dạng
phiếu thi

Nhận dạng
thông tin

File hoặc
CSDL

Hình 1. 1: Sơ đồ khối hệ thống tự động chấm thi trắc nghiệm

Sơ đồ khối hệ thống tự động chấm thi trắc nghiệm do nhóm đề xuất đƣợc giới
thiệu trong hình 1.1, trong đó có những khối chức năng cơ bản sau:
 Phần cứng
Hệ thống tời giấy tích hợp camera, là một hệ thống cơ khí tự động đƣa PTLTN
từ khay đựng phiếu tới vị trí xác định để camera thu nhận hình ảnh. Camera sẽ đƣợc
14


kết nối với máy vi tính có cài đặt phần mềm OMR. Phần cứng sẽ đƣợc điều khiển
bởi driver đƣợc cài đặt trên máy tính.
 Phần mềm
Nhận dạng vùng chứa phiếu thi trong ảnh, vùng chứa thông tin trên phiếu thi
(mã đề, số báo danh, phần trả lời) và xử lý thông tin để cho ra kết quả. Kết quả sẽ
đƣợc lƣu vào file hoặc CSDL để in ấn, thống kê.
1.3.3. Cơ chế làm việc
Cơ chế làm việc của hệ thống đƣợc chia thành 3 quá trình:
1.

Quá trình thu nhận ảnh:

Tập PTLTN đƣợc đƣa vào khay tời giấy. Thông qua hệ thống tời giấy, PTLTN
đƣợc đƣa đến vị trí xác định để camera thu nhận ảnh. Khi PTLTN tới vị trí chụp, tín
hiệu chỉ thị chụp đƣợc gửi tới camera để camera thu nhận ảnh. Kết thúc quá trình
thu nhận ảnh, tín hiệu chỉ thị tời đƣợc gửi tới hệ thống tời giấy. Hệ thống tời giấy sẽ
đƣa PTLTN từ vị trí chụp ra ngoài, đồng thời đƣa PTLTN mới vào vị trí chụp.
2.

Quá trình đọc thông tin trên ảnh

Dữ liệu ảnh từ quá trình 1 đƣợc tiền xử lý nhằm mục đích lọc nhiễu và nâng

cao chất lƣợng ảnh. Sau đó, thông qua việc xác định 4 đỉnh của PTLTN trong ảnh,
góc nghiêng của PTLTN sẽ đƣợc tính toán, tự động điều chỉnh góc nghiêng và
chuẩn hóa ảnh theo một tỉ lệ xác định. Ảnh sau chuẩn hóa đƣợc trích chọn các vùng
thông tin: vùng số báo danh, vùng mã đề, vùng trả lời. Việc sử dụng thuật toán nhận
dạng dấu tích trên từng vùng sẽ cho ta thông tin bài thi.
3.

Quá trình đánh giá và xuất kết quả:

Thông tin bài thi từ quá trình 2 sẽ đƣợc xem xét, đánh giá. Với mỗi mã đề của
một môn thi trong một kỳ thi xác định sẽ có một đáp án tƣơng ứng đƣợc lƣu trong
CSDL. Tiến hành so sánh thông tin bài thi với đáp án tƣơng ứng, ta sẽ đƣa ra đƣợc
kết quả bài thi. Kết quả này sẽ ngay lập tức đƣợc cập nhật vào CSDL tạo điều kiện
thuận lợi cho việc tra cứu và đánh giá.

15


CHƢƠNG 2: CƠ SỞ LÝ THUYẾT
2.1. Những khái niệm cơ bản về ảnh số
2.1.1. Pixel
Một bức ảnh hay một bức tranh ta nhìn thấy bằng mắt thƣờng là một sự liên
tục về không gian cũng nhƣ độ sáng. Khi kỹ thuật số đƣợc ứng dụng vào lĩnh vực
nhiếp ảnh, rất nhiều khái niệm mới đã đƣợc ra đời.
Kỹ thuật số là một kỹ thuật xử lý rời rạc trên máy tính, kỹ thuật này chỉ áp
dụng đối với các bit (các con số), chính vì vậy các bức ảnh liên tục về không gian
và độ sáng cần phải đƣợc “số hóa”. Số hoá ảnh thực chất là sự biến đổi gần đúng
một ảnh liên tục thành một tập điểm rời rạc phù hợp với ảnh thật về vị trí (không
gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó đƣợc thiết lập sao
cho mắt ngƣời không thể phân biệt đƣợc ranh giới giữa chúng. Chính vì vậy, khi

chúng ta nhìn một bức tranh là tập hợp của rất nhiều điểm rời rạc, chúng ta sẽ có
cảm giác đó là một bức ảnh liên tục. Mỗi một điểm nhƣ vậy gọi là một điểm ảnh
(PEL: Picture Element) hay gọi tắt là Pixel [3]. Trong khuôn khổ ảnh hai chiều, mỗi
pixel ứng với cặp tọa độ (x, y).
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc
màu nhất định. Kích thƣớc và khoảng cách giữa các điểm ảnh đó đƣợc chọn thích
hợp sao cho mắt ngƣời cảm nhận sự liên tục về không gian và mức xám (hoặc màu)
của ảnh số gần nhƣ ảnh thật.
2.1.2. Độ xám
Mỗi một điểm ảnh (Pixel) sẽ đƣợc đặc trƣng bởi hai tham số chính về không
gian và độ xám. Trong khuôn khổ ảnh hai chiều, tham số không gian đƣợc xác định
bởi tọa độ Đề-các (x,y) của điểm ảnh đó. Tham số độ xám đƣợc xác định là giá trị
cƣờng độ sáng tại điểm đó. Máy tính thƣờng sử dụng đơn vị byte (8bit) để biểu diễn
giá trị số. Chính vì vậy, giá trị lớn nhất của độ xám thƣờng đƣợc sử dụng rộng rãi
nhất là 2^8 = 256 tƣơng đƣơng với việc cƣờng độ sáng của các điểm sẽ nằm trong
dải từ 0 đến 256, khi đó, máy tính sẽ dùng 8bit = 1byte để biểu diễn giá trị cƣờng độ
sáng. Ngoài ra, còn có các giá trị cƣờng độ sáng lớn nhất khác: 16,32,64,128,…

16


Thông thƣờng, ta sẽ làm quen với 3 loại ảnh sau dựa vào cấu trúc cũng nhƣ độ
xám điểm ảnh:
-

Ảnh màu: là ảnh mà màu của các điểm ảnh đƣợc tạo nên bởi sự pha trộn 3

màu cơ bản (Red, Blue, Green) với các tỉ lệ cƣờng độ sáng khác nhau. Với mỗi một
màu cơ bản, ngƣời ta sẽ sử dụng một byte để biểu diễn cƣờng độ sáng, chính vì vậy
cần 3 byte (24bit) để biểu diễn một điểm ảnh. Khi đó giá trị màu sẽ nhận giá trị từ 0

cho đến 2^24 (vào khoảng ≈16,7 triệu màu).
-

Ảnh đen trắng: là ảnh mà mỗi điểm ảnh chỉ có hai màu đen, trắng (không

chứa màu khác) với cƣờng độ sáng (mức xám) ở các điểm ảnh có thể sử dụng nhiều
bit để biểu diễn các giá trị khác nhau.
-

Ảnh nhị phân: là ảnh chỉ có hai màu đen, trắng (không chứa màu khác) với

cƣờng độ sáng chỉ có 2 giá trị duy nhất 0 và 255. Ngƣời ta dùng duy nhất 2 bit để
biểu diễn độ xám, bit “1” tƣơng ứng điểm ảnh đen (0), bit “0” tƣơng ứng điểm ảnh
trắng (255).
2.1.3. Cấu trúc ảnh
Cấu trúc của một ảnh IplImage [4] trong OpenCV bao gồm các thông số chính:
|-- nChannels;
|-- depth;

số kênh ảnh (1,2,3,4)
độ sâu ảnh (bits):

|

// IPL_DEPTH_8U, IPL_DEPTH_8S,

|

// IPL_DEPTH_16U,IPL_DEPTH_16S,


|

// IPL_DEPTH_32S,IPL_DEPTH_32F,

|

// IPL_DEPTH_64F

|-- width;

chiều rộng ảnh

|-- height;

chiều dài ảnh

|-- imageData;

con trỏ truy nhập dữ liệu ảnh

|
|-- dataOrder;

0 – các kênh màu đan xen

|

1 – các kênh màu độc lập

|


17


|-- origin;

0 – gốc ảnh tại vị trí trên cùng bên trái

|

1 – gốc ảnh dƣới cùng bên trái

|-- widthStep;

kích thƣớc sắp xếp hàng (bytes)

|-- imageSize;

kích thƣớc ảnh = height*widthStep

|-- roi;

vùng ảnh xét

|-- imageDataOrigin; con trỏ tới vùng ảnh không đƣợc sắp xếp
|
|-- align;

sắp xếp cột 4 – 8 byte


|
|-- colorModel[4]; kiểu màu
Khi sử dụng bộ thƣ viện OpenCV, các ảnh đƣợc lƣu trữ và truy nhập các phần
tử điểm ảnh dƣới dạng ma trận:

Hình 2. 1: Cấu trúc dữ liệu ảnh

2.1.4. Nhiễu ảnh
Trƣớc khi xem xét chi tiết các kỹ thuật xử lý ảnh cơ bản, chúng ta cần phân
biệt các loại nhiễu hay can thiệp trong quá trình xử lý ảnh. Trên thực tế tồn tại nhiều
loại nhiễu, tuy nhiên ngƣời ta thƣờng xem xét 3 loại nhiễu chính: nhiễu cộng, nhiễu
nhân và nhiễu xung:

18


• Nhiễu cộng
Nhiễu cộng thƣờng phân bố khắp ảnh. Nếu gọi ảnh quan sát (ảnh thu đƣợc) là
Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu đƣợc có thể biểu diễn bởi:
Xqs = Xgốc + η

(2.1)

• Nhiễu nhân
Nhiễu nhân cũng thƣờng phân bố khắp ảnh. Nếu gọi ảnh quan sát (ảnh thu
đƣợc) là Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu đƣợc có thể biểu diễn bởi:
Xqs = Xgốc * η

(2.2)


• Nhiễu xung
Khác với nhiễu nhân và nhiễu cộng, nhiễu xung thƣờng chỉ gây đột biến tại
một số điểm ảnh. Nhiễu xung là một loại nhiễu khá đặc biệt có thể sinh ra bởi nhiều
lý do khác nhau chẳng hạn: lỗi truyền tín hiệu, lỗi bộ nhớ, hay lỗi định thời trong
quá trình lƣợng tử hóa.
2.2. Những kỹ thuật xử lý ảnh cơ bản
2.2.1. Thiết bị thu nhận ảnh
Một hệ thống xử lý ảnh có thể trang bị kèm theo các hệ thống thông tin địa lý GIS (Geographical Information System) [5] hay hệ MORPHO (giá khoảng 7 đến 8
triệu USD) hoặc có thể là hệ thống máy tính cá nhân. Các thiết bị thu ảnh thông
thƣờng gồm máy quay (camera) cộng với bộ chuyển đổi tƣơng tự số AD (Analog to
Digital) hoặc máy quét (scanner) chuyên dụng.
Các thiết bị thu nhận ảnh này có thể cho ảnh trắng đen B/W (Black and White)
với mật độ từ 400 đến 1600 dpi (dot per inch) hoặc ảnh màu 600 dpi. Với ảnh B/W
mức màu là 0 hoặc 1. Với ảnh đa cấp xám, mức xám biến thiên từ 0 đến 255. Ảnh
màu, mỗi điểm ảnh lƣu trữ trong 3 bytes và do đó ta có 2

8x3

= 224 màu (cỡ 16,7

triệu màu).
Khi dùng scanner, một dòng photodiot sẽ quét ngang ảnh (quét theo hàng) và
cho ảnh với độ phân giải ngang khá tốt. Đầu ra của scanner là ảnh ma trận số mà ta
quen gọi là bản đồ ảnh (ảnh Bitmap). Bộ số hoá (digitalizer) sẽ tạo ảnh vector có
hƣớng.

19


Trong xử lý ảnh bằng máy tính, ta không thể không nhắc đến màn hình

(monitor) để hiển thị hình ảnh. Màn hình có nhiều loại:
 CGA: 640 x 320 x 16 màu
 EGA : 640 x 350 x 16 màu
 VGA : 640 x 480 x 16 màu
 SVGA: 1024 x 768 x 256 màu.
Với ảnh màu, có nhiều cách tổ hợp màu khác nhau. Theo lý thuyết màu do
Thomas đƣa ra từ năm 1802, mọi màu đều có thể tổ hợp từ 3 màu cơ bản: Red,
Green và Blue.
Thiết bị ra ảnh có thể là máy in đen trắng, máy in màu hay máy vẽ (ploter).
Máy vẽ cũng có nhiều loại: loại dùng bút, loại phun mực.
Nhìn chung, các hệ thống thu nhận ảnh thực hiện 2 quá trình:
- Cảm biến: biến đổi năng lƣợng quang học (ánh sáng) thành năng lƣợng điện.
- Tổng hợp năng lƣợng điện thành ảnh
2.2.2. Lấy mẫu và lượng tử hóa (Image Sampling and quantization)
1. Lấy mẫu
Lấy mẫu là một quá trình, qua đó ảnh đƣợc tạo nên trên một vùng có tính liên
tục đƣợc chuyển thành các giá trị rời rạc theo tọa độ nguyên. Quá trình này gồm 2
lựa chọn:
- Một là: khoảng lấy mẫu.
- Hai là: cách thể hiện dạng mẫu.
Lựa chọn thứ nhất đƣợc đảm bảo nhờ lý thuyết lấy mẫu của Shannon. Lựa
chọn thứ hai liên quan đến độ đo (Metric) đƣợc dùng trong miền rời rạc.
Khoảng lấy mẫu (Sampling Interval)
Ảnh lấy mẫu có thể đƣợc mô tả nhƣ việc lựa chọn một tập các vị trí lấy mẫu
trong không gian hai chiều liên tục. Đầu tiên mô tả qua quá trình lấy mẫu một chiều
với việc sử dụng hàm
(2.3)

20



(2.4)
Tiếp theo chúng ta định nghĩa hàm răng lƣợc với các khoảng Δx nhƣ sau:
(2.5)
với r là số nguyên, Δx là khoảng lấy mẫu
Nhƣ vậy, hàm răng lƣợc là chuỗi các xung răng lƣợc từ (-∞ đến +∞). Giả sử
hàm một chiều g(x) đƣợc mô tả (gần đúng) bằng g(r Δx ) tức là:
g(x)≈g(rΔx)

(2.6)

Khi đó tín hiệu lấy mẫu đƣợc mô hình hoá
(2.7)
hoặc tƣơng đƣơng
(2.8)
Trong thực tế, r không thể tính đƣợc trong khoảng vô hạn (từ − ∞ đến +∞) mà
là một số lƣợng NΔx mẫu lớn cụ thể. Nhƣ vậy, để đơn giản có thể nói hàm liên tục
g(x) có thể biểu diễn trên một miền với độ dài NΔx mẫu thành chuỗi nhƣ sau:
g(x) ≈ {g(0), g(Δx), g(2Δx),..., g((N −1)Δx) }

(2.9)

Chú ý 1: Khoảng lấy mẫu (Sampling Interval) Δx là một tham số cần phải
đƣợc chọn đủ nhỏ, thích hợp, nếu không tín hiệu thật không thể khôi phục lại đƣợc
từ tín hiệu lấy mẫu.
Chú ý 2: Từ lý thuyết về xử lý tín hiệu số [6], (2-6) là tích chập trong miền
không gian x. Mặt khác, phƣơng trình trên tƣơng đƣơng với tích chập trong miền
tần số ω tức là biến đổi Fourier của gs(x) là
(2.10)
Trong đó ωx là giá trị tần số ứng với giá trị x trong miền không gian.

Điều kiện khôi phục ảnh lấy mẫu về ảnh thật đƣợc phát biểu từ định lý lấy
mẫu của Shannon.

21


Định lý lấy mẫu của Shannon [7]
Giả sử g(x) là một hàm giới hạn giải (Band Limited Function) và biến đổi
Fourier của nó là G(ωx) = 0 đối với các giá trị ωx > Wx . Khi đó g(x) có thể đƣợc
khôi phục lại từ các mẫu đƣợc tạo tại các khoảng Δx đều đặn. Tức là:
(2.11)
Định lý lẫy mẫu của Shannon có thể mở rộng cho không gian hai chiều. Hàm
răng lƣợc hai chiều khi đó đƣợc xác định:
(2.12)
Hàm lấy mẫu hai chiều thu đƣợc:
(2.13)
và Δx, Δy đƣợc chọn thoả mãn các điều kiện tƣơng ứng theo định lý lấy mẫu
của Shannon khi đó:
(2.14)
(2.15)
Tƣơng tự nhƣ không gian một chiều, một tín hiệu ảnh hai chiều g(x,y) có thể
xấp xỉ trong khoảng [N, M] có thể đƣợc ƣớc lƣợng nhƣ sau :
(2.16)

Các dạng lấy mẫu (Tesselation)
Dạng lẫy mẫu (Tesselation) điểm ảnh là cách bài trí các điểm mẫu trong không
gian hai chiều. Một số dạng mẫu điểm ảnh đƣợc cho là dạng chữ nhật, tam giác, lục
giác. Mỗi một mẫu, ngoài việc thể hiện hình dáng còn cho biết đặc điểm liên thông
của chúng. Ví dụ, mẫu chữ nhật có liên thông 4 hoặc 8 (nói về các mẫu liền kề);
mẫu lục giác có liên thông 6; mẫu tam giác có liên thông 3 hoặc 6.


22


Hình 2. 2: Các dạng mẫu điểm ảnh
Cần chú ý rằng, trong khuôn khổ luận văn này chỉ xét các mẫu điểm ảnh hình
chữ nhật, đặc biệt là dạng hình vuông. Nhiều trƣờng hợp ứng dụng có dùng đến các
mẫu tam giác hoặc lục giác.
2. Lượng tử hóa
Lƣợng tử hoá là một quá trình lƣợng hoá tín hiệu thật dùng chung cho các loại
xử lý tín hiệu trên cơ sở máy tính. Vấn đề này đã đƣợc nghiên cứu kỹ lƣỡng và có
nhiều lời giải lý thuyết dƣới nhiều giả định của các nhà nghiên cứu nhƣ Panter và
Dite (1951), Max (1960), Panter (1965).
Các giá trị lấy mẫu Z là một tập các số thực từ giá trị Zmin đến lớn nhất Zmax.
Mỗi một số trong các giá trị mẫu Z cần phải biến đổi thành một tập hữu hạn số bit
để máy tính lƣu trữ hoặc xử lý.

Hình 2. 3: Quá trình lượng tử hóa
Định nghĩa: Lƣợng tử hoá là ánh xạ từ các số thực mô tả giá trị lấy mẫu thành
một giải hữu hạn các số thực. Nói cách khác, đó là quá trình số hoá biên độ.

23


Hình 2. 4: Khuông lượng tử theo L mức xám
Giả sử Z là một giá trị lấy mẫu (số thực) tại vị trí nào đó của mặt phẳng ảnh,
và Zmin<=Z’<=Zmax và giả sử chúng ta muốn lƣợng hoá giá trị đó thành một
trong các mức rời rạc: l1, l2,…ln tƣơng ứng với Zmin đến Zmax (Hình 2.4). Khi đó,
quá trình lƣợng hoá có thể thực hiện bằng cách chia toàn bộ miền vào (Zmax Zmin) thành L khoảng, mỗi khoảng là Δl và khoảng thứ i đƣợc đặt tại điểm giữa các
khoảng liền kề li. Họ các giá trị z đƣợc thực hiện và mô tả bằng li theo quá trình trên

đây, khi đó sai số của quá trình lấy mẫu có thể đƣợc xác định theo:
eq=li – Z.

(2.17)

Hình 2. 5: Lấy mẫu và lượng tử hóa

24


2.2.3. Xứ lý và nâng cao chất lượng ảnh
Nâng cao chất lƣợng ảnh là một bƣớc quan trọng, tạo tiền đề cho xử lý ảnh.
Mục đích chính là nhằm làm nổi bật một số đặc tính của ảnh nhƣ thay đổi độ tƣơng
phản, lọc nhiễu, nổi biên, làm trơn biên ảnh, khuếch đại ảnh .. . Tăng cƣờng ảnh và
khôi phục ảnh là hai quá trình khác nhau về mục đích. Tăng cƣờng ảnh bao gồm
một loạt các phƣơng pháp nhằm hoàn thiện trạng thái quan sát của một ảnh. Tập
hợp các kỹ thuật này tạo nên giai đoạn tiền xử lý ảnh. Trong khi đó, khôi phục ảnh
nhằm khôi phục ảnh gần với ảnh thực chất trƣớc khi nó bị biến dạng do nhiều
nguyên nhân khác nhau.
Nhiệm vụ của tăng cƣờng chất lƣợng ảnh không phải là làm tăng lƣợng thông
tin vốn có trong ảnh mà làm nổi bật các đặc trƣng đã chọn làm sao để có thể phát
hiện tốt hơn, tạo thành quá trình tiền xử lý cho phân tích ảnh.
1. Cải thiện ảnh dùng toán tử điểm
Cải thiện ảnh là làm cho ảnh có chất lƣợng tốt hơn theo ý đồ sử dụng. Thƣờng
là ảnh thu nhận có nhiễu cần phải loại bỏ nhiễu hay ảnh không sắc nét bị mờ hoặc
cần làm rõ các chi tiết nhƣ biên. Các toán tử không gian dùng trong kỹ thuật tăng
cƣờng ảnh đƣợc phân theo nhóm theo công dụng: làm trơn nhiễu, nổi biên. Để làm
trơn nhiễu hay tách nhiễu ngƣời ta sử dụng các bộ lọc tuyến tính (lọc trung bình,
thông thấp) hay lọc phi tuyến (trung vị, giả trung vị, lọc đồng hình). Do bản chất
của nhiễu là ứng với tần số cao và cơ sở lý thuyết của lọc là bộ lọc chỉ cho tín hiệu

có tần số nào đó thông qua (dải tần bộ lọc). Do vậy để lọc nhiễu ta dùng lọc thông
thấp (theo quan điểm tần số không gian) hay lấy tổ hợp tuyến tính để san bằng (lọc
trung bình). Để làm nổi cạnh (ứng với tần số cao), ngƣời ta dùng các bộ lọc thông
cao, Laplace [8].
 Tăng độ tương phản
Trƣớc tiên cần làm rõ khái niệm độ tƣơng phản; ảnh số là tập hợp các điểm,
mà mỗi điểm có giá trị độ sáng khác nhau. Ở đây, độ sáng để mắt ngƣời dễ cảm
nhận ảnh song không phải là quyết định. Thực tế chỉ ra rằng hai đối tƣợng có cùng

25


×