BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN VĂN VƯƠNG
NGHIÊN CỨU XÂY DỰNG HỆ THỐNG
ĐẢM BẢO AN TOÀN DỮ LIỆU ĐÀO TẠO
TẠI TRƯỜNG ĐẠI HỌC SƯ PHẠM
ĐẠI HỌC ĐÀ NẴNG
LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN
Đà Nẵng – Năm 2016
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN VĂN VƯƠNG
NGHIÊN CỨU XÂY DỰNG HỆ THỐNG
ĐẢM BẢO AN TOÀN DỮ LIỆU ĐÀO TẠO
TẠI TRƯỜNG ĐẠI HỌC SƯ PHẠM
ĐẠI HỌC ĐÀ NẴNG
Chuyên ngành: Hệ thống thông tin
Mã số: 60.48.01.04
LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN
Người hướng dẫn khoa học: TS. NGUYỄN TRẦN QUỐC VINH
Đà Nẵng – Năm 2016
LỜI CAM ĐOAN
Tơi cam đoan đây là cơng trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng
được ai công bố trong bất kỳ cơng trình nào khác.
Tác giả luận văn
Nguyễn Văn Vương
MỤC LỤC
MỞ ĐẦU ........................................................................................................... 1
1. Tính cấp thiết của đề tài ........................................................................... 1
2. Mục tiêu nghiên cứu ................................................................................ 3
3. Đối tượng và phạm vi nghiên cứu ........................................................... 4
4. Phương pháp nghiên cứu ......................................................................... 4
5. Bố cục của luận văn ................................................................................. 5
6. Tổng quan tài liệu nghiên cứu ................................................................. 5
CHƯƠNG 1. NGHIÊN CỨU TỔNG QUAN................................................. 6
1.1. TỔNG QUAN VỀ HỆ THỐNG THƠNG TIN........................................... 6
1.1.1. Khái niệm hệ thống thơng tin ........................................................ 6
1.1.2. Phân loại hệ thống thông tin .......................................................... 7
1.1.3. Các thành phần của một hệ thống thông tin .................................. 7
1.1.4. Phát triển hệ thống thông tin .......................................................... 8
1.2. THỰC TRẠNG CÔNG TÁC QUẢN LÝ DỮ LIỆU ĐÀO TẠO .............. 9
1.2.1. Quy trình quản lý dữ liệu đào tạo .................................................. 9
1.2.2. Đánh giá hiện trạng quản lý dữ liệu đào tạo hiện nay ................. 10
1.3. TỔNG QUAN KỸ THUẬT XỬ LÝ ẢNH............................................... 12
1.3.1. Khái niệm xử lý ảnh..................................................................... 12
1.3.2. Quy trình xử lý ảnh ...................................................................... 14
1.3.3. Một số ứng dụng của công nghệ xử lý ảnh.................................. 15
1.4. KỸ THUẬT NHẬN DẠNG KÝ TỰ QUANG HỌC ............................... 16
1.4.1. Khái niệm nhận dạng ký tự quang học ........................................ 16
1.4.2. Các yếu tố đầu vào quyết định thành công của hệ thống OCR ... 17
1.4.3. Một số ứng dụng của OCR .......................................................... 17
1.5. THƯ VIỆN TESSERACT ........................................................................ 19
1.5.1. Sơ lược Tesseract ......................................................................... 19
1.5.2. Cấu trúc Tesseract ........................................................................ 20
1.5.3. Cách thức Tesseract làm việc ...................................................... 20
1.5.4. Thư viện VietOCR.NET .............................................................. 22
1.6. KIẾN TRÚC HƯỚNG DỊCH VỤ ............................................................ 23
1.6.1. Tổng quan về SOA ...................................................................... 23
1.6.2. Kiến trúc SOA ............................................................................. 24
1.6.3. Phân tích tính ứng dụng của SOA trong hệ thống ....................... 25
1.6.4. Những thách thức trong mơ hình SOA ........................................ 25
1.7. KẾT LUẬN CHƯƠNG 1.......................................................................... 25
CHƯƠNG 2. GIẢI PHÁP CHỐNG CAN THIỆP DỮ LIỆU ĐIỂM ĐÀO
TẠO ................................................................................................................ 27
2.1. GIỚI THIỆU ............................................................................................. 27
2.2. PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG .............................................. 27
2.2.1. Phân tích hệ thống........................................................................ 28
2.2.2. Thiết kế hệ thống ......................................................................... 30
2.2.3. Thiết kế cơ sở dữ liệu .................................................................. 32
2.3. XÂY DỰNG THUẬT TOÁN NHẬN DẠNG KÝ IN TỰ QUANG HỌC
DẠNG SỐ TRONG BÀI TOÁN NHẬN DẠNG BẢNG ĐIỂM .................... 34
2.3.1. Các yêu cầu của tệp tin ảnh đầu vào ............................................ 34
2.3.2. Chuẩn hóa tệp tin ảnh .................................................................. 34
2.3.3. Xây dựng thuật toán ..................................................................... 35
2.3.4. Kiểm thử thuật toán ..................................................................... 38
2.3.5. Đánh giá thuật toán ...................................................................... 38
2.3.6. Xây dựng dịch vụ trích xuất thơng tin từ bảng điểm sinh viên ... 39
2.4. XÂY DỰNG MÔ-ĐUN TƯƠNG TÁC VỚI HỆ THỐNG THÔNG TIN
ĐÀO TẠO ........................................................................................................ 40
2.4.1. Cấu trúc dữ liệu hệ thống thông tin đào tạo ................................ 40
2.4.2. Các dịch vụ của hệ thống thông tin đào tạo................................. 41
2.4.3. Xây dựng mô-đun tương tác với hệ thống thông tin đào tạo....... 41
2.5. KẾT LUẬN CHƯƠNG 2.......................................................................... 42
CHƯƠNG 3. PHÁT TRIỂN ỨNG DỤNG................................................... 44
3.1. LỰA CHỌN CƠNG CỤ PHÁT TRIỂN ................................................... 44
3.1.1. Ngơn ngữ lập trình ....................................................................... 44
3.1.2. Cơ sở dữ liệu ................................................................................ 44
3.2. XÂY DỰNG CƠ SỞ DỮ LIỆU LƯU TRỮ TỆP TIN ẢNH BẢNG
ĐIỂM ................................................................................................................ 44
3.2.1. Thu thập và xử lý các nguồn dữ liệu ........................................... 44
3.2.2. Xây dựng dịch vụ truy xuất dữ liệu ............................................. 48
3.3. XÂY DỰNG WEBSITE TƯƠNG TÁC VỚI NGƯỜI DÙNG CUỐI ..... 51
3.3.1. Xây dựng hệ thống ....................................................................... 51
3.3.2. Tích hợp mơ-đun trích xuất dữ liệu từ bảng điểm sinh viên ....... 57
3.3.3. Tích hợp mơ-đun tương tác với hệ thống thông tin đào tạo ........ 58
3.4. THỬ NGHIỆM VÀ ĐÁNH GIÁ CHƯƠNG TRÌNH .............................. 58
3.4.1. Thử nghiệm mơ-đun nhận dạng dữ liệu .......................................... 58
3.4.2. Thử nghiệm mô-đun tương tác với người dùng cuối và mô-đun kết
nối với hệ thống đào tạo ................................................................................... 59
3.5. XÂY DỰNG CHÍNH SÁCH VÀ GIẢI PHÁP BẢO MẬT CHO HỆ
THỐNG ............................................................................................................ 63
3.5.1. Xác định các mối đe dọa hệ thống ............................................... 64
3.5.2. Gian lận và đánh cắp thông tin .................................................... 64
3.5.3. Tấn công từ bên bên ngoài hệ thống............................................ 64
3.5.4. Sử dụng mã nguy hiểm ................................................................ 64
3.6. KẾT LUẬN CHƯƠNG 3.......................................................................... 65
KẾT LUẬN ..................................................................................................... 66
DANH MỤC TÀI LIỆU THAM KHẢO ...................................................... 67
QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN (bản sao)
DANH MỤC CÁC TỪ VIẾT TẮT
Từ/Cụm từ
Từ/Cụm từ đầy đủ
Ý nghĩa
ATTT
An tồn thơng tin
An tồn thơng tin
API
Application Programming Interface Giao diện lập trình ứng dụng
CSDL
Cơ sở dữ liệu
Cơ sở dữ liệu
CNTT
Công nghệ thông tin
Công nghệ thông tin
DPI
Dot Per Inch
Đơn vị chỉ số lượng điểm trên một
inch vuông
DSS
Decision Support System
Hệ thống trợ giúp ra quyết định
ES
Expert System
Hệ thống chuyên gia
ISCA
Information System for
Hệ thống tăng cường khả năng
Competitive Advantage
cạnh tranh
MIS
Management Information System
Hệ thống thông tin quản lý
OCR
Optical Character Recognition
Nhận dạng ký tự in quang học
SOA
Service Oriented Architecture
Kiến trúc hướng dịch vụ
TPS
Transaction Processing System
Hệ thống thông tin xử lý giao dịch
DANH MỤC CÁC BẢNG
Số hiệu
Tên bảng
Trang
3.1.
Danh sách Usecase
52
3.2.
Đặc tả Usecase Đăng nhập
52
3.3.
Đặc tả Usecase đăng tải bảng điểm
53
3.4.
Đặc tả Usecase Tìm kiếm bảng điểm
53
3.5.
Đặc tả Usecase Đối sánh dữ liệu
54
3.6.
Đặc tả Usecase Thống kê bảng điểm
54
3.7.
Đặc tả Usecase Nhận thông báo qua email
55
3.8.
Đặc tả Usecase Xem kết quả nhận dạng
55
3.9.
Đặc tả Usecase Nhận dạng bảng điểm
56
3.10.
Đặc tả Usecase Cấu hình hệ thống
56
3.11.
Kết quả nhận dạng bảng điểm
59
DANH MỤC CÁC HÌNH
Số
Tên hình
hiệu
Trang
1.1.
Các chức năng chính của hệ thống thông tin
6
1.2.
Các thành phần trong hệ thống thông tin
8
1.3.
Lưu đồ quản lý dữ liệu điểm đào tạo
11
1.4.
Ảnh thu nhận và ảnh mong muốn
13
1.5.
Sơ đồ tổng quát của hệ thống xử lý ảnh
14
1.6.
Mẫu ký tự viết tay
16
1.7.
Ảnh chụp mẫu ký tự đánh máy
17
1.8.
Giao diện phần mềm VnDOCR và VietOCR
18
1.9.
Kiến trúc Tesseract
19
1.10. Ví dụ về một đường cơ sở dạng cong
21
1.11. Ví dụ về cắt các ký tự bị dính
21
1.12. Quá trình nhận dạng từ
22
1.13. Kiến trúc SOA
25
2.1.
Tổng quan các thành phần trong hệ thống
28
2.2.
Sơ đồ hoạt động xử lý và nhận dạng ảnh
29
2.3.
Sơ đồ mô tả tương tác giữa ứng dụng và hệ thống đào tạo
30
2.4.
Cấu trúc các thành phần của hệ thống
31
2.5.
Sơ đồ cơ sở dữ liệu
32
2.6.
Bảng điểm mẫu
33
2.7.
Ảnh gốc đã được chuyển về dạng nhị phân
34
2.8.
Bản sao ảnh gốc với dạng màu được đảo ngược
35
2.9.
Thuật toán đánh dấu các khối chữ nhật
36
Số
Tên hình
hiệu
Trang
2.10. Thuật tốn nhận dạng bảng điểm
37
2.11. Kết quả khi chạy thuật toán đánh dấu các khối chữ nhật
38
2.12.
Kết quả khi chạy thuật toán nhận dạng bảng điểm
2.13. Sơ đồ cơ sở dữ liệu hệ thống đào tạo
38
40
3.1.
Bảng ghi điểm bộ phận 1,2 và giữa kỳ
45
3.2.
Bảng ghi điểm cuối kỳ
46
3.3.
Cấu trúc bảng điểm đề xuất
47
3.4.
Cấu trúc thư mục lưu tệp tin bảng điểm
50
3.5.
Biểu đồ usecase tổng quát website tương tác với người
51
dùng cuối
3.6.
Cách thức tương tác giữa mô-đun nhận dạng và website
57
3.7.
Giao diện mô-đun nhận dạng bảng điểm
58
3.8.
Minh họa Bảng điểm bị nhiễu
59
3.9.
Màn hình đăng nhập
60
3.10. Màn hình đăng tải bảng điểm
60
3.11. Màn hình tra cứu bảng điểm
61
3.12. Màn hình thơng báo của hệ thống
61
3.13. Danh sách các API của đào tạo
62
3.14. Dữ liệu trả về của API
62
3.15. Sử dụng Jquery Ajax để lấy dữ liệu thông qua API
63
3.16. Kết quả trả về khi thực hiện truy vấn đến API
63
1
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Trong các hệ thống thơng tin, việc đảm bảo vấn đề an tồn thơng tin
(ATTT) được xem là sự sống cịn, là giá trị tồn tại của hệ thống. Thế nhưng,
không phải tổ chức nào cũng nhận thức được tầm quan trọng của vấn đề bảo
mật thơng tin và những nguy cơ có thể xảy ra từ việc công khai thông tin trên
mạng internet.
Hiện nay, trường Đại học Sư phạm, Đại học Đà Nẵng đang vận hành hệ
thống thông tin đào tạo, cung cấp cho sinh viên công cụ để tra cứu điểm, đăng
ký học, giảng viên và bộ phận quản lý nhập điểm và thực hiện các nghiệp vụ
khác. Hệ thống thông tin đào tạo của Nhà trường được triển khai trên cơ sở
các máy chủ vật lý tự xây dựng và quản lý bởi các đơn vị trong nhà Trường.
Qua thực tế vận hành, hệ thống vẫn còn tiềm ẩn các vấn đề về bảo mật dẫn
đến các nguy cơ mất ATTT, đặc biệt là dữ liệu về điểm môn học của sinh
viên.
Với đặc điểm là một hệ thống thông tin phục vụ cho nhiều người, nhiều
mục đích khác nhau, hệ thống thông tin đào tạo của nhà Trường chia sẻ nhiều
dữ liệu quan trọng với nhiều đối tượng người dùng khác nhau. Chẳng hạn,
sinh viên có thể vào xem điểm; giảng viên nhập điểm thành phần 1 và 2, cán
bộ quản lý nhập điểm thành phần 3; bộ phận quản lý máy chủ có thể vào
chỉnh sửa dữ liệu trong cơ sở dữ liệu (CSDL). Các đối tượng này khi sử dụng
mạng internet để truy cập hệ thống thường sẽ đối mặt với nguy cơ bị mất an
toàn như: truy cập bất hợp pháp, sao chép, lưu trữ hoặc chuyển đến cho các
đối tượng không được phép. Nguy hiểm hơn là dữ liệu điểm bị thay đổi mà
người dùng không hề biết. Việc thay đổi dữ liệu lại càng dễ dàng hơn nếu
những cá nhân có mục đích xấu lại là những người có hiểu biết về cơng nghệ
2
thông tin (CNTT) hoặc là những người quản trị hệ thống, quản trị ứng dụng
trong Nhà trường.
Hiện tại, nhà Trường đã áp dụng một số biện pháp quản lý như sao lưu
dữ liệu thường xuyên, tăng cường công tác an ninh mạng và bảo vệ phòng
máy. Tuy nhiên các giải pháp này vẫn mang tính tạm thời, vẫn tìm ẩn những
nguy cơ như đã đề cập ở trên do chưa có cơ chế chống sửa đổi dữ liệu.
Bên cạnh đó, giải pháp số hóa tài liệu, cơng văn đã được nghiên cứu
triển khai tại một số đơn vị như Thư viện, phịng Tổ chức - Hành chính.
Trong tương lai, giải pháp số hóa bảng điểm gốc sẽ được áp dụng triển khai
tại các Khoa/Phịng có cơng tác quản lý điểm. Việc số hóa các bảng điểm gốc
của sinh viên kết hợp với cơng nghệ xử lý ảnh, chúng ta hồn tồn có thể tra
cứu, tìm kiếm điểm mơn học nào thuộc về sinh viên nào. Bên cạnh đó, dữ liệu
là các tệp tin ảnh thì khơng thể sửa đổi. Chính vì vậy, mỗi khi so sánh, các
bảng điểm này sẽ là cơ sở cho việc tìm kiếm sự thay đổi giữa dữ liệu điểm tại
phòng Đào tạo và dữ liệu điểm tại các Khoa/Phịng.
Trên cơ sở phân tích hiện trạng công tác quản lý tại trường Đại học Sư
phạm, tôi đi sâu vào việc nhận dạng ký tự in quang học dạng số, từ đó cho
phép tìm kiếm trên các bảng điểm được số hóa. Bên cạnh đó, tơi nghiên cứu
cấu trúc dữ liệu của hệ thống đào tạo. Từ đó, xây dựng các dịch vụ hỗ trợ
người dùng so sánh, tìm kiếm sự khác biệt dữ liệu giữa hệ thống đào tạo và
các bảng điểm gốc nhằm tăng cường cơng tác bảo vệ an tồn dữ liệu, góp
phần tăng cường tính tin cậy của hệ thống thơng tin đào tạo. Nhằm thực hiện
các mục tiêu đề ra, tôi chọn đề tài “Nghiên cứu xây dựng hệ thống đảm bảo
an toàn dữ liệu đào tạo tại trường Đại học Sư phạm – Đại học Đà Nẵng” làm
đề tài tốt nghiệp cao học.
3
2. Mục tiêu nghiên cứu
Về lý thuyết: Tìm hiểu và nghiên cứu lý thuyết xử lý ảnh và nhận dạng
ký tự in quang học dạng số. Bên cạnh đó, đề tài thực hiện nghiên cứu lý
thuyết kiến trúc hướng dịch vụ nhằm xây dựng công cụ giao tiếp giữa các ứng
dụng khác nhau.
Về ứng dụng: Xây dựng hệ thống đảm bảo an toàn dữ liệu đào tạo tại
trường Đại học Sư phạm – Đại học Đà Nẵng bao gồm các chức năng:
- Số hóa và lưu trữ bảng điểm gốc;
- Nhận dạng và tìm kiếm thơng tin điểm trên bảng điểm;
- So sánh, đối chiếu với hệ thống đào tạo nhằm tìm kiếm sự khác biệt
về điểm;
- Thống kê, báo cáo.
Để đạt được mục tiêu trên, nhiệm vụ của tôi là nghiên cứu đề xuất giải
pháp và xây dựng công cụ để sử dụng lại các hệ thống nhận dạng ký tự in
quang học và tích hợp vào hệ thống nhằm tạo ra kho dữ liệu điểm sinh viên
có thể tìm kiếm, đối chiếu trên các tệp tin ảnh là các bảng điểm.
Về lý thuyết:
- Tìm hiểu kỹ thuật xử lý ảnh và nhận dạng ký tự quang học.
- Nghiên cứu các thư viện nhận dạng ký tự quang học.
- Nghiên cứu hệ thống thông tin đào tạo.
- Nghiên cứu công nghệ web 2.0.
Về thực tiễn: Đề tài đề xuất giải pháp và xây dựng công cụ để nhận
dạng điểm môn học của sinh viên trong các bảng điểm được lưu trữ dưới dạng
tệp tin ảnh. Từ đó, xây dựng hệ thống so sánh đối chiếu nhằm tìm ra sự thay
4
đổi dữ liệu điểm trong hệ thống thông tin đào tạo của trường Đại học Sư
phạm, Đại học Đà Nẵng.
3. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: Hệ thống thông tin đào tạo của trường Đại học
Sư phạm, Đại học Đà Nẵng; Thư viện xử lý ảnh và nhận dạng ký tự in quang
học dạng số
Phạm vi nghiên cứu: Đề tài tập trung nghiên cứu giải pháp nhận dạng
ký tự in quang học dạng số nhằm xây dựng hệ thống chống can thiệp dữ liệu
trong hệ thống thông tin đào tạo trường Đại học Sư phạm, Đại học Đà Nẵng.
4. Phương pháp nghiên cứu
Phương pháp nghiên cứu, tơi đã sử dụng hai phương pháp chính là
nghiên cứu lý thuyết và nghiên cứu thực nghiệm.
Phương pháp nghiên cứu lý thuyết
- Các tài liệu về cơ sở lý thuyết: xử lý ảnh, nhận dạng ký tự quang học,
kỹ thuật lập trình.
- Các tài liệu mơ tả một số cơng cụ xử lý ảnh và nhận dạng ký tự.
- Công nghệ web 2.0, kiến trúc hướng dịch vụ (SOA)
- Các tài liệu liên quan đến một số nghiên cứu về bảo mật và an tồn
thơng tin.
Phương pháp thực nghiệm
- Sử dụng các hệ thống xử lý ảnh và nhận dạng ký tự quang học để
trích xuất dữ liệu từ các tệp tin ảnh.
- Thực nghiệm nhận dạng và kiểm tra kết quả.
- Xây dựng công cụ kiểm tra, đối chiếu với hệ thống thơng tin về điểm
của Phịng đào tạo.
5
5. Bố cục của luận văn
Báo cáo của luận văn được tổ chức thành 3 chương chính như sau:
Chương 1: Tập trung phân tích hiện trạng quản lý hệ thống thông tin
đào tạo; cơ sở lý thuyết về xử lý ảnh và nhận dạng ký tự in quang học dạng
số; cuối chương là cơ sở lý thuyết về mơ hình kiến trúc hướng dịch vụ.
Chương 2: Nghiên cứu xây dựng thuật toán nhận dạng ký tự in quang
học dạng số trên đối tượng là bảng điểm sinh viên; Xây dựng mô-đun tương
tác với hệ thống thông tin đào tạo.
Chương 3: Đề tài tập trung xây dựng và triển khai hệ thống bằng cách
tích hợp các mơ-đun ở chương 2. Từ đó, xây dựng hệ thống website tương tác
với người dùng cuối. Cuối chương, đề tài xây dựng hệ thống các chính sách
và giải pháp bảo mật cho hệ thống.
Kết thúc luận văn là phần kết luận và đề xuất hướng phát triển. Trong
phần này đề tài tổng kết các nội dung đã nghiên cứu và đề xuất hướng phát
triển trong tương lai.
6. Tổng quan tài liệu nghiên cứu
Trong luận văn này, các tài liệu nghiên cứu tập trung vào lý thuyết về
các hệ thống thơng tin, giáo trình xử lý ảnh và nhận dạng ký tự quang học, kỹ
thuật xây dựng và phát triển hệ thống. Các tài liệu tham khảo có thể được kể
đến như:
- Giáo trình hệ thống thơng tin
- Giáo trình Xử lý ảnh
- Quy trình phát triển phần mềm
6
CHƯƠNG 1
NGHIÊN CỨU TỔNG QUAN
1.1. TỔNG QUAN VỀ HỆ THỐNG THƠNG TIN
1.1.1. Khái niệm hệ thống thơng tin
Trong các tổ chức, việc tin học hóa các quy trình, nghiệp vụ nhằm tạo
ra sản phẩm hoặc hỗ trợ ra quyết định bằng các ứng dụng phần mềm ngày
càng được quan tâm. Các ứng dụng này được gọi là hệ thống thông tin.
Hệ thống thông tin là một hệ thống bao gồm các yếu tố có quan hệ với
nhau cùng làm nhiệm vụ thu thập, xử lý, lưu trữ, phân phối thông tin và dữ
liệu, cung cấp một cơ chế phản hồi để đạt được một mục tiêu định trước [1].
Giống như các hệ thống khác, hệ thống thơng tin có đầu vào là dữ liệu. đầu ra
là thơng tin.
Hình 1.1. Các chức năng chính của hệ thống thơng tin [2]
Dữ liệu đầu vào là các mô tả trung thực, khách quan về đặc tính vốn có
của một đối tượng trong thế giới thực. Thông qua các xử lý, biến đối và có sự
tham gia của tri thức, dữ liệu đầu vào sẽ được chuyển thành thông tin. Thông
tin là dữ liệu được tổ chức theo một cách sao cho chúng mang lại một giá trị
gia tăng so với giá trị vốn có của bản thân sự kiện đó. Hình 1.1 mơ tả các
chức năng chính trong một hệ thống thơng tin.
7
1.1.2. Phân loại hệ thống thông tin
Hệ thống thông tin có thể phân loại dựa theo các tiêu chí khác nhau.
thông thường, hệ thống thông tin được phân loại theo mục đích phục vụ của
thơng tin đầu ra hoặc mục đích hoạt động trong các tổ chức.
Mặc dù rằng các hệ thống thường sử dụng các công nghệ khác nhau
nhưng chúng phân biệt nhau trước hết bởi thông tin đầu ra phục vụ các loại
hoạt động nào mà chúng trợ giúp. Theo cách này có năm loại: Hệ thống thơng
tin xử lý giao dịch (TPS); Hệ thống thông tin quản lý (MIS); Hệ thống trợ
giúp ra quyết định (DSS); Hệ chuyên gia (ES); Hệ thống thông tin tăng cường
khả năng cạnh tranh (ISCA).
Cách phân loại thứ hai dựa vào các nghiệp vụ trong tổ chức mà hệ
thống thông tin được ứng dụng. Theo cách này hệ thống thông tin trong tổ
chức gồm các hệ thống: Hệ thống thông tin tài chính; Hệ thống thơng tin
Marketing; Hệ thống thơng tin quản lý kinh doanh và sản xuất; Hệ thống
thông tin quản trị nhân lực; Hệ thống thơng tin văn phịng.
1.1.3. Các thành phần của một hệ thống thông tin
Các thành phần trong một hệ thống thông tin gồm con người, các thiết
bị phần cứng, phần mềm, dữ liệu nhằm thực hiện các hoạt động thu thập, lưu
trữ, xử lý dữ liệu, tạo ra và phân phối thông tin trong tập hợp rằng buộc là
mơi trường. Hình 1.2 mơ tả tổng qt các thành phần trong một hệ thống
thông tin. Trong sơ đồ 1.2, phần cứng có nhiệm vụ kết nối các thiết bị vật lý
và tương tác với con người, phần mềm điều khiển phần cứng và thao tác trên
dữ liệu, tiến trình là tập hợp các nghiệp vụ trong hệ thống, con người thực
hiện xây dựng, vận hành hệ thống.
8
Hình 1.2. Các thành phần trong hệ thống thơng tin [2]
1.1.4. Phát triển hệ thống thông tin
Phát triển hệ thống thơng tin là xây dựng mới hay hồn thiện một hệ
thống thông tin nhằm nâng cao chất lượng thu thập, xử lý, phân phối, lưu trữ
dữ liệu và thông tin. Việc phát triển hệ thống thơng tin có nhiều ngun nhân,
cụ thể như sau:
- Hệ thống thông tin hiện tại không thể đáp ứng được yêu cầu đặt ra;
- Sự thay đổi luật của nhà nước;
- Những yêu cầu mới của nhà quản lý: ký kết hợp đồng mới, thay đổi
sản phẩm, …;
- Sự thay đổi của công nghệ: thiết bị công nghệ mới, xuất hiện hệ quản
trị cơ sở dữ liệu;
- Gặp phải những vấn đề cản trở hoạt động của tổ chức;
- Cần tạo ra những ưu thế mới trong cạnh tranh.
9
- Cắt giảm được chi phí quan trọng
Vịng đời phát triển hệ thống thơng tin có thể chia thành các giai đoạn
như sau:
- Khởi tạo và lập kế hoạch dự án;
- Phân tích hệ thống;
- Thiết kế hệ thống;
- Triển khai hệ thống;
- Vận hành và bảo trì hệ thống.
1.2. THỰC TRẠNG CÔNG TÁC QUẢN LÝ DỮ LIỆU ĐÀO TẠO
Hiện nay, phịng Đào tạo trường Đại học Sư phạm có nhiều tổ chuyên
trách các nhiệm vụ khác nhau, như: tổ quản lý dữ liệu, tổ giáo vụ, … các tổ
chuyên trách hoạt động độc lập và cùng sử dụng chung hệ thống thơng tin đào
tạo.
1.2.1. Quy trình quản lý dữ liệu đào tạo
Công tác quản lý dữ liệu được thực hiện qua nhiều công đoạn với sự
tham gia của nhiều đối tượng khác nhau. Hình 1.3 mơ tả các nghiệp vụ làm
phát sinh dữ liệu đào tạo. Đầu tiên, bộ phận chun trách phịng đạo tạo sẽ
trích xuất danh sách sinh viên của môn học thành bảng ghi điểm, sau đó bảng
ghi điểm này được gửi cho cho giáo viên và bộ phận khảo thí. Giáo viên và
bộ phận khảo thí tiến hành ghi điểm vào bảng điểm. Trước khi gửi bảng ghi
điểm về cho đào tạo và giáo vụ khoa, giáo viên sẽ nhập điểm lên hệ thống đào
tạo. Bộ phận khảo thí cũng tiến hành tương tự giáo viên. Giáo vụ khoa sau khi
tiếp nhận bảng điểm gốc sẽ tiến hành so sánh bảng điểm gốc và dữ liệu điểm
được lưu trên hệ thống đào tạo để tìm sai sót. Nếu có sai sót, giáo vụ khoa lập
bảng kê và gửi đến đào tạo.
10
Bộ phận đào tạo sau khi tiếp nhận sai sót, sẽ tiến hành rà sốt để kiểm
tra lại. Nếu có sai sót, bộ phận đào tạo tiến hành cập nhật vào hệ thống. Dữ
liệu điểm sẽ được sử dụng để xét học vụ và cho sinh viên tra cứu điểm cá
nhân.
1.2.2. Đánh giá hiện trạng quản lý dữ liệu đào tạo hiện nay
Trong quy trình hiện nay có nhiều ưu điểm, tuy nhiên vẫn còn tồn tại
các bất cập. Với quy trình này, mỗi bộ phận tham gia phải thực hiện nhiều
nghiệp vụ, lưu trữ nhiều dữ liệu dưới các dạng khác nhau. Ví dụ, giáo viên
phải vừa ghi điểm vào bảng ghi điểm trên giấy, vừa phải nhập điểm vào hệ
thống qua mạng internet. Bên cạnh đó, bộ phận giáo vụ khoa phải rà soát lại
dữ liệu trên hệ thống và bảng điểm gốc lưu tại khoa. Điều này sẽ làm tốn thời
gian và công sức khi dữ liệu điểm tại mỗi học kỳ là rất lớn. Ngoài ra, dữ liệu
điểm được lưu trên hệ thống sau khi được kiểm tra tại mỗi học kỳ sẽ được sử
dụng cho tra cứu và xét học vụ sau này mà không phải kiểm tra lại tại thời
điểm xét học vụ. Điều này dẫn đến rủi ro có sự can thiệp điều chỉnh điểm
bằng các cách khác nhau kể cả trong và ngoài hệ thống.
11
Lưu đồ quản lý dữ liệu đào tạo và các đối tượng sử dụng
Giáo viên
Khảo thí và kiểm định
CLGD
Đào tạo
Giáo vụ Khoa
Hệ thống thông tin đào tạo
Sinh viên
CSDL Điểm
đào tạo
In bảng điểm
Bảng điểm giữa
kỳ
Ghi điểm giữa
kỳ
Bảng điểm gốc
Ghi điểm cuối
kỳ
Bảng điểm cuối
kỳ
Lưu văn thư
Bảng điểm gốc
Đối chiếu điểm
gốc và điểm lưu
trên hệ thống
Nhập điểm vào
hệ thống đào tạo
Nhập điểm vào
hệ thống đào tạo
CSDL Điêm
đào tạo
Có sai sót?
CĨ
Xác nhận các sai
sót
Lập bảng kê
danh sách sai sót
Có sai sót
ĐÚNG
Cập nhật hệ
thống
Xét học vụ cấp
khoa
Lập bảng kê:
- Sinh viên tốt nghiệp
- Sinh viên không được tốt nghiệp
- Sinh viên cảnh bảo học vụ
- Xét học bổng
Lập bảng kê:
- Sinh viên tốt nghiệp
- Sinh viên không được tốt nghiệp
- Sinh viên cảnh bảo học vụ
- Xét học bổng
CSDL Điểm
đào tạo
Phase
Xét học vụ cấp
trường
Hình 1.3. Lưu đồ quản lý dữ liệu điểm đào tạo
Tra cứu bảng
điểm cá nhân
12
1.3. TỔNG QUAN KỸ THUẬT XỬ LÝ ẢNH
1.3.1. Khái niệm xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng
vai trị quan trọng nhất. Những năm trở lại đây với sự phát triển của phần
cứng máy tính, xử lý ảnh và đồ hoạ do đó phát triển một cách mạnh mẽ và có
nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trị quan
trọng trong tương tác người máy. [3]
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận.
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem
như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó
của đối tượng trong khơng gian và nó có thể xem như một hàm n biến P(c1,
c2,..., cn). Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều.
Một số khái niệm cơ bản
- Ảnh và điểm ảnh: Điểm ảnh được xem như là dấu hiệu hay cường độ
sáng tại 1 toạ độ trong không gian của đối tượng và ảnh được xem như là 1
tập hợp các điểm ảnh.
- Mức xám, màu: Là số các giá trị có thể có của các điểm ảnh của ảnh
Các vấn đề cơ bản trong xử lý ảnh
- Nắn chỉnh biến dạng: Ảnh thu nhận thường bị biến dạng do các thiết
bị quang học và điện tử
13
Hình 1.4. Ảnh thu nhận và ảnh mong muốn
- Khử nhiễu: Có 2 loại nhiễu cơ bản trong q trình thu nhận ảnh:
Nhiễu hệ thống và nhiễu ngẫu nhiên. Nhiễu hệ thống là nhiễu có quy luật có
thể khử bằng các phép biến đổi. Nhiễu ngẫu nhiên là nhiễu do vết bẩn khơng
rõ ngun nhân, có thể khắc phục bằng các phép lọc.
- Chỉnh mức xám: Nhằm khắc phục tính khơng đồng đều của hệ thống
gây ra. Thơng thường có 2 hướng tiếp cận: Giảm số mức xám và tăng số mức
xám. Giảm số mức xám thực hiện bằng cách nhóm các mức xám gần nhau
thành một bó. Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen
trắng. Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng
kỹ thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh
- Trích chọn đặc điểm: Các đặc điểm của đối tượng được trích chọn tuỳ
theo mục đích nhận dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc
điểm của ảnh sau đây: Đặc điểm không gian (phân bố mức xám, biên độ,
điểm uốn, …); Đặc điểm biến đổi (trích chọn bằng việc thực hiện lọc vùng);
Đặc điểm biên và đường biên (đặc trưng cho đường biên của đối tượng)
- Nhận dạng: Nhận dạng tự động (automatic recognition), mơ tả đối
tượng, phân loại và phân nhóm các mẫu.
- Nén ảnh: Nhằm giảm thiểu không gian lưu trữ.
14
1.3.2. Quy trình xử lý ảnh
Sơ đồ tổng quát của một hệ thống xử lý ảnh được trình bày trong hình
1.5.
Hình 1.5. Sơ đồ tổng quát của hệ thống xử lý ảnh
Sơ đồ này bao gồm các thành phần sau:
- Thu nhận ảnh: Ảnh có thể nhận qua camera màu hoặc đen trắng.
Thường ảnh nhận qua camera là ảnh tương tự (loại camera ống chuẩn CCIR
với tần số 1/25, mỗi ảnh 25 dịng), cũng có loại camera đã số hóa (như loại
CCD – Change Couple Device) là loại photodiot tạo cường độ sáng tại mỗi
điểm ảnh. Camera thường dùng là loại qt dịng, ảnh tạo ra có dạng hai chiều.
Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường
(ánh sáng, phong cảnh).
- Tiền xử lý: Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên
cần đưa vào bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ
tiền xử lý là lọc nhiễu, nâng cao độ tương phản để làm ảnh rõ hơn, nét hơn.
- Trích chọn đặc điểm: Phân vùng ảnh thành các thành phần để phân
tích tìm kiếm các đặc trưng các đối tượng cần nhận dạng ví dụ ký tự chữ in,
ký tự viết tay, hình tứ giác, hình tam giác, …
- Hậu xử lý: Là kỹ thuật rút gọn số lượng điểm biểu diễn. Kết quả của
phần dị biên hay trích xương thu được 1 dãy các điểm liên tiếp. Việc rút gọn
sẽ giúp bỏ bớt các điểm thu điểm điểm giảm thiểu không gian lưu trữ và
thuận tiện cho việc đối sánh.