Tải bản đầy đủ (.pdf) (69 trang)

042_Tom tat khoa luan tot nghiep K47CNPM.pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.08 MB, 69 trang )



ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
KHOA CÔNG NGHỆ THÔNG TIN




TÓM TẮT KHÓA LUẬN TỐT NGHIỆP
CHUYÊN NGÀNH CÔNG NGHỆ PHẦN MỀM


















HÀ NỘI – 2006
ĐẠI HỌC QUỐC GIA HÀ NỘI


TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
KHOA CÔNG NGHỆ THÔNG TIN












TÓM TẮT KHÓA LUẬN TỐT NGHIỆP
CHUYÊN NGÀNH CÔNG NGHỆ PHẦN MỀM

















HÀ NỘI - 2006

- 1 -
Mục lục






1.


2.


3.


4.


5.


6.



7.


8.



9.



10.



11.


12.


Danh sách cán bộ Bộ môn Công nghệ phần mềm ……………………………..

Danh sách cán bộ tham gia hướng dẫn ………………………………………...

Phân tích và thiết kế cơ sở dữ liệu cho doanh nghiệp vừa và nhỏ
Nguyễn Việt Cường …………………………………………………………..

Tìm hiểu một số phương pháp phân tích trang tài liệu
Nguyễn Văn Dũng ……………………………………………………………


Xây dựng hệ chuyên gia hỗ trợ cho đào tạo quản lý dự án
Vũ Thị Hà Minh, Cao Thị Nhậm, Nghiêm Văn Triệu ……………………..

Ứng dụng Framework Jhotdraw phát triển hệ thống tính toán ROI
Nguyễn Thanh Hà ……………………………………………………………

Quản lý vật tư
Bùi Thị Thu Hằng ……………………………………………………………

Phân loại văn bản tiếng Việt
Trần Mai Hạnh ………………………………………………………………

Xây dựng thành phần sinh ảnh chống đăng nhập tự động
Phan Chí Hiếu ………………………………………………………………..

Các vấn đề phi chuẩn trong phân tích thiết kế hệ thống thông tin quản lý hoạt
động kinh doanh
Nguyễn Huy Hoàng …………………………………………………………..

Nghiên cứu kỹ thuật khai phá dữ liệu và ứng dụng trong hệ thống bán sách
trực tuyến
Tạ Thanh Hùng, Đinh Tiến Đức, Nguyễn Văn Công ………………………

Phát hiện, phân loại và theo dõi đối tượng chuyển động trong hệ thống giám
sát thông minh
Trần Nguyên Khải, La Tuấn Dũng, Nguyễn Thị Lan Hương ……………..

Nghiên cứu và ứng dụng học thích nghi trong đào tạo điện tử
Kiều Thị Kim Oanh …………………………………………………………..


Hệ thống quản lý tổ chức thi và cập nhật điểm tự động
Đoàn Lan Anh, Bùi Thị Nhíp ………………………………………………..

4
5
6
8
10
12
14
16
18
20
22
24
26
28

- 2 -
13.



14.



15.



16.


17.


18.


19.



20.



21.


22.


23.


24.




25.


26.

Nghiên cứu công nghệ thẻ không tiếp xúc (RFID) và xây dựng ứng dụng thử
nghiệm
Hà Huy Luân …………………………………………………………………

Phân tích môđun quản lý kho trong hệ thống thông tin quản lý hoạch định
nguôn lực doanh nghiệp (ERP)
Trương Hồng Nam …………………………………………………………...

Nghiên cứu về hệ hỗ trợ thiết kế phần mềm sử d
ụng CBR
Nguyễn Thị Nga ………………………………………………………………

Nghiên cứu về quản trị nội dung của hệ thống e-learning
Trần Thị Nghĩa, Bùi Thị Thơm ……………………………………………..

Một số vấn đề phát triển phần mềm hướng mô hình
Đào Bảo Ngọc, Đào Thanh Tuấn, Trịnh Xuân Sơn ………………………..

Tìm hiêu chuỗi thời gian và ứng dụng trong bài toán quản lý
Nguyễn Xuân Núi …………………………………………………………….

Nghiên cứu và xây dựng hệ thống nhập tài liệu tự động b
ằng nhận dạng
quang học

Nguyễn Thanh Phúc ………………………………………………………….

Nghiên cứu và xây dựng hệ thống nhập tài liệu tự động bằng nhận dạng
quang học
Đinh Văn Phương …………………………………………………………….

Nhận dạng phiếu đăng ký thi
Trần Minh Quân ……………………………………………………………..

Mô hình dự đoán rủi ro và quản lý rủi ro của dự án phần mềm
Nguyễn Thị Minh Tâm ………………………………………………………

Một số khía cạnh của cơ sở âm thanh và ứng dụng
Hồ Tất Thành ………………………………………………………………...

Hệ thống tư vấn môn học dựa trên công nghệ Framework có sử dụng mã
nguồn mở
Phạm Văn Thành, Hoàng Việt Quang ……………………………………...

Ứng dụng Framework và lập trình ràng buộc cho bài toán lập thời khoá biểu
Đỗ Huy Thịnh ………………………………………………………………...

Xây dựng hệ thống quản trị dự án phần mềm
Nguyễn Cảnh Toàn, Trần Thị Cẩm Anh …………………………………...
30
32
34
36
38
40

42
44
46
48
50
52
54
56

- 3 -

27.



28.


29.



30.




Phương pháp bảo trì ca lập luận trong CBR và ứng dụng trong hệ thống dự
đoán nồng độ cồn trong hơi thở
Vũ Thanh Toàn ……………………………………………………………….


Phát triển hệ thống e-learning trên nền tảng công nghệ Portal
Lưu Hồng Vân ………………………………………………………………..

Phân tích, thiết kế hệ thống quản trị quan hệ khách hàng cho công ty cổ phần
phần mềm FPT
Phạm Thanh Xuân …………………………………………………………...

Lựu chọn và trích rút ảnh để giảm dung lượng video phục vụ truyền trên
mạng không dây
Hoàng Thị Thuỳ Dương ……………………………………………………...
58
60
62
64

- 4 -
Danh sách cán bộ Bộ môn Công nghệ phần mềm

Danh sách cán bộ giảng dạy
1. PGS. TS. Nguyễn Ngọc Bình Hiệu phó trường ĐHCN Email:
2. ThS. Trần Thị Minh Châu Email:
3. ThS. Vũ Quang Dũng Email:
4. TS. Nguyễn Việt Hà Phó chủ nhiệm Khoa CNTT Email:
Chủ nhiệm Bộ môn CNPM
5. ThS. Đặng Đức Hạnh Email:
6. ThS. Vũ Diệu Hương Email:

7. ThS. Đào Kiến Quốc Giám đốc Trung tâm Email:


NC & PT CNPM
8. CN. Nguyễn Việt Tân Email:
9. ThS. Nguyễn Thị Nhật Thanh Email:
10. PGS. Nguyễn Quốc Toản Email:
11. PGS. TS. Nguyễn Văn Vỵ Email:
Danh sách nghiên cứu sinh
1. CN. Nguyễn Ngọc Bảo Email:
2. ThS. Lê Việt Hà Email:

Danh sách thực tập sinh
1. Bùi Đức Giang Email:
2. Tô Văn Khánh Email:
3. Nguyễn Thị Diệu Linh Email:

4. Phan Hồ Việt Phương Email:
5. Trần Thị Mai Thương Email:

- 5 -
Danh sách cán bộ tham gia hướng dẫn

1. ThS. Nguyễn Việt Anh Trung tâm máy tính-ĐHCN Email:

2. ThS. Trần Vũ Việt Anh Công ty Viet Software Email:

3. TS. Lê Trọng Bài Công ty Cổ phần Sinh viên Phone: 04.7163827
4. KS. Đặng Việt Dũng Trung tâm NC & PT CNPM Email:
5. TS. Nguyễn Trọng Dũng Viện CNTT Email:
6. PGS. TS. Hồ Sĩ Đàm Bộ môn Mạng & TTMT Email:

7. TS. Vũ Ba Đình Trung tâm KHKT và CNQS Email:


8. PGS. TS. Đặng Văn Đức Viện CNTT Email:
9. ThS. Từ Trung Hiếu Trường ĐH Thuỷ Lợi Email:
10. TS. Lê Văn Phùng Viện CNTT Email:
11. PGS. TS. Vũ Đức Thi Viện CNTT Email:
12. PGS. TS. Ngô Quốc Tạo Viện CNTT Email:
13. TS. Đỗ Năng Toàn Viện CNTT Email:
14. PGS. TS. Đỗ Trung Tuấn Trường ĐHKHTN Email:

- 6 -
PHÂN TÍCH VÀ THIẾT KẾ CƠ SỞ DỮ LIỆU CHO
DOANH NGHIỆP VỪA VÀ NHỎ

Sinh viên : Nguyễn Việt Cường Giáo viên hướng dẫn : TS.Lê Văn Phùng
Lớp:K47CC Viện CNTT


1)Giới thiệu:

Nước ta đang trong thời kì đổi mới, phát triển nền
kinh tế nhiều thành phần. Số lượng các Doanh
nghiệp trong nước phát triển một cách mạnh mẽ.
Tuy nhiên hầu hết các doanh nghiệp ở nước ta là
doanh nghiệp vừa và nhỏ. Thực tế cho thấy, việc
áp dụng CNTT trong các doanh nghiệp ở nước ta
là chưa phổ biến. Bài toán phân tích thiết kế cơ sở
dữ liệu cho doanh nghiệp vừa và nhỏ là một bài
toán rộng, trong khuôn khổ của của luận này chỉ
tập trung vào giải quyết các vấn đề sau:


- Quản lý các đặc trưng chung của doanh nghiệp

- Quản lý khó khăn khi mới thành lập doanh
nghiệp

-Quản lý đặc điểm sản xuất và công nghệ

-Quản lý cơ cấu bán hàng

-Quản lý nguyên vật liệu

-Quản lý việc làm

-Các cơ quan thuế

-Quản lý nguồn vốn ban đầu

-Quản lý mạng lưới doanh nghiệp

-Ảnh hưởng của môi trường kinh tế

Sau bước phân tích và thiết kế ra cơ sở dữ liệu là
lập trình thử nghiệm minh hoạ cho các chức năng
cần quản lý.

2) Hướng giải quyết bài toán:

-Thiết kế phiếu điều tra: Nhằm phân tích thông
tin trong các doanh nghiệp và số liệu đầu vào
- Phân tích chức năng, xác định mô hình khái

niệm dữ liệu.

- Thiết kế Cơ sở dữ liệu và bảng ra.

- Thiết kế tìm kiếm

- Thiết kế các báo cáo.

Yêu cầu:

- Về cấu trúc dữ liệu:
Các tệp trong mô hình mối quan hệ thực thể đạt
chuẩn 3 (3NF).
Dữ liệu đảm bảo tính toàn vẹn.

- Về chương trình:
Thực hiện đầy đủ các yêu cầu nghiệp vụ, dễ thao
tác,dễ nhận biết và đánh giá kết quả

3) Cấu trúc của khoá luận (Các mục nội dung)

Khoá luận gồm 4 chương:

- Chương 1: Giới thiệu doanh nghiệp vừa và
nhỏ(DNV&N) ở Việt Nam bao gồm :

1.1.Thông tin về doanh nghiệp vừa và nhỏ
1.2. Ứng dụng của CNTT vào DNV&N

- Chương 2: Cơ sở lý luận đây là cơ sở lý thuyết

để giải quyết bài toán.Chương này liệt kê tóm tắt
một số khái niệm về phân tích và thiết kế hệ
thống thông tin bao gồm

2.1.Khái niệm hệ thống thông tin(HTTT)
2.2.Một số cách tiếp cận HTTT
2.3.Phương pháp phân tích và thiết kế có cấu trúc
2.4. Mô hình thực thể quan hệ E-R

- 7 -

-Chương 3: Đi vào nội dung chính của việc phân
tích và thiết kế CSDL cho DNN&V. Bao gồm :
- Sơ đồ chức năng nghiệp vụ
- Danh sách các thuộc tính cần quản lý
- Xác định các thực thể và mối quan hệ
- Sơ đồ E-R

Cấu trúc:
3.1. Đặt vấn đề
3.2. Thiết kế phiếu điều tra
3.3. Xây dựng Cơ sở dữ liệu

Chương 4: Lập trình thử nghiệm.
Chươ
ng này đưa ra lý do chọn CSDL và ngôn
ngữ lập trình. Sơ đồ cấu trúc của chương trình.
Thiếtkế các giao diện. Đưa ra các bảng kết quả
thử nghiệm


4.1. Lựa chọn ngôn ngữ và hệ quản trị cơ sở dữ
liệu
4.2.Sơ đồ phân rã chức năng hệ thống
4.3.Thiết kế các Form

Sau một thời gian chạy thử chương trình đã đạt
được các yêu cầu chức n
ăng cần quản lý.Tuy
nhiên vẫn có nhiều hạn chế.


TÀI LIỆU THAM KHẢO
[1] Đinh Xuân Lâm. Những bài thực hành cơ sở
dữ liệu Visual Basic.Nhà xuất bản thống
kế,2002
[2] Nguyễn Thị Ngọc Mai . Microsoft Visual
Basic và lập trình cơ sở dữ liệu. Nhà xuất bản
Lao động- Xã hội,2002
[3] Nguyễn Tuệ. Giáo trình cơ sở dữ liệu. Khoa
Công Nghệ, ĐHQGHN, 2004
[4] TS.Lê Văn Phùng. Phân tích và thiết kế hệ
thống thông tin.Nhà xuất bản Lao động-xã
hội,2004
[5] Nguyễn Văn Vỵ. Giáo trình phân tích thiết
k
ế hệ thống thông tin. Nhà xuất bản Nông
nghiệp,2004







- 8 -
TÌM HIỂU MỘT SỐ PHƯƠNG PHÁP PHÂN TÍCH
TRANG TÀI LIỆU
Sinh viên: Nguyễn văn Dũng Cán bộ hướng dẫn:
Mã SV: 0220056 PGS.TS: Ngô Quốc Tạo
Email:
1. Tổng quan
Hầu hết tất cả tài liệu hiện nay của
con người đều đã được số hóa và được lưu
trữ trong máy tính. Nhưng tài liệu giấy thì
vẫn và sẽ còn tồn tại vì nó vẫn không thể
thiếu được trong cuộc sống hằng ngày. Việc
chuyển đổi từ tài liệu điện tử sang tài liệu
giấy có thể đựợc thực hiện dễ dàng bằng máy
in, máy fax. Nhưng làm thế nào để chuyển từ
tài liệu giấy sang tài liệu điện tử để máy tính
có thể hiểu được? Câu hỏi đó đã khiến các
chuyên gia trong lĩnh vực công nghệ thông
tin phải đầu tư, nghiên cứu trong nhiều thập
kỷ qua, và rồi hệ thống nhận dạng quang học
(OCR - Optical Character Recognize system)
đã ra đời và đáp ứng được phần nào nhu cầu
của cuộc sống. Bên cạnh đó vẫn còn bao
thách thức lớn lao cho nghành xử lý ảnh, vì
xử lý ảnh chính là giai đoạn mấu chốt trong
hệ thống nhận dạng quang học (OCR).
Phân tích trang tài liệu (Document layout

analysis) là một ứng dụng của xử lý ảnh, nó
sẽ giải quyết bài toán của ta ở trên, tức là làm
thế nào để có thể chuyển đổi từ tài liệu giấy
thành tài liệ
u điện tử. Tài liệu giấy sau khi
được scan bằng máy scaner thành một file
ảnh, công việc của phân tích trang tài liệu sẽ
phân tích file ảnh đó để nhận biết nội dung
của tài liệu đó là gì. Tức là sau khi phân tích
thì chúng ta thực sự có được một tài liệu điện
tử mà cả con người và máy tính đều có thể
hiểu được.
2. Cấu trúc của trang tài liệu
Cấu trúc của một trang tài liệu bao gồm hai
phần:
+ Cấu trúc vật lý (hay cấu trúc hình học).
+ Cấu trúc logic.
2.1 Cấu trúc vật lý
Một trang tài liệu được hợp thành từ
nhiều khối, nhiều đoạn. Mỗi khối này là tập
hợp của các thành phần có các thuộc tính
giống nhau như: font chữ, kích thuớc,
màu,.v..v. Và mỗi khối đều mang một ý
nghĩa riêng. Cấu trúc vật lý là thể hiện được
thông tin của các khối và mối quan hệ giữa
chúng trong trang tài liệu. Hình dướ
i đây sẽ
minh họa cấu trúc vật lý của một trang tài
liệu:










(Hình 1:Hình minh họa cấu trúc vật lý của
trang tài liệu)
2.2 Cấu trúc logic
Cấu trúc logic nói lên ý nghĩa của các thành
phần đó trong trang tài liệu ấy, tức là mỗi
khối, mỗi thành phần trong trang tài liệu sẽ
nói lên điều gì. Một trang tài liệu có thể được
tạo bởi rất nhiều đoạn, nhiều thành phần khác
nhau, mỗi thành phần đó đều nói lên một ý
nghĩa nào đó cho người đọc. Thông thường
một trang tài liệu có thể có các phần sau:
phần đầu (header), phần cuối (footer), phần
tiêu đề trang (title), phần tóm tắt trang
(abstract), các đoạn trong thân trang
(paragraph), .v..v.
3. Các phương pháp phân tích
1H
2B

10H
11B
3B 4H

18H
5H
1
2
B
14B
1
6
B
15
6B
8B
7B
9B
1
3
B
17B

- 9 -
Dựa vào mô hình phân tích, người ta
chia các phương pháp phân tích trang tài liệu
thành ba loại:
+ Mô hình phân tích từ trên xuống (Top-
down).
Mô hình phân tích từ trên xuống (top-down)
là mô hình được tiến hành phân tích bắt đầu
từ toàn bộ trang tài liệu, sau đó sẽ phân tích
trang tài liệu đó thành các vùng nhỏ hơn, các
vùng nhỏ hơn này lại được phân tích thành

các vùng nhỏ hơn nữa, thủ tục tách cứ được
lặp đi, lặp lại nhiều lần cho đến khi thỏa mãn
các tiêu chuẩn đề ra của bài toán.
+ Mô hình phân tích từ dưới lên (Bottom-up).
Mô hình phân tích từ dưới lên là mô hình
được tiến hành phân tích từ một hay một
nhóm các pixel liền nhau, sau đó lại nhóm
các pixel nhỏ liền nhau đó thành một khối lớn
hơn (có thể là ký tự), rồi lại nhóm các khối
pixel này lại thành một khối lớn hơn nữa, và
cứ tiếp tục như vậy cho đến khi phân tích
được toàn bộ trang tài liệu.
+ Mô hình phân tích lai (Kết hợp hai phương
pháp Top-down và Bottom-up).
Mô hình phân tích lai (hybrid) là mô hình kết
hợp cả hai mô hình top-down và bottom-up,
nó tận dụng các ưu điểm và khắc phục các
khuyết điểm của cả hai mô hình trên. Nổi bật
là hai ưu điểm: không yêu cầu thông tin về
ảnh, và giảm được thời gian tính toán.
4. Các phương pháp và kỹ thuật tiền xử lý
Mục đích của việc tiền xử lý này là làm sạch
tài liệu, để việc phân tích được chính xác và
hiệu quả hơn. Có thể kể đến một số vi
ệc như:
lọc nhiễu (Noise Cleaning), dò và xử lý độ
nghiêng của trang tài liệu (Skew Detecting
and Processing).
4.1. Lọc nhiễu.
Nhiễu ảnh thường xuất hiện khi scan ảnh,

photo ảnh hay do ảnh lâu ngày bị nhạt đi.
Nhiễu thường gặp trong các ảnh nhị phân,
chúng có thể là các đốm đen, nhỏ, phân bố
ngẫu nhiên trên nền trắng hoặc những đốm
trắng phân bố ngẫu nhiên trên nền đen. Trước
khi tiến hành phân tích trang tài liệu thì ph
ải
tiến hành công việc loại bỏ nhiễu, đây là
bước hết sức quan trọng.
Có thể loại bỏ nhiễu bằng cách xử lý sau khi
ảnh đã được nhị phân hóa hoặc sử dụng một
số kỹ thuật như: kỹ thuật hình thái
(morphological methods)….
4.2 Xử lý độ nghiêng của trang tài liệu.
Một trang tài liệu chuẩn là trang tài liệu có
góc nghiêng bằng không, tức là các dòng văn
bản theo hướng ngang hay hướng dọc đều
song song với các cạnh của trang tài liệu, tuy
nhiên, trong quá trình scan hoặc copy mà độ
nghiêng của trang tài liệu khác không và dẫn
tới hiện tượng văn bản trong trang tài liệu bị
nghiêng so với lề của trang.
Dò và xử lý độ nghiêng của tài liệu là
tìm các dòng bị nghiêng và xử lý chúng sao
cho thẳng hàng. Có một số phương pháp dò
và xử lý độ nghiêng của văn bản,
+ Phương pháp dựa trên phép chiếu nghiêng
(Projection Profiles).
+ Phương pháp dựa vào phép biến đổi
Hough (Hough Transform).

+ Phương pháp láng giềng gần nhất (Nearest
-Neighbor Methods).
+ Phương pháp dựa vào sự tương quan chéo
(Cross Correlation).
+ Một số phương pháp khác thì dựa vào sự
phân tích gradient (Gradient Analysis), dựa
vào phân bố Fourier, .v..v.
5. Tài liệu tham khảo
[1]. R. Cattoni, T. Coianiz, S. Messelodi, C. M.
Modena. Geometric Layout Analysis Techniques for
Document Image Understanding. January 1998, tr.1-
68.
[2]. Roberto Bedola, Davide Bordo, Franc Vojtech.
Report of Document Analysis Group. 2001, tr 1-13.
[3]. Boulos Waked. Page Segmentation and
Identification for Document Image Analysis.
September 2001, tr. 28-37.
[4]. Zhixin Shi and Venu Govindaraju. Multi-scale
Techniques for Document Page Segmentation. Tr.1-5.
[5]. Miroslav Halas. Document classification. Tr.1-8.
…..

- 10 -
XÂY DỰNG HỆ CHUYÊN GIA HỖ TRỢ CHO ĐÀO TẠO
QUẢN LÝ DỰ ÁN


Vũ Thị Hà Minh
Cao Thị Nhâm
Nghiêm Văn Triệu


Người hướng dẫn: ThS.Đào Kiến Quốc

1. Giới thiệu
Vai trò của quản trị dự án trong công
nghệ phần mềm ngày càng trở nên
đặc biệt quan trọng. Nó không những
ảnh hưởng tới chất lượng phần mềm
mà còn là nhân tố quyết định sự
thắng lợi của dự án phần mềm, là
chìa khóa mang lại thành công cho
mọi dự án.
Nhiều trường đại học, cao đẳng đào
tạo về ngành công nghệ thông tin đã
đư
a môn quản trị dự án vào chương
trình đào tạo. Những người ta đều
biết rằng các kiến thức đó đều không
đủ để hình thành nên tố chất của một
người quản trị dự án vì các tình
huống thực luôn luôn phá vỡ mọi kế
hoạch. Bản lĩnh của một người quản
trị dự án không chỉ kiến thức về
phương pháp quản trị dự
án được
học trong nhà trường mà còn là các
biện pháp ứng phó động theo hoàn
cảnh. Điều này có thể học được qua
các phần mềm mô phỏng dự án.
Khoá luận “Xây dựng hệ chuyên gia

hỗ trợ cho đào tạo quản lý dự án”
nhằm xây dựng một “simulation
game”, giúp người học trở thành
“quản trị gia” thông qua chính những
rủi ro, thất bại trong quản trị dự án
của họ.

2. Tổ
ng quan quản trị dự án
Quản trị dự án là việc áp dụng tri
thức, kĩ năng, công cụ và kĩ thuật
vào dự án cụ thể sao cho những hoạt
động trong dự án phải phù hợp với
yêu cầu đưa ra. Mỗi dự án là sự nỗ
lực, cố gắng để đạt được mục tiêu cụ
thể. Tri thức và hoạt động trong quản
trị dự án được thể
hiện tốt nhất thông
qua các quy trình của nó.
Chương này sẽ trình bày những khái
niệm cơ bản trong quản trị dự án.
3. Hệ chuyên gia
Hệ chuyên gia là một chương trình
bắt nguồn từ một nhánh của khoa
học máy tính, đó là trí tuệ nhân tạo.
Mục đích của trí tuệ nhân tạo là có
thể xây dựng những chương trình
ứng xử thông minh. Trí tuệ nhân tạo
đề cập đến các khái niệm và phương
pháp suy di

ễn (lập luận), cách suy
diễn (lập luận) này được thể hiện
bằng chương trình máy tính và theo
cách tri thức biểu diễn bên trong máy
tính.
Thành phần chính của hệ chuyên gia:












Cơ sở tri thức: là nền tảng cơ bản
cho chế độ hoạt động thông minh
của hệ chuyên gia.
Giao diên
n
gười dùng
Mô tơ
suy diễn
Cơ sở
tri thức

- 11 -

Mô tơ suy luận: với chức năng chính
là suy luận, lập luận để tìm lời giải.
Giao diện người dùng: là phần giao
tiếp giữa người và hệ thống máy tính

4. Xây dựng hệ chuyên gia hỗ trợ
cho đào tạo quản lý dự án
Khóa luận này đề xuất phương
hướng giải quyết bài toán xây dựng
game mô phỏng quản trị dự án bằng
cách xây dựng hệ
chuyên gia dựa
trên cơ sở tri thức.
Mô hình hệ chuyên gia cho game mô
phỏng quản trị dự án gồm thành
phần:
(1) Cơ sở dữ liệu: lưu trữ toàn bộ nội
dung những thông báo, báo cáo.
(2) Quản lý cơ sở tri thức: Cơ sở tri
thức của hệ thống được lưu trữ
bằng các luật nếu – thì.
(3) Thành phần xử lý cơ sơ tri thứ
c:
Có nhiệm vụ tạo ra những đối
tượng tham gia vào dự án và mối
quan hệ giữa chúng.
(4) Thành phần tạo kịch bản: là bộ
phận nằm ở mức cao nhất của
game mô phỏng. Bộ phận này có
nhiệm vụ kết hợp hành động của

những đối tượng trong bộ phận
xử lý tri thức và dàn dựng thành
một chuỗi sự kiện như trong thể
giới thực.
(5) Giao diện: là cầu nối giữa hệ
thống và người dùng. Thông qua
giao diện, người dùng xác lập các
thông số cho dự án.

5. Thực nghiệm
Chúng tôi đã xây dựng hệ thống dựa
trên:
- Môi trường: Visual Studio.NET
2003
- Ngôn ngữlập trình: C#
- Tool hỗ trợ: C1StudioDotNET
Và bước đầu cho thấy hệ thống
Game mô phỏng đạt kết quả tốt.

6. Kết luận

Kết quả đạt được:
- Áp dụng tốt lý thuyết vào giải
quyết bài toán cụ thể.
- Xây dựng được chương trình tuy
còn đơn giản nhưng đã hướng đạt
được mục đích chính của đề tài.
• Hướng phát triển:
- Tạo giao diện thân thiện hơn.
- Xây dựng một chương trình hoàn

hảo hơn, xử lý thông minh, nhanh
nhạy hơn nhằm để có thể đưa hệ
thống vào chương trình giảng dạy.

7. Tài liệu tham khảo
• Tài liệu tham khảo tiếng Việt:
[1]Đinh Mạnh Tường, “Trí tuệ nhân
tạo”, Nhà xuất bản khoa học kĩ thuật
2002.
• Tài liệu tiếng Anh
[2] Roger S, Pressman, “Software
Engineering”.
[3] Fujitsu, ”Project Management
Game”.
[4] C.S. Krishnamoorthy; S. Rajeev,
“Artificial Intelligence and Expert
Systems for Engineers”, CRC
Press, CRC Press LLC
[5] Amit Konar, “Artificial
Intelligence and Soft Computing”,
Department of Electronics and Tele-
communication Engineering Jadavpur
University, Calcutta, India.
[6] Sourabh Dash, Mano Ram
Maurya, Priyan Patkar and Chunhua
Zhao, “Expert systems- principles
and applications” , Laboratory for
Intelligent Process Systems , School
of Chemical Engineering, Purdue
University, W. Lafayette, IN 47907

[7] Jay Liebowitz,” The Handbook
of Applied Expert Systems ”, CRC
Press LLC



- 12 -
ỨNG DỤNG FRAMEWORK JHOTDRAW PHÁT TRIỂN
HỆ THỐNG TÍNH TOÁN ROI
Nguyễn Thanh Hà Người hướng dẫn: GS.TS. Nguyễn V ăn Vỵ
MSV: 0220087
Email:


1. Giới thiệu
Tỷ suất hoàn vốn đầu tư ROI (Return On
Investment) có ý nghĩa rất quan trọng
trong nền kinh tế đầu tư. Nó cho các chủ
đầu tư biết tỷ suất lợi nhuận họ thu được
so với khoản chi phí bỏ ra cho một dự án
đầu tư, từ đó có thể xác định hướng đầu tư
đúng đắn.
Tuy nhiên bài toán tính toán ROI rất phức
tạp, chỉ cần sai s
ố nhỏ sẽ dẫn đến việc đầu
tư sai lầm, và có thể gây hậu quả nghiêm
trọng.
Vì vậy việc ứng dụng công nghệ thông tin
để tạo ra được công cụ tính toán ROI
chính xác, tin cậy là một bài toán cấp

thiết.
2. Cơ sở lý thuyết.
-Tỷ suất ROI dựa trên công thức:


ROI =



Từ công thức tính toán ROI ở trên, tôi
phân tích hai yếu tố Lợi nhuận và vốn đầu
tư và đưa ra biểu đồ cẩu trúc các nhân tố
tham gia tính ROI cơ bản. Các nhân tố này
được phân làm từng mức theo mô hình
hình cây.

3. Bài toán Ứng dụng Framework
Jhotdraw phát triển hệ thống tính toán
ROI.
-Khóa luận của tôi ứng dụng framework
JHotDraw mã nguồn mở để xây dựng
chương trình tính toán ROI bằng cách xây
dựng mô hình ROI trực quan từ hình vẽ
nhân tố đã có sẵn. Việc ứng dụng
framework JHotDraw không những tiết
kiệm tiền bạc, thời gian, công sức mà còn
tạo ra công cụ tính toán ROI nhanh chóng,

dễ dàng, chính xác và đặc biệt rất trực
quan.

-Muốn ứng dụng framework JHotDraw
vào bài toán của chúng ta, trước tiên
chúng ta phải hiểu rõ cẩu trúc cơ bản của
nó. Thiết kế JHotDraw gồm ba phần: phần
một là hệ lớp Figure - chức năng lưu trữ
các loại hình, phần thứ hai là các lớp
Drawing và DrawingView – dung để vẽ
hình và giao diện, và phần thứ ba là các
lớp DrawingEditor – có chức năng biên
tập và thực hiện.
Bài khóa luận của tôi đi vào trình bày cấu
trúc của từng phần.
-Các lớp Figure:
Figure là sự trừu tượng chính của khung
làm việc trình vẽ hình. Nó thể hiện một
hình đồ họa mà người sử dụng có thể
dung. Bài khóa luận trình bày các lớp
Figure, CompositeFigure,
DecoratorFigure, ConnectionFigure,
Handle và Drawing.
-Các lớp Drawing và DrawingView.
Phần này đi sâu tìm hiểu các lớp
DrawingChangeListener, DrawingView,
Painter, PointStrainer, DrawingEditor,
Tool.
-Các lớp DrawingEditor.
Phần thứ ba củ akhung làm việc JHotDraw
mô tả về DrawingEditor và các lớp liên
quan: CreationTool, HandleTracker,
SelectionTool, Handle, TrackHandle,

NullHandle, LocatorHandle, Locator.

Sau khi đã nắm được cấu trúc của
framework JHotDraw, bài khóa luận củ
a
tôi đi vào phân tích thiết kế cho bài toán
tính toán ROI dựa trên ứng dụng
JHotDraw.
Phần phân tích thiết kế đưa ra được mô
hình năm lớp để xây dựng cho chương
trình tính toán ROI.
Tổng lợi nhuận
Tổng vốn đầu tư

- 13 -
3. Kết luận.
Bài khóa luận đã giúp hiểu được cấu trúc
tổng quan một các đơn giản cấu trúc của
framework JHotDraw và tìm hiểu được
các nhân tố ảnh hưởng đến tỷ suất hoàn
vốn đầu tư ROI, đồng thời đưa ra được
hướng giải quyết bài tóan tính tỷ suất ROI
hiệu quả, chính xác.

4. Tài liệu tham khảo.

Tiếng Việt
[1] Nguyễn Văn Vỵ, Phân tích thiết kế hệ
thống thông tin hiện đại: Hướng cấu trúc
và hướng đối tượng , NXB Thống kê, Hà

Nội, 2002
Tiếng Anh
[2] Graig Larman , Applying UML and
Patterns, An Introduction to Object
Oriented Analysis and Design,1998
[3] Erich Gamma, Rechard Helm, Ralph
Jonhson, John Vlissides, Design
Patterns, Element of reusable object-
oriented software,1999
[4] Tham khảo một số nguồn trên Internet,
chủ yếu trong






- 14 -
QUẢN LÝ VẬT TƯ

Bùi Thị Thu Hằng
MSV: 00220105
Email:

Cán bộ hướng dẫn: ThS. Trần Vũ Việt Anh
Cán bộ đồng hướng dẫn: TS. Nguyễn Việt Hà

1. Mở đầu
Ứng dụng công nghệ thông tin vào thực hiện
tiến trong đời sống xã hội giảm thiểu được sức

lao động của con người, tăng hiệu quả kinh tế.
Quản lý vật tư cũng là lĩnh vực được quan tâm.
Nội dung của luận văn đi vào việc tìm hiểu
nghệp vụ của bài toán. Em đã phân tích thiết kế
cho bài toán quản lý vật tư đồng thời đưa ra cài
đặt cho hệ
thống quản lý vật tư.
2. Cơ sở bài toán
Trong quá trình tìm hiểu nghiệp vụ của bài
toán quản lý vật tư, em đã tìm hiểu tại đơn vị
kinh doanh máy tính trong Hà Nội. Qua việc
tìm hiểu, em nắm bắt được nghiệp vụ của bài
toán, thu thập được hồ sơ dữ liệu sử dụng
(Phiếu nhập, phiếu xuất, phiếu thu, phiếu chi,
bảng báo giá vật tư) .
Từ đó đưa ra mô tả của bài toán , những
chức năng c
ủa hệ thống, từ điển dữ liệu và mô
hình lĩnh vực nghiệp vụ.
3. Phân tích thiết kế bài toán

Trên cơ sở tìm hiểu bài toán quản lý kho ở
chương trước, em đã tiến hành phân tích thiết
kê bài toán.
Giải pháp lựa chọn cho việc
phân tích thiết kế là phân tích thiết kế
hướng đối tượng theo tiến trình RUP.

Trong phân tích thiết kế, khoá luận trình
bày:

- Mô hình ca sử dụng: chỉ ra tác nhân,
các tiến trình nghiệp vụ. Mô hình ca
sử dụng tổng thể. Mô tả chi tiết mỗi
ca sử dụng.
- Phân tích từng ca sử dụng: phân tích
chi tiết từng ca sử dụng và các biểu
đồ liên quan.
- Thiết kế: trình bày các gói thiết kế.
Thành phần trong gói thiêt kế.
- Thiết kế cơ sở dữ liệu cho hệ thố
ng.

4. Công nghệ sử dụng
Có rất nhiều công nghệ có thể được sử
dụng để xây dựng hệ thống phần mềm. Trong
khoá luận này để cài đặt chương trình em đã sử
dụng công nghệ Java.
Java được nói đến rất nhiều trên sách báo,
trên Internet, trong khoá luận này em xin trình
bày những nét cơ bản về công nghệ Java là
những phần mà cài đặt hệ thống em đã sử dụng
bao gồm:
- Vài nét về Java: trình bày về lịch sử của
Java. Nh
ững đặc điểm, và những ưu nhược
điểm của nó.
- Phần cài đặt hệ thống sử dụng Swing, một
phần trong công nghệ Java. Swing hỗ trợ trong
việc lập trình giao diện.
- Trình bày mẫu thiêt kế MVC là mẫu thiết

kế nổi tiếng. Chỉ ra thiết kế của các thành phần
trong Swing.
Và hệ cơ sở dữ liệu SQLServer. Hệ cơ sở dữ
liệu thông dụ
ng ngày nay.
5. Kết quả
Dựa vào chức năng của bài toán mô tả được
ở trên, em đã tiến hành cài đặt hệ thống.
Trong khóa luận này, em đã cài đặt hệ thống
quản lý vật tư trên công cụ JBuiler X, sử dụng
công nghệ Java Swing đã chỉ ra ở trên, dùng hệ
cơ sở dữ liệu SQL Server để lưu trữ nội dung.
Hệ thống đã cài đặt được những chức năng
của đáp ứng nghi
ệp vụ của bài toán đã đặt ra.
6. Kết luận
Khoá luận đã chỉ ra được nghiệp vụ của bài
toán quản lý vật tư. Những phân tích thiết kế
của bài toán. Và cài đặt chương trình trên nền
tảng Java Swing.
Hướng phát triển của bài toán:
- Tiếp tục nghiên cứu sâu hơn về
nghiệp vụ quản lý vật tư.
- Hoàn thiện phân tích thiết kế.
- Cài đặt hệ thống hoàn chỉnh hơn, để
chương trình thực sự
hữu ích hơn,
đáp ứng những nghiệp vụ quản lý

- 15 -

phức tạp hơn, dữ liệu lớn, trong việc
quản lý vật tư.

Tài liệu tham khảo
[1] Core Java 2 Volumn I, Fundamental,
Seventh Edition, Chapter 7 Graphics
Programming, Chapter 8 Event Handling,
Chapter 9 User Interface.
[2] Core Java 2 Volumn II – Advanced
Features, Seventh @ Team Lib, Chapter 4
Database programming, Chapter 6 Advanced
Swing , Tables.
[3] Slides Bài giảng môn Ngôn ngữ mô hình
hoá UML – ThS. Đào Kiến Quốc- Giảng viên
trường Đại học Công Nghệ - Đại học Quốc Gia
Hà Nội.


- 16 -
PHÂN LOẠI VĂN BẢN TIẾNG VIỆT
Họ tên SV: Trần Mai Hạnh
MSSV: SV0220102
Email:

Giáo viên hướng dẫn:
T.S Nguyễn Việt Hà

Tóm tắt nội dung của khóa luận “Phân loại văn bản Tiếng Việt”.

1. Đặt vấn đề

Cùng với sự gia tăng về số lượng
văn bản, nhu cầu tìm kiếm văn bản cũng
tăng theo. Với số lượng văn bản đồ sộ thì
việc phân loại văn bản một cách tự động là
một nhu cầu bức thiết.
Việc phân loại văn bản sẽ giúp
chúng ta tìm kiếm thông tin dễ dàng và
nhanh chóng hơn rất nhiều so với việc phải
bới tung mọi thứ trong ổ đĩa lưu trữ để tìm
kiếm thông tin. Mặc khác, lượng thông tin
ngày một tăng lên đáng kể, việc phân loại
văn bản tự động sẽ giúp con người tiết kiệm
được nhiề
u thời gian và công sức.
2. Các phương pháp phân loại
văn bản Tiếng Anh
Trong những năm gần đây việc
phân loại văn bản là một lĩnh vực được chú
ý nhất. Để phân loại người ta sử dụng nhiều
cách tiếp cận khác nhau như dựa trên từ
khóa, dựa trên ngữ nghĩa các từ có số lần
xuất hiện cao, mô hình Maximum Entropy,
tập thô… Một số lượng lớn các văn bả
n đã
được áp dụng thành công trên ngôn ngữ này:
mô hình hồi quy, phân loại dựa trên láng
giềng gần nhất (k-nearest neighbours),
phương pháp dựa trên xác xuất Naïve Bayes,
cây quyết định, học luật quy nạp, mạng
nơron (neural network), học trực tuyến, và

máy vector hỗ trợ (SVM – support vector
machine). Khi áp dụng với Tiếng Anh chúng
cho những hiệu quả rất khác nhau. Việc
đánh giá gặp rất nhiều khó khăn do việc
thiếu các tập ngữ liệu huấn luyện chuẩn.
Ngay cả với tập dữ liệu được sử dụng rộng
rãi nhất, Rerter cũng có nhiều phiên bản
khác nhau. Hơn nữa, đã có rất nhiều độ đo
được sử dụng như recall, precision, accuracy
hoặc error, break-even point, F-
measure…Phần này giứoi thiệu các thuật
toán phân loại được sử dụng rộng rãi nhất
đồng thời so sánh giữa các phương pháp sử
dụng kết quả của.
Trong phần này em đưa ra chi tiết
của các phương pháp phân loại văn bản
Tiếng Anh bao gồm
So sánh văn bản theo phương pháp
TF/IDF

- 17 -
Máy hỗ trợ vector (Support vector
Machine – SVM)
K – Nearest Neighbor (kNN)
Naïve Bayes (NB)
Neural Network (Nnet)
Linear Least Square Fit (LLSF)
Centroid – based vector
3. Các phương pháp tách từ
Tiếng Việt hiện nay

Trong phần này em đưa ra chi tiết
cho các phương pháp tách từ Tiếng Việt
hiện nay.
- Phương pháp Maximum matching:
forwarrd/ backward.
- Phương pháp quy hoạch động (dynamic
programming).
- Phương pháp tách từ Tiếng Việt dựa trên
thống kê từ Internet và thuật toán di truyền.
- Mô hình tách từ bằng WFST và mạng
Neural
- Phương pháp giải thuật học cải tiến
(Transformation based Learning – TBL)
4. Bài toán phân loại văn bản
Tiếng Việt
Xét bài toán phân loại văn bản
Tiếng Việt, cho một văn bản bất kỹ hãy xác
định chủ đề của văn bản đó dựa trên một tập
gồm 200 văn bản.
5. Thực Nghiệm
Phần này thể hiện những kết quả
những đánh giá và so sánh của những cái đạt
được tỉ lệ phần trăm đúng.
6. Tổng Kết
Sau khi kết thúc khóa luận em đã
có những kiến thức về các vấn đề liên quan
đến phân loại văn bản như: các phương pháp
phân loại văn bản Tiếng Anh, các phương
pháp tách từ Tiếng Việt, và cách tiến hành đi
vào làm công cụ phân loại văn bản.

Trong luận văn có sử dụng một số
tài liệu quan trọng liên quan đến vấn đề
phân loại văn bản. Rút ra những kinh
nghiệm của bản thân

[1] Nguyễn Phương Thái, Kiểm lỗi Chính tả
Cảm Ngữ cảnh Tiếng Việt, Luận văn thạc sĩ,
Khoa Công nghệ, 2003.
[12] Le An Ha, 2003. A method for word
segmentation Vietnamese. Proceddings of
Corpus Linguistics 2003, Lancaster, UK.


- 18 -
XÂY DỰNG THÀNH PHẦN SINH ẢNH
CHỐNG ĐĂNG NHẬP TỰ ĐỘNG

Họ và tên: Phan Chí Hiếu
MSV: 0220116
Email:
Người hướng dẫn: Ths. Từ Trung Hiếu
1. Giới thiệu
Trong những năm gần đây, rất nhiều hệ
thống các trang web, hệ thống các máy chủ
phục vụ thư thường bị các chương trình
đăng nhập tự động tấn công. Tác hại của
đăng nhập tự động là chúng thường xuyên
dò mật khẩu tự động của người dùng dẫn
đến nhiều người dùng thực bị mất tài
khoản, chúng có thể đăng nhập vào hệ

thống và tạo nhiều tài khoản giả làm cho cơ
sở dữ liệu của hệ thống đầy lên nhanh
chóng, sau đó chúng có thể tự động gửi một
lượng lớn thư quảng cáo làm cho hòm thư
của người dùng luôn luôn bị đầy.
Giải pháp hiện nay các hệ thống lớn
như yahoo, hotmail, gmail thường dùng để
ngăn các chương trình đăng nhập tự động là
sử dụng ảnh xác nhận mỗi khi đăng ký hoặc
đăng nhập vào hệ thống. Việc xây dựng ảnh
xác nhận là một vấn đề còn mới và có tính
thực tiễn cao, hiện nay có rất nhiều hệ
thống khác muốn sử dụng thành phần này
để chống đăng nhập tự động. Vì vậy khoá
luận của chúng tôi thực hiện việc xây dựng
thành phần sinh ảnh tự động có khả năng
kết nối vào các hệ thố
ng để ngăn chặn đăng
nhập tự động
2. Cơ sơ lý thuyết
Quá trình xây dựng thành phần sinh ảnh
tự động là sự kết hợp của nhiều thuật toán.
Đó là quá trình sinh chuỗi ngẫu nhiên, biến
chuỗi ngẫu nhiên thành ảnh, sinh nền, ghép
chuỗi ảnh vào nền, thực hiện biến đổi chuỗi
ảnh theo các hình khác nhau, sử dụng các
kỹ thuật để gây nhiều bề mặt ảnh.
2.1. Thuật toán sinh chuỗi ngẫu nhiên
Mô tả thuật toán


Đầu vào: Rỗng
Đầu ra: Chuỗi gồm từ 6 đến 12 ký tự ngẫu
nhiên
Các bước thực hiện:
- Bước1: Khởi tạo một từ điển gồm các chữ
cái trong bảng mã alphabel và các chữ số từ
0 đến 9
- Bước 2: Xác định ngẫu nhiên số các ký
tự sẽ được sinh ra
- Bước 3: Để sinh từng ký tự, lấy ngẫu
nhiên môt ký tự trong từ điển.
- Bước 4: Lặp lại việc lấy ngẫu nhiên đó
đến khi nào sinh đủ số ký tự thì dừng lại
2.2. Thuật toán sinh nền
Với những ảnh đơn giản, chương trình
nhận dạng dễ dàng thực hiện việc tách
chuỗi ảnh ra khỏi nền để sau đó có thể thực
hiện việc dò chuỗi ảnh ngẫu nhiên được
sinh ra. Vì vậy để làm cho các thuật toán
tách cạnh, tìm biên không hiệu quả chúng
tôi sẽ cho sinh ra những nền có cấu trúc
phức tạp hơn.
+ Nền dạng thác nước
Để tạo ra thác nước cần duyệt theo chiều
ngang ảnh trước. Tại mỗi vị trí chiều ngang
ta sẽ xây dựng giọt nước từ trên đỉnh ảnh
xuống đáy ảnh. Thuậtb toán:
void waterfall(left, right, top, bottom) {
for(x=left; x<=right; x++) {
s = (rand()%256)<<10;

r = 256+rand()%128<<3;
for(y=top; y<=bottom; y++, r+=s);
SetPixel(x, y, RGB(r + y, r + y, r + y));
}
}



- 19 -
+ Nền dạng bàn cờ(Checkboard)
Để sinh ra bàn cờ caro chúng ta cần
duyệt tất cả các điểm x, y theo chiều ngang
và chiều dọc của ảnh sau đó xác định vị trí
của những ô mầu đỏ và đen để tô mầu
tương ứng. Công thức:
)()(y)f(x, kyfloorkxfloor ×+×=

(
11 ≤≤− k
)
2.3. Thuật toán biến đổi chuỗi ảnh
Biến đổi chuỗi ảnh cũng là một trong
những biện pháp ngăn các hệ nhận dạng
nhận được chuỗi ảnh. Có rất nhiều cách
biến đổi chuỗi ảnh như biến đổi theo hình
sin, hình bình hành hay hình thang…
+ Biến đổi hình sin:Tư tưởng của thuật toán
rất đơn giản, từ chuỗi ảnh ban đầu, copy
chuỗi ảnh đến vị trí đã được làm cong theo
dang hinh sin. Với các toạ độ

được xác
đinh: x


= x

y

= y + a*sin(x/b)
(x, y) là toạ độ ban đầu
(x


,y

) là toạ độ sau khi được biến đổi

2.4. Thuật toán gây nhiễu bề mặt
Gây nhiễu bề mặt tức là sinh ra các
đường thẳng, đường cong hay đường tròn
ngẫu nhiên lên trên ảnh xác nhận nhằm làm
tăng tính an toàn cho chuỗi ảnh. Để sinh
đường thẳng có thể sử dụng thuật toán
DDA hoặc công thức của Bresenham. Đối
với đường cong có thể sử dụng công thức
Bezier-Bernstain:
10 ≤≤ u

p(u) =


=
n
i 0
B
i, n
(u)p
i
Trong đó: B
i, n
(u) = C(n, i)*u
i*
(i-u)
n-i

C(n,i) =
)!(!
!
ini
n


3. Triển khai thành phần
Thành phần sinh ảnh xác nhận chúng
tôi xây dựng dựa trên cấu trúc của ảnh
bitmap và các thủ tục hỗ trợ để tạo ra thành
phần phục vụ
+ Cấu trúc ảnh bmp: struct image
{
long width; //Chiều rộng của ảnh
long height; //Chiều cao của ảnh

unsigned char **pix; //Dữ liệu ảnh
long pal[256]; //Bảng màu
}
+ Các thủ tục hỗ trợ
Thủ tục tạo ra thành phần phục vụ
Sử dụng thành phần phục v
ụ trong trang tin
3. Thực nghiệm
Chúng tôi đã xây dựng trang đăng nhập
đơn giản có sử dụng ảnh xác nhận
Mỗi lần đăng nhập, đều có một chuỗi
ảnh ngẫu nhiên xuất hiện. Nếu nhập đúng
tên mã xác nhận, hệ thống sẽ cho đăng
nhập. Nếu nhập sai, một chuỗi ảnh xác
nhận mới sẽ sinh ra và người dùng phải
nhập lại mã số xác nhận này.
4. Kết luận
Trong khoá luận này, chúng tôi đã xây
dựng thành công thành phần sinh ảnh
chống đăng nhập tự động và thành phần
này có khả năng gắn vào các hệ thống để hệ
thống ngăn chặn các chương trình đăng
nhập tự động

5. Tài liệu tham khảo
[1] Lương Mạnh Bá, “Nhập môn xử lý
ảnh số”, NXB khoa học và kỹ thuật
năm 2003
[2] Lê Tấn Hùng, Huỳnh Quyết Thắng,
“Kỹ thuật đồ hoạ”, NXB khoa học

và kỹ thuật
[3] Dwayne Phillips, Image Processing
in C
[4] Image Verification and
Identification Application
Programming Interface

[5] User Authentication With Image
Verification

- 20 -
CÁC VẤN ĐỀ VỀ PHI CHUẨN TRONG PHÂN TÍCH THIẾT KẾ HỆ THỐNG THÔNG
TIN QUẢN LÝ HOẠT ĐỘNG KINH DOANH
SV: Nguyễn Huy Hoàng
MSV: 0220126
Email :
.
Người hướng dẫn: TS. Lê Văn Phùng
Địa chỉ : Viện CNTT.
1. Giới thiệu.
Xây dựng các hệ thống hỗ trợ quản lý
hoạt động kinh doanh luôn luôn là cần thiết,
tin học hoá sẽ giúp cho việc kinh doanh buôn
bán trở nên hiệu quả hơn. Một hệ thống hiệu
quả là một hệ thống có khả năng đáp ứng
được mọi yêu cầu liên quan, từ những yêu
cầu nghiệp vụ
đến những yêu cầu phi chức
năng. Những yêu cầu phi chức năng là đòi hỏi
tối ưu hoá hệ thống có khi là tối ưu hoá về

không gian lưu trữ, cũng có khi là tối ưu hoá
về tốc độ thực hiện. Trong đó phần lớn là tập
trung vào nhu cầu thứ 2 đó là đòi hỏi về tốc
độ tính toán, trả lời nhanh các truy vấn. Để
đáp ứng được yêu cầu
đó buộc ta phải thiết kế,
tổ chức dữ liệu một cách hợp lý, tuân theo các
chuẩn đã đặt ra. Tuy nhiên việc thiết kế dữ
liệu đúng theo các chuẩn đôi khi lại không
giải quyết được yêu cầu đặt ra khi đó có một
giải pháp là thực hiện phi chuẩn hoá tổ chức
dữ liệu.Quá trình hạ thấp các chuẩn trong
thiết kế dữ liệu là nguyên nhân làm cho dữ
liệ
u bị thừa, khó quản lý dữ liệu dẫn đến
thông tin bị sai lệch. Nhưng bù lại nó có thể
đáp ứng được các yêu cầu đặt ra của hệ thống.
Câu hỏi là có những phương pháp phi
chuẩn csdl dữ liệu nào, cách thực hiện của
chúng ra sao thì trong nội dung của khoá luận
này sẽ trình bày cụ thể.
Nội dung của khoá luận gồm 2 phần:
Phần 1. Phần cơ sở lý thuyết.
- M
ột số vấn đề trong thiết kế csld
vật lý.
- Vấn đề phi chuẩn trong thiết kế
csdl vật lý.
Phần 2. Ứng dụng xây dựng hệ thống
quản lý kho hàng.

- Tìm hiểu yêu cầu nghiệp vụ.
- Hồ sơ phân tích thiết kế hệ thống.
2. Một số vấn đề trong thiết kế CSDL vật lý.
Sơ lược lại các khái niệm về chuẩn hoá
dữ liệu. Các chuẩn 1NF, 2NF, 3NF, BCNF.
Cách nhận dạng các chuẩn và phương pháp để
cho các quan hệ đạt được các chuẩn trên.
Trong bước thiết kế CSDL, chúng ta phải
xem xét, cân nhắc kỹ các vấn đề liên quan đến
khối lượng dữ liệu mà CSDL đang xây dựng
cần phải đáp ứng, ngoài ra, cũng trong bước
này có thể chúng ta phải tiến hành tinh chỉnh
thêm thiết kế các quan hệ để đảm bảo chắc
chắn rằ
ng nó đáp ứng được các mục tiêu về
hiệu năng truy suất.
Để đạt được hiệu năng truy suất cao thì
cần phải tìm hiểu kỹ hệ quản trị cơ sở dữ liệu
sẽ sử dụng là gì, phải có sự phân tích kích
thước và nhu cầu sử dụng dữ liệu một cách
chi tiết và thiết kế các trường (field) dữ liệu
một cách hiệu quả.
3. Vấ
n đề phi chuẩn trong thiết kế CSDL
vật lý.
Phi chuẩn là một kỹ thật chuyển đổi các
quan hệ đã được chuẩn hoá ở mức cao thành
những dạng chuẩn ở mức thấp hơn nhằm tăng
tốc độ truy nhập trong cơ sở dữ liệu. Tuy
nhiên chúng ta cũng cần phải lưu ý rằng, việc

thiết kế phi chuẩn sẽ làm gia tăng khả năng
x
ảy ra lỗi cũng như vấn đề không nhất quán
dữ liệu và khiến cho việc lập trình ứng dụng
phức tạp hơn.
a. Phi chuẩn theo phương pháp gộp mối
quan hệ.
Khi hai quan hệ được hình thành từ hai
kiểu thực thể tham gia vào liên kết một - một.
Nếu việc truy suất giữa hai quan hệ diễn ra
thường xuyên thì chúng ta nên kết hợp chúng
thành một quan hệ.
Trong trường hợp các quan hệ đượ
c hình
thành từ một liên kết nhiều - nhiều đối với các
thuộc tính trong liên kết không phải là khoá.
Thay vì phải hình thành 3 quan hệ chúng ta có
thể kết hợp thành 2 quan hệ chính. Chúng ta
gộp các thuộc tính trong một quan hệ vào
trong quan hệ được hình thành từ liên kết.
Nếu trường hợp các quan hệ được hình
thành từ liên kết 1-n và kiểu thực thể phía liên
kết đầu một không tham gia vào bất cứ một
liên kết nào khác. Khi đó chúng ta có thể cân
nhắc đế
n việc kết hợp hai quan hệ hình thành

- 21 -
từ hai kiểu thực thể này thành một quan hệ
phi chuẩn.

b. Phi chuẩn theo phương pháp phân
mảng :
Phân mảng theo chiều ngang là chia một
quan hệ thành nhiều vùng khác nhau có cùng
cấu trúc các trường.
Phân mảng theo chiều dọc là chia các cột
của một quan hệ thành những tệp khác nhau
và thuộc tính tham gia vào làm khoá chính sẽ
được lưu trữ ở tất cả các tệp được phân tách
ra đó.
c Phi chuẩn theo phương pháp gộp mối
quan hệ.
Kỹ
thuật thiết kế bảng trung gian cũng là
một dạng phi chuẩn. Nội dung của kỹ thuật
này là tính toấn sẵn một số thông tin để khi
cần có thể cung cấp tức thì. Việc xác định các
thông tin cần tính toán sẵn được thực hiện
trong giai đoạn thiết kế hệ thống và căn cứ
trên các yêu cầu mà người dùng áp đặt lên hệ
thống.
Các yêu cầu dẫn đến các bảng trung gian
thườ
ng là các yêu cầu về tốc độ xử lý các
công đoạn có tần suất sử dụng lớn Phần thiết
kế các dữ liệu trung gian là phần quan trọng,
đòi hỏi trình đọ chuyên nghiệp ở mức cao.
Người thiết kế đồng thời phải hiểu thấu đáo
các yêu cầu nghiệp vụ và lựa chọn giải pháp
thiết kế tối ưu để thoả mãn tốt nhấ

t các yêu
cầu nghiệp vụ.
4. Các yêu cầu nghiệp vụ.
a. Nhập kho.
Số liệu chứng từ nhập kho phải được lưu
trữ, cập nhật tự động và tức thì lên số tồn kho
cả về số lượng và giá trị của các mặt hàng
tương ứng.
Giá trị kho của một mặt hàng được tính
theo công thức : Giá trị kho = (Tổng số lựong
tồn kho) x Đơn giá. Sau mỗi l
ần nhập hàng.
Giá trị kho của từng mặt hàng thay đổi theo
công thức : Giá trị kho mới = Giá trị kho cũ +
Số lượng nhập x Đơn giá nhập.Lập và in được
phiếu nhâp kho.
a. Xuất kho.
Mỗi khi xuất kho có gợi ý được số lượng
hàng tồn và giá trị tồn mỗi của một mặt hàng
muốn xuất kho.
Đơn giá xuất được tính và gợi ý theo
phương thức bình quân gia quyền :Đơn giá
xuất = Giá trị
kho tồn/Số lượng tồn.
Số liệu chứng từ xuất kho phải được cập
nhật tự động và tức thì lên số tồn kho cả về số
lựong lẫn giá trị của mặt hàng tương ứng. Sau
mỗi lấn xuất kho. Giá trị kho (của mặt hàng)
thay dổi theo công thức.Giá trị kho mới = giá
trị kho cũ - Số lượng xuất x Đơn giá xuất.Lập

và in đượ
c phiếu xuất kho.
c. Yêu cầu khác..
Gợi ý được số hàng tồn và đơn giá tồn
mỗi khi có yêu cầu xuất trong vòng thời gian
< 40s.
Lập và in được thẻ kho theo từng mặt
hàng.
Lập được báo cáo kho hàng tháng cho
toàn bộ kho hàng.
4. Hồ sơ phân tích thiết kế.
Phân rã chức năng: 1.Nhập kho, 2. Xuất kho.
3.Thống kê báo cáo
5. Kết luận.
Sau khi phân tích thiết kế hệ thống, có sử
dụng kĩ thuật phi chuẩn. Hệ thống
được thử
nghiệm và có kết quả khả thi. Có khả năng
đáp ứng được các yêu cầu nêu trên.
Tài liệu tham khảo.
1] Phạm Hữu Khang. « Lập trình ứng dụng
chuyên nghiệp SQL Server 2000. Tập 1 »,
NXB Giáo Dục 2002.
[2]. Phạm Hữu Khang. « Kĩ thuật lập trình
ứng dụng công nghệ VisualBasic.Net ». NXB
Lao Động – Xã Hội.
[3]. TS.Lê Văn Phùng. « Phân tích và thiết kế
hệ thống thông tin Kiến thức và thực hành ».
NXB Lao Động – Xã Hội 2004.
[4] ThS. Đào Kiến Quốc. « Giáo trình phân

tích thiết kế Hệ thống thông tin - Tin học
hoá ».. Khoa Công Nghệ.
[5] TS. Nguyễn Tuệ. « Giáo trình nhập môn
hệ CSDL » Đại Học Công Nghệ.
[6] GS.TS Nguyễn Văn Vỵ. « Giáo trình Phân
tích thiết kế Hệ thống thông tin ». 2004.


- 22 -
NGHIÊN CỨU KỸ THUẬT KHAI PHÁ DỮ LIỆU
VÀ ỨNG DỤNG TRONG HỆ THỐNG
BÁN SÁCH TRỰC TUYẾN

1. Thông tin về sinh viên, người hướng dẫn
• Nhóm sinh viên thực hiện (K47CB):
¾ Tạ Thanh Hùng
¾ Đinh Tiến Đức
¾ Nguyễn Văn Công
• Giáo viên hướng dẫn: PGS.TS. Đỗ
Trung Tuấn (ĐH Khoa Học Tự
Nhiên - ĐHQGHN)
• Giáo viên đồng hướng dẫn: Ths.
Đào Kiến Quốc (ĐH Công Nghệ -
ĐHQGHN)
2. Giới thiệu
Trong gần hai thập kỷ qua, các hệ
thống cơ sở dữ liệu đã đem lại những lợi ích vô
cùng to lớn cho nhân loại. Cùng với sự phát
triển của công nghệ thông tin và ứng dụng của
nó trong đời sống - kinh tế - xã hội, lượng dữ

liệu thu thập được ngày càng nhiều theo thời
gian, làm xuất hiện ngày càng nhiều các hệ
thống cơ sở dữ liệu có kích thước lớn. Trong
tình hình hiện nay, khi thông tin đang trở thành
yếu tố quyết định trong kinh doanh thì vấn đề
tìm ra các thông tin hữu ích trong các cơ sở dữ
liệu khổng lồ ngày càng trở thành mục tiêu
quan trọng của các doanh nghiệp và khai phá
dữ liệu dần trở thành thành phần chính để thực
thi nhiệm vụ khai phá tri thức. Được đánh giá
sẽ tạo ra cuộc cách mạng trong thế kỷ 21, khai
phá dữ liệu sẽ ngày càng được ứng dụng phổ
biến trong các lĩnh vực kinh tế, xã hội: ngân
hàng, truyền thông, quảng cáo….
Trong quá trình nghiên cứu, học tập tại
trường, được sự chỉ bảo và hướng dẫn trực tiếp
của thầy Đỗ Trung Tuấn và thầy Đào Kiến
Quốc, cũng như sự giúp đỡ, động viên của các
thầy, cô giáo trong trường ĐH Công Nghệ -
ĐHQGHN, chúng tôi đã quyế
t định làm khóa
luận tốt nghiệp với đề tài “Nghiên cứu kỹ
thuật khai phá dữ liệu và ứng dụng trong hệ
thống bán sách trực tuyến”.
Khóa luận được chia thành 4 chương:
- Chương 1: Tổng quan về khai phá
dữ liệu.
- Chương 2: Một số thuật toán KPDL.
- Chương 3: Áp dụng một số kỹ thuật
KPDL vào hệ thống bán sách trực tuyến.

- Chương 4: K
ết luận.
3. Các mục nội dung
Trước tiên, khóa luận xin trình bày tổng
quan về khai phá dữ liệu, bao gồm sự cần thiết, khái
niệm và các bước xây dựng một hệ thống khai phá
dữ liệu, kiến trúc điển hình của một hệ thống khai
phá dữ liệu và vấn đề bán sách trực tuyến liên quan
đến khai phá dữ liệu. Tiếp theo, khóa luận giới thiệu
một vài thuật toán khai phá dữ liệu: thuật toán kinh
điển và thuật toán của Microsoft tích hợp trong công
cụ MSSQL Server 2005 nhằm mục tiêu giải quyết
ba nhóm bài toán của khai phá dữ liệu là bài toán
phân loại, bài toán phân tích luật kết hợp và bài toán
dự đoán. Khóa luận cũng xin trình bày việc xây
dựng một ứng dụng nhỏ – hệ thống bán sách trực
tuyến – để minh họa triển khai, áp dụng thử nghiệm
kỹ thuật khai phá dữ liệu vào bài toán trên. Cuối
cùng, qua bài toán, khóa luận cũng xin được giới
thiệu một số kỹ thuật, công nghệ liên quan đến vấn
đề xây dựng một ứng dụng có áp dụng khai phá dữ
liệu với 2 công cụ là ASP.NET 2.0 (VS.NET 2005)
và MSSQL Server 2005.
4. Kết luận
Qua thời gian thực hiện khoá luận này,
chúng tôi đã nghiên cứu một số kỹ thuật khai phá dữ
liệu theo hướng ứng dụng từ đó áp dụng vào triển
khai hệ thống bán sách trực tuyến
.
Mục tiêu

đặt ra ở đầu khoá luận đã đạt
được thành công tuy còn ở mức đơn giản:
- Nắm được các ý tưởng chủ đạo về khai
phá dữ liệu.
- Áp dụng kỹ thuật khai phá dữ liệu trong
các chức năng: phân loại khách hàng,
gợi ý sách mua kèm theo và lập các báo
cáo dự đoán.

- 23 -
- Áp dụng các công nghệ mới trong
việc cài đặt hệ thống, sử dụng
ASP.NET tích hợp trong VS.NET
2005 và hệ quản trị cơ sở dữ liệu
MSSQL Server 2005.
Để hệ thống có thể đưa hệ thống vào
vận hành thực sự trên thực tế cần có thêm thời
gian và công sức nghiên cứu kiểm thử, hoàn
thiện giải pháp và xây dựng phần mềm hoàn
chỉnh.
Hướng phát triển:
- Bổ sung và hoàn thiện các dịch vụ
để khai thác hệ thống.
- Cần kiểm định với lượng dữ liệu
chương trình lớn, thực tế và bổ
xung, nâng cao nghiệp vụ kinh
doanh để đạt được một hệ thống có
hiệu suất xử lý tốt cũng như độ
chính xác về các kết quả hệ thống
suy luận và dự đoán

Trong phạm vi của một khoá luận tốt
nghiệp, đề tài này không thể tránh khỏi những
thiếu sót. Chúng tôi mong nhận được những ý
kiến phê bình, đóng góp, sự chỉ bảo chân tình
của các thầy cô và các bạn để có thể tiếp tục
phát triển đề tài này trong thời gian tới.
Một lần nữa tôi xin chân thành cảm ơn
Công ty Công nghệ Tin học Tinh Vân đã tạo
điều kiện cho chúng tôi phát triển đề tài. Cảm
ơn các thầy cô giáo bộ môn Công Nghệ Phầ
n
Mềm và bộ môn Các Hệ Thống Thông Tin. Đặc
biệt là thầy Đỗ Trung Tuấn và thầy Đào Kiến
Quốc, hai thầy đã định hướng và trực tiếp giúp
đỡ tôi hoàn thành khoá luận này.
5. Tài liệu tham khảo

Tài liệu tiếng Việt:

[1] Đào Kiến Quốc, “Phân tích thiết kế hệ
thống thông tin tin học hóa”, NXB Đại Học
Quốc Gia Hà Nội, 1998.

[2] Trần Mạnh Tuấn, “Xác suất thống kê”
(Giáo trình).

[3] Đỗ Trung Tuấn, “Cơ sở dữ liệu, Giáo trình dùng
cho sinh viên, kỹ sư, cử nhân chuyên nghành công
nghệ thông tin”, NXB Giáo dục, 1997.


[4] Đỗ Trung Tuấn, Thầy Trần Thọ Châu , “Trí tuệ
nhân tạo“ (Bài giảng).

[5] Nguyễn Tuệ, “SQL cơ bản” (Giáo trình).

[6] Nguyễn Tuệ, “SQL nâng cao” (Giáo trình).

[7] Đinh M
ạnh Tường, “Nhập môn Trí tuệ nhân
tạo”, NXB Khoa học kỹ thuật, 2002 .

[8] Nguyễn Văn Vỵ, “Giáo trình phân tích thiết kế
hệ thống thông tin” , NXB Đại Học Quốc Gia TP.
Hồ Chí Minh, 2004.

[9] Nguyễn Văn Vỵ. “Phân tích và thiết kế hệ thống
thông tin quản lý”, NXB Thống kê, 2004.

Tài liệu tiếng Anh:

[1] Nguyễn Hùng Sơn, “Giáo trình Dataming”
(Slide).

[2] Wiley.IEEE.Press.DANIEL T. LAROSE Data
Mining Methods and Models Jan 2006.

[3] (By Laxxus) Data Mining Cookbook - Modeling
Data for Marketing, Risk, and Customer
Relationship Management (OCR) – 2001.


[4] Micheal J.A.Berry, Gordon S.Linoff.Data
mining technique, 2006.

[5] Ykie Go, Robert Grossman, High Performent
data mining Scaling Algorithms, Applications and
Systems, 2003.

[6] Hewett R., Leuchner J. Restructuring decision
tables for elucidation of knowledge. Data &
Knowledge Engineering 46(3), 2003.

×