Tải bản đầy đủ (.pdf) (18 trang)

KHOA CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG BỘ MÔN CÔNG NGHỆ PHẦN MỀM LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC K29 – TIN HỌC Năm học 2007- 2008

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (391.52 KB, 18 trang )

KHOA CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
BỘ MÔN CÔNG NGHỆ PHẦN MỀM
LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC K29 – TIN HỌC
Năm học 2007- 2008

Mã số đề tài
LVCNPM_2901
LVCNPM_2902
LVCNPM_2903
LVCNPM_2904
LVCNPM_2905
LVCNPM_2906
LVCNPM_2907
LVCNPM_2908
LVCNPM_2909
LVCNPM_2910
LVCNPM_2911
LVCNPM_2912
LVCNPM_2913
LVCNPM_2914
LVCNPM_2915
LVCNPM_2916

Tên đề tài
Xây dựng công cụ sinh ra các luật kết
hợp với các ràng buộc
Nâng cao hiệu quả của việc phân lớp
các độ đo lợi ích với boosting và
bagging
Nghiên cứu các phương pháp kiểm thử
phần mềm - Ứng dụng phần mềm


Bugzilla để kiểm thử
Xây dựng dịch vụ trao đổi tin nhắn tự
động
Đề nghị một giải thuật tìm cục bộ cho
vấn đề xếp thời khóa biểu
Phát triển một Search Engine Web trên
tiếng Việt
Xây dựng website cấp giấy chứng nhận
sinh viên
Hệ thống hỗ trợ bán hàng trên thiết bị
di động
Xây dựng hệ thống tự động thông báo
trạm dừng xe buýt trong thành phố Cần
Thơ
Hệ thống GIS trợ giúp cho người dùng
xe buýt trong phạm vi thành phố Cần
Thơ
Phát hiện sao chép tài liệu văn bản
(tiếng Việt) với phương pháp Ferret
Phát hiện sao chép tài liệu văn bản
(tiếng Pháp) với phương pháp Ferret
Phát hiện sao chép tài liệu văn bản
(tiếng Việt) với kỹ thuật LSI
Phát hiện sao chép tài liệu văn bản
(tiếng Pháp) với kỹ thuật LSI
Quản lí cơng tác tuyển sinh Đại học với
DB2
Quản lí thư viện Khoa CNTT-ĐHCT
với DB2


Cán bộ hướng dẫn
TS. Huỳnh Xuân Hiệp
TS. Trần Cao Đệ
KS. Nguyễn Thanh Bình
TS. Huỳnh Xuân Hiệp
TS. Phạm Thị Xuân Lộc
TS. Nguyễn Thị Minh Luân

Số SV
2
2

Ths. Nguyễn Công Danh

1

Ths. Nguyễn Công Danh

1

Ths. Nguyễn Công Danh

1

Ths. Phan Phương Lan

1

Ths. Nguyễn Văn Linh
KS. trần Minh Tân


1

KS. Lâm Hoài Bảo

1

TS. Trần Cao Đệ

2

TS. Trần Cao Đệ

1

TS. Trần Cao Đệ

1

TS. Trần Cao Đệ

1

TS. Trần Cao Đệ

1

TS. Trần Cao Đệ

1


TS. Trần Cao Đệ

1

TS. Trần Cao Đệ

1

1


LVCNPM_2901
1. Tên đề tài: XÂY DỰNG CÔNG CỤ SINH RA CÁC LUẬT KẾT HỢP VỚI CÁC RÀNG
BUỘC.
2. Loại đề tài: Khai phá dữ liệu, làm việc theo nhóm.
3. Giáo viên hướng dẫn: TS. Huỳnh Xuân Hiệp, TS. Trần Cao Đệ, KS. Nguyễn Thanh Bình.
4. Số lượng sinh viên tham gia: 2 sinh viên.
5. Yêu cầu của đề tài:
ƒ Tóm tắt bài tốn, khả năng ứng dụng.
Apriori là giải thuật thơng dụng trong chuyên ngành khai phá dữ liệu (data mining hay còn
được gọi là knowledge discovery from databases) [7][6][2] để tạo ra các luật kết hợp
(association rules) [1][3][4]. Việc tạo ra các luật được tiến hành thông qua hai giai đoạn:
xây dựng các tập ứng viên và sinh luật. Trong quá trình sinh luật thì một số ràng buộc [5] có
thể được định nghĩa theo một số tiêu chí để tập trung vào một số luật được quan tâm
[5][10]. Ngoài ra đề tài cũng tiến hành khảo sát phương pháp FP-tree [8] để sinh ra trực tiếp
các luật mà không cần xây dựng tập các ứng viên.
Mục tiêu của đề tài là nhằm xây dựng hai phân hệ sinh luật theo các hướng xây dựng các tập
ứng viên và không xây dựng các tập ứng viên. Sau đó sẽ tiến hành xây dựng một số ràng
buộc cài đặt trực tiếp vào quá trình sinh luật. Các phân hệ này sẽ được tích hợp vào cơng cụ

ARQAT [9].
ƒ Về lí thuyết cần nghiên cứu: Khai phá dữ liệu
ƒ Ngôn ngữ cài đặt: Java.
6. Tài liệu tham khảo:
[1] R. Agrawal, T. Imielinski and A. Swami. “Mining association rules between sets of
items in large databases”. Proceedings of 1993 ACM-SIGMOD International
Conference on Management of Data. 207-216, 1993.
[2] R. Agrawal, T. Imielinski and A. Swami. “Database Mining: A Performance
Perspective”. IEEE Transactions on Knowledge and Data Engineering 5(6). 914-925,
1993.
[3] R. Agrawal and R. Srikant. “Fast algorithms for mining association rules”. VLDB'94,
Proceedings of 20th International Conference on Very Large Data Bases. 487499.1994.
[4] R. Agrawal, H. Mannila, R. Srikant, H. Toivonen and A. I. Verkamo. “Fast discovery of
association rules”. Advances in Knowledge Discovery and Data Mining. 307-328, 1996.
[5] R. J. Jr. Bayardo and Rakesh Agrawal. “Mining the most interestingness rules”.
KDD'99, Proceedings of the 5th ACM SIGKDD International Confeference on
Knowledge Discovery and Data Mining. 145-154, 1999.
[6] U. M. Fayyad, G. Piatetsky-Shapiro and P. Smyth. “From data mining to knowledge
discovery”. Advances in Knowledge Discovery and Data Mining. 1-34, 1996.
[7] W. J. Frawley, G. Piatetsky-Shapiro and C. J. Matheus. “Knowledge discovery in
databases: an overview”. Knowledge Discovery in Databases. 1-27, 1991.
[8] J. Han, J. Pei, Y. Yin and R. Mao. “Mining frequent patterns without candidate
generation: a frequent-pattern tree approach”. Data Mining and Knowledge Discovery
(8). 53-87, 2004.
[9] H. X. Huynh, F. Guillet and H. Briand. “ARQAT: an exploratory analysis tool for
interestingness measures”. ASMDA'05, Proceedings of the 11th International
Symposium on Applied Stochastic Models and Data Analysis. 334-344, 2005.

2



[10] G. Piatetsky-Shapiro. “Discovery, analysis, and presentation of strong rules”.
Knowledge Discovery in Databases (In G. Piatesky-Shapiro and W. Frawley editors).
229-248, 1991.

3


LVCNPM_2902
1. Tên đề tài: NÂNG CAO HIỆU QUẢ CỦA VIỆC PHÂN LỚP CÁC ĐỘ ĐO LỢI ÍCH VỚI
BOOSTING VÀ BAGGING.
2. Loại đề tài: Khai phá dữ liệu, làm việc theo nhóm.
3. Giáo viên hướng dẫn: TS. Huỳnh Xuân Hiệp, TS. Phạm Thị Xuân Lộc, TS. Nguyễn Thị
Minh Luân.
4. Số lượng sinh viên tham gia: 2 sinh viên.
5. Yêu cầu của đề tài:
ƒ Tóm tắt bài tốn, khả năng ứng dụng.
Phân lớp (clustering) [8] các độ đo lợi ích (interestingness measures) [9][10] là một vấn đề
thu hút được sự quan tâm của nhiều nhà nghiên cứu trong lĩnh vực khai phá dữ liệu [4][3]
trong thời gian gần đây. Việc phân lớp được tiến hành thơng qua việc phân tích các tính chất
của các độ đo hoặc thông qua việc tiến hành tính tốn hệ số tương quan giữa các độ đo lợi
ích [10][9][7]. Kết quả của các nghiên cứu này phụ thuộc nhiều vào bản chất của dữ liệu và
độ đo lợi ích.
Boosting [5] và bagging [2] là hai trong số những tiếp cận gần đây cho phép nâng cao độ
chính xác của các giải thuật mang tính chất dự đốn. Vì thế, mục tiêu của đề tài xây dựng
hai phân hệ nhằm nâng cao tính chính xác của tiếp cận phân lớp các độ đo lợi ích bằng kỹ
thuật đồ thị, với các khảo sát trên các tập luật kết hợp [1] có kích thước lớn. Các phân hệ
này sẽ được tích hợp vào cơng cụ ARQAT [6].
ƒ Về lí thuyết cần nghiên cứu: Khai phá dữ liệu
ƒ Ngôn ngữ cài đặt: Java.

6. Tài liệu tham khảo:
[1] R. Agrawal, H. Mannila, R. Srikant, H. Toivonen and A. I. Verkamo. “Fast discovery
of association rules”. Advances in Knowledge Discovery and Data Mining. 307-328,
1996.
[2] L. Breiman. “Bagging predictors”. Machine Learning (24). 123-140, 1996.
[3] U. M. Fayyad, G. Piatetsky-Shapiro and P. Smyth. “From data mining to knowledge
discovery”. Advances in Knowledge Discovery and Data Mining. 1-34, 1996.
[4] W. J. Frawley, G. Piatetsky-Shapiro and C. J. Matheus. “Knowledge discovery in
databases: an overview”. Knowledge Discovery in Databases. 1-27, 1991.
[5] Y. Freund and R. E. Schapire. “A short introduction to boosting”. Journal of Japanese
Society for Artificial Intelligence, 14(5). 771-780, 1999. (In Japanese, translation by
Naoki Abe.).
[6] H. X. Huynh, F. Guillet and H. Briand. “ARQAT: an exploratory analysis tool for
interestingness measures”. ASMDA'05, Proceedings of the 11th International
Symposium on Applied Stochastic Models and Data Analysis. 334-344, 2005.
[7] H. X. Huynh, F. Guillet and H. Briand. “A graph-based approach for comparing
interestingness measures”. IEEE ICEIS'06, Proceedings of the First IEEE International
Conference on Engineering of Intelligent Systems. 375-380, 2006.
[8] K. Jain, M. N. Murty and P.J. Flyn. “Data clustering: a review”. ACM Computing
Surveys 31(3). 264-323, 1999.
[9] G. Piatetsky-Shapiro. “Discovery, analysis, and presentation of strong rules”.
Knowledge Discovery in Databases, In G. Piatesky-Shapiro and W. Frawley (editors).
229-248, 1991.
[10] Silberschatz and A. Tuzhilin. “What makes patterns interesting in knowledge discovery
systems”. IEEE Transactions on Knowledge and Data Engineering 5(6). 970-974,
1996.
4


LVCNPM_2903

1. Tên đề tài: NGHIÊN CỨU CÁC PHƯƠNG PHÁP KIỂM THỬ PHẦN MỀM - ỨNG
DỤNG PHẦN MỀM BUGZILLA ĐỂ KIỂM THỬ.
2. Loại đề tài: Công nghệ phần mềm.
3. Giáo viên hướng dẫn: Ths. Nguyễn Công Danh.
4. Số lượng sinh viên tham gia: 1 sinh viên.
5. Yêu cầu của đề tài.
ƒ Tóm tắt bài tốn, khả năng ứng dụng.
9 Xây dựng một hệ thống trao đổi tin nhắn tự động cho những người liên quan,
cụ thể là cho hệ thống quản lý việc dạy học, ra đề, và xem thi.
9 Dữ liệu về giảng dạy, ra đề, và xem thi của các cán bộ được lưu trong một cơ
sở dữ liệu (được cập nhật bởi người quản lý).
9 Chương trình Message Server lấy dữ liệu từ cơ sở dữ liệu trên và tự động gởi
tin nhắn có liên quan tới Message Client của mỗi cán bộ. Chú ý là mỗi cán bộ
chỉ nhận được các tin nhắn liên quan đến mình.
ƒ Về lí thuyết cần nghiên cứu: Kiến thức về cơng nghệ phần mềm, kiểm thử.
ƒ Ngôn ngữ cài đặt:
9 Một ứng dụng trên nền web hay application được viết theo ngôn ngữ tùy ý trên
nền Windows hoặc Linux.
9 Cài đặt và sử dụng Bugzilla trên nền Linux.
6. Tài liệu tham khảo.
[1] The Bugzialla Team. The Bugzilla Guide – 3.0 Release. Tham khao khảo tại địa chỉ:
http:// www.bugzilla.org/docs/ vào ngày 20/07/2007.
[2] Manfred Ratzmann và Clinton De Young, Software Testing and Internationalization,
Galileo Computing, 2003.

5


LVCNPM_2904
1.

2.
3.
4.
5.

Tên đề tài: XÂY DỰNG DỊCH VỤ TRAO ĐỔI TIN NHẮN TỰ ĐỘNG.
Loại đề tài: Lập trình mạng, cơ sở dữ liệu.
Giáo viên hướng dẫn: Ths. Nguyễn Công Danh.
Số lượng sinh viên tham gia: 1 sinh viên.
Yêu cầu của đề tài.
ƒ Tóm tắt bài tốn, khả năng ứng dụng.
9 Xây dựng một hệ thống trao đổi tin nhắn tự động cho những người liên quan,
cụ thể là cho hệ thống quản lý việc dạy học, ra đề, và xem thi.
9 Dữ liệu về giảng dạy, ra đề, và xem thi của các cán bộ được lưu trong một cơ
sở dữ liệu (được cập nhật bởi người quản lý).
9 Chương trình Message Server lấy dữ liệu từ cơ sở dữ liệu trên và tự động gởi
tin nhắn có liên quan tới Message Client của mỗi cán bộ. Chú ý là mỗi cán bộ
chỉ nhận được các tin nhắn liên quan đến mình.
ƒ Về lí thuyết cần nghiên cứu: Kiến thức về thiết kế hệ thống và xây dựng cở sở dữ liệu,
chiến lược gởi tin nhắn được hỗ trợ trong Java.
ƒ Ngơn ngữ cài đặt:
9 Lập trình Java.
9 Cơ sở dữ liệu tùy ý, nên dùng một Open Source Database.
6. Tài liệu tham khảo.
[1] Richard Monson-Haefel & David Chappell, Java Message Service, O’reilly. 2/2000.
[2] Eric Armstrong et al. The J2EE™ 1.4 Tutorial, Sun Microsystems, 7/2005.
[3] Developing EAServer messaging service applications. Tham khao khảo tại địa chỉ:
vào ngày ngày 20/07/2007.

6



LVCNPM_2905
1. Tên đề tài: ĐỀ NGHỊ MỘT GIẢI THUẬT TÌM CỤC BỘ CHO VẤN ĐỀ XẾP THỜI
KHÓA BIỂU.
2. Loại đề tài: Nghiên cứu giải thuật, cơ sở dữ liệu và phân tích hệ thống.
3. Giáo viên hướng dẫn: Ths. Nguyễn Công Danh.
4. Số lượng sinh viên tham gia: 1 sinh viên.
5. u cầu của đề tài.
ƒ Tóm tắt bài tốn, khả năng ứng dụng.
9 Đề nghị một giải thuật tìm cục bộ cho vấn đề xếp thời khóa biểu cho một khoa
của đại học
9 Dựa trên dữ liệu về giảng dạy của giảng viên, đăng ký học của sinh viên, và cơ
sở vật chất của 1 khoa để xếp thời khóa biểu học kỳ. Thời khóa biểu kết quả
tránh đụng độ về thời gian dạy và học. Tránh đụng độ về thời gian cho các
phòng học (hoặc hạn chế đến mức thấp nhất).
ƒ Về lí thuyết cần nghiên cứu: Tìm hiểu các nghiên cứu khác về vấn đề xếp thời khóa
biểu, đề nghị một giải thuật xếp lịch có thể là Tabu Search hay Simulated Annealing,
hay một giải thuật khác, thiết kế hệ thống và cơ sở dữ liệu
ƒ Ngôn ngữ cài đặt:
9 Tùy ý
9 Cơ sở dữ liệu tùy ý, nên dùng một Open Source Database.
6. Tài liệu tham khảo.
[1] Hakan Yildiz at al, Simulated Annealing & Applications to Scheduling Problems,
Bilkent University, 1/2000.
[2] Graham Kendall, Simulated Annealing, được truy tìm ở trang
vào ngày 31/07/2007

7



LVCNPM_2906
1.
2.
3.
4.
5.

Tên đề tài: PHÁT TRIỂN MỘT SEARCH ENGINE WEB TRÊN TIẾNG VIỆT
Loại đề tài: Truy vấn thông tin.
Giáo viên hướng dẫn: Ths. Phan Phương Lan.
Số lượng sinh viên tham gia: 1 sinh viên.
Yêu cầu của đề tài.
ƒ Tóm tắt bài toán, khả năng ứng dụng.
Mục tiêu của đề tài là phát triển một search engine có khả năng tìm kiếm các tài liệu web
được viết bằng tiếng Việt. Các search engine đều có các hoạt động: thu thập thơng tin, lập
chỉ mục trên thơng tin, truy tìm và sắp xếp kết quả trả về cho người truy vấn. Giao diện cho
phép người sử dụng truy vấn thông tin là một giao diện web gồm hai phần: đơn giản và
nâng cao. Người sử dụng có thể tìm kiếm có thể tìm kiếm thông tin ở dạng in hoa, in thường
hay không phân biệt; có thể tìm kiếm: một cụm từ, nhiều cụm từ bằng cách sử dụng các
toán tử AND, OR, v.v, sử dụng từ khóa để lọc tìm kiếm, v.v. Hiện nay, các tài liệu tiếng
Việt ở rất nhiều dạng bảng mã khác nhau. Đây cũng là một vấn đề mà đề tài cần quan tâm
để kết quả tìm kiếm phong phú.
Sinh viên không cần tự viết từ đầu tất cả các phần của một search engine; có thể sử dụng
các giải pháp có sẵn nhưng cần phải giải thích tại sao chọn giải pháp đó bằng cách so sánh,
đánh giá các khả năng.
ƒ Về lí thuyết cần nghiên cứu: Kiến thức về truy vấn thông tin.
ƒ Ngôn ngữ cài đặt: Ngơn ngữ lập trình tùy ý (khuyến khích sử dụng Java).
6. Tài liệu tham khảo.
[1] Google, www. google.com

[2] AltaVista, www.altavista.com
[3] Yahoo, www.yahoo.com
[4] VinaSeek, www.vinaseek.com
[5] NetNam, www.pan.vietnam.com
[6] Paolo Boldi and Sebastiano Vigna. The WebGraph framework I: Compression
techniques. In Proc. of the Thirteenth International World Wide Web Conference, pages
595–601, Manhattan, USA, 2004. ACM Press.
[7] Taher Haveliwala. Efficient computation of PageRank. Technical report, Stanford
University Technical Report, October 1999.
[8] T. Westerveld, W. Kraaij, and D. Hiemstra. Retrieving web pages using content, links,
URLs and anchors. In Proceedings of the Tenth Text Retrieval Conference (TREC-10),
2001.

8


LVCNPM_2907
1.
2.
3.
4.
5.

Tên đề tài: XÂY DỰNG WEBSITE CẤP GIẤY CHỨNG NHẬN SINH VIÊN.
Loại đề tài: Lập trình web
Giáo viên hướng dẫn: Ths. Nguyễn Văn Linh; KS. Trần Minh Tân.
Số lượng sinh viên tham gia: 1 sinh viên.
Yêu cầu của đề tài.
ƒ Tóm tắt bài tốn, khả năng ứng dụng.
Hiện nay sinh viên thường phải đến văn phòng khoa để xin các loại giấy chứng nhận như:

Giấy xác nhận là sinh viên của trường, giấy xác nhận đã hồn thành chương trình đào tạo,
giấy chứng nhận tốt nghiệp tạm thời,... Các hồ sơ này phải được kiểm tra bởi trợ lí quản lí
sinh viên, thư kí trình Trưởng khoa kí và sau đó sinh viên mang tới phịng Kế hoạch tổng
hợp để được đóng dấu. Do thầy Trưởng khoa bận cơng tác nên khơng phải lúc nào cũng có
mặt ở khoa để đáp ứng kịp thời yêu cầu của sinh viên. Điều này có thể gây phiền hà cho
sinh viên vì phải đi lại văn phòng khoa nhiều lần.
Để giải quyết vấn đề nói trên, chúng ta xây dựng một website chứa các mẫu giấy tờ, cơ sở
dữ liệu sinh viên. Khi sinh viên có yêu cầu về một giấy chứng nhận nào đó, sinh viên tự
điền thơng tin vào mẫu giấy tờ và gửi cho hệ thống, hệ thống sẽ kiểm tra và nếu hợp lệ sẽ
báo cho trợ lí để in giấy chứng nhận này và trình trưởng khoa kí. Sau khi trưởng khoa kí
xong, trợ lí sử dụng hệ thống để thơng báo cho sinh viên đến văn phịng khoa nhận. Với quy
trình mới này thì sinh viên chỉ phải đến văn phòng khoa một lần duy nhất.
ƒ Về lí thuyết cần nghiên cứu: MySQL, PHP hoặc các cơng nghệ tương đương.
ƒ Về thực tiễn cần tìm hiểu tất cả các loại giấy tờ mà sinh viên cần xác nhận, quy trình
hiện hành thực hiện cơng việc này.
ƒ Về công nghệ cần sử dụng: MySQL, PHP hoặc các công nghệ tương đương.
ƒ Về yêu cầu bổ sung: Tái sử dụng được cơ sở dữ liệu sinh viên hiện có của trường.
6. Tài liệu tham khảo.
[1] Các tài liệu liên quan đến các yêu cầu nói trên

9


LVCNPM_2908
1.
2.
3.
4.
5.


Tên đề tài: HỆ THỐNG HỖ TRỢ BÁN HÀNG TRÊN THIẾT BỊ DI ĐỘNG.
Loại đề tài: Lập trình trên thiết bị di động
Giáo viên hướng dẫn: KS. Lâm Hoài Bảo.
Số lượng sinh viên tham gia: 1 sinh viên.
Yêu cầu của đề tài.
ƒ Tóm tắt bài tốn, khả năng ứng dụng.
Ngày nay, thiết bị di động (PDA, Pocket PC…) ngày càng phổ biến; chúng được ứng dụng
trong nhiều mặt của đời sống xã hội. Một trong những ứng dụng của chúng là hỗ trợ cho
việc bán hàng ở các đại lý của một công ty cụ thể.
Thị trường bán hàng của một công ty được chia thành một số khu vực (chẳng hạn: miền
Trung, miền Nam, miền Bắc…); mỗi khu vực do một người quản lý. Mỗi khu vực lại có
một số đại lý thuộc khu vực đó. Vấn đề là: mỗi đại lý có đội ngũ bán hàng riêng; hằng ngày
đội ngũ bán hàng này cần phải giao hàng cho các điểm bán hàng của mình. Mỗi lần giao
hàng như vậy, người bán hàng cần ghi nhận lại mỗi mặt hàng đã giao có số lượng là bao
nhiêu?
Giả sử mỗi người bán hàng có một thiết bị di động (PDA, Pocket PC…); khi giao hàng cho
một điểm bán hàng, anh (chị) ta chỉ cần cập nhật lên CSDL chung nhờ thiết bị di động của
mình.
Cuối ngày, cuối tháng hay cuối quý; người ta có thể: thống kê doanh số theo từng người bán
hàng, doanh số theo khu vực, doanh số của tồn cơng ty…
ƒ Về lí thuyết cần nghiên cứu: Phân tích, thiết kế hệ thống.
ƒ Ngơn ngữ lập trình: Lập trình .NET hoặc Java trên các thiết bị di động; Hệ quản trị cơ
sở dữ liệu: MySQL hoặc SQL Server, v.v.
6. Tài liệu tham khảo.
[1] Giáo trình phân tích hệ thống hướng đối tượng.
[2] MSDN.
[3] Các tài liệu về lập trình trên các thiết bị di động.

10



LVCNPM_2909
1. Tên đề tài: XÂY DỰNG HỆ THỐNG TỰ ĐỘNG THÔNG BÁO TRẠM DỪNG XE BUÝT
TRONG THÀNH PHỐ CẦN THƠ.
2. Loại đề tài: Công nghệ phần mềm
3. Giáo viên hướng dẫn: TS. Trần Cao Đệ.
4. Số lượng sinh viên tham gia: Thực hiện theo nhóm 2 sinh viên (Trần Văn Thành, Tăng Phú
Khoa).
5. Yêu cầu của đề tài.
ƒ Mục tiêu:

Dùng thiết bị GPS để xác định tọa độ hiện tại của xe buýt. Khi xe buýt chạy gần tới một
trạm dừng thì máy sẽ tự động phát một message ghi sẳn. Ví dụ “Trạm kế tiếp là trạm cầu số
2, hành khách xuống trạm này có thể ghé vào Khu II-ĐHCT hoặc các tịa soạn báo trên
đường Trần Văn Hồi”
ƒ Cách tiếp cận giải quyết vấn đề:
9 Xây dựng bản đồ hệ thống xe buýt của thành phố có độ chính xác theo GPS.
9 Dùng thiết bị GPS thu tọa độ thực của xe buýt.
9 Tùy theo tọa độ và hướng di chuyển, lựa chọn Message và phát ra loa.
ƒ u cầu của đề tài
9 Hồn tất Demo chương trình trước 15/10 để tham gia thi TTVN.
9 Hoàn chỉnh về mặt khoa học cho LVTN.
6. Tài liệu tham khảo: liên hệ GVHD.

11


LVCNPM_2910
1. Tên đề tài: HỆ THỐNG GIS TRỢ GIÚP CHO NGƯỜI DÙNG XE BUÝT TRONG PHẠM
VI THÀNH PHỐ CẦN THƠ.

2. Loại đề tài: Công nghệ phần mềm
3. Giáo viên hướng dẫn: TS. Trần Cao Đệ.
4. Số lượng sinh viên tham gia: 1 sinh viên (Nguyễn Chí Cường).
5. Yêu cầu của đề tài.
ƒ Mục tiêu:
Xây dựng một hệ thống thông tin địa lý (GIS) trợ giúp cho người dùng xe buýt trong phạm
vi thành phố. Một người muốn đi từ điểm A đến điểm B trong thành phố đều được chỉ dẫn 1
cách đi xe buýt hiệu quả nhất (chuyển ít tuyến nhất). Hiện tại hệ thống xe buýt của thành
phố Cần Thơ chưa phủ khắp thành phố, vì vậy các điểm A và B có thể khơng nằm trên một
tuyến xe buýt nào. Nếu một vị trí nằm quá xa tuyến xe bt thì hệ thống khơng trợ giúp.
Nếu vị trí nằm trong phạm vi khoảng 10 phút đi bộ (<=1km) thì hệ thống sẽ chỉ dẫn cho
hành khách cách đi đến trạm xe buýt thích hợp, tuyến xe và hướng đi, nơi xuống (chuyển xe
buýt),… để đến đích.
ƒ Cách tiếp cận giải quyết vấn đề:
9 Xây dựng bản đồ giao thơng (tất cả các đường có tên) & bản đồ hệ thống xe
buýt của thành phố.
9 Xây dựng ứng dụng dẫn đường đi: tìm điểm truy cập vào tuyến xe buýt (trạm
lên), hướng đi, các trạm chuyển, nơi đổi tuyến, giá tiền xe,…
ƒ Yêu cầu
9 Xây dựng ứng dụng Web: hiển thị bản đồ, tìm đường đi.
9 Cài đặt ứng dụng lên PDA, Tích hợp ứng dụng vào đề tài LVCNPM_2909.
6. Tài liệu tham khảo: liên hệ GVHD.

12


LVCNPM_2911
1. Tên đề tài: PHÁT HIỆN SAO CHÉP TÀI LIỆU VĂN BẢN (TIẾNG VIỆT) VỚI
PHƯƠNG PHÁP FERRET.
2. Loại đề tài: Công nghệ phần mềm

3. Giáo viên hướng dẫn: TS. Trần Cao Đệ.
4. Số lượng sinh viên tham gia: 1 sinh viên.
5. Yêu cầu của đề tài.
ƒ Mục tiêu:
Kiểm tra và phát hiện việc sao chép (copy) tài liệu trong một tập hợp tài liệu thu thập trước
(ví dụ thư viện các luận văn, đồ án). Một tài liệu kiểm tra (ví dụ một luận văn) được đưa vào
hệ thống, hệ thống sẽ rà soát tài liệu này trong thư viện để xác định có sao chép hay khơng
và mức độ sao chép là bao nhiêu.
ƒ Cách tiếp cận:
9 Mơ hình hóa thư viện: Thư viện là một tập các tài liệu (documents); mỗi tài
liệu được chia thành đoạn (paragraph), mỗi đoạn có nhiều câu (sentence); mỗi
câu được chia thành cụm 3 từ (trigram).
9 Mơ hình hóa tài liệu kiểm tra: tương tự như trên.
9 Đo độ tương tự của hai văn bản: dựa trên đo độ tương tự của hai đoạn. Giả sử
đoạn văn bản A là của tài liệu kiểm tra, B là đoạn văn bản của một tài liệu
trong thư viện. S(A) và S(B) là tập hợp các trigram của A và B tương ứng. Độ
tương tự là S(A) ∩S(B)/S(A) U S(B). Nếu độ tương tự của hai đoạn vượt
ngưỡng α nào đó thì kết luận là đoạn văn bản được sao chép. Nếu tỉ lệ các
đoạn văn bản được sao chép vượt một ngưỡng β nào đó thì kết luận là văn bản
có sao chép.
ƒ u cầu của đề tài
9 Viết module hỗ trợ sưu tập các tài liệu làm thư viện (khoảng 100 tài liệu,
10000 đoạn).
9 Mơ hình hóa thư viện Ỉ CSDL.
9 Đo độ tương tự để kết luận sao chép với thời gian xử lí là chấp nhận được.
6. Tài liệu tham khảo: liên hệ GVHD.

13



LVCNPM_2912
1. Tên đề tài: PHÁT HIỆN SAO CHÉP TÀI LIỆU VĂN BẢN (TIẾNG PHÁP) VỚI
PHƯƠNG PHÁP FERRET.
2. Loại đề tài: Công nghệ phần mềm
3. Giáo viên hướng dẫn: TS. Trần Cao Đệ.
4. Số lượng sinh viên tham gia: 1 sinh viên francophone.
5. Yêu cầu của đề tài.
ƒ Mục tiêu:
Kiểm tra và phát hiện việc sao chép (copy) tài liệu trong một tập hợp tài liệu thu thập trước
(ví dụ thư viện các luận văn, đồ án). Một tài liệu kiểm tra (ví dụ một luận văn) được đưa vào
hệ thống, hệ thống sẽ rà soát tài liệu này trong thư viện để xác định có sao chép hay khơng
và mức độ sao chép là bao nhiêu.
ƒ Cách tiếp cận:
9 Mô hình hóa thư viện: Thư viện là một tập các tài liệu (documents); mỗi tài
liệu được chia thành đoạn (paragraph), mỗi đoạn có nhiều câu (sentence); mỗi
câu được chia thành cụm 3 từ (trigram).
9 Mơ hình hóa tài liệu kiểm tra: tương tự như trên.
9 Đo độ tương tự của hai văn bản: dựa trên đo độ tương tự của hai đoạn. Giả sử
đoạn văn bản A là của tài liệu kiểm tra, B là đoạn văn bản của một tài liệu
trong thư viện. S(A) và S(B) là tập hợp các trigram của A và B tương ứng. Độ
tương tự là S(A) ∩S(B)/S(A) U S(B). Nếu độ tương tự của hai đoạn vượt
ngưỡng α nào đó thì kết luận là đoạn văn bản được sao chép. Nếu tỉ lệ các
đoạn văn bản được sao chép vượt một ngưỡng β nào đó thì kết luận là văn bản
có sao chép.
ƒ u cầu của đề tài
9 Viết module hỗ trợ sưu tập các tài liệu làm thư viện (khoảng 100 tài liệu,
10000 đoạn).
9 Mơ hình hóa thư viện Ỉ CSDL.
9 Đo độ tương tự để kết luận sao chép với thời gian xử lí là chấp nhận được.
6. Tài liệu tham khảo: liên hệ GVHD.


14


LVCNPM_2913
1.
2.
3.
4.
5.

Tên đề tài: PHÁT HIỆN SAO CHÉP TÀI LIỆU VĂN BẢN VỚI KỸ THUẬT LSI.
Loại đề tài: Công nghệ phần mềm
Giáo viên hướng dẫn: TS. Trần Cao Đệ.
Số lượng sinh viên tham gia: 1 sinh viên (giỏi giải thuật & thống kê).
Yêu cầu của đề tài.
ƒ Mục tiêu:
Kiểm tra và phát hiện việc sao chép (copy) tài liệu trong một tập hợp tài liệu thu thập trước
(ví dụ thư viện các luận văn, đồ án). Một tài liệu kiểm tra (ví dụ một luận văn) được đưa vào
hệ thống, hệ thống sẽ rà soát tài liệu này trong thư viện để xác định có sao chép hay khơng
và mức độ sao chép là bao nhiêu. Việc rà soát là dựa trên ngữ nghĩa chứ không phải Text
như trong đề tài 3.
ƒ Cách tiếp cận:
9 Mơ hình hóa thư viện: Thư viện là một tập các tài liệu (documents); mỗi tài
liệu được chia thành đoạn (paragraph), mỗi đoạn có nhiều câu (sentence). Mơ
hình hóa có thể đến câ hoặc đoạn. Mỗi câu/đoạn là một vector theo từ, cả thư
viện là một khơng gian vector.
Ví dụ thư viện có 3 văn bản D1, D2, D3
D1: a b c. c b d.
D2: a c e f. e b.

D3: e c b d. a d c. e f
Mơ hình hóa theo câu, thì khơng gian vector gồm 7 vector:
s1
s2
s3
s4
s5
s6
s7
A
1
0
1
0
0
1
0
B
1
1
0
1
1
0
0
C
1
1
1
0

1
1
0
D
0
1
0
0
1
1
0
E
0
0
1
1
1
0
1
F
0
0
1
0
0
0
1
9 Mơ hình hóa tài liệu kiểm tra: tương tự như trên, tài liệu kiểm tra chia thành
các câu/đoạn, mỗi câu đoạn là một vector theo từ.
9 Kỹ thuật LSI cho phép phân tích ma trận (của Không gian vector)

9 Amxn = U∑VT
9 Đo độ tương tự của hai văn bản: dựa trên đo độ tương tự của hai đoạn theo kỹ
thuật LSI:
o Cắt theo kỹ thuật LSI: Ak = Uk∑kVkT
o Đo độ tương tự ngữ nghĩa của hai câu/đoạn bằng cách tính cosin của hai
vector trong không gian xác định bởi Ak.
ƒ Yêu cầu của đề tài
9 Viết module hỗ trợ sưu tập các tài liệu làm thư viện (khoảng 100 tài liệu,
10000 đoạn)
9 Mô hình hóa thư viện Ỉ CSDL
9 Đo độ tương tự để kết luận sao chép với thời gian xử lí là chấp nhận được
9 Kết quả đạt được:
o Cài đặt một phần mềm xác định sao chép với kỹ thuật LSI
o Phân tích độ chính xác của phần mềm.
6. Tài liệu tham khảo: liên hệ GVHD.
15


LVCNPM_2914
1. Tên đề tài: PHÁT HIỆN SAO CHÉP TÀI LIỆU VĂN BẢN (TIẾNG PHÁP) VỚI KỸ
THUẬT LSI.
2. Loại đề tài: Công nghệ phần mềm
3. Giáo viên hướng dẫn: TS. Trần Cao Đệ.
4. Số lượng sinh viên tham gia: 1 sinh viên francophone (giỏi giải thuật & thống kê).
5. Yêu cầu của đề tài.
ƒ Mục tiêu:
Kiểm tra và phát hiện việc sao chép (copy) tài liệu trong một tập hợp tài liệu thu thập trước
(ví dụ thư viện các luận văn, đồ án). Một tài liệu kiểm tra (ví dụ một luận văn) được đưa vào
hệ thống, hệ thống sẽ rà soát tài liệu này trong thư viện để xác định có sao chép hay khơng
và mức độ sao chép là bao nhiêu. Việc rà soát là dựa trên ngữ nghĩa chứ không phải Text

như trong đề tài 3.
ƒ Cách tiếp cận:
9 Mơ hình hóa thư viện: Thư viện là một tập các tài liệu (documents); mỗi tài
liệu được chia thành đoạn (paragraph), mỗi đoạn có nhiều câu (sentence). Mơ
hình hóa có thể đến câ hoặc đoạn. Mỗi câu/đoạn là một vector theo từ, cả thư
viện là một khơng gian vector.
Ví dụ thư viện có 3 văn bản D1, D2, D3
D1: a b c. c b d.
D2: a c e f. e b.
D3: e c b d. a d c. e f
Mơ hình hóa theo câu, thì khơng gian vector gồm 7 vector:
s1
s2
s3
s4
s5
s6
s7
A
1
0
1
0
0
1
0
B
1
1
0

1
1
0
0
C
1
1
1
0
1
1
0
D
0
1
0
0
1
1
0
E
0
0
1
1
1
0
1
F
0

0
1
0
0
0
1
9 Mơ hình hóa tài liệu kiểm tra: tương tự như trên, tài liệu kiểm tra chia thành
các câu/đoạn, mỗi câu đoạn là một vector theo từ.
9 Kỹ thuật LSI cho phép phân tích ma trận (của Khơng gian vector)
9 Amxn = U∑VT
9 Đo độ tương tự của hai văn bản: dựa trên đo độ tương tự của hai đoạn theo kỹ
thuật LSI:
o Cắt theo kỹ thuật LSI: Ak = Uk∑kVkT
o Đo độ tương tự ngữ nghĩa của hai câu/đoạn bằng cách tính cosin của hai
vector trong khơng gian xác định bởi Ak.
ƒ Yêu cầu của đề tài
9 Viết module hỗ trợ sưu tập các tài liệu làm thư viện (khoảng 100 tài liệu,
10000 đoạn).
9 Mơ hình hóa thư viện Ỉ CSDL.
9 Đo độ tương tự để kết luận sao chép với thời gian xử lí là chấp nhận được.
9 Kết quả đạt được:
o Cài đặt một phần mềm xác định sao chép với kỹ thuật LSI.
o Phân tích độ chính xác của phần mềm.
6. Tài liệu tham khảo: liên hệ GVHD.
16


LVCNPM_2915
1.
2.

3.
4.
5.

Tên đề tài: QUẢN LÝ CÔNG TÁC TUYỂN SINH ĐẠI HỌC VỚI DB2.
Loại đề tài: Công nghệ phần mềm
Giáo viên hướng dẫn: TS. Trần Cao Đệ.
Số lượng sinh viên tham gia: 1 sinh viên khá giỏi tiếng Anh.
Yêu cầu của đề tài.
ƒ Mục tiêu:
Mục đích chính của đề tài là tìm hiểu cơng nghệ DB2 của IBM. Áp dụng cơng nghệ vào bài
tốn quản lí cơng tác tuyển sinh Đại học.
ƒ Yêu cầu của đề tài
9 Tìm hiểu DB2, trình bày báo cáo kỹ thuật về DB2 (cùng kết hợp với SV trong
đề tài LVCNPM_2916).
9 Tìm hiểu cơng tác quản lí tuyển sinh ĐH, phân tích hệ thống.
9 Viết ứng dụng quản li tuyển sinh trong đó CSDL được quản lí với DB2. Ứng
dụng được phát triển trong mơi trường của cơng nghệ IBM (DB2, Eclipse, …)
o Quản lí từ xa trên mạng, môi trường nhiều người dùng (ứng dụng web).
o Web tra cứu thông tin tuyển sinh (ngành, khối, điểm chuẩn, chỉ tiêu, tỉ lệ
chọi…), tra cứu điểm thi .
ƒ Quyền lợi đặc biệt: Có thể có hỗ trợ tài chính của IBM-VN là cơ hội làm việc cho IBMVN.
6. Tài liệu tham khảo: liên hệ GVHD.

17


LVCNPM_2916
1.
2.

3.
4.
5.

Tên đề tài: QUẢN LÝ THƯ VIỆN KHOA CNTT-ĐHCT với DB2.
Loại đề tài: Công nghệ phần mềm
Giáo viên hướng dẫn: TS. Trần Cao Đệ.
Số lượng sinh viên tham gia: 1 sinh viên khá giỏi tiếng Anh.
Yêu cầu của đề tài.
ƒ Mục tiêu:
Mục đích chính của đề tài là tìm hiểu công nghệ DB2 của IBM. Áp dụng công nghệ vào bài
tốn quản lí thư viện khoa.
ƒ u cầu của đề tài:
9 Tìm hiểu DB2, trình bày báo cáo kỹ thuật về DB2 (cùng kết hợp với SV trong
đề tài LVCNPM_2915).
9 Tìm hiểu cơng tác quản lí thư viện, phân tích hệ thống.
9 Viết ứng dụng quản li thư viện trong đó CSDL được quản lí với DB2. Ứng
dụng được phát triển trong môi trường của công nghệ IBM (DB2, Eclipse, …)
o Quản lí từ xa trên mạng, mơi trường nhiều người dùng (ứng dụng web).
o Web tra cứu/tìm kiếm tài liệu, đặt mượn, gia hạn.
ƒ Quyền lợi đặc biệt: Có thể có hỗ trợ tài chính của IBM-VN là cơ hội làm việc cho IBMVN.
6. Tài liệu tham khảo: liên hệ GVHD.

18



×