KỶ YÉU HỘI THẢO QUÓC GIA
HƯNG YÊN, 19-20 THÁNG 8 NĂM 2010
MỘT SỐ VẤN ĐỀ CHỌN LỌC CỦA
CÔNG NGHỆ THÔNG TIN VÀ
TRUYÈN t h ô n g
NHÀ XUẤT BẢN KHOA HỌC KỸ THUẬT
HÀ NỘI-2011
H Ộ I THẢO QUỐC GIA LẦN T H Ứ XIII
M Ộ T SỐ VẤN ĐÈ CHỌN LỌC CỦA
CÔ N G NGHỆ THÔNG TIN VÀ TRUYÈN THÔNG
C hủ đề: Các cơng n g h ệ tỉnh tốn hiện đại
H ư n g Yen, 19-20/08/2010
THÔNG BÁO
Hội thảo Quốc gia lần thứ XIII "Một số vấn đề chọn lọc của Công nghệ thông tin
và Truyền thông" do Viện Công nghệ thông tin - Viện Khoa học và Công nghệ Việt Nam
và Đại học Sư phạm Kỹ thuật Hưng Yên tổ chức tại Khoái Châu, Hưng Yên từ ngày 19
đến ngày 20 tháng 8 năm 2010. Hội thảo là diễn đàn để các nhà khoa học và quản lý trong
cả nước chia sẻ kinh nghiệm nghiên cứu, triển khai trong lĩnh vực Công nghệ thông tin và
truyền thông. Đặc biệt Hội thảo cũng là môi trường để những người làm công tác nghiên
cứu khoa học trẻ; những nghiên cứu sinh, học viên cao học có điều kiện để trao đổi, tìm
kiếm sự tài trợ hợp tác.
Các chủ đề chính (khơng hạn chế) của Hội thảo
• Tin học quản lý
• Mã nguồn mở
Các hệ thống tích hợp
• Cơng nghệ đa phương tiện, mơ phỏng
Thực tại ảo
• Giáo dục điện tử, đào tạo từ xa
Cơng nghệ phần mềm
• Cơng nghệ điện tử và viễn thơng
• Xử lý ngơn ngữ
• Cơng nghệ tri thức và tính tốn mềm
• Các hệ thống nhúng
•
Cơng nghệ mạng và mạng khơng dây
Các cơ quan đồng tổ chức
•
Đại học Sư phạm Kỹ thuật Hưng Yên
•
Viện CNTT - Viện KH&CN Việt Nam
Các hệ thống tính tốn di động
Xử lý ảnh và kỹ thuật Video
CNTT trong Kinh tế- Kỹ thuật
< Cơ sở toán học của tin học
Liên hệ đăng ký tham dự
•
Đỗ Năng Tồn. Viện CNTT - Viện KH&CN Việt Nam
Email.
ĐT\ (043) 7567935, 0913-583240, Fox: (043) 756 4217
•
Phạm Minh Chuẩn, ĐHSP Kỹ thuật Hưng Yên
Email:
ĐT: (03213) 775075,0983-081120, Fax: (0321) 3713 015
Thòi hạn đăng ký báo cáo
•
Tồn văn báo cảo:
30/06/20ỉ 0
•
Chấp nhận báo cáo: 15/07/2010
Đăng ký đại biểu
•
Hội nghị phỉ: 100. OOOđồng (miễn phỉ đối với sinh viên tham gia báo cáo)
•
Ban Tổ chức sẽ giúp liên hệ chỗ ăn, ở cho các đại
biểu về dự Hội thảo
Quy cách chuẩn bị báo cáo xem chi tiết lại Website:
BAN THƯ KÝ HỘI THẢO
Truởng ban
Đỗ Năng Tồn
Các ủy viên
Phạm Minh Chuẩn
Trần Quang Diệu
Phạm Ngọc Hưng
Viện Cơng nghệ thông tin
Đại học Sư phạm Kỹ thuật Hưng Yên
Viện Công nghệ thông tin
Đại học Sư phạm Kỹ thuật Hưng Yên
BAN TỔ CHỨC
Trưởng ban
Trần Trung
Đại học Sư phạm Kỹ thuật Hưng Yên
Phó trưởng ban
Trưcmg Ngọc Tuấn
Đại học Sư phạm Kỹ thuật Hưng n
Các ủy viên
Ngơ Thanh Bình
Đại học Sư phạm Kỹ thuật Hưng Yên
Nguyễn Văn Bình
Phạm Việt Bình
Ngơ Kim Dung
Nguyễn Việt Hà
Nguyễn Đình Hân
Nguyễn Hồng Hịa
Nguyễn Quang Hưng
Ngơ Hùng Mạnh
Nguyễn Hữu Quỳnh
Nguyễn Minh Quý
Nguyễn Văn Tám
Huỳnh Quyết Thẳng
Nguyễn Thị Lê Thu
VNPT Hưng Yên
Khoa CNTT - ĐH Thái Nguyên
Đại học Công nghiệp Hà Nội
Đại học Công nghệ- Đại học QGHN
Đại học Sư phạm Kỹ thuật Hưng Yên
Sở TT &Truyền thông Hưng Yên
Bộ Thông tin & Truyền thông
Sờ Khoa học- Công nghệ Hưng Yên
Đại học Điện lực
Đại học Sư phạm Kỹ thuật Hưng Yên
Sở GD&ĐT Hưng Yên
Đại học Bách khoa Hà Nội
Viện Công nghệ thông tin
BAN CHƯƠNG TRÌNH
Trưởng ban
Vũ Đức Thi
Viện Cơng nghệ thơng tin
Pìiỏ trưởng ban
Đặng Quang Á
Ngô Văn Quyết
Ngô Quốc Tạo
Viện Công nghệ thông tin
Đại học Sư phạm Kỹ thuật Hưng Yên
Viện Công nghệ thơng tin
Các ủy viên
Đồn Văn Ban
Lê Hồi Bắc
Nguyễn Ngọc Bình
Bùi Thế Duy
Phan Thị Hà Dương
Hồ Sỹ Đàm
Đặng Hữu Đạo
Lê Quốc Định
Dương Anh Đức
Đặng Văn Đức
Trần Hành
Nguyễn Thúc Hải
Nguyễn Mậu Hân
Viện Cơng nghệ thơng tin
Đại học KHTN Tp. Hồ Chí Minh
Đại học Cơng nghệ -ĐHQGHN
Đại học Cơng nghệ -ĐHQGHN
Viện Tốn học
Đại học Công nghệ -ĐHQGHN
Viện Công nghệ ứiông tin
Đại học Hàng hải
Đại học Khoa học tự nhiên
Viện Công nghệ ứiông tin
Đại học Lạc Hồng
Đại học Bách khoa Hà Nội
Đại học Huế
Vũ Đình Hịa
Nguyễn Đình Hóa
Nguyễn Xn Huy
Phan Huy Khánh
Hồng Kiếm
Lương Chi Mai
Nguyễn Văn Mạnh
Trần Đức Minh
Trần Văn Lăng
Phạm Thế Long
Nguyễn Huy Lợi
Vũ Duy Lợi
Phùng Văn ồ n
Nguyễn Hoàng Phương
Từ Minh Phương
Nguyễn Hồng Quang
Lê Văn Sơn
Hồng Chí Thành
Trần Thiên Thành
Lê Mạnh Thạnh
Lê Quyết Thắng
Nguyễn Đình Thuân
Nguyễn Thanh Thủy
Hà Quang Thuỵ
Trịnh Nhật Tiến
Nguyễn Thanh Tùng
Phan Thị Tươi
Hồ Tường Vinh
Đại học Sư phạm 1 Hà Nội
Viện CNTT - ĐHQG Hà Nội
Viện Công nghệithông tin
Đại học Bách khoa Đà Nang
Đại học CNTT Tp. Hồ Chí Minh
Viện Cơng nghệ thơng tin
Đại học Bách khoa Hà Nội
Đại học Đà Lạt
Đại học Lạc Hồng
Học viện Kỹ thuật quân sự
Đại học Sư phạm Hà Nội 2
Trung tâm Tin học - VPTW
Văn phịng Chính phủ
TT Tin học Bộ Y tế
Học viện Công nghệ BCVT
Viện Tin học Pháp ngữ - IFI
Đại học Sư phạm Đà Nang
ĐH Khoa học Tự nhiên - ĐHQG Hà Nội
Đại học Quy Nhem
Đại học Khoa học Huế
Đại học Cần Thơ
Đại học Nha Trang
Đại học Bách khoa Hà Nội
Đại học Công nghệ - ĐHQG Hà Nội
Đại học Công nghệ -ĐHQGHN
Viện Công nghệ thông tin
Đại học Bách khoa-Tp. Hồ Chí Minh
Viện Tin học Pháp ngữ - IFI
C Á C Đ Ơ N VỊ TÀ I TR Ọ H Ộ I TH Ả O C N TT 2010
V iện K h o a học và C ông nghệ V iệt N am
V iện C ô n g nghệ T hông tin- V iện K hoa học và C ông nghệ V iệt N am
T rườ ng Đ ại học Sư phạm K ỹ thuật H ưng Y ên
K hoa C ô n g nghệ thông tin - T rường Đại học C ông nghệ - Đại học Quốc
G ia H à NỘI
T rườ ng Đ ại học B ách K hoa H à Nội
T rườ ng Đ ại học cần T hơ
T rườ ng Đ ại học K hoa học H uế
T rườ ng Đ ại học L ạc H ồng
T rườ ng Đ ại học N ha T rang
T rư ờ ng Đ ại học Sư phạm Kỹ thuật N am Đ ịnh
Trưòrng C ao đẳng Sư P hạm Trung ư ơ n g
K hoa C ô n g nghệ th ô n g tin- T rường Đại học C ông N ghiệp Hà N ội
K hoa C ô n g nghệ th ô n g tin- T rường Đại học Đ iện Lực
K hoa C ô n g nghệ th ô n g tin- T rường Đại học Thái N guyên
K lioa C ô n g nghệ th ô n g tin- Trường Đại học K hoa học tự nhiên Tp Hồ
Chí M inh
K lìoa C ô n g nghệ th ô n g tin- T rường Đại học Sư phạm H à N ội 2
K hoa C ô n g n g h ệ th ô n g tin- Trường Đại học T hủ D ầu M ột
K hoa C ô n g nghệ th ô n g tin- T rường Đại học Sư phạm K ỹ T huật Vinh
K hoa C ô n g n g h ệ thông tin - H ọc V iện K ỹ thuật Q uân sự
K hoa C ô n g n g h ệ th ô n g tin- H ọc viện C ông nghệ B ư u chính V iễn thơng
T rung tâm T in học- B ư u điện Hải Phịng
T rung tâm C ơng n g h ệ th ôn g tin - V ăn phòng T W Đ ảng
T ập đ o àn V iễn th ô n g quân đội V iettel - C hi nhánh H ưng Y ên
C ông ty V iễn th ô n g H ư ng Y ên và V inaphone H ư ng Y ên
C ông ty Cổ p h ần truyền thơng truyền hình quốc g ia H à N ội (H T M )
C ông ty C ổ phần điện tử tin học FSC Hà N ội
C ông ty Cổ phần tư vấn xây dựng và thư ơ ng m ại Thái D ương
C ông ty C ổ p h ần và thư ơ ng m ại N B T H ưng Y ên
Một số vẩn đề chọn lọc cùa Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 nâm 2 0 Ĩ0
LỜI NÓI ĐẦU
Hội thảo Quốc gia "Một sổ vấn đề chọn lọc của Công nghệ thông tin ” được khởi
xướng theo sáng kiến của Viện Công nghệ Thông tin thuộc Viện Khoa học và Công nghệ
Việt nam, đến nay đã qua hơn 10 lần tổ chức
Hội thảo Quốc gia "Một sổ vấn đề chọn ỉọc pủa Công nghệ thông tin ” lần thứ I được
tổ chức từ ngày 5 đến 7 tháng 8 năm 1997 tại Đại học Sư phạm Hà Nội II, Đại Lải, Vĩnh
Phúc. Hội thảo được tổ chức dưới sự phối hợp của: Viện Công nghệ thông tin, Đại học
Quốc gia Hà Nội, Đại học Sư phạm Hà Nội II.
Kể từ đó đến nay, hàng năm cứ mỗi độ thu sang Viện Công nghệ thông tin- Viện Khoa
học và Công nghệ Việt Nam lại phối hợp với một trong các trường Đại học trong nước để
tổ chức Hội thảo Quốc gia "Một số vẩn đề chọn lọc của Công nghệ thông tin
Với các chủ để khác nhau, hội thảo Quốc Gìa."Một số vấn đề chọn lọc của Công nghệ
thông tin ” đã thực sự trở thành diễn đàn nhằm trao đổi các kết quả nghiên cứu và triển khai
ứng dụng công nghệ thông tin của các nhà khoa học, đặc biệt là các nhà khoa học trẻ trên
mọi miền đất nước.
Hội thảo lần thứ XIII với chủ đề “Cóc cơng nghệ tính tốn hiện đạĩ' được Viện Công
nghệ thông tin phối họp với Đại học Sư phạm Kỹ thuật Hưng Yên tổ chức tại Hưng Yên từ
ngày 19-20 tháng 8 năm 2010
Hcm 500 đại biểu và khách mòd từ mọi miền của đất nước đã tham dự Hội thảo lần thứ
mười ba này. Các đại biểu đã nghe và thảo luận gần 150 báo cáo khoa học theo các nội dung:
Các hệ tíiống thơng minh
Cơ sở toán học của tin học
Mã nguồn mở
Tin học quản lý
Giáo dục điện tử, đào tạo từ xa
Công nghệ đa phương tiện, mô phỏng
Xử lý ngôn ngữ
Công nghệ điện tử và viễn thông
Các hệ thống nhúng
Công nghệ tri thức và tính tốn mềm
Các hệ thống tích hợp
Cơng nghệ mạng và mạng không dây
Thực tại ảo
Công nghệ phần mềm
Xừ lý ảnh và kỹ thuật Video
Một sổ vấn đề chọn ¡ọc cùa Công nghệ thông lin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 2010
Với sự tham gia đông đảo của các nhà khoa học trong và ngoài nước cùng với số
lượng lớn báo cáo khoa học gửi tới Hội thảo đã khẳng định ý nghĩa thiết thực và tầm vóc
quốc gia của Hội thảo "Một sổ vấn đề chọn lọc của Công nghệ thơng tin
Các đại biểu đánh giá cao sự nhiệt tình của các đơn vị tham gia tổ chức Hội thảo, đặc
biệt là cơ sở đăng cai; Đại học Sư Phạm Kỹ thuật Hưng Yên và đơn vị chủ quản và điều
hành chương trình - Viện Cơng nghệ thơng tin.
Trong phiên bế mạc Hội thảo lần thứ XIII, Ban Tổ Chức đã trao cờ cho Đại học cần
Thơ, là đơn vị đăng cai tổ chức Hội thào lần thứ XIV tại Thành phố cần Thơ.
Các cơng trình được in trong tập kỷ yếu này đã được báo cáo, thảo luận tại Hội thảo và
sau đó đã được phản biện nghiêm túc.
Ban tổ chức Hội thảo xin chân thành cảm on các đcm vi sau đây đã tài trợ kinh phí cho
hoạt động của Hội thảo:
Trường Đại học Sư phạm Kỹ thuật Hưng Yên
Viện Công nghệ Thông tin- Viện Khoa học và Công nghệ Việt Nam
Khoa Công nghệ thông tin - Trường Đại học Công nghệ - Đại học Quốc Gia
Hà Nội
Trường Đại học Bách Khoa Hà Nội
Trường Đại học cần Thơ
Trưòmg Đại học Khoa học Huế
Trường Đại học Lạc Hồng
Trưòng Đại học Nha Trang
Trường Đại học Sư phạm Kỹ thuật Nam Định
Trường Cao đẳng Sư Phạm Trung ư ơng
Khoa Công nghệ thông tin- Trường Đại học Công Nghiệp Hà Nội
Khoa Công nghệ thông tin- Trường Đại học Điện Lực
Khoa Công nghệ thơng tin- Trưịng Đại học Thái Ngun
Khoa Cơng nghệ thơng tin- Trường Đại học Khoa học tự nhiên Tp Hồ chí Minh
Khoa Cơng nghệ thơng tin- TrưỊTig Đại học Sư phạm Hà Nội 2
Klioa Công nghệ thông tin- Trường Đại học Thủ Dầu Một
Khoa Công nghệ thông tin- Trường Đại học Sư phạm Kỹ Thuật Vinh
Khoa Công nghệ thông tin - Học Viện Kỹ thuật Quân sự
Khoa Công nghệ thông tin- Học viện Cơng nghệ Bưu chính Viễn thơng
Trung tâm Tin học- Bưu điện Hải Phịng
Trung tâm Cơng nghệ thơng tin - Văn phòng TW Đảng
10
Một sổ vấn đề chọn lọc của Công nghệ thông lin và truyền thông, Hưng Yên, ¡9-20 tháng 08 năm 2010
•
•
Tập đồn Viễn thơng qn đội Viettel - Chi nhánh Hưng Yên
Công ty Viễn thông Hưng Yên và Vinaphone Hưng n
•
Cơng ty Cổ phần truyền thơng truyền hình quốc gia Hà Nội (HTM)
•
Cơng ty Cổ phần điện tử tin học FSC Hà Nội
•
•
•
Cơng ty Cổ phần tư vấn xây dựng và thưcmg mại Thái Dương
Công ty Cổ phần và thương mại NBT Hưng Yên
Và nhiều cá nhân khác
Ban ChưoTig trìnli xin chân thành cảm ơn các phản biện đã đóng góp nhiều ý kiến quý
báu góp phần nâng cao chất lượng tập kỷ yếu của Hội thảo.
Xin trân trọng giới thiệu với đông đảo bạn đọc và mong tiếp tục nhận được những ý
kiến đóng góp về hình thức hoạt động của Hội thảo cũng như về nội dung khoa học của các
báo cáo.
Hà Nội, ngày
19
tháng 06
năm 2011
Ban Biên tập
II
D A N H S Á C H C Á C P H Ả N B IỆ N
1
Đoàn Văn Ban
Học hàm , học
vi
PGS.TS.
2
Phạm Thượng Cát
PGS.TSKH.
Viện Công nghệ thông tin
3
Đặng Hữu Đạo
PGS.TS
Viện Công nghệ thông tin
4
Nguyễn Công Điều
PGS.TS.
Viện Công nghệ thông tin
5
Đặng Văn Đức
PGS.TS.
Viện Công nghệ thông tin
6
Nguyễn Huy Đức
TS.
Trường Cao đăng SP Mâu
giáo Trung ương
7
Lê Bá Dũng
PGS.TS.
Viện Công nghệ thông tin
8
Nguyễn Đức Dũng
TS.
Viện Công nghệ thông tin
9
Bùi Thế Duy
PGS.TS.
10
Nguyễn Việt Hà
PGS.TS.
11
Nguyễn Cát Hồ
PGS.TSKH.
Đại học Công nghệ- Đại
học Quốc gia Hà Nội
Đại học Công nghệ- Đại
học Quốc gia Hà Nội
Viện Công nghệ thông tin
PGS.TS.
Viện Công nghệ thông tin
13
1 Bùi Thế Hồng
Nguyễn Xuân Huy
PGS.TSKH.
Viện Công nghệ thông tin
14
Phan Trung Huy
PGS.TS.
Đại học Bách Khoa
15
Trần Đình Khang
PGS.TS.
Đại học Bách khoa
16
Lương Chi Mai
PGS.TS.
Viện Cơng nghệ thông tin
17
Lê Văn Phùng
TS.
Viện Công nghệ thông tin
18
Từ Minh Phương
PGS.TS.
Học viện Cơng nghệ Bưu
chính Viễn thơng
19
Trần Hồng Qn
PGS.TS.
Viện KHKT Bưu điện
20
Lê Xuân Quảng
TS.
Viện Công nghệ thông tin
21
Trần Thái Sơn
TS.
Viện Công nghệ thông tin
22
Nguyễn Văn Tam
PGS.TS.
Viện Công nghệ thông tin
23
Ngô Quốc Tạo
PGS.TS.
Viện Công nghệ thông tin
24
Nguyễn Trường Thắng
TS.
Viện Công nghệ thông tin
STT
12
12
Họ và tên ngưịi phản biện
Cơ quan
Viện Cơng nghệ thơng tin
25
Hồng Chí Thành
PGS.TS.
26
Vũ Đức Thi
GS.TS.
Đại học Cơng nghệ- Đại
học Quốc gia Hà Nội
Viện Công nghệ thông tin
27
Nguyễn Thanh Thủy
GS.TS.
Đại học Bách Khoa
28
Hà Quang Thụy
PGS.TS.
29
Trịnh Nhật Tiến
PGS.TS.
30
Đỗ Năng Tồn
PGS.TS.
Đại học Cơng nghệ- Đại
học Quốc gia Hà Nội
Đại học Công nghệ- Đại
học Quốc gia Hà Nội
Viện Công nghệ thông tin
31
Nguyễn Minh Tuấn
TS.
Viện Cơng nghệ thơng tin
32
Nguyễn Thanh Tùng
PGS.TS.
Viện Cơng nghệ thơng tin
33
Hồng Đỗ Thanh Tùng
TS.
Viện Công nghệ thông tin
13
M ột số vẩn đề chọw ỉọc cùa Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 20ỈỒ
MỤC LỤC
Lịi nói đầu
9
Mục lục
15
1. Hoang Thi Lan Giao, Nguyen Thi Lan Anh
19
A COMPARATIVE ANALYSIS OF TECHNIQUES FOR PREDICTING ACADEMIC PERFORMANCE
2. Lê Huy Thập
29
ĐẢNG CÂU VÂN TIN TRÊN CÁC QUAN HỆ VÀ x ừ LÝ CÂU VÂN TIN TRÊN BẢNG
3. Bùi Thế Hồng, Lưu Thị Bích Hương
BẢO VỆ BẢN QUYỀN CÔNG KHAI CHO CÁC
41
cơ sở
DỬ LIỆU QUAN HỆ
4. Bùi Đức Minh, Lưong Nguyễn Hoàng Hoa, Cao Tùng Anh, Nguyễn Gia
51
Như, Nguyễn Xuân Huy
BIẺU DIÊN C ơ SỜ CÙA HỆ SINH ÁNH XẠ ĐÓNG
5. Vũ Duy Linh, Lê Quyết Thắng, Huỳnh Xuân Hiệp
59
D ự BẢO NẺ RÂY THEO THỜI GIAN
6. Nguyễn Hữu Mùi, Vũ Đình Hịa
71
GIẢI BÀI TỐN LẬP LỊCH JOB SHOP BẰNG THUẬT TOÁN DI TRUYỀN
7. Lưong Xuân Bách, Nguyễn Nhật Quang
83
HỆ THỐNG GỢI Ý TIN TỨC NEWSARD
8. Võ Hồng Bảo Châu, Trương Thị Quỳnh Hưong, Trương Thị Đức,
97
Nguyễn Thụy Mai Trâm, Tạ Thúc Nhu
LẬP CHÌ MỤC THEO NHĨM ĐÊ NÂNG CAO HIỆU
QUẢ KHAI THÁC cơ sờ
D Ữ LIỆU VIRUS CÚM
9. Đặng Thành Chương, Vũ Duy Lợi, Võ Viết Minh Nhật
MƠ HÌNH PHÂN TÍCH ĐỊNH TUYẾN LỆCH HƯỚNG KÉT HỢP VỚI CHUN ĐƠI
107
Bước
SĨNG
NHẰM GIẢI QUT TÁC NGHẼN TRÊN MẠNG CHUYẺN MẠCH CHÙM QUANG OBS
15
Một s ố vấn đề chọn lọc cùa Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 2010
10. Bùi Quốc Trung, HỒ Tường Vinh
119
MƠ PHĨNG MỘT SĨ TINII HUỐNG GIAO THƠNG ĐƠ THỊ D ự A TRÊN MƠ HÌNH ĐA TÁC TỪ
11. Trưong Cơng Tuấn, Trần Thái Sơn
133
MÔI QUAN HỆ GIỮA N G Ừ NGHĨA CÚA CHƯƠNG TRÌNH LOGIC DIỄN GIẢI VÀ CHƯƠNG TRÌNH
LOGIC DẠNG TUYÊN
12. Nguyễn Văn Huân, Phạm Việt Bình, Vũ Xuân Nam
141
MỘT CÁCH TIÉP CẬN TRONG HỎ TRỢ THU THẬP DỪ LIỆU T ự ĐỘNG
13. Nguyễn Thị Hồng Minh, Lê Hoàng Sơn, Phạm Huy Thơng,
151
Nguyễn Duy Linh
MỘT GIẢI PHÁP CẢI TIÉN THUẬT TỐN BEEMAN TRONG MƠ PHĨNG ĐỘNG L ự c PHÂN TỬ
14. Nguyễn Thanh Tùng, Trần Huy Dương
163
MỘT PHƯƠNG PHÁP MÓI TIÈN x ử LÝ GIÁ TRỊ THIẾU
15. Nguyễn Thị Thu Hà, Nguyễn Thiện Luận, Vũ Văn Định
173
MỘT PHƯƠNG PHÁP TRÍCH RÚT CÂU TRONG VĂN BÀN TIẺNG VIỆT s ử DỤNG LUẬT KẾT HỢP
16. Trần Ngọc Hà, Hoàng Xuân Huấn, Nguyễn PhưoTig Chi
181
MỘT PHƯƠNG PHÁP x ừ LÝ KÉT QUẢ TÌM KIÊM TRÊN WEB
17. Đỗ Văn Tuấn, Trần Đăng Hiên, Nguyễn Thanh Bình, Phạm Văn Át
193
MỘT SỔ CÀI TIÊN NÂNG CAO Tốc Đ ộ x ừ LÝ CÚA PHƯƠNG PHÁP MÃ HÓA s ố HỌC
18. Nguyễn Mạnh Hùng, Phạm Thị Bích Vân, Đỗ Thị Mai Hường
205
MỘT SỐ CÀI TIÉN THUẬT TOÁN PHÂN CỤM SONG SONG D Ữ LIỆU LỚN, NHIÊU CHIÊU
DỰA TRÊN LƯỚI THÍCH NGHI PMAFIA
19. Hà Mạnh Đào, Thái Quang Vinh, Hoàng Văn Tuấn
MƯỢN KÊNH ĐỘNG TRÊN c ơ s ờ B ộ ĐIÊU KHIÊN MÒ SỪ DỤNG SUBSETHOOD
16
215
Một số vấn để chọn lọc cùa Công nghệ thông tin và truyền thông, Hung Yên, 19-20 tháng 08 năm 20Ỉ0
20. Lê Tiến Lộc, Lâm Thành Hiển, Trần Hành
229
NGHIÊN c ú u BA CHÉ Đ ộ ĐIÊU KHIÊN ON/OFF, PID, FUZZY VÀ ỨNG DỤNG TRONG ĐIÈU
KHIÊN MƠ HÌNH LỊ NHIỆT
21. Lê Văn Sơn, Trần Nguyễn Hồng Phúc
239
NGHIÊN CỬU MƠ HÌNH GIÁM SÁT TRựC TUYÉN HỆ THỐNG MẠNG PHÂN TÁN QUY MÔ LỚN
22. Hà Đại Dương, Đào Thanh Tĩnh
251
PHÁT HIỆN CHÁY S ừ DỤNG CAMERA THÔNG THƯỜNG TRONG ĐIÊU KIỆN ÁNH SÁNG
MÔI TRƯỜNG YÉU
23. Cù Thu Thủy, Hà Quang Thụy
263
PHÁT HIỆN LUẬT KẾT HỢP SPORADIC TUYỆT ĐỐI HAI NGƯỠNG MỜ
24. Trịnh Đình Thắng, Trần Minh Tuyến
276
PHÉP DỊCH CHUYÊN L ư ợ c Đ ồ KHỐI VÀ VẤN ĐÊ BIÊU DIỄN BAO ĐĨNG, KIIỐ TRONG
MƠ HÌNH D ử LIỆU DẠNG KHỐI
25. Nguyen Buong, Nguyen Dinh Dung
287
REGULARIZATION FOR A COMMON SOLUTION OF A SYSTEM OF NONLINEAR ILL-POSED
EQUATIONS WITH PERTURBATIVE DATA
26. Văn Đình Vỹ Phưong, Phan Mạnh Thưòng, Trần Văn Lăng
295
SO SÁNH CẨU TRÚC PROTEIN SỪ DỤNG MƠ HÌNH TỐNG QT
27. Phạm Văn Trung, Võ Thanh TÚ
301
SO SÁNH VÀ ĐÁNH GIÁ MỘT s ố GIAO THỨC ĐỊNH TUYÉN ĐIỀU KHIÊN THEO YÊU CẢU TRÊN
MẠNG MANET
28. Đặng Quang Á, Vũ Vinh Quang, Trương Hà Hải
311
TIÊP CẬN CHIA MIỀN TỚI CÁC BÀI TOÁN VỀ MẶT PHÂN CÁCH
29. Nguyễn Đình Hân, Đặng Quyết Thắng, Hồ Ngọc Vinh
33ẵf
rÍNH TỐN Đ ộ TRẺ GlÀl MÃ CỦA NGƠN NGỮ BÂNG OTOMAT
17
Một số vấn đề chọn lọc của Công nghệ thông tin và truvền thông, Hưng Yên, 19-20 tháng 08 năm 2010
30. Nguyễn Thị Hương Thủy, Nguyễn Văn Toàn, Nguyễn Ngọc Kỷ,
333
Nguyễn Thị Hoàng Lan
XÂY DỤNG GIẢI PHÁP BẢO MẬT BIOPKI VÀ ÚÌMG DỤNG ĐẺ BẢO MẬT HỆ NHẬN
DẠNG VÂN TAY
31. Tạ Nguyễn, Vũ Đình Trung, Trần Ngọc Phúc, Đỗ Quốc Bảo, Tạ Thúc Nhu,
34'
Trần Hành
XÂY DỰNG HỆ THỐNG QUẢN LÝ CÁC QUY TRÌNH MƠ PHỎNG NGHIỆP v ụ TRONG
DOANH NGHIỆP
32. Vũ Trí Dũng, Nguyễn Xuân Huy
353
VÈ PHÉP BIÉN ĐỔI HỆ SINH ÁNH XẠ ĐĨNG
33. Nguyễn Mậu Un, Ngơ Thành Long, Bùi Đình Hà
361
VÊ PHƯƠNG PHÁP PHÂN NGƯỠNG ẢNH THÍCH NGHI SỪ DỤNG TẬP MỜ LOẠI 2
34. Vũ Đức Thi, Nguyễn Huy Đức, Hồng Minh Quang
373
TMUẬT TỐN HIỆU QUẢ KHAI PHÁ TẬP MỤC LỢl ÍCH CAO TRÊN DỊNG DỮ LIỆU
35. Phạm Thượng Cát, Phạm Minh Tuấn, Nguyễn Văn Tính
MƠ HÌNH HỐ VÀ ĐIÊU KHIÊN TÔI ư u T ư THẾ VỆ TINH NHÒ DÙNG BA THANH TỪ
18
385
Lực
M ật sổ vắn đề chọn Ịọc của Công nghệ thông tin và truyền thông, Hưng Yên, ỉ 9-20 thảng 08 năm 2 0 ỉ 0
A METHOD FOR DATA MINING
IN INCOMPLETE INFORMATION SYSTEMS
Hoang Thi Lan Giao’, Nguyen Thi Lan Anh^
(1) Department o f IT, College o f Sciences, H ue University, Vietnam
(2) Department o f Informatics, College o f Pedagogy, H ue University, Vietnam
To deal with missing attribute values in incomplete information systems,
G.Busse used the characteristic relation instead o f the indiscernibility relation.
Based on this relation and the information theory, in this paper, we propose an
algorithm to fin d a reduct o f an incomplete decision table and the otherHLEM algorithm- to induce rules from it.
Keywords; missing attribute value, characteristic relation, rough entropy, reduct, rule
induction
1. Introduction
In a data set, there are usually some redundant attributes, which are not essential for
knowledge discovering. Hence, eliminating these attributes to simplify and hasten the data
mining process is an important request. In other words, following rough set approach, we
need to find a reduct of an information system or decision table.
However, in real life, data sets may have missing attribute values. Missing attribute
values are the attribute values of corresponding case which cannot be specified. So,
information systems (or decision tables) containing missing attribute values are incomplete
information systems (or decision tables, respectively). There are two types of missing
attribute values: lost values and do not care conditions [1,2,3,4]. Lost values are the
attribute values were originally known but currently they are not specified because of
many reasons. Do not care conditions are ineffective attribute values in the classification of
the case they belong to.
To solve the missing attribute value problem, G. Busse initiated the method:
extending the indiscernibility relation to characteristic relation. In this paper, we will use
this relation to construct one algorithm finding decision rules in incomplete decision table.
Besides, using concept o f entropy in information theory, we will also propose an heuristic
algorithm to compute a reduct of incomplete decision table before inducing rules. And we
will also assume that decision tables are consistent.
19
Một số vấn đề chọn ỉọc của Công nghệ thông tin và truvển thông, Hưng Yên, ỉ 9-20 thảng 08 năm 20 ỉ 0
2. Data preprocessing in Incom plete Decision Tables
2.1 Characteristic relations and set approximations
In the incomplete decision table DT = (U, CuD ), with an attribute ae c and ve Va
is an value of a for some cases, let t = (a, v) be an attribute-value pair and then block o f t,
denoted by [t], is a set o f all cases from Ư that for attribute a has value V o r *.
Incomplete decision tables are described by characteristic relations instead of
indiscemibility relations [3],[4],[5],[6], so equivalence classes are replaced by
characteristic sets. For DT = (U, C uD ), B c c , characteristic set K b( x) o f X is defined:
ỉ ^ b Í^)=
n [(« .« w ]
K b( x) is the smallest set o f cases which are indistinguishable from X using all
attributes in B.
And the characteristic relation R(B) is a binary relation on u defined as follows:
R(B)={(x,y)eU M yeK B(x)}
If DT is a complete decision table, R(B) is clearly indiscernibility relation IND(B),
so it is an extension of IND(B) in incomplete information system. R(B) is reflexive but- in
general- is not symmetric or transitive.
Let U/R(B) denote the family set {Kb(x), xeU}. Characteristic sets in U/R(B)
constitute a covering of u, i.e, for every xe u, we have that Kb(x)
and ỊJ/íg (x ) = Ơ .
x
X c u which consists of all cases from u which has the same values of decision
attributes is called a concept.
Unlike complete decision table, based on the characteristic relation, there are three
ways to approximate a concept X of an incomplete decision table DT = (U, CuD).
Let B e c and R(B) be the characteristic relation of DT with characteristic sets
K b( x ), w h e r e x e U ;
a. Singleton approximation: lower and upper approximations are sets of singletons
from Ư sastisfying some properties.
A singleton B-lower approximation of X is defined as:
M X)=
ui-»:}
xbU,K, { x) ^X
A singleton B-upper approximation of X is defined as:
5(X)=
UÍ-"}
x e U ,K g { x ) n X Jt0
b. Subset approximations', are unions o f characteristic sets o f any X from Ư:
A subset B-lower approximation of X is defined as follows:
20
M ột số vấn đề chọn lọc của Câng nghệ thông tin và truyền thông, Hung Yên, ¡9-20 tháng 08 nm 2 0 0
B{X)=
U^b(^)
xe U ,K s{x)ỗ:X
A subset B-upper approximation o f X is :
B(X)=
xeU,K¡(x)nX*0
u from the definitions
c. Concept approximations', are defined by replacing universe
of subset approximations by a concept X.
A concept B-lower approximation of X is:
B iX )^
U ^b(^)
XG
X ,K
b {x )
^X
A concept B-upper approximation of X is:
B{X)=
U^5(^)
xe X , K s { x ) n X i t 0
Because of the reflexibility of R(B), the singleton B-lower and singleton B-upper
approximations are respectively subsets of the subset B-lower and B-upper approximations
of any concept X. Besides, we can see that the concept B-lower approximation and the
subset B-lower approximation are the same; the concept B-upper approximation is subset
of subset B-upper approximation and it is the smallest set which includes X.
Among the three approximations, the concept B-lower approximations are the most
suitable for inducing rules [1,2].
In case of complete decision table, three approximations are the same. But this
property is not true for incomplete decision table.
2.2 Reducts
Definition 2.1
Let DT= (U,CuD) be an incomplete decision table, C€C. We will say c is
dispensable in DT if U/R(C\{c}) = U/R(C\{c}uD); otherwise c is indispensable in DT.
DT is called independent if each c e C is indispensable; otherwise DT is dependent.
The set of all indispensable attributes in DT is called Core , denoted by Core(C).
Definition 2.2
Let DT= (U, CuD ) be an incomplete decision table, P cC is a reduct o f c in DT if
DT’ = (U, PuD ) is independent and U/R(P) = U/R(PuD).
Obviously, there may be many reducts o f c and the intersection of all reducts of c
is Core(C). C€ c is indispensable if and only if it belongs to Core(C).
Example 2.1
Table 1 is an incomplete decision table DT= (U,CuD) with
u ={1, 2, 3, 4, 5, 6}, c
= {Temp, Headache, Nausea, Ache} and D = {Flu}:
21
Một sổ vấn đề chọn lọc của Công nghệ thẬng tin và truyền thông, Hưng Yên, ĩ 9-20 thảng 08 nãm 2 0 ỉ 0
Temp
*
'Headache
Nausea
Ache
Flu
No
No
Yes
No
Yes
Yes
No
Yes
3
Very-high
?
No
No
Yes
No
4
High
No
Yes
No
Yes
5
Normal
*
No
Yes
*
No
*
No
Ư
1
2
6
Ì.
Yes
Yes
Table 1- An example of incomplete decision table
U/R(P) = U/R(PuD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R(P\{Temp}) = {{1, 3},{2, 6},{1, 3},{4, 5},(4, 5},{2, 6}}
U/R(C\{Temp}uD) = {{1, 3},{2,
(*)
3},{4},{5},{2, 6}}
=> Temp is indispensable in DT’= (U,PuD).
U/R(P\{Headache}) ={{1, 3, 6},{2, 6},{1, 3, 6},{4, 6},(5, 6},{1, 2, 3, 4, 5, 6}}
U/R(C\{Headache}uD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2,4, 6}}
=> Headache is indispensable in DT’= (U,PuD).
U/R(P\{Ache}) = {{1, 3, 4, 5},{2, 6},{1, 3, 4, 5},{1, 4},{1, 5},{2, 6}}
U/R(C\{Ache}uD) ={{1, 3, 5},{2, 6},{1, 3, 5},{4},{5},{2, 6}}
=> Ache is indispensable in DT’= (U,PuD).
So, DT’ is independent (**)
From (*) and (**) we can conclude that P ={Temp, Headache, Ache} is a reduct of C.
2.3 Rough Entropy and significance of attributes
Definition 2.3 [6]
,
Let IS = (U,A) be an incomplete information system, B £ A. The rough entropy of
B is defined as follows;'
£ (S ) = - Z
/=)
u
Kaix,)
KM)
where card(U) = n,
set KB(xi) within U,
denotes
^;
1^1
represents the probability of characteristic
denotes the probability of one o f the values in characteristic
set KB(xi).
Some properties of the rough entropy: cardinality, monotocity, equivalence,
maximum, minimum [6] can be infered from the above definition.
22
M ột số vấn đ ề chọn lục cùa C ông n ghệ thông.Hn và truyền thông, H ưng Yên, I9-2Ỡ thảng 08 năm 2010
Theorem 2.1
Let DT = (U, CuD ) be an incomplete decision table. Then P c
c is a reduct of c in
DT iff p is the smallest set which satisfies E(P) = E(PuD).
Proof:
p is a reduct of c
o (U, PuD ) is independent and U/R(P) = U/R(PuD)
o Vc e p, U/R(P\{c}) ^ U/R(P\{c}uD) and U/R(P) = U/R(PwD)
p is minimum and E(P) = E(PuD) (equivalence property).
Using rough entropy of knowledge, we can define the significance of an attribute.
Definition 2.4
Let DT
= (U,
CuD ) be an incomplete decision table. The significance of c in
denoted sigC\{c)(c), as:
Then,
ceC
D)
' (4 )- £ (c \
is
indispensable
C o r e(C ) = { : e c |i 7 g c \ H ( c ) > o }
in
c
c,
iff:
sigC\{c}(c)
>0
and
,
Definition 2.5
Let DT = (U, CuD ) be an incomplete decision table, P cC , ceC\P. The significance
of c about p, denoted sigP(c), as:
sig,{c) = E [p u D )-E { P u {c}u D)
2.4 Algorithm based on rough entropy for computing reduct
Let DT = (U, C uD ) be an incomplete decision table. We will find a rcduct of c by
starting out with Core(C) (because it is the intersection of
allreductsof C),choosing the
attribute in C\Core(C) to add to this Core until we have E(Corc(C)) = E(Core(C) uD ).
Then, eliminating all the dispensable attributes in this Core, we will have one reduct of c.
Algorithm:
Input: An incomplete decision table DT = (Ư, CuD );
Output: A reduct p of c.
1. Begin
2.
Compute Core(C) = {ce cl sigc\{cj(c) > 0};
3.
P:= Core(C);
4.
Compute E(P) and E(PuD);
5.
IfE(P) = E(PuD) then exit;
6.
While E(P) ị E(PuD) do
23
M ột số vấn đề chọn lọc của Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 20IỦ
7.
Begin
8.
Select first c e c \p such that sigp(c) = max{sigp(a’), a’e C\P};
9.
P := P u {c};
End {while}
10.
11.
P:= P\core(C);
12.
N:= i p | ;
For i =1 to N do
13.
If E(P\{ci} u core(C)) = E(P\{cị} u core(C)u D ) then P:=P\{c,};
14.
15.
P;= Pucore(C);
16. End.
The time complexity of this algorithm is O(m^n^), where m is the cardinality of
c
and n is the cardinality of Ư.
Example 2.2
Let consider the incomplete decision table which is shown in Table 1. We will find
one reduct o f c by using the above algorithm.
Let denote: Temp = ai; Headache = aa; Nausea = as; Ache = a4;
• [(Temp,Very-high)] = {1,2, 6}
[(Nausea,Yes)] = {2,4, 5, 6}
[(Temp, High)] = {1.4, 6}
[(Nausea,No)] = {1, 3, 6}
[(Temp, Normal = {1, 5, 6}
[(Ache,Yes)] = {1, 3, 6}
[(Headache,Yes)] = {2, 6}
[(Ache,No)] = {2, 4, 5, 6}
[(Headache,No)] = {1,3, 4, 5}
. U/R(C) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R(CuD) = {{1, 3},{2,
3},{4},{5},{2, 6}}
U/R({a2,a3 ,a4 }) = {{1, 3},{2, 6},{1, 3},{4, 5),{4, 5},{2, 6}}
U/R({a2 ,a3 ,a4 }uD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R({a,,33 ,04 })= {{1, 3, 6},{2, 6},{1, 3, 6},{4, 6},{5, 6},{1, 2, 3, 4, 5, 6}}
U/R({a.,a 3,a4}uD) = {{1, 3},{2, 6},{1, 3},{4, 6},{5},{2,4, 6}}
U/R({a,,a2,a4 }) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R({a2,a3 ,a4}uD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R({a,,a2,a3 }) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R({a2 ,a3,a3 }uD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
• Finding reduct of C:
2
- ^ỉểc\{a,}(«i)=3 > 0
24
M ột sổ vấn đề chọn lọc của Công nghệ thông tin và truyền thông, Hưng Yên. ỉ 9-20 tháng 08 nm 2 0 0
-
ãyớc\{<,,}(ô3) = 0
-
y'c\{a,}(ô4) = 0
=> Core(C) = P = {ai,a2 }
- U /R (P)= {{1,3,4,5},{2,6},{1,3,4,5},{1,4},{!,5},{2,6}}
=> E(P) = 4
-
U /R (P uD )= {{1,3,5},{2,6},{1,3,5},{4},{!,5},{2,6}}
=> E(PuD ) = 1 + log3
-
E(P).
sigp(a3) = E(PuD)- E(Pu{a3}uD) = E(PuD)- E(ai,a2,,a3}uD)
^ 6 1 o g 3 -2
6
-
sigp(a4) = E(PuD )- E(Pu {34 }uD ) = E(PuD)- E(ai ,a2,,a4 }uD)
_ 6Iog3-2
6
=> Select as; P:= {ai,32 ,3 3 }.
=i> E(P) = ^ = E(PuD )
P = {ai, 32, 3 3 } is
3
reduct of C in DT.
The decision t3ble sfter reducing - DT’ = (U, PuD ) - is shown by Tsb. 2
Ỉ/ t
Ư Temp
He3dache Nausea
Flu '
♦
1
No
No
No
2
Yes
Yes
Yes
3
Very-high
?
No
No
No
4
High
No
Yes
Yes
5
Normal
*
No
Yes
*
No
6
Yes
Yes
Table 2- The incomplete decision system after reducing of Table 1
3. Rule induction in incom plete decision tables
HLEM, proposed by us, is the extension of LEM2 o f G.Busse. In general, LEM2
computes 3 local covering and then converts it into a decision rule set [2,3], In HLEM
algorithm, we will find a minimal complex T for a whole characteristic set of x\ by
selecting t from the set o f condition attribute-v3lue pairs (a, a(xi)), where a(xi)
and a(xi)
7^?, corresponding with Xj instead of selecting t such that [t] consists o f as many cases as
possible. However, we won’t expand T like NewLEM2 [5], we will eliminate the
25
M ột số vẩn đề chọn lọc cùa Cõng nghệ thông tin và truvền thông, Hưng Yên, 19-20 tháng 08 năm 2010
redundant attribute-value pairs in the former T to get a suitable minimum complex. The
some below concepts are defined to describe the HLEM algorithm.
Let DT= (U, CuD ) be an incomplete decision table, V be a nonempty lower or
upper approximation of a concept whose decision value is w.
Let T be a set of attribute-value pairs, T = {t = (a, v)}, denote [T’]= p |[/].
leT
Then, V depends on T iff 0
[r] c F .
T is a minimal complex of V if V depends on T and there is not proper subset T ’ of
T such that V depends on T’.
A minimal complex T of V is a predecessor of a decision rule matching with some
cases in [T],
Let T be a nonempty family of nonempty sets of attribute-value pairs. T is a local
covering of V iff T satisfies the below conditions:
Each member T of T is a minimal complex of V.
^Tet[T] = V and X is minimal,i.e the cardinality o f t is as small as possible.
Hence, T is the smallest set of minimal complexes totally covering the
approximation V of someconcept X; in other words, T is a set of predecessors (conditions)
of the decision rule set covering V.
The HLEM algorithm which is presented below can be used to find T.
Algorithm HLEM
Procedure HLEM
(Input: a set V;
Output: a local covering t of V)
1. Begin
2.
G:=V;
3.
x:=0;
4.
5.
While G 0 do
Begin
6.
Select xe G such that Kc(x) c V and |ATc (^)| is maximum;
7.
T V (x)= {(a,a(x))|ae C A a (x )? t* A a (x )? i? } ;
8.
T:=TV(x);
9.
Repeat
10.
Select t = (a,a(x)) from TV(x) such that [a ,a (x )]n [r ] is
minimum;
26