Tải bản đầy đủ (.pdf) (179 trang)

Kỷ yếu hội thảo quốc gia Hưng Yên: Một số vấn đề chọn lọc của công nghệ thông tin và truyền thông

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.92 MB, 179 trang )

KỶ YÉU HỘI THẢO QUÓC GIA
HƯNG YÊN, 19-20 THÁNG 8 NĂM 2010

MỘT SỐ VẤN ĐỀ CHỌN LỌC CỦA
CÔNG NGHỆ THÔNG TIN VÀ
TRUYÈN t h ô n g

NHÀ XUẤT BẢN KHOA HỌC KỸ THUẬT
HÀ NỘI-2011


H Ộ I THẢO QUỐC GIA LẦN T H Ứ XIII
M Ộ T SỐ VẤN ĐÈ CHỌN LỌC CỦA
CÔ N G NGHỆ THÔNG TIN VÀ TRUYÈN THÔNG
C hủ đề: Các cơng n g h ệ tỉnh tốn hiện đại
H ư n g Yen, 19-20/08/2010

THÔNG BÁO
Hội thảo Quốc gia lần thứ XIII "Một số vấn đề chọn lọc của Công nghệ thông tin
và Truyền thông" do Viện Công nghệ thông tin - Viện Khoa học và Công nghệ Việt Nam
và Đại học Sư phạm Kỹ thuật Hưng Yên tổ chức tại Khoái Châu, Hưng Yên từ ngày 19
đến ngày 20 tháng 8 năm 2010. Hội thảo là diễn đàn để các nhà khoa học và quản lý trong
cả nước chia sẻ kinh nghiệm nghiên cứu, triển khai trong lĩnh vực Công nghệ thông tin và
truyền thông. Đặc biệt Hội thảo cũng là môi trường để những người làm công tác nghiên
cứu khoa học trẻ; những nghiên cứu sinh, học viên cao học có điều kiện để trao đổi, tìm
kiếm sự tài trợ hợp tác.
Các chủ đề chính (khơng hạn chế) của Hội thảo
• Tin học quản lý
• Mã nguồn mở

Các hệ thống tích hợp



• Cơng nghệ đa phương tiện, mơ phỏng

Thực tại ảo

• Giáo dục điện tử, đào tạo từ xa

Cơng nghệ phần mềm

• Cơng nghệ điện tử và viễn thơng
• Xử lý ngơn ngữ
• Cơng nghệ tri thức và tính tốn mềm
• Các hệ thống nhúng


Cơng nghệ mạng và mạng khơng dây

Các cơ quan đồng tổ chức


Đại học Sư phạm Kỹ thuật Hưng Yên



Viện CNTT - Viện KH&CN Việt Nam

Các hệ thống tính tốn di động

Xử lý ảnh và kỹ thuật Video
CNTT trong Kinh tế- Kỹ thuật

< Cơ sở toán học của tin học


Liên hệ đăng ký tham dự


Đỗ Năng Tồn. Viện CNTT - Viện KH&CN Việt Nam
Email.
ĐT\ (043) 7567935, 0913-583240, Fox: (043) 756 4217



Phạm Minh Chuẩn, ĐHSP Kỹ thuật Hưng Yên
Email:
ĐT: (03213) 775075,0983-081120, Fax: (0321) 3713 015

Thòi hạn đăng ký báo cáo


Tồn văn báo cảo:

30/06/20ỉ 0



Chấp nhận báo cáo: 15/07/2010

Đăng ký đại biểu



Hội nghị phỉ: 100. OOOđồng (miễn phỉ đối với sinh viên tham gia báo cáo)



Ban Tổ chức sẽ giúp liên hệ chỗ ăn, ở cho các đại

biểu về dự Hội thảo

Quy cách chuẩn bị báo cáo xem chi tiết lại Website:


BAN THƯ KÝ HỘI THẢO
Truởng ban
Đỗ Năng Tồn
Các ủy viên
Phạm Minh Chuẩn
Trần Quang Diệu
Phạm Ngọc Hưng

Viện Cơng nghệ thông tin
Đại học Sư phạm Kỹ thuật Hưng Yên
Viện Công nghệ thông tin
Đại học Sư phạm Kỹ thuật Hưng Yên
BAN TỔ CHỨC

Trưởng ban
Trần Trung

Đại học Sư phạm Kỹ thuật Hưng Yên


Phó trưởng ban
Trưcmg Ngọc Tuấn

Đại học Sư phạm Kỹ thuật Hưng n

Các ủy viên
Ngơ Thanh Bình

Đại học Sư phạm Kỹ thuật Hưng Yên


Nguyễn Văn Bình
Phạm Việt Bình
Ngơ Kim Dung
Nguyễn Việt Hà
Nguyễn Đình Hân
Nguyễn Hồng Hịa
Nguyễn Quang Hưng
Ngơ Hùng Mạnh
Nguyễn Hữu Quỳnh
Nguyễn Minh Quý
Nguyễn Văn Tám
Huỳnh Quyết Thẳng
Nguyễn Thị Lê Thu

VNPT Hưng Yên
Khoa CNTT - ĐH Thái Nguyên
Đại học Công nghiệp Hà Nội
Đại học Công nghệ- Đại học QGHN
Đại học Sư phạm Kỹ thuật Hưng Yên

Sở TT &Truyền thông Hưng Yên
Bộ Thông tin & Truyền thông
Sờ Khoa học- Công nghệ Hưng Yên
Đại học Điện lực
Đại học Sư phạm Kỹ thuật Hưng Yên
Sở GD&ĐT Hưng Yên
Đại học Bách khoa Hà Nội
Viện Công nghệ thông tin

BAN CHƯƠNG TRÌNH
Trưởng ban
Vũ Đức Thi

Viện Cơng nghệ thơng tin

Pìiỏ trưởng ban
Đặng Quang Á
Ngô Văn Quyết
Ngô Quốc Tạo

Viện Công nghệ thông tin
Đại học Sư phạm Kỹ thuật Hưng Yên
Viện Công nghệ thơng tin

Các ủy viên
Đồn Văn Ban
Lê Hồi Bắc
Nguyễn Ngọc Bình
Bùi Thế Duy
Phan Thị Hà Dương

Hồ Sỹ Đàm
Đặng Hữu Đạo
Lê Quốc Định
Dương Anh Đức
Đặng Văn Đức
Trần Hành
Nguyễn Thúc Hải
Nguyễn Mậu Hân

Viện Cơng nghệ thơng tin
Đại học KHTN Tp. Hồ Chí Minh
Đại học Cơng nghệ -ĐHQGHN
Đại học Cơng nghệ -ĐHQGHN
Viện Tốn học
Đại học Công nghệ -ĐHQGHN
Viện Công nghệ ứiông tin
Đại học Hàng hải
Đại học Khoa học tự nhiên
Viện Công nghệ ứiông tin
Đại học Lạc Hồng
Đại học Bách khoa Hà Nội
Đại học Huế


Vũ Đình Hịa
Nguyễn Đình Hóa
Nguyễn Xn Huy
Phan Huy Khánh
Hồng Kiếm
Lương Chi Mai

Nguyễn Văn Mạnh
Trần Đức Minh
Trần Văn Lăng
Phạm Thế Long
Nguyễn Huy Lợi
Vũ Duy Lợi
Phùng Văn ồ n
Nguyễn Hoàng Phương
Từ Minh Phương
Nguyễn Hồng Quang
Lê Văn Sơn
Hồng Chí Thành
Trần Thiên Thành
Lê Mạnh Thạnh
Lê Quyết Thắng
Nguyễn Đình Thuân
Nguyễn Thanh Thủy
Hà Quang Thuỵ
Trịnh Nhật Tiến
Nguyễn Thanh Tùng
Phan Thị Tươi
Hồ Tường Vinh

Đại học Sư phạm 1 Hà Nội
Viện CNTT - ĐHQG Hà Nội
Viện Công nghệithông tin
Đại học Bách khoa Đà Nang
Đại học CNTT Tp. Hồ Chí Minh
Viện Cơng nghệ thơng tin
Đại học Bách khoa Hà Nội

Đại học Đà Lạt
Đại học Lạc Hồng
Học viện Kỹ thuật quân sự
Đại học Sư phạm Hà Nội 2
Trung tâm Tin học - VPTW
Văn phịng Chính phủ
TT Tin học Bộ Y tế
Học viện Công nghệ BCVT
Viện Tin học Pháp ngữ - IFI
Đại học Sư phạm Đà Nang
ĐH Khoa học Tự nhiên - ĐHQG Hà Nội
Đại học Quy Nhem
Đại học Khoa học Huế
Đại học Cần Thơ
Đại học Nha Trang
Đại học Bách khoa Hà Nội
Đại học Công nghệ - ĐHQG Hà Nội
Đại học Công nghệ -ĐHQGHN
Viện Công nghệ thông tin
Đại học Bách khoa-Tp. Hồ Chí Minh
Viện Tin học Pháp ngữ - IFI


C Á C Đ Ơ N VỊ TÀ I TR Ọ H Ộ I TH Ả O C N TT 2010
V iện K h o a học và C ông nghệ V iệt N am
V iện C ô n g nghệ T hông tin- V iện K hoa học và C ông nghệ V iệt N am
T rườ ng Đ ại học Sư phạm K ỹ thuật H ưng Y ên
K hoa C ô n g nghệ thông tin - T rường Đại học C ông nghệ - Đại học Quốc
G ia H à NỘI
T rườ ng Đ ại học B ách K hoa H à Nội

T rườ ng Đ ại học cần T hơ
T rườ ng Đ ại học K hoa học H uế
T rườ ng Đ ại học L ạc H ồng
T rườ ng Đ ại học N ha T rang
T rư ờ ng Đ ại học Sư phạm Kỹ thuật N am Đ ịnh
Trưòrng C ao đẳng Sư P hạm Trung ư ơ n g
K hoa C ô n g nghệ th ô n g tin- T rường Đại học C ông N ghiệp Hà N ội
K hoa C ô n g nghệ th ô n g tin- T rường Đại học Đ iện Lực
K hoa C ô n g nghệ th ô n g tin- T rường Đại học Thái N guyên
K lioa C ô n g nghệ th ô n g tin- Trường Đại học K hoa học tự nhiên Tp Hồ
Chí M inh
K lìoa C ô n g nghệ th ô n g tin- T rường Đại học Sư phạm H à N ội 2
K hoa C ô n g n g h ệ th ô n g tin- Trường Đại học T hủ D ầu M ột
K hoa C ô n g nghệ th ô n g tin- T rường Đại học Sư phạm K ỹ T huật Vinh
K hoa C ô n g n g h ệ thông tin - H ọc V iện K ỹ thuật Q uân sự
K hoa C ô n g n g h ệ th ô n g tin- H ọc viện C ông nghệ B ư u chính V iễn thơng
T rung tâm T in học- B ư u điện Hải Phịng
T rung tâm C ơng n g h ệ th ôn g tin - V ăn phòng T W Đ ảng
T ập đ o àn V iễn th ô n g quân đội V iettel - C hi nhánh H ưng Y ên
C ông ty V iễn th ô n g H ư ng Y ên và V inaphone H ư ng Y ên
C ông ty Cổ p h ần truyền thơng truyền hình quốc g ia H à N ội (H T M )
C ông ty C ổ phần điện tử tin học FSC Hà N ội
C ông ty Cổ phần tư vấn xây dựng và thư ơ ng m ại Thái D ương
C ông ty C ổ p h ần và thư ơ ng m ại N B T H ưng Y ên



Một số vẩn đề chọn lọc cùa Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 nâm 2 0 Ĩ0

LỜI NÓI ĐẦU

Hội thảo Quốc gia "Một sổ vấn đề chọn lọc của Công nghệ thông tin ” được khởi
xướng theo sáng kiến của Viện Công nghệ Thông tin thuộc Viện Khoa học và Công nghệ
Việt nam, đến nay đã qua hơn 10 lần tổ chức
Hội thảo Quốc gia "Một sổ vấn đề chọn ỉọc pủa Công nghệ thông tin ” lần thứ I được
tổ chức từ ngày 5 đến 7 tháng 8 năm 1997 tại Đại học Sư phạm Hà Nội II, Đại Lải, Vĩnh
Phúc. Hội thảo được tổ chức dưới sự phối hợp của: Viện Công nghệ thông tin, Đại học
Quốc gia Hà Nội, Đại học Sư phạm Hà Nội II.
Kể từ đó đến nay, hàng năm cứ mỗi độ thu sang Viện Công nghệ thông tin- Viện Khoa
học và Công nghệ Việt Nam lại phối hợp với một trong các trường Đại học trong nước để
tổ chức Hội thảo Quốc gia "Một số vẩn đề chọn lọc của Công nghệ thông tin
Với các chủ để khác nhau, hội thảo Quốc Gìa."Một số vấn đề chọn lọc của Công nghệ
thông tin ” đã thực sự trở thành diễn đàn nhằm trao đổi các kết quả nghiên cứu và triển khai
ứng dụng công nghệ thông tin của các nhà khoa học, đặc biệt là các nhà khoa học trẻ trên
mọi miền đất nước.
Hội thảo lần thứ XIII với chủ đề “Cóc cơng nghệ tính tốn hiện đạĩ' được Viện Công
nghệ thông tin phối họp với Đại học Sư phạm Kỹ thuật Hưng Yên tổ chức tại Hưng Yên từ
ngày 19-20 tháng 8 năm 2010
Hcm 500 đại biểu và khách mòd từ mọi miền của đất nước đã tham dự Hội thảo lần thứ
mười ba này. Các đại biểu đã nghe và thảo luận gần 150 báo cáo khoa học theo các nội dung:
Các hệ tíiống thơng minh

Cơ sở toán học của tin học

Mã nguồn mở

Tin học quản lý

Giáo dục điện tử, đào tạo từ xa

Công nghệ đa phương tiện, mô phỏng


Xử lý ngôn ngữ

Công nghệ điện tử và viễn thông

Các hệ thống nhúng

Công nghệ tri thức và tính tốn mềm

Các hệ thống tích hợp

Cơng nghệ mạng và mạng không dây

Thực tại ảo

Công nghệ phần mềm

Xừ lý ảnh và kỹ thuật Video


Một sổ vấn đề chọn ¡ọc cùa Công nghệ thông lin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 2010

Với sự tham gia đông đảo của các nhà khoa học trong và ngoài nước cùng với số
lượng lớn báo cáo khoa học gửi tới Hội thảo đã khẳng định ý nghĩa thiết thực và tầm vóc
quốc gia của Hội thảo "Một sổ vấn đề chọn lọc của Công nghệ thơng tin
Các đại biểu đánh giá cao sự nhiệt tình của các đơn vị tham gia tổ chức Hội thảo, đặc
biệt là cơ sở đăng cai; Đại học Sư Phạm Kỹ thuật Hưng Yên và đơn vị chủ quản và điều
hành chương trình - Viện Cơng nghệ thơng tin.
Trong phiên bế mạc Hội thảo lần thứ XIII, Ban Tổ Chức đã trao cờ cho Đại học cần
Thơ, là đơn vị đăng cai tổ chức Hội thào lần thứ XIV tại Thành phố cần Thơ.

Các cơng trình được in trong tập kỷ yếu này đã được báo cáo, thảo luận tại Hội thảo và
sau đó đã được phản biện nghiêm túc.
Ban tổ chức Hội thảo xin chân thành cảm on các đcm vi sau đây đã tài trợ kinh phí cho
hoạt động của Hội thảo:
Trường Đại học Sư phạm Kỹ thuật Hưng Yên
Viện Công nghệ Thông tin- Viện Khoa học và Công nghệ Việt Nam
Khoa Công nghệ thông tin - Trường Đại học Công nghệ - Đại học Quốc Gia
Hà Nội
Trường Đại học Bách Khoa Hà Nội
Trường Đại học cần Thơ
Trưòmg Đại học Khoa học Huế
Trường Đại học Lạc Hồng
Trưòng Đại học Nha Trang
Trường Đại học Sư phạm Kỹ thuật Nam Định
Trường Cao đẳng Sư Phạm Trung ư ơng
Khoa Công nghệ thông tin- Trường Đại học Công Nghiệp Hà Nội
Khoa Công nghệ thông tin- Trường Đại học Điện Lực
Khoa Công nghệ thơng tin- Trưịng Đại học Thái Ngun
Khoa Cơng nghệ thơng tin- Trường Đại học Khoa học tự nhiên Tp Hồ chí Minh
Khoa Cơng nghệ thơng tin- TrưỊTig Đại học Sư phạm Hà Nội 2
Klioa Công nghệ thông tin- Trường Đại học Thủ Dầu Một
Khoa Công nghệ thông tin- Trường Đại học Sư phạm Kỹ Thuật Vinh
Khoa Công nghệ thông tin - Học Viện Kỹ thuật Quân sự
Khoa Công nghệ thông tin- Học viện Cơng nghệ Bưu chính Viễn thơng
Trung tâm Tin học- Bưu điện Hải Phịng
Trung tâm Cơng nghệ thơng tin - Văn phòng TW Đảng
10


Một sổ vấn đề chọn lọc của Công nghệ thông lin và truyền thông, Hưng Yên, ¡9-20 tháng 08 năm 2010





Tập đồn Viễn thơng qn đội Viettel - Chi nhánh Hưng Yên
Công ty Viễn thông Hưng Yên và Vinaphone Hưng n



Cơng ty Cổ phần truyền thơng truyền hình quốc gia Hà Nội (HTM)



Cơng ty Cổ phần điện tử tin học FSC Hà Nội





Cơng ty Cổ phần tư vấn xây dựng và thưcmg mại Thái Dương
Công ty Cổ phần và thương mại NBT Hưng Yên
Và nhiều cá nhân khác

Ban ChưoTig trìnli xin chân thành cảm ơn các phản biện đã đóng góp nhiều ý kiến quý
báu góp phần nâng cao chất lượng tập kỷ yếu của Hội thảo.
Xin trân trọng giới thiệu với đông đảo bạn đọc và mong tiếp tục nhận được những ý
kiến đóng góp về hình thức hoạt động của Hội thảo cũng như về nội dung khoa học của các
báo cáo.
Hà Nội, ngày


19

tháng 06

năm 2011

Ban Biên tập

II


D A N H S Á C H C Á C P H Ả N B IỆ N

1

Đoàn Văn Ban

Học hàm , học
vi
PGS.TS.

2

Phạm Thượng Cát

PGS.TSKH.

Viện Công nghệ thông tin

3


Đặng Hữu Đạo

PGS.TS

Viện Công nghệ thông tin

4

Nguyễn Công Điều

PGS.TS.

Viện Công nghệ thông tin

5

Đặng Văn Đức

PGS.TS.

Viện Công nghệ thông tin

6

Nguyễn Huy Đức

TS.

Trường Cao đăng SP Mâu

giáo Trung ương

7

Lê Bá Dũng

PGS.TS.

Viện Công nghệ thông tin

8

Nguyễn Đức Dũng

TS.

Viện Công nghệ thông tin

9

Bùi Thế Duy

PGS.TS.

10

Nguyễn Việt Hà

PGS.TS.


11

Nguyễn Cát Hồ

PGS.TSKH.

Đại học Công nghệ- Đại
học Quốc gia Hà Nội
Đại học Công nghệ- Đại
học Quốc gia Hà Nội
Viện Công nghệ thông tin

PGS.TS.

Viện Công nghệ thông tin

13

1 Bùi Thế Hồng
Nguyễn Xuân Huy

PGS.TSKH.

Viện Công nghệ thông tin

14

Phan Trung Huy

PGS.TS.


Đại học Bách Khoa

15

Trần Đình Khang

PGS.TS.

Đại học Bách khoa

16

Lương Chi Mai

PGS.TS.

Viện Cơng nghệ thông tin

17

Lê Văn Phùng

TS.

Viện Công nghệ thông tin

18

Từ Minh Phương


PGS.TS.

Học viện Cơng nghệ Bưu
chính Viễn thơng

19

Trần Hồng Qn

PGS.TS.

Viện KHKT Bưu điện

20

Lê Xuân Quảng

TS.

Viện Công nghệ thông tin

21

Trần Thái Sơn

TS.

Viện Công nghệ thông tin


22

Nguyễn Văn Tam

PGS.TS.

Viện Công nghệ thông tin

23

Ngô Quốc Tạo

PGS.TS.

Viện Công nghệ thông tin

24

Nguyễn Trường Thắng

TS.

Viện Công nghệ thông tin

STT

12

12


Họ và tên ngưịi phản biện

Cơ quan
Viện Cơng nghệ thơng tin


25

Hồng Chí Thành

PGS.TS.

26

Vũ Đức Thi

GS.TS.

Đại học Cơng nghệ- Đại
học Quốc gia Hà Nội
Viện Công nghệ thông tin

27

Nguyễn Thanh Thủy

GS.TS.

Đại học Bách Khoa


28

Hà Quang Thụy

PGS.TS.

29

Trịnh Nhật Tiến

PGS.TS.

30

Đỗ Năng Tồn

PGS.TS.

Đại học Cơng nghệ- Đại
học Quốc gia Hà Nội
Đại học Công nghệ- Đại
học Quốc gia Hà Nội
Viện Công nghệ thông tin

31

Nguyễn Minh Tuấn

TS.


Viện Cơng nghệ thơng tin

32

Nguyễn Thanh Tùng

PGS.TS.

Viện Cơng nghệ thơng tin

33

Hồng Đỗ Thanh Tùng

TS.

Viện Công nghệ thông tin

13



M ột số vẩn đề chọw ỉọc cùa Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 20ỈỒ

MỤC LỤC
Lịi nói đầu

9

Mục lục


15

1. Hoang Thi Lan Giao, Nguyen Thi Lan Anh

19

A COMPARATIVE ANALYSIS OF TECHNIQUES FOR PREDICTING ACADEMIC PERFORMANCE

2. Lê Huy Thập

29

ĐẢNG CÂU VÂN TIN TRÊN CÁC QUAN HỆ VÀ x ừ LÝ CÂU VÂN TIN TRÊN BẢNG

3. Bùi Thế Hồng, Lưu Thị Bích Hương
BẢO VỆ BẢN QUYỀN CÔNG KHAI CHO CÁC

41

cơ sở

DỬ LIỆU QUAN HỆ

4. Bùi Đức Minh, Lưong Nguyễn Hoàng Hoa, Cao Tùng Anh, Nguyễn Gia

51

Như, Nguyễn Xuân Huy
BIẺU DIÊN C ơ SỜ CÙA HỆ SINH ÁNH XẠ ĐÓNG


5. Vũ Duy Linh, Lê Quyết Thắng, Huỳnh Xuân Hiệp

59

D ự BẢO NẺ RÂY THEO THỜI GIAN

6. Nguyễn Hữu Mùi, Vũ Đình Hịa

71

GIẢI BÀI TỐN LẬP LỊCH JOB SHOP BẰNG THUẬT TOÁN DI TRUYỀN

7. Lưong Xuân Bách, Nguyễn Nhật Quang

83

HỆ THỐNG GỢI Ý TIN TỨC NEWSARD

8. Võ Hồng Bảo Châu, Trương Thị Quỳnh Hưong, Trương Thị Đức,

97

Nguyễn Thụy Mai Trâm, Tạ Thúc Nhu
LẬP CHÌ MỤC THEO NHĨM ĐÊ NÂNG CAO HIỆU

QUẢ KHAI THÁC cơ sờ

D Ữ LIỆU VIRUS CÚM


9. Đặng Thành Chương, Vũ Duy Lợi, Võ Viết Minh Nhật
MƠ HÌNH PHÂN TÍCH ĐỊNH TUYẾN LỆCH HƯỚNG KÉT HỢP VỚI CHUN ĐƠI

107
Bước

SĨNG

NHẰM GIẢI QUT TÁC NGHẼN TRÊN MẠNG CHUYẺN MẠCH CHÙM QUANG OBS

15


Một s ố vấn đề chọn lọc cùa Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 2010

10. Bùi Quốc Trung, HỒ Tường Vinh

119

MƠ PHĨNG MỘT SĨ TINII HUỐNG GIAO THƠNG ĐƠ THỊ D ự A TRÊN MƠ HÌNH ĐA TÁC TỪ

11. Trưong Cơng Tuấn, Trần Thái Sơn

133

MÔI QUAN HỆ GIỮA N G Ừ NGHĨA CÚA CHƯƠNG TRÌNH LOGIC DIỄN GIẢI VÀ CHƯƠNG TRÌNH
LOGIC DẠNG TUYÊN

12. Nguyễn Văn Huân, Phạm Việt Bình, Vũ Xuân Nam


141

MỘT CÁCH TIÉP CẬN TRONG HỎ TRỢ THU THẬP DỪ LIỆU T ự ĐỘNG

13. Nguyễn Thị Hồng Minh, Lê Hoàng Sơn, Phạm Huy Thơng,

151

Nguyễn Duy Linh
MỘT GIẢI PHÁP CẢI TIÉN THUẬT TỐN BEEMAN TRONG MƠ PHĨNG ĐỘNG L ự c PHÂN TỬ

14. Nguyễn Thanh Tùng, Trần Huy Dương

163

MỘT PHƯƠNG PHÁP MÓI TIÈN x ử LÝ GIÁ TRỊ THIẾU

15. Nguyễn Thị Thu Hà, Nguyễn Thiện Luận, Vũ Văn Định

173

MỘT PHƯƠNG PHÁP TRÍCH RÚT CÂU TRONG VĂN BÀN TIẺNG VIỆT s ử DỤNG LUẬT KẾT HỢP

16. Trần Ngọc Hà, Hoàng Xuân Huấn, Nguyễn PhưoTig Chi

181

MỘT PHƯƠNG PHÁP x ừ LÝ KÉT QUẢ TÌM KIÊM TRÊN WEB

17. Đỗ Văn Tuấn, Trần Đăng Hiên, Nguyễn Thanh Bình, Phạm Văn Át


193

MỘT SỔ CÀI TIÊN NÂNG CAO Tốc Đ ộ x ừ LÝ CÚA PHƯƠNG PHÁP MÃ HÓA s ố HỌC

18. Nguyễn Mạnh Hùng, Phạm Thị Bích Vân, Đỗ Thị Mai Hường

205

MỘT SỐ CÀI TIÉN THUẬT TOÁN PHÂN CỤM SONG SONG D Ữ LIỆU LỚN, NHIÊU CHIÊU
DỰA TRÊN LƯỚI THÍCH NGHI PMAFIA

19. Hà Mạnh Đào, Thái Quang Vinh, Hoàng Văn Tuấn
MƯỢN KÊNH ĐỘNG TRÊN c ơ s ờ B ộ ĐIÊU KHIÊN MÒ SỪ DỤNG SUBSETHOOD

16

215


Một số vấn để chọn lọc cùa Công nghệ thông tin và truyền thông, Hung Yên, 19-20 tháng 08 năm 20Ỉ0

20. Lê Tiến Lộc, Lâm Thành Hiển, Trần Hành

229

NGHIÊN c ú u BA CHÉ Đ ộ ĐIÊU KHIÊN ON/OFF, PID, FUZZY VÀ ỨNG DỤNG TRONG ĐIÈU
KHIÊN MƠ HÌNH LỊ NHIỆT

21. Lê Văn Sơn, Trần Nguyễn Hồng Phúc


239

NGHIÊN CỬU MƠ HÌNH GIÁM SÁT TRựC TUYÉN HỆ THỐNG MẠNG PHÂN TÁN QUY MÔ LỚN

22. Hà Đại Dương, Đào Thanh Tĩnh

251

PHÁT HIỆN CHÁY S ừ DỤNG CAMERA THÔNG THƯỜNG TRONG ĐIÊU KIỆN ÁNH SÁNG
MÔI TRƯỜNG YÉU

23. Cù Thu Thủy, Hà Quang Thụy

263

PHÁT HIỆN LUẬT KẾT HỢP SPORADIC TUYỆT ĐỐI HAI NGƯỠNG MỜ

24. Trịnh Đình Thắng, Trần Minh Tuyến

276

PHÉP DỊCH CHUYÊN L ư ợ c Đ ồ KHỐI VÀ VẤN ĐÊ BIÊU DIỄN BAO ĐĨNG, KIIỐ TRONG
MƠ HÌNH D ử LIỆU DẠNG KHỐI

25. Nguyen Buong, Nguyen Dinh Dung

287

REGULARIZATION FOR A COMMON SOLUTION OF A SYSTEM OF NONLINEAR ILL-POSED

EQUATIONS WITH PERTURBATIVE DATA

26. Văn Đình Vỹ Phưong, Phan Mạnh Thưòng, Trần Văn Lăng

295

SO SÁNH CẨU TRÚC PROTEIN SỪ DỤNG MƠ HÌNH TỐNG QT

27. Phạm Văn Trung, Võ Thanh TÚ

301

SO SÁNH VÀ ĐÁNH GIÁ MỘT s ố GIAO THỨC ĐỊNH TUYÉN ĐIỀU KHIÊN THEO YÊU CẢU TRÊN
MẠNG MANET

28. Đặng Quang Á, Vũ Vinh Quang, Trương Hà Hải

311

TIÊP CẬN CHIA MIỀN TỚI CÁC BÀI TOÁN VỀ MẶT PHÂN CÁCH

29. Nguyễn Đình Hân, Đặng Quyết Thắng, Hồ Ngọc Vinh

33ẵf

rÍNH TỐN Đ ộ TRẺ GlÀl MÃ CỦA NGƠN NGỮ BÂNG OTOMAT

17



Một số vấn đề chọn lọc của Công nghệ thông tin và truvền thông, Hưng Yên, 19-20 tháng 08 năm 2010

30. Nguyễn Thị Hương Thủy, Nguyễn Văn Toàn, Nguyễn Ngọc Kỷ,

333

Nguyễn Thị Hoàng Lan
XÂY DỤNG GIẢI PHÁP BẢO MẬT BIOPKI VÀ ÚÌMG DỤNG ĐẺ BẢO MẬT HỆ NHẬN
DẠNG VÂN TAY

31. Tạ Nguyễn, Vũ Đình Trung, Trần Ngọc Phúc, Đỗ Quốc Bảo, Tạ Thúc Nhu,

34'

Trần Hành
XÂY DỰNG HỆ THỐNG QUẢN LÝ CÁC QUY TRÌNH MƠ PHỎNG NGHIỆP v ụ TRONG
DOANH NGHIỆP

32. Vũ Trí Dũng, Nguyễn Xuân Huy

353

VÈ PHÉP BIÉN ĐỔI HỆ SINH ÁNH XẠ ĐĨNG

33. Nguyễn Mậu Un, Ngơ Thành Long, Bùi Đình Hà

361

VÊ PHƯƠNG PHÁP PHÂN NGƯỠNG ẢNH THÍCH NGHI SỪ DỤNG TẬP MỜ LOẠI 2


34. Vũ Đức Thi, Nguyễn Huy Đức, Hồng Minh Quang

373

TMUẬT TỐN HIỆU QUẢ KHAI PHÁ TẬP MỤC LỢl ÍCH CAO TRÊN DỊNG DỮ LIỆU

35. Phạm Thượng Cát, Phạm Minh Tuấn, Nguyễn Văn Tính
MƠ HÌNH HỐ VÀ ĐIÊU KHIÊN TÔI ư u T ư THẾ VỆ TINH NHÒ DÙNG BA THANH TỪ

18

385
Lực


M ật sổ vắn đề chọn Ịọc của Công nghệ thông tin và truyền thông, Hưng Yên, ỉ 9-20 thảng 08 năm 2 0 ỉ 0

A METHOD FOR DATA MINING
IN INCOMPLETE INFORMATION SYSTEMS
Hoang Thi Lan Giao’, Nguyen Thi Lan Anh^
(1) Department o f IT, College o f Sciences, H ue University, Vietnam
(2) Department o f Informatics, College o f Pedagogy, H ue University, Vietnam
To deal with missing attribute values in incomplete information systems,
G.Busse used the characteristic relation instead o f the indiscernibility relation.
Based on this relation and the information theory, in this paper, we propose an
algorithm to fin d a reduct o f an incomplete decision table and the otherHLEM algorithm- to induce rules from it.
Keywords; missing attribute value, characteristic relation, rough entropy, reduct, rule
induction

1. Introduction

In a data set, there are usually some redundant attributes, which are not essential for
knowledge discovering. Hence, eliminating these attributes to simplify and hasten the data
mining process is an important request. In other words, following rough set approach, we
need to find a reduct of an information system or decision table.
However, in real life, data sets may have missing attribute values. Missing attribute
values are the attribute values of corresponding case which cannot be specified. So,
information systems (or decision tables) containing missing attribute values are incomplete
information systems (or decision tables, respectively). There are two types of missing
attribute values: lost values and do not care conditions [1,2,3,4]. Lost values are the
attribute values were originally known but currently they are not specified because of
many reasons. Do not care conditions are ineffective attribute values in the classification of
the case they belong to.
To solve the missing attribute value problem, G. Busse initiated the method:
extending the indiscernibility relation to characteristic relation. In this paper, we will use
this relation to construct one algorithm finding decision rules in incomplete decision table.
Besides, using concept o f entropy in information theory, we will also propose an heuristic
algorithm to compute a reduct of incomplete decision table before inducing rules. And we
will also assume that decision tables are consistent.

19


Một số vấn đề chọn ỉọc của Công nghệ thông tin và truvển thông, Hưng Yên, ỉ 9-20 thảng 08 năm 20 ỉ 0

2. Data preprocessing in Incom plete Decision Tables
2.1 Characteristic relations and set approximations
In the incomplete decision table DT = (U, CuD ), with an attribute ae c and ve Va
is an value of a for some cases, let t = (a, v) be an attribute-value pair and then block o f t,
denoted by [t], is a set o f all cases from Ư that for attribute a has value V o r *.


Incomplete decision tables are described by characteristic relations instead of
indiscemibility relations [3],[4],[5],[6], so equivalence classes are replaced by
characteristic sets. For DT = (U, C uD ), B c c , characteristic set K b( x) o f X is defined:
ỉ ^ b Í^)=

n [(« .« w ]

K b( x) is the smallest set o f cases which are indistinguishable from X using all

attributes in B.
And the characteristic relation R(B) is a binary relation on u defined as follows:
R(B)={(x,y)eU M yeK B(x)}
If DT is a complete decision table, R(B) is clearly indiscernibility relation IND(B),
so it is an extension of IND(B) in incomplete information system. R(B) is reflexive but- in
general- is not symmetric or transitive.
Let U/R(B) denote the family set {Kb(x), xeU}. Characteristic sets in U/R(B)
constitute a covering of u, i.e, for every xe u, we have that Kb(x)

and ỊJ/íg (x ) = Ơ .
x
X c u which consists of all cases from u which has the same values of decision
attributes is called a concept.
Unlike complete decision table, based on the characteristic relation, there are three
ways to approximate a concept X of an incomplete decision table DT = (U, CuD).
Let B e c and R(B) be the characteristic relation of DT with characteristic sets
K b( x ), w h e r e x e U ;

a. Singleton approximation: lower and upper approximations are sets of singletons
from Ư sastisfying some properties.

A singleton B-lower approximation of X is defined as:
M X)=

ui-»:}

xbU,K, { x) ^X

A singleton B-upper approximation of X is defined as:
5(X)=

UÍ-"}
x e U ,K g { x ) n X Jt0

b. Subset approximations', are unions o f characteristic sets o f any X from Ư:

A subset B-lower approximation of X is defined as follows:
20


M ột số vấn đề chọn lọc của Câng nghệ thông tin và truyền thông, Hung Yên, ¡9-20 tháng 08 nm 2 0 0

B{X)=

U^b(^)
xe U ,K s{x)ỗ:X

A subset B-upper approximation o f X is :
B(X)=
xeU,K¡(x)nX*0


u from the definitions

c. Concept approximations', are defined by replacing universe
of subset approximations by a concept X.
A concept B-lower approximation of X is:
B iX )^

U ^b(^)
XG

X ,K

b {x )

^X

A concept B-upper approximation of X is:
B{X)=

U^5(^)
xe X , K s { x ) n X i t 0

Because of the reflexibility of R(B), the singleton B-lower and singleton B-upper
approximations are respectively subsets of the subset B-lower and B-upper approximations
of any concept X. Besides, we can see that the concept B-lower approximation and the
subset B-lower approximation are the same; the concept B-upper approximation is subset
of subset B-upper approximation and it is the smallest set which includes X.
Among the three approximations, the concept B-lower approximations are the most
suitable for inducing rules [1,2].
In case of complete decision table, three approximations are the same. But this

property is not true for incomplete decision table.

2.2 Reducts
Definition 2.1
Let DT= (U,CuD) be an incomplete decision table, C€C. We will say c is
dispensable in DT if U/R(C\{c}) = U/R(C\{c}uD); otherwise c is indispensable in DT.
DT is called independent if each c e C is indispensable; otherwise DT is dependent.
The set of all indispensable attributes in DT is called Core , denoted by Core(C).
Definition 2.2
Let DT= (U, CuD ) be an incomplete decision table, P cC is a reduct o f c in DT if
DT’ = (U, PuD ) is independent and U/R(P) = U/R(PuD).
Obviously, there may be many reducts o f c and the intersection of all reducts of c
is Core(C). C€ c is indispensable if and only if it belongs to Core(C).
Example 2.1
Table 1 is an incomplete decision table DT= (U,CuD) with

u ={1, 2, 3, 4, 5, 6}, c

= {Temp, Headache, Nausea, Ache} and D = {Flu}:
21


Một sổ vấn đề chọn lọc của Công nghệ thẬng tin và truyền thông, Hưng Yên, ĩ 9-20 thảng 08 nãm 2 0 ỉ 0

Temp
*

'Headache

Nausea


Ache

Flu

No

No

Yes

No

Yes

Yes

No

Yes

3

Very-high
?

No

No


Yes

No

4

High

No

Yes

No

Yes

5

Normal
*

No

Yes
*

No
*

No


Ư
1
2

6

Ì.

Yes

Yes

Table 1- An example of incomplete decision table

U/R(P) = U/R(PuD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R(P\{Temp}) = {{1, 3},{2, 6},{1, 3},{4, 5},(4, 5},{2, 6}}
U/R(C\{Temp}uD) = {{1, 3},{2,

(*)

3},{4},{5},{2, 6}}

=> Temp is indispensable in DT’= (U,PuD).
U/R(P\{Headache}) ={{1, 3, 6},{2, 6},{1, 3, 6},{4, 6},(5, 6},{1, 2, 3, 4, 5, 6}}
U/R(C\{Headache}uD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2,4, 6}}
=> Headache is indispensable in DT’= (U,PuD).
U/R(P\{Ache}) = {{1, 3, 4, 5},{2, 6},{1, 3, 4, 5},{1, 4},{1, 5},{2, 6}}
U/R(C\{Ache}uD) ={{1, 3, 5},{2, 6},{1, 3, 5},{4},{5},{2, 6}}
=> Ache is indispensable in DT’= (U,PuD).

So, DT’ is independent (**)
From (*) and (**) we can conclude that P ={Temp, Headache, Ache} is a reduct of C.

2.3 Rough Entropy and significance of attributes
Definition 2.3 [6]

,

Let IS = (U,A) be an incomplete information system, B £ A. The rough entropy of

B is defined as follows;'

£ (S ) = - Z
/=)

u

Kaix,)

KM)
where card(U) = n,
set KB(xi) within U,

denotes

^;

1^1

represents the probability of characteristic


denotes the probability of one o f the values in characteristic

set KB(xi).
Some properties of the rough entropy: cardinality, monotocity, equivalence,
maximum, minimum [6] can be infered from the above definition.
22


M ột số vấn đ ề chọn lục cùa C ông n ghệ thông.Hn và truyền thông, H ưng Yên, I9-2Ỡ thảng 08 năm 2010

Theorem 2.1
Let DT = (U, CuD ) be an incomplete decision table. Then P c

c is a reduct of c in

DT iff p is the smallest set which satisfies E(P) = E(PuD).
Proof:

p is a reduct of c
o (U, PuD ) is independent and U/R(P) = U/R(PuD)
o Vc e p, U/R(P\{c}) ^ U/R(P\{c}uD) and U/R(P) = U/R(PwD)
p is minimum and E(P) = E(PuD) (equivalence property).
Using rough entropy of knowledge, we can define the significance of an attribute.
Definition 2.4
Let DT

= (U,

CuD ) be an incomplete decision table. The significance of c in


denoted sigC\{c)(c), as:
Then,

ceC

D)

' (4 )- £ (c \
is

indispensable

C o r e(C ) = { : e c |i 7 g c \ H ( c ) > o }

in

c

c,

iff:

sigC\{c}(c)

>0

and

,


Definition 2.5
Let DT = (U, CuD ) be an incomplete decision table, P cC , ceC\P. The significance
of c about p, denoted sigP(c), as:
sig,{c) = E [p u D )-E { P u {c}u D)

2.4 Algorithm based on rough entropy for computing reduct
Let DT = (U, C uD ) be an incomplete decision table. We will find a rcduct of c by
starting out with Core(C) (because it is the intersection of

allreductsof C),choosing the

attribute in C\Core(C) to add to this Core until we have E(Corc(C)) = E(Core(C) uD ).
Then, eliminating all the dispensable attributes in this Core, we will have one reduct of c.
Algorithm:
Input: An incomplete decision table DT = (Ư, CuD );
Output: A reduct p of c.
1. Begin
2.

Compute Core(C) = {ce cl sigc\{cj(c) > 0};

3.

P:= Core(C);

4.

Compute E(P) and E(PuD);


5.

IfE(P) = E(PuD) then exit;

6.

While E(P) ị E(PuD) do
23


M ột số vấn đề chọn lọc của Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 20IỦ

7.

Begin

8.

Select first c e c \p such that sigp(c) = max{sigp(a’), a’e C\P};

9.

P := P u {c};

End {while}

10.
11.

P:= P\core(C);


12.

N:= i p | ;
For i =1 to N do

13.

If E(P\{ci} u core(C)) = E(P\{cị} u core(C)u D ) then P:=P\{c,};

14.
15.

P;= Pucore(C);

16. End.
The time complexity of this algorithm is O(m^n^), where m is the cardinality of

c

and n is the cardinality of Ư.
Example 2.2
Let consider the incomplete decision table which is shown in Table 1. We will find
one reduct o f c by using the above algorithm.
Let denote: Temp = ai; Headache = aa; Nausea = as; Ache = a4;
• [(Temp,Very-high)] = {1,2, 6}

[(Nausea,Yes)] = {2,4, 5, 6}

[(Temp, High)] = {1.4, 6}


[(Nausea,No)] = {1, 3, 6}

[(Temp, Normal = {1, 5, 6}

[(Ache,Yes)] = {1, 3, 6}

[(Headache,Yes)] = {2, 6}

[(Ache,No)] = {2, 4, 5, 6}

[(Headache,No)] = {1,3, 4, 5}
. U/R(C) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R(CuD) = {{1, 3},{2,
3},{4},{5},{2, 6}}
U/R({a2,a3 ,a4 }) = {{1, 3},{2, 6},{1, 3},{4, 5),{4, 5},{2, 6}}
U/R({a2 ,a3 ,a4 }uD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R({a,,33 ,04 })= {{1, 3, 6},{2, 6},{1, 3, 6},{4, 6},{5, 6},{1, 2, 3, 4, 5, 6}}
U/R({a.,a 3,a4}uD) = {{1, 3},{2, 6},{1, 3},{4, 6},{5},{2,4, 6}}
U/R({a,,a2,a4 }) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R({a2,a3 ,a4}uD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R({a,,a2,a3 }) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R({a2 ,a3,a3 }uD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
• Finding reduct of C:
2
- ^ỉểc\{a,}(«i)=3 > 0
24


M ột sổ vấn đề chọn lọc của Công nghệ thông tin và truyền thông, Hưng Yên. ỉ 9-20 tháng 08 nm 2 0 0


-

ãyớc\{<,,}(ô3) = 0

-

y'c\{a,}(ô4) = 0

=> Core(C) = P = {ai,a2 }
- U /R (P)= {{1,3,4,5},{2,6},{1,3,4,5},{1,4},{!,5},{2,6}}

=> E(P) = 4
-

U /R (P uD )= {{1,3,5},{2,6},{1,3,5},{4},{!,5},{2,6}}

=> E(PuD ) = 1 + log3

-

E(P).

sigp(a3) = E(PuD)- E(Pu{a3}uD) = E(PuD)- E(ai,a2,,a3}uD)
^ 6 1 o g 3 -2
6

-

sigp(a4) = E(PuD )- E(Pu {34 }uD ) = E(PuD)- E(ai ,a2,,a4 }uD)


_ 6Iog3-2
6
=> Select as; P:= {ai,32 ,3 3 }.
=i> E(P) = ^ = E(PuD )
P = {ai, 32, 3 3 } is

3

reduct of C in DT.

The decision t3ble sfter reducing - DT’ = (U, PuD ) - is shown by Tsb. 2
Ỉ/ t
Ư Temp
He3dache Nausea
Flu '

1
No
No
No
2

Yes

Yes

Yes

3


Very-high
?

No

No

No

4

High

No

Yes

Yes

5

Normal
*

No

Yes
*


No

6

Yes

Yes

Table 2- The incomplete decision system after reducing of Table 1

3. Rule induction in incom plete decision tables
HLEM, proposed by us, is the extension of LEM2 o f G.Busse. In general, LEM2
computes 3 local covering and then converts it into a decision rule set [2,3], In HLEM
algorithm, we will find a minimal complex T for a whole characteristic set of x\ by
selecting t from the set o f condition attribute-v3lue pairs (a, a(xi)), where a(xi)
and a(xi)
7^?, corresponding with Xj instead of selecting t such that [t] consists o f as many cases as
possible. However, we won’t expand T like NewLEM2 [5], we will eliminate the
25


M ột số vẩn đề chọn lọc cùa Cõng nghệ thông tin và truvền thông, Hưng Yên, 19-20 tháng 08 năm 2010

redundant attribute-value pairs in the former T to get a suitable minimum complex. The
some below concepts are defined to describe the HLEM algorithm.
Let DT= (U, CuD ) be an incomplete decision table, V be a nonempty lower or
upper approximation of a concept whose decision value is w.
Let T be a set of attribute-value pairs, T = {t = (a, v)}, denote [T’]= p |[/].
leT
Then, V depends on T iff 0


[r] c F .

T is a minimal complex of V if V depends on T and there is not proper subset T ’ of
T such that V depends on T’.
A minimal complex T of V is a predecessor of a decision rule matching with some
cases in [T],
Let T be a nonempty family of nonempty sets of attribute-value pairs. T is a local
covering of V iff T satisfies the below conditions:
Each member T of T is a minimal complex of V.
^Tet[T] = V and X is minimal,i.e the cardinality o f t is as small as possible.
Hence, T is the smallest set of minimal complexes totally covering the
approximation V of someconcept X; in other words, T is a set of predecessors (conditions)
of the decision rule set covering V.
The HLEM algorithm which is presented below can be used to find T.
Algorithm HLEM
Procedure HLEM
(Input: a set V;
Output: a local covering t of V)
1. Begin
2.
G:=V;
3.

x:=0;

4.
5.

While G 0 do

Begin

6.

Select xe G such that Kc(x) c V and |ATc (^)| is maximum;

7.

T V (x)= {(a,a(x))|ae C A a (x )? t* A a (x )? i? } ;

8.

T:=TV(x);

9.

Repeat

10.

Select t = (a,a(x)) from TV(x) such that [a ,a (x )]n [r ] is

minimum;
26


×