Tải bản đầy đủ (.pdf) (402 trang)

Một số vấn đề chọn lọc của công nghệ thông tin và truyền thông

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (14.75 MB, 402 trang )

KỶ YÉU HỘI THẢO QUÓC GIA
HƯNG YÊN, 19-20 THÁNG 8 NĂM 2010

MỘT SỐ VẤN ĐỀ CHỌN LỌC CỦA
CÔNG NGHỆ THÔNG TIN VÀ
TRUYÈN t h ô n g

NHÀ XUẤT BẢN KHOA HỌC KỸ THUẬT
HÀ NỘI-2011



H Ộ I THẢO QUỐC GIA LẦN T H Ứ XIII
M Ộ T SỐ VẤN ĐÈ CHỌN LỌC CỦA
CÔ N G NGHỆ THÔNG TIN VÀ TRUYÈN THÔNG
C hủ đề: Các công n g h ệ tỉnh toán hiện đại
H ư n g Yen, 19-20/08/2010

THÔNG BÁO
Hội thảo Quốc gia lần thứ XIII "Một số vấn đề chọn lọc của Công nghệ thông tin
và Truyền thông" do Viện Công nghệ thông tin - Viện Khoa học và Công nghệ Việt Nam
và Đại học Sư phạm Kỹ thuật Hưng Yên tổ chức tại Khoái Châu, Hưng Yên từ ngày 19
đến ngày 20 tháng 8 năm 2010. Hội thảo là diễn đàn để các nhà khoa học và quản lý trong
cả nước chia sẻ kinh nghiệm nghiên cứu, triển khai trong lĩnh vực Công nghệ thông tin và
truyền thông. Đặc biệt Hội thảo cũng là môi trường để những người làm công tác nghiên
cứu khoa học trẻ; những nghiên cứu sinh, học viên cao học có điều kiện để trao đổi, tìm
kiếm sự tài trợ hợp tác.
Các chủ đề chính (không hạn chế) của Hội thảo
• Tin học quản lý
• Mã nguồn mở


Các hệ thống tích hợp

• Công nghệ đa phương tiện, mô phỏng

Thực tại ảo

• Giáo dục điện tử, đào tạo từ xa

Công nghệ phần mềm

• Công nghệ điện tử và viễn thông
• Xử lý ngôn ngữ
• Công nghệ tri thức và tính toán mềm
• Các hệ thống nhúng


Công nghệ mạng và mạng không dây

Các cơ quan đồng tổ chức


Đại học Sư phạm Kỹ thuật Hưng Yên



Viện CNTT - Viện KH&CN Việt Nam

Các hệ thống tính toán di động

Xử lý ảnh và kỹ thuật Video

CNTT trong Kinh tế- Kỹ thuật
< Cơ sở toán học của tin học


Liên hệ đăng ký tham dự


Đỗ Năng Toàn. Viện CNTT - Viện KH&CN Việt Nam
Email.
ĐT\ (043) 7567935, 0913-583240, Fox: (043) 756 4217



Phạm Minh Chuẩn, ĐHSP Kỹ thuật Hưng Yên
Email:
ĐT: (03213) 775075,0983-081120, Fax: (0321) 3713 015

Thòi hạn đăng ký báo cáo


Toàn văn báo cảo:

30/06/20ỉ 0



Chấp nhận báo cáo: 15/07/2010

Đăng ký đại biểu



Hội nghị phỉ: 100. OOOđồng (miễn phỉ đối với sinh viên tham gia báo cáo)



Ban Tổ chức sẽ giúp liên hệ chỗ ăn, ở cho các đại

biểu về dự Hội thảo

Quy cách chuẩn bị báo cáo xem chi tiết lại Website:


BAN THƯ KÝ HỘI THẢO
Truởng ban
Đỗ Năng Toàn
Các ủy viên
Phạm Minh Chuẩn
Trần Quang Diệu
Phạm Ngọc Hưng

Viện Công nghệ thông tin
Đại học Sư phạm Kỹ thuật Hưng Yên
Viện Công nghệ thông tin
Đại học Sư phạm Kỹ thuật Hưng Yên
BAN TỔ CHỨC

Trưởng ban
Trần Trung

Đại học Sư phạm Kỹ thuật Hưng Yên


Phó trưởng ban
Trưcmg Ngọc Tuấn

Đại học Sư phạm Kỹ thuật Hưng Yên

Các ủy viên
Ngô Thanh Bình

Đại học Sư phạm Kỹ thuật Hưng Yên


Nguyễn Văn Bình
Phạm Việt Bình
Ngô Kim Dung
Nguyễn Việt Hà
Nguyễn Đình Hân
Nguyễn Hoàng Hòa
Nguyễn Quang Hưng
Ngô Hùng Mạnh
Nguyễn Hữu Quỳnh
Nguyễn Minh Quý
Nguyễn Văn Tám
Huỳnh Quyết Thẳng
Nguyễn Thị Lê Thu

VNPT Hưng Yên
Khoa CNTT - ĐH Thái Nguyên
Đại học Công nghiệp Hà Nội
Đại học Công nghệ- Đại học QGHN

Đại học Sư phạm Kỹ thuật Hưng Yên
Sở TT &Truyền thông Hưng Yên
Bộ Thông tin & Truyền thông
Sờ Khoa học- Công nghệ Hưng Yên
Đại học Điện lực
Đại học Sư phạm Kỹ thuật Hưng Yên
Sở GD&ĐT Hưng Yên
Đại học Bách khoa Hà Nội
Viện Công nghệ thông tin

BAN CHƯƠNG TRÌNH
Trưởng ban
Vũ Đức Thi

Viện Công nghệ thông tin

Pìiỏ trưởng ban
Đặng Quang Á
Ngô Văn Quyết
Ngô Quốc Tạo

Viện Công nghệ thông tin
Đại học Sư phạm Kỹ thuật Hưng Yên
Viện Công nghệ thông tin

Các ủy viên
Đoàn Văn Ban
Lê Hoài Bắc
Nguyễn Ngọc Bình
Bùi Thế Duy

Phan Thị Hà Dương
Hồ Sỹ Đàm
Đặng Hữu Đạo
Lê Quốc Định
Dương Anh Đức
Đặng Văn Đức
Trần Hành
Nguyễn Thúc Hải
Nguyễn Mậu Hân

Viện Công nghệ thông tin
Đại học KHTN Tp. Hồ Chí Minh
Đại học Công nghệ -ĐHQGHN
Đại học Công nghệ -ĐHQGHN
Viện Toán học
Đại học Công nghệ -ĐHQGHN
Viện Công nghệ ứiông tin
Đại học Hàng hải
Đại học Khoa học tự nhiên
Viện Công nghệ ứiông tin
Đại học Lạc Hồng
Đại học Bách khoa Hà Nội
Đại học Huế


Vũ Đình Hòa
Nguyễn Đình Hóa
Nguyễn Xuân Huy
Phan Huy Khánh
Hoàng Kiếm

Lương Chi Mai
Nguyễn Văn Mạnh
Trần Đức Minh
Trần Văn Lăng
Phạm Thế Long
Nguyễn Huy Lợi
Vũ Duy Lợi
Phùng Văn ồ n
Nguyễn Hoàng Phương
Từ Minh Phương
Nguyễn Hồng Quang
Lê Văn Sơn
Hoàng Chí Thành
Trần Thiên Thành
Lê Mạnh Thạnh
Lê Quyết Thắng
Nguyễn Đình Thuân
Nguyễn Thanh Thủy
Hà Quang Thuỵ
Trịnh Nhật Tiến
Nguyễn Thanh Tùng
Phan Thị Tươi
Hồ Tường Vinh

Đại học Sư phạm 1 Hà Nội
Viện CNTT - ĐHQG Hà Nội
Viện Công nghệithông tin
Đại học Bách khoa Đà Nang
Đại học CNTT Tp. Hồ Chí Minh
Viện Công nghệ thông tin

Đại học Bách khoa Hà Nội
Đại học Đà Lạt
Đại học Lạc Hồng
Học viện Kỹ thuật quân sự
Đại học Sư phạm Hà Nội 2
Trung tâm Tin học - VPTW
Văn phòng Chính phủ
TT Tin học Bộ Y tế
Học viện Công nghệ BCVT
Viện Tin học Pháp ngữ - IFI
Đại học Sư phạm Đà Nang
ĐH Khoa học Tự nhiên - ĐHQG Hà Nội
Đại học Quy Nhem
Đại học Khoa học Huế
Đại học Cần Thơ
Đại học Nha Trang
Đại học Bách khoa Hà Nội
Đại học Công nghệ - ĐHQG Hà Nội
Đại học Công nghệ -ĐHQGHN
Viện Công nghệ thông tin
Đại học Bách khoa-Tp. Hồ Chí Minh
Viện Tin học Pháp ngữ - IFI


C Á C Đ Ơ N VỊ TÀ I TR Ọ H Ộ I TH Ả O C N TT 2010
V iện K h o a học và C ông nghệ V iệt N am
V iện C ô n g nghệ T hông tin- V iện K hoa học và C ông nghệ V iệt N am
T rườ ng Đ ại học Sư phạm K ỹ thuật H ưng Y ên
K hoa C ô n g nghệ thông tin - T rường Đại học C ông nghệ - Đại học Quốc
G ia H à NỘI

T rườ ng Đ ại học B ách K hoa H à Nội
T rườ ng Đ ại học cần T hơ
T rườ ng Đ ại học K hoa học H uế
T rườ ng Đ ại học L ạc H ồng
T rườ ng Đ ại học N ha T rang
T rư ờ ng Đ ại học Sư phạm Kỹ thuật N am Đ ịnh
Trưòrng C ao đẳng Sư P hạm Trung ư ơ n g
K hoa C ô n g nghệ th ô n g tin- T rường Đại học C ông N ghiệp Hà N ội
K hoa C ô n g nghệ th ô n g tin- T rường Đại học Đ iện Lực
K hoa C ô n g nghệ th ô n g tin- T rường Đại học Thái N guyên
K lioa C ô n g nghệ th ô n g tin- Trường Đại học K hoa học tự nhiên Tp Hồ
Chí M inh
K lìoa C ô n g nghệ th ô n g tin- T rường Đại học Sư phạm H à N ội 2
K hoa C ô n g n g h ệ th ô n g tin- Trường Đại học T hủ D ầu M ột
K hoa C ô n g nghệ th ô n g tin- T rường Đại học Sư phạm K ỹ T huật Vinh
K hoa C ô n g n g h ệ thông tin - H ọc V iện K ỹ thuật Q uân sự
K hoa C ô n g n g h ệ th ô n g tin- H ọc viện C ông nghệ B ư u chính V iễn thông
T rung tâm T in học- B ư u điện Hải Phòng
T rung tâm C ông n g h ệ th ôn g tin - V ăn phòng T W Đ ảng
T ập đ o àn V iễn th ô n g quân đội V iettel - C hi nhánh H ưng Y ên
C ông ty V iễn th ô n g H ư ng Y ên và V inaphone H ư ng Y ên
C ông ty Cổ p h ần truyền thông truyền hình quốc g ia H à N ội (H T M )
C ông ty C ổ phần điện tử tin học FSC Hà N ội
C ông ty Cổ phần tư vấn xây dựng và thư ơ ng m ại Thái D ương
C ông ty C ổ p h ần và thư ơ ng m ại N B T H ưng Y ên



Một số vẩn đề chọn lọc cùa Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 nâm 2 0 Ĩ0


LỜI NÓI ĐẦU
Hội thảo Quốc gia "Một sổ vấn đề chọn lọc của Công nghệ thông tin ” được khởi
xướng theo sáng kiến của Viện Công nghệ Thông tin thuộc Viện Khoa học và Công nghệ
Việt nam, đến nay đã qua hơn 10 lần tổ chức
Hội thảo Quốc gia "Một sổ vấn đề chọn ỉọc pủa Công nghệ thông tin ” lần thứ I được
tổ chức từ ngày 5 đến 7 tháng 8 năm 1997 tại Đại học Sư phạm Hà Nội II, Đại Lải, Vĩnh
Phúc. Hội thảo được tổ chức dưới sự phối hợp của: Viện Công nghệ thông tin, Đại học
Quốc gia Hà Nội, Đại học Sư phạm Hà Nội II.
Kể từ đó đến nay, hàng năm cứ mỗi độ thu sang Viện Công nghệ thông tin- Viện Khoa
học và Công nghệ Việt Nam lại phối hợp với một trong các trường Đại học trong nước để
tổ chức Hội thảo Quốc gia "Một số vẩn đề chọn lọc của Công nghệ thông tin
Với các chủ để khác nhau, hội thảo Quốc Gìa."Một số vấn đề chọn lọc của Công nghệ
thông tin ” đã thực sự trở thành diễn đàn nhằm trao đổi các kết quả nghiên cứu và triển khai
ứng dụng công nghệ thông tin của các nhà khoa học, đặc biệt là các nhà khoa học trẻ trên
mọi miền đất nước.
Hội thảo lần thứ XIII với chủ đề “Cóc công nghệ tính toán hiện đạĩ' được Viện Công
nghệ thông tin phối họp với Đại học Sư phạm Kỹ thuật Hưng Yên tổ chức tại Hưng Yên từ
ngày 19-20 tháng 8 năm 2010
Hcm 500 đại biểu và khách mòd từ mọi miền của đất nước đã tham dự Hội thảo lần thứ
mười ba này. Các đại biểu đã nghe và thảo luận gần 150 báo cáo khoa học theo các nội dung:
Các hệ tíiống thông minh

Cơ sở toán học của tin học

Mã nguồn mở

Tin học quản lý

Giáo dục điện tử, đào tạo từ xa


Công nghệ đa phương tiện, mô phỏng

Xử lý ngôn ngữ

Công nghệ điện tử và viễn thông

Các hệ thống nhúng

Công nghệ tri thức và tính toán mềm

Các hệ thống tích hợp

Công nghệ mạng và mạng không dây

Thực tại ảo

Công nghệ phần mềm

Xừ lý ảnh và kỹ thuật Video


Một sổ vấn đề chọn ¡ọc cùa Công nghệ thông lin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 2010

Với sự tham gia đông đảo của các nhà khoa học trong và ngoài nước cùng với số
lượng lớn báo cáo khoa học gửi tới Hội thảo đã khẳng định ý nghĩa thiết thực và tầm vóc
quốc gia của Hội thảo "Một sổ vấn đề chọn lọc của Công nghệ thông tin
Các đại biểu đánh giá cao sự nhiệt tình của các đơn vị tham gia tổ chức Hội thảo, đặc
biệt là cơ sở đăng cai; Đại học Sư Phạm Kỹ thuật Hưng Yên và đơn vị chủ quản và điều
hành chương trình - Viện Công nghệ thông tin.
Trong phiên bế mạc Hội thảo lần thứ XIII, Ban Tổ Chức đã trao cờ cho Đại học cần

Thơ, là đơn vị đăng cai tổ chức Hội thào lần thứ XIV tại Thành phố cần Thơ.
Các công trình được in trong tập kỷ yếu này đã được báo cáo, thảo luận tại Hội thảo và
sau đó đã được phản biện nghiêm túc.
Ban tổ chức Hội thảo xin chân thành cảm on các đcm vi sau đây đã tài trợ kinh phí cho
hoạt động của Hội thảo:
Trường Đại học Sư phạm Kỹ thuật Hưng Yên
Viện Công nghệ Thông tin- Viện Khoa học và Công nghệ Việt Nam
Khoa Công nghệ thông tin - Trường Đại học Công nghệ - Đại học Quốc Gia
Hà Nội
Trường Đại học Bách Khoa Hà Nội
Trường Đại học cần Thơ
Trưòmg Đại học Khoa học Huế
Trường Đại học Lạc Hồng
Trưòng Đại học Nha Trang
Trường Đại học Sư phạm Kỹ thuật Nam Định
Trường Cao đẳng Sư Phạm Trung ư ơng
Khoa Công nghệ thông tin- Trường Đại học Công Nghiệp Hà Nội
Khoa Công nghệ thông tin- Trường Đại học Điện Lực
Khoa Công nghệ thông tin- Trưòng Đại học Thái Nguyên
Khoa Công nghệ thông tin- Trường Đại học Khoa học tự nhiên Tp Hồ chí Minh
Khoa Công nghệ thông tin- TrưÒTig Đại học Sư phạm Hà Nội 2
Klioa Công nghệ thông tin- Trường Đại học Thủ Dầu Một
Khoa Công nghệ thông tin- Trường Đại học Sư phạm Kỹ Thuật Vinh
Khoa Công nghệ thông tin - Học Viện Kỹ thuật Quân sự
Khoa Công nghệ thông tin- Học viện Công nghệ Bưu chính Viễn thông
Trung tâm Tin học- Bưu điện Hải Phòng
Trung tâm Công nghệ thông tin - Văn phòng TW Đảng
10



Một sổ vấn đề chọn lọc của Công nghệ thông lin và truyền thông, Hưng Yên, ¡9-20 tháng 08 năm 2010




Tập đoàn Viễn thông quân đội Viettel - Chi nhánh Hưng Yên
Công ty Viễn thông Hưng Yên và Vinaphone Hưng Yên



Công ty Cổ phần truyền thông truyền hình quốc gia Hà Nội (HTM)



Công ty Cổ phần điện tử tin học FSC Hà Nội





Công ty Cổ phần tư vấn xây dựng và thưcmg mại Thái Dương
Công ty Cổ phần và thương mại NBT Hưng Yên
Và nhiều cá nhân khác

Ban ChưoTig trìnli xin chân thành cảm ơn các phản biện đã đóng góp nhiều ý kiến quý
báu góp phần nâng cao chất lượng tập kỷ yếu của Hội thảo.
Xin trân trọng giới thiệu với đông đảo bạn đọc và mong tiếp tục nhận được những ý
kiến đóng góp về hình thức hoạt động của Hội thảo cũng như về nội dung khoa học của các
báo cáo.
Hà Nội, ngày


19

tháng 06

năm 2011

Ban Biên tập

II


D A N H S Á C H C Á C P H Ả N B IỆ N

1

Đoàn Văn Ban

Học hàm , học
vi
PGS.TS.

2

Phạm Thượng Cát

PGS.TSKH.

Viện Công nghệ thông tin


3

Đặng Hữu Đạo

PGS.TS

Viện Công nghệ thông tin

4

Nguyễn Công Điều

PGS.TS.

Viện Công nghệ thông tin

5

Đặng Văn Đức

PGS.TS.

Viện Công nghệ thông tin

6

Nguyễn Huy Đức

TS.


Trường Cao đăng SP Mâu
giáo Trung ương

7

Lê Bá Dũng

PGS.TS.

Viện Công nghệ thông tin

8

Nguyễn Đức Dũng

TS.

Viện Công nghệ thông tin

9

Bùi Thế Duy

PGS.TS.

10

Nguyễn Việt Hà

PGS.TS.


11

Nguyễn Cát Hồ

PGS.TSKH.

Đại học Công nghệ- Đại
học Quốc gia Hà Nội
Đại học Công nghệ- Đại
học Quốc gia Hà Nội
Viện Công nghệ thông tin

PGS.TS.

Viện Công nghệ thông tin

13

1 Bùi Thế Hồng
Nguyễn Xuân Huy

PGS.TSKH.

Viện Công nghệ thông tin

14

Phan Trung Huy


PGS.TS.

Đại học Bách Khoa

15

Trần Đình Khang

PGS.TS.

Đại học Bách khoa

16

Lương Chi Mai

PGS.TS.

Viện Công nghệ thông tin

17

Lê Văn Phùng

TS.

Viện Công nghệ thông tin

18


Từ Minh Phương

PGS.TS.

Học viện Công nghệ Bưu
chính Viễn thông

19

Trần Hồng Quân

PGS.TS.

Viện KHKT Bưu điện

20

Lê Xuân Quảng

TS.

Viện Công nghệ thông tin

21

Trần Thái Sơn

TS.

Viện Công nghệ thông tin


22

Nguyễn Văn Tam

PGS.TS.

Viện Công nghệ thông tin

23

Ngô Quốc Tạo

PGS.TS.

Viện Công nghệ thông tin

24

Nguyễn Trường Thắng

TS.

Viện Công nghệ thông tin

STT

12

12


Họ và tên ngưòi phản biện

Cơ quan
Viện Công nghệ thông tin


25

Hoàng Chí Thành

PGS.TS.

26

Vũ Đức Thi

GS.TS.

Đại học Công nghệ- Đại
học Quốc gia Hà Nội
Viện Công nghệ thông tin

27

Nguyễn Thanh Thủy

GS.TS.

Đại học Bách Khoa


28

Hà Quang Thụy

PGS.TS.

29

Trịnh Nhật Tiến

PGS.TS.

30

Đỗ Năng Toàn

PGS.TS.

Đại học Công nghệ- Đại
học Quốc gia Hà Nội
Đại học Công nghệ- Đại
học Quốc gia Hà Nội
Viện Công nghệ thông tin

31

Nguyễn Minh Tuấn

TS.


Viện Công nghệ thông tin

32

Nguyễn Thanh Tùng

PGS.TS.

Viện Công nghệ thông tin

33

Hoàng Đỗ Thanh Tùng

TS.

Viện Công nghệ thông tin

13



M ột số vẩn đề chọw ỉọc cùa Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 20ỈỒ

MỤC LỤC
Lòi nói đầu

9


Mục lục

15

1. Hoang Thi Lan Giao, Nguyen Thi Lan Anh

19

A COMPARATIVE ANALYSIS OF TECHNIQUES FOR PREDICTING ACADEMIC PERFORMANCE

2. Lê Huy Thập

29

ĐẢNG CÂU VÂN TIN TRÊN CÁC QUAN HỆ VÀ x ừ LÝ CÂU VÂN TIN TRÊN BẢNG

3. Bùi Thế Hồng, Lưu Thị Bích Hương
BẢO VỆ BẢN QUYỀN CÔNG KHAI CHO CÁC

41

cơ sở

DỬ LIỆU QUAN HỆ

4. Bùi Đức Minh, Lưong Nguyễn Hoàng Hoa, Cao Tùng Anh, Nguyễn Gia

51

Như, Nguyễn Xuân Huy

BIẺU DIÊN C ơ SỜ CÙA HỆ SINH ÁNH XẠ ĐÓNG

5. Vũ Duy Linh, Lê Quyết Thắng, Huỳnh Xuân Hiệp

59

D ự BẢO NẺ RÂY THEO THỜI GIAN

6. Nguyễn Hữu Mùi, Vũ Đình Hòa

71

GIẢI BÀI TOÁN LẬP LỊCH JOB SHOP BẰNG THUẬT TOÁN DI TRUYỀN

7. Lưong Xuân Bách, Nguyễn Nhật Quang

83

HỆ THỐNG GỢI Ý TIN TỨC NEWSARD

8. Võ Hồng Bảo Châu, Trương Thị Quỳnh Hưong, Trương Thị Đức,

97

Nguyễn Thụy Mai Trâm, Tạ Thúc Nhu
LẬP CHÌ MỤC THEO NHÓM ĐÊ NÂNG CAO HIỆU

QUẢ KHAI THÁC cơ sờ

D Ữ LIỆU VIRUS CÚM


9. Đặng Thành Chương, Vũ Duy Lợi, Võ Viết Minh Nhật
MÔ HÌNH PHÂN TÍCH ĐỊNH TUYẾN LỆCH HƯỚNG KÉT HỢP VỚI CHUYÊN ĐÔI

107
Bước

SÓNG

NHẰM GIẢI QUYÉT TÁC NGHẼN TRÊN MẠNG CHUYẺN MẠCH CHÙM QUANG OBS

15


Một s ố vấn đề chọn lọc cùa Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 2010

10. Bùi Quốc Trung, HỒ Tường Vinh

119

MÔ PHÓNG MỘT SÓ TINII HUỐNG GIAO THÔNG ĐÔ THỊ D ự A TRÊN MÔ HÌNH ĐA TÁC TỪ

11. Trưong Công Tuấn, Trần Thái Sơn

133

MÔI QUAN HỆ GIỮA N G Ừ NGHĨA CÚA CHƯƠNG TRÌNH LOGIC DIỄN GIẢI VÀ CHƯƠNG TRÌNH
LOGIC DẠNG TUYÊN

12. Nguyễn Văn Huân, Phạm Việt Bình, Vũ Xuân Nam


141

MỘT CÁCH TIÉP CẬN TRONG HỎ TRỢ THU THẬP DỪ LIỆU T ự ĐỘNG

13. Nguyễn Thị Hồng Minh, Lê Hoàng Sơn, Phạm Huy Thông,

151

Nguyễn Duy Linh
MỘT GIẢI PHÁP CẢI TIÉN THUẬT TOÁN BEEMAN TRONG MÔ PHÓNG ĐỘNG L ự c PHÂN TỬ

14. Nguyễn Thanh Tùng, Trần Huy Dương

163

MỘT PHƯƠNG PHÁP MÓI TIÈN x ử LÝ GIÁ TRỊ THIẾU

15. Nguyễn Thị Thu Hà, Nguyễn Thiện Luận, Vũ Văn Định

173

MỘT PHƯƠNG PHÁP TRÍCH RÚT CÂU TRONG VĂN BÀN TIẺNG VIỆT s ử DỤNG LUẬT KẾT HỢP

16. Trần Ngọc Hà, Hoàng Xuân Huấn, Nguyễn PhưoTig Chi

181

MỘT PHƯƠNG PHÁP x ừ LÝ KÉT QUẢ TÌM KIÊM TRÊN WEB


17. Đỗ Văn Tuấn, Trần Đăng Hiên, Nguyễn Thanh Bình, Phạm Văn Át

193

MỘT SỔ CÀI TIÊN NÂNG CAO Tốc Đ ộ x ừ LÝ CÚA PHƯƠNG PHÁP MÃ HÓA s ố HỌC

18. Nguyễn Mạnh Hùng, Phạm Thị Bích Vân, Đỗ Thị Mai Hường

205

MỘT SỐ CÀI TIÉN THUẬT TOÁN PHÂN CỤM SONG SONG D Ữ LIỆU LỚN, NHIÊU CHIÊU
DỰA TRÊN LƯỚI THÍCH NGHI PMAFIA

19. Hà Mạnh Đào, Thái Quang Vinh, Hoàng Văn Tuấn
MƯỢN KÊNH ĐỘNG TRÊN c ơ s ờ B ộ ĐIÊU KHIÊN MÒ SỪ DỤNG SUBSETHOOD

16

215


Một số vấn để chọn lọc cùa Công nghệ thông tin và truyền thông, Hung Yên, 19-20 tháng 08 năm 20Ỉ0

20. Lê Tiến Lộc, Lâm Thành Hiển, Trần Hành

229

NGHIÊN c ú u BA CHÉ Đ ộ ĐIÊU KHIÊN ON/OFF, PID, FUZZY VÀ ỨNG DỤNG TRONG ĐIÈU
KHIÊN MÔ HÌNH LÒ NHIỆT


21. Lê Văn Sơn, Trần Nguyễn Hồng Phúc

239

NGHIÊN CỬU MÔ HÌNH GIÁM SÁT TRựC TUYÉN HỆ THỐNG MẠNG PHÂN TÁN QUY MÔ LỚN

22. Hà Đại Dương, Đào Thanh Tĩnh

251

PHÁT HIỆN CHÁY S ừ DỤNG CAMERA THÔNG THƯỜNG TRONG ĐIÊU KIỆN ÁNH SÁNG
MÔI TRƯỜNG YÉU

23. Cù Thu Thủy, Hà Quang Thụy

263

PHÁT HIỆN LUẬT KẾT HỢP SPORADIC TUYỆT ĐỐI HAI NGƯỠNG MỜ

24. Trịnh Đình Thắng, Trần Minh Tuyến

276

PHÉP DỊCH CHUYÊN L ư ợ c Đ ồ KHỐI VÀ VẤN ĐÊ BIÊU DIỄN BAO ĐÓNG, KIIOÁ TRONG
MÔ HÌNH D ử LIỆU DẠNG KHỐI

25. Nguyen Buong, Nguyen Dinh Dung

287


REGULARIZATION FOR A COMMON SOLUTION OF A SYSTEM OF NONLINEAR ILL-POSED
EQUATIONS WITH PERTURBATIVE DATA

26. Văn Đình Vỹ Phưong, Phan Mạnh Thưòng, Trần Văn Lăng

295

SO SÁNH CẨU TRÚC PROTEIN SỪ DỤNG MÔ HÌNH TỐNG QUÁT

27. Phạm Văn Trung, Võ Thanh TÚ

301

SO SÁNH VÀ ĐÁNH GIÁ MỘT s ố GIAO THỨC ĐỊNH TUYÉN ĐIỀU KHIÊN THEO YÊU CẢU TRÊN
MẠNG MANET

28. Đặng Quang Á, Vũ Vinh Quang, Trương Hà Hải

311

TIÊP CẬN CHIA MIỀN TỚI CÁC BÀI TOÁN VỀ MẶT PHÂN CÁCH

29. Nguyễn Đình Hân, Đặng Quyết Thắng, Hồ Ngọc Vinh

33ẵf

rÍNH TOÁN Đ ộ TRẺ GlÀl MÃ CỦA NGÔN NGỮ BÂNG OTOMAT

17



Một số vấn đề chọn lọc của Công nghệ thông tin và truvền thông, Hưng Yên, 19-20 tháng 08 năm 2010

30. Nguyễn Thị Hương Thủy, Nguyễn Văn Toàn, Nguyễn Ngọc Kỷ,

333

Nguyễn Thị Hoàng Lan
XÂY DỤNG GIẢI PHÁP BẢO MẬT BIOPKI VÀ ÚÌMG DỤNG ĐẺ BẢO MẬT HỆ NHẬN
DẠNG VÂN TAY

31. Tạ Nguyễn, Vũ Đình Trung, Trần Ngọc Phúc, Đỗ Quốc Bảo, Tạ Thúc Nhu,

34'

Trần Hành
XÂY DỰNG HỆ THỐNG QUẢN LÝ CÁC QUY TRÌNH MÔ PHỎNG NGHIỆP v ụ TRONG
DOANH NGHIỆP

32. Vũ Trí Dũng, Nguyễn Xuân Huy

353

VÈ PHÉP BIÉN ĐỔI HỆ SINH ÁNH XẠ ĐÓNG

33. Nguyễn Mậu Uyên, Ngô Thành Long, Bùi Đình Hà

361

VÊ PHƯƠNG PHÁP PHÂN NGƯỠNG ẢNH THÍCH NGHI SỪ DỤNG TẬP MỜ LOẠI 2


34. Vũ Đức Thi, Nguyễn Huy Đức, Hoàng Minh Quang

373

TMUẬT TOÁN HIỆU QUẢ KHAI PHÁ TẬP MỤC LỢl ÍCH CAO TRÊN DÒNG DỮ LIỆU

35. Phạm Thượng Cát, Phạm Minh Tuấn, Nguyễn Văn Tính
MÔ HÌNH HOÁ VÀ ĐIÊU KHIÊN TÔI ư u T ư THẾ VỆ TINH NHÒ DÙNG BA THANH TỪ

18

385
Lực


M ật sổ vắn đề chọn Ịọc của Công nghệ thông tin và truyền thông, Hưng Yên, ỉ 9-20 thảng 08 năm 2 0 ỉ 0

A METHOD FOR DATA MINING
IN INCOMPLETE INFORMATION SYSTEMS
Hoang Thi Lan Giao’, Nguyen Thi Lan Anh^
(1) Department o f IT, College o f Sciences, H ue University, Vietnam
(2) Department o f Informatics, College o f Pedagogy, H ue University, Vietnam
To deal with missing attribute values in incomplete information systems,
G.Busse used the characteristic relation instead o f the indiscernibility relation.
Based on this relation and the information theory, in this paper, we propose an
algorithm to fin d a reduct o f an incomplete decision table and the otherHLEM algorithm- to induce rules from it.
Keywords; missing attribute value, characteristic relation, rough entropy, reduct, rule
induction


1. Introduction
In a data set, there are usually some redundant attributes, which are not essential for
knowledge discovering. Hence, eliminating these attributes to simplify and hasten the data
mining process is an important request. In other words, following rough set approach, we
need to find a reduct of an information system or decision table.
However, in real life, data sets may have missing attribute values. Missing attribute
values are the attribute values of corresponding case which cannot be specified. So,
information systems (or decision tables) containing missing attribute values are incomplete
information systems (or decision tables, respectively). There are two types of missing
attribute values: lost values and do not care conditions [1,2,3,4]. Lost values are the
attribute values were originally known but currently they are not specified because of
many reasons. Do not care conditions are ineffective attribute values in the classification of
the case they belong to.
To solve the missing attribute value problem, G. Busse initiated the method:
extending the indiscernibility relation to characteristic relation. In this paper, we will use
this relation to construct one algorithm finding decision rules in incomplete decision table.
Besides, using concept o f entropy in information theory, we will also propose an heuristic
algorithm to compute a reduct of incomplete decision table before inducing rules. And we
will also assume that decision tables are consistent.

19


Một số vấn đề chọn ỉọc của Công nghệ thông tin và truvển thông, Hưng Yên, ỉ 9-20 thảng 08 năm 20 ỉ 0

2. Data preprocessing in Incom plete Decision Tables
2.1 Characteristic relations and set approximations
In the incomplete decision table DT = (U, CuD ), with an attribute ae c and ve Va
is an value of a for some cases, let t = (a, v) be an attribute-value pair and then block o f t,
denoted by [t], is a set o f all cases from Ư that for attribute a has value V o r *.


Incomplete decision tables are described by characteristic relations instead of
indiscemibility relations [3],[4],[5],[6], so equivalence classes are replaced by
characteristic sets. For DT = (U, C uD ), B c c , characteristic set K b( x) o f X is defined:
ỉ ^ b Í^)=

n [(« .« w ]

K b( x) is the smallest set o f cases which are indistinguishable from X using all

attributes in B.
And the characteristic relation R(B) is a binary relation on u defined as follows:
R(B)={(x,y)eU M yeK B(x)}
If DT is a complete decision table, R(B) is clearly indiscernibility relation IND(B),
so it is an extension of IND(B) in incomplete information system. R(B) is reflexive but- in
general- is not symmetric or transitive.
Let U/R(B) denote the family set {Kb(x), xeU}. Characteristic sets in U/R(B)
constitute a covering of u, i.e, for every xe u, we have that Kb(x)

and ỊJ/íg (x ) = Ơ .
x
X c u which consists of all cases from u which has the same values of decision
attributes is called a concept.
Unlike complete decision table, based on the characteristic relation, there are three
ways to approximate a concept X of an incomplete decision table DT = (U, CuD).
Let B e c and R(B) be the characteristic relation of DT with characteristic sets
K b( x ), w h e r e x e U ;

a. Singleton approximation: lower and upper approximations are sets of singletons

from Ư sastisfying some properties.
A singleton B-lower approximation of X is defined as:
M X)=

ui-»:}

xbU,K, { x) ^X

A singleton B-upper approximation of X is defined as:
5(X)=

UÍ-"}
x e U ,K g { x ) n X Jt0

b. Subset approximations', are unions o f characteristic sets o f any X from Ư:

A subset B-lower approximation of X is defined as follows:
20


M ột số vấn đề chọn lọc của Câng nghệ thông tin và truyền thông, Hung Yên, ¡9-20 tháng 08 năm 2 0 Ỉ0

B{X)=

U^b(^)
xe U ,K s{x)ç:X

A subset B-upper approximation o f X is :
B(X)=
xeU,K¡(x)nX*0


u from the definitions

c. Concept approximations', are defined by replacing universe
of subset approximations by a concept X.
A concept B-lower approximation of X is:
B iX )^

U ^b(^)
XG

X ,K

b {x )

^X

A concept B-upper approximation of X is:
B{X)=

U^5(^)
xe X , K s { x ) n X i t 0

Because of the reflexibility of R(B), the singleton B-lower and singleton B-upper
approximations are respectively subsets of the subset B-lower and B-upper approximations
of any concept X. Besides, we can see that the concept B-lower approximation and the
subset B-lower approximation are the same; the concept B-upper approximation is subset
of subset B-upper approximation and it is the smallest set which includes X.
Among the three approximations, the concept B-lower approximations are the most
suitable for inducing rules [1,2].

In case of complete decision table, three approximations are the same. But this
property is not true for incomplete decision table.

2.2 Reducts
Definition 2.1
Let DT= (U,CuD) be an incomplete decision table, C€C. We will say c is
dispensable in DT if U/R(C\{c}) = U/R(C\{c}uD); otherwise c is indispensable in DT.
DT is called independent if each c e C is indispensable; otherwise DT is dependent.
The set of all indispensable attributes in DT is called Core , denoted by Core(C).
Definition 2.2
Let DT= (U, CuD ) be an incomplete decision table, P cC is a reduct o f c in DT if
DT’ = (U, PuD ) is independent and U/R(P) = U/R(PuD).
Obviously, there may be many reducts o f c and the intersection of all reducts of c
is Core(C). C€ c is indispensable if and only if it belongs to Core(C).
Example 2.1
Table 1 is an incomplete decision table DT= (U,CuD) with

u ={1, 2, 3, 4, 5, 6}, c

= {Temp, Headache, Nausea, Ache} and D = {Flu}:
21


Một sổ vấn đề chọn lọc của Công nghệ thẬng tin và truyền thông, Hưng Yên, ĩ 9-20 thảng 08 nãm 2 0 ỉ 0

Temp
*

'Headache


Nausea

Ache

Flu

No

No

Yes

No

Yes

Yes

No

Yes

3

Very-high
?

No

No


Yes

No

4

High

No

Yes

No

Yes

5

Normal
*

No

Yes
*

No
*


No

Ư
1
2

6

Ì.

Yes

Yes

Table 1- An example of incomplete decision table

U/R(P) = U/R(PuD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R(P\{Temp}) = {{1, 3},{2, 6},{1, 3},{4, 5},(4, 5},{2, 6}}
U/R(C\{Temp}uD) = {{1, 3},{2,

(*)

3},{4},{5},{2, 6}}

=> Temp is indispensable in DT’= (U,PuD).
U/R(P\{Headache}) ={{1, 3, 6},{2, 6},{1, 3, 6},{4, 6},(5, 6},{1, 2, 3, 4, 5, 6}}
U/R(C\{Headache}uD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2,4, 6}}
=> Headache is indispensable in DT’= (U,PuD).
U/R(P\{Ache}) = {{1, 3, 4, 5},{2, 6},{1, 3, 4, 5},{1, 4},{1, 5},{2, 6}}
U/R(C\{Ache}uD) ={{1, 3, 5},{2, 6},{1, 3, 5},{4},{5},{2, 6}}

=> Ache is indispensable in DT’= (U,PuD).
So, DT’ is independent (**)
From (*) and (**) we can conclude that P ={Temp, Headache, Ache} is a reduct of C.

2.3 Rough Entropy and significance of attributes
Definition 2.3 [6]

,

Let IS = (U,A) be an incomplete information system, B £ A. The rough entropy of

B is defined as follows;'

£ (S ) = - Z
/=)

u

Kaix,)

KM)
where card(U) = n,
set KB(xi) within U,

denotes

^;

1^1


represents the probability of characteristic

denotes the probability of one o f the values in characteristic

set KB(xi).
Some properties of the rough entropy: cardinality, monotocity, equivalence,
maximum, minimum [6] can be infered from the above definition.
22


M ột số vấn đ ề chọn lục cùa C ông n ghệ thông.Hn và truyền thông, H ưng Yên, I9-2Ỡ thảng 08 năm 2010

Theorem 2.1
Let DT = (U, CuD ) be an incomplete decision table. Then P c

c is a reduct of c in

DT iff p is the smallest set which satisfies E(P) = E(PuD).
Proof:

p is a reduct of c
o (U, PuD ) is independent and U/R(P) = U/R(PuD)
o Vc e p, U/R(P\{c}) ^ U/R(P\{c}uD) and U/R(P) = U/R(PwD)
p is minimum and E(P) = E(PuD) (equivalence property).
Using rough entropy of knowledge, we can define the significance of an attribute.
Definition 2.4
Let DT

= (U,


CuD ) be an incomplete decision table. The significance of c in

denoted sigC\{c)(c), as:
Then,

ceC

D)

' (4 )- £ (c \
is

indispensable

C o r e(C ) = { : e c |i 7 g c \ H ( c ) > o }

in

c

c,

iff:

sigC\{c}(c)

>0

and


,

Definition 2.5
Let DT = (U, CuD ) be an incomplete decision table, P cC , ceC\P. The significance
of c about p, denoted sigP(c), as:
sig,{c) = E [p u D )-E { P u {c}u D)

2.4 Algorithm based on rough entropy for computing reduct
Let DT = (U, C uD ) be an incomplete decision table. We will find a rcduct of c by
starting out with Core(C) (because it is the intersection of

allreductsof C),choosing the

attribute in C\Core(C) to add to this Core until we have E(Corc(C)) = E(Core(C) uD ).
Then, eliminating all the dispensable attributes in this Core, we will have one reduct of c.
Algorithm:
Input: An incomplete decision table DT = (Ư, CuD );
Output: A reduct p of c.
1. Begin
2.

Compute Core(C) = {ce cl sigc\{cj(c) > 0};

3.

P:= Core(C);

4.

Compute E(P) and E(PuD);


5.

IfE(P) = E(PuD) then exit;

6.

While E(P) ị E(PuD) do
23


M ột số vấn đề chọn lọc của Công nghệ thông tin và truyền thông, Hưng Yên, 19-20 tháng 08 năm 20IỦ

7.

Begin

8.

Select first c e c \p such that sigp(c) = max{sigp(a’), a’e C\P};

9.

P := P u {c};

End {while}

10.
11.


P:= P\core(C);

12.

N:= i p | ;
For i =1 to N do

13.

If E(P\{ci} u core(C)) = E(P\{cị} u core(C)u D ) then P:=P\{c,};

14.
15.

P;= Pucore(C);

16. End.
The time complexity of this algorithm is O(m^n^), where m is the cardinality of

c

and n is the cardinality of Ư.
Example 2.2
Let consider the incomplete decision table which is shown in Table 1. We will find
one reduct o f c by using the above algorithm.
Let denote: Temp = ai; Headache = aa; Nausea = as; Ache = a4;
• [(Temp,Very-high)] = {1,2, 6}

[(Nausea,Yes)] = {2,4, 5, 6}


[(Temp, High)] = {1.4, 6}

[(Nausea,No)] = {1, 3, 6}

[(Temp, Normal = {1, 5, 6}

[(Ache,Yes)] = {1, 3, 6}

[(Headache,Yes)] = {2, 6}

[(Ache,No)] = {2, 4, 5, 6}

[(Headache,No)] = {1,3, 4, 5}
. U/R(C) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R(CuD) = {{1, 3},{2,
3},{4},{5},{2, 6}}
U/R({a2,a3 ,a4 }) = {{1, 3},{2, 6},{1, 3},{4, 5),{4, 5},{2, 6}}
U/R({a2 ,a3 ,a4 }uD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R({a,,33 ,04 })= {{1, 3, 6},{2, 6},{1, 3, 6},{4, 6},{5, 6},{1, 2, 3, 4, 5, 6}}
U/R({a.,a 3,a4}uD) = {{1, 3},{2, 6},{1, 3},{4, 6},{5},{2,4, 6}}
U/R({a,,a2,a4 }) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R({a2,a3 ,a4}uD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R({a,,a2,a3 }) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
U/R({a2 ,a3,a3 }uD) = {{1, 3},{2, 6},{1, 3},{4},{5},{2, 6}}
• Finding reduct of C:
2
- ^ỉểc\{a,}(«i)=3 > 0
24



M ột sổ vấn đề chọn lọc của Công nghệ thông tin và truyền thông, Hưng Yên. ỉ 9-20 tháng 08 năm 2 0 Ỉ0

-

•yíểc\{<,,}(«3) = 0

-

■y'ểc\{a,}(«4) = 0

=> Core(C) = P = {ai,a2 }
- U /R (P)= {{1,3,4,5},{2,6},{1,3,4,5},{1,4},{!,5},{2,6}}

=> E(P) = 4
-

U /R (P uD )= {{1,3,5},{2,6},{1,3,5},{4},{!,5},{2,6}}

=> E(PuD ) = 1 + log3

-

E(P).

sigp(a3) = E(PuD)- E(Pu{a3}uD) = E(PuD)- E(ai,a2,,a3}uD)
^ 6 1 o g 3 -2
6

-


sigp(a4) = E(PuD )- E(Pu {34 }uD ) = E(PuD)- E(ai ,a2,,a4 }uD)

_ 6Iog3-2
6
=> Select as; P:= {ai,32 ,3 3 }.
=i> E(P) = ^ = E(PuD )
P = {ai, 32, 3 3 } is

3

reduct of C in DT.

The decision t3ble sfter reducing - DT’ = (U, PuD ) - is shown by Tsb. 2
Ỉ/ t
Ư Temp
He3dache Nausea
Flu '

1
No
No
No
2

Yes

Yes

Yes


3

Very-high
?

No

No

No

4

High

No

Yes

Yes

5

Normal
*

No

Yes
*


No

6

Yes

Yes

Table 2- The incomplete decision system after reducing of Table 1

3. Rule induction in incom plete decision tables
HLEM, proposed by us, is the extension of LEM2 o f G.Busse. In general, LEM2
computes 3 local covering and then converts it into a decision rule set [2,3], In HLEM
algorithm, we will find a minimal complex T for a whole characteristic set of x\ by
selecting t from the set o f condition attribute-v3lue pairs (a, a(xi)), where a(xi)
and a(xi)
7^?, corresponding with Xj instead of selecting t such that [t] consists o f as many cases as
possible. However, we won’t expand T like NewLEM2 [5], we will eliminate the
25


×