Tải bản đầy đủ (.doc) (31 trang)

XÂY DỰNG ỨNG DỤNG METRO TỔNG HỢP TIN TỪ CÁC TRANG WEB TIN TỨC

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.75 MB, 31 trang )

TRƯỜNG ĐẠI HỌC ĐIỆN LỰC
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO
BÀI TẬP LỚN MÔN HỆ CHUYÊN GIA
ĐỀ TÀI:
XÂY DỰNG ỨNG DỤNG METRO
TỔNG HỢP TIN TỪ CÁC TRANG WEB TIN TỨC
Giảng viên hướng dẫn : TS. NGUYỄN THỊ THU HÀ
Nhóm sinh viên thực hiện : PHƯƠNG VĂN CẢNH
: ĐỖ ANH ĐỨC
: DƯƠNG VĂN PHONG
: TRẦN VĂN HẢI
Chuyên ngành : CÔNG NGHỆ PHẦN MỀM
Lớp : D4-CNTT
Hà Nội - 2013
LỜI CẢM ƠN
Ngày nay, việc ứng dụng công nghệ thông tin đã trở nên phổ biến trong hầu hết
mọi cơ quan, doanh nghiệp, trường học đặc biệt là việc áp dụng các giải pháp tin học
trong công tác quản lý.
Trong ít năm trở lại đây, với tốc độ phát triển như vũ bão, CNTT đang dần làm
cho cuộc sống của con người trở nên thú vị và đơn giản hơn. Vì vậy để bắt kịp với
nhịp độ phát triển của xã hội, những kiến thức học được trên giảng đường là vô cùng
quan trọng đối với mỗi Sinh viên chúng em.
Chúng em xin chân thành cảm ơn các thầy, cô bộ môn đã tận tình giảng dạy
chúng em trong suốt thời gian học tập vừa qua. Nhờ có sự chỉ dạy tận tình của các
thầy, cô để giúp chúng em hoàn thành đồ án này.
Chúng em xin chân thành cảm ơn thầy cô!
Hà nội, ngày 24 tháng 06 năm 2013
Nhóm sinh viên thực hiện
Phương Văn Cảnh
Đỗ Anh Đức


Dương Văn Phong
Trần Văn Hải
MỤC LỤC
LỜI CẢM ƠN 2
DANH MỤC HÌNH ẢNH 6
LỜI NÓI ĐẦU 1
CHƯƠNG 1: NỀN TẢNG ỨNG DỤNG METRO – WINDOWS 8 2
1.1 TỔNG QUAN VỀ WINDOWS 8 2
1.2 DESKTOP ĐI ĐÂU RỒI? 2
1.3 THIẾT BỊ SỬ DỤNG WINDOWS 8 2
Hình 1.1. Thiết bị sử dụng Windows 8 3
Hình 1.2. Thiết bị sử dụng Windows 8 3
1.4 METRO & DESKTOP 4
1.5 GIAO DIỆN NGƯỜI DÙNG CỦA WINDOWS 8 5
1.5.1 Charm Bar 5
Hình 1.3. Charm Bar của windows 6
1.5.2 Điều hướng 7
1.5.3 Tile và Live Tile 8
Hình 1.4. Tile & Live Tile 8
1.6 KIẾN TRÚC NỀN TẢNG WINDOWS 8 8
Hình 1.5. Mô hình kiến trúc nền tảng WINDOWS 8 9
1.6.1 Core 9
1.6.2 System Services 9
1.6.3 Model Controller 9
1.6.4 View 10
CHƯƠNG 2: TỔNG QUAN BÀI TOÁN TỔNG HỢP TIN TỨC 11
2.1 YÊU CẦU BÀI TOÁN 11
2.1.1 Thực trạng phát triển của tin tức điện tử 11
2.1.2 Bài toán tổng hợp và phân loại tin tức từ các trang tin điện tử 12
2.2 PHƯƠNG PHÁP TIẾP CẬN BÀI TOÁN 13

2.2.1 Tổng hợp tin tức 13
2.2.1.1 Giới thiệu về công nghệ RSS 13
2.2.1.2 Thu thập tin tức từ trang tin điện tử 14
2.2.1.3 Phương pháp lấy tin qua RSS 16
Hình 2.1. Link RSS của 16
Hình 2.2. HTML Nội dung bài viết cần bóc tách 17
2.2.2. Lọc tin trùng 17
2.2.3 Hiển thị tin tức qua ứng dụng METRO – WINDOWS 8 18
2.2.4 Tổng đài truy vấn tin tức 18
2.3 MÔ HÌNH HỆ THỐNG 19
Hình 2.3. Mô hình hệ thống thu thập tin tức 19
CHƯƠNG 3: KẾT QUẢ HỆ THỐNG 20
3.1 ỨNG DỤNG METRO – WINDOWS 8 20
Hình 3.1. Trang chủ 20
Hình 3.2. Trang tin chuyên mục 20
Hình 3.3. Trang tin chi tiết 21
Hình 3.4. Chia sẻ tin tức – Mail + Facebook 21
Hình 3.5. Tìm kiếm tin trên trang tin 22
Hình 3.6. Thông báo – notification 22
3.2 TỔNG ĐÀI TIN NHẮN TRUY VẤN TIN TỨC 22
Hình 3.7. Thông báo sai cú pháp tin nhắn 23
Hình 3.8. Tin nhắn hướng dẫn gửi từ tổng đài 23
Hình 3.9. Các tin nhắn trả về từ tổng đài 24
KẾT LUẬN 25

DANH MỤC HÌNH ẢNH
Hình 1.1.Thiết bị sử dụng Windows 8 3
Hình 1.2.Thiết bị sử dụng Windows 8 3
Hình 1.3.Charm Bar của windows 6
Hình 1.4.Tile & Live Tile 8

Hình 1.5.Mô hình kiến trúc nền tảng WINDOWS 8 9
Hình 2.1.Link RSS của 16
Hình 2.2.HTML Nội dung bài viết cần bóc tách 17
Hình 2.3.Mô hình hệ thống thu thập tin tức 19
Hình 3.1.Trang chủ 20
Hình 3.2.Trang tin chuyên mục 20
Hình 3.3.Trang tin chi tiết 21
Hình 3.4.Chia sẻ tin tức – Mail + Facebook 21
Hình 3.5.Tìm kiếm tin trên trang tin 22
Hình 3.6.Thông báo – notification 22
Hình 3.7.Thông báo sai cú pháp tin nhắn 23
Hình 3.8.Tin nhắn hướng dẫn gửi từ tổng đài 23
Hình 3.9.Các tin nhắn trả về từ tổng đài 24
Báo cáo bài tập lớn môn Hệ Chuyên Gia
LỜI NÓI ĐẦU
Hiện nay, công nghệ thông tin được xem là một ngành mũi nhọn của các quốc
gia, đặc biệt là các quốc gia đang phát triển, tiến hành công nghiệp hóa và hiện đại hoá
như nước ta. Sự bùng nổ thông tin và sự phát triển mạnh mẽ của công nghệ kỹ thuật
số, yêu cầu muốn phát triển thì phải tin học hoá tất cả các ngành, các lĩnh vực.
Cùng với sự phát triển nhanh chóng về phần cứng máy tính, các phần mềm ngày
càng trở nên đa dạng, phong phú, hoàn thiện hơn và hỗ trợ hiệu quả cho con người.
Các phần mềm hiện nay ngày càng mô phỏng được rất nhiều nghiệp vụ khó khăn, hỗ
trợ cho người dùng thuận tiện sử dụng, thời gian xử lý nhanh chóng, và một số nghiệp
vụ được tự động hoá cao. Kết hợp với Internet đang được toàn cầu hóa, lượng người
sử dụng Internet trên toàn thế giới là vô cùng lớn.
Do vậy mà trong việc phát triển phần mềm, sự đòi hỏi không chỉ là sự chính xác,
xử lý được nhiều nghiệp vụ thực tế mà còn phải đáp ứng các yêu cầu khác như về tốc
độ, giao diện thân thiện, mô hình hoá được thực tế vào máy tính để người sử dụng tiện
lợi, quen thuộc, tính tương thích cao, bảo mật cao (đối với các dữ liệu nhạy cảm),…
Các phần mềm giúp tiết kiệm một lượng lớn thời gian, công sức của con người, và

tăng độ chính xác và hiệu quả trong công việc (nhất là việc sửa lỗi và tự động đồng bộ
hoá).
Ngày nay, với sự bùng nổ của internet và các phương tiện lưu trữ đã tạo ra một
lượng thông tin khổng lồ. Đứng trước lượng thông tin khổng lồ đó và một lượng lớn
trang báo điện tử như ngày nay, người đọc muốn cập nhật thông tin hàng ngày sẽ tốn
nhiều thời gian và công sức khi phải truy cập nhiều trang báo điện tử khác nhau. Tuy
nhiên, các trang tin báo điện tử có thể đăng tải cùng một tin tức dẫn đến việc người
đọc mất thêm thời gian bỏ qua các tin trùng lặp.
Việc xây dựng một trang web tổng hợp tin tức từ các trang báo điện tử lớn có thể
giúp người đọc khắc phục những hạn chế nêu trên. Từ đó, chúng em đi sâu nghiên cứu
và xây dựng hệ thống tổng hợp tin tức từ các website trên nền ứng dụng Metro –
Windows 8 với sự hướng dẫn của TS.Nguyễn Thi Thu Hà.
Trang 1
Báo cáo bài tập lớn môn Hệ Chuyên Gia
CHƯƠNG 1: NỀN TẢNG ỨNG DỤNG METRO – WINDOWS 8.
1.1 TỔNG QUAN VỀ WINDOWS 8.
Từ lúc còn trong "trứng nước", hệ điều hành Windows 8 đã làm tiêu tốn không
biết bao nhiêu giấy mực và cả nước bọt vì các cuộc tranh luận, suy đoán và tưởng
tượng về nó. Nóng và càng ngày càng nông dần ngay cả lúc Windows 8 đã chính thức
"ò oe chào đời" trong ngày 26 tháng 10 vừa qua. Đã có nhiều bài viết nhận định, khen,
chê, khách quan, chủ quan, trung lập nói về Windows 8. Và cũng đã có nhiều bài viết
về các thủ thuật, luật mẹo để giúp người dùng có được sự chinh phục tốt nhất với "chú
ngựa xanh" của Microsoft này.
Năm 1991, Microsoft phát hành phiên bản đầu tiên hệ điều hành của họ. Một con
chuột được sử dụng để điều khiển giao diện đồ họa người dùng như một cuộc cách
mạng trong ngành công nghệ thời bấy giờ. Và bây giờ đây, năm 2012, Microsoft lại
đặt rất nhiều hy vọng vào một cuộc cách mạng mới sẽ tạo nên một thời kỳ mới cho
ngành công nghệ máy tính, đó là hệ điều hành Windows 8 mà theo nhiều người nhận
định có lẽ là bước phát hành táo bạo nhất chưa từng có của Microsoft.
1.2 DESKTOP ĐI ĐÂU RỒI?

Sau khi cài đặt Windows 8, chắc chắn bạn sẽ bất ngờ vì những gì quá mới của
giao diện này. Desktop quen thuộc đã đi đâu rồi và thay vào đó là một màn hình hầu
như không có gì (tất nhiên vẫn có hình nền). Không quen thuộc tí nào? Nhiều người đã
nói đùa rằng: Windows 8 phát triển theo lối “Ninja„ nên các nút quen thuộc như
Start, thanh tác vụ và các biểu tượng trên desktop của các phiên bản trước hầu như đã
bị ẩn đi một cách lạ lùng. Nhưng đó chính là một giao diện hoàn toàn mới cho bạn!
Dẫu vậy, nếu là người dùng máy tính còn trong giao đoạn “tân binh„ bạn cũng
đừng lo lắng vì bạn vẫn có thể thông qua nhiều cách để tìm lại “một thoáng xa xưa
„ cho mình trên nền tảng mới mẻ này.
1.3 THIẾT BỊ SỬ DỤNG WINDOWS 8.
Trang 2
Báo cáo bài tập lớn môn Hệ Chuyên Gia
Hình 1.1. Thiết bị sử dụng Windows 8.
Trái ngược với sự lo lắng về sự “kén chọn” thiết bị phần cứng của Windows 8,
đặc biệt là những ai dùng máy tính để bàn, cho đến nay Windows 8 tỏ ra tương thích
tốt với nhiều thiết bị phần cứng. Nếu PC của bạn có khả năng chạy hệ điều hành
Winows Vista, rất cao về khả năng sẽ chạy được Windows 8. Thậm chí còn có một số
máy tính cũ được xem là “mắc kẹt” với Windows Xp vẫn có khả năng sử dụng được
Windows 8 một cách hiệu quả.
Hình 1.2. Thiết bị sử dụng Windows 8.
Trang 3
Báo cáo bài tập lớn môn Hệ Chuyên Gia
Tương tự như vậy, các dòng máy tính xách tay và Ultrabook hiện có cũng sẽ có
thể chạy tốt Windows 8 dựa vào các ứng dụng cảm ứng hữu ích. Thực tế đã chứng
minh Windows 8 vẫn đáp ứng được với các hệ thống nhỏ hơn so với Vista hoặc
Windows 7. Mặc dù vậy, Windows 8 vẫn thực sự được xem như là một hệ điều hành
dành cho các thiết bị mới. Lý do để hiểu điều này thật đơn giản: Sự thay đổi của
Windows chủ yếu tập trung vào màn hình Start và được xây dựng với cách dùng cảm
ứng. Do đó các thế hệ máy tinh mới với Windows 8 sẵn có sẽ đi kèm với màn hình
cảm ứng hay chuột với các công cụ nhận dạng cử chỉ, Mac OS X mới theo phong cách

touch-pads sẽ có sẵn trên máy tính xách tay và sẽ gần như tất cả trở thành thiết bị lai
với hiển thị màn hình cảm ứng.
Để phát triển định hướng trên, Microsoft đã thực hiện một chính sách mới trong
quan hệ với các đối tác truyền thống sản xuất phần cứng cho họ theo xu hướng…
“chơi xấu”, nghĩa là họ công bố đã thuê lại một nhà sản xuất máy tính bảng mới –
Microsoft Surface – là kết quả của bước đi này. Tuy nhiên về mặt khách quan có thể
nhận định đây là một bước tiến lớn cho một công ty thường không chuyên về phần
cứng như Microsoft và biết đâu trong tương lai không xa, thế giới sẽ được biết đến
những máy tính bộ, laptop v.v…được xây dựng trên nền tảng phần cứng mang thương
hiệu Microsoft.
Windows 8 được thiết kế để làm việc trên các thiết bị được hỗ trợ bởi một bộ xử
lý điện năng thấp ARM (được tìm thấy điển hình trong Android và máy tính bảng của
Apple) cũng như dựa trên bộ vi xử lý phổ thông là Intel x86 (đó là những gì mà hầu
hết các máy tính để bàn, máy tính xách tay và Ultrabooks sử dụng cho đến nay).
Surface được xem như là một đối thủ có sức cạnh tranh khá lớn với máy tính bảng
Android và iOS, và Windows 8 với các kho ứng dụng khổng lồ dựa trên giao diện tile–
based là nguyên nhân lớn của sự cạnh tranh khốc liệt này.
Với điều này, chắc chắn sẽ không thiếu các máy tính và máy tính bảng phù hợp
để chạy hệ điều hành mới. Nhưng cũng cần lưu ý rằng Windows 8 sử dụng trên một bộ
xử lý ARM sẽ không thể chạy các phần mềm Windows cũ, ví dụ như các trò chơi và
phiên bản cũ của Microsoft Office. Nếu muốn sử dụng những “đồ cổ” đó, người dùng
phải sử dụng bộ xử lý Intel.
1.4 METRO & DESKTOP
Màn hình Start mới của Microsoft dựa trên ngôn ngữ thiết kế Metro đầu tiên
giống như trên các thiết bị Windows Phone 7 xuất hiện trong năm 2010. Trong thời
Trang 4
Báo cáo bài tập lớn môn Hệ Chuyên Gia
gian đó, Metro đã “lây lan” sang cả Microsoft Xbox 360 và nhiều thiết bị khuyến mãi
khác nhau.
Thiết kế vuông vắn, màu sắc mạnh mẽ và sử dụng giao diện người dùng trên kiểu

chữ Segoe UI nên cho đến gần đây được gọi là Metro UI. Đó là những gì được
Microsoft tiết lộ trong nguyên mẫu Windows Phone vào đầu năm 2010 trở về sau. Kể
từ khi phát hành phiên bản Consumer Preview Windows 8, thông qua các cuộc thảo
luận với Metro AG, nhà bán lẻ hàng đầu của Đức, Microsoft đã thay đổi cách gọi tên
cho giao diện Metro là “Modern”. Tuy nhiên rất nhiều người vẫn thích gọi một cách
đơn giản là Metro.
Song song với việc cách mạng giao diện Windows, Microsoft dường như muốn
đồng bộ tất cả theo xu hướng mới này nên nếu thường xuyên sử dụng các dịch vụ trực
tuyến của Microsoft như Windows Live v.v…tất cả đều được khoát lên một giao diện
mới. Ngay cả phiên bản Office 2013 cũng đã thay đổi rất nhiều trong giao diện như
việc kết hợp chữ, rõ ràng (một biến thể của các font Segoe) với màu sắc đáng chú ý,
đường nét sắc và sống động, Các tile có khả năng hiển thị tốt trong ứng dụng dữ liệu
trông giống như các vật dụng trên một thiết bị Android hoặc các tiện ích desktop máy
tính trong Windows Vista và 7.
Nhưng tất cả những điều này không phải là để cho một máy tính để bàn truyền
thống. Tuy nhiên vẫn có rất nhiều ứng dụng tương thich, các trò chơi và các tiện ích
của Windows 8 dành cho máy tính để bàn. Đối với những ai thích giao diện Metro, sẽ
có một số lượng lớn các ứng dụng và trò chơi đã được thiết kế và có sẵn thông qua
Store Windows 8 để chạy trong màn hình Start mới.
Rõ ràng Microsoft đang hy vọng để giữ cho tất cả mọi người từ người dùng máy
tính để bàn đến người dùng máy tính bảng đều hài lòng với Windows 8 của họ.
1.5 GIAO DIỆN NGƯỜI DÙNG CỦA WINDOWS 8.
1.5.1 Charm Bar.
Có lẻ con đường tốt nhất để sử dụng Windows 8 một cách chuyên nghiệp theo
phong cách …Windows là bạn hãy quên đi rằng bạn đã sử dụng tất cả những hệ điều
hành trước đó với những thao tác gì.
Có rất nhiều cách mà bạn có thể tương tác với hệ thống, nhưng một vài trong số
đó yêu cầu bạn nhấn chuột và kéo, mở properties hoặc thực hiện một vài sự điều chỉnh
bố trí màn hình. Vấn đề đạt được sự quen thuộc với các tile và sự điều hướng là một
Trang 5

Báo cáo bài tập lớn môn Hệ Chuyên Gia
bước rất quan trọng cũng như việc “nắm bắt” được “Charms” – một mảng ẩn của các
mục menu - đều sẽ giúp bạn tự tin hơn để làm chủ “chú ngựa xanh” này.
Bạn cần phải di chuyển “chú chuột” của bạn hay dùng tap vào phía trên bên phải
hoặc dưới cùng của màn hình Windows 8 để làm hiện ra Charm bar. Thay vào thao tác
đó bạn có thể sử dụng nút Win + C trên bàn phím để mở Charm bar của Windows.
Hình 1.3. Charm Bar của windows.
Xuất hiện ở phía bên tay phải của màn hình, Charm bar cho thấy cung cấp các
tính năng và chức năng khác như:
• Search (Tìm kiếm) : Như menu Start của Windows, bạn chỉ cần gõ vào
để tìm kiếm những gì bạn muốn tìm. Khi một ứng dụng đang mở, việc tìm kiếm sẽ tập
trung vào phần mềm đó chứ không phải là máy tính riêng của mình. Đối với một tiến
trình tìm kiếm trên tổng thể máy tính bạn phải sử dụng công cụ từ màn hình Start.
• Share - Chia sẻ : các ứng dụng điều khoản chia sẻ sẽ được sử dụng để
chia sẻ các thông tin như liên kết. Cần lưu ý rằng điều này nếu sử dụng với máy tính
bàn phải thông qua trình trình duyệt Metro.
• Start : Có một tùy chọn để mở màn hình Start từ trình đơn ở góc dưới bên
trái hoặc bằng cách nhấn phím Windows trên bàn phím.
• Device : Cài đặt cho các thiết bị ngoại vi như màn hình thứ 2/ bên ngoài
và có thể điều chỉnh được.
Trang 6
Báo cáo bài tập lớn môn Hệ Chuyên Gia
• Setting : Cài đặt Audio, Brightness, Wi-Fi, Power, Notifcations và
Language đều được truy cập từ đây. Liên kết PC Setting sẽ cho phép bạn truy cập các
tùy chọn trong Control Panel. Các tùy chọn Setting sẽ hiển thị các thiết lâp cho các
ứng dụng cá nhân trong khi chúng đang hoạt động. Các tùy chọn hiển thị theo phong
cách Metro. Ở phía bên trái màn hình của bạn, ngày tháng, thời gian và thông tin pin
và kết nối mạng không dây cũng sẽ được hiển thị.
Cần lưu ý rằng các ứng dụng (chính thống và bên thứ ba) sẽ có các menu ngữ
cảnh của riêng mình. Các menu này đều có thể truy cập bằng cách nhấp chuột.

1.5.2 Điều hướng.
Với ba cách để trở về với menu Start, việc điều hướng thông qua Windows 8 sẽ
trở nên đơn giản rất nhiều. Tùy thuộc vào thiết bị của bạn, bạn sẽ có ba phương cách.
Đồi với người dùng máy tính bảng, việc sử dụng các ngón tay sẽ cho phép bạn để
swipe bên trái và phải, zoom và tap. Với máy tính xách tay hoặc máy tính để bàn,
chuột và bàn phím (hoặc có thể là touchpad) sẽ cho phép bạn tìm theo cách của bạn
xung quanh Windows 8.
Thay vì lo lắng cho vấn đề điều hướng ở giai đoạn này, theo các chuyên gia, bạn
chỉ nên nhận định vấn đề đơn giản rằng màn hình Start và Charm bar là chìa khóa để
nhận được từ A đến B trong Windows 8.
Trang 7
Báo cáo bài tập lớn môn Hệ Chuyên Gia
1.5.3 Tile và Live Tile.
Hình 1.4. Tile & Live Tile.
Trên màn hình Start sẽ tìm thấy hai loại của Tile. Đầu tiên bạn sẽ nhận thấy các
Tile tĩnh. Chắc hạn là hiển thị của Internet Explorer cũng giống như đây là các biểu
tượng Desktop thời cũ. Tuy nhiên những điều đó không quan trọng so với những gì mà
Windows 8 và Microsoft đang thực hiện với hệ điều hành mới này chính là các Live
Tile, các khung hình vuông, chữ nhật hiển thị thông tin quan trọng chẳng hạn như các
đối tượng của thông báo có email mới hay thông tin về nhiệt độ … có thể được hiển
thị mà người dùng không cần phải tạm dừng các thao tác khác để mở nó ra.
Nhờ tính năng này, việc sử dụng Windows 8 trở nên khá dễ chịu. Tương tự như
các Widget của Android 4.0 Ice Cream Sandwich và sau đó (nhưng có liên quan chặt
chẽ hơn tới Tile của Windows Phone), Live Tile là một thiết kế sử dụng tiết kiệm thời
gian và mang lại sức sống mới cho máy tính bảng hoặc máy tính của bạn.
1.6 KIẾN TRÚC NỀN TẢNG WINDOWS 8.
Trong phần này, chúng ta sẽ chỉ quan tâm đến kiến trúc nền tảng của hệ thống
ứng dụng theo thiết kế Metro.
Trang 8
Báo cáo bài tập lớn môn Hệ Chuyên Gia

Hình 1.5. Mô hình kiến trúc nền tảng WINDOWS 8.
1.6.1 Core.
Windows Core OS Services : các dịch vụ của hệ điều hành cốt lõi (hệ điều hành)
bao gồm hạt nhân Microsoft ® Windows ® CE và các tính năng phổ biến khác cho tất
cả các hệ điều hành CE thiết kế Windows. Các dịch vụ hệ điều hành cốt lõi cho phép
thực thi các nhiệm vụ ở mức độ thấp, chẳng hạn như xử lý, luồng, và quản lý bộ nhớ.
Trình điều khiển thiết bị cơ bản cũng là một phần của CE cốt lõi dịch vụ hệ điều hành
Windows.
1.6.2 System Services.
Dịch vụ hệ thống, cũng cấp các gói WinRT APIs được xây dựng sẵn, bao gồm
các hàm xử lý thông tin và dữ liệu, các hàm xử lý đồ họa và âm thanh, các thiết bị
phần cứng và máy in, ngoài ra còn một tập hợp rất lớn những thư viện mô hình ứng
dụng đã được xây dựng sẵn.
1.6.3 Model Controller
Mô hình điều khiển, cung cấp bộ công cụ thiết kế, xây dựng ứng dụng, thao tác
trực tiếp với các tầng dưới của mô hình kiến trúc nền tảng Windows 8.
Với hệ thống ứng dụng theo thiết kế Metro, Windows 8 cung cấp bộ công cụ trên
các ngôn ngữ C/C++ và VB/C#, hoặc JavaScript bao gồm các thư viện hàm, thủ tục.
Người dùng có thể tác động để thực hiện các nhiệm vụ quản trị hệ thống khác nhau.
Trang 9
Báo cáo bài tập lớn môn Hệ Chuyên Gia
1.6.4 View
Windows 8 Metro cung cấp bộ công cụ mới XAML cũng như HTML5/CSS để
thiết kế giao diện. Là một cái nhìn cụ thể theo ý đồ của người thiết kế, thông qua đó
tác động đến Model Controller, thực hiện các nhiệm vụ quản trị hệ thống khác nhau.
Bất cứ thứ gì được tạo ra hoặc thực hiện trong XAML có thể được thể hiện bằng
cách sử dụng truyền thống NET,. Như C # hoặc Visual Basic.NET. Tuy nhiên, một
khía cạnh quan trọng của công nghệ này là sự giảm phức tạp cần thiết cho các công cụ
để xử lý XAML, bởi vì nó được dựa trên XML. Do đó, một loạt các sản phẩm đang
nổi lên, đặc biệt là trong không gian WPF, mà tạo ra các ứng dụng dựa trên XAML .

Như XAML chỉ đơn giản là dựa trên XML, các nhà phát triển và nhà thiết kế có thể
chia sẻ và chỉnh sửa nội dung tự do với nhau mà không cần biên dịch. Vì nó liên quan
chặt chẽ với các công nghệ NET Framework 3.0., Việc thực hiện chỉ hoàn toàn tuân
thủ hiện nay là Microsoft. [Wikipedia].
Khi được sử dụng trong Windows Presentation Foundation, XAML được sử
dụng để mô tả các giao diện người dùng trực quan. WPF cho phép định nghĩa các đối
tượng cả 2D và 3D, quay, hình ảnh động, và một loạt các hiệu ứng và các tính năng.
Khi được sử dụng trong Windows Workflow Foundation bối cảnh, XAML được
sử dụng để mô tả khả năng lý khai báo dài hạn, chẳng hạn như những người tạo ra bởi
các công cụ mô hình hóa quy trình và hệ thống quy tắc. Định dạng tuần tự cho công
việc trước đây được gọi là XOML, để phân biệt nó từ giao diện người dùng đánh dấu
sử dụng XAML, nhưng bây giờ họ không còn phân biệt. Tuy nhiên, phần mở rộng tập
tin cho các tập tin có chứa các đánh dấu công việc vẫn là "XOML".
Trang 10
Báo cáo bài tập lớn môn Hệ Chuyên Gia
CHƯƠNG 2: TỔNG QUAN BÀI TOÁN TỔNG HỢP TIN TỨC.
2.1 YÊU CẦU BÀI TOÁN
2.1.1 Thực trạng phát triển của tin tức điện tử.
Xuất hiện tử thập kỷ 70 thế kỷ XIX, bùng nổ phát triển vào cuối thế kỷ XX,
Internet mang đến cho người sử dụng nhiều tiện ích như thông tin điện tử, thư điện tử
(email), trò chuyện trực tuyến (chat), tìm kiếm dữ liệu, dịch vụ thương mại, y tế, giáo
dục, quản lý hành chính, điều hành công việc… Internet cung cấp đồng thời một khối
lượng thông tin, dịch vụ khổng lồ trên phạm vi rộng khắp. Nhờ internet mọi người có
thể mở rộng mối quan hệ đến tất cả bạn bè trên thế giới một cách nhanh chóng và ít
tốn kém. Internet còn là nơi để con người sáng tạo không ngừng, là đòn bẩy giúp phát
huy sức mạnh cộng đồng, góp sức xây dựng và phát triển kinh tế tri thức Có thể nói
Internet đã tạo ra nền văn minh mới cho loài người.
Việt Nam chính thức kết nối Internet toàn cầu vào 19-11-1997, sau gần 15 năm
phát triển, đến nay cả nước có khoảng 30,92 triệu người sử dụng Internet, bằng
35,33% số dân. Đây là tỷ lệ khá cao so với khu vực. Dự báo trong 3 năm tới, số người

sử dụng ước tính sẽ đạt 40-45 triệu, chiếm gần 50% dân số.
Sự phát triển nhảy vọt của Internet và công nghệ điện tử đã dẫn đến sự thay đổi
mối tương quan giữa người đưa tin và người nhận tin, rõ nhất là lĩnh vực báo chí. Hơn
hai thập niên trước, các cơ quan báo chí, nhà báo dường như có “toàn quyền” trong
việc đưa, thậm chí áp đặt thông tin (nội dung, thời điểm, thời lượng, mức độ, đối
tượng, phạm vi…). Phía tiếp nhận thông tin thường ở thế thụ động, chịu sự áp đặt, ít
khi có sự phản hồi. Ngày nay, tương quan này đã thay đổi, số đơn vị, người đưa tin
trên báo chí điện tử, mạng xã hội gia tăng nhanh chóng. Theo đó, số đơn vị, số người
nhận tin tăng theo không thua kém. Cơ quan báo chí và nhà báo chuyên nghiệp không
còn là người độc quyền cung cấp thông tin. Thói quen đọc báo của người dân cũng
thay đổi, nhất là giới trẻ, từ chỗ chỉ đọc báo truyền thống (báo in) sang chủ yếu đọc
báo điện tử và mạng xã hội.Vậy báo điện tử là gì?
Báo điện tử hay báo mạng là loại báo được sản xuất bởi tòa soạn điện tử mà
người ta có thể đọc nó trên máy tính, điện thoại di động, máy tính bảng… khi có kết
nối internet. Khác vơi báo in, báo điện tử được cập nhật thường xuyên, tin ngắn và
thông tin có được từ nhiều nguồn khác nhau. Nó cũng khác so với trang thông tin điện
tử về tần suất cập nhật.
Trang 11
Báo cáo bài tập lớn môn Hệ Chuyên Gia
Báo điện tử cho phép mọi người trên thế giới tiếp cận tin tức nhanh chóng không
phụ thuộc vào không gian và thời gian, sự phát triển của Báo điện tử đã làm thay đổi
thói quen đọc tin và ít nhiều ảnh hưởng đến việc phát triển báo giấy truyền thống
Nhận thức được xu thế phát triển, khả năng tác động sâu sắc, toàn diện đến mọi
mặt của đời sống xã hội của báo điện tử, ngày 22-7-2005, Bộ Chính trị đã ban hành
Chỉ thị số 52-CT/TW về phát triển và quản lý báo điện tử ở nước ta hiện nay, để tăng
cường quản lý; thúc đẩy, tạo điều kiện cho báo chí điện tử phát triển đúng định hướng,
góp phần cùng với các loại hình báo chí truyền thống thực hiện tốt các nhiệm vụ chính
trị, phục vụ sự nghiệp đổi mới đất nước.
Sau 7 năm thực hiện Chỉ thị 52-CT/TW, báo chí điện tử có sự phát triển nhanh cả
về số lượng và chất lượng; đội ngũ cán bộ, phóng viên, biên tập viên làm báo điện tử

cũng được bổ sung, tăng cường về số lượng và trình độ chuyên môn, chính trị. Báo chí
điện tử Việt Nam đang từng bước phát huy các lợi thế công nghệ, khẳng định vị thế
ngày càng quan trọng trong hệ thống báo chí cách mạng. Thực hiện tốt nhiệm vụ thông
tin tuyên truyền chủ trương, đường lối của Đảng, chính sách, pháp luật của Nhà nước,
đáp ứng nhu cầu thông tin giải trí của xã hội, đồng thời là phương tiện thông tin đối
ngoại quan trọng và hiệu quả, là vũ khí sắc bén trong cuộc đấu tranh chống diễn biến
hoà bình trên mặt trận tư tưởng…
Bên cạnh những ưu điểm nói trên, báo chí điện tử còn không ít khuyết điểm,
thiếu sót như: Thực hiện không đúng tôn chỉ mục đích, còn nhiều thông tin sai sự thật,
có xu hướng đưa nhiều tin theo kiểu “giật gân”, câu khách, khai thác nhiều thông tin
về các vụ án, chuyện đời tư cá nhân, các vấn đề tâm linh, mê tín dị đoan, vụ việc tiêu
cực…; một số vấn đề phức tạp, nhạy cảm liên quan đến đối ngoại đưa tin thiếu thận
trọng, gây ảnh hưởng xấu trong xã hội và quan hệ ngoại giao.[1]
2.1.2 Bài toán tổng hợp và phân loại tin tức từ các trang tin điện tử.
Với sự bùng nổ quá nhanh chóng của hệ thống báo điện tử, việc xuất hiện quá
nhiều tờ báo mạng, khối lượng tin tức hằng ngày được đưa lên là khổng lồ. Khi đó,
những trang tin có uy tín với những bài viết chất lượng sẽ thu hút được lượng view
nhiều hơn. Tuy nhiên, nhược điểm của người này lại có thể là ưu điểm của người khác,
cũng không tránh được quy luật đó, các trang báo tuy có uy tín lớn nhưng một trang
không thể đáp ứng toàn bộ lượng tin tức. Điều đó gây ra khó khăn cho người đọc có
thể cập nhật tin tức một cách nhanh chóng. Người dùng sẽ phải truy cập nhiều trang
tin khác nhau để có thể làm được việc đó. Chưa kể đến việc những tin tức này có thể
có nội dung trùng nhau ở nhiều báo khác nhau.
Trang 12
Báo cáo bài tập lớn môn Hệ Chuyên Gia
Vì vậy một hệ thống tổng hợp và phân loại tin tức từ nhiều trang báo khác nhau
là cần thiết và thiết thực. Ngoài ra, môi trường Metro trên windows 8 là một môi
trường mới, trên một khía cạnh nào đó, nó đáp ứng rất tốt yêu cầu của người dùng vì
sự tiện lợi khi sử dụng với máy tính bảng, hệ thống máy tính có màn hình cảm ứng …
Bên cạnh đó, một hệ thống tổng hợp tin trên Windows 8 sẽ nhanh chóng đem lại lợi

ích lớn. Người dùng có thể thay vì mở trình duyệt nhiều trang tin khác nhau bằng việc
mở một ứng dụng duy nhất với giao diện metro bắt mắt sẽ làm cho người dùng cảm
thấy thoải mái hơn rất nhiều.
 Yêu cầu đặt ra:
Một ứng dụng Windows 8 theo phong cách metro có khả năng tổng hợp, phân
loại và hiển thị tin tức từ nhiều trang báo khác nhau, với giao diện bắt mắt và tạo cảm
giác thoải mái nhất cho người dùng khi sử dụng hệ thống.
Một tổng đài di động, cho phép người dùng không có sẵn mạng có thể cập nhật
những tin tức mới nhất theo các chuyên mục thông qua việc nhắn tin đến tổng đài, với
chi phí không quá đắt.
 Mục tiêu của hệ thống:
Về mặt chức năng, mục tiêu của hệ thống là lấy tin, lọc tin và hiển thị tin tức từ
nhiều trang báo điện tử khác nhau.
2.2 PHƯƠNG PHÁP TIẾP CẬN BÀI TOÁN.
2.2.1 Tổng hợp tin tức.
2.2.1.1 Giới thiệu về công nghệ RSS.
RSS là một định dạng tập tin thuộc học XML dùng trong việc chia sẻ tin tức
web, được dùng bởi nhiều website tin tức và weblog. Chữ viết tắt dùng để chỉ các
chuẩn sau:
• Rich Site Summary (RSS 0.91)
• RDF Site Summary (RSS 0.9 and 1.0)
• Really Simple Syndication (RSS 2.0.0)
Công nghệ RSS cho phép người dùng internet có thể đặt mua thông tin tử các
website có cung cấp khả năng RSS (RSS feeds). Chúng thường là các site có nội dung
thay đổi và được thêm vào thường xuyên. Để có thế dùng công nghệ này, người quản
trị site đó tạo hay quản lý một phần mềm chuyên dụng với định dạng XML mà máy có
thể đọc được, có thể biểu diễn bài tin mới thành một danh sách, với một hoặc hai dòng
Trang 13
Báo cáo bài tập lớn môn Hệ Chuyên Gia
cho mỗi bài tin và một liên kết đến bài tin đầy đủ đó. Khác với việc mua nhiều ấn bản

của các tờ báo hay tạp chí in giấy, hầu hết việc mua RSS là miễn phí.
Định dạng RSS cung cấp nội dung web và tóm tắt nội dung cùng với các liên kết
đến phiên bản đầy đủ của nội dung tin đó, và các siêu-dữ-liệu khác. Thông tin này
được cung cấp dưới dạng một tập tin XML được gọi là một RSS feed, webfeed, RSS
stream, hay RSS channel. Cùng với việc hỗ trợ cung cấp chia sẻ thông tin, RSS cho
phép những độc giả thường xuyên của một website có thể theo dõi các cập nhật của
site đó dùng một Aggregator.
RSS được sử dụng phổ biến bởi cộng đồng weblog để chia sẻ những tiêu đề tin
tức mới nhất hay toàn bộ nội dung của nó, kể cả các tập tin đa phương tiện đính kèm.
Vào giữa năm 2000, việc sử dụng RSS trở nên phổ dụng đối với các hãng tin tức lớn
như là: Reuters, CNN, và BBC. Những nhà cung cấp tin này cho phép các website
khác tổng hợp những tiêu đề tin tức “được chia sẻ” hay cung cấp các tóm tắt ngắn gọn
của các bản tin chính dưới nhiều hình thức thỏa hiệp khác nhau. RSS ngày nay được
dùng cho nhiều mục đích, bao gồm tiếp thị, báo cáo lỗi hay cập nhật và xuất bản định
kỳ.
Một chương trình gọi là một feed reader hay aggregator có thể kiểm tra xem một
website có hỗ trợ RSS cho người dùng không và nếu có, hiển thị những bài viết cập
nhật nhất mà nó tìm thấy từ website đó. Ngày nay có thể tìm thấy RSS feeds trên rất
nhiều website.
Các công cụ đọc tin phía khách và công cụ aggregator thường được xây dựng
thành một chương trình độc lập hoặc là một phần mở rộng của các chương trình có sẵn
như trình duyệt web. Những chương trình như vậy có mặt trên nhiều hệ điều hành
khác nhau.
Các phần mềm thu thập tin tức như trên không đòi hỏi phải cài đặt và có thể sử
dụng trên các máy tính kết nối internet. Một số aggregator kết hợp khả năng chia sẻ tin
tức, ví dụ: lấy mọi thông tin bóng đá từ nhiều nguồn tin và cung cấp thành một nguồn
tin mới. Đây cũng chính là các động cơ tìm kiếm nội dung được đăng tải thông qua
RSS feeds như Feedster hay Blogdigger.
2.2.1.2 Thu thập tin tức từ trang tin điện tử.
Trang 14

Báo cáo bài tập lớn môn Hệ Chuyên Gia
Việc lấy tin hiện nay có rất nhiều các phương pháp, tuy nhiên trong báo cáo này
trình bày việc lấy tin bằng RSS. Đa số các trang tin tức hiện nay đều cung cấp cho ta
những RSS, vì vậy việc lấy tin qua RSS đơn giản hơn rất nhiều.
 Lấy tin qua RSS có thể lấy theo 2 cách:
• Lấy theo đúng chuyên mục: tức là lấy RSS của từng chuyên mục như
văn hóa, xã hội, pháp luật,… việc lấy tin theo đúng chuyên mục có ưu điểm là các tin
lấy về không cần phân loại. Tuy nhiên nó có nhược điểm là phải sử dụng nhiều RSS,
vì mỗi chuyên mục phải cần ít nhất 1 RSS.
• Lấy theo 1 RSS duy nhất, ví dụ như RSS trang chủ(của dân trí) hay rss
tin tức hàng ngày(của 24h). Việc lấy tin theo cách này có ưu điểm là sử dụng ít RSS
(chỉ cần 1 RSS) nhưng việc lấy tin theo cách này thì phải phân loại, vì lấy theo 1 RSS
thì các tin sẽ nằm ở tất cả các chuyên mục.
 Việc thu thập toàn bộ các tin về rồi phân loại đôi khi lại mang một số rủi ro
như độ chính xác của phân loại. Còn việc thu thập thông tin theo các chuyên mục sẽ
giảm triệt để được rủi ro đó do các bài đăng đã được đặt theo đúng chủ đề, tuy nhiên
sẽ tốn thời gian xử lý hơn.
 Đề nghị hướng giải quyết:
Với cách lấy RSS theo chuyên mục, ta sẽ xây dựng một service có nhiệm vụ
chính là tổng hợp tin tức từ các trang tin. Service sẽ tự động cập nhật các tin tức 10
phút một lần. Theo đó, việc thu thập tin tức sẽ trở thành truy vấn các hàm của service
để lấy dữ liệu, điều này sẽ giảm thiểu rất nhiều thời gian xử lý lấy RSS mà còn đảm
bảo tính chính xác của việc phân danh mục tin tức.
Ngoài ra, việc xử lý service sẽ cho ta một không gian lưu trữ lớn hơn rất nhiều so
với lưu trữ qua SqlLite của Windows 8 Metro, mà chi phí phải bỏ ra không phải là quá
lớn so với những gì mà một hệ thống như thế này có thể đem lại.
Service ngoài việc thực hiện thu thập tin tức từ các trang tin, nhóm còn xây dựng
một fanpage Facebook, sử dụng APIs của Facebook để đăng tin lên fanpage. Những
tin tức mới cập nhật vào hệ thống ngay lập tức sẽ được đăng lên fanpage. Và hệ thống
sẽ cung cấp cho người dùng chức năng comment Facebook thông qua APIs của

Facebook. Phản hồi từ phía người dùng sẽ có yếu tố rất quan trọng trong việc kích
thích, chia sẻ tin tức, tạo cảm giác thoải mái cho người sử dụng hệ thống và giúp quản
trị viên có thể thống kê được sự quan tâm của người dùng tới các tin đăng.
Trang 15
Báo cáo bài tập lớn môn Hệ Chuyên Gia
2.2.1.3 Phương pháp lấy tin qua RSS.
RSS được cung cấp hầu hết ở các Forum hiện đại, các Website tin tức… Bạn có
thể dễ dàng nhận biết một Website có cung cấp RSS nhờ biểu tượng . Hầu hết các
nguồn tin RSS đó đều miễn phí sử dụng cho mục đích phi thương mại.
 Bước 1: Lấy link RSS
Lấy link RSS của website, ví dụ lấy của trang
Hình 2.1. Link RSS của
 Bước 2 : Download RSS về dưới dạng *.XML
 Bước 3 : Thực hiện việc tách đoạn XML ở bước 2 để lấy các thông tin
cần thiết
Trang 16
Báo cáo bài tập lớn môn Hệ Chuyên Gia
Đây là bước quan trọng nhất để lấy tin, tách lấy thông tin cần thiết là việc lấy ra
Phân loại, Tiêu đề, Tóm tắt và nội dung của bài đăng, thời gian đăng.
Với một số trang, RSS có cung cấp nội dung của bài viết, việc xử lý với trang đó
sẽ dễ dàng hơn rất nhiều. Với một số trang khác ví dụ , nội
dung bài viết không được cung cấp trong file XML của RSS, vì vậy thông qua đường
link bài viết ta có được file HTML của trang tin, cần phải bóc tách HTML này thêm
một lần nữa để tách ra được nội dung bài viết có cấu trúc phù hợp.

Hình 2.2. HTML Nội dung bài viết cần bóc tách.
Do ảnh đại diện của bài viết hiển thị ở trang chủ quá nhỏ, và RSS không cung
cấp ảnh đại diện nên ảnh đại diện cho bài viết sẽ được lấy ngẫu nhiên ở trong phần nội
dung bài viết.
2.2.2. Lọc tin trùng.

 Vấn Đề: Với việc thu thập tin tức từ nhiều trang tin khác nhau sẽ có thể thu
được các tin có nội dung tương tự nhau từ các trang khác nhau. Điều này gây dư thừa
thông tin lưu trữ. Tuy nhiên, trên thực tế với lối hành văn của các nhà báo khác nhau
sẽ gây khó khăn rất lớn cho hệ thống lọc tin. Một số phương pháp đề xuất chỉ đem lại
kết quả khoảng 10~20% chính xác (tức là chỉ xử nhận biết được với 2 chuỗi có nội
dung tương đương đến 90%) nhưng lại cho thấy tốc độ xử lý quá chậm với một hệ
thống nhiều tin tức như vậy.
 Hướng giải quyết: Xử lý tạm thời bằng tay và xử lý tự động với tiêu đề bài
viết với độ tương đồng của 2 tiêu đề ~ 90%. Sẽ đề xuất nghiên cứu thêm trong các
phiên bản tiếp theo của hệ thống.
Trang 17
Báo cáo bài tập lớn môn Hệ Chuyên Gia
2.2.3 Hiển thị tin tức qua ứng dụng METRO – WINDOWS 8
Sau khi xây dựng Service, Service có cung cấp cho các ứng dụng WINDOWS 8
những hàm truy vấn, dữ liệu sẽ được lấy về, xử lý và hiển thị lên hệ thống. Ngoài ra,
ứng dụng còn hỗ trợ tìm kiếm và Share tin thông qua Charm Bar.
Thông báo - Notification tin mới sẽ kiểm tra mỗi 5 phút một lần, nếu có tin mới
cập nhật, hệ thống sẽ đưa ra thông báo cho người dùng – tính năng này có thể tắt.
2.2.4 Tổng đài truy vấn tin tức.
 Vấn Đề: Với những đối tượng thường xuyên phải di chuyển, không có kết
nối Internet hay kết nối mạng không dây, việc theo dõi tin tức trở nên khó khăn. Hiện
nay, mạng di động đã và đang phủ sóng khắp mọi nơi. Sự tiện lợi của các mạng di
động thúc đẩy việc phổ biến điện thoại di động trên mọi tầng lớp xã hội. Một tổng đài
di động, cho phép người dùng không có sẵn mạng có thể cập nhật những tin tức mới
nhất theo các chuyên mục thông qua việc nhắn tin đến tổng đài, với chi phí không quá
đắt là thực sự cần thiết.
 Hướng giải quyết: Xây dựng một hệ thống tổng đài trên Android.
Hệ thống có nhiệm vụ lắng nghe tin nhắn gửi đến, truy vấn đến service lấy thông
tin cần thiết và trả về thông tin đó theo đúng yêu cầu từ phía khách hàng.
Trang 18

Báo cáo bài tập lớn môn Hệ Chuyên Gia
2.3 MÔ HÌNH HỆ THỐNG.
Hình 2.3. Mô hình hệ thống thu thập tin tức.
Trang 19

×