Tải bản đầy đủ (.doc) (34 trang)

Hệ thống khai thác và quản lý nội dung trên nền web iCMS

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (391.54 KB, 34 trang )

Hệ thống khai thác và quản lý nội
dung trên nền web iCMS
Nhóm iCMS
Nguyễn Công Kha
Tôn Nữ Minh Anh
Đặng Quang Huy
Nguyễn Anh Tuấn
Nguyễn Thanh Tùng


Hà nội

Mục lục
I. Giới thiệu...............................................................................................4
I.1. Nhu cầu thực tế...................................................................................................4
I.1.1. Thực trạng các web site tại Việt Nam...................................................................................4
I.1.2. Nhu cầu về cập nhật và quản lý nội dung thông tin web site................................................4

I.2. Hoàn cảnh ra đời.................................................................................................5
I.3. Giới thiệu sản phẩm............................................................................................6
I.4. Các khó khăn và cách giải quyết trong quá trình phát triển sản phẩm...............9
I.5. Các kết quả đã đạt được...................................................................................11
I.6. Đánh giá tiềm năng thị trường...........................................................................11

II. Cơ sở lý thuyết ..................................................................................13
II.1. Yêu cầu đối với hệ thống quản lý nội dung (Content Management System) và
hướng áp dụng trong iCMS.....................................................................................13
II.1.1. Giới thiệu chung về hệ thống quản lý nội dung..................................................................13
II.1.2. Các chức năng cơ bản mà một hệ thống CMS phải có.....................................................13
II.1.3. Các yêu cầu mới hiện nay đối với hệ thống CMS chuyên nghiệp......................................14
II.1.4. Định hướng phát triển cho sản phẩm iCMS.......................................................................15



II.2. Lý thuyết về thu thập và phân tích thông tin và hướng tích hợp với hệ quản lý
nội dung iCMS.........................................................................................................15
II.2.1. Toàn cảnh.......................................................................................................................... 15
II.2.2. Khái niệm........................................................................................................................... 15
II.2.3. Tầm quan trọng.................................................................................................................. 16
II.2.4. Mô hình về một hệ thống thu thập và phân tích thông tin..................................................16
II.2.5. Thiết kế phần thu thập thông tin của iCMS NewsSpider....................................................16
II.2.6. Thiết kế phần phân tích thông tin của iCMS NewsSpider..................................................17
II.2.7. Mô hình của một hệ thống hoạt động tự động trong iCMS NewsSpider............................18
II.2.8. Phân phối thông tin và hướng tích hợp với iCMS..............................................................18

III. Mô tả giải pháp..................................................................................20
III.1. Các đặc điểm cơ bản của iCMS......................................................................20

Hồ sơ dự thi Trí tuệ Việt Nam

2


III.1.1. Đa hệ điều hành................................................................................................................ 20
III.1.2. Đa hệ quản trị cơ sở dữ liệu............................................................................................. 20
III.1.3. Hỗ trợ chuẩn xuất bản và thu nhận thông tin theo XML, RDF, RSS.................................20
III.1.4. Hệ thống thu thập và phân loại thông tin từ các nguồn xuất bản không tuân theo chuẩn
( dành riêng cho điều kiện Việt Nam)........................................................................................... 21
III.1.5. Multi Input ( Multi document format, Multi protocol, RDF source…)..................................21
III.1.6. Multi Output (Web Browser, Printer, WAP Mobile Phone, iCMS Offline Client, RSS …). .21
III.1.7. Quản lý quy trình và phân quyền biên tập thông tin..........................................................21
III.1.8. Cơ chế quản lý tính duy nhất (kiểm tra vào ra (Check-in; Check-out)).............................22
III.1.9. Quản lý phiên bản (Versioning)......................................................................................... 23

III.1.10. Đa ngôn ngữ................................................................................................................... 23
III.1.11. Đa giao diện, đa website.................................................................................................23
III.1.12. Tối ưu hoá cho các máy tìm kiếm...................................................................................23
III.1.13. Tìm kiếm Toàn văn đa ngôn ngữ trên toàn bộ dữ liệu....................................................24
III.1.14. Thống kê và phân tích thông tin......................................................................................24
III.1.15. Sao lưu dự phòng và hồi phục........................................................................................ 24
III.1.16. Bảo mật........................................................................................................................... 25
III.1.17. Xuất bản thông tin........................................................................................................... 25
III.1.18. Khả năng tích hợp và mở rộng.......................................................................................25

III.2. Mô hình triển khai............................................................................................25

IV. Ưu điểm của iCMS và so sánh với các hệ thống khác.....................27
IV.1.1. Ưu điểm của việc ứng dụng iCMS....................................................................................27

V. Tài liệu cài đặt và sử dụng iCMS.......................................................30
V.1. Yêu cầu môi trường triển khai..........................................................................30
V.2. Hướng dẫn cài đặt...........................................................................................30
V.3. Hướng dẫn sử dụng iCMS...............................................................................30
V.4. Hướng dẫn sử dụng module iCMS News Spider............................................30
V.5. Hướng dẫn sử dụng phần mềm iCMS Off-line Client......................................30

VI. Kết luận và định hướng phát triển tiếp theo......................................31
VI.1. Nguyện vọng trong tương lai..........................................................................32

VII. Tài liệu tham khảo............................................................................33

Hồ sơ dự thi Trí tuệ Việt Nam

3



I.

Giới thiệu

I.1.

Nhu cầu thực tế
I.1.1.

Thực trạng các web site tại Việt Nam

a)
Theo một tài liệu của Bộ Khoa học và Công nghệ thì hiện nay, Việt Nam có
khoảng 10.000 web site tiếng Việt và là một số lượng khá khiêm tốn nếu biết rằng
trong cả nước có khoảng 70 ngàn doanh nghiệp, không kể số lượng hàng ngàn các
đơn vị, cơ quan trong hệ thống quản lý của nhà nước. Nhu cầu xây dựng web site tại
Việt Nam, đặc biệt là các web site tiếng Việt như vậy còn rất lớn.
b)
Thông tin trên các web site của Việt Nam nói chung được đánh giá là còn sơ
sài, nghèo nàn và chưa đáp ứng được nhu cầu của người sử dụng cả trong nước lẫn
ngoài nước. Một trong những nguyên nhân cơ bản mang tính kỹ thuật là do thiếu qui
trình cập nhật thông tin, thiếu các công cụ phần mềm cho việc cập nhật và quản trị
nội dung thông tin, đặc biệt là các công cụ bằng tiếng Việt.
I.1.2.

Nhu cầu về cập nhật và quản lý nội dung thông tin web site

a)

Đa phần các web site cập nhật thông tin từ xa bằng các tệp siêu văn bản thông
qua một phần mềm truyền tệp được cài đặt trên máy trạm rồi được chuyển vào máy
chủ truyền tệp. Từ đây dữ liệu được lấy ra, được duyệt và được đưa lên web site
bằng phương pháp sao chép thủ công.
b)
Số ít các web site được cập nhật nhờ các form mẫu được thiết kế để nhập dữ
liệu vào trong một hệ quản trị cơ sở dữ liệu và các dữ liệu này có kết nối với các tệp
siêu văn bản và hình ảnh nằm trong cây thư mục của máy chủ web. Rất nhiều các
form mẫu nhập liệu loại này chỉ có thể chạy trên một hệ thống mạng LAN.
c)
Với hai cách trên, việc cập nhập dữ liệu của hầu hết các web site không được tự
động hoá bằng một qui trình khép kín, làm nảy sinh mâu thuẫn giữa người chịu trách
nhiệm về thông tin và người đưa thông tin lên web site.
d)
Cũng do những cách cập nhật nội dung như trên, việc quản lý nội dung thông
tin web site trở nên khó khăn, đôi khi là không thể thực hiện được. Những ví dụ
thường thấy là rất nhiều web site có những thông tin đã cũ rích, không còn giá trị
nhưng vẫn tồn tại vì có lẽ trước đó, người ta chỉ nghĩ tới việc đưa các thông tin lên
web site chứ chưa nghĩ tới việc đưa nó xuống như thế nào.

Hồ sơ dự thi Trí tuệ Việt Nam

4


e)
Vì vậy, việc xây dựng web site với những công cụ cập nhật và quản lý nội dung
thông tin được tích hợp ngay trên web site đó, là một nhu cầu rất lớn hiện nay tại
Việt Nam.
Những nhược điểm của các web site hiện hành được phân tích bên trên có thể giải

quyết được bằng một hệ thống quản trị nội dung thông tin web site như iCMS. iCMS
là một hệ quản lý thông tin website được xây dựng

I.2.

Hoàn cảnh ra đời
* Đầu năm 2001, khi tham gia trong CLB Nhà doanh nghiệp tương lai ĐHNT,
Nguyễn Công Kha tham gia phụ trách mảng xây dựng một Website thông tin phục
vụ nghiên cứu và hoạt động của CLB. Bài toán đặt ra là có một phần mềm quản lý
việc đưa tin lên Web một cách thuận tiện, đơn giản và dễ dàng, bất kỳ người nào có
kiến thức cơ bản về tin học cũng thể sử dụng được. Một bài toán khác cũng đặt ra lúc
đấy là việc khai thác, biên tập thông tin trên mạng rất tốn rất nhiều thời gian online
và công sức tìm kiếm của nhiều người trong ban biên tập, trong khi đó chi phí
Internet lúc đó chủ yếu do các thành viên tự trả. Do vậy, nếu có một công cụ nào đấy
giúp việc khai thác thông tin trên mạng nhanh chóng, dễ dàng, có thể sử dụng offline, một người khai thác nhưng có thể cho nhiều người dùng sẽ giúp giảm chi chí,
thời gian và công sức rất nhiều.
* Nguyễn Công Kha đã trao đổi ý tưởng xây dựng hệ thống phần mềm này với một
số người bạn quen trên các diễn đàn về công nghệ thông tin trên Internet đang học
chuyên ngành CNTT là Đặng Quang Huy, Nguyễn Anh Tuấn, Nguyễn Thanh Tùng.
Lúc đó, Tùng đang nghiên cứu dự án về tự động tìm kiếm và khai thác thông tin trên
các Website Internet. Còn Tuấn và Huy đang tham gia phát triển và quản trị Website
của một số công ty tin học và câu lạc bộ sinh viên.
* Say mê với công việc mới thú vị, chỉ 02 tháng sau, nhóm cho ra đời một phần mềm
phục vụ quản lý Website Internet đáp ứng cơ bản các yêu cầu đặt ra. Tuy nhiên, phần
mềm mới là sản phẩm tự phát xây dựng chưa được định hướng về công nghệ cũng
như tư tưởng, khái niệm sản phẩm rõ ràng.
* Trong thời gian này, một người bạn thân của nhóm là Tôn Nữ Minh Anh lúc đó
đang học ngành quản trị kinh doanh ở nước ngoài biết đến sản phẩm và có trao đổi ý
tưởng về sản phẩm cũng như khả năng triển khai ứng dụng thực tế những gì mà
nhóm đang phát triển. Minh Anh cũng đã nghiên cứu và tham gia cộng tác, thực tập

với một số công ty nước ngoài nên có nhiều ý tưởng hay về hệ thống quản trị nội
dung chuyên nghiệp. Đồng thời, Minh Anh cũng gợi ý nếu mọi người tập trung
nghiên cứu khái niệm Knowledge Mangement, Content Management, nghiên cứu

Hồ sơ dự thi Trí tuệ Việt Nam

5


quy trình phát triển phần mềm chuyên nghiệp để ứng dụng phát triển thành sản phẩm
hoàn thiện, đáp ứng yêu cầu của hệ thống CMS chuyên nghiệp. Khi đó, Minh Anh có
thể giúp đỡ đưa ứng dụng triển khai tại một số công ty, tổ chức nước ngoài. Hơn
nữa, sản phẩm CMS hoàn thiện có khả năng ứng dụng hiệu quả phục vụ nhu cầu
trong.nước, giúp giải quyết nhu cầu nghiên cứu, chia sẻ, trao đổi nội dung trực tuyến
một cách thuận tiện, đơn giản, nhanh chóng chóng, tiết kiệm nhiều thời gian và chi
phí.
* Sự tham gia của Minh Anh vào nhóm đã thúc đẩy tinh thần và quyết tâm của nhóm
xây dựng một phần mềm CMS chuyên nghiệp đáp ứng các tiêu chuẩn của thế giới.
Nhóm thành lập lấy tên là iCMS với 5 thành viên cơ cấu gồm 3 người phụ trách kỹ
thuật, phát triển sản phẩm là Huy, Tuấn, Tùng ; 2 người phụ trách xây dựng các yêu
cầu sản phẩm, quy trình làm việc, kế hoạch đưa ra triển khai và ứng dụng.. là Kha và
Minh Anh. Nhóm đặt tên sản phẩm là Hệ thống khai thác và quản lý nội dung trên
nền web iCMS (Innovative Content Management System), cùng nhau xây dựng kế
hoạch học hỏi và hợp tác với các chuyên gia trong lĩnh vực công nghệ thông tin, báo
chí, các bạn bè đang học tập, nghiên cứu ở trong và ngoài nước, xây dựng kế hoạch
nghiên cứu và phát triển sản phẩm lâu dài theo các giai đoạn khác nhau.

I.3.

Giới thiệu sản phẩm.

Hệ thống khai thác và quản lý thông tin trên nền web iCMS (Innovative Content
Management System)
Ngoài tính năng của một hệ quản trị nội dung chuyên nghiệp (Content Management
System) theo các chuẩn quốc tế đã và đang được triển khai và đem lại hiệu quả cao
trong thực tiễn, iCMS còn được tích hợp với hệ thống khai thác thông tin trực tuyến,
tạo thành một giải pháp hoàn chỉnh trong việc khai thác, quản lý, phân phối và xuất
bản thông tin
Giải pháp iCMS gồm 3 hệ thống: Hệ thống quản lý nội dung iCMS; Hệ thống khai
thác và phân tích thông tin iCMS News Spider; Hệ thống iCMS Off-line Client
tạo thành một giải pháp hoàn chỉnh phục vụ việc khai thác và quản lý nội dung trực
tuyến từ lúc thu thập thông tin cho đến khi phân phối thông tin đến người dùng cuối

iCMS

iCMS

iCMS

News Spider

Content Management System

Off-line Client

iCMS Solution
Hồ sơ dự thi Trí tuệ Việt Nam

6



Hình minh họa cơ chế hoạt động của Hệ thống khai thác và quản lý nội dung trên web iCMS
Cơ chế hoạt động gồm 3 giai đoạn lớn: Khởi tạo nội dung – Quản lý nội dung – Xuất bản nội dung được mô tả như mô hình dưới đây.

Multimedia Documents

iCMS Core Engine

Multimedia Documents

Quản lý quy trình
Quản lý phiên bản
Quản lý lưu trữ
Thống kê
Phân quyền bảo mật,
Quản lý người dùng
Tích hợp hệ thống
V...v...

XML, RDF, RSS
iCMS WYSIWYG Tool
iCMS News Spider
Others
Khởi tạo nội dung

XML, RDF, RSS
Internet, Intranet Website
Mobile, PDA, Email, Print
iCMS Off-line Client

Quản lý nội dung


Xuất bản nội dung

Mô tả cơ chế hoạt động của giải pháp iCMS

Hồ sơ dự thi Trí tuệ Việt Nam

7


iCMS giải quyết đầy đủ 3 giai đoạn của nghiệp vụ quản trị nội dung gồm:

1. Quản lý khỏi tạo, thu thập nội dung
iCMS cung cấp phong phú các công cụ phục vụ quá trình tạo, thu thập, xử lý
các loại nội dung thông tin đầu vào từ nhiều nguồn tin, thiết bị đưa tin khác
nhau.


iCMS cho phép thông tin đầu vào từ nhiều nguồn khác nhau: Từ các hệ thống
xuất bản thông tin chuẩn theo các định dạng XML, RDF, RSS; Nội dung do
người dùng trực tiếp biên tập và nhập vào hệ thống



Hỗ trợ nhiều định dạng dữ liệu: Tất cả các định dạng tài liệu trên máy tính: văn
bản, hình ảnh, âm thanh, bảng tính...



Công cụ biên tập khởi tạo nội dung WYSIWYG (công cụ biên tập “thấy là được”

tương tự Microsoft Word) trực tiếp trên nền web, các mẫu (template) định dạng
đối tượng nội dung thông tin...



Tích hợp công cụ khai thác và thu thập tin tức tự động iCMS News Spider phép
phân tích, khai thác, tổng hợp thông tin tự động từ các hệ thống trực tuyến khác
như hệ thống Website, diễn đàn.. là thông tin đầu vào

Nội dung trong quá trình khởi tạo này có thể được lưu trữ trong hệ thống kho dữ liệu
phục vụ việc tham khảo, nghiên cứu hoặc được sử dụng như là nguồn thông tin đầu
vào cho quá trình xuất bản nội dung ở các giai đoạn sau.
2. Quản lý quá trình xử lý nội dung
Phần quan trọng của iCMS là cung cấp các cơ chế, tính năng phục vụ công việc
quản lý quá trình biên tập nội dung, quản lý phiên bản, quy trình duyệt tin, phê
chuẩn, lưu chữ.... Đây là cầu nối, nhân xử lý quan trọng liên kết các dữ liệu
thông tin đầu vào để tạo ra nội dung đầu ra


iCMS cung cấp cơ chế workflow engine cho phép các thực hiện các quy trình
biên tập và xuất bản thông tin, bao gồm việc phân quyền theo vai trò biên tập nội
dung, quản lý duy nhất (cơ chế check-in, check-out); quản lý quy trình linh hoạt
với khả năng tùy biến cao; cung cấp trang thái xử lý nội dung...



iCMS cho phép tạo lập không giới hạn các phiên bản tài liệu, thể hiện trạng thái
hiện thời của phiên bản tài liệu

Hồ sơ dự thi Trí tuệ Việt Nam


8




Công cụ báo cáo thống kê tình trạng hoạt động của hệ thống đầy đủ và phong phú



iCMS cho phép lưu trữ nội dung thông tin dưới nhiều dạng khác nhau database,
XML, HTML, TEXT

3. Phân phối và xuất bản thông tin
iCMS cung cấp khả năng phân phối và xuất bản thông tin đa dạng phong phú tới
bằng nhiều phương thức, tới nhiều thiết bị và đối tượng khác nhau:
iCMS cho phép xuất bản thông tin trực tiếp từ một nguồn duy nhất ra các phương
tiện khác nhau như hệ thống Website Internet, Intranet, các thiết bị di động, cầm tay,
in ấn, email..
iCMS cung cấp nội dung thông tin theo các định dạng chuẩn XML, RDF, RSS cho
phép các hệ thống khai thác nội dung của iCMS một cách thuận tiện và dễ dàng..
Ngoài ra, iCMS còn hỗ trợ phần mềm iCMS Off-line Client cho phép người dùng sử
dụng khai thác thông tin off-line nhằm tiết kiệm thời gian và chi phí
4. Dễ dàng tích hợp với các module khác
iCMS module hóa, cho phép dễ dàng thêm, bớt, quản lý các module khác gồm:

I.4.




Công cụ quản lý quảng cáo



Công cụ thăm dò dư luận (Poll)



Công cụ điều tra ý kiến (Survey)



Công cụ phỏng vấn, hội thoại trực tuyến, tích hợp văn bản, âm thanh, hình ảnh
(Live Support)



Và nhiều module khác (Customize Modules)

Các khó khăn và cách giải quyết trong quá trình phát triển
sản phẩm.
Quá trình xây dựng và phát triển iCMS là thách thức cực kỳ to lớn đối với mỗi thành
viên trong nhóm.
* Thách thức lớn nhất là việc thay đổi suy nghĩ, chuyển từ việc lập trình, xây dựng
sản phẩm tự phát, không có tiêu chuẩn, định hướng lâu dài, làm việc thiếu chuyên
nghiệp để chuyển sang phương thức làm việc chuyên nghiệp, xây dựng khái niệm và
định hướng sản phẩm rõ ràng theo các hệ thống chuẩn quốc tế. Đây chính thách thức

Hồ sơ dự thi Trí tuệ Việt Nam


9


là phải tạo ra sản phẩm có chất lượng tương đương với những sản phẩm quốc tế
trong khi có nhiều nguồn lực hạn chế và phải vừa làm vừa tự nghiên cứu.
* Việc xây dựng iCMS khó hơn những suy nghĩ ban đầu của các thành viên. Cả
nhóm đã có những “sản phẩm” đã giải quyết được bài toán đặt ra: Tùng có sản phẩm
tự động phân tích, khai thác thông tin trên Internet; Huy và Tuấn đã lập trình và quản
trị mạng cho một số Website, và còn một số sản phẩm nhỏ nữa có thể tích hợp được.
Tuy nhiên, do các sản phẩm này đựoc xây dựng chưa chuyên nghiệp nên rất hạn chế
trong khả năng tích hợp lại với nhau, đồng thời hạn chế khả năng mở rộng, xây dựng
phát triển theo các tiêu chuẩn quốc tế.. Do vậy, cả nhóm bắt tay xây dựng iCMS gần
như là từ đầu. Phải lựa chọn lại công nghệ, nghiên cứu các sản phẩm của nước ngoài,
nghiên cứu lý thuyết về ứng dụng Content Management, quy trình phát triển phần
mềm...
* Các khó khăn mà nhóm đã trải qua trong quá trình phát triển sản phẩm đó là
-

Phải tự học hỏi những tiêu chuẩn, khái niệm mới trong lĩnh vực phát triển giải
pháp CMS theo chuẩn chuyên nghiệp của thế giới nhằm xây dựng được những
yêu cầu cụ thể, chính xác, có định hướng cho sản phẩm.

-

Khi mới bắt đầu phát triển iCMS, cả nhóm đã phân tích nghiên cứu và lựa
chọn nền tảng .NET Framework. Lúc đó, .NET Framework vẫn rất còn mới mẻ
ở Việt Nam. Do vậy, song song với việc nghiên cứu, xây dựng yêu cầu sản
phẩm, đội công nghệ cũng phải tự đầu tư nghiên cứu để triển khai công nghệ
mới.


-

Việc xây dựng ứng dụng iCMS đòi hỏi phải có hệ thống mạng, máy chủ,
Internet, Intranet, thiết bị để nghiên cứu thử nghiệm, tuy nhiên các thiết bị này
cũng rất bị hạn chế.

-

Do các thành viên là phân tán, có thời gian biểu không giống nhau, lại vừa học,
vừa phát triển sản phẩm nên nhóm cũng gặp khó khăn về thời gian và địa điểm
làm việc cùng nhau.

-

Ngoài ra, đó là khó khăn về kinh phí và nhân lực dẫn đến việc chưa có đủ
nguồn lực để có thể nâng cao hơn nữa thời gian và chất lượng sản phẩm.

* Tuy nhiên, bên cạnh khó khăn đó, chúng tôi cũng gặp nhiều thuận lợi. Chúng tôi đã
nhận được rất nhiều ý kiến động viên chia sẻ về ý tưởng, phương thức, định hướng
để phát triển, hoàn thiện sản phẩm của những người quan tâm đến lĩnh vực mà chúng
tôi đang nghiên cứu. Chúng tôi nhận được một số nguồn tài liệu, kinh nghiệm quý
báu trong lĩnh vực chuyên môn và công nghệ từ các bạn bè, công ty, tổ chức trong và

Hồ sơ dự thi Trí tuệ Việt Nam

10


ngoài nước ủng hộ. Điều này giúp chúng tôi có cái nhìn rộng hơn, sâu hơn và tự tin
hơn vào công việc đang làm.


I.5.

Các kết quả đã đạt được
iCMS hiện đã là một sản phẩm hoàn thiện, có thể triển khai để quản lý nội dung
website của các Toà soạn báo điện tử, các trang thông tin điện tử, trang web của các
cơ quan, ban ngành, tổ chức xã hội và hệ thống thông tin của doanh nghiệp.
Sản phầm iCMS hiện được thử nghiệm và ứng dụng tại nhiều website của các tổ
chức, công ty, trang tin hàng đầu Việt Nam như


Hệ thống quản lý thông tin trên web của Đài truyền hình Việt Nam (
)



Trang tin điện tử và website Công ty cổ phần viễn thông Hà Nội (
)



Trang tin điện tử và website Công ty cổ phần viễn thông Dầu khí (
)



Trang tin điện tử Tin tức Việt Nam ( )

Với tổng số người xem trên 1 triệu lượt / ngày. iCMS cũng đang chuẩn bị triển khai
tại nhiều website của các tổ chức, công ty khác trong nước và một số khách hàng

nước ngoài....

I.6.

Đánh giá tiềm năng thị trường
Thị trường Web-based Content Management System trên thế giới mới xuất hiện
trong vòng 5 năm trở lại đây ( đến năm 2002 hãng Microsoft mới gia nhập thị trường
này), riêng ở Mỹ đây là thị trường có giá trị 13 đến 15 tỉ USD và hiện đang tăng
trưởng nhanh trên toàn thế giới. Đặc biệt ở Việt Nam, cùng với sự phát triển của
Internet, nhu cầu thực tế của các tổ chức, công ty có một hệ thống website có thể
quản lý tin tức, xuất bản thông tin, làm việc nhóm trực tuyến ngày càng cao. Có thể
nói iCMS có thị trường tiềm năng lớn cả trong và ngoài nước, vì:
Việt Nam là thị trường mới đối với CMS và có nhu cầu rất lớn: Theo thống kê của
VNNIC, hầu hết các công ty, tổ chức ở Việt Nam chưa có tên miền riêng hoặc mới
mua tên miền nhưng chưa xây dựng website ( trong số trên 70.000 doanh nghiệp và
hàng chục ngàn tổ chức mới chỉ có 2300 tên miền được đăng ký trong nước và
khoảng 10.000 trang web trên mạng). Thị trường của iCMS khá rộng bao gồm các
trang tin điện tử, các cơ quan Bộ, ban, ngành, UBND các cấp..., các tổ chức, hiệp

Hồ sơ dự thi Trí tuệ Việt Nam

11


hội, các doanh nghiệp ... Hiện iCMS đã được ứng dụng thành công để quản lý thông
tin qua hệ thống web của Đài truyền hình Việt Nam, công ty viễn thông Hà Nội,
công ty viễn thông Dầu khí, trang tin điện tử Tin tức Việt Nam...
Với cách tiếp cận hiện đại, iCMS không hề thua kém nhiều sản phẩm cùng loại trên
thế giới. Cấu trúc mở của iCMS khiến phần mềm có thể ứng dụng với mọi ngôn ngữ
khác nhau và qui trình quản lý nội dung khác nhau. Nếu có bộ phận tiếp thị, bán

hàng hiệu quả phần mềm hoàn toàn có khả năng thu hút khách hàng quốc tế nhờ chất
lượng tốt và giá thành hợp lý. Hiện nhóm tác giả đang chuẩn bị bán iCMS cho một
số công ty, tổ chức tại Hà Lan, Đan Mạch..

Hồ sơ dự thi Trí tuệ Việt Nam

12


II.

Cơ sở lý thuyết

II.1.

Yêu cầu đối với hệ thống quản lý nội dung (Content
Management System) và hướng áp dụng trong iCMS
II.1.1.

Giới thiệu chung về hệ thống quản lý nội dung

* Sự bùng nổ của kỷ nguyên Internet đã dẫn tới một nhu cầu mới rất lớn, đó là nhu
cầu tìm kiếm, khai thác và trao đổi thông tin trên mạng Internet. Các website xuất
hiện liên tục và ngày càng nhiều, do đó, đẫn tới một nhu cầu mới: Nhu cầu quản lý
và khai thác và trao đổi thông tin trên mạng Internet. Những giải pháp quản trị nội
dung Internet được phát triển và ngày càng được chuẩn hóa, giúp cho các tổ chức,
doanh nghiệp.... thuận tiện hơn trong việc xuất bản cũng như khai thác thông tin.
* Trong môi trường liên kết và tương tác cao như môi trường Internet, việc nhận
thức và phát triển một ứng dụng theo tiêu chuẩn chung của quốc tế, có khả năng
tương tác cao với các hệ thống khác là một yếu tố hết sức quan trọng và cần thiết.

* Một cách đơn giản nhất, Hệ thống quản trị nội dung (Web Content Management
System) là một hệ thống quản lý các thành phần làm nên nội dung của một Website.
Tuy nhiên “nội dung” là một khái niệm rất rộng. Do vậy, khi nhắc đến CMS, người
ta phải nhắc đến các đến các yếu tố cấu thành nội dung nằm trong phạm vi mà hệ
CMS đề cập tới cũng như các đặc điểm trong các chu trình quản lý nội dung đó.
* Một cách chính xác hơn, CMS là hệ thống quản lý việc khởi tạo nội dung, quá trình
xử lý nội dung đó cho đến khi nó được xuất bản, phân phối tới người dùng cuối.
CMS = Khởi tạo nội dung -> Quản lý quá trình xử lý nội dung đó -> Phân phối nội
dung tới người dùng cuối
II.1.2.

Các chức năng cơ bản mà một hệ thống CMS phải có

* Cung cấp công cụ phục vụ quá trình soạn thảo, biên tập, chỉnh lý nội dung
* Có hệ thống quản lý lưu trữ nội dung chung
* Quản lý phiên bản tài liệu, giám sát sự thay đổi, cho phép tìm lại nội dung thay liệu
trước và sau khi thay đổi, biên tập
* Cung cấp hệ thống quản lý quy trình xử lý nội dung thông tin
* Có khả năng kết xuất thông tin đầu ra tự động từ hệ thống quản lý lưu trữ nội dung
dùng chung.

Hồ sơ dự thi Trí tuệ Việt Nam

13


* Cung cấp khả năng cá nhân hóa thông tin cho người dùng
* Cung cấp cho người dùng những công cụ tìm kiếm tra cứu theo thuộc tính, tìm
kiếm toàn văn giúp nhanh chóng tìm kiếm và định vị được nội dung thông tin.
II.1.3.


Các yêu cầu mới hiện nay đối với hệ thống CMS chuyên nghiệp



Trong môi trường điện toán phức tạp như hiện nay, thông tin không còn là thực
thể đơn lẻ nữa, nó là một phần trong một hệ thống thông tin lớn hơn, luôn cần có
sự kết hợp, trao đổi, liên thông dữ liệu với nhau.



Yêu cầu trong quá trình khởi tạo nội dung:
-

Độc lập nội dung và các lớp giao diện thể hiện

-

Cho phép nhiều người sử dụng, làm việc trên một tài liệu

-

Đối với mỗi nội dung, chỉ có một nguồn duy nhất

-

Cung cấp khả năng quản lý các thuộc tính khác liên quan đến nội dung thông
tin (Tác giả, tiêu đề, từ khóa...) (Metacontent)

-


Người sử dụng không cần có kỹ năng đặc biệt về lập trình và công nghệ có thể
sử dụng các công cụ biên tập và xử lý nội dung

-

Tính dễ sử dụng



Yêu cầu trong quá trình quản lý nội dung
-

Quản lý phiên bản tài liệu, Quản lý lưu trữ

-

Quản lý quy trình biên tập và phê duyệt nội dung thông tin

-

Đảm bảo tính bảo mật

-

Có khả năng tích hợp với các hệ thống thông tin khác bên ngoài

-

Cung cấp các dữ liệu báo cáo tình hình hoạt động đa dạng




Xuất bản thông tin
-

Đồng nhất về khả năng trình bày với những loại dữ liệu giống nhau

-

Cung cấp các mẫu, định dạng (template) giúp xuất bản nội dung một cách
nhanh chóng và thuận lợi

-

Có khả năng xuất bản ra nhiều định dạng khác nhau như Web, In ấn, thiết bị
cầm tay...

Hồ sơ dự thi Trí tuệ Việt Nam

14




Có khả năng cá nhân hóa thông tin
Về mặt công nghệ

-


Hệ thống phải tiện dụng và thân thiện với người dùng

-

Công nghệ giúp hệ thống có khả năng tương thích và dễ dàng tích hợp, mở
rộng.

-

Hệ thống phải tuân theo các chuẩn dữ liệu xuất bản thông tin trực tuyến

II.1.4.

Định hướng phát triển cho sản phẩm iCMS

Thông qua nghiên cứu yêu cầu đặt ra đối với hệ thống CMS chuyên nghiệp, nhóm
iCMS định hướng phát triển sản phẩm tuân theo các chuẩn đặt ra của hệ thống quản
trị nội dung, có khả năng tích hợp và mở rộng trong tương lai để tạo thành giải pháp
hoàn chỉnh trong việc quản lý khai thác và xử lý thông tin trực tuyến.

II.2.

Lý thuyết về thu thập và phân tích thông tin và hướng tích
hợp với hệ quản lý nội dung iCMS
II.2.1.

Toàn cảnh

Hiện nay công nghệ thông tin đang phát triển cực kỳ mạnh mẽ, lượng thông tin điện
tử được cập nhật và bổ sung hàng ngày với dung lượng tăng theo cấp số mũ. Một

phần lớn trong số đó là những dữ liệu văn bản không có cấu trúc. Những công cụ tìm
kiếm đã trợ giúp đắc lực cho nhu cầu tìm kiếm của người dùng, chúng mang lại một
phương thức hiệu quả để thu thập thông tin với những truy vấn gồm một tập những
từ khóa mà người dùng mô tả thông tin. Tuy nhiên, sử dụng công cụ tìm kiếm không
thể đạt hiệu quả với những nhu cầu tìm kiếm thông tin không thể đưa ra từ khóa. Một
ví dụ thực tế rất điển hình: “Liệt kê những tin tức trong ngày hôm nay”. Sử dụng một
công cụ tìm kiếm không phải là một ý tưởng tốt cho vấn đề này. Một công cụ thu
thập thông tin (Information Retrieval) và phân tích thông tin (Information Extraction)
sẽ là giải pháp cần thiết và hợp lý hơn.
II.2.2.

Khái niệm

Công nghệ thu thập tin: (Information Extraction) là quá trình thu thập, xử lý thông
tin từ một số nguồn văn bản xác định (có thể là nguồn chuẩn hoặc không chuẩn) tách
ra những thông tin cần thiết để có thể lưu trữ và sử dụng lại được (reusable). Nguồn
văn bản này thường là từ Internet
Công nghệ phân phối tin: Từ các dữ liệu đã thu thập được, thông tin sẽ được phân
phối tới các ứng dụng khác như ứng dụng CMS (Content Management System – Hệ

Hồ sơ dự thi Trí tuệ Việt Nam

15


thống quản lý thông tin), ứng dụng WAP (Wireless Application - Ứng dụng không
dây)…
Công nghệ thu thập và phân phối tự động: các tài liệu được tự động cập nhật, người
sử dụng không cần điều khiển liên tục để thu thập thông tin. Sau đó hệ thống tự động
điều phối tin tới các ứng dụng cần thiết.

II.2.3.

Tầm quan trọng

Với sự phát triển mạnh mẽ của công nghệ thông tin, các nguồn tin trên mạng xuất
hiện càng nhiều. Vì vậy nhu cầu thu thập và phân tách thông tin ngày càng lớn.
Người dùng có thể chọn các nguồn tin có chất lượng sau đó sử dụng công nghệ thu
thập thông tin để tạo ra cơ sở dữ liệu thông tin lưu trữ cho cá nhân hoặc tập thể. Các
nguồn tin này có thể là tin tức báo chí, tỉ giá chứng khoán, thông tin thời tiết, hay bất
cứ nguồn tin nào khác. Sau đó các thông tin này sẽ được phân phối tới các ứng dụng
làm nhiệm vụ xử lý, xuất bản lại.
II.2.4.

Mô hình về một hệ thống thu thập và phân tích thông tin

Những
thông tin
liên quan

Nguồn
ban đầu
xác định

Thu thập thông tin

Bộ xử lý
tương
ứng với
nguồn


Nội dung
có cấu trúc
đã được
phân tích

Phân tích thông tin

Đầu vào của hệ thống là một nguồn xác định. Người sử dụng trong quá trình tìm
kiếm thông tin, đã tìm được một số nguồn thông tin tin cậy để phục vụ cho nhu cầu
của mình. Ví dụ: mục Vi tính của báo điện tử VnExpress là một nguồn thông tin có
chất lượng cao, địa chỉ URL là Từ đầu vào
này, hệ thống tìm các thông tin liên quan, đưa vào bộ xử lý tương ứng với báo điện
tử VnExpress, kết quả đầu ra là những tin bài của mục Vi tính của báo điện tử
VnExpress.
II.2.5.

Thiết kế phần thu thập thông tin của iCMS NewsSpider

Hồ sơ dự thi Trí tuệ Việt Nam

16


Đầu
vào

Bộ lọc
tương
ứng


Thông tin
liên quan

Nội dung
cần phân
tích
Nội dung
chứa đầu
vào mới

Phần thu thập thông tin của iCMS NewsSpider sử dụng công nghệ tương đương với
công nghệ của một bộ công cụ tìm kiếm nhưng với phạm vi áp dụng nhỏ hơn và giới
hạn chặt chẽ hơn. Với phạm vi ứng dụng trên Internet, đầu vào của hệ thống thu thập
thông tin trong iCMS là một liên kết (hyperlink) tới một trang web chứa thông tin
liên quan. Hệ thống duyệt nội dung của trang web, tìm ra những liên kết có liên
quan, những liên kết này có thể dẫn trực tiếp tới nội dung cần phân tích hoặc dẫn tới
nguồn có thể chứa những liên kết mới (đầu vào mới).
II.2.6.

Nội dung
cần phân
tích

Thiết kế phần phân tích thông tin của iCMS NewsSpider

Chuẩn
hóa
XML

Bộ lọc

nội dung
tương
ứng

Nội dung
có cấu trúc
đã được
phân tích

Nội dung sau khi đã được lấy về sẽ được chuyển tới bộ chuẩn hóa XML chuyển văn
bản về dạng XML, sau đó được đưa vào bộ lọc thông tin tương ứng; kết quả trả về là
thông tin đã phân tích có cấu trúc xác định, lưu trữ lại vào hệ cơ sở dữ liệu thích hợp.
Một nét đặc trưng của iCMS NewsSpider là thông tin luôn được chuẩn hóa theo đặc
tả XML – ngôn ngữ của tương lai - nhằm đảm bảo tính tương thích với công nghệ
mới cao, khả năng lọc chính xác và hiệu quả, những thông tin có cấu trúc trả về đã
được chuẩn hóa.
Với thiết kế phần thu thập và phân tích thông tin như vậy, một cơ chế linh hoạt mà
các sản phẩm hiện đại thường dùng đó là sử dụng plugin. Mỗi một plugin sẽ là một
bộ lọc bao gồm bộ lọc đường dẫn và bộ lọc nội dung. Tương ứng plugin – đầu vào là

Hồ sơ dự thi Trí tuệ Việt Nam

17


tương ứng một – nhiều nghĩa là một plugin có thể sử dụng cho nhiều đầu vào hoặc
chỉ sử dụng chuyên biệt cho một đầu vào xác định.

II.2.7.


Mô hình của một hệ thống hoạt động tự động trong iCMS
NewsSpider

Chạy
chương
trình

Cập nhật
thông tin
mới

Hết

Tự
động
ngắt

Đến thời điểm xác định

Một nét đặc trưng tiêu biểu của iCMS NewsSpider là khả năng hoạt động tự động,
không cần người điều khiển. iCMS NewsSpider tự động tìm kiếm thông tin sau một
khoảng thời gian nhất định, hoặc chạy vào những thời điểm xác định do người dùng
thiết lập. Chương trình cũng tự động ngắt khi không tìm thấy thông tin nào mới.
II.2.8.

Phân phối thông tin và hướng tích hợp với iCMS

Khác với các hệ thông thu thập và phân tích thông tin khác trên thế giới như
IMINER (IBM), PROTEUS (New York University), LaSIE/Gate (University of
Sheffield), FASTUS (SRI International) … iCMS là một giải pháp tích hợp hoàn

chỉnh bao gồm thu thập, phân tích và phân phối thông tin.

Thu thập
thông tin

Phân tích
thông tin

Xuất bản
ngay

Hồ sơ dự thi Trí tuệ Việt Nam

Phân phối
thông tin

Các kênh
của
iCMS

Chờ duyệt

18


Thông tin sau khi được thu thập và phân tích, chuyển về dạng có cấu trúc sẽ được
phân phối theo chuẩn quốc tế RSS tới các kênh của hệ thống quản lý nội dung, các
đầu vào có thể có thiết lập linh hoạt để xuất bản thông tin ngay hoặc để ở trạng thái
chờ duyệt, theo đúng trình tự làm việc (workflow) của một hệ thống quản lý nội
dung CMS.


Hồ sơ dự thi Trí tuệ Việt Nam

19


III.

Mô tả giải pháp

III.1.

Các đặc điểm cơ bản của iCMS

III.1.1. Đa hệ điều hành
iCMS được viết bằng ngôn ngữ C# và chạy trên Mono Framework ( ). Đây là Framework mã nguồn mở tương thích với Microsoft .Net
framework. Việc tương thích với Mono Framework cho phép cùng một mã nguồn
iCMS có thể chạy trên nhiều hệ điều hành như Linux, Unix và Windows…
Sở dĩ chúng tôi lựa chọn Mono bởi nền tảng này cho phép sử dụng các công cụ, công
nghệ mới nhất mà không làm mất đi tính khả chuyển, đa môi trường của sản phẩm.
III.1.2. Đa hệ quản trị cơ sở dữ liệu
iCMS giao tiếp với cơ sở dữ liệu tuân theo chuẩn OLEDB, do vậy có thể chạy trên
nhiều hệ điều hành với hầu hết các Hệ quản trị cơ sở dữ liệu có trên thị trường như
MySql, MSSQL, Oracle, DB2…
Trên thực tế chúng tôi đã cài đặt iCMS với hệ thống sử dụng toàn bộ mã nguồn mở
của công ty Viễn thông Hà Nội (Linux, Apache, Mysql), trên hệ thống Windows với
CSDL Oracle của Đài truyền hình Việt Nam, trên hệ thống Windows với MSSQL
của trang tin điện tử Tin tức Việt Nam v.v…
III.1.3. Hỗ trợ chuẩn xuất bản và thu nhận thông tin theo XML, RDF, RSS
RDF là chuẩn quốc tế trong việc phân phối/ thu nhận tin tức của các nguồn thông tin

khác nhau. RDF Site Summary (RSS) là một giao thức để xuất bản thông tin theo
XML đang được dùng phổ biến hiện nay tại các hãng tin lớn như CNN, BBC,AFP…
và nhiều hệ quản trị thông tin website khác.
Có thể nói iCMS là phần mềm CMS đầu tiên ở Việt Nam hoàn toàn tuân theo chuẩn
RDF () để xuất bản nội dung, các phần mềm CMS phổ biến
trên thế giới ( trong đó có các phần mềm open source được ứng dụng rộng rãi ở Việt
Nam như post nuke, php bb…) đều có thể lấy được thông tin do iCMS xuất bản qua
chuẩn này một cách hoàn toàn tự động. Đây là phương thức phân phối tin thuận tiện
và phổ biến mà các hãng tin và website lớn trên thế giới đang sử dụng.
Bằng việc xuất bản và thu thập thông tin dưới chuẩn XML, iCMS có thể thu nhận và
xuất bản bất kỳ dạng tin tức nào từ các nguồn tuân thủ RDF mà hầu hết các website
trên thế giới sử dụng.

Hồ sơ dự thi Trí tuệ Việt Nam

20


III.1.4. Hệ thống thu thập và phân loại thông tin từ các nguồn xuất bản không
tuân theo chuẩn ( dành riêng cho điều kiện Việt Nam).
Hiện nay tuy các website lớn trên thế giới đều đã hỗ trợ RDF nhưng hầu hết các
trang tin tức Việt Nam chưa hỗ trợ chuẩn này. Hệ thống iCMS News Spider là một
phần mềm tự động thu thập và bóc tách thông tin từ các nguồn tin của Việt Nam
(như Vnexpress.net, Vnn.vn, vdcmedia.com … ) sau đó phân loại và đưa vào các
chuyên mục thông tin tương ứng của iCMS đề làm nguồn tham khảo hoặc đưa trực
tiếp lên web.
III.1.5. Multi Input ( Multi document format, Multi protocol, RDF source…)
iCMS hỗ trợ nhiều dạng tài liệu để nhập vào hệ thống như .pdf, .doc, .xls, .xml,.zip
v.v… và có công cụ chuyển đổi trực tuyến ra dạng HTML.
Phần mềm cũng hỗ trợ việc tải file vào hệ thống bằng FTP, qua Web hoặc lấy file từ

xa thông qua URL.
Hiện nay tất cả các hãng tin lớn như CNN, BBC, AFP… cũng như phần lớn các hệ
CMS khác nhau trên thế giới đều tuân theo chuẩn RDF. Với sự hỗ trợ hoàn toàn
chuẩn này, iCMS có thể tự động cập nhật tin bài từ các nguồn tin khác nhau và mới
nhất trên thế giới.
III.1.6. Multi Output (Web Browser, Printer, WAP Mobile Phone, iCMS Offline
Client, RSS …)
Để phục vụ sự đa dạng của các thiết bị truy cập nội dung, không chỉ xuất tin dưới
dạng dành cho trình duyệt web thông thường, iCMS còn được thiết kế để hỗ trợ xuất
ra máy in, xuất qua điện thoại di động WAP….
Đặc biệt chúng tôi còn phát triển một phần mềm iCMS Client chuyên dụng để đọc
tin tức Offline từ iCMS và các trang báo điện tử khác, iCMS Client còn hỗ trợ việc
gửi bài lại cho ban biên tập, lưu trữ, tìm kiếm tin bài trực tuyến và cả khi đã ngắt
khỏi mạng. iCMS được thiết kế dành riêng cho điều kiện Việt Nam với giao diện dễ
sử dụng, 100% tiếng Việt với bộ gõ tích hợp sẵn… giúp người dùng tiết kiệm thời
gian và tiền bạc khi khai thác thông tin qua iCMS và thông tin chung trên Internet.
Ngoài ra bằng việc xuất bản thông tin qua RSS, các trang web và phần mềm theo
chuẩn này đều có thể lấy được thông tin do iCMS xuất bản hoàn toàn tự động. Đây là
một đặc điểm ưu việt của iCMS so với các sản phẩm khác tại Việt Nam.
III.1.7. Quản lý quy trình và phân quyền biên tập thông tin
• Phân cấp quyền sử dụng

Hồ sơ dự thi Trí tuệ Việt Nam

21


iCMS tuân theo quy trình xử lý thông tin (workflow) đúng với mô hình chuẩn của
thế giới với đầy đủ các cơ chế : Soạn tin, gửi tin, duyệt tin, xem trước, trả ngược, hồi
âm, tổng hợp và xuất bản.

Với mỗi đối tượng sử dụng sẽ có các quyền tương ứng, các chức năng tương ứng
,được kết cấu và bảo vệ chặt chẽ từ cấp thấp lên cấp cao ở nhiều mức độ khác nhau
(bảo vệ theo từng tệp tin, từng thư mục và từng vai trò sử dụng (role) )
Đây là một mô hình đầy đủ và uyển chuyển, giúp người sử dụng iCMS dễ dàng áp
dụng hệ thống vào các mục đích khác nhau như hệ thống xuất bản tin doanh nghiệp,
toà soạn điện tử, bản tin hàng ngày mà không cần tuân theo một luồng làm việc cứng
nhắc và máy móc như một số các hệ thống CMS tương tự vẫn áp đặt.
Ví dụ:
• Khi áp dụng vào một toà soạn báo điện tử : các cộng tác viên có thể soạn và
gửi bài dưới dạng các bản nháp thô, tiếp đến người phụ trách chuyên mục
xem, sửa, duyệt và sắp xếp thông tin vào các kênh tương ứng hoặc gửi trả lại,
hoặc lưu trữ bài với cơ chế hồi phục (rollback) dễ dàng, tiếp đến là gửi lên
Thư ký toà soạn , quyết định việc xuất bản thông tin dưới hình thức nào,vị trí
nào, ngày giờ nào.... Cuối cùng là đưa lên Tổng biên tập, người có thẩm
quyền cao nhất để tổng duyệt với các chức năng cao cấp trước khi lên mặt
báo.
• Với hệ thống bản tin doanh nghiệp , khi mà không nhất thiết và cũng không
có các cấp phân quyền nhiều như mô hình toà soạn báo điện tử, các tin được
soạn và gửi thẳng trực tiếp lên hệ thống hiển thị từ người biên tập mà không
cần tuân theo quy trình trên , đó cũng chính là sự linh hoạt mà iCMS cung
cấp cho người sử dụng, nhằm mục đích áp dụng vào càng nhiều mô hình càng
tốt.
III.1.8. Cơ chế quản lý tính duy nhất (kiểm tra vào ra (Check-in; Check-out))
• Cơ chế khóa cấp tệp tin và cơ chế log các tác động của người sử dụng của iCMS
nhằm giải quyết xung đột giữa các người dùng, tránh người này ghi đè lên phần
làm việc của người kia, hoặc nếu có thì có thể dễ dàng tìm được nguyên nhân và
hồi phục lại.
Đây cũng là một trong các tính năng quan trọng và cao cấp của iCMS , hỗ trợ tối đa
cho người dùng , đảm bảo tính toàn vẹn của dữ liệu.


Hồ sơ dự thi Trí tuệ Việt Nam

22


• Cơ chế thông báo bằng Email đến người quản lý về các tác động liên quan đến
thông tin như việc bài bị xóa, bị sửa, bị gửi trả v...v để có giúp người dùng luôn có
thể theo dõi chặt chẽ và kiểm tra tính hợp lệ của thông tin trước khi xuất bản.
III.1.9. Quản lý phiên bản (Versioning)
iCMS cho phép cùng một nội dung thông tin có nhiều phiên bản khác nhau qua mỗi
lần sửa chữa thay đổi, tạo điều kiện thuận lợi cho việc phân phối thông tin, chỉnh sửa
nội dung. Việc tạo nhiều phiên bản cũng cho phép so sánh hay lấy lại một văn bản
cũ dễ dàng.
Ngoài ra hệ thống cho phép xuất bản thông tin theo lịch (scheduling), hiển thị tin
theo ngày giờ được định sẵn, lưu trữ và tự động ẩn thông tin khi hết hạn (expiration),
giúp người dùng chọn ngày tháng hiển thị và không hiển thị của bất kì tài liệu nào.
III.1.10. Đa ngôn ngữ
Được thiết kế với mục đích sử dụng cho cả thị trường trong nước và quốc tế, ICMS
hỗ trợ nhiều ngôn ngữ ngay trong một văn bản bằng cách sử dụng Unicode hoàn
toàn.
Hơn thế nữa, ICMS còn cho phép sử dụng nhiều ngôn ngữ trên cùng một website,
điều này giúp người sử dụng có thể lựa chọn được ngôn ngữ hiển thị dựa trên nhu
cầu của mình và hệ thống web có thể phục vụ người dùng nói nhiều thứ tiếng…
III.1.11. Đa giao diện, đa website.
Với sự phân biệt rõ ràng giữa giao diện và dữ liệu, iCMS có cơ chế Template mạnh
giúp người thiết kế tạo nhiều mẫu giao diện khác nhau, sửa đổi trực tuyến và áp dụng
để thay đổi toàn bộ thiết kế mỹ thuật của trang web. Mọi thao tác với hệ thống đều có
thể thực hiện qua trang web với giao diện Thấy là được ( What you see is what you
get).
iCMS còn hỗ trợ việc đa website, với chỉ một bộ mã của iCMS khi cài đặt , người

dùng có thể tạo, thêm bớt các website tại địa chỉ khác nhau với nội dung, hình thức
hoàn toàn khác nhau. Bên cạnh việc tiện dụng trong quản lý, tính năng này giúp việc
nâng cấp và sửa lỗi dễ dàng hơn khi thay vì mỗi lần chỉnh sửa phải sửa trên hàng
chục website, người quản lý kỹ thuật chỉ cần sửa tại một nơi duy nhất và chắc chắn
rằng điều đó được áp dụng cho mọi website thuộc hệ thống.
III.1.12. Tối ưu hoá cho các máy tìm kiếm.
Máy tìm kiếm đóng một vai trò quan trọng trong việc một website được biết đến hay
không.
Hồ sơ dự thi Trí tuệ Việt Nam

23


Sự tối ưu hoá thể hiện qua cơ chế sinh ra các thẻ meta tự động dựa trên nội dung
hoặc cho người dùng tự nhập, giúp máy tìm kiếm xác định được từ khoá và thông tin
chính xác về một tài liệu.
iCMS còn sử dụng cơ chế viết lại URL để URL đến một tài liệu thân thiện với máy
tìm kiếm ( không chứa dấu ?, dấu &, có độ sâu cao...)
III.1.13. Tìm kiếm Toàn văn đa ngôn ngữ trên toàn bộ dữ liệu.
iCMS có cơ chế tìm kiếm được viết riêng để có thể tìm kiếm toàn văn trên nội dung
các tài liệu có trong hệ thống, tìm kiếm theo từ khoá và theo các biểu thức logic. Kết
quả tìm kiếm được hiển thị nổi bật theo độ chính xác.
Ngoài ra iCMS có thể tìm kiếm tài liệu theo tác giả, chuyên mục, kích thước, ngày
tháng xuất bản v.v...
III.1.14. Thống kê và phân tích thông tin
Một hệ thống chỉ có thể hoạt động hiệu quả khi người quản lý nắm được nhiều thông
tin hoạt động của nó, càng nhiều càng tốt.
Hệ thống thống kê và phân tích thông tin là của là một giải pháp hoàn chỉnh bao gồm
các kiểu thống kê đa dạng, việc đưa thêm các kiểu thống kê mới theo ý muốn cũng
rất dễ dàng, đó là điểm mạnh của hệ thống. Không cố định với một vài kiểu thống kê

đơn điệu như các sản phẩm cùng loại, iCMS cho phép tuỳ biến kiểu thống kê cũng
như hiển thị kết quả cực kỳ linh hoạt, thậm chí cho chèn cả mã SQL để có thể tuỳ
biến kết quả theo ý muốn. Thêm bớt các kiểu thống kê, phân quyền các kiểu thống kê
cho từng cấp người sử dụng, các kiểu biểu đồ 2D,3D ... đa dạng để mô tả kết quả một
cách sinh động và trung thực nhất.
Các thông tin như tốc độ trung bình của hệ thống, lượt người truy cập, lưu lượng
hoạt động, các trường hợp lỗi mà người dùng gặp phải và các thông tin liên quan đã
được iCMS thực sự quan tâm, đầu tư và nghiên cứu kỹ lưỡng theo điều tra từ các mô
hình hoạt động thực tế, giúp cho người quản trị thực sự là ông chủ hệ thống, theo dõi
được tình hình phát triển của site cũng như phát hiện các trục trặc bất thường xảy ra
đối với hệ thống (ví dụ như bị hacker chống phá, server bị trục trặc,v...v ).
III.1.15. Sao lưu dự phòng và hồi phục
Công tác sao lưu dự phòng và hồi phục là không thể thiếu đối với một hệ thống hoạt
động liên tục và chứa nhiều thông tin quan trọng của tổ chức bởi khi hỏng hóc xảy ra
thì hiệu quả sẽ rất khó lường. iCMS có thể tự sao lưu dự phòng theo định kì dữ liệu

Hồ sơ dự thi Trí tuệ Việt Nam

24


sang một phương tiện lưu trữ khác trên máy hoặc qua Intranet, Internet... và khôi
phục bất cứ lúc nào.
III.1.16. Bảo mật
iCMS hỗ trợ giao thức SSL (Secure Socket Layer) nhằm bảo đảm sự an toàn của dữ
liệu trên đường truyền, mã hoá các thông tin quan trọng của người dùng.
Mỗi người sử dụng đều được cấp tên đăng nhập và mật khẩu, iCMS log lại toàn bộ
các thao tác của từng người sử dụng để đảm bảo phát hiện nhanh người gây ra khi hệ
thống có vấn đề.
Cơ chế phân quyền truy cập đến từng chức năng và từng tài liệu với nhiều cấp người

dùng khác nhau bảo vệ chặt chẽ tài liệu tuỳ theo quyền hạn của từng người sử dụng.
III.1.17. Xuất bản thông tin
iCMS hỗ trợ việc xuất tin đến nhiều thiết bị khác nhau ngoài web browser như điện
thoại di động, máy in, đến các web site khác theo RDF
Đặc biệt iCMS có thể xuất thông tin đến nhiều máy chủ chạy iCMS khác nhau đồng
thời và thu nhận thông tin phản hồi từ nhiều máy chủ thông qua Web services.
III.1.18. Khả năng tích hợp và mở rộng
Do tuân theo các chuẩn, iCMS đảm bảo khả năng mở rộng và tích hợp, tương thích
với nhiều hệ thống CMS và các hệ thống Website khác trên thế giới
Ngoài ra, trong tương lai, nhóm iCMS sẽ phát triển iCMS sao cho có khả năng tương
thích và liên kết thông tin với các hệ thống quản lý thông tin doanh nghiệp (EIP,
ERP, CRM), hệ thống quản trị nội dung đào tạo trực tuyến LCMS..

III.2.

Mô hình triển khai
Nhờ sự mạnh mẽ trong việc giữa việc tự động phân tích, khai thác thông tin từ nhiều
nguồn kết hợp với quy trình biên tập, xuất bản thông tin linh hoạt, iCMS là giải pháp
rất hữu ích khi triển khai những trung tâm nghiên cứu, xuất bản thông tin trên
Internet, Intranet. iCMS đặc biệt phù hợp khi kết hợp triển khai hệ thống site Intranet
phục vụ nghiên cứu tích hợp với site Internet cung cấp thông tin đầu ra cho các đơn
vị trường học, tổ chức, viện nghiên cứu, trung thông thông tin, các tòa soạn báo điện
tử, các intranet site của công ty, doanh nghiệp, chính phủ, bộ, ngành...

Hồ sơ dự thi Trí tuệ Việt Nam

25



×