Tải bản đầy đủ (.pdf) (64 trang)

Phát triển công nghệ tìm kiếm thông tin trực tuyến việt nam trên nền tảng mã nguồn mở và web 2.0 tích hợp công nghệ bản đồ định vị số, bản đồ mô phỏng không gian ba chiều

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.33 MB, 64 trang )


Cơ quan hỗ trợ
QUỸ PHÁT TRIỂN KHOA HỌC
VÀ CÔNG NGHỆ QUỐC GIA
Đơn vị thực hiện
CÔNG TY CP GIẢI PHÁP PHẦN
MỀM CHUYÊN NGHIỆP VIỆT

HỒ SƠ ĐỀ TÀI NGHIÊN CỨU KHOA HỌC VÀ ĐỔI MỚI
CÔNG NGHỆ DO DOANH NGHIỆP THỰC HIỆN THEO
NGHỊ ĐỊNH 119/1999/NĐ-CP

BÁO CÁO TỔNG HỢP
KẾT QUẢ KHOA HỌC CÔNG NGHỆ ĐỀ TÀI/DỰ ÁN
Tên đề tài:
“Nghiên cứu, phát triển công nghệ tìm kiếm thông tin trực tuyến
Việt Nam trên nền tảng mã nguồn mở và Web 2.0, tích hợp công
nghệ bản đồ định vị số, bản đồ mô phỏng không gian ba chiều, ứng
dụng trên Web và điện thoại di động.”
Mã số: 01/2009


Cơ quan chủ trì đề tài/dự án: Công ty CP Giải pháp phần mềm
chuyên nghiệp Việt
Chủ nhiệm đề tài/dự án: Hoàng Quốc Việt
9187

Hà Nội - 2011
Cơ quan hỗ trợ
QUỸ PHÁT TRIỂN KHOA HỌC
VÀ CÔNG NGHỆ QUỐC GIA


Đơn vị thực hiện
CÔNG TY CP GIẢI PHÁP PHẦN
MỀM CHUYÊN NGHIỆP VIỆT

HỒ SƠ ĐỀ TÀI NGHIÊN CỨU KHOA HỌC VÀ ĐỔI MỚI
CÔNG NGHỆ DO DOANH NGHIỆP THỰC HIỆN THEO
NGHỊ ĐỊNH 119/1999/NĐ-CP


BÁO CÁO TỔNG HỢP
KẾT QUẢ KHOA HỌC CÔNG NGHỆ ĐỀ TÀI/DỰ ÁN
Tên đề tài:
“Nghiên cứu, phát triển công nghệ tìm kiếm thông tin trực tuyến Việt Nam
trên nền tảng mã nguồn mở và Web 2.0, tích hợp công nghệ bản đồ định vị
số, bản đồ mô phỏng không gian ba chiều, ứng dụng trên Web và điện
thoại di động.”
Mã số: 01/2009

Chủ nhiệm đề tài/dự án: Cơ quan chủ trì đề tài/dự án:
(ký tên) (ký tên và đóng dấu)




Hoàng Quốc Việt Nguyễn Văn Đắc








Hà N

i - 2011

CÔNG TY CP GIẢI PHÁP PHẦN
MỀM CHUYÊN NGHIỆP VIỆT
__________________
CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc

Hà Nội, ngày tháng năm 2011



BÁO CÁO THỐNG KÊ
KẾT QUẢ THỰC HIỆN ĐỀ TÀI/DỰ ÁN SXTN

I. THÔNG TIN CHUNG
1. Tên đề tài/dự án: “Nghiên cứu, phát triển công nghệ tìm kiếm thông
tin trực tuyến Việt Nam trên nền tảng mã nguồn mở và Web 2.0, tích
hợp công nghệ bản đồ định vị số, bản đồ mô phỏng không gian ba
chiều, ứng dụng trên Web và điện thoại di động.”
Mã số đề tài, dự án: 01/2009
Thuộc: Đề tài nghiên cứu khoa học và đổi mới công nghệ do doanh
nghiệp thực hiện theo nghị định 110/1999/NĐ-CP
2. Chủ
nhiệm đề tài/dự án:
Họ và tên: Hoàng Quốc Việt

Ngày, tháng, năm sinh: 26/03/1983 Nam/ Nữ: Nam
Học hàm, học vị: Cử nhân
Chức danh khoa học: Kỹ sư CNTT Chức vụ: Giám đốc
Điện thoại: Tổ chức: 04.66603701, Nhà riêng: 043.6886369, Mobile:
0916520899
Fax: 043.3688978 E-mail:
Tên tổ chức đang công tác: Công ty CP Giải pháp phần mềm chuyên
nghiệp Việt (Vietsoftpro)
Địa chỉ tổ chức: Nhà 12B, Lô 5, Khu đo thị Định Công, Hoàng Mai,
Hà Nội
Địa chỉ nhà riêng: Tổ 2, Bằng A, Hoàng Liệt, Hoàng Mai, Hà N
ội
3. Tổ chức chủ trì đề tài/dự án:
Tên tổ chức chủ trì đề tài: Công ty CP Giải pháp phần mềm chuyên
nghiệp Việt
Điện thoại: 04.66603703 Fax: 043.3688978
E-mail:
Website:
Địa chỉ: Tổ 2, Bằng A, Hoàng Liệt, Hoàng Mai, Hà Nội
Họ và tên thủ trưởng tổ chức (Chủ tịch HĐQT ) : Nguyễn Văn Đắc.
Số tài khoản: 0021001887416
Ngân hàng: Vietcombank Hà Nội

II. TÌNH HÌNH THỰC HIỆN
1. Thời gian thực hiện đề tài/dự án:
- Theo Hợp đồng đã ký kết: từ tháng 11 năm 2009 đến tháng 02 năm 2011.
- Thực tế thực hiện: từ tháng 11 năm 2009 đến tháng 09 năm 2011.
- Được gia hạn (nếu có): từ tháng 02 năm 2011 đến tháng 09 năm 2011.
2. Kinh phí và sử dụng kinh phí:
a) Tổng số kinh phí thực hiện: 3.163 triệu đồng, trong đó:

+ Kính phí hỗ trợ từ ngân sách Nhà nước để thực hiện đề tài: 936 triệu đồ
ng.
+ Kinh phí từ nguồn vốn của doanh nghiệp: 2.227 triệu đồng.
b) Tình hình cấp và sử dụng kinh phí từ nguồn ngân sách Nhà nước:
Theo kế hoạch Thực tế đạt được
Số
TT
Thời gian
(Tháng, năm)
Kinh phí
(Tr.đ)
Thời gian
(Tháng, năm)
Kinh phí
(Tr.đ)
Ghi chú
(Số đề nghị
quyết toán)
1 Năm 2010 736
2 Năm 2011 200 936

c) Kết quả sử dụng kinh phí theo các khoản chi:
Đối với đề tài:
Đơn vị tính: Triệu đồng
Theo kế hoạch Thực tế đạt được
Số
TT
Nội dung
các khoản chi
Tổng SNKH Nguồn

khác
Tổng SNK
H
Nguồn
khác
1 Trả công lao động
(khoa học, phổ
2855 899 1956 2855 899 1956
thông)
2 Nguyên, vật liệu,
năng lượng

3 Thiết bị, máy móc
184 184 179,36 179,36
4 Xây dựng, sửa
chữa nhỏ

5 Chi khác
124 37 87 200,53 37 163,53

Tổng cộng 3163 936 2227 3234,8
9
936 2298,8
9

3. Các văn bản hành chính trong quá trình thực hiện đề tài/dự án:
Số
TT
Số, thời gian ban
hành văn bản

Tên văn bản Ghi chú
1 Số: 806/QĐ-
BKHCN ngày
05/05/2008
Quyết định về việc thành
lập Hội đồng thẩm định
chuyên ngành xem xét hỗ
trợ kinh phí cho doanh
nghiệp thực hiện đề tài
nghiên cứu khoa học và
công nghệ năm 2009 theo
Nghị định 119/1999/NĐ-CP
của Chính phủ
Kèm theo:
- Danh sách các
thành viên hội đồng
thẩm định chuyên
ngành xem xét lựa
chọn các đề tài
nghiên cứu khoa
học và công nghệ
của doanh nghiệp
năm 2009.
- Tổng h
ợp danh
mục các đề tài của
doanh nghiệp đề
nghị hỗ trợ kinh phí
năm 2009 theo nghị
định 119/1999/NĐ-

CP
2 Ngày 09/05/2008 Biên bản họp hội đồng thẩm
định

3 Số 01/QĐ-HĐQLQ Quyết định: về việc thành
lập Tổ thẩm định nhiệm vụ
KH&CN do doanh nghiệp
thực hiện năm 2009 theo
nghị định 119/1999/NĐ-CP
của Chính phủ

4 Ngày 21/04/2009 Biên bản họp tổ thẩm định
đề tài KH&CN do doanh
nghiệp thực hiện năm 2009
theo nghị định
119/1999/NĐ-CP
5 Ngày 15/03/2009 Biên bản tiếp thu ý kiến bổ
xung đề tài nghiên cứu khoa
học

6 Số:15-TB/2009 Thông báo thay đổi nội
dung đăng ký kinh doanh
của doanh nghiệp

7 Số:
01/2009/HĐKHCN-
DN ngày
22/11/2009
Hợp đồng nghiên cứu Khoa
học và Phát triển công nghệ


8 Số 92/QPTKH-
HĐQL ngày
02/08/2011
Văn bản về việc gia hạn
thời gian thực hiện Đề tài
NCKH&PTCN theo Nghị
định số 119/1999/NĐ-CP
của Chính phủ.


4. Tổ chức phối hợp thực hiện đề tài, dự án:
Số
TT
Tên tổ
chức đăng
ký theo
Thuyết
minh
Tên tổ
chức đã
tham gia
thực hiện
Nội
dung
tham
gia chủ
yếu
Sản phẩm chủ yếu đạt
được

Ghi
chú*
Công ty
CP Giải
pháp phầm
mềm
chuyên
nghiệp
Việt
Công ty
CP Giải
pháp phầm
mềm
chuyên
nghiệp
Việt
Thực
hiện
toàn bộ
đăng ký
trong đề
tài.
1. IZOMI Search:
Hệ
thống nền tảng máy tìm
kiếm IZOMI
2. IZOMI Maps:
Bản đồ
trực tuyến IZOMI
3. IZOMI 3D Virtual

Tour: Mô phỏng ba chiều
trực tuyến
4. IZOMI AI:
Hệ thống
trả lời, tìm kiếm, nói
chuyện thông minh trực
tuyến ứng dụng công nghệ
thông minh nhân tạo tích
hợp trên Web, Chat và điện
thoại di động.
5. IZOMI News:
Hệ thống
tự động thu thập, phân loại,
tìm kiếm thông tin trực
tuyến các báo điện tử trong
và ngoài nước.
6. IZOMI Language
(Dictionary &
Translation): Dịch vụ tra
cứu từ điển, dịch văn bản
tự động trực tuyến.
7. IZOMI Mobile & 3G
Solutions: Dịch vụ tìm
kiếm, tra cứu thông tin trên
điện thoại di động.
8. IZOMI Social
Network: Mạng xã hội kết
nối cộng đồng theo xu
hướng Web 2.0 tích hợp
bản đồ, dịch vụ Chat và

điện thoại di động.


5. Cá nhân tham gia thực hiện đề tài, dự án:
Số
TT
Tên cá nhân
đăng ký theo
Thuyết minh
Tên cá nhân
đã tham gia
thực hiện
Nội dung
tham gia
chính
Sản phẩm
chủ yếu đạt
được
Ghi
chú*
1 Hoàng Quốc
Việt
Hoàng Quốc
Việt
- Chủ nhiệm
đề tài
- Phụ trách
phát triển
máy tìm kiếm
IZOMI

IZOMI
Search: Hệ
thống nền
tảng máy
tìm kiếm
IZOMI

2 Nguyễn Hữu
Thành
Nguyễn Hữu
Thành
Phụ trách
phát triển ứng
dụng tích hợp
công nghệ
thông minh
nhân tạo.
IZOMI AI:

Hệ thống trả
lời, tìm
kiếm, nói
chuyện
thông minh
trực tuyến
ứng dụng
công nghệ
thông minh
nhân tạo
tích hợp

trên Web,
Chat và
điện thoại di
động.

3 Hà Minh Toản Hà Minh
Toản
Phụ trách
phát triển tích
hợp ứng dụng
trên điện
thoại di động
IZOMI
Mobile &
3G
Solutions:
Dịch vụ tìm
kiếm, tra
cứu thông
tin trên điện
thoại di
động.

4 Nguyễn Đức
Dũng
Nguyễn Đức
Dũng
Phụ trách
phát triển tích
hợp ứng dụng

IZOMI
Mobile &
3G

trên điện
thoại di động
Solutions:

Dịch vụ tìm
kiếm, tra
cứu thông
tin trên điện
thoại di
động.
5 Đỗ Văn Giáp

Đỗ Văn Giáp Phụ trách
phát triển ứng
dụng từ điển,
dịch văn bản
IZOMI
Language
(Dictionary
&
Translation
): Dịch vụ
tra cứu từ
điển, dịch
văn bản tự
động trực

tuyến.

6 Nguyễn
Quang Hưng
Nguyễn
Quang Hưng
Phụ trách
phát triển hệ
thống tin tức
trực tuyến.
IZOMI
News: Hệ
thống tự
động thu
thập, phân
loại, tìm
kiếm thông
tin trực
tuyến các
báo điện tử
trong và
ngoài nước.

7 Đặng Phan
Điệp
Đặng Phan
Điệp
Phụ trách
phát triển ứng
dụng bản đồ

trực tuyến
IZOMI
Maps: Bản
đồ trực
tuyến
IZOMI

8 Lê Tiến Hiển Nguyễn Duy

Phụ trách
phát triển hệ
thống tin tức
trực tuyến.
IZOMI
News: Hệ
thống tự
động thu
thập, phân

loại, tìm
kiếm thông
tin trực
tuyến các
báo điện tử
trong và
ngoài nước.
9 Đồng Quang
Đức
Nguyễn
Thanh Hiếu

Phụ trách
phát triển tích
hợp công
nghệ mô
phỏng ba
chiều.
IZOMI 3D
Virtual
Tour: Mô
phỏng ba
chiều trực
tuyến

10 Vũ Minh
Tuân
Phụ trách
phát triển tích
hợp dịch vụ
mạng xã hội.
IZOMI
Social
Network:
Mạng xã
hội kết nối
cộng đồng
theo xu
hướng Web
2.0 tích hợp
bản đồ, dịch
vụ Chat và

điện thoại di
động.

- Lý do thay đổi:
+ Cán bộ Lê Tiến Hiển điều chuyển công tác nên công việc phụ phát
triển IZOMI News được thay thế bởi cán bộ Nguyễn Duy Tư.
+ Cán bộ Đồng Quang Đức đi du học tại Úc nên công việc phụ trách
phát triển tích hợp công nghệ mô phỏng ba chiều được thay thế bởi cán bộ
Nguyễn Thanh Hiếu.
+ Do tiến độ công việc, chủ nhiệm đề tài cử thêm cán bộ Vũ Minh
Tuấn là cán bộ chính phụ
trách phát triển tích hợp công nghệ mô phỏng ba
chiều.
6. Tình hình tổ chức hội thảo, hội nghị:
Số
TT
Theo kế hoạch
(Nội dung, thời gian, kinh phí, địa
Thực tế đạt được
(Nội dung, thời gian, kinh
Ghi chú*
điểm ) phí, địa điểm )
1 - Hội thảo “Xây dựng hệ
thống Cluster server trên nền
tảng Unix/Linux, Ứng dụng
công nghệ trí tuệ thông minh
nhân tạo trên và mobile, Xu
hướng và ứng dụng thế hệ
web2.0 tại Việt Nam”.
- Kinh phí (triệu đồng): 6,0

- Hội thảo “Xây dựng
hệ thống Cluster server
trên nền tảng
Unix/Linux, Ứng dụng
công nghệ trí tuệ thông
minh nhân tạo trên và
mobile, Xu hướng và
ứng dụng thế hệ web2.0
tại Việt Nam”.
- Thời gian: ngày
29/12/2010
-
Địa điểm: Phòng hội
thảo, trung tâm Ươm
tạo CNC, khu công
nghệ cao Hòa Lạc.
- Kinh phí (triệu đồng):
5,65

2 - Hội nghị “Xây dựng công
nghệ tìm kiếm của Việt Nam
trên nền tảng mã nguồn mở,
Y kiến khách hàng”
- Kinh phí (triệu đồng): 6,0
- Hội nghị “Xây dựng
công nghệ tìm kiếm của
Việt Nam trên nền tảng
mã nguồn mở, Y kiến
khách hàng”
- Thời gian: 08/03/2011

- Địa điểm: Phòng hội
thảo, trung tâm Ươm
tạo CNC, khu công
nghệ cao Hòa Lạc.
- Kinh phí (triệu đồng):
5,72


8. Tóm tắt các nội dung, công việc chủ yếu:
Thời gian
(Bắt đầu, kết thúc
- tháng … năm)
Số
TT
Các nội dung, công việc
chủ yếu
(Các mốc đánh giá chủ yếu)
Theo kế
hoạch
Thực tế
đạt được
Người,
cơ quan
thực hiện
I IZOMI Search
11/2009
đến
11/2009
đến
Công ty

Vietsoftpro,
04/2010 05/2010 Trưởng
nhóm phát
triển: Hoàng
Quốc Việt
1
Phát triển hệ thống máy chủ
tìm kiếm (Search Server
System)
11/2009
đến
02/2010
11/2009
đến
02/2010

2
Phát triển hệ thống cơ sở dữ
liệu cho Local Search
11/2009
đến
03/2010
11/2009
đến
02/2010

3
Phát triển hệ thống web
crawlering
12/2009

đến
02/2010
01/2010
đến
03/2010

4
Phát triển hệ thống nhập và
kiểm tra dữ liệu nội bộ
11/2009
đến
02/2010
01/2010
đến
03/2010

5
Phát triển hệ thống data
indexing
12/2009
đến
03/2010
12/2009
đến
02/2010

6
Phát triển máy tìm kiếm
(Search engine)
11/2009

đến
03/2010
01/2010
đến
05/2010

7
Phát triển module phân loại
tìm kiếm tối ưu theo từ khóa
(key work search
categorization) và tìm kiếm
theo các lĩnh vực chi tiết
(search narrow down)
12/2009
đến
04/2010
02/2010
đến
04/2010

8
Phát triển module tìm chuỗi ký
tự sát nghĩa nhất cho tiếng Việt
có dấu và không dấu và module
gợi ý kết quả gàn đúng.

02/2010
đến
04/2010


9
Module Caching trong hệ
thống tìm kiếm

02/2010
đến
03/2010

10
Phát triển giao diện người
dùng IZOMI Search
12/2009
đến
04/2010
11/2009
đến
05/2010

II IZOMI Maps 12/2009 11/2009
Công ty
đến
10/2010
đến
03/2011
Vietsoftpro,
Trưởng
nhóm phát
triển: Đặng
Phan Điệp
1

Phát triển máy chủ bản đồ
(Map server)
12/2009
đến
02/2010
06/2010
đến
08/2010

2
Hiệu chỉnh dữ liệu số bản đồ
nền cho các tỉnh thành và các
địa điểm du lịch nổi tiếng tại
Việt Nam (Xây dựng lớp dữ
liệu nền, vector hóa trên dữ
liệu bản đồ thô)
12/2009
đến
10/2010
11/2009
đến
03/2011

3
Phát triển ứng dụng bản đồ
(Map Client)
02/2010
đến
08/2010
05/2010

đến
08/2010

4
Phát triển, tích hợp các ứng
dụng web2.0 trên nền bản đồ
06/2010
đến
10/2010
06/2010
đến
08/2010

III IZOMI 3D Virtual Tour
06/2010
đến
02/2011
06/2010
đến
07/2011
Công ty
Vietsoftpro,
Trưởng
nhóm phát
triển:
Nguyễn
Thanh Hiếu
1 Phát triển 3D Engine
06/2010
đến

09/2010
06/2010
đến
08/2010

2
Xây dựng dữ liệu 3D giai đoạn
1 cho Hà Nội, Đền Hùng
06/2010
đến
02/2011
12/2010
đến
07/2011

3
Phát triển giao diện người
dùng (3D Client) tích hợp trên
nền bản đố 2D.
08/2010
đến
02/2011
08/2010
đến
10/2010

4
Phát triển các ứng dụng người
dùng trên nền bản đồ không
gian 3D.

08/2010
đến
02/2011
08/2010
đến
10/2010

IV IZOMI AI
02/2010
đến
10/2010
08/2010
đến
04/2011
Công ty
Vietsoftpro,
Trưởng
nhóm phát
triển:
Nguyễn Hữu
Thành
1
Phát triển máy chủ AI (AI
server)
02/2010
đến
04/2010
08/2010
đến
10/2010


2
Phát triển máy thông minh (AI
Engine)
02/2010
đến
06/2010
07/2010
đến
11/2010

3
Xây dựng dữ liệu ngôn ngữ
giao tiếp con người (human
language): cả tiếng Việt và
tiếng Anh.
02/2010
đến
10/2010
02/2011
đến
04/2011

4
Phát triển hệ thống API kết nối
web, chat và điện thoai di động
06/2010
đến
10/2010
09/2010

đến
11/2010

5
Phát triển hệ thống API tích
hợp tìm kiếm thông tin, tra cứu
dịch từ điển, và các dịch vụ
tích hợp khác
06/2010
đến
10/2010
09/2010
đến
02/2011

V IZOMI News
12/2009
đến
06/2010
11/2010
đến
03/2011
Công ty
Vietsoftpro,
Trưởng
nhóm phát
triển:
Nguyễn
Quang Hưng
1

Xây dựng máy chủ IZOMI
News Server
12/2009
đến
02/2010
11/2010
đến
12/2010

2
Phát triển hệ thống tự động thu
thập và phân loại thông tin
theo chủ đề các báo điện tử lớn
trong và ngoài nước.
12/2009
đến
04/2010
11/2010
đến
01/2011

3 Hệ thống tìm kiếm toàn văn 02/2010 01/2011

cho tất cả các tin báo điện tử. đến
06/2010
đến
03/2011
4
Phát triển giao diện người
dùng (web client)

03/2010
đến
06/2010
11/2010
đến
01/2011

VI
IZOMI Language
(Dictionary & Machine
Translation)
03/2010
đến
12/2010
11/2010
đến
06/2011
Công ty
Vietsoftpro,
Trưởng
nhóm phát
triển: Đỗ
Văn Giáp
1
Phát triển máy chủ Language
Server
03/2010
đến
06/2010
11/2010

đến
01/2011

2
Phát triển hệ thống từ điển
(Dictionary)
03/2010
đến
10/2010
12/2010
đến
02/2011

3 DICT ENGINE Package
12/2010
đến
01/2011

4
Tích hợp hệ thống dịch văn bản
tự động (Machine translation)
06/2010
đến
12/2010
01/2011
đến
06/2011

5
Phát triển API cung cấp dịch

vụ dịch, tra từ điển trên web,
Chat.

01/2011
đến
03/2011

6
Xây dựng hệ thống tích hợp
web2.0 cho hệ thống từ điển và
dịch máy văn bản
08/2010
đến
10/2010
01/2011
đến
03/2011

7
Phát triển giao diện người
dùng web
08/2010
đến
12/2010
02/2011
đến
03/2011

VII
IZOMI Mobile & 3G

Solutions
06/2010
đến
01/2011
02/2011
đến
06/2011
Công ty
Vietsoftpro,
Trưởng
nhóm phát
triển: Hà
Minh Toản
1 Phát triển hệ thống máy chủ 06/2010 02/2011

đến
09/2010
đến
04/2011
2
Phát triển gateway kết nối với
các nhà cung cấp mạng viển
thông qua SMS, WAP
07/2010
đến
12/2010
03/2011
đến
06/2011


VIII IZOMI Social Network
08/2010
đến
02/2011
03/2011
đến
07/2011
Công ty
Vietsoftpro,
Trưởng
nhóm phát
triển: Vũ
Minh Tuân
1 Phát triển hệ thống
08/2010
đến
01/2011
03/2011
đến
07/2011

2
Phát triển hệ thống ứng dụng
mạng xã hội
08/2010
đến
02/2011
05/2011
đến
07/2011



- Lý do thay đổi: Do yếu khối lượng công việc thực tế của đề tài nên tiến độ
công việc được tăng thêm 06 tháng so với kế hoạch ban đầu. Chủ nhiệm đề
tài đã có công văn giải trình và đề nghị gia hạn với Quỹ phát triển Khoa học
và Công nghệ Quốc gia.


III. SẢN PHẨM KH&CN CỦA ĐỀ TÀI, DỰ ÁN
1. Sản phẩm KH&CN đã tạo ra:
Yêu cầu khoa học
cần đạt

Số
TT
Tên sản phẩm

Theo
kế hoạch
Thực tế
đạt được
Số
lượng
sản
phẩm
tạo ra
1
IZOMI Search:

Hệ thống nền

tảng máy tìm
kiếm IZOMI
- Tìm kiếm toàn văn
(Full text search)
- Cơ chế xử lý
XMLRPC
- Thời gian trả lại kết
quả tìm kiếm nhanh:
SRT < 1/10 giây.
- Thời gian xử lý tìm
- Tìm kiếm toàn văn
(Full text search)
- Tính năng tìm kiếm
thu hẹp (Search
narrow down) cho
phép tìm thông tin
nhanh và chính xác.
- Xử lý phân tán theo
01
kiếm tại máy chủ: ổn
định: SPT < 1/100
giây.
- Tìm kiếm tiếng Việt
có dấu và không dấu
- Có khả năng tìm
kiếm, tự động phân
loại các loại dữ liệu
khác nhau trên các
cấu trúc động, phức
tạp (định dạng XML)

- Khả năng tìm kiếm
gần đúng, đưa ra gợi
ý sát với các từ khóa
tìm kiếm.
- Tìm kiếm thông tin
Local Search (địa
điểm, dịch vụ taxi, xe
buýt, phim chiếu r
ạp)
công nghệ XMLRPC
- Thời gian trả lại kết
quả tìm kiếm nhanh:
SRT < 0.05s.
- Thời gian xử lý tìm
kiếm tại máy chủ: ổn
định: SPT < 0.01s.
- Tìm kiếm tiếng Việt
có dấu và không dấu
- Có khả năng tìm
kiếm, tự động phân
loại các loại dữ liệu
khác nhau trên các
cấu trúc động, phức
tạp (định dạng XML)
- Khả năng tìm kiếm
gần đúng, đưa ra gợi
ý sát v
ới các từ khóa
tìm kiếm.
- Tìm kiếm thông tin

Local Search cho 05
lĩnh vực chính: Giải
trí, Ăn uống, Tin tức,
Du lịch, Thương mại.
2
IZOMI Maps:

Bản đồ trực
tuyến IZOMI
- Cơ sở dữ liệu các
tỉnh/thành phố và các
địa điểm du lịch chính
tại Việt Nam: Hà Nội,
09 thành phố chính,
50 tỉnh, 05 địa điểm
du lịch
- Có khả năng mở
(social network) cho
cộng đồng tự động
cập nhật, định vị các
địa điểm trên bản đồ.
- Chức năng web2.0:
tạo đị
a điểm cuộc
hẹn, kết nối bạn bè,
lưu danh các địa điểm
- Cơ sở dữ liệu các
tỉnh/thành phố và các
địa điểm du lịch chính
tại Việt Nam: Hà Nội,

09 thành phố chính,
50 tỉnh, 05 địa điểm
du lịch
- Có khả năng mở
(social network) cho
cộng đồng tự động
cập nhật, định vị các
địa điểm trên b
ản đồ.
- Chức năng web2.0:
tạo địa điểm cuộc
hẹn, kết nối bạn bè,
lưu danh các địa điểm
01
nổi tiếng…trên nền
bản đồ.
- Khả năng cung cấp
API bản đồ tích hợp
cho các nhà phát triển
web khác.
nổi tiếng…trên nền
bản đồ.
- Khả năng cung cấp
API bản đồ tích hợp
cho các nhà phát triển
web khác.
3
IZOMI 3D
Virtual Tour:
Mô phỏng ba

chiều trực tuyến
- Xây dựng dữ liệu
giai đoạn 1 cho các
địa điểm nổi tiếng tại
Hà Nội (100 địa
điểm), Đền Hùng (20
địa điểm)
- Có khả năng zoom,
xoay 360 độ trên 3D.
- Dữ liệu có khả năng
cập nhật thường
xuyên.
- Khả năng cung cấp
API tích hợp cho các
phát triển dịch vụ web
khác.
- Có khả năng hi
ện thị
nội dung, chú thích,
comment cho các vị
trí trên không gian 3D
- Xây dựng dữ liệu
giai đoạn 1 cho các
địa điểm nổi tiếng tại
Hà Nội (100 địa
điểm), Đền Hùng (20
địa điểm)
- Có khả năng zoom,
xoay 360 độ trên 3D.
- Dữ liệu có khả năng

cập nhật thường
xuyên.
- Khả năng cung cấp
API tích hợp cho các
phát triển dịch vụ web
khác.
- Có khả năng hiệ
n thị
nội dung, chú thích,
comment cho các vị
trí trên không gian 3D
01
4 IZOMI AI: Hệ
thống trả lời,
tìm kiếm, nói
chuyện thông
minh trực tuyến
ứng dụng công
nghệ thông
minh nhân tạo
tích hợp trên
Web, Chat và
điện thoại di
động.
- Có khả năng giao
tiếp với người dùng
bằng ngôn ngữ tiếng
Việt (cả có dấu và
không dấu) và tiếng
Anh

- Tích hợp cả 3 nền
tảng Web, các hệ
thống Chat (Yahoo,
MSN) và điện thoại di
động.
- Có khả
năng tự động
nói chuyện thông
minh bằng tiếng Anh
và Việt
- Có khả năng giao
tiếp với người dùng
bằng ngôn ngữ tiếng
Việt (cả có dấu và
không dấu) và tiếng
Anh
- Tích hợp cả 3 nền
tảng Web, các hệ
thống Chat (Yahoo,
MSN) và điện thoại di
động.
- Có khả năng tự động
nói chuyện thông
minh bằng tiếng Anh
và Việt.
01
- Tích hợp khả năng
phân tích nhu cầu và
cung cấp các thông tin
hữu ích cho người

dùng (tra từ điển, dịch
văn bản, tìm thông tin
phim, cafe, nhà hàng,
thông tin thời tiết, tin
tức thời sự,….)
- Tích hợp khả năng
phân tích nhu cầu và
cung cấp các thông tin
hữu ích cho người
dùng (tra từ điển, dịch
văn bản, tìm thông tin
phim, cafe, nhà hàng,
thông tin thời tiết, tin
tức thời sự,….)
5
IZOMI News:

Hệ thống tự
động thu thập,
phân loại, tìm
kiếm thông tin
trực tuyến các
báo điện tử
trong và ngoài
nước.
- Tự động thu thập
phân loại thông tin
theo chủ đề các báo
điện tử lớn tại Việt
Nam và trên thế giới:

BBC, CNN,
Vnexpress,Thanhnien,
Dantri, Vietnamnet
- Có khả năng tìm
kiếm thông tin nhanh,
chính xác
- Tích hợp trên hệ
thống internet và trên
các dịch vụ Chat.
- Tự động thu thập
phân loạ
i thông tin
theo chủ đề các báo
điện tử lớn tại Việt
Nam và trên thế giới:
BBC, CNN,
Vnexpress,Thanhnien,
Dantri, Vietnamnet
- Có khả năng tìm
kiếm thông tin nhanh,
chính xác
- Tích hợp trên hệ
thống internet và trên
các dịch vụ Chat.
01
6
IZOMI
Language
(Dictionary &
Translation):

Dịch vụ tra cứu
từ điển, dịch
văn bản tự động
trực tuyến.
- Nhanh, chính xác và
hiệu quả
- Tra cứu từ điển:
Anh, Pháp, Nga, Hàn,
Nhật, Trung Quốc.
- Dịch tự động văn
bản các ngôn ngữ phổ
biến trên thế giới
(Việt - Anh, Việt –
Pháp)
- Tích hợp trên web,
chat và cả điện thoại
di động.
- Khả nă
ng mở: có
khả năng cập nhật
thêm các từ mới, định
nghĩa, chú thích từ
- Nhanh, chính xác và
hiệu quả
- Tra cứu từ điển:
Anh, Pháp, Nga, Hàn,
Nhật, Trung Quốc.
- Dịch tự động văn
bản các ngôn ngữ phổ
biến trên thế giới

(Việt - Anh, Việt –
Pháp)
- Tích hợp trên web,
chat và cả điện thoại
di động.
- Khả năng mở: có
khả năng c
ập nhật
thêm các từ mới, định
nghĩa, chú thích từ
01
cộng đồng người
dùng.
cộng đồng người
dùng.
7
IZOMI Mobile
& 3G
Solutions: Dịch
vụ tìm kiếm, tra
cứu thông tin
trên điện thoại
di động.
- Khả năng tích hợp
với các nhà cung cấp
dịch vụ SMS.
- Tốc độ truy cập
thông tin nhanh, hiệu
quả
- Khả năng tương

thích SMS và GPRS.
- Khả năng tìm kiếm
các địa điểm, tra cứu
từ điển, dịch tự động,
tin tức hàng ngày, chỉ
số chứng khoán.
- Khả
năng tích hợp
với các nhà cung cấp
dịch vụ SMS.
- Tốc độ truy cập
thông tin nhanh, hiệu
quả
- Khả năng tương
thích SMS và GPRS.
- Khả năng tìm kiếm
các địa điểm, tra cứu
từ điển, dịch tự động,
tin tức hàng ngày, chỉ
số chứng khoán.
01
8
IZOMI Social
Network: Mạng
xã hội kết nối
cộng đồng theo
xu hướng Web
2.0 tích hợp bản
đồ, dịch vụ Chat
và điện thoại di

động.
- Khả năng đăng nhập
hệ thống theo cơ chế
OpenID
- Chia sẻ thông tin,
giao lưu kết bạn tích
hợp hệ thống bản đồ,
Chat
- Tích hợp với mạng
cộng đồng lớn trên
thế giới (Face book)
- Khả n
ăng đăng nhập
hệ thống theo cơ chế
OpenID
- Chia sẻ thông tin,
giao lưu kết bạn tích
hợp hệ thống bản đồ,
Chat
- Tích hợp với mạng
cộng đồng lớn trên
thế giới (Face book)
01

2. Đánh giá về hiệu quả do đề tài, dự án mang lại:
a) Hiệu quả về khoa học và công nghệ:
Trong quá trình thực hiện đề tài, nhóm thực hiện đã nghiên cứu, ứng dụng và
làm chủ được các công nghệ quan trọng, rất nhiều trong số đó là hướng phát
triển tương lai trong lĩnh vực CNTT nói chung và Internet nói riêng. Cụ thể:
+ Công nghệ tìm kiếm trực tuyến (Search Engine):

Tìm kiếm trực tuyến luôn là một trong số công cụ quan trọ
ng và được quan
tâm nhất trên Internet với người sử dụng cũng như các nhà nghiên cứu phát
triển dịch vụ trực tuyến. Google, Yahoo, Bing, Baidu, là các dịch vụ Web
search rất phổ biến trên phạm vi toàn cầu.
Đề tài tập trung vào lĩnh vực Local Search cho tiếng Việt trên nền tảng công
nghệ Web 2.0, giải quyết bài toán tìm kiếm thông tin cho những lĩnh vực
chuyên sâu (Vertical search) mà người dùng Internet Việt Nam quan tâm
hàng ngày: Giải trí, ăn uống, thời trang, dịch vụ thương mại, tin tức, địa
điểm
Các công nghệ mà nhóm thực hiện đề tài đã làm chủ là:
- Tìm kiếm thông tin các lĩnh vực chuyên sâu (Vertical search)
- Tìm kiếm trên cấu trúc dữ liệu động, phức tạp
- Xữ lý Search querry nhanh trên hệ th
ống máy chủ phân tán
- Tìm kiếm toàn văn (Full text search) cả tiếng Việt không dấu và có dấu
- Tích hợp bản đồ trực tuyến
- Tích hợp tìm kiếm trên các dịch vụ Chat và Mobile.
+ Ứng dụng công nghệ thông minh nhân tạo (Artificial Intelligence - AI)
trên Internet:
Đề tài đã nghiên cứu, ứng dụng thành công công nghệ AI trên Internet, tạo
ra dịch vụ Bot Server có khả năng giao tiếp với người dùng thông qua hệ
thống Web, Chat. Tích hợp Bot Server với dịch vụ tìm kiếm, dịch vụ từ đi
ển,
dịch vụ tin tức, làm tăng tính thân thiện, thông minh của hệ thống tìm kiếm
IZOMI, đem lại sự tiện lợi tốt nhất cho người sử dụng.
Trên thế giới, công nghệ AI cũng đã được ứng dụng khá rộng rãi trên
Internet, nhưng có thể nói đề tài đã lần đầu tiên tích hợp công nghệ này cho
một dịch vụ tìm kiếm trực tuyến.
+ Công nghệ xử lý ngôn ngữ tiếng Việ

t:
Xử lý ngôn ngữ tiếng Việt đang được quan tâm nghiên cứu phát triển tại
Việt Nam. Làm chủ được công nghệ này sẽ mang lại rất nhiều ứng dụng hữu
ích cho các sản phẩm phần mềm, tăng tính thân thiện, hiệu quả xử lý thông
tin cho các dịch vụ trực tuyến trong nước.
Đề tài đã làm chủ được các công nghệ sau:
- Từ điển tiếng Việt với các ngôn ngữ phổ biế
n trên thế giới: Anh, Pháp,
Trung,
- Dịch văn bản tiếng Việt.
- Phân tách cụm từ trong chuỗi văn bản.
- Chuyển đổi tiếng Việt có dấu sang không dấu và ngược lại.
b) Hiệu quả về kinh tế xã hội:
Mục tiêu của đề tài là xây dựng hệ thống tìm kiếm trực tuyến Local Search.
Sau khi hoàn thành đề tài, sản phẩm ứng dụng thực tiễn sẽ mang lại hiệu quả
kinh tế rất lớn không chỉ cho doanh nghiệp chủ trì Vietsoftpro mà cho rất
nhiều các doanh nghiệp đối tác và xã hội.
- Hiệu quả kinh tế chung: Sản phẩm của đề tài sẽ là một hệ thống tìm ki
ếm
thông tin Local Search đầu tiên tại Việt Nam. Tính tới thời điểm kết thúc đề
tài, tại Việt Nam hiện mới chỉ có 2 dòng công cụ tìm kiếm, đó là:
+ Dịch vụ Web Search: Thị phần Web search tại Việt Nam chủ yếu
vẫn thuộc về các dịch vụ phổ biến toàn cầu, đó là: Google, Bing, Yahoo. Một
số sản phẩm tương tự của Việt Nam, điển hình là SocBay của NaisCorp, về
c
ơ bản đã không cạnh tranh được với các dịch vụ nước ngoài.
+ Các dịch vụ tìm kiếm tích hợp trong các cổng thông tin: Điển hình
là các dịch vụ cổng thông tin về Âm nhạc, Thời trang, Việc làm, Tin
tức, Đây là thế mạnh của các dịch vụ trong nước.
Như vậy, một hệ thống tìm kiếm Local Search tổng hợp các thông tin mà

người dùng quan tâm hàng ngày sẽ là hướng đi phù hợp với khả năng đầ
u tư
tài chính và hạ tầng, đem lại thế mạnh cạnh tranh, thu hút thị phần người
dùng lớn cho các doanh nghiệp CNTT trong nước. Trên cơ sở đó dịch vụ
Local Search sẽ đem lại hiệu quả rât lớn về mặt kinh tế, cụ thể đó là doanh
thu trên quảng cáo trực tuyến.
Theo một số đánh giá không chính thức, doanh thu của thị trường quảng cáo
trực tuyến trong năm 2006 là 64 tỷ VNĐ, 2007 kho
ảng 80 tỷ VND, 2008
doanh thu đạt hơn 120 tỷ VND, đạt tới con số 400 tỷ VNĐ vào năm 2010, dự
kiến trong những năm tới sẽ tăng trưởng 100%.
- Hiệu quả kinh tế cho doanh nghiệp chủ trì đề tài và các doanh nghiệp
đối tác:
Đề tài đã thúc đẩy, rút ngắn quá trình nghiên cứu, ứng dụng công nghệ trong
doanh nghiệp. Các sản phẩm công nghệ của đề tài đang và sẽ được ứng dụng
trực tiếp vào các s
ản phẩm thương mại, đem lại hiệu quả kinh tế rất lớn. Cụ
thể:
+ Năm 2010, 2011: Tích hợp công nghệ tìm kiếm, bản đồ số, xử lý
ngôn ngữ tiếng Việt cho các sản phẩm quản lý thông tin, quản lý kho, cổng
thông tin: doanh thu đạt gần 2 tỷ VNĐ.
+ Các năm tiếp theo: Đề tài sẽ hoàn thiện và được ứng dụng rộng rãi
hơn, đặc biệt cho lĩnh vực văn hóa, giải trí. Hiệu quả kinh tế ước đạt trên 2
tỷ/năm.
3. Tình hình thực hiện chế độ báo cáo, kiểm tra của đề tài, dự án:
Số
TT
Nội dung
Thời gian
thực hiện

Ghi chú

Nghiệm thu cơ sở Ngày
19/10/2011
(Dự kiến thực hiện)



Chủ nhiệm đề tài
(Họ tên, chữ ký)


Thủ trưởng tổ chức chủ trì
(Họ tên, chữ ký và đóng dấu)


MỞ ĐẦU
Tìm kiếm trực tuyến là một trong những ứng dụng quan trọng không
thể thiếu trên Internet. Hiện nay trên thế giới, các dịch vụ tìm kiếm trực
tuyến phổ biến có thể kể đến như Google, Bing, Yahoo Search, trong đó,
nếu xét ở phạm vi toàn cầu, Google hiện đang giữ thị phần người dùng lớn
nhất.
Ở mỗi quốc gia, việc làm chủ công nghệ tìm kiếm trực tuy
ến và có
môt dịch vụ tìm kiếm nội địa đủ mạnh chiếm lĩnh được thị phần nguời dùng
không chỉ có ý nghĩa về mặt kinh tế mà còn có ý nghĩa rất lớn trong việc
thúc đẩy phát triển công nghệ Internet và đảm bảo an ninh số. Các nước như
Nga, Trung Quốc, Nhật Bản đã làm được điều này với các dịch vụ tìm kiếm
thông tin trực tuyến nội địa như: Yandex, Baidu, Iscle.
Tạ

i Việt Nam, đã có những dịch vụ tìm kiếm nội địa xuất hiện, có thể
kể đến các dịch vụ như: Vinaseek, Xalo, Socbay, Các dịch vụ này đều đáp
ứng được một phần nhu cầu tìm kiếm thông tin của người Việt Nam nhưng
nhìn chung chưa chiếm được thị phần người dùng khi tập trung vào tính
năng Web Search như Google đòi hỏi đầu tư và duy trì hạ tầng rất lớn. Tuy
nhiên, các dị
ch vụ trên đã bước đầu thành công với các dịch vụ tìm kiếm
thông tin về âm nhạc và tin tức cũng như rất triển vọng ở mảng ứng dụng
trên điện thoại di động. Như vậy, dịch vụ tìm kiếm thông tin tổng hợp Local
Search tập trung chuyên sâu vào các lĩnh vực người dùng quan tâm hàng
ngày, phù hợp với văn hóa thói quen người dùng và ngôn ngữ tiếng Việt sẽ
là hướng đi giúp các dịch vụ tìm kiế
m nội địa chiếm lĩnh thị phần người
dùng trong nước và là ưu điểm cạnh tranh với các dịch vụ tìm kiếm nước
ngoài. Tại Ấn Độ, xuất hiện từ năm 2009, dịch vụ tìm kiếm trực tuyến
Onyomo đã rất thành công theo hướng đi này.
Công nghệ thông tin nói chung và công nghệ ứng dụng trên Internet
nói riêng phát triển không ngừng. Chúng ta đã trải qua thế hệ Web1.0, hiện
tại là Web2.0 với sự bùng n
ổ và phát triển của các mạng xã hội và tương lai
là thế hệ Web3.0 với xu hướng phát triển Web có ngữ nghĩa (Semantic
Web). Công nghệ tìm kiếm trực tuyến cũng nằm trong xu thế phát triển
chung đó thế hệ tìm kiếm trực tuyến tương lai phải là những công cụ tìm
kiếm trực tuyến thông minh, biểu đạt ngữ nghĩa và tương tác tốt hơn với con
người. Đây cũng là hướng đi công nghệ t
ạo ra cơ hội thành công cho các dự
án phát triển dịch vụ tìm kiếm Việt Nam hiện tại và tương lai.
Xuất phát từ thực tiễn trên, đề tài “Nghiên cứu, phát triển công nghệ
tìm kiếm thông tin trực tuyến Việt Nam trên nền tảng mã nguồn mở và Web
2.0, tích hợp công nghệ bản đồ định vị số, bản đồ mô phỏng không gian ba

chiều, ứng dụng trên Web, Chat và điện thoại di động” đặt ra các mục tiêu
sau:
- Nghiên cứu, phát triển công nghệ tìm kiếm trực tuyến, tập trung phát
triển theo hướng Local Search
- Nghiên cứu, phát triển các công nghệ xử lý ngôn ngữ tiếng Việt
- Nghiên cứu ứng dụng công nghệ thông minh nhân tạo (AI) tích hợp
vào hệ thống tìm kiếm
- Nghiên cứu, phát triển các ứng dụng kết nối dịch vụ tìm kiếm trên
Web, các dịch vụ Chat và điện thoại di động
- Phát triển và tích hợp các tính năng tiện ích cho dịch vụ tìm kiế
m:
Bản đồ trực tuyến, Tin tức, Từ điển, ứng dụng mô phỏng 3D.
Sau gần 2 năm thực hiện, đề tài đã hoàn thành, xây dựng được một hệ
thống tìm kiếm Local Search với 8 phân hệ sản phẩm công nghệ là: Phân hệ
tìm kiếm (IZOMI Search), Phân hệ bản đồ trực tuyến (IZOMI Maps), Phân
hệ ngôn ngữ (IZOMI Language), Phân hệ tích hợp thông minh nhân tạo
(IZOMI AI), Phân hệ tin tức (IZOMI News), Phân hệ mô phỏng 3D (IZOMI
3D Virtual Tour), Phân hệ ứng dụ
ng trên điện thoại (IZOMI Mobile). Đề tài
đã hoàn thành mục tiêu ban đầu là nghiên cứu thành công mô hình công
nghệ tìm kiếm thế hệ mới ứng dụng tại Việt Nam, phát triển thử nghiệm một
hệ thống hoàn chỉnh để đánh giá các tính năng và khả năng ứng dụng.
Tuy nhiên, quá trình thực hiện đề tài cũng đặt ra cho nhóm tác giả
những vấn đề cần nghiên cứu, giải quyết trong tương lai, đó là:
- Nghiên cứu, làm chủ
công nghệ điện toán tri thức cho máy tìm kiếm
(hướng phát triển mà dự án WolframAlpha đang thực hiên) cho tiếng Việt
- Nghiên cứu, phát triển công nghệ điện toán đám mây (Cloud
computing) cho hệ thống tìm kiếm
- Xây dựng hoàn thiện hạ tầng kỹ thuật, hệ thống cơ sở dữ liệu đầy đủ.


Chương 1 – NỘI DUNG KHOA HỌC CÔNG NGHỆ ĐÃ THỰC HIỆN

1.1 Hệ thống nền tảng máy tìm ki
ếm Izomi - Izomi Search

1.1.1 Giới thiệu chung
Trung tâm hệ thống tìm kiếm IZOMI là nền tảng tìm kiếm IZOMI Search.
IZOMI Search là một máy tìm kiếm cục bộ (Local Search Engine) được phát
triển theo công nghệ Web 2.0.
IZOMI Search cho phép tìm kiếm toàn văn (Full text search) thông tin chi
tiết các lĩnh vực mà người dùng quan tâm hàng ngày nhất, đó là các lĩnh
vực: Giải trí, Ăn uống, Du lịch, Tin tức, Kinh doanh thương mại và được
chia theo 15 danh mục chính: Nhà hàng, Khách sạn, Café, ATM, Trạm xăng,
Công ty thương mại, Phim ảnh, Địa điểm Karaoke, Quán Bar, Cửa hàng l
ưu
niệm, Văn phòng phẩm, Hàng hoa, Shop thời trang, Siêu thị, Ngân hàng

×