Tải bản đầy đủ (.pdf) (47 trang)

Nghiên cứu, xây dựng hệ thống gợi ý quảng cáo trong các dịch vụ chia sẻ hình ảnh trực tuyến

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (753.66 KB, 47 trang )


BỘ KHOA HỌC VÀ CÔNG NGHỆ



CHƯƠNG TRÌNH KH&CN TRỌNG ĐIỂM CẤP NHÀ NƯỚC
KC.01/11-15




BÁO CÁO TỔNG HỢP
KẾT QUẢ KHOA HỌC CÔNG NGHỆ ĐỀ TÀI


NGHIÊN CỨU, XÂY DỰNG HỆ THỐNG GỢI Ý QUẢNG CÁO
TRONG CÁC DỊCH VỤ CHIA SẺ HÌNH ẢNH TRỰC TUYẾN
Mã số KC.01.TN10/11-15



Cơ quan chủ trì đề tài:
Chủ nhiệm đề tài:
Công ty CP DV CNTT Naiscorp
KS. Nguyễn Khánh Toàn





9809







BỘ KHOA HỌC VÀ CÔNG NGHỆ


CHƯƠNG TRÌNH KH&CN TRỌNG ĐIỂM CẤP NHÀ NƯỚC KC.01/11-15



BÁO CÁO TỔNG HỢP
KẾT QUẢ KHOA HỌC CÔNG NGHỆ ĐỀ TÀI

NGHIÊN CỨU, XÂY DỰNG HẸ THỐNG GỢI Ý QUẢNG CÁO
TRONG CÁC DỊCH VỤ CHIA SẺ HÌNH ẢNH TRỰC TUYẾN

Mã số KC.01.TN10/11-15



Chủ nhiệm đề tài/dự án:





Nguyễn Khánh Toàn


Cơ quan chủ trì đề tài/dự án:





Nguyễn Xuân Tài
Ban chủ nhiệm chương trình Bộ Khoa học và Công nghệ










CÔNG TY CP DV CNTT
NAISCORP
__________________
CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc

Hà nội, ngày tháng 12năm 2012


BÁO CÁO THỐNG KÊ
KẾT QUẢ THỰC HIỆN ĐỀ TÀI


I. THÔNG TIN CHUNG
1. Tên đề tài/dự án:Nghiên cứu, xây dựng hệ thống gợi ý quảng cáo trong các dịch
vụ chia sẻ hình ảnh trực tuyến
Mã số đề tài, dự án: KC.01.TN10/11-15
Thuộc: Chương trình KH&CN trọng điể
m cấp nhà nước KC.01/11-15
2. Chủ nhiệm đề tài/dự án:
Họ và tên: NGUYỄN KHÁNH TOÀN
Ngày, tháng, năm sinh: 01/09/1984. Nam/ Nữ: Nam
Học hàm, học vị: Kỹ sư
Điện thoại: Tổ chức: 04.3767.8458. Nhà riêng:
Mobile: 0983.190.084Fax: . 04.3767.8024. E-mail:
Tên tổ chức đang công tác: Công ty cổ phần dịch vụ Công nghệ thông tin Naiscorp
Địa chỉ tổ chức: 101 Tòa nhà B1, đường Nguyễn Khánh Toàn, Cầu Giấy, Hà Nội
Địa chỉ nhà riêng: Số 15 ngõ 396, đường Trương Định, Hoàng Mai, Hà Nội
3. Tổ chứ
c chủ trì đề tài/dự án:
Tên tổ chức chủ trì đề tài: Công ty cổ phần Dịch vụ Công nghệ thông tin Naiscorp
Điện thoại: 04.3767.8458. Fax: 04.3767.8024
E-mail:
. Website: www.naiscorp.com
Địa chỉ: 101 Tòa nhà B1, đường Nguyễn Khánh Toàn, Cầu Giấy, Hà Nội
Họ và tên người đứng đầu tổ chức: Nguyễn Xuân Tài
Số tài khoản: 3711.9057491
Ngân hàng: Kho bạc Nhà nước quận Cầu Giấy – Hà Nội
Tên cơ quan chủ quản đề tài: Công ty cổ phần Dịch vụ Công nghệ thông tin
Naiscorp

II. TÌNH HÌNH THỰC HIỆN
1. Thời gian thực hiện đề tài/dự án:

- Theo Hợp đồng đã ký kết:từ 10 tháng 1 năm 2012 đến 10 tháng 1 nă
m 2013
- Thực tế thực hiện:từ 10 tháng 1 năm 2012 đến 10 tháng 1 năm 2013
- Được gia hạn (nếu có):
- Lần 1 từ tháng…. năm…. đến tháng…. năm….
2. Kinh phí và sử dụng kinh phí:
a) Tổng số kinh phí thực hiện:950 tr.đ, trong đó:
+ Kính phí hỗ trợ từ SNKH: 950 tr.đ.
+ Kinh phí từ các nguồn khác:0 tr.đ.
+ Tỷ lệ và kinh phí thu hồi đối với dự án (nếu có): 0

b) Tình hình cấp và sử dụng kinh phí từ nguồn SNKH:
Theo kế hoạch Th
ực tế đạt được
Số
TT
Thời gian
(Tháng, năm)
Kinh phí
(Tr.đ)
Thời gian
(Tháng, năm)
Kinh phí
(Tr.đ)
Ghi chú
(Số đề nghị
quyết toán)
1
03/2012 285 03/2012 285
2

05/2012 380 05/2012 380
3
09/2012 285 09/2012 285

c) Kết quả sử dụng kinh phí theo các khoản chi:
Đơn vị tính: Triệu đồng
Theo kế hoạch Thực tế đạt được
Số
TT
Nội dung
các khoản chi
Tổng SNKH Nguồn
khác
Tổng SNKH Nguồn
khác
1 Trả công lao động
(khoa học, phổ
thông)
740 740 740

740

2 Nguyên, vật liệu,
năng lượng
0 0 0 0
3 Thiết bị, máy móc 120 120 108 108
4 Xây dựng, sửa chữa
nhỏ
0 0 0 0
5 Chi khác 90 90 90 90

Tổng cộng: 950 950 938 938
- Lý do thay đổi (nếu có):Do đề tài chậm trong việc tổ chức đấu thầu hạng
mục thuê chỗ server nên tiền chi cho khoản mục này giảm xuống. Thời gian thuê
chỗ theo thuyết minh là 10 tháng *12 triệu = 120 triệu. Thực tế thực hiện là 9 tháng
* 12 triệu =108 triệu.
3. Các văn bản hành chínhtrong quá trình thực hiện đề tài/dự án:
(Liệt kê các quyết định, văn bản của cơ quan quản lý từ công đoạn xác định
nhiệm vụ, xét chọn, phê duyệt kinh phí, hợp đồng, điều chỉnh (thời gian, nội dung,
kinh phí thực hiện nếu có); văn bản của tổ chức chủ trì đề tài, dự án (đơn, kiến
nghị điều chỉnh nếu có)

TSTT
Số, thời gian ban
hành văn bản
Tên văn b
ản
Ghi
chú
1 15/12/2011 Quyết định số 3853/QĐ-BKHCN ngày
15/12/2011 của Bộ trưởng Bộ Khoa học và
Công nghệ về việc phê duyệt kinh phí, tổ
chức và cá nhân chủ trì các nhiệm vụ khoa
học và công nghệ bắt đầu thựchiện trong kế
hoạch 2011 của Chương trình: “Nghiên cứu
ứng dụng và phát triển công nghệ Thông tin
và Truyền thông”, mã số KC.01/11-15

2 10/01/2012 Hợp đồng Nghiên cứu khoa học và phát
triển công nghệ số 19/2011/HĐ-ĐTTN-
KC.01/11-15 và Thuyết minh đề tài

“Nghiên cứu, xây dựng hệ thống gợi ý
quảng cáo trong các dịch vụ chia sẻ hình
ảnh trực tuyến”, mã số KC.01.TN10/11-15

3 10/01/2012 Bản quy chế chi tiêu kinh phí của đề tài
“Nghiên cứu, triển khai hệ thống chia sẻ
hình ảnh cho cộng đồng”, mã số
KC.01.TN10/11-15


4. Tổ chức phối hợp thực hiện đề tài, dự án:
Số
TT
Tên tổ chức
đăng ký theo
Thuyết minh
Tên tổ chức đã
tham gia thực
hiện
Nội dung
tham gia chủ
yếu
Sản phẩm
chủ yếu đạt
được
Ghi chú*
1 Trung tâm
nghiên cứu
quốc tế MICA


Trung tâm
nghiên cứu quốc
tế MICA

Nghiên cứu
công nghệ
nhận dạng
ảnh
Module
nhận dạng
ảnh

- Lý do thay đổi (nếu có):

5. Cá nhân tham gia thực hiện đề tài, dự án:
(Người tham gia thực hiện đề tài thuộc tổ chức chủ trì và cơ quan phối hợp,
không quá 10 người kể cả chủ nhiệm)
Số Tên cá nhân Tên cá nhân Nội dung tham Sản phẩm chủ yếu Ghi
TT đăng ký theo
Thuyết minh
đã tham gia
thực hiện
gia chính đạt được chú
*
1 Nguyễn Khánh
Toàn
Nguyễn Khánh
Toàn
Chủ nhiệm đề tài
Nghiên cứu

thuật toán nhận
dạng đối tượng
trong ảnh
Website thử
nghiệm hệ thống
gợi ý quảng cáo

2 Nghiêm Tiến
Viễn

Nghiêm Tiến
Viễn

Xây dựng hệ
thống gợi ý trên
ảnh và gắn
Watermark vào
ảnh
Module gợi ý
quảng cáo trong
dịch vụ chia sẻ
hình ảnh trực
tuyến Upanh

3 Nguyễn Đức
Chính
Nguyễn Đức
Chính
Xây dựng hệ
thống gợi ý trên

ảnh và gắn
Watermark vào
ảnh
Module gợi ý
quảng cáo trong
dịch vụ chia sẻ
hình ảnh trực
tuyến Upanh

4 Lê Thị Lan Lê Thị Lan Trích chọn thông
tin cho bài toán
nhận dạng đối
tượng
Chương trình
phần mềm nhận
dạng đối tượng/
khung cảnh trong
ảnh

5 Trần Thị Thanh
Hải
Trần Thị
Thanh Hải
Phương pháp
học cho bài toán
nhận dạng đối
tượng
Chương trình
phần mềm nhận
dạng đối tượng/

khung cảnh trong
ảnh

6 Đồng Văn Thái Đồng Văn
Thái
Xây dựng mô
đun nhận dạng
đối tượng trong
ảnh
Chương trình
phần mềm nhận
dạng đối tượng/
khung cảnh trong
ảnh

7 Phạm Ngọc Hải Phạm Ngọc
Hải
Xây dựng mô
đun nhận dạng
đối tượng trong
ảnh
Chương trình
phần mềm nhận
dạng đối tượng/
khung cảnh trong
ảnh

8 Lê Văn Hùng Lê Văn Hùng Kiểm tra, thử
nghiệm hệ thống
Website thử

nghiệm hệ thống

gợi ý quảng cáo,
module gợi ý
quảng cáo trong
dịch vụ chia sẻ
hình ảnh trực
tuyến Upanh
9 Nguyễn Văn
Trường
Nguyễn Văn
Trường
Thiết lập hệ
thống kho lưu
trữ
Website thử
nghiệm hệ thống
gợi ý quảng cáo

10 Phạm Quốc
Hiệp
ThS. Trần Thị
Hoàn
Tích hợp vào hệ
thống
Website thử
nghiệm hệ thống
gợi ý quảng cáo

- Lý do thay đổi ( nếu có): Vì lý do cá nhân, KS. Phạm Quốc Hiệp xin rút

khỏi đề tài. Đề tài đã mời Ths. Trần Thị Hoàn tham gia để hoàn thiện đề tài đúng
tiến độ.

6. Tình hình hợp tác quốc tế:
Số
TT
Theo kế hoạch
(Nội dung, thời gian, kinh
phí, địa điểm, tên tổ chức
hợp tác, số đoàn, số lượng
người tham gia )
Thực tế đạt được
(Nội dung, thời gian, kinh
phí, địa điểm, tên tổ chức hợp
tác, số đoàn, số lượng người
tham gia )
Ghi
chú*
1 Không Không
- Lý do thay đổi (nếu có):
7. Tình hình tổ chức hội thảo, hội nghị:
Số
TT
Theo kế hoạch
(Nội dung, thời gian, kinh
phí, địa điểm )
Thực tế đạt được
(Nội dung, thời gian,
kinh phí, địa điểm )
Ghi chú*

1 01 Hội nghị khoa học ở
Naiscorp năm 2012,
Hội thảo: “Quảng cáo trên
hình ảnh và xử lý các đối
tượng trong ảnh” ngày
18/12/2012 tại Trung tâm
nghiên cứu quốc tế MICA
Thực hiện
theo kế hoạch
2 01 Hội nghị khoa học ở MICA
năm 2012
Hội thảo: “Các công nghệ
được sử dụng để xây
dựng hệ thống quảng cáo
trên hình ảnh” ngày
24/12/2012 tại Công ty cổ
phần dịch vụ Công nghệ
Thực hiện
theo kế hoạch
thông tin Naiscorp.
- Lý do thay đổi (nếu có): Không


III. SẢN PHẨM KH&CN CỦA ĐỀ TÀI, DỰ ÁN
1. Sản phẩm KH&CN đã tạo ra:
a) Sản phẩm Dạng II:
Yêu cầu khoa họccần đạt
Ghi
chú
Số

TT
Tên sản phẩm
Theo kế hoạch Thực tế đạt được

-Hiển thị thông tin về 10 lớp đối tượng -Hiển thị thông tin về 10 lớp đối tượng
-Hiện thị thông tin về 05 khung hình (trong
trường hợp không có đối tượng trong lớp quan
tâm)
-Hiện thị thông tin về 05 khung hình (trong
trường hợp không có đối tượng trong lớp quan
tâm)
-Cho phép người dùng upload ảnh lên -Cho phép người dùng upload ảnh lên
-Nhận dạng đối tượng trong ảnh/khung cảnh
của ảnh người dùng upload lên với 10 lớp đối
tượng hoặc 05 khung hình (trong trường hợp
không có đối tượng trong lớp quan tâm) với độ
chính xác 80%
-Nhận dạng đối tượng trong ảnh/khung cảnh
của ảnh người dùng upload lên với 10 lớp đối
tượng hoặc 05 khung hình (trong trường hợp
không có đối tượng trong lớp quan tâm) với độ
chính xác 80%
-Đưa ra các gợi ý quảng cáo dựa vào các nhãn
được gán, sinh các quảng cáo dưới dạng
watermark gán vào ảnh dưới dạng text hoặc
banner lên ảnh người dùng upload
-Đưa ra các gợi ý quảng cáo dựa vào các nhãn
được gán, sinh các quảng cáo dưới dạng
watermark gán vào ảnh dưới dạng text hoặc
banner lên ảnh người dùng upload

-Hiện thị ảnh và phần quảng cáo -Hiện thị ảnh và phần quảng cáo
1
Website thử
nghiệm hệ thống
gợi ý quảng cáo
-Thời gian thực hiện gần với thời gian thực
(khoảng 1 giây)
-Thời gian thực hiện gần với thời gian thực
(khoảng 1 giây)

Nhận dạng đối tượng trong ảnh/khung cảnh
của ảnh với 10 lớp đối tượng hoặc 05 khung
hình (trong trường hợp không có đối tượng
trong lớp quan tâm) với độ chính xác 80%
Nhận dạng đối tượng trong ảnh/khung cảnh
của ảnh với 10 lớp đối tượng hoặc 05 khung
hình (trong trường hợp không có đối tượng
trong lớp quan tâm) với độ chính xác 80%
Đưa ra các gợi ý quảng cáo dựa vào các nhãn
được gán, sinh các quảng cáo dưới dạng
watermark gán vào ảnh dưới dạng text hoặc
banner cho các trang Web chia sẻ hình ảnh thế
hệ mới.
Đưa ra các gợi ý quảng cáo dựa vào các nhãn
được gán, sinh các quảng cáo dưới dạng
watermark gán vào ảnh dưới dạng text hoặc
banner cho các trang Web chia sẻ hình ảnh thế
hệ mới.
Đáp ứng được 100.000 lượt người dùng đồng
thời, 100.000.000 lượt truy xuất ảnh có quảng

cáo mỗi ngày.
Đáp ứng được 1.000 lượt người dùng đồng
thời, 10.000 lượt truy xuất ảnh có quảng cáo
mỗi ngày.
Kết nối cơ sở dữ liệu ảnh,cơ sơ ̉dữ liệu xâu text
quảng cáo, xuất ra hệ thống web portal để tạo
thành một sản phẩm tương đối hoàn thiện. Cơ
sở dữ liệu ảnh được thiết kế phân tán, đáp ứng
khả năng lưu trữ ảnh số lượng lớn.
Kết nối cơ sở dữ liệu
ảnh,cơ sơ ̉dữ liệu xâu text
quảng cáo, xuất ra hệ thống web portal để tạo
thành một sản phẩm tương đối hoàn thiện. Cơ
sở dữ liệu ảnh được thiết kế phân tán, đáp ứng
khả năng lưu trữ ảnh số lượng lớn.
2
Module gợi ý
quảng cáo trong
dịch vụ chia sẻ
hình ảnh trực
tuyến Upanh
Hệ thống được áp dụng cho cộng đồng 100.000
người dùng trên Web và 100.000 người dùng
trên mobile.
Đáp ứng được 1.000 lượt người dùng đồng
thời, 10.000 lượt truy xuất ảnh có quảng cáo
mỗi ngày.

3 01 Chương trình Đầu vào là một ảnh Đầu vào là một ảnh
-Đầu ra là các đối tượng tồn tại ở trong ảnh và

các thông tin về đối tượng như vị trí, kích
thước, sự quan trọng của đối tượng
-Đầu ra là các đối tượng tồn tại ở trong ảnh và
các thông tin về đối tượng như vị trí, kích
thước, sự quan trọng của đối tượng
-Có khả năng hoạt động trong trường hợp trong
cùng một ảnh có nhiều đối tượng quan tâm
-Có khả năng hoạt động trong trường hợp trong
cùng một ảnh có nhiều đối tượng quan tâm
-Cho phép nhận dạng 05 khung cảnh đối với
ảnh không có đối tượng quan tâm.
-Cho phép nhận dạng 05 khung cảnh đối với
ảnh không có đối tượng quan tâm.
phần mềm nhận
dạng
đốitượng/khung
cảnh trong ảnh
Hệ thống nhận dạng đối tượng/khung cảnh
được đánh giá dựa trên độ chính xác nhận dạng
và thời gian tính toán. Hệ thống được xây dựng
cần:
- Cho phép phát hiện 10 lớp đối tượng cơ bản
(người, nhà, xe cộ, ) với độ chính xác
(precision) 70% trên cơ sở dữ liệu xây dựng
để thử nghiệm.
- Cho phép nhận dạng 05 khung cảnh đối với
ảnh không có đối tượng quan tâm.
- Thời gian tính toán gần với thời gian thực
(10 ảnh/s).
Hệ thống nhận dạng đối tượng/khung cảnh

được đánh giá dựa trên độ chính xác nhận dạng
và thời gian tính toán. Hệ thống được xây dựng
cần:
- Cho phép phát hiện 10 lớp đối tượng cơ bản
(người, nhà, xe cộ, ) với độ chính xác
(precision) 70% trên c
ơ sở dữ liệu xây dựng
để thử nghiệm.
- Cho phép nhận dạng 05 khung cảnh đối với
ảnh không có đối tượng quan tâm.
- Thời gian tính toán gần với thời gian thực
(10 ảnh/s).

- Lý do thay đổi (nếu có):
Đề tài đặt ra kế hoạch là: “Đáp ứng được 100.000 lượt người dùng đồng thời, 100.000.000 lượt truy xuất ảnh có quảng
cáo mỗi ngày” nhưng thực tế không thực hiện được vì hệ thống QUANGCAOANH.COM đang trong quá trình xây dựng và
thử nghiệm. Đề tài mới chỉ thử nghiệm ở mức “Đáp ứng được 1.000 lượt người dùng đồng thời, 10.000 lượt truy xuất ảnh có
quảng cáo mỗi ngày.”
Thời gian thực hiện đề tài là quá ngắn nên không đủ để đưa sản phẩm vào kinh doanh.
Yêu cầu khoa học
cần đạt
Số
TT
Tên sản phẩm
Theo kế hoạch Thực tế đạt được
Số lượng, nơi công bố (Tạp chí,
nhà xuất bản)
1 Howcan human
communicate with
robot by handgesture ?


Được chấp nhận trình bày và
đăng tải trên kỷ yếu của hội
nghị, hội thảo

Được chấp nhận trình
bày và đăng tải trên kỷ
yếu của hội nghị, hội
thảo

Computing, Management &
Telecommunications Conference
(ComManTel 2013)
2 Nhận dạng ảnh đồi trụy
trong hệ thống chia sẻ
ảnh quy mô lớn

Được chấp nhận trình bày và
đăng tải trên kỷ yếu của hội
nghị, hội thảo
Được chấp nhận đăng tải
trên tạp chí
Tạp chí Khoa học và Công nghệ,
trường CĐ kĩ thuật Công nghệ
Thủ Đức, tp HCM, số quý 1/2013
3 Object detection and
classification for
advertising service
based on image content
Được chấp nhận trình bày và

đăng tải trên kỷ yếu của hội
nghị, hội thảo

Được chấp nhận trình
bày và đăng tải trên kỷ
yếu của hội nghị, hội
thảo

HUST - CNRS/UMI 2954 -
Grenoble INP Hanoi University of
Science and Technology



b) Thống kê danh mục sản phẩm KHCN đã được ứng dụng vào thực tế
Số
T
T
Tên kết quả
đã được ứng dụng
Thời gian
Địa điểm
(Ghi rõ tên, địa chỉ nơi
ứng dụng)
Kết quả
sơ bộ
1 Website thử nghiệm hệ
thống gợi ý quảng cáo
9/2012 Website:
www.Quangcaoanh.com

Tốt
2 Module gợi ý quảng
cáo trong dịch vụ chia
sẻ hình ảnh trực tuyến
Upanh
9/2012 Website:
www.Quangcaoanh.com
Tốt
3 01 Chương trình phần
mềm nhận dạng
đốitượng/khung cảnh
trong ảnh
9/2012 Website:
www.Quangcaoanh.com
Tốt

2. Đánh giá về hiệu quả do đề tài, dự án mang lại:
a) Hiệu quả về khoa học và công nghệ:
(Nêu rõ danh mục công nghệ và mức độ nắm vững, làm chủ, so sánh với
trình độ công nghệ so với khu vực và thế giới…)
Tổng quan về cách nội dung nghiên cứu trong đề tài là:
Thiết lập nền tảng phục vụ cho hệ thống quảng cáo trên ảnh
Các vấn đề công nghệ phục vụ cho mụ
c tiêu là:
Vấn đề nghiên cứu 1: Công nghệ Webserver Portal phục vụ cho chia sẻ ảnh - cho
phép cân bằng tải, phục vụ cho hàng trăm triệu request về ảnh mỗi ngày.
Tình hình nghiên cứu thế giới:

- Áp dụng các công nghệ phân tán, công nghệ tính toán đám mây để tăng hiệu
năng của hệ thống, đáp ứng cho nhiều người sử dụng là những điều không mới.

Tất cả các công ty, tổ chức lớn đều đi theo hướng này. Tuy nhiên, đặt trong bài
toán chia sẻ ảnh với mục tiêu phục vụ cho 100.000 người sử dụng đồng thời, lưu
trữ 50 triệu ảnh, chúng tôi chọn mô hình phân tán để x
ử lý vì nó phù hợp nhất về
giá cả, độ khó của công nghệ, số lượng người phục vụ…
- Nói chung, các website chia sẻ ảnh lớn trên thế giới không công bố công nghệ
của họ. Tuy nhiên, qua quá trình tìm hiểu, thử nghiệm, chúng tôi cho rằng họ
cũng thiết kế theo hướng có thể hoạt động theo cụm cluster server, tối ưu và sử
dụng nhiều mô hình để quản lý các cụm máy chủ này.
- Vấn đề xây dựng hệ thống theo hướng phân tán đã được nhiều tổ chức, công ty,
nhiều nhóm nghiên cứu và công bố kết quả dưới dạng tài liệu và mã nguồn mở.
Chúng tôi sử dụng các thành quả nghiên cứu này bằng cách nghiên cứu, tìm hiểu
nhiều kết quả và lựa chọn cho mình công nghệ phù hợp nhất.

Tình hình nghiên cứu Việt nam:

Các công ty ở Việt Nam cũng áp dụng các công nghệ phân tán theo trào lưu
nghiên cứu chung của thế giới. Tuy nhiên cũng có những sự khác biệt:
• Phần lớn các website ở Việt nam có quy mô vừa và nhỏ nên họ không cần phải
tập trung nghiên cứu về công nghệ mà chỉ cần tăng số lượng server là đủ.
• Với các công ty lớn, chắc chắn họ cũng đầu tư, nghiên cứu các công nghệ phân
tải, phân tán; nhưng trong l
ĩnh vực hẹp là công nghệ phân tải phục vụ cho chia
sẻ ảnh, cũng chỉ có 1 vài công ty như Zing Photo, AnhSo.net nghiên cứu, ứng
dụng. Theo đánh giá của chúng tôi, công nghệ của các công ty này vẫn đang
trong quá trình hoàn thiện.

Kết quả nghiên cứu của đề tài:

Đề tài nghiên cứu thành công công nghệ này.Trình độ nghiên cứu tương

đương với các kết quả nghiên cứu trên thế giới.

Vấn đề nghiên cứu 2: Công nghệ lưu trữ phân tán các file ảnh - cho phép phục
vụ hàng trăm triệu lượt download mỗi ngày.
Tình hình nghiên cứu thế giới và Việt Nam:

Cũng như vấn đề công nghệ Webserver Portal, vấn đề này được nghiên cứu
nhiều ở thế giới; tuy nhiên ở Việt Nam, trong lĩnh vực hẹp là xây dựng hệ thống
chia sẻ ảnh, công nghệ của các công ty xử lý ảnh vẫn còn đang hạn chế.
Kết quả nghiên cứu của đề tài:

Đề tài nghiên cứu thành công công nghệ này.Trình độ nghiên cứu tương
đương với các kết quả nghiên cứu trên thế giới.

Vấn đề nghiên cứu 3 : Phát hiện và nhận dạng các đối tượng trong ảnh
Phát hiện và nhận dạng đối tượng trên ảnh là xác định có hay không đối
tượng trong ảnh và xác định xem nó thuộc lớp đối tượng nào. Đây là bài toán hấp
dẫn thu hút sự quan tâm của nhiều nhà nghiên cứu trong và ngoài nước. Kết quả củ
a
bài toán này có thể áp dụng trong các hệ thống giám sát từ xa, hệ thống điều khiển,
trợ giúp, v.v.
Bài toán phát hiện và nhận dạng đối tượng thường được chia thành ba bài
toán con:
• Biểu diễn đối tượng: liên quan đến việc trích chọn các đặc trưng sẽ được sử
dụng và xác định mô hình biểu diễn đối tượng từ các đặc trưng này.
• Học cách phân lớp đối tượng: thông qua mô hình biểu diễn đối tượng, các bộ
phân lớp đối tượng sẽ được học từ các dữ liệ
u huấn luyện.
• Nhận dạng: cho phép nhận dạng dữ liệu mới từ các bộ phân lớp đã được học
từ trước.


Tại Việt Nam, trong một vài năm gần đây, một số nghiên cứu trong lĩnh vực
này đã được thực hiện. Các giảng viên Khoa điện – Điện tử – Trường Đại học
GTVT đã có đề tài nghiên cứu: Hệ thống thu thậ
p dữ liệu giao thông ứng dụng công
nghệ xử lý ảnh cho phép đếm số lượng xe ở trên đường. Học viện kỹ thuật quân sự
đã nghiên cứu và triển khai thành công hệ thống ghi vé ô tô, xe máy tự động. Hệ
thống gồm máy tính, camera, máy in. Khi xe đi qua trạm ghi vé, camera sẽ chụp
ảnh xe và biển số xe. Ảnh này được đưa vào xử lý và nhận dạng biển số. Kết quả
của việc nhận dạng tự
động biển số cho phép quản lý xe cộ và in vé tự động một
cách dễ dàng và nhanh chóng, tiết kiệm được chi phí cho người ghi phát vé, đảm
bảo lưu thông luồng nhanh. Ngoài ra hệ thống còn cho phép thống kê phân tích và
tìm kiếm dữ liệu xe gửi nên đảm bảo mức độ an ninh an toàn cao. Trạm ghi phát vé
tự động là một hệ thống nhỏ, có thể áp dụng trong các bãi đỗ xe. Các giải pháp về
xử lý ảnh được thiết kế trong những điề
u kiện tương đối lý tưởng: tốc độ xe nhỏ,
ánh sáng không đổi, không gian thu nhận ảnh tương đối hẹp. Vì thế việc nhận dạng
xe và biển số thực hiện dễ dàng. Khi áp dụng các hệ thống nhận dạng trong môi
trường không ràng buộc về điều kiện chiếu sáng, góc thu nhận ảnh, chuyển động
của đối tượng, việc nhận dạng đối tượng vẫn đang còn là m
ột là thách thức lớn đối
với các nhà nghiên cứu về xử lý ảnh và thị giác máy tính.

Trong khuôn khổ của đề tài độc lập cấp nhà nước mã số 42/2009G/HĐ-
ĐTĐL "Nghiên cứu, thiết kế, tích hợp robot thông minh có khả năng ứng dụng
trong khai thác các thông tin đa phương tiện" do Trung tâm MICA chủ trì thực hiện,
nhóm xử lý ảnh của trung tâm tham gia thực hiện các mô đun nhận dạng cử chỉ tay
và nhận dạng cảm xúc c
ủa người thông qua gương mặt trong ứng dụng tương tác

người máy. Các giải thuật phát hiện tự động lớp đối tượng như bàn tay, gương mặt
trong ảnh/video trong thời gian thực đã cho những kết quả rất hứa hẹn. Những
nghiên cứu này có thể mở rộng để áp dụng vào việc phát hiện nhận dạng các loại
đối tượng khác như người, đồ vật trong phòng.

Nhận xét chung:
Mặc dù đã có rất nhiều kết quả nghiên cứu về phát hiện và nhận dạng đối
tượng và hiểu ảnh trên thế giới cũng như ở Việt Nam. Đây vẫn còn là một thách
thức trong lĩnh vực xử lý ảnh và thị giác máy vì mỗi lớp đối tượng có những tính
chất và thể hiện khác nhau. Ngoài ra các đối tượng trong cùng một lớp cũng rất đa
dạng vì th
ế một hệ thống nhận dạng không có tính khái quát sẽ khó hoạt động hiệu
quả. Một hệ thống phát hiện và nhận dạng tự động đối tượng ảnh hoạt động hiệu
quả là một hệ thống phải đáp ứng cả 2 yêu cầu: (1) cho độ chính xác cao với thời
gian chấp nhận được và (2) có khả năng hoạt động được trong môi trường thực với
sự
thay đổi của các yếu tố như độ sáng, phông nền, góc nhìn, thang đo v.v.

Vấn đề nghiên cứu 4:Tìm kiếm text quảng cáo phù hợp với nội dung của ảnh
Sau khi đã nhận dạng đối tượng và hiểu ảnh ở một mức chấp nhận được, bài
toán đặt ra ở đây là sử dụng thông tin về các đối tượng này để tìm ra xâu quảng cáo
phù hợp. Với mỗi yêu cầu quảng cáo của khách hàng, chúng tôi yêu c
ầu họ phải xác
định ra một số đối tượng, đặc trưng, thể loại mà họ muốn quảng cáo
Vấn đề cần nghiên cứu ở đây không chỉ là việc tìm kiếm xâu quảng cáo phù
hợp mà là việc thống kê các sự kiện quảng cáo.Bài toán tìm kiếm text quảng cáo đã
được chúng tôi giải quyết trong quy mô phòng thí nghiệm. Một hệ thống quảng cáo
trong thực tế sẽ phải nhận hàng nghìn các request về tìm text quảng cáo phù h
ợp,
đồng thời phải thống kê, tính toán chi phí online và chúng tôi chưa có điều kiện để

thực hiện.
Tình hình nghiên cứu thế giới:

Trình độ nghiên cứu cỉa về các vấn đề tính toán song song, thống kê số
lượng lớn của thế giới là rất tốt.Các hệ thống quảng cáo của các công ty lớn như
Google, Microsoft, Amazone đã hoàn thiện với quy mô toàn cầu.
Tình hình ở Việt nam:

Các công ty Việt nam thường chọn mô hình quảng cáo theo thời gian: Ngày,
tháng để dễ dàng cho việc triển khai chứ không chọn đến mức Click, View.
Thống kê đến mức Click, View đòi hỏi phải đầu tư nghiên cứu rất nhiều về hệ
thống tính toán, xác thực
Kết quả nghiên cứu của đề tài:

Đề tài nghiên cứu thành công công nghệ ở quy mô phòng thí nghiệm.Các kết
quả này so với các hệ thống lớn trên thế giới thì vẫn còn khá khiêm tốn.

b) Hiệu quả về kinh tế xã hội:
(Nêu rõ hiệu quả làm lợi tính bằng tiền dự kiến do đề tài, dự án tạo ra so với
các sản phẩm cùng loại trên thị trường…)
b1. Mô hình kinh doanh của hệ thống QUANGCAOANH



Hình 12: Mô phỏng quá trình sử dụng dịch vụ quảng cáo theo ảnh

Chú thích:
- Có nhiều công ty cần quảng cáo (10.000 công ty), các công ty này gửi link và
xâu text cần quảng cáo đến công ty Quảng cáo
- Công ty quảng cáo xây dựng cơ sở dữ liệu text cần quảng cáo

- Trên các website, forum có ảnh, bao gồm ảnh có hoặc không có chứa text.
Các website này gửi ảnh/link chứa ảnh thô đến công ty quảng cáo
- Công ty quảng cáo trả về Ảnh + text quảng cáo phù hợp.
- Các website, forum hiển thị ảnh + text quảng cáo trên website của mình
- Người dùng xem ảnh, click vào link quảng cáo (do các công ty cần quảng cáo
cung cấp)
b2. Quá trình thanh toán (Hình 13)



Hình 13: Minh họa quá trình thanh toán
Chú thích:
1. 10.000 công ty cần quảng cáo trả tiền cho công ty quảng cáo
2. Công ty quảng cáo chia sẻ doanh thu cho các website, forum

b3. Danh mục sản phẩm hàng hóa hình thành từ kết quả KH&CN

Sản phẩm hàng hóa chính của đề tài chính là dịch vụ tìm xâu quảng cáo
phù hợp với ảnh. Chúng tôi tạo ra các gói sản phẩm khác nhau để tạo thành các
sản phẩm khác nhau

T
T
Tên hàng
hóa
Tiêu chuẩn sản phẩm Đối tượng
khách
hàng
Ghi chú
1 View1 Cho phép View tối đa 1.000 lần

xâu quảng cáo trên các website
khác nhau

Các doanh
nghiệp
nhỏ
2 View2 Cho phép View tối đa 5.000 lần
xâu quảng cáo trên các website
khác nhau
Các doanh
nghiệp
vừa
3 View3 Cho phép View tối đa 10.000 lần
xâu quảng cáo trên các website
khác nhau.
Các
doanh
nghiệp lớn
Dịch vụ này
không giới hạn
về thời gian;
cho đến khi
người dùng
xem đủ số xâu
quảng cáo.
4 Click1 Cho phép Click tối đa 1.000 lần
xâu quảng cáo trên các website
khác nhau
Thời hạn gói cước tối đa 1 tháng.
Các doanh

nghiệp
nhỏ
Gói cước giới
hạn về thời
gian vì có thể
xâu quảng cáo
5 Click2 Cho phép Click tối đa 5.000 lần
xâu quảng cáo trên các website
khác nhau
Thời hạn gói cước tối đa 1 tháng.
Các doanh
nghiệp
vừa
6 Click3 Cho phép Click tối đa 10.000 lần
xâu quảng cáo trên các website
khác nhau.
Thời hạn gói cước tối đa 1 tháng.
Các
doanh
nghiệp lớn
không hấp dẫn,
người dùng
xem ảnh
nhưng không
click vào link
7 ClickView
1
Cho phép View tối đa 1.000 lần
xâu quảng cáo trên các website
khác nhau.

Cho phép Click tối đa 500 lần
Các doanh
nghiệp
nhỏ
8 ClickView
2
Cho phép View tối đa 5.000 lần
xâu quảng cáo trên các website
khác nhau
Cho phép Click tối đa 2.000 lần
Các doanh
nghiệp
vừa
9 ClickView
3
Cho phép View tối đa 10.000 lần
xâu quảng cáo trên các website
khác nhau.
Cho phép Click tối đa 5.000 lần
Các
doanh
nghiệp lớn
Gói cước sẽ
kết thúc tùy
theo điều kiện
click hay view
đến trước
Trong quá trình sử dụng dịch vụ, các công ty cần quảng cáo có thể xem,
thống kê, kiểm soát và biết số lần view, click với từng xâu quảng cáo của mình.
b4. Thị trường của sản phẩm


Sản phẩm hướng đến một thị trường rất rộng lớn là các công ty có nhu cầu
quảng cáo. Tùy theo quy mô, nhu cầu quảng cáo… mà các công ty có thể lựa
chọn cho mình những gói cước phù hợp.
b5. Thiết bị trong dây chuyền công nghệ, nguyên vật liệu đảm bảo cho sản xuất :

Thiết bị chủ yếu trong dây chuyền công nghệ là các cụm server được đặt phân
tán trên các ISP khác nhau của Việt nam. Các cụm server sẽ được lập trình để có thể
liên lạc, kết nối và trao đổi dữ liệu với nhau, đảm bảo khả năng tính toán phân tán,
sử dụng lợi thế đường truyền nội mạng ISP để cung cấp dữ liệu nhanh nhất đến
người sử dụng.
Đầu vào cho sản xuấ
t là các thuật toán nhận dạng ảnh, server và đường
truyền.Cả 3 yếu tố trên đều cần phải được quan tâm, đầu tư đúng mức.Chúng tôi sẽ
đầu tư hệ thống server có cấu hình đủ mạnh để có thể xử lý được nhiều ảnh, đặt
server ở nhiều ISP khác nhau để tăng băng thông đường truyền. Các công việc sẽ
được xử lý cả online và offline để tăng hiệu năng của h
ệ thống

b6. Kế hoạch sản xuất kinh doanh trong 3-5 năm đầu tiên


I.Nhu cầu thị trường
Số lượng có thể tiêu thụ trong
năm:

T
T
Tên sản
phẩm

Đơn
vị đo
2013 2014 2015
Chú thích
1 2 3 4 5 6 8
1 View1 lượt 10,000 15,000 22,500 Cho phép View tối đa
1.000 lần
2 View2 lượt 5,000 7,500 11,250 Cho phép View tối đa
5.000 lần
3 View3 lượt 2,000 3,000 4,500 Cho phép View tối đa
10.000 lần
4 Click1 lượt 8,000 12,000 18,000 Cho phép Click tối đa
1.000 lần
5 Click2 lượt 4,000 6,000 9,000 Cho phép Click tối đa
5.000 lần
6 Click3 lượt 2,000 3,000 4,500 Cho phép Click tối đa
10.000 lần
7 ClickView1 lượt 12,000 18,000 27,000 Cho phép View tối đa
1.000 lần, Click 500
lần
8 ClickView2 lượt 6,000 9,000 13,500 Cho phép View tối đa
5.000 lần, Click 2.000
lần
9 ClickView3 lượt 4,000 6,000 9,000 Cho phép View tối đa
10.000 lần, Click
5.000 lần
Tổng số 53,000 79,500 119,250

Dựa trên tính toán dựa trên số doanh nghiệp, số người dùng của Việt nam,
chúng tôi ước lượng nhu cầu thị trường sẽ tăng trưởng 50%/ năm.Đến năm 2014,

hệ thống đạt 100% công suất.

b7. Doanh thu dự kiến(khi đạt 100% công suất)

II. Doanh thu dự kiến (lúc đạt 100% công suất)
Số lượng có thể tiêu thụ
trong năm:

Đơn vị tính 1000 đồng
TT
Tên sản
phẩm
Đơn
vị đo
Số
lượng
Đơn
giá Thành tiền Chú thích
1 2 3 4 5 6 8
1 View1 lượt 22,500 42 945,000 Cho phép View tối đa
1.000 lần
2 View2 lượt 11,250 105 1,181,250 Cho phép View tối đa
5.000 lần
3 View3 lượt 4,500 210 945,000 Cho phép View tối đa
10.000 lần
4 Click1 lượt 18,000 42 756,000 Cho phép Click tối đa
1.000 lần
5 Click2 lượt 9,000 105 945,000 Cho phép Click tối đa
5.000 lần
6 Click3 lượt 4,500 210 945,000 Cho phép Click tối đa

10.000 lần
7 ClickView1 lượt 27,000 42 1,134,000 Cho phép View tối đa
1.000 lần, Click 500
lần
8 ClickView2 lượt 13,500 420 5,670,000 Cho phép View tối đa
2.000 lần, Click 2.000
lần
9 ClickView3 lượt 9,000 210 1,890,000 Cho phép View tối đa
10.000 lần, Click 5.000
lần
Tổng tiền 14,411,250
Chia sẻ doanh thu 30% cho các website 4,323,375
Doanh thu còn lại 10,087,875
Doanh thu của dự án dự kiến ổn định vào năm 2015 với số tiền là
10.087.875.000 đồng/năm

b8. Phương án nâng cao năng lực sản xuất kinh doanh

Để nâng cao năng lực sản xuất kinh doanh, chúng tôi sử dụng các cách thức
sau
• Các thuật toán, các nghiên cứu mới của đề tài sẽ được cập nhật thường xuyên
cho các server để nâng cao chất lượng dịch vụ
• Chúng tôi đưa ra các gói cước khác nhau là để có thêm nhiều lựa chọn cho
khách hàng.
• Liên kết với công ty Naiscorp để quảng cáo trên các sản phẩm của Naiscorp
như Socbay iMedia, Socbay News Portal…
• Cho phép sử dụng miễn phí dịch vụ trong thời gian đầu
• Ký kết hợp đồng làm việc với các Website để
hợp tác kinh doanh.
Liên kết, đặt server ở nhiều nhà mạng khác nhau để đảm bảo băng thông

và độ ổn định hệ thống
b9. Các ràng buộc về bản quyền công nghệ

Các kết quả về nhận dạng đối tượng/khung cảnh trong ảnh nghiên cứu và
phát triển trong đề tài thuộc về bản quyền của Trung tâm nghiên cứu quốc tế
MICA, Trường Đại học Bách Khoa Hà Nội. Các kết quả chỉ được sử dụng
trong các sản phẩm đã đăng ký của đề tài phục vụ cho việc đánh giá, nghiệm thu
đề tài. Việc sử dụng kết quả này trong phát triển kinh doanh, xây d
ựng doanh
nghiệp khoa học cần phải được sự chấp nhận của Trung tâm nghiên cứu quốc tế
MICA, Trường Đại học Bách Khoa Hà Nội.

3. Tình hình thực hiện chế độ báo cáo, kiểm tra của đề tài, dự án:
Số
TT
Nội dung
Thời gian
thực hiện
Ghi chú
(Tóm tắt kết quả, kết luận chính,
người chủ trì…)
I Báo cáo định kỳ
Lần 1 01/10/2012
- Về số lượng: Đảm bảo đúng tiến độ
đã ký trong hợp đồng với bộ, một số
chuyên đề đã làm vượt so với thời hạn
ký trong hợp đồng
- Về chất lượng: Đảm bảo các chương
trình, module chạy ổn định, đạt yêu
cầu

II Kiểm tra định kỳ
Lần 1 12/10/2012
- Công việc của đề tài tiến hành nhanh,
không có gặp vấn đề gì bất thường.
- Đã sử dụng kinh phí được cấp một
cách hợp lý.

III
Nghiệm thu cơ sở
29/12/2012


Chủ nhiệm đề tài
(Họ tên, chữ ký)

Thủ trưởng tổ chức chủ trì
(Họ tên, chữ ký và đóng dấu)


MỤC LỤC
Chương1:TÓMTẮTVỀĐỀTÀI 33
1.1. Cácmụctiêucủađềtài 33
1.1.1. Mục tiêu tổngquát 33
1.1.2. Mục tiêu cụthể 33
1.2. Nănglựccánhânchủtrìvàtổchứcchủtrìthựchiện 33
1.2.1. CôngtyNaiscorp 33
1.2.2. TrungtâmMICA 34
1.3. Tính cấp thiết của vấn đề nghiên cứu 35
1.4. Giải
thíchcácthànhphầntronghệthống 36

1.4.1. Khoảnh 36
1.4.2. Khotextquảngcáo 36
1.4.3. Enginenhậndạngảnh 37
1.5. ModuleQuảngcáo 37
Chương2:TỔNGQUANVỀHỆTHỐNGGỢIÝQUẢNGCÁOTRÊNẢNH 40
2.1. Giớithiệuhệthốnggợiýquảngcáotrênảnh 40
2.1.1. Hệthốngquảngcáoonline 40
2.1.2. Hệthốngquảngcáotrênảnh 40
2.2. Cácthànhphầntronghệthống 41
2.2.1. Websitecungcấpdịchvụgợiýquảngcáotrênảnh 41
2.2.2. Modulegợiýquảngcáo 41
2.2.3. Phầnmềmnhậndạngđố
itượng/khungcảnhtrongảnh 42
2.3. Cácvấnđềnghiêncứutronghệthống 42
2.3.1. CôngnghệWebserPortalphụcvụchochiasẻảnh 42
2.3.2. Côngnghệlưutrữphântáncácfileảnh 43
2.3.3. Pháthiệnvànhậndạngcácđốitượngtrongảnh 43
2.3.4. Tìmkiếmtextquảngcáophùhợpvớinộidungcủaảnh 44
2.4. Kếtquảđạtđược 44
Chương3:CÔNGNGHỆWEBSERVERPORTAL 46
3.1. TổngquanvềcôngnghệWebserverPortal 46
3.1.1. Đặcđiểm 46
3.1.2. Tìnhhìnhnghiêncứuthếgiới: 46
3.1.3. TìnhhìnhnghiêncứuViệtnam: 47
3.2.1. GiảithuậtRoundRobinDNS 49
3.2.2. KháiniệmAnycast 50
3.2.3. PhântíchhoạtđộngAnycast 50
3.2.4. ỨngdụngchohệthốngDNS 51
3.3. HệthốngcânbằngtảiLoadBalancer 53

×