Tải bản đầy đủ (.docx) (8 trang)

Mô hình đồ thị hỗ trợ tìm kiếm vị trí địa lý dựa trên cấu trúc balltree Đề cương luận văn thạc sĩ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (598.62 KB, 8 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

TRƯỜNG ĐẠI HỌC CẦN THƠ

Độc lập - Tự do - Hạnh phúc
Cần Thơ, ngày 1 tháng 10 năm 2014

ĐỀ CƯƠNG LUẬN VĂN THẠC SĨ
1. Họ tên học viên: Lương Hoàng Hướng

MSHV: M2513028

2. Cơ sở đào tạo: Khoa Công nghệ thông tin & Truyền thông
3. Chuyên ngành: Hệ thống thông tin – khoá 20
Tên đề tài:
“Mô hình đồ thị hỗ trợ tìm kiếm vị trí địa lý dựa trên cấu trúc balltree”
4. Cơ sở khoa học và cơ sở thực tiễn của đề tài
4.1. Cơ sở thực tiễn
Tìm kiếm vị trí địa lý trên một vùng không gian xác định là bài toán tìm
kiếm dựa trên đồ thị. Tìm kiếm thông tin địa lý dựa trên mô hình đồ thị có nhiều
ứng dụng quan trọng như: định tuyến
đường đi cho dữ liệu, ước lượng dữ liệu
bị mất trong mạng cảm biến không dây,
thu thập thông tin…
Để xây dựng được mô hình đồ thị cho
các vị trí địa lý, trên thực tế đã có nhiều
nghiên cứu liên quan về xây dựng mô
hình đồ thị như: xác định tính liên thông
trong mạng với mô hình đồ thị UDG


[14], RGG [1] [3], bảo mật kênh truyền
với mô hình đồ thị EG [9], định tuyến
đường đi dữ liệu trong mạng với mô hình đồ thị PG [2], đơn giản hóa quá trình
tính toán và nâng cao khả năng chịu lỗi trong mạng với mô hình đồ thị HG [15] …
Tuy nhiên, các mô hình đồ thị đó còn phức tạp và chưa tập trung đưa ra giải pháp
giải quyết vấn đề về tìm kiếm thông tin địa lý một cách hiệu quả và nhanh chóng.
Xuất phát từ vấn đề thực tế, đề tài luận văn đề xuất một hướng tiếp cận mới
trong tìm kiếm thông tin địa lý một cách hiệu quả và nhanh chóng trên cơ sở xây
dựng một mô hình đồ thị dựa vào cấu trúc balltree (Graph Model based on
BallTree Structure - GMBS) [11]. Dựa trên mô hình này, không chỉ làm giảm độ
phức tạp của mô hình đồ thị, giảm chi phí trong triển khai mô hình thực tế, còn
đem lại hiệu quả cao trong kết quả tìm kiếm thông tin địa lý. Kết quả của nghiên
cứu sẽ giúp hỗ trợ trong việc xây dựng mô hình đồ thị cho mạng các bẫy đèn tự
động giám sát rầy nâu, thí điểm tại tỉnh Hậu Giang.

4.2. Cơ sở khoa học
1


a. Xây dựng mô hình đồ thị dựa trên cấu trúc balltree
Balltree [11] là một cấu trúc dữ liệu cây nhị phân hoàn chỉnh. Balltree được
ứng dựng nhằm mục đích mô hình hóa dữ liệu, hỗ trợ việc thêm và xóa dữ liệu, xử
lý với không gian đa chiều. Balltree được áp dụng trong nhiều lĩnh vực khác nhau
như: robots, thị giác máy tính, xử lý giọng nói, và trong lĩnh vực đồ họa.
Mỗi nút trong balltree là một “ball” - là một vùng chứa tập hợp điểm trong
không gian Euclidean. Mỗi “ball” được xác định bởi tọa độ tâm và bán kính của
nó. Nút gốc của balltree chưa tất cả các điểm, các điểm đó sẽ được phân chia thành
các tập hợp con. Mỗi nút của balltree có thể là nút lá hoặc không. Một nút lá là một
điểm trong tập hợp điểm ban đầu. Một nút không phải là nút lá thì chứa tập hợp
điểm. Trong không gian Euclidean, mỗi “ball” được xác định bởi hai thành phần là

tâm (pivot/centroid) và bán kính của nó [8] [11] [12] [13].
Trên cơ sở đó, xây dựng mô hình đồ thị dựa trên cấu balltree (GMBS) như
sau: dữ liệu đầu vào là thông tin về các vị trí địa lý cho trước trong một không gian
địa lý xác định. Các vị trí địa lý được xem như là một tập dữ liệu gồm các điểm
trong không gian Euclidean, tiến hành xây dựng cấu trúc balltree dựa vào tập dữ
liệu đó.

Hình 1: Thông tin về các vị trí địa lý trên thực tế – Tập hợp điểm.
Có nhiều giải thuật xây dựng cấu trúc balltree: kd, top-down, bottom-up...
[11]. Tùy vào mục tiêu ban đầu mà quyết định lựa chọn giải thuật xây dựng phù
hợp: đơn giản, số nút trên cây tối thiểu,...

2


Hình 2: Các giải thuật xây dựng cấu trúc balltree
Mô hình đồ thị GMBS là một đồ thị mà trong đó: đỉnh của đồ thị tương ứng
với một vị trí địa lý, cạnh của đồ thị là cạnh nối hai vị trí địa lý. Trong đó, cạnh của
đồ thị GMBS tính theo khoảng cách Euclidean, và được xác định dựa vào cấu trúc
balltree.
Giả sử xét trên một không gian địa lý xác định có các vị trí địa lý (P1 – P6)
như hình 3. Mỗi vị trí địa lý là một bẫy đèn tự động:

Hình 3: Đồ thị biểu diễn mạng các bẫy đèn
Hình 3 là minh họa một cấu trúc GMBS cơ bản. Đồ thị thu được chứa 6 nút,
2 đồ thị con và 1 đỉnh cô lập. Đồ thị con thứ nhất chứa 3 nút P1, P2, P3 vì khoảng
3


cách giữa các nút này nhỏ hơn bán kính hoạt động r xác định trước. Tương tự, ta có

P4 và P5 là một đồ thị con. Trong khi đó P6 là đỉnh cô lập.

Hình 4: Một ví dụ về GMBS
b. Xác định bán kính hoạt động cho bấy đèn tự động dựa vào
mô hình đồ thị GMBS
Mỗi bẫy đèn tự động có cấu trúc giống như một “ball” trong cấu trúc balltree
bao gồm: tâm – vị trí đặt bẫy đèn, bán kính hoạt động để thu thập và truyền tải
thông tin [14].
Trên cơ sở đó, một bán kính được đề xuất cho các bẫy đèn dựa trên mô hình
GMBS như sau: sau khi xây dựng cấu trúc balltree dựa trên vị trí đặt các bẫy
đèn, các bán kính của các “ball” (không phải là nút lá) của cấu trúc balltree sẽ
được thêm vào một danh sách gọi là L. Lập cấu trúc GMBS cho mạng các bẫy
đèn lần lượt với các bán kính trong danh sách L. Chọn ra mô hình GMBS thỏa
hai điều kiện sau: mô hình đồ thị GMBS thu được là một đồ thị liên thông, bán
kính của “ball” được chọn là nhỏ nhất.
c. Tìm kiếm k vị trí địa lý gần nhất
Tìm kiếm vị trí địa lý dựa trên cấu trúc balltree (Balltree based Search –
BTS) được thể hiện như là phương pháp tìm kiếm k vị trí địa lý được áp dụng
trên hệ thống mạng các điểm bẫy đèn tại một không gian địa lý xác định. Gọi: V
là tập hợp các vị trí địa lý (bẫy đèn), Q là chứa các điểm láng giềng của truy vấn
q trong V, k là số vị trí địa lý gần nhất cần tìm.
Khi đó, Q chứa k vị trí địa lý gần truy vấn q nhất khi và chỉ khi [12]:

Khoảng cách lớn nhất từ điểm truy vấn q đến các điểm thuộc Q được tính
theo công thức sau:
4


Tương tự vậy, khoảng cách lớn nhất có thể có từ điểm truy vấn q đến các
điểm thuộc B được tính theo công thức sau:


Kết quả tìm kiếm các vị trí địa lý có thể là: các vị trí gần nhất trên khoảng
cách, các vị trí thu được nhiều (ít) dữ liệu nhất, các vị trí tiêu hao năng lượng nhiều
nhất,….
d. Tìm kiếm đường đi giữa hai vị trí địa lý
Tìm kiếm đường đi giữa hai vị trí địa lý được xem như là một bài toán tìm
kiếm đường đi dựa trên đồ thị. Quá trình tìm kiếm được xây dựng dựa trên mô
hình đồ thị GMBS. Gọi: V là tập hợp các vị trí địa lý (bẫy đèn), G là mô hình đồ
thị GMBS, q là vị trí ban đầu, e là vị trí cần tìm đến.
Giải thuật tìm kiếm được thực hiện qua ba bước. Bước 1: xây dựng đồ thị
GMBS gọi là đồ thị G. Bước 2: từ mô hình đồ thị G, xây dựng ma trận trọng số
M cho các vị trí địa lý trong V. Với là hai vị trí địa lý trong V, khi đó ta có:
trọng số thu được là 0, trọng số thu được là:

Cuối cùng, tiến hành tìm kiếm đường đi từ q, e trên ma trận trọng số tạo
được ở bước hai.
Kết quả của tìm kiếm đường đi ngắn nhất giữa hai vị trí địa lý có thể được là
xem: tìm kiếm kênh truyền dữ liệu ngắn nhất giữa hai vị trí trong một mô hình
mạng.
5. Tại sao đề tài chọn xây dựng mô hình đồ thị dựa trên cấu trúc balltree?
Qua quá trình nghiên cứu, cấu trúc balltree không chỉ hỗ trợ trong việc mô
hình hóa dữ liệu mà còn cho kết quả tốt trong bài toán tìm kiếm láng giềng gần
nhất trong không gian đa chiều (đặc biệt trong trường hợp số chiều lớn).
Ngoài ra, mỗi cấu trúc một “ball” trong cấu trúc balltree giống với cấu trúc
của một cảm biến nói chung và bẫy đèn tự động nói riêng. Vì vậy, thông qua
GMBS có thể xác định bán kính hoạt động của các cảm biến dựa trên từng yêu cầu
cụ thể.
Về việc kiểm chứng kết quả cảnh báo:
- Một là kiểm chứng dựa trên công thức toán học được trình bày ở trên và
các phép toán được thể hiện trong các bài báo được đề cập ở tài liệu tham khảo.

5


- Hai là kiểm chứng qua thực nghiệm: dựa vào tập dữ liệu đầu vào thực tế,
sau đó tiến hành xây dựng mô hình, lựa chọn mô hình phù hợp và thực hiện tìm
kiếm trên mô hình được chọn.
6. Mục đích của đề tài (các kết quả cần đạt được)
Trên cơ sở dựa vào cấu trúc balltree, đề tài xây dựng mô hình đồ thị tìm
kiếm thông tin địa lý. Từ đó, dựa trên mô hình đồ thị tìm được để hỗ trợ:
 Xác định bán kính hoạt động tốt nhất (theo tiêu chí tìm kiếm) cho các bẫy
đèn tự động.
 Tìm kiếm k vị trí gần nhất.
 Tìm kiếm đường đi giữa hai vị trí địa lý.
Tìm kiếm vị trí địa lý dựa trên mô hình đồ thị là một trong những hướng
nghiên cứu quan trọng, mà tìm ra một mô hình đồ thị phù hợp là một vấn đề khó
khăn. Chính vì vậy chúng tôi đã đề xuất một hướng tiếp cận mới trong việc xây
dựng mô hình đồ thị dựa trên cấu trúc balltree - GMBS để hỗ trợ cho tìm kiếm vị
trí địa lý.
7. Nội dung của đề tài, các vấn đề cần giải quyết
Tìm hiểu về cấu trúc dữ liệu balltree, xác định mối tương quan giữa các vị
trí địa lý dựa trên cấu trúc balltree, đề xuất một mô hình đồ thị cho các vị trí địa lý,
các phương pháp tìm kiếm dựa trên cấu trúc balltree.
Xây dựng mô hình đồ thị trên quy mô triển khai dựa trên hệ thống các vị trí
địa lý được bố trí thực tế trong một vùng không gian địa lý xác định thành một
mạng các vị trí địa lý (như một đồ thị vô hướng).
Phân tích, xác định và lựa chọn một mô hình đồ thị tốt nhất, nhằm làm giảm
độ phức tạp của mô hình mạng, giảm chi phí trong triển khai mô hình thực tế mà
còn đem lại độ chính xác cao trong kết quả tìm kiếm vị trí địa lý.
• Cài đặt công cụ và triển khai thực nghiệm
- Dữ liệu đầu vào: từ nguồn dữ liệu có sẵn.

- Cài đặt các chức năng:
o Hiển thị bản đồ của Google và xác định vị trí các đối tượng trên bản
đồ.
o Mô phỏng cấu trúc balltree
o Mô phỏng mạng các vị trí địa lý.
o Mô hình GMBS
o Xác định bán kính hoạt động cho các bẫy đèn dựa vào GMBS
o Hỗ trợ tìm kiếm vị trí địa lý
- Thực nghiệm với dữ liệu là vị trí địa lý các bẫy đèn tự động thực tại tỉnh
Hậu Giang. Đánh giá dựa trên kết quả thu được.
8. Hướng phát triển của đề tài
Đề tài có thể triển khai áp dụng vào thực tế thí điểm cho mạng giám sát rầy
nâu tại tỉnh đặc thù thuộc vùng Đồng bằng sông Cửu Long – tỉnh Hậu Giang. Dựa
trên kết quả ứng dụng, chúng ta có thể tiến hành thực nghiệm, xây dựng mạng bẫy
6


đèn tự động phục vụ cho giám sát rầy nâu ở quy mô lớn hơn, vùng Đồng bằng
sông Cửu Long.
Nâng cao tốc độ tìm kiếm của những mô hình lớn bằng cách sử dụng giải
thuật tìm kiếm song song trên ngôn ngữ CUDA.
Mở rộng nghiên cứu mô hình vào các lĩnh vực như: cảnh báo cháy rừng,
phòng chống cháy nổ, các tòa nhà cao tầng, khu công nghiệp, trung tâm thương
mại…
9. Dự kiến kế hoạch thực hiện
Thời gian thực hiện dự kiến trong 5 tháng kể từ ngày 01/01/2015, được
chia thành các giai đoạn để thực hiện như sau:
10.
Kiến
Thời

giannghị về giảng viên hướng dẫn
Tên công việc
PGS.TS.
Huỳnh
Xuân
Hiệp,
trưởng
Khoacác
Công
nghệ
thông
Tháng
1
Tìm hiểu
tài liệu
về Phó
cấu trúc
balltree,
phương
pháp
xây tin và
Truyền thông Trường
Thơ.
dựngĐại
cấuhọc
trúcCần
balltree
Tháng 2

- Xác định mối tương quan giữa các vị trí địa lý theo quan điểm

balltree

- Đề xuất một mô hình đồ thị thể hiện mối tương quan giữa các
11. Tài liệu tham khảo
vị trí địa lý theo quan điểm balltree
[1]Tháng
David3J. Marchette,”Random
Graphs
Statistical
Recognition”,Wiley- Tìm hiểu phương
phápfortìm
kiếm dựaPattern
trên cấu
trúc balltree
Interscience, 2004.
- Cài đặt chương trình và triển khai thực nghiệm về:
[2] D. Panwar and S.
G. Neogi,
“DESIGN
+ Xây
dựng mô
hình đồ OF
thị. ENERGY EFFICIENT ROUTING
ALGORITHM FOR WIRELESS SENSOR NETWORK (WSN) USING
+ Xác
bán kính
hoạt động cho các bẫy đèn.
PASCAL GRAPH,”
pp.định
175–189,

2013.
+ Tìm
kiếm
trí địa
lý.
[3] J. Dong, Q. Chen,
and
Z. vị
Niu,
“Random
graph theory based connectivity
analysis
sensor
Tháng
4 in wireless
Viết báo
cáonetworks
luận văn with Rayleigh fading channels” 2007 AsiaPacific Conf. Commun., pp. 123–126, Oct. 2007
Tháng 5
Hoàn chỉnh luận văn và báo cáo.
[4] H. Munaga and V. Jarugumalli, “Performance Evaluation: Ball-Tree and KDTree in the Context of MST,” arXiv Prepr. arXiv1210.6122, 2012.
[5]

NetGen website, “A generator of concurrent systems”, />
[6] N. Bhatia, “Survey of nearest neighbor techniques,”
arXiv1007.0085, vol. 8, no. 2, pp. 302–305, 2010.

arXiv

Prepr.


[7] N. Kumar, L. Zhang, and S. Nayar, “What is a good nearest neighbors
algorithm for finding similar patches in images?” Comput. Vision–ECCV 2008,
pp. 1–14, 2008.
[8] P. Ram and A. Gray, “Maximum inner-product search using cone trees,”
Proceedings of the 18th ACM SIGKDD international conference on Knowledge
discovery and data mining (KDD '12). ACM, New York, NY, USA, 931-939

7


[9] S. Camtepe, B. Yener, and M. Yung, “Expander Graph based Key Distribution
Mechanisms in Wireless Sensor Networks” 2006 IEEE Int. Conf. Commun., pp.
2262–2267, 2006.
[10] S. Dhanabal and Dr. S. Chandramathi. “A Review of various k-Nearest
Neighbor Query Processing Techniques”. International Journal of Computer
Applications 31(7), Published by Foundation of Computer Science, New York,
USA, 14-22, October 2011
[11] S. M. Omohundro, “Five Balltree Construction Algorithms”, ICSI Technical
Report, 1989.
[12] T. Liu, A. Moore, and A. Gray, “Efficient exact k-NN and nonparametric
classification in high dimensions,” J. Mach. Learn. Res. , 1135-1158, 2006.
[13] T. Liu, A.W. Moore, A.G. Gray, and K. Yang, “An Investigation of
Practical Approximate Nearest Neighbor Algorithms”,In Proceedings of NIPS.
2004.
[14] V. Truong, H. Huynh, M. Le, and A. Drogoul, “Estimating the density of
brown plant hoppers from a light-traps network based on unit disk graph,” Act.
Media Technol., pp. 276–287, 2011.
[15] Y. Ting and K. ChunJian, “An energy-efficient and fault-tolerant
convergecast protocol in wireless sensor networks” International Journal of

Distributed Sensor Networks, vol. 2012, Article ID 429719, 8 pages, 2012.
GIÁO VIÊN HƯỚNG DẪN

HỌC VIÊN CAO HỌC

PGS.TS. Huỳnh Xuân Hiệp

Lương Hoàng Hướng

8



×