Tải bản đầy đủ (.pdf) (24 trang)

Nâng cao hiệu quả truyền dữ liệu trong mạng cảm biến không dây dựa trên tương quan dữ liệu tt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.43 MB, 24 trang )

MỞ ĐẦU
1. Lý do lựa chọn đề tài
Mạng cảm biến không dây (WSN) là tập lợp các nút cảm biến liên kết với
nhau để giám sát môi trường, sự kiện xung quanh trong các không gian
vật lý rộng. Các tiến bộ trong việc tích hợp các hệ thống vi cơ điện tử và
sự phát triển nhanh chóng của truyền thông không dây đã cho phép WSN
ngày càng được triển khai một cách rộng rãi. Các nút cảm biến trong WSN
được trang bị nhiều chức năng cảm biến khác nhau cùng với năng lực xử
lý ngày càng cao cho phép WSN có thể đáp ứng được các yêu cầu khác
nhau từ rất nhiều các ứng dụng hiện đại. Do tính chất của WSN là giá
thành rẻ, kích thước nhỏ và không thể thay thế nguồn năng lượng cấp cho
các nút cảm biến, vấn đề tiết kiệm năng lượng luôn là một thách thức lớn
trong việc thiết kế và vận hành mạng cảm biến không dây.
Trong các ứng dụng điển hình của WSN, các cảm biến được triển khai
một cách dày đặc trong không gian giám sát để đảm bảo tính chính xác
của kết quả giám sát. Điều này dẫn tới việc có nhiều cảm biến sẽ thu thập
thông tin của cùng một sự kiện. Nói một cách khác, dữ liệu thu được từ
các cảm biến này có tính tương đồng, hay một cách tổng quát các dữ liệu
này có tính chất tương quan với nhau. Việc tồn tại đặc tính tương quan
này có thể đem lại rất nhiều lợi thế cho việc phát triển các giao thức truyền
thông hiệu quả cho WSN.
Từ các lý do trên, tác giả đã lựa chọn đề tài nghiên cứu “Nâng cao hiệu
quả truyền dữ liệu trong mạng cảm biến không dây dựa trên tương
quan dữ liệu” với mục tiêu khám phá và khai thác tính chất tương quan
trong WSN dưới góc độ tiết kiệm năng lượng. Đề tài này được hi vọng có
ứng dụng rộng rãi do tính chất tương quan là khá phổ biến trong các môi
trường mà WSN được triển khai trong thực tế. Đặc biệt nghiên cứu này
sẽ có hữu dụng với các mạng cảm biến không dây đa phương tiện, là mạng
cảm biến không dây mà ở đó mức độ tương quan cao và dữ liệu truyền
lớn.
2. Mục tiêu và nội dung của đề tài


Các nghiên cứu trước đây về vấn đề tương quan trong mạng cảm biến
không dây thường chỉ tập trung vào tính tương quan phụ thuộc vào
khoảng cách. Giả thiết này không tổng quát và trong một số trường hợp
không còn đúng khi các nút cảm biến gần nhau nhưng bị ngăn cách bởi
1


một rào cản vật lý. Do vậy mục tiêu của nghiên cứu này là đề xuất một
mô hình tương quan mới không phụ thuộc vào khoảng cách dựa trên lý
thuyết tương quan entropy để mô tả tính chất tương quan trong WSN. Từ
mô hình tương quan này, ảnh hưởng của tính chất tương quan tới một số
cơ chế kết tập dữ liệu như nén dữ liệu hay nút đại diện được phân tích và
đánh giá. Thêm vào đó, một giao thức định tuyến tiết kiệm năng lượng
với kết tập dữ liệu dựa vào tính tương quan được xây dựng.
3. Nhiệm vụ nghiên cứu của luận án
Để đạt được mục tiêu nghiên cứu, luận án cần phải giải quyết các nhiệm
vụ sau:
<1>. Đề xuất phương pháp đánh giá joint entropy cho một tập dữ liệu.
Xây dựng định nghĩa vùng tương quan dựa vào các dữ liệu cảm biến đo
được và xây dựng thuật toán phân nhóm tương quan entropy.
<2>. Phân tích ảnh hưởng của tương quan entropy tới các cơ chế kết tập
dữ liệu như nén dữ liệu và nút đại diện trong WSN.
<3>. Xây dựng giao thức định tuyến với kết tập dữ liệu dựa vào tính tương
quan.
4. Đối tượng và phạm vi nghiên cứu của luận án
Đối tượng của luận án là mạng cảm biến không dây hoạt động trong môi
trường có độ tương quan cao, nghĩa là các dữ liệu thu thập bởi các nhóm
cảm biến có tính tương đồng/tương quan với nhau. Phạm vi nghiên cứu
của luận án là nhận biết tính chất tương quan và ứng dụng đặc tính tương
quan môi trường để phát triển các giao thức định tuyến năng lượng. Cụ

thể, đối tượng và phạm vi nghiên cứu cho các nhiệm vụ bao gồm:
- Với nhiệm vụ 1: Lý thuyết entropy được sử dụng để xem xét tính chất
tương quan. Xây dựng cách thức đánh giá joint entropy sử dụng giá trị
entropy của mỗi nút và hệ số tương quan entropy giữa hai nút. Tính chất
tương quan sẽ được nhận biết dựa trên thuộc tính của giá trị joint entropy
của nhóm dữ liệu. Dữ liệu thực tế được sử dụng để xác thực tính chính
xác của phương pháp đề xuất.
- Với nhiệm vụ 2: Để khai thác đặc tính tương quan môi trường, hai cơ
chế kết tập dữ liệu chính bao gồm nén dữ liệu và nút đại diện được xem
xét và phân tích sử dụng mô hình tương quan đã đề xuất trong nhiệm vụ
1. Cơ chế nén dữ liệu được xem xét với các cấu trúc mạng kiểu 1D và 2D,
nén dọc đường truyền về nút trưởng nhóm hoặc chỉ nén tại nút trưởng
2


nhóm. Cơ chế nút đại diện được xem xét với việc sử dụng hàm méo
entropy.
- Với nhiệm vụ 3: Dựa trên các kết quả phân tích và đánh giá trong nhiệm
vụ 2, giao thức định tuyến sử dụng kết tập dữ liệu dựa trên tương quan
entropy sẽ được xây dựng với mục tiêu tiết kiệm năng lượng. Cấu trúc và
hoạt động của giáo thức được mô tả và khả năng tiết kiệm năng lượng của
giao thức sẽ được đánh giá.
5. Ý nghĩa khoa học thực tiễn của luận án
Luận án đã đề xuất một định nghĩa vùng tương quan mới từ đó xây dựng
được thuật toán gom nhóm tương quan có thể thực hiện một cách đơn
giản trong thực tế. Thêm vào đó, mô hình tương quan không phụ thuộc
vào khoảng cách được đề xuất trong luận án có thể được sử dụng trong
các nghiên cứu khác về tính tương quan.
Luận án cũng đã xây dựng được một giao thức tiết kiệm năng lượng sử
dụng đặc tính tương quan. Giao thức này cho phép kéo dài thời gian hoạt

động của mạng trong khi vẫn đảm bảo độ chính xác dữ liệu theo yêu cầu.
6. Phương pháp nghiên cứu của luận án
Luận án kết hợp song song phương pháp nghiên cứu lý thuyết và phương
pháp nghiên cứu thực nghiệm.
Về lý thuyết: luận án sử dụng lý thuyết entropy và khái niệm tương quan
entropy để xây dựng mô hình tương quan, vùng tương quan và thuật toán
phân nhóm tương quan. Luận án cũng phát triển giao thức định tuyến cho
WSN. Tất cả các kết quả đều được chứng minh tính đúng đắn thông qua
các công cụ toán học.
Về thực nghiệm: tất cả các kết quả lý thuyết đều được xác thực với các
bộ dữ liệu thực tế. Các sai khác giữa điều kiện thực tế và giả thiết trong lý
thuyết đều được xem xét và hiệu chỉnh. Thêm vào đó, mô phỏng máy tính
cũng được tiến hành để đánh giá khả năng tiết kiệm năng lượng của giao
thức định tuyến đề xuất.
7. Kết quả nghiên cứu, đóng góp của luận án
Các kết quả và đóng góp chính của luận án bao gồm:
<1>. Xây dựng thuật toán phân nhóm tương quan entropy và xây dựng
mô hình tương quan entropy để mô tả tính chất tương quan của một nhóm
tương quan.
<2>. Phân tích và đánh giá ảnh hưởng của tương quan entropy tới các cơ
3


chế kết tập dữ liệu nén dữ liệu và nút đại diện.
<3>. Xây dựng giao thức định tuyến với kết tập dữ liệu dựa trên tương
quan entropy. Giao thức này cho phép khai thác đặc tính tương quan của
môi trường mạng cảm biến không dây làm việc.
8. Nội dung luận án
Nội dung của luận án được trình bày trong 5 chương bao gồm:
Chương 1: Giới thiệu tổng quan. Chương này trình bày giới thiệu về

WSN, các cơ chế tiết kiệm năng lượng và vấn đề tương quan dữ liệu trong
WSN. Các đóng góp chính của luận án cũng được đề cập trong chương
này.
Chương 2: Vấn đề tương quan trong mạng cảm biến không dây. Trong
chương này, các mô hình tương quan trong mạng cảm biến không dây
được khảo sát. Vấn đề tương quan dưới góc độ lý thuyết entropy thông
tin cũng được xem xét và ý tưởng để có thể thiết lập một mô hình tương
quan mới cũng được mô tả.
Chương 3: Phân nhóm tương quan entropy. Trong chương này, đầu tiên,
lý thuyết entropy đề cập. Sau đó phương pháp đánh giá xấp xỉ joint
entropy được xây dựng. Từ đánh giá xấp xỉ này, các định nghĩa về vùng
tương quan cũng như thuật toán phân nhóm tương quan được xây dựng.
Quá trình xác thực tính đúng đắn của các đề xuất cũng được thực hiện
trong chương này.
Chapter 4: Kết tập dữ liệu dựa trên tương quan entropy. Chương này trình
bày các phân tích và đánh giá ảnh hưởng của tương quan entropy tới các
kết tập dữ liệu kiểu nén dữ liệu và kiểu nút đại diện.
Chapter 5: Giao thức kết tập dữ liệu dựa trên tương quan entropy
(ECODA). Chương này xây dựng chi tiết giao thức ECODA sử dụng
thuật toán phân nhóm tương quan ở chương 3 và các các cơ chế kết tập
dữ liệu trong chương 4. Các mô phỏng cũng được tiến hành trong chương
này.
Chapter 6: Kết luận và kiến nghị. Chương này tổng kết các kết quả đạt
được, các giới hạn và hướng nghiên cứu tiếp theo của luận án.
1. GIỚI THIỆU TỔNG QUAN
1.1. Tổng quan
1.2. Vấn đề tiết kiệm năng lượng trong mạng cảm biến không dây
1.2.1. Tối ưu thông số radio
4



1.2.2. Các cơ chế thức/ngủ
1.2.3. Định tuyến tiết kiệm năng lượng
1.2.4. Giảm dữ liệu truyền
1.2.5. Các giải pháp về nạp năng lượng
1.3. Tương quan dữ liệu và vấn đề tiết kiệm năng lượng trong mạng
cảm biến không dây
Tính chất tương quan có thể đem lại rất nhiều thuận lợi cho việc xây dựng
các giao thức tiết kiệm năng lượng trong mạng cảm biến không dây. Ví
dụ như do sự tương quan cao, các dữ liệu trong một vùng tương quan có
thể được nén với tỉ số nén cao. Do vậy lượng dữ liệu gửi sẽ được giảm
thiểu. Thậm chí trong trường hợp tương quan đủ cao, ta có thể chỉ phải sử
dụng một số nút đại diện để thu thập thông tin. Các nút khác có thể được
nghỉ để tiết kiệm năng lượng mà vẫn đảm bảo độ chính xác, tin cậy của
thông tin thu thập. Điều đó cho thấy tính chất tương quan có thể cho phép
chúng ta giảm thiểu được lượng dữ liệu truyền, và do đó giúp tiết kiệm
năng lượng tiêu thụ của mạng cảm biến không dây một cách đáng kể.
1.4. Các vấn đề nghiên cứu và đóng góp của luận án
Vấn đề chính đặt ra cho luận án này là làm thế nào để có thể nhận biết
được sự tương quan của các dữ liệu mà chỉ xem xét giá trị của bản thân
dữ liệu đó, và làm thể nào để khai thác được tính chất tương quan cho
mục tiêu tiết kiệm năng lượng trong mạng cảm biến không dây.
Các đóng góp bao gồm:
• Xây dựng thuật toán phân nhóm vùng tương quan entropy và mô hình
tương quan entropy mô tả tính chất tương quan của nhóm tương quan.
• Phân tích và đánh giá cơ chế kết tập kiểu nén dữ liệu và kiểu nút đại
diện sử dụng mô hình tương quan đề xuất.
• Xây dựng giao thức định tuyến với kết tập dữ liệu dựa trên tương quan
entropy.
2. TƯƠNG QUAN TRONG MẠNG CẢM BIẾN KHÔNG DÂY

2.1. Khảo sát các mô hình tương quan
Để khai thác tính tương quan trong WSN, ta cần phải nhận biết được sự
tương quan của các dữ liệu thu thập được tại các nút trong mạng bằng
cách thiết lập các mô hình tương quan. Có rất nhiều nghiên cứu tập trung
cào nghiên cứu mô hình tương quan trong WSNs. Trong (Vuran, Akan,
& Akyildiz, 2004), các nút tương quan được giả thiết là các nút giám sát
5


cùng một nguồn và dữ liệu đo được tại mỗi nút là tổng của dữ liệu tương
quan với nguồn và nhiễu đo. Mô hình tương quan là hàm hiệp phương sai
𝐾𝜗 (hoặc hệ số tương quan ) và được chọn là một hàm phụ thuộc vào
khoảng cách. Có 4 nhóm hàm được xem xét là dạng cầu, hàm mũ, hàm tỉ
lệ bậc 2 và hàm Matern. Một số nghiên cứu khác cũng xây dựng mô hình
tương quan trong đó hệ số tương quan là hàm của khoảng cách giữa các
nút như trong (Shakya, Singh, & Verma, 2013), (von Rickenbach &
Wattenhofer, 2004). Nhược điểm của các mô hình trên là chỉ xem xét đến
mối tương quan tuyến tính và phụ thuộc vào khoảng cách.
Một số nghiên cứu khác xem xét tính tương quan như là sự tương đồng
của các dữ liệu. như trong (C. Liu, Wu, & Pei, 2007), (Peng, Tsai, & Lee,
2008), (Z. Liu, Xing, Zeng, Wang, & Lu, 2013). Một số nghiên cứu khác
định nghĩa mô hình tương quan theo một số cách khác như là mô hình dự
đoán tuyến tính (Gupta, Navda, Das, & Chowdhary, 2008), trọng số nút
(Ma, Guo, Tian, & Ghanem, 2011), độ tương quan mật độ dữ liệu (Yuan
et al., 2014). Cũng giống như các mô phương pháp được đề cập trước, các
mô hình này chỉ xem xét tương quan tuyến tính và đều phụ thuộc vào
khoảng cách. Để xây dựng mô hình tổng quát hơn mô hình tương quan
tuyến tính, mô hình tương quan entropy được xem xét (R. Dai & Akyildiz,
2009; Long, Liu, Fan, Dick, & Yang, 2009; Pattem, Krishnamachari, &
Govindan, 2008; F. Wang, Wu, Wang, & Hu, 2016). Tuy nhiên các mô

hình này vẫn là mô hình phụ thuộc vào khoảng cách.
Hầu hết các mô hình trong các nghiên cứu ở trên đều phụ thuộc vào
khoảng cách giữa các nút. Khoảng cách càng nhỏ, độ tương quan càng
cao. Tuy nhiên, giả thiết này không phải luôn đúng do một số rào cản vật
lý có thể làm cho các nút gần nhau có dữ liệu không tương quan nhau. Do
đó cần phải thiết lập một mô hình tương quan không phụ thuộc vào
khoảng cách. Điều này càng được khẳng định trong (Dang et al., 2007).
Do đó ta cần nhìn sâu vào bên trong bản thân dữ liệu hơn là chỉ xem xét
các thuộc tính mô tả dữ liệu như khoảng cách hay thời gian. Luận án này
sẽ sử dụng lý thuyết entropy thông tin để khám phá tính chất tương quan
dựa trên giá trị của các dữ liệu.
2.2. Lý thuyết entropy thông tin
2.2.1. Tổng quan
2.2.2. Khái niệm entropy
6


2.2.3. Joint entropy
2.3. Sự tương quan và entropy
2.3.1. Sự tương quan của hai biến
2.3.1.1. Tương hỗ thông tin
2.3.1.2. Hệ số tương quan entropy
2.3.2. Sự tương quan của nhiều hơn hai biến
Theo lý thuyết entropy thông tin, các biến trong một nhóm tương quan
với nhau càng cao thì giá trị joint entropy của nhóm biến càng khác biệt
so với tổng giá trị entropy của từng biến. Tuy nhiên việc sử dụng sự so
sánh này để nhận biết tính tương quan. Thay vào đó ta sẽ xem xét sự tăng
lên của joint entropy của một nhóm khi có một biến được thêm vào nhóm
đó. Nếu biến đó tương cao cao với các biến trong nhóm thì giá trị joint
entropy chỉ tăng lên một lượng nhỏ. Do đó, nếu ta xem xét mối liên hệ

giữa giá trị joint entropy và số lượng biến trong nhóm, ta có thể thấy tốc
độ tăng của joint entropy sẽ giảm dần và tiệm cận về 0 khi số lượng nút
tăng lên. Nói cách khác, giá trị joint entropy sẽ tiến đến trạng thái “bão
hòa” khi số biến tăng lên. Độ tương quan càng cao thì joint entropy tiến
đến trạng thái bão hòa càng nhanh.
2.4. Kết luận
Trong chương này ta đã khảo sát các mô hình tương quan trong WSN.
Các mô hình dựa trên lý thuyết xác suất thống kê kinh điển chỉ mô tả được
quan hệ tương quan tuyến tính. Lý thuyết entropy thông tin có thể cho
phép mô tả quan hệ tương quan một cách tổng quát. Hầu hết các mô hình
tương quan đều phụ thuộc vào thông tin khoảng cách. Tuy nhiên, cần phải
nhìn vào giá trị của dữ liệu để xem xét. Và khi đó mối gian hệ giữa giá trị
joint entropy và số lượng biến trong nhóm có thể được sử dụng để nhận
biết tính tương quan.
3. PHÂN NHÓM TƯƠNG QUAN ENTROPY
3.1. Đánh giá joint entropy
3.1.1. Xác định giới hạn trên của joint entropy
Với nhóm có một nút, joint entropy của nhóm là entropy của nút đó:
(3.3)
𝐻1 = 𝐻(𝑋𝑖 ) ≤ 𝑘1 𝐻𝑚𝑎𝑥
trong đó k1 =1. Với nhóm gồm 2 nút, Xi and Xj, từ định nghĩa hệ số tương
quan entropy ta có:
7


2 − 𝜌(𝑋𝑖 , 𝑋𝑗 )
(𝐻(𝑋𝑖 ) + 𝐻(𝑋𝑗 ))
2
Thêm vào đó, 𝐻(𝑋𝑖 ), 𝐻(𝑋𝑗 ) ≤ 𝐻𝑚𝑎𝑥 , và 𝜌(𝑋𝑖 , 𝑋𝑗 ) = 𝜌𝑖𝑗 ≥ 𝜌𝑚𝑖𝑛 ,
(3.4)

𝐻2 ≤ 𝑘2 𝐻𝑚𝑎𝑥 = 𝑏𝐻𝑚𝑎𝑥
với 𝑘2 = 𝑏 = 2 − 𝜌𝑚𝑖𝑛
Với nhóm gồm 3 nút, Xi, Xj, và Xk, đầu tiên, hai nút Xi và Xj được thay thể
bởi một nút tương đương Xij có entropy 𝐻(𝑋𝑖𝑗 ) = 𝐻(𝑋𝑖 , 𝑋𝑗 ) ≤ 𝑘2 𝐻𝑚𝑎𝑥 .
Theo (R. Dai & Akyildiz, 2009; Jain et al., 1999), hệ số tương quan giữa
hai nhóm nút có thể được xác định bằng giá trị lớn nhất/nhỏ nhất/trung
bình của hệ số tương quan giữa một nút thuộc nhóm này và một nút thuộc
nhóm khác. Do đó, 𝜌(𝑋𝑖𝑗 , 𝑋𝑘 ) = min{𝜌(𝑋𝑖 , 𝑋𝑘 ), 𝜌(𝑋𝑗 , 𝑋𝑘 )} ≥ 𝜌𝑚𝑖𝑛 . Vì
vậy,
𝐻2 = 𝐻(𝑋𝑖 , 𝑋𝑗 ) =

𝐻3 = 𝐻(𝑋𝑖 , 𝑋𝑗 , 𝑋𝑘 ) = 𝐻(𝑋𝑖𝑗 , 𝑋𝑘 ) =

2 − 𝜌(𝑋𝑖𝑗 , 𝑋𝑘 )
(𝐻(𝑋𝑖𝑗 ) + 𝐻(𝑋𝑘 ))
2

2 − 𝜌𝑚𝑖𝑛
𝑏
(𝑘2 𝐻𝑚𝑎𝑥 + 𝐻𝑚𝑎𝑥 ) = (𝑘2 + 1)𝐻𝑚𝑎𝑥 = 𝑘3 𝐻𝑚𝑎𝑥
2
2
𝑏
với 𝑘3 = 2 (𝑘2 + 1).
Tương tự, joint entropy Hm của một nhóm m nút có thể được coi như là
joint entropy của nhóm con với m-1 nút với nút còn lại. Entropy của nhóm
con có giá trị bằng joint entropy của m-1 nút; hệ số tương quan entropy
giữa nhóm con và nút còn lại là giá trị lớn nhất/nhỏ nhất/trung bình của
hệ số tương quan giữa một nút thuộc nhóm con và nút còn lại.
2 − 𝜌𝑚𝑖𝑛

𝑏
(𝑘𝑚−1 𝐻𝑚𝑎𝑥 + 𝐻𝑚𝑎𝑥 ) = (𝑘𝑚−1 + 1)𝐻𝑚𝑎𝑥
𝐻𝑚 ≤
2
2
𝑏
𝐻𝑚 = 𝑘𝑚 𝐻𝑚𝑎𝑥 với 𝑘𝑚 = 2 (𝑘𝑚−1 + 1).
𝐻3 ≤

Từ quan hệ truy hồi của km, công thức tổng quát để tính km được xây
dựng như sau (m  3):
𝑏 𝑚
(2 ) − 1
𝑏 𝑚−1
(3.8)
𝑘𝑚 =
+( )
−1
𝑏
2

1
2
3.1.2. Xác định giới hạn dưới của joint entropy
Giới hạn dưới joint entropy của nhóm m nodes có thể được xác định theo
8


cách tương tự như với giới hạn trên. Cuối cùng, với một nhóm gồm m nút
{𝑋1 , 𝑋2 , … , 𝑋𝑚 } thỏa mãn điều kiện sau:

(3.13)
𝐻𝑚𝑖𝑛 ≤ 𝐻(𝑋𝑖 ) ≤ 𝐻max ∀𝑖 ∈ 𝑚
𝜌𝑚𝑖𝑛 ≤ 𝜌𝑖𝑗 ≤ 𝜌max ∀𝑖, 𝑗 ≠ 𝑖 ∈ 𝑚
(3.14)
Joint entropy Hm của nhóm sẽ thỏa mãn:
𝑘𝑚𝑖𝑛 𝐻𝑚𝑖𝑛 ≤ 𝐻𝑚 ≤ 𝑘𝑚𝑎𝑥 𝐻𝑚𝑎𝑥
(3.15)
trong đó
𝑏𝑚𝑖𝑛 𝑛
( 2 ) −1
𝑏𝑚𝑖𝑛 𝑛−1
(3.16)
𝑘𝑚𝑖𝑛 =
+(
)
−1
𝑏𝑚𝑖𝑛
2
2 −1
với bmin = 2-𝜌max
𝑛
𝑏
( 𝑚𝑎𝑥
)
−1
𝑏𝑚𝑎𝑥 𝑛−1
2
(3.17)
𝑘𝑚𝑎𝑥 =
+(

)
−1
𝑏𝑚𝑎𝑥
2
2 −1
với bmax = 2-𝜌min
3.1.3. Xác thực phương pháp đánh giá joint entropy
Để xác thực phương pháp đánh giá joint entropy ở trên trong thực tế,
chúng ta sẽ tính toán joint entropy của các nhóm dữ liệu được cấp bởi (
Intel Berkeley Research Lab, 2004). Một nhóm 11 nút được gọi là tập dữ
liệu 1 được lựa chọn từ 48 nút with 𝜌𝑚𝑖𝑛 = 0.6, 𝐻𝑚𝑖𝑛 = 2.16, and
𝐻𝑚𝑎𝑥 = 2.55.

Thuật toán lựa chọn nút sẽ được trình bày ở phần sau của luận án. Với
mỗi nút, ta chọn 256 mẫu để tính entropy, joint entropy và hệ số tương
quan entropy. Từ các giá trị này, giới hạn trên, giới hạn dưới joint entropy
9


của nhóm nút sẽ được xác định. Thêm vào đó giá trị joint entropy của các
nhóm nút hình thành từ 11 nút này cũng được tính toán để so sánh với các
giá trị giới hạn trên và giới hạn dưới. Kết quả được trình bày trong bảng
3.3 và hình 3.3. Có thể thấy rằng giá trị joint entropy thực tế luôn nằm
giữa giá trị giới hạn trên và giới hạn dưới. Ví dụ này đã chứng thực tính
đúng đắn của phương pháp đề xuất.
3.2. Vùng tương quan và thuật toán phân nhóm tương quan
3.2.1. Đánh giá joint entropy và sự tương quan
Hình 3.4 chỉ ra mối quan hệ giữa giá trị đánh giá joint entropy theo số
lượng nút trong nhóm với các trường hợp hệ số tương quan entropy khác
nhau. Khi hệ số tương quan joint entropy đủ lớn, giá trị đánh giá joint

entropy có tính chất tương tự như giá trị joint entropy thực tế của nhóm
tương quan. Đó là joint entropy sẽ tăng dần đến giá trị “bão hòa” khi số
lượng nút tăng. Tốc độ tiếp cận giá trị bão hòa càng cao, độ tương quan
giữa các nút càng lớn. Từ đó ta có thể kết luận rằng:
• Có thể chấp nhận việc sử dụng giá trị giới hạn trên/dưới của joint
entropy để đánh giá joint entropy của nhóm tương quan bởi chúng
đều có tính chất tiến đến “bão hòa” tăng số lượng nút giống nhau.
• Hệ số tương quan của các cặp nút trong nhóm có thể là đại diện cho
mức độ tương quan của nhóm.
Trong luận án này ta sử dụng hàm giới hạn trên. Hình 3.5 cho thấy so
sánh giữa giá trị giới hạn trên và giá trị joint entropy thực tế của tập dữ
liệu 1. Hai đường đều có đặc tính tương tự nhau và của nhóm tương
quan. Sự khác nhau về giá trị là do sự khác nhau về giá trị entropy và
hệ số tương quan entropy giữa các nút của dữ liệu thực tế.

3.2.2. Định nghĩa vùng tương quan
Định nghĩa 2: Một nhóm m nút {𝑋1 , 𝑋2 , … , 𝑋𝑚 } được gọi là trong một
vùng tương quan với mức tương quan 𝜌0 nếu giá trị entropy của tất cả
10


các nút nằm trong một dải thay đổi nhỏ và hệ số tương quan entropy
của các cặp nút lớn hơn hoặc bằng 𝜌0 .
• 𝐻0 − ∆𝐻 ≤ 𝐻(𝑋1 ), 𝐻(𝑋2 ), … , 𝐻(𝑋𝑚 ) ≤ 𝐻0
• 𝜌0 ≤ 𝜌𝑖𝑗 = 𝜌(𝑋𝑖 , 𝑋𝑗 ),  𝑖  𝑗
trong đó H là dải thay đổi entropy, H0 được gọi là giá trị entropy cơ
bản và 𝜌0 là mức tương quan. Nếu 𝜌0 ≥ 0.5 ta gọi là vùng tương quan
cao. Với định nghĩa này, chúng ta có thể đánh giá joint entropy của
nhóm m nút {𝑋1 , 𝑋2 , … , 𝑋𝑚 } bằng phương trình sau:
(3.20)

𝐻𝑚 = 𝐻(𝑋1 , 𝑋2 , … , 𝑋𝑚 ) = 𝑘𝑚 𝐻0
trong đó km được tính bởi (3.8) với b=2-0. Phương trình này chính là
mô hình tương quan entropy đề xuất. Với định nghĩa 2 ta cần phải làm
rõ việc xác định giá trị dải thay đổi entropy. Trong luận án này, chúng
ta chọn sai số tối đa giữa giá trị joint entropy thực tế và giá trị đánh giá
là e = 85% thì Δ𝐻 ≤ 15%𝐻0 .
3.2.3. Thuật toán phân nhóm tương quan
Thuật toán phân nhóm tương quan được mô tả trong hình 3.6.

11


3.2.4. Xác thực thuật toán

Để kiểm tra tính tương quan, đạo hàm của hàm joint entropy theo số nút
của nhóm được tính toán và biểu diễn trong hình 3.8. Có thể thấy rằng các
đường đạo hàm đó có hình dáng và tính chất khá tương đồng. Chúng đều
giảm dần về 0 khi số lượng nút tăng. Điều đoc có nghĩa là giá trị joint
entropy tiến tới “bão hòa” khi số lượng nút tăng. Tính chất tương quan
được bảo toàn, và do đó có thể sử dụng mô hình tương quan entropy (3.20)
để đánh giá joint entropy của nhóm tương quan được thiết lập từ định
nghĩa vùng tương quan được đề xuất. Thêm vào đó, ta cũng đánh giá độ
phức tạp của thuật toán phân nhóm tương quan đề xuất. Có thể thấy rõ
rằng độ phức tạp của thuật toán đề xuất chỉ là O(n3) nhỏ hơn nhiều so với
O(2n) là độ phức tạp của việc phân nhóm dựa vào tính toán trực tiếp joint
entropy.
3.3. Kết luận
Trong chương này ta đã đề xuất định nghĩa về vùng tương quan và xây
dựng thuật toán phân nhóm tương quan. Các đề xuất này cho phép chúng
ta nhận biết được nhóm tương quan trong một tập các dữ liệu mà chỉ sử

dụng giá trị entropy của các dữ liệu đơn lẻ và hệ số tương quan entropy
của các cặp dữ liệu. Mô hình này hoàn toàn không phụ thuộc vào thông
tin vị trí nên đã khắc phục được các vấn đề của các mô hình trước đây và
có tính tổng quát. Độ phức tạp của thuật toán chỉ là O(n3), do đó có thể
được thực hiện một cách đơn giản với khối lượng tính toán ít. Hơn nữa
chúng tôi cũng đã xây dựng mô hình tương quan entropy để đánh giá joint
entropy của nhóm tương quan. Hệ số tương quan entropy chính là thông
số thể hiện độ tương quan của nhóm.
12


4. KẾT TẬP DỮ LIỆU DỰA TRÊN TƯƠNG QUAN ENTROPY
4.1. Kết tập dữ liệu kiểu nén
4.1.1. So sánh các cơ chế nén
Trong luận án này, để lựa chọn phương pháp nén không mất dữ liệu thích
hợp nhất, tương tự như (Pattem et al., 2008), ta sẽ đánh giá ba cơ chế định
tuyến nén chính là DSC (Pradhan & Ramchandran, 2003), RDC
(Intanagonwiwat, Estrin, Govindan, & Heidemann, 2002; Pattem et al.,
2008), và CDR (Scaglione & Servetto, 2002).
Hình 4.2 cho thấy năng lượng tiêu thụ ứng với các cơ chế DSC, DRC và
CDR thay đổi theo hệ số tương quan entropy (với n = n1 = 50, H0=1 bit).
Có thể thấy rằng, phương pháp DSC và CDR thích hợp cho WSN trong
môi trường tương quan cao. Tuy nhiên cơ chế DSC khó thực thi trong
thực tế vì tính phức tạp của nó, trong khi cơ chế CDR có thể được thực
thi một cách đơn giản bằng cách sử dụng các thuật toán nén cục bộ. Do
đó, CDR được đề xuất sử dụng cho mạng cảm biến không dây với môi
trường tương quan cao.

4.1.2. Cơ chế định tuyến nén trong vùng tương quan
4.1.2.1 Phân tích cấu trúc 1-D

a. Nén dọc đường truyền ngắn nhất tới nút trưởng nhóm
Hình 4.4 cho thấy tổng năng lượng tiêu thụ Es tương ứng với các kích
thước nhóm khác nhau với các giá trị 0 khác nhau (trong trường hợp này
N = 50, P= 5, H0=1). Có thể thấy rằng trong trường hợp tương quan cao
(0 ≥0.5), giá trị tối ưu của kích thước nhóm là sopt = N, nghĩa là không
cần thiết phải phân chia vùng tương quan thành các nhóm nhỏ hơn nữa.
Dữ liệu được nén lần lượ từ nút đầu tiên đến nút cuối cùng và tới nút
trưởng nhóm trong một nhóm. Nút trưởng nhóm sẽ nén dữ liệu và truyền
về trạm chủ.
13


b. Chỉ nén tại nút trưởng nhóm
Hình 4.5 cho thấy tổng năng lượng tiêu thụ Es tương ứng với các kích
thước nhóm khác nhau với các giá trị 0 khác nhau (trong trường hợp này
N = 50, P= 30, H0=1). Có thể thấy rằng có tồn tại giá trị tối ưu không
phải tại hai đầu mút (𝑠 ≠ 1 và 𝑠 ≠ 𝑁). Tuy nhiên giá trị tối ưu này phụ
thuộc vào hệ số tương quan. Với giá trị tương quan cao (0 ≥ 0.5), giá trị
kích thước nhóm tối ưu giản khi độ tương quan tăng. Thêm vào đó, mặc
dù không chỉ ra trong luận văn nhưng giá trị tối ưu kích thước nhóm phụ
thuộc nhiều vào số lượng bước chuyển tiếp (P). Số lượng bước càng cao
thì kích thước nhóm càng lớn.

4.1.2.2 Phân tích cấu trúc 2-D
a. Nén dọc đường truyền ngắn nhất tới nút trưởng nhóm
Hình 4.7 cho thấy tổng năng lượng tiêu thụ Es tương ứng với các kích
thước nhóm khác nhau với các giá trị 0 khác nhau (trong trường hợp n =
72; s = [1, 2, 3, 4, 6, 8, 9, 12, 18, 24, 36, 72]). Có thể thấy rằng trong
trường hợp tương quan cao (0 ≥0.5), giá trị tối ưu của kích thước nhóm
là sopt = n, nghĩa là không cần thiết phải phân chia vùng tương quan thành

các nhóm nhỏ hơn nữa.
b. Chỉ nén tại nút trưởng nhóm
Hình 4.8 cho thấy tổng năng lượng tiêu thụ Es tương ứng với các kích
thước nhóm khác nhau với các giá trị 0 khác nhau (trong trường hợp n =
72; s = [1, 2, 3, 4, 6, 8, 9, 12, 18, 24, 36, 72]). Có thể thấy rằng có tồn tại
giá trị tối ưu không phải tại hai đầu mút. Trong trường hợp này năng lượng
tiêu thụ đạt giá trị lớn nhất tại s=1 và s=n bởi vì tất cả các nút sẽ gửi dữ
liệu chưa nén. Tuy nhiên giá trị tối ưu này phụ thuộc vào hệ số tương
quan. Giá trị kích thước nhóm tối ưu giản khi độ tương quan tăng.
14


4.1.2.3. Phân tích mô hình tổng quát
a. Nén dọc đường truyền ngắn nhất tới nút trưởng nhóm
Hình 4.10 cho thấy tổng năng lượng tiêu thụ tương ứng với kích thước
nhóm khác nhau với cá giá trị 0. Có thể thấy rằng kết quả nhận được là
tương tự như các phân tích trước. Kích thước nhóm tối ưu là s = n, nghĩa
là một vùng tương quan là một nhóm duy nhất.

b. Chỉ nén tại nút trưởng nhóm
Hình 4.11 cho thấy tổng năng lượng tiêu thụ tương ứng với kích thước
nhóm khác nhau với cá giá trị 0. Có thể thấy rằng kết quả nhận được là
tương tự như các phân tích trước. Giá trị kích thước nhóm tối ưu không
phải tại hai đầu dải giá trị xem xét và giá trị tối ưu này phụ thuộc vào hệ
số tương quan. Hệ số tương quan càng lớn thì giá trị tối ưu càng nhỏ.
4.1.3. Cơ chế định tuyến tối ưu trong mạng tương quan
Nếu thực hiện nén dọc đường đi ngắn nhất tới nút trưởng nhóm với mạng
có hệ số tương quan cao, tất cả cá nút trong một vùng tương quan sẽ tập
hợp thành một nhóm mà không cần phân chia thành các nhóm nhỏ hơn
15



để tối ưu năng lượng tiêu thụ. Nếu chỉ thực hiện nén tại nút trưởng nhóm,
sẽ tồn tại một giá trị kích thước nhóm tối ưu, nghĩa là nhóm tương quan
sẽ được chia thành các nhóm nhỏ để tối ưu năng lượng tiêu thụ. Ta có thể
dùng phương pháp xem xét giá trị tối ưu trong các trường hợp cụ thể.
Thêm vào đó có thể thấy năng lượng tiêu thụ trong trường hợp chỉ nén tại
nút trưởng nhóm cao hơn so với trường hợp nén dọc đường đi ngắn nhất
tới nút trưởng nhóm.
4.2. Kết tập dữ liệu kiểu nút đại diện
4.2.1. Độ méo
Độ méo có thể được mô tả là phần trăm thông tin vị mất khi hạn chế
nguồn thông tin. Trong luận án này, ta sử dụng khái niệm độ méo
entropy được đề xuất trong (R. Dai & Akyildiz, 2009). Độ méo entropy
được định nghĩa là tỉ lệ độ suy giảm thông tin so với tổng lượng thông
tin tối đa và được tính theo công thức:
𝐷=

𝐻(𝑋1 , 𝑋2 , … , 𝑋𝑁 ) − 𝐻(𝑋𝑖1 , 𝑋𝑖2 , … , 𝑋𝑖𝑀 )
𝐻(𝑋1 , 𝑋2 , … , 𝑋𝑁 )

(4.10)

4.2.2. Số lượng nút đại diện
Số lượng nút đại diện iM có thể được tính theo công thức:
𝑖𝑀 = log 𝛽 (

trong đó

𝛽(𝛽 − 1)(1 − 𝐷)𝑘𝑁 + 𝛽 2

)
2𝛽 − 1
𝑏
𝜌
𝛽 = =1−
2
2

(4.15)

Mối quan hệ giữa độ méo và số lượng nút đại diện tương ứng với các hệ
số tương quan khác nhau được thể hiện trong hình 4.12 (trong trường hợp
N=10). Bảng 4.2 cho biết giá trị số lượng nút đại diện trong trường hợp
độ méo yêu cầu là D= 0.1. Với giá giả định sát với thực tế như Định nghĩa
2, giá trị số nút đại diện nên được tăng lên 1 đơn vị so với tính toán lý
thuyết. Việc chỉnh định này được thực hiện sau khi đã khảo sát một số
trường hợp thực tế để bù lại sai khác giữa tình huống thực tế và các giả
thuyết trên lý thuyết, và cũng cho phép việc lựa chọn các nút đại diện
được linh hoạt hơn.

16


4.2.3. Lựa chọn nút đại diện
Sau khi xác định được số nút đại diện, ta cần phải lựa chọn các nút đại
diện. Việc lựa chọn này có thể dựa theo các tiêu chí khác nhau như tối ưu
hóa lượng thông tin nhận được, tối ưu hóa vùng che phủ của các nút đại
diện hoặc cân bằng năng lượng trong mạng.
4.2.4. Xác thực thực tế
Bảng 4.8 cho thấy với phương pháp tính toán và xác định nút đại diện đề

xuất, độ méo thực tế luôn thỏa mãn độ méo yêu cầu.

4.3. Kết luận
Với kết tập dữ liệu kiểu nén, ba cơ chế nén phổ biến đã được xem xét
và cơ chế CDR được kết luận là phù hợp nhất với WSN có tính tương
quan cao. Thêm vào đó, với hệ số tương cao cao (0 ≥ 0.5), nếu thực
hiện nén dọc đường truyền ngắn nhất tới nút trưởng nhóm thì mỗi vùng
tương quan sẽ là một nhóm để tối ưu năng lượng tiêu thụ. Nếu chỉ thực
hiện nén tại nút trưởng nhóm, vùng tương quan sẽ được chia thành các
nhóm nhỏ hơn để tối ưu năng lượng. Việc xác định kích thước nhóm
tối ưu có thể thực hiện đơn giản qua các khảo sát với trường hợp cụ
thể.
Với kết tập dữ liệu kiểu nút đại diện, sử dụng mô hình đánh giá joint
entropy, ta đã thiết lập được hàm độ nén. Việc xác định số lượng nút
17


đại diện và lựa chọn các nút đại diện cũng được chỉ rõ. Khuyến nghị
của nghiên cứu sinh là nên chọn nhóm có hệ số tương quan cao
(0≥0.5) và thay đổi entropy nhỏ (H ≤20%H0). Thêm vào đó phương
án tính toán số nút đại diện thực tế nên được lựa chọn để có thể lựa
chọn nút đại diện linh hoạt hơn.
5. GIAO THỨC KẾT TẬP DỮ LIỆU DỰA TRÊN TƯƠNG
QUAN ENTROPY (ECODA)
5.1. Mô hình mạng
5.2. Mô hình truyền sóng radio
5.3. ECODA
Trong ECODA, quá trình phân nhóm được thực hiện tại trạm trung
tâm. Tại thời điểm ban đầu, cần ít nhất 𝑁𝑠 mẫu để tính toán entropy và
hệ số tương quan entropy. Do đó hoạt động của ECODA dduwocwj

chia thành hai giai đoạn: giai đoạn thu thập dữ liệu ban đầu và giai
đoạn hoạt động theo phân nhóm tương quan. Trong cả hai giai đoạn,
một vòng làm việc sẽ bao gồm 2 pha là pha thiết lập và pha ổn định
như trong hình 5.2.

5.3.1. Pha thiết lập
Trong giai đoạn thu thập dữ liệu ban đầu, ban đầu, trạm trung tâm xác
định số lượng nhóm k, và tất cả các nút trong mạng được chia thành k
vùng địa lý tương đương nhau tương ứng với k nhóm. Sau đó quá trình
thu thập dữ liệu được thực hiện. Trong giai đoạn hoạt động theo gom
nhóm tương quan, trạm trung tâm đã có đủ thông tin va thực hiện thuật
toán phân nhóm tương quan. Nhóm trưởng được chọn sao cho tổng
bình phương khoảng cách từ các nút tới nhóm trưởng là nhỏ nhất, và
năng lượng của nhóm trưởng phải lớn hơn năng lượng trung bình của
nhóm. Nếu kết tập dữ liệu kiểu nút đại diện được chọn, trong giai đoạn
18


phân nhóm tương quan, trạm trung tâm sẽ thực hiện lựa chọn nút đại
diện trong pha này.
Trong cả hai giai đoạn, sau khi xác định được nút trưởng nhóm và các
nút thành viên, trạm trung tâm sẽ thực hiện việc định tuyến từ nút thành
viên về các nút trưởng nhóm. Trong luận án này, thuật toán định tuyến
tối ưu trong (Vinh et.al., 2008) được sử dụng.
5.3.3. Pha ổn định
Trong giai đoạn thu thập dữ liệu ban đầu, các nút gửi dữ liệu tới các
nút trung gian/trưởng nhóm và các nút này sẽ chuyển tiếp dữ liệu tới
các nút ở lớp trên hoặc trạm chủ. Trong giai đoạn phân nhóm tương
quan, các nút trung gian thu thập dữ liệu từ các nút khác gửi đến và
nén cùng với dữ liệu nó đo được rồi gửi đến nút ở lớp tiếp theo hoặc là

tới nút trưởng nhóm. Nút trưởng nhóm thu thập dữ liệu từ các nút thành
viên, nén và gửi dữ liệu về trạm chủ.
5.4. Mô phỏng ánh giá
5.4.1. Mô hình mô phỏng
Mô hình năng lượng trong (Heinzelman et al., 2002) được sử dụng.
5.4.1.1. Các thông số mô phỏng
5.4.1.2. Thiết lập mô phỏng
5.4.1.3. Tính toán năng lượng tiêu hao
5.4.2. Kết quả mô phỏng và đánh giá
5.4.2.1. Với trường hợp giao thức định tuyến kiểu nén
Từ kết quả mô phỏng có thể thấy số lượng nhóm tương quan càng nhỏ
thì hiệu quả càng cao và cân bằng năng lượng được đảm bảo tốt trong
các trường hợp. Năng lượng suy giảm tuyến tính trong nửa đầu thời kỳ
tồn tại của mạng. Sau đó tốc độ suy giảm năng lượng giảm dần. Điều
này có thể được giải thích là do chỉ còn lại các nút ở gần trạm trung
tâm, do đó năng lượng tiêu thụ giảm.
Từ kết quả mô phỏng có thể thấy số nhóm tương quan càng nhỏ thì
càng tốt. Lý do là số nhóm tương quan càng nhỏ thì số nút trong mỗi
nhóm càng lớn. Do đó số nút ngủ càng lớn (do số nút đại diện là không
thay đổi).
19


5.4.2.2. Với trường hợp giao thức định tuyến kiểu nút đại diện

5.4.3. So sánh và đánh giá
5.4.3.1. Trong trường hợp ECODA với kết tập kiểu nén
Có thể thấy rằng giao thức dựa trên nén tốt hơn giao thức dựa trên
khoảng cách trong tất cả các thông số trừ thông số thời gian tồn tại của
mạng. Lý do là giao thức nén giảm số lượng thông tin truyền nhiều hơn

giao thức tối ưu khoảng cách nên tốt hơn. Tuy nhiên ở cuối thời kỳ
hoạt động của mạng, số nút trong mỗi vùng tương quan không còn
nhiều và do đó ưu điểm tương quan không còn phát huy tác dụng. Khi
đó tối ưu khoảng cách sẽ tiết kiệm năng lượng hơn.

20


5.4.3.2. Trong trường hợp ECODA với kết tập kiểu nút đại diện

Do chấp nhận một mức độ méo nhất định, giao thức kiểu nút đại diện
sẽ có nhiều nút ngủ để tiết kiệm năng lượng. Do đó giao thức nút đại
diện luôn tốt hơn giao thức tối ưu theo khoảng cách. Nếu thực hiện
thêm cả chức năng nén dữ liệu với các nút đại diện thì kết quả càng trở
nên tốt hơn.
5.5. Kết luận
Dựa trên các cơ chế kết tập dữ liệu, giao thức ECODA cho mạng cảm
biến không dây đã được xây dựng. Quá trình hoạt động của giao thức
được chia thành hai giai đoạn là giai đoạn thu thập dữ liệu ban đầu và giai
đoạn hoạt động theo phân nhóm tương quan. Giai đoạn thu thập dữ liệu
ban đầu xảy ra ở thời điểm ban đầu quá trình hoạt động để thu thập dữ
liệu cho việc nhận biết tính chất tương quan môi trường. Giai đoạn tiếp
theo là giai đoạn chính với việc phân nhóm tương quan và sử dụng các cơ
chế kết tập dữ liệu. Trong mỗi giai đoạn, trạm trung tâm thực hiện phân
nhóm và thiết lập các kết nối trong pha thiết lập. Sau đó, trong pha ổn
định, dữ liệu được gửi tới trạm trung tâm. Trạm trung tâm có thể sử dụng
dữ liệu thu được để đánh giá lại tính tương quan giữa các nút trong mạng.
Thêm vào đó, các mô phỏng đã được tiến hành với các điều kiện mô
phỏng khác nhau và giao thức đề xuất đã được so sánh với giao thức
tối ưu dựa vào khoảng cách. Mô phỏng đã chi ra giao thức đề xuất cho

kết quả tốt hơn về tiết kiệm và cân bằng năng lượng.
6. KẾT LUẬN VÀ KIẾN NGHỊ
6.1. Đóng góp của luận án
Luận án nghiên cứu tính tương quan trong mạng cảm biến không dây sử
dụng lý thuyết entropy thông tin. Thay vì xem xét tính tương quan thông
21


qua thông tin vị trí như các nghiên cứu trước, chúng tôi đã làm việc trực
tiếp trên các giá trị của dữ liệu thu thập và đề xuất phương pháp tiếp cận
mới với vấn đề tương quan. Các đống góm chính của luận án bao gồm:
• Đề xuất định nghĩa vùng tương quan và xây dựng thuật toán phân
nhóm tương quan mới. Mô hình tương quan entropy để tính toán joint
entropy của nhóm tương quan cũng được thiết lập
• Tính tương quan được xem xét thông qua mối quan hệ giữa giá trị
joint entropy của một nhóm và số lượng biến trong nhóm đó. Để nhận
biết được sự tương quan, chúng tôi đã thực hiện đánh giá giá trị joint
entropy sử dụng giá trị entropy của các biến đơn lẻ và hệ số tương quan
entropy của các cặp biến. Sử dụng đánh giá này, các điều kiện để có thể
thiết lập được nhóm tương quan đã được xây dựng. Thêm vào đó, hệ số
tương quan entropy được dùng để xác định độ tương quan của nhóm
tương quan.
• Phân tích và đánh giá ảnh hưởng của tương quan entropy tới các cơ
chế kết tập dữ liệu trong mạng cảm biến không dây. Sau đó các cơ chế
kết tập dữ liệu dựa trên tương quan đã được xây dựng.
• Sử dụng mô hình tương quan dữ liệu, hai cơ chế kết tập dữ liệu bao
gồm cơ chế nén và cơ chế nút đại điện đã được xem xét.
- Với cơ chế kết tập dữ liệu kiểu nén, một số kiểu định tuyến có nén dữ
liệu đã được phân tích và đánh giá với các cấu trúc mạng 1D và 2D.
Từ góc độ tiết kiệm năng lượng và dễ dàng thực thi, cơ chế CDR với

nén dọc đường truyền ngắn nhất từ nút tới nút trưởng nhóm là cơ chế
thích hợp nhất. Thêm vào đó, từ các tính toán lý thuyết, có thể thấy
rằng mỗi vùng tương quan sẽ tương ứng với một nhóm duy nhất để
đảm bảo tối ưu năng lượng.
- Với cơ chế kết tập dữ liệu kiểu nút đại diện, để lựa chọn các nút đại
diện cho một nhóm tương quan, độ méo entropy đã được sử dụng để
xác định mức độ yêu cầu về chính xác của dữ liệu nhận được. Luận
án đã đề xuất một phương pháp tính toán số lượng nút đại diện cũng
như lựa chọn các nút đại diện để đảm bảo đạt được độ chính xác yêu
cầu. Các đánh giá cả về lý thuyết và thực nghiệm đã kiểm chứng tính
đúng đắn của phương pháp đề xuất.

22


• Phác thảo ra một giao thức định tuyến kết tập dữ liệu dựa trên tương
quan entropy ECODA cho mạng cảm biến không dây hoạt động trong
môi trường tương quan.
Trong giao thức này, mỗi vùng tương quan trở thành một nhóm tương
quan và các nhóm trưởng được lựa chọn dựa trên nguyên tắc cân bằng
năng lượng. Hai cơ chế kết tập dữ liệu có thể được sử dụng trong giao
thức này.
- Với cơ chế nén dữ liệu, dữ liệu được truyền và nén dọc theo đường đi
tối ưu tới nút trưởng nhóm sử thuật toán nén Huffman với từ điển mã
cố định. Do tính chất tương quan mà có thể thực hiện nén với tỉ số
cao, giảm lượng dữ liệu truyền nên năng lượng tiêu tán được giảm đi.
- Với kết tập dữ liệu kiểu nút đại diện, các nút không là nút đại diện có
thể ngủ để tiết kiệm năng lượng. Kết quả mô phỏng cho thấy giao
thức đề xuất hoạt có thể tiết kiệm năng lượng và đảm bảo cân bằng
năng lượng cho mạng cảm biến không dây.

6.2. Các hạn chế
Luận án chỉ xem xét sự phân bố của các nút mạng trong không gian 1
chiều và 2 chiều, chưa xem xét trong không gian 3 chiều. Thêm vào đó,
mặc dù giao thức đề xuất cố gắng nhận dạng tính chất tương quan tại mỗi
vòng hoạt động tại trạm trung tâm, luận án vẫn chưa phân tích và đánh
giá ảnh hưởng của sự thôi đổi môi trường tới hoạt động của mạng. Do đó
vẫn còn thiếu cơ chế phát hiện sự thay đổi tính tương quan của môi trường
cũng như cơ chế xử lý khi có sự thay đổi này.
Các thí nghiệm với thiết bị và hệ thống thực tế vẫn chưa được tiến hành
do các hạn chế về nguồn lực. Các dữ liệu thực tế sử dụng trong luận án
này là dữ liệu của một môi trường mà tính tương quan không thực sự nổi
bật. Luận án này cũng sử dụng giả thiết trạm trung tâm biết thông tin vị
trí của tất cả các nút trong mạng. Việc đánh giá ảnh hưởng của giả thiết
này vẫn chưa được xem xét một cách chi tiết và cẩn thận. Giao thức đề
xuất cũng chưa được triển khai trên mạng thực tế với môi trường tương
quan. Thêm vào đó, tác giả mới thực hiện so sánh giao thức đề xuất với
một giao thức định tuyến dựa vào khoảng cách. Điều này làm hạn chế
việc đánh giá chính xác tính hiệu quả của giao thức đề xuất.
Trong luận án này, việc gom nhóm tương quan có thể dẫn tới hình thành
các nhóm cố định và do đó có thể làm suy giảm hiệu quả hoạt động của
23


mạng. Thêm vào đó, các tính toán entropy và phân nhóm có thể gây ra trễ
trong quá trình hoạt động. Tuy nhiên ảnh hưởng này cũng chưa được đánh
giá một cách chi tiết.
6.3. Các hướng phát triển tiếp theo
Hướng phát triển tiếp theo của luận án là khắc phục các nhược điểm đã
đề cập đến ở trên. Thêm vào đó, việc mở rộng ứng dụng của mô hình
tương quan entropy cho các lĩnh vực khác liên quan đến tính chất tương

quan cũng là một hướng đầy hứa hẹn. Đặc biệt, việc phát triển cơ chế
DSC, là cơ chế nén có hiệu quả tối ưu sử dụng mô hình tương quan đề
xuất sẽ được xem xét. Một hướng phát triển khác cũng đang thu hút được
sự quan tâm là xây dựng mô hình tương quan không-thời gian dựa trên lý
thuyết entropy nhằm mục đích tiết kiệm năng lượng trong mạng cảm biến
không dây.

24



×