Báo cáo khoa học: "áp dụng Lý thuyết Dempster-Shafer cho quá trình trộn dữ liệu đa cảm biến" potx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (138.93 KB, 5 trang )

áp dụng Lý thuyết Dempster-Shafer
cho quá trình trộn dữ liệu đa cảm biến

ThS Phạm hải an
Viện Tự động hoá kỹ thuật quân sự
PGS. TS Lê hùng lân
Trờng Đại học Giao thông Vận tải
Tóm tắt: Trộn dữ liệu đa cảm biến l quá trình kết hợp dữ liệu v thông tin từ nhiều nguồn
cảm biến khác nhau. L một lĩnh vực tơng đối mới mẻ nên các kỹ thuật trộn dữ liệu vẫn còn
đang đợc tiếp tục nghiên cứu v giải quyết. Bi báo đa ra các kỹ thuật trộn đã đợc đề xuất,
trong đó đi sâu trình by kỹ thuật trộn theo lý thuyết Dempster-Shafer.
Summary: Multi-sensor data fusion relates to the combination of data and information
from different sensors. As a fairly new field, the techniques for fusing data have been studied
and developed. The study deals with the techniques proposed, in particularly with the ones
accordance to Dempster-shafer theory.

* Tốt hơn trong việc đánh giá tình huống và ra quyết định, vì vậy phản ứng của hệ thống sẽ
nhanh hơn. Từ các nguồn dữ liệu khác nhau và độ chính xác của các cảm biến, việc kết hợp và
trộn dữ liệu sẽ đem lại một đánh giá tốt hơn về tình huống và do đó tăng độ chính xác khi kết
luận và vì thế dễ dàng đa ra quyết định. Điều này là đặc biệt đúng trong các tình huống chiến
tranh nơi mà độ chính xác của các cảm biến phát hiện mục tiêu sớm sẽ giúp cho ngời chỉ huy
có phản ứng nhanh hơn để đa ra các biện pháp đối phó.
CT 2
* Tăng độ chính xác của dữ liệu và giảm các dữ liệu không chắc chắn và mơ hồ. Tập hợp
nhiều nguồn dữ liệu có thể giúp cho việc tăng độ chính xác dữ liệu và giảm thông tin không chắc
chắn sau quá trình trộn thông minh và bỏ đi các dữ liệu mơ hồ.
* Mở rộng thông tin về đối tợng. Nhiều nguồn dữ liệu sẽ cung cấp thêm thông tin về đối
tợng hoặc sự kiện quan sát. Mở rộng thông tin có thể bao gồm cả không gian và thời gian.
* Sự hiệu quả về chi phí. Với việc giảm về chi phí tính toán, truyền thông và tài nguyên

mạng, vì vậy, trong trờng hợp tổng quát, hầu hết chi phí sẽ phụ thuộc vào nhiều nguồn dữ liệu
đầu vào hơn là dựa vào một nguồn dữ liệu để cung cấp tất cả thông tin cần thiết. Ví dụ để xây
dựng một cảm biến mà có thể thực hiện nhiều chức năng sẽ đắt hơn rất nhiều so với việc kết
hợp một vài cảm biến đơn giản và rẻ tiền với một chức năng cụ thể.
* Không có nguồn dữ liệu đơn hoàn chỉnh. Hầu hết các nguồn thu thập dữ liệu, ví dụ nh
các cảm biến, chỉ thực sự hữu ích trong một môi trờng nhất định. Những thông tin thu nhận
đợc từ một nguồn dữ liệu đơn có thể rất hạn chế và có thể không hoàn toàn đầy đủ và đáng tin
cậy. Ví dụ nh cảm biến tiếp xúc chỉ có thể phát hiện một đối tợng khi tiếp xúc, cảm biến âm
thanh chỉ phát hiện đợc đối tợng mà tín hiệu âm thanh đợc phát ra, cảm biến quang điện tử
hoàn toàn phụ thuộc vào điều kiện ánh sáng ở môi trờng xung quanh và các cảm biến giám

sát điện tử chỉ có thể phát hiện các đối tợng mà có sóng điện từ phát ra. Vì vậy, sẽ là rất khó
khăn khi thiết kế một cảm biến cho nhiều mục đích.
2. Một số kỹ thuật trộn dữ liệu
Là một lĩnh vực tơng đối mới mẻ nên các kỹ thuật trộn dữ liệu vẫn còn đang đợc tiếp tục
nghiên cứu và giải quyết. Do trộn dữ liệu đợc áp dụng trong rất nhiều lĩnh vực rộng lớn và rất
khác nhau do vậy tuỳ theo từng bài toán cụ thể mà ta sẽ phải có một kỹ thuật trộn thích hợp.
Lý thuyết Bayes dựa trên ý tởng về xác suất cổ điển có thể áp dụng rất hữu hiệu trong bài
toán trộn dữ liệu, trong đó việc trộn dữ liệu đợc thực hiện theo thời gian. Các giá trị xác suất thu
nhận đợc trong các bớc thời gian sẽ đợc kết hợp với nhau để đa ra một xác suất đánh giá
mới về đối tợng đang xém xét.
Cùng tồn tại với lý thuyết Bayes là lý thuyết Dempster-Shafer, đây là lý thuyết cho phép
giải thích kỹ hơn sự kiện không chắc chắn sắp xảy ra là cái gì. Lý thuyết Dempster-Shafer xử lý
các độ đo về niềm tin chứ không phải là xác suất. Lý thuyết Dempster-Shafer dựa trên ý tởng
về khối lợng ngợc với xác suất theo lý thuyết Bayes; Để trộn dữ liệu, ta sẽ sử dụng các ý
tởng mới trong lý thuyết này đó là mức độ hỗ trợ và mức độ đồng thuận.
Trong một số bài toán mà các dữ liệu đầu từ các cảm biến có thể bị nhiễu đòi hỏi ta phải có
một phơng pháp có khả năng xử lý vấn đề đặt ra: tức là đa ra các quyết định dựa trên các
điều kiện không chắc chắn. Mục đích của các phơng pháp này đợc mở rộng từ việc đánh giá

định lợng giá trị vật lý đến việc đánh giá theo xác suất xuất hiện trên kết quả tổng hợp của
nhiều dữ liệu cảm biến trong không gian một và nhiều chiều. ở đây áp dụng kỹ thuật logic mờ là
một phơng pháp rất hữu ích.
CT 2
Khi các cảm biến là không tơng tự nhau, nhiều công việc cần phải thực hiện để thực hiện
suy diễn trong bài toán trộn dữ liệu nhng chúng ta không thể luôn tạo ra đợc các quy tắc cụ
thể để kết hợp dữ liệu từ các nguồn khác nhau. Một phơng pháp khác là sử dụng hệ thống có
khả năng tự tạo ra các qui tắc của riêng nó để trộn dữ liệu. Khả năng học hỏi và thích nghi của
mạng neuron có khả năng đợc sử dụng cho mục đích này.
3. Kỹ thuật trộn dữ liệu Dempster-Shafer
Cả hai phơng pháp Bayes và Dempster-Shafer đều dựa trên khái niệm gắn các trọng
lợng cho các trạng thái của hệ thống đang đợc khảo sát. Trong khi lý thuyết Bayes có ý nghĩa
cổ điển hơn đứng về mặt ý tởng xác suất, lý thuyết của Dempster-Shafer cho phép sử dụng
thêm các kịch bản khác, ví dụ ta có thể kết hợp các trạng thái đang có để tạo ra trạng thái mới
tơng ứng với đại lợng cha biết. Khái niệm trọng lợng, chính là xác suất cổ điển trong lý
thuyết Bayes thì không đợc dùng nhiều trong lý thuyết Dempster-Shafer. Các đại lợng tơng
tự trong lý thuyết Dempster-Shafer đợc gọi là các khối lợng, và ít nhiều chúng cũng đợc hiểu
là xác suất. Lý thuyết Dempster-Shafer gắn các khối lợng cho tất cả các tập con của các thực
thể bao gồm trong hệ thống. Giả sử hệ thống có 5 thành viên. Ta sẽ đánh nhãn chúng và sẽ mô
tả một tập con cụ thể bằng cách viết số 1 cạnh mỗi một phần tử nằm trong tập con này, và số
0 cạnh mỗi một phần tử mà không phụ thuộc vào tập con này. Nh vậy có thể thấy có 2
5
tập
con phần tử. Nếu tập ban đầu gọi là tập S thì tập của tất cả các tập con đợc gọi là tập luỹ thừa
ký hiệu là 2
S
. Dempster-Shafer xem các tập con này là điểm bắt đầu.

Một ví dụ về lý thuyết này đợc mô tả trong công trình của Zou và các cộng sự [1]. Robot

của họ chia môi trờng xung quanh thành một lới, gán cho mỗi ô trong lới một khối lợng: Độ
đo về niềm tin trong mỗi một sự kiện có thể thay thế cho nhau là: đã bị chiếm, trống hoặc
cha biết. Mặc dầu khối lợng này không phải là xác suất nhng tổng khối lợng của tất cả
các kết hợp của 3 trạng thái thay thế nhau này (tạo thành tập luỹ thừa) cần phải bằng 1. Trong
trờng hợp này cha biết có thể là đã bị chiếm hoặc là trống. Ba trạng thái thay thế này
cùng với tập rỗng có khối lợng bằng 0, tạo thành tập lũy thừa đầy đủ.
Lý thuyết Dempster-Shafer cung cấp quy tắc để tính toán độ đo niềm tin của mỗi trạng
thái dựa trên các dữ liệu cả cũ lẫn mới. Các phơng án thay thế mà Robot xây dựng trên đó là:
{đã bị chiếm, trống, cha biết} đợc ký hiệu là {O, E, U}.
Ta sẽ xét 3 khối lợng, khối lợng này là niềm tin trong mỗi phần tử của tập lũy thừa; độ
đo niềm tin m
s
là các chứng cứ hiện thời nhận đợc từ các cảm biến; và độ đo niềm tin m
o
từ
các chứng cứ cũ đã biết (chính là khối lợng m từ các hành trình trớc đó). Giả sử ta có tập luỹ
thừa gồm 3 phần tử A, B, C, theo quy tắc Dempster-Shafer [2] ta có công thức sau:

=
== 0BA
os
CBA
0s
)B(m)A(m1)B(m)A(m)C(m
(1)
áp dụng phơng trình này cho quá trình tìm kiếm các vùng đã bị chiếm trên lới ta đợc
phơng trình sau:
)O(m)E(m)E(m)O(m1
)O(m)U(m)U(m)O(m)O(m)O(m
m(O)
osos
ososos

++
=
(2)
CT 2
Khi Robot khảo sát môi truờng xung quanh, nó tính m(O) cho mỗi điểm trên lới xung
quanh vùng di chuyển của nó và vẽ ra một điểm nếu nh m(O) này lớn hơn một giá trị niềm tin
định trớc. Và cuối cùng bức tranh mà nó vẽ ra sẽ là sơ đồ của các bức tờng của môi trờng
xung quanh.
3.1. Trộn 02 cảm biến
Giả sử ta có hai cảm biến đang quan sát 1 máy bay chuyển động, loại của máy bay này có
thể là máy bay phản lực TU134, hoặc dạng tơng tự của TU là AN26 và có thể là máy bay MI8.
Ta sẽ thêm 02 trạng thái trong cơ sở tri thức.
1. Trạng thái Unknown: là trạng thái khi mà việc đa ra quyết định máy bay thuộc loại nào

là không thể thực hiện đợc. Điều này tơng đơng với tập con {TU134, AN26}.
2. Trạng thái Fast, ở đây ta không thể phân biệt giữa TU134 và AN26 về mặt tốc độ.
Giả sử 02 cảm biến phân phối các khối lợng cho tập luỹ thừa nh trong bảng 1; cột thứ 3
là các khối lợng trộn cuối cùng mà ta sẽ tính toán. Trong số 8 tập con có thể đợc tạo thành từ
3 máy bay, chỉ có 5 tập là hữu ích, vì vậy chúng là những tập đợc phân phối khối lợng,
Dempster-Shafer cũng yêu cầu tổng các khối lợng bằng 1 trên toàn bộ tập con luỹ thừa. Ví dụ
nếu cảm biến 1 cho xác suất là máy bay là máy bay TU134 thì cách viết khác là khối lợng của
nó là 30%, khi đó các xác suất đợc tính đối với máy bay TU134 qua các tập Fast và
Unknown là không có ý nghĩa.

Các khối lợng này đợc trộn sử dụng quy tắc kết hợp sử dụng quy tắc Dempster. Sử dụng
chỉ số trên của khối lợng để chỉ số của cảm biến ta đợc:
SUM/)B(m)A(m)C(m
CBA
212,1

=
=
(3)
ở đây SUM là tổng các khối lợng của các thành phần trong tập luỹ thừa.
Bảng 1
Cảm biến 1
(khối lợng m
1
)
Cảm biến 2
(khối lợng m
2
)

Khối lợng trộn
(khối lợng m
1,2
)
TU 134 30% 40% 55%
AN26 15% 10% 16%
MI8 3% 2% 0,4%
Fast 42% 45% 29%
Unknown 10% 3% 0,3%
Tổng khối lợng 100% 100% 100%
Ta sẽ trộn dữ liệu của bảng 1 sử dụng quy tắc (3) này. Ví dụ với máy bay TU134 ta đợc:
.SUM/47.0
SUM/40.010.040.042.003.030.045.030.040.030.0
SUM/)]134TU(m)Unknown(m
)134TU(m)Fast(m)Unknown(m)134TU(m
)Fast(m)134TU(m)134TU(m)134TU(m[)134TU(m
21
2121
21212,1
=
ì+ì+ì+ì+ì=
+
++
+=

CT 2
Các đại lợng khác sẽ đợc tính tơng tự. Sau khi tính toán ta sẽ đợc các giá trị khối lợng
mới sau khi trộn tại cột 3 của bảng 1. Việc trộn này củng cố thêm ý tởng cho rằng máy bay
thuộc loại TU134 và cùng với niềm tin ban đầu nó thuộc loại máy bay nhanh, có nghĩa là ta
chắc chắn hơn bao giờ hết rằng nó không phải là loại máy bay MI8. Mặc đầu vậy có một điều là

mặc dù là phần lớn các khối lợng đợc gán cho 2 loại máy bay nhanh, nhng sau khi trộn, khối
lợng mà gán cho Fast không nhiều nh ta tởng. Điều này là lý do rất tốt để không giải thích
khối lợng Dempster-Shafer là các xác suất.
Ta có thể làm sáng tỏ điều bất thờng này bằng cách sử dụng một tập các khối lợng mới
nh trong bảng 2. Cảm biến 2 không gán khối lợng cho Fast. Ta có thể giải thích điều này
nghĩa là nó không biết máy bay thuộc loại nhanh hay không. Nhng một trạng thái nh vậy thì
không khác biệt gì về mặt số với việc gán cho nó khối lợng bằng 0. Ta trộn các khối lợng của
2 cột đầu tiên trong bảng 2 tạo ra cột thứ 3. Mặc dù trộn dữ liệu vẫn dẫn đến cùng một niềm tin
nh trớc đây, nhng giá trị 2% của m
1,2
Fast có vẻ hơi bất thờng với kết luận là máy bay này
rất có thể là máy bay TU134 hoặc AN26. Các khối lợng nh vậy chắc chắn không thể nào là
xác suất đợc. Rất có thể là sự thiếu hiểu biết về một trạng thái sẽ dẫn đến việc gán cho nó một
khối lợng lớn hơn 0, nhng khối lợng đó cần phải bằng bao nhiêu, khi mà xem xét tất cả các
tập con, thì còn là một hớng mở cho việc nghiên cứu.
Từ công thức (1) ta có thể viết lại quy tắc Dempster-Shafer khi trộn dữ liệu của hai cảm
biến là:

=

=
=
=

=

CBA
21
CBA
21
0BA
21
CBA
21
2,1
)B(m)A(m1
)B(m)A(m
)B(m)A(m
)B(m)A(m
)C(m
(4)
Bảng 2
Cảm biến 1
(khối lợng m
1
)
Cảm biến 2
(khối lợng m
2
)
Khối lợng trộn
(khối lợng m
1,2
)
TU 134 30% 50% 63%
AN26 15% 30% 31%

MI8 3% 17% 3.5%
Fast 42% 2%
Unknown 10% 3% 0.5%
Tổng khối lợng 100% 100% 100%
3.2. Ba hoặc nhiều hơn ba cảm biến
Trong trờng hợp ba hoặc nhiều hơn ba cảm biến, quy tắc Dempster-Shafer có thể đợc
áp dụng theo các cách khác nhau phụ thuộc vào thứ tự đợc chọn của các cảm biến nhng kết
quả là quy tắc chỉ quan tâm đến các tập giao nhau, thứ tự trộn sẽ không quan trọng, nh vậy
cho trờng hợp ba cảm biến ta đợc công thức (5):

=
=

=

==
0CBA
321
DCBA
321
0CBA
321
DCBA
321
3,2,1
)C(m)B(m)A(m1
)C(m)B(m)A(m

)C(m)B(m)A(m
)C(m)B(m)A(m
)D(m
(5)
CT 2
và khi trộn nhiều cảm biến hơn ta có thể xây dựng công thức tơng tự nh công thức (5) ở trên.
4. Kết luận
Trộn dữ liệu là một lĩnh vực mới đợc đa ra trong những năm gần đây, tuy nhiên các ứng
dụng của nó trên thế giới đang đợc phát triển rất mạnh mẽ áp dụng vào mọi ngành và lĩnh vực
khác nhau. Trong khuôn khổ bài báo có hạn, chúng tôi chỉ đi sâu trình bày một số phơng pháp
cơ bản và đa ra một phơng pháp trộn ứng dụng quy tắc Dempster-Shafer. Tuy nhiên quá trình
trộn dữ liệu đa cảm biến là một vấn đề phức tạp đặc biệt là khi ta phải giải quyết các bài toán
yêu cầu cần nhiều loại cảm biến khác nhau. Các phơng pháp trộn dữ liệu đa cảm biến vẫn còn
là một hớng mở cho chúng ta tiếp tục nghiên cứu.

Tài liệu tham khảo
[1] Zou Y, Ho Y K, Chua C S. Zhou X W. Multi-untrasonic sensor fusion for autonomous mobile robots.
Proc SPIE 4051, 2000.
[2] Elaine Rich, Kenvin Knight. Artificial Intelligence, McGraw-Hill, Inc 1991
[3] G. W. Ng. Intelligent Systems Fusion, Tracking and Control, UMIST, 2004.
[4] CJ Harris, ZQ Wu. Inteligetn NeuroFuzzy Estimator & Multisensor Data Fusion, UK , 1999.
[5] David L Hall. An Introduction to Multisensor Data Fusion, Proc.1997 IEEE, 1997.
[6]
/>[7] Nguyễn Đình Cử. Giáo trình Lý thuyết xác suất và thống kê toán, Nhà xuất bản Thống kê, Hà nội,
1991Ă

Báo cáo khoa học: "áp dụng Lý thuyết Dempster-Shafer cho quá trình trộn dữ liệu đa cảm biến" potx

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về