Tải bản đầy đủ (.pptx) (79 trang)

Ứng dụng bayes entropy cho việc thiết kế không gian lấy mẫu môi trường

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (723.69 KB, 79 trang )

Ứng dụng bayes entropy cho việc thiết
kế không gian lấy mẫu môi trường
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM
KHOA MÔI TRƯỜNG VÀ TÀI NGUYÊN
Giảng viên hướng dẫn:
TS. Nguyên Văn Minh Mẫn
Nhóm 4:

Phạm Tuấn Quỳnh

Trương Anh Tuấn

Phạm Biên Vĩnh Tân
Nội dung
1. Giới thiệu chung
2. Dữ liệu.
3. Phương pháp xấp xỉ Bayes đầy đủ cho thiết kế
mạng
4. Lợi ích của thiết kế.
5. Tối ưu hóa vấn đề.
6. Tính không ổn định của việc mô hình hóa.
7. Áp dụng
8. Kết luận
Giới thiệu
Các cơ quan giám sát môi trường trên toàn thế
giới duy trì sự giám sát không khí quốc gia nhằm:

Đánh giá hiệu quả của các quá trình kiểm soát.

Xác định mức độ và xu hướng ô nhiễm không
khí.



Cung cấp nguyên liệu đầu vào chất lượng không
khí để phân tích đánh giá rủi ro và phân tích
nguồn gây nên.
Giới thiệu:

Có nhiều khó khăn trong việc duy trì các mạng
lưới giám sát môi trường. Giảm kích thước
mạng lưới mà vẫn duy trì đủ thông tin để đảm
bảo suy luận thống kê hợp lý về ôi nhiễm không
khí

Đề xuất một phương pháp mới để xếp hạng các
mạng lưới con khác nhau sử dụng một biện pháp
entropy của không gian thông tin và ưu tiên giám
sát các vùng có giá trị ôi nhiễm cao.
Giới thiệu:

Phương pháp này sử dụng ý tưởng từ các thông
tin và dữ liệu lý thuyết ngẫu nhiên theo công thức
Bayes.

Các công việc chính là giảm kích thước các mạng
lưới.
Các vấn đề thúc đẩy đề tài:

Cung cấp phương pháp thống kê đáng tin cậy để
giảm mạng lưới quan trắc hiện có.

Đánh giá xu hướng ô nhiễm không khí thông qua

ozon.
Năm 1997 theo tiêu chuẩn là < 0.08ppm, là giá
trị lớn nhất trong 17 giá trị được đo một ngày trong
mỗi khoảng thời gian liên tiếp 8h. Của mỗi 3 năm
Các vấn đề thúc đẩy đề tài:

Cung cấp phương pháp thống kê đáng tin cậy để
giảm mạng lưới quan trắc hiện có.

Bài báo này nghiên cứu những thiết kế để giảm
thiểu sử dụng “ giá trị thiết kế” từ 1997 đến 1999
cho 513 trạm quan trắc không khí tại các bang và
khắp miền đông nước mỹ.
Vị trí các trạm quan trắc:
Phương pháp xấp xỉ Bayes đầy đủ

Xem xét phân phối Gauss
{Z(x) : x D R2} ∈ ⊂

Với trung bình E[Z(x)] =µZ (x)

Phương sai của Z() phụ thuộc vào tham số θ,
cov[Z(x)Z(y)|θ] = Cθ (x, y).
Phương pháp xấp xỉ Bayes đầy đủ

Chúng ta đặt một phân phối sau vào θ,θ π( ). ∼

Quan sát quá trình tại các điểm x1, x2, , xm,
chúng ta có một vector của sự quan sát Z =
(Z(x1), Z(x2), Z(x3), . . . , Z(xm)).


Trong vấn đề của việc thiết kế mạng lưới môi
trường chúng ta phải chọn một tập hợp con {x1,
x2, , xm} có kích thước sao cho sự mất mát về
thông tin thống kê (ở đây là entropy) là nhỏ nhất.
Định nghĩa entropy

Nếu Y là biến cố, và f (y) là hàm mật độ ngẫm nhiên của Y, thì sự không chắc chắn về Y có thể được thể
hiện là entropy của phân phối của Y.

Nếu phân phối không trải rộng và điểm cao nhất gần Mode mode chỉ ra đâu là giá trị quan sát bị sai

Ngược lại phân phối có đỉnh thấp trải rộng thì phạm vi điểm quan sát sai có thể lớn.
Định nghĩa entropy

Với các phân phối có đồ thị lan rộng thì entropy càng
lớn trong 1 khoảng (a,b) thì phân phối đều có entropy
lớn nhất
VD:

Nếu Y N(µ, σ2), thì ∼
H(Y ) = 0.5(log(2π ) − 1) + log(σ )
entropy là một hàm tăng của phương sai

Nếu Y U[a, b], thì H(Y ) = log(b − a)∼
Hàm của entropy là một hàm tăng của chiều rộng của
khoảng
Phân phối tiên nghiệm

Xem xét một mạng lưới Bayes sau đây

Y f (y|θ ), θ π( ).∼ ∼
Chúng ta có biến ngẫu nhiên Y, mật độ của chúng được
cấp bởi một dạng tham số f (y|θ ),và π( ) là một phân phối
trước θ. Trong thiết lập Bayes, mật độ biên của Y tại điểm y
* là:
Phân phối tiên nghiệm

Tuy nhiên, sau khi có một sự quan sát của biến quan tâm
Y = y chúng ta chuyển π(θ ) thành π(θ|y) và có được phân
phối sau.

Vì vậy, sau khi quan sát giá trị thực của Y, nói y là mật độ
tiên nghiệm của Y tại một điểm y *, sau khi quan sát y,
được định nghĩa là:
Thiết kế mạng lưới phân phối Bayes đầy đủ

Chọn ra một mạng nhỏ tối ưu I của cỡ K<m thông qua
mạng lưới Bayes bằng cách xem xét tất cả các tập hợp
con của cỡ k của (x1, , xm).

Chúng tôi tính toán entropy của mật độ tiên nghiệm Si =
(Z (xi1), Z (xi2), , Z (xik)) và chọn mạng con với
entropy tiên nghiệm lớn nhất.

Nơi có sự không chắc chắn cao thường khó khăn khi dự
đoán được giữ lại.

Nơi với sự không chắc chắn nhỏ hơn được loại bỏ từ các
mạng con.
Thiết kế mạng lưới phân phối Bayes đầy đủ


Đặt gi() là mật độ tiên nghiệm của Si . Trong việc tính
toán entropy của gi(), chúng ta nên chỉ ra rằng nếu Si1,
Si2, , Sip là một mẫu từ gi(). Do đó
Thiết kế mạng lưới phân phối Bayes đầy đủ

Là một ước lượng entropy không thiên của gi (). Do đó,
nếu có thể tính toán giá trị của gi () cho một mạng cụ thể
Si j, và tạo ra một mẫu từ gi (), chúng ta có thể ước tính
giá trị entropy của gi ().

Mặc dù, không thể tính toán một cách rõ ràng giá trị của
gi () ,ta vẫn có thể ước tính giá trị của nó bằng cách sử
dụng phương pháp sau đây:

Đầu tiên, chúng ta tạo ra một mẫu θ1, , θk, từ phân bố tiên
nghiệm của θ.

Sau đó, mật độ tiên nghiệm có thể được ước tính là:
Thiết kế mạng lưới phân phối Bayes đầy đủ

Chúng ta ước lượng etropy tiên nghiệm là

Tuy nhiên, từ log(gˆi(Si j)) ≠ Log(gi(Si j)) ( bởi bất đẳng thức của
Jensen). Biểu thức ở trên có thể không bị lêch, do đó, từ

Gần như hội tụ hoàn toàn tới giá trị của mật độ tiên nghiệm tại So,
với k → ∞ ứng với mỗi S0, chúng ta sau đó có thể dự đoán tốt bằng
việc chọn K đủ lớn.
Lợi ích của thiết kế.


Với một thiết kế tiềm năng S, chúng tôi định nghĩa
một hàm ứng dụng U(S)

Giảm đi chi phí giám sát có

Thiết kế tối ưu bằng việc làm tối đa hỗn hợp mục
tiêu giám sát.
H(S) + γU(S),
ở đây γ là một ứng dụng của hệ số chuyển đổi
entropy .
Sự quan hệ ưu tiên giữa các thiết kế

Tìm cặp mục tiêu của giá trị entropy tiên nghiệm lớn nhất ,ưu tiên
với những nơi quan sát được ozon cao

Ích lợi của entropy tổ hợp cho một thiết kế S(H(S), UZ (S)) là một
điểm trong R2. Không có cách nào đạt được 2 mục đích đồng thời.
Bởi vậy,chúng tôi giới thiệu một mối quan hệ tương quan trong R2
để lựa chọn giữa 2 thiết kế.

Mục tiêu của chúng ta là lựa chọn một mạng con đặc trưng bởi cả
entropy cao và tiện ích cao. Nếu S1 và S2 là hai thiết kế, chúng
phải đáp ứng:
H(S1) > H(S2) và UZ (S1) > UZ (S2) lúc đó S1 >> S2.

Nếu entropy của một thiết kế cao hơn, nhưng tiện ích của nó thấp
hơn
H(S1) > H(S2) và UZ (S1) < UZ (S2).
Sự quan hệ ưu tiên giữa các thiết kế


Sau đó chúng tôi căn cứ quyết định của chúng tôi về mức tăng
tương đối so với sự mất mát dữ liệu ngẫu nhiên tương đối tiện ích,
nếu;
thì, S1 >> S2. Nếu đảo chiều bất đẳng thức ta có S1 << S2.

Khi tỷ lệ bằng nhau, chúng ta không quan tâm đến sự lựa chọn giữa
hai thiết kế và chúng ta xem xét hai thiết kế tương đương với nhau,
S1 S2,∼
và chúng ta chọn một thiết kế ngẫu nhiên.
TỐI ƯU HÓA VẤN ĐỀ
Tiêu chuẩn phát thảo dạng lưới mà có thể được dùng để định nghĩa
một mạng lưới phụ hữu ích hay sự phân chia mạng lưới ban đầu.
Nhưng việc tối ưu hóa các vấn đề thiết kế cho các mẫu có kích
thước lớn thì có tính mãnh liệt cực cao và đưa ra các vấn đề cực kỳ
nan giải, Nhiều nỗ lực trước đây đã áp dụng đơn thuần them vào
một lần, và các quy trình loại bỏ, thường dẫn tới các giải pháp
không chính xác.
Ko và cộng sự (1995) đã bàn luận một thuật toán chính xác cho
việc xác định các phát thảo về động lực học dựa trên việc ước
lượng đường biên trên và không liên kết với đường bao trong một
nhánh và phương pháp bù.
TỐI ƯU HÓA VẤN ĐỀ

SA là phương pháp phóng đại thực nghiệm được truyền thụ bằng
kỹ thuật làm mát một chất lỏng chậm đến giai đoạn năng lượng có
khả năng thấp nhất. Các giá trị khác nhau của một chức năng có
thể được xem xét các giá trị năng lượng có khả năng, và giá trị
tuyệt đối được phát hiện bằng cách sử dụng một nghiên cứu ngẫu
nhiên ở một cách thông minh.


Chỉ ra hàm f() là một hệ thức ta cần phóng đại. Để S = (s1,…, sk)
là điều kiện của các điểm khi nó ổn định trên một cực đại toàn cầu.
Mục tiêu của SA là xây dựng một chuỗi Markos không đồng nhất
mà hội tụ đến π∞(), một phân phối đồng biến với S.
TỐI ƯU HÓA VẤN ĐỀ
Thuật giải
Xem xét chuỗi số {Tn}, gọi một quy trình làm mát, hội tụ tại 0. Ta bắt
đầu với mạng phụ ban đầu Si1. Kế đến là bước tìm i.

Ta kiểm tra hệ động học và giá trị hiệu dụng của bản thảo ngẫu
nhiên gọi là Si2.

Nếu Si1 << Si2, ta cập nhật giá trị Si1 thành Si2.

Nếu Si1 >> Si2, ta cập nhận Si1 thành Si2 với xác suất
.
TỐI ƯU HÓA VẤN ĐỀ

Ban đầu, khi Tn lớn, xác suất một bước nhảy đến một điểm
thấp hơn thì cao hơn, nhưng khi Tn tiến tới 0 xác suất của bước
nhảy đến môt điểmthấp hơn trở nên nhỏ sau khi độ lặp lại đầy
đủ. Các lựa chọn đa dạng cho quy trình làm sạch đã được đề
nghị trong tài liệu, ta sử dụng ở đây quy trình làm làm sạch
bằng hình học, Tn=T0cn, cho c=0.8. Để tìm được mạng lưới
phụ ban đầu cho thuật toán SA, ta dùng hình học làm đầy không
gian tiếp cận bản phát thảo như đã được mô tả bởi Nychka và
Saltzman

×