Tải bản đầy đủ (.pdf) (68 trang)

(Luận văn thạc sĩ) nghiên cứu áp dụng phương pháp khoảng cách tần suất nhận dạng trong giải đoán địa chất số liệu địa vật lý hàng không luận văn ths 60 44 61

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.64 MB, 68 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
---------------------

Nguyễn Trí Tiến

NGHIÊN CỨU ÁP DỤNG PHƢƠNG PHÁP
KHOẢNG CÁCH – TẦN SUẤT – NHẬN DẠNG TRONG
GIẢI ĐOÁN ĐỊA CHẤT SỐ LIỆU ĐỊA VẬT LÝ HÀNG KHÔNG

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội – Năm 2012


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
--------------------Nguyễn Trí Tiến

NGHIÊN CỨU ÁP DỤNG PHƢƠNG PHÁP
KHOẢNG CÁCH – TẦN SUẤT – NHẬN DẠNG TRONG
GIẢI ĐOÁN ĐỊA CHẤT SỐ LIỆU ĐỊA VẬT LÝ HÀNG KHÔNG
Chuyên ngành: Địa vật lý.
Mã số: 60 44 61.

LUẬN VĂN THẠC SĨ KHOA HỌC

NGƢỜI HƢỚNG DẪN KHOA HỌC

PGS.TS Võ Thanh Quỳnh.


Hà Nội – Năm 2012


MỤC LỤC
MỞ ĐẦU

............................................................................................................ 4

Chƣơng 1 - CƠ SỞ LÝ THUYẾT NHẬN DẠNG TRONG XỬ LÝ SỐ LIỆU ĐỊA
VẬT LÝ

............................................................................................................ 7

1.1. Lý thuyết xử lý tổ hợp số liệu ......................................................................... 7
1.2. Mẫu và các đặc trƣng thông kê số liệu địa vật lý ............................................ 10
1.2.1.

Số liệu đo và mẫu ngẫu nhiên ............................................................ 10

1.2.2.

Hàm mật độ xác suất .......................................................................... 11

1.3. Các thuật toán nhận dạng ................................................................................ 13
1.3.1.

Mẫu chuẩn các đặc điểm đặc trƣng và sử dụng mẫu chuẩn trong ....

nhận dạng......................................................................................................... 14
1.3.2.


Các thuật tốn nhận dạng có mẫu chuẩn ............................................ 16

1.3.3.

Các thuật tốn nhận dạng khơng có mẫu chuẩn ................................. 21

1.3.4.

Quyết định sự tồn tại của đối tƣợng và đánh giá chất lƣợng xử lý ... 23

Chƣơng 2 - HOÀN THIỆN VÀ MỞ RỘNG PHẠM VI ÁP DỤNG PHƢƠNG
PHÁP KHOẢNG CÁCH -TẦN SUẤT - NHẬN DẠNG TRONG XỬ LÝ SỐ LIỆU
ĐỊA VẬT LÝ MÁY BAY. ...................................................................................... 24
2.1. Các phƣơng pháp phân tích tài liệu địa vật lý máy bay trong nƣớc và trên thế
giới

............................................................................................................ 24
2.1.1.

Các phƣơng pháp phân tích tài liệu địa vật lý máy bay trên thế giới. 24

2.1.2.

Các phƣơng pháp phân tích tài liệu dịa vật lý may bay ở Việt Nam 30

2.2. Hoàn thiện và mở rộng phạm vi áp dụng phƣơng pháp Khoảng cách-Tần suấtNhận dạng trong xử lý-phân tích số liệu địa vật lý .................................................. 31
2.2.1.

Nội dung Phƣơng pháp Khoảng cách-Tần suất-Nhận dạng hiện nay 32


2.2.2.

Hoàn thiện và mở rộng phạm vi áp dụng Phƣơng pháp Khoảng cách-

Tần suất-Nhận dạng ................................................................................................. 33


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

Chƣơng 3 - ÁP DỤNG PHƢƠNG PHÁP KHOẢNG CÁCH -TẦN SUẤT - NHẬN
DẠNG VÀO XỬ LÝ SỐ LIỆU ĐỊA VẬT LÝ HÀNG KHƠNG VÙNG ĐƠNG
TUY HỊA

............................................................................................................ 39

3.1. Lịch sử nghiên cứu địa chất – địa vật lý vùng đơng Tuy Hịa ........................ 39
3.1.1.

Lịch sử nghiên cứu Địa chất............................................................... 39

3.1.2.

Lịch sử nghiên cứu Địa vật lý ............................................................ 40

3.2. Đặc điểm địa chất và địa vật lý của vùng Đơng Tuy Hịa ............................... 42
3.2.1.


Đặc điểm địa lý, tự nhiên ................................................................... 42

3.2.2.

Đặc điểm địa chất ............................................................................... 44

3.2.3.

Đặc điểm địa vật lý............................................................................. 46

3.3. Kết quả áp dụng phƣơng pháp Khoảng cách-Tần suất-Nhận dạng vào phân
tích tài liệu thực tế vùng Đơng Tuy Hịa .................................................................. 47
KẾT LUẬN ............................................................................................................ 63
TÀI LIỆU THAM KHẢO ........................................................................................ 64

Luận văn thạc sĩ khoa học

1

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

MỤC LỤC HÌNH
Hình 3.1 – sơ đồ tuyến bay thực tế và dị thƣờng phổ gamma hàng khơng ............. 53
Hình 3.2 – bản đồ trƣờng từ vùng đơng Tuy Hịa .................................................... 54
Hình 3.3 – bản đồ cƣờng độ trƣờng từ delta T vùng đơng Tuy Hịa ....................... 55

Hình 3.4 – bản đồ hàm lƣợng Kali vùng đơng Tuy Hịa.......................................... 56
Hình 3.5 – bản đồ hàm lƣợng Thoiri vùng đơng Tuy Hịa ...................................... 57
Hình 3.6 – bản đồ cƣờng độ Gamma vùng đơng Tuy Hịa ...................................... 58
Hình 3.7 – bản đồ cƣờng độ Uran vùng đơng Tuy Hịa ........................................... 59
Hình 3.8 – sơ đồ phân bố cụm dị thƣờng vùng đơng Tuy Hịa ................................ 60
Hình 3.9 – sơ đồ phân bố cụm dị thƣờng và kết quả phân tích theo phƣơng pháp . 61
Hình 3.10 – sơ đồ dự báo triển vọng khống sản vùng đơng Tuy Hịa
khoảng cách – tần suất – nhận dạng vùng đơng Tuy Hịa........................................ 62
Bảng 3.1 - Kết quả phân tích theo phƣơng pháp Khoảng cách-Tần suất -Nhận dạng
và so sánh với kết quả kiểm tra mặt đất - Các cụm đối tƣợng mẫu: 38 và 55 ......... 50
Bảng 3.2: Kết quả phân tích theo phƣơng pháp khoảng cách –tần suất – nhận dạng
và so sánh với kết quả kiểm tra mặt đất - Đối tƣợng mẫu: 68 và 88 ....................... 51

Luận văn thạc sĩ khoa học

2

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

MỞ ĐẦU
Các phƣơng pháp nhận dạng đóng vai trị hết sức quan trọng trong xử lý, phân
tích tài liệu địa vật lý, đặc biệt là đối với các dạng số liệu có đặc tính phân bố ngẫu
nhiên nhƣ các số liệu địa hóa, các số liệu phổ gamma v.v…. Hiện nay trong địa vật
lý có rất nhiều thuật tốn nhận dạng hiện đại, đƣợc tự động hóa bằng các hệ phần
mềm mạnh chuyên dụng, đáng chú ý là bộ chƣơng trình phân tích phổ-thống kê do

Giáo sƣ, Viện sĩ Ni-Ki-Tin cùng các đồng sự đề xuất, xây dựng. Tuy nhiên trên
thực tế khối lƣợng tài liệu cũng nhƣ số lƣợng các chủng loại thông tin thu đƣợc trên
các đối tƣợng địa chất ngày càng rất lớn. Trong khi đó số lƣợng các tham số đầu
vào của các chƣơng trình phân tích nhận dạng hiện có thƣờng bị giới hạn. Việc sử
dụng các tổ hợp thông tin khác nhau để tiến hành phân tích nhận dạng nhiều khi cho
những kết quả rất khác nhau. Để nâng cao độ tin cậy của các phƣơng pháp phân tích
nhận dạng đã có những cơng trình nghiên cứu theo hƣớng ứng dụng lớp bài toán
đánh giá lựa chọn thông tin để lựa chọn những tổ hợp thông tin chất lƣợng cao
trƣớc khi tiến hành phân tích nhận dạng. Cũng từ đó đề xuất những cách tiếp cận
mới giải quyết bài toán nhận dạng trong xử lý số liệu địa vật lý và thu đƣợc kết quả
tốt. Mặc dù vậy trong các phƣơng pháp phân tích đối sánh cũng nhƣ đánh giá lựa
chọn thơng tin có ứng dụng thuật tốn phân tích tần suất nói trên chỉ tiến hành trên
một loại đối tƣợng mẫu, đó là các đối tƣợng cần tìm. Do vậy với thuật tốn nhận
dạng tần suất trong một số trƣờng hợp sẽ gặp hạn chế. Thực tế có những chủng loại
thơng tin khi đánh giá trên đối tƣợng mẫu là tin cậy nhƣng đặc trƣng của nó lại
tƣơng tự nhƣ trên các đối tƣợng đối nghịch với đối tƣợng mẫu, khi đó việc sử dụng
các thơng tin này để phân tích đối sánh, xác định đối tƣợng đồng dạng dễ bị nhầm
lẫn giảm độ tin cậy. Trong khi đó trên thực tế trong nhiều trƣờng hợp, ta có đƣợc
Luận văn thạc sĩ khoa học

3

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

đồng thời 2 loại đối tƣợng mẫu đối nghịch nhau là đối tƣợng cần tìm và đối tƣợng

đối nghịch với nó (ví dụ các đối tƣợng quặng và không quặng). Rõ ràng trong
trƣờng hợp này cần có các thuật tốn nhận dạng mới sao cho việc đánh giá lựa chọn
tổ hợp thông tin đƣợc tiến hành đồng thời trên cả 2 loại đối tƣợng mẫu, để từ đó tiến
hành phân tích đối sánh, nhận biết, phân biệt đối tƣợng sẽ cho kết quả tin cậy hơn.
Theo hƣớng này các nhà địa vật lý Việt Nam đã nghiên cứu vận dụng kết hợp
phƣơng pháp phân tích khoảng cách khái qt theo thuật tốn của Pagnơp và
phƣơng pháp phân tích tần suất theo thuật tốn Griffiths-Vinni trong đánh giá lựa
chọn thơng tin cũng nhƣ trong phân tích đối sánh xác định đối tƣợng đồng dạng. Từ
đó xây dựng thành một phƣơng pháp phân tích nhận dạng mới với tên gọi “Phƣơng
pháp Khoảng cách-Tần suất-Nhận dạng”. Những phân tích thử nghiệm trên các tài
liệu thực tế bằng phƣơng pháp phân tích nhận dạng mới nói trên đã cho kết quả tốt.
Tuy nhiên trƣớc đây phƣơng pháp Khoảng cách-Tần suất-Nhận dạng vẫn còn tồn tại
một số hạn chế, cần đƣợc nghiên cứu khắc phục. Đó là: Phƣơng pháp Khoảng cáchTần suất-Nhận dạng hiện mới chỉ đƣa ra đƣợc thuật tốn phân tích đối sánh, xác
định mức độ đồng dạng của đối tƣợng đối sánh so với đối tƣợng mẫu, làm cơ sở cho
việc đánh giá, dự báo mức độ triển vọng của chúng, khi đối tƣợng đối sánh đã biết;
chƣa giải quyết đƣợc nhiệm vụ tìm kiếm, phát hiện, khoanh định ranh giới các đối
tƣợng đồng dạng cũng nhƣ mức độ đồng dạng của chúng khi chƣa biết trƣớc các đối
tƣợng đối sánh; một nội dung quan trọng đối với các phƣơng pháp phân tích nhận
dạng nói chung. Phƣơng pháp này cũng mới áp dụng có hiệu quả đối với tài liệu dị
thƣờng phổ gamma hàng không mà chƣa đƣợc mở rộng cho các dạng tài liệu địa vật
lý khác, kể cả tài liệu từ hàng không. Hiện nay phƣơng pháp Khoảng cách-Tần suấtNhận dạng đã đƣợc các tác giả: Nguyễn Xuân Bình, Nguyễn Đức Vinh, Võ Thanh
Quỳnh và nnk nghiên cứu hoàn thiện, khắc phục những hạn chế đã nêu và mở rộng
hơn nữa phạm vi áp dụng của phƣơng pháp. Luận Văn này trình bày nội dung của
phƣơng pháp đã đƣợc hoàn thiện, bằng việc mở rộng thuật toán cho cả trƣờng hợp
biết trƣớc đối tƣợng đối sánh và trƣờng hợp chƣa biết trƣớc đối tƣợng đối sánh,
cùng với phần mềm xử lí trên máy tính tƣơng ứng. Tiến hành áp dụng phân tích thử
nghiệm đối với tài liệu địa vật lý hàng không (bao gồm cả tài liệu từ và tài liệu phổ
Luận văn thạc sĩ khoa học

4


Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

gamma), góp phần làm rõ ý nghĩa khoa học cũng nhƣ khả năng áp dụng thực tế của
phƣơng pháp vừa mới đƣợc hồn thiện, đồng thời góp phần làm sáng tỏ đặc điểm
địa chất và triển vọng khống sản vùng Đơng Tuy Hịa.

Luận văn gồm các nội dung chính :
- Mở đầu.
- Chƣơng 1 - Cơ sở ly thuyết nhận dạng trong xử lý số liệu địa vật lý.
- Chƣơng 2 - Hoàn thiện và mở rộng phạm vi áp dụng phƣơng pháp khoảng
cách - tần xuất - nhận dạng trong xử lý số liệu địa vật lý máy bay.
- Chƣơng 3 - Áp dụng phƣơng pháp khoảng cách – tần suất – nhận dạng vào
xử lý số liệu địa vật lý hàng khơng vùng đơng Tuy Hịa
- Kết luận.
Luận văn là kết quả thực hiện chƣơng trình cao học tại Khoa địa chất – trƣờng
Đại học Khoa Học Tự Nhiên – ĐHQGHN dƣới sự hƣớng dẫn của PGS.TS Võ
Thanh Quỳnh – trƣờng Đại học Khoa Học Tự Nhiên – ĐHQGHN.

Luận văn thạc sĩ khoa học

5

Nguyễn Trí Tiến



Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

Chƣơng 1 - CƠ SỞ LÝ THUYẾT NHẬN DẠNG TRONG XỬ LÝ SỐ LIỆU
ĐỊA VẬT LÝ
Khác với các lĩnh vực nghiên cứu trực tiếp đối tƣợng địa chất, địa vật lý
nghiên cứu gián tiếp các đối tƣợng dựa vào các đặc điểm trƣờng vật lý của chúng.
Từ số liệu khảo sát trƣờng địa vật lý, mục tiêu cuối cùng của công tác thăm dị địa
vật lý là đƣa ra đƣợc các thơng tin của để phục vụ cho các mục tiêu khác nhau. Để
thực hiện nhiệm vụ này có nhiều phƣơng pháp, trong đó lý thuyết nhận dạng – lĩnh
vực tốn học giải quyết các bài toán phân loại đối tƣợng là một phƣơng án đƣợc lựa
chọn nhiều hiện nay trong địa vật lý.
1.1.

Lý thuyết xử lý tổ hợp số liệu

Mỗi loại số liệu cụ thể thƣờng chỉ phản ánh một số đặc trƣng nào đó của đối
tƣợng vì vậy khi sử dụng đó để đƣa ra kết luận về đối tƣợng sẽ cho kết quả kém tin
cậy do nhiều nguyên nhân chƣa kể tới các sai số mắc phải khi thu thập và chỉnh lý
số liệu. Để nâng cao chất lƣợng xử lý thông tin và đáp ứng nhu cầu thực tế, hiện nay
ngƣời ta áp dụng phổ biến là các phƣơng pháp xử lý tổ hợp dữ liệu. Xử lý tổ hợp dữ
liệu về cơ bản là dựa trên nhiều loại thông tin khác nhau để quyết được các nhiệm
vụ đặt ra phù hợp với điều kiện kinh tế và kỹ thuật cho phép. Không chỉ trong địa
vật lý mà nhiều lĩnh vực khác cũng sử dụng xử lý tổ hợp số liệu để nâng cao chất
lƣợng của kết quả xử lý.
Khảo sát và thu thập thông tin về đối tƣợng phải đáp ứng đƣợc các yêu cầu
thực tế đặt ra nhƣ sau:


Luận văn thạc sĩ khoa học

6

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên



Khoa Địa Chất

Thông tin phải đảm bảo về số lƣợng và chất lƣợng để đạt đƣợc mục

tiêu và xử lý với độ chính xác chấp nhận đƣợc.


Thời gian thu thập thông tin phải phù hợp với tiến độ yêu cầu.



Khảo sát, thu thập thông tin phải đạt đƣợc hiệu quả kinh tế.

Từ các yêu cầu này mà đôi khi các phƣơng án khảo sát loại số liệu có độ tin
cậy cao hơn khơng đƣợc lựa chọn mà thay vào đó ngƣời ta sử dụng một loại thông
tin khác mà khi sử dụng tổ hợp các thơng tin này cũng có khả năng đáp ứng đƣợc
các yêu cầu, mục tiêu đề ra. Ví dụ nhƣ thay vì dùng số liệu địa chấn có giá thành
khảo sát cao thì có thể sử dụng tổ hợp khảo sát trọng lực và số liệu điện trở suất để
tìm kiếm các hang động karst.

Mặt khác, hiện nay các tổ hợp phƣơng pháp địa vật lý đang ngày càng đƣợc áp
dụng rộng rãi do những đặc trƣng về kỹ thuật nhƣ tổ hợp địa vật lý biển, tổ hợp địa
vật lý hàng không…. Các tổ hợp phƣơng pháp này với các phƣơng pháp ghi đo tự
động sẽ cung cấp một khối lƣợng dữ liệu rất lớn bao gồm nhiều chủng loại thơng
tin.
Ngồi dữ liệu khảo sát trực tiếp, hiện nay với số lƣợng thơng tin lƣu trữ ngày
càng tăng thì việc sử dụng kết hợp các dữ liệu có sẵn này với các thông tin khảo sát
là một nhu cầu để nâng cao độ tin cậy cho kết quả xử lý.
Mỗi loại thông tin chỉ mang những đặc trƣng nhất định của đối tƣợng và để
hoàn thành đƣợc nhiệm vụ đặt ra trong nhiều trƣờng hợp ngƣời ta buộc phải sử
dụng tổ hợp các thông tin khác nhau.
Bản thân mỗi loại số liệu khảo sát đều mang những sai số, chúng đi kèm với
số liệu và nhiều lúc gây ra những sai lầm khi xử lý. Những sai số này do nhiều
nguyên nhân khác nhau nhƣ: Sai số đo ghi của máy, sai số do kỹ thuật và phƣơng
pháp đo ghi, sai số do ảnh hƣởng của các đối tƣợng khác…trong số liệu địa vật lý
những sai số mắc phải làm giảm độ tin cậy của thông tin đƣợc loại bỏ trong các
Luận văn thạc sĩ khoa học

7

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

bƣớc xử lý số liệu nhƣng rất khó để tách hồn tồn đƣợc chúng ra khỏi số liệu. Đặc
biệt là các nhiễu do nguồn gốc địa chất, chúng làm sai lệch mạnh các tín hiệu có ích
và đối khi khơng loại bỏ đƣợc do không đủ thông tin. Những sai số này làm giảm

đáng kể độ tin cậy của thông tin, đặc biệt trong trƣờng hợp loại thơng tin đó đƣợc
coi là loại tính quan trọng đặc trƣng cho đối tƣợng đang cần nghiên cứu. Một
nguyên nhân khác dẫn tới độ giảm tin cậy của một loại thơng tin là tính đa trị của
kết quả xử lý. Điều này gây nhiều khó khăn và sai lầm trong xử lý. Để xác định đơn
trị đối tƣợng cần sử dụng kết hợp nhiều loại thông tin khác nhau một cách phù hợp.
Từ các nguyên nhân trên các phƣơng pháp xử lý tổ hợp số liệu đã và dang
đƣợc áp dụng phổ biến trong nhiều lĩnh vực và mang lại kết quả cao.
Lựa chọn tổ hợp số liệu:
Trong bất kỳ bài toán nhận dạng nào thì số lƣợng và chất lƣợng các tính chất
(loại thơng tin) dùng để nhận dạng luôn đƣợc quan tâm hàng đầu. Mỗi tổ hợp thông
tin khác nhau thƣờng cho kết luận khác nhau về đối tƣợng. Để đạt đƣợc kết quả
đáng tin cậy nhất thì trong quá trình xử lý số liệu cần lựa chọn đƣợc tổ hợp thơng
tin có độ tin cậy cao và hợp lý.
Chất lƣợng của thông tin tốt hay không phụ thuộc vào loại thông tin đó có đặc
trƣng cho đối tƣợng (khả năng phân biệt đối tƣợng với mơi trƣờng xung quanh) hay
khơng. Tính đặc trƣng cho đối tƣợng của một loại số liệu địa vật lý do nhiều nguyên
nhân quyết định. Một tính chất là đặc trƣng cho đối tƣợng khi độ chênh lệch giá trị
của số liệu của tính chất đó giữa đối tƣợng nghiên cứu với môi trƣờng xung quanh
đủ lớn. Trong trƣờng hợp đối tƣơng nằm quá sâu, kích thƣớc quá nhỏ, hoặc do ảnh
hƣởng của đối tƣợng khác (phong hóa, biến chất, chất lƣu…) dẫn tới độ chênh lệch
của giá trị không đủ để phân biệt đối tƣợng với môi trƣờng xung quanh khi đó
thơng tin có ích cho xử lý số liệu. Các sai số không tách đƣợc sẽ gây ra sai lệch về
số liệu khi đó thơng tin khơng cịn mang tính đặc trƣng cho đối tƣợng.

Luận văn thạc sĩ khoa học

8

Nguyễn Trí Tiến



Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

Một tổ hợp thông tin không đầy đủ sẽ không đáp ứng đƣợc yêu cầu, nhiệm vụ
đặt ra cho quá trình xử lý. Việc chọn số lƣợng các loại thông tin phải đảm bảo đƣợc
tính đơn trị cho kết quả và đƣa ra đƣợc đầy đủ các yêu cầu nghiên cứu về đối tƣợng.
Việc sử dụng đồng thời nhiều loại thông tin trong đó có những thơng tin có độ
tin cậy thấp khơng những gây khó khăn cho q trình xử lý, chất lƣợng xử lý không
cao, do các thông tin thiếu tin cậy sẽ làm nhịe đi các thơng tin quan trọng khác dẫn
đến những nhận thức sai lệch về đối tƣợng.
Việc lựa chọn đƣợc một tổ hợp thơng tin có chất lƣợng cao là nội dung khó
khăn và phụ thuộc nhiều vào hiểu biết, kinh nghiệm của ngƣời xử lý.
1.2.

Mẫu và các đặc trƣng thông kê số liệu địa vật lý

1.2.1.

Số liệu đo và mẫu ngẫu nhiên

Vì các thiết bị quan sát trƣờng trong trƣờng đại vật lý đều là thiết bị số nên các
kết quả quan sát trƣờng là những con số. Ở một điểm quan sat bất kì, kết quả quan
sát trƣờng địa vật lý hoặc đại lƣợng khác lại chứa nhiễu và sai số đo nên có thể là
đại lƣợng này hay đại lƣợng khác mà ngƣời đo khơng dự đốn trƣớc đƣợc. Vì vậy
để mơ tả các giá trị (bằng số) các trƣờng địa vật lý đo đƣợc ngƣời ta sử dụng khái
niệm đại lƣợng ngẫu nhiên.
Các giá trị trƣờng đại vật lý đo đƣợc là các số cụ thể nên đại lƣợng ngẫu niên
là mô tả nền tảng để mô tả các số liệu đại vật lý

Đại lƣợng X đƣợc gọi là đại lƣợng ngẫu nhiên nếu trong mỗi phép đo sẽ xuất
hiện một trong những giá trị cụ thể x1, x2, x3,…của đại lƣợng náy với xác xuất tƣơng
ứng p1, p2, p3…
Tất cả cá giá trị có thể của X sẽ tạo thành nhóm đầy đủ vì bao giờ trong kết
quả của một phép đo cúng sẽ xuất hiện một giá trị xi nào đó (biểu hiện nào đó của
X); nghĩa là bao giờ cúng tồn tại đẳng thức:
Luận văn thạc sĩ khoa học

9

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

=1

(1.1)

Để mô tả các đại lƣợng ngẫu nhiên, ngƣời ta sử dụng cơng cụ tốn học xác
suất thơng qua hàm phân bố xác suất và các đặc trƣng thống kê.
1.2.2.

Hàm mật độ xác suất

Hàm mật độ xác suất f(x) là một hàm mô tả xác suất xuất hiện các giá trị cụ
thể của đại lƣợng ngẫu nhiên x
Hàm mật độ xác suất có các tính chất sau:

(1.2)

(1.3)

P(x1
(1.4)

Với P(x1 F(x1)=

(1.5)

Với F(x) là hàm phân hàm bố của X; hàm mô tả xác suất để đại lƣợng ngẫu
nhiên X nhận các giá trị nhỏ hơn giá trị xi nào đó.
Đồ thị của hàm phân bố mật độ xác suất thực nghiệm đƣợc dựng lên từ số liệu
khảo sát thực tế đƣợc gọi là đường cong biến phân.

Luận văn thạc sĩ khoa học

10

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

Ngoài hàm phân bố F(x) và hàm mật độ f(x) ngƣời ta cịn dung các đặc trƣng

thống kê để mơ tả các đại lƣợng ngẫu nhiên bao gồm:


Kỳ vọng toán M[x]= =



Mod (M0) là giá trị mà tại đó hàm mật độ phân bố max



Median (Me) là giá trị của X có xác suất P(x) =



Phƣơng sai: D[x]= M[x- [Mx]]2 =



Độ lệch trung bình bình phƣơng

xi

(1.6)

– M[x])2 pi
=

(1.7)
(1.8)


Một số hàm phân phối lý thuyết
Đế mô tả các đại lƣợng ngẫu nhiên trong vật lý ngƣời ta sử dụng các hàm phân
phối lý thuyết nhƣ hàm phân phối chuẩn (phân phối Gauxơ), phân phối chuẩn loga,
phân phối Puasson…
Phần lớn các đại lƣợng ngẫu nhiên trong địa vật lý cũng nhƣ hiện tƣợng địa
chất khác chúng tuân theo luật phân phối chuẩn
Đại lƣợng ngẫu nhiên X tuân theo luật phân phối chuẩn nếu hàm mật độ của
nó có dạng:

f(x) =

(1.9)

trong đó:

Kỳ vọng:

Phƣơng sai:

=

(1.10)

= E(X – EX)2

Luận văn thạc sĩ khoa học

(1.11)


11

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

Đồ thị hàm phân phối chuẩn đối xứng qua đƣờng thẳng x= và giảm dần
xuống xung quanh kỳ vọng.
Diện tích giới hạn bởi đƣờng cong và trục hồnh bằng 1 đó chính là xác xuất
để đại lƣợng ngẫu nhiên X nhân giá trị cong khoảng ( -

;+

) (1.3). Xác xuất để

đại lƣợng ngẫu nhiên X nhận giá trị trong khoảng từ x1 tới x2 chính là phần diện tích
đƣợc bao bởi đƣờng cong, trục hoành và hai đƣờng thẳng x = x1; x = x2. Xác xuất
đó đƣợc tính theo cơng thức (1.4).
Nhiều giá trị trƣờng địa vật lý nhƣ mật độ, tốc độ truyền sóng, phóng xạ…
tuân theo luật phân phối chuẩn và dựa trên các thuật toán thống kê theo luật phân
phối chuẩn ngƣời ta có thể xử lý số liệu để tìm ra các đặc trƣng của đối tƣợng
Ngồi luật phân phối chuẩn cịn có các luật phân phối khác đang đƣợc áp dụng
phổ biến trong phân tích thống kê các số liệu địa vật lý. Ví dụ nhƣ luật phân phối
chuẩn loga đƣợc dùng để mô tả các giá trị điện trở, độ từ cảm của đất đá.
1.3.

Các thuật tốn nhận dạng


Nhiệm vụ cơ bản nhất của cơng tác xử lý tổ hợp số liệu địa vậy lý là phân loại
đƣợc các điểm quan sát thành các diện tích nhất định hay các nhóm, lớp diện tích
nhất định, ở đó các đặc trƣng của trƣờng địa vật lý giống với các đặc trƣng của
trƣờng liên quan với loại (lớp) đối tƣợng địa chất nhất định. Để giải quyết đƣợc
nhiệm vụ trên tƣơng tự nhiều lĩnh vực khoa học khác ngƣời ta sử dụng lý thuyết
nhận dạng - một lĩnh vực toán học đi sâu vào giải quyết các bài toán phân loại đối
tƣợng dựa vào mối quan hệ hữu cơ giữa các đối tƣợng cụ thể và các dấu hiệu đặc
trƣng cho đối tƣợng đó.
Hiện nay, trong địa vật lý ngƣời ta sử dụng rất nhiều phƣơng pháp nhận dạng
hiện đại, đƣợc tự động hóa bằng các phần mềm mạnh. Tuy nhiên,có thể chia chúng
thành hai nhóm: có phƣơng pháp nhận dạng theo đối tƣợng chuẩn (có thơng tin tiên

Luận văn thạc sĩ khoa học

12

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

nhiệm) và nhóm có phƣơng pháp nhận dạng khơng có đối tƣợng chuẩn (khơng có
thơng tin tiên nghiệm.
1.3.1.

Mẫu chuẩn các đặc điểm đặc trƣng và sử dụng mẫu chuẩn trong


nhận dạng
Để xử lý tổ hợp các số liệu bằng phƣơng pháp nhận dạng có mẫu chuẩn thì
cơng việc quan trọng mang tính quyết định là lựa chọn các mẫu chuẩn và xác định
các đặc trƣng thống kê các trƣờng địa vật lý của chúng.
Các mẫu hay đối tƣợng chuẩn là phần diện tích ở đó bằng các số liệu khoan và
các số liệu địa chất khác đã xác định đƣợc bản chất địa chất của từng đối tƣợng gây
ra trƣờng địa vật lý. Tùy thuộc vào các mục đích nghiên cứu khác nhau mà các đối
tƣợng chuẩn đƣợc lựa chọn khác nhau. Ví dụ nhƣ mục đích nghiên cứu là tìm kiếm
khống sản thì đối tƣợng chuẩn có thể là một vùng quặng,một trƣờng quặng, một
mỏ quặng hay một vỉa quặng. Còn khi khảo sát địa vật lý phục vụ công tác đo vẽ
bản đồ địa chất thì các đối tƣợng mẫu có thể là diện tích phát triển một loại đá nào
đó.
Tùy theo bản chất, đối tƣợng chuẩn có hai loại là đối tƣợng chuẩn mang các
thông tin đại diện và đối tƣợng chuẩn mang thông tin phủ nhận. Đối tƣợng đại diện
mang các thơng tin có khả năng phân loại một hay một lớp đối tƣợng. Trong nhiều
trƣờng hợp có những đối tƣợng khác nhau nhƣng mang các đặc điểm trƣờng địa vật
lý tƣơng đồng. Khi đó ngƣời ta sử dụng đối tƣợng chuẩn mang thông tin phủ nhận
để loại bỏ những đối tƣợng không đúng ra khỏi tập kết quả nhận dạng. Cần lƣu ý để
cơng tác phân tích nhận dạng đạt hiệu quả tốt thì cần lựa chọn đối tƣợng chuẩn sao
cho các diện tích tồn tại các đối tƣợng chuẩn phải nằm xen kẽ với các phần diện tích
khảo sát cần nhận dạng.
Một đối tƣợng chuẩn nào đó có phạm vi ứng dụng là giới hạn và nó phụ thuộc
vào các yếu tố sau:

Luận văn thạc sĩ khoa học

13

Nguyễn Trí Tiến



Trường đại học Khoa Học Tự Nhiên



Khoa Địa Chất

Đối tƣợng chuẩn phải có giá trị thơng tin tin cậy theo mục tiêu tìm

kiếm.


Đối tƣợng chuẩn phải phù hợp với diện tích nghiên cứu.



Mật độ lƣới khảo sát các loại thơng tin phải tƣơng ứng với đối tƣợng

chuẩn lựa chọn
Đối tƣợng mang các dấu hiệu nhận biết, phân biệt nó với mơi trƣờng xung
quanh, các dấu hiệu có khả năng phân biệt cao trong các loại thông tin thu thập sẽ
giúp quá trình xử lý số liệu cho kết tin cậy. Để đánh giá chất lƣợng của dấu hiệu
ngƣời ta sở dụng khái niệm lƣợng tin của dấu hiệu. Lƣợng tin của dấu hiệu là khả
năng mà dấu hiệu đó có khả năng phân biệt đƣợc các đối tƣợng khác nhau với nhau.
Khả năng này phụ thuộc vào việc các đối tƣợng của cùng một lớp có thƣờng xuyên
cho những giá trị cố định của nó hay khơng và các giá trị đó có phân bố rộng ra
ngồi giới hạn của các đối tƣợng của lớp đó hay khơng.
Trong q trình nhận dạng không phải mọi dấu hiệu trƣờng đều quan trọng
nhƣ nhau, thậm chí có những dấu hiệu trƣờng địa vật lý hồn tồn khơng chứa
thơng tin về đối tƣợng khảo sát và có thê là những dấu hiệu nhiễu làm mờ nhạt đi

các thơng tin hữu ích. Khi đƣa ra dấu hiệu này váo sử dụng để nhận dạng không làm
tăng mà ngƣợc lại làm giảm chất lƣợng nhận dạng đối tƣợng. Chính vì vậy, trong
q trình xử lý cần tiến hành đánh giá lƣợng tin của từng dấu hiệu để từ đó chọn ra
những dấu hiệu có lƣợng tin đƣa vào xử lý và loại bỏ những dấu hiệu có lƣợng tin
thấp.
Dựa vào các giá trị trƣờng quan sát đƣợc trên các đối tƣợng chuẩn ngƣời ta
tiến hành xác định các đặc trƣng thống kê của trƣờng cho từng đối tƣợng. Các đặc
trƣng này đƣợc sử dụng tùy thuộc vào thuật toán nhận dạng áp dụng. Thƣờng các
đặc trƣng bao gồm:


Đƣờng cong biến phân (hàm phân bố mật độ xác suất thực nghiệm).

Luận văn thạc sĩ khoa học

14

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên



Khoa Địa Chất

Kỳ vọng và phƣơng sai của trƣờng (tính thơng qua đƣờng cong biến

phân).
Ngồi ra khi cần ngƣời ta tính cả hệ số tƣơng quan giữa các dấu hiệu, phƣơng

chủ đạo của dị thƣờng…
1.3.2.

Các thuật tốn nhận dạng có mẫu chuẩn

Các thuật tốn nhận dạng có mẫu chuẩn là các thuật tốn tiến hành xác định
bản chất địa chất của các đối tƣợng dựa vào việc so sánh tập hợp các dấu hiệu địa
vật lý của đối tƣợng nghiên cứu.
Việc lựa chọn thuật toán nhận dạng tùy thuộc vào các điều kiện sau:


Số liệu xuất phát



Tồn tại thông tin tiên nghiệm về đối tƣợng.



Nhiệm vụ cụ thể của công tác địa vật lý.

Các thuật toán nhận dạng đƣợc xây dựng dựa vào các cơng thức tốn khác
nhau nhƣ: tốn logic, các hàm hồi quy và lý thuyết định nghiệm thống kê…dƣới
đây là một số thuật tốn điển hình.
a. Phương pháp nhận dạng sử dụng toán logic
Trong các thuật toán logic, để nhận dạng đối tƣợng hoặc là ngƣời ta tính lƣợng
tin tổng, hoặc là xác định khoảng cách tổng.
Từ đối tƣợng chuẩn tìm đƣợc các dấu hiệu đặc trƣng và ngƣời ta tiến hành mã
hóa các dấu hiệu trƣờng bằng mã nhị phân gồm tập hợp số “0” và “1”.
Nếu xkn là giá trị trƣờng của dấu hiệu thứ n của mẫu thứ k thì :

- xkn =0 khi mẫu k khơng chứa dấu hiệu thứ n.

Luận văn thạc sĩ khoa học

15

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

- xkn =1 khi mẫu k chứa dấu hiệu thứ n.
Bằng cách trên tồn bộ mẫu trên đƣợc mã hóa.
Tiếp theo, dựa vào tổ hợp số “0” và “1” (từ thông tin ) xác lập trên các mẫu
chuẩn ngƣời ta xác định các từ thông tin chuẩn cho từng lớp đối tƣợng. Từ thông tin
chuẩn cho một lớp (đối tƣợng) là từ thông tin gặp p lần ở các đối tƣợng chuẩn của
lớp đó và khơng gặp lần nào các đối tƣợng chuẩn thuộc lớp là chọn khoảng giá trị
thông tin chuẩn. Các thông tin này đƣợc gọi là tổ hợp dấu hiệu phức hợp đặc trƣng
cho các đối tƣợng chuẩn của cùng một lớp thì tổ hợp dấu hiệu nào đặc trƣng cho số
lƣợng mẫu chuẩn lớn hơn, tổ hợp dấu hiệu đó sẽ có lƣợng tin lớn hơn.
Cuối cùng là nhận dạng đối tƣợng nghiên cứu. Ở bƣớc này ngƣời ta tiến hành
kiểm tra xem có bao nhiêu tổ hợp dấu hiệu phức hợp của từng lớp gặp ở đối tƣợng
nghiên cứu. Nếu số lần gặp các tổ hợp dấu hiệu phức hợp của một lớp nào đó nhiều
hơn số lần gặp các tổ hợp phức hợp khác thì đối tƣợng nghiên cứu đƣợc xếp vào
lớp đó. Q trình này đƣợc tiến hành cho tới khi đối tƣợng cuối cùng đƣợc nhận
dạng.
b. Phương pháp nhận dạng sử dụng phân tích hồi quy
Trong xử lý số liệu địa vật lý, thuật toán hồi quy đầu tiên đƣợc sử dụng để xử

lý số liệu đo địa vật lý giếng khoan và phân tích định lƣợng các tài liệu trọng lực.
Thực chất của phƣơng pháp này là xây dựng các hàm hồi quy xác định mối quan hệ
giữa các tham số địa chất cần tìm với các số liệu địa vật lý quan sát đƣợc bằng các
phƣơng pháp khác nhau. Ví dụ mối quan hệ giữa một bên là độ rỗng của đất đá với
bên kia là các số liệu đo điện trở, điện trƣờng tự nhiên, gamma…dọc thành giếng
khoan.
Thƣờng quá trình xấp xỉ các hàm hồi quy giới hạn bởi các đa thức bậc 1, bậc 2
hoặc đặc biệt có thể xấp xỉ với đa thức bậc lớn hơn. Ví dụ: nếu chỉ có hai dấu hiệu 1
và 2 thì hàm hồi quy đƣợc xấp xỉ bằng đa thức bậc 2 có dạng:
Luận văn thạc sĩ khoa học

16

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

yk = akxik + bkx2x +ckx1kx2k + dk

+ gk

+ hk

(1.12)

Các hệ số ak , bk , ck ,dk , gk và hk trong biểu thức (1.12) đƣợc xác định bằng
phƣơng pháp bình phƣơng tối thiểu theo các giá trị địa chất của tham số yk xác định

đƣợc trên các đối tƣợng chuẩn và các số liệu đo trƣờng địa vật lý của các dấu hiệu
x1k và x2k của chính đối tƣợng đó.
Phƣơng trình hồi quy trên đƣợc xác định cho từng đối tƣợng chuẩn thứ k.
Ngoài phƣơng pháp hồi quy ngƣời ta còn tiến hành xác định giá trị ngƣỡng yk cho
từng lớp đối tƣợng chuẩn. Cuối cùng đƣa các giá trị trƣờng đo đƣợc trên các đối
tƣợng cần nghiên cứu vào các phƣơng trình hồi quy tìm đƣợc trên đối tƣợng chuẩn
ta sẽ xác định đƣợc giá trị của tham số yk của đối tƣợng nghiên cứu.
Thuật tốn phân tích hồi quy có ƣu điểm là dễ dàng đƣa vào xử lý bổ sung các
số liệu của dấu hiệu mới bằng cách đƣa thêm vào phƣơng trình của hàm hồi quy các
số hạng mới. Vì vậy, thuật tốn này rất phù hợp cho việc xử lý các số liệu của tổ
hợp khảo sát gồm nhiều dấu hiệu khác nhau.
Tuy nhiên, thuật tốn hồi quy cũng có nhƣợc điểm ở chỗ với một tập hợp số
liệu nhất định ứng với một giá trị sai số cho trƣớc có thể xấp xỉ đƣợc nhiều hàm hồi
quy. Nhƣợc điểm này thể hiện rõ nhất khi các dấu hiệu quan sát trƣờng liên quan
với nhau. Lý do trên không cho phép đƣa ra đƣợc các lý giải về ý nghĩa vật lý của
các hệ số của hàm hồi quy tìm đƣợc. Các lý giải vật lý chỉ có thể đƣợc đƣa ra khi
dạng của phƣơng trình này đƣợc xác định cho một mơ hình vật lý cụ thể, cịn q
trình xấp xỉ hồi quy chỉ đƣợc tiến hành đơn thuần với mục đích xác định hệ số của
phƣơng trình hồi quy ứng với mơ hình vật lý đó.
c. Phương pháp kiểm định giả thuyết thống kê

Luận văn thạc sĩ khoa học

17

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên


Khoa Địa Chất

Thuật toán nhận dạng trên cơ sở mơ hình thống kê đối tƣợng chuẩn trong phân
tích số liệu địa vật lý thƣờng sử dụng các thông số nhƣ: tỷ số sự thật L(x) và tổng
lƣợng thông tin J(1:2,x).
Giá trị các thông số đƣợc tính theo cơng thức:

L(x) =

(1.13)

J(1:2,x) =

(1.14)

Trong đó:
P1(x), P2(x) là các xác suất bắt gặp giá trị dấu hiệu x cùng với các đối tƣợng
tƣơng ứng của lớp 1 và lớp 2 (ví dụ lớp quặng và lớp khơng quặng). Khi sử dụng
đối tƣợng chuẩn cho lớp 1 (lớp quặng) thì các biểu thức P2(x) đƣơc thay bằng 1.
x là vecto giá trị các dấu hiệu đƣợc sử dụng x1 , x2,…xk (ví dụ các hàm lƣợng
qu, qth ,qk , …).
Khi các dấu hiệu x1 , x2,…xk đƣợc xem nhƣ là khơng phụ thuộc nhau thì xác
suất của đại lƣợng n chiều của tổ hợp n dấu hiệu đƣợc tính:
P(x)= P(x1). P(x2). P(x3)...P(xk)
L(x) =

= L(x1).L(x2)…L(xk)

J(1:2,x) = J(1:2,x1)+ J(1:2,x2)+ …+J(1:2,xk)
Luận văn thạc sĩ khoa học


18

(1.15)
(1.16)

(1.17)
Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

Nếu sự phụ thuộc của các dấu hiệu là rõ và sự phân bố của chúng tuân theo
luật chuẩn thì để nhận dạng các đối tƣợng thuộc lớp 1 và lớp 2 ngƣời ta thƣờng sử
dụng các hàm phân giải bậc 1 (R1) hoặc bậc 2 (R2) đối với các tham số x1 , x2,…xn. .
Các hàm này đƣợc biểu diễn nhƣ sau :
R1 =

(1.18)

R2 =

(1.19)

Trong đó các hệ số: ai , bij , ci đƣợc xác định từ các ma trận thông tin các dấu
hiệu của đối tƣợng thứ 1 và thứ 2. Thơng qua các “diện tích đối tƣợng chuẩn” ngƣời
ta xác định đƣợc các vecto giá trị các dấu hiệu sử dụng x (trong trƣờng hợp các dấu
hiệu đƣợc xem là không phụ thuộc nhau ) hoặc các hệ số ai , bij , ci (trong trƣờng

hợp các dấu hiệu phụ thuộc nhau). Sau đó tính giá trị L(x), J(1:2,x) hoặc R1, R2 phổ
các giá trị này lên khắp diện tích khảo sát và biểu diễn chúng lên bản đồ. Đối sánh
các giá trị này với các giá trị của đối tƣợng chuẩn có thể nhận biết và khoanh định
đƣợc các diện tích đồng dạng với đối tƣợng chuẩn. Các dấu hiệu đƣợc lựa chọn
thƣờng là một tổ hợp nào đó trong số các tham số thu đƣợc.
1.3.3.

Các thuật tốn nhận dạng khơng có mẫu chuẩn

a. Thuật tốn kiểm chứng thống kê
thuật toán này tiến hành phân loại trƣờng khi các dấu hiệu trƣờng hoàn toàn
độc lập với nhau. Ban đầu ngƣời ta sử dụng bộ lọc để tách các dị thƣờng ra khỏi
phông nhiễu cho từng dấu hiệu trƣờng. Kết quả lọc có phép nhận đƣợc các số liệu
trƣờng chủ yếu gồm các dị thƣờng. Tiếp theo phân loại các dị thƣờng thành các lớp
Luận văn thạc sĩ khoa học

19

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

dị thƣờng. Mỗi lớp dị thƣờng gồm các dị thƣờng có các đặc trƣng thống kê giống
nhau. Để phân loại các dị thƣờng, đầu tiên ngƣời ta phân của khu vực khảo sát
thành các diện tích cơ sở, sau đó dựa vào kết quả phân chia các giá trị trƣờng ở mỗi
cửa sổ ngƣời ta dựng các đƣờng cong biến phân đặc trƣng cho cửa sổ đó. Cuối
cùng, để phân lớp các dị thƣờng ngƣời ta sử dụng các chỉ tiêu X2 để so sánh và xếp

loại các đƣờng cong biến phân. Các diện tích có ƣớc lƣợng phân bố mật độ xác suất
giống nhau đƣợc sắp xếp vào một lớp.
Giai đoạn cuối cùng của quá trình nhận dạng là giai đoạn thuật toán tiến hành
xác định số hiệu của lớp tổng hợp.
Với mục đích này, dựa vào các đƣờng cong biến phân dựng đƣợc cho từng
dấu hiệu ngƣời ta xác định giá trị trung bình và phƣơng sai sắp xếp các giá trị trung
bình theo thứ tự tăng dần. Sau đó ngƣời ta dựa vào chỉ tiêu xác suất hậu nghiệm cực
đại ngƣời ta quyết định xếp loại đối tƣợng khảo sát và các lớp khác nhau. Bằng cách
trên, toàn bộ khu vực khảo sát đƣợc phân chia thành một số diện tích có hình dạng
bất kỳ, ở đó dị thƣờng của các dấu hiệu khác nhau đè lên nhau.
b. Thuật tốn K trung bình
Nội dung thuật tốn nhƣ sau: Giả sử tồn tại n đối tƣợng, nhiệm vụ đặt ra là
phân chia toàn bộ n đối tƣợng thành M lớp với M<Để giải quyết nhiệm vụ trên, lúc đầu ngƣời ta chọn hú họa từ n đối tƣợng ra k
đối tƣợng, k đối tƣợng đƣợc chọn này xem nhƣ các mẫu chuẩn xuất phát. Tiếp theo
là tiến hành chính xác hóa liên tiếp các mẫu chuẩn chọn đƣợc bằng cách so sánh các
mẫu chuẩn với các đối tƣợng còn lại. Sau mỗi lần chọn tập hợp các mẫu chuẩn Ev
chọn đƣợc ở lần chọn thứ v sẽ thay cho các mẫu chuẩn ở lần chọn thứ v-1 ( lần
trƣớc đó).
Nếu ký hiệu tập hợp mẫu chuẩn (Ev) chọn đƣợc ở lần thứ v là:

Luận văn thạc sĩ khoa học

20

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên


Khoa Địa Chất

Ev = { e1v, e2v,… ekv} với v= 0, 1, 2,…
Với kí hiệu này mẫu chuẩn xuất phát là:
E0 ={ e10, e20, …ek0}
Các mẫu chuẩn này chính là các mẫu đƣợc chọn ra từ vịng đầu tiên (vịng số
0) của q trình lặp. Tiếp theo vịng số 0 thuật tốn gọi tiếp số xk+1 và và tìm xem
trong k mẫu ei0, mẫu chuẩn nào gần nhất với nó. Nếu tìm đƣợc, thì mẫu chuẩn thuộc
tập hợp E0 tìm đƣợc này đƣợc thay thế bằng mẫu chuẩn mới. Mẫu chuẩn mới này có
giá trị ei1 đƣợc tính nhƣ giá trị trọng tâm giữa các giá trị của mẫu chuẩn cũ và giá trị
của của đối tƣợng gắn kết với nó xk+1.
Sau q trình hiệu chỉnh ở vịng 1, bằng phƣơng pháp mơ tả trên thuật toán sẽ
tiến hành hiệu chỉnh ở các lần tiếp theo, cho tới khi đối tƣợng cuối cùng đƣợc gọi
ra.
Sau khi tập các mẫu các mẫu chuẩn đƣợc chính xác hóa, thuật tốn tiến hành
phân loại tồn bộ số lƣợng n các đối tƣợng theo tập hợp các dấu hiệu thành M lớp
dựa vào nguyên tắc khoảng cách tối thiểu.
1.3.4.

Quyết định sự tồn tại của đối tƣợng và đánh giá chất lƣợng xử lý

Đối với thuật toán nhận dạng có mẫu chuẩn việc quyết định nghiệm chủ yếu
dựa vào chỉ số tƣơng đồng. Chỉ số này xác định mức độ giống nhau hoặc khác nhau
giữa đối tƣợng nghiên cứu và đối tƣợng chuẩn theo lƣợng thông tin tổng hợp của
toàn bộ các dấu hiệu (trƣờng địa vật lý quan sát).
Phụ thuộc vào từng loại thuật toán nhận dạng ngƣời ta chọn những đại lƣợng
khác nhau để đánh giá chỉ số tƣơng đồng. Đối với thuật toán nhận dạng kiểm chứng
thống kê thì chỉ số tƣơng đồng chính tƣơng đồng chính là hệ số tƣơng thích thích
hay xác suất hậu nghiệm P( Ak/Bj ). Đối với thuật toán loại này để giải quyết


Luận văn thạc sĩ khoa học

21

Nguyễn Trí Tiến


Trường đại học Khoa Học Tự Nhiên

Khoa Địa Chất

nghiệm ngƣời ta đƣa ra các giá tri ngƣỡng của hệ số tƣơng thích và xác suất hậu
nghiệm. Giá trị của chỉ số tƣơng đồng sẽ đƣợc so sánh với giá trị ngƣỡng này để
quyết định đối tƣợng nghiên cứu giống hay không giống với mẫu.
Chất lƣợng của kết quả xử lý đƣợc đánh giá dựa vào sai số nhận dạng các đối
tƣợng kiểm chứng. Các đối tƣợng kiểm chứng là các đối tƣợng mà bản chất địa chất
của chúng đã đƣợc xác định rõ, song chúng không đƣợc chọn là mẫu chuẩn để nhận
dạng mà đƣợc dùng làm các đối tƣợng để kiểm tra các kết quả nhận dạng.
Sai số nhận dạng đƣợc tính bằng tỷ số các đối tƣợng kiểm chứng đƣợc nhận
dạng đúng so với tổng các đối tƣợng kiểm chứng đƣợc đem ra nhận dạng.
Đối với các thuật toán nhận dạng kiểm chứng thống kê ngƣời ta sử dụng xác
suất nhận dạng sai lầm để đánh giá chất lƣợng xử lý. Xác suất này đƣợc xác định
dựa vào việc tính tích phân hàm phân bố mật độ xác suất của hệ số tƣơng thích. Các
hàm này đƣợc xác định riêng cho các đối tƣợng kiểm chứng của từng lớp một.

Luận văn thạc sĩ khoa học

22

Nguyễn Trí Tiến



×