Tải bản đầy đủ (.pdf) (68 trang)

Nghiên cứu áp dụng phương pháp khoảng cách - tần suất - nhận dạng trong giải đoán địa chất số liệu địa vật lý hàng khôn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.64 MB, 68 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN


Nguyễn Trí Tiến



NGHIÊN CỨU ÁP DỤNG PHƢƠNG PHÁP
KHOẢNG CÁCH – TẦN SUẤT – NHẬN DẠNG TRONG
GIẢI ĐOÁN ĐỊA CHẤT SỐ LIỆU ĐỊA VẬT LÝ HÀNG KHÔNG


LUẬN VĂN THẠC SĨ KHOA HỌC




Hà Nội – Năm 2012
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

Nguyễn Trí Tiến

NGHIÊN CỨU ÁP DỤNG PHƢƠNG PHÁP
KHOẢNG CÁCH – TẦN SUẤT – NHẬN DẠNG TRONG
GIẢI ĐOÁN ĐỊA CHẤT SỐ LIỆU ĐỊA VẬT LÝ HÀNG KHÔNG
Chuyên ngành: Địa vật lý.
Mã số: 60 44 61.

LUẬN VĂN THẠC SĨ KHOA HỌC



NGƢỜI HƢỚNG DẪN KHOA HỌC
PGS.TS Võ Thanh Quỳnh.


Hà Nội – Năm 2012


MỤC LỤC
MỞ ĐẦU 4
Chƣơng 1 - CƠ SỞ LÝ THUYẾT NHẬN DẠNG TRONG XỬ LÝ SỐ LIỆU ĐỊA
VẬT LÝ 7
1.1. Lý thuyết xử lý tổ hợp số liệu 7
1.2. Mẫu và các đặc trƣng thông kê số liệu địa vật lý 10
1.2.1. Số liệu đo và mẫu ngẫu nhiên 10
1.2.2. Hàm mật độ xác suất 11
1.3. Các thuật toán nhận dạng 13
1.3.1. Mẫu chuẩn các đặc điểm đặc trƣng và sử dụng mẫu chuẩn trong
nhận dạng 14
1.3.2. Các thuật toán nhận dạng có mẫu chuẩn 16
1.3.3. Các thuật toán nhận dạng không có mẫu chuẩn 21
1.3.4. Quyết định sự tồn tại của đối tƣợng và đánh giá chất lƣợng xử lý 23
Chƣơng 2 - HOÀN THIỆN VÀ MỞ RỘNG PHẠM VI ÁP DỤNG PHƢƠNG
PHÁP KHOẢNG CÁCH -TẦN SUẤT - NHẬN DẠNG TRONG XỬ LÝ SỐ LIỆU
ĐỊA VẬT LÝ MÁY BAY. 24
2.1. Các phƣơng pháp phân tích tài liệu địa vật lý máy bay trong nƣớc và trên thế
giới 24
2.1.1. Các phƣơng pháp phân tích tài liệu địa vật lý máy bay trên thế giới . 24
2.1.2. Các phƣơng pháp phân tích tài liệu dịa vật lý may bay ở Việt Nam 30
2.2. Hoàn thiện và mở rộng phạm vi áp dụng phƣơng pháp Khoảng cách-Tần suất-

Nhận dạng trong xử lý-phân tích số liệu địa vật lý 31
2.2.1. Nội dung Phƣơng pháp Khoảng cách-Tần suất-Nhận dạng hiện nay 32
2.2.2. Hoàn thiện và mở rộng phạm vi áp dụng Phƣơng pháp Khoảng cách-
Tần suất-Nhận dạng 33
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
1
Chƣơng 3 - ÁP DỤNG PHƢƠNG PHÁP KHOẢNG CÁCH -TẦN SUẤT - NHẬN
DẠNG VÀO XỬ LÝ SỐ LIỆU ĐỊA VẬT LÝ HÀNG KHÔNG VÙNG ĐÔNG
TUY HÒA 39
3.1. Lịch sử nghiên cứu địa chất – địa vật lý vùng đông Tuy Hòa 39
3.1.1. Lịch sử nghiên cứu Địa chất 39
3.1.2. Lịch sử nghiên cứu Địa vật lý 40
3.2. Đặc điểm địa chất và địa vật lý của vùng Đông Tuy Hòa 42
3.2.1. Đặc điểm địa lý, tự nhiên 42
3.2.2. Đặc điểm địa chất 44
3.2.3. Đặc điểm địa vật lý 46
3.3. Kết quả áp dụng phƣơng pháp Khoảng cách-Tần suất-Nhận dạng vào phân
tích tài liệu thực tế vùng Đông Tuy Hòa 47
KẾT LUẬN 63
TÀI LIỆU THAM KHẢO 64

















Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
2




MỤC LỤC HÌNH
Hình 3.1 – sơ đồ tuyến bay thực tế và dị thƣờng phổ gamma hàng không 53
Hình 3.2 – bản đồ trƣờng từ vùng đông Tuy Hòa 54
Hình 3.3 – bản đồ cƣờng độ trƣờng từ delta T vùng đông Tuy Hòa 55
Hình 3.4 – bản đồ hàm lƣợng Kali vùng đông Tuy Hòa 56
Hình 3.5 – bản đồ hàm lƣợng Thoiri vùng đông Tuy Hòa 57
Hình 3.6 – bản đồ cƣờng độ Gamma vùng đông Tuy Hòa 58
Hình 3.7 – bản đồ cƣờng độ Uran vùng đông Tuy Hòa 59
Hình 3.8 – sơ đồ phân bố cụm dị thƣờng vùng đông Tuy Hòa 60
Hình 3.9 – sơ đồ phân bố cụm dị thƣờng và kết quả phân tích theo phƣơng pháp . 61
Hình 3.10 – sơ đồ dự báo triển vọng khoáng sản vùng đông Tuy Hòa
khoảng cách – tần suất – nhận dạng vùng đông Tuy Hòa 62
Bảng 3.1 - Kết quả phân tích theo phƣơng pháp Khoảng cách-Tần suất -Nhận dạng
và so sánh với kết quả kiểm tra mặt đất - Các cụm đối tƣợng mẫu: 38 và 55 50
Bảng 3.2: Kết quả phân tích theo phƣơng pháp khoảng cách –tần suất – nhận dạng
và so sánh với kết quả kiểm tra mặt đất - Đối tƣợng mẫu: 68 và 88 51

Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
3




MỞ ĐẦU
Các phƣơng pháp nhận dạng đóng vai trò hết sức quan trọng trong xử lý, phân
tích tài liệu địa vật lý, đặc biệt là đối với các dạng số liệu có đặc tính phân bố ngẫu
nhiên nhƣ các số liệu địa hóa, các số liệu phổ gamma v.v…. Hiện nay trong địa vật
lý có rất nhiều thuật toán nhận dạng hiện đại, đƣợc tự động hóa bằng các hệ phần
mềm mạnh chuyên dụng, đáng chú ý là bộ chƣơng trình phân tích phổ-thống kê do
Giáo sƣ, Viện sĩ Ni-Ki-Tin cùng các đồng sự đề xuất, xây dựng. Tuy nhiên trên
thực tế khối lƣợng tài liệu cũng nhƣ số lƣợng các chủng loại thông tin thu đƣợc trên
các đối tƣợng địa chất ngày càng rất lớn. Trong khi đó số lƣợng các tham số đầu
vào của các chƣơng trình phân tích nhận dạng hiện có thƣờng bị giới hạn. Việc sử
dụng các tổ hợp thông tin khác nhau để tiến hành phân tích nhận dạng nhiều khi cho
những kết quả rất khác nhau. Để nâng cao độ tin cậy của các phƣơng pháp phân tích
nhận dạng đã có những công trình nghiên cứu theo hƣớng ứng dụng lớp bài toán
đánh giá lựa chọn thông tin để lựa chọn những tổ hợp thông tin chất lƣợng cao
trƣớc khi tiến hành phân tích nhận dạng. Cũng từ đó đề xuất những cách tiếp cận
mới giải quyết bài toán nhận dạng trong xử lý số liệu địa vật lý và thu đƣợc kết quả
tốt. Mặc dù vậy trong các phƣơng pháp phân tích đối sánh cũng nhƣ đánh giá lựa
chọn thông tin có ứng dụng thuật toán phân tích tần suất nói trên chỉ tiến hành trên
một loại đối tƣợng mẫu, đó là các đối tƣợng cần tìm. Do vậy với thuật toán nhận
dạng tần suất trong một số trƣờng hợp sẽ gặp hạn chế. Thực tế có những chủng loại
thông tin khi đánh giá trên đối tƣợng mẫu là tin cậy nhƣng đặc trƣng của nó lại
tƣơng tự nhƣ trên các đối tƣợng đối nghịch với đối tƣợng mẫu, khi đó việc sử dụng
các thông tin này để phân tích đối sánh, xác định đối tƣợng đồng dạng dễ bị nhầm

lẫn giảm độ tin cậy. Trong khi đó trên thực tế trong nhiều trƣờng hợp, ta có đƣợc
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
4
đồng thời 2 loại đối tƣợng mẫu đối nghịch nhau là đối tƣợng cần tìm và đối tƣợng
đối nghịch với nó (ví dụ các đối tƣợng quặng và không quặng). Rõ ràng trong
trƣờng hợp này cần có các thuật toán nhận dạng mới sao cho việc đánh giá lựa chọn
tổ hợp thông tin đƣợc tiến hành đồng thời trên cả 2 loại đối tƣợng mẫu, để từ đó tiến
hành phân tích đối sánh, nhận biết, phân biệt đối tƣợng sẽ cho kết quả tin cậy hơn.
Theo hƣớng này các nhà địa vật lý Việt Nam đã nghiên cứu vận dụng kết hợp
phƣơng pháp phân tích khoảng cách khái quát theo thuật toán của Paguônôp và
phƣơng pháp phân tích tần suất theo thuật toán Griffiths-Vinni trong đánh giá lựa
chọn thông tin cũng nhƣ trong phân tích đối sánh xác định đối tƣợng đồng dạng. Từ
đó xây dựng thành một phƣơng pháp phân tích nhận dạng mới với tên gọi “Phƣơng
pháp Khoảng cách-Tần suất-Nhận dạng”. Những phân tích thử nghiệm trên các tài
liệu thực tế bằng phƣơng pháp phân tích nhận dạng mới nói trên đã cho kết quả tốt.
Tuy nhiên trƣớc đây phƣơng pháp Khoảng cách-Tần suất-Nhận dạng vẫn còn tồn tại
một số hạn chế, cần đƣợc nghiên cứu khắc phục. Đó là: Phƣơng pháp Khoảng cách-
Tần suất-Nhận dạng hiện mới chỉ đƣa ra đƣợc thuật toán phân tích đối sánh, xác
định mức độ đồng dạng của đối tƣợng đối sánh so với đối tƣợng mẫu, làm cơ sở cho
việc đánh giá, dự báo mức độ triển vọng của chúng, khi đối tƣợng đối sánh đã biết;
chƣa giải quyết đƣợc nhiệm vụ tìm kiếm, phát hiện, khoanh định ranh giới các đối
tƣợng đồng dạng cũng nhƣ mức độ đồng dạng của chúng khi chƣa biết trƣớc các đối
tƣợng đối sánh; một nội dung quan trọng đối với các phƣơng pháp phân tích nhận
dạng nói chung. Phƣơng pháp này cũng mới áp dụng có hiệu quả đối với tài liệu dị
thƣờng phổ gamma hàng không mà chƣa đƣợc mở rộng cho các dạng tài liệu địa vật
lý khác, kể cả tài liệu từ hàng không. Hiện nay phƣơng pháp Khoảng cách-Tần suất-
Nhận dạng đã đƣợc các tác giả: Nguyễn Xuân Bình, Nguyễn Đức Vinh, Võ Thanh
Quỳnh và nnk nghiên cứu hoàn thiện, khắc phục những hạn chế đã nêu và mở rộng
hơn nữa phạm vi áp dụng của phƣơng pháp. Luận Văn này trình bày nội dung của

phƣơng pháp đã đƣợc hoàn thiện, bằng việc mở rộng thuật toán cho cả trƣờng hợp
biết trƣớc đối tƣợng đối sánh và trƣờng hợp chƣa biết trƣớc đối tƣợng đối sánh,
cùng với phần mềm xử lí trên máy tính tƣơng ứng. Tiến hành áp dụng phân tích thử
nghiệm đối với tài liệu địa vật lý hàng không (bao gồm cả tài liệu từ và tài liệu phổ
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
5
gamma), góp phần làm rõ ý nghĩa khoa học cũng nhƣ khả năng áp dụng thực tế của
phƣơng pháp vừa mới đƣợc hoàn thiện, đồng thời góp phần làm sáng tỏ đặc điểm
địa chất và triển vọng khoáng sản vùng Đông Tuy Hòa.

Luận văn gồm các nội dung chính :
- Mở đầu.
- Chƣơng 1 - Cơ sở ly thuyết nhận dạng trong xử lý số liệu địa vật lý.
- Chƣơng 2 - Hoàn thiện và mở rộng phạm vi áp dụng phƣơng pháp khoảng
cách - tần xuất - nhận dạng trong xử lý số liệu địa vật lý máy bay.
- Chƣơng 3 - Áp dụng phƣơng pháp khoảng cách – tần suất – nhận dạng vào
xử lý số liệu địa vật lý hàng không vùng đông Tuy Hòa
- Kết luận.
Luận văn là kết quả thực hiện chƣơng trình cao học tại Khoa địa chất – trƣờng
Đại học Khoa Học Tự Nhiên – ĐHQGHN dƣới sự hƣớng dẫn của PGS.TS Võ
Thanh Quỳnh – trƣờng Đại học Khoa Học Tự Nhiên – ĐHQGHN.






Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến

6



Chƣơng 1 - CƠ SỞ LÝ THUYẾT NHẬN DẠNG TRONG XỬ LÝ SỐ LIỆU
ĐỊA VẬT LÝ
Khác với các lĩnh vực nghiên cứu trực tiếp đối tƣợng địa chất, địa vật lý
nghiên cứu gián tiếp các đối tƣợng dựa vào các đặc điểm trƣờng vật lý của chúng.
Từ số liệu khảo sát trƣờng địa vật lý, mục tiêu cuối cùng của công tác thăm dò địa
vật lý là đƣa ra đƣợc các thông tin của để phục vụ cho các mục tiêu khác nhau. Để
thực hiện nhiệm vụ này có nhiều phƣơng pháp, trong đó lý thuyết nhận dạng – lĩnh
vực toán học giải quyết các bài toán phân loại đối tƣợng là một phƣơng án đƣợc lựa
chọn nhiều hiện nay trong địa vật lý.
1.1. Lý thuyết xử lý tổ hợp số liệu
Mỗi loại số liệu cụ thể thƣờng chỉ phản ánh một số đặc trƣng nào đó của đối
tƣợng vì vậy khi sử dụng đó để đƣa ra kết luận về đối tƣợng sẽ cho kết quả kém tin
cậy do nhiều nguyên nhân chƣa kể tới các sai số mắc phải khi thu thập và chỉnh lý
số liệu. Để nâng cao chất lƣợng xử lý thông tin và đáp ứng nhu cầu thực tế, hiện nay
ngƣời ta áp dụng phổ biến là các phƣơng pháp xử lý tổ hợp dữ liệu. Xử lý tổ hợp dữ
liệu về cơ bản là dựa trên nhiều loại thông tin khác nhau để quyết được các nhiệm
vụ đặt ra phù hợp với điều kiện kinh tế và kỹ thuật cho phép. Không chỉ trong địa
vật lý mà nhiều lĩnh vực khác cũng sử dụng xử lý tổ hợp số liệu để nâng cao chất
lƣợng của kết quả xử lý.
Khảo sát và thu thập thông tin về đối tƣợng phải đáp ứng đƣợc các yêu cầu
thực tế đặt ra nhƣ sau:
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
7
 Thông tin phải đảm bảo về số lƣợng và chất lƣợng để đạt đƣợc mục
tiêu và xử lý với độ chính xác chấp nhận đƣợc.

 Thời gian thu thập thông tin phải phù hợp với tiến độ yêu cầu.
 Khảo sát, thu thập thông tin phải đạt đƣợc hiệu quả kinh tế.
Từ các yêu cầu này mà đôi khi các phƣơng án khảo sát loại số liệu có độ tin
cậy cao hơn không đƣợc lựa chọn mà thay vào đó ngƣời ta sử dụng một loại thông
tin khác mà khi sử dụng tổ hợp các thông tin này cũng có khả năng đáp ứng đƣợc
các yêu cầu, mục tiêu đề ra. Ví dụ nhƣ thay vì dùng số liệu địa chấn có giá thành
khảo sát cao thì có thể sử dụng tổ hợp khảo sát trọng lực và số liệu điện trở suất để
tìm kiếm các hang động karst.
Mặt khác, hiện nay các tổ hợp phƣơng pháp địa vật lý đang ngày càng đƣợc áp
dụng rộng rãi do những đặc trƣng về kỹ thuật nhƣ tổ hợp địa vật lý biển, tổ hợp địa
vật lý hàng không…. Các tổ hợp phƣơng pháp này với các phƣơng pháp ghi đo tự
động sẽ cung cấp một khối lƣợng dữ liệu rất lớn bao gồm nhiều chủng loại thông
tin.
Ngoài dữ liệu khảo sát trực tiếp, hiện nay với số lƣợng thông tin lƣu trữ ngày
càng tăng thì việc sử dụng kết hợp các dữ liệu có sẵn này với các thông tin khảo sát
là một nhu cầu để nâng cao độ tin cậy cho kết quả xử lý.
Mỗi loại thông tin chỉ mang những đặc trƣng nhất định của đối tƣợng và để
hoàn thành đƣợc nhiệm vụ đặt ra trong nhiều trƣờng hợp ngƣời ta buộc phải sử
dụng tổ hợp các thông tin khác nhau.
Bản thân mỗi loại số liệu khảo sát đều mang những sai số, chúng đi kèm với
số liệu và nhiều lúc gây ra những sai lầm khi xử lý. Những sai số này do nhiều
nguyên nhân khác nhau nhƣ: Sai số đo ghi của máy, sai số do kỹ thuật và phƣơng
pháp đo ghi, sai số do ảnh hƣởng của các đối tƣợng khác…trong số liệu địa vật lý
những sai số mắc phải làm giảm độ tin cậy của thông tin đƣợc loại bỏ trong các
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
8
bƣớc xử lý số liệu nhƣng rất khó để tách hoàn toàn đƣợc chúng ra khỏi số liệu. Đặc
biệt là các nhiễu do nguồn gốc địa chất, chúng làm sai lệch mạnh các tín hiệu có ích
và đối khi không loại bỏ đƣợc do không đủ thông tin. Những sai số này làm giảm

đáng kể độ tin cậy của thông tin, đặc biệt trong trƣờng hợp loại thông tin đó đƣợc
coi là loại tính quan trọng đặc trƣng cho đối tƣợng đang cần nghiên cứu. Một
nguyên nhân khác dẫn tới độ giảm tin cậy của một loại thông tin là tính đa trị của
kết quả xử lý. Điều này gây nhiều khó khăn và sai lầm trong xử lý. Để xác định đơn
trị đối tƣợng cần sử dụng kết hợp nhiều loại thông tin khác nhau một cách phù hợp.
Từ các nguyên nhân trên các phƣơng pháp xử lý tổ hợp số liệu đã và dang
đƣợc áp dụng phổ biến trong nhiều lĩnh vực và mang lại kết quả cao.
Lựa chọn tổ hợp số liệu:
Trong bất kỳ bài toán nhận dạng nào thì số lƣợng và chất lƣợng các tính chất
(loại thông tin) dùng để nhận dạng luôn đƣợc quan tâm hàng đầu. Mỗi tổ hợp thông
tin khác nhau thƣờng cho kết luận khác nhau về đối tƣợng. Để đạt đƣợc kết quả
đáng tin cậy nhất thì trong quá trình xử lý số liệu cần lựa chọn đƣợc tổ hợp thông
tin có độ tin cậy cao và hợp lý.
Chất lƣợng của thông tin tốt hay không phụ thuộc vào loại thông tin đó có đặc
trƣng cho đối tƣợng (khả năng phân biệt đối tƣợng với môi trƣờng xung quanh) hay
không. Tính đặc trƣng cho đối tƣợng của một loại số liệu địa vật lý do nhiều nguyên
nhân quyết định. Một tính chất là đặc trƣng cho đối tƣợng khi độ chênh lệch giá trị
của số liệu của tính chất đó giữa đối tƣợng nghiên cứu với môi trƣờng xung quanh
đủ lớn. Trong trƣờng hợp đối tƣơng nằm quá sâu, kích thƣớc quá nhỏ, hoặc do ảnh
hƣởng của đối tƣợng khác (phong hóa, biến chất, chất lƣu…) dẫn tới độ chênh lệch
của giá trị không đủ để phân biệt đối tƣợng với môi trƣờng xung quanh khi đó
thông tin có ích cho xử lý số liệu. Các sai số không tách đƣợc sẽ gây ra sai lệch về
số liệu khi đó thông tin không còn mang tính đặc trƣng cho đối tƣợng.
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
9
Một tổ hợp thông tin không đầy đủ sẽ không đáp ứng đƣợc yêu cầu, nhiệm vụ
đặt ra cho quá trình xử lý. Việc chọn số lƣợng các loại thông tin phải đảm bảo đƣợc
tính đơn trị cho kết quả và đƣa ra đƣợc đầy đủ các yêu cầu nghiên cứu về đối tƣợng.
Việc sử dụng đồng thời nhiều loại thông tin trong đó có những thông tin có độ

tin cậy thấp không những gây khó khăn cho quá trình xử lý, chất lƣợng xử lý không
cao, do các thông tin thiếu tin cậy sẽ làm nhòe đi các thông tin quan trọng khác dẫn
đến những nhận thức sai lệch về đối tƣợng.
Việc lựa chọn đƣợc một tổ hợp thông tin có chất lƣợng cao là nội dung khó
khăn và phụ thuộc nhiều vào hiểu biết, kinh nghiệm của ngƣời xử lý.
1.2. Mẫu và các đặc trƣng thông kê số liệu địa vật lý
1.2.1. Số liệu đo và mẫu ngẫu nhiên
Vì các thiết bị quan sát trƣờng trong trƣờng đại vật lý đều là thiết bị số nên các
kết quả quan sát trƣờng là những con số. Ở một điểm quan sat bất kì, kết quả quan
sát trƣờng địa vật lý hoặc đại lƣợng khác lại chứa nhiễu và sai số đo nên có thể là
đại lƣợng này hay đại lƣợng khác mà ngƣời đo không dự đoán trƣớc đƣợc. Vì vậy
để mô tả các giá trị (bằng số) các trƣờng địa vật lý đo đƣợc ngƣời ta sử dụng khái
niệm đại lƣợng ngẫu nhiên.
Các giá trị trƣờng đại vật lý đo đƣợc là các số cụ thể nên đại lƣợng ngẫu niên
là mô tả nền tảng để mô tả các số liệu đại vật lý
Đại lƣợng X đƣợc gọi là đại lƣợng ngẫu nhiên nếu trong mỗi phép đo sẽ xuất
hiện một trong những giá trị cụ thể x
1
, x
2,
x
3
,…của đại lƣợng náy với xác xuất tƣơng
ứng p
1
, p
2
, p
3


Tất cả cá giá trị có thể của X sẽ tạo thành nhóm đầy đủ vì bao giờ trong kết
quả của một phép đo cúng sẽ xuất hiện một giá trị xi nào đó (biểu hiện nào đó của
X); nghĩa là bao giờ cúng tồn tại đẳng thức:
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
10
=1 (1.1)
Để mô tả các đại lƣợng ngẫu nhiên, ngƣời ta sử dụng công cụ toán học xác
suất thông qua hàm phân bố xác suất và các đặc trƣng thống kê.
1.2.2. Hàm mật độ xác suất
Hàm mật độ xác suất f(x) là một hàm mô tả xác suất xuất hiện các giá trị cụ
thể của đại lƣợng ngẫu nhiên x
Hàm mật độ xác suất có các tính chất sau:
(1.2)

(1.3)


P(x
1
<X< x
2
)= (1.4)

Với P(x
1
<X< x
2
) là xác suất rơi khoảng (x
1

;x
2
) của đại lƣợng ngẫu nhiên x
F(x
1
)= (1.5)
Với F(x) là hàm phân hàm bố của X; hàm mô tả xác suất để đại lƣợng ngẫu
nhiên X nhận các giá trị nhỏ hơn giá trị x
i
nào đó.
Đồ thị của hàm phân bố mật độ xác suất thực nghiệm đƣợc dựng lên từ số liệu
khảo sát thực tế đƣợc gọi là đường cong biến phân.
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
11
Ngoài hàm phân bố F(x) và hàm mật độ f(x) ngƣời ta còn dung các đặc trƣng
thống kê để mô tả các đại lƣợng ngẫu nhiên bao gồm:
 Kỳ vọng toán M[x]= = x
i
(1.6)
 Mod (M
0
) là giá trị mà tại đó hàm mật độ phân bố max
 Median (M
e
) là giá trị của X có xác suất P(x) =
 Phƣơng sai: D[x]= M[x- [Mx]]
2
= – M[x])
2

p
i
(1.7)
 Độ lệch trung bình bình phƣơng = (1.8)
Một số hàm phân phối lý thuyết
Đế mô tả các đại lƣợng ngẫu nhiên trong vật lý ngƣời ta sử dụng các hàm phân
phối lý thuyết nhƣ hàm phân phối chuẩn (phân phối Gauxơ), phân phối chuẩn loga,
phân phối Puasson…
Phần lớn các đại lƣợng ngẫu nhiên trong địa vật lý cũng nhƣ hiện tƣợng địa
chất khác chúng tuân theo luật phân phối chuẩn
Đại lƣợng ngẫu nhiên X tuân theo luật phân phối chuẩn nếu hàm mật độ của
nó có dạng:
f(x) = (1.9)
trong đó:
Kỳ vọng: = (1.10)

Phƣơng sai: = E(X – EX)
2
(1.11)
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
12
Đồ thị hàm phân phối chuẩn đối xứng qua đƣờng thẳng x= và giảm dần
xuống xung quanh kỳ vọng.
Diện tích giới hạn bởi đƣờng cong và trục hoành bằng 1 đó chính là xác xuất
để đại lƣợng ngẫu nhiên X nhân giá trị cong khoảng ( - ; + ) (1.3). Xác xuất để
đại lƣợng ngẫu nhiên X nhận giá trị trong khoảng từ x
1
tới x
2

chính là phần diện tích
đƣợc bao bởi đƣờng cong, trục hoành và hai đƣờng thẳng x = x
1
; x = x
2
. Xác xuất
đó đƣợc tính theo công thức (1.4).
Nhiều giá trị trƣờng địa vật lý nhƣ mật độ, tốc độ truyền sóng, phóng xạ…
tuân theo luật phân phối chuẩn và dựa trên các thuật toán thống kê theo luật phân
phối chuẩn ngƣời ta có thể xử lý số liệu để tìm ra các đặc trƣng của đối tƣợng
Ngoài luật phân phối chuẩn còn có các luật phân phối khác đang đƣợc áp dụng
phổ biến trong phân tích thống kê các số liệu địa vật lý. Ví dụ nhƣ luật phân phối
chuẩn loga đƣợc dùng để mô tả các giá trị điện trở, độ từ cảm của đất đá.
1.3. Các thuật toán nhận dạng
Nhiệm vụ cơ bản nhất của công tác xử lý tổ hợp số liệu địa vậy lý là phân loại
đƣợc các điểm quan sát thành các diện tích nhất định hay các nhóm, lớp diện tích
nhất định, ở đó các đặc trƣng của trƣờng địa vật lý giống với các đặc trƣng của
trƣờng liên quan với loại (lớp) đối tƣợng địa chất nhất định. Để giải quyết đƣợc
nhiệm vụ trên tƣơng tự nhiều lĩnh vực khoa học khác ngƣời ta sử dụng lý thuyết
nhận dạng - một lĩnh vực toán học đi sâu vào giải quyết các bài toán phân loại đối
tƣợng dựa vào mối quan hệ hữu cơ giữa các đối tƣợng cụ thể và các dấu hiệu đặc
trƣng cho đối tƣợng đó.
Hiện nay, trong địa vật lý ngƣời ta sử dụng rất nhiều phƣơng pháp nhận dạng
hiện đại, đƣợc tự động hóa bằng các phần mềm mạnh. Tuy nhiên,có thể chia chúng
thành hai nhóm: có phƣơng pháp nhận dạng theo đối tƣợng chuẩn (có thông tin tiên
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
13
nhiệm) và nhóm có phƣơng pháp nhận dạng không có đối tƣợng chuẩn (không có
thông tin tiên nghiệm.

1.3.1. Mẫu chuẩn các đặc điểm đặc trƣng và sử dụng mẫu chuẩn trong
nhận dạng
Để xử lý tổ hợp các số liệu bằng phƣơng pháp nhận dạng có mẫu chuẩn thì
công việc quan trọng mang tính quyết định là lựa chọn các mẫu chuẩn và xác định
các đặc trƣng thống kê các trƣờng địa vật lý của chúng.
Các mẫu hay đối tƣợng chuẩn là phần diện tích ở đó bằng các số liệu khoan và
các số liệu địa chất khác đã xác định đƣợc bản chất địa chất của từng đối tƣợng gây
ra trƣờng địa vật lý. Tùy thuộc vào các mục đích nghiên cứu khác nhau mà các đối
tƣợng chuẩn đƣợc lựa chọn khác nhau. Ví dụ nhƣ mục đích nghiên cứu là tìm kiếm
khoáng sản thì đối tƣợng chuẩn có thể là một vùng quặng,một trƣờng quặng, một
mỏ quặng hay một vỉa quặng. Còn khi khảo sát địa vật lý phục vụ công tác đo vẽ
bản đồ địa chất thì các đối tƣợng mẫu có thể là diện tích phát triển một loại đá nào
đó.
Tùy theo bản chất, đối tƣợng chuẩn có hai loại là đối tƣợng chuẩn mang các
thông tin đại diện và đối tƣợng chuẩn mang thông tin phủ nhận. Đối tƣợng đại diện
mang các thông tin có khả năng phân loại một hay một lớp đối tƣợng. Trong nhiều
trƣờng hợp có những đối tƣợng khác nhau nhƣng mang các đặc điểm trƣờng địa vật
lý tƣơng đồng. Khi đó ngƣời ta sử dụng đối tƣợng chuẩn mang thông tin phủ nhận
để loại bỏ những đối tƣợng không đúng ra khỏi tập kết quả nhận dạng. Cần lƣu ý để
công tác phân tích nhận dạng đạt hiệu quả tốt thì cần lựa chọn đối tƣợng chuẩn sao
cho các diện tích tồn tại các đối tƣợng chuẩn phải nằm xen kẽ với các phần diện tích
khảo sát cần nhận dạng.
Một đối tƣợng chuẩn nào đó có phạm vi ứng dụng là giới hạn và nó phụ thuộc
vào các yếu tố sau:
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
14
 Đối tƣợng chuẩn phải có giá trị thông tin tin cậy theo mục tiêu tìm
kiếm.
 Đối tƣợng chuẩn phải phù hợp với diện tích nghiên cứu.

 Mật độ lƣới khảo sát các loại thông tin phải tƣơng ứng với đối tƣợng
chuẩn lựa chọn
Đối tƣợng mang các dấu hiệu nhận biết, phân biệt nó với môi trƣờng xung
quanh, các dấu hiệu có khả năng phân biệt cao trong các loại thông tin thu thập sẽ
giúp quá trình xử lý số liệu cho kết tin cậy. Để đánh giá chất lƣợng của dấu hiệu
ngƣời ta sở dụng khái niệm lƣợng tin của dấu hiệu. Lƣợng tin của dấu hiệu là khả
năng mà dấu hiệu đó có khả năng phân biệt đƣợc các đối tƣợng khác nhau với nhau.
Khả năng này phụ thuộc vào việc các đối tƣợng của cùng một lớp có thƣờng xuyên
cho những giá trị cố định của nó hay không và các giá trị đó có phân bố rộng ra
ngoài giới hạn của các đối tƣợng của lớp đó hay không.
Trong quá trình nhận dạng không phải mọi dấu hiệu trƣờng đều quan trọng
nhƣ nhau, thậm chí có những dấu hiệu trƣờng địa vật lý hoàn toàn không chứa
thông tin về đối tƣợng khảo sát và có thê là những dấu hiệu nhiễu làm mờ nhạt đi
các thông tin hữu ích. Khi đƣa ra dấu hiệu này váo sử dụng để nhận dạng không làm
tăng mà ngƣợc lại làm giảm chất lƣợng nhận dạng đối tƣợng. Chính vì vậy, trong
quá trình xử lý cần tiến hành đánh giá lƣợng tin của từng dấu hiệu để từ đó chọn ra
những dấu hiệu có lƣợng tin đƣa vào xử lý và loại bỏ những dấu hiệu có lƣợng tin
thấp.
Dựa vào các giá trị trƣờng quan sát đƣợc trên các đối tƣợng chuẩn ngƣời ta
tiến hành xác định các đặc trƣng thống kê của trƣờng cho từng đối tƣợng. Các đặc
trƣng này đƣợc sử dụng tùy thuộc vào thuật toán nhận dạng áp dụng. Thƣờng các
đặc trƣng bao gồm:
 Đƣờng cong biến phân (hàm phân bố mật độ xác suất thực nghiệm).
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
15
 Kỳ vọng và phƣơng sai của trƣờng (tính thông qua đƣờng cong biến
phân).
Ngoài ra khi cần ngƣời ta tính cả hệ số tƣơng quan giữa các dấu hiệu, phƣơng
chủ đạo của dị thƣờng…

1.3.2. Các thuật toán nhận dạng có mẫu chuẩn
Các thuật toán nhận dạng có mẫu chuẩn là các thuật toán tiến hành xác định
bản chất địa chất của các đối tƣợng dựa vào việc so sánh tập hợp các dấu hiệu địa
vật lý của đối tƣợng nghiên cứu.
Việc lựa chọn thuật toán nhận dạng tùy thuộc vào các điều kiện sau:
 Số liệu xuất phát
 Tồn tại thông tin tiên nghiệm về đối tƣợng.
 Nhiệm vụ cụ thể của công tác địa vật lý.
Các thuật toán nhận dạng đƣợc xây dựng dựa vào các công thức toán khác
nhau nhƣ: toán logic, các hàm hồi quy và lý thuyết định nghiệm thống kê…dƣới
đây là một số thuật toán điển hình.
a. Phương pháp nhận dạng sử dụng toán logic
Trong các thuật toán logic, để nhận dạng đối tƣợng hoặc là ngƣời ta tính lƣợng
tin tổng, hoặc là xác định khoảng cách tổng.
Từ đối tƣợng chuẩn tìm đƣợc các dấu hiệu đặc trƣng và ngƣời ta tiến hành mã
hóa các dấu hiệu trƣờng bằng mã nhị phân gồm tập hợp số “0” và “1”.
Nếu x
kn
là giá trị trƣờng của dấu hiệu thứ n của mẫu thứ k thì :
- x
kn
=0 khi mẫu k không chứa dấu hiệu thứ n.
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
16
- x
kn
=1 khi mẫu k chứa dấu hiệu thứ n.
Bằng cách trên toàn bộ mẫu trên đƣợc mã hóa.
Tiếp theo, dựa vào tổ hợp số “0” và “1” (từ thông tin ) xác lập trên các mẫu

chuẩn ngƣời ta xác định các từ thông tin chuẩn cho từng lớp đối tƣợng. Từ thông tin
chuẩn cho một lớp (đối tƣợng) là từ thông tin gặp p lần ở các đối tƣợng chuẩn của
lớp đó và không gặp lần nào các đối tƣợng chuẩn thuộc lớp là chọn khoảng giá trị
thông tin chuẩn. Các thông tin này đƣợc gọi là tổ hợp dấu hiệu phức hợp đặc trƣng
cho các đối tƣợng chuẩn của cùng một lớp thì tổ hợp dấu hiệu nào đặc trƣng cho số
lƣợng mẫu chuẩn lớn hơn, tổ hợp dấu hiệu đó sẽ có lƣợng tin lớn hơn.
Cuối cùng là nhận dạng đối tƣợng nghiên cứu. Ở bƣớc này ngƣời ta tiến hành
kiểm tra xem có bao nhiêu tổ hợp dấu hiệu phức hợp của từng lớp gặp ở đối tƣợng
nghiên cứu. Nếu số lần gặp các tổ hợp dấu hiệu phức hợp của một lớp nào đó nhiều
hơn số lần gặp các tổ hợp phức hợp khác thì đối tƣợng nghiên cứu đƣợc xếp vào
lớp đó. Quá trình này đƣợc tiến hành cho tới khi đối tƣợng cuối cùng đƣợc nhận
dạng.
b. Phương pháp nhận dạng sử dụng phân tích hồi quy
Trong xử lý số liệu địa vật lý, thuật toán hồi quy đầu tiên đƣợc sử dụng để xử
lý số liệu đo địa vật lý giếng khoan và phân tích định lƣợng các tài liệu trọng lực.
Thực chất của phƣơng pháp này là xây dựng các hàm hồi quy xác định mối quan hệ
giữa các tham số địa chất cần tìm với các số liệu địa vật lý quan sát đƣợc bằng các
phƣơng pháp khác nhau. Ví dụ mối quan hệ giữa một bên là độ rỗng của đất đá với
bên kia là các số liệu đo điện trở, điện trƣờng tự nhiên, gamma…dọc thành giếng
khoan.
Thƣờng quá trình xấp xỉ các hàm hồi quy giới hạn bởi các đa thức bậc 1, bậc 2
hoặc đặc biệt có thể xấp xỉ với đa thức bậc lớn hơn. Ví dụ: nếu chỉ có hai dấu hiệu 1
và 2 thì hàm hồi quy đƣợc xấp xỉ bằng đa thức bậc 2 có dạng:
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
17
y
k
= a
k

x
ik
+ b
k
x
2x
+c
k
x
1k
x
2k
+ d
k
+ g
k
+ h
k
(1.12)

Các hệ số a
k
, b
k
, c
k
,d
k
, g
k

và h
k
trong biểu

thức (1.12) đƣợc xác định bằng
phƣơng pháp bình phƣơng tối thiểu theo các giá trị địa chất của tham số y
k
xác định
đƣợc trên các đối tƣợng chuẩn và các số liệu đo trƣờng địa vật lý của các dấu hiệu
x
1k


x
2k
của chính đối tƣợng đó.

Phƣơng trình hồi quy trên đƣợc xác định cho từng đối tƣợng chuẩn thứ k.
Ngoài phƣơng pháp hồi quy

ngƣời ta còn tiến hành xác định giá trị ngƣỡng y
k
cho
từng lớp đối tƣợng chuẩn. Cuối cùng đƣa các giá trị trƣờng đo đƣợc trên các đối
tƣợng cần nghiên cứu vào các phƣơng trình hồi quy tìm đƣợc trên đối tƣợng chuẩn
ta sẽ xác định đƣợc giá trị của tham số y
k
của đối tƣợng nghiên cứu.
Thuật toán phân tích hồi quy có ƣu điểm là dễ dàng đƣa vào xử lý bổ sung các
số liệu của dấu hiệu mới bằng cách đƣa thêm vào phƣơng trình của hàm hồi quy các

số hạng mới. Vì vậy, thuật toán này rất phù hợp cho việc xử lý các số liệu của tổ
hợp khảo sát gồm nhiều dấu hiệu khác nhau.
Tuy nhiên, thuật toán hồi quy cũng có nhƣợc điểm ở chỗ với một tập hợp số
liệu nhất định ứng với một giá trị sai số cho trƣớc có thể xấp xỉ đƣợc nhiều hàm hồi
quy. Nhƣợc điểm này thể hiện rõ nhất khi các dấu hiệu quan sát trƣờng liên quan
với nhau. Lý do trên không cho phép đƣa ra đƣợc các lý giải về ý nghĩa vật lý của
các hệ số của hàm hồi quy tìm đƣợc. Các lý giải vật lý chỉ có thể đƣợc đƣa ra khi
dạng của phƣơng trình này đƣợc xác định cho một mô hình vật lý cụ thể, còn quá
trình xấp xỉ hồi quy chỉ đƣợc tiến hành đơn thuần với mục đích xác định hệ số của
phƣơng trình hồi quy ứng với mô hình vật lý đó.
c. Phương pháp kiểm định giả thuyết thống kê
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
18
Thuật toán nhận dạng trên cơ sở mô hình thống kê đối tƣợng chuẩn trong phân
tích số liệu địa vật lý thƣờng sử dụng các thông số nhƣ: tỷ số sự thật L(x) và tổng
lƣợng thông tin J(1:2,x).
Giá trị các thông số đƣợc tính theo công thức:
L(x) = (1.13)

J(1:2,x) = (1.14)

Trong đó:
P
1
(x), P
2
(x) là các xác suất bắt gặp giá trị dấu hiệu x cùng với các đối tƣợng
tƣơng ứng của lớp 1 và lớp 2 (ví dụ lớp quặng và lớp không quặng). Khi sử dụng
đối tƣợng chuẩn cho lớp 1 (lớp quặng) thì các biểu thức P

2
(x) đƣơc thay bằng 1.

x là vecto giá trị các dấu hiệu đƣợc sử dụng x
1
, x
2
,…x
k
(ví dụ các hàm lƣợng
q
u
,

q
th
,q
k
, …).
Khi các dấu hiệu x
1
, x
2
,…x
k
đƣợc xem nhƣ là không phụ thuộc nhau thì xác
suất của đại lƣợng n chiều của tổ hợp n dấu hiệu đƣợc tính:
P(x)= P(x
1
). P(x

2
). P(x
3
) P(x
k
) (1.15)
L(x) = = L(x
1
).L(x
2
)…L(x
k
) (1.16)

J(1:2,x) = J(1:2,x
1
)+ J(1:2,x
2
)+ …+J(1:2,x
k
) (1.17)
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
19

Nếu sự phụ thuộc của các dấu hiệu là rõ và sự phân bố của chúng tuân theo
luật chuẩn thì để nhận dạng các đối tƣợng thuộc lớp 1 và lớp 2 ngƣời ta thƣờng sử
dụng các hàm phân giải bậc 1 (R
1
) hoặc bậc 2 (R

2
) đối với các tham số x
1
, x
2
,…x
n.
.
Các hàm này đƣợc biểu diễn nhƣ sau

:
R
1
= (1.18)

R
2
= (1.19)

Trong đó các hệ số: a
i
, b
ij
, c
i
đƣợc xác định từ các ma trận thông tin các dấu
hiệu của đối tƣợng thứ 1 và thứ 2. Thông qua các “diện tích đối tƣợng chuẩn” ngƣời
ta xác định đƣợc các vecto giá trị các dấu hiệu sử dụng x (trong trƣờng hợp các dấu
hiệu đƣợc xem là không phụ thuộc nhau ) hoặc các hệ số a
i

, b
ij
, c
i
(trong trƣờng
hợp các dấu hiệu phụ thuộc nhau). Sau đó tính giá trị L(x), J(1:2,x) hoặc R
1
, R
2
phổ
các giá trị này lên khắp diện tích khảo sát và biểu diễn chúng lên bản đồ. Đối sánh
các giá trị này với các giá trị của đối tƣợng chuẩn có thể nhận biết và khoanh định
đƣợc các diện tích đồng dạng với đối tƣợng chuẩn. Các dấu hiệu đƣợc lựa chọn
thƣờng là một tổ hợp nào đó trong số các tham số thu đƣợc.
1.3.3. Các thuật toán nhận dạng không có mẫu chuẩn
a. Thuật toán kiểm chứng thống kê
thuật toán này tiến hành phân loại trƣờng khi các dấu hiệu trƣờng hoàn toàn
độc lập với nhau. Ban đầu ngƣời ta sử dụng bộ lọc để tách các dị thƣờng ra khỏi
phông nhiễu cho từng dấu hiệu trƣờng. Kết quả lọc có phép nhận đƣợc các số liệu
trƣờng chủ yếu gồm các dị thƣờng. Tiếp theo phân loại các dị thƣờng thành các lớp
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
20
dị thƣờng. Mỗi lớp dị thƣờng gồm các dị thƣờng có các đặc trƣng thống kê giống
nhau. Để phân loại các dị thƣờng, đầu tiên ngƣời ta phân của khu vực khảo sát
thành các diện tích cơ sở, sau đó dựa vào kết quả phân chia các giá trị trƣờng ở mỗi
cửa sổ ngƣời ta dựng các đƣờng cong biến phân đặc trƣng cho cửa sổ đó. Cuối
cùng, để phân lớp các dị thƣờng ngƣời ta sử dụng các chỉ tiêu X
2
để so sánh và xếp

loại các đƣờng cong biến phân. Các diện tích có ƣớc lƣợng phân bố mật độ xác suất
giống nhau đƣợc sắp xếp vào một lớp.
Giai đoạn cuối cùng của quá trình nhận dạng là giai đoạn thuật toán tiến hành
xác định số hiệu của lớp tổng hợp.
Với mục đích này, dựa vào các đƣờng cong biến phân dựng đƣợc cho từng
dấu hiệu ngƣời ta xác định giá trị trung bình và phƣơng sai sắp xếp các giá trị trung
bình theo thứ tự tăng dần. Sau đó ngƣời ta dựa vào chỉ tiêu xác suất hậu nghiệm cực
đại ngƣời ta quyết định xếp loại đối tƣợng khảo sát và các lớp khác nhau. Bằng cách
trên, toàn bộ khu vực khảo sát đƣợc phân chia thành một số diện tích có hình dạng
bất kỳ, ở đó dị thƣờng của các dấu hiệu khác nhau đè lên nhau.
b. Thuật toán K trung bình
Nội dung thuật toán nhƣ sau: Giả sử tồn tại n đối tƣợng, nhiệm vụ đặt ra là
phân chia toàn bộ n đối tƣợng thành M lớp với M<<n.
Để giải quyết nhiệm vụ trên, lúc đầu ngƣời ta chọn hú họa từ n đối tƣợng ra k
đối tƣợng, k đối tƣợng đƣợc chọn này xem nhƣ các mẫu chuẩn xuất phát. Tiếp theo
là tiến hành chính xác hóa liên tiếp các mẫu chuẩn chọn đƣợc bằng cách so sánh các
mẫu chuẩn với các đối tƣợng còn lại. Sau mỗi lần chọn tập hợp các mẫu chuẩn E
v

chọn đƣợc ở lần chọn thứ v sẽ thay cho các mẫu chuẩn ở lần chọn thứ v-1 ( lần
trƣớc đó).
Nếu ký hiệu tập hợp mẫu chuẩn (E
v
) chọn đƣợc ở lần thứ v là:
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến
21
E
v
= { e

1
v
, e
2
v
,… e
k
v
} với v= 0, 1, 2,…
Với kí hiệu này mẫu chuẩn xuất phát là:
E
0
={ e
1
0
, e
2
0
, …e
k
0
}
Các mẫu chuẩn này chính là các mẫu đƣợc chọn ra từ vòng đầu tiên (vòng số
0) của quá trình lặp. Tiếp theo vòng số 0 thuật toán gọi tiếp số x
k+1
và và tìm xem
trong k mẫu e
i
0
, mẫu chuẩn nào gần nhất với nó. Nếu tìm đƣợc, thì mẫu chuẩn thuộc

tập hợp E
0
tìm đƣợc này đƣợc thay thế bằng mẫu chuẩn mới. Mẫu chuẩn mới này có
giá trị e
i
1
đƣợc tính nhƣ giá trị trọng tâm giữa các giá trị của mẫu chuẩn cũ và giá trị
của của đối tƣợng gắn kết với nó x
k+1.
Sau quá trình hiệu chỉnh ở vòng 1, bằng phƣơng pháp mô tả trên thuật toán sẽ
tiến hành hiệu chỉnh ở các lần tiếp theo, cho tới khi đối tƣợng cuối cùng đƣợc gọi
ra.
Sau khi tập các mẫu các mẫu chuẩn đƣợc chính xác hóa, thuật toán tiến hành
phân loại toàn bộ số lƣợng n các đối tƣợng theo tập hợp các dấu hiệu thành M lớp
dựa vào nguyên tắc khoảng cách tối thiểu.
1.3.4. Quyết định sự tồn tại của đối tƣợng và đánh giá chất lƣợng xử lý
Đối với thuật toán nhận dạng có mẫu chuẩn việc quyết định nghiệm chủ yếu
dựa vào chỉ số tƣơng đồng. Chỉ số này xác định mức độ giống nhau hoặc khác nhau
giữa đối tƣợng nghiên cứu và đối tƣợng chuẩn theo lƣợng thông tin tổng hợp của
toàn bộ các dấu hiệu (trƣờng địa vật lý quan sát).
Phụ thuộc vào từng loại thuật toán nhận dạng ngƣời ta chọn những đại lƣợng
khác nhau để đánh giá chỉ số tƣơng đồng. Đối với thuật toán nhận dạng kiểm chứng
thống kê thì chỉ số tƣơng đồng chính tƣơng đồng chính là hệ số tƣơng thích thích
hay xác suất hậu nghiệm P( A
k
/B
j
). Đối với thuật toán loại này để giải quyết
Trường đại học Khoa Học Tự Nhiên Khoa Địa Chất
Luận văn thạc sĩ khoa học Nguyễn Trí Tiến

22
nghiệm ngƣời ta đƣa ra các giá tri ngƣỡng của hệ số tƣơng thích và xác suất hậu
nghiệm. Giá trị của chỉ số tƣơng đồng sẽ đƣợc so sánh với giá trị ngƣỡng này để
quyết định đối tƣợng nghiên cứu giống hay không giống với mẫu.
Chất lƣợng của kết quả xử lý đƣợc đánh giá dựa vào sai số nhận dạng các đối
tƣợng kiểm chứng. Các đối tƣợng kiểm chứng là các đối tƣợng mà bản chất địa chất
của chúng đã đƣợc xác định rõ, song chúng không đƣợc chọn là mẫu chuẩn để nhận
dạng mà đƣợc dùng làm các đối tƣợng để kiểm tra các kết quả nhận dạng.
Sai số nhận dạng đƣợc tính bằng tỷ số các đối tƣợng kiểm chứng đƣợc nhận
dạng đúng so với tổng các đối tƣợng kiểm chứng đƣợc đem ra nhận dạng.
Đối với các thuật toán nhận dạng kiểm chứng thống kê ngƣời ta sử dụng xác
suất nhận dạng sai lầm để đánh giá chất lƣợng xử lý. Xác suất này đƣợc xác định
dựa vào việc tính tích phân hàm phân bố mật độ xác suất của hệ số tƣơng thích. Các
hàm này đƣợc xác định riêng cho các đối tƣợng kiểm chứng của từng lớp một.






×