Tải bản đầy đủ (.pdf) (86 trang)

Luận văn thạc sĩ khoa học: Nghiên cứu áp dụng phương pháp khoảng cách – tần suất – nhận dạng mới trong xử lý – phân tích số liệu địa vật lý

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.27 MB, 86 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
---------------------

Nguyễn Thị Thu Hiền

NGHIÊN CỨU ÁP DỤNG PHƢƠNG PHÁP KHOẢNG CÁCH –TẦN SUẤT –
NHẬN DẠNG MỚI TRONG XỬ LÝ- PHÂN TÍCH SỐ LIỆU ĐỊA VẬT LÝ

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội – 2016


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
---------------------

Nguyễn Thị Thu Hiền

NGHIÊN CỨU ÁP DỤNG PHƢƠNG PHÁP KHOẢNG CÁCH – TẦN SUẤT –
NHẬN DẠNG MỚI TRONG XỬ LÝ- PHÂN TÍCH SỐ LIỆU ĐỊA VẬT LÝ

Chuyên ngành: Vật lý địa cầu.
Mã số: 60440111

LUẬN VĂN THẠC SĨ KHOA HỌC
Người hướng dẫn khoa học
PGS.TS.VÕ THANH QUỲNH

Hà Nội - 2016




LỜI CẢM ƠN
Để hoàn thành quyển luận văn này, trước tiên, với lòng kính trọng và biết ơn
sâu sắc, tôi xin gửi lời cảm ơn tới PGS.TS. Võ Thanh Quỳnh - người thầy trực tiếp
hướng dẫn khoa học và chỉ bảo tôi trong suốt quá trình thực hiện đề tài.
Tôi xin gửi lời cảm ơn tới ThS. Nguyễn Viết Đạt người đã tận tình giúp đỡ
tôi trong suốt quá trình làm luận văn. Tôi chân thành cảm ơn các thầy cô trong Bộ
môn Vật lý Địa cầu – Trường Đại học Khoa học tự nhiên – Đại học Quốc gia Hà
Nội đã trang bị kiến thức và có những đóng góp hết sức quý báu để tôi hoàn thành
luận văn này.
Cuối cùng cho phép tôi bày tỏ lòng biết ơn vô hạn tới gia đình và bạn bè,
những người đã luôn quan tâm, động viên và là chỗ dựa tinh thần vững chắc của tôi
trong những thời khắc khó khăn nhất.
Do điều kiện thời gian và trình độ nên bản luận văn không tránh khỏi những
thiếu sót, rất mong nhận được sự góp ý quý báu của thầy cô và các bạn.
Tôi xin chân thành cảm ơn!
Hà Nội, ngày 16 tháng 2 năm 2016
Học viên

Nguyễn Thị Thu Hiền


MỤC LỤC

MỞ ĐẦU ......................................................................................................... 1
CHƢƠNG 1.CƠ SỞ LÝ THUYẾT XỬ LÝ TỔ HỢP SỐ LIỆU ĐỊA VẬT
LÝ .................................................................................................................... 3
1.1. Lý thuyết xử lý tổ hợp số liệu Địa Vật lý ........................................... 3
1.1.1. Xây dựng mô hình và xác định phương pháp ................................. 3

1.1.2. Ước lượng và đánh giá các đặc trưng của đối tượng chuẩn.......... 4
1.1.3. Chọn thuật toán xử lý ...................................................................... 6
1.1.4. Định nghiệm về sự tồn tại của đối tượng ....................................... 7
1.1.5. Đánh giá chất lượng xử lý ............................................................. 7
1.2. Lý thuyết các thuật toán nhận dạng ................................................... 7
1.2.1. Các thuật toán nhận dạng có mẫu chuẩn ....................................... 7
1.2.2. Các thuật toán nhận dạng không có mẫu chuẩn .......................... 11
CHƢƠNG 2.HỆ PHƢƠNG PHÁP PHÂN TÍCH TÀI LIỆU ĐỊA VẬT
LÝ MÁY BAY .............................................................................................. 13
2.1. Các phƣơng pháp phân tích tài liệu địa vật lý máy bay ................. 13
2.1.1. Các phương pháp tách trường ....................................................... 13
2.1.2. Nhóm các phương pháp thống kê nhận dạng ............................... 13
2.1.3. Các phương pháp thống kê thực nghiệm ....................................... 14
2.1.4. Một số phương pháp khác ............................................................. 14
2.2. Phƣơng pháp Tần suất - Nhận dạng ................................................ 15
2.2.1. Nội dung cơ bản của phương pháp phân tích tần suất ................. 15
2.2.2. Phương pháp Tần suất-Nhận dạng ............................................... 17
2.3. Phƣơng pháp Khoảng cách- Tần suất- Nhận dạng ........................ 20
2.3.1. Nội dung cơ bản của phương pháp phân tích khoảng cách khái
quát ........................................................................................................ 20
2.3.2. Phương pháp Khoảng cách – Tần suất – Nhận dạng ................... 22


CHƢƠNG 3: KẾT QUẢ PHÂN TÍCH THỰC NGHIỆM TRÊN TÀI
LIỆU THỰC TẾ VÙNG KHÁNH THƢỢNG........................................... 28
3.1. Thông tin về khu vực nghiên cứu .................................................... 28
3.2. Tài liệu thu thập, tính toán về khu vực nghiên cứu ........................ 30
3.2.1. Tài liệu thu thập về khu vực ........................................................... 30
3.2.2. Thực hiện phân tích thử nghiệm phương pháp Khoảng cách - tần
suất - nhận dạng. ...................................................................................... 34

3.2.3. Phân tích thử nghiệm với mục tiêu phân định một ranh giới địa chất
theo tài liệu địa vật lý máy bay. ............................................................... 41
KẾT LUẬN ................................................................................................... 55
TÀI LIỆU THAM KHẢO ........................................................................... 57
PHỤ LỤC ...................................................................................................... 59


DANH MỤC HÌNH

Hình 2.1.Sơ đồ các bước của phương pháp phân tích Tần suất – Nhận dạng ....... 19
Hình 2.2.Sơ đồ các bước thực hiện phân tích theo phương pháp Khoảng cách
– Tần suất – Nhận dạng.................................................................................. 24
Hình 3.1.Vị trí khu vực nghiên cứu ............................................................... 28
Hình 3.2.Địa hình khu vực nghiên cứu .......................................................... 28
Hình 3.3.Bản đồ hàm lượng Uran .................................................................. 31
Hình 3.4.Bản đồ hàm lượng Thori ................................................................. 31
Hình 3.5.Bản đồ hàm lượng kali .................................................................... 32
Hình 3.6.Bản đồ hàm lượng kênh tổng .......................................................... 32
Hình 3.7.Kết quả phân vùng triển vọng khoáng sản theo đề án bay đo cho khu
vực nghiên cứu ............................................................................................... 33
Hình 3.8.Kết quả phân chia các thành tạo địa chất của khu vực theo tài liệu
địa vật lý máy bay. ......................................................................................... 42
Hình 3.9.Vùng chọn để xác định lại ranh giới các thành tạo (vùng khoanh màu
xanh). ............................................................................................................... 43
Hình 3.10.Vị trí lấy đối tượng mẫu để thực hiện phân tích thử nghiệm ........ 43
Hình 3.11. Sơ đồ đường đồng mức hệ số đồng dạng thành lập từ kết quả phân
tích .................................................................................................................. 53
Hình 3.12. Sơ đồ 2 lớp đường đồng mức và lớp phân chia thành tạo ban đầu. ..... 53
Hình 3.13.Ranh giới của 2 thành tạo được phân chia theo phương pháp
Khoảng cách – Tần Suất – Nhận dạng. .......................................................... 54



DANH MỤC BẢNG

Bảng 3.1.Tổng hợp các tính chất thu thập và tính toán được của khu vực. ... 34
Bảng 3.2.Bảng kết quả ................................................................................... 35
Bảng 3.3.Bảng kết quả sắp xếp lại các tính chất theo thứ tự giảm dần ......... 36
Bảng 3.4.Kết quả xác định khoảng giá trị đặc trưng các tính chất của đối
tượng mẫu ....................................................................................................... 37
Bảng 3.5.Ma trận thông tin của đối tượng 1 được chuyển đổi bằng khoảng giá
trị đặc trung của đối tượng mẫu: .................................................................... 38
Bảng 3.6.Kết quả phân tích hệ số đồng dạng cho 8 đối tượng với đối tượng 6
là đối tượng mẫu............................................................................................. 40
Bảng 3.7.Bảng số liệu đối tượng mẫu 1 ......................................................... 44
Bảng 3.8.Bảng số liệu đối tượng mẫu 2 ......................................................... 46
Bảng 3.9.Bảng trích lược số liệu của lưới điểm............................................. 51
Bảng 3.10.Kết quả phân tích Khoảng cách – Tần suất – Nhận dạng cho vùng
diện tích đã chọn. ........................................................................................... 52


MỞ ĐẦU
Địa vật lý hàng không ( Airborne Geophysics) là một lĩnh vực của Địa Vật
lý thăm dò, dùng máy bay làm phương tiện để bay đo các trường Địa vật lý trên đất
liền hoặc thăm dò trên thềm lục địa, nhằm nghiên cứu thạch quyển – thủy quyển.
Những kết quả đạt được của công tác địa vật lý hàng không ở nước ta trong thời
gian qua đã và đang ngày càng phát huy vai trò và hiệu quả to lớn trong việc tìm
kiếm và dự báo các khoáng sản có ích.
Những kết quả đạt được của công tác địa vật lý máy bay ở nước ta trong
thời gian qua đã có hiệu quả to lớn trong việc tham gia giải quyết nhiều nhiệm vụ
địa chất quan trọng, đặc biệt là trong việc tìm kiếm và dự báo các khoáng sản có

ích. Tuy nhiên, trong thực tế công tác địa vật lý máy bay cũng đang bộc lộ một số
hạn chế, mà chủ yếu là ở khâu xử lý và phân tích tài liệu, cần được đầu tư nghiên
cứu khắc phục, nhằm không ngừng nâng cao hơn nữa hiệu quả của phương
pháp.Trong những năm gần đây công tác xử lí và phân tích tài liệu địa vật lý máy
bay ở nước ta cũng đã có được những bước tiến đáng kể. Thông qua các đề tài
nghiên cứu, một số tác giả cũng đã tiến hành những nghiên cứu, phân tích thử
nghiệm trên các tài liệu thực tế bằng nhiều phương pháp khác nhau, trong đó đáng
chú ý là nhóm các phương pháp thống kê-nhận dạng và thu được kết quả tốt.
Các phương pháp nhận dạng đóng vai trò hết sức quan trọng trong xử lý,
phân tích tài liệu địa vật lý, đặc biệt là đối với các dạng số liệc có đặc tính phân bố
ngẫu nhiên như các số liệu địa hóa, các số liệu phổ gamma v.v…. Hiện nay trong
địa vật lý có rất nhiều thuật toán nhận dạng hiện đại, được tự động hóa bằng các hệ
phần mềm mạnh chuyên dụng, đáng chú ý là bộ chương trình phân tích phổ-thống
kê do Giáo sư, Viện sĩ Ni-Ki-Tin cùng các đồng sự đề xuất, xây dựng. Tuy nhiên
trên thực tế khối lượng tài liệu cũng như số lượng các chủng loại thông tin thu
được trên các đối tượng địa chất ngày càng rất lớn. Trong đó số lượng các tham số
đầu vào của các chương trình phân tích nhận dạng hiện có thường bị giới hạn. Việc
sử dụng các tổ hợp thông tin khác nhau để tiến hành phân tích nhận dạng nhiều khi
cho những kết quả rất khác nhau. Để nâng cao độ tin cậy của các phương pháp
phân tích nhận dạng đã có những công trình nghiên cứu theo hướng ứng dụng lớp

1


bài toán đánh giá lựa chọn thông tin để lựa chọn những tổ hợp thông tin chất lượng
cao trước khi tiến hành phân tích nhận dạng.
Phương pháp khoảng cách – tần suất – nhận dạng là một trong các phương
pháp phân tích tài liệu mới đã được áp dụng và mang lại kết quả khả quan trong
công tác xử lý phân tích tài liệu Địa Vật lý máy bay, một nguồn tài liệu đồ sộ và
hết sức phong phú nhưng chưa được khai thác triệt để ở nước ta hiện nay.

Đề tài luận văn “Nghiên cứu áp dụng phương pháp Khoảng cách– Tần suất
– Nhận dạng mới trong phân tích- xử lý số liệu Địa vật lý” mà học viên lựa chọn
nhằm tìm hiểu, áp dụng phương pháp phân tích tổ hợp các tài liệu địa vật lý máy
bay góp phần đẩy nhanh và nâng cao chất lượng của công tác xử lí phân tích tài liệu
địa vật lý máy bay.
Luận văn được thực hiện với nhiệm vụ chính sau:
- Tìm hiểu về các thuật toán phân tích và đánh giá lựa chọn thông tin.
- Tìm hiểu về các phương pháp phân tích trong xử lý phân tích số liệu Địa vật lý
- Đánh giá, phân tích thử nghiệm phương pháp với tài liệu thực tế vùng Khánh
Thượng trên cơ sở áp dụng bổ sung phương pháp Khoảng cách– Tần suất – Nhận
dạng mới.
Từ những nhiệm vụ trên, luận văn được viết với cấu trúc gồm:
- Mở đầu
- Chương 1: Cơ sở lý thuyết phân tích- xử lý số liệu Địa vật lý
- Chương 2: Hệ phương pháp phân tích tài liệu Địa vật lý máy bay
- Chương 3: Kết quả phân tích thực nghiệm trên tài liệu thực tế vùng Khánh
Thượng.
- Kết luận

2


CHƢƠNG 1.CƠ SỞ LÝ THUYẾT XỬ LÝ TỔ HỢP SỐ LIỆU ĐỊA VẬT LÝ
1.1.

Lý thuyết xử lý tổ hợp số liệu Địa Vật lý
Xử lí số liệu về cơ bản là dựa trên nhiều loại thông tin khác nhau để giải

quyết được các nhiệm vụ đặt ra phù hợp với điều kiện kinh tế và kĩ thuật cho phép.
Không chỉ riêng trong địa vật lý mà nhiều lĩnh vực khác cũng sử dụng xử lí tổ hợp

dữ liệu để nâng cao chất lượng xử lí.
Xử lý số liệu Địa vật lý là một quá trình phức tạp phụ thuộc vào mục đích
nghiên cứu và dạng các số liệu khác nhau. Một cách khái quát có thể phân chia quá
trình này theo các bước cơ bản sau:
- Xây dựng mô hình và xác định phương pháp
- Ước lượng và đánh giá các đặc trưng của đối tượng chuẩn.
- Chọn thuật toán xử lý
- Định nghiệm về sự tồn tại của đối tượng cần tìm
- Đánh giá chất lượng xử lý
1.1.1. Xây dựng mô hình và xác định phƣơng pháp [1] [10]
Để xử lý tổ hợp số liệu Địa vật lý người ta chủ yếu sử dụng các mô hình
thống kê vì các đối tượng khảo sát cần nghiên cứu có vị trí, kích thước, tính chất
vật lý không biết trước nên chúng được xem như các đối tượng ngẫu nhiên. Mặt
khác, các trường vật lý do các đối tượng địa chất tạo ra thường bị các loại nhiễu
làm méo nên các dấu hiệu trường Địa vật lý khảo sát cũng mang tính ngẫu nhiên.
Với mô hình để được nhiệm vụ tiếp theo là lựa chọn các phương pháp nhận dạng
tương ứng, tiến hành xử lý theo mô hình và giải quyết các nhiệm vụ bài toán đặt ra.
Hiện nay trong công tác xử lý-phân tích số liệu địa vật lý có rất nhiều
phương pháp nhận dạng, có thể chia chúng thành hai nhóm: nhóm các phương
pháp nhận dạng theo đối tượng chuẩn và nhóm các phương pháp nhận dạng không
có đối tượng chuẩn.
Nhóm các phương pháp nhận dạng theo đối tượng chuẩn được áp dụng khi
chúng ta biết được lớp đối tượng và biết được đặc trưng thống kê của các trường
địa vật lý đối với từng lớp đối tượng.

3


Khi xử lý số liệu địa vật lý bằng thuật toán nhận dạng có mẫu chuẩn, nhiệm vụ
đặt ra là cần xây dựng các thuật toán hay đề xuất các chỉ tiêu nhận dạng đảm bảo để

phân loại các đối số liệu quan sát thành hai lớp hoặc với số lớp nhiều hơn 2 khi có
trước các đặc trưng thống kê của mỗi loại dấu hiệu ứng với các đối tượng chuẩn.Vấn
đề mang tính quyết định là lựa chọn đối tượng chuẩn, trên đó tiến hành nghiên cứu các
đặc trưng thông kê của các dấu hiệu (các trường địa vật lý). Điều này đặc biệt quan
trọng khi khảo sát các diện tích có cấu trúc địa chất phức tạp, ở đó các trường địa vật
lý quan sát được biến đổi mạnh ngay cả ở những diện tích nhỏ.
Nhóm các phương pháp nhận dạng không có đối tượng chuẩn được áp
dụng khi chúng ta không biết trước các đặc trưng thống kê của các dấu hiệu ứng
với các lớp đối tượng cần tìm. Khi đó quá trình nhận dạng đơn thuần chỉ thực hiện
nhiệm vụ phân loại trường.
Phương pháp xử lý số liệu bằng thuật toán nhận dạng không có đối tượng
chuẩn được thực hiện như sau: bằng thuật toán phân loại trường lựa chọn được,
tiến hành chia các điểm quan sát thành một số nhất định các diện tích đồng nhất về
dấu hiệu tổ hợp. Bản chất địa chất của từng diện tích phân ra được có thể không
xác định được; để xác định chúng đòi hỏi phải có các số liệu khoan hoặc nghiên
cứu bổ sung về tính chất vật lý của đá.
1.1.2. Ƣớc lƣợng và đánh giá các đặc trƣng của đối tƣợng chuẩn.[1] [10]
a. Ước lượng các đặc trưng thống kê
Để xử lý tổ hợp các số liệu bằng phương pháp nhận dạng có mẫu chuẩn thì
công việc mang tính quyết định là lựa chọn các mẫu chuẩn và xác định các đặc
trưng thống kê các trường địa vật lý của chúng.
Các mẫu hay đối tượng chuẩn là phần diện tích ở đó bằng các số liệu khoan
và các số liệu địa chất khác đã xác định được bản chất địa chất của các đối tượng
gây ra trường địa vật lý. Tùy thuộc vào các mục đích nghiên cứu khác nhau mà các
đối tượng chuẩn được lựa chọn khác nhau.
Dựa vào các giá trị trường quan sát được trên các đối tượng chuẩn người ta
tiến hành xác định các đặc trưng thống kê của trường cho từng loại đối tượng. Các
đặc trưng này bao gồm:

4



 Đường cong biến phân (hàm phân bố mật độ xác suất thực nghiệm).
 Kỳ vọng và phương sai của trường (thông qua đường cong biến phân ).
Ngoài ra khi cần người ta còn tính cả hệ số tương quan giữa các dấu hiệu,
phương chủ đạo của các dị thường…
Điều đặc biệt cần lưu ý để công tác phân tích nhận dạng đạt hiệu quả tốt thì
cần lựa chọn các đối tượng chuẩn sao cho các diện tích tồn tại đối tượng chuẩn
phải nằm xen kẽ với các phần diện tích khảo sát cần nhận dạng.
Đối với nhóm các phương pháp nhận dạng không có đối tượng chuẩn để xác
định các đặc trưng thống kê của trường người ta chia khu vực khảo sát thành các
diện tích cơ sở – cửa sổ. Kích thước của các diện tích cơ sở hay số lượng điểm
quan sát trên mỗi diện tích cơ sở được lựa chọn dựa vào tỉ lệ bản đồ và kích thước
dị thường mà các đối tượng trường tạo ra. Diện tích cơ sở có thể nhỏ nhất cần chọn
để trong tương lai có thể đề nghị (hoặc không đề nghị) đưa vào thăm dò hoặc khảo
sát chi tiết. Diện tích cơ sở cũng có thể xem như cửa sổ trượt, các đặc trưng thống
kê của trường trong cửa sổ đó được gán cho điểm trung tâm cửa sổ.
b. Đánh giá lượng tin của dấu hiệu
Lượng tin của dấu hiệu là khả năng mà dấu hiệu đó có thể phân biệt được
các đối tượng khác nhau với nhau. Khả năng này phụ thuộc vào việc các đối tượng
của cùng một lớp có thường xuyên cho những giá trị cố định của dấu hiệu đó hay
không và các giá trị đó có phân bố rộng ra ngoài giới hạn của các đối tượng của lớp
đó hay không.
Người ta đưa ra các khái niệm lượng tin từng phần, lượng tin tổng (tích
phân) và lượng tin tổng hợp. Lượng tin từng phần là lượng tin của những dải giá trị
hay của nhóm các giá trị riêng biệt của một dấu hiệu nhất định. Lượng tin tổng là
lượng tin chứa toàn bộ các giá trị của một dấu hiệu (một loại trường) nào đó.
Lượng tin tổng hợp là lượng tin tính cho những dạng kết hợp khác nhau của nhiều
dấu hiệu.
Trong quá trình nhận dạng không phải mọi dấu hiệu trường đều quan trọng

như nhau, thậm chí có những dấu hiệu trường địa vật lý hoàn toàn không chứa
thông tin về đối tượng khảo sát và có thể là những dấu hiệu nhiễu làm mờ nhạt đi
5


các thông tin hữu ích. Khi đưa các dấu hiệu này vào sử dụng để nhận dạng không
làm tăng mà ngược lại làm giảm chất lượng nhận dạng đối tượng. Chính vì vậy,
trong quá trình xử lý cần tiến hành đánh giá lượng tin của từng dấu hiệu để từ đó
chọn ra những dấu hiệu có lượng tin cao đưa vào xử lý và loại bỏ những dấu hiệu
có lượng tin thấp.
1.1.3. Chọn thuật toán xử lý [1] [10]
Các thuật toán được lựa chọn để xử lý sẽ ảnh hưởng tới chất lượng xử lý. Để
chất lượng xử lý cao khi lựa chọn các thuật toán người ta dựa vào các yếu tố sau:
a. Nhiệm vụ địa chất đặt ra
Nếu nhiệm vụ của khảo sát địa vật lý là tìm kiếm mỏ thì thuật toán phải có
khả năng nhận dạng hai lớp đối tượng: lớp quặng và lớp không quặng. Còn nếu
nhiệm vụ của khảo sát địa vật lý là phục vụ công tác đo vẽ bản đồ địa chất thì thuật
toán phải đảm bảo khả năng cùng một lúc nhận dạng được nhiều lớp đối tượng liên
quan với nhiều loại đất đá và các yếu tố kiến tạo khác nhau.
b. Đặc điểm chứa thông tin của số liệu gốc
Nếu các số liệu địa vật lý chứa thông tin ở hai mức: mức “có”- mức dị
thường và mức “không”- mức phông thì người ta sử dụng các thuật toán logic.
Trong trường hợp các số liệu địa vật lý chứa các thông tin định lượng thì người ta
sử dụng các thuật toán kiểm chứng thống kê.
c. Tính độc lập và không độc lập
Khi các dấu hiệu trường địa vật lý độc lập nhau thì có thể sử dụng các thuật
toán đơn giản. Còn trong trường hợp các dấu hiệu liên quan với nhau thì các thuật
toán được sử dụng phức tạp hơn.
d. Mức độ đầy đủ của các thông tin tiên nghiệm
Mức độ đầy đủ của các thông tin tiên nghiệm chính là mức độ hoàn chỉnh

của các mô hình vật lý địa chất. Trong trường hợp tồn tại các đối tượng chuẩn,
nghĩa là khi biết rõ mô hình vật lý địa chất của các đối tượng thì để xử lý người ta
sử dụng các thuật toán nhận dạng có mẫu chuẩn để phân loại trường.

6


1.1.4. Định nghiệm về sự tồn tại của đối tƣợng [1] [10]
Đối với các thuật toán nhận dạng có mẫu chuẩn việc quyết định nghiệm chủ
yếu dựa vào chỉ số tương đồng. Chỉ số này xác định mức độ giống nhau hoặc khác
nhau giữa đối tượng nghiên cứu với đối tượng chuẩn theo lượng thông tin tổng hợp
của toàn bộ các dấu hiệu.
Đối với các thuật toán nhận dạng không có mẫu chuẩn thì quá trình nhận
dạng chỉ đơn thuần thực hiện việc phân chia diện tích khảo sát thành các phần đồng
nhất theo tổng hợp các dấu hiệu. Việc phân loại ở đây được tiến hành dựa vào các
chỉ tiêu định nghiệm khác nhau. Chỉ tiêu này phụ thuộc rất nhiều vào số lượng các
lớp đối tượng cần phân chia là bao nhiêu.
1.1.5. Đánh giá chất lƣợng xử lý [1] [10]
Đối với các thuật toán nhận dạng có mẫu chuẩn, chất lượng xử lý được đánh
giá dựa vào sai số nhận dạng các đối tượng kiểm chứng. Các đối tượng kiểm chứng
là các đối tượng mà bản chất địa chất của chúng đã được xác định rõ, song chúng
không được chọn làm đối tượng mẫu mà là đối tượng được dùng làm kiểm tra các
kết quả nhận dạng.
Đối với các thuật toán nhận dạng không đối tượng chuẩn người ta sử dụng
xác suất nhận dạng sai lầm để đánh giá chất lượng xử lý. Xác suất này được tính
dựa vào việc tính tích phân hàm phân bố mật độ xác suất của một hệ số gọi là hệ số
tương thích. Các hàm này được xác định riêng cho các đối tượng kiểm chứng của
từng lớp một.
1.2.


Lý thuyết các thuật toán nhận dạng [1] [10]
Hiện nay, trong địa vật lý người ta sử dụng nhiều phương pháp nhận dạng

hiện đại, được tự động hóa bằng các phần mềm mạnh. Tuy nhiên có thể chia chúng
thành 2 nhóm: nhóm có phương pháp nhận dạng theo đối tượng chuẩn (có thông
tin tiên nghiệm) và nhóm có phương pháp nhận dạng không có đối tượng chuẩn
(không có thông tin tiên nghiệm).
1.2.1. Các thuật toán nhận dạng có mẫu chuẩn
Các thuật toán nhận dạng có mẫu chuẩn là các thuật toán tiến hành xác định
bản chất địa chất của các đối tượng dựa vào việc so sánh tập hợp các dấu hiệu địa

7


vật lý đặc trưng cho đối tượng chuẩn với tập hợp các dấu hiệu địa vật lý của đối
tượng nghiên cứu. Dưới đây là một số thuật toán điển hình.
a. Thuật toán logic
Trong các thuật toán logic, để nhận dạng đối tượng hoặc là người ta tính
lượng tin tổng, hoặc là xác định khoảng cách tổng.
Công việc đầu tiên, người ta tiến hành mã hóa các dấu hiệu trường bằng mã nhị
phân gồm tập số 0 và 1.
Nếu xkl là giá trị trường thứ l của mẫu thứ k thì:
-

xkl = 0 khi mẫu k không chứa giá trị thứ l

-

xkl = 1 khi mẫu k chứa giá trị thứ l


Bằng cách trên toàn bộ các mẫu được mã hóa.
Tiếp theo dựa vào các tổ hợp số 0 và 1(từ thông tin) xác lập trên các mẫu
chuẩn người ta xác định các từ thông tin chuẩn cho từng lớp đối tượng. Từ thông
tin chuẩn cho một lớp (đối tượng) là từ thông tin gặp p lần ở các đối tượng chuẩn
của lớp đó và không gặp lần nào ở các đối tượng chuẩn thuộc lớp khác. Đối với
một lớp đối tượng người ta có thể chọn vài từ thông tin chuẩn. Các thông tin này
được gọi là tổ hợp dấu hiệu phức hợp. Trong các tổ hợp dấu hiệu phức hợp đặc
trưng cho các đối tượng chuẩn của cùng một lớp thì tổ hợp dấu hiệu nào đặc trưng
cho số lượng mẫu chuẩn lớn hơn, tổ hợp dấu hiệu đó sẽ có lượng tin lớn hơn.
Cuối cùng là nhận dạng các đối tượng nghiên cứu. Ở bước này người ta tiến
hành kiểm tra xem bao nhiêu tổ hợp dấu hiệu phức hợp của từng lớp gặp ở đối
tượng nghiên cứu. Nếu số lần gặp các tổ hợp dấu hiệu phức hợp của một lớp nào
đó nhiều hơn số lần gặp các tổ hợp phức hợp của lớp khác thì đối tượng nghiên cứu
được xếp vào lớp đó.
b. Thuật toán hồi quy
Thực chất của thuật toán này là xây dựng các hàm hồi quy xác định mối
quan hệ giữa các tham số địa chất cần tìm với các số liệu địa vật lý quan sát được.
Giả sử ta lập một quan hệ hàm giữa tham số địa chất Y và các dấu hiệu địa
vật lý x1, x2…, xk. Hàm f(x1, x2…, xk) mà ta cần tìm phải thỏa mãn:
E(Y-f(x1, x2…, xk))2 đạt cực tiểu.

8


Lớp hàm thường được dùng là các hàm đa thức, thường chỉ là bậc 1 (hàm
tuyến tính) hoặc bậc 2.
Hàm tuyến tính có dạng:
k

Y0

ixi
i

Với điều kiện:
n

k

j
1

i

2
L

(
Y
j

0


i
x
ji
)


đạt cực tiểu.


Trong đó Yj là giá trị quan trắc của biến Y tại quan trắc thư j; xji là giá trị
quan trắc thứ j của biến xi.
Hàm đa thức bậc hai có dạng:
k

k k

i

1

i

1j

1

Y

a

b
i
x
i
c
ij
x
i

.
x
j



Với điều kiện:
2

k
kk




L

Y
l
a

b
i
x
l
i
c
ij
x
li

.
x
lj
đạt cực tiểu.






l

1
i

1
i

11
j



n

Trong đó Yl là giá trị quan trắc của biến Y tại quan trắc thứ l; xli là giá trị
quan trắc thứ l của biến xi.
Thuật toán phân tích hồi quy có ưu điểm là dễ dàng đưa vào xử lý bổ sung
các số liệu của dấu hiệu mới bằng cách đưa thêm vào phương trình của hàm hồi
quy các số hạng mới. Tuy nhiên thuật toán hồi quy cũng có nhược điểm đó là với

một tập hợp số liệu nhất định ứng với một giá trị sai số cho trước có thể xấp xỉ
được nhiều hàm hồi quy. Do vậy ta không thể đưa ra được các lý giải về ý nghĩa
vật lý của các hệ số của hàm hồi quy.
c. Thuật toán định nghiệm thống kê
Thuật toán nhận dạng trên cơ sở mô hình thống kê đối tượng chuẩn trong
phân tích số liệu địa vật lý thường sử dụng các thông số như: Tỉ số sự thật L(x) và
tổng lượng thông tin J(1:2,x).
9


Giá trị các thông số đó được tính theo công thức:
L(x) = P1(x)/ P2(x)
J(1:2,x) = log[P1(x)/ P2(x)]
Trong đó:
P1(x), P2(x): là xác suất bắt gặp giá trị dấu hiệu x cùng với các đối tượng
tương ứng của lớp 1 và lớp 2 (lớp quặng và lớp không quặng). Khi sử dụng đối
tượng chuẩn cho lớp 1 (lớp quặng) thì trong các biểu thức P2(x) được thay bằng 1.
x: là vectơ giá trị các dấu hiệu được sử dụng, x1,x2…xk (ví dụ các hàm
lượng qU, qTh, qK…).
Khi các dấu hiệu x1,x2…xk được xem là không phụ thuộc nhau thì xác suất
của đại lượng n chiều của tổ hợp n dấu hiệu được tính.
P(x) = P(x1). P(x2)…. P(xk)

P
1
(x
1
).
P
1

(x
2
)

.
P
1
(x
k
)
L
(
x
)


L
(
x
1
).
L
(
x
2
)....
L
(
x
k

)
P
2
(x
1
).
P
2
(x
2
)

.
P
2
(x
k
)
J(1:2,x) = J(1:2,x1) + J(1:2,x2) +…+ J(1:2,xk)
Nếu sự phụ thuộc của các dấu hiệu là rõ và sự phân bố của chúng tuân theo
luật chuẩn thì để nhận dạng các đối tượng quặng và không quặng người ta thường
sử dụng các hàm phân giải bậc 1 (R1) hoặc bậc 2 (R2) đối với các tham số
x1,x2…xn. Các hàm này được biểu diễn như sau:
n

R1 aixi
i1

k k


k

i
1 j
1

i 1

R
2
b
ij
x
i.
x
j 


 cixi
Trong đó các hệ số: ai, bij, ci được xác định từ các ma trận thông tin các dấu
hiệu của các đối tượng quặng và không quặng. Thông qua các “diện tích đối tượng
chuẩn” người ta xác định được các vectơ giá trị các dấu hiệu sử dụng x (trong
trường hợp các dấu hiệu được xem là không phụ thuộc nhau) hoặc các hệ số ai, bij,
ci (trong trường hợp các dấu hiệu phụ thuộc nhau). Sau đó tính giá trị L(x), J(1:2,x)
hoặc R1, R2, phổ các giá trị này lên khắp diện tích khảo sát và biểu diễn chúng lên

10


bản đồ. Đối sánh các giá trị này với các giá trị của đối tượng chuẩn có thể nhận biết

và khoanh định được các diện tích đồng dạng với đối tượng chuẩn. Các dấu hiệu
được lựa chọn thường là một tổ hợp nào đó trong số các tham số thu được.
1.2.2. Các thuật toán nhận dạng không có mẫu chuẩn
a. Thuật toán kiểm chứng thống kê
Thuật toán này tiến hành phân loại trường khi các dấu hiệu trường hoàn toàn
độc lập nhau. Ban đầu người ta sử dụng các bộ lọc để tách các dị thường ra khỏi
phông nhiễu cho từng dấu hiệu trường. Kết quả lọc cho phép nhận được các số liệu
trường chủ yếu gồm các dị thường. Tiếp theo là phân loại các dị thường thành các
lớp dị thường. Mỗi lớp dị thường gồm các dị thường có các đặc trưng thống kê
giống nhau. Để phân loại các dị thường đầu tiên người ta phân chia khu vực khảo
sát thành các diện tích cơ sở, sau đó dựa vào kết quả phân cấp các giá trị trường ở
mỗi cửa sổ người ta dựng các đường cong biến phân đặc trưng cho cửa sổ đó. Cuối
2
cùng để phân lớp các dị thường người ta sử dụng chỉ tiêu  để so sánh và xếp loại

các đường cong biến phân. Các diện tích có ước lượng phân bố mật độ xác suất
giống nhau được xếp vào một lớp.
Giai đoạn cuối cùng của quá trình nhận dạng là giai đoạn thuật toán tiến
hành xác định số hiệu của lớp tổng hợp.
Với mục đích này, dựa vào các đường cong biến thiên dựng được cho từng
dấu hiệu người ta xác định giá trị trung bình và phương sai rồi sắp xếp các giá trị
trung bình theo thứ tự tăng dần. Sau đó dựa vào chỉ tiêu xác suất hậu nghiệm cực
đại người ta quyết định xếp loại đối tượng khảo sát vào các lớp khác nhau. Bằng
cách trên, toàn bộ khu vực khảo sát được phân thành một số diện tích có hình dạng
bất kì, ở đó dị thường của các dấu hiệu khác nhau chồng lên nhau.
b. Thuật toán K trung bình
Nội dụng của thuật toán như sau: Giả sử tồn tại n đối tượng. Nhiệm vụ đặt
ra là phân chia toàn bộ n đối tượng thành M lớp với M << n.
Để giải quyết nhiệm vụ trên, lúc đầu người ta chọn ngẫu nhiên từ n đối
tượng ra k đối tượng, k đối tượng được chọn này được xem như là các mẫu chuẩn

xuất phát. Tiếp theo là tiến hành chính xác hóa liên tiếp các mẫu chuẩn chọn được
11


bằng cách so sánh các mẫu chuẩn với các đối tượng còn lại. Sau mỗi lần chọn tập
hợp các mẫu chuẩn Eν chọn được ở lần chọn thứ ν sẽ thay cho các mẫu chuẩn chọn
được ở lần ν -1 (lần trước đó).
Nếu kí hiệu tập hợp mẫu chuẩn Ev chọn được ở lần thứ v là:
Eν = {e1ν, e2ν,…, ekν } với ν = 0, 1, 2,….
Với mỗi mẫu chuẩn này còn được ghi các trọng số đặc trưng là: h1ν, h2ν,
h3ν... hkν
Với kí hiệu này mẫu chuẩn xuất phát sẽ là:
E0 = {e10, e20,…, ek0 }
Các mẫu chuẩn này chính là các mẫu được chọn ra ở vòng đâu tiên (vòng số
không) của quá trình lặp. Tiếp theo vòng số không thuật toán gọi tiếp số xk+1 và tìm
xem trong k mẫu ei0, mẫu chuẩn nào gần với nó nhất. Nếu tìm được, thì mẫu chuẩn
thuộc tập hợp E0 tìm được này được thay thế bằng mẫu chuẩn mới. Mẫu chuẩn mới
này có giá trị ei1 được tính như giá trị trọng tâm giữa giá trị của mẫu chuẩn cũ và
giá trị của đối tượng gắn kết với nó xk+1.
Sau quá trình hiệu chỉnh ở vòng 1, bằng phương pháp mô tả trên thuật toán
sẽ tiến hành hiệu chỉnh ở các lần tiếp theo, cho đến khi đối tượng cuối cùng được
gọi ra.
Sau khi tập hợp các mẫu chuẩn được chính xác hóa, thuật toán tiến hành
phân loại toàn bộ số lượng n các đối tượng theo tập hợp các dấu hiệu thành M lớp
dựa vào nguyên tắc khoảng cách tối thiểu.

12


CHƢƠNG 2.HỆ PHƢƠNG PHÁP PHÂN TÍCH TÀI LIỆU ĐỊA VẬT

LÝ MÁY BAY
2.
2.1.

Các phƣơng pháp phân tích tài liệu địa vật lý máy bay
Công tác phân tích tài liệu địa vật lý máy bay nói riêng và phân tích tổ hợp

tài liệu nói chung để giải thích các vấn đề địa chất và dự báo triển vọng khoáng sản
người ta sử dụng rất nhiều phương pháp khác nhau tùy thuộc vào từng mục tiêu,
từng bước và từng điều kiện cụ thể, trong đó có các phương pháp thông kê - nhận
dạng được áp dụng rộng rãi có hiêu quả hơn cả. Một số nội dung cơ bản của các
phương pháp như sau:
2.1.1. Các phƣơng pháp tách trƣờng[10]
Các phương pháp tách trường là những phương pháp quen thuộc, được sử
dụng rất rộng rãi và có hiệu quả trong phân tích các tài liệu địa vật lý nói chung.
Sử dụng các phương pháp tách trường để phân chia các dị thường nhằm
khoanh định và dự đoán về diện phân bố của các đối tượng địa chất gây dị thường.
Việc quan trọng khi sử dụng phương pháp này là lựa chọn bán kính trung bình sao
cho phù hợp với kích thước của đối tượng gây dị thường.
2.1.2. Nhóm các phƣơng pháp thống kê nhận dạng[10]
a. Các phương pháp nhận dạng theo đối tượng chuẩn
Trong các phương pháp phân tích nhận dạng có đối tượng chuẩn thì việc
quan trọng nhất là chọn đối tượng chuẩn, tiếp đến là chọn tập hợp các dấu hiệu
dùng để phản ánh và nhận dạng các đối tượng. Tùy thuộc vào các mục đích nghiên
cứu khác nhau mà việc lựa chọn các đối tượng chuẩn sẽ khác nhau.
b. Các phương pháp nhận dạng không có đối tượng chuẩn .
Trong điều kiện khi diện tích khảo sát chưa được nghiên cứu kỹ và không
có được các đối tượng chuẩn tin cậy người ta có thể sử dụng các phương pháp nhận
dạng không có mẫu theo nguyên lý tự điều chỉnh để phát hiện và khoanh định các
diện tích trường dị thường dựa trên một số dấu hiệu đã được chọn trước theo

nguyên tắc: xác suất nhỏ, tương quan yếu và có tính trội của một nguyên tố nào đó

13


Người ta đặc biệt quan tâm đến các diện tích dị thường (có khả năng liên
quan với các khoáng sản) được khoanh định theo các dấu hiệu nên trên khi có các
đặc điểm như:
 Loại thường gặp trong các lớp đất đá khác nhau nhưng rất giống nhau.
 Loại không điển hình cho lớp đất đá của nó hoặc trên toàn vùng.
Các phương pháp nhận dạng không có mẫu theo nguyên lý tự điều chỉnh để
đánh giá triển vọng khoáng sản nói chung đạt hiệu quả không cao, thường chỉ có
thể tham gia vào việc phát hiện và khoanh định các diện tích, dự báo là có thể có
liên quan với khoáng sản.
2.1.3. Các phƣơng pháp thống kê thực nghiệm[10]
Các phương pháp thống kê thực nghiệm được thiết lập trên cơ sở các quan
niệm lý thuyết, những kinh nghiệm thực tế, sự tự điều chỉnh để tìm kiếm lời giải
đúng trong quá trình phân tích. Bằng mô hình toán học và thông qua chúng có thể
phân chia các lớp dấu hiệu đối với các dị thường quặng và không quặng . Các
thông số (được biểu diễn qua các biểu thức toán học) thường được sử dụng đó là:
K
  (
1

x
)
/2

(
q


q
)
e
Th
K
Th
 Các thông số Dominal : D

Trong đó:

q
(
q
q
)/
K
K
K
K

 K - là độ lệch chuẩn của q
K

 Các hàm tương quan.
 Các hàm xác suất thống kê phản ánh xác suất bắt gặp của các đặc tính
phóng xạ nào đó (theo nguyên tắc xác suất nhỏ).
 Các tỉ số hàm lượng các nguyên tố.
Các phương pháp thống kê thực nghiệm, thông qua các thông số nói trên
được áp dụng khá rỗng rãi và có hiệu quả trong phân tích tài liệu phổ gamma hàng

không, đặc biệt là trong việc phát hiện và khoanh định các đới biến đổi có thể liên
quan với khoáng sản.
2.1.4. Một số phƣơng pháp khác
Ngoài một số phương pháp phân tích mang tính chuyên dụng thường được
áp dụng trong phân tích tài liệu phổ gamma hàng không, trong thực tế người ta còn

14


sử dụng rất nhiều phương pháp phân tích khác theo hướng khai thác và sử dụng
triệt để thông tin như các phương pháp đạo hàm, phương pháp phân tích các thành
phần chính, các phương pháp phân tích bản đồ bóng, các phương pháp chồng chập
thông tin.
Hầu hết các phương pháp nói trên ( bao gồm các phương pháp tách trường,
các phương pháp nhận dạng, các phương pháp thống kê thực nghiệm v.v…) nói
chung đều xử lý trên các số liệu liên tục theo tuyến hoặc theo diện, nghĩa là phân
tích trên các bản đồ trường (cường độ bức xạ gamma, hàm lượng các nguyên tố
phóng xạ U, Th, K).
2.2.

Phƣơng pháp Tần suất - Nhận dạng
Phương pháp Tần suất - Nhận dạng là một trong các nội dung liên quan trực

tiếp tới luận văn mà cụ thể, phương pháp này liên quan khá mật thiết với nội dung
của phương pháp phân tích Khoảng cách – Tần suất – Nhận dạng. Do đó việc tìm
hiểu cơ bản nội dung của phương pháp Tần suất - Nhận dạng là một nội dung quan
trọng cho các mục tiêu tiếp theo của luận văn.
Phương pháp phân tích Tần suất – Nhận dạng được tác giả PGS.TS Võ
Thanh Quỳnh đề xuất và công bố năm 2007 trong bài bài báo khoa học “ Một cách
tiếp cận mới giải quyết bài toán nhận dạng trong xử lý phân tích tài liệu địa vật lý”

đăng trên TC Địa chất, A/302 : 76-80. Hà Nội. Và nhóm tác giả Võ Thanh Quỳnh,
Nguyễn Xuân Bình, Nguyễn Đức Vinh tiếp tục nghiên cứu hoàn thiện và mở rộng
khả năng ứng dụng của phương pháp vào những năm gần đây. Từ các kết quả công
bố cho thấy các thử nghiệm bước đầu của phương pháp cho kết quả tốt khi phân
tích tài liệu thực tế.
Phương pháp Tần suất – Nhận dạng dựa trên cơ sở là phương pháp phân
tích tần suất, một phương pháp có khả năng đánh giá chất lượng của mỗi loại thông
tin.
2.2.1. Nội dung cơ bản của phương pháp phân tích tần suất [6]
Phương pháp phân tích tần suất với việc sử dụng tần suất trung bình của sự
xuất hiện đồng thời các dấu hiệu do Griffths-Vinni đưa ra tiến hành trên một loại
đối tượng mẫu có nội dung tóm tắt như sau:

15


Giả sử ta có ma trận thông tin các tính chất của đối tượng nghiên cứu:

1112......1k 
  ...... 

2k 
  21 22

..........
.........


n1 n 2 ...... nk 


 

i , j dt

Trong đó:
k : số loại tính chất của ma trận thông tin
n : số lượng mẫu chứa các thông tin về các tính chất của đối tượng
: được biểu diễn bằng các khái niệm logic: “yes” hoặc “no” hoặc bằng các số 1
hoặc 0.
Theo Griffths-Vinni, lượng thông tin tương đối của dấu hiệu thứ “i” được
xác định theo công thức:

1 1 k  n

Ii 
   hi hj 

n k j k  h


2

(2.1)

Trong đó: n,i,j là tần suất xuất hiện đồng thời các tính chất thông tin thứ “i”
và thứ “j”.
Nếu sắp xếp các dấu hiệu của đối tượng theo thứ tự giảm dần của lượng
thông tin tương đối, ta sẽ được tập mới là {

}. Khi đó tỷ trọng thông tin của tổng


m dấu hiệu đầu tính theo tỉ lệ % trong tổng thông tin của tất cả k dấu hiệu được
tính bằng:
m

Pm 

I
i 1
k

I
i 1

*2
i

 100%
2

(2.2)

*
i

Pm là cơ sở để lựa chọn tập hợp các tính chất đủ chứa tải những thông tin cần thiết
theo yêu cầu nghiên cứu, nghĩa là khi cho Pm một giá trị tỉ lệ % nào đó ta sẽ tìm
được tập hợp m tính chất tương ứng.

16



Như vậy bản chất của phương pháp phân tích tần suất theo thuật toán Giffiths Vinni là đưa ra được một cách đánh giá về chất lượng của từng chủng loại thông tin
trong nhận thức đối tượng, trên cơ sở đó lựa chọn tập hợp các chủng loại thông tin
có giá trị cao phục vụ các mục đích nghiên cứu.
Tiếp sau đó, cũng từ nội dung phương pháp phân tích tần suất, tác giả đã đề xuất
một cách tiếp cận, trực tiếp tham gia giải quyết bài toán nhận dạng và xây dựng
thành một phương pháp mới: “Phương pháp tần suất - nhận dạng” [6].
2.2.2. Phương pháp Tần suất-Nhận dạng
 Xây dựng ma trận thông tin của đối tượng mẫu
Để đánh giá và lựa chọn tổ hợp thông tin theo thuật toán Griffths-Vinni,
trước hết cần có ma trận thông tin của đối tượng mẫu. Ma trận này được xây dựng
theo các bước sau:
-Xác định tính chất của các tham số dùng để xây dựng ma trận thông tin:
Xác định tính chất của các tham số là xác định các khoảng giá trị đặc trưng chung
tương ứng của nó, làm cơ sở cho việc xây dựng các đơn vị thông tin ma trận.
-Xác định giá trị của từng đơn vị thông tin ( “ yes” , “ no” hoặc “1”, “0”)
cho các tính chất của ma trận: Sau khi có được các khoảng giá trị đặc trưng , sử
dụng chúng làm “cửa sổ quét” để tạo ra các đơn vị thông tin cho từng chủng loại
thông tin của từng phần tử. Đối với mỗi phần tử của mỗi chủng loại thông tin, nếu
nó nằm trong khoảng giá trị đặc trưng sẽ nhận giá trị là 1, nằm ngoài sẽ nhận giá trị
là 0. Bằng cách đó sẽ chuyển được một ma trận thông tin với các số liệu địa chất,
địa vật lý về ma trận thông tin chuẩn theo yêu cầu của thuật toán với các phân tử là
các giá trị 1 hoặc 0. Vì vậy để xây dựng được ma trận thông tin đòi hỏi phải có tập
hợp số liệu nhiều và phong phú.
 Đánh giá, lựa chọn tổ hợp thông tin
Để tiến hành phân tích đối tượng, xác định các đối tượng đồng dạng, trước
hết cần đánh giá lựa chọn tổ hợp thông tin có chất lượng cao từ tập hợp tất cả các
chủng loại thông tin có được về đối tượng nghiên cứu. Số lượng chủng loại thông
tin m được lựa chọn tùy thuộc vào giá trị ngưỡng của Pm cho trước.


17


 Phân tích đối sánh, xác định các đối tượng đồng dạng
-

Xây dựng ma trận thông tin cho đối tượng đối sánh tương tự như đối với đối

tượng mẫu thông qua các khoảng giá trị đặc trưng của chính đối tượng mẫu.
-

Tiến hành đánh giá tỉ trọng thông tin cho tất cả các tính chất của đối tượng đối

sánh bằng phương pháp phân tích tần suất theo thuật toán Griffiths-Vinin.
-

Tính tỉ trọng thông tin của tổ hợp thông tin đã được lựa chọn của đối tượng mẫu

cho đối tượng đối sánh. Có thể xem giá trị này tương tự như hệ số đồng dạng, ta
gọi nó là chỉ số đồng dạng, kí hiệu P*m.
Đối tượng đối sánh được xem là đồng dạng với đối tượng mẫu khi P*m có
giá trị đạt mức giá trị ngưỡng nào đó.
Các bước phân tích của phương pháp Tần suất-Nhận dạng được thực hiện
theo sơ đồ hình 2.1.
Phương pháp được nhóm tác giả nhận định: “Phương pháp này hoàn toàn có
thể ứng dụng để giải quyết nhiệm vụ tìm kiếm và dự báo triển vọng khoáng sản
trong xử lý, phân tích tài liệu địa vật lý máy bay, một nguồn tài liệu hết sức phong
phú ở nước ta hiện nay. Về nguyên tắc, phương pháp này có thể mở rộng phân tích
cho các tài liệu địa vật lý khác nhau. Tuy nhiên, hiện chưa có kết quả phân tích trên

các dạng tài liệu địa vật lý khác. Đây cũng là hướng nghiên cứu tiếp theo của tác giả
để hoàn thiện hơn nữa nội dung của phương pháp. Những kết quả đạt được cũng mở
ra hướng nghiên cứu tiếp cận mới giải quyết bài toán nhận dạng trong địa vật lý trên
cơ sở khai thác ứng dụng lớp các bài toán đánh giá lựa chọn thông tin.” [5]

18


×