Tải bản đầy đủ (.doc) (53 trang)

Khóa luận Tốt nghệp Nghiên cứu áp dụng phương pháp Tần suất – Nhận dạng trong giải đoán địa chất số liệu địa vật lý hàng không

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (7.41 MB, 53 trang )

MỤC LỤC
LỜI MỞ ĐẦU 2
CHƯƠNG 1: LÝ THUYẾT NHẬN DẠNG 4
1.1 Lý thuyết xử lý tổ hợp số liệu 4
1.1.1 Các yêu cầu khi sử dụng tổ hợp số liệu trong xử lý 4
1.1.2 Lựa chọn tổ hợp số liệu 5
1.2.1 Số liệu đo và mẫu ngẫu nhiên 7
1.2.2 Hàm mật độ xác suất 7
1.2.3 Một số hàm phân phối lý thuyết 8
1.3 Các thuật toán nhận dạng 10
1.3.1 Mẫu chuẩn các đặc điểm đặc trưng và sử dụng mẫu chuẩn trong nhận
dạng 10
1.3.2 Các thuật toán nhận dạng có mẫu chuẩn 12
1.3.3. Các thuật toán nhận dạng không có mẫu chuẩn 15
1.3.4 Quyết định sự tồn tại của đối tượng và đánh giá chất lượng xử lý 16
2.1 Phương pháp phân tích tần suất 18
2.2 Phương pháp Tần suất - Nhận dạng 20
2.2.1. Phương pháp xây dựng ma trận thông tin đối tượng mẫu 20
2.2.2. Phương pháp đánh giá lựa chọn tổ hợp thông tin 20
2.2.3. Phương pháp phân tích đối sánh xác định các đối tượng đồng dạng. .21
21
2.3. Xây dựng phần mềm ứng dụng phương pháp Tần suất – Nhận dạng 22
CHƯƠNG 3: ÁP DỤNG KẾT QUẢ NGHIÊN CỨU PHÂN TÍCH DỮ LIỆU
VÙNG ĐÔNG TUY HOÀ 25
3.1 Đặc điểm địa chất và địa vật lý vùng Đông Tuy Hoà 25
3.1.1. Đặc điểm địa lý, tự nhiên 25
3.1.2. Đặc điểm địa chất và địa vật lý 26
3.2. Ứng dụng chương trình phân tích tần suất trong số liệu thực tế 29
3.2.1. Xử lý số liệu cho trường hợp biết trước đối tượng đối sánh 29
3.2.2. Xử lý số liệu không dùng đối tượng đối sánh 32
TÀI LIỆU THAM KHẢO 36


PHỤ LỤC 1: CHƯƠNG TRÌNH PHÂN TÍCH TẦN XUẤT – NHẬN DẠNG 37
LỜI MỞ ĐẦU
Hiện nay, trong công tác điều tra nghiên cứu địa chất và tìm kiếm khoáng
sản thì số lượng thông tin trên mỗi một đối tượng thu thập ngày càng lớn. Mỗi một
tài liệu chứa đựng một loại thông tin về đối tượng và nếu chỉ sử dụng một loại tài
liệu riêng biệt thì rất khó có thể giải quyết thoả đáng nhiệm vụ đặt ra. Do đó phân
tích đồng thời nhiều loại thông tin về đối tượng (tổ hợp số liệu) là một xu hướng tất
yếu, được phát triển mạnh và được áp dụng rộng rãi ở nước ta và trên thế giới.
Có nhiều phương pháp khác nhau đang được sử dụng trong xử lý phân tích
tổ hợp số liệu địa vật lý, trong đó nhóm các phương pháp thống kê – nhận dạng
được ứng dụng rộng rãi và có hiệu quả hơn cả. Tuy nhiên khi tiến hành phân tích xử
lý tổ hợp số liệu địa vật lý vẫn còn những hạn chế đó là: số lượng chủng loại thông
tin rất lớn trong khi số lượng các tham số đầu vào của các chương trình phân tích
nhận dạng thường bị giới hạn. Việc sử dụng các tổ hợp thông tin khác nhau để tiến
hành phân tích nhận dạng nhiều khi cho những kế quả rất khác biệt. Trong trường
hợp số lượng các tham số đầu vào được mở rộng nhưng do việc sử dụng các thông
tin kém tin cậy sẽ dẫn tới các kết quả kém hơn so với sử dụng một tổ hợp thông tin
ít hơn nhưng có chất lượng cao. Việc sử dụng những thông tin kém tin cậy không
những không có hiệu quả mà còn làm nhoà đi những thông tin quan trọng khác dẫn
tới những nhận thức sai lệch về đối tượng. Với số lượng các chủng loại thông tin
ngày càng tăng hiện nay, việc lựa chọn được một tổ hợp thông tin có chất lượng cao
là một nhiệm vụ quan trọng và rất khó khăn. Đây chính là nội dung của các bài toán
đánh giá lựa chọn thông tin. Từ yêu cầu thực tế trên khoá luận với đề tài “Nghiên
cứu áp dụng phương pháp Tần suất – Nhận dạng trong giải đoán địa chất số
liệu địa vật lý hàng không” đưa ra một hướng đánh giá lựa chọn các thông tin góp
phần nâng cao chất lượng xử lý số liệu địa vật lý.
Khoá luận được thực hiện với các mục tiêu nhiệm vụ chính sau:
- Nghiên cứu lựa chọn một thuật toán đánh giá lựa chọn thông tin để lựa
chọn các tổ hợp thông tin có chất lượng nhằm nâng cao độ tin cậy của kết
quả nhận dạng.

- Trên cơ sở thuật toán lựa chọn thông tin đã nghiên cứu đề xuất một giải
pháp phân tích đối sánh từ đó xây dựng thành một phương pháp phân
tích, nhận dạng.
- Tiến hành phân tích thử nghiệm trên một tài liệu thực tế nhằm làm rõ ý
nghĩa thực tiễn và khả năng áp dụng thực tế của kết quả nghiên cứu.
2
Từ cơ sở những mục tiêu thực hiện, khoá luận được viết với cấu trúc như
sau:
- Mở đầu
- Chương 1: Lý thuyết nhận dạng
- Chương 2: Ứng dụng phương pháp Tần suất – Nhận dạng trong xử lý số
liệu địa vật lý
- Chương 3: Áp dụng kết quả nghiên cứu phân tích số liệu hàng không
vùng Đông Tuy Hoà
- Kết luận
Khoá luận có sử dụng tài liệu từ - phổ gamma hàng không, các tài liệu kiểm
tra mặt đất khu vực Đông Tuy Hoà của Đoàn Địa vậy lý máy bay, Đoàn Địa vật lý
mặt đất, Liên đoàn Vậy lý – Địa chất, Các kết quả của các đề tài nghiên cứu do
PGS.TS. Võ Thanh Quỳnh làm chủ biên.
Trong quá trình thực hiện khoá luận này, em đã nhận được sự quan tâm giúp
đỡ tận tình của các thầy giáo, cô giáo trong Khoa Địa chất, Trường Đại học Khoa
học Tự nhiên; sự giúp đỡ tạo điều kiện của ban lãnh đạo và các cán bộ kỹ thuật
Đoàn Địa vậy lý máy bay, Đoàn Địa vật lý mặt đất, Liên đoàn Vậy lý – Địa chất
trong việc tìm hiểu và thu thập tài liệu, đặc biệt là sự hướng đẫn, giúp đỡ tận tình
của thầy giáo hướng dẫn PGS.TS. Võ Thanh Quỳnh. Em xin bày tỏ lòng biết ơn
chân thành tới những sự giúp đỡ nhiệt tình đó!
Do những hạn chế về mặt thời gian và kinh nghiệm còn ít nên khoá luận
không thể tránh khỏi những thiếu sót, rất mong nhận được sự bổ xung, góp ý từ
thầy cô và các bạn.
Sinh viên thực hiện

Nguyễn Viết Đạt
3
CHƯƠNG 1: LÝ THUYẾT NHẬN DẠNG
Khác với các lĩnh vực nghiên cứu trực tiếp đối tượng địa chất, địa vật lý
nghiên cứu gián tiếp các đối tượng đó dựa vào các đặc điểm trường vật lý của
chúng. Từ các số liệu khảo sát trường địa vật lý, mục tiêu cuối cùng của công tác
thăm dò địa vật lý là đưa ra được các thông tin của đối tượng để phục vụ cho các
mục tiêu khác nhau. Để thực hiện nhiệm vụ này có nhiều phương pháp, trong đó lý
thuyết nhận dạng – lĩnh vực toán học giải quyết các bài toán phân loại đối tượng là
một phương án được lựa chọn nhiều hiện nay trong địa vật lý.
1.1 Lý thuyết xử lý tổ hợp số liệu
Mỗi loại số liệu cụ thể thường chỉ phản ánh một số đặc trưng nào đó của đối
tượng vì vậy khi sử dụng số liệu đó để đưa ra kết luận về đối tượng sẽ cho kết quả
kém tin cậy do nhiều nguyên nhân khác nhau chưa kể tới các sai số mắc phải khi
thu thập và chỉnh lý số liệu. Để nâng cao chất lượng xử lý thông tin và đáp ứng
được các yêu cầu thực tế, hiện nay, người ta áp dụng phổ biến là các phương pháp
xử lý tổ hợp dữ liệu. Xử lý tổ hợp dữ liệu về cơ bản là dựa trên nhiều loại thông tin
khác nhau để giải quyết được các nhiệm vụ đặt ra phù hợp với điều kiện kinh tế và
kỹ thuật cho phép. Không chỉ trong địa vật lý mà nhiều lĩnh vực khác cũng sử dụng
xử lý tổ hợp số liệu để nâng cao chất lượng của kết quả xử lý.
1.1.1 Các yêu cầu khi sử dụng tổ hợp số liệu trong xử lý.
Khảo sát, thu thập thông tin về đối tượng phải đáp ứng được các yêu cầu
thực tế đặt ra như sau:
- Thông tin phải đảm bảo về số lượng và chất lượng để đạt được mục tiêu và
xử lý với độ chính xác chấp nhận được.
- Thời gian thu thập thông tin phải phù hợp với tiến độ yêu cầu.
- Khảo sát, thu thập thông tin phải đạt được hiệu quả kinh tế.
Từ các yêu cầu này mà đôi khi các phương án khảo sát loại số liệu có độ tin
cậy cao hơn không được lựa chọn mà thay vào đó người ta sử dụng một số loại
thông tin khác mà khi sử dụng tổ hợp các thông tin này cũng có khả năng đáp ứng

được yêu cầu, mục tiêu đề ra. Ví dụ như thay vì dùng số liệu địa chấn có giá thành
khảo sát cao thì có thể sử dụng tổ hợp số liệu khảo sát trọng lực và số liệu điện trở
suất để tìm kiếm các hang động karst.
Mặt khác hiện nay các tổ hợp phương pháp địa vật lý đang ngày càng được
áp dụng rộng rãi do những đặc trưng về kỹ thuật như tổ hợp địa vật lý biển, tổ hợp
4
địa vật lý hàng không… Các tổ hợp phương pháp này với các phép ghi đo tự động
sẽ cung cấp một khối lượng dữ liệu rất lớn bao gồm nhiều chủng loại thông tin.
Ngoài dữ liệu khảo sát trực tiếp, hiện nay, với số lượng thông tin lưu trữ
ngày càng tăng thì việc sử dụng kết hợp các dữ liệu có sẵn này với các thông tin
khảo sát là một nhu cầu để nâng cao độ tin cậy cho kết quả xử lý.
Mỗi loại thông tin chỉ mang những đặc trưng nhất định của đối tượng và để
hoàn thành được nhiệm vụ đặt ra trong nhiều trường hợp người ta buộc phải xử
dụng tổ hợp các thông tin khác nhau.
Bản thân mỗi số liệu khảo sát đều mang những sai số, chúng đi kèm với số
liệu và nhiều lúc gây ra những sai lầm khi xử lý. Những sai số này do nhiều nguyên
nhân khác nhau như: sai số đo ghi của máy, sai số do kỹ thuật và phương pháp đo
ghi, sai số do ảnh hưởng của các đối tượng khác… Trong số liệu địa vật lý những
sai số mắc phải làm giảm độ tin cậy của thông tin được loại bỏ trong các bước xử lý
số liệu nhưng rất khó để tách hoàn toàn được chúng ra khỏi số liệu. Đặc biệt là các
nhiễu do nguồn gốc địa chất, chúng làm sai lệch mạnh các tín hiệu có ích và đôi khi
không loại bỏ được do không đủ thông tin. Những sai số này làm giảm đáng kể độ
tin cậy của thông tin, đặc biệt trong trường hợp loại thông tin đó được coi là loại
tính chất quan trọng đặc trưng cho đối tượng đang cần nghiên cứu. Một nguyên
nhân khác dẫn tới giảm độ tin cậy của một loại thông tin là tính đa trị của kết quả
xử lý. Điều này gây nhiều khó khăn và sai lầm trong xử lý. Để xác định đơn trị đối
tượng cần sử dụng kết hợp nhiều loại thông tin khác nhau một cách phù hợp.
Từ các nguyên nhân trên các phương pháp xử lý tổ hợp số liệu đã và đang
được áp dụng phổ biến trong nhiều lĩnh vực và mang lại kết quả cao.
1.1.2 Lựa chọn tổ hợp số liệu

Trong bất kỳ bài toán nhận dạng nào thì số lượng và chất lượng các tính chất
(loại thông tin) dùng để nhận dạng luôn được quan tâm hàng đầu. Mỗi tổ hợp thông
tin khác nhau thường cho những kết luận khác nhau về đối tượng. Để đạt được kết
quả đáng tin cậy nhất thì quá trình xử lý số liệu cần lựa chọn được tổ hợp thông tin
có độ tin cậy cao và hợp lý.
Chất lượng của thông tin tốt hay không phụ thuộc vào loại thông tin đó có
đặc trưng cho đối tượng (khả năng phân biệt đối tượng với môi trường xung quanh)
hay không. Tính đặc trưng cho đối tượng của một loại số liệu địa vật lý do nhiều
nguyên nhân quyết định. Một tính chất là đặc trưng cho đối tượng khi độ chênh lệch
giá trị của số liệu của tính chất đó giữa đối tượng nghiên cứu với môi trường xung
5
quanh đủ lớn. Trong trường hợp đối tượng nằm quá sâu, kích thước quá nhỏ, hoặc
do ảnh hưởng của các yếu tố khác (phong hóa, biến chất, chất lưu…) dẫn tới độ
chênh lệch của giá trị không đủ để phân biệt đối tượng với môi trường xung quanh
khi đó thông tin là không có ích cho xử lý số liệu. Các sai số không tách được sẽ
gây ra sai lệch về số liệu khi đó thông tin không còn mang tính đặc trưng cho đối
tượng.
Một tổ hợp thông tin không đầy đủ sẽ không đáp ứng được yêu cầu, nhiệm
vụ đặt ra cho quá trình xử lý. Việc chọn số lượng các loại thông tin phải đảm bảo
được tính đơn trị của kết quả và đưa ra được đầy đủ các yêu cầu nghiên cứu về đối
tượng.
Việc sử dụng đồng thời nhiều loại thông tin trong đó có những thông tin có
độ tin cậy thấp không những gây khó khăn cho quá trình xử lý, chất lượng xử lý
không cao, do các thông tin thiếu tin cậy sẽ làm nhoè đi các thông tin quan trọng
khác dẫn đến những nhận thức sai lệch về đối tượng.
Việc lựa chọn được một tổ hợp thông tin có chất lượng cao là nội dung khó
khăn và phụ thuộc nhiều vào hiểu biết, kinh nghiệm của người xử lý.
6
1.2 Mẫu và các đặc trưng thống kê của số liệu địa vật lý
1.2.1 Số liệu đo và mẫu ngẫu nhiên

Vì các thiết bị quan sát trường trong địa vật lý đều là các thiết bị số nên các
kết quả quan sát trường là những con số. Ở một điểm quan sát bất kỳ, kết quả quan
sát trường địa vật lý vì chứa nhiễu và sai số đo nên có thể là đại lượng này hay đại
lượng khác mà người đo không dự đoán trước được. Vì vậy để mô tả các giá trị
(bằng số) các trường địa vật lý đo được người ta sử dụng khái niệm đại lượng ngẫu
nhiên.
Các giá trị trường địa vật lý đo được là các số cụ thể nên đại lượng ngẫu
nhiên là mô hình nền tảng để mô tả các số liệu địa vật lý.
Đại lượng X được gọi là ngẫu nhiên nếu trong mỗi phép đo sẽ xuất hiện một
trong những giá trị cụ thể x
1
, x
2
, x
3
,… của đại lượng này với xác suất tương ứng p
1
,
p
2
, p
3
,…
Tất cả các giá trị có thể của X sẽ tạo thành nhóm đủ, vì bao giờ trong kết quả
của một phép đo cũng sẽ xuất hiện một giá trị x
i
nào đó (biểu hiện nào đó của X);
nghĩa là bao giờ cũng tồn tại đẳng thức:

=

=
n
i
i
P
1
1
(1.1)
Để mô tả các đại lượng ngẫu nhiên, người ta sử dụng công cụ toán học xác
suất, thông qua hàm phân bố xác suất và các đặc trưng thống kê.
1.2.2 Hàm mật độ xác suất
Hàm mật độ xác suất f(x) là một hàm mô tả xác suất xuất hiện các giá trị cụ
thể của đại lượng ngẫu nhiên x.
Hàm mật độ xác suất có các tính chất sau:
0lim
)(
=
±∞→
xf
x
(1.2)

+∞
∞−
=1)( dxxf
(1.3)

=<<
2
1

)()(
21
x
x
dxxfxXxP
(1.4)
với P(x
1
<X<x
2
) là xác suất rơi vào khoảng (x
1
;x
2
) của đại lượng ngẫu nhiên
x.
7

∞−
=
1
)()(
1
x
dxxfxF
(1.5)
với F(x) là hàm phân bố của X; hàm mô tả xác suất để đại lượng ngẫu nhiên
X nhận các giá trị nhỏ hơn giá trị x
i
nào đó.

Đồ thị của hàm phân bố mật độ xác suất thực nghiệm được dựng lên từ số
liệu khảo sát thực tế được gọi là đường cong biến phân.
Ngoài hàm phân bố F(x) và hàm mật độ f(x) người ta còn dùng các đặc trưng
thống kê để mô tả các đại lượng ngẫu nhiên bao gồm:
- Kỳ vọng toán
[ ]

=
==
n
i
ii
xpxxM
1
(1.6)
- Mod (M
0
) là giá trị x mà tại đó hàm mật độ phân bố đạt max
- Median (M
e
) là giá trị là giá trị của X có xác suất P(X) =
2
1
- Phương sai:
[ ] [ ][ ] [ ]
ii
pxMxMxxMxD
2
2
)( −=−=


(1.7)
- Độ lệch trung bình phương
D±=
σ
(1.8)
1.2.3 Một số hàm phân phối lý thuyết
Để mô tả các đại lượng ngẫu nhiên, trong địa vật lý người ta sử dụng các
hàm phân phối lý thuyết như hàm phân phối chuẩn (phân phối Gauxơ), phân phối
chuẩn loga, phân phối Puasson…
Phần lớn các đại lượng ngẫu nhiên trong địa vật lý cũng như nhiều hiện
tượng địa chất khác chúng tuân theo luật phân phối chuẩn.
Đại lượng ngẫu nhiên X tuân theo luật phân phối chuẩn nếu hàm mật độ của
nó có dạng:
2
2
2
)(
2
1
)(
σ
µ
σ
−−
Π
=
x
exf
(1.9)

Trong đó:
- kỳ vọng:
dxe
x
x

+∞
∞−
−−

=
2
2
2
)(
2
σ
µ
σ
µ
(1.10)
- Phương sai:
22
)( EXXE −=
σ
(1.11)
Đồ thị của hàm phân phối chuẩn đối xứng qua đường thẳng
µ
=x
và giảm

dần xuống xung quanh kỳ vọng.
Diện tích giới hạn bởi đường cong và trục hoành bằng 1, đó chính là xác suất
để đại lượng ngẫu nhiên X nhận giá trị trong khoảng
);( +∞−∞
(1.3). Xác suất để đại
8
lượng ngẫu nhiên X nhận giá trị trong khoảng từ x
1
tới x
2
chính là phần diện tích
được bao bởi đường cong, trục hoành và hai đường thẳng
1
xx =
;
2
xx =
. Xác suất
đó được tính theo công thức (1.4).
Nhiều giá trị trường địa vật lý như mật độ, tốc độ truyền sóng, phóng xạ…
tuân theo luật phân phối chuẩn và dựa trên các thuật toán thống kê theo luật phân
phối chuẩn người ta có thể xử lý số liệu để tìm ra các đặc trưng của đối tượng.
Ngoài luật phân phối chuẩn còn có các luật phân phối khác đang được áp
dụng phổ biến trong phân tích thống kê các số liệu địa vật lý. Ví dụ như luật phân
phối chuẩn loga được dùng để mô tả các giá trị điện trở xuất, độ từ cảm của đất đá.
9
1.3 Các thuật toán nhận dạng
Nhiệm vụ cơ bản nhất của công tác xử lý tổ hợp số liệu địa vật lý là phân
loại được các điểm quan sát thành các diện tích nhất định hay các nhóm, lớp diện
tích nhất định, ở đó các đặc trưng của trường địa vật lý giống với các đặc trưng của

trường liên quan với loại (lớp) đối tượng địa chất nhất định. Để giải quyết được
nhiệm vụ trên tương tự nhiều lĩnh vực khoa học khác người ta sử dụng lý thuyết
nhận dạng - một lĩnh vực toán học đi sấu vào giải quết các bài toán phân loại đối
tượng dựa vào mối quan hệ hữu cơ giữa các đối tượng cụ thể và các dấu hiệu đặc
trưng cho đối tượng đó.
Hiện nay, trong địa vật lý ngưồi ta sử dụng rất nhiều phương pháp nhận dạng
hiện đại, được tự động hoá bằng các phần mềm mạnh. Tuy nhiên có thể chia chúng
thành 2 nhóm: nhóm có phương pháp nhận dạng theo đối tượng chuẩn (có thông tin
tiên nghiệm) và nhóm có phương pháp nhận dạng không có đối tượng chuẩn (không
có thông tin tiên nghiệm).
1.3.1 Mẫu chuẩn các đặc điểm đặc trưng và sử dụng mẫu chuẩn trong nhận
dạng
Để xử lý tổ hợp các số liệu bằng phương pháp nhận dạng có mẫu chuẩn thì
công việc quan trọng mang tính quyết định là lựa chọn các mẫu chuẩn và xác định
các đặc trưng thống kê các trường địa vật lý của chúng.
Các mẫu hay đối tượng chuẩn là phần diện tích ở đó bằng các số liệu khoan
và các số liệu địa chất khác đã xác định được bản chất địa chất của từng đối tượng
gây ra trường địa vật lý. Tuỳ thuộc vào các mục đích nghiên cứu khác nhau mà các
đối tượng chuẩn được lựa chọn khác nhau. Ví dụ khi mục đích nghiên cứu là tìm
kiếm khoáng sản thì đối tượng chuẩn có thể là một vùng quặng, một trường quặng,
một mỏ quặng hay một vỉa quặng. Còn khi khảo sát địa vật lý phục vụ công tác đo
vẽ bản đồ địa chất thì các đối tượng mẫu có thể là diện tích phát triển một loại đá
nào đó.
Tuỳ theo bản chất, đối tượng chuẩn có hai loại là đối tượng chuẩn mang các
thông tin đại diện và đối tượng chuẩn mang thông tin phủ nhận. Đối tượng chuẩn
đại diện mang các thông tin có khả năng phân loại một hay một lớp đối tượng.
Trong nhiều trường hợp có những đối tượng khác nhau nhưng mang các đặc điểm
trường địa vật lý tương đồng. Khi đó người ta sử dụng đối tượng chuẩn mang thông
tin phủ nhận để loại bỏ những đối tượng không đúng ra khỏi tập kết quả nhận dạng.
10

Cần lưu ý để công tác phân tích nhận dạng đạt hiệu quả tốt thì cần lựa chọn
các đối tượng chuẩn sao cho các diện tích tồn tại các đối tượng chuẩn phải nằm xen
kẽ với các phần diện tích khảo sát cần nhận dạng.
Một đối tượng chuẩn nào đó có phạm vi ứng dụng là giới hạn và nó phụ
thuộc vào các yếu tố sau:
- Đối tượng chuẩn phải có giá trị thông tin tin cậy theo mục tiêu tìm kiếm.
- Đối tượng chuẩn phải phù hợp với diện tích nghiên cứu.
- Mật độ lưới khảo sát các loại thông tin phải tương ứng với đối tượng chuẩn
lựa chọn.
Đối tượng chuẩn mang các dấu hiệu nhận biết, phân biệt nó với môi trường
xung quanh, các dấu hiệu có khả năng phân biệt cao trong các loại thông tin thu
thập sẽ gúp quá trình xử lý số liệu cho kết quả tin cậy. Để đánh giá chất lượng của
dấu hiệu người ta sử dụng khái niệm lượng tin của dấu hiệu. Lượng tin của dấu
hiệu là khả năng mà dấu hiệu đó có thể phân biệt được các đối tượng khác nhau
với nhau. Khả năng này phụ thuộc vào việc các đối tượng của cùng một lớp có
thường xuyên cho những giá trị cố định của dấu hiệu đó hay không và các giá trị đó
có phân bố rộng ra ngoài giới hạn của các đối tượng của lớp đó hay không.
Trong quá trình nhận dạng không phải mọi dấu hiệu trường đều quan trọng
như nhau, thậm chí có những dấu hiệu trường địa vật lý hoàn toàn không chứa
thông tin về đối tượng khảo sát và có thể là những dấu hiệu nhiễu làm mờ nhạt đi
các thông tin hữu ích. Khi đưa các dấu hiệu này vào sử dụng để nhận dạng không
làm tăng mà ngược lại lại làm giảm chất lượng nhận dạng đối tượng. Chính vì vậy,
trong quá trình xử lý cần tiến hành đánh giá lượng tin của từng dấu hiệu để từ đó
chọn ra những dấu hiệu có lượng tin cao đưa vào xử lý và loại bỏ những dấu hiệu
có lượng tin thấp.
Dựa vào các giá trị trường quan sát được trên các đối tượng chuẩn người ta
tiến hành xác định các đặc trưng thống kê của trường cho từng loại đối tượng. Các
đặc trưng này được sử dụng tuỳ thuộc vào thuật toán nhận dạng áp dụng. Thường
các đặc trưng thống kê bao gồm:
- Đường cong biến phân (hàm phân bố mật độ xác xuất thực nghiệm).

- Kỳ vọng và phương sai của trường (tính thông qua đường cong biến phân).
Ngoài ra khi cần người ta tính cả hệ số tương quan giữa các dấu hiệu,
phương chủ đạo của các dị thường…
11
1.3.2 Các thuật toán nhận dạng có mẫu chuẩn
Các thuật toán nhận dạng có mẫu chuẩn là các thuật toán tiến hành xác định
bản chất địa chất của các đối tượng dựa vào việc so sánh tập hợp các dấu hiệu địa
vật lý đặc trưng cho đối tượng chuẩn với tập hợp các dấu hiệu địa vật lý của đối
tượng nghiên cứu.
Việc lựa chọn thuật toán nhận dạng tuỳ thuộc vào các điều kiện sau:
- Số liệu xuất phát.
- Tồn tại thông tin tiên nghiệm về đối tượng.
- Nhiệm vụ cụ thể của công tác địa vật lý.
Các thuật toán nhận dạng được xây dựng dựa vào các công cụ toán học khác
nhau như: toán logic, các hàm hồi quy và lý thuyết định nghiệm thống kê… dưới
đây là một số thuật toán điển hình.
a. Phương pháp nhận dạng sử dụng toán logic
Trong các thuật toán logic, để nhận dạng đối tượng hoặc là người ta tính
lượng tin tổng, hoặc là xác định khoảng cách tổng.
Từ đối tượng chuẩn tìm được các dấu hiệu đặc trưng và, người ta tiến hành
mã hoá các dấu hiệu trường bằng mã nhị phân gồm tập số “0” và “1”.
Nếu x
kn
là giá trị trường của dấu hiệu thứ n của mẫu thứ k thì:
- x
kn
= 0 khi mẫu k không chứa dấu hiệu thứ n.
- x
kn
=1 khi mẫu k chứa dấu hiệu thứ n.

Bằng cách trên toàn bộ các mẫu được mã hoá.
Tiếp theo, dựa vào các tổ hợp số “0” và “1” (từ thông tin) xác lập trên các
mẫu chuẩn người ta xác định các từ thông tin chuẩn cho từng lớp đối tượng. Từ
thông tin chuẩn cho một lớp (đối tượng) là từ thông tin gặp p lần ở các đối tượng
chuẩn của lớp đó và không gặp lần nào các đối tượng chuẩn thuộc lớp khác (giá trị
p được chọn theo kinh nghiệm). Đối với một lớp người ta có thể chọn khoảng giá trị
thông tin chuẩn. Các thông tin này được gọi là tổ hợp dấu hiệu phức hợp. Trong các
tổ hợp dấu hiệu phức hợp đặc trưng cho các đối tượng chuẩn của cùng một lớp thì
tổ hợp dấu hiệu nào đặc trưng cho số lượng mẫu chuẩn lớn hơn, tổ hợp dấu hiệu đó
sẽ có lượng tin lớn hơn.
Cuối cùng là nhận dạng các đối tượng nghiên cứu. Ở bước này người ta tiến
hành kiểm tra xem bao nhiêu tổ hợp dấu hiệu phức hợp của từng lớp gặp ở đối
tượng nghiên cứu. Nếu số lần gặp các tổ hợp dấu hiệu phức hợp của một lớp nào đó
nhiều hơn số lần gặp các tổ hợp phức hợp của lớp khác thì đối tượng nghiên cứu
12
được xếp vào lớp đó. Quá trình này được tiến hành cho tới khi đối tượng cuối cùng
được nhận dạng.
b. Phương pháp nhận dạng sử dụng phân tích hồi quy
Trong xử lý số liệu địa vật lý, thuật toán hồi quy đầu tiên được sử dụng để sử
lý các số liệu đo địa vật lý giếng khoan và phân tích định lượng các tài liệu trọng
lực. Thực chất của thuật toán này là xây dựng các hàm hồi quy xác định mối quan
hệ giữa các tham số địa chất cần tìm với các số liệu địa vật lý quan sát được bằng
các phương pháp khác nhau. Ví dụ mối quan hệ giữa một bên là độ rỗng của đất đá
với bên kia là các số liệu đo điện trở, điện trường tự nhiên, gama… dọc thành giếng
khoan.
Thường quá trình xấp xỉ các hàm hồi quy giới hạn bởi các đa thức bậc 1, bậc
2 hoặc đặc biệt có thể xấp xỉ với đa thức bậc lớn hơn. Ví dụ: nếu chỉ có hai dấu hiệu
1 và 2 thì hàm hồi quy được xấp xỉ bằng đa thức bậc 2 có đạng:
y
k

= a
k
x
1k
+ b
k
x
2k
+c
k
x
1k
x
2k
+ d
k
x
2
1k
+ g
k
x
2
2k
+ h
k
(1.12)
Các hệ số a
k
, b

k
, c
k
, d
k
, g
k
và h
k
trong biểu thức (1.12) được xác định bằng
phương pháp bình phương tối thiểu theo các giá trị địa chất của tham số y
k
xác định
được trên các đối tượng chuẩn và các số liệu đo trường địa vật lý của các dấu hiệu
x
1k
và x
2k
của chính đối tượng đó.
Phương trình hồi quy trên được xác định cho từng đối tượng chuẩn thứ k.
Ngoài phương pháp hồi quy người ta còn tiến hành xác định giá trị ngưỡng y
k
cho
từng lớp đối tượng chuẩn. Cuối cùng đưa các giá trị trường đo được trên các đối
tượng cần nghiên cứu vào các phương trình hồi quy tìm được trên đối tượng chuẩn
ta sẽ xác định được giá trị của tham số y
k
của đối tượng nghiên cứu.
Thuật toán phân tích hồi quy có ưu điểm là dễ dàng đưa vào xử lý bổ sung
các số liệu của dấu hiệu mới bằng cách đưa thêm vào phương trình của hàm hồi quy

các số hạng mới. vì vậy thuật toán này rất phù hợp cho việc xử lý các số liệu của tổ
hợp khảo sát gồm nhiều dấu hiệu khác nhau.
Tuy nhiên thuật toán hồi quy cũng có nhược điểm ở chỗ với một tập hợp số
liệu nhất định ứng với một giá trị sai số cho trước có thể xấp xỉ được nhiều hàm hồi
quy. Nhược điểm này thể hiện rõ nhất khi các đấu hiệu quan sát trường liên quan
với nhau. Lý do trên không cho phép đưa ra được các lý giải về ý nghĩa vật lý của
các hệ số của hàm hồi quy tìm được. Các lý giải vật lý chỉ có thể được đưa ra khi
dạng của phương trình này được xác định cho một mô hình vật lý cụ thể, còn quá
trình xấp xỉ hồi quy chỉ được tiến hành đơn thuần với mục đích xác định hệ số của
phương trình hồi quy ứng với mô hình vật lý đó.
13
c. Phương pháp kiểm định giả thuyết thống kê
Thuật toán nhận dạng trên cở sở mô hình thống kê đối tượng chuẩn trong
phân tích số liệu địa vật lý thường sử dụng các thông số như: tỷ số sự thật L(x) và
tổng lượng thông tin J(1:2,x).
Giá trị các thông số đó được tính theo công thức:
( )
)(
)(
2
1
xP
xP
xL =
(1.13)
( )









=
)(
)(
log,2:1
2
1
xP
xp
xJ
(1.14)
Trong đó:
P
1
(x), P
2
(x) là các xác suất bắt gặp giá trị dấu hiệu x cùng với các đối tượng
tương ứng của lớp 1 và lớp 2 (ví dụ lớp quặng và lớp không quặng). Khi sử dụng
đối tượng chuẩn cho lớp 1 (lớp quặng) thì trong các biểu thức P
2
(x) được thay bằng
1.
x là vecto giá trị các dấu hiệu được sử dụng, x
1
, x
2
,…, x

k
(ví dụ các hàm
lượng q
u
, q
th
, q
k
,…).
Khi các dấu hiệu x
1
, x
2
,…, x
k
được xem là không phụ thuộc nhau thì xác xuất
của đại lượng n chiều của tổ hợp n dấu hiệu được tính:
)() ().().()(
321 k
xPxPxPxPxP =
(1.15)
)() ().(
)() ().(
)() ().(
)(
21
22212
12111
k
k

k
xLxLxL
xPxPxP
xPxPxP
xL ==
(1.16)
),2:1( ),2:1(),2:1(),2:1(
21 k
xJxJxJxJ +++=
(1.17)
Nếu sự phụ thuộc của các dấu hiệu là rõ và sự phân bố của chúng tuân theo
luật chuẩn thì để nhận dạng các đối tượng thuộc lớp 1 và lớp 2 người ta thường sử
dụng các hàm phân giải bậc 1 (R
1
) hoặc bậc 2 (R
2
) đối với các tham số x
1
, x
2
,…, x
n
.
Các hàm này được biểu diễn như sau:

=
=
n
i
ii

xaR
1
1
(1.18)
∑∑∑
== =
+=
k
i
ii
k
i
k
j
jiij
xcxxbR
11 1
2
(1.19)
Trong đó các hệ số: a
i
, b
ij
, c
i
được xác định từ các ma trận thông tin các dấu
hiệu của các đối tượng thứ 1 và thứ 2. Thông qua các “diện tích đối tượng chuẩn”
người ta xác định được các vecto giá trị các dấu hiệu sử dụng x (trong trường hợp
các dấu hiệu được xem là không phụ thuộc nhau) hoặc các hệ số a
i

, b
ij
, c
i
(trong
14
trường hợp các dấu hiệu phụ thuộc nhau). Sau đó tính giá trị L(x), J(1:2,x) hoặc R
1
,
R
2
, phổ các giá trị này lên khắp diện tích khảo sát và biểu diễn chúng lên bản đồ.
Đối sánh các giá trị này với các giá trị của đối tượng chuẩn có thể nhận biết và
khoanh định được các diện tích đồng dạng với đối tượng chuẩn. Các dấu hiệu được
lựa chọn thường là một tổ hợp nào đó trong số các tham số thu được.
1.3.3. Các thuật toán nhận dạng không có mẫu chuẩn
a, Thuật toán kiểm chứng thống kê
Thuật toán này tiến hành phân loại trường khi các dấu hiệu trường hoàn toàn
độc lập nhau. Ban đầu người ta sử dụng bộ lọc để tách các dị thường ra khỏi phông
nhiễu cho từng dấu hiệu trường. Kết quả lọc cho phép nhận được các số liệu trường
chủ yếu gồm các dị thường. Tiếp theo phân loại các dị thường thành các lớp dị
thường. Mỗi lớp dị thường gồm các dị thường có các đặc trưng thống kê giống
nhau. Để phân loại các dị thường đầu tiên người ta phân chia khu vực khảo sát
thành các diện tích cơ sở, sau đó dựa vào kết quả phân chia cá giá trị trường ở mỗi
cửa sổ người ta dựng các đường cong biến phân đặc trưng cho cửa sổ đó. Cuối cùng
để phân lớp các dị thường người ta sử dụng các chỉ tiêu χ
2
để so sánh và xếp loại
các đường cong biến phân. Các diện tích có ước lượng phân bố mật độ xác suất
giống nhau được xếp vào một lớp.

Giai đoạn cuối cùng của quá trình nhận dạng là giai đoạn thuật toán tiến
hành xác định số hiệu của lớp tổng hợp.
Với mục đích này, dựa vào các đường cong biến phân đựng được cho từng
dấu hiệu người ta xác định giá trị trung bình và phương sai rồi sắp xếp các giá trị
trung bình theo thứ tự tăng dần. Sau đó người ta dựa vào chỉ tiêu xác suất hậu
nghiệm cực đại người ta quyết định xếp loại đối tượng khảo sát và các lớp khác
nhau. Bằng cách trên, toàn bộ khu vực khảo sát được phân thành một số diện tích có
hình dạng bất kỳ, ở đó dị thường của các dấu hiệu khác nhau đè lên nhau.
b, Thuật toán K trung bình
Nội dung thuật toán như sau: Giả sử tồn tại n đối tượng, nhiệm vụ đặt ra là
phân chia toàn bộ n đối tượng thành M lớp với M << n.
Để giải quyết nhiệm vụ trên, lúc đầu người ta chọn hú hoạ từ n đối tượng ra
k đối tượng, k đối tượng được chọn này xem như các mẫu chuẩn xuất phát. Tiếp
theo là tiến hành chính xác hoá liên tiếp các mẫu chuẩn chọn được bằng cách so
sánh các mẫu chuẩn với các đối tượng còn lại. Sau mỗi lần chọn tập hợp các mẫu
15
chuẩn E
v
chọn được ở lần chọn thứ v sẽ thay cho các mẫu chuẩn ở lần chọn thứ v-1
(lần trước đó).
Nếu ký hiệu tập hợp mẫu chuẩn (E
v
) chọn được ở lần chọn thứ v là:
E
v

= { e
1
v
, e

2
v
,… e
k
v
} với v = 0, 1, 2,
Với ký hiệu này mẫu chuẩn xuất phát là:
E
0

= { e
1
0
, e
2
0
,… e
k
0
}
Các mẫu chuẩn này chính là các mẫu được chọn ra ở vòng đầu tiên (vòng số
0) của quá trình lặp. Tiếp theo vòng số 0 thuật toán gọi tiếp số x
k+1
và tìm xem trong
k mẫu e
i
0
, mẫu chuẩn nào gần nhất với nó. Nếu tìm được, thì mẫu chuẩn thuộc tập
hợp E
0

tìm được này được thay thế bằng mẫu chuẩn mới. Mẫu chuẩn mới này có giá
trị e
i
1
được tính như giá trị trọng tâm giữa các giá trị của mẫu chuẩn cũ và giá trị của
đối tượng gắn kết với nó x
k+1
.
Sau quá trình hiệu chỉnh ở vòng 1, bằng phương pháp mô tả trên thuật toán
sẽ tiến hành hiệu chỉnh ở các lần tiếp theo, cho tới khi đối tượng cuối cùng được gọi
ra.
Sau khi tập hợp các mẫu chuẩn được chính xác hoá, thuật toán tiến hành
phân loại toàn bộ số lượng n các đối tượng theo tập hợp các dấu hiệu thành M lớp
dựa vào nguyên tắc khoảng cách tối thiểu.
1.3.4 Quyết định sự tồn tại của đối tượng và đánh giá chất lượng xử lý
Đối với thuật toán nhận dạng có mẫu chuẩn việc quyết định nghiệm chủ yếu
dựa vào chỉ số tương đồng. Chỉ số này xác định mức độ giống nhau hoặc khác nhau
giữa đối tượng nghiên cứu với đối tượng chẩn theo lượng thông tin tổng hợp của
toàn bộ các dấu hiệu (trường địa vật lý quan sát).
Phụ thuộc vào từng loại thuật toán nhận dạng người ta chọn những đại lượng
khác nhau để đánh giá chỉ số tương đồng. Đối với các thuật toán nhận dạng kiểm
chứng thống kê thì chỉ số tương đồng chính là hệ số tương thích λ hay xác suất hậu
nghiệm P(A
k
/B
j
). Đối với các thuật toán loại này để quyết định nghiệm người ta đưa
ra các giá trị ngưỡng của hệ số tương thích và xác suất hậu nghiệm. Giá trị của chỉ
số tương đồng sẽ được so sánh với giá trị ngưỡng này để quyết định đối tượng
nghiên cứu giống hay không giống với mẫu.

Chất lượng của kết quả xử lý được đánh giá dựa vào sai số nhận dạng các đối
tượng kiểm chứng. Các đối tượng kiểm chứng là các đối tượng mà bản chất địa chất
của chúng đã được xác định rõ, song chúng không được chọn là mẫu chuẩn để nhận
dạng mà được dùng làm các đối tượng để kiểm tra các kết quả nhận dạng.
16
Sai số nhận dạng được tính bằng tỷ số các đối tượng kiểm chứng được nhận
đạng dúng so với tổng các đối tượng kiểm chứng được đem ra nhận dạng.
Đối với các thuật toán nhận dạng kiểm chứng thống kê người ta sử dụng xác
suất nhận dạng sai lầm để đánh giá chất lượng xử lý. Xác suất này được xác định
dựa vào việc tính tích phân hàm phân bố mật độ xác suất của hệ số tương thích λ.
Các hàm này được xác định riêng cho các đối tượng kiểm chứng của từng lớp một.
17
CHƯƠNG 2: ỨNG DỤNG PHƯƠNG PHÁP TẦN SUẤT – NHẬN DẠNG
TRONG XỬ LÝ SỐ LIỆU ĐỊA VẬT LÝ
2.1 Phương pháp phân tích tần suất
Phương pháp phân tích tần suất với việc sử dụng tần suất trung bình của sự
xuất hiện đồng thời các dấu hiệu do Griffths -Vinni đưa ra tiến hành trên một loại
đối tượng mẫu có nội dung tóm tắt như sau:
Giả sử ta có đối tượng nghiên cứu với k loại dấu hiệu, mỗi dấu hiệu có n số
liệu đã biết. Khi đó ta có ma trận thông tin các dấu hiệu của đối tượng mẫu như sau:
( )















=
nknn
k
k
dt
ji
ϕϕϕ
ϕϕϕ
ϕϕϕ
ϕ




21
22221
11211
,
(2.1)
Trong đó:
k là số các tính chất của ma trận thông tin
n là số lượng mẫu của mỗi loại thông tin
Mỗi phần tử
ij
ϕ

của ma trận được biểu diễn bằng các khái niệm logic: “yes”
hoặc “no” hoặc bằng các số 1 hoặc 0.
Theo Griffths-Vinni, lượng thông tin tương đối của dấu hiệu thứ “i” được
xác định theo công thức:
2
11
∑ ∑
=






=
k
kj
n
h
hjhii
kn
I
ϕϕ
(2.2)
Nếu sắp xếp các dấu hiệu của đối tượng theo thứ tự giảm dần của lượng
thông tin tương đối, ta sẽ được tập mới là
{ }
*
i
I

. Khi đó tỷ trọng thông tin của tổng m
dấu hiệu đầu tính theo tỉ lệ % trong tổng thông tin của tất cả k dấu hiệu được tính
bằng:
18
%100
1
*
1
*
2
2
×=


=
=
k
i
i
m
i
i
m
I
I
P
(2.3)
Tỷ trọng thông tin P
m
là giá trị biểu hiện chất lượng của m tính chất lựa chọn

trong k tính chất ban đầu. Theo như thuật toán này khi ta lựa chọn trước một giá trị
tỷ trọng thông tin thì tương ứng ta có thể tính toán được m thông tin tương ứng.
Như vậy thuật toán cho phép đánh giá chất lượng của từng loại thông tin và lựa
chọn tập hợp chủng loại thông tin có giá trị cao phục vụ các mục đích nghiên cứu.
19
2.2 Phương pháp Tần suất - Nhận dạng
Lý thuyết của phương pháp phân tích tần suất ở trên là một cơ sở để lựa chọn
các tính chất tốt một cách định lượng. Như đã trình bày trong chương 1, tổ hợp số
liệu địa vật lý là tập hợp của các tính chất có chất lượng khác nhau. Và khi ứng
dụng phương pháp phân tích tần suất trong việc tìm một tổ hợp tính chất tốt phục vụ
mục tiêu nhận dạng đối tượng là hiệu quả và có tính định lượng. Phương pháp Tần
suất – Nhận dạng là một phương pháp nhận dạng trong xử lý số liệu địa vật lý do
PGS. TS. Võ Thanh Quỳnh đề xuất trên cơ sở ứng dụng phương pháp phân tích tần
suất trong tổ hợp số liệu thống kê cũng như xây dựng thuật toán phân tích, đối
sánh, xác định đối tượng đồng dạng (kết quả đề tài QG06.16).
Các nội dung của phương pháp tần suất nhận dạng gồm có 3 nội dung chính
sau:
- Xây dựng ma trận thông tin của đối tượng mẫu.
- Đánh giá, lựa chọn tổ hợp thông tin.
- Phân tích, đối sánh, xác định các đối tượng đồng dạng.
2.2.1. Phương pháp xây dựng ma trận thông tin đối tượng mẫu
Đây là một nội dung rất quan trọng ảnh hưởng tới kết quả phân tích của thuật
toán Griffths –Vinni, trước hết cần có ma trận thông tin của đối tượng mẫu. Ma trận
thông tin của đối tượng mẫu trong phương pháp phân tích tần suất được xây dựng
như sau:
Từ tập hợp số liệu của các chủng loại thông tin của đối tượng mẫu xây dựng
các đường cong biến phân (đường cong mật độ phân bố). Từ các đường cong biến
phân xác định khoảng giá trị đặc trưng cho từng tham số. Sau khi có được các
khoảng giá trị đặc trưng, dùng nó làm “cửa sổ quét” để tạo ra các đơn vị thông tin
cho từng chủng loại thông tin của từng phần tử. Đối với mỗi phần tử của mỗi chủng

loại thông tin, nếu nó nằm trong khoảng giá trị đặc trưng sẽ nhận giá trị là 1, nằm
ngoài sẽ nhận giá trị là 0. Bằng cách này sẽ chuyển được một ma trận thông tin với
các số liệu địa chất, địa vật lý bất kì về ma trận thông tin chuẩn theo yêu cầu của
thuật toán với các phân tử là các giá trị 1 hoặc 0.
2.2.2. Phương pháp đánh giá lựa chọn tổ hợp thông tin
Để tiến hành phân tích đối sánh, xác định các đối tượng đồng dạng, trước hết
cần đánh giá lựa chọn tổ hợp thông tin có chất lượng cao từ tập hợp tất cả các chủng
loại thông tin có được về đối tượng nghiên cứu.
20
Nội dung này được thực hiện theo đúng phương pháp phân tích tần suất như
đã trình bày ở mục 2.1. Số lượng chủng loại thông tin m được lựa chọn tùy thuộc
vào giá trị ngưỡng của P
m
cho trước (ví dụ P
m
≥ 75%).
2.2.3. Phương pháp phân tích đối sánh xác định các đối tượng đồng dạng
Phân tích đối sánh, xác định đối tượng đồng dạng là nội dung chính của một
thuật toán nhận dạng.
Các đối tượng cần đối sánh với đối tượng mẫu để xem nó có đồng dạng với
đối tượng mẫu hay không được thực hiện như sau:
- Xây dựng ma trận thông tin cho đối tượng đối sánh tương tự như đối với
đối tượng mẫu thông qua các khoảng giá trị đặc trưng của chính đối tượng mẫu.
- Tiến hành đánh giá tỷ trọng thông tin cho tất cả các tính chất của đối tượng
đối sánh bằng phương pháp phân tích tần suất như trên.
- Tính tỷ trọng thông tin của tổ hợp thông tin đã được lựa chọn của đối tượng
mẫu cho đối tượng đối sánh. Có thể xem giá trị này tương tự hệ số đồng dạng, ta gọi
nó là chỉ số đồng dạng, kí hiệu P
*
m

.
Đối tượng đối sánh được xem là đồng dạng với đối tượng mẫu khi P
*
m
có giá
trị đạt mức quy định nào đó. Ví dụ P
*
m
≥ 65%.

21
2.3. Xây dựng phần mềm ứng dụng phương pháp Tần suất – Nhận dạng
Theo nội dung phương pháp phân tích tần suất nhận dạng được trình bày ở
trên tôi đã thành lập một phần mềm tự động xử lý số liệu tương ứng trên máy tính
(phụ lục 1) . Về nguyên tắc chương trình này có thể xử lý mọi tổ hợp số liệu phức
tạp tương ứng như số liệu địa chất, địa vật lý, địa hoá…Các nội dung thực hiện tính
toán của chương trình được trình bày trên sơ đồ khối như sau:
Hình 2.1: Sơ đồ khối chương trình xử lý số liệu
Từ số liệu đầu vào bao gồm: số liệu của đối tượng mẫu và số liệu của vùng
nghiên cứu hoặc của các đối tượng cần đối sánh. Chương trình sẽ tính toán với 2
nội dung chính là thực hiện tính toán trên đối tượng mẫu và từ các kết quả phân tích
đối tượng mẫu tiến hành đối sánh hoặc phân vùng tuỳ thuộc vào dạng dữ liệu đầu
vào của những đối tượng cần xác định.
Phân tích, tính toán trên đối tượng mẫu:
Với thông tin đầu vào của đối tượng mẫu bao gồm toạ độ điểm và các chủng
loại thông tin của đối tượng chương trình tiến hành xây dựng ma trận thông tin cho
đối tượng mẫu theo thuật toán trình bày trong mục 2.2.1.
22
Từ ma trận thông tin thành lập được tiến hành lựa chọn tổ hợp thông tin mới
trong tổ hợp thông tin ban đầu với các loại thông tin được lựa chọn có chất lượng

cao. Thuật toán lựa chọn tổ hợp thông tin được trình bày trong mục 2.2.2.
Hình 2.2 : Dao diện chương trình xử lý số liệu
Tuỳ thộc vào mục tiêu xử lý số liệu chương trình có thể thực hiện với hai
trường hợp khác nhau:
Trường hợp 1 – Đã biết đối tượng đối sánh:
Ở trường hợp này, các đối tượng là xác định, dữ liệu đầu vào là số liệu của tổ
hợp đối tượng cần đối sánh với đối tượng mẫu. Đối với mỗi đối tượng chương trình
tính toán với tổ hợp thông tin đã lựa chọn ở đối tượng mẫu (tổ hợp các thông tin có
chất lượng, đặc trưng cho đối tượng mẫu) các bước tiến hành cụ thể như sau:
- Bước 1: Xây dựng ma trận thông tin của đối tượng đối sánh với khoảng giá
trị đặc trưng cho các tham số là khoảng giá trị đặc trưng của tham số đó tính
được ở đối tượng mẫu.
- Bước 2: Tính toán giá trị chỉ số đồng dạng P*m từ đó cho biết đối tượng đối
sánh có đồng dạng với đối tượng mẫu hay không.
Kết quả sau khi tính toán với trường hợp này bao gồm:
- Các khoảng giá trị đặc trưng cho từng tính chất của đối tượng mẫu.
- Kết quả đánh giá và lựa chọn các chủng loại thông tin của đối tượng mẫu.
- Danh sách các đối tượng đồng dạng với đối tượng mẫu và chỉ số đồng dạng
tương ứng.
Trường hợp 2 – Chưa biết đối tượng đối sánh
Từ số liệu của đối tượng mẫu và số liệu của toàn bộ diện tích cần nghiên
cứu, yêu cầu trong trường hợp này là tiến hành khoanh vùng được các vùng đối
tượng đồng dạng với đối tượng mẫu. Trong trường hợp này số liệu mẫu được xử lý
23
hoàn toàn tương tự như trường hợp 1. Việc xử lý số liệu đối với vùng nghiên cứu
được tiến hành như sau:
- Bước 1: Thành lập các diểm trên mạng lưới đều phủ kín toàn bộ diện tích
- Bước 2: Từ mỗi điểm trên mạng lưới thành lập được, lấy nó làm tâm dựng
một hình vuông cạnh a với a được lựa chọn sao cho phù hợp.
- Bước 3: Coi mỗi hình vuông dựng được là một “đối tượng” đối sánh với số

liệu là toàn bộ các điểm số liệu của vùng nằm trong hình vông này. Tiến
hành phân tích trên các “đối tượng” đối sánh như ở trường hợp 1 và nhận
được giá trị P
*
m
của các “đối tượng” này.
- Bước 4: Gán giá trị P
*
m
tìm được về điểm trung tâm của hình vuông (các
điểm được thành lập ở bước 1)
Kết quả sau khi tính toán với trường hợp này bao gồm:
- Kết quả đánh giá và lựa chọn thông tin của đối tượng mẫu.
- File dữ liệu P
*
m
trên mạng lưới đều.
Từ file dữ liệu đầu ra (P
*
m
) ta có thể vẽ các bản đồ đồng mức bằng một số
phần mềm hỗ trợ thành lập bản đồ như MAPINFOR, Suffer for Win…
Dựa theo bản đồ này ta có thể xác định các đối tượng đồng dạng với đối
tượng mẫu đã dùng đối sánh.
Chương trình này được viết với ngôn ngữ lập trình C, mặc dù có những điểm
yếu trong trình bày dao diện nhưng các hỗ trợ toán học cao giúp cho các bước tính
và số lượng phép tính được tối ưu khi lập trình.
24
CHƯƠNG 3: ÁP DỤNG KẾT QUẢ NGHIÊN CỨU PHÂN TÍCH DỮ LIỆU
VÙNG ĐÔNG TUY HOÀ

3.1 Đặc điểm địa chất và địa vật lý vùng Đông Tuy Hoà
3.1.1. Đặc điểm địa lý, tự nhiên
Vị trí địa lý, địa hình
Khu vực nghiên cứu thuộc Trung Trung bộ gồm phần lớn thuộc địa phận
tỉnh Phú Yên, được giới hạn từ 12
o
53’ – 13
o
21’ vĩ độ bắc và 108
o
53’ – 109
o
28’ kinh
độ đông với tổng diện tích gần
3500km
2
bao gồm các huyện: Sơn Hoà,
Tuy Hoà, Sông Hinh (tỉnh Phú Yên),
Địa hình của khu vực chủ yếu là
đồng bằng và một phần nhỏ phía tây là
đồi núi thấp. Phần lớn khu vực ven
biển Tuy Hoà đều khá phẳng và nông
với các bãi, doi cát trừ đoạn đèo Cả có
nhiều ngành đá, vũng vịnh nhỏ, nước
sâu. Vùng cửa sông Đà Rằng thường bị
cát bồi không thuận lợi cho lưu thông
dòng chảy. Phía trong bờ biển có các
đồng bằng hẹp phân bố không liên tục
dọc sông Ba.
Khí hậu, Thuỷ văn

Khu vực nghiên cứu đặc trưng bởi điều kiện nhiệt phong phú. Ở đây có đặc
trưng của vùng khí hậu nhiệt đới ẩm gió mùa và chịu ảnh hưởng của đại dương. Có
2 mùa rõ rệt: mùa mưa từ tháng 9 đến tháng 12 và mùa nắng từ tháng 1 đến tháng 8.
nhiệt độ trung bình hàng năm khoảng 27
o
C, lượng mưa trung bình hàng năm đạt
1600mm – 1700mm.
Mạng lưới sông suối của khu vực tương đối dày nhưng do đặc điểm địa hình
nên các sông thường ngắn và dốc. các sông lớn thường bắt nguồn từ dãy trường sơn
(sông Ba, sông Đà Nông, sông Krông H’Năng, sông Hinh…). Lớn nhất trong vùng
là sông Đà Rằng (sông Ba) đổ ra biển đông ở thị xã Tuy Hoà. Chế độ thuỷ văn ở
đây cũng hoàn toàn phụ thuộc theo mùa. Vào mùa mưa lượng dòng chảy chiếm hơn
80% tổng lượng dòng chảy năm. Hơn nữa, do đặc trưng địa hình dốc nên vào mùa
25
Hình 3.1: Vị trí khu vực nghiên cứu

×