Tải bản đầy đủ (.pdf) (47 trang)

Nghiên cứu áp dụng bài toán nhận dạng xác định các đặc trưng của trường địa hoá thứ sinh- phục vụ tìm kiếm khoáng sản

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (19.21 MB, 47 trang )

ĐẠI HỌC QUOC GĨA HA NỢI
TRƯỜNG ĐẠI HỌC KHOA HỌC Tự NHIÊN
ì?*#**********
N G H IÊ N C Ứ U Á P D Ụ N G
BÀI TOÁN NHẬN DẠNG XÁC ĐỊNH CÁC
• • •
ĐẶC TRƯNG CỦA TRƯỜNG ĐỊA HOÁ THỨ
SINH PHỤC y ụ TÌM KIẾM KHOÁNG SẢN
MÃ Số: QT - 01 - 18
Chủ trì đề tài: TS. Đặng Mai
Ị - •
iĩr ■
0 1 1 /I4 Ỉ
— HÀ NỘI -2 0 0 3 —
1. BÁO CÁO TÓM TẮT
a. Tên đề tài: Nghiền cứu áp dụng bài toán nhận dạng xúc định
các đặc trưng của trường địa hoá thứ sinh - phục vụ tìm kiếm
khoáng sản
M ã số: QT - 01 - 18
b. Chủ trì đề tài: TS. Đặng Mai
c. Các cán bộ tham gia:
d. Mục tièu và nội dung nghiên cứu:
Để tài nhằm nghiên cứu các thuật toán nhận dạng và công nghệ tin
học thích hợp cho việc phân tích, xử lý số liệu kim lượng và xác định các
đặc trưng của trường địa hoá thứ sinh.
Để đạt mục đích đó, một tập mẫu kim lượng ở vùng Lào Cai, gồm
hơn 5.900 kết quả phân tích định lượng gần đúng của các nguyên tô Ba, Ti,
Cr, Co, Ni, Mo, w , Sn, Bi, Cu, Pb, Zn, Nb, Li, Ce, La, Zr đã được lựa chọn
và xử lý theo các nội dung sau: 1) Nhận dạng các tổ hợp nguyên tố chi thị.
2) Phân vùng trường địa hoá thứ sinh và 3) Nhận dạng phông và dị thường
địa hoá.


e. Các kết quả đạt được:
1. Bằng việc áp dụng phân tích chùm (cluster analyse) theo các độ đo
và phương pháp ghép nhóm khác nhau đã xác định được rằng độ đo Pearson
với thuật toán trọng tâm thích hợp cho việc phân chia các tổ hợp nguyên tô
chỉ thị trong trường địa hoá thứ sinh.
2. Tổ hợp nguyên tố chỉ thị trong trường địa hoá thứ sinh vùng
nghiên cứu gồm:
• Pt>0 .6 9 Baí)ilị3 La()i9 -,Ce0 9 4
• Ti0 69Co0 7X Cr0 72Ni0 X4
• Mo0 í7 Sn()X2
• Cuoyi Bi()91 Pb052 W07l
3. Thuật toán K-means cluster được áp dụng đã chia tập mầu thành 4
nhóm khác nhau. Mỗi nhóm bao gồm một số mẫu phân bổ trona không
gian nhất định tạo thành các kiểu địa hoá riêng biệt. Các hàm nhận dạng
của chúng có dạng:
F,= -0.49Ba+ 1.68TĨ - 662.66Cr +765.22CO - 0.44NÌ +11.36MO +
24.31W - 2.66Sn -3.30BĨ -11.08Cu -17.08Pb -21.93Zn -39.37Nb -16.91LÌ +
43.63Ce + 527.92La - 1.97Zr - 1150.74
F2 = -0.40Ba-1.23Ti - 666.6lCr +776.60CO + 2.05NÌ +1I.21MO+
23.30W - 3.78Sn + 0.61BÌ -11.13Cu -16.68PỒ -ỉ8.63Zn -25.02Nb-15.96Li -
23.46Ce + 530.47La + 0.44Zr -1124.59
F3 = -1.00Ba-0.17Ti - 683.34Cr + 790.41CO - 2.10NĨ + IO.2 IM0 +
23.37W -4.37Sn -2.53BÌ -15.40Cu -16.72PỒ -21.12Zn -22.32Nb-13.82Li -
26.10Ce + 527.09La + 0.29Zr -1126.01
F4 = -0.96Ba -1.19TĨ - 679.7lCr + 789.69CO - 2 .3 2 N1 + 11.84MO +
24.39W -3.09Sn -5.30BÌ -9.89Cu -16.49Pb -21.31Zn - 24.79NÒ -13.18LĨ -
24.92Ce + 525.88La + 0.91Zr -1132.71
Các hàm này cho xác suất nhận dạng đúng trên 90%.
4. Xu hướng biến đổi hàm lượng các nguyên tố chi thị trong trường
địa hoá thứ sinh được mô tả bằng các đa thức hai biến z = f (x, y) bậc 2. với

z là hàm lượng nguyên tố chỉ thị, X và y là hai toạ độ địa lý.
Tính giá trị trend và phần dư cho tất cả các điểm lấy mẫu và nội suy
lưới điểm bằng phương pháp Kriging, xác định được diện phân bỏ phông và
dị thường địa hoá làm cơ sở cho việc đánh giá triển vọng khoáng sán của
vùng nghiên cứu.
f. Tình hình sử dụng kinh phí của để tài
Kinh phí hỗ trợ : 18.000.000 đ
Kinh phí được cấp: 17.280.000 đ
Vật tư văn phòng
750.000 đ
Công tác phí
2500.000 đ
Chi phí thuê mướn
10.800.000đ
Hội nghị, nghiệm thu
1.480.000 đ
Mua tài liệu, số liệu 1.550.000
In ấn 200.000 đ
Tổng 17.280.000
KHOA QUẢN LÝ
(Ký và ghi rõ họ tên)
CHỦ TRÌ ĐỂ TÀI
(Ký và ghi rõ họ tên)
T S -
<ỉyỵ? VúL-T) i^cÀ ú ư /y^

Cơ QUAN CHỦ TRÌ ĐỂ TÀI
OHÓ W!ÊU Tt?'JỞNtr
SUMMARY
a. Title of the project: Study ofthe application of the diagnostic algorithm

for determination of the characteristics of secondary geochemìcaì /ieìcls in
mineral expìoraỉion
Code: QT - 01 - 18
b. Head of the project: Dr. Đặng Mai
c. Participants:
d. Objectives and contents of the project:
The objectives of the project are to study appropriate diagnostic
algorithms and informatic technologies for analysis and treatment of
metallometric data and determination of the characteristics of geochemical
íields.
To obtain these aims, a set of metallometric samples in Lao Cai area.
including more than 5.900 results of qualitative determination of Ba, Ti, Cr,
Co, Ni, Mo, w , Sn, Bi, Cu, Pb, Zn, Nb, Li, Ce, La, Zr, has been selected
and treated according to the next items: 1) Diagnosis of the assemblages of
elements-indicators 2) Zoning of secondary geochemical fields 3)
Diagnosis of geochemical background and anomalies.
e. Obtained results:
1. By the application of cluster analysis according to diíĩerent
measurements and grouping methods it has been determined that the
Pearson measurement with centroid algorithm is suitable for classitication
of the assemblages of elements-indicators in secondary geochemical lields.
2. The assemblages of elements-indicators in the study area include:
• Pfr(i (w Ba(lx1La09ìCe()ụ4
• Ti() 6L)Co() 7X Cr0 72Nio x4
• Mo0 57 Sn0 K2 Nb0 X6
• Cu(ly| Bi09I Pb( ) 52 W07|
3. By using the K-means cluster algorithm, the set of samples has
been divided into 4 different groups. Each group includes some samples
which are located in a definite space íorming separate geochemical types.
Their diagnostic equations have forms as foỉlow:

F|= -0.49Ba+ 1.68TĨ - 662.66Cr +765.22CO - 0.44NÌ +11.36MO +
24.31W - 2.66Sn -3.30BÌ -11.08Cu -17.08PÒ -21.93Zn -39.37Nb-16.91Li +
43.63Ce + 527.92La - 1.97Zr - 1150.74
F2 = -0.40Ba-1.23Ti - 666.61Q +776.60CO + 2.05NÍ +11.21MO+
23.30W - 3.78Sn + 0.61BÌ -11.13Cu -16.68Pb -18.63Zn -25.02Nb-15.96Li -
23.46Ce + 530.47La + 0.44Zr-1124.59
F3 = -1.00Ba-0.17Ti - 683.34Cr + 790.41CO - 2.10NĨ + 10.21MO+
23.37W -4.37Sn -2.53BÌ -15.40Cu -16.72Pb -21.12Zn -22.32Nb-l3.82Li -
26.10Ce + 527.09La + 0.29Zr -1126.01
F4 = -0.96Ba -1.19TÍ - 679.71& + 789.69CO - 2.32NÍ + 11.84Mo +
24.39W -3.09Sn -5.30BĨ -9.89Cu -16.49PÒ -21.31Zn - 24.79NÒ -13.18LĨ -
24.92Ce + 525.88La + 0.91Zr -1132.71
These equations have the diagnostic probability more than 90%
accurate.
4. The trends in change of the contents ot' elements-indicators in
secondary geochemical fields have been portrayed by bi-variant second
ordered polynomical íunctions z = f (x, y), where z is a content of elements-
indicators, X and y are geographical coordinates.
Based on the trends and surplus calculated for all the sampling points
and by interpolation of point set according to Kriging method, the contours
of geochemical background and anomalies, basis for evaluation of mineral
potential in the study area, have been deíìned.
MỤC LỤC
Mớ đầu 2
Chương 1 4
Nhận dạng các tổ hợp nguyên tô chi thị của trường địa hoá

4
1.1. Phân tích chùm 4
1.1.1. Cơ sở lý thuyết của phương pháp

4
1.1.2. Kết quả áp dụng phương pháp 5
1.2. Phân tích Thành phần chính 9
1.2.1. Cơ sở lý thuyết của phương pháp
9
1.2.2. Kết quả áp dụng phương pháp 11
Chương 2

14
Phân vùng tự động trường địa hoá thứ sinh 14
2.1. Cơ sở lý thuyết của phương pháp 14
2.2. Kết quả áp dụng phương pháp 15
2.2.1. Phân vùng tự động 16
2.2.2. Hàm nhận dạng

16
Chương 3 22
Nhận dạng phòng và dị thường địa hoá 22
3.1. Cơ sở lý thuyết của phương pháp 22
3.2. Kết quả áp dụng phương pháp 23
3.2.1. Hàm trend 23
3.2.2. Bản đồ trend và phần dư 23
Kết luận 30
Tài liệu tham khảo 31
Mở đầu
Bài toán nhận dạng đã được đề xuất ứng dụng vào Địa chất học từ
những thập niên 70 của thế kỷ trước [8, 11], nhưng do tính phức tạp vé các
thuật toán và những đòi hỏi cao về kỹ thuật máy tính nên mức độ áp dụng
còn hạn chế. ơ Việt Nam, vấn đề này lại càng mới mẻ và còn ít được quan
tâm.

Đề tài này là một bước thử nghiệm nhằm áp dụng một sỏ phương
pháp toán học nhận dạng và phần mềm thông kẽ hiện đại SPSS vào việc giai
quyết một bài toán địa chất cụ thể: xác định các đặc trưng định lượng cùa
trường địa hoá thứ sinh, phục vụ tìm kiếm khoáng sản.
Với mục đích đó, tác giả đã lựa chọn và xử lý một tập mẫu kim lượng
thuộc địa phận tỉnh Lào Cai cùng các bản đồ sô hoá của nó. Tập mẫu này
gồm hơn 5900 kết quả phân tích định lượng gần đúng với danh sách các
nguyên tố gồm: Ba, Ti, Cr, Co, Ni, Mo, w , Sn, Bi, Cu, Pb, Zn, Nb, Li, Ce.
La, Zr. Khu vực nghiên cứu nằm trong phạm vi toạ độ địa lý:
22° 10’ đến 22°50’ vĩ độ bắc
103°30’ đến 104''00’ kinh độ đông
Các đặc trưng chính của trường địa hoá thứ sinh bao gồm tổ hợp cộng
sinh nguyên tố chỉ thị, phông, dị thường địa hoá và một sỏ tham số khác.
Việc xác định các đặc trưng này là bài toán muôn thổ trong công tác tìm
kiếm khoáng sản bằng phương pháp địa hoá. Theo truyền thống, các đặc
trưng đó được xác định bằng các thủ tục thống kê cổ điên và kinh nghiệm
địa chất. Các phương pháp này có ưu điểm là tương đổi đơn giản, có thế sứ
dụng rộng rãi trong các đoàn Địa chất. Tuy nhiên, để phân tích sâu sắc và
khái quát cấu trúc số liệu trong những tập mẫu lớn, các phương pháp dó
không thể thực hiện được. Bài toán toán nhận dạng với các thuật toán thống
kê hiện đại có thể đáp ứng được yêu cầu đó.
Trong để tài này, việc xác định các tổ hợp nguyên tố của trường thứ
sinh sẽ được tiến hành theo phương pháp phân tích chùm (cluster analyze)
và phân tích nhân tố theo thành phần chính (factor analyze) . còn phỏng va
dị thường địa hoá sẽ được nhận dạng theo phương pháp
■)
phân tích trend. Phân tích phân biệt (discriminal analyze) sẽ
được áp dùng vào việc nhận dạng kiểu và vùng địa hoá.
Công trình được hoàn thành nhờ vào sự trợ giúp kinh phí của Đại học
Quốc Gia Hà Nội và sự giúp đỡ của Phòng KHCN trường ĐHKHTN. Tác

giả xin chân thành cảm ơn.
Chương 1
NHẬN DẠNG CÁC Tổ HỢP NGUYÊN Tố CHỈ THỊ
CỦA TRƯỜNG ĐỊA HOÁ
Các tổ hợp nguyên tố chỉ thị quặng (THNTCT) của trường địa hoá
thứ sinh có ý nghĩa quan trọng trong việc đánh giá kiểu quặng hoá và tính
chất sinh khoáng của khu vực. Mặt khác, đối với công tác tìm kiếm địa hoá.
có thể dựa vào các tổ hợp đó để lựa chọn phương pháp và chi tiêu phân tích
hợp lý. Tổ hợp nguyên tố chỉ thị thường được xác định bằng cách chổng
ghép các bản đổ dị thường địa hoá hoặc phân tích tương quan. Mỗi phương
pháp đều có những ưu thế và hạn chế nhất định. Dưới đây sẽ áp dụng phân
tích chùm và phân tích thành phần chính để giả bài toán này.
1.1. PHÂN TÍCH CHÙM
1.1.1. Cơ sở lý thuyết của phương pháp
Phương pháp phân tích chùm sử dụng thuật toán ghép nhóm dựa vào
độ đo "khoảng cách" của các đối tượng [1, 2, 4] mà trong trường hợp này là
các nguyên tố trong trường địa hoá thứ sinh.
Các độ đo khoảng cách được sử dụng ở đây bao gồm:
1. Khoảng cách ơcơlit:
2. Khoảng cách khi bình phương:
2. Khoảng cáh Trêbưsev:
D (x,y) = Max,! X, - y, I (3)
3. Khoảng cách cosine:
4
D(x, y) =
(
\
z *
,y«
(

\
/
\
I * ? I y?
V 1
/
V i
>
(4)
4. Độ đo pearson
D (x, y) =
I ZX,-Z,
_J
______
_
N -l
(5)
Trong các biểu thức trên, X, và y, là giá trị của đối tượng X và y tương
ứng tai điểm quan trắc i, N là tổng số điểm quan trắc.
Các phương pháp ghép nhóm:
1. Liên kết trung vị (median clustring)
2. Liên kết lân cận gần (nearest
neighbor)
3. Liên kết trọng tâm (centroid
clustering)
1.1.2. Kết quả áp dụng phương pháp
Mô hình THNTCT được đưa ra trên
các hình 1-8. Đó là các đendrogram được
xử lý và thiết lập bằng chương trình SPSS
10.0 theo các thuật toán nêu trên.

Đendrogram lập theo khoảng cách
Ơcơlit gồm hai nhánh (hìnhl), trong đó
nhánh thứ nhất chỉ có titan, nhánh thứ hai
chứa tất cả các nguyên tố còn lại. Đến lượt
mình, nhánh thứ hai lại được tách thành hai
nhánh con: bari và các nguyên tô' khác
V.V RÕ ràng rằng mô hình này không phản
ánh đúng đặc điểm địa hoá của khu vực nghiên cứu.
Mô hình lập theo khoáng cách Khi-bình phương cũng có những nét
tương tự như mô hình trên (hình 2). Ỏ đây, xuất hiện tố hợp w - Sn - Mo -
Li - Bi tương đối rõ rệt, còn các nguyên tô khác nhir Pb, Zn. Cu không
5
nam trong một tô hợp nào. Mô hình này cũng không hợp lý.
Trên hình 3 ta thấy có ba nhánh độc lập, đó là Ti. Ba, Ce và các
nguyên tố còn lại, Nhánh thứ tư này lại
phân ra các nhánh phụ bao gồm Co-Mo-
Bi-Sn-W-Zn-Nb, Cr-Cu-Pb và La. Các tổ
hợp này không phù hợp với tính chất địa
hoá của các nguyên tố. Như vậy, độ đo
Trêbưsev không thích hợp cho việc phân
nhóm các tổ hợp nguyên tố chỉ thị trong
trường địa hoá thứ sinh.
Khoảng cách Côsin được thử
nghiêm theo ba phương pháp khác nhau:
trọng tâm, trung vị và lân cận gần. Trên
mô hình theo phương pháp trọng tâm của
độ đo này xuất hiện ba nhánh lớn. Nhánh
thứ nhất bao gồm năm nguyên tô' Ce, La,
Ba, Pb, Li, Nhánh thứ hai bao gồm ba
nguyên tố Bi, Cu, w. Các nguyên tố còn

lại (Nb, Zr, Mo, Sn, Cr, Ni, Ti, Zn, Co)
thuộc vào nhánh thứ ba (hình 4). Trong
khi đó, đendrogram theo phương pháp
trung vị chỉ gồm hai nhánh: Li là nhánh
thứ nhất, còn nhánh kia gồm 16 nguyên
tố (hình 5). Nhánh thứ hai này lại chia
thành ba nhánh con. Nhánh con thứ nhất
gồm Ce, La, Ba, Pb. Nhánh con thứ hai
gồm Ti, Zn, Co. Cr, Ni, Nb, Zr, Sn, Mo.
Các nguyên tố Bi, Cu, w thuộc nhánh
thứ ba. Đendrogram lập theo phương
pháp làn cận gần cũng có những nét
tương tự. Liti vẫn tách thành một nhánh
độc lập, nhưng tổ hợp nguyên tô trong
các nhánh phụ có nhiều thay đổi. Tổ hợp
w
Bi —
Li —
Sn
Mo —
Co

Cu
Zn
Cr
Zr
Nb
Ce
La
Ba

Ti.
I
Ti
Hình 2. Độ do Khi-bình
phương -thuật toán trọng lãm
Co
Mo
Bi
Sn
w
Zn
Ni
Zr
Nb
Li
Cr
Cu
Pb
La
Ce
Hình 3. Độ đo Trebưsev
thuật toán trọng tám
6
thứ nhất bao gồm Ce, La, Ba, Pb, Ti, Zn, Co và tổ hợp thứ hai gồm Cr. Ni.
Nb, Zr, Sn, Mo, Bi, Cu, w. Như vậy, các tổ hợp theo mô hình Cosin không
thật rõ ràng và chưa phản ánh đúng thực tế.
Chuyển sang các đendrogram lập theo độ đo Pearson. Tương tự như
các mô hình Cosin, trong thuật toán trung vị, cây phân loại gồm hai nhánh
không cân đối. Một nhánh là Li, còn nhánh kia hợp thành bới các nguyên tô
Ce, La, Ba, Pb, Bi, Cu, w, Cd, Ni, Co, Ti, Zn, Mo, Nb, Zr, Sn. Các nguyên

tố trong nhóm thứ hai này được xếp vào bốn phụ nhóm. Đó là Ce-La-Ba-Pb.
Bi-Cu-W, Cd-Ni-Co-Ti-Zn-Mo và Nb-Zr-Sn (hình 7). Nếu không xét trườna
hợp đứng riêng của Li, cây phân loại này khá phù hợp với thực tế.
Hình 5. Độ đo Cosin
thuật toán trung vị
Đendrogram theo thuật toán trọng tâm của độ đo Pearson được tách
thành bốn nhánh rõ rệt (hình 8). Các thành viên trên nhánh thứ nhất là Ce.
La, Ba, Pb. Đó là một tổ hợp đặc trưng cho quặng nhiệt dịch chứa đất hiếm.
Nhánh thứ hai gồm Bi, Cu và w , tương ứng tổ hợp nhiệt dịch nhiệt đọ cao.
Nhánh thứ ba đặc trung cho các nguyên tố liên quan đến magma axit như
Nb, Zr, Sn, Mo. Zn. Và, cuối cùng, tổ hơp nguyên tố liên quan đến magma
bazơ tạo nên nhánh thứ tư. Các tổ hợp chi thị thế hiện trẽn đendrogram này
phan anh đung đặc điểm địa hoá các nguyên tô và đặc điếm kim sinh cua
khu vực nghiên cứu.
Từ những điều trình bày trên đày, có thể rút ra hai nhận định trong
phần này như sau.
• Trong vùng nghiên cứu tồn tại bốn tổ hợp nguyên tô chi thị
Ce
La
Ba
Pb
Ti
Zn
Co
Cr
Ni
Nb
Zr
Sn
Mo

Bi
Cu
w
Li
J
Hình 6. Độ đo Cosin
- thuật toán lân cận gần
Ce
La
Ba
Pb
Bi
Cu
w
Cd
Ni
Co
T1
Zn
Mo
Nb
Zr
Sn
Li
Hình
I
7. Đọ đo Pearson - thuật toán
trung vị
là Pb -La- - Ce - Ba, Bi - Cu - w, Nb - Zr - Sn - Mo và, Cr - Ni - Ti -
Co - Li.

• Độ đo Pearson với thuật toán trọng tâm thích hơp cho việc
phân chia các tổ hợp nguyên tố chí thị trong trường địa hoá thứ sinh.
1.2. PHÂN TÍCH THÀNH PHAN ch ính
1.2.1. Cơ sở lý thuyết của phương pháp
Phân tích thành phần chính là một trong những phương pháp rất có
hiệu lực đế lựa chọn tham số nhận dạng. Ngoài ra, trong nghiên cứu địa
hoá phương pháp này còn được ứng dụng đế phân chia các tổ hơp nguyên
X
tố chỉ thị cuả trường địa hoá. Ý nghĩa quan trọng của phương pháp này là ớ
chô từ những tham số ít đặc tưng tạo ra được những tham số đặc trưng hưn
và có thể rút bớt tham số nhận dạng m à lượng thông tin mất đi không đáng
kể.
Gọi các nguyên tố trong trường địa hoá thứ sinh là các biến ngẫu
nhiên Xj, x2, , xm. Vấn để đặt ra là tìm phép biến đổi tuyến tính m vectơ
ngẫu nhiên đó thành p vectơ mới (Z|, z2,Zp) sao cho m ồi veclơ này (biến
mới) chứa nhiều thông tin ban đầu nhất. Các biến đó viết được dưới dạng
z, = a,]X| + a 12x2+ +oclmxm
z2 = a 21x, + a 22x2+ +a2mxm

.

.
(6)
zp = a plx1 + ocp2x2+ +apmxm
Các biến Z|, z2, z p được gọi là các thành phần chính. Trong thực tế,
p thường được chọn bé hơn m, nhưng lượng thông tin chứa trong đó vẫn đủ
lớn. Do vậy phương pháp thành phần chính cho phép rút bớt sỏ tham sô
nhận dạng một cách đáng kế. Điều đó làm nhẹ nhàng công tác tính toán,
tránh được các nhiễu loạn ngẫu nhiẻn. Ngoài ra, việc nhận dạng dựa tren
thành phần chính lại dễ dàng và chính xác. Trong nghiên cứu địa chất la

thường lựa chọn hai thành phần chính và do vậy có thế đưa lên hệ trục loạ
độ vuông góc, thuận lợi cho việc bình luận kết quá.
Để tìm thành phần chính, trước hết phải lập ước lượng ma trận
covarian của các biến (trong trường hợp này là các nguyên tố). Ma trận này
có dạng:
ơ|, cov(xI,X ,) cov(Xj ,Xm )
cov(x,,x,) ơ ;, cov(x2,x,J
cov( X m, X j) cov(xm,x ,) ơ ;m„
trong đó :
+ ơ;í là phương sai cùa biến thứ i và ước lượng của nó là
s „ = ' T T ẳ ^ , , (7)
n i ị=I
+ cov(X |, Xj) là covarian của X, và Xj với ước lượng là
^ = - Lĩ ẳ ( x ,1- x i)(xJI- x )) (8)
1 1 1 t= 1
Tiep theo, tính các vectơ riêng và giá trị riêng tương ứng của ma trận
II su II và thiết lập thành
phần chính theo nguyên tắc
sau.
Toạ độ của các vectơ
riêng chính là các hệ số (Xjj
cần thiết để lập các tổ hợp
Zj trong (6). Gọi vectơ riêng
ứng với giá trị riêng lớn
nhất là vectơ riêng thứ nhất,
ứng với giá trị riêng lớn thứ
hai là vectơ riêng thứ hai
v.v Khi đó, thành phần
chính thứ nhất, kí hiệu F|,
là tổ hợp Zj với các hệ số Gt

là toạ độ của vectơ riêng
thứ nhất. Thành phần chính thứ hai là tổ hợp có các hệ số a là toạ độ của
vectơ riêng thứ hai V. V
F, = a llxl + a l2x2 + + a lmxm
F2 = a 2lX| + a 22x2 + + a 2mxm
Fp = a plx, + a p2x2 + + a pmxm
Trong đó, a n, a , 2
a lm là toạ độ của vectơ riêng thứ nhất. a 21.
a 22, , a 2m ■ của vectơ riêng thứ hai V. V Các số a,j còn được gọi là trọng
số của biến j trên thành phần chính i.
1.2.2. Kết quả áp dụng phương pháp
Trường địa hoá nghiên cứu gồm 17 nguyên tô hoá học, như vậy ma
trận covanan có 17 vec tơ riêng, nhưng chí 4 vec tơ đạt trị riêng > 1 Chúng
là các thành phần chính chứa thông tin chủ yếu về trường địa hoá thứ sinh
(hình 9).
Ba


Pb

Bi

Cu
w

Nb

Zr




Sn



Mo


Zn

-

Cr


Ni




Ti

Co

Li
Hình 8. Độ đo Pearson - thuật toán trọng tâm
10
Bảng 1 đưa ra thành phần chính của trường địa hoá thứ sinh vùng
nghiên cứu. Đó là các véc tơ riêng có trị riêng lớn hơn 1 của ma trận tương
quan sau khi

thực hiên
z:%
phép quay
20 -
varimax.
15-
Bảng 2 là tất
10 -
cả các giá trị
5-
riêng ứng vơí
0 -
17 vec tơ
riêng. Chúng
Hình 9. Biến thiên % giá trị riêng cùa
trường địa hoá thứ sinh vùng Lào Cai
2 3 4 5 6 7 9 10 11 12 13 14 15 16
tpc
ta sẽ phân tích các bảng này để rút ra các kết luận địa hoá cần thiết.
Bảng 1. Thành phán chính cúa trường ĐH
Thành phần chính
thứ nhất (Fl) có trị riêng
(eigen value) bằng 3,504
và chiếm tới gần 20%
tổng phương sai trong
tổng số 17 vec tơ riêng
(bảng 2). Trên thành
phần chính này, trọng số
của 4 nguyên tố Ba, Pb,
La và Ce đạt giá trị rất

lớn, từ + 0,69 (ở Pb) đến
+ 0,94 (ở La). Các
nguyên tố khác có trọng
số rất bé về trị số tuyệt
đối (cỡ phần trăm, phần
nghìn). Như vậy, thành
phần chính thứ nhất là
biếu hiện của tổ hợp Ba - Pb - La - Ce.
Thành phần chính thứ hai có giá trị riêng bằng 3.211. chiêm 18f r
tổng phương sai. Trên véc tơ này, toạ độ của Ti, Cr, Co và Ni đều mang dâu
dương với trị tuyệt đôi lớn (từ 0,687 đến 0,836). Toạ đô cúa các biến khác
Nguyên
Thành plần chính
tố
F,
f2
Ft
f4
Ba
0.834 -0.040 -0.050 0.040
Ti
-0.05 0.687 0.060 -0.030
Cr
0.080 0.724 -0.060
0.007 !
Co -0.007
0.784
-0.343
0.050
Ni 0.060 0.836 -0.060

-0.0004’
Mo 0.300 0.189 0.566 0.126
w 0.007 -0.010 0.040 0.747
Sn -0.060 -0.030 0.822
-0.010
Bi
0.020 -0.020
-0.030 0.905
Cu 0.020
0.114 -0.040 0.908
Pb
0.690
-0.020 0.020 0.520
Zn
-0.060
0.584
0.411 0.108
Nb
-0.050
-0.193
0.860 -0.040
Li
0.170
0.090
-0.020 -0.010
0.938
-0.050
0.020 -0.040
La
0.932

-0.060
0.010 -0.040
Zr
-0.102
-0.136 -0.062
0.776
11
có giá trị dưới < 1 % (ngoại trừ Zn). Như vậy, thành phần chính thứ 2 đặc
trưng bằng tổ hợp nguyên tố Ti -Co - Ni - Cr.
Thành phần chính thứ 3 có giá trị riêng 2,79, chiếm 15,67%. Các
Bảng 2. Giá tri riêng
nguyên tố chiếm trọng số đáng
kể trên thành phần này gồm Mo
(0,566), Sn (0,822) và Nb
(0,860). chúng tạo thành tổ hợp
thứ 3.
Thành phần chính thứ 4 có
giá trị riêng là 2,36, chiếm
13,23% tổng phương sai. Những
thành viên đóng góp vào lượng
đó gồm chủ yếu là Cu, Bi và Pb,
với các trọng s ố tương ứng là
0,908; 0,905; 0,520. Như vậy một
tổ hợp nguyên tố cần lưu ý nữa
gổm Cu - Bi - Pb.
So sánh với kết quả phân
tích chùm đã nêu ở trên, ta thấy có một sự phù hợp rất tốt, đặc biệt đôi với
nhóm nguyên tô' Pb - Ba - La - Ce . Một sô' sai lệch nhó thể hiện trong các
nhóm Ti -Co - Ni - Cr, Mo -Sn - Nb và Cu - Bi - Pb. Theo kết quả phân
tích chùm trong nhóm thứ 2, còn có thêm Li, trong nhóm thứ 3, có thêm

Zr còn trong nhóm cuối cùng Pb được thay thế bởi w . Sự kiện này phan
ánh tính đa dạng và phức lạp trong mối quan hê địa hoá giữa các yếu tố cua
trường thứ sinh. Tuy vậy. từ những kết qua tương đổng cùa hai phưưng pháp
toán học đã áp dụng có thế khắng định vé sư hiện hữu 4 tố hợp nguyên tố
chí thị trong trường địa hoá thứ sinh vùng Lào Cai. Cụ thế là:
• Pb()fiy Baus3La() vlCell>)4
• TilwwC0a7s Cr(l72Ni, IK4
Vec tơ
Trị riêng
%
c/c tống
1
3.50
19.68
19.68
2
3.21
18.04 37.72
3
2.79 15.67 53.38
4
2.36
13.23
66.61
5 0.98
5.53
72.14
6
0.92 5 18
77.31

7
0.69 3.88
81.20
8 0.59 3.29
84.48
9 0.55 3.11
87.59
10 0.46
2.58
90.17
11 0.42
2.38 92.55
12
0.37 2.07 94.62
13 0.29
1.64 96.26
14 0.28
1.59
97.85
15 0.21
1.19
99.04
16
0.17 0.96 100.00
17
0.00
0.00 100.00
Sn<iK2 Nb0
• Cu(,yI Bio.yi Pb<i52 W(l71
Các chì số đi kèm nguyên tố chính là trọng số cùa nguyên tố đó tròn

thành phần chính tirơne ứng. Cách biễu diễn này đã được một số tác giả sử
12
dụng [9]; nó tăng tính định lượng cho công thức cúa các tổ hợp.
Chương 2
PHÂN VÙNG Tự ĐỘNG TRƯỜNG ĐỊA HOÁ THÚ SINH
Phân vùng một trường địa hoá thứ sinh là sự phân chia trường đó
thành những bộ phận đồng nhất về mặt địa hoá. Những bộ phận ấy có thể
tiêu biếu cho một kiểu quặng, một tập hợp đá gốc, hoặc một điều kiện cánh
quan nhất định. Để giả quyết bài toán này, đã áp dụng thuật toán phân tích
chùm theo quan trắc và phân tích phân biệt. Trước khi trình bày các kết qua
nghiên cứu, ta sẽ trình bày tóm tất cơ sở lý thuyết của các phương này.
2.1. Cơ SỞ LÝ THUYẾT CỦA PHUƠNG PHÁP
Mặc dầu lý thuyết toán học về phân loại đã được giải quyết bới nhiều
nhà nghiên cứu [5,6,7], nhưng với các đối tượng địa chất cũng như nhicu
đôi tượng tự nhiên khác, chưa có (và sẽ không bao giờ có) một thuật toán cụ
thể nào có thể được coi là tốt nhất. Điều đó liên quan đến tính phức tạp cúa
đối tượng. Ngoài ra, những đòi hỏi chặt chẽ của lý thuyết toán học đối với
số liệu phân tích thường không thể thực hiện đầy đủ trong thực tế. Do tâl cá
những điều ấy, cần thiết phải tiến hành thử nghiệm theo nhiều thuật toán
khác nhau.
Thuật toán phân tích chùm đã trình bày trên đây về cơ bán vẫn được
áp dụng trong phần này để phân vùng địa hoá. nhưng có một sỏ thay đối
nhỏ. Thứ nhất, trong khi xác định các tổ hợp cộng sinh nguyên tố. đỏi tượng
phân chia là các biến (nguyên tô), còn giờ đây là các quan trác (mẩu kim
lượng). Thứ hai. do số lượng quan trắc rất nhiểu (gần 6000) nén khóng thê
sử dụng thuật toán hợp nhất liên tiếp và đưa ra các đendrogram dạng cành
cây như trên. Thay vào đó sẽ là thuật toán K - nieaiìs cỉustev' ‘ .
Dưới đây trình bày khái quát về phân tích phán biệt.
Phân tích này nhằm tìm ra các hàm nhận dạng mẫu một cách tốt nhất
cho một số nhóm đối tượng nhất định. Hàm này và được biễu diễn dưới

Hiện chưa có tài liệu nào dịch thuật ngữ này ra tiếng Việt, nén tác gia vẫn đẽ nguyên
từ tiếng Anh
dạng một tổ hợp tuyến tính của các nguyên tố:
F = a,x,+ a2x2 + + amx2m+a<)
trong đó:
• X|, x 2 , x m là các biến (ờ đây là nguyên tố)
• a K a h a2 ’ am là các hệ số bằng số cần tìm.
Trong trường hợp có 2 nhóm, các hệ sô a, tính bằng công thức
A = s ‘D
với:
• A là vec tơ (a,, a2, am)
• D là véc tơ hiệu số trung binh trong hai nhóm
• s là ma trận mà mỗi phân tử của nó là
s.; =
ni + n2
I k - U-)(UJ. - ui)+Z ( v« - V,)(VJ. - vj)
1=1 1=1
trong đó:
u„, v„ là
hàm lượng nguên
tố i tại mẫu t trong
nhóm u và V
tương ứng.
• n! là số
lượng của nhóm u
và n2 là số lượng
mẫu nhóm V
• ũị, V j là
các số trung bình.
Căn cứ vào

đặc điểm của số
liệu kim lượng thu
được, nhằm tìm ra
các hàm phân biệt
tốt nhất, tác giả đã
tiến hành thử
nghiệm theo hai
phương án khác
1835Ũ 18360 18370 183SŨ 18390
252E
25ie
250Ẽ
249Ẽ
2476
246Ễ
3 t
J * 2 ỳ
* l:
41 *3 ,« 4r 2 2
3
\ 2 4 4 4
1 1 ' 2 4 2 4 4
\ 4 4 4 A 4 2 244
4 , 3^4 4
4 4 . ,4.2
2 2 2 -
248Ê2 2 ị 1 !
1 iV 3 444 4 4 4
1 1 1 i 1 4 4 4
, 1 ỉ 1 1 I 4 4

' ’ < \ 1 1 13 1 ỳ*
-2521
-2511
2501
-2491
•2481
•2471
3,3< 'Ị1.' ',.ỉ .
44 .j Ầ 23 ' V ' m '' 1 "
% 2 2“2 _2 4 4; 24 ! ĩ \ 1 1 1 1 1 1
2 ỉ , 44 H 1\ » 1 1 l1 lV Ị_
18350 18360 18370 18380 18390
-2461
Hình 10. Sơ đô phân vùng lự dộng
nhau.: số liệu thường và số liệu logarit hoá.
2.2. KẾT QUẢ ÁP DỤNG PHUONG pháp
2.2.1. Phân vùng tự động
Trước hêt bàng thuật toán K - means cluster. tâD mẫu kim lươns
vùng nghiên
cứu được chia
thành 4 nhóm
khác nhau về
đặc điểm đị
hoá. Phân bô
các nhóm
được thể hiện
trên hình 10.
Hình này cho
thấy nhóm 1
và nhóm 3 có

ranh giới
tương đối rõ
rệt. Trong đó
nhóm 1 tập
trung ở phần
giữa phía
nam, nhóm 3
tập trung ở
phía tây bắc. Nhóm 2 và 4 có xu hướng đan xen vào nhau và vào các nhóm
khác. Đặc điểm địa hoá nổi bật của các nhóm được thế hiện qua phố địa
hoá của chúng (hình 11). Mặt khác, tính không đổng dang cua chúng cũng
chứng tỏ sự khác nhau thực chất về đặc đ iểm địa hoá của các nhóm đã chia
bằng thuật toán tự động (hãy xem kỹ hình 11).
2.2.2. Hàm nhận dạng
Hàm nhận dạng (trong trường hợp này là hàm phân biệt) được ihử
nghiệm theo số liệu thường và số liệu logarit. Mức độ chính xác cua các
14 c/f + Nhóm3
Hình 11. Phố địa hoá của cát nhóm
K>
ham thê hiện qua xác suất nhận dạng đúng và sự phân bô trọng tâm của các
nhóm mà các hàm này đặt lên.
Cac ham phân biệt theo sô liệu thường (không logarit hoá) có dạng:
G, = 0.002Ba+ 6.059BÍ + 0.013Ce + 1.836CO - 0.073Cr - 0.212Cu -
0.014La+ 6.300 Li + 7.214 Mo + 0.998Nb + 0.023NÍ -O.OỎOPb + 35.563Sn
+ 0.006TĨ + 0.290VV + 0.402Zn - 42.087
G2 = 0.003Ba + 4.478BĨ + 0.008Ce + 6.619CO - 0.039Q- -
0.057Cu 0.017La + 6.437LÍ + 8.162 Mo - 0.320Nb + 0.053NĨ 0.00 lPb +
29.825Sn + 0.008TÍ + 0.052W + 0.392Zn - 42.439
G, = 0.003Ba + 5.735BĨ + 0.030 Ce + 1.795CO - 0.086Q- -
0.210CU -0.046La + 6.279LĨ + 4.419MO - 0.414NÒ + 0.026NÍ -0.036Pb +

33.101Sn + 0.004TÍ + 0.312W + 0.118Zn - 31.671
G 4 = -0.001 Ba + 6.134BÌ + 0.032Ce + 5.I68C 0 - 0.046Cr - 0.226C 11 -
0.028La + 6.293LÍ + 4.662MO - 0.386NÒ + -0.470NĨ - 0.013Pb + 30.420Sn
+ 0.008TĨ + 0.376W + 0.300Zn - 35.587
Với các hàm này, 83.02% trường hợp của nhóm 1; 69.34f/f nhóm 2;
96.80% nhóm 3 và 85.83% nhóm 4 và xét chung là 84.2% được nhận dang
đúng (bảng 3)
Báng 3. Kết quả nhận dạng theo các hàm G| - (ỉ4
Nhóm ban đầu
Nhóm dư đoán
Tống sò
1 2
3
4
Số lượng quan trắc
1 1413 52
196 41
1702
2 0 760 43
293
1096
3 0 0 1150
38
1188
4 0 36 238
1659 1933
Xác suất (%) 1
83.02 3.06
11.52
2.41

100
2
0
69.34
3.92 26.73 100
3
0 0 96.80 3.20 100
4
0
1.86
12.31
85.83
100
84.2c/c trường liựp nhận dụng CỈÍUIỊỊ
Trên Territorial Map ri, trọng tâm của các nhóm nàm rát gần nhau
n Một sô tác giả dịch từ này là bán đồ lanh thố [3], nhưng vì sơ bị nhám lan với khá 1
niệm lãnh thổ trong địa lý, chúng tôi vẫn để nguyên từ tiêng Anh.
ŨI Ị .ịQò
(hình 12)
Các hàm nhận dạng theo tỷ lê logarit có dạng
Fị= -0.49Ba+ 1.68TĨ - 662.66Cr +765.22CO - 0.44Ni +11.36MO +
24.31W - 2.66Sn -3.30BÍ -ll.08Cu-17.08Pb -21.93Zn -39.37Nb-16.91Li +
43.63Ce + 527.92La - 1.97Zr - 1150.74
F2 = -0.40Ba-1.23Ti - 666.61Cr +776.600) + 2.05NĨ +11.21MO+
23.30W - 3.78Sn + 0.61 Bi -11.13CU -16.68Pb-18.63Zn -25.02Nb-15.96Li -
23.46Ce + + 530.47La + 0.44Zr -1124.59
F, = -I.00Ba-0.17Ti - 683.34Cr + 790.41CO - 2.10NÌ + 10.21MO+
23.37W -4.37Sn -2.53BÍ -15.40CU -16.72PỒ -21.12Zn -22.32Nb-l3.82Li -
26.10Ce + 527.09La + 0.29Zr -1126.01
F4 = -0.96Ba -1.19TĨ - 679.71Cr + 789.69CO - 2.32NÌ + 11.84Mo +

24.39W -3.09Sn -5.30BÌ -9.89Cu -16.49PÒ -21.31Zn - 24.79NỒ -13.18LĨ -
24.92Ce + 525.88La + 0.91Zr -1132.71n
Bảng 4. Kết quả nhận dạng theo các hàin F, - F4
Nhóm ban đầu
Nhóm dư đoán
Tống số
1 2
3
4
Số lượng quan trác 1
1702 0
0
0
1702
2
ũ 1055 5 36
1096
3
0
1
1151 36 1188
4
0 59 45 1829 1933
Xác suất (%) 1
100
0
0 0
100
2 0 96.26 0,46 3.28
100

3
0
0.08 96.89 3.03
100
4 0 3.05
2.33
94.62
100
96.9% trường hợp nhận dạng dim ị’
Khả năng nhận dạng đúng theo các hàm F, trong tnrờng hợp tống
quát đạt xác suất tới 96.9%, trong đó riêng nhóm 1 là 100% (bang 4).
Ngoài ra, trên Territoriaì Mơp, trọng tâm của các nhóm cách xa nhau (hình
13).
Tìr những phân tích trên, có thể rút ra hai kết luận cho phần này:
• Trường thứ sinh vùng nghien cứu gồm 4 kiêu địa hoá khác nhau.
r ’ Biến số trong các hàm F, phải lấy logarit
1S
• Để xây dựng hàm nhận dạng tốt nhất cho các kiểu địa hoá. cần sử
dụng phép biến đổi logarit hoá
19

×