Tải bản đầy đủ (.pdf) (20 trang)

Giáo trình xử lý số liệu trắc địa phần 2 PGS TS đặng nam chinh (chủ biên)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (455.76 KB, 20 trang )

Chương 2
PHÂN TÍCH THỐNG KÊ VÀ XẤP XỈ HÀM
2.1. DÃY SỐ LIỆU QUAN TRẮC
Trong thực tế, người ta thường tiến hành đo đạc hoặc quan trắc một đại
lượng hay yếu tố nào đó nhiều lần (đo góc, đo cạnh, ...) hoặc một loại đại lượng
hay yếu tố nào đó được phân bố trong không gian (đo trọng lực, đo cường độ từ
trường, độ cao bề mặt nào đó) hoặc quan trắc đại lượng có tính biến đổi theo
thời gian (trị đo pha, đo khoảng cách giả trong công nghệ GPS, giá trị quan trắc
lún, giá trị quan trắc dịch chuyển, biến dạng, ...). Các số liệu quan trắc đó được
gọi chung là dãy số liệu hay bộ số liệu (Data Samples).
Một đặc điểm chung của đo đạc hay quan trắc là được tiến hành trong
cùng điều kiện hoặc không cùng điều kiện bằng thiết bị quan trắc để nhận được
các giá trị quan trắc luôn kèm theo sai số.
Nếu xét trong khơng gian, các trị đo chỉ có thể được quan trắc tại những
vị trí (điểm) nhất định với số lượng quan trắc là hữu hạn mà không thể quan
trắc tất cả vị trí trong khơng gian đó. Nếu xét theo thời gian, các trị quan trắc
cũng chỉ có thể thực hiện tại những thời điểm nhất định với tần suất cao hoặc
thấp chứ khơng thể quan trắc trên tồn bộ trục thời gian. Như vậy đặc điểm
chung của dãy số liệu quan trắc là tập hợp các số liệu rời rạc.
Ký hiệu u là véc tơ tọa độ trong hệ thống tọa độ, (thường là x, y trên một
mặt nào đó) và ký hiệu z là giá trị đo (quan trắc) xác định tại vị trí tọa độ u, khi
đó có thể coi z như là “hàm” của tọa độ u và được viết là z(u).
Xử lý dãy số liệu rời rạc không chỉ là nhiệm vụ của ngành trắc địa mà là
của nhiều lĩnh vực khác như môi trường, địa vật lý, địa chất cơng trình, địa chất
thủy văn,... Để xử lý dãy số liệu quan trắc trước hết phải xác định được một số
đặc trưng thống kê của chúng.
Đối với dãy số liệu phân bố trong không gian, cần phải xác định một số
đặc trưng địa thống thống kê (Geostatistics) như: tính chất của dãy số liệu
(đẳng hướng hay không đẳng hướng, phân bố đều hay không đều), đặc trưng
phân bố của dữ liệu (chuẩn hay không chuẩn), trị trung bình, độ lệch chuẩn,
mối liên hệ khơng gian của các cặp giá trị, ... Liên quan đến các tính chất này,


phải xác định các giá trị như phương sai (Variance), hiệp phương sai
(Covariance), hệ số tương quan (Correlation), bán phương sai (Semivariance),
bước gián đoạn (trễ) (Lag). Trong đó người ta sử dụng các thuật ngữ như
“Variogram”, “Semivariogram” hoặc “Correlogram” để chỉ đặc trưng tương
73


quan không gian của dãy số liệu. Các tham số đặc trưng cho mối liên hệ không
gian của dãy số liệu được người ta sử dụng để ước lượng địa thống kê
(Geostatistical Estimation) như để nội suy, ngoại suy giá trị tại những vị trí
khơng quan trắc và sử dụng để mô phỏng địa thống kê (Geostatistical
Simulation) thể hiện quy luật biến đổi trong không gian của số liệu, lập mơ
hình,...
Đối với dãy số liệu quan trắc theo chuỗi thời gian, cần xác định đặc
trưng thống kê của chúng như tính chất dừng hay khơng dừng (Stationary or
Nonstationary), xu thế biến thiên của dãy số liệu, ... Nếu như chuỗi thời gian đó
là dừng, cũng sẽ xác định được một số đặc trưng thống kê tương tự như trị
trung bình, phương sai, độ trễ, hiệp phương sai hay tự phương sai, ...
Nếu có dãy số liệu Z(u) và dãy số liệu G(u), khi đó sẽ có các khái niệm
về hiệp phương sai chéo (Cross-covariance), hệ số tương quan chéo (Crosscorrelation) cũng như variogram chéo (CrossVariogram), ...
2.2. XÁC ĐỊNH CÁC ĐẶC TRƯNG THỐNG KÊ CỦA CÁC DÃY SỐ LIỆU
QUAN TRẮC
Như đã nói ở trên, xác định các đặc trưng thống kê của dãy số liệu quan
trắc phân bố trong không gian là cần thiết cho công tác xử lý dãy số liệu quan
trắc. Sau đây giới thiệu một số công thức tính tốn phân tích, trong đó có một
số cơng thức chỉ sử dụng mà khơng chứng minh.
2.2.1. Tính chất phân bố của dãy số liệu

Hình 2.1. Phân bố các điểm quan trắc độ rỗng


74


Với tập hợp số liệu quan trắc (số lượng khá lớn) có thể sử dụng đồ thị để
biểu thị mật độ phân bố các giá trị của tập hợp đó bằng cách chia các khoảng
giá trị và xác định số lượng giá trị trong các khoảng đó. Ví dụ dựa trên 85 điểm
đo xác định giá trị độ rỗng trung bình (Averaged Porosity Values) có giá trị
trong khoảng từ 12% đến 17% phân bố trên một diện tích 20 kmx16 km (hình
2.1), có thể biểu thị đặc tính phân bố chuẩn của bộ số liệu đo trên hình 2.2 [21,
22].

Hình 2.2. Quy luật phân bố của các giá trị quan trắc
Nhận thấy rằng, giá trị độ rỗng của 85 điểm quan trắc có quy luật phân
bố rất gần với luật phân bố chuẩn.
Trong trắc địa vật lý (Physical Geodesy), các giá trị trọng lực g được đo
ở các điểm khác nhau với một mật độ nào đó cũng hình thành nên một dãy số
liệu phân bố trong không gian.
2.2.2. Trị trung bình và phương sai
Từ các giá trị quan trắc, dễ dàng tính được trị trung bình theo cơng thức:
Z(u ) tb 

1 n
 z( u i )
n i 1

(2.2.1.)

trong đó n là số trị quan trắc.
Phương sai (Variance) của dãy số liệu được tính theo cơng thức:
Var (z(u )) 


1 n
2
 z(u i )  Z(u ) tb 
n i 1

(2.2.2)

Thứ nguyên của phương sai bằng bình phương của thứ nguyên z(u).
75


2.2.3. Hiệp phương sai và hệ số tương quan
Để tiếp cận với khái niệm hiệp phương sai, cần xét tới biến mới là độ trễ
(lag) hay khoảng cách (xét tương quan) giữa các cặp điểm, ký hiệu là s. Ứng
với giá trị s khác nhau sẽ tính được giá trị hiệp phương sai khác nhau. Lúc này
hiệp phương sai được coi là hàm của khoảng cách s, ký hiệu là C(s). Khái niệm
hiệp phương sai nêu trên được xét trong một tập hợp số liệu cho nên còn được
gọi là tự hiệp phương sai (Auto-Covariance).
Nếu như dãy số liệu phân bố trong khơng gian thỏa mãn tính đẳng hướng
(Non-trend) và có tính chất dừng (Stationary), thì hiệp phương sai
(Covariance) giữa các giá trị z(u) và z(u+s) được tính theo cơng thức:
C(s) 

1 N (s )
 [z(u i )  Z(u ) tb ][z(u i  s)  Z(u  s) tb ]
N(s) i 1

với


Z(u  s) tb 

1 n
 z ( u i  s)
n i1

(2.2.3)
(2.2.4)

Trong (2.2.3), N(s) là số cặp điểm có khoảng cách là s. Số cặp điểm N(s)
càng lớn thì giá trị hiệp phương sai tính được C(s) càng có độ tin cậy cao.
Từ (2.2.3) có thể chứng minh được rằng:
C(s) 

1 N (s )
 z(u i )z(u i  s)  Z(u ) tb Z(u  s) tb
N (s) i 1

(2.2.5)

Vì cùng xuất phát từ một dãy giá trị z(u i ) , do đó trị trung bình tính theo
(2.2.1) và trị trung bình tính theo (2.2.4) sẽ như nhau, khi đó biểu thức (2.2.5)
sẽ được viết dưới dạng:
C(s) 

1 N (s )
2
 z( u i ) z(u i  s)  [ Z(u ) tb ]
N(s) i 1


(2.2.6)

Vì vậy phương sai Var (z(u )) s tính theo z(u i  s) cũng bằng giá trị
phương sai Var(z(u )) tính theo z(u i ) ở cơng thức (2.2.2).
Theo định nghĩa, hệ số tương quan ứng với khoảng cách s được tính:
(s) 

C(s)
C(s)

Var (z( u )).Var (z(u )) s Var (z(u ))

(2.2.7)

Hiệp phương sai tính theo (2.2.3) hoặc (2.2.6) là các giá trị hiệp phương
sai thực nghiệm. Quy luật chung của hiệp phương sai thực nghiệm thể hiện trên
hình 2.3. Dựa vào quy luật của các giá trị hiệp phương sai thực nghiệm, có thể
xác định được dạng của hàm hiệp phương sai lý thuyết tương ứng theo nguyên
76


tắc xấp xỉ hàm. Hàm hiệp phương sai lý thuyết có vai trị quan trọng trong nội
suy theo phương pháp Collocation và nội suy theo phương pháp Kriging.
Có thể nhận thấy rằng, hiệp phương sai tính theo (2.2.3) khi s = 0 chính
là phương sai tính theo cơng thức (2.2.2).
2.2.4. Bán phương sai
Tương tự như hiệp phương sai, bán phương sai (Semivariance) là giá trị
đặc trưng cho mối phụ thuộc của các giá trị z(u) theo khoảng cách s, tuy nhiên
nó cũng có điểm khác với hiệp phương sai. Hiệp phương sai và bán phương sai
đều là các chỉ tiêu thống kê về mức độ (đo) sự tương quan không gian (Spatial

Autocorrelation). Bán phương sai còn được sử dụng cho thuật ngữ Semivariogram hoặc Variogram.
Bán phương sai ở khoảng cách s được tính theo cơng thức kỳ vọng:
 (s ) 

1
E[(z(u )  z(u  s)) 2 ]
2

(2.2.8)

hoặc viết ở dạng công thức thực dụng:
2
1 N (s )
 (s) 
 z(u i )  z(u i  s)
2 N(s) i 1

(2.2.9)

Bán phương sai tính theo cơng thức trên gọi là bán phương sai thực
nghiệm. Quy luật chung của bán phương sai là khi s=0 giá trị  (s)  0 và tăng
tới một giới hạn nào đó (Sill), giới hạn tăng sẽ có khoảng cách tương ứng gọi là
độ trễ tương quan. Đồ thị chung của bán phương sai thực nghiệm, phương sai
thực nghiệm và hệ số tương quan có dạng như hình 2.3.

Hình 2.3. Đồ thị phương sai, bán phương sai và hệ số tương quan

77



Dựa vào quy luật của các giá trị bán phương sai để chọn hàm bán
phương sai lý thuyết phù hợp và dựa trên nguyên tắc xấp xỉ hàm để xác định
các tham số của hàm bán phương sai lý thuyết.
Hàm bán phương sai lý thuyết có vài trị quan trọng trong nội suy
Kriging.
Mối liên hệ giữa bán phương sai và hiệp phương sai được thể hiện qua
công thức sau:
 (s)  C(0)  C(s)

(2.2.10)

trong đó C(0) là hiệp phương sai tương ứng với s = 0 và cũng chính là
phương sai.
2.3. KHÁI NIỆM VỀ PHÂN TÍCH HỒI QUY
2.3.1. Khái niệm chung
Đối với dãy số liệu quan trắc theo chuỗi thời gian, có thể gặp những
trường hợp là chuỗi ngẫu nhiên không dừng (Non-Stationary). Trong trường
hợp này, cần phải xác định quy luật biến đổi của chuỗi số liệu hay xác định ma
trận trạng thái của quy luật đó. Hồi quy có liên quan với phân tích hệ số tương
quan, dựa trên hệ số tương quan người ta đưa ra (lựa chọn) phương pháp hồi
quy phù hợp.
Đối với các số liệu đo thay đổi liên tục theo thời gian như các trị đo pha
trị đo khoảng cách giả trong công nghệ GPS, chúng ta cần xem xét quy luật
biến thiên theo thời gian của các trị đo đó đồng thời có thể xem xét cả quy luật
biến thiên của vận tốc trị đo và gia tốc trị đo.
Ký hiệu các trị đo pha sóng tải tại thời điểm t i1 và tại thời điểm t i là
L( t i1 ) và L( t i ) , vận tốc trị đo pha tại thời điểm t i ký hiệu là VL ( t i ) được tính
theo cơng thức:
VL ( t i ) 


dL( t i ) L( t i )  L( t i 1 ) L( t i )


dt
t i  t i 1
t

(2.2.11)

trong đó t là tần suất ghi tín hiệu GPS.
Ký hiệu a L ( t i ) là gia tốc trị đo pha tại thời điểm t i , được tính như sau::
a L (t i ) 

d 2 L( t i )
dt 2



VL ( t i )  VL ( t i 1 )
t

(2.2.12)

Nhờ khảo sát sự biến thiên của vận tốc trị đo pha và gia tốc trị đo pha
chúng ta có thể phát hiện được hiện tượng trượt chu kỳ ...

78


Ví dụ: Xét một chuỗi số liệu trị đo pha sóng tải L1 của vệ tinh PRN-19

bằng máy thu 1 tần số Trimble 4600LS, tần suất ghi tín hiệu 15s, bắt đầu từ 7h
23m 30s đến 8h 20m 45s ngày 15 tháng 10 năm 2006 tại Hà Nội (gồm 230 trị
đo pha), tính được các giá trị thay đổi trị đo pha như vận tốc trị đo pha (dL/dt)
và gia tốc trị đo pha (d2L/dt2). Kết quả trị đo pha và các giá trị tính tốn được
thể hiện trên bảng sau:
TT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46

Thời
7 23
7 23
7 24
7 24
7 24
7 24

7 25
7 25
7 25
7 25
7 26
7 26
7 26
7 26
7 27
7 27
7 27
7 27
7 28
7 28
7 28
7 28
7 29
7 29
7 29
7 29
7 30
7 30
7 30
7 30
7 31
7 31
7 31
7 31
7 32
7 32

7 32
7 32
7 33
7 33
7 33
7 33
7 34
7 34
7 34
7 34

gian
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0

.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0

L1

223519.116
301610.037
379629.540
457577.500
535454.543
613259.580
690997.078
768669.705
846281.548
923837.570
1001333.595
1078774.294
1156164.288
1233500.009
1310781.555
1388014.722
1465201.803
1542345.698
1619445.800
1696496.263
1773507.571
1850468.657
1927374.980
2004238.553
2081066.285
2157855.988
2234605.199
2311316.618
2387983.910
2464611.188

2541199.309
2617747.324
2694256.527
2770726.614
2847158.463
2923544.471
2999890.656
3076199.329
3152469.309
3228701.767
3304894.016
3381044.453
3457153.168
3533228.386
3609269.038
3685266.835

dL/dt
5206.061
5201.300
5196.531
5191.803
5187.002
5182.500
5178.175
5174.123
5170.401
5166.402
5162.713
5159.333

5155.715
5152.103
5148.878
5145.805
5142.926
5140.007
5136.698
5134.087
5130.739
5127.088
5124.238
5121.849
5119.314
5116.614
5114.095
5111.153
5108.485
5105.875
5103.201
5100.614
5098.006
5095.457
5092.401
5089.746
5087.245
5084.665
5082.164
5079.483
5076.696
5073.914

5071.681
5069.377
5066.520
5064.190

d2L/dt2
-.317
-.318
-.315
-.320
-.300
-.288
-.270
-.248
-.267
-.246
-.225
-.241
-.241
-.215
-.205
-.192
-.195
-.221
-.174
-.223
-.243
-.190
-.159
-.169

-.180
-.168
-.196
-.178
-.174
-.178
-.172
-.174
-.170
-.204
-.177
-.167
-.172
-.167
-.179
-.186
-.185
-.149
-.154
-.190
-.155
-.178

79


47
48
49
50

51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80

81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103

7
7
7
7
7
7

7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7

7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7

35
35
35
35
36
36
36
36

37
37
37
37
38
38
38
38
39
39
39
39
40
40
40
40
41
41
41
41
42
42
42
42
43
43
43
43
44
44

44
44
45
45
45
45
46
46
46
46
47
47
47
47
48
48
48
48
49

.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0

30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0

.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0

3761229.680
3837152.384
3913044.720
3988900.131
4064718.432
4140502.953
4216248.461
4291958.017
4367627.658
4443261.143
4518859.415
4594421.017

4669942.460
4745425.849
4820873.616
4896283.904
4971657.704
5046993.251
5122296.159
5197566.143
5272793.269
5347984.304
5423139.268
5498260.248
5573346.633
5648399.008
5723418.127
5798403.386
5873350.692
5948262.433
6023137.194
6097975.083
6172780.610
6247557.248
6322304.186
6397008.152
6471675.344
6546306.310
6620902.414
6695465.643
6769991.869
6844482.743

6918941.059
6993368.293
7067764.800
7142121.004
7216441.250
7290732.340
7364991.322
7439216.383
7513409.456
7587565.335
7661686.169
7735775.949
7809833.713
7883857.791
7957852.130

5061.514
5059.489
5057.027
5054.553
5052.301
5049.701
5047.304
5044.643
5042.232
5039.885
5037.440
5034.763
5032.226
5029.851

5027.353
5024.920
5022.370
5020.194
5017.999
5015.142
5012.736
5010.331
5008.065
5005.759
5003.492
5001.275
4999.017
4996.487
4994.116
4991.651
4989.193
4987.035
4985.109
4983.129
4980.264
4977.813
4975.398
4973.074
4970.882
4968.415
4966.058
4963.888
4961.816
4959.767

4957.080
4954.683
4952.739
4950.599
4948.337
4946.205
4943.725
4941.389
4939.319
4937.184
4934.939
4932.956
4930.420

-.135
-.164
-.165
-.150
-.173
-.160
-.177
-.161
-.156
-.163
-.178
-.169
-.158
-.167
-.162
-.170

-.145
-.146
-.190
-.160
-.160
-.151
-.154
-.151
-.148
-.151
-.169
-.158
-.164
-.164
-.144
-.128
-.132
-.191
-.163
-.161
-.155
-.146
-.164
-.157
-.145
-.138
-.137
-.179
-.160
-.130

-.143
-.151
-.142
-.165
-.156
-.138
-.142
-.150
-.132
-.169
-.132

80


104
105
106
107
108
109
110
111
112
113
114
115
116
117
118

119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148

149
150
151
152
153
154
155
156
157
158
159
160

7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7

7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
7
8
8
8
8

8
8
8
8
8
8
8
8
8
8

49
49
49
50
50
50
50
51
51
51
51
52
52
52
52
53
53
53
53

54
54
54
54
55
55
55
55
56
56
56
56
57
57
57
57
58
58
58
58
59
59
59
59
0
0
0
0
1
1

1
1
2
2
2
2
3
3

15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0

30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0

.0
15.0
30.0
45.0
.0
15.0

8031808.424
8105734.930
8179628.066
8253487.596
8327310.657
8401099.577
8474861.049
8548587.489
8622276.067
8695929.856
8769560.614
8843149.869
8916705.223
8990230.166
9063720.851
9137180.412
9210607.280
9283996.057
9357351.858
9430670.838
9503953.394
9577198.890
9650414.195

9723595.787
9796745.884
9869862.594
9942944.738
10015989.062
10089000.095
10161983.018
10234929.571
10307843.107
10380723.578
10453570.670
10526384.083
10599163.887
10671906.856
10744619.022
10817298.849
10889947.723
10962564.844
11035146.249
11107695.705
11180217.824
11252711.581
11325171.744
11397591.385
11469983.414
11542346.568
11614676.395
11686980.199
11759249.282
11831486.243

11903690.544
11975865.768
12048007.676
12120114.424

4928.434
4926.209
4923.969
4921.537
4919.261
4917.431
4915.096
4912.572
4910.253
4908.717
4905.950
4903.690
4901.663
4899.379
4897.304
4895.125
4892.585
4890.387
4887.932
4885.504
4883.033
4881.020
4878.773
4876.673
4874.447

4872.143
4869.622
4867.402
4865.528
4863.104
4860.902
4858.698
4856.473
4854.228
4851.987
4849.531
4847.478
4845.322
4843.258
4841.141
4838.760
4836.630
4834.808
4832.917
4830.678
4827.976
4826.135
4824.210
4821.988
4820.254
4817.939
4815.797
4813.620
4811.682
4809.461

4807.117
4805.377

-.148
-.149
-.162
-.152
-.122
-.156
-.168
-.155
-.102
-.184
-.151
-.135
-.152
-.138
-.145
-.169
-.147
-.164
-.162
-.165
-.134
-.150
-.140
-.148
-.154
-.168
-.148

-.125
-.162
-.147
-.147
-.148
-.150
-.149
-.164
-.137
-.144
-.138
-.141
-.159
-.142
-.121
-.126
-.149
-.180
-.123
-.128
-.148
-.116
-.154
-.143
-.145
-.129
-.148
-.156
-.116
-.134


81


161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186

187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216

217

8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8

8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8


3
3
4
4
4
4
5
5
5
5
6
6
6
6
7
7
7
7
8
8
8
8
9
9
9
9
10
10
10
10

11
11
11
11
12
12
12
12
13
13
13
13
14
14
14
14
15
15
15
15
16
16
16
16
17
17
17

30.0
45.0

.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0

30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0

12192195.082
12264245.579
12336267.570
12408261.387

12480218.545
12552143.745
12624040.950
12695910.089
12767745.344
12839549.231
12911321.211
12983062.222
13054772.110
13126452.914
13198099.882
13269711.356
13341293.482
13412847.025
13484375.768
13555873.335
13627341.381
13698775.006
13770174.354
13841542.094
13912885.473
13984199.290
14055480.774
14126725.063
14197939.172
14269131.009
14340291.233
14411416.886
14482516.908
14553590.063

14624629.254
14695637.183
14766610.310
14837552.947
14908465.551
14979345.511
15050193.975
15121011.638
15191796.820
15262549.865
15333270.234
15403957.399
15474609.932
15545232.896
15615823.295
15686383.233
15756909.732
15827400.000
15897854.971
15968277.361
16038673.065
16109036.670
16179367.739

4803.366
4801.466
4799.588
4797.144
4795.013
4793.147

4791.276
4789.017
4786.926
4784.799
4782.734
4780.659
4778.720
4776.465
4774.098
4772.142
4770.236
4768.583
4766.504
4764.536
4762.242
4759.957
4757.849
4756.225
4754.254
4752.099
4749.619
4747.607
4746.122
4744.015
4741.710
4740.001
4738.210
4735.946
4733.862
4731.542

4729.509
4727.507
4725.331
4723.231
4721.178
4719.012
4716.870
4714.691
4712.478
4710.169
4708.198
4706.027
4703.996
4701.767
4699.351
4696.998
4694.826
4693.047
4690.907
4688.738
4686.636

-.127
-.125
-.163
-.142
-.124
-.125
-.151
-.139

-.142
-.138
-.138
-.129
-.150
-.158
-.130
-.127
-.110
-.139
-.131
-.153
-.152
-.141
-.108
-.131
-.144
-.165
-.134
-.099
-.140
-.154
-.114
-.119
-.151
-.139
-.155
-.136
-.133
-.145

-.140
-.137
-.144
-.143
-.145
-.148
-.154
-.131
-.145
-.135
-.149
-.161
-.157
-.145
-.119
-.143
-.145
-.140
-.152

82


218
219
220
221
222
223
224

225
226
227
228
229
230

8
8
8
8
8
8
8
8
8
8
8
8
8

17
18
18
18
18
19
19
19
19

20
20
20
20

45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0
.0
15.0
30.0
45.0

16249667.276
16319932.662
16390161.596
16460353.848
16530516.263
16600644.117
16670738.553
16740795.472
16810822.746
16880818.940
16950781.846

17020711.452
17090608.013

4684.359
4681.929
4679.483
4677.494
4675.190
4672.962
4670.461
4668.485
4666.413
4664.194
4661.974
4659.771

-.162
-.163
-.133
-.154
-.149
-.167
-.132
-.138
-.148
-.148
-.147

Từ các số liệu ở bảng trên, có thể nhận thấy một số đặc tính thống kê của
dãy số liệu trên qua các đồ thị hình 2.4, hình 2.5 và hình 2.6.


Hình 2.4. Đồ thị biến thiên trị đo pha L1

Hình 2.5. Đồ thị biến thiên vận tốc trị đo pha (dL/dt)

Hình 2.6. Đồ thị biến thiên gia tốc trị đo pha (d2L/dt2)

83


Nhận thấy trong đoạn số liệu trên, trị đo pha tăng dần (hình 2.4) cịn vận
tốc trị đo pha lại giảm dần (hình 2.5), các giá trị gia tốc trị đo pha có thể hiện
yếu tố ngẫu nhiên chứa trong các trị đo pha (hình 2.6). Cũng từ hình 2.6 có thể
nhận thấy rằng khi mới bật máy thu, gia tốc pha chưa ổn định, nhưng sau đó giá
trị gia tốc pha khá ổn định mặc dù có sự biến thiên, thể hiện tính chất của một
biến ngẫu nhiên dừng.
Trong phần này, chúng ta sẽ xem xét 2 vấn đề thường được áp dụng đối
với các chuỗi số liệu quan trắc là hồi quy (Regression) và tự hồi quy (Autoregression).
2.3.2. Hệ số tương quan thực nghiệm
Xét hai biến ngẫu nhiên X và Y, được cho bởi dãy các giá trị thực
nghiệm rời rạc như sau:
Bảng 2.1. Các giá trị của hai biến X và Y
X
Y

x1
y1

x2
y2


x3
y3

...
...

xn
yn

Phương sai của X và Y ký hiệu là V(X) và V(Y) được tính:
Var (X) 

2
2
1 n
1 n
;
(
x

x
)
Var
(
Y
)

(
y


y
)
 i
 i
TB
TB
(n  1) i1
(n  1) i1

(2.3.1)

trong đó:
n

n

 xi
x TB 

i 1

n

 yi

;

y TB 


i 1

n

(2.3.2)

Hiệp phương sai chéo giữa X và Y được tính:
COV (X, Y) 

1 n
 ( x i  x TB )( y i  y TB )
(n  1) i 1

(2.3.3)

Hệ số tương quan (mẫu, hay thực nghiệm) giữa biến X và Y được xác
định bởi công thức sau:
 xy 

COV(X, Y)
Var (X).Var (Y)

(2.3.4)

Thay (2.3.1) và (2.3.3) vào (2.3.4) ta được:

84


n


 ( x i  x TB )( y i  y TB )
 xy 

i 1
n

2

n

 ( x i  x TB )  ( y i  y TB )
i 1

(2.3.5)
2

i 1

Hệ số tương quan  xy xác định theo (2.3.5) có giá trị nằm trong khoảng 1 đến +1 tức là:
 1    1

(2.3.6)

Nếu  xy  1 , khi đó X và Y có tương quan tuyến tính dương tuyệt đối (
đồng biến)
Nếu  xy  1 , khi đó X và Y có tương quan tuyến tính âm tuyệt đối (
nghịch biến)
Nếu  xy  0 , khi đó X và Y khơng tương quan tuyến tính.
Từ các giá trị xi, yi có thể triển vẽ lên đồ thị, từ đó có thể nhận dạng được

quy luật của mối quan hệ X, Y . Đồ thị trên hình 2.7 thể hiện mối quan hệ giữa
X và Y là tuyến tính.

Hình 2.7. Quan hệ tuyến tính
2.3.3. Hồi quy tuyến tính
Nếu xác định được hệ số tương quan thực nghiệm có giá trị tuyệt đối
bằng 1 hoặc xấp xỉ 1, khi đó có thể biểu diễn X, Y bởi hàm hồi quy tuyến tính
như sau:
Y = A + B.X

(2.3.7)

Trên thực tế chỉ có thể ước lượng được các tham số của hàm là a và b
theo tiêu chuẩn độ lệch nhỏ nhất (ước lượng không chệch), khi đó hàm hồi quy
sẽ là:

85


(2.3.8)

y i  a  b.x i   i

trong đó  i là sai số của hàm hồi quy.
Dựa vào các dãy giá trị xi, yi sẽ xác định được giá trị các tham số a, b của
hàm hồi quy tuyến tính theo ngun lý bình phương nhỏ nhất.
Phương pháp xác định a, b thực hiện theo nguyên lý bình phương nhỏ
nhất, sẽ được trình bày ở phần “Xấp xỉ hàm”.
Ngồi hồi quy tuyến tính, có thể sử dụng hàm hồi quy phi tuyến (bậc hai
hoặc bậc 3,...) nếu như giá trị tuyệt đối của hệ số tương quan thực nghiệm

khơng gần với 1.
2.3.4. Phân tích tự hồi quy
Phân tích tự hồi quy AR (Auto-Regression Analysis) là phương pháp xử
lý số liệu chỉ dựa trên các giá trị của một chuỗi số liệu thời gian, nhằm đưa ra
dự báo được coi là tốt nhất tại thời điểm t dựa trên các giá trị trước đó. Với
chuỗi số liệu thời gian Y(Y1 , Y2 ,..., Yn ) , mơ hình tự hồi quy có dạng tổng quát
như sau:

Yt  f (Yt 1 , Yt  2 ,...., Yt  p ,  )

(2.3.9)

trong đó  là nhiễu trắng (ngẫu nhiên)
Mơ hình tự hồi quy thường sử dụng có dạng hàm tuyến tính sau:
p

Yt  b0   bi Yt i   t

(2.3.10)

i 1

trong đó: Yt giá trị biến Y ở thời điểm t;
Yt i (i = 1, 2, ..., p) là giá trị biến Y ở thời điểm t-i;
bi là hệ số hồi quy ;

p là bậc tự hồi quy;
 t là nhiễu.

Trong trường hợp này cần xác định các hệ số bi (i  0,1,2,... p) thỏa mãn

điều kiện bình phương tối thiểu, tức là bài tốn ước lượng bình phương nhỏ
nhất. Từ biểu thức (2.3.10) viết được hệ phương trình số hiệu chỉnh ở dạng ma
trận như sau:
V  AX  L

(2.3.11)

trong đó:
86


1 Y p Y p 1 ... Y1 
Y p 1 
b o 
 V1 
1 Y

Y 
Y p ... Y2 
p 1
b 
V 

 p2 
1
2 





.
.
. ; X
; A . .
; L . 
V
 .. 
 .. 




.
.
.
.
. 
. 
 




Vn  p 
b p 
1 Yn1 Yn 2 ... Yn  p 
 Yn 




(2.3.12)

Theo điều kiện V T V  min , véc tơ X được xác định:
X   ( A T A ) 1 A T L

(2.3.13)

Có hai dạng tự hồi quy thường gặp đó là tự hồi quy bậc nhất (p = 1) và tự
hồi quy bậc 2, (p = 2)
Mơ hình tự hồi quy bậc nhất (p = 1) có dạng:
Yt  b o  b1Y( t 1)   t

(2.3.14)

Mơ hình tự hồi quy bậc hai (p = 2) có dạng:
Yt  b o  b1Y( t 1)  b 2 Y( t 2 )   t

(2.3.15)

2.4. XẤP XỈ HÀM VÀ ỨNG DỤNG
2.4.1. Khái niệm chung về xấp xỉ hàm
Xấp xỉ hàm (Functional Approximation) là phương pháp tính tốn dựa
trên nguyên lý bình phương nhỏ nhất để xác định các tham số của một hàm lý
thuyết (đã xác định) dựa trên các số liệu thực nghiệm rời rạc, nó cịn được gọi
là phương pháp ước lượng tham số.
Để xấp xỉ hàm giữa hai đại lượng X và Y, trong đó coi Y là hàm của X,
trước hết phải xem xét các dãy số liệu xi, yi và lựa chọn hàm số lý thuyết mô tả
mối liên hệ (hàm số) giữa hai đại lượng đó dưới dạng:
Y  f (X)


(2.4.1)

Trong thực tế có những quy luật có thể biết trước dạng của hàm số f(X)
nhưng cũng có nhiều trường hợp khơng biết được mối quan hệ hàm số của các
dãy số liệu thực nghiệm. Trong trường hợp này có thể sử dụng hàm đa thức bậc
cao (bậc k) để biểu thị quan hệ cần tìm. Đa thức bậc k có dạng chung là:
y i  a o  a 1 x i  a 2 x i2  a 3 x 3i  ....  a k x ik

(2.4.2)

Trong đa thức trên, các tham số (hệ số) a o , a 1 , a 2 ....a k cần được xác định
theo ngun lý bình phương nhỏ nhất, khi đó ta đã thiết lập được một hàm lý
thuyết để mô phỏng mối quan hệ giữa hai dãy số liệu quan trắc (dãy số liệu

87


thực nghiệm). Trên hình 2.8 thể hiện các các giá trị quan trắc rời rạc và đồ thị
của hàm trong hệ tọa độ XOY. Sử dụng nguyên lý bình phương nhỏ nhất để
xác định các tham số nói chung và hàm xấp xỉ nói riêng cịn được gọi là
phương pháp tính tốn làm khớp tốt nhất (Best-Fit Computing) [25].
Cần lưu ý tới một nguyên tắc bắt buộc là dãy số liệu quan trắc phải đủ
lớn để có thể xác định được các tham số. Nếu sử dụng hàm đa thức một biến số
dạng (2.4.2), số lượng trị quan trắc n trong dãy xi và yi phải thỏa mãn:
n  k 1

(2.4.3)

Hình 2.8. Giá trị quan trắc và đồ thị của hàm xấp xỉ
Trong nghiên cứu các quy luật giá trị của các đại lượng phân bố trong

không gian (như trọng trường, từ trường, ...) có thể phải xác định (ước lượng)
mối quan hệ giữa đại lượng Z với các giá trị tọa độ X và Y dưới dạng hàm số
sau:
Z  g ( X, Y )

(2.4.4)

Nếu chưa xác định được quan hệ hàm g(X,Y) nói trên, có thể lựa chọn
hàm đa thức bậc cao đối với X, Y để mô tả quy luật giá trị của Z. Hàm đa thức
bậc cao có dạng:
z i  b 0  b1 x i  b 2 y i  b 3 x i2  b 4 y i2  b 5 x i y i  .....

(2.4.5)

Các tham số b o , b1 , b 2 , b 3 ..... cũng được xác định theo nguyên lý bình
phương nhỏ nhất.
88


Nếu áp dụng dạng hàm đa thức 2 biến (2.4.5), số giá trị quan trắc phải
lớn hơn hoặc bằng số lượng tham số bi có trong đa thức đó.
Chất lượng của xấp xỉ hàm phụ thuộc vào các yếu tố sau:
- Dạng hàm số lựa chọn (phù hợp hay không phù hợp).
- Số lượng trị quan trắc trong các dãy số liệu.
- Phân bố của các giá trị quan trắc.
- Độ chính xác của các giá trị quan trắc.
2.4.2. Phương pháp tính xấp xỉ hàm
Mục tiêu của phương pháp xấp xỉ hàm là xác định các tham số của một
hàm số (lý thuyết) dựa trên các số liệu thực nghiệm rời rạc. Dạng của hàm số lý
thuyết này có thể xác định trước (chọn trước), trong đó có các tham số cần xác

định. Cũng có thể gặp trường hợp chưa xác định được dạng của hàm số mà
phải sử dụng một hàm đa thức bậc cao để làm hàm xấp xỉ với quy luật của các
dãy số liệu thực nghiệm. Các tham số của hàm xấp xỉ có vai trị trong dự báo,
nội suy hoặc làm trơn kết quả quan trắc.
2.4.2.1. Trường hợp chưa biết trước dạng hàm số
Trong một số trường hợp, chúng ta có các dãy số liệu quan trắc nhưng
chưa biết mối quan hệ giữa chúng. Trong trường hợp này cần phải xác định
mối quan hệ giữa các dãy số liệu để có thể biểu diễn giá trị dãy số liệu Y như là
các giá trị (gần đúng) của một hàm toán học tương ứng với các biến số X.
Trong đó phải xác định các tham số của hàm.
Để đơn giản, xét trường hợp xác định mối quan hệ giữa hai dãy số liệu
quan trắc X và Y, với n cặp giá trị dạng số.
Trước hết cần áp dụng phương pháp phân tích hồi quy để đánh giá một
vài tính chất của hai dãy số liệu đó. Các tính tốn phân tích hồi quy gồm:
- Tính hệ số tương quan thực nghiệm theo công thức (2.3.4). Nếu như trị
tuyệt đối của hệ số tương quan thực nghiệm  xy có giá trị xấp xỉ 1 thì dạng hàm
số cần xác định sẽ là hàm tuyến tính:
Y  a.  b.X

(2.4.6)

Việc xác định 2 tham số a,b của hàm tuyến tính (2.4.6) khá dễ dàng.
Nếu trị tuyệt đối của hệ số tương quan thực nghiệm  xy có giá trị khác
với 1 thì mối quan hệ giữa X và Y khơng thể là dạng tuyến tính, trong trường
hợp này có thể chọn hàm đa thức bậc k dạng biểu thức (2.4.2) để làm hàm xấp
xỉ.
89


Một cách tổng quát, trong trường hợp này chúng ta phải xác định các

tham số của một đa thức có thể là hàm bậc nhất (hàm tuyến tính, k = 1) hoặc là
đa thức bậc cao (k > 1).
y i  a 0  a 1 x i  a 2 x i2  a 3 x 3i  ....  a k x ik

(2.4.7)

trong đó có k + 1 ẩn số cần xác định là ao, a1, a2,....,ak.
Từ (2.4.7) lập được phương trình số hiệu chỉnh (phương trình sai số):
v i  a 0  a 1 x i  a 2 x i2  a 3 x 3i  ....  a k x ik  y i

(2.4.8)

Các phương trình số hiệu chỉnh (2.4.8) được viết ở dạng ma trận:
V  A.X  L

(2.4.9)

trong đó:
1

1
A  1

..
1


x1
x2


x 12
x 22

x3
..

x 32
..

xn

x 2n

... x 1k 
 v1 
  y1 

a o 
... x k2 
v 
 y 
a 
2
1
k


; V
; L   2
... x 3 ; X 

 .. 
 .. 
 .. 

 
.. .. 




ak 
v

y

v
n




.. x kn 

(2.4.10)

Khi số lượng phương trình số hiệu chỉnh n nhiều hơn số lượng ẩn số, tức
là n > k + 1 và coi các phương trình (2.4.8) cùng độ chính xác, theo nguyên lý
[vv] = min, sẽ lập được hệ phương trình chuẩn:
A T A.X  A T L  0


(2.4.11)

Giải hệ phương trình chuẩn, sẽ nhận được véc tơ ẩn số X:
X   ( A T A ) 1 A T L

(2.4.12)

Sau khi xác định được các tham số của hàm xấp xỉ là ao, a1, a2....ak ,
chúng ta sẽ nhận được giá trị ước lượng của hàm ứng với biến x i là y i được
xác định theo công thức:
y i  a 0  a 1 x i  a 2 x i2  a 3 x 3i  ....  a k x ik

(2.4.13)

Giữa giá trị ước lượng y i , giá trị quan trắc y i và số hiệu chỉnh v i có mối
quan hệ sau:
yi  vi  yi

(2.4.14)

Để đánh giá độ chính xác các tham số, chúng ta áp dụng cơng thức tính
sai số trung phương của ẩn số:

90


m ai   Q ai

(2.4.15)


trong đó Qai là phần tử trên đường chéo của ma trận nghịch đảo Q  (A T A) 1
tương ứng với tham số ai,  là sai số trung phương đơn vị trọng số được tính
theo cơng thức:


vv
n  k 1

(2.4.16)

Độ lớn của giá trị  phản ánh chất lượng (mức phù hợp) của bài tốn xấp xỉ
hàm.
2.4.2.2. Trường hợp đã có trước dạng hàm số
Trong trường hợp giữa hai dãy số liệu X và Y đã biết mối quan hệ dưới
dạng một hàm số có các tham số chưa xác định:
Y=f(X,a,b,c)

(2.4.17)

trong đó a,b,c là các tham số chưa xác định của hàm (trường hợp này chỉ
xét 3 tham số, theo đó có thể xét cho các trường hợp khác)
Nhiệm vụ là phải xác định các tham số a, b, c của hàm dựa trên chuỗi số
liệu quan trắc của biến X và hàm Y là x i và y i với i = 1, 2,...,n.
Trước hết phải xác định trị gần đúng của các tham số a, b, c. Ký hiệu trị
gần đúng của các tham số a, b, c là ao, bo, co và số hiệu chỉnh tương ứng là da,
db, dc. Giữa chúng có quan hệ:
a = ao + da
b = bo + db

(2.4.18)


c = co + dc
Từ hàm (2.4.17) và mối quan hệ (2.4.18) ta có thể viết:
Y  f (X, a o  da , b o  db, c o  dc)

(2.4.19)

Nếu các trị gần đúng ao, bo và co được xác định rất gần với giá trị cần xác
định, khi đó da, db, dc là những giá trị nhỏ, từ đó áp dụng khai triển chuỗi
Taylor để đưa (2.4.19) về dạng phương trình số hiệu chỉnh sau:
 Y 
 Y 
 Y 
vi  
 da  
 db  
 dc  l i
 a  0
 b  0
 c  0

(2.4.20)

trong đó số hạng tự do li được tính:
li  f (x i , a 0 , b 0 , c 0 )  y i

(2.4.21)

91



Y
Y
Y
Nếu ký hiệu:     i ;     i ;     i
 a  0

 b  0

 c  0

(2.4.22)

phương trình số hiệu chỉnh (2.4.20) được viết:
v i   i da   i db   i dc  l i

(2.4.23)

Hoặc viết ở dạng ma trận:
V  A.X  L

(2.4.24)

trong đó:
 v1 
 1
v 

2


; A 2
V
 .. 
 ..
 

v n 
 n

1
2
..
n

1 
 l1 
da


l 
 2 


; X  db  ; L   2 
 .. 
.. 
 dc 

 
n 

l n 

(2.4.25)

Nếu số giá trị quan trắc (n) lớn hơn 3 (n > 3), ta sẽ xác định da, db, dc
theo nguyên lý bình phương nhỏ nhất. Hệ phương trình chuẩn sẽ là:
A T A.X  A T L  0

(2.4.26)

Từ đó ta có lời giải hệ phương trình chuẩn:
X  (A T A) 1 A T L

(2.4.27)

Việc giải hệ phương trình chuẩn (2.4.6) và tính các tham số a, b, c của
hàm xấp xỉ được thực hiện theo quy trình tính tốn như đã nêu ở phần trước.
Việc tính tốn xác định các tham số a, b, c phải tính lặp (nhích dần) cho đến khi
trị tuyệt đối của các số hiệu chỉnh da, db, dc khá nhỏ, không lớn hơn  (gọi là
điều kiện dừng lặp). Việc xác định giá trị gần đúng đầu tiên của các tham số a,
b, c không ảnh hưởng đến kết quả xác định tham số mà chỉ ảnh hưởng đến số
lần tính lặp. Độ chính xác của tham số phụ thuộc vào giá trị  được chọn khi
tính lặp.
2.4.3. Ứng dụng của phương pháp xấp xỉ hàm
Phương pháp xấp xỉ hàm được sử dụng trong nghiên cứu các quy luật tự
nhiên dựa trên các số liệu do đạc hay quan trắc. Các giá trị của hàm được xác
định theo phương pháp xấp xỉ (theo ngun lý bình phương nhỏ nhất) là cơ sở
có độ tin cậy cần thiết để sử dụng cho tính tốn nội suy, mô phỏng hoặc dự báo
các quy luật tự nhiên đó. Trong trắc địa, phương pháp xấp xỉ hàm được ứng
dụng trong xử lý các số liệu đo đạc như:

- Xác định các tham số của hàm nội suy hoặc hàm hiệp phương sai, hàm
bán phương sai trong tính toán nội suy.
92



×