Tải bản đầy đủ (.pdf) (81 trang)

Mô hình hóa sự phụ thuộc với các copula và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.39 MB, 81 trang )

Mục lục
Mở đầu 5
Lời cảm ơn 7
Bảng kí hiệu 8
1 Kiến thức chuẩn bị 9
1.1 Copula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.1 Giới thiệu về copula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.2 Một vài định nghĩa và tính chất của copula . . . . . . . . . . . . . . . . . . 11
1.1.3 Các biên Fre’chet- Hoeffding có các hàm phân phối đồng thời . . . . . . . 13
1.1.4 Các copula và các biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . 15
1.2 Sự phụ thuộc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.2.1 Tương quan tuyến tính . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.2.2 Sự phụ thuộc hoàn hảo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.2.3 Sự phù hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.2.4 Hệ số Kendall tau (τ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.2.5 Hệ số Spearman rho (ρ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3
1.2.6 Sự phụ thuộc đuôi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2 Mô hình hóa sự phụ thuộc với các copula và ứng dụng 34
2.1 Kỹ thuật xây dựng các copula nhiều chiều . . . . . . . . . . . . . . . . . . . . . . 34
2.1.1 Họ Farlie- Gumbel- Morgenstern . . . . . . . . . . . . . . . . . . . . . . . 35
2.1.2 Họ Marshall- Olkin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2 Các Copula Elliptic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.2.1 Copula Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2.2 t- copula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.3 Các Copula Archimede . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.3.1 Các tổng lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.3.2 Các định nghĩa, tính chất và ví dụ . . . . . . . . . . . . . . . . . . . . . . 52
2.3.3 Sự phụ thuộc đuôi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.3.4 Các copula Archimede nhiều chiều . . . . . . . . . . . . . . . . . . . . . . 64
2.4 Ứng dụng của mô hình hóa sự phụ thuộc với các copula trong bảo hiểm . . . . . . 68


Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
Phụ lục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4
Mở đầu
Trong kỷ nguyên hội nhập kinh tế, các thị trường kinh tế khác nhau có sự phụ thuộc nhất
định. Nói riêng, trong một nước các ngành kinh tế khác nhau cũng có sự phụ thuộc nhất định, ví
dụ: sự phụ thuộc giữa thị trường vàng và thị trường chứng khoán, thị trường chứng khoán và thị
trường dầu mỏ, . . Nếu ta đo lường được sự phụ thuộc giữa các thị trường tài chính với nhau thì
sẽ quản trị rủi ro tốt hơn. Như ta đã biết, nếu các thị trường có sự phụ thuộc tuyến tính với nhau
thì chúng ta sử dụng hệ số tương quan tuyến tính và hiệp phương sai để tính toán. Nhưng nếu
các thị trường không có sự phụ thuộc tuyến tính với nhau mà chúng có sự phụ thuộc phi tuyến
thì chúng ta không thể dùng hệ số tương quan tuyến tính và hiệp phương sai để tính toán. Vậy
vấn đề đặt ra là: Nếu giữa các thị trường có sự phụ thuộc phi tuyến với nhau thì chúng ta dùng
công cụ nào để tính toán? Để giải quyết vấn đề này chúng ta sẽ dùng mô hình hóa sự phụ thuộc
giữa các biến nhẫu nhiên bằng phương pháp copula.
Copula là các hàm liên kết hoặc nối các phân phối biên duyên một chiều với các hàm phân
phối nhiều chiều. Copula thường được quan tâm trong các lĩnh vực nghiên cứu về sự phụ thuộc
và xây dựng các phân phối nhiều chiều. Trong lĩnh vực tài chính, copula thường được sử dụng
như một công cụ quan trọng trong các bài toán nghiên cứu sự tương quan giữa các thị trường,
đo lường rủi ro của các danh mục đầu tư và nhiều bài toán liên quan khác. Vì vậy, trong những
năm gần đây những nghiên cứu về copula và các ứng dụng của nó được rất nhiều người quan tâm.
5
Trong luận văn này trình bày về các họ copula và mô hình hóa sự phụ thuộc với các copula thông
qua việc nghiên cứu sự phụ thuộc đuôi giữa hai phân phối. Các kết quả này cung cấp một cơ sở
cho những ai quan tâm đến mô hình hóa sự phụ thuộc trong lý thuyết và các ứng dụng của nó
trong thực tế.
Với mong muốn tìm hiểu về các vấn đề trên, luận văn nghiên cứu về đề tài: ”Mô hình hóa
sự phụ thuộc với các copula và ứng dụng” .
Ngoài phần mở đầu, kết luận và tài liệu tham khảo, luận văn chia làm hai chương:

Chương 1: Kiến thức chuẩn bị . Chương này trình bày những khái niệm cơ sở, tính chất
của copula, sự phụ thuộc và một số ví dụ minh họa.
Chương 2: Mô hình hóa sự phụ thuộc với các copula và ứng dụng. Chương này trình
bày việc mô hình hóa sự phụ thuộc với các copula thông qua sự phụ thuộc đuôi của các phân phối
copula. Phần cuối của chương này, luận văn trình bày ứng dụng của mô hình hóa sự phụ thuộc
với các copula với các số liệu trong thực tế.
6
Lời cảm ơn
Bản luận văn này được hoàn thành dưới sự hướng dẫn nghiêm khắc và tận tình chỉ bảo của
TS Trần Trọng Nguyên. Thầy đã dành nhiều thời gian hướng dẫn cũng như giải đáp các thắc mắc
của tôi trong suốt quá trình làm luận văn. Tôi muốn bày tỏ lòng biết ơn sâu sắc đến người thầy
của mình.
Qua đây, tôi xin gửi tới các thầy cô Khoa Toán- Cơ- Tin học, Trường Đại học Khoa học Tự
nhiên, Đại học Quốc gia Hà Nội, cũng như các thầy cô đã tham gia giảng dạy khóa cao học 2011-
2013, lời cảm ơn sâu sắc nhất đối với công lao dạy dỗ trong suốt quá trình giáo dục đào tạo của
nhà trường.
Tôi xin cảm ơn gia đình, bạn bè và tất cả mọi người đã quan tâm, tạo điều kiện, động viên cổ
vũ tôi để tôi hoàn thành nhiệm vụ của mình.
Hà Nội, Tháng 01 năm 2014.
7
Bảng kí hiệu
R: Tập số thực
R: Tập số thực mở rộng[−∞, ∞]
R
2
= R ×R
I = [0, 1]
I
2
= I ×I

I
n
= [0, 1]
n
[0, 1] = {x ∈ R |0  x  1}
(0, 1) = {x ∈ R |0 < x < 1}
[0, 1) = {x ∈ R |0  x < 1}
(0, 1] = {x ∈ R |0 < x  1}
Họ copula FGM: Họ copula Farlie- Gumbel- Morgenstern
F
−1
: Nghịch đảo của F
t
−1
: Nghịch đảo của t
t
υ
: t- phân phối với độ tự do υ
8
Chương 1
Kiến thức chuẩn bị
Chương này trình bày các khái niệm cơ bản về copula, các tính chất của chúng và khái niệm
sự phụ thuộc để sử dụng cho chương sau.
1.1 Copula
1.1.1 Giới thiệu về copula
Giả sử R biểu thị đường thẳng thực thông thường (−∞, ∞), R biểu thị đường thẳng thực mở
rộng [−∞, ∞] và R
2
biểu thị mặt phẳng mở rộng R ×R. Một hình chữ nhật trong R
2

là tích Đề
các B của hai khoảng đóng B = [x
1
, x
2
] × [y
1
, y
2
]. Các đỉnh của hình chữ nhật B là các điểm
(x
1
, y
1
) , (x
1
, y
2
) , (x
2
, y
2
) , (x
2
, y
1
). Hình vuông đơn vị I
2
là tích I ×I, ở đó I = [0, 1]. Một hàm thực
n- vị trí H là một hàm mà miền xác định của DomH là một tập hợp con của R

2
và miền giá trị
của RanH là một tập con của R.
Định nghĩa 1.1 Cho S
1
, S
2
, , S
n
là các tập con không rỗng của R , trong đó R kí hiệu là đường
9
thẳng thực mở rộng [−∞; ∞]. Giả sử H là hàm thực với n biến trên miền xác định DomH =
S
1
× S
2
× ×S
n
và cho a  b (trong đó a = (a
1
, a
2
, , a
n
) ,
b = (b
1
, b
2
, , b

n
) và a
k
 b
k
với mọi k =
1, n), giả sử B = [a, b] = [a
1
, b
1
] × × [a
n
, b
n
] là một n-
hộp có tất cả các đỉnh trong DomH. Khi đó thể tích-H của B được cho bởi
V
H
(B) =

sgn (c) H (c)
(1.1)
với tổng được thực hiện tại tất cả các đỉnh c của B , và sgn (c) được cho bởi:
sgn (c) =








1, nếu c
k
= a
k
với k chẵn
−1, nếu c
k
= a
k
với k lẻ
(1.2)
Một cách tương đương, thể tích- H của một n- hộp B = [a, b] là thứ tự thứ n khác của H trong
B
V
H
(B) = ∆
b
a
H (t) = ∆
b
n
a
n

b
n−1
a
n−1


b
1
a
1
H (t)
trong đó

b
k
a
k
H (t) = H (t
1
, t
2
, , t
k−1
, b
k
, t
k+1
, , t
n
) − H (t
1
, t
2
, , t
k−1
, a

k
, t
k+1
, , t
n
).
Định nghĩa 1.2 Một hàm thực H của n biến là n tăng nếu V
H
(B)  0 của tất cả n- hộp B có
đỉnh nằm trong miền xác định DomH hay có thể nói thể tích của nó trên hộp bất kì là không âm.
Giả sử miền của một hàm thực H của n biến được cho bởi DomH = S
1
×S
2
× ×S
n
ở đó mỗi S
k
một phần tử nhỏ nhất là a
k
. Chúng ta nói rằng H có đáy (ground: đáy) nếu H (t) = 0 với mọi t
trong DomH sao cho t
k
= a
k
với ít nhất một k. Nếu mỗi S
k
là không rỗng và có một phần tử lớn
nhất là b
k

, khi đó chúng ta nói rằng H có phân phối biên biên duyên, và phân phối biên duyên
một chiều của H là hàm H
k
cho bởi DomH
k
= S
k

H
k
(x) = H (b
1
, b
2
, , b
k−1
, x, b
k+1
, , b
n
)
(1.3)
với tất cả x trong S
k
.
Phân phối biên duyên một- chiều sẽ được gọi đơn giản là “phân phối biên duyên” với k  2 phân
phối biên duyên k- chiều sẽ được gọi là “k- phân phối biên duyên”.
10
Bổ đề 1.1 Cho S
1

, S
2
, , S
n
là tập con khác rỗng của R , và giả sử hàm H có đáy n- tăng với miền
xác định S
1
×S
2
× ×S
n
. Khi đó là không giảm theo mỗi đối số, tức là nếu (t
1
, t
2
, , t
k−1
, x, t
k+1
, , t
n
)
và (t
1
, t
2
, , t
k−1
, y, t
k+1

, , t
n
) nằm trong miền xác định DomH và x < y khi đó
H (t
1
, t
2
, , t
k−1
, x, t
k+1
, , t
n
)  H (t
1
, t
2
, , t
k−1
, y, t
k+1
, , t
n
) .
Bổ đề 1.2 Cho S
1
, S
2
, , S
n

là tập con khác rỗng của R, và giả sử hàm H có đáy n- tăng với
phân phối biên duyên và miền xác định là S
1
× S
2
× × S
n
. Nếu bất kì điểm x = (x
1
, x
2
, , x
n
)
và y = (y
1
, y
2
, , y
n
) trong S
1
× S
2
× ×S
n
. Khi đó
|H (x) − H (y)| 
n


k=1
|H
k
(x
k
) − H
k
(y
k
)|.
Chứng minh: (xem Schweizer và Sklar (1983) , [10]).
Định nghĩa 1.3 Hàm phân phối n- chiều là một hàm H với miền R
n
mà:
1. H là n- tăng
2. H (t) = 0 với tất cả t trong R
n
như vậy t
k
= −∞ với ít nhất một k và
H(∞, ∞, , ∞) = 1.
Do H có đáy, và DomH = R
n
, nên theo bổ đề 1.2 các biên duyên của một hàm phân phối n-
chiều là các hàm phân phối mà chúng ta sẽ kí hiệu F
1
, F
2
, , F
n

.
1.1.2 Một vài định nghĩa và tính chất của copula
Đầu tiên chúng ta xác định các subcopula như một lớp của các hàm n- tăng cơ sở với các biên,
khi đó chúng ta xác định các copula như các subcopula với miền xác định I
n
.
Định nghĩa 1.4 Một subcopula n- chiều là một hàm C’ với những tính chất sau:
1. DomC

= S
1
× S
2
× ×S
n
, với mỗi S
k
là một tập con của I chứa 0 và 1.
2. C

có đáy và n- tăng.
3. C

có phân phối biên duyên C

k
, k = 1, 2, , n thỏa mãn C

k
(u) = u với mọi u trong S

k
.
11
Chú ý rằng với mỗi u thuộc DomC

, 0  C

(u)  1 vì vậy C

cũng là tập con của I.
Định nghĩa 1.5 Một copula n-chiều là một n-subcopula C mà miền xác định là I
n
. Một cách
tương đương , n- copula là một hàm C từ I
n
tới I với những tính chất sau:
1. Với mọi u trong I
n
, C (u) = 0 nếu ít nhất một tọa độ của u là 0 và nếu tất cả tọa độ của u là
1 trừ u
k
thì C (u) = u
k
.
2. Với mọi a và b trong I
n
được xác định a  b , V
C
([a, b])  0 .
Chú ý rằng với bất kì n- copula C, n  3, mỗi k- biên duyên của C là k- copula, 2  k < n . Định

lý sau suy ra trực tiếp từ bổ đề 1.2.
Định lý 1.1 Cho C

là n- subcopula. Khi đó với mỗi u và v thuộc DomC

,
|C

(v) −C

(u)| 
n

k=1
|v
k
− u
k
|
Vì thế C

là liên tục đều trên miền xác định của nó.
Định lý 1.2 (Định lý Skalar với n- chiều) Cho H là một hàm phân phối n- chiều với các phân
phối biên duyên F
1
, F
2
, , F
n
. Khi đó tồn tại một n- copula C sao với mọi x thuộc R

n
, ta có:
H (x
1
, x
2
, , x
n
) = C (F
1
(x
1
) , F
2
(x
2
) , F
n
(x
n
))
(1.4)
Nếu tất cả F
1
, F
2
, , F
n
liên tục , khi đó C là duy nhất, nói cách khác C là xác định duy nhất
trên RanF

1
×RanF
2
× ×RanF
n
. Ngược lại , nếu C là n- copula và F
1
, F
2
, , F
n
là các hàm phân
phối, thì hàm H xác định ở trên là một hàm phân phối n- chiều với các biên duyên F
1
, F
2
, , F
n
.
Chứng minh: (xem Sklar (1996) , [13]).
Định nghĩa 1.6 Cho F là một hàm phân phối. Khi đó ma trận tựa nghịch đảo của F là bất kì
hàm F
(−1)
với miền xác định I sao cho:
1. Nếu t thuộc RanF thì F
(−1)
(t) là số x bất kì trong R sao cho F (x) = t, nghĩa là với tất cả
t thuộc RanF , F

F

(−1)
(t)

= t.
12
2. Nếu t không thuộc RanF thì
F
(−1)
(t) = inf {x |F (x)  t} = sup {x |F (x)  t}.
Nếu F là tăng ngặt thì ma trận tựa nghịch đảo là nghịch đảo thường, chúng ta kí hiệu : F
−1
.
Hệ quả 1.1 Cho H, C, F
1
, F
2
, , F
n
như trong định lý 1.2 và cho
F
(−1)
1
, F
(−2)
2
, , F
(−n)
n
là ma trận tựa nghịch đảo của F
1

, F
2
, , F
n
tương ứng. Khi đó với u bất kì trong I
n
,
C (u
1
, u
2
, , u
n
) = H

F
(−1)
1
(u
1
) , F
(−1)
2
(u
2
) , , F
(−1)
n
(u
n

)

.
Ví dụ 1.1 Kí hiệu Φ là hàm phân phối chuẩn tắc đơn biến và kí hiệu Φ
n
ρ
là hàm phân phối chuẩn
nhiều chiều với ma trận tương quan tuyến tính ρ. Khi đó C (u
1
.u
2
, , u
n
) = Φ
n
ρ

−1
(u
1
) , Φ
−1
(u
2
) , , Φ
−1
(u
n
))
là Gauss hoặc n-copula chuẩn. Copula này thường được sử dụng trong thực tế, bởi vì nó có một

số tính chất đẹp như là một thành viên của họ copula elliptic và nó rất dễ dàng mô phỏng với
những người thực hành có hiểu biết hạn chế về các copula .
1.1.3 Các biên Fre’chet- Hoeffding có các hàm phân phối đồng thời
Xét các hàm M
n
, Π
n
và W
n
cho bởi
M
n
(u) = min (u
1
, u
2
, , u
n
)
Π
n
(u) = u
1
u
2
u
n
W
n
(u) = max (u

1
+ u
2
+ + u
n
− n + 1, 0)
Các hàm M
n
và Π
n
là n-copula với mọi n  2 trong khi hàm W
n
không là copula với bất kì
n > 2 như trong ví dụ sau.
Ví dụ 1.2 Xét n- hình lập phương [1/2, 1]
n
⊂ I
n
. Bởi vì lực lượng của W là đối xứng thể tích-W
13
của [1/2, 1]
n
là cho bởi:
V
W
([1/2, 1]
n
) = max (1 + + 1 −n + 1, 0) − n max (1/2 + 1 + + 1 − n + 1, 0) +
+





n
2




max (1/2 + 1/2 + 1 + + 1 − n + 1, 0) −

+ max (1/2 + 1/2 + + 1/2 −n + 1, 0)
= 1 −n (1/2) + 0 + + 0
Vì thế, W
n
không là copula với n  3.
Tiếp theo định lý mở rộng n chiều của Fre’chet-Hoeffding của bất đẳng thức các biên
Định lý 1.3 Nếu C

là n-subcopula bất kì, khi đó với mỗi u trong DomC

,
W
n
(u)  C

(u)  M
n
(u)
(1.5)

.
Chứng minh:(xem Nelsen (1999) , [9]).
Mặc dù Fre’chet-Hoeffding biên dưới W
n
không là một copula với n > 2, vế trái của (1.5) là có
thể đạt được theo hướng với mọi n  3 và bất kì u trong I
n
, có một n-copula mà C (u) = W
n
(u).
Định lý 1.4 Với bất kì n  3và u bất kì trong I
n
, có một n-copula C (mà phụ thuộc vào u)
chẳng hạn
C (u) = W
n
(u)
Chứng minh:(xem Nelsen (1999) , [9]).
Định nghĩa 1.7 Nếu C
1
và C
2
là các copula, chúng ta nói rằng C
1
nhỏ hơn C
2
(hoặc C
2
lớn hơn
C

1
) và viết C
1
≺ C
2
) (hoặc C
2
 C
1
) nếu
C
1
(u
1
, u
2
, , u
n
)  C
2
(u
1
, u
2
, , u
n
) với mọi u
1
, u
2

, , u
n
thuộc I .
14
1.1.4 Các copula và các biến ngẫu nhiên
Giả sử X
1
, , X
n
là các biến ngẫu nhiên liên tục với các hàm phân phối F
1
, , F
n
tương ứng
và hàm phân phối đồng thời H. Khi đó (X
1
, , X
n
) có duy nhất một copula C, với C được cho
bởi (1.4).
Định lý 1.5 Cho X
1
, X
2
, , X
n
là các biến ngẫu nhiên liên tục với copula C. Khi đó X
1
, X
2

, , X
n
là các biến độc lập nếu và chỉ nếu C = Π
n
.
Một tính chất đẹp của các copula là phép biến đổi đơn điệu ngặt của các biến copula là bất
biến. Chú ý rằng nếu hàm phân phối của một biến ngẫu nhiên X là liên tục, và nếu α là hàm đơn
điệu ngặt có miền xác định chứa miền giá trị RanX, khi đó hàm phân phối của biến ngẫu nhiên
α (X) cũng là liên tục.
Định lý 1.6 Cho X
1
, X
2
, , X
n
là các biến ngẫu nhiên liên tục với copula C. Nếu α
1
, α
2
, , α
n

đơn điệu tăng ngặt trên RanX
1
, RanX
2
, , RanX
n
tương ứng, khi đó α
1

(X
1
) , α
2
(X
2
) , , α
n
(X
n
)
có copula C. Do đó C là bất biến dưới các phép biến đổi tăng ngặt của X
1
, X
2
, , X
n
.
Chứng minh.
Cho F
1
, F
2
, , F
n
kí hiệu là các hàm phân phối của X
1
, X
2
, , X

n
tương ứng, và kí hiệuG
1
, G
2
, , G
n
theo thứ tự là các hàm phân phối của
α
1
(X
1
) , α
2
(X
2
) , , α
n
(X
n
).
Cho X
1
, X
2
, , X
n
có copula C, và cho α
1
(X

1
) , α
2
(X
2
) , , α
n
(X
n
) có copula C
α
. Vì α
k
tăng
ngặt với mỗi một k ,
G
k
(x) = P [α
k
(X
k
)  x] = P

X
k
 α
−1
k
(x)


= F
k

α
−1
k
(x)

với bất kì x trong R.
C
α
(G
1
(x
1
) , , G
n
(x
n
)) = P [α
1
(X
1
)  x, , α
n
(X
n
)  x]
15
= P


X
1
 α
−1
1
(x
1
) , , X
n
 α
−1
n
(x
n
)

= C

F
1

α
−1
1
(x
1
)

, , F

n
αn (x
n
)

= C (G
1
(x
1
) , , G
n
(x
n
))
Vì X
1
, X
2
, , X
n
là liên tục, RanG
1
= RanG
2
= = RanG
n
= I. Từ đó suy ra rằng C
α
= C
trong I

n
.
Từ định lý Sklar chúng ta biết rằng hàm copula, C , tập hợp tách một hàm phân phối n- chiều
từ các phân phối biên duyên của nó. Định lý tiếp theo cũng sẽ cho biết một hàm,

C, tồn tại hàm
tách n- chiều các phân phối biên duyên sống sót của nó. Hơn nữa, hàm này có thể được biểu diễn
bằng một copula, và copula sống sót có thể hoàn toàn dễ biểu diễn trong các số hạng của C và k-
phân phối biên duyên của nó.
Định lý 1.7 Giả sử X
1
, X
2
, , X
n
là các biến ngẫu nhiên liên tục với copula C
X
1
,X
2
, ,X
n
. Cho
α
1
, α
2
, , α
n
là đơn điệu ngặt theo thứ tự trên RanX

1
, RanX
2
, , RanX
n
, và cho α
1
(X
1
) , α
2
(X
2
) , , α
n
(X
n
)
có copula C
α
1
(X
1
),α
2
(X
2
), ,α
n
(X

n
)
. Hơn nữa cho α
k
là hàm giảm ngặt với một số k thỏa mãn
1  k  n. Không mất tính tổng quát cho k = 1 khi đó
C
α
1
(X
1
),α
2
(X
2
), ,α
n
(X
n
)
(u
1
, u
2
, , u
n
) =
= C
α
2

(X
2
), ,α
n
(X
n
)
(u
2
, , u
n
) − C
X
1

2
(X
2
), ,α
n
(X
n
)
(1 − u
1
, u
2
, , u
n
)

Chứng minh.
Cho X
1
, X
2
, , X
n
có các phân phối biên duyên F
1
, F
2
, , F
n
và cho α
1
(X
1
) , α
2
(X
2
) , , α
n
(X
n
) có các phân phối biên duyên G
1
, G
2
, , G

n
. Khi đó
16
C
α
1
(X
1
),α
2
(X
2
), ,α
n
(X
n
)
(G
1
(x
1
) , G
2
(x
2
) , , G
n
(x
n
)) =

= P [α
1
(X
1
)  x
1
, α
2
(X
2
)  x
2
, , α
n
(X
n
)  x
n
]
= P

X
1
> α
−1
1
(x
1
) , α
2

(X
2
)  x
2
, , α
n
(X
n
)  x
n

=

P

A
C
∩ B

= P [B] −P [A ∩B]

= P [α
2
(X
2
)  x
2
, , α
n
(X

n
)  x
n
] −
−P

X
1
> α
−1
1
(x
1
) , α
2
(X
2
)  x
2
, , α
n
(X
n
)  x
n

= C
α
2
(X

2
), ,α
n
(X
n
)
(G
2
(x
2
) , , G
n
(x
n
)) −
−C
X
1

2
(X
2
), ,α
n
(X
n
)

F
1


α
−1
1
(x
1
)

, G
2
(x
2
) , , G
n
(x
n
)

=

G
1
(x) = P [α
1
(X
1
)  x] = P

X
1

> α
−1
1
(x
1
)

= 1 −F
1

α
−1
1
(x
1
)

= C
α
2
(X
2
), ,α
n
(X
n
)
(G
2
(x

2
) , , G
n
(x
n
)) −
−C
X
1

2
(X
2
), ,α
n
(X
n
)
(1 − G
1
(x
1
) , G
2
(x
2
) , , G
n
(x
n

))
Vậy định lý đã được chứng minh xong.
Từ đó ta có kết luận sau đây.
Bằng cách sử dụng kết quả của hai định lý trên rõ ràng một cách tổng quát hơn copula
C
α
1
(X
1
),α
2
(X
2
), ,α
n
(X
n
)
có thể được biểu diễn trong các số hạng của copula C
X
1
,X
2
, ,X
n
. Điều này
được thực hiện trong ví dụ sau.
Ví dụ 1.3 Xét trường hợp phân phối hai chiều.
Cho α
1

là giảm ngặt và cho α
2
là tăng ngặt. Khi đó:
C
α
1
(X
1
),α
2
(X
2
)
(u
1
, u
2
) = u
2
− C
X
1

2
(X
2
)
(1 − u
1
, u

2
) = u
2
− C
X
1
,X
2
(1 − u
1
, u
2
)
Cho α
1
và α
2
là giảm ngặt. Khi đó :
17
C
α
1
(X
1
),α
2
(X
2
)
(u

1
, u
2
) = u
2
− C
X
1

2
(X
2
)
(1 − u
1
, u
2
)
= u
2
− (1 −u
1
− C
X
1
,X
2
(1 − u
1
, 1 −u

2
))
= u
1
+ u
2
− 1 + C
X
1
,X
2
(1 − u
1
, 1 −u
2
)
Ở đây C
α
1
(X
1
),α
2
(X
2
)
cũng là copula sống sót,

C, của X
1

và X
2
, nghĩa là :
H (x
1
, x
2
) = P [X
1
> x
1
, X
2
> x
2
] =

C

F
1
(x
1
) , F
2
(x
2
)

Xét trường hợp phân phối 3 chiều.

Cho α
1
, α
2
và α
3
là giảm ngặt. Khi đó :
C
α
1
(X
1
),α
2
(X
2
),α
3
(X
3
)
(u
1
, u
2
, u
3
) =
= C
α

2
(X
2
),α
3
(X
3
)
(u
2
, u
3
) − C
X
1

2
(X
2
),α
3
(X
3
)
(1 − u
1
, u
2
, u
3

)
=
= u
1
+ u
2
+ u
3
− 2 + C
X
1
,X
2
(1 − u
1
, 1 −u
2
) + C
X
1
,X
3
(1 − u
1
, 1 −u
3
)
+C
X
2

,X
3
(1 − u
2
, 1 −u
3
) − C
X
1
,X
2
,X
3
(1 − u
1
, 1 −u
2
, 1 −u
3
)
Ở đây C
α
1
(X
1
),α
2
(X
2
),α

3
(X)
là copula sống sót của X
1
, X
2
, X
3
.
Cũng chú ý rằng hàm sống sót đồng thời của n biến ngẫu nhiên đều (0, 1) có hàm phân phối
đồng thời là copula C là
C (u
1
, u
2
, , u
n
) =

C (1 − u
1
, 1 −u
2
, , 1 −u
n
).
Mỗi phân phối đồng thời H cảm sinh một độ đo xác suất trên R
n
qua
V

H
((−∞, x
1
] × (−∞, x
2
] × × (−∞, x
n
]) = H (x
1
, x
2
, , x
n
).
Từ các copula có hàm phân phối đồng thời, mỗi copula cảm sinh một độ đo xác suất trên I
n
qua
V
C
([0, u
1
] × [0, u
2
] × × [0, u
n
]) = C (u
1
, u
2
, , u

n
).
Do đó, ở mức độ trực quan C- độ đo của một tập con của I
n
là giới hạn xác suất mà n biến ngẫu
nhiên thuộc (0, 1) có phân phối đồng thời C, giả thiết các giá trị trong tập hợp con đó.
Với bất kì copula C, lấy :
18
C (u
1
, u
2
, , u
n
) = A
C
(u
1
, u
2
, , u
n
) + S
C
(u
1
, u
2
, , u
n

)
Trong đó
A
C
(u
1
, u
2
, , u
n
) =
u
1

0

u
n

0

n
∂u
1
∂u
n
C (u
1
, u
2

, , u
n
) ds
1
ds
n
S
C
(u
1
, u
2
, , u
n
) = C (u
1
, u
2
, , u
n
) − A
C
(u
1
, u
2
, , u
n
)
Không giống như các phân phối nhiều chiều tổng quát, các phân phối biên duyên của một

copula là liên tục, do đó một copula không có các điểm cá thể trên I
n
mà C- độ đo dương.
Nếu C = A
C
trên I
n
khi đó C được gọi là liên tục tuyệt đối. Trong trường hợp này C có mật
độ đồng thời được cho bởi

n
∂u
1
∂u
n
C (u
1
, , u
n
).
Nếu C = S
C
trên I
n
khi đó C được gọi là suy biến, và

n
∂u
1
∂u

n
C (u
1
, , u
n
) = 0 hầu khắp nơi
trong I
n
.
Giá của một copula là phần bù của hợp tất cả các tập con mở của I
n
với C- độ đo không. Khi
giá của một copula C là I
n
, Chúng ta nói C có “giá toàn phần”. Khi C là suy biến thì giá của C
có độ đo Lebesgue không và ngược lại. Tuy nhiên, một copula có thể có giá toàn phần mà không
cần phải liên tục tuyệt đối.
Ví dụ 1.4 Xét phân phối hai chiều Fre’chet-Hoeffding biên trên M. Khi

2
∂u∂v
M (u, v) = 0 khắp nơi trên I
2
ngoại trừ trên đường chéo chính (trong đó có độ đo Lebesgue
không), và M - độ đo của tất cả các hình chữ nhật I
2
hoàn toàn trên hoặc dưới đường chéo chính
là không, M là kì dị. Giá của M là đường chéo chính của I
2
như trong hình 1.1 .

Tương tự như vậy giá của phân phối hai chiều Fre’chet-Hoeffding biên dưới W là đường chéo
thứ hai của I
2
như trong hình 1.1 .
Ta sẽ trình bày các thuật toán có kết quả của các biến ngẫu nhiên sinh ra từ các họ copula
nghiên cứu khác nhau. Các thuộc tính cụ thể của họ copula thường là cần thiết cho tính hiệu quả
của các thuật toán tương ứng. Bây giờ chúng ta trình bày một thuật toán chung cho biến ngẫu
19
1.jpg
Hình 1.1: Giá của Fre’chet- Hoefding các biên trên và dưới
nhiên được tạo thành từ các copula. Tuy nhiên trong nhiều trường hợp thì nó không phù hợp để
sử dụng.
Xét trường hợp tổng quát của biến ngẫu nhiên tạo thành từ n-copula C. Cho:
C
k
(u
1
, u
2
, , u
n
) = C (u
1
, u
2
, , u
k
, 1, , 1)
, k = 1, 2, , n − 1
kí hiệu k- phân phối biên duyên của C (u

1
, u
2
, , u
n
). Hơn nữa C
1
(u
1
) = u
1
và C
n
(u
1
, u
2
, , u
n
) =
C (u
1
, u
2
, , u
k
). Cho (U
1
, U
2

, , U
n
) có hàm phân phối đồng thời C. Khi đó phân phối cá điều
kiện của U
k
cho các giá trị là k − 1 thành phần đầu tiên của (U
1
, U
2
, , U
n
) được cho bởi
C
k
(u
k
|u
1
, u
2
, , u
k−1
) = P [U
k
 u
k
|U
1
= u
1

, , U
k−1
= u
k−1
]
=

k−1
C
k
(u
1
, ,u
k
)
∂u
1
∂u
k−1
/

k−1
C
k−1
(u
1
, ,u
k−1
)
∂u

1
∂u
k−1
.
Chú ý rằng khi tăng các hàm một biến được cho bởi u
j
→ C (u) với j = 1, 2, , n là lấy vi phân
20
được hầu khắp nơi, đầu tiên theo thứ tự các đạo hàm riêng tồn tại hầu như tất cả (u
1
, u
2
, , u
n
)
thuộc I
n
. Thuật toán sau đây tạo ra một biến ngẫu nhiên (u
1
, u
2
, , u
n
) từ C (u
1
, u
2
, , u
n
):

Thuật toán 1.
+) Mô phỏng một giá trị u
1
từ U (0, 1).
+) Mô phỏng một giá trị u
2
từ C
2
(u
2
|u
1
).

+) Mô phỏng một giá trị u
2
từ C
n
(u
n
|u
1
, u
2
, , u
n−1
).
Sự chính xác của thuật toán từ thực tế của các biến ngẫu nhiên độc lập Q
1
, , Q

n
ngẫu nhiên
trên U (0, 1),

Q
1
, C
−1
2
(Q
2
|Q
1
) , , C
−1
n

Q
n
|Q
1
, C
−1
2
(Q
2
|Q
1
) ,


có hàm phân phối chung C.
Việc mô hình hóa một giá trị từ C
k
(u
k
|u
1
, u
2
, , u
k−1
) nói chung có nghĩa là mô hình hóa q từ
U (0, 1) với u
k
= C
−1
k
(q |u
1
, u
2
, , u
k−1
) có thể nhận được từ phương trình q = C
k
(u
k
|u
1
, u

2
, , u
k−1
)
thông qua việc tìm số nghiệm. Tuy nhiên chúng ta sẽ trình bày những trường hợp mà C
−1
k
(. |u
1
, u
2
, , u
k−1
)
tồn tại dạng đóng và do đó không cần tìm số nghiệm. Trong các trường hợp này các thuật toán
có thể được sử dụng. Chúng tôi sẽ đưa ra phương pháp có điều kiện với biến ngẫu nhiên được tạo
thành.
Ví dụ 1.5 Xét phân phối hai chiều của họ copula được cho bởi:
C (u, v) =

u
−θ
+ v
−θ
− 1

−1/θ
(1.6)
với θ > 0
C

2
=
∂C
∂u
(u, v) = −
1
θ

u
−θ
+ v
−θ
− 1

−1/θ−1

−θu
−θ−1

=

u
θ

−1−θ
θ

u
−θ
+ v

−θ
− 1

−1/θ−1
=

1 + u
θ

v
−θ
− 1

−1−θ
θ
.
Tìm ra lời giải phương trình C
−1
2
(q |u) với v được cho
C
−1
2
(q |u) = v =

q
−θ
1+θ
− 1


u
−θ
+ 1

−1/θ
.
Do đó thuật toán sau sinh ra một biến ngẫu nhiên từ copula (1.6)
21
Sinh ra một giá trị u từ U (0, 1)
Sinh ra một giá trị q từ U (0, 1).
Đặt v =

q
−θ
1+θ
− 1

u
−θ
+ 1

−1/θ
(u, v) là biến ngẫu nhiên cần tìm.
1.2 Sự phụ thuộc
Khi sự phụ thuộc vào cấu trúc các biến ngẫu nhiên được biểu diễn bởi các copula nó cung
cấp một phương pháp tự nhiên để nghiên cứu và liên kết phép đo sự phụ thuộc giữa các biến
ngẫu nhiên. Nhiều trong số những tính chất và phép đo bất biến theo các phép biến đổi tăng ngặt
(như một hệ quả trực tiếp của định lý 1.6). Tương quan tuyến tính (hoặc tương quan Pearson)
là thường được sử dụng trong thực tế như một phép đo của sự phụ thuộc. Tuy nhiên khi tương
quan tuyến tính không là một phép đo dựa trên sự phụ thuộc copula. Nó thường dẫn đến sai lầm

và không nên xem đó là phép đo sự phụ thuộc chính tắc.
Chúng ta bắt đầu bằng cách trình bày tương quan tuyến tính và sau đó chúng ta tiếp tục với
một số phép đo dựa trên sự phụ thuộc copula.
1.2.1 Tương quan tuyến tính
Định nghĩa 1.8 Cho X và Y là hai giá trị thực các biến ngẫu nhiên với phương sai hữu hạn.
Mối tương quan tuyến tính giữa X và Y là:
ρ
l
(X, Y ) =
Cov(X,Y )

V ar(X)

V ar(Y )
Với Cov (X, Y ) = E (XY )−E (X) E (Y ) là hiệp phương sai giữa X và Y , và V ar (X) , V ar (Y )
kí hiệu là phương sai của X và Y .
22
Tương quan tuyến tính là phép đo của sự phụ thuộc tuyến tính. Trong trường hợp sự phụ thuộc
tuyến tính là đầy đủ, nghĩa là Y = aX + b
h.c.c
với a ∈ R\{0}, b ∈ R, chúng ta có ρ
l
(X, Y ) =
±1. Nếu không −1 < ρ
l
(X, Y ) < 1 . Hơn nữa tương quan tuyến tính có tính chất:
ρ
l
(αX + β, γY + δ) = sgn (αγ) ρ
l

(X, Y )
với α, γ ∈ R\{0}, β, δ ∈ R. Do đó tương quan tuyến tính là bất biến theo các phép biến đổi tuyến
tính tăng ngặt.
Tương quan tuyến tính là dễ dàng vận dụng theo các phép toán tuyến tính. Cho A, B ∈
R
m×n
; a, b ∈ R
m
và cho X, Y là n- vectơ ngẫu nhiên. Khi đó:
Cov (AX + a, BY + b) = ACov (X, Y ) B
T
Từ bây giờ trở về sau với α ∈ R
n
,
V ar

α
T
X

= α
T
Cov (X, X) α
và do đó phương sai của một tổ hợp tuyến tính là hoàn toàn xác định bởi hiệp phương sai giữa
cặp các thành phần.
Tương quan tuyến tính là phổ biến nhưng cũng thường bị hiểu sai là phép đo sự phụ thuộc.
Hai lý do cho sự phổ biến của tương quan tuyến tính đó là nó thường dễ dàng để tính toán và là
một phép đo tự nhiên của sự phụ thuộc vào phân phối hình elip (Với các phần tử thường được sử
dụng như phân phối nhiều chiều chuẩn tắc và phân phối nhiều chiều t- phân phối). Trong một số
trường hợp, phân phối elip không thể sử dụng tương quan tuyến tính để tính toán . Chúng ta có

thể chọn một số mô hình sử dụng phân phối đuôi đầy như t- phân phối với bậc tự do thấp. Trong
trường hợp này tương quan tuyến tính có thể không được xác định bởi vì mômen thứ hai vô hạn.
23
1.2.2 Sự phụ thuộc hoàn hảo
Với mọi n- copula C chúng ta biết từ bất đẳng thức Fre’chet-Hoeffding
W
n
(u
1
, u
2
, , u
n
)  C (u
1
, u
2
, , u
n
)  M
n
(u
1
, u
2
, , u
n
)
Hơn nữa, với n = 2 ước lượng trên và mật độ dưới biên của các copula và chúng ta đã biết W và
M là các hàm phân phối hai chiều của các véc tơ ngẫu nhiên (U, 1 −U) và (U, U) tương ứng tại

U đều ( 0, 1).Trong trường hợp này chúng ta nói rằng W mô tả đầy đủ sự phụ thuộc âm và M
mô tả đầy đủ sự phụ thuộc dương.
Định lý 1.8 Cho (X, Y ) có một trong các copula W hoặc M. Khi đó tồn tại hai hàm đơn điệu
α, β : R → R và một biến ngẫu nhiên có giá trị thực để
(X, Y ) =
d
(α (Z) , β (Z)),
với α tăng và β giảm trong trường hợp trước và cả α và β đều tăng trong trường hợp sau. Điều
ngược lại của kết quả này cũng đúng.
Chứng minh:(xem Embrechts, McNeil và Straumann (1999) , [5]).
1.2.3 Sự phù hợp
Cho (x
i
, y
i
) và (x
j
, y
j
) là hai quan sát từ một véc tơ ngẫu nhiên (X, Y ) của các biến ngẫu nhiên
liên tục. Chúng ta nói rằng (x
i
, y
i
) và (x
j
, y
j
) là phù hợp nếu x
i

< x
j
và y
i
< y
j
, hoặc x
i
> x
j

y
i
> y
j
. Tương tự như vậy nếu chúng ta nói (x
i
, y
i
) và (x
j
, y
j
) là không phù hợp nếu x
i
< x
j

y
i

> y
j
, hoặc x
i
> x
j
và y
i
< y
j
. Điều này có thể được trình bày gọn hơn: (x
i
, y
i
) và (x
j
, y
j
) là
phù hợp nếu (x
i
− x
j
) (y
i
− y
j
) > 0, và không phù hợp nếu (x
i
− x

j
) (y
i
− y
j
) < 0.
24
1.2.4 Hệ số Kendall tau (τ)
Một phiên bản mẫu của phép đo sự kết hợp được hiểu như hệ số Kendall tau là khái niệm
được định nghĩa theo các số hạng của sự phù hợp như sau: giả sử {(x
1
, y
1
) , (x
2
, y
2
) , , (x
n
, y
n
)};
kí hiệu là một mẫu của n các quan sát từ véc tơ ngẫu nhiên (X, Y ) của các biến ngẫu nhiên liên
tục. Mỗi




n
2





(hay C
2
n
) phân biệt cặp (x
i
, y
i
) và (x
j
, y
j
) của các quan sát trong mẫu là phù hợp
hoặc không phù hợp; giả sử c và d là kí hiệu cặp số phân biệt của sự phù hợp và không phù hợp.
Khi đó hệ số Kendall tau cho mẫu là:
c−d
c+d
= (c −d) /




n
2





.
Mở rộng phổ biến của hệ số Kendall tau (kí hiệu đơn giản là hệ số Kendall tau) với các biến
ngẫu nhiên liên tục được định nghĩa tương tự. Giả sử (X
1
, Y
1
) và (X
2
, Y
2
) là độc lập và là các véc
tơ ngẫu nhiên có cùng phân phối, với hàm phân phối đồng thời là H. Khi đó
τ = τ
X,Y
= P [(X
1
− X
2
) (Y
1
− Y
2
) > 0] − P [(X
1
− X
2
) (Y
1
− Y

2
) < 0]
(1.7)
Định lý 1.9 Cho (X
1
, Y
1
) và (X
2
, Y
2
) là các véc tơ độc lập của các biến ngẫu nhiên liên tục với
các hàm phân phối đồng thời H
1
và H
2
tương ứng, với các biên chung F (của X
1
và X
2
) và G (
của Y
1
và Y
2
). Giả sử C
1
và C
2
kí hiệu của các copula (X

1
, Y
1
) và (X
2
, Y
2
) tương ứng, sao cho
H
1
(x, y) = C
1
(F (x) , G (y)) và H
2
(x, y) = C
2
(F (x) , G (y)). Cho Q là kí hiệu giữa xác suất của
sự tương thích và sự không tương thích của (X
1
, Y
1
) và (X
2
, Y
2
), nghĩa là cho
Q = P [(X
1
− X
2

) (Y
1
− Y
2
) > 0] − P [(X
1
− X
2
) (Y
1
− Y
2
) < 0]
(1.8)
Khi đó
Q = Q (C
1
, C
2
) = 4

I
2
C
2
(u, v) dC
1
(u, v) − 1
(1.9)
Chứng minh.

25
Khi các biến ngẫu nhiên liên tục ,
P [(X
1
− X
2
) (Y
1
− Y
2
) < 0] = 1 −P [(X
1
− X
2
) (Y
1
− Y
2
) > 0] và do đó
Q = 2P [(X
1
− X
2
) (Y
1
− Y
2
) > 0] − 1
(1.10)
Nhưng P [(X

1
− X
2
) (Y
1
− Y
2
) > 0] = P [X
1
> X
2
, Y
1
> Y
2
]+P [X
1
< X
2
, Y
1
< Y
2
], và các xác suất
có thể đánh giá bằng sự kết hợp trên các phân phối của một trong các véc tơ (X
1
, Y
1
) hoặc (X
2

, Y
2
).
Với vec tơ (X
1
, Y
1
) ta có:
P [X
1
> X
2
, Y
1
> Y
2
] = P [X
2
< X
1
, Y
2
< Y
1
]
=
 
R
2
P [X

2
< x, Y
2
< y] dC
1
(F (x) , G (y))
=
 
R
2
C
2
(F (x) , G (y))dC
1
(F (x) , G (y))
Để sử dụng xác suất ta biến đổi u = F (x) và v = G (y) suy ra
P [X
1
> X
2
, Y
1
> Y
2
] =

I
2
C
2

(u, v) dC
1
(u, v)
(1)
Tương tự
P [X
1
< X
2
, Y
1
< Y
2
]
=
 
R
2
P [X
2
> x, Y
2
> y] dC
1
(F (x) , G (y))
=
 
R
2
[1 − F (x) −G (y) + C

2
(F (x) , G (y))]dC
1
(F (x) , G (y))
=
 
I
2
[1 − u − v + C
2
(u, v)]dC
1
(u, v)
Nhưng khi C
1
là hàm phân phối đồng thời của một cặp các biến ngẫu nhiên (U, V ) trên
(0, 1), E (U) = E (V ) = 1/2, và do đó
P [X
1
< X
2
, Y
1
< Y
2
] = 1 −
1
2

1

2
+

I
2
C
2
(u, v) dC
1
(u, v) =

I
2
C
2
(u, v) dC
1
(u, v)
(2)
Từ (1) và (2) suy ra:
26
P [(X
1
− X
2
) (Y
1
− Y
2
) > 0] = 2


I
2
C
2
(u, v) dC
1
(u, v)
(3)
Thay (3) vào (1.10) ta có điều phải chứng minh.
Hệ quả 1.2 Cho C
1
, C
2
và Q được cho trong định lý 1.9. Khi đó
1. Q có tính đối xứng : Q (C
1
, C
2
) = Q (C
2
, C
1
)
2. Q không giảm trong mỗi đối số: Nếu C
1
≺ C

1
và C

2
≺ C

2
với tất cả (u, v) trong I
2
, khi đó
Q (C
1
, C
2
)  Q (C

1
, C

2
).
3. Các copula có thể được thay thế bởi các copula sống sót trong Q, nghĩa là Q (C
1
, C
2
) =
Q


C
1
,


C
2

Ví dụ 1.6 Bởi vì giá của M và W chính là đường chéo chính thứ nhất thứ hai của I
2
, hàm Q có
thể dễ dàng ước lượng cặp các copula cơ sở W, M và Π. Nếu g là hàm khả tích trên miền I
2
, khi
đó
 
I
2
g (u, v) dM (u, v) =
1

0
g (u, u) du,
 
I
2
g (u, v) dW (u, v) =
1

0
g (u, 1 −u) du,
 
I
2
g (u, v) dΠ (u, v) =

 
I
2
g (u, v) dudv
Từ đó ta có điều sau:
27

×