Tải bản đầy đủ (.pdf) (14 trang)

BÀI TIỂU LUẬN HỌC PHẦN LÝ THUYẾT XÁC XUẤT VÀ THỐNG KÊ TOÁN HỌC

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.23 MB, 14 trang )

TRƯỜNG ĐẠI HỌC NGÂN HÀNG TPHCM
BỘ MƠN TỐN KINH TẾ

----

BÀI TIỂU LUẬN
HỌC PHẦN

LÝ THUYẾT XÁC XUẤT VÀ THỐNG KÊ TOÁN HỌC

Sinh viên thực hiện : Nguyễn Đào Lan Anh
Lớp học phần
: AMA303_211_D02
TP Thủ Đức, ngày 14 tháng 11 năm 2021


Phần I: XÁC SUẤT.
1. Xác xuất điều kiện.
- Định nghĩa: Xác suất có điều kiện là xác suất của một biến cố A nào đó, biết rằng
một biến cố B khác xảy ra.
Ký hiệu: P(A|B), và đọc là "xác suất của A, biết B".
- Cơng thức: P(A|B) =
- Tính chất:

P(AB)
P(B)

, P(B) > 0

+ P(A|B) ≥ 0


+ P(Ω|B) = P(B|B) = 1

+ Nếu A1, A2, ... , An (n ≥ 2) là các biến cố xung khắc từng đôi một, nghĩa là AiAj =
∅ với mọi i ≠ j, ta có:

P
1. Cộng xác suất.

n
i=1

Ai |B =

n
i=1

P(Ai |B)

- Công thức: P(A+B) = P(A) + P(B) - P(AB), với A và B là hai biến cố bất kỳ.
- Công thức tổng quát: P(A1 + A2 + ... + An) = -(-1)n-1P(A1.A2..An)
- Hệ quả: Nếu A và � là hai biến cố đối lập với nhau thì: P(A) = 1 - P (�)
2. Nhân xác suất.

- Công thức: P(A.B) = P(A).P(B|A) = P(B).P(B|A) với P(A) > 0, P(B) > 0
- Công thức tổng quát:
P(A1 + A2 + ... + An) = P(A1)P(A2|A)P(A3|A1A2)...P(An|A1A2...An-1)
với P(A1 + A2 + ... + An-1) > 0
3. Công thức đầu đủ.



- Hệ đầy đủ các biến cố:
Hệ các biến cố {B1,B2,…,Bn} được gọi là đầy đủ nếu thỏa mãn đồng thời hai điều
kiện:
+ B1, B2,…,Bn là các biến cố xung khắc từng đôi một, nghĩa là BiBj = ∅ với mọi i ≠ j,
+ Ω = B1∪B2∪...∪Bn.

Nhận xét rằng, hệ {B, �} là một hệ đầy đủ, trong đó B là một biến cố bất kỳ.
- Công thức:

Giả sử {B1,B2,…,Bn} là hệ đầy đủ các biến cố với P(Bi) > 0,∀i = 1,2,…,n. Khi đó
với bất kỳ biến cố A, ta có
P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+...+P(Bn)P(A|Bn)
4. Cơng thức Bayes - Định lý Bayes.
Giả sử P(A) > 0 và {B1,B2,…,Bn} là hệ đầy đủ các biến cố với P(Bk) > 0 với mọi
k = 1,2,…,n. Khi đó với mọi k = 1,2,…,n, ta có
P(Bk|A) = P(Bk)P(A|Bk)P(B1)P(A|B1) + P(B2)P(A|B2) + ... +P(Bn)P(A|Bn).
5. Kỳ vọng.
- Kỳ vọng của biến ngẫu nhiên là trung bình của biến ngẫu nhiên. Kỳ vọng của biến
ngẫu nhiên X được kí hiệu là E X :
EX =
- Kỳ vọng có một số tính chất như sau:


E(c) = c với c là hằng số



E(cX) = cE(X) với c là hằng số

∀i



−∞

xi pi

xf(x)dx




E[aX+b] = aE[X]+b với a, b là các hằng số



E[X+Y] = E[X]+E[Y]



E[XY] = E[X]E[Y] với X, Y là độc lập



E g(X) =

g(xi )pX (xi )
∀i


g(x)f(x)dx

−∞

6. Phương sai.
- Phương sai Var(X) là trung bình của bình phương khoảng cách từ biến ngẫu nhiên X
tới giá trị trung bình: Var(X)=E[(X-E[X])2]
- Việc tính tốn dựa vào cơng thức này khá phức tạp, nên trong thực tế người ta thường
sử dụng công thức tương đương sau:Var(X)=E[X2]-E2[X]
- Phương sai có một số tính chất sau:


Var(c) = 0 với c là hằng số



Var(cX) = c2Var(X) với c là hằng số



Var(aX+b) = a2Var(X) với a, b là các hằng số



Var(X+Y) = Var(X)+Var(Y) với X, Y là độc lập
7. Mod.
Giá trị tin chắc nhất của đại lượng ngẫu nhiên rời rạc X [ký hiệu là Mod(X)] là giá
trị của X ứng với xác suất lớn nhất ưong bảng phân phối xác suất.
Nếu X là đại lượng ngẫu nhiên liên tục có hàm mật độ xác suất f(x) thì Mod(X) là
giá trị của X mà tại đó hàm mật độ đạt giá trị cực đại.
Chú ý: Mod(X) có thể nhận nhiều giá trị khác nhau



8. Trung vị
Trung vị (median) là điểm chia đều xác suất thành 2 phần giống nhau, kí hiệu
là med(X): P(X < med(X)) = P(X ≥ med(X)) = 0.5

Như vậy trung vị là nghiệm của phương trình hàm tích lũy xác suất: FX(x) = 0.5
9. Luật phân phối của biến ngẫu nhiên.
- Quy luật phân phối chuẩn
+ Định nghĩa:
Biến ngẫu nhiên liên tục X nhận các giá trị trong khoảng ( − ∞; + ∞) gọi là phân

phối theo quy luật chuẩn với các tham số μ và �2 , nếu hàm mật độ xác suất của nó
có dạng:

f(x) =

1

σ 2π

(�−�)2

� 2�2

Nếu tiến hành khảo sát hàm số trên và vẽ đồ thị của nó ta sẽ thu được các kết luận
sau đây:


Hàm số xác định trên toàn trục Ox.




Với mọi giá trị của x, hàm số luôn luôn dương, như vậy, đồ thị của nó ln
nằm cao hơn trục Ox.




Khi x →± ∞ thì f(x) → 0, tức trục Ox là đường tiệm cận ngang.
Ta tìm đạo hàm bậc nhất: f'(x) = −
Dễ dàng thấy

x−μ

σ3 2π

e

(x−μ)2
2σ2



.

rằng: f'(x) = 0 khi x = μ, f'(x) > 0 khi x < μ, f'(x) < 0 khi x > μ. Như vậy,


khi x = μ, hàm số có cực đại bằng �


1

2�

.

Hiệu x − μ trong biểu thức của hàm f(x) nằm trong dạng bình phương, tức là

hàm số đối xứng qua đường thẳng x = μ.




Ta tìm đạo hàm bậc hai: f''(x) = − σ3

1



(x−μ)2
2σ2



e

1−

(x−μ)2
σ2


.

Dễ dàng thấy rằng: khi x = μ + σ và x = μ − σ, đạo hàm bậc hai bằng 0 và đi qua
hai điểm đó nó đổi dấu. Tại cả hai điểm đó, hàm số đều bằng
hàm có các điểm uốn là: μ + σ; �

1

và μ − σ; �

2��

1

1

� 2��

. Như vậy,

2��

Đồ thị hàm f (x) và đồ thị sự thay đổi của f(x) theo σ:

Hai tham số μ và σ có ý nghĩa quan trọng trong phân phối chuẩn. Khi μ và σ thay

đổi, dạng đồ thị của hàm mật độ xác suất f(x) cũng thay đổi như sau: Khi μ thay đổi
thì dạng của đường cong f(x) khơng thay đổi, song nó sẽ chuyển dịch sang phải
hoặc sang trái theo trục Ox. Khi μ tăng lên thì đồ thị sẽ dịch sang phải, cịn


khi μ giảm thì đồ thị sẽ dịch sang trái. Trái lại, khi σ thay đổi, dạng của đồ thị sẽ

thay đổi theo. Nếu σ tăng lên thì đồ thị sẽ thấp xuống và phình ra, cịn khi σ giảm
thì đồ thị sẽ cao lên và nhọn thêm.

Hàm phân phối xác suất của biến ngẫu nhiên X phân phối theo quy luật chuẩn:
F(X) =

1



� 2�� −∞

2. Các tham số đặc trưng của quy luật chuẩn:

(�−�)2

� 2�2 ��

– Kỳ vọng toán: E(X) = μ
– Phương sai: V(X) = σ2
– Độ lệch chuẩn: �� = �

Phân phối chuẩn được ký hiệu là N(μ, σ2 ). Có liên quan mật thiết với phân phối

chuẩn là quy luật phân phối chuẩn hóa. Giả sử biến ngẫu nhiên X phân phối chuẩn
với kỳ vọng toán μ và độ lệch chuẩn �. Xét biến ngẫu nhiên: U =
- Quy luật nhị thức:

+ Định nghĩa:

X−μ
σ

.


Biến ngẫu nhiên rời rạc X nhận một trong các giá trị có thể có x = 0, 1, 2, . . . , n với
các xác suất tương ứng được tính bằng cơng thức (2) gọi là phân phối theo quy luật
nhị thức với các tham số là n và p.

Quy luật nhị thức được ký hiệu là B(n,p). Bảng phân phối xác suất của biến ngẫu
nhiên X phân phối theo quy luật nhị thức có dạng:
X

0

1



x



n

P


P0

P1



Px



Pn

Với �0 = �0� �0 �� ; �1 = �1� �1 ��−1 ; . . . , �� = ��� �� ��−� , . . . , �� = ��� �� �0 .

Trong thực tế, đơi khi ta phải tính xác suất để biến ngẫu nhiên X phân phối theo quy
luật nhị thức nhận giá trị trong một khoảng [x, x + h], trong đó h là một số nguyên
dương (h ≤ n − x). Lúc đó, ta có thể tính xác suất này theo công thức:
P(x ≤ X ≤ x + h) = Px + Px+1 + . . . + Px+h

Trong đó: �� , ��+1 , . . . , ��+ℎ được tính bằng cơng thức (2).

Ngồi ra, xuất phát từ cơng thức (2), ta cũng có được mối liên hệ truy chứng giữa
các xác suất �� và ��−1 như sau:

�� =

�(� − � + 1)
��−1
��


+ Các tham số đặc trưng của quy luật nhị thức:
– Kỳ vọng toán: E(X) = np
– Phương sai: V(X) = npq
– Độ lệch chuẩn: �� =

���

Ngồi kỳ vọng tốn, phương sai và độ lệch chuẩn, trong quy luật nhị thức, tham số
mode cũng hay được dùng. Nếu X phân phối theo quy luật nhị thức thì mode m0 có
thể được tìm trực tiếp từ bảng phân phối xác suất bằng cách tìm trong số các giá trị
có thể có của X giá trị tương ứng với xác suất lớn nhất. Tuy nhiên, có thể tìm mode


mà không cần phải xây dựng bảng phân phối xác suất. Nó được xác định bằng cơng
thức sau đây:np − q ≤ m0 ≤ np + p

Ta chú ý rằng, vì trong quy luật nhị thức mode phải là giá trị nguyên, do đó có thể
xảy ra hai trường hợp: Nếu np + p là một số nguyên thì np − q cũng là một số

nguyên, lúc đó mode sẽ cùng một lúc nhận hai giá trị: m0 = np + p và m0 = np − q.

Còn nếu np + p là một số thập phân thì mode sẽ là giá trị nguyên nằm trong khoảng
hai số thập phân là np − q và np + p.
10. Liên hệ giữa các luật phân phối

- Chuyển từ phân phối siêu bội sang phân phối nhị thức.
p = NA /N
q=1−p
N > 20. n


- Chuyển từ phân phối nhị thức sang phân phối Poison.
λ = np

� ≥ 30
�� < 5
� ≤ 0.1

- Chuyển từ phân phối nhị thức sang phân phối chuẩn.
� ≥ 30
0.1 < � < 0.9
�� ≥ 5 ∧ �� ≥ 5

μ = np

σ = npq

P(X = k) ≈

1 k−μ
f(
)
σ
σ

P(a ≤ X < b) ≈ φ

b−μ
a−μ
−φ
σ

σ


11. Ví dụ.
1. Xác suất bắn trúng đích mỗi lần của một thiện xạ là 0,8. Xạ thủ bắn 5 lần độc lập.
Tính xác suất:
a. Cả 5 lần đều trúng đích
b. 3 lần đầu trúng đích, 2 lần sau trượt
c. Có 3 lần trúng đích
d. Có ít nhất 1 lần trúng đích.
Lời giải.
Gọi Ai là “lần thứ i xạ thủ bắn trúng đích” i=1,2,3,4,5
a. Gọi B “Cả 5 lần đều trúng đích”
P(B) = A1.A2.A3.A4.A5 = 0,8 . 0,8 . 0,8 . 0,8 . 0,8 = 0,32768
b. Gọi C “3 lần đầu trúng đích, 2 lần sau trượt”
P(C) = A1 . A2 . A3 . A4 . A5 = 0,8 . 0,8 . 0,8 . 0,2 . 0,2 = 0,02048
c. Gọi D “Có 3 lần trúng đích”

P(D) = C35 . Ai . Ai . Ai . Ai . Ai = C35 . 0,8 . 0,8 . 0,8 . 0,2 . 0,2 = 0,2048
d. Gọi E “Có ít nhất 1 lần trúng đích”
E “Khơng lần nào trúng đích”

P(E) = Ai . Ai . Ai . Ai . Ai = 0,2 . 0,2 . 0,2 . 0,2 . 0,2 = 0,00032
P(E) = 1 − P(E) = 1 − 0,00032 = 0,99968

2. Cho biến ngẫu nhiên X có phân phối xác suất:
X
P

0


1

2

3

4

1
8

1
4

1
4

1
4

1
8


Và Y = 2X - 1. Tính P{Y<4}; EY, VY.
Giải.
Bảng phân phối xác suất:
X


0

1

2

3

4

Y

-1

1

3

5

7

P

1
8

1
4


1
4

1
4

1
8

1

1

1

5

Ta có: P{Y<4} = P(Y=-1)+P(Y=1)+P(Y=3) = 8 + 4 + 4 = 8

1
1
1
1
1
EY = − 1. + 1. + 3. + 5. + 7. = 3
8
4
4
4
8


1
1
1
1
1
1
1
1
1
1
VY = ( − 1)2 + 12 + 32 + 52 + 72 − −1. + 1. + 3. + 5. + 7.
8
4
4
4
8
8
4
4
4
8
=6

3. Một đề thi trắc nghiệm gồm 10 câu hỏi độc lập. Trong mỗi câu hỏi có 4 cách trả
lời trong đó chỉ có 1 cách đúng. Giả sử mỗi câu trả lời đúng được 5 điểm và mỗi câu
trả lời sai bị trừ 1 điểm. Một thí sinh khơng học hành gì, đi thi với tinh thần giao lưu
cọ xát lấy kinh nghiệm, làm bài bằng “nhân phẩm”. Tìm số điểm có khả năng nhất.
Giải
X là số câu đúng ⇒ X~B(n = 10; p = 0,25)


Y là điểm số đạt được ⇒ Y = 5X − 1. (10 − X) = 6X − 10
Với xi bất kì, ta có: X = xi ⇒ Y = xi − 10
⇒ P(X = xi ) = P(Y = 6xi − 10)

Để P(X) lớn nhất thì �� = �0 (�) (1)

Để P(Y) lớn nhất thì 6xi − 10 = m0 (Y) (2)


Thế (1) vào (2) ta được: 6m0 (X) − 10 = m0 (Y) (3)
Theo phân phối Nhị thức ta có:

(10 + 1). 0,25 − 1 ≤ m0 (X) ≤ (10 + 1). 0,25
1,75 ≤ m0 (X) ≤ 2,75
⇒ m0 (X) = 2 (4)

Thay (4) vào (3), ta được: 6.2 − 10 = 2 = m0 (Y)
Vậy điểm số có khả năng nhất là 2.

4. Lãi suất đầu tư vào một công ty là biến ngẫu nhiên phân phối chuẩn. Biết xác
suất để đạt được lãi suất trên 20% một năm là 0,2 và dưới 10% một năm là 0,1. Tìm
xác suất để đầu tư vào cơng ty đó sẽ được lãi ít nhất 14%/năm.
Gọi X là lãi suất khi đầu tư vào công ty (%)⇒ X~N(μ; σ2 )
Theo đề bài ta có: P(X > 20) =0,2
⇒1−ϕ
⇒ϕ
⇒ϕ



20 − μ
= 0,2
σ

20 − μ
= 0,8
σ

20 − μ
= ϕ 0,84
σ

20 − μ
= 0,84
σ

⇒ 20 − μ = 0,84σ (1)

Tương tự, ta cũng có: P(X > 10) =0,1
⇒ϕ
⇒ϕ

10−μ
σ

10−μ
σ

= 0,1
= 0,1



⇒ϕ


10 − μ
= ϕ −1,28
σ

10 − μ
=− 1,28
σ

⇒ 10 − μ =− 1,28σ (2)

Kết hợp (1) và (2), ta được:
20 − μ = 0,84σ
� = 16,04

20 − μ =− 1,28σ
� = 4,72

Theo u cầu bài tốn, ta cần tính:
P(X > 14) = 1 − ϕ

14 − 16,04
= 1 − ϕ( − 0,43)
4,72

= 1 − 0,3336 = 0,6664

Phần 2: THỐNG KÊ.

1. Trong một đợt kiểm tra cây cùng loại và cùng độ tuổi trong một vườn ươm,
người ta chọn được một mẫu gồm số cây và chiều cao cho trong bảng.
Chiều cao (cm) 230 - 240

220 - 230

210 - 220

200 - 210

180 - 200

Số cây

35

30

15

10

30

a. Hãy ước lượng chiều cao trung bình của cây trong vườn ươm với độ tin cậy 96%.
b. Với độ tin cậy 97% hãy ước lượng tỉ lệ cây không đạt tiêu chuẩn trong vườn ươm.
Biết rằng tỉ lệ cây đạt tiêu chuẩn có chiều cao lớn hơn 210 cm.
c. Với độ tin cậy 95% hãy ước lượng phương sai của cây trong vườn ươm.

d. Có người cho rằng chiều cao trung bình của cây trong vườn ươm là 225 cm. Cho
nhận xét về ý kiến đó với mức ý nghĩa 5%.
e. Có người cho rằng tỉ lệ cây khơng đạt tiêu chuẩn có chiều cao lớn hơn 210 cm
20%. Cho nhận xét về ý kiến đó với mức ý nghĩa 5%.
Giải


Ta có: n = 120; x = 219,5833; s = 13,1983; m=25; f=0,2083
a. Gọi µ là chiều cao trung bình của cây trong vườn ươm. Ta có:
Giá trị giới hạn:
1 − α = 0,96 ⇒ φ(zα ) =
Độ chính xác: ε = zα
2

2

s

n

1−α
= 0,48 ⇒ zα = 2.05
2

= 2,47

Khoảng ước lượng trung bình: μ ∈ (217,1089; 222,0578)
b. Gọi ρ là tỷ lệ cây khơng đạt tiêu chuẩn. Ta có:
Giá trị giới hạn:


1 − α = 0,97 ⇒ φ(zα ) =
Độ chính xác: ε = zα

2

f(1−f)
n

2

1−α
= 0,485 ⇒ zα = 2.17
2
2
= 0.0804

Khoảng ước lượng tỷ lệ: ρ ∈ (0,1279; 0,2887)
(n − 1)s2

c. χ 2

(n−1;α/2)



≤ σ2 ≤

(n − 1)s 2

χ 2(n−1;1−α/2)


621875
621875
≤ σ2 ≤
4566
27471

⇔ 136,1969 ≤ σ2 ≤ 226,1969

d. Gọi µ là chiều cao trung bình của cây trong vườn ươm.
Giả thiết �0 : �0 = 225 và �1 : �0 ≠ 225
Mức ý nghĩa: ∝= 0,05 ⇒ zα = 2,17
2

Giá trị tiêu chuẩn kiểm định: z =

x−μ0
s

n =− 4.4957

Do |z| = 4.4957 > zα ⇒ Bác bỏ H0. Tức là bác bỏ tuyên bố trên trên với mức ý
nghĩa 5%.

2


e. Gọi ρ là tỷ lệ cây không đạt tiêu chuẩn.
Giả thiết �0 : ρ0 = 0,2 và �1 : ρ0 ≠ 0,2
Mức ý nghĩa: ∝= 0,05 ⇒ zα = 2,17

2

Giá trị tiêu chuẩn kiểm định: z =

f−ρ0

n =0,2282

ρ0 (1−ρ0 )

Do |z| = 4.4957 < zα ⇒ Chấp nhận H0. Tức là chưa có cơ sở bác bỏ tuyên bố trên
2

trên với mức ý nghĩa 5%.

2. Để so sánh hiệu quả của hai loại phân A và B đối với năng suất cà chua, người ta
điều tra năng suất cà chua (đơn vị: quả) khi bón A, B cho kết quả:
Loại phân

Số cây

Năng suất trung

Độ lệch tiêu chuẩn

bình
A

41


32,2

8,5

B

61

28,4

9,3

Với mức ý nghĩa 5%, hãy cho biết loại phân A có hiệu quả hơn loại phân B khơng?
Ta có: n1 = 41; n2 = 61; x1 = 32,2; x2 = 28,4; s1 = 8,5 và s2 = 9,3.
Gọi µ1, µ2 lần lượt là năng suất trung bình của phân bón A và B.
Giả thiết: H0 : µ1 = µ2 và H1 : µ1 > µ2
Mức ý nghĩa: α = 0.05 =⇒ zα = 1.65
Giá trị của tiêu chuẩn kiểm định:
z =

x1 −x2

2
s2
1 + s2
n1 n2

= 2,1309

Do z = 2,1309 > zα = 1.65 =⇒ Bác bỏ H0. Tức là đủ cơ sở để cho rằng hiệu quả của

phân bón A cao hơn B với mức ý nghĩa 5%.



×