Tải bản đầy đủ (.pdf) (23 trang)

BTL xac suat thong ke OK

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (428.98 KB, 23 trang )

PHẦN I: LÝ THUYẾT XÁC SUẤT
VÀ QUÁ TRÌNH NGẪU NHIÊN
Bài 1
Gieo xúc xắc liên tiếp n lần, tìm xác suất để tổng số chấm xuất hiện ở n lần gieo chia
hết cho 6:
Lời giải:
Các biến có thể xảy ra của tổng số chấm xuất hiện ở n lần gieo xúc xắc là:


Tổng số chấm chia hết cho 6.



Tổng số chấm chia cho 6 dư 1.



Tổng số chấm chia cho 6 dư 2.



Tổng số chấm chia cho 6 dư 3.



Tổng số chấm chia cho 6 dư 4



Tổng số chấm chia cho 6 dư 5.


Vậy có tất cả 6 biến cố có cùng khả năng xuất hiện. Theo định nghĩa thì xác xuất để
tổng số chấm sau n lần gieo chia hết cho 6 là 1/6.
Bài 2
Một tập 10 vé trong đó có 3 vé có thưởng. Chọn ngẫu nhiên 5 vé, tìm xác suất để
trong đó có đúng 2 vé có thưởng.
Lời giải:
Gọi A là biến cố chọn ngẫu nhiên 5 vé có đúng 2 vé thưởng. Để có A ta cần:
2



Chọn ra 2 vé thưởng trong 3 vé có thưởng có



Chọn ra 3 vé thưởng trong 7 vé không có thưởng còn lại có

Tổng số trường hợp đồng khả năng:

C

5
10

3

cách.

C


3
7

cách.

cách.

2

Vậy: P( A)

C

.
C C
C
3

5

10

3
7



3.35
 0.4167
252


Bài 3
Một xạ thủ bắn bia, xác suất trúng bia của xạ thủ bằng 0.75. Tìm xác suất để sau 4 lần
bắn liên tục, lần cuối cùng (lần thứ 4) là lần đầu tiên xạ thủ bắn trúng bia.
Lời giải:
Gọi A là biến cố lần bắng thứ 4 là lần đầu tiên xạ thủ bắn trúng bia, để xảy ra A ta có.

1




Gọi A1 là biến cố xạ thủ bắn trượt với xác xuất là 0.25.



Gọi A2 là biến cố xạ thủ bắn trúng xác xuất là 0.75.

Do A1, A2 là 2 biến cố độc lập nên ta có:
P(A) = P(A1.A1.A1.A2) = P(A1). P(A1). P(A1). P(A2) = 0.253.0.75= 0.01172
Bài 4
A và B chơi một trò chơi như sau: A gieo đồng thời 2 xúc xắc. Nếu tổng bằng 7 hoặc
11 thì A thắng cuộc. Nếu tổng bằng 2 , 3 hoặc 12 thì A thua cuộc. Các trường hợp còn lại
thì A lặp lại trò chơi cho đến khi có thắng, người thua. Tìm xác suất để A thắng.
Lời giải:


Gọi G1 là biến cố xảy ra tổng số chấm bằng 7 hoặc 11.

P(G1)=2/12




Gọi G2 là biến cố xảy ra tổng số chấm bằng 2, 3 hoặc 12. P(G2)=3/12



Gọi G3 là biến cố xảy ra tổng số chấm không thuộc hai trường hợp trên ( 1, 4, 5,
6, 8, 9, 10).
P(G3)=7/12.

Gọi A là biến cố để A thắng thì ta có:
P(A) = P(A/G1). P(G1) + P(A/G2). P(G2) + P(A/G3). P(G3) = 1.P(G1) + 0. P(G1) + P(G3). P(A)
= P(G1) + P(G3). P(A)
 P( A) 

P( G1)
1  P( G 3)



1/ 6
2

1  7 /12 5

Bài 5
Chọn ngẫu nhiên 2 số thực dương x,y không vượt quá 3. Tìm xác suất của biến cố: y/x
 1 và xy  2.
Lời giải:

Xác xuất của biến cố có thể tìm bằng phương pháp hình học P( A) 


 là miền hình vuông có cạnh là 3
giới hạn bởi 4 điểm có tọa độ (0,0); (
0,3); (3,0); (3,3).

( A )
(  )

3

y=x

2

 () =3.3= 9 đơn vị diện tích.
y=2/x


A là miền giới hạn bởi các đường y=x;
y = 2/x ; trục hoành OX và x=3.

2

( A ) 


0


3

xdx 

2
x2
dx

x
2
2

2
0

 2 ln x

3
2



1
 2 ln 3  ln 2
2

1

0
0


1

2

3

2


1

 2 ln 3  ln 2

Vậy P( A)  ( A)  2
 0.2227
(  )
9

Bài 6
Các hộp được đánh số 1,2....,N và hộp mang số k chứa bi đỏ, N-k bi trắng
(k=1,2,...,N). Chọn ngẫu nhiên một hộp và từ hộp này chọn ngẫu nhiên một viên bi. Tìm xác
suất để viên bi được chọn là viên bi đỏ.
Lời giải:


GọiA là biến cố tìm ra được viên bi đỏ .




Gọi Ak là biến cố chọn ra hộp mang số k (k=1N)

Vậy xác suất để chọn được viên bi đỏ là:
N

N

P( A)   P( A / Ak ) .P( Ak )  
k 1

k 1

k 1
1 N ( N  1) N  1
.  2.

N N N
2
2N

Bài 7
Một học sinh làm bài thi gồm 4 câu hỏi. Xác suất giải đúng mỗi câu trong 3 câu hỏi
đầu bằng 0,75 ; giải đúng câu cuối cùng bằng 0,4. Tìm luật phân bố số câu giải đúng. Tính
kì vọng và phương sai của nó.
Lời giải:
Tìm luật phân bố luật xác xuất số câu giải đúng. Gọi A là số câu giải đúng.


Khi A=0 không có câu trả lời đúng.
P(A=0) = 0, 253.0, 6  0.009375




Khi A=1 là biến cố có 1 câu giải đúng.
P(A=1) =



3

2

1

2

2

C .0, 75 .0, 25.0.6  C 0, 75.0, 25 .0, 4  0.309375
3

3

Khi A=3 là biến cố có 3 câu giải đúng.
P(A=3) =



2


3

Khi A=2 là biến cố có 2 câu giải đúng.
P(A=2) =



1

C .0, 75.0, 25 .0.6  0, 25 .0, 4  0.090625

3

2

3

2

C .0, 75 .0, 6  C .0, 75 .0, 25.0, 4  0.421875
3

3

Khi A=4 là biến cố có 4 câu giải đúng.
P(A=4) = 0,753.0,4 =0.16875

* Vậy ta có bảng phân phối xác xuất.
A
P(A)


0
0.009375

1
0.090625

2
0.309375

3
0.421875

4
0.168750

3


4

* Tính kì vọng: E( A)   Ai .P( Ai )  2.65
i 0

4

* Tính phương sai: D( A)  EX 2  ( EX ) 2   Ai 2 .P( Ai )  2.652  7.825  2.652 =0.8025
i 0

Bài 8

X có phân bố đều trên đoạn [0, /2]. Tìm hàm mật độ của Y=eX và hàm mật độ của
Z=sin X .
Giải :
a- Xác định hàm mật độ của Y=eX
- Hàm y=eX là hàm đơn điệu trên đoạn [0,/2] có hàm ngược x=lny
- Hàm mật độ của X :
2

f(x) =


0

nếu x [0,/2]
nếu x [0,/2]

- Hàm mật độ của Y là :
 g(y) =

2  d (ln y ) 
2



  dy   . y

nếu y  [0, e/2]

0
nếu y  [0, e/2]

b- Xác định hàm mật độ của Z=sinx
- Hàm z=sinx đơn điệu trên đoạn [0,/2] có hàm ngược x=arcsinz
- Hàm mật độ của Z là :
 h(y) =

2  d (arcsin z ) 
2



 
dz
  . 1 z y

0

nếu z  [0, 1]
nếu z  [0, 1]

4


Bài 9
X và Y là hai đại lượng ngẫu nhiên độc lập, phân bố đều trên đoạn [0,1]. Hãy tính hàm mật
độ của X+Y và 2X+Y. Hãy kì vọng và phương sai của chúng.
Giải :
Ta có hàm mật độ của X và Y là :
y
0
nếu x  [0,1]

 f(x) = g(x) =
1
nếu x  [0,1]
* Tính hàm mật độ của X+Y :
Đặt Z=X+Y
1
 H(z) = P(ZHàm phân bố của Z là :
z
0
nếu z  0
2
H(z) = z /2
nếu 0< z  1
0
z
1
2
1-(2 - z) /2 nếu 1 < z  2
1
nếu z > 2
Hàm mật độ của Z là
h(z) = F'(z-y) = f(z-y)


h(z) =

 f ( z  y) f ( x)dx




0

nếu z  [0,2]

z

nếu 0< z 1

1

 h(z) =

 f ( z  y)dx =
0

2-z

nếu 1 < z <2

+ Kỳ vọng :
EZ = E(X+Y) = EX + EY
EX =



1

 xf ( x)dx =


 xdx =



0

x2
2

1
0

= 0,5

Tương tự : EY = 0,5
 EZ = E(X+Y) = 0,5+0,5 = 1
+ Phương sai :
DZ = D(X+Y) = DX + DY
DX = EX2 - (EX)2
EX2 =



1

2
 x f ( x)dx =

2
 x dx =




0

x3
3

1
0

= 0,333

 DX = 1/3 -(1/2)2 = 1/12
Tương tự : DY = 1/12
 DZ = DX + DY = 1/6

5


* Tính hàm mật độ của 2X+Y :
Đặt Z=2X+Y
 G(z) = P(ZCác giá trị(x,y) thuộc hình vuông OABC, còn giá trị 2X+Y rơi vào miền (S) xem
hình bên.
G(z) =

 f ( x) f
1


2

( y )dxdy =  dxdy = S

S

S

Khi đó :
0
nếu z  0
2
z /4
nếu 0< z  1
G(z) =
(2z-1)/4
Nếu 12
1-[(3 - z) /4]
nếu 2 < z  3
1
nếu z > 3
Hàm mật độ của Z là
g(z) = F'((z-y)/2) = f((z-y)/2)


g(z) =

 f (( z  y) / 2) f ( x)dx




0

nếu z  [0,3]

z/2

nếu 0< z 1

1/2
(3 - 2z)/2

Nếu 1nếu 2 < z  3

1

 g(z) =

 f (( z  y) / 2)dx

=

0

+ Kỳ vọng :
EZ = E(2X+Y) = 2EX + EY
EX =




1

 xf ( x)dx =

 xdx =



0

x2
2

y
1
0

= 1/2

Tương tự : EY = 1/2
 EZ = E(XX+Y) = 2 *1/2+1/2 = 3/2
+ Phương sai :
DZ = D(2X+Y) = 4DX + DY
DX = 1/12 = DY

A

B


z
0

z/2

C

 DZ = 4DX + DY = 4*1/12 + 1/12 = 5/12

6


Bài 10
Giả sử X và Y là hai đại lượng ngẫu nhiên độc lập có cùng phân bố đều trên (-1,1). Hãy
tính hàm mật độ của X+Y.
Lời giải
+ Đặt Z=X+Y
Gọi G(z) là hàm phân bố của z:
 G(z) = P(ZHàm phân bố của Z là :
0
G(z) =

nếu z < -2

(2  z )
8
1


2

(2  z ) 2
8

1

nếu -2 < z < 0
nếu 0 < z < 2
nếu z > 2

Hàm mật độ của Z là : g(z) = G'(z)
0
nếu z  [-2,2]
g(z) =

(2  z )
4
(2  z ) 2
4

nếu z  [-2,0]
nếu z  [0,2]

Bài 11:
Giả sử X, Y là hai ĐLNN độc lập có phân bố mũ với tham số . Hãy tính hàm mật độ của
|X-Y|.

Giải :
X, Y là hai đại lượng ngẫu nhiên độc lập có cùng phân bố mũ với tham số . Vậy

hàm mật độ của X,Y lần lượt là:
 e   x NÕu x > 0
f ( x)  
NÕu x  0
0
 e   y NÕu y > 0
g ( y)  
NÕu y  0
0

X – Y = X + (-Y)
* Mật độ của (–Y)
P(-Y<y) = G(y) = P(Y>-y)
7


y > 0 -> P(-Y<y) -> 1
y < 0 -> P(Y>-y) = 1- P(Y≤-y)
y

P(Y≤-y) =  .e y dy  1  e y
0

-> 1- P(Y≤-y) = ey

G’(y) = ey

nếu y < 0

g(y) =

0

nếu y ≥ 0

Mật độ của : X + (-Y)


0

r(z) =  f ( z  y).g ( y ).dy =


 f ( z  y).e

y

.dy



a) Xét z > 0
-> z – y > 0

(vì y<0)

0

0






r(z) =  e  ( z  y ) .e y .dy =  2 e z e 2y .dy =2e-z.

1
1 -z
 e
2 2

b) Xét z < 0
-> z – y > 0 khi y < z ;
z

r(z) =  2 e z e 2y .dy =2e-z. e2z .


 r(z) =

1
e-z
2
1
ez
2

1
1 z
 e
2 2


nếu z > 0
nếu z ≤ 0

P(Z ≤ z) = 2P(0 < Z < z)
 Mật độ của X-Y
 e  z NÕu z > 0
h(z) = 
NÕu z  0
0

8


Bài 12
Biết hàm mật độ đồng thời của X và Y có dạng:
nếu (x,y)  (0,/4) x (0,/4)

CSinxCosy
h(x,y) =

nếu (x,y)  (0,/4) x (0,/4)

0
a/ Xác định C:

 /4  /4




Ta có:

 h( x, y)dxdy  1 



D

C 

 CSinxCosydxdy 

  

  CSinxCosydxdy  1
0

0

2
2 1

b/ X và Y có đập lập không:
+ Ta có:
 /4



f(x) =


 h( x, y)dy

=

2





2 1

0

SinxCosydy

0

=

nếu (x,y)  (0,1) x (0,1)

2 2
2 1

Cosy

0

 h( x, y)dx =






2
2 1

0

SinxCosydx

0

=

nếu (x,y)  (0,1) x (0,1)
nếu (x,y)  (0,1) x (0,1)

2 2
2 1

Sinx

0
Ta có :

nếu (x,y)  (0,1) x (0,1)
nếu (x,y)  (0,1) x (0,1)


 /4



g(y) =

nếu (x,y)  (0,1) x (0,1)

nếu (x,y)  (0,1) x (0,1)

f ( x / y) 

g ( y / x) 

nếu (x,y)  (0,1) x (0,1)

h( xy )
 f ( x)
g ( y)

h( xy )
 g ( y)
f ( x)

* Vậy X và Y độc lập với nhau.

9


c/ Tính xác suất P(2Y

 /4 x/2

P(2Y
 h( x, y)dxdy =

0

2 y x

=

2

 

2 1

0

sin x cos ydxdy

8

( 2  1).Sin 3 ( )  0.60797
3
8

Bài 13
Biết hàm mật độ (X,Y) bằng

Hàm mật độ chung của của X và Y là :
h(x,y) =

12 2
(x +xy+y2)
11

nếu (x,y)  (0,1) x (0,1)
nếu (x,y)  (0,1) x (0,1)

0
a) Tính EX , DX :
Hàm mật độ của X :
1



f(x) =

 h( x, y)dy

=

12

2

2

 11 (x +xy+y )dy




0
=

nếu (x,y)  (0,1) x (0,1)

12 2 x 1
(   )
11 x 2 3

0

nếu (x,y)  (0,1) x (0,1)
nếu (x,y)  (0,1) x (0,1)

1



EX =

nếu (x,y)  (0,1) x (0,1)

0

 xf ( x)dx =




12 x 2 x 1
0 11 x(  2  3 )dx = 7/11  0.63636

DX = EX2 - (EX)2
1



2

EX =

2

 x f ( x)dx =



12 2 x 2 x 1
0 11 x (  2  3 )dx = 59/110  0.53636

 DX = 0,53636 - 0.636362= 0,1314
b) Tính xác suất P(Y+X<1) :
1 1 x

P(Y+X<1) =

 h( x, y)dxdy =


x  y 1


0 0

12
( x2  xy  y2)dxdy
11

1

=

12
x( x  1) ( x  1) 3
5
(
x2(x
1)


)dx 
0 11
2
3
22

c1/ X và Y có độc lập không :
Tương tự ta có hàm mật độ của Y :


10


1



g(y) =

=

 h( x, y)dx

12

2

2

 11 (x +xy+y )dx



nếu (x,y)  (0,1) x (0,1)

0

0
=


nếu (x,y)  (0,1) x (0,1)

12 2 y 1
(y   )
11
2 3

nếu (x,y)  (0,1) x (0,1)

0

nếu (x,y)  (0,1) x (0,

Xét hàm mật độ phân xấc suất có điều kiện f(x/y):
f ( x / y) 

h ( x, y )
 f ( x)
g ( y)

Vậy X và Y không độc lập với nhau.
c2/ Tính Cov(X,Y) : Cov(X,Y) = E(XY) - EX.EY


E(XY) =



=


  xyh( xy)dxdy

  

1



EX =

 xf ( x)dx =



  

12

 yg ( y)dy =



x

2

1

 11 x( x  2  3 )dx = 7/11  0.63636
0


1



EY =

12

  xy 11 ( x2  xy  y 2)dxdy  17 / 24

2

12 y y 1
0 11 y(  2  3 )dy = 7/11  0.63636

Cov(X,Y) = E(XY) - EX.EY = 53/144 = 0.368
c3. Hệ số tương quan của (XY) :


Cov ( XY )


y



x

53

144
7
11

 0.578

Bài 14
Giả sử X và Y là hai đại lượng ngẫu nhiên đập lập có cùng phân bố chuẩn N(0,1).Hãy tính
xác suất P(XTa có:
P(XHàm mật độ của Z = X+Y  (0,2)
P ( Z  0) 

1
2 2

e



Z2
2 x2

 R( Z )

Ta có hàm R(Z) là hàm chẳn đối với z nên P(Z<0) = 1/2.

11



Bài 15

Giải
a. Do tổng các cột của xích Markov bằng 1 nên xác xuất các trạng thái:
P1=P2=P3=1.3
b. Tìm ma trận xác xuất chuyển sau n bước:
 n  P.T n .P 1 trong đó P là ma trận chuyển cơ sở của  dạng chéo, T là ma trận chéo

gồm trị riêng của .
Dùng phần mềm Matlab ta tính được:
 1
 2 0
 1 1 1 

P   2 1 0  ; T   0 1
1 1 1



 0 0


  1  n

 
0
 2 
 n 
0  ;T 

0


1


 0
2


  1  n
 
 1 1 1   2 
Vậy  n  P.T n .P 1   2 1 0  .  0
 1 1 1


 0

 1  -1 n 1 1  1 n
   + +  
6 2  3 22
n

1  -1  1
n

 
   +


3 2  3

n
n
 1  -1  + 1 - 1  1 
 6  2  3 2  2 



0 

1
0 

n
1 
0   
2 
0

 1
0  6

1
1
0  .

 3
n
 1    1

0   
 2    2
0

n

1  -1  1
-   +
3 2  3
n

2  -1  1
  +
3 2  3
n

1  -1  1
-   +
3 2  3

1 1 
3 6

1 1
3 3

1
0

2


n
n
1  -1  1 1  1  
  + -   
6 2  3 22 
n

1  -1  1

-   +
3 2  3

n
n 
1  -1  1 1  1  
  + -  
6  2  3 2  2  

12


1
2

1
2
c. Sau 2 ngày ta có   
4


 1
4

1
4
1
2
1
4

1
4

1
4

1

2

2

1

Phân bố xác xuất sau 2 ngày. P   0 . 2  
5 5

1
2


2 1
.
5 4

 1
4

1
4
1
2
1
4

1
4

1  7
3

4   20 10

1

2

7 

20 


Từ mà trận 2 ta có nếu hôm nay là nắng thì khả năng hai ngày sau là nắng sẽ cao
nhất ( chiễm xác suất 0.5).
d. Nếu hôm nay là mưa để tính thời gian trung bình để có nắng ta coi nắng là trạng
thái hút ta có xích Markov mới.
N

M

T

0
0 N
 1


1 / 2 1 / 2 0  M
1 / 2 0 1 / 2  T


 1 0  1 / 2 0  1 / 2 0 
  
  

0 1  0 1/ 2  0 1/ 2
 2 0

N  ( I  Q ) 1  
 0 2

 ( I  Q)  


 2 0  1  2  M
.    
 0 2  1  2  T

  N .E  

Vậy thời gian trung bình chuyển từ Mưa Nắng mất 2 ngày.
 Nếu hôm nay trời mưa trung bình phải đợi hai ngày để có nắng.
Bài 16

a) Trị riêng : 1, 3/4, -1/4
Vectơ riêng: u1 = (1,1,1) ; u2 = (0,1,1); u3 = (0,-3, 1)

13


1 0 0 


T = 1 1  3  ; T-1=
1 1 1 


0
1

  =  0 (3 / 4) n
0
0


n



 1
3
Tính ra  n  1  ( ) n

4

3 n
1  ( )
4


0
0 
0 
1
1 0




0 
  1 1/ 4 3 / 4  ;  =  0 3 / 4
 0  1/ 4 1/ 4 
 0 0  1/ 4 





0



0 
(1/ 4) n 
0
3.(1) n .4 1n  3n.4 1n
 (1) n .4 1n  3n.4 1n




4
( ) 1n  3.(1) n .4 1n 

3

4 1n
( )
 (1) n .4 1n 
3

0

1 0 0  1



b) Limn = 1 0 0  2
1 0 0  3



 3 / 4
1 0  0 3 / 4  1
  
  
  ( I  Q) 1  N =
 0 1  1 / 4 1 / 2    1 / 4 1 / 2 

c) ( I  Q)  

 8 / 5 12 / 5 1

 8 / 5 12 / 5 


 4 / 5 16 / 5 

 4 2

    
  
 4 / 5 16 / 5 1  4  3

Vậy thời gian trung bình để hệ thống dịch chuyển từ trạng thái 3 sang trạng thái hút là 4.


14


PHẦN II: THỐNG KÊ TOÁN VÀ HỒI QUY BỘI
Câu 1
Giả thiết trọng lượng của các gói đường là ĐLNN có phân bố chuẩn với độ lệch chuẩn là
=0,05.Chọn ngẫu nhiên ra 30 gói đường và tính trọng lượng trung bình của chúng X =
0,98. Tìm khoảng tin cậy cho trọng lượng trung bình của các gói đường với độ tin cậy 95%.
Giải:
Khoảng tin cậy cho m với độ tin cậy cho trước có thể được xác định theo biểu thức sau:


u  m  X 
u
m1  m  m2 hay là X 
n

n

Trong đó:
X = 0,98 : trọng lượng trung bình của các mẫu,
=0,05 : độ lệch chuẩn,
n = 30, số lượng mẫu,
u - phân vị chuẩn mức  của u : P(u>u) = ,
u được xác định bằng hàm NORMSINV(1-0,5) trong Excell,
Với  = 1 - 0,95 = 0,05 ta có: u = 1,959964, thay vào biểu thức trên ta có khoảng tin cậy
cần tìm là:
0,962108 < m < 0,997892
Câu 2
Cho mẫu ngẫu nhiên sau của ĐLNN có phân bố chuẩn:

{4,7; 3,01; 4,65; 3; 3,26; 3,1; 3,41; 5,64; 2,97; 4,89; 4,55;4,89; 2,72; 4,57; 3,94; 3,61; 6,22;
3,02; 2,47}. Tìm khoảng tin cậy với độ tin cậy 98% cho kỳ vọng của của ĐLNN đó.
Giải:
Nhập số liệu mẫu vào bảng Excel và tính được như sau:
Xi
Xi2
Xi
Xi2
STT
STT
1
4.7
22.09
11
4.89
23.9121
2
3.01
9.0601
12
4.55
20.7025
3
4.65
21.6225
13
4.89
23.9121
4
3.52

12.3904
14
2.72
7.3984
5
3
9
15
4.57
20.8849
6
3.26
10.6276
16
3.94
15.5236
7
3.1
9.61
17
3.61
13.0321
8
3.41
11.6281
18
6.22
38.6884
9
5.64

31.8096
19
3.02
9.1204
10
2.97
8.8209
20
2.47
6.1009
(Ghi chú: trong bảng Excel lấy dấu chấm (.) để phân cách số thập phân)
- Kỳ vọng mẫu X = =AVERAGE(B18:B37) = 3,907
- Phương sai mẫu: S 2 

1 20 2
 X i  X 2  1,032081
20 i 1

- Phương sai mẫu điều chỉnh: S *2 

20
.S 2  1,086401 => S* =1,042306
(20  1)

15


- Mức ý nghĩa:  = 1- 0,98 = 0,02
- Phân vị student mức  với n-1 = 19 bậc tự do: t0.02 = TINV(0.02,19) = 2,539483
Vậy khoảng tin cậy được xác định như sau:

X

S*
S*
t  m  X 
t => 3,315131 < m < 4,498869
n
n

Câu 3
Mẫu có phân bố chuẩn như bảng sau,
(a) Với độ tin cậy 94%, tìm khoảng tin cậy cho kỳ vọng EX của ĐLNN đó, biết rằng phương
sai đã cho  =1.
(b) Trường hợp phương sai chưa biết, cũng độ tin cậy 94%, tìm khoảng tin cậy cho EX.
Giải:
Các giá trị trong bảng nhập vào Excel và tính toán như sau:
Giá trị X
6.9
7.2-7.8
7.8-8.4
8.4-9
9-9.6
9.6-10.2
Số lần ni
8
14
8
3
5
2

Trung bình Xi
6.9
7.5
8.1
8.7
9.3
9.9
Xi^2=
47.61
56.25
65.61
75.69
86.49
98.01
a) Trường hợp đã cho  = 1 và độ tin cậy (1-) = 94%:
- Độ lệch chuẩn  = 1-0,94 =0,06
- Số lượng mẫu n = 40,
- Kỳ vọng mẫu X được xác định theo Excel bằng hàm SUMPRODUCT, ta được: X =
7,935
- Phân vị chuẩn u được xác định bằng hàm NORMSINV(1-0,5.) = 1,880794
Vậy khoảng tin cậy được xác định bằng:


X
u  m  X 
u => 7,63762 < m < 8,23238
n

n


b) Trường hợp chưa cho  :
- Độ tin cậy (1 - ) = 0,94 =>  = 0,06
- Phương sai mẫu: S 2 

1 20 2
 X i  X 2  0,755775
20 i 1

- Phương sai mẫu điều chỉnh: S *2 

40
.S 2  0,775154 => S* =0,880428
(40  1)

- Phân vị student mức  với n-1 = 39 bậc tự do: t0.06 = TINV(0.06,39) = 1,937106
Vậy khoảng tin cậy được xác định như sau:
X

S*
S*
t  m  X 
t => 7,665339 < m < 8,204661
n
n

Câu 4 : Trước ngày bầu cử, một cuộc thăm dò dư luận qua 500 cử tri cho thấy số người ủng
hộ ứng cử viên A là 245. Tìm khoảng tin cậy cho tỷ lệ phiếu bầu cho ứng cử viên A với độ
tin cậy 90%.
Ta có :


16


pˆ 

u
n

pˆ (1  pˆ )  p  pˆ 

u
n

pˆ (1  pˆ )

Trong đó :
pˆ =

k 245
= 0,49 , n=500.

n 500

u : u = 1,6448
 Khoảng tin cậy : m  (0,4532 ; 0,527)
Câu 5: Sở giáo dục nọ báo cáo : tỉ lệ học sinh tốt nghiệp phổ thông trung học của tỉnh là
88%. Kiểm tra ngẫu nhiên 400 học sinh, trong đó có 340 em đỗ tốt nghiệp. Với mức ý nghĩa
5% hãy kiểm định báo cáo của họ có quá cao không.
Bài toán ta có :
H : p = 0,88

với  =5%
K : p < 0,88
Ta có :
uqs =

pˆ  p 0
p 0 (1  p 0 )

n =

340
 0,88
400
400 = -1,8464
0,88(1  0,88)

u = 1,96
 uqs > -u  Chấp nhận H (Chấp nhận tuyên bố của Sở giáo dục nọ)
Câu 6
Lượng xăng tiêu thụ của một loại xe máy (trên quãng đường 100Km) là ĐLNN có phân bố
chuẩn với độ lệch chuẩn =0,3. Bảng sau cho biết lượng xăng tiêu thụ (tính theo lít) của 12
chiếc xe máy. Hãy kiểm định giả thiết lượng xăng tiêu thụ trung bình H: m≥ 1,9 với đối thiết
là K: m<1,9. Mức ý nghĩa của kiểm định  = 0,05.
STT
Lượng xăng tiêu thụ
STT
Lượng xăng tiêu thụ
1
1.8
7

1.49
2
1.8
8
1.6
3
1.51
9
1.86
4
1.61
10
1.92
5
2
11
1.7
6
1.55
12
1.5
Giải:
Đây là bài toán kiểm định một phía khi đã cho  (=> kiểm định theo U), ta làm như sau:
- Ta có: mo = 1,9;  = 0,05;  = 0,3
- Kỳ vọng mẫu X được xác định theo Excel bằng hàm AVERAGE, ta được: X = 1,695
- Phân vị chuẩn U được xác định bằng hàm NORMSINV(1-)=1,644854 =>-U =1,644854
- Xác định U qs 
Vậy ta thấy rằng

X  mo




n

1,695  1,9
12  2,36714
0,3

Uqs < - U => kết luận: bác bỏ giả thiết (H)

17


Câu 7
Với mẫu ngẫu nhiên của X N(m,2) cho trong bài tập 2. Hãy kiểm định giả thiết H: giá trị
trung bình của ĐLNN đó bằng 4,4 với giả thiết đối K: m ≠ 4,4. Cho mức ý nghĩa kiểm định
 = 0,04.
Giải:
Đây là bài toán kiểm định hai phía. Từ câu 2 ta đã có:
X = 3,907; S* =1,042306;
Bài toán cho: mo = 4,4; mức ý nghĩa kiểm định  = 0,04
Tính: U qs 

X  mo
3,907  4,4
n
20  2,11527
S*
1,042306


t = TINV(0.04,39) = 2,204701;
Ta thấy, Uqs < t do đó chấp nhận giả thiết (H).
Câu 8
Đo chiều cao của một giống cây 2 tuổi, kết quả cho dưới bảng sau.
Chiều cao của cây
Số cây
Chiều cao của cây
Số cây
<7
1
9.5-10
13
7.0-7.5
2
10.0-10.5
20
7.5-8.0
7
10.5-11.0
22
8.0-8.5
6
11.0-11.5
15
8.5-9.0
13
11.5-12.0
8
9.0-9.5

12
12.0-12.5
1
Với mức ý nghĩa  = 0,04 hãy kiểm định giả thiết chiều cao của loại cây đó có phân bố
chuẩn.
Giải:
Gọi xi là chiều cao của cây thuộc nhóm i với số lượng cây là ni, ta có bảng tính toán trong
Excel như sau:

- Các khoảng mẫu cách nhau 0,5, ta có kỳ vọng mẫu là:

- Phương sai mẫu:

18


=> Vậy độ lệch mẫu:

Vì bài toán cho là phân bố chuẩn nên pi được xác định:
Từ đó:

Vậy, vì Q2 < 2 => chấp nhận giả thiết (H).
Câu 9
Thống kê học sinh nghỉ học trong tuần của một trường học
Ngày
Thứ 2
Thứ 3
Thứ 4
Thứ 5
Thứ 6

Thứ 7
Số HS nghỉ
80
65
70
45
55
85
Kiểm định giả thiết: các ngày nghỉ của học sinh phân bố đều vào các ngày trong tuần, mức
ý nghĩa kiểm định là 5%.
Giải:
Số liệu đầu bài :
Do kiểm định phân bố đều nên kiểm định giả thiết H: pi = 1/6, i = 1…6
Với đối thiết K: tồn tại i để pi  1/6 với mức ý nghĩa  = 0,05, r = 6
(Do phân bố đều nên pi’ = 1/6).
n = 80+65+70+45+55+85 = 400,
Ta có:
2 =CHIINV(, r-1) = 11,0705
r



Q2  
i 1

(ni  npi ' ) 2
 17 > 2
npi '

Vậy, bác bỏ giả thiết (H)

Bài 10 : Nghiên cứu mối quan hệ giữa huyết áp (HA) và trọng lượng (TL) cơ thể trẻ em lứa
tuổi 14, người ta phân ra hai loại :
A1 : Nhóm người có trọng lượng không quá 50kg, A2 : Nhóm người có trọng lượng trên
50kg
Phân chia huyết áp thành 4 loại :
B1 : Nhóm người có huyết áp không vượt quá 99, B2 : Nhóm người có huyết áp trong
khoảng 100-110, B3 : Nhóm người có huyết áp trong khoảng 110-120, B4 : Nhóm người có
huyết áp trên 120.
Kết quả điều tra được ghi trong bảng sau :
HA/TL
B1
B2
B3
B4
10
20
11
5
A1
6
48
50
50
A2

19


Với mức ý nghĩa 1% hãy kiểm định các dấu hiệu về huyết áp và trọng lượng cơ thể có độc
lập nhau không?

Giải : Ta có :
n= 200 , 2 = 11,3

Q2qs =

6

6


i 1

j 1

n n

 nij  i 0 0 j
n

ni 0 n 0 j





2

= 22,5325< 2 = 11,3

n


 Bác bỏ giả thiết huyết áp và trọng lượng độc lập với nhau.
Câu 11
Các số liệu cho ở bảng sau nhằm phân tích hiệu quả của việc đầu tư quảng cáo (X) và
doanh thu của một công ty (Y) trong khoảng thời gian 6 tháng.
X
5
8
10
15
18
22
Y
6
15
20
25
30
36
Hãy xác định hệ số tương quan giữa X và Y. Tìm hồi quy của Y theo X. Dự báo doanh thu
của công ty trong tháng tiếp theo nếu số tiền đầu tư cho quảng cáo là X= 20.
Giải:
Nhập bảng số liệu trên vào Excel.

Câu 12
Bảng sau cho số liệu quan sát về kết quả học tập của học sinh. Giả thiết mô hình hồi quy
giữa chúng Y =  + 1x1+ 2x2 + 3x3 + ,
Trong đó:
Y là điểm trung bình chung của học sinh cuối năm thứ nhất.
x1: là điểm thi tốt nghiệp phổ thông của học sinh;

x2: là điểm thi đại học;
x3: là điểm thi môn toán kỳ I của học sinh.

20


a) Viết phương trình mặt phẳng hồi quy Y theo x1, x2, x3
b) Tính hệ số xác định và sai số chuẩn cuả hồi qui
c) Tính hệ số tương quan bội và hệ số tương quan riêng giữa điểm trung bình chung năm
thứ nhất và điểm thi tốt nghiệp PTTH
d) Tính khoảng tin cậy 2 với độ tin cậy 90%
e) Dự báo điểm trung bình chung cuối năm cho học sinh nếu x1=55; x2=29; x3=9
Giải:
Giải toàn bộ bài toán trên bằng bảng Excel, ta được kết quả như sau:
* Lập bảng số liệu thống kê:
STT
1
2
3
4
5
6
7
8
9
10
11
12
13
14

15
16
X_

x1
42
43
49
46
46
51
49
43
53
52
50
43
40
51
55
54
47.9375

x2
25
23
26
22
21
26

27
25
23
26
24
24
22
22.5
24
28
24.28125

1. Viết phương trình mặt phẳng hồi quy
* Lập ma trận covarian:
0.977578
1.988633

x3
6
7
7
8
5
8
9
8
6
8
9
8

7
9
6
9
7.5

Y
6.2
6.63
7.57
7.79
5.5
8.2
8.44
7.75
6.5
7.8
8.2
7.8
6.4
8.87
6.9
9.1
7.478125

1.115215

1.133438

Y^

6.1873
6.818108
7.279782
7.602807
5.510584
8.063531
8.691485
7.599954
6.65373
8.115145
8.59111
7.549291
6.612602
8.56673
6.807621
9.000219

21


C=

1.988633
1.115215
1.133438

20.80859
3.361328
1.09375


3.361328
3.686523
1.109375

1.09375
1.109375
1.5

Ma trận A

* Ma trận nghịch đảo của A là:
0.056376
-0.050207
-0.003976
-0.050207
0.393625
-0.254509
-0.003976
-0.254509
0.857796
b1=
0.051614
b2=
0.050663
b3=
0.68052
c=
-1.330194
* Vậy phương trình mặt phẳng hồi quy là:
Y = 0.05164*x1+ 0.050663*x2+0.68052*x3-1.330194

A^(-1)=

2. Hệ số xác định và sai số chuẩn:
* SST = nD(Y); SSR =nD(Y^) và SSE=SST-SSR:
SST=
15.64124
SSR=
14.8875
SSE=
0.753742
* Sai số của hồi quy Se = SQRT(SSE/(n-k-1); với k=2:
Se=
0.240791
* Hệ số tương quan bội R=SQRT(SSR/SST):
R=
0.975608
* Hệ số tương quan riêng giữa Y và x1:
. Ma trận các PP đại số Covarian:
76.25684
-3.935935
-3.935935
0.405674
-3.863407
0.019045
-51.89431
2.664201
. Hệ số tương quan riêng giữa Y và x1 là:
HS TQR=
0.68052
0.05803

0.951811
79.00585
14.8875

-3.863407
0.019045
1.60978
1.714833

-51.89431
2.664201
1.714833
38.39664

0.707652

0.050663
0.051614
-1.330194
0.03931
0.014877
0.882626
0.250623
12
0.753742
(kết quả phù hợp với tính toán ở trên)

4. Tính khoảng tin cậy cho  2 với độ tin cậy 90%
* Tính phân bố Student: T với n-k-1 = 13 bậc tự do:
T=

1.770933
* Khoảng tin cậy  2 là:
< 2 <
0.025268

<=>

b3
Sb3
R^2
Fsq
SSR

0.07796

22


5. Dự báo điểm trung bình chung năm cuối
x1 =
55
x2 =
29
Vậy Y^n+1= 0.05164*x1+ 0.050663*x2+0.68052*x3-1.330194
Y^n+1 =

x3 =

9.102497


23



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×