Tải bản đầy đủ (.pdf) (83 trang)

Các phương pháp dự báo (chuyên ngành: Toán ứng dụng)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.2 MB, 83 trang )



1

đại học thái nguyên
trờng đại học s phạm
khoa toán







Các phơng pháp dự báo
Các phơng pháp dự báo Các phơng pháp dự báo
Các phơng pháp dự báo





Chuyên ngành: Toán ứng dụng



luận văn tốt nghiệp Đại học


Ngời hớng dẫn khoa học:


C.n Mã Thế Đông





thái nguyên-2006
Mục lục


2

Trang
Trang bìa phụ 1
Mục lục 2
Mở đầu 3
Chơng 1. Tổng quan về thống kê toán và các bài toán cơ bản 5
1.1. Tổng quan về thống kê toán 5
1.2. Các bài toán cơ bản 18
Chơng 2. Phân tích hồi quy 45
2.1. Mục đích của phơng pháp phân tích hồi quy 45
2.2. Hàm hồi quy 46
2.3. Mô hình hồi quy tuyến tính đơn 46
Chơng 3. Phân tích chỗi thời gian 54
3.1. Một số khái niệm 54
3.2. Phân tích bằng hàm xu thế 55
3.3. Phân tích biến động mùa vụ 59
3.4. Phân tích biến động chu kỳ 60
Chơng 4. Thống kê Bayes và lý thuyết quyết định thống kê 61
4.1. Thống kê Bayes 61

4.2. Lý thuyết quyết định thống kê 66
Một vài ứng dụng thực tế 76
Kết luận 82
Tài liệu tham khảo 83



3

Mở đầu
1. Lý do chọn đề tài
Trong khoa học và đời sống ngời ta cần phải thu thập các số liệu chẳng
hạn về số lợng năng suất lúa ở các vùng trong nhiều năm, số liệu điều tra dân
số, số liệu về trình độ nhận thức của học sinh
Vấn đề đặt ra là: Sau khi thu thập các số liệu, ta phải trình bầy các số
liệu đó một cách có hệ thống nh thế nào? Từ các số liệu đó rút ra kết luận gì?
Các số liệu đó phản ánh quy luật nào của sự vật đang xét, độ tin cậy của các
kết luận? Phán đoán sự phát triển của sự vật? Cần phải có những quyết định gì
trong hoạt động thực tiễn.
Tất cả các vấn đề trên đợc quy tụ về bộ môn: Thống kê toán. Thống kê
toán là bộ môn toán học nghiên cứu quy luật của các hiện tợng ngẫu nhiên
có tính chất số lớn trên cơ sở thu thập và xử lý các số liệu thống kê, các kết
quả quan sát. Nội dung chủ yếu của thống kê toán là xây dựng các phơng
pháp thu thập và xử lý các số liệu thống kê nhằm rút ra các kết luận khoa học
và thực tiễn. Các phơng pháp thống kê toán là công cụ để giải quyết nhiều
vấn đề khoa học và thực tiễn nảy sinh trong các lĩnh vực khác nhau của tự
nhiên và kinh tế xã hội.
Các phơng pháp dự báo là một trong những phơng pháp thống kê
toán. Ta thấy việc lựa chọn quyết định hoạt động ở tơng lại sẽ thuận lợi hơn,
mang lại hiệu quả hơn khi đã biết phân bố xác suất của các dữ kiện ngẫu

nhiên. Các xác suất này thực chất là đợc đa ra từ các kết quả thống kê của
quá khứ dùng làm dự báo cho khả năng xảy ra trong tơng lai. Với mục đích
chính của các phơng pháp dự báo là dự báo đại lợng ngẫu nhiên trong tơng
lai. Vì vậy các phơng pháp dự báo đợc ứng dụng trong nhiều lĩnh vực khác
nhau nh: Kinh tế sản xuất, giao thông vận tải, xây dựng, và kể cả trong


4

giáo dục. Dự báo đợc các kết cục xảy ra trong tơng lai sẽ là điều kiện cơ sở
để ta lựa chọn các quyết định một cách đúng đắn.
Từ tính thực tiễn và những lý luận chung nêu trên là lý do để em tiến
hành nghiên cứu đề tài: Các phơng pháp dự báo.
Em xin chân thành cảm ơn Thầy Mã Thế Đông - giảng viên khoa Toán,
các thầy cô giáo trong khoa Toán trờng ĐHSP Thái Nguyên đã tận tình giúp
đỡ, chỉ bảo em hoàn thành đề tài nghiên cứu khoa học này.
2. Nội dung chính
Đề tài Các phơng pháp dự báo bao gồm các nội dung chính sau:
Chơng 1:Tổng quan về thống kê toán và các bài toán cơ bản.
Chơng 2: Phân tích hồi quy
Chơng 3: Phân tích chuỗi thời gian.
Chơng 4: Thống kê Bayes và lý thuyết quyết định thống kê.
3. Mục đích yêu cầu
Đề tài Các phơng pháp dự báo nghiên cứu nhằm:
- Tìm hiểu, hệ thống các vấn đề tổng quan về thống kê toán, các bài
toán cơ bản của thống kê toán.
- Bớc đầu tìm hiểu kỹ thuật phán đoán, kỹ thuật phân tích hồi quy, kỹ
thuật phân tích chuỗi thời gian để từ đó đa ra một số ứng dụng thực tế.
4. Các phơng pháp nghiên cứu
Đề tài Các phơng pháp dự báo đợc nghiên cứu dựa trên sự tổng hợp

của các phơng pháp:
- Thu thập tài liệu, đọc tài liệu.
- Phân loại, hệ thống lý thuyết.
- Phân tích, tổng hợp lý thuyết.


5

Chơng 1: tổng quan về thống kê toán và
các bài toán cơ bản
1.1.tổng quan về thống kê toán.

1.1.1. Tổng thể và mẫu.
1.1.1.1.Tổng thể.
Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứu
định tính hoặc định lợng nào đó đợc gọi là tổng thể nghiên cứu hay tổng thể.
Để nghiên cứu tổng thể có 2 cách:
- Nghiên cứu toàn bộ mọi phần tử của tổng thể.
- Nghiên cứu đại diện: Lấy một số phần tử ra để nghiên cứu. Từ những
thông tin nhận đợc, ta kết luận cho cả tổng thể.
1.1.1.2. Mẫu.
1.1.1.2.1.Định nghĩa.
Tập hợp n phần tử chọn ra đại diện từ tổng thể để nghiên cứu đợc
gọi là mẫu.
Ta có: n << N N: Số phần tử của tổng thể.
n: Số phần tử của mẫu.
1.1.1.2.2. Phơng pháp chọn mẫu.
Tuỳ thuộc vào đặc điểm từng lĩnh vực nghiên cứu mà mẫu có thể đợc chọn
theo nhiều phơng pháp khác nhau để đảm bảo yêu cầu về tính đại diện của mẫu.
Cụ thể:

- Mẫu giản đơn ( mẫu hoàn lại, mẫu không hoàn lại).
- Mẫu hệ thống.
- Mẫu chùm.
- Mẫu phân tổ.
- Mẫu nhiều cấp.


6

Một mẫu đợc coi là tốt nếu n vừa đủ để nghiên cứu và các phần tử vừa
đợc chọn ngẫu nhiên, vừa có tính đại diện cao.
1.1.1.2.3. Phân loại mẫu (2 loại).
- Mẫu không lặp: Các phần tử của mẫu là khác nhau.
- Mẫu lặp: Một phần tử của tổng thể có thể rơi vào mẫu nhiều lần (đợc
nghiên cứu nhiều lần).
Nếu n rất bé, N rất lớn, ta có thể coi mẫu lặp và không lặp nh nhau.
1.1.2. Mẫu ngẫu nhiên.
Xét biến ngẫu nhiên X, thử X n lần một cách độc lập. Biến ngẫu nhiên X
đợc thử ở lần thứ i (ký hiệu X
i
), i =
n,1

Một bộ sắp thứ tự (X
1
, X
2
, ,X
n
) đợc gọi là một mẫu ngẫu nhiên lấy từ

X. Ký hiệu: W = (X
1
, X
2
, ,X
n
).
Việc thực hiện một phép thử đối với mẫu ngẫu nhiên W chính là thực
hiện một phép thử đối với mỗi thành phần của mẫu.
Giả sử X
1
nhận giá trị x
1
, ,X
n
nhận giá trị x
n
. Tập hợp n giá trị x
1
, ,
x
n
tạo thành một giá trị của mẫu ngẫu nhiên (mẫu thực nghiệm).
Ký hiệu: w = (x
1
, x
2
, ,x
n
).

1.1.3. Các phơng pháp mô tả số liệu.
1.1.3.1. Sắp xếp số liệu thực nghiệm.
Từ mẫu ngẫu nhiên W = (X
1
, X
2
, ,X
n
) thờng có 2 cách sắp xếp tiện
lợi cho việc áp dụng các tiêu chuẩn thống kê.
1.1.3.1.1. Sắp xếp theo các giá trị khác nhau.
Từ tổng thể với biến ngẫu nhiên gốc X, rút ra 1 mẫu cụ thể có kích
thớc n :W = (X
1
, X
2
, ,X
n
), ta xác định đợc k giá trị khác nhau k n.
Trong đó: Giá trị x
1
xuất hiện với tần số n
1

Giá trị x
k
xuất hiện với tần số n
k



7

a. Sắp xếp các giá trị cụ thể x
i
theo trình tự tăng dần, ta có bảng phân phối tần
số thực nghiệm sau:
x
i
x
1
x
2
x
k

n
i
n
1
n
2
n
k

Trong đó: n
1
+ n
2
+ + n
k

= n.
b. Nếu ký hiệu f
i
=
n
n
i
(tần suất xuất hiện của giá trị x
i
trong mẫu). Ta có bảng
phân phối tần suất thực nghiệm sau:
x
i
x
1
x
2
x
k

f
i
f
1
f
2
f
k



Trong đó:

f
1
+ f
2
+ + f
k
= 1
1.1.3.1.2. Sắp xếp dới dạng khoảng.
Giả sử n lớn, khi đó ta chọn a min {x
i
}

; b max {x
i
}. Chia [a, b]
thành k khoảng bởi các điểm chia: a = a
0
< a
1
< < a
k - 1
< a
k
= b. Đếm số
lợng các phần tử rơi vào từng khoảng, giả sử khoảng thứ i có n
i
phần tử. Ta
có bảng ghép lớp sau:

Khoảng [a
0
, a
1
) [ a
1
, a
2
)

[ a
k - 1
, a
k
]
n
i
n
1
n
2
n
k

1.1.3.2. Hàm phân phối mẫu (hàm phân phối thực nghiệm).
1.1.3.2.1.Định nghĩa.
Cho 1 mẫu ngẫu nhiên W = (X
1
, X
2

, ,X
n
)
Ký hiệu:
i


(i =
k,1
) - Tần số tích luỹ của x
i
,
i

=

< )(x
j
j
n
i
x

F*(x
i
) - Tần suất tích luỹ của x
i
, F*(x
i
) =

i
n

=
j i
j
x x
n
n
<


F*(x
i
) là một hàm của x
i
, gọi là hàm phân phối mẫu.


8

1.1.3.2.2. Tính chất của hàm phân phối mẫu.
+) 0 F*(x
i
) 1
+) F*(x
i
) là hàm đơn điệu tăng theo x
i


+) F*(x
i
) = 0 nếu x
i
min (x
1
, ,x
n
)
+) F*(x
i
) = 1 nếu x
i
> max (x
1
, , x
n
)
+) F*(x
i
) F(x) khi x theo nghĩa xác suất (F(x)- hàm phân phối
xác suất của biến ngẫu nhiên gốc X ; F(x) =P(X<x) )
1.1.3.3.Biểu đồ.
Để mô tả số liệu mẫu một cách rõ ràng cho phép đa ra những nhận xét
sơ bộ ban đầu về tổng thể, ngời ta còn xây dựng các loại đồ thị khác nhau
của phân phối thực nghiệm.
1.1.3.3.1. Đa giác tần số.
Đa giác tần số là đờng gy khúc mà các đoạn thẳng của nó nối các
điểm (x
1

, n
1
), (x
2
, n
2
), , (x
k
, n
k
) trên mặt phẳng. (H.1)
1.1.3.3.2. Đa giác tần suất.
Đa giác tần suất là đờng gy khúc mà các đoạn thẳng của nó nối các
điểm (x
1
, f
1
), (x
2
, f
2
), , (x
k
, f
k
) trên mặt phẳng.(H.2)
1.1.3.3.3. Tổ chức đồ.
Khi dấu hiệu nghiên cứu có phân phối liên tục, ta xây dựng biểu đồ tần
số (tần suất) gọi là tổ chức đồ tần số (tần suất). (H.3)
Ta chia khoảng chứa tất cả các giá trị quan sát của mấu thành 1 số đoạn

có chiều dài bằng h, tại mỗi đoạn đa vào tần số (tần suất) tơng ứng. Nh vậy
biểu đồ tần số sẽ là 1 hình thang tạo nên bởi nhiều hình chữ nhật, có đáy bằng
h, chiều cao bằng
h
n
i
. Lúc đó diện tích của hình chữ nhật thứ i bằng: h.
h
n
i
= n
i
.
Vậy diện tích của tất cả các hình chữ nhật sẽ bằng kích thớc mẫu n.


9

Tơng tự biểu đồ tần suất là 1 hình bậc thang tạo nên bởi nhiều hình
chữ nhật có đáy bằng h, chiều cao bằng
h
f
h
i
, lúc đó diện tích của hình chữ
nhật thứ i bằng:
h
f
h
i

.
= f
i
. Vậy diện tích của toàn bộ hình bậc thang sẽ bằng 1.







1.1.4. Thống kê.
1.1.4.1. Định nghĩa.
Việc tổng hợp mẫu W = (X
1
, X
2
, , X
n
) đợc thực hiện dới dạng 1
hàm nào đó của các giá trị X
1
, X
2
, , X
n
của mẫu đợc gọi là thống kê. Ký
hiệu: G =f(X
1
, X

2
, , X
n
)
1.1.4.2. Một số thống kê đặc trng của mẫu ngẫu nhiên.
1.1.4.2.1. Các thống kê đặc trng xu hớng trung tâm của phân phối của mẫu.
a. Trung bình mẫu (
X
).
W (X
1
, X
2
, , X
n
) là mẫu ngẫu nhiên kích thức n.
Trung bình mẫu là 1 thống kê, là trung bình của các giá trị mẫu:

=
=
n
i
n
X
1
1
X
i
(1)


Khi mẫu ngẫu nhiên nhận giá trị cụ thể w (x
1
, x
2
, , x
n
) thì trung
bình mẫu nhận giá trị cụ thể

=
=
n
i
n
x
1
1
x
i
(2) hoặc

=
=
k
i
n
x
1
1
n

i
x
i
x
1
x
2
x
k

x
f

f
1
f
k
H. 2

a

b

x

f

H. 3






x
1
x
2
x
k

x
n


n
k



n
2

n
1

H. 1

0 0
0




10

Tính chất: Nếu biến ngẫu nhiên gốc có kỳ vọng toán E(X ) =
à
,
Phơng sai V (X ) =

2
thì E (
X
) =
à
(3); V (
X
) =
n
2

(4)
Độ lệch chuẩn
)(XV
=
n


Độ lệch chuẩn này của
X
dùng để phản ánh sai số ớc lợng gọi là sai

số chuẩn Se của trung bình mẫu (
)X
: Se (
)X

n

(5)
b. Trung vị (X
d
).
Trung vị là giá trị nằm chính giữa, tức là giá trị chia các số liệu mẫu
thành 2 phần bằng nhau:
- Nếu số liệu mẫu gồm n giá trị rời rạc đợc sắp xếp theo trình tự tăng dần.
+ n lẻ: trung vị là giá trị thứ
2
1
+
n
trong dãy số liệu.
+ n chẵn: trung vị là 2 giá trị nằm chính giữa của dãy số liệu. Nó đợc
gọi là khoảng trung vị.
- Nếu các số liệu mẫu đợc ghép lớp theo phân phối tần số thì giá trị
trung vị có thể tính gần đúng bởi công thức sau:
X
d
L +
h
n
S

n
d
x







2
(6)
Trong đó: L - Giới hạn dới của lớp chứa trung vị.
n - Kích thớc mẫu.
S - Tổng tần số của các lớp đứng trớc lớp chứa trung vị.
n
d
x
- Tần số của lớp chứa trung vị.
h - Độ dài của lớp chứa trung vị.
Ví dụ 1:
Giả sử có số liệu mẫu: 240, 220, 210, 225, 235, 225, 270, 250, 280.


11

Có n = 9 số liệu nên trung vị là giá trị thứ
5
2
19

=
+
trong dãy số liệu
đợc xếp theo thứ tự tăng dần:
210, 220, 225, 225, 235, 240, 250, 270, 280.

X
d

Giả sử có thêm số liệu 200, tức n = 10, do đó trung vị là 2 giá trị nằm
chính giữa của dãy số liệu:
200, 210, 220, 225, 225, 235, 240, 250, 270, 280.
X
d
= [225 - 235]
Ví dụ 2:
Bảng phân phối thực nghiệm (Bảng 1)
Đoạn giá trị chiều dài h = 5
Tần số n
i
Tần số tích luỹ w
i
5 -10
10 - 15
15 - 20
20 - 25
25 -30
30 - 35
35 -40


4
6
16
36
24
10
4
4
10
26
62
86
96
100
Tổng số

n = 100


Có n/2 =100/ 2 =50 .Vậy trung vị nằm ở lớp thứ 4 căn cứ vào cột tần số
tích luỹ , ta có : X
d
20 +
33,235
36
2650
=







12

c. Môt (X
0
).
Môt là giá trị có tần số lớn nhất trong dy số liệu mẫu.
- Nếu số liệu mẫu là rời rạc, và các giá trị x
1
, x
2
, ,x
k
xuất hiện với tần
số tơng ứng n
1
, n
2
, , n
k
thì có thể xác định trực tiếp giá trị của mốt trên bảng
phân phối tần số của mẫu.
- Nếu các số liệu mẫu là ghép lớp theo bảng phân phối tần số thì:
X
o
L +
h
dd

d








+
21
1
(7)
Trong đó:
L - Giới hạn dới của lớp chứa môt
d
1
- Hiệu số giữa tần số của lớp chứa môt và tần số của lớp đứng trớc.
d
2
- Hiệu số giữa tần số của lớp chứa môt và tần số của lớp đứng sau.
h - Độ dài của lớp chứa môt.
Ví dụ : Từ số liệu bảng 1 tìm giá trị môt :
X
o
20 +
5
1220
20







+
= 23,125
1.1.4.2.2. Các thống kê đặc trng độ phân tán của phân phối của mẫu.
a. Khoảng biến thiên (R).
Khoảng biến thiên là sai lệch giữa giá trị lớn nhất và nhỏ nhất của mẫu.
R = X
max
- X
min
b. Khoảng tứ phân vị.
Nếu mẫu đợc chia thành 4 phần bằng nhau. Tứ phân vị đầu là giá trị
của mẫu đứng ở vị trí cách đơn vị đầu tiên 1/4 số đơn vị của mẫu. Tứ phân vị
thứ hai chính là trung vị. Tứ phân vị thứ ba là giá trị của mẫu đứng ở vị trí
cách đơn vị đầu tiên 3/4 số đơn vị của mẫu.
Nếu các số liệu mẫu đợc ghép lớp thì các tứ phân vị đợc tính:


13

Q
1
= L
1
Q
+

1
1
1
4
Q
Q
Q
h
n
S
n

(8) Q
3
= L
3
Q
+
3
3
3
4
3
Q
Q
Q
h
n
S
n


(9)

Trong đó: L
1
Q
, L
3
Q
- Giới hạn dới của các lớp chứa Q
1
, Q
3
S
1
Q
, S
3
Q
- Tổng các tần số của các lớp đứng trớc lớp chứa Q
1
và Q
3
n
1
Q
, n
3
Q
- Tần số của các lớp chứa Q

1
, Q
3.
h
1
Q
, h
3
Q
- Độ dài của các lớp chứa Q
1
, Q
3
.
Ví dụ 1: Từ dãy số liệu: 200, 210, 220, 225, 225, 235, 240, 250, 270, 280
Ta có : tứ phân vị đầu là giá trị nằm ở vị trí thứ n/4 =10/4 =2,5 .
Do thứ tự vị trí phải là nguyên do đó nó là giá trị nằm ở vị trí thứ 3 tức:
Q
1
=220
Tứ phân vị thứ 3 là giá trị nằm ở vị trí 3n /4 = 3.10/ 4 = 7,5 do đó nó là
giá trị nằm ở vị trí thứ 8 tức Q
3
= 250
Ví dụ 2. Từ số liệu Bảng 1 ta tìm đợc :
Lớp chứa Q
1
là lớp thứ 3 ( 100/4 = 25 ) do đó :
Q
1

= 15+
5
16
1025







= 19,6875.
Lớp chứa Q
3
là lớp thứ 5 (3.100/4 = 75) do đó:
Q
3
= 7083,275.)
24
6275
(25 =

+
Vậy khoảng tứ phân vị (ký hiệu: IQR) là:
IQR = Q
3
- Q
1
= 27, 7083 - 19,6875
c. Tổng bình phơng các sai lệch và độ lệch bình phơng trung bình.

Cho W = (X
1
, ,X
n
)
- Tổng bình phơng các sai lệch giữa các giá trị của mẫu và trung bình
mẫu (ký hiệu TSS):


14

TSS =
(
)
2
1
XX
i
n
i


=
(10)
Nếu đem chia TSS cho kích thớc mẫu ta thu đợc trung bình số học của tổng
bình phơng sai lệch giữa các giá trị của mẫu và trung bình mẫu gọi là độ lệch bình
phơng trung bình, ký hiệu MSS: MSS=
2
1
)(.

1
XX
n
i
n
i


=

d. Phơng sai mẫu S
2
và phơng sai S
*2.

- Phơng sai mẫu (S
2
) đợc xác định:
S
2
=

= =









=

n
i
n
i
ii
XnX
n
XX
n
1
2
1
2
2
1
1
)(.
1
1
(11)
- Phơng sai S
*2
đợc xác định:
S
*2
=


=

n
i
i
X
n
1
2
)(.
1
à
(
à
là trung bình tổng thể) (12)
e. Tần suất mẫu (f).
- Là tỷ số giữa số phần tử mang dấu hiệu nghiên cứu trong mẫu và kích thớc mẫu.
f =
n
X

(13)
- Kỳ vọng toán của tần suất mẫu E(f) = p
Sai số chuẩn của tần suất mẫu: Se(f) =
n
pp
)1(

(13)
Nếu mẫu lấy ra theo phơng pháp không hoàn lại thì sai số chuẩn mẫu:

Se (f) =
n
pp
N
nN )1(
.
1



(14)
Ví dụ: Lấy ngẫu nhiên 100 thanh niên ở một tỉnh đem đo chiều cao và thu đợc số liệu sau:
Chiều cao
154-158

158-162

162-166

166-170

170-174

174-178

178-182

Số thanh niên
có chiều
caotơng ứng


10 14 26 28 12 8 2


15

ở đây dấu hiệu nghiên cứu là chiều cao thanh niên. Để xác định các
thống kê mẫu nh trung bình mẫu, phơng sai mẫu ta lập bảng tính trong đó
các lớp giá trị x
i
đợc thay bằng giá trị giữa của mỗi lớp.
Bảng 2:
x
i
n
i
x
i
n
i
n
i
x
i
2
156 10 1560 243360
160 14 2240 358400
164 26 4264 699296
168 28 4704 790272
172 12 2064 355008

176 8 1408 247808
180 2 360 64800

n
i
= n = 100 n
i
x
i
= 16600 n
i
x
i
2

= 2738944


Vậy
)(166
100
16600
cmX ==
MSS =
44,33166
100
2758944
2
=


S =
812,544,33.
99
100
=

1.1.5. Quy luật phân phối xác suất của một số thống kê đặc trng mẫu.
Vì bản chất của các thống kê đặc trng mẫu là các biến ngẫu nhiên. Do
đó để nắm đợc đầy đủ thông tin về các thống kê này cần khảo sát quy luật
phân phối xác suất của chúng.
Quy luật phân phối xác suất của các thống kê đặc trng mẫu phụ thuộc
chặt chẽ vào quy luật phân phối xác suất của biến ngẫu nhiên gốc X.
1.1.5.1. Biến ngẫu nhiên gốc phân phối theo quy luật chuẩn.
Giả sử dấu hiệu nghiên cứu trong tổng thể xem nh một biến ngẫu
nhiên tuân theo quy luật chuẩn: E(X) =
à
, V(X) =
2
. Các tham số này đã biết
hoặc cha biết. Xét W=(X
1
,X
2
, ,X
n
)


16


Nếu các biến ngẫu nhiên độc lập và cùng phân phối theo quy luật chuẩn
thì mọi tổ hợp tuyến tính của các biến ngẫu nhiên cũng phân phối theo quy
luật chuẩn.
Vậy ta có
X
, S
*2
phân phối theo quy luật chuẩn.
E (
X
) = à , V(
X
) =
n
2

từ đó xây dựng thống kê:
G = U =

àà
nX
XSe
X )(
)(

=


.
Thống kê U phân phối theo quy luật chuẩn hoá N (0,1).


S
*2
=
n
i
n
1
1
=

n
2 *2 2
i i
i 1
(X ) nS (X )
=
à => = à

Xây dựng thống kê:
G =

2
=
2
1
2
1
22
2*

)()(
1

à
à


==

==
i
i
n
i
i
n
i
X
X
nS

Thống kê

2
phân phối theo quy luật "khi bình phơng" với n bậc tự
do:

2
(n).
Xây dựng thống kê: G =


2
=
2
2
)1(

Sn

phân phối theo quy luật "khi
bình phơng" với (n-1) bậc tự do:

2
(n-1).
Xây dựng thống kê:
G = T =
S
nX
n
SnnX
n
U )(
)1(
)1(
:
)(
1
2
2
2

à

à


=


=


Thống kê T phân phối theo quy luật stuđent với n-1 bậc tự do: T(n-1)
1.1.5.2. Biến ngẫu nhiên gốc X phân phối theo quy luật không - một:
Giả sử trong tổng thể, dấu hiệu nghiên cứu có thể xem nh biến ngẫu
nhiên phân phối theo quy luật không- một. Từ tổng thể lập mẫu kích thớc n:
W= (X
1
, X
2
, , X
n
).Khi đó:


17

Tần xuất mẫu f phân phối theo quy luật nhị thức với các tham số đặc
trng:
E(f) = p, V(f) =
n

pp
)1(

(p - Xác suất của tổng thể).
Nếu kích thớc mẫu n lớn, p lại không nhỏ song thoả n>5, và:
n
p
p
p
p


1
1
< 0,3 thì tần suất mẫu phân phối chuẩn với E(f) = p,
V(f) =
n
pp )1(


Do đó biến ngẫu nhiên: U =
f p (f p) n
Se(f )
p(1 p)

=

phân phối xấp xỉ N(0,1).
1.1.6. Suy diễn thống kê.
Nếu đã biết quy luật phân phối xác suất cũng nh các tham số đặc trng

của tổng thể thì có thể sử dụng các kết luận đó để suy đoán về tính chất của
một mẫu ngẫu nhiên rút ra từ tổng thể. Đây chính là việc sử dụng thông tin
của tổng thể để suy đoán về một bộ phận của tổng thể.
1.1.6.1. Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể phân phối chuẩn.
1.1.6.1.1. Suy đoán về giá trị của trung bình mẫu.
Có thống kê U =

à
nX )(
N(0,1).
Vậy với xác suất 1- , tìm đợc các giá trị
1
,
2
:
1
+
2
=

và các giá
trị tới hạn u
1-
1

,u
2


thoả: P [ u

1-
1


< U < u
2

] = 1 -
Vậy ta có: P [
1


à
u
n
<
X
< à +
2


u
n
] = 1 - (15)
1.1.6.1.2. Suy đoán về giá trị của phơng sai mẫu.


2 =
2
2

)1(

Sn




2
(n - 1)
Với xác suất 1 - , tìm đợc cặp giá trị
1
,
2
:
1
+
2
= và các giá
trị tới hạn


)1(2
1
1


n




)1(2
1
2


n
tơng ứng thoả:


18

P [


)1(2
1
1


n
<

2
<


)1(2
2
n
] = 1 -

Thay

2
vào ta có:
P [



)1(2
1
2
1
1



n
n
< S
2
<



)1(2
2
2
1



n
n
] = 1 - (16)
1.1.6.2. Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể phân phối không - một.
Giả sử biến ngẫu nhiên X trong tổng thể phân phối không một với tần
số p.Từ tổng thể rút ra một mẫu kích thớc n.Ta có thống kê: U =
)1(
)(
pp
npf




N (0,1).
Nếu thoả mãn điều kiện n>5 và
n
p
p
p
p



1
1
< 0,3 thì
với
xác suất
1 - , tìm đợc cặp

1
,
2
:
1
+
2
= và giá trị tới hạn
)1(
1


u ,
2

u tơng ứng
thoả:
P [
)1(
1


u
< U <
2

u
] = 1 - .
Thay biểu thức của U vào ta có:
P[p -

1
)1(

u
n
pp
< f < p+
2
)1(

u
n
pp
] = 1 - (17)
Từ đó ta tiến hành các suy đoán đối với f.
1.2. các bài toán cơ bản.

1.2.1.Bài toán 1: Ước lợng các tham số của biến ngẫu nhiên.
Bài toán ớc lợng tham số: cho biến ngẫu nhiên X với quy luật phân
phối xác suất đ biết song cha biết tham số

nào đó của nó. Phải ớc lợng
(xác định một cách gần đúng) giá trị

.
Phơng pháp mẫu cho phép ta giải quyết bài toán này bằng quy nạp
thống kê nh sau: Từ tổng thể nghiên cứu rút ra một mẫu ngẫu nhiên kích
thớc n và dựa vào đó để xây dựng thống kê



dùng để ớc lợng bằng cách
này hay cách khác. Có hai phơng pháp sử dụng


để ớc lợng là phơng
pháp ớc lợng điểm và phơng pháp ớc lợng bằng khoảng tin cậy.


19

1.2.1.1. Phơng pháp ớc lợng điểm.
Phơng pháp ớc lợng điểm là phơng pháp dùng một giá trị để thay
thế cho tham số

cha biết của tổng thể. Thông thờng giá trị đợc chọn là
một thống kê


nào đó của biến ngẫu nhiên.
1.2.1.1.1. Phơng pháp hàm ớc lợng.
1.2.1.1.1.1. Định nghĩa.
Giả sử cần ớc lợng tham số

của biến ngẫu nhiên gốc X. Từ tổng thể
lập mẫu ngẫu nhiên kích thớc n: W = (X
1
, X
2
, ,X
n

)
Lập thống kê


= f(X
1
, X
2
, X
n
) là một thống kê đặc trng mẫu tơng
ứng với tham số

cần ớc lợng.
Ví dụ: Đại lợng

=
=
n
ii
i
X
n
X
1
là ớc lợng điểm của kỳ vọng toán à.
Đạilợng
(
)
2

2
1
1
)(



=
XX
n
XS
i
hoặc
( )

=

2
2
1
)(
à
i
X
n
XS
là ớc
lợng điểm của
2


.
1.2.1.1.1.2. Các tiêu chuẩn lựa chọn hàm ớc lợng.
a. Ước lợng không chệch.
Thống kê


của mẫu đợc gọi là ớc lợng không chệch của tham số


của biến ngẫu nhiên gốc X nếu E(


) =

.
Ngợc lại E(


) thì


gọi là ớc lợng chệch của .
Ta có: - Trung bình mẫu
X
là ớc lợng không chệch của kỳ vọng toán à của
biến ngẫu nhiên gốc [E(
X
) = à]
- Phơng sai mẫu S
2

và phơng sai S
*2
là ớc lợng không chệch của
phơng sai
2
của biến ngẫu nhiên gốc. [E(S
2
)=
2
, E(S
*2
) =
2.
]
- Tần suất mẫu f là ớc lợng không chệch của xác suất p của biến ngẫu
nhiên gốc [E(f) = p].



20

b. Ước lợng hiệu quả.
Thống kê của mẫu đợc gọi là ớc lợng hiệu quả nhất của tham số


của biến ngẫu nhiên gốc X nếu nó là ớc lợng không chệch và có phơng sai
nhỏ nhất so với mọi ớc lợng không chệch khác đợc xây dựng trên cùng
mẫu đó.
Ngời ta sử dụng định lý sau đây để kiểm tra



có phải là có phơng sai
bé nhất hay không?
Định lý Crame-Rao: Cho X là biến ngẫu nhiên liên tục, f(x,

) ,từ biến
ngẫu nhiên X lấy một mẫu (X
1
, X
2
, X
n
), dựng một hàm thống kê


=


(X
1
, X
2
,
X
n
).
V(


)



2
),(ln
1










xf
nE
(18) (BĐT thông tin Crame-Rao).
c. Ước lợng vững.
Ước lợng


đợc gọi là ớc lợng vững của tham số

nếu


> 0 ta luôn

có:


u
lim P
1)

( =<

hay




.
Định lý:


là ớc lợng vững của

nếu:





là ớc lợng không chệch của

(E(


) =


).




n
Lim
V (


) = 0
d. Ước lợng đủ.


đợc gọi là ớc lợng đủ của

nếu nó chứa toàn bộ các thông tin
trong mẫu về tham số

của ớc lợng.



n




xác suất



21

1.2.1.1.1.3. Một vài kết luận.
Tham số cần ớc lợng Hàm ớc lợng

Tính chất
E(X) = à
X

Không chệch, vững
P = P(X) f Không chệch, hiệu quả, vững

2
= V(X)
S
2
(hoặc S
*2
)

Không chệch, không hiệu quả, vững

1.2.1.1.2.Phơng pháp ớc lợng hợp lý tối đa.
Lập mẫu ngẫu nhiên kích thớc n: W = (X
1
, X
2
, ,X

n
) và xây dựng
hàm của đối số

tại 1 giá trị cụ thể của mẫu.
L(x
1
, x
2
, ,x
n
,

) = f (X
1
,

) f(X
2
,

) f(X
n
,

)
Hàm L đợc gọi là hàm hợp lý của tham số

. Giá trị của hàm hợp lý
chính là xác suất hay mật độ xác suất tại điểm (x

1
, x
2
, , x
n
), còn giá trị của
thống kê

tại điểm đó:


= f (x
1
, x
2
, , x
n
) đợc gọi là ớc lợng hợp lý tối đa
của

nếu ứng với giá trị này của

hàm hợp lý đạt cực đại.
* Phơng pháp tìm ớc lợng:
Bớc 1: tìm đạo hàm bậc nhất của ln L theo


Bớc 2: Giải phơng trình:
0
ln

=

d
Ld
(
Giả sử có nghiệm

=


= f (x
1
, x
2
, , x
n
) )
Bớc 3: Tìm đạo hàm bậc hai
2
2
d ln L
d


Nếu tại

=


,

2
2
d ln L
d

< 0 => lnL max =>


=f (x
1
, , x
n
) là ớc lợng
điểm hợp lý tối đa cần tìm.
1.2.1.2. Phơng pháp ớc lợng bằng khoảng tin cậy.
1.2.1.2.1. Định nghĩa.
Khoảng (G
1
, G
2
) của thống kê G đợc gọi là khoảng tin cậy của tham số

nếu với xác suất bằng (1-

) cho trớc thoả mn điều kiện:
P (G
1
<

< G

2
) = 1-

(19) .


22

Xác suất (1-

) đợc gọi là độ tin cậy của ớc lợng, còn I = G
2
G
1

đợc gọi là độ dài khoảng tin cậy.
1.2.1. 2.2. Phơng pháp tìm khoảng tin cậy.
Từ một mẫu (X
1
, X
2
, X
n
) ta cần phải xác định

với độ tin cậy 1 -

cho trớc.
Lấy G = G (X
1

, X
2
X
n
,

)
Tìm một khoảng giá trị (G
1
, G
2
): P (G
1
< G < G
2
) = 1 -
Trên thực tế G
1
, G
2
đợc chọn thoả: P (G < G
1
) =
1

P (G > G
2
) =
2
=> P (G

1
< G < G
2
) = 1 - (
1
+
2
)
Bằng cách biến đổi tơng ứng, ta có: P (

1
<

<

2
) = 1 -
Khoảng (

1
,

2
) tìm đợc là khoảng tin cậy của

.
Yêu cầu:
1
,
2

> 0 ,
1
+
2
=
1.2.1.2.3. Ước lợng kỳ vọng toán.
a. Biến ngẫu nhiên phân phối theo quy luật chuẩn, đ biết phơng sai



2
(N (
à
àà
à
,



2
)).
Chọn thống kê G = U =
n
X
.
)(

à

N(0, 1) (20)

Độ tin cậy 1 - Tìm
1
,
2
:
1
+
2
= Tìm u
1 -

1
, u

2
sao cho:
P(U < u
1 -

1
) =
1
, P(U > u

2
) =
2
.
Từ đó: P(u
1 -


1
< U < u

2
) = 1 - (
1
+
2
) = 1 - .
Vì u

1
= - u
1 -

1
nên: P( - u

1
< U < u

2
) = 1 - . (21)
Thay (20) vào (21), tìm à, ta thu đợc:
P(
n
X



u

2
< à <
n
X

+
u

1
) = 1 - . (22)
Vậy tham số à của biến ngẫu nhiên gốc X nằm trong khoảng:
(
n
X


u

2
,
n
X

+
u

1
)

Trong đó: u

1
, u

2
xác định nh sau: P(U < u

) = 1 - .


23

u

1
:

P (U < u

1
) = 1 -
1
= (u

1
) =
2
1
-

1

u

2
:

P (U < u

2
) = 1 -
2
= (u

2
) =
2
1
-
2
Với (u

) =




u
t
dte

0
2/
.
2
1
2
(Hàm Laplace).
Trên thực tế ngời ta chỉ xét 3 trờng hợp.

1
=
2
=
2/

=>
/ 2 / 2
X u X u
n n


à
< < +
(khoảng tin cậy đối xứng)

1
= 0,
2
= hoặc
1

= ,
2
= 0
=>
+<<
X
n
uX
à


hoặc
n
uXX

à

+<<

Tóm tắt bớc giải:
Bớc 1: Tính
X

Bớc 2: Tìm U

/2
: (U

/2
) =

2
2
1



Bớc 3: Tính
n
U



.
2/
=
(độ chính xác của ớc lợng)
Bớc 4:Trình bày khoảng tin cậy
Ví dụ: Trọng lợng 1 loại sản phẩm là biến ngẫu nhiên phân phối theo quy luật
chuẩn với độ lệch chuẩn là 1 g. Cân thử 25 sản phẩm loại này thu đợc kết quả:
Trọng lợng (g) 18 19 20 21
Số sản phẩm tơng ứng

3 5 15 2

Với độ tin cậy 0,95 hãy tìm khoảng tin cậy đối xứng của trọng lợng
trung bình của loại sản phẩm nói trên.
Bài giải: Gọi X là trọng lợng sản phẩm, theo giả thiết, X phân phối
chuẩn với = 1. Vậy trọng lợng trung bình của sản phẩm chính là tham số à.
Đây là bài toán ớc lợng bằng khoảng tin cậy đối xứng giá trị của tham số à
của phân phối N (à,

2
) khi đã biết phơng sai của nó.


24

Ta có:

=
=
25
1
25
1
i
i
XX
Từ bảng số liệu ta tìm đợc:
64,19
25
21.220.1519.518.3
=
+
+
+
=
X

Với độ tin cậy 1 - = 0,95 thì /2 = 0,025 => u
0,025

= 1,96
áp dụng công thức tìm khoảng tin cậy
/ 2 / 2
X u X u
n n


à
< < +

Kết quả thu đợc cho biết 95% số mẫu kích thớc n = 25
ta tìm đợc
khoảng tin cậy đối xứng của
à
là:
(19,248 < à < 20,032).
b. Biến ngẫu nhiên phân phối theo quy luật chuẩn N (
à
àà
à
,



2
), cha biết
phơng sai




2
, kích thớc mẫu n<30.
Chọn thống kê G = T =
S
nX )(
à

(23) ~ T (n-1)
Khoảng tin cậy đối xứng có dạng:
n
S
tX
n
S
tX
nn 1
2/
1
2/

+<<

à

Bớc giải: Bớc 1: Tính
X
, S.
Bớc 2: Với cho trớc, tra bảng phân phối Student tìm
1
2/


n
t

sao
cho thoả: P (
T

1
2/

n
t

) =
Bớc 3: Tính độ chính xác của ớc lợng:
n
S
t
n 1
2/

=



Bớc 4: Trình bày khoảng tin cậy.
* Khi n 30 thì T U . Khi đó ta coi
1
2/


n
t

U

/2

Ví dụ: Để xác định trọng lợng trung bình của các bao bột trong kho ngời ta đem
cân ngẫu nhiên 15 bao của kho đó và tìm đợc
X
=39,8 kg; S
2
=0,144.Hãy tìm khoảng
tin cậy đối xứng của trọng lợng trung bình của các bao bột trong kho với yêu cầu
độ tin cậy của việc ớc lợng là 99%.Giả thiết trọng lợng đóng bao của các bao
bột là biến ngẫu nhiên phân phối chuẩn.


25

Bài giải: Gọi X là trọng lợng bột đóng bao, theo giả thiết X phân phối
chuẩn.Vậy trọng lợng đóng bao trung bình chính là giá trị
à
.Đây là bài toán
ớc lợng bằng khoảng tin cậy đối xứng giá trị của tham số
à
phân phối
N(
à

,
2

) khi cha biết
2

của X là :
Với độ tin cậy 1-

=0,99 thì
2/

=0,005.Tra bảng phân phối Student
có t
)14(
005,0
=2,977.Qua mẫu cụ thể tính đợc
X
=39,8; S
2
=0,144

S=0,379.
Vậykhoảng tin cậy đối xứng của
à
là: (39,5023 <
à
< 40,0977).
c.Cha biết phân phối của X nhng n




30.
Ta tiến hành ớc lợng nh phân phối chuẩn.
Ví dụ : Để xác định kích thớc trung bình của chi tiết do một máy sản xuất ta
lấy ngẫu nhiên 200 chi tiết để đo kích thớc và thu đợc
X
= 54,83525, S = 0,0164.
Với độ tin cậy 95% hãy ớc lợng bằng khoảng tin cậy đối xứng kích thớc
trung bình của chi tiết do máy đó sản xuất. Giả thiết kích thớc chi tiết là
biến ngẫu nhiên phân phối chuẩn.
Bài giải: Gọi X là kích thớc do máy đó sản xuất theo giả thiết X phân
phối chuẩn.Vậy kích thớc trung bình của chi tiết chính là tham số
à
.Đây là
bài toán ớc lợng khoảng tin cậy đối xứng giá trị của tham số
à
của phân
phối N(
à
,
2

)khi cha biết phơng sai
2

.Vậy khoảng tin cậy của
à
là:
(

X
-
1
2/

n
t
n
S

;
X
+
1
2/

n
t
n
S

);Do n =200>30 nên với 1-

=0,95 thì :
t
1
2/

n


= t
199
025,0

U
025,0
=1,96.
Với độ tin cậy 0,95 qua mẫu cụ thể(n=200) khoảng tin cậy đối xứng của
à
là (54,54,83298 <
à
<54,83752).
1.2.1.2.4. Ước lợng xác suất của biến ngẫu nhiên phân phối theo quy luật không một.
Chọn thống kê: G = U =
)1(
)(
pp
npf


(24) ~ N (0,1)
Với độ tin cậy (1- ) tìm u
1-

/2
, u

/2
: P (U < u
1-


/2
) =
2

, P (U > u

/2
) =
2


×