Tải bản đầy đủ (.pdf) (43 trang)

XÁC SUẤT THỐNG KÊ - PHẦN 2: THỐNG KÊ TOÁN - GV. CHU BÌNH MINH docx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (572.5 KB, 43 trang )

Giảng viên:
Chu Bình Minh
Bài giảng
Xác suất thống kê
Nam Dinh,Februay, 2008
PHN 2
THNG Kấ TON
CHệễNG 4:
TONG THE VAỉ MAU
I. Khái niêm lý thuyết mẫu
Nhiều bài toán trong thực tế dẫn đến nghiên cứu một hay
nhiều dấu hiệu định tính hoặc địnhlượng đặc trưng cho các
phần tử của một tập hợp nào đó.
Chẳng hạn nếu muốn điều tra thu nhập bình quân của
các gia đình ở Hà Nội thì tập hợp cần nghiên cứu là các hộ
gia đình ở Hà Nội, dấu hiệu nghiên cứu là thu nhập của từng
mỗi gia đình.
I. Khái niêm lý thuyết mẫu
Một doanh nghiệp muốn nghiên cứu các khách hàng của
mình về dấu hiệu định tính có thể là mức độ hài lòng của
khách hàng đối với sản phẩm hoặc dịch vụ của doanh
nghiệp, còn dấu hiệu định lượng là số lượng sản phẩm của
doanh nghiệp mà khách hàng có nhu cầu được đáp ứng.
Khi khảo sát một tín hiệu là quá trình ngẫu nhiên người
ta tiến hành lấy mẫu tại những thời điểm nào đó và thu được
các tín hiệu mẫu.
I. Khái niêm lý thuyết mẫu
Để xử lý dấu hiệu cần nghiên cứu đôi khi người ta sử dung
phương pháp nghiên cứu toàn bộ, đó là điều tra toàn bộ các
phần tử của tập hợp theo dấu hiệu cần nghiên cứu để rút ra
các kết luận cần thiết. Tuy nhiên trong thực tế việc áp dụng


phương pháp này gặp phải những khó khăn sau:
- Do qui mô của tập hợp cần nghiên cứu quá lớn nên việc
nghiên cứu toàn bộ sẽ đòi hỏi nhiều chi phí về vật chất và
thời gian, có thể không kiểm soát được dẫn đến bị chồng
chéo hoặc bỏ sót.

I. Khái niêm lý thuyết mẫu
- Trong nhiều trường hợp không thể nắm được toàn bộ các
phần tử của tập hợp cần nghiên cứu, do đó không thể tiến
hành toàn bộ được.
- Có thể trong quá trình điều tra sẽ phá hủy đối tượng
nghiên cứu …
Vì thế trong thực tế phương pháp nghiên cứu toàn bộ
thường chỉ áp dụng đối với các tập hợp có qui mô nhỏ, còn
chủ yếu người ta sử dụng phương pháp không toàn bộ mà
đặc biệt là phương pháp nghiên cứu chọn mẫu.
II. Tổng thể.
Toàn bộ các phần tử đồng nhất theo một dấu hiệu
nghiên cứu định tính hay định lượng nào đó là một tổng
thể. Số lượng phần tử của tổng thể gọi là kích thước của
tổng thể.
Dấu hiệu nghiên cứu của tổng thể được mô tả bằng
biến ngẫu nhiên X gọi là biến ngẫu nhiên gốc. Do đó, ta
có thể áp dung các công thức xác suất để áp dụng vào
việc nghiên cứu tổng thể.
II. Tổng thể.
Ví dụ 1
Nghiên cứu thời gian tự học của sinh viên một trường đại
học thì tổng thể là toàn bộ các sinh viên của trường này. Do
trường đại học này có 5000 sinh viên nên tổng thể có kích

thước 5000.
Dấu hiệu nghiên cứu là thời gian tự học trong ngày của mỗi
sinh viên trường này (Dấu hiệu nghiên cứu định lượng).
II. Tổng thể.
Ta có thể mô hình hóa dấu hiệu nghiên cứu bằng cách.
Chọn ngẫu nhiên 1 sinh viên của trường và gọi X là thời
gian tự học của sinh viên này, X gọi là biến ngẫu nhiên
gốc. Do vậy thay vì nghiên cứu thời gian tự học trong
ngày của mỗi sinh viên ta sẽ sử dung các kiến thức về
xác suất nghiên cứu biến ngẫu nhiên gốc X ví dụ như
muốn biết thời gian tự học trung bình trong ngày của
mỗi sinh viên ta cần tìm EX (trung bình tổng thể), cần
biết tỉ lệ sinh viên có thời gian tự học trong ngày lớn hơn
5 giờ ta cần tìm P(X>5), …
II. Tổng thể.
Ví dụ 2
Nghiên cứu tỉ lệ khách hàng không hài lòng với sản phẩm A thì
tổng thể là toàn bộ khách hàng dùng sản phẩn A. Trường hợp
này thường khó xác định được kích thước chính xác của tổng
thể.
Dấu hiệu nghiên cứu ở đây là mỗi khách hàng dùng sản phẩm
A có hài lòng hay không (dấu hiệu nghiên cứu định tính). Ta
mô hình hóa dấu hiệu trên bằng cách chọn ngẫu nhiên 1 khách
hàng dùng sản phẩm A và gọi X là số khách hàng không hài
lòng chọn được. X chỉ nhận hai giá trị 0 và 1 và (X=1) chính là
biến cố chọn được khách hàng không hài lòng nên P(X=1) = p
là tỉ lệ khách không hài lòng với sản phẩm A. Vậy biến ngẫu
nhiên X có quy luật A(p).
III. Mẫu ngẫu nhiên.
Ta gọi một mẫu là ngẫu nhiên nếu trong phép lấy mẫu đó

mỗi phần tử được chọn một cách độc lập và có xac suất như
nhau. Do đó tá khái niệm:
III. Mẫu ngẫu nhiên.
Định nghĩa:
Mẫu ngẫu nhiên kích thước n là tập hợp gồm n biến ngẫu
nhiên độc lập 
1
, 
2
, , 

được thành lập từ biến ngẫu
nhiên gốc X trong tổng thể và có cùng quy luật phân phối
xác suất với X.
Ký hiệu:
= (
1
, 
2
, , 

)
Tức là các biến ngẫu nhiên 
1
, 
2
, , 

độc lập và 


~
III. Mẫu ngẫu nhiên.
Khi 

nhận giá trị cụ thể 

thì ta có mẫu cụ thể:
= (
1
, 
2
, , 

)
Để mô tả số liệu của một mẫu cụ thể ta thường sử dụng:
+ Bảng phân bố tần số:




1


2










1


2





Với 

là tần số xuất hiện của 

trong mẫu.
+ Bảng phân bố tần suất:




1


2










1


2





Với 

là tần suất xuất hiện của 

trong mẫu.

III. Mẫu ngẫu nhiên.
Ví dụ 1
Từ tập hợp các sinh viên của trường chọn ngẫu nhiên 100
sinh viên và gọi:

1
là thời gian tự học trong ngày của sinh viên chọn lần 1.
Hiển nhiên 
1
~.


2
là thời gian tự học trong ngày của sinh viên chọn lần 2.
Hiển nhiên 
2
~ và 
1
, 
2
độc lập.


100
là thời gian tự học trong ngày của sinh viên chọn lần
100. Hiển nhiên 
100
~ và 
1
, 
2
, , 
100
độc lập.
III. Mẫu ngẫu nhiên.
Khi đó một bộ gồm 100 biến ngẫu nhiên độc lập và có cùng
quy luật phân phối với biến ngẫu nhiên gốc X :
= (
1
, 
2

, , 
100
)
Gọi là mẫu ngẫu nhiên kích thước 100.
Giả sử trong trường hợp chọn cụ thể ta được:
Lần 1 chọn được sinh viên tự học 2 giờ/1 ngày nên 
1
= 2
Lần 2 chọn được sinh viên tự học 6 giờ/1 ngày nên 
2
= 6

Lần 100 chọn được sinh viên tự học 5 giờ/1 ngày nên

100
= 5
III. Mẫu ngẫu nhiên.
Khi đó ta có một mẫu cụ thể
= (2; 6; ; 5)
Do khi liệt kê 100 phần tử trên một hàng gây cảm giác giắc
rối mà ta lại nhận thấy nhiều phần tử trên hàng đó có giá trị
bằng nhau (chẳng hạn có 10 phần tử bằng 2, 15 phần tử
bằng 6,… 5 phần tử bằng 5) ta có thể biểu diễn mẫu cụ thể
trên dạng:



2
6


5



10
15

5
Thì bảng trên gọi là bản phân phối tần số của mẫu.
Hoặc ta có thể lập bảng phân phối tần suất của mẫu với


=







2
6

5



10/100
15/100


5/100

III. Mẫu ngẫu nhiên.
Ví dụ 2
Do không xác định được toàn bộ các khách hàng nên công
ti sẽ không thể hỏi ý kiến của toàn bộ khách hàng về sản
phẩm A được nên công ti tiến hành thăm dò bằng cách hỏi
ý kiến của 50 khách hàng dùng sản phẩn A (Ngay cả khi
xác định được nhưng do số lượng quá nhiều cũng làm như
trên) và gọi:

1
là là số khách hàng không hài lòng chọn được lần 1 nên

1
~( )

2
là là số khách hàng không hài lòng chọn được lần 2 nên

2
~( ) và 
1
, 
2
độc lập
III. Mẫu ngẫu nhiên.


50

là là số khách hàng không hài lòng chọn được lần 50
nên 
50
~() và 
1
, 
2
, , 
50
độc lập
Khi đó một bộ gồm 50 biến ngẫu nhiên độc lập và có cùng
quy luật phân phối A(p) với biến ngẫu nhiên gốc X :
= (
1
, 
2
, , 
50
)
Là một mẫu ngẫu nhiên kích thước 50.
III. Mẫu ngẫu nhiên.
Giả sử trong trường hợp chọn cụ thể ta được:
Lần 1 chọn được khách hàng hài lòng với sản phẩm A nên

1
= 0
Lần 2 chọn được khách không hàng hài lòng với sản phẩm
A nên 
2
= 1


Lần 50 chọn được khách không hàng hài lòng với sản
phẩm A nên 
50
= 1
III. Mẫu ngẫu nhiên.
Khi đó ta có một mẫu cụ thể
= (0; 1; ; 1)
Giả sử trong mẫu có 5phần tử bằng 1. Khi đó ta có bảng
phân phối tần số của mẫu



0
1



45
5
=
5
50
gọi là tỉ lệ mẫu
III. Mẫu ngẫu nhiên.
Mẫu có thể cho dưới dạng khoảng



(

1
; 
1
)
(
2
; 
2
)

(

; 

)




1


2





Co thể chuyển về dạng điểm bằng cách đơn giản là đặt:



=


+ 
1
2

Ta có:




1


2









1


2







IV. Thống kê.
1. Khái niệm
Cho mẫu = (
1
, 
2
, , 

) , thống kê G là việc tổng
hợp mẫu đã cho dưới dạng môt hàm nào đó theo các biến

1
, 
2
, , 

. Tức là
= (
1
, 
2
, , 

)

Sau đây là một số thống kê quan trọng
IV. Thống kê.
2. Trung bình mẫu


=
1





=1

Ta có: 

= 



= 

3. Phương sai mẫu


2
=
1



(



)
2

=1
=
1




2

=1
(

)
2

Ta có: 

2
=
1


IV. Thống kê.

4. Phương sai mẫu hiệu chỉnh

2
=
1
1

(



)
2

=1
=
1
1



2

=1


1
(

)

2

Ta có: 
2
= 
IV. Thống kê.
Chú ý: Khi mẫu cụ thể cho dưới dạng tần số ta có thể rút
gọn:
=
1







=1


2
=
1






2


=1
()
2


2
=
1
1





2

=1


1
()
2

×