Tải bản đầy đủ (.pdf) (20 trang)

Giáo trình Lý thuyết xác suất và thống kê toán: Phần 2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.18 MB, 20 trang )

<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>

<i>íỳiáty trinh Lị thuyết </i> <i>xúc tuất ồ tỊỊúutạ kê tốn </i>


C h ư ơ n g 5


H À M C Á C Đ<i>Ạ</i>I L Ư ỢN G N G <i>Ẫ</i> U N H I Ê N


V À L U Ậ T S Ố L <i>Ớ</i> N


I- Hàm của các đại lượng ngẫu nhiên


Trong thực t ế , ta thường gặp trường hợp một đạ i lượng ngẫu
nhiên là h à m số của một hay n h i ề u đạ i lượng ngẫu nhiên k h á c . K h i
đó n ế u b i ế t được qui luật phân„phối xác suất của các đố i số thì ta có
thể tìm được qui luật phân phối xác suất của c á c h à m số tương ứng.
Ì- Qui luật phân phối xác suất của hàm một đại lượng ngẫu


n h i ê n


N ế u v ớ i mỗi giá trị có thể GỊ của đạ i lượng ngẫu nhiên X , qua
h à m f ( X ) , ta xác định được một giá trị của đạ i lượng ngẫu n h i ê n Y
thì Y được g ọ i là h à m của đạ i lượng ngẫu nhiên X :


Y = f(X)


<i>a- Trường, hợp X là đại lượng ngẫu nhiên rời rạc và ứng với các giá </i>
<i>trị khác nhau của X ía có các giá trị khác nhau của Y </i>
Trường hợp này, ứng với mỗi giá trị có thể nhận của X ta chỉ có
một giá trị có thể nhận của Y , tức:


(X=xi) = [Y=f(xi) = yi] (Vi)



Suy ra:


' P(X= Xi) = P(Y= yo ( V i )


</div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2>

<i>ŨhưỞ4UỊ. 5: Jốàni của eáe. đại lượng, ngẫu nhiên oà. luật IJỐ lởn. </i>
<i>Thí dụ ỉ: Đ</i>ạ i lượng ngẫu n h i ê n X có bang p h â n phối x á c suất n h ư
sau:


X 2 3 4


p 0,3 0,5 0,2


2
T ì m qui luật p h â n p h ố i x á c suất của Y = X
<i>Giải: Các giá trị mà Y có thể nhận là: </i>


yi = 22 = 4; y2 = 32 = 9; y3 = 42 = 16


P(X= 2) = P(Y= 4) = 0,3; P(X= 3) = P(Y= 9) = 0,5;
P(X= 4) = P(<i>Ỷ</i>= 16) = 0,2;


Vậy phân phối xác suất của Y như sau:


Y 4 9 16


p 0,3 0,5 0,2


<i>b- Nếu tương ứng với hai (hay nhiều hơn 2) giá trị của X ta có một </i>
<i>giá trị của Y </i>



Chẳng hạn ứng với 2 giá trị có t h ể nhận của X ta chỉ có m ộ t giá trị
có t h ể nhận của Y, tức:


(Y=yk) = (X=xt)u(X=Xj)


Do các biến cố (X= Xt) và (X= Xj) xung khắc, áp dụng công thức
cộng x á c suất ta có:


P(Y=yk) = P(X= xt) + P(X=Xj)


</div>
<span class='text_page_counter'>(3)</span><div class='page_container' data-page=3>

<i>éịiáữ trình bị tluiụẾt xịe, mủi tui thống, kè tốn </i>


X - 2 1 2


p 0,1 0,4 0,5


T i m qui luật p h â n phối x á c suất của Y = X
<i>Giải: Ta có: </i>


khi X = - 2 thì Y = ( - 2 )2 = 4; khi x = Ì thì Y = Ì2 = Ì;


K h i X = 2 thì Y = 4 ;
N h ư vậy:


( Y = 4 ) = [ ( X = - 2 ) U ( X = 2 ) ]
Do đó:


P ( \ = 4) = P(X= - 2 ) + P(X= 2) = 0,6
Và: P(Y= 1) = P(X= ì) = 0,4



V ậ y qui luật p h â n phối x á c suất của Y như sau:


Y 1 4


p 0,4 0,6


<i>c- Trường hợp X tò đại lượng ngẫu nhiên liên tục </i>


Giả sử đạ i lượng ngẫu n h i ê n X liên tục v ớ i h à m mật độ x á c suất
f(x) đã b i ế t và Y la ham số của X : Y = f ( X )


Có thể chứng minh được rằng: Nếu Y = f(X) là hàm khả vi, đơn


đ iệ u tăng hoặc đơn đ iệ u g i ả m , có h à m ngược là X = *F(y) thì hàm
mật độ x á c suất (p(y) của đạ i lượng ngẫu nhiên Y được x á c định
bằng b i ể u thức:


9(y) = f [vĩ ' ( y ) ] | T ' ( y ) |


</div>
<span class='text_page_counter'>(4)</span><div class='page_container' data-page=4>

<i>thường. 5: Vỗàm cùa các đại lưựnạ ngẫu nhiên oà luật iế lán </i>
N ế u ứng v ớ i mỗi cặp giá trị có thể nhận của hai đạ i lượng ngẫu
nhiêri X và z có một giá trị có thể nhận của đạ i lượng ngẫu n h i ê n Y
thì Y được g ọ i là h à m của 2 đạ i lượng ngẫu nhiên X và z


Y = q>(X, Z)


Nếu biết được qui luật phân phối xác suất của X và z, ta có


t h ể t ì m đ ượ c q u i l u ậ t p h â n p h ố i x á c suất của Y = (p(X, Z)
Để tìm các giá trị mà Y có thể nhận và tính các xác suất tương ứng



của Y n g ườ i ta thường t i ế n h à n h lập bảng, Để b i ế t c á c h lập bảng n à y
la x é t m ộ t thí dụ sau đ â y :


<i>Thí dạ: Có 2 máy cùng sản suất một loại sản phẩm, tỷ lệ sản phẩm </i>


l o ạ i A của m á y thứ nhất là 0,8; của m á y thứ hai là 0, 7; L ấ y 3 sản
p hẩm do m á y thứ nhất sản xuất và Ì sản p hẩm do m á y thứ hai sản
xuất để k i ể m tra. T i m quy luật p h â n phối x á c suất của số sản p hẩm
l o ạ i A có trong 4 sản phẩm l ấ y ra từ hai m á y để k i ể m tra ?


<i>Giải: Gọi X là số sản phẩm loại A có trong 3 sản phẩm lấy ra từ máy </i>


thứ nhất để k i ể m tra. Dễ thấy rằng X ~ B(3; 0,8). N ê n ta dễ d à n g tìm
được bảng p h â n phối x á c suất của X như sau:


X 0 1 2 3


p 0,008 0,096 0,384 0,512


G ọ i z là số sản phẩm l o ạ i A có trong Ì sản p hẩm l ấ y ra từ m á y t h ứ
hai để k i ể m tra z ~ B ( l ; 0,7). Bảng p h â n p h ố i x á c suất của z n h ư
sau:


z 0 1


p 0,3 0,7


G ọ i Y là số sán phẩm l o ạ i A có ư ơ n g 4 sản phẩm l ấ y ra từ hai m á y
để k i ể m ư a thì:



</div>
<span class='text_page_counter'>(5)</span><div class='page_container' data-page=5>

<i>íịiáo trình, lý. thuyết </i> <i>xịe, mất ồ. thống, kẻ tốn </i> <i>ì </i>
tức Y là h à m của hai đạ i lượng ngẫu n h i ê n X và z.


Để tìm qui luật phân phối xác suất của Y, trước hết ta tìm các giá
trị mà Y có t h ể nhận. M u ố n v ậ y ta lập bảng n h ư sau:


0 1 2 3


z \


0 0 1 2 3


1 1 2 3 4


Trong bảng trên dòng X ta ghi c á c giá trị mà X có thể nhận. (trong
thí dụ ta đ a n g xét, X có thể nhận c á c giá trị 0, Ì, 2, 3)


Cột z ghi cạc giá trị mà z có thể nhận. Trong thí dụ này, z'chỉ có
thể nhận một trong hai giá trị: 0 hoặc 1;


Các ơ cịn lại ta ghi các giá trị mà Y có thể nhận. Để xác định các


giá trị n à y ta c ă n cứ v à o b i ể u thức của h à m b i ể u đ iể n m ố i quan hệ
giữa Y v ớ i X và z , trong thí dụ ta đ a n g x é t b i ể u thức h à m n à y có
dạng: Y = X + z , đồng thời c ă n cứ v à o giá trị của X và z ở cột và
dòng tương ứng.


Chẳng hạn: Y nhận giá trị 0 khi X = 0 đồng thời z = 0;



Y = l khi x = 0 đồng thời z = Ì hoặc X = Ì đồng thời z = 0
(tương ứng v ớ i hai ừường hợp này trên bảng có hai ơ ghi số 1)


Vậy các giá trị mà Y có thể nhận là: 0, Ì, 2, 3, 4.


Ta có thể biểu diễn việc phân tích ề Xiên dưới dạng tổng và tích các
b i ế n cố như sau:


( Y = 0) = [ ( X = 0)(Z = 0)]


</div>
<span class='text_page_counter'>(6)</span><div class='page_container' data-page=6>

<i>(Phương. 5: 7Càm eủa eáe đại /ưựttạ ngẫu nhiên g ã luật tố lởn </i>
( Y = 3) = [(X = 2)(Z = 1)] u Ĩ ( X = 3)(Z = 0)]


( Y = 4 ) = [ ( X = 3 ) ( Z = 1 ) ]


Á p dụng công thức cộng x á c suất và công thức nhân xác suất, ta tính
c á c x á c suất tương ứng v ớ i các giá trị của Y như sau:


P(Y = 0) = P(X = 0).P(Z = 0) = 0,08. 0,3 = 0,0024
• P(Y = 1) = P(X = 0).P(Z = 1) + P(X = 1).P(Z = 0)


= 0,008. 0,7 + 0,096. 0,3 = 0,0344
P(Y = 2) = P(X = 2).P(Z = 0) + P(X = 1).P(Z = 1)


= 0,384. 0,3 + 0,096. 0,7 = 0,1824
P(Y = 3) = P(X = 2).P(Z = 1) + P(X = 3).P(Z = 0)


= 0,384. 0,7 + 0,512. 0,3 = 0,4224


P(Y = 4) = P(X = 3).P(Z = 1) = 0,512. 0,7 = 0,3584



V ậ y ta có qui luật p h â n p h ố i x á c suất của Y như sau:


Y 0 1 '-. 2 3 4


p 0,0024 0,0344 0,1824 0,4224 0,3584


• Trường hợp X, z là các đại lượng ngẫu nhiên liên tục


C ó t h ể chứng (ninh được rằng: h à m mật độ x á c suất (p(y) của Y
(Y = X + Z) được x á c định theo công thức:


<i>y ' y </i>
cp(y)= J f1( x ) fỉ( y - x ) d x Hoặc: Ịf, (y - z ) f2 (z)dz


</div>
<span class='text_page_counter'>(7)</span><div class='page_container' data-page=7>

<i>íịiá& trịnh dị t/uiụết xác xuất MÌ thống, kê tốn </i>


3- C á c t h a m s ố đặc t r ư n g c ủ a h à m c á c đạ i l ượ n g n g ẫ u n h i ê n
Giả sử đạ i lượng ngẫu nhiên r ờ i rạc X có p h â n phối x á c suất như
sau:


X Xi x2


p <sub>P' </sub> <sub>P2 </sub> Pn


Ta cần tìm kỳ vọng tốn và .phương sai của đạ i lượng ngẫu nhiên Y
[Y = (p(X)]. C á c tham số đặc trưng này được xác định bằng c á c công
thức sau:


E(Y) = E[(p(X)]=ịọ(xi)pi



Var(Y) = Var[<p(X)] = £<p2(x,)Pl -[E(Y)]2


i = l


* Nêu X là đại lượng ngẫu nhiên liên tục với hàm mật độ xác suất là


f(x) thì kỳ vọng toán và phương sai của đạ i lượng ngẫu nhiên
Y = (p(X) được xác định bằng cơng thức:


•KO


E(Y) = E [ Ọ ( X ) ] = J(p(x)f(x)dx
-co


+00


V a r ( Y ) = Var[(p(X)] = J(p2 ( x ) f ( x ) d x - [ E ( Y ) ]2


-00


li- Luật số lớn


Như ta đã thấy ở các phần trước, không thể dự đoán trước một cách


</div>
<span class='text_page_counter'>(8)</span><div class='page_container' data-page=8>

<i>thường. 5: 7õàtii của các đại lường. Iiạẫii nhiều oà luật tá' lân </i>
xét đồng thời một số lớn các đại lượng ngẫu nhiên thì tính "ngẫu


n h i ê n " của h i ệ n tượng mất đi và qui luật tất nhiên của nó được thể
h i ệ n .



Đối với thực tiễn thì điều quan trọng là phải xác định các điều


k i ệ n trong đó tác động đồng thời của n h i ề u n g u y ê n nhàn niiẫn nhiên
sẽ dẫn đế n k ế t quả gần như khơng phụ thuộc gì vào các y ế u tô ngẫu
n h i ê n nữa và khi đó ta có thể dự đốn được t i ế n ưình của h i ệ n
tượng. C á c đ iề u k i ệ n n à y được chỉ ra trong các định lý có tên là luật
số lớn. Định lý Chebyshev là định lý tổng quát nhấí của luật số lớn,
c ò n định lý Bernoulli là định lý đơn giằn nhất.


Để chứng minh' các định lý này ta sử dụng bất đẳng thức
Chebyshev.


Ì- Bất đẳng thức Chebyshev


C ó t h ể chứng minh được rằng: N ế u X là đạ i lượng ngẫu nhiên có
kỳ vọng tốn và phương sai hữu hạn thì v ớ i m ọ i số dương s bé tùy ý,
ta đề u c ó :


V a r ( X )
P ( | X E ( X ) 1 < £ ) > 1


-E2


B ấ t dẳng thức Chebyshev còn được b i ể u d iễn dưới dạng k h á c như
sau:


V a r ( X )
P ( | X - E ( X ) ị > 8 ) <



s2


</div>
<span class='text_page_counter'>(9)</span><div class='page_container' data-page=9>

<i>íịiấ trình lự thuyết xịe. Mất OĂ tkếttạ kẻ tôn </i>


<i>Thí dụ: Thu nhập trung bình của c á c hộ gia đình ở một vùng là 900 </i>
U S D / n ă m và độ lệch chuẩn là 120 USD. H ã y x á c định khoảng thu
nhập xung quanh giá trị trung bình của ít nhất 95% hộ gia đình ơ
vùng đó.


<i>Giải: Gọi X là thu nhập của một hơ gia đình ở vùng này thì X là đại </i>


lượng ngẫu nhiên với qui luật p h â n phối chưa b i ế t , nhưng E(X) = 900
và ax = 120.'Do đó theo bất đẳng thức Chebyshev, ta có:


p(jx-E(X)|.<e)>l-^^ y


6
. ì


. = > P ( ị x - 9 0 0 | < e ) > l - ^ y - = 0,95
£


Từ đó ta tìm được s = 536,656


Vậy ít nhất 95% hộ gia đình ở vùng đó có thu nhập hàng năm nằm


trong khoảng (900 - 536,656; 90Ọ + 536,656) tức thu nhập của các
hộ gia đình trong khoảng (363,344;• 1436,656) U S D / n ă m .


2- Định lý Chebyshev



Nếu các đại lượng ngẫu nhiên X[, X2 , xn độc lập từng đôi,


có kỳ vọng tốn hữu hạn và các phương sai đề u bị chặn trên b ở i
hằng số c [Var(Xị) < c ; V i = thì Ve > 0 b é tùy ý cho trước ta
ln có:


Lim P(|-ẳXi-lẳE(Xi)|<6) = l


<i>li t i n t i </i>
Ị n


</div>
<span class='text_page_counter'>(10)</span><div class='page_container' data-page=10>

<i>@hưư4iạ 5: Jơàm của ốn đại tường, ngẫu nhiều oà luật- úi lứt Ị </i>


E ( X ) = E


Ị n \ Ị n
<i>\ n t í ) n t í </i>


Ì X2- 1 T2


<i>-yntỉ ) n i</i>= l


Var( X ) = Var


Áp dụng bất đẳng thức Chebyshev cho đại lượng ngẫu nhiên X ta
có:


, , V a r ( X ) , X V a r ( X i )



< £ ) > ! - - ^ 7 ^ = 1 - — Ì ;
P ( | X - E ( X ) |


n2. e2


Theo giả t h i ế t : Var(Xị) < c (V i = 1,«). Do đó, trong b i ể u thức trên,
n ế u ta thay mỗi Var(Xi) ( i = 1,«) bằng c thì bất đẳng thức sẽ chỉ
mạnh t h ê m .


P ( | X - E ( X ) | < s ) * l - - ~ 5 - = l - - £ r


n .e n.e
L ấ y g i ớ i hạn cả hai v ế k h i n - » 00 ta có:


- 4 c


L i m P ( l X - E ( X ) I < e ) > L i m ( l - -—J) = Ì
n-»oo .n-»« n_g


Ta chú ý rằng, x á c suất của b i ế n c ố khơng thể lớn hơn 1. Do đ ó :
L i m P | x - E ( X ) | < e ) = l


Đó là điều cầaphải chứng minh.


• Trường hợp riêng của định lý Chebyshev


N ế u X i , X2, . . . , xn là c á c đạ i lượng ngẫu nhiên độc lập từng đơi,


có c ù n ể kỳ vọng toán, [E(Xị) = a ( V i = Ị, H ) ] thì Ve > 0 b é tùy ý
ta-ln c ó :



</div>
<span class='text_page_counter'>(11)</span><div class='page_container' data-page=11>

L i m P
n—>00


ì JQ_


ni*' < 6 = 1


• Bản chất của định lý Chebyshev


I •!.!•; r i u In vhcv Jã chứng tỏ sự ổn định của ư u n g bình số học
của một số lớn các đạ i lượng ngẫu nhiên xung quanh trung bình số
học các kỳ vọng tốn của các đạ i lượng ngẫu nhiên ấy.


Như vậy, mặc dù từng đạ i lượng ngẫu nhiên độc lập có thể nhận


giá trị sai khác n h i ề u so với kỳ vọng toán của chúng, nhưng trung
bình sù học của một số lớn c á c đạ i lượng ngẫu nhiên l ạ i nhận giá trị
gần bằng trung bình số học của các kỳ vọng tốn của chúng v ớ i xác
suất rất lớn'. Đ iề u đó cho p h é p dự đ o á n giá trị giá trị trung bình số
học của đạ i lượng ngẫu nhiên.


Trong thực tế, định lý Chebyshev được ứng dụng rộng rãi trong


n h i ề u lĩnh vực. Chẳng hạn, trường hợp r i ê n g của nó là cơ sở cho
phương p h á p đo lường trong vật lý. N h ư chúng ta đề u b i ế t , để xác
định một đạ i lượng n à o đ ó , người ta thường t i ế n h à n h đo n h i ề u lần
và l ấ y ừung bình số học của c á c k ế t quả đo ấy l à m giá trị thực của
đạ i lượng cần đo.



Thật vậy: ta có thể coi kết quả của n lần đo là các đại lượng ngẫu


nhiên Xị, X2, . . . , Xn. C á c đạ i lương n à y độc l ậ p từng đôi, có cùng


kỳ vọng tốn (kỳ vọng tốn của c ác đạ i lượng ngẫu nhiên n à y chính
là giá trị thực của đạ i lượng cần đo) và phương sai của chúng đề u bị
chặn trên bởi chính độ chính x á c của t h i ế t bị dùng để đo. Vì t h ế
theo trường hợp riêng của định lý Chebyshev thì trung bình số học
của các k ế t quả đo sẽ sai lệeh rất ít so với giá trị thực của đạ i lượng
cần đo và điề u đó xảy ra v ớ i x á c suất gần bằng 1.


Định lý Chebyshev còn là cơ sở cho một phương pháp được áp


dụng rộng rãi trong thống kê là phương p h á p mẫu mà thực chất là


</div>
<span class='text_page_counter'>(12)</span><div class='page_container' data-page=12>

<i>(?ilười UI 5: JCtưn cua ếe đai Ixíđ4iạ ngẫu nhiên oà Lưu lơ lởn </i>
dựa v à o một mẫu khá nhỏ ta có thể k ế t luận v ề toàn bộ tập hợp các
đố i tượng cần nghiên cứu.


Chẳng hạn để đánh giá năng suất cây trồng ở một vùng nào đó


người ta k h ơ n g cần phải điề u tra t o à n bộ diện tích trồng l o ạ i cây này
mà chỉ cần dựa v à o k ế t quả thu hoa ch cửa một mẫu mà v ẫ n đưa ra
được các k ế t luận đủ chính x á c v ề năng suất cây trồng của vùng đó.


3- Định lý Bernoulỉi


Nếu Fn là tần suất xuất hiện biến cố A trong n phép thử độc lập và


p là x á c suất xuất h i ệ n b i ế n c ố trong mỗi p h é p thử đó thì v ớ i m ọ i e


dương b é tùy ý, ta ln ln có:


Lim p(| Fn - p I < E) = Ì


<i>Chứng minh: Gọi X là số lần xuất hiện biến cô A trong n phép thử </i>


độc lập. X i (ỉ = ỉ,n) là số l ầ n xuất hiện b i ế n cố A trong p h é p thử thứ
I I >0 thú > M ne X j có p h â n phối xác suất như sau:


Xi 0 1


p <sub>q p </sub>


Trong dỏ.


q = Ì - p , Tri thấy: X li
i = l


V i=l
.2


<i>iu \ n </i>


£ x i = £ E ( X , ) = n p


<i>) i=i </i>
E(Xi) = o.q + l.p = p => E(X) = E


Var(Xị) = E( X?) - [E(Xi)]2 = p - p2 = p(l - p) = p.q



<i>í</i> n ^ "


=> Var(X) = Var X x . = L V a r ( X . ) = 'nP(l


</div>
<span class='text_page_counter'>(13)</span><div class='page_container' data-page=13>

<i>íịiáữ trình tụ. thuyết xịe, mất oà. tháng, kê tơón </i>


X é t đạ i lượng ngẫu nhiên Fn = — . Ta thấy Fn chính là tần suất


n


xuất h i ệ n b i ế n c ố A ương n p h é p thử độc l ậ p . '


E Í Fn) = E


X Ì Ì


- = - E ( X ) = - n . p = p
v n j n n


Var(Fn) = Var 1 V a r ( X ) = ^ U H


n n n


Á p đụng bất đẳng thức Chebyshcv cho đai lưrtng ngẫu n h i ê n Fn ta


có:


P ( | F n- p | < e ) > l - - £ ị


n.£^


L ấ y giới hạn cả 2 v ế k h i n - > 00 ta c ó :


L i m P ( | Fn- p | < s ) > L i m ( Ì - ^ 4 ) = Ì


<i>ne </i>
Mặt khác, vì xác suất k h ơ n g thể lớn hơn Ì, do đó:
Lim P(| fn - p| < e) = Ì


* Ý nghĩa:


</div>
<span class='text_page_counter'>(14)</span><div class='page_container' data-page=14>

<i>&uứfrtạ ó: Mẫu ngẫu nhiên </i>


P h ầ n 2


T H Ô N G K Ê T O Á N


Thống kê tốn là bộ mơn tốn học nghiên cứu qui luật của các hiện


tượng ngẫu n h i ê n có tính chất số lớn trên cơ sở thu thập và xử lý c á c
số l i ệ u thống k ê - các k ế t quả quan sát. Như vậy nội dung chủ y ế u
của thống kê toán là x â y dựng các phương p h á p thu thập và xử lý
c á c số1 l i ệ u thống k ê nhằm rút ra các k ế t luận khoa học. C á c phương


p h á p thống k ê tốn là cơng cụ để giải quyết n h i ề u vấn đề khoa học
và thực t iễn nảy sinh trong c á c lĩnh vực khác nhau của tự nhiên và
kinh t ế xã h ộ i .


C h ư ơ n g 5: M <i>Ẫ</i> U N G <i>Ẫ</i> U N H I Ê t y


I- Tổng thể


Ì- Kh4i niệm


</div>
<span class='text_page_counter'>(15)</span><div class='page_container' data-page=15>

<i>QiáA trình bị ưuujẤ't xác uiất nả thấtig. kê tốn </i>


hàng của mình theo các dấu h i ệ u như: mức độ hài lòng của khách
h à n g v ề sản phẩm hay dịch vụ của doanh nghiệp (dấu h i ệ u định
tính) hoặc nghiên cứu theo dấu hiệu định lượng là nhu cầu của khách
hàng v ề số lượng sản phẩm của doanh nghiệp. Trong trường hợp này
thì tạp hợp gồm tất cả các k h á c h h à n g của doanh nghiệp là tổng thể.
Đối với tổng thể, ta sử dụng một số khái niệm và ký hiệu sau đây:


• N: Số phần tử của tổng thể và được gọi là kích thư<i>ớc của tổng thề. </i>


Kích thước của tổng thể phụ thuộc v à o vấn đề và phạm v i nghiên
cứu.


• X* : Dấu hiệu ta cần khảo sát, nghiên cứu (trong kinh tế thường gọi


là chỉ tiêu).. Dấu hiệu nghiên cứu có thể là định tính hoặc định lượng.
Cần nhấn mạnh rằng, khi nói nghiên cứu một tổng thể có nghĩa là ta
n g h i ê n cứu dấu hiệu X* được thể h i ệ n trên các phần tử của tổng thể.
• Xi (i = 1,2, k) là các giá trị của dấu hiệu X* đo được trên các


phần tử của tổng thể. Xi là những thông tin cần t h i ế t để ta nghiên cứu
v ề dấu hiệu x \ còn các phần tử của tổng thể là những đố i tượng
mang thơng tin.


• Ni (i = Ì, 2, .... k): Tần số của Xi - là số phần tử nhận giá trị Xj.


* Pi Ú = i, 2 k): Tần suất của X, - là tỷ số giữa tần số của Xi và



<i>* , N i</i> B / £


kích thước tống t h ế : pi - —<i> . Ta ln ln có 2 ^ p ' l </i>


-2- Các phương pháp mô tả tổng thể


</div>
<span class='text_page_counter'>(16)</span><div class='page_container' data-page=16>

<i>&ƯIUỊ ó: MÂU IUỊỖU</i> <i>nhiều </i>
<i>Bảng 6.1 </i>


Giá trị của X * Xi x2 xk .


T ầ n số (Ni) N i N2 Nk


k


H i ể n nhiên: 0 < N i < N và ta ln có: 2 ^ N ; = N
i=l


Ta cũng có.thể mơ tả tổng thể bằng bảng phân phối tần suất. Dạng
tổng q u á t của bảng n à y như sau:


<i>Bảng 6.2 </i>


Giá trị của X* Xi x2 xk


T ầ n suất (Pi) Pl P2 Pk


k



Ta ln ln có: 0 < Pi < Ì và ] T p í = 1 .
i=l


* Chùy: Bảng (6.1) và (6.2ì,ró thổ lập dưới dạng cột.


Về hình thức, bảng phân phối tần suất của tổng thể tương tự như


bảng p h â n phối xác suất của đạ i lượng ngẫu nhiên rời rạc. N ó phản
á n h cơ cấu của tổng thể.


3- Các số đặc trưhg của tổng thể


</div>
<span class='text_page_counter'>(17)</span><div class='page_container' data-page=17>

<i>cịiáo trình Lị thuyết xác mất ồ. tlÚHtọ. kê tữáiL </i>
<i>Ì- Trung bình của tổng thể </i>


Trung bình của tổng thể (ký hiệu là ịi), được xác định theo công
thức: .


k


H = 2 > i P i (6.3)
i = l


<i>2- Phương sai của tổng thể </i>


Phương sai của tổng thể (ký hiệu là ơ2) được xác định theo cơng


thức:


k


• i = l


I


<i>3- Độ lệch chuẩn của tổng thể </i>


Độ lệch chuẩn của tổng thể (ký hiệu là ơ) được xác định theo công
thức:


ơ=V<i>ỡ</i>r (<i>Ể</i>L5).


<i>4- Tỷ lệ tổng thể </i>


Tỷ lệ tổng thể (ký hiệu là p) được định nghĩa như sau:


Giả sử tổng thể gồm N phần tử, trong đó có M phần tử có tính chất
M


<i>Ạ</i> . G ọ i p = — là tỷ l ệ các phần tử có tính chất A của tổng thể (hay
gọi tắt là tỷ lệ tổng thể), p cũng chính là xác suất lấy được phần tử


có tính chất A khi lấy ngẫu nhiên một phần tử từ tổng thể.


<i>Thí dụ: Ngành cao su có 500.000 cơng nhân. Để nghiên cứu mức </i>
sống của họ, người tá khảo'sát chỉ tiêu X* :" Thu nhập thực tế của


</div>
<span class='text_page_counter'>(18)</span><div class='page_container' data-page=18>

<i>ót lứtfi tạ ó: Mẫu ngẫu nhiên </i>
<i>Bảng 6.6 </i>


Thu nhập số công nhân . T ầ n suất



X* (ngàn/tháng) <sub>(Ni) </sub> <sub>(Pi) </sub>


500 50.000 0,10


600 70.000 0,14


700 150.000 0,30


800 120.000 0,24


900 55.000 0,11


1000 30.000 0,06


1100 25.000 0,05


Tống 500.000 1,00


T ừ bảng 6.6 ta tính được:


• Thu nhập trung bình của cơng nhân ngành cao su (trung bình tổng
thể) là;


l i = 500x 0,1 + 600x 0,14 + 700x 0,3 + 800x 0,24 +


+900x 0,11 + lOOOx 0,06 + Ì lOOx 0,05 = 750 ngàn đồng.
• Phương sai của thu nhập (phương sai của tổng thể):


ơ2= (500 - 750)2.0,1 + (600 -750)2.0,14 + (700 - 7 5 0 )2 0,3 +



+ (800 - 750)2.0,24 + (900 - 750)2.0,11 + (K)00 - 750)2 0,06


+ (1100-750)2.0,05 =23100


• Độ lệch chuẩn của thu nhập (độ lệch chuẩn của tổng thể):
ơ = V23100 = 151,987


• Tỷ l ệ cơng nhân có thu nhập cao của n g à n h cao su (tỷ l ệ tổng thể):
N ế u ta coi những cơng n h â n có mức thu nhập từ 1000 (ngàn đồng)
-trở l ê n là những người có thu nhập cao thì tỷ l ệ cơng n h â n có thu


</div>
<span class='text_page_counter'>(19)</span><div class='page_container' data-page=19>

<i>4ỳiá& bình bị tluiụết xác tuất ồ tliếnạ kê tơĨMi </i>
30000 + 25000 _


n = •— = 0,11 hay 1 1 %


F 500000


li- Khái niệm mẫu


Để nghiên cứu tổng thể theo m ộ t hay một số dấu hiệu n à o đó ta
cần nghiên cứu toàn bộ các phần tử của tổng thể, tức là thống kê
tồn bộ táp hợp và phân tích từng phần tử của nó theo dấu hiệu
nghiên cứu. Chẳng hạn để nghiên cứu d â n số của một nước theo các
dấu hiệu như: giới tính, độ tuổi, nghề nghiệp, trình độ học v ấ n , nơi
cư trú, . . . . ta phải t i ế n h à n h tổng điề u tra dân sô và p h â n tích từng
người theo các dấu hiệu trên sau đó tổng hợp cho tồn bộ d â n số của
cả nước. Tuy nhiên trong thực t ế c á c h l à m n à y gặp phải những khó
khăn sau đây:



• N ế u kích thước của tổng thể q lớn thì việc nghiên cứu tồn bộ
phải chịu chi phí lớn v ề t i ề n của, thời gian, nhân lực, phương t i ệ n , . .
. dễ xảy ra sai sót trong quá trình thu thập thơng tin ban đầu, hạn c h ế
độ chính xác của k ế t quả p h â n tích.


• Nếu các phần tử của tập hợp lại bị phá hủy trong quá trình điều


tra thì phương pháp nghiên cứu tồn bộ trở thành vơ nghĩa . Chẳng
hạn: để k i ể m tra chất lượng của các hộp sữa do một h ã n g sản xuất
thì ta khơng thể mở tất cả các hộp sữa do hãng này sản xuất để k i ể m
tra được.


</div>
<span class='text_page_counter'>(20)</span><div class='page_container' data-page=20>

<i>CHúttiq. ó: Mẫu ngẫu nhiên. </i>
Vì vậy, từ t h ế kỷ 17, phương p h á p nghiên cứu mẫu đã ra đờ i , ngày
càng phát triển và được sử dụng rộng rãi trong nhiều lĩnh vực. T ư
tưởng cơ bản của phương p h á p mẫu như'sau:


T ừ tổng-thể ta l ấ y ra n phần tử và đo lường giá trị của dấu hiệu X*
trên chúng, n phần tử n à y lập n ê n một mẫu. s ố phần tử của mẫu (n)
được g ọ i là kích thư<i>ớc mẫu. thơng thường kích thư</i>ớc của mẫu nhỏ
hơn n h i ề u so với kích thước của tổng thể. Vì vậy ta có khả năng thực
t ế để thu thập, xử lý và khai thác thông tin mẫu một cách nhanh
chóng, tồn d i ệ n hơn. Sử dụng các phương p h á p toán học (đặc b i ệ t
là lý thuyết x á c suất), người ta t i ế n h à n h suy rộng k ế t quả nghiên
cứu trên m ẫ u cho toàn bộ tổng t h ể , đó là mục đích cuối cùng của
phương p h á p mẫu.


Để đạt được mục đích trên thì mẫu phải đại diện cho tổng thể.



M u ố n vậy, khi lấy mẫu phải đả m bảo tính ngẫu nhiên, khơng chọn
m ẫ u theo một tiêu chuẩn chủ quan đã định trước.


Trong thực t ế có nhiều c á c h lấy mẫu:
<i>Ì- Lấy mẫu ngẫu nhiên:! </i>


Ta đánh số các phần tử từ Ì đế n N (N là số phần tử của tổng
thể),-Để có một mẫu kích thước n, ta- có thể dùng bảng số ngẫu nhiên'
hoặc dùng cách bốc thăm để lấy cho iu n phần tử vào mẫu.


Bằng cách này, mỗi phần tử của tỏng thể đề u có khả năng dược
chọn vào mẫu như nhau.


2- Ch<i>ọn mẫu cơ giới: </i>


</div>

<!--links-->

×