Tải bản đầy đủ (.pdf) (244 trang)

Giáo trình Lý thuyết xác suất và thống kê toán - NXB Thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (37.68 MB, 244 trang )

<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>

H O À N G N G Ọ C N H Ậ M


</div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2></div>
<span class='text_page_counter'>(3)</span><div class='page_container' data-page=3></div>
<span class='text_page_counter'>(4)</span><div class='page_container' data-page=4></div>
<span class='text_page_counter'>(5)</span><div class='page_container' data-page=5>

L ờ i n ó i đ ầ u


Lý thuyết xác suất nghiên cứu quy luật của các h i ệ n tượng ngẫu
nhiên. Dựa trên những thành tựu của lý thuyết xác suất, thống k ê
loàn là khoa học ra quyết định trên cơ sở những thông tin thu thập từ
thực t ế . Hơn 300 n ă m phát triển, đ ế n nay nội dung và phương p h á p
của xác suất thốn" kê rất phong phủ và được á p dụng rộng rãi trong
rãi nhiều lĩnh vực. Vì vậy việc học tập, nghiên cứu m ô n x á c suất
<i>ihống kê hở thành nhu cầu khôn!* thể thiếu đ ố i với sinh viên của </i>
n h i ề u trường đ ạ i học.


Đe đáp ứng yêu cầu nân" cao chát lượn" đào lạo, đáp ứng những


đòi hỏi của nền kinh l ố thị trương và tạo điều k i ệ n thuận l ợ i đ ể sinh
viên của trường học m ô n x á c suất thống k ê . Chúng tôi b i ê n soạn
<i>cuốn "Lý thuyết xác suất và thống kê toán". Qua cuốn sách nhỏ n à y </i>
chúng tôi hy vạn? sẽ giúp c á c bạn -sinh viên đ ạ t k ế t quả cao khi học
tập, nghiên cứu m ô n học và ứng dụng được c á c phương p h á p của x á c
suất thống kê trong công v i ệ c của mình sau này.


Cuốn sách gồm 3 phần được chia làm 8 chương được sắp xếp theo


</div>
<span class='text_page_counter'>(6)</span><div class='page_container' data-page=6>

Đ ố i v ớ i các nhà kinh t ế và các nhà quản trị doanh nghiệp, biết
thu thập và n ắ m vững c á c phương p h á p x ử lý thôn g tin kinh t ế xã hộ i
là y ê u cầu không thể thiếu được. T o á n học nói chung, xác suất thống
k ê nói riêng là cơng cụ nghiên cứu kinh t ế r ấ t hữu hiệu. Đ ố i v ớ i sinh
viên, mục tiêu cuối cùng của v i ệ c học tốn là sử dụng được cơng cụ
này vào ư o n g cơng việc của mình trong tương lai. Do đó cuốn sách
được viết theo quan đ i ể m thực hành, chú trọng việc á p dụng x á c suất


thống kê toán v à o thực t ế hơn là việc trình b à y các vấn đ ề có tính
chất thuần túy lý thuyết.


Ngoài đối tượng bạn đọc là sinh viên trường Đại học Kinh tế


cuốn sách cũng giúp ích cho tất cả những ai trong c ô n s việc, tron"
nghiên cứu phải xử lý một số lượng lớn thông ùn, số l i ệ u .


Cuốn sách đã được chỉnh lý, sửa đổi một số phần cho phù hợp với


y ê u cầu và trình độ t i ế p thu của sinh viên. Đồng thời cuốn sách cũng
được các c á n bộ giảng dạy của bộ m ô n T o á n Kinh t ế Khoa T o á n
-Thống kê trường đ ạ i học kinh t ế thành p h ố H ồ Chí M i n h g ó p ý song
<i>k h ô n g thể tránh khỏi những sai sót. C h ú n g tơi rất mong bạn đọc vần </i>
xa g ó p ý, bổ sung đ ể cuốn sách ngày c à n g có chất lượng cao đ á p ứng
ngày càng tốt hơn nhu cầu nghiên cứu, học tập của sinh viên.


Nhân dịp này chúng tôi xin chân thành cảm ơn tất cả những ai đã


đ ó n g g ó p v à o nôi dung và tổ chức cho cuốn sách được ra mắt ban
đọc.


<i>Thành phố Hồ Chí Minh ỉ/2003 </i>


<i>T* 'É. • 9 </i>


</div>
<span class='text_page_counter'>(7)</span><div class='page_container' data-page=7>

<i>Ọliươtiti 1: c&tír i Ị ít ít cùa biến eổ ồ cúc cô/lự thức tinh xáe ỊUất </i>


P H Ầ N I
LÝ THUYẾT XÁC SUẤT



Chương 1


XÁC SUẤT CỦA BIẾN cố VÀ CÁC CÔNG


T H Ứ C T Í N H X Á C S U Ấ T


ì- Phép thử và các loại biến cố


Tron? tốn học có những khái n i ệ m khơng có định nghĩa mà chỉ
có thể mơ tả chúng bằng những hình ảnh hoặc tư duy trực giác.
Chẳng hạn. tron? hình học, các khái n i ệ m đ i ể m , đường thẳng, mặt
phang là những khái niệm không có định nghĩa. Trong xác suất, khái
n i ệ m p h é p thử là khái n i ệ m cơ bản không có định nghĩa, ta hiểu
p h é p thử là m ộ i thí nghiệm hay quan sát nào đó. P h é p thử được gọi
là ngẫu nhiên nếu la không thể biết trước kết quả nào sẽ xảy ra.
Thường trong một phép thử (thí nghiệm) có nhiều kết quả có thể


xảy ra. Có kết quả đơn giản, và cũng có những kết quả phức hợp.
Chẳng hạn, khi quay xổ số, nếu ta chí quan lâm tới hai số c u ố i . thì
m ỗ i sự xuấi hiện một trong các số l ừ 00. OI 98, 99 là những k ế t
<i>quả đơn giản nhất; ương khi đó. sự xuất hiên các số chẵn. l ẻ . đ ầ u 5, </i>
đuôi 2 . . . là những k ế t quả phức hợp (gồm nhiều kết quá đơn giản
nhai hợp thành).


Kết quả đơn giản nhất được gọi là biến cố sơ cấp (nó giống như


</div>
<span class='text_page_counter'>(8)</span><div class='page_container' data-page=8>

<i>íỊiáo trình li) tlim/ết .nít' mất DÙ Hiốnq tốn </i>


sơ cấp. M ỗ i tập con của không gian các hiến c ố sư cấp được gọi là


b i ế n cố.


Ta Ihườnsĩ dùng:


<i>(0 đ ổ ký hiệ u b i ế n cơ sơ cáp ; </i>


<i>íì đ ể ký hiệu k h ô n " gian các biến c ố sơ c á p ; </i>


A. B. c, . . . A | . A2 A„. . . . đ ể ký hiệu h i ế n cố
Để minh họa, la XĨI phép thử có số kết quả đơn giản nhất là hữu hạn


hoặc vô hạn đ ế m được: (Oi, 0)2. . . . Theo trên, m ỗ i cou được gọi là
một hiên cơ sơ cấp, cịn lập hợp


Q = leo,. CO:, . . . }
là không dan các Hiôli cô sơ cáp.


<i>Thí dụ: </i>


Ì- Gieo m ộ i con xúc xắc là thực hiện một p h é p lliử . K h ô n g aian
<i>các biên cô sơ cáp đôi với phép thử này là: </i>


<i>Q = í (Oi. (Õ2. Ị, 0)4, (0ỹ, 0)</i>(lj


tron" đó: Củi (i = ì, 2. . , 6) chí kết quả xúc xắc xuất hiện mại i
chấm.


2. Gieo hai con xúc xắc. Khôns eian các biên cố sơ cấp đối với
p h é p thử này là:



Q = {con, to,:. . ... ,,0)fõ, Oif.fi}


trong đó: 0)jj (i. j = 1,2 6) chỉ kết quả xúc xắc thứ nhất xuất


hiện mặt i chấm và xúc xắc thứ hai xuất h i ệ n mặt j chấm (phép thử
này có 36 biến cố SƯ cấp).


</div>
<span class='text_page_counter'>(9)</span><div class='page_container' data-page=9>

<i>VhttơntỊ 1: (ÀMÍC iittĩt tim biến cố va etíe inỊ thứ* titth ,rtíe suất </i>


Như vậy, mội biến cố du LO Me xay ra khi mội phép thử gắn liền


với nó được thực hiện. TroiiiỊ thực t ế có thơ xảy ra các loai b i ế n c ố
sau đ â y :


<i>+ Hiến cố chắc chắn: lù biến cố nhất đinh sẽ xảy ra khi thực h i ệ n </i>
p h é p thử. B i ế n cố chắc chán được ký hiệu là Q.


<i>Thi dụ: Tung một con xức xấc. biến cố " xuất hiện m ã i cớ số chấm </i>


<i>nhỏ hơn 7" là biến c ố chắc chắn. </i>


<i>+ Biếu cố không thể có: là biến cố nhất định khơng xảy ra khi thực </i>
hiện p h é p thử. B i ế n c ố không thê dược ký hiệu là 0 .


<i>Thi dụ: M Ộ I k i ệ n hùng có l o sản phẩm (trong đó có 7 sản phẩm </i>


l o ạ i í và 3 sản phẩm loại l i ) . Chọn ngẫu nhiên không h o à n l ạ i l ừ
k i ệ n ra 5 sản phẩm. B i ế n cố: " có một sản phẩm loại ì trong 5 sản
p h ẩ m l ấ y ra từ k i ệ n " là biến cố không i h ể có.



<i>+ Biến cố ngẫu nhiên: là b i ế n c ố có thể xảy ra hoặc k h ô n g xảy ra </i>
khi thực hiện p h é p thử. người ta thường dùng các chữ in hoa đ ể ký
h i ệ u các biến cố nsẫu nhiên, chẳng hạn: A, B, c, . . . ; hoặc A i , À 2 , .
. . , A n : hoặc B i , B i , . . . , B,J,


<i>Thí dụ: Tung một con xúc xắc, gọi A2 là biến cố: "xuất h i ệ n mặt 2 </i>


c h ấ m " thì A2 là biến c ố ngẫu nhiên.
li- Mối quan hệ giữa các biến cố


Khi g i ả i các bài toán của lý thuyết xác suất ta thường phải d i ễ n tả
<i>một b i ế n c ố phức hợp theo các hiến cố đơn gián hơn. Đ e l à m được </i>
điều đó ta cần nghiên cứu m ố i quan hộ giữa các biến c ố thể h i ệ n qua
các định nshía dưới đây:


<i>Định nghĩa ì: B i ế n c ố A và B được g ọ i là hai biển cố tương đương </i>


</div>
<span class='text_page_counter'>(10)</span><div class='page_container' data-page=10>

<i>Qiủa trình /ý thuyết xức mất DÙ t/tơnạ kè tốn </i>


<i>Thí dụ. Tung một con xúc xắc, h i ế n cố " x ú c xắc ra mặt chẩn** và </i>


b i ế n cố "xú c XÍU r;i một trong 3 mặt: 2, 4, 6" là hai b i ế n c ố tương
đương.


<i>Định nghĩa 2: B i ế n cố c được g ọ i là tổng của 2 b i ế n c ố A và B (ký </i>


hiệu là c = A ù B hoặc c = A + B). N ế u c x ả y ra khi và chỉ khi có ít
nhất môi trong hai biến c ố A hoặc B xảy ra.


<i>Thí dụ: Xét phép thử quan sát hai xạ thủ cùng bắn vào một bia. Gọi </i>



A là biến cố "xạ thủ thứ nhất bắn trúng bia", B là b i ế n c ố "xạ thủ
thứ hai bắn trúng bia", c là b i ế n cố "bia trúng đ ạ n " . R õ ràng c xả>
ra khi và chi khi có ít nhất m ộ i trong hai b i ế n c ố A, B xảy ra
V ậ y :


c = A u B
I


<i>Định nghĩa 3: B i ế n cố A được g ọ i là lổng của n b i ế n cố: A j , A</i>2, . . .
An nếu A xảy ra khi và chí khi có ít nhất mộ t trong n b i ế n c ố đó x ả )
ra.


Ký hiệu là:


li •
<i>A = A i u A i ụ . . . u An hoặc A = M A j hoặc A = 2^</i>Ai


i=i i=i


<i>Định nghĩa 4: Biến cố c được gọi là hiệu của 2 biến cố A và B (ký </i>


hiệu là c = A - B). N ế u c xảy ra khi và chỉ khi A xảy ra nhưng B
khơng xảy ra.


<i>Thí dụ: Một lớp có 50 học sinh, trong đó có 15 người giỏi tốn, 10 </i>


ngươi giỏi văn và 4 người giỏi cả hai môn này. Gặp ngẫu nhiên một
học sinh của lớp. G ọ i A là b i ế n cố gặp được người g i ỏ i loàn; B là
b i ế n c ố gặp được người giỏ i văn ; c là b i ế n c ố gặp được ngư ờ i chi


giỏi tốn, thì c = A - B


<i>Định nghĩa 5: Hai biến cố A và B được gọi là xung khắc nhau nếu </i>


</div>
<span class='text_page_counter'>(11)</span><div class='page_container' data-page=11>

<i>VttiMiHỊ Ị: f.X)ùi' suất cún biếu eìỉ vù các cị lít/ thửe tính je suất </i>


Trong thực l í với sô p h é p thử đủ lớn ta có thổ lấy lần suất làm giá
trị iiân li ú li Ỉ: của xác suấL Tức la có PíA) * RA) khi n khá lớn.


<i>* Chủ ý: Khái niệm hội lạ theo xác suấi của lần suất cú iBrhĩa là với </i>
m ọ i Í: ihíóiiu bé tùy ý ta ln có:


<i>Lim vịt' - pị < e) = Ì </i>


n—>oc


Đốn chưtiiii! 5 la sẽ chứng minh cứ S("í lý thuyết của sự hội lu đó
Nhờ những thành quả của lồn học và kỹ ihuậl lính tốn hiện đại,


định nghĩa thốn" kê của x á c suất có l ầ m quan trọng đặc biệt trong
ứng dụng.


4- Nguyên lý xác suất nhỏ và xác suất lổn


Trong nhiều bài toán thực l ố , ta thườn" irặp các biến c ố có xác
suất rái nhò, tức gần b à n g 0. Qua nhiều lần quan sái, người ta thấy
rà nạ: các hiến c ố có xác suất nhỏ. gần như khôiiỉĩ xảy ra khi ihực
<i>hiện p h é p thử. Trên d í sở đó có thể đưa ra "Nguyên lý ihực l ố khơng </i>
thể có của c á c biến c ố LÓ x á c suất nhỏ" sau đ â y :



Nếu mội biến cố có xác suất rất nhỏ thì thực lố có thể cho rằng
trong m ộ i p h é p ihử, biến cơ đó sẽ khòm: xảy ra.
Việc qui định một mức xác suất được coi là "rất nhỏ" tùy thuộc


v à o từng bài loàn cụ t h ể . C h ẩ n " hạn: N ế u xác suối đ ể một loại dù
<i>khơng mà khi nhảy dù là 0,0ỉ thì xác suất đó chưa thổ coi là nhỏ và </i>
la khôns: n ê n sử đ ụ n " loại dù đ ó . Sm nếu xác suất đổ m ộ i chuyến
xe lửa đ ố n ỈM chậ m l o phin là 0.01 thì ta có th ể coi mức x á c suất đ ó
là nhỏ lức có thổ cho rằm? xe lửa đốn ga đúnsi iiiìí.


MỘI mức xác suất nhỏ mà với nó ta có lliể chi) rằn ÍT: biên cố đang


</div>
<span class='text_page_counter'>(12)</span><div class='page_container' data-page=12>

<i>Lịìáo trình Ị lị thuyết xát Mất oà thống kẻ toài* </i>


theo từng bài toán cụ thể, mức ý nghĩa thường được lấy ưong khoảng
từ 0,01 đ ế n 0,05.


Tương tự như vậy ta có thể nêu ra" nguyên lý thực tế chắt chắn
xảy ra của các b i ế n c ố có xác suất lớn" n h ư sau: ,


<i>N ê u một biến c ố có xác suất gần bằng Ì thì thực te V > 'hổ cho rằng </i>
b i ế n c ố đ ó sẽ xả y ra trong m ộ i p h é p thử.


Cũng như ưên, việc qui định mức xác suất dượt L»»I là "lớn" tùy


thuộc vào bài toán cụ t h ể . T h ô n g thường người la l ấ y trong khoảng
từ 0,95 đ ế n 0,99.


IV- Công thức cộng xác suất



a- Nếu Ả và B là hai biến cố xung khắc thì:


<i>Chứng minh: Ta chứng minh cho trường hợp p h é p thử có thể phân </i>


tích thành n trường hợp đ ố i xứng, trong đó c ó m i trường hợp thuận
lợi cho A và m2 trường hợp thuận l ợ i cho B. K h i đ ó số trường hợp
thuận lợi cho b i ế n c ố (A u B) sẽ là: mi+nv> (vì A, B là hai biến cố
xung khắc).


Ta có thể minh họa số trường hợp thuận lợi như sau:
P ( A u B ) = P ( A ) + P(B)


</div>
<span class='text_page_counter'>(13)</span><div class='page_container' data-page=13>

<i>QtuMng ì: Ợũảê mất en ạ biết! tế vù tám tồng, títứe. tinh xáe tuất </i>
<i>Trường hợp tổng quát, công Ihức trên được phát biểu như sau: </i>


Nếu Aj, A2,..., An là n biến cố xung khắc từng đơi, thì:
P(Aj u A2 u... u An) = P(A,) + P(A2) +... + P(An)


Bạn đọc có thể chứng minh cơng thức trên bằng phương pháp quy
nạp.


<i>Thí dụ 1: Một hộp có 10 sản phẩm (trong đó có 2 phế phẩm). Lấy </i>


ngẫu nhiên (khơng hồn l ạ i ) từ hộp ra 6 sản phẩm. T i m x á c suất đ ể
có khơng q Ì p h ế phẩm trong 6 sản phẩm l ấ y ra.


<i>Giải: Gọi A là biến cố "khơng có phế phẩm nào trong 6 sản phẩm </i>


lấy ra"; B là b i ế n c ố "có Ì p h ế phẩm trong 6 sản phẩm lấy ra" và c
là b i ế n c ố " c ó k h ơ n g q u á Ì p h ế phẩm trong 6 sản phẩm l ấ y ra".



Ta thấy: c = A u B •


M à A , B là hai b i ế n c ố xung khắc (vì nó khơng thể đồng thời xảy ra
trong p h é p thử lây ngẫu n h i ê n ra 6 sản phẩm từ hộp). . V ỉ..


P(C) = P(A u B ) = P(A) + P(BÌ


- 4 = ± L . p( B ) = £ i £ i = ^


<i>c i 105 c „ 105 </i><sub>'lo ^10 </sub>


V ậ y :


P(C) = i i + ^ = 2 i = ỉ
105 105 105 3
Từ cơng thức trên ta có thể suy ra một số hệ quả sau:


<i>Hệ quả 1: Nếu Ai, A</i>2 An là hệ biến cố đầy đủ và xung khắc
từng đơi thì:


li


</div>
<span class='text_page_counter'>(14)</span><div class='page_container' data-page=14>

<i>íịiúo Ị'tìnít í lị thuyết -rác suất vù iltổiiq kè toán </i>


<i>Hệ quả 2: N ế u A và A là hai biến c ố đ ố i lập với nhau thì: </i>


P ( A ) = Ì - P( A )


Bạn đọc có thể dễ dìm" chứng minh các hệ quả trên.


b- N ế u A và B là hai b i ế n c ố k h ô n g xung k h ắ c thì:


P(A u l i ) = P(A) + PHỈ) - P(A.B)


<i>Chứng minh: Giả sử phép thử có n trường hợp đ ố i xứnc. tron" đó có </i>


mi trường hợp thuận lợi cho A, 1112 inrìíriỉĩ hợp thuận l ợ i cho B. Vì A.
B khơng xung khắc nên nói chung sẽ cớ k irườnu hợp thuận lợi cho
cả A và B. Khi đó số trường hợp thuận l ợ i cho b i ế n c ố (A u B) sẽ là


Ì
mi + m-> - k.


Ta có th ể minh họa trường hợp này nh ư sau:


Theo mô lả ở hình trên m ỗ i nốt chấm đen là một trường hợp ihuận
lợi thì: rai = 12; m2 = 15; k = 5


Theo định nghĩa cổ điển của xác suất, ta có:
n,A D> m , + m , - k m , m , k


P ( A u B ) = - i — ^ = : ^ i + l í ỉ 2 _ _ ± = P ( A ) + P ( B ) - P ( A B )


<i>n n n </i> <i>ũ </i>


B . = P ( A ) ; ^ L = P ( B ) ; ằ = P ( A B )
n n n


<i>Thí dụ: M ộ t lớp có 50 sinh viên.trong đó có 20 sinh viên học giỏi </i>



</div>
<span class='text_page_counter'>(15)</span><div class='page_container' data-page=15>

<i>Phương í: (Xiáe li lất cùa biến cố vù các cịng tinh' tính xác mất </i>


m ô n T o á n và Anh văn. Chọn ntrẫu nhiên một sinh viên của lớp. T i m
xác suất đ ể chọn được sinh viên học giỏi ít nhất một m ô n trong hai
môn T o á n và Anh văn.


<i>Giai: Gọi A là biến cố chọn được sinh viên học giỏi mơn Tốn; B là </i>


b i ế n c ố chọn được sinh viê n học giỏ i mô n Anh văn; c là b i ế n c ố
chọn được sinh viên học giỏi ít nhất một trong hai mơn T o á n và Anh
văn. Ta thấy c = A w B mà hai biến cố A và B là hai biến c ố khơng
xung khắc (vì A và B có thể xảy ra đồntĩ Ihời trong cùng một p h é p
thử. Đ ó chính là trường hợp chọn được một sinh viên học giỏi cả hai
m ô n T o á n và Anh văn). Do đ ó :


P(C) = P(A) + P(B) - P(AB) = — + — - — = — =0,8


50 50 50 50


<i>Trường hợp tổng quát công thức trên được phát biểu như sau: </i>


Nếu Ai, A2,.... An là n biến cố khơn" xun*: khắc thì:
li


P ( A j U A2U . . . u An) = Ị T P ( A i ) - X P ( Ai A )) + £ p( A lA j Ak)
i=l " Ki i<j<k


. . . + ( - l )n- ' P ( A1. A2 An)
<i>• Trường hơy li = 3: </i>



P(A, U A2 u A , ) = P ( Al) + P ( A:) + P ( A3) - P ( A1A2)
-- P ( AIA , ) - P ( A , A , ) + P ( AIA3A3)
<i>• Trường hợp li = 4: </i>


P(A, ÙA, ÙA, UA4) = P(A,) + P(A,) + P(A,) + P(A4)


- P ( AIA2) - P ( AIA1) - P ( AIA4) - P ( A:A , ) - P ( A , A4)
- P ( A3<i>Ã4) + P(A, A , A , ) + P(A IA , A</i>4<i>) + P(A, A , A \ ) </i>


</div>
<span class='text_page_counter'>(16)</span><div class='page_container' data-page=16>

<i>(ịlủo trinh /lị tỉtui/ểt xác mất Hít thấm/ kê toan </i>


c- N ế u A j , A „ . . . , An là n b i ế n c ố k h ô n g xung k h ắ c v à độc lập
t o à n p h ầ n thì:


<i>ỸịầịU A</i>2U . . . u An) = Ì - P ( Ã1) . P ( Ã2) P ( Ãn)


V- Cơng thức nhân xác suất
Ì- Xác suất có điều kiện


<i>a- Định nghĩa: Xác suất của biến cố A được tính v ớ i đ i ề u k i ệ n biến </i>


cố B đã xảy ra được gọi là xác suất có đ i ề u k i ệ n của A. Ký hiệu là
P(A/B)


<i>b- Thí dụ: t r o n g bình có 5 quả cầu (trong đó có 2 quả ưắng). Lấy </i>


ngẫu nhiên lần lượt ra hai quả (lấy không h o à n l ạ i ) . T i m x á c suất để
lần thứ hai lấy được quả trắng biết lần thứ nhất lấy được cầu trắng ?


<i>Giải: Gọi A là biến cố "lần thứ hai lấy được cầu trắng"; B là biến cố </i>



"lần thứ nhất lấy được cầu trắng". Ta cần tìm P(A/B).


Ta thấy lần thứ nhất đã lấy được cầu t r ấ n " (tức B đã xảy ra) nên
trong bình cịn l ạ i 4 quả, trong đó có Ì quả cầu trắng.


Nên: P(A/B) =
-4
c- cơng thức tính:


P(AB)
P ( A / B ) =


P(B)


Ta có thể dùng khái niệm xác suất có đ i ề u k i ệ n đ ể định nghĩa cách
k h á c các biến c ố độc lập như sau:


Nếu: P(A/B) = P(A) và P(B/A) = P(B) thì A, B độc lập.
2- Nếu A, B là hai biến cố bất kỳ, thì:


</div>
<span class='text_page_counter'>(17)</span><div class='page_container' data-page=17>

<i>@/utưnạ 1: Qbáe. mất của biển eấ ồ các uạ thức Hu ít xịe tuất </i>
<i>Chứng minh: Giả sử p h é p thử có n trường hợp đ ố i xứng, trong đó có </i>


m i trường hợp thuận l ợ i cho A; IĨ12 trường hợp thuận l ợ i cho B. Vì A ,
B k h ô n g xung khắc n ê n nói chung sẽ có k trường hợp thuận l ợ i cho
cả A và B. Theo định nghĩa cổ điển của xác suất ta có:


le m
<i>P(AB) = - ; P(A) = ^ ị </i>



n n
Ta tính P(B/A).


Với điều kiện A đã xảy ra nên số trường hợp đối xứng của biến cố B
khi đó sẽ là mi ; số trường hợp thuận lợi cho B là k.
Do vậy:


P(B/A) = —
m,
Ta có:


le m lí


<i>P(AB) =- = ĩ^-. — = P(A)P(B/A) </i>
u n m ị


Vì vai trị của 2 biến cố À. và B như nhau, chứng minh tương tự ta
được:


P(AB) = P(B)P(B/A)
Ta xét một thí dụ để minh hoa cho phần chứng minh nêu trên:


M ộ t lớp có 50 sinh viên, trong đó có 20 nữ và 30 nam. Trong kỳ thi
m ô n T o á n có 10 sinh viên đ ạ i đ i ể m giỏi (trong đó có 6 nam và 4 nữ).
G ọ i tên ngẫu nhiên một sinh viên trong danh sách lớp. T i m xác suất
g ọ i được sinh viên đạt đ i ể m giỏi môn T o á n biết rằng sinh viên đó là
n ữ ?


Trong thí dụ này, phép thử là gọi ngẫu nhiên tên mội sinh viên của



</div>
<span class='text_page_counter'>(18)</span><div class='page_container' data-page=18>

<i><ậiáo trình lý tí IU yết xtỉe xuất DÙ thốn*/ kè toán </i>


irườne hợp thuận l ợ i cho cả A và B (k) là 4 (đó chính là sơ sinh viên
nữ đạt đ i ể m giỏi mơn Tốn). X á c suất cần tính chính là P(B/A). Ta
có:


P ( B / A ) = — = — = 0 . 2
m, 20


<i>Trường hợp tổng quát, công thức trên được phát biểu như sau: </i>


Nếu Aj, A2,..., An là các biến cố bất kỳ thì:


P(A1.A2.... An) = P(A1).P(A2/A1)... .P(An/A1.A2... .An.j)


<i>3- Nếu A, B là hai biến cố độc lập, thì: </i>


P(A.IÌ) = P(A).P(B)
Bạn đọc có thổ dễ dàn" chứng minh cơn" thức này.


<i>Trường hợp tổng quát công thức trên được phái biểu như sau: </i>


N ê u A j , A-J, — , An là c á c b i ế n c ố độc l ậ p t o à n p h ầ n , t h ì :
P(A!.A2 An) = P(A!).P(A2) P(An)


<i>Thí dụ: Một phân xưởng có 3 máy. Xác suất các máy bị hỏng </i>


trong n g à y tương ứng là: 0 , 1 ; 0,2; 0,15. T í n h x á c suất c ó m ộ t
m á y bị hỏng trong n g à y ?



<i>Giải: (a) Gọi Ai, Ai, Áy tương ứng là các biến cố máy thứ nhất, thứ </i>


hai, thứ ba bị hỏng trong ngày. Khi đó A I ; A Ị ; A 3 tương ứng sẽ là
c á c b i ế n c ố má y thứ nhất, thứ hai, thứ ha t ố i trong ngày.


A là biến cố có một máy hỏng trong ngày.
Ta thây:


A = Â | A Ị . A J + A i . A Ị . A i +Ã1.Ã2.A3


</div>
<span class='text_page_counter'>(19)</span><div class='page_container' data-page=19>

<i>Phương Ị: fẦHÌe suất rùa biến cố ồ fúf cịng tltửe tinh xác mất </i>


Vì các b i ế n c ố lích xung khắc lừng đôi và các b i ế n c ố trong m ỗ i
tích đó độc lập tồn phần, do đ ó :


P(A) ) = P(A| ).p(Ã2 )p(Ã J ) + p(Ã Ì )P(À , ).p(Ă3<i>Ị+ p(Ă Ì )P(Ã2 )p(A3) </i>
= Ọ. Ì .0.8.0.85 + 0.9.0.2.0,85 + 0.9.0.8.0,15 = 0,329


VI- Công thức Bernoulli


Trong nhiều bài toán thực l ố , ta thườn" sập trườn" hợp cùng một
p h é p thử dược lập đi lặp l ạ i nhiều lần. Trong mỗi p h é p ihử có thể
xảy ra hay khôntĩ xảy ra một biến cố A nào đó và la quan tâm đ ố n
lổng số lần xảy ra biến c ố A trong d ã y p h é p thử. Chẳng hạn, n ế u
t i ế n h à n h sản xuất hàn g loạ i m ộ i loạ i chi t i ế t n à o đ ó ta thường quan
t â m đ ế n tổng số chi t i ế i đạt tiêu chuẩn của cả quá trình sản xuất. B à i
tốn này có the giải quyết khá d ễ dàng nếu c á c p h é p thử độc lập với
nhau.



Các phép thử được gọi là độc lập với nhau nếu xác suất để xảy ra


một biến c ố nào đó trong từng p h é p thử sẽ không phụ thuộc v á p việc
b i ế n c ố d ó có xả y ra ở p h é p thử khá c hay không. Chẳng hạn: tung
n h i ề u lầ n một đồng xu hoặc lấ y ngẫu nhiê n có hồ n l ạ i n sản ph ẩ m
l ừ một lô h à n " sẽ lạo nên các p h é p thử độc lập.


Giả sử tiến hành n phép thử độc lập. Trong mỗi phép thử chỉ có


thể xảy ra một trong hai trường hợp: Hoặc biến cố A xảy ra hoặc
b i ế n c ố A khôn g xả y ra. X á c suất xả y ra b i ế n c ố A trong m ỗ i p h é p
thử đ ề u bằng p và xác suất A khơng xảy ra bằng Ì - p = q. Khi dó
xác suất đ ể trong n p h é p thử độc lập nói trên biến c ố A x ả y ra đúng
k lần ký hiệu là Pk(A)đƯỢc tính theo cơng thức Bernoulli sau đây:


Pk(A)=Cnkpkqn-k (k = 0,1,2 ,n)


<i>Chứng minh: Gọi Ai là biến cố "ở phép thử thứ i, A xảy ra" (i = Ì, 2, </i>


</div>
<span class='text_page_counter'>(20)</span><div class='page_container' data-page=20>

<i>íỊiảo- trĩnh tụ títuụếi xịe mất ồ thống kê toán </i>


Gọi B là biến cố "trong n phép thử, A xảy ra đúng k lần". B có thể


xảy ra theo nhiều cách khác nhau. Chẳng hạn, k p h é p thử đầu, A xảy
ra, còn n-k p h é p thử sau A không xảy ra. Trường hợp này ta có thể
biểu diễn bằng b i ế n c ố tích:


A | . A2. . . . Ak .Ak+I Ak+2 An


Hoặc n-k p h é p thử đầu A khơng xảy ra, cịn n-k p h é p thử cuối A xảy


ra. Trường hợp này ta có thể b i ể u diễn bằng b i ế n c ố tích có dạng:
A1Ã2 A„-k.A,,-k+iAn-k+2 A„


Tổng số các tích như vậy chính là số cách chọn k p h é p thử đ ể biến
<i>c ố A xảy ra, tức bằng c\ và biến cố B chính là tổng của những biến </i>
cố tích ấy. Đ ố i với m ỗ i tích, ta thấy biến c ố A xảy ra đúng k lần, còn


<i>A xảy ra đúng (n-k) lần. Do đó xác suất của m ỗ i tích đ ề u bằng </i>


k n—k


p q . V ì các biến cố tích là các biến cố xung khắc từng đơi, nên ta
có:


Pk(A) = P(B)= c„yqn-k


<i>Thí dụ: Một lơ hàng có tỷ lệ phế phẩm là 5%. Lấy ngẫu nhiên từ </i>


lơ hàng đó ra 5 sản phẩm đ ể k i ể m tra (lấy có hồn l ạ i ) . T i m xác suất
đổ có 2 p h ế phẩm trong 5 sản phẩm lấy ra k i ể m tra?


<i>Giải: Ta coi việc kiểm tra một sản phẩm là thực hiện một phép </i>


thử. Vì k i ể m tra 5 sản phẩm n ê n ta coi như thực hiện 5 p h é p thử độc
lập. Gọi A là biến cố "sản phẩm lấy ra k i ể m tra la p h ế phẩm". Ta
thấy trong m ỗ i p h é p thử chỉ có thể xảy ra một trong hai trường hợp:
Hoặc sản phẩm k i ể m tra là phố phẩm (tứcA xảy ra), hoặc s ả n phẩm
k i ể m tra là sản phẩm tốt (tức A không xảy ra). X á c suất đ ể A xảy ra
trong m ỗ i p h é p thử đều hằng 0,05. Vày các điều k i ệ n đ ể á p dụng
công thức Bernoulli đ ề u thoa mãn. V I vậy, xác suất đ ể có 2 phế


phẩm trong 5 sản phẩm lấy ra k i ể m tra là:


</div>
<span class='text_page_counter'>(21)</span><div class='page_container' data-page=21>

<i>ệỊkựỰaạ. ì: Ọbáe. Mất của biến cố ồ các ênụ thức tinh, xịe. ít lất </i>


p2<i> (A) = c\ (0,05)</i>2 (0,95)3 =s 0,0214


VII- Công thức xác suất đầy đủ


Gia ỉ>ư hiến cố A là b i ế n c ố bất kỳ có t h ể x ả y ra đồng thời v ớ i m ộ t
trong c á c biến c ố Hl t H2 , Hn - là h ệ b i ế n c ố đ ầ y đủ và xung
khắc từng đôi. K h i đó x á c suất của b i ế n c ố A được tính theo c ô n g
limV sau đây:


p(A)=^?aiiAAmi)


i = l


Các xác suất P(Hi); P(H2); .... P(H„) thường được gọi là các xác


suất của các giả thiết (hay c á c x á c suất tiên nghiệm) và công thức
trên được g ọ i là công thức x á c suất đ ầ y đủ.


<i>Chứng minh: Vì các biến cố Hi, H2, . . . , H</i>n là một hệ biến cố đầy


đủ và xung khắc từng đôi, n ê n b i ế n c ố A n ế u x ả y ra thì sẽ x ả y ra
đồng thời v ớ i một trong c á c b i ế n c ố đó. V ậ y ta c ó :


A = H|.AuH2.Au....uH„.A


<i>Do c á c b i ế n c ố H j , Hi, H</i>n xung khắc từng đôi n ê n c á c b i ế n c ố


H [ . A ; H2.A ; . . . ; H„.A cũng xung khắc từng đôi. Á p dụng công thức


n


cộng x á c suất ta có: P(A) = P ( H , . A )
i=i


Theo công thức nhân x á c suất, ta l ạ i có:
P(Hi.A) = P(Hi).P(A/Hi)


Vậy: P(A)=ịP(Hi)P(A/Hi)


i=l


<i>Thí dụ: Cỗ 3 lô sản phẩm, tỷ lệ phế phẩm của từng lô tương ứng là: </i>


</div>
<span class='text_page_counter'>(22)</span><div class='page_container' data-page=22>

<i>(Ịláo trình lý, L'uiụê'1 xác tuất ồ tlicútạ kê tốn </i>


<i>Giải: G ọ i A là b i ế n cố l ấ y được một p h ế phẩm. H i , H</i>2, H3 tương ứng
là các h i ế n c ố sản phẩm l ấ y ra thuộc lô thứ nhất, thứ hai, thứ ba. Các
b i ế n c ố H i , H2, H3 là m ộ t h ệ b i ế n c ố đ ầ y đủ và xung khắc từng đôi,
và biến c ố A có thể xảy ra đồng thời v ớ i m ộ t trong c á c b i ế n cố này.
Áp dụng công thức x á c suất đ ầ y đủ ta có:


l \ A ) = P(H|)P(A/H|) + P ( H2) P ( A / H2) + P ( H3) P ( A / H3)
Ì


P(H,) = P(H2) = P ( H3<i>) = Ỷ </i>
P(A/H,) = 0,06; P(A/H2) = 0,02 ; P(A/H3) = 0,01



Vậy: • P(A)=-(0,06 + 0.0? . 0,01) = 0.03


VUI- Công thức Bayes


Giả sử A là b i ế n cố bất kỳ có thể xảy ra đỏng thời với một trong
các b i ế n cố H i , H2, . . . , Hn - là hệ b i ế n cô đ ầ y đủ và xung khắc từng
đôi Giả thiết rằng A đã xảy ra. K h i đó:


pm/ P(H,)P(A/H,) .


P(Hị/A) = — (V i = Ì, 2 , . . . . n)
X p ( H i ) p ( A / H i )


i=l


<i>Chứng minh: Theo công thức nhân xác suất ta có: </i>


P(Hi.A) = P(Hi).P(A/Hj) = P(A).P(Hị/A)


^P(Hi/A)=ỈÍMi^ii


P ( A )
Theo công thức xác suất đầy đủ ta c ó :


P ( A ) = £ P ( H , ) P ( A / H , )


34


</div>
<span class='text_page_counter'>(23)</span><div class='page_container' data-page=23>

<i>ẽhư&iiạ í: (Xjác iu ất của biến cố ồ ếe. CÁ li ạ thứe tính, xịe Mất </i>



V ậ y :


P ( H | / A ) = J W ^ > ( i = 1, 2 „ )
X P ( H , ) P ( A / H , )


i=l


Các xác suất P(Hị/A) được xác định sau khi đã biết kết quả của


<i>3hép thử là A đã x ả y ra n ê n thương được gọi là các xác suất hậu </i>


<i>nghiệm. N h ư v ậ y công thức Bayes cho p h é p ta x á c định l ạ i c á c xác </i>
<i>suất tiên nghiệm P(Hi) khi biết thcm thông tin là A xảy ra k h i thực </i>


liên m ộ t p h é p thử.


<i>Thí dụ: Ta x é t thí dụ ở phần cơng thức xác suất đầy đủ nhưng cho </i>


b i ế t t h ê m là đã lấ y được p h ế ph ẩ m khi lấ y ngẫu nhiê n mộ t sản p h ẩ m
từ lô h à n g được chọn. Tính x á c suất được chọn của từng lô h à n g ?


<i>Giải: V ì A đã xảy ra n ê n á p dụng cơng thức Bayes, ta có: </i>


Xác suất lơ hàng có tỷ lệ phế phẩm là 6% được chọn là:


P(H,)P(A/H.) 30'06 6


P(H[/A) 1 = — =


-P ( À ) 0,03 9


<i>Xác suất để lơ hàng có tỷ lệ phế phẩm là 2% được chọn là: </i>


P(H2)P(A/H2) 3'0'02 2


P(H2/A) = 2: = =


-P ( A ) 0,03 9
Xác suất để lơ hàng có tỷ lệ phế phẩm là 1% được chọn là:


P(H3)P(A/H3) 3'0'01 Ì


P(H3/A) = 3 : — — = =


</div>
<span class='text_page_counter'>(24)</span><div class='page_container' data-page=24>

<i>ẨỆiáữ trình bị thuyết xuê mối ồ tkốuạ. kê tốn </i>


C h ư ơ n g 2
<i>ĐẠI LƯỢNG NGẪU NHIÊN VÀ </i>


Q U I L U Ậ T P H Â N P H Ố I X Á C S U Ấ T


I- Định nghĩa và phân loại đại lượng ngẫu nhiên
Ì - Định nghĩa


<i>Đại lượng ngẫu nhiên (hay b i ế n ngẫu n h i ê n ) là m ộ t qui tắc hay </i>


môi h à m đ ể g á n các giá trị bằng sô cho những k ế t qua của m ộ t phép
thu ngầu nhiên.


Như vậy, khi thực hiện phép thử, đại lượng ngẫu nhiên sẽ nhận



một giá trị n à o đó trong tập hợp c á c giá trị mà nó có thể nhận. Việc
đ ạ i lượng ngẫu nhiên nhận giá trị cụ t h ể n à o là m ộ t b i ế n cố.


Các đại lượng ngẫu nhiên thường được ký hiệu là: X, Y, z,. . . Xi,


X2, . . . , xn ; Y i , Y2, . . . ., Ym ; C ò n c á c giá trị có thể có của
nó được ký h i ệ u là: Xi, x2<i> x„ ; y i , y% y</i>m


<i>Thí dụ ì: Tung một con xúc xắc, g ọ i X là số chấm xuất hiện thì X là </i>


đ ạ i lượng ngẫu nhiên vì trong k ế t quả của p h é p thử nó sẽ nhận một
trong 6 giá trị: Ì, 2, 3, 4, 5, 6. với x á c suất tương ứng đ ề u bằng 1/6.


<i>Thí dụ 2: G ọ i Y là số p h ế phẩm có trong 100 sản phẩm l ấ y ra kiểm </i>


tra. Y là đ ạ i lượng ngẫu nhiên vì trong k ế t quả của p h é p thử Y sẽ
nhận một trong các giá trị: 0, Ì, 2 , . . . , 100.


2- Phân loại đại lượng ngẫu nhiên


D ạ i lượng ngẫu nhiên có thể là rời rạc hoặc liên tục.


</div>
<span class='text_page_counter'>(25)</span><div class='page_container' data-page=25>

<i>@hư&nạ. 2: Dại lường, m/ẫti nhiên và qui luật phản pltối xòe. luốt </i>


Đối với đại lượng ngẫu nhiên rời rạc, ta có thể liệt kê được các
giá trị của nó.


<i>Đ ạ i lượng ngẫu nhiên được g ọ i là liên tục n ế u các giá trị mà nó có </i>
t h ể nhận có thể lấp kín cả một khoảng ư ê n trục số.



Đ ố i v ớ i đ ạ i lượng ngẫu nhiên liên tục, ta không thể l i ệ t k ê tất cả
các giá trị của nó.


<i>Thí dụ: số sinh viên vắng mặt trong mỗi buổi học ; sô máy hỏng </i>


trong từng ngày của một p h â n xưởng, . . . là các đ ạ i lượng ngẫu
n h i ê n rời rạc.


N ế u g ọ i X là trọng lượng của mộ t loạ i sản ph ẩ m do mộ t nhà m á y
sản xuất; Y là sai số khi đo lường một đ ạ i lượng vật lý; . . . . thì X, Y
là những đ ạ i lượng ngẫu nhiên liên tục.


li- Qui luật phân phối xác suất của đại lượng
n g ẫ u n h i ê n


Để xác định một đại lượng ngẫu nhiên ta phải biết đại lượng ngẫu


n h i ê n ấy có thể nhận cạc giá trị n à o và nó nhận các giá trị ấy với
x á c suất tương ứng là bao nhiêu.


M ộ t h ệ thức cho p h é p b i ể u d i ễ n m ố i quan hệ giữa các giá trị cố
thể nhận của đ ạ i lượng ngẫu nhiên v ớ i các x á c suất tương ứng đưck
<i>g ọ i là qui luật phân phối xác suất của đ ạ i lượng ngẫu nhiên </i>


Đ ể thiết lập qui luật p h â n phối xác suất của một đ ạ i lượng ngẫu
<i>nhiên ta có thể dùng: bảng phân phối xác suất hoặc hàm phân phối </i>


<i>xác suất hoặc hàm mật độ xác suất. </i>


Ì- Bảng phân phối xác suất



</div>
<span class='text_page_counter'>(26)</span><div class='page_container' data-page=26>

<i>CỊÌÚƠ trịnh Ị lị thuyết xóa mất ồ ỊhấỊỊtạ kè toán </i>


Giả sử đ ạ i lượng ngẫu nhiên X có thể nhận một trong các giá trị:
Xli X2, . . . ., xn


với các xác suất tương ứng là:
Pi, P2 Pn


Tức:pi = P(X = Xi)(i=l,2,...,n)


Bảng phân phối xác suất của X có dạng:


X <sub>Xi x</sub>2 Xn


p <sub>Pl P2 • • • • Pi, </sub>


<i>Đ ố i với bảng phân phối xác suất, ta lu*''li có: ọ = Ị </i>
Í=I


<i>Thí dụ: Trong hộp có lo sản phẩm (tronu dị oi 6 chính phẩm). Lấy </i>


ngẫu nhiên khơng hồn l ạ i từ hộp ra 2 sản phẩm. L ậ p bảng phân
phối của số chính phẩm được lấy ra ?


<i>Giải: Gọi X là số chính phẩm được lấy ra từ hộp thì X là đại lượng </i>


ngẫu nhiên rời rạc có thể nhận các giá trị: 0, 1 , 2 , v ớ i các xác suat
tương ứng:



c2 2


P l= P ( X = 0) = ^ f = - = :
cic; 8 c3 5


Vậy qui luật phân phối xác suất của X là:


X 0 1 2


p 2/15 8/15 5/15


</div>
<span class='text_page_counter'>(27)</span><div class='page_container' data-page=27>

<i>QitơơiHỊ 2: r-ùại ittơttạ ít (Ị VUI nhiên oà. iịiù luật phân phối xát' xuất </i>


Hàm phân phối xác suàt có thể thiết lập cho cả đại lượng ngẫu
nhiên r ờ i rạc và đ ạ i lượng ngầu nhiên liên tục.


<i>a- Định nghĩa: H à m phân phối xác suất của đ ạ i lượng ngẫu nhiên X </i>


[ký h i ệ u là F(x)] được định nghĩa bởi biểu thức:
F(x) = P(X < x)
Nếu X là đại lượng ngẫu nhiên rời rạc thì hàm F(x) có dạng:
F(x)= £P(X<X,)= XP,


XÉ<X x,<x


<i>b- Tính chất: Ta có thể chứng minh được các tính chất sau đây của </i>


h à m p h â n phối xác suất.


<i>* Tính chất ì: Hàm phân phối xác suất luôn luôn nhận giá trị </i>


trong khoảng [0, 1] , tức: 0 < F(x) < Ì


Tính chất này suy ra từ định nghĩa của F(x).


<i>* Tính chất 2: H à m p h â n phối xác suất là h à m không giảm. </i>
Tức là:


n ế u X2 > Xi thì F(X2> > F ( x i )


<i>Chứng minh: Thật vậy, ta có: </i>


(X < x2) = (X < Xi) + ( X I < X < x2)
Do đ ó :


P(X2 < X < Xi) = P(X < x2) - P(X < Xi) = F(x2) - F ( x 0
Vì: P(X| < x < x2) > 0 => F ( x2) - F ( x , ) > 0


V ậ y : F ( x2) > F ( x i )


T ừ tính chất 2 ta suy ra một số h ệ quả sau:


<i>Hệ quả 1: P(a < X < b) = F(b) - F(a) </i>


</div>
<span class='text_page_counter'>(28)</span><div class='page_container' data-page=28>

<i>ịịiào trình tý thuyết xịe luốt oà thõng kê toán </i>


<i>Hệ quả 2: X á c suất đ ể đ ạ i lượng ngẫu n h i ê n liên tục nhận giá trị </i>


xác định cho trước luôn bằng 0.


Thật vậy. Từ h ệ quả Ì, nếu ta đặt: a = X ; b = X + Ax, thì ta có:


P(x < X < X + Ax) = F(x + Ax) - F(x)


Lấy giới hạn cả hai vế khi Ax-> 0 ta có:


<i>Lim P(x < X < X + Ax) = Lim F(x + Ax) - F(x) </i>


Vì X là đại lượng ngẫu nhiên liên tục nên F(x) cũng liên tục tại X.
T ừ đó ta có:


<i>Lim F(x + Ax) = F(x) </i>


Ax->0
Khi Ax 0 thì: P(x < X < X + Ax) P(X = x)


V ậ y : P(X = X) = 0


<i>Hệ quả 3: Nếu X là đại lượng ngẫu nhiên liên tục thì: </i>


P(a < X < b) = P(a < X < b) = P(a < X < b) = P(a < X < b)
<i>* Tính chất 3: Lim F(x) = Ì ; Lim F(x) = 0 </i>


Tính chất này có thể viết dưới dạng:


F(+oo) = Ì ; F(-oo) = 0
<i>c- Ý nghĩa của hàm phân phối xác suất: </i>


T ừ định nghĩa của h à m phân phối xác suất ta thấy h à m F(x) phản
ánh mức độ tập trung xác suất về phía b ê n trái của đ i ể m X. Giá trị
của h à m F(x) cho biết có bao nhiêu phần của một đơn vị xác suất
phân phối trong khoảng ( - co, x).



</div>
<span class='text_page_counter'>(29)</span><div class='page_container' data-page=29>

<i>Giường. 2: <ĩ)a£ ỈKỌIHỊ ti gau 'thiền ồ q luật phàn phối xịe. luốt </i>
<i>a- Định nghĩa: Hàm mật độ xác suất của đại lượng ngẫu nhiên liên </i>


<i>tục X [ký h i ệ u là f ( x ) ] là đạo h à m bại hất của h à m p h â n phối. Tức: </i>
f(x) = F'(x)


<i>b- Tính chất: Hàm mật độ xác suất có các tinh chác sau lũy: </i>


<i>* Tính chất 1: f(x) > 0 (V x) </i>


Tính chất n à y suy ra từ tính chất 2 của h à m p h â n phối x á c suất.
D


<i>* Tính chất 2: P(a < X < b) = j f ( x ) d x </i>


<i>Chứng minh: Thật v ậ y , theo cơng thức Newton Leibnitz ta có: </i>


u


J f ( x ) d x = F(x) = F(b) - F(a)


Trong đó: F(x) là n g u y ê n h à m cua f ( x ) .
Theo hệ quả l(tính chất 2) của hàm phân phối xác suất thì:


F(b) - F(a) = P(a < X < b)
Do X là đ ạ i lượng ngẫu n h i ê n liên tục n ê n :


P ( a < X < b ) = P ( a < X < b )
T ừ đó suy ra đ i ề u cần p h ả i chứng minh.


về mặt hình học, tính chất 2 được minh họa như sau:


Xác suất để đại lượng ngẫu nhiên liên tục X nhận giá trị trong


</div>
<span class='text_page_counter'>(30)</span><div class='page_container' data-page=30>

<i>lịiúa trình lý thuyết xúc luốt ồ thống kè tốn </i>


<i>f(x) Ạ </i>


0 a b X


<i>* Tính chất 3: F(x) = J f ( x ) d x </i>


-co
I


<i>* Tính chất 4: Jf(x)dx = Ì </i>


-ao


B ạ n đọc có thể tự chứng minh 2 tính chất trên.


<i>c- Ý nghĩa của hàm mật độ: </i>


T ừ định nghĩa của h à m mật độ ta suy ra h ệ thức xấp xỉ:
P(x < X < X+Ax) « f(x)Ax


Tức là xác suất để X lấy giá trị thuộc một lân cận khá bé (x, x+ Ax)


gần như tỉ l ệ với giá trị của hàm f(x) t ạ i đ i ể m X. Vì vậy, với cùng độ
dài Ax như nhau, tại đ i ể m X nào mà giá trị của h à m f(x) lớn hơn thì ở


lân cận của đ i ể m ấy sẽ tập trung một xác suất lớn hơn. Chính vì thế
mà f ( x ) có t ê n là h à m mật độ xá c suất.


</div>
<span class='text_page_counter'>(31)</span><div class='page_container' data-page=31>

<i>nhương. 2: (Đại lưựitq. ttạẫu nhiên DÙ ỊịỊti Ị Ị lội phàn pỉtấì xáo mất </i>


Khi ta xác định được qui luật phân phối xác suất của đại lượng


ngẫu nhiên thì ta đã. n ắ m được tồn bộ thơng tin về đ ạ i lượng ngẫu
nhiên đó. Tuy nhiên trong thực t ế rất khó và cũng khơng cần thiết
phải nắm được tồn bộ những thơng tin này, mà chỉ cần quan t â m
đ ế n những thông tin quan trọng nhất, phản á n h các đặc trưng cơ bản
của đ ạ i lượng ngẫu n h i ê n đang n g h i ê n cứu. Phần n à y chúng ta n ê u
ra một vài tham số đặc trưng quan trọng nhất, phản á n h từng mặt của
một đ ạ i lượng ngẫu nhiên.


Ì- Kỳ vọng toán


<i>a- Định nghĩa: Giả sử X là một đại lượng ngẫu nhiên rời rạc có thổ </i>


nhận các giá ưị: X i , X2, . . . ., xn v ớ i c á c x á c suất tương ứng: Pi, P2, .
. . ., p„. Kỳ vọng toán của đ ạ i lượng ngẫu nhiên X [ký h i ệ u là E ( X ) ]
là tổng các tích giữa các giá trị có thể có của đ ạ i lương ngẫu n h i ê n
v ớ i các x á c suất tương ứng.


E(X)=5>iPi


<i>1</i> UI


N ế u X là đ ạ i lượng ngẫu nhiê n liên tục có h à m mậ t đ ộ x á c suất là
f(x) thì kỳ vọng tốn được xác định bởi b i ể u thức:



+00


E ( X ) = j x f ( x ) d x
-00


<i>b- Các tính chất: </i>


<i>* Tính chất ì: Kỳ vọng tốn của hằng số bằng chính hằng số đ ó . </i>
T ứ c :


E(C) = c ( v ớ i c là hằng số)


<i>Chứng minh: Thật vậy, hằng số c có thể xem như một đại lượng </i>


ngẫu nhiên đặc biệt, chỉ nhận một giá trị có t h ể có là c v ớ i x á c xuất
tương ứng bằng Ì. Do đó theo định nghĩa:


E(C) = C.l =c


</div>
<span class='text_page_counter'>(32)</span><div class='page_container' data-page=32>

<i>Kj.iáa trình lý tíuiiịẾÍ xúc Mất lùi Ịhmiụ kè tốn </i>


<i>* Tính chất 2: E(CX) = C.E(X) (với c là hằng số) </i>


<i>Chứng minh: Thật vậy, giả sử đại lượng ngẫu nhiên X có luật phân </i>


phối xác suất là:


X Xi X2 xn



p <sub>Pl P2 Pn </sub>


Khi đó c x sẽ là đ ạ i lượng ngẫu nhiên r ờ i rạc mà các giá trị có thể
có là:


C x i , CX2, . . . ., C xn
M ặ t khác, do


nên:


(X = Xi) = (CX = CXi) ( i = l , 2 , . . . , n )


P(X = Xj) = P(CX = CXj) (i=l,2,...,n)


NHƯ vậy hảng phân phối xác suất của đ ạ i lượng ngẫu nhiên c x có
dạng:


c x <sub>C x i C x</sub>2 C xn


p <sub>Pl P2 Pn </sub>


Theo định nghĩa ta có:
E(CX) = ịcxiPi = C5>iPi = CE(X) •


i = l i = 1


<i>* Tính chất 3: Kỳ vọng tốn của tổng hai đ ạ i lượng ngẫu nhiên </i>
bằng tổng các kỳ vọng toán-thành phần. Tức là:


E(X+Y) = E(X) + E(Y)



<i>Chứng minh: Giả sử X, Y là các đại lượng ngẫu nhiên rời rạc có luật </i>


</div>
<span class='text_page_counter'>(33)</span><div class='page_container' data-page=33>

<i>thường. 2: (Đại lượt vạ. ngẫu /thiền ứà qui luật phàn, phát xịe, tuảí </i>


X Xi x2 . . . . . xn
p <sub>Pi </sub> p2 . . ... pn


Y <sub>y i </sub> <sub>y2 •• </sub><sub>• . - y</sub>m


p <sub>qi </sub> • • qm


K h i đó ta có luật p h â n p h ố i x á c suất của đ ạ i lượng ngẫu nhiên tổng
( X + Y ) như sau:


X + Y ( X i + y i ) ( X i + y2) . . . . (Xi+yj) . . • • (Xn+ym)


p <sub>P n </sub> <sub>P12 </sub> <sub>Pij </sub> <sub>• • pnm </sub>


Trong đ ó : Pij là x á c suất đ ể đ ạ i lượng ngẫu nhiên ( X + Y ) nhận giá
trị:(Xj + yj). ( i = l , n : i = ì . m ì


Theo định nghĩa kỳ vọng tốn ta có:


<i>n m n m n m </i>


E(X + Y ) = Z E ( X i + y j ) p . j = S E X i . p i j + z z >j.Pij
i = l j=l i = l j=l i=l J=l


n m m n


= z x i Z Pij + Z y j E pij


1=1 j=l j=l 1=1
m


<i>Ta sẽ chứng minh rằng: 2! Pij = Pi ( V i = l , n ) . </i>
H


Thật vậy: B i ế n c ố ( X = Xi) sẽ x ả y ra khi tổng ( X + Y ) nhận m ộ t
trong c á c giá trị: (Xi + y O ; (Xi + y2) ; . . . ỉ (Xi + ym) ;


Do đó theo cơng thức cộng x á c suất ta có:


</div>
<span class='text_page_counter'>(34)</span><div class='page_container' data-page=34>

<i>(}iúữ trình bị Uutạết xác mất vù ihấnq kê toán </i>


Tương tự ta cũng chứng minh được: X Pij = Qj (Vị = Ì, m )


Từ đó ta có:


li m


E ( X + Y ) = X Xi p, + z y j qj = E(X) + E(Y)
i=l j=l


Bằng phương pháp qui nạp ta có thể chứng minh được tính chất trên
trong trường hợp tổng quát:


<i>Kỳ vọng toán của tổng li đại lượng ngẫu nhiên: Xi, x2, . . . , XH </i>
<i>bằng tổng các kỳ vọng toán thành phần. Tức là: </i>



E(Xi + x2 + ... + x„) = E(Xi) + E(X2) + ... +E(Xn)


<i>* Tính chất 4: Kỳ vọng tốn của tích hai đại lượng ngẫu nhiên </i>
độc lập bằng tích các kỳ vọng toán của chúng. Tức là:


E ( X Y ) = E ( X ) . E ( Y ) n ế u X , Y độc lậ p


<i>Chứng minh: Giả sử X và Y là hai đài lượng ngẫu nhiên rời rạc. sử </i>


dụng các ký h i ệ u ở phần chứng minh tính chất 3, ta có:
n tu


E ( X Y ) = 2 Z Xi y j Pij
i=i j=i


Vì X , Y độc lập nên:
Pij = Pi-qj (Vi=l,n ;j = l,m)


Do đó:


n m


E ( X Y ) = S XiP. E y j qj = E(X).E(Y)
i = l ^ j=l


</div>
<span class='text_page_counter'>(35)</span><div class='page_container' data-page=35>

<i>ẽhư&tiạ 2ĩ ^Đạì lượng, itạẫii nhiên ồ qui luật phần phố! góc luốt </i>
<i>Kỳ vọng tốn của tích H đại lượng ngẫu nhiên độc lập vối nhau bằng </i>


<i>tích các kỳ vọng tốn của chúng. Tức là: n ế u X i , X2, . . . , x „ độc </i>



lập, thì:


E ( X j X2. . . x „ ) = E ( X i ) . E ( X2) . . . E ( Xn)
<i>* Chú ý: Ì - Hai đại lượng ngẫu nhiên được gọi là độc lập với nhau </i>


n ế u qui luật phâ n phố i xá c suất của đ ạ i lượng ngẫu nhiê n n à y k h ô n g
phụ thuộc gi v à o việc đ ạ i lượng ngẫu nhiên kia nhận giá trị bằng bao
nhiêu.


2- Tổng của hai d ạ i lươn? ngẫu nhiên X và Y là đ ạ i lượng
ngẫu nhiên ( X + Y ) mà các iii.i UỊ co thể có của nó là tổng của m ỗ i
giá trị có thể có của X và m ỗ i giá trị có t h ể có của Y. N ế u X , Y độc
lập v ớ i nhau thì các xác suất tương ứng sẽ bằng tích các x á c suất
thành phần. N ế u X, Y phụ thuộc nhau thì các xác suất tương ứng sẽ
bằng tích xác suất của thành phần này v ớ i x á c suất có đ i ề u k i ệ n của
thành phần kia.


<i>c- Bản chất và ý nghĩa của kỳ vọng toán </i>


Đ ể thấy được bản chất của kỳ vọne toán, ta xét các thí dụ sau đ ậ y :


<i>Thí dụ ì: M ộ t lớp có 50 sinh viên, trong kỳ thi m ơ n tốn có k ế t quả </i>


cho ở bảng sau:


Đ i ể m 3 4 5 6 7 8 9


S ố s/v 3 7 15 10 5 6 4


N ế u g ọ i X là đ i ể m thi m ơ n tố n của mộ t sinh v i ệ n chọn nsẫ u


nhiên từ lớp này thì X là đ ạ i lượng ngẫu nhiên có qui luật p h â n phối
x á c suất như sau:


X 3 4 5 6 7 8 9


p 0,06 0,14 0,3 0,2 0,1 0,12 0,08


</div>
<span class='text_page_counter'>(36)</span><div class='page_container' data-page=36>

<i>íịuiữ trình Lị thuyết ạẹtịe tuất MÌ ÚLốnạ kè tữáti </i>


E(X) = 3x0,06+ 4x0,14 + 5x0,3 + 6x0,2 +7x0,1+ 8x0,12 + 9x0,08
Ta cũng có thể v i ế t :


3x 3 + 7x4 + 15x5 + 10x6 + 5x7 + 6x8 + 4x9
E ( X ) =


50


= 5,82


D ễ thấy rằng, E(X) chính là đ i ế m thi trung bình m ơ n tốn của một
sinh viên lớp đó.


<i>Thí dụ 2: Nghiên cứu về thu nhập của công nhân ngành dệt, giả sử </i>


có sơ l i ệ u cho ở bảng sau:'


Thu nhập (tr.đ/năm) 7 8 9 10 l i 12 14


Số C N ( 1 0 Ơ 0 người) 50 70 150 120 55 30 25
Gói Y là thu nhập của công nhân n g à n h dệt, từ số l i ệ u ở bảng trên


.1 s. ú bảng phân phối x á c suất của Y n h ư sau:


1 Y 7 8 9 10 l i 12 14


1 p 0,1 0,14 0,3 0,24 0,11 0,06 0,05
Vạy ta có:


• =7x0,1+8x0,14+9x0,3+10x0,24+11x0,1 l + 12x 0,06+14x0,05
•50 + 8x70 + 9x150 + 10x120 + 11x55 + 12x30 + 14x25


500 = 9,55


Như vậy, trong thí dụ này, E(Y) = 9,55 t r i ệ u đ / n ă m chính là thu
: ' ũ p trung bình của mộ t côn g n h â n n g à n h d ệ t


V ày kỳ vọng toán của đ ạ i lượng ngẫu n h i ê n chính là giá trị trung
hình của đ ạ i lượng ngẫu nhiên đ ó . Chẳng hạn, N ế u X là chiều c a ơ


<i>í một l o ạ i cây (cùpg độ tuổi) thì E(X) là chiều cao trung bình của </i>


</div>
<span class='text_page_counter'>(37)</span><div class='page_container' data-page=37>

<i>Qítitưttạ 2: Dai tường, nạẫu /thiên tìà giũ luật phân phối xịe xuất </i>


Long của năm 2001 thì E(Y) là năng suất lúa ưung bình ở vùng này
trong n ă m đó.


Trong thực t ế người ta thường l ấ y một mẫu gồm n quan sát đ ể
nghiên cứu v ề một tổng thể. K h i đó kỳ vọng tốn của đ ạ i lượng ngẫu
nhiên xấp xỉ v ớ i trung bình số học các giá trị quan sát của đ ạ i lượng
ngẫu nhiên (trung bình mẫu). Kỳ vọng tốn phản ánh giá trị trung
tâm của một phân phối x á c suất, có nhiều giá trị của đ ạ i lượng ngẫu


nhiên nhận giá trị gần v ớ i kỳ vọng tốn. Chẳng hạn, ở thí dụ 2 nêu
trên, ta có E(Y) = 9,55 có nghĩa là có nhiều cơng nhân n g à n h dệt có
mức thu nhập xấp xỉ ở mức 9,55 triệu đ/năm. Cụ thể là có 150 ngàn
cơng nhân có mức thu nhập 9 triệu đ/năm và 120 ngàn cơng nhân có
mức thu nhập 10 triệu đ/năm.


2- Phương sai


Trong thực t ế , nhiều khi n ế u chỉ xác định kỳ vọng toán của đ ạ i
lương ngẫu nhiên thì chưa đủ. Đ ể xác định một đ ạ i lượng ngẫu nhiên
ta c ò n phải x á c định mức độ phân lán các giá trị của đ ạ i lượng ngẫu
n h i ê n xung quanh giá trị trung bình của nó. Chẳng hạn, khi n g h i ê n
cứu đ ạ i lượng n g l u nhiên là năng suất lúa của một vùng n à o đ ó , thì
n ă n g suất lúa trung bình (kỳ vọng tốn) mới chỉ phản ánh được một
mặt của đ ạ i lượng ngẫu nhiên này. Mức độ chênh lệch v ề n ă n g suất
(so v ớ i n ă n g suất trang bình) ở những thửa ruộng khác nhau cũng là
v ấ n đ ề c ầ n quan t â m nghiên cứu. B ở i vì n ế u mức độ chênh lệch n à y
nhỏ thì chứng tỏ giống lúa đó có năng suất khá ổ n định. T ừ đó ta có
khái n i ệ m v ề phương sai


<i>a- Định nghĩa: Phương sai của đại lượng ngẫu nhiên X, ký hiệu là </i>
V a r ( X ) [hoặc D ( X ) ] , được định nghĩa bằng công thức:
Var(X) = E{[X-E(X)]2}


<i>Chú ý: Phương sai được định nghĩa bằng một công thức. Nhưhg </i>


</div>
<span class='text_page_counter'>(38)</span><div class='page_container' data-page=38>

<i>Qiáo trình bị tluiụết xác ấl ồ thống, kè tõúti </i>


Var(X)=£[x, -E(X)]2Pi



UI
• Nếu X là đại lượng ngẫu nhiên liên tục thì:


+00


V a r ( X ) = j [ x - E ( X ) ]2f ( x ) d x
—00


Trong thực tế người ta thường tính phương sai bV. Long thức:
Var(X) = - LE(X)]2


Thật vậy: Theo định nghĩa của phương sai, ta có:
Var(X) = Ế(IX- E(X)]2} = E{X2<i> - 2XE(X) + [EỌQ]2} </i>


= E(X2) - 2E(X).E(X) r LUX)]2 = EfX2) - E(X)]2


<i>Thí dụ: Cho đại lượng ngẫu nhiên X có Ì .li phàn phối xác suất như </i>


sau:


X 1 3 4


p 0,1 0,5 0,4


Tìm phương sai của X ?


<i>Giải: Theo định nghĩa kỳ vọng tốn ta có: </i>


E(X) = lx 0,1 + 3x 0,5 + 4x 0,4 = 3,2
E(X2) = 12X 0,1 + 32x 0,5 + 42x 0,4 = li


Vậy: VaitX)= li-(3,2)2 = 0,76


<i>b- Cát: tính chất của phương sai: </i>


<i>* Tính chất ì: Phương sai của hằng số bao giờ cũng bằng 0. </i>
Tức là:


</div>
<span class='text_page_counter'>(39)</span><div class='page_container' data-page=39>

<i>ểhươttụ 2: Dai lương. Itạẫa nhiên oà qui luật phân phối xịe iitãt </i>
<i>* Tính chất 2: V a r ( C X ) = c</i>2 V a r ( X ) (với c là hằng s ố )
Dựa vào định nghĩa của phương sai ban toe có thể tự chứng minh
hai tính chất trên.


<i>* Tính chất 3: N ế u X , Y là hai d ạ i lượng ngẫu nhiên độc lập thì: </i>
Var(X + Y) = Var(X) + Var(Y)


<i>Chứng minh: Theo cơng thức tính phương sai ta có: </i>


Var(X +Y) = E [ ( X + Y )2] - [E(X+Y)]2


= E ( X2 + 2 X . Y + Y2) - [E(X) + E(Y)]2
= E ( X2) + 2E(XY) + E ( Y2) - [E(X)]2 - [E(Y)]2 - 2 E ( X ) . E ( Y )
Vì X, Y độc lập nên:


E ( X Y ) = E(X).E(Y)
V ậ y :


Var(X + Y ) = E ( X2) - [E(X)]2 + E ( Y2) - [E(Y)]2
Hay:


Var(X +Y) = Var(X) + Var(Y)



<i>Trường hợp tổng quát, nếu Xi, x</i>2, . . . , Xn là n đại lượng ngẫu
nhiên độc lập thì:


Var(Xi + x2 + ... + xn) = Var(Xị) + Var(X2) + ....+ Var(Xn)


Bằng phương pháp qui nạp bạn đọc có thể chứng minh kết luận trên.
T ừ tính chất 3 ta có thể chứng minh được các hệ quả sau:
<i>* Hệ quả ì: Var(X - Y) = Var(X) + Var(Y) Nếu X, Y độc lập </i>


<i>Chứng minh: Thật vậy, theo tính chất 3 của phương sai ta có: </i>


</div>
<span class='text_page_counter'>(40)</span><div class='page_container' data-page=40>

<i>(ịiáữ trình bị ưuujjếl xóa mất im ưiốtiạ kè tơáti </i>


<i>= Var(X) + ( - l )</i>2V a r ( Y ) = Var(X) + Var(Y)
<i>* Hệ quả 2: Var(C + X) = Var(X) (với c là hằng số) </i>


<i>c- Bản chất và ý nghĩa của phương sai: </i>


Ta thấy, kỳ vọng toán của một đ ạ i lượng ngẫu nhiên là giá trị
trung bình của đ ạ i lượng ngẫu nhiên đó (trong sản xuất cơng nghiệp,
kỳ vọng toán thường là giá trị qui định. Chẳng hạn như : đường kính
qui định, trọng lượng qui định, . . . )• C ị n thực t ế sản xuất ra những
sản phẩm có đường kính, trọng lượng, . . . . sai l*ệch so với qui định.
Độ sai lệch này được đặc ưưng bởi đ ạ i lượng ngẫu nhiên: [ X - E(X)]
. Mà phương sai được định nghĩa bởi công thức:


, Var(X) = E { [ X - E ( X ) ]2}
<i>Như vậy, thực chất của phương sai là:" kỳ vọng toán của bình </i>



<i>pììUitng các sai lệch" hay nói một cách k h á c " Phương sai là sai </i>
<i>lệch bình phương trung bình", nó phản á n h mức độ p h â n tán các </i>


giá trị của đ ạ i lượng ngẫu nhiên xung quanh giá trị trung bình. Đại
lượng nào có nhiều giá trị sai lệch lớn so v ớ i giá ừị trung bình thì
phương .vù sẽ lớn; Đ ạ i lượng n à o có nhiều giá trị sai lệch ít so với
giá trị trung bình thì phương sai sẽ nhỏ.


Trong sản xuất công nghiệp, phương sai thường biểu thị độ chính


xác của sản xuất. Trong chăn nuôi, phương sai b i ể u thị mức độ đồng
đ ề u của đàn gia súc. Trong trồng trọt, phương sai b i ể u thị mức độ ổn
định của năng suất cây trồng....


3- Độ lệch chuẩn


Ngoài phương sai ra, người ta còn sử dụng một tham số khác để
đặc trưng cho mức độ phân tán của đ ạ i lượng ngẫu nhiên đó là độ
lệch chuẩn.


</div>
<span class='text_page_counter'>(41)</span><div class='page_container' data-page=41>

<i>(Hiứơỉiq 2: Dại lưựttạ. Iiạẫu ttỉtiẻti oà rụii luật phân phết, xòe, luốt </i>


Ơ ( X ) = V V a r ( X )


Ta tha) rằng đơn vị đo của phương sai bằng bình phương đơn vị


đo của đ ạ i lượng ngẫu nhiên. Vì vậy khi cần phải đánh giá mức độ
phân tán các giá trị của đ ạ i lượng ngẫu nhiên theo đơn vị đo của n ó ,
người ta thường dùng độ lệch tiêu chuẩn, vì độ lệch tiêu chuẩn có
cùng đơn vị đo v ớ i đ ạ i lượng ngẫu nhiên đang nghiên cứu.



4- Giá trị tin chắc nhất


<i>a- Định nghĩa: Giá trị tin chắc nhất của đại lượng ngẫu nhiên rời rạc </i>


X [ký hiệu là Mod(X)] là giá trị của X ứng với xác suất lớn nhất
trong bản" phân phối x á c suất.


N ế u X là đ ạ i lượng n^ảu nhiê n liên tục có h à m mậ t độ xá c suất f ( x )
thì Mođ(X) là giá trị của X ma l ạ ; .Tó h à m m ạ i độ đạt giá tri cức đai.


<i>h- Thí dụ: Đ ạ i lượng ngầu nhiên X có qui luật p h â n phối xác suất </i>


nhu U u


X 7 8 9 <i>ị </i> <sub>l i 12 14 </sub>


p 0,1 0,14 0,3 , 0,24 0,11 0,06 0,05
Ta thấy P(X = 9) = 0,3 lớn nhất. Vì vậy Mod(X) = y


T ừ định nghĩa của Mod(X) ta thấy Mod(X) chính là giá trị có khả
n ă n g xảy ra nhiều nhất trong các giá trị mà đ ạ i lượng ngẫu nhiên X
có thê nhận. Chẳng hạn, X là chiều cao của sinh viên trong m ộ t
trường, thì M o d ( X ) là chiều cao mà nhiều sinh viên đạt được
nhất-N ế u Y là n ă n g suất của những côn g nhâ n trong một nhà m á y thì
M o d ( Y ) là n ă n g suất mà số công nhân đạt được mức n ă n e suất n à y ở
nhà m á y là nhiều n h ấ t . . .


<i>* Chú ý: Mod(X) có thể nhận nhiêu ÚI lác nhau. </i>



</div>
<span class='text_page_counter'>(42)</span><div class='page_container' data-page=42>

<i>LjJảữ trinh lý. thuyết xác mất oà ttiếng kê toán </i>


Y 1 2 3 4 5 6 7


p 0,1 0,15 0,3 0.3 0.08 0,05 0,02
Ta thấy xá c suất lớn nhất trong bảng trê n là 0,3 ứng vớ i hai giá trị
Y = 3 và Ý = 4. V ậ y Mod(Y) = 3 hoặc M o d ( X ) = 4.


5- M ộ t s ố t h a m s ố đ ặ c t r ư n g k h á c


<i>5.1 Mô men </i>


<i>Định nghĩa ỉ: Mô men gốc cấp k (ký hiệu là Gtịc) được định nghĩa </i>


như sau:


ak= E [ ( X )k]
I


<i>Định nghĩa 2: Mo men nung tâm cấp k (ký hiệu là I^k) được định </i>


nghĩa nh ư sau:


^ = E | x - E ( X ) ] k }
Như vậy, kỳ vọng tốn chính là mơ men gốc cấp một: E(X) =


(X|-phương sai chính là mô men trung tâm cấp hai: Var(X) = f i2
-Giữa mơ men gốc và mơ men trung tâm có mối liên hệ như sau:


= Var(X) = E(X2) - [E(X)f = a2 - (a,)2


H3 = a3- 3ctia2 +2(ct|)3


H4 = a4 - 4a,a3 + 6(a,)2a2 - 3(ct|)4
<i>5.2 Hệ số bất đối xứng </i>


Ta gọi: s3 = -^i


ơ


là h ệ số bất đ ố i xứng của đ ạ i lượng ngẫu nhiên X (trong đó ơ là độ
lệch chuẩn).


</div>
<span class='text_page_counter'>(43)</span><div class='page_container' data-page=43>

<i>ẽluứfug. 2: rĐại lưựtiạ Ịiạẫa nhiên nà qui luật phân phổi xóa xuất </i>


X é t biểu thức cùa }j-3 ta có:


<i>ịi3 = E|X - E(X)f } =</i> +j[x - E(X)]3 f (x)dx


Bằng phép tịnh liến trục Oy đến dường thằng X = E(X) ta thấy:


(i) N ế u đỏ thị của h à m mật độ f(x) đ ố i xứng qua đường thẳng
<i>X = E(X) thì ịi3</i> = 0 (hình v ẽ )


E(X)


(li) N ế u 1^3 > 0 thì đồ thị của hà m mát độ f(x ) khơn g đói xứng qua
đường thẳng X = E(X), phàn phối của X lệch vé phía bèn phải. (hình
v ẽ )


E(X)



(iii) ) N ế u H3 < 0 thì đồ thị của hà m mật độ f(x ) không đ ố i xứng
qua đường thẳng X = E(X), phân phối của X lệch về phía b ê n trái.
(hình v ẽ )


</div>
<span class='text_page_counter'>(44)</span><div class='page_container' data-page=44>

<i>Ếịiáữ trình, lý. thuyết xúc mất ồ thống, kê toán </i>


1 M 4


ơ


<i>5.3 Hệ số nhọn </i>


Ta gọi:


là hệ số nhọn của đại lượng ngẫu nhiên X.


Nếu N4 của mót đại lượng ngẫu nhiên càng lớn thì đồ thị cửa hàm
!•.."•! ít. tua đ ạ i lượng ngẫu nhiên đó càng nhọn. (hình v ẽ )


<i>À </i>


<i>5.4 trung vị </i>


Trung vị của đại lượng ngẫu nhiên X [ký hiệu là Međ(X)] là gia tri


chia phân phối của đ ạ i lượng ngẫu nhiên thành hai phần bằng nhau.
Nếu X là đại lượng ngẫu nhiên rời rạc thì giá trị Xi sẽ là giá trị


trung vị nếu:



F (X i) < 0 , 5 < F ( xi + 1)
Nếu X là đại lượng ngẫu nhiên liên tục thì trung vị là giá trị Me


thỏa m ã n điều k i ệ n :


Me


</div>
<span class='text_page_counter'>(45)</span><div class='page_container' data-page=45>

<i>@fu/&tiạ 3: Mệt lố ạttì luật phán phổi xóa luốt lítéhtạ dụng </i>


Chương 3


M Ộ T S Ố Q U I L U Ậ T P H Â N P H Ố I
<i>X Á C S U Ấ T T H Ô N G D Ụ N G </i>


I- Qui luật nhị thức


Ì - B à i t o á n t ổ n g q u á t d ẫ n đ ế n q u i l u ậ t n lị t h ứ c


Giả sử tiến h à n h n p h é p thử độc lập, gọi A là biến c ố n à o đó m à ta
cần quan tâm. Trong m ỗ i p h é p thử chỉ có thể xảy ra một trong hai
trường hợp: Hoặc b i ế n c ố A xảy ra, hoặc A không x ả y ra. X á c suất
đ ể cho A xảy ra trong m ỗ i p h é p thử đ ề u bằng p. G ọ i X là số l ầ n b i ế n
c ố A x ả y ra ương n p h é p thử, thì X là đ ạ i lượng ngẫu nhiên r ờ i rạc
có thể nhận các giá trị: 0, Ì, 2 n, v ớ i các x á c suất tương ứng
được tính theo cơng thức Bernoulli:


Px = P(X = x)=C>V'X (3.1)


(Vx = 0, l , 2 , . . . , n )


2- Định nghĩa: Đại lượng ngẫu nhiên rời rạc X nhận một trong các


giá trị: 0, Ì, 2 , n, v ớ i các xác suất tương ưng được tính theo
công thức (3.1) g ọ i là p h â n phối theo qui luật nhị thức v ớ i các tham
số n và p.


Đ ạ i lượng ngẫu nhiên X p h â n phối theo qui luật nhị thức được ký
hiệu là: X ~ B(n, p)


N ế u X ~ B(n, p) và ta cần tính P(X = x) hoặc P(X < x) thì có th ể
dùng h à m BINOMDIST trong Excel.


</div>
<span class='text_page_counter'>(46)</span><div class='page_container' data-page=46>

P(X < X) =BIN0MDIST(x,n,p,1)


(Phần được đóng khung là câu lệnh, sau khi gõ xong câu lệnh nhấn
phím Enter, k ế t quả sẽ xuất hiện)


<i>Thí dụ: X ~ B(50; 0,3) Tính P(X = 16) và P(12 < X < 18) </i>


P(X = 16) =BINOMDIST(16,50,0.3,0) = 0,1147
P(12 < X < 18) = P(X < 18) - P(X < li) =


=BINOMDIST(18,50,0.3,1)-BINOMDIST(11,50,0.3,1) = 0,7204
Trong thực tế, nhiều khi ta cần tính xác suất để đại lượng ngẫu


nhiên X phân phối theo qui luật nhị thức nhận giá trị trong khoảng
(x, x+h) (với h nguyên dương và h < n - x). K h i đó ta ấp dụng công
thức sau đây:


P(x < X < x+h) = Px + Px+l + + Px+h (3.2)



Trong đó: Px, Px+1, . . . , Px+h được tính theo cơng thức (3.1)


<i>Thí dụ: M ộ t phân xưởng có 5 m á y hoạt động độc lập. x á c suất để </i>


trong một ngày m ỗ i m á y bị hỏng đ ề u bằng 0,1. T i m x á c suất đ ể :
(a) Trong một ngày có 2 m á y hỏng.


(b) Trong một ngày có khơng q 2 m á y hỏng.


<i>Giải: Nếu coi việc quan sát hoạt động của một máy trong ngày là </i>


một p h é p thử thì ta có 5 p h é p thử độc lập. Trong m ỗ i p h é p thử chỉ có
hai trường hợp có thể xảy ra: hoặc m á y hỏng hoặc m á y k h ô n g hỏng.
Xác suất máy bị hỏng đ ề u bằng 0,1. G ọ i X là số m á y hỏng trong một
ngày thì X ~ B ( 5 ; 0,1).


(a) Xác suất để có 2 máy hỏng trong ngày chính là P(X = 2)
Theo cơng thức (3.1) ta có:


</div>
<span class='text_page_counter'>(47)</span><div class='page_container' data-page=47>

<i>(ỉllượt uy 3:Jiù}t íố ÍỊJIÌ luật phán phối xác mối thơng, di í nạ </i>


(b) X á c suất đ ể trong ngày có khơng q 2 m á y hỏng chính là
P ( X < 2 ) . Ta thấy:


P(X < 2) = P(0 < X < 2)
Á p dụng cơng thức (3.2) ta có:


P(0<X<2) = P(X = 0) + P(X= 1) + P(X = 2) = P„+P| + p2
Theo cơng thức (3.1) ta có:



P(X = 0) = p0 = c° (0,1)° (0,9)5 = 0,59049
P(X = 1) = p, = c; (0,1)' (0,9)4 = 0,32805


V ậ y :


P(X < 2) = 0,59049 + 0,32805 + 0,0729 = 0,99144
3- Các tham số đặc trưng:


<i>a- Kỳ vọng toán: Nếu X ~ B(n , p) thì: </i>


E ( X ) = np


<i>Chứng minh: Thật vậy, Gọi X là số lần xuất hiện biến cố A trong </i>


p h é p thử thứ i (i = Ì, 2, . . . , n). Xi là các đ ạ i lượng ngẫu nhiên độc
lập và đ ề u có qui luật phân phối xác suất như sau:


Xi 0 1


p <sub>q p </sub>


Theo định nghĩa kỳ vọng tốn, ta có:
E(Xj) = 0.q+ l.p = p (Vi =1,2, , ạ)


</div>
<span class='text_page_counter'>(48)</span><div class='page_container' data-page=48>

<i>Xịiáa hình tý. thuyết XĨM, mất vá. thống, kê toán </i>
<i>b- Phương sai: N ế u X ~ B(n , p) thì: </i>


Var(X) = npq



<i>Chứng minh: Thật vậy, Từ luật phân phối xác suất của X ở trên ta </i>


tính được:


E ( X ; ) = 02.q + l2. p = p
Theo cơng thức tính phương sai, ta có:


Var(Xi) = E(X,2<i>)- [E(X,)f = p -p2</i> = p(l - p) = pq


Var (X) = Var(Xi + x2 + . .-. + xn) = npq
<i>c- Giá trị tin chắc nhất: </i>


Ngồi cách tìm Mod(X) từ bảng phân phối xác suất của X. Người
ta đã chứng minh rằng: N ế u X ~ B(n , p) thì ta có thể á p dụng cơng
thức sau để tìm Mod(X):


np - q 5 Mod(X) < np + p (3.3)


<i>Chứng minh: Gọi Xo là Mod(X). Theo định nghĩa của mod(X) ta </i>


có:


P(X = X0) > P ( X = X0-|) (3.4)




P(X = Xo) > P(X = x0 +<i>i ) (3.5) </i>


Ấp dụng cơng thức Bernoulli ta có:



P(X=X„) = Cn x opxy -x o ; P ( X = XX 0_ , ) = Cx o -l px o - iq. - x w
Từ (3.4) ta suy ra:


CX0p.X0qn-.X0


</div>
<span class='text_page_counter'>(49)</span><div class='page_container' data-page=49>

<i>("hường. 3: Mệt úi qui luật phân phối xịe, tuất thơng. íitutg. </i>


o^^>-l «(n-x1+l)p>x0q
*0.q


ox0(p + q)<(n + l)p =>x0<np + p (3.6)


Tương tự, từ (3.5) ta cũng chứng minh được:


Xo > np - q (3.7)
Kết hợp (3.6) và (3.7) ta được:


np - q < Xo < np + p


<i>ả- Thí dụ: Một máy sản xuất được 200 sản phẩm trong một ngày. </i>


X á c suất đ ể máy sản xuất ra p h ế phẩm là 0,05. T i m số p h ế phẩm
trung bình và số p h ế phẩm tin chắc nhất của m á y đó trong một n g à y


<i>Giải: Gọi X là số phế phẩm của máy trong một ngày thì </i>


X~B(200, 0,05). S ố p h ế phẩm trung bình của máy trong một ngày
chính là E(X). Theo cơng thức tính kỳ vọng tốn của đ ạ i lượng ngẫu
nhiên p h â n ' p h ố i theo qui luật nhị thức ta có:



E(X) = np = 200x 0,05 = 10


Số p h ế phẩm tin chắc nhất của máy trong một ngày chính là
Mod(X).


Ta có:


• np - q = 200 X 0,05 - 0,95 = 9,05
np + p = 200 X 0,05 + 0,05 = 10,05
Vậy theo cơng thức (3.3) ta có:


9,05<Mod(X)< 10,05


</div>
<span class='text_page_counter'>(50)</span><div class='page_container' data-page=50>

<i>ỊẬiáo trình tý thuyết xác mất ồ Hiếng, kè tốn </i>


l i - Q u i l u ậ t P o i s s o n .


Ì- Bài tốn tổng qt dẫn đến qui luật Poisson


Giả sử t i ế n hành n phép thử độc lập, trong m ỗ i p h é p thử chỉ có thể
xảy ra một trong hai trường hợp: hoặc b i ế n c ố A xảy ra, hoặc A
không xảy ra. Xác suất đ ể cho b i ế n cố A x ả y ra trong m ỗ i phép thử
đều bằng p, xác suất đ ể A không xảy ra đ ề u bằng q (q = Ì - p).
G ọ i X là số l ầ n biến cố A xảy ra trong n p h é p thử thì X phàn phối
theo qui luật nhị thức. Trường hợp n lớn, p nhỏ (p < 0,1) và tích
<i>np = Ằ khơng đ ổ i thì ta có cơng thức xấp xỉ sau đây: </i>


pk = P(X = k ) = Cn k p kqn-k<i>* ^ 7 e 'x </i>
<i>kỉ </i>



Trong đó e là hằng số n ê p e :


<i>( </i>


e = L i m 1 + -Ì


<i>Chứng minh: </i>


<i>Thây vậy: Do np = X => p = </i>
n


e « 2,71828


q = l - p = l - <i>X </i>
n
n!


k ! ( n - k ) !


Y
1 _
V


\ n-k


<i>n ( n - l ) ( n - k + 1) xk (</i> <i>Ị</i> <i>_ v n-k </i>


Vì:


V n<i> A </i>


<i>ỉ </i>


L i m
- ì
Hy


<i>í </i>


k - 1 <i>k ỉ </i>
n J k ! 1


<i>-X </i>


n


<i>1 - Ị </i>
<i>\ n-k </i>


</div>
<span class='text_page_counter'>(51)</span><div class='page_container' data-page=51>

<i>ũíúAtạ 3: Jfíởt íố qui luật phân phối xóa mai tháng, dụnạ </i>


Nên dễ thấy rằng:


L i m Pk = — e_ x


<i>Như vậy, với n lớn, p nhỏ, tích np = X khơng đ ổ i , các xác suất </i>
pk = P(X = k) của công thức Bernoulli có thể thay t h ế bằng công thức
Poisson sau đây:


Pk<i>=P(X = k)= ụ~ex</i> (k = 0, 1,2,...) (3.8)



k !


2- Định nghĩa: Đại lượng ngẫu nhiên rời rạc X nhận một trong các


giá trị: 0, Ì, 2 với c á c xác suất tương ứng tính theo cơng thức
<i>(3.8) được gọi là phân phối theo qui luật Poisson với tham số X. </i>
<i>X có phân phối Poisson v ớ i tham số X được ký hiệu là X ~ ÍP(X) </i>
<i>Nếu X có phân phối Poisson với tham số X, thì xác suất để X nhận </i>


giá trị trong khoảng [le, k+h] trong đó k vì* h là số ngun dương tùy
ý, được tính theo cơng thức :


P(k < X < k+h) = pk + Pk+1 + ... + pk+h (3.9)


Trong đó các xác suất pk, pk+|, . . . . , pk+h tính theo (3.8)
<i>* Chú ý: Nếu X ~ <P{X), để tính P(X = k) hoặc P(X < k) ta có thể </i>


dùng h à m POISSON trong Excel
P(X = k) =POISSON(k,X,0)


P(X <k) =POISSON(k,Ầ,1)


<i>Thí dụ 1: Cho X ~ £p(l,5), tính P(X = 5) và P(X < 3) </i>


Ta có:


P(X = 5) =POISSON(5,1.5,0) = 0.01412


</div>
<span class='text_page_counter'>(52)</span><div class='page_container' data-page=52>

<i>lịiáa trinh lý thuyết xái' mất lùi ttiếng, kê toán </i>



P(X < 3) =POISSON(3,1.5,1) = 0,934358


<i>Thídụ2: Một máy dệt có 500 ống sợi. Xác suất một ống sợi bị đứt </i>


trong khoảng thời gian Ì giờ m á y l à m việc là 0,004. T i m x á c suất để
trong một giờ có khơng q 2 ống sợi bị đứt ?


<i>Giải: Nếu coi việc quan sát một ống sợi xem có bị đứt hay khơng </i>


trong khoảng thời gian một giờ là một p h é p thử. Theo giả thiết, máy
dệt có 500 ống sợi nên ta có 500 phép thử độc lập. X á c suất trong
m ỗ i p h é p thử biến cố A (là biến cố ống sợi bị đứt) x ả y ra với xác
suất là p = 0,004.


N ế u g ọ i X là số ống sợi bị đứt trong khoảng thời gian Ì gi ờ của máy
thì X ~ B(50ồ; 0,004). Vì n = 500 khá l ớ n , p = 0,004 rất nhỏ và tích
np = 500x0,004 = 2 không đ ổ i n ê n ta có t h ể coi X ~ £ p ( 2 )


Xác suất để có khơng quá 2 ống sợi bị đứt trong khoảng thời gian
Ì giờ là: P(0 < X < 2) = Po + Pi + p2


p0 = P(X = 0) = ^-e-2 p, = P(X = 1) = ^-e-2
22


P2 = P(X = 2 ) = — e"2
2!
P(0 < X < 2) = (Ì + 2 + 2) e ~2 = 5(2,7183)-2 = 0,6767


<i>* Chú ý: Nếu tính các xác suất trên bằng hàm POISSON thì : </i>
<i>P(X < 2) =POISSON(2,2,1) = 0,Ổ76676 </i>



Ta cũng có thể tính xác suất mà bài tốn u cầu bằng hàm
BINOMDIST


</div>
<span class='text_page_counter'>(53)</span><div class='page_container' data-page=53>

<i>&utưttạ 3: Jlậl tà' qui luật phân phối xóa luốt tkâitạ Ị lung </i>


CĨ thể chứng minh được ra ng: <i>N ế u X ~ <PọC) thì: </i>
<i>• ' E(X) = Var(X) = X (3.10) </i>


<i>X- Ì < Mod(X)<Ầ (3.11) </i>


<i>Chứng minh: Theo định nghĩa kỳ vọng toán của đại lượng ngẫu </i>


nhiên r ờ i rạc, ta có :


<i>00 ao 00 i k ao ì k-1 </i>
<i>E ( X ) = ỵk.pk = Ỷ k . p</i>k<i> = Ỳ k . ^ e -</i>x = A . ỷ - ^ — - e -x


<i>to ừ Ù </i> <i>kĩ </i> t í ( k - l ) !


Đặtk' = k- l.Ta có:


<i>f ọp -\ k' eo ì k 00 </i>


k'=0K 1 k=9 Ki k=0
Vậy:


<i>E ( X ) = X </i>


<i>Ta có: E(X</i>2)= jỉ>2Pk = ỹ[k(k-l) + k]ik



k=0 k=0


= ẳk(k-l)£e-+f>.Pk


k=2 K I k=0


V ì : £ k P u = E ( X ) = \
<i>k=0 </i>


, k co


co ì k co "S k


Đặt k' = k -2 thì ('*) có thể viết như sau:
co ì k' co ì k


</div>
<span class='text_page_counter'>(54)</span><div class='page_container' data-page=54>

<i>ựiííơ trình tý. thuyết XĨA mất ơà tltếitạ kê tơán </i>


Vậy ta có: E(X2<i>) = X1 + X </i>


Var ( X ) = E ( X2) - [ E ( X ) ]2<i> = X2 + X - Ả2 = X </i>
<i>Thí dụ: Xác suất một chai rượu bị bể khi vận chuyển là 0,001. Giả </i>


sử v ậ n chuyển 4000 chai. T i m số chai rượu bị b ể trung bình và số
chai bị b ể tin chắc nhất khi v ậ n cỉyiyển ?


<i>Giải: Gọi X là số chai rượu bị bể khi vận chuyển 4000 chai. X là đại </i>


<i>lương n- ' l i nhiên và X ~ <P(X) v ớ i X = n.p = 4000 X 0,001 = 4 </i>


Số chai rượu bị bể trung bình khi vận chuyển chính là E(X)


<i>E(X) = x = 4 </i>


Tức có trung bình 4 chai rượu bị bể khi vận chuyển 4000 chai.


Số chai rượu bị b ể tin chắc nhất khi v ậ n chuyển 4000 chai chính là
Mod(X). Theo cơng thức (3.11) ta có:


3 < Mod(X) < 4
V ậ y :


M o d ( X ) = 3 h o ặ c M o d ( X ) = 4
Tức số chai rượu bị bể tin chắc nhất (có khả năng xảy ra nhiều


nhất) là 3 chai hoặc 4 chai


MI - Qui luật siêu bội


Ì- Bài tốn tổng qt dẫn đến qui luật siêu bội


T ừ một tập hợp g ồ m N phần tử (trong đó có M phần tử có tính chất
<i>A n à o đó) l ấ y ngẫu nhiên khơng hồn lại ra n phần tử . G ọ i X là số </i>
phần tử có tính chất A có ương n phần tử l ấ y ra, thì X là đ ạ i lượng
ngẫu nhiên r ờ i rạc có t h ể nhận c á c giá trị: 0, Ì, 2, . . . n với.các x á c
suất tương ứng:


</div>
<span class='text_page_counter'>(55)</span><div class='page_container' data-page=55>

<i>Qttương. 3: JILệt íà í/lù luật phân phối xác UI'''í tíiâuạ dung. </i>


Px = P(X = x ) = M _ N M (3.12)



N


(x = 0, 1,2 n)
2- Định nghĩa: Đại lượng ngẫu nhiên rời rạc X có thể nhận một


trong c á c giá trị: 0, Ì, 2, . . . n v ớ i các xác suất tương ứng được tính
theo cơng thức (3.12) g ọ i là p h â n phối theo qui luật siêu b ộ i v ớ i c á c
tham Số: N , -M; n.


Đại lượng ngẫu nhiên X phân phối theo qui luật siêu bội được ký
h i ệ u l à : X ~ H ( N , M , n).


<i>* Chú ý: Trường hợp n > M (hoặc n > N - M) Khi đó X phân phối </i>


theo qui luật siêu b ộ i nhưng có một số giá trị trong số các giá trị 0, Ì,
2 , . . . , n đ ạ i lượng ngẫu n h i ê n X sẽ khơng nhận.


<i>Thí dụ: Một hộp có 10 sản phẩm (trong đó có 3 sản phẩm loại A) </i>


L ấ y ngẫu nhiên (không h o à n l ạ i ) từ hộp ra 5 sản phẩm. G ọ i X là số
sản phẩm loại A có trong 5 sản phẩm lấy ra, thì X có p h â n p h ố i siêu
b ộ i v ớ i c á c giá trị X có thể nhận là 0, Ì, 2, 3 cịn các giá trị 4 và 5 thì
X k h ơ n g thể nhận. Vì trong trường hợp n à y : n = 5 > M = 3
Nếu X ~ H (N, M, n), để tính P(X = x) ta có thể dùng hàm


HYPGEOMDIST trong Excel
P(X = x) =HYPGEOMDIST(x,n,M,N)


<i>Thí dụ: Cho X ~ H (20, 14, 8), tính P(X = 5) </i>



Ta có:


P(X = 5) =HYPGEOMDIST(5,8,14,20) = 0,317853
3- Các tham số đặc trứhg


</div>
<span class='text_page_counter'>(56)</span><div class='page_container' data-page=56>

<i>íậiáa trình /tị'tJuajết xịe Mất túi ittốitạ. kê tối! </i>


E ( X ) = np (3.13)
M


( v ớ i p = — )
N


N - n


<i>V a r ( X ) = n p q - ^ — ị (3.14) </i>
(với q = 1-p)


Trong thực tế, qui luật siêu bội được dùng để tính xác suất có X


phần tử mang dấu hiệu A n à o đó khi lấy ngẫu nhiên n phần tử theo
<i>phương thức khơng hồn lại từ một tập hợp g ồ m N phần tử. Chẳng </i>
hạn, đ ể k i ể m tra chất lượng của một lô sản phẩm, n»ười ta thường


V ra từ lơ đó ra n sản phẩm theo phương thức khơng hồn l ạ i và
ù xác suâ.t đ ể có X p h ế phẩm (hoặc chính phẩm).


Ta có thể chứng minh Klng: khi n là rất bé so với N thì ta có công
thức xấp xỉ sau đây:



<i>VÁ </i>


11


^ P - « C : P Y - S (3.15)


<i>Chứng minh: </i>


Xét v ế trái của (3.15) ta có:
( < M! _ M(M - 1)(M -2) (M-x + 1)


M x ! ( M - x ) ! x!


C

n-X ( N - M ) !


N M ( n - x ) ! ( N - M - n + x ) !
= (N-M)(N-M- 1) (N - M -n + X +1)


( n - x ) !


Cn N! . _N(N-1) (N-n + 1)


</div>
<span class='text_page_counter'>(57)</span><div class='page_container' data-page=57>

<i>@hưưiiỢ. 3: Jllật lố qui luật phân phối jráe mất thơng. íiụitụ </i>


Thay các biểu thức trên v à o v ế trái của (3.15) và gắp'xếp l ạ i ta
được:


V T = B



Trong đó: VT là ký hiệu vế trái của (3.15); B là biểu thức dưới đây:


M ( M - 1)...(M - X + 1)(N - M ) ( N - M - 1)....(N - M - n + x + 1)
N ( N - l ) ( N - 2 ) ( N - n + 1)


Để ý rằng, tử số và mẫu số của biểu thức trên đều có n thừa số. Chia
cả tử số và mẫu sộ của b i ể u thức đó cho Nn ta được:


Q R


Trong đó:
Q =


R =
M


N


M Ì
V N N


B =


M x - 1


N N (Q có X thừa số)


M
N



M Ì
V, N N .


M n - x - 1


N N


[R có (n - x) thừa số]


s = l 1 - — \


N l N V


Đặt: M


N = p ;


N


<i>< M </i>


Ì <sub>N </sub> = Ì - p = q


Khi N lớn, n rất nhỏ so v ớ i N thì :
Q*px; R*qn_x; s^l


Từ đó ta suy ra điều cần phải chứng minh


</div>
<span class='text_page_counter'>(58)</span><div class='page_container' data-page=58>

<i>lị ủi ọ trình Lị thuyết xóa Mất ồ tíiốtiọ. kê tơáii </i>



lấy n phần tử từ một tập hợp g ồ m N phần tử theo phương thức
khơng hồn l ạ i và n là rất nhỏ so v ớ i N . G ọ i X là số phần tử có tính
chất A n à o đó có trong n phần tử lấy ra thì ta có thể xem X ~ B(n, p).
V ớ i p là tỉ l ệ phần tử có tính chất A của tập hợp.


<i>Thí dụ: ĩảộl lơ hàng gồm 1000 sản phẩm, trong đó có 800 sản phẩm </i>


loại A và 200 sản phẩm loại B. L ấ y ngẫu nhiên (không h o à n l ạ i ) từ
lơ h à n g đó 10 sản phẩm đ ể k i ể m tra. T ì m x á c suất đ ể có ít nhất 8 sản
phẩm loại A trong 10 sản phẩm lấy ra k i ể m tra ?


<i>Giải:' Gọi X là số sản phẩm loại A có trong lo sản phẩm lấy ra kiểm </i>


tra. Vì lấy khơng hồn l ạ i n ê n X ~ H(1000, 800, 10). Nhưng vì lấy ít
(10) từ một tập hợp có số phần tử lớn (1000) n ê n ta có thể coi
X ~ B(n, p), v ớ i n = 10 và p = - 0,8


1000
Xác suất cần tìm là P(X > 8).


Ta có:


P(X = 8 ) = c ? „ ( 0 , 8 )8( 0 , 2 )2 = 0,30199
P(X = 9) = c?0(0,8)9 (0,2) = 0,268435


P(X = 10) = (0,8)'°= 0,107374
V ậ y :


P(X > 8) = P(X = 8) + P(X = 9) + P(X = 10) = 0,6778
<i>* Chú ý: Ngồi cách tính trên, ta có thể dùng hàm HYPGEOMDIST </i>



đ ể tính như sau:


P(X = 8) =HYPGEOMDIST(8,10,800,1000) = 0,30351


P(X = 9) =HYPGEOMDIST(9,10,800,1000) = 0,268431
P(X = 10) =HYPGEOMDIST(10,10,800,1000) = 0,106164


</div>
<span class='text_page_counter'>(59)</span><div class='page_container' data-page=59>

<i>@hưư4iạ 3: Một lố qjù luật phán phối xán luốt thảng, dunạ </i>


Ta thấy kết quả của hai cách tính xấp xỉ nhau.


I V - Q u i l u ậ t p h â n p h ố i c h u ẩ n


Ì- Định nghĩa: Đại lượng ngẫu nhiên liên tục X nhận giá trị trong


khoảng (-oo,+oo) được g ọ i là p h â n phối theo qui luật chuẩn n ế u h à m
mật độ xác suất của nó có dạng:


f(x)=-U*pí <*-*>• Ì


2 a5


N ế u t i ế n h à n h khả o sát h à m nà y ta thấy: f(x ) > 0 ( V x)
Khi x-> ± 00 thì f(x) - > 0. H à m số đạt cực đ ạ i t ạ i đ i ể m X = n và:


f 0 0 = Ì
ơ-v/ĩrĩ
H à m số có 2 đ i ể m uốn:



<i>M i ụ, — ơ </i>


<i>OyỊĨŨe </i> và M'2 | i + ơ ;


Ì
V ơ V 2 ĩ ĩ e


</div>
<span class='text_page_counter'>(60)</span><div class='page_container' data-page=60>

<i>(ị mo trìu li lạ ỊiuuỊct xáe mất ồ tỉiơnụ Ui' toán </i>


2- C á c t h a m s ố đ ặ c t r ư n g


<i>a- Kỳ vọng toán: N ế u đ ạ i lượng ngẫu nhiên X có p h â n phối chuẩn </i>


với h à m mật độ như trên t h ì : E(X) = | i


Chứng minh: Theo định nghĩa kỳ vọng toán của đại lượng.ngẫu
nhiên liên tục, La t ỏ:


<i>4-00* J +00 ị , )^ ì </i>
E ( X ) = f x f ( x ) d x = — ^ = f x e x p ] - ( x~ 7 [da


X — LI


Đặt: t = — => X = ỊJ. + á t ; dx = ơ d t


Đ ể \ rằng khi đ ổ i sang biên l thì cận lấy tích p h â n k h ô n g thay đ ổ i .
V ậ y ta có:


ì +c<i>? í t</i> <i>2 </i>



E(X) <i>= —1= hụ + ot)exp\ - -— \ơdt </i>Ì t


+ < D<i> í Ì **" í t</i>21
<i>= ~p= Jexp ị ~ \ á t + -2= ịttxpị - — [át </i>


Theo giải tích ta có:


<i>j e x p | - ị - Ịdt s= V ã n (tích p h â n Poisson) </i>
-00 l 2 J


+0° ít2] ít2!


j t e x p Ị - y | d t = 0 (vì h à m t e x p ị - — Ị. là h à m số l ẻ )


Do đó:


</div>
<span class='text_page_counter'>(61)</span><div class='page_container' data-page=61>

<i>&tN&aợ 3: Mệt iấ quì luật nhàn phết xảe suất tháng tlụnạ. </i>
<i>c- Phương sai: Nếu X là đại lượng ngẫu nhiên phân phối theo qui </i>


luật chuẩn với h à m mật đô như trên t h ì :
Var(X) = ơ2


<i>Chứng minh: Theo định nghĩa phương sai của đại lưcim Bgẫu nhiên </i>


liên lục ta c ó :


+00


V a r ( X ) = j [ x F ( X ) ]2f ( x ) d x
—co



<i>Vì X có phân phối chuẩn nên: E(X) = ụ. Do đó: </i>


<i>Var(X) = —J= J(x - ịi)1 expị -</i> (x~*?)2 tox


<i>lo1 </i>


Đặt:
Khi đó:


t = X = | i + crt; d x = ơ d t


ì <i>ế z ị 2 +00 1 2 </i>


V a r ( X ) = - 4 = ( " ơ V e x p i - — ơ d t = - ^ l í t2<i> expị - — }dt </i>


Á p dung p W ơ n g p h á p tích p h â n từng phần:


Đặt: u = t; dv = texpj- —Ịdt => V = -expj- —Ị
Ta có:


Var(X) = ơ - t e x p
2 ,


+ 00
— 00


</div>
<span class='text_page_counter'>(62)</span><div class='page_container' data-page=62>

<i>(ịìáơ trình lý ậh nụ ất xáe suối ơà ưiốitạ kề tốn </i>


texp-Ị - ý + 00 t



• 00


<i>= 0 (vì h à m - t e x p < Ị - — \ là h à m số lẻ) </i>


Ị e x p I - — Ị-dt = V27Ĩ (tích phá n Poissan)


V ậ y ta có:


V a r ( X ) = ơ2


Đại lượng ngẫu nhiên X phân phối theo qui luật chuẩn với kỳ vọng
<i>toán là ụ. và phương sai là ơ</i>2 được ký h i ệ u là X ~ N( |J., ơ2)
Phân phối chuẩn do nhà tốn học Đức Karl Gauss tìm ra nên cịn gọi
là phân phối Gauss.


3- Phân phối chuẩn tắc


Giả sử đ ạ i lượng ngẫu nhiên X p h â n phối theo qui luật chuẩn với
i là ơ2


<i>x-ịi </i>


2


<i>kỳ vọng toán là ụ và phương sai là ơ . X é t đ ạ i lượng ngầu nhiên </i>
z =


Đ ạ i lượng ngẫu nhiên z nhận giá trị trong khoảng (-00, +00) được
gọi là phân phối theo qui luật chuẩn tắc nếu h à m m ậ t độ x á c suất


của z có dạng:


f ( * ) = v f e e x p K


</div>
<span class='text_page_counter'>(63)</span><div class='page_container' data-page=63>

<i>(ễhươtiạ 3: Mật úi-' qui luật phân phối xóa mút IhịiUỊ dụng </i>


f(z) ' \


>


- l o i z


<i>Các giá ưị của hàm f(z) được tính sẵn thành bảng (xem phụ lục 2). </i>
Có thể chứng minh được rằng: Nếu đại lượng ngẫu nhiên z có'
p h â n phối chuẩn tắc thì:


E(Z) = 0 và Var(Z) = 1
X - n " Ị _ Ì


= - [ E ( X ) - n ]
ơ


T h ậ t v ậ y , Ta có : E(Z) = E


DoX ~N(n,ơ2), nê


Var(Z) = Var > ì = 1 [ v a r ( X ) - V a r ( ^ ) ]
<i>A. ơ ) </i>


Vì Var(X) = ơ2 ; Var(n) = 0 => Var(Z) = Ị



Đại lượng ngẫu nhiên z phân phối theo qui luật chuẩn tắc được kỷ
h i ệ u là z ~ N ( 0 , 1 )


* Ta ký hiệu za là giá trị của của đại lượng ngẫu nhiên z phân phối
theo qui luật chuẩn tắc thoa m ã n đ i ề u k i ệ n :


</div>
<span class='text_page_counter'>(64)</span><div class='page_container' data-page=64>

<i>L}iiío- trùilt Lị tỉ tuyết xác mất cúi thống, hê toán </i>


N ế u minh hoa trên đồ thị ta thấy d i ệ n tích của m i ề n hình học giới
hạn bởi đường cong h à m mật độ và trục h o à n h bằng Ì đơn vị diện


+00


tích (Vì | f ( z ) d z = 1) thì za là một đ i ể m nằm trên trục hồnh sao
—co


cho diên tích của m i ề n gạch c h é o trên hình v ẽ bằng cc
<i>f(z) Ạ </i>


Cho trước oe ta có thể tính được các giá trị za. Bảng tính sẩn các giá
trị zu cho ở phụ lục 4.


4- Các cơng thức tính xác suất:
N ế u X ~ N í n , CT ) t h ì


P(X! < X < x2) = Ọ


x2<i>- ụ . \ í </i>



- ọ


v ơ ; (3.16)


Trong đó:


.2 \


dz <sub>( H à m Laplace) </sub>


<i>Chứng minh: Thật Vậy, ta có: </i>


P ( x 1 < X < X 2 ) = p í ^ l H < ^ Z £ < Í L Z i i >


</div>
<span class='text_page_counter'>(65)</span><div class='page_container' data-page=65>

<i>QiuỂđHq. 3: Mát Ìấ tịitỉ luật phản phổi xịe, li lất thịng đung </i>
<i>= p(z, <z<z</i>2)


Trong đó


X1 ~ n x 2<i>- ụ . </i>


<i>•ỉ </i>


<i>x - ị i </i>


Theo tính chất h à m m ậ t độ (tính chất 2) ta có:
z, z, z,


P(z, < z < z2) = jf(z)dz = jf (z)dz - |f(z)dz



= 91 - ọ í * , - n ì - ọ í * , - n ì


V ơ J


* N ế u X ~ N ( n , ơ2) t h ì :


P ( | x - d < 8 ) = 2<p


<i>C/ií?Kg mi/í/i. Ta có: p ( j x - | i | < e ) = P ( - e < X - ụ < e) </i>


<i>ỉ </i> <sub>e X - | i £ </sub>


(3.17)


— < — <
<i>V, ơ ơ ơ J </i>


= P - * < Z < *


^ ơ ơ


<i>( é ) </i> <sub>í 0 ( « 0 </sub>


r o =2cp co
= 9 — -<p - - = <p — +<p - =2cp —


* CAÚ J : N ế u X ~ N ( n , ơ2) , đ ể tính P(X < x) ta có thể d ù n g h à m
NORMDIST trong Excel


P(X < X) =NORMDIST(x,n,ơ,1)



</div>
<span class='text_page_counter'>(66)</span><div class='page_container' data-page=66>

<i>íịiá& trình Lị thuụết xác mãi ồ tívấtig. kê- tốn </i>


* N ế u z ~ N(0, 1), đ ể tính P(Z < z) ta có t h ể d ù n g h à m NORMSDIST
trong Excel


P(Z < z) =NORMSDIST(z)
P(a < z < p) =NORMSDIST(P)-NORMSDIST(a)


* Nếu X ~ Nín, ơ2), để tính P( |x - jx| <e ) ta có thể dùng hàm
NORMSDIST


<i>P ( | x - \x\ < £ ) = 2 * N O R M S D I S T ( E / < J ) - 1 </i>


<i>Thí dụ 1: Trọng lượng của một loại sản phẩm là đại lượng ngẫu </i>


<i>nhiên p h â n phối theo qui luật chuẩn v ớ i trọng lượng trung bình ụ. = 5 </i>
kg và độ lệch tiêu chuẩn ơ = 0,1. Tính tỷ l ệ những sản phẩm có
trọng lượng từ 4,9 kg đ ế n 5,2 kg ?


<i>Giải: Gọi X là trọng lượng của loại sản phẩm này. theo giả thiết </i>


X ~ N ( n , ơ2<i>) v ớ i ịi = 5 ( k g ) ; ơ = 0,1 </i>


Tỷ lệ sản phẩm có trọng lượng từ 4,9 đến 5,2 kg chính là:
P(4,9< x<5,2)


Áp dụng công thức (3.18) ta được:


P(4.9 < X < 5,2) = <p(^p) " Ọ(^OF) = 9(2) " 9



• = 0,4772 - ( - 0,3413) = 0,8185
Tức tỷ lệ những sản phẩm có trọng lượng từ 4,9 đến 5,2 kg là 82%
<i>* Chứ ý: Nếu dùng hàm NORMDIST để tính xác suất trên thì: </i>


</div>
<span class='text_page_counter'>(67)</span><div class='page_container' data-page=67>

<i>@hu&tiạ 3: Jtlội Lố ạuỉ luật phân, phối xịe, xi thịng, dung </i>
<i>Thí dạ 2? Đường kính của một l o ạ i trục m á y do một nhà m á y sản </i>


suất là 3 ạ i lượng ngẫu n h i ê n p h â n p h ố i theo qui luật chuẩn v ớ i
đường kính trung binh (theo như thiết k ế ) là n = 20 mm và độ l ệ c h
tiêu chuẩn ơ = 0,04 min. Trục m á y được coi là đạt tiêu chuẩn kỹ
thuật nếu đường kính của nó sai lệch so v ớ i đường kính thiết k ế
không quá 0,072 mm. T i m tỷ l ệ trục m á y đạt tiêu chuẩn kỹ thuật của
nhà m á y ?


<i>Giải: Gọi X là đường kính của trục máy. Theo giả thiết X ~ N(|i, ơ</i>2)


<i>với ụ. = 20 (ram) ; ơ = 0,04 . T ỷ l ệ trục m á y đ ạ t tiêu chuẩn kỹ thuật </i>
<i>của nhà m á y chính là : P(| X < 0,072). </i>


Ấp dụng cơng thức (3.19) ta có:


<i>f</i> 0,072 ì


p ( | x - n | < 0 , 7 2 ) = 2 ( p = 2(p(l,8) * 93%
l 0,04


<i>* Chú ý: Nếu dùng hàm NORMSDIST thì: </i>


<i>p(jx-ụị < 0,072) =2*NORMSDIST(0.072/0.04)-1 =0,928139 </i>



5- Phân phối xác suất của tổng các đại lượng ngẫu nhiên độc
l ậ p t u â n t h e o c ù n g m ộ t q u i l u ậ t


Giả sử Xi và X2 là hai đại lượng ngẫu nhiên độc lập. Xi tuân theo


<i>qui luật chuẩn v ớ i kỳ vọng toán là ịlị và phương sai là <j] còn x</i>2
<i>cũng t u â n theo qui luậ t chuẩn v ớ i kỳ vọn g toá n là ịi2</i> và phương sai


<i>l i ^ vị. K h i đó đ ạ i lượng ngẫu nhiên X = ( X i + X2) cũng tuân theo </i>
qui l u ậ t chuẩn vớ i kỳ vọn g toá n là Hj + n2 v à<i> phương sai là G2ị + ơ \ . </i>


Tính chất trên cũng có thể mở rộng cho một số bất kỳ các đại lượng


</div>
<span class='text_page_counter'>(68)</span><div class='page_container' data-page=68>

<i>tị,.., trinh tụ iỉưtụết xác mất ồ títấnq. kè tốn </i>


Ngồi ra nếu Xi, x2, xn là n đại lượng ngẫu nhiên độc lập và


man theo một qui luật p h â n p h ố i x á c suất n à o đó (khơng nhất
thiết là qui luật chuẩn) v ớ i cá c kỳ vọn g toá n E ( X i ) , E ( X2) , . . . .
E(X„) và phương sai var(Xi), v a r ( X2) , . . .' , var(Xn) đã b i ế t thì đại
lượng ngẫu nhiên:


X = ẳ x i
i = l
sẽ p h â n phố i xấ p xỉ chuẩn với :


<i>E(X) = ị E(X,) và Var(X) = Ỳ</i> Var(x.)


i=l i=l


khi n khá lớn (n > 30)


Tính chất trên thường được g ọ i là định lý giới hạn trung tâm của
l.iapunốp


6- Sự hội tụ của qui luật nhị thức và qui luật Poisson về qui
l u ậ t c h u ẩ n


Khi sử dụng qui luật nhị thức, n ế u n khá lớn thì việc tính tốn theo
cơng thức Bernoulli sẽ gặp khó khăn. lúc đó n ế u p nhỏ đ ế n mức np «
npq thì có thể dùng qui luật Poisson thay t h ế cho qui luật nhị thức.
Nhưng nêu p l ạ i không nhỏ (p > 0,1) thì k h ơ n g t h ể d ù n g qui luật
Poisson đ ể thay t h ế được. Khi đó ta có t h ể d ù n g qui luật chuẩn để
thay t h ế cho qui luật nhị thức.


Khi n lởn và p không quá gần 0 và không quá gần Ì thì đại lượng


ngẫu nhiên X ~ B(n; p) có thể coi như-phân p h ố i xấp xỉ chuẩn với kỳ
<i>vọng toán ị! = np và phương sai ơ . = npq. T ừ đ ó ta có c ơ n g thức sau: </i>


Px=C;PY"X~-pLrf(z) (3.18)


</div>
<span class='text_page_counter'>(69)</span><div class='page_container' data-page=69>

<i>Qhươitq. 3: Mệt lổ qui luật, phàn phổi xác luốt thông, dụng </i>


Trong đó: z = p = = i ; f(z) = - p = e x p ( - z2/ 2 )


Vnp q V271


Công thức (3.18) được.gọi là công thức địa phương Laplace. Các



giá trị của h à m f(z) được tính sẩn thành bảng với các giá tri của
z > 0 (xem phụ lục 2).


Chú ý rằng f(z) là h à m chẩn, n ê n f ( - z ) = f(z). Vì v ậ y v ớ i z < 0 ta
cũng d ù n g bảng nà y đ ể suy ra giá trị của f ( z ) .


Khi n lớn, xác suất p không quá gần 0 và khơng q gần Ì thì ta có
thế d ù n g công thức xấ p xỉ sau đây d ể tính tốn:


P(x < X < x+h) « (p(x2<i>) - <p(xi) (3. ỉ 9) </i>
Trong đó :


1 x


<i>ọ ( x ) = -J= f e x p ( - z</i>2 / 2 ) d z ( H à m Laplace)
<i>V 2 T I ị </i>


x - n p x + h - n p


X l = T = ^ X 2 =<i> r = </i>


Công thức (3. 19) được gọi là cơng thức tích phân Laplace.


C á c giá trị của h à m ọ(x) được tính sẩn thành bảng. (xem phụ lục
3). Cần lưu ý là trong bảng này chỉ tính các giá trị của-hàm (p(x) v ớ i
những giá trị X > 0, n ế u cần tính giá trị của (p(x) v ớ i X < 0 thì ta chú ý
rằng cp(x) là h à m l ẻ , do đó: cp(-x) = - (p(x)


Trong bảng chỉ tính (p(x) v ớ i X < 5, v ớ i X > 5 thì h à m (p(x) tăng rất
chậm và nhận giá trị rất gần 0,5. Do vậy ta l ấ y (p(x) = 0,5 (Vx > 5)



<i>Thí dụ: Xác suất để một máy sản xuất được sản phẩm loại A là 0,8. </i>


</div>
<span class='text_page_counter'>(70)</span><div class='page_container' data-page=70>

<i>trình tiị tlutỵết xịe mất lút thống kè tốn </i>


(b) Có từ 304 đến 328 sán phẩm loại A


<i>Giai: Gọi X là sơ sản phẩm loại A có trong 400 sản phẩm do máy </i>


sản xuất. X - B(4()0, 0,8). Vì n = 400 khá lớn, p = 0.8 khơng q gan
0 và khơng q lĩần Ì, nên ta có thể á p dụng cơng thức (3,18)


(a) P ( X = 3 3 6 ) « 336 - 400 X 0,8


V400x 0,8x0,2 [ V 4 0 0 x 0,8x0,2 J • >
Tra bảng la được 1(2) = 0,054.


V ậ y :


P(X = 3 3 6 ) « 0,00675


<i>(b) Ta cần tính P(304 < X < V>J0 Áp dụng cơng thức (3.19) ta có: </i>
P(304 < X < 328) * cp (x2) - cp(Xl)


Trong đó:


x = 3 2 8 - 4 0 0 x 0,8 _ ỉ 3 0 4 - 4 0 0 x 0,8
2 V400 X 0,8 X 0,2 ; X | ~ ^ 0 x 0 , 8 x 0 , 2 ~ ~
Tra bảng hà ni cp(x) la được: (p(l) = 0,3413 ; (p(-2) = - 0 4772



V ậ y :


P(304 < X < 328) * 0,3413 - ( - 0,4772) = 0,8185
<i>* Chú ý: Với thí dự trên, nếu ta dùng Excekđể tính thì: </i>


P(X = 336) =BINOMDIST(336,400,0.8,0) = 0,006573
P(3()4 < X < 328) = P(X < 328) - P(X 5303) =


=BINOMDIST(328,400.0.8,1)-BINOMDIST(303,400I0.8,1)= 0,83505


Ta thấy k ế t q của hai cách tính có c h ê n h lệch nhau, tất nhiên tính
bằng Excel sẽ cho kết q chính xác hơn. vì vậy nếu có thể la nên
tính bằng Exccỉ.


</div>
<span class='text_page_counter'>(71)</span><div class='page_container' data-page=71>

<i>&tưưttạ 3: Mặt Lố quì ỉutịt phân phối xác Mất thịng, {tung </i>
<i>* Đối với qui luật Poisson thì q trình hội tụ của nó về qui luật </i>


<i>chuẩn sẽ d i ễ n ra khi X >«20. Vì vậy lú-li V phân phối theo qui luật </i>
<i>Poisson nhưng X > 20 thì có t h ể xem X phan pi,. ' i * \ í " xỉ chuẩn v ớ i </i>
<i>| i = À. và ơ = X </i>


7- ứng dụng của qui luật chuẩn


Qui luật chuẩn là qui luật p h â n phối xác suất được á p dụng rộng
rãi trong thực tế. Trong nhiều lĩnh vực của khoa học và đ ờ i sống ta
thường gặp những đ ạ i lượng ngẫu nhiên có p h â n phối chuẩn. Chẳng
hạn trong cơng nghiệp, kích th#ớc của các chi tiết do m á y sản xuất
ra; trọng lượng của những sản phẩm cùng loại là những đ ạ i lượng
ngẫu nhiên phân phối theo q u i ^ u ậ t chuẩn n ế u quá trình sản xuất
d i ễ n ra bình thường. Trong nông nghiệp, n ă n g suất của một l o ạ i cây


trồng ở những thửa ruộng k h á c nhau; trọng lượng của gia súc c ù n g
độ tuổi và cùng điều k i ệ n c h ă m sóc cũng là những đ ạ i lượng ngẫu
nhiên p h â n phối theo qui luật chuẩn.. . .


Lý do của sự phổ biến đó đã được nhà toán học người Nga là


Li-a-pu-nốp g i ả i thích trong định lý "giới hạn ư u n g tâm "mà m ộ t h ệ quả
của nó là: N ế u đ ạ i lượng ngẫu nhiên X là tổng của một s ố lớn c á c
đ ạ i lượng ngẫu nhiên độc lập và giá trị của m ỗ i đ ạ i lượng đóng vai
ư ị rất nhỏ trong tổng đó thì X sẽ có phân phối x ấ p xỉ v ớ i qui luật
chuẩn.


V- Qui luật X2 "Chi-bình phướng"


Giả sử Xi (i = Ì, 2,.... n) là các đại lượng ngẫu nhiên độc lập,


cùng p h â n p h ố i theo qui luật chuẩn tắc. X é t đ ạ i lượng ngẫu nhiên:


x2=ịx


i=l


</div>
<span class='text_page_counter'>(72)</span><div class='page_container' data-page=72>

<i>íịiáữ trình Lị. ílmụết xác mất ồ thống- kẻ tốn </i>


với n bậc tự do.


Qui luật "chi bình phương" với n bậc tự do được ký hiệu là: 3£2(n)
<i>Hàm mật độ xác suất của đại lượng ngẫu nhiên ỵ2</i> có dạng:


f n ( x ) =



_ y --1
e<i> / zx2 • </i>
<i>2</i> <i>7 lr </i>


0


, 2y


Trong đó: r ( x ) = J t *_ Ie_ td t


x > 0


( hàm gama)


Qui luật "chi bình phương " được Helmert và Pearson x é t đến đầu
tiên.


Đồ thị của hàm mật độ fn(x):
fn(x)


, n = 30


N ế u c á c đ ạ i lượng ngẫu nhiên_Xị liên hệ vơi nhau bằng mộ t h ệ thức
<i>tuyến tính, chẳng hạn EXị = n X thì s ố bạc tự do sẽ là n - 1 </i>


Nếu đại lượng ngẫu nhiên X2 phân phối theo qui bát x2(n) [ký hiêu
l à x ~ x2( n ) ] . t h ì :


</div>
<span class='text_page_counter'>(73)</span><div class='page_container' data-page=73>

<i>VltưưiHi 3: JLệt tố qui luật pìiâii phối xịe. xuất tháng. dung. </i>



E(x2) = n ; Var(x2) = 2n


<i>* Ta ký hiệu %2a là giá tri cun đui lượng ngẫu nhiên ỵ2</i> phân phối


theo qui luật "chi bình phương" với n bậc tự do, thỏa mãn điều kiện:
P(x2>x2a) = a


fn(x)


<i>X a chính là giá trị nằm trên tục hồnh sao cho diện tích m i ề n gạch </i>


c h é o bằng a


C á c giá trị X2CC được tính sẩn thành bảng (xem phụ lục 5)


<i>Ta cũng£Ó thể dùng hàm CH11NV để tìm %2a khi biết a </i>


X* =CHIINV(a,k)


* Cho X2 ~ x2( k ) , đ ể tìm P(x2 > X) ta có the dùng h à m CHIDIST
P(x2 > X) =CHIDIST(x,k)


<i>Thí dụ: Cho</i> x2 ~ *2(28), tìm P(x2 > 25) và xỉ.os
<i>2* _ , » </i>


P(x > 25) =CHIDIST(25,28) = 0,627835
<i>XỒ.05 =CHIINV(0.05,28) = 41,33715 </i>


</div>
<span class='text_page_counter'>(74)</span><div class='page_container' data-page=74>

<i>ựiá» trùih lợ. thuyết tếe mất ơã thống, kè tốn </i>



K h i số bậc tự do tăng lên, qui luật "chi bình phương u sẽ xấp xỉ vơi
qui luật chuẩn.


Vỉ- Qui luật student


N ế u z là đai lưcn e n«ẫ u nhiê n p h â n phố i theo qui lun t huân lác
va > la d ạ i lượng ngẫu nhiên độc l ậ p v ớ i z , p h á " ,Mwi meo qui luật
"chi bình p h ư ơ n g " với n bậc tự do.


Khi đó đai lưrtn? nenn n^iên:
T =


V v / n


sẽ ph ẩ n phố i theo qui luật Student v ớ i n bậc t ự do.


Hàm ^ìật độ xác suất của đại lượng ngẫu nhiên T phân phối theo qui
luật Student v ớ i n bậc tự do có dạng:


n + 1
f n ( t ) =


1 +


n+l


<i>a V ĩ </i>


n



< ! > =


(-00 < t < +00)
eo


r ( x ) = | tI _ 1e_ ,d t ( h à m gama)
0


Qui luậ t Studeni v ớ i n bậc tự do được ký h i ệ u là : T(n )
Trong đ ó :


Đ ồ thị của h à m f„(t):


</div>
<span class='text_page_counter'>(75)</span><div class='page_container' data-page=75>

<i>&utờtiQ. 3: Mật UẾ quỉ luật phân phối xác Mất thăng, dung. </i>


MO í


0 t
Qui luật Stuđent được w . s Gosset sử dụng lần đ ầ u tiên trong một


bài toán thống k ê quan trọng và khi viết tác giả lấy bút danh là
"Student".


* Nếu đại lượng ngẫu nhiên T phân phơi theo qui luật Studenl với
n bậc tự do [ký hiệu là T ~ T(n)] thì:


E(T) = 0 và Var(T) = ——


<i>n-2 </i>


<i>* Ta ký hiệu ta là giá trị của đại lượng ngẫu nhiên T ~ T(n) thu.Ì </i>


m ã n đ i ề u k i ệ n : P(| T I > ta) = oe


C á c giá trị ta được tính sẩn thành b ả n g (xem phụ lục 6)
* Ta cũng có thể dùng hàm TINV trong Excel để tìm ta


ta=T!NV(a,k)


v ớ i k là bậc tự do


* Nếu T ~ T(k), để tìm P(|T| > t) (với t > 0) UI có tì. j dùng hàm TDIS'1
P(|T| > t) =TDIST(t,k,2)


</div>
<span class='text_page_counter'>(76)</span><div class='page_container' data-page=76>

<i>Lị ì lia trình Lị tlutụểt xúc mất ồ thống, kê (ốn </i>


<i>Thí dụ: Cho T ~ T(24), tìm P(|T| > Ì,3); P(T > ì ,5) và to.05 </i>


Ta có: P(|T| > ì ,5) =TDIST(1.5,24,2) = 0,146656
P(T > 1,5) =TDIST(1.5,24,1) = 0,073328


to.05 =TINV(0.05,24) = 2,063898 * 2,064


Khi số bậc tự do tăng lên, qui luật Student tiến rất nhanh về phần


phối chuẩn tắc. Vì vậy, khi n > 30 ta có thể dùng p h â n phối chuẩn
tắc thay cho phân phối Student.


VII- Qui luật Fisher- Snedecor (phân phôi F)


I


Đ ạ i lượng ngẫu nhiên F được gọi là p h â n phôi theo qui luật Pisher
- Snedecor với ni và n2 bậc tự do nếu hà UI mật độ x á c suất có dạng:


* . , , , ( * ) =


Trong đó :


0


<i>(JHZĨÌ </i>


<i>[ </i> ( n2+ n , x ) 2


<i>í n , i n . ^ </i>


c =


Ị • "2


2 n , 2 » v
n


r


<i>\ t J Kí ) </i>


x < 0



x>0


Đ ồ thị của h à m fni n 2( x ) :


</div>
<span class='text_page_counter'>(77)</span><div class='page_container' data-page=77>

<i>@hườitg. 3: Mội XÁ qui tuột phàn phổi xác Mất tít ải tạ dung. </i>


N ế u đ ạ i lượng ngẫu nhiê n F phâ n phố i theo quy luật Fisher
<i>-Snedecor với bậc tự do ni và ĨỈ2 [ký hiệu là F ~ F ( m , 112)] thì: </i>


<i>_ n 2nị (AI, +«, - 2) </i>


<i>E ( F ) = — — ; V a r ( F ) = ã </i>


ô2 2 w) (w2 - 2 ) (»2 ~ 4 )


Ta ký hiệu Fa (nu n2) là giá trị của đại lượng ngẫu nhiên F phân


phối theo quy luật Fisher - Snedecor v ớ i bậc tự do n i , n? thoa
m ã n điều k i ệ n :


P f F > F0( n i , n2) ] = a


</div>
<span class='text_page_counter'>(78)</span><div class='page_container' data-page=78>

<i>(ịiáa trìitk bị tkuụết xịe Mất ồ thống, kê toán </i>


fni,n2 (x)


0 Fa X


Đ ể tìm Fa ( n i , n2) ta có thể tra bảng p h â n phối F hoặc dùng hàm
FINV trong Excel



Fa( n , , n2) = F I N V ( a , n1, n2)
* Nếu F~ F(ni, n2), ta cần tính P(F > x) thì dùng hàm FDIST
P(F>x) =FDIST(x,n1, n2)


<i>Thí dụ: Cho F ~ F (2, 14), ta cần tính P(F > 1,6) và tìm F</i>0j05
Tá có:


P(F> 1,6) =FDIST(1.6,2, 14) = 0,236699


</div>
<span class='text_page_counter'>(79)</span><div class='page_container' data-page=79>

<i>@ỉutWtiạ 4/Đại lường, ngẫu nhiên, hai chiều </i>


C h ư ơ n g 4
<i>ĐẠI LƯỢNG NGẪU NHIÊN HAI CHIỀU </i>


I- Khái niệm về đại lượng ngẫu nhiên hai chiều


ở c á c chương trước, chúng ta đã xét những đ ạ i lượng ngẫu n h i ê n
m à các giá trị nó có thể nhận được biểu thị bằng một số. C á c đ ạ i


lượng ngẫu nhiên như vậy được g ọ i là đ ạ i lượng ngẫu nhiên một
c h i ề u . N g o à i những đ ạ i lượng ngẫu nhiê n mộ t chiều, trong thực t ế ta


c ò n gặp những đ ạ i lượng ngẫu nhiê n mà c á c giá trị nó có th ể nhận
được b i ể u thị bằng 2, hoặc 3,. . . , hoặc n số.


Những đại lượng ngẫu nhiên mà các giá trị nó có thể nhận là những
<i>v é c tơ 2 chiều được g ọ i là đại lượng ngẫu nhiên 2 chiều. </i>


<i>TổntỊ quát: Những đại lượng ngẫu nhiên mà các giá trị nó có thể </i>



<i>nhận là một véc tơ n chiều được gọi là đại lượng ngẫu nhiên n </i>


<i>chiều. </i>


Ta ký hiệu đại lượng ngẫu nhiên 2 chiều là (X, Y). Trong đó X và


<i>Y được g ọ i là các thành phần của đ ạ i lượng ngẫu nhiên 2 chiều, c ả </i>
hai đ ạ i lượng ngẫu nhiên X và Y được xét một cách đồng thời tạo
n ê n đ ạ i lượng ngẫu nhiên 2 chiều. Tương tự n đ ạ i lượng ngẫu nhiên
được x é t m ộ t cách đồng thời tạo n ê n đ ạ i lượng ngẫu nhiên n chiều.


<i>Thí dụ 1: Khi nghiên cứu về thể lực của những học sinh tiểu học có </i>


</div>
<span class='text_page_counter'>(80)</span><div class='page_container' data-page=80>

<i>Qiáữ trình bị tltttiịết seáe mất và t/iốuạ kè ĩơán </i>


<i>Thí dụ 2: Khi khảo sát các siêu thị, nếu ta quan tâm đ ế n doanh số </i>


bán ( X i ) và lượng vốn ( X2) ta sẽ có đ ạ i lượng ngẫu nhiên hai chiều.
( X | , ' X2) . Còn nếu ta quan tâm cả chi phí quảng c á o (X3) thì ta sẽ có
đ ạ i lượng ngẫu nhiên 3 chiều ( X i , X2, X3).


T r o n " thực t ế người ta cũng p h â n chia đ ạ i lượng ngẫu nhiên nhiều
<i>chiều m à n h hai loại : rời rạc và liên tục. </i>


Các đ ạ i lượng ngẫu nhiên nhiều chiều được g ọ i là rời rạc nếu các
thành phần của nó là cá c đ ạ i lư ợn g n g ẫ u n h i ê n rờ i rạc.


C á c đ ạ i lượng ngẫu nhiên nhiều chiều được g ọ i là liên tục nếu các
thành phần của nó là các đ ạ i lượng ngẫu nhiê n liên tục.



li- Qui luật phân phối xác suất của đại lượng
n g ẫ u n h i ê n h a i c h i ể u


Đ ố i với đại lượng ngẫu nhiên hai chiều người ta cũng dùng bảng
phân phôi xác suất hoặc hàm phân phối xác suât hoặc h à m mật độ
xác suất" đ ể thiết lập qui luật phân phối xác suất của chúng.


Ì- Báng phân phối xác suất của đại lượng ngẫu nhiên 2
c h i ề u


Bảng phân phối xác suất của đ ạ i lương ngẫu nhiên 2 chiều rời rạc
có dạng:


V Y yi <i>yi </i> ym


Xi P ( x , , y , ì P ( x , , y2) P(X|, ym)
P(X2.yi) P(X2, y2) P(x2. ym)


Xn PUn.yO <i>PUn. yì) </i> P(x„, ym)


</div>
<span class='text_page_counter'>(81)</span><div class='page_container' data-page=81>

<i>&Ơ41Q. 4:<ĩ)ại lừợnạ Itạẫii nhiên hai eiiièít </i>


Xi (Ì = Ì, 2 , . . . , n) là các giá trị có thể nhận của thành phần X


<i>Ỵj (j = Ì, 2 , . . . , m) là các giá trị có thể nhận của thành phần Y </i>


p(Xj, yj) (i = Ì, 2, . . . n; j = Ì, 2, . . . , ro) là xác suất đ ể đ ạ i lượng
ngẫu nhiên 2 chiều (X, Y ) nhận giá trị (Xi, yj)



li m


z £ p ( x i , y j ) = i
i=i j=i


Ký hiệu:


+ P(Xi, yj) = P[(X t xi)(Y =yj)] = Pi> = P(X =Xj).P(Y=yj / x = . Xi)
<i>= P(Y =yj).P(X =xựY= y j ) </i>
m ni


+ P ( X = X Ị ) = 2p(xi » y j ) = Z P i j =P ì
j=i j=i


+ P(Y = yj)= ỈP(xi,yj) = ẳPij =Qj


i=l i=l
• N ế u pi J = pi. qj ( V i , j ) thì X, Y độc lậ p


<i>>•• ỊỊ m </i>


Ta ln có: Z P i = Z t ỉ j = = 1


i=i j=i


V ớ i các ký hiệu trên, ta có thể biểư diễn bảng phân phối xác suất
của đ ạ i lượng ngẫu nhiên 2 chiều dưới dạng sau:


V Y
X ^ \



y i y2


• y


n, Px


Xi Pn P12 Plm <sub>Pl </sub>


X2 P21 P22 P2ni P2


*


Xn Pnl Pn2 Pnni Pn


</div>
<span class='text_page_counter'>(82)</span><div class='page_container' data-page=82>

<i>Cịiúo trình tụ. tlutụẨt xịe mối ơă Miếng, kè tơáii </i>


<i>B i ế t được phân phối xá c suất của đ ạ i lượng ngẫu nhiê n ĩ chiều ta </i>
có th ể tìm được bảng phâ n phối xá c suất của t á c thàn h phần.


Bảng phân phối xác suất của thành phần X có dạng:


X <sub>Xi </sub> <sub>X2 </sub> <sub>x„ </sub>


Px p. P2 Pn


T ừ bảng phân phôi xác suất của X v ớ i các côn£ thức đã biết ở
<i>chương ĩ ta có thể tính được E(X), Var(X), Mod(X), </i>


Tương tự ta có bảng phân phối xác suất của thành phần Y có dạng:



Y , <sub>y i </sub> <sub>Y2 </sub> <sub>y</sub>


m


Py q i Q2 Qui


T ừ bảng phân phối xác suất của Y ta cũng có thể tính được E(Y),
Var(Y), M o d ( Y ) , . . . .


<i>Thí dụ: Cho biết bảng phân phối xác suất của đại lượng n?ẫu nhiên ĩ </i>


chiều ( X , Y ) , trong đó X là doanh thu và Y là chi phí quảng cá o của
các cơng ty tư nhân kinh doa#h cùng một mặt hàng như sau (đơn vị
tính của X và Y đ ề u là ư i ệ u đồng/tháng):


Y \ v


100 * 150 200 <sub>P Y </sub>


0 0,1 0,05 0,05» <sub>0 * </sub>


1 0,05 0,2 0,15 0,4


2 0 <sub>0,1 </sub> <sub>0,3 </sub> <i><sub>OA </sub></i>


Px 0,15 0,35 0,5 1


</div>
<span class='text_page_counter'>(83)</span><div class='page_container' data-page=83>

<i>ẽkươíiự 4/Đại lượng ngẫu nhiên hai </i> <i>chiều </i>



<i>%</i> x 100


150 200


0,15 0,35 0,5


Từ đó ta d ễ d à n g tính được:


E(X) = lOOx 0,15 + 150x 0,35 + 200x 0,5 = 167,5


Tức doanh thu trung bình của một cơng ty tư nhân là 167,5 triệu
đ/tháng.


E ( X2) = 1002x 0,15 + 1502x 0,35 + 2002x 0,5 = 29375
Var(X) = E(X2) ~[E(X)]2 = 29375 - (167,5)2 = 1318,75


=> Ơ(X) = Vi 318,75 = 36,3146


Tức là mức chênh lệch trung bình về doanh thu của các cơng ty vào
khoảng 36,3 triệu đồng/tháng.


+ Bảng phân phối xác suất của Y:


Y <i>0 , </i> 1 2


PY 0,2 0,4 0,4


E(Y) = Ox 0,2 + l x 0,4 + 2x 0,4 = 1,2


Tức chi phí quảng c á o trung bình của một công ty tư nhân là 1,2 triệu


đ/tháng.


Var(Y) = E ( Y2) - [ E ( Y ) ]2 = 2 - (1,2)2 = 0,56
<i>=> Ơ(Y)= y[Õj6 =0,74833 </i>


</div>
<span class='text_page_counter'>(84)</span><div class='page_container' data-page=84>

<i>Qiáo trình tý thuyết xác í Ị lất và tíiốnợ kè toán </i>


<i>a- Định nghĩa: Hàm phân phối xác suất của đ ạ i lượng ngầu nhiên </i>


hai chiều (X, Y) [ký hiệu là F(x, y)] được định nghĩa như sau:
F(x, y) = P[(X < X)(Y < y)]


( x . y e R )
Như vậy hàm phân phối F(x, y) có miền xác định là R2 và miền giá
trị -là [0, 1]


<i>b- Tính chất: </i>


T ừ định nghĩa, ta có thể chứng minh được các tính chất sau đây của
h à m phân phơi:


(ì) 0 < F(x, y) < Ì


(li) F(x. y) là hàm không giảm theo từng đối số
(iii) F(x, -00) = F(-co, y) = 0; F(+oo. +co) = Ì
<i>(iv) V Xi < Xi và yi < y</i>2 ta có:


P[(x < X < x2)(yi < Y < y2)] = F(x2, y2) - Ftx2. yi)


-- F ( X | , y2) + F ( X i , y i )


(v) F(x,+oo) = P[(X<x)(Y<oo;] = p(X<x) = Fịíx) '


F(+oo, y) = P[(X < co) (Y < y)] = P( Y < y') = F2( y ì
trong đó F|(X). F;(y) tưcíng ứng là hàm phân phối ru;.., X và "V


<i>* Hệ quả: </i>


Ì- X. Y độc lập khi và chỉ khi:-F(x, y) = F|(x).F7 (y)


2- V ớ i véc rư ngẫu nhiên 2 chiều (X, Y) rời rạc, ta có:


</div>
<span class='text_page_counter'>(85)</span><div class='page_container' data-page=85>

<i>(Hiứưuq 4: (Đại lượng, ngẫu nhiên hai </i> <i>thiều </i>


F ( M ) = ^ p [ ( X = xi) ( Y = yi) ]
Xi<XyJ<y


b- p [ ( x , < X < x2) ( y , < Y < y2) ] = 2 > [ ( X = x i ) ( Y = X i ) ]
yi<yj<yi


T r ê n R b i ế n c ố [Xi < X < x2) . ( y i < Y < y2) ] có thê b i ể u d i ễ n là c á c
đ i ể m trong hình chữ nhật A B C D (hình v ẽ )


y2


y i


A


0 <sub>Xi </sub> *2



- >


3- H à m m ậ t đ ộ x á c s u ấ t c ủ a đ ạ i l ư ợ n g n g ẫ u n h i ê n h a i c h i ề u


<i>à- Định nghĩa: H à m mậ t đ ộ xá c suất của đ ạ i lượng ngẫu n h i ê n hai </i>


c h i ề u l i ê n tục (X , Y ) [ký h i ệ u là f(x , y) ] được định nghĩa n h ư sau:


f ( x , y ) = -<i>ỡ</i>zF(x,y)


<i>ỡxỡy </i>
<i>b- Tính chất: </i>


• (i)


(ii)


f ( x , y ) > 0 V ( x , y ) e R2
-KO+CO


</div>
<span class='text_page_counter'>(86)</span><div class='page_container' data-page=86>

<i>(ịiáo trình tụ thuyết xịe mối tui thững, kê tốt </i>


x2yi


' ( i u ) p [ ( x , < x < x2) ( y , < Y < y 2 ) ] = j j f ( x , y ) d x d y
*|<i> VI </i>


X y_


<i>y -HO </i>


(iv) F ( x . y ) = J j f ( u , v ) d u d v


—eo-00


<i>(V) F,(x) = Ỵịf(x,y)ày ; F</i>2<i>(y) = Ị Jf (x,y)dx </i>


(vi) f , ( x ) = ^ ^ = 7 f ( x , y ) d y


f!(y) = ^ = ]f(x,y)dx
trong đó:


f i ( x ) và f2( y ) tương ứng là h à m mật độ xác suất của: X và Y
(hàm mật độ x á c suất biên)


<i>Hệ quả: X, Y độc lập khi và chỉ khi f(x, y) = f|(x).f</i>2(y)


<i>Thí dụ: Cho hàm mật độ xác suất của biến ngẫu nhiên hai chiều </i>


( X , Y ) như sau:


<i>í C(2x + y) </i> n ế u 2 < X < 6; 0 < y < 5
f(x, y ) = H


L 0 v ớ i cá c giá trị khá c của X. y
a-Xác định tham sốc


</div>
<span class='text_page_counter'>(87)</span><div class='page_container' data-page=87>

<i>@ỉuỉƠ4iq. 4; (Đai tướng, ngẫu nhiên hai </i> <i>chiều </i>
<i>Giải: </i>





a-+C0+00 6 5


= J j f ( x , y ) d x d y = J j c ( 2 x + y ) d x d y
—co—co 2 0


= Jc 2xy + — dx= jc(l0x + 12,5)dx = 210C
<i>2 V 2 )0 ị </i>


c = 1/210
4 5
210


4 5 Ì


<i>P[(3 < X < 4) (Ý > 2)] = Ị ị ~ - ( 2 x + y ) d x d y = </i>
3 2


_3_
20


c- H à m mật độ xác suất biên f i(x) v à Í2(y)
'5


fL( x ) = J f ( x , y ) d y =
<i>5 Y </i>


í—— (2x + y ) d y =
Ì 2 1 Ĩ



4 x + 5
84


f2<i>( y ) = J f ( x , y ) d x = «Ị Ị 210 </i>
0


f — ( 2 x + y ) d x = 2 y + 16
105


2 < x < 6
<i>X Ể (2,6) </i>


y e (0,5)
<i>y Ể (0,5) </i>


I U - C á c t h a m s ố đ ặ c t r ư n g c ủ a đ ạ i l ư ợ n g n g â u
n h i ê n h a i c h i ề u


Ì - C á c t h a m s ố đ ặ c t r ư n g c ủ a đ ạ i l ư ợ n g n g ẫ u n h i ê n t h à n h
p h ầ n


Kỳ vọng toan và phương sai của các đ ạ i lượng ngẫu nhiên thành
phần được xác định bằng c á c công thức sau đây:


</div>
<span class='text_page_counter'>(88)</span><div class='page_container' data-page=88>

<i>Lịìủơ trình íặ t/tiiựếi xịe Mất ồ ihốtiq. kè toán </i>


E ( X ) = 2 £ x i p i j ; E ( Y ) = £ 2 > j P i j
UI j=l j=l i - l


n m



v a r ( X ) = 2 Z x fP i j - [ E ( X ) ] 2
i=i j=i


var(Y) = |;ẳy>ìj-[E(Y)f


j=i i=i


<i>* Nếu (X, Y) liên tục thì: </i>


-HĐ+O0 +00+00
<i>E ( X > = f J x f ( x , y ) d x d y ; E ( Y ) = Ị J y f ( x , y ) d x d y </i>


— CO —Ó)—CO
+00 +00


v a r ( X ) = Ị j x2f ( x , y ) d x d y - [ E ( X ) ]2
—00 —00


+00 +00


<i>v a r ( Y ) = ị j y</i>2f ( x , y ) d x d y - [ E ( Y ) ]2
— 00 —00


2- Các tham số đặc trưng của đại lượng ngẫu nhiên hai
c h i ề u


<i>ã- Hiệp phương sai: </i>


Hiệp phương sai của hai đại lượng ngẫu nhiên X và Y [ký hiệu là


cov(X, Y ) ] được định nghĩa như sau;


cov(X, Y) = E{[x - E(X)Ị[V - E(Y)]}
•= E(XY)-E(X)E(Y)


</div>
<span class='text_page_counter'>(89)</span><div class='page_container' data-page=89>

<i>CHuù(4t(ị 4/Đại lường, ngẫu nhiên hai eitiều </i>


c o v ( X , Y ) = S E W l - E ( X ) E ( Y )
UI j=l


• Nếu (X, Y) là đại lượng ngẫu nhiên 2 chiều liên tục thì:
+00+00


<i>c o v ( X , Y ) = ị | x y f ( x , y ) d x d y - E ( X ) E ( Y ) </i>
-00— co


• Nếu X, Y là hai đại lượng ngẫu nhiên độc lập thì :
cov(X, Y ) = 0
Thật vậy, Nếu X, Y độc lập thì E(XY) = E(X)E(Y)


K h i đó ta có:


cov(X,Y) = E ( X Y ) - E ( X ) E ( Y ) = 0
• Nếu cov(X, Y) = 0 ta nói X và Y không tương quan, ngược


l ạ i , nếu cov(X, Y ) * 0 ta nói X và Y có tương quan, khi đó X,
Y là hai b i ế n ngẫu nhiên không độc lập.


. cov(X, X) = var(X); cov(X, Y) = cov(Y, X)



<i>3 </i>
<i>b- Hệ số tương quan </i>


<i>. H ệ số tương quan [ký h i ệ u là PXY] được định nghĩa như sau: </i>


' c o v ( X , Y )
Pxv =


ơ x ơ ,
trong đ ó :


ơx; ơY tương ứng là độ lệch chuẩn của X và Y


</div>
<span class='text_page_counter'>(90)</span><div class='page_container' data-page=90>

<i>ịịừío trình Lí thuyết xịe. luốt ồ tháng, kê íơáti </i>


• N ế u X , Y là hai đ ạ i lượng ngẫu nhiên phụ thuộc thì:
o v a r ( X ± Y ) = v a r ( X ) + v a r ( Y ) ± 2 c o v ( X , Y )
<i>© var(aX ± bY) = ũ2</i> var(X) + b2 var(Y) ± 2abcov(X,Y)


• Nếu X, Y là hai đại lượng ngẫu nhiên độc lập thì
vaựx.Y) = [E(Y)]2 var(X) + [E.(X)]Z var(Y) + var(X) var(Y)
<i>Thí dụ: Lãi suất hàng năm của trái phiếu T và cổ phiếu s của một </i>


cơng ty có bảng phân phối x á c suất như sau:


-10% 0 10% 20% P T


6% 0 0 0,1 0,1 <i>oa </i>


8% 0 <sub>ọ , l </sub> 0,3 0,2 0,6



10% 0,1 0,1 0 0 0,2


Ps 0,1 0,2 0,4 0,3 1


N ế u muố n đ ầ u tư t i ề n v à o cả trái p h i ế u và cổ p h i ế u thì n ê n đ ầ u tư
theo tỷ l ệ bao nhiêu đ ể :


(a) Lãi suất kỳ vọng thu được là lớn nhất.
(b) ' Đ ộ r ủ i ro v ề lãi suất là nhỏ nhất.


<i>Giải: Từ bảng trên, ta tính được: </i>


E(T) = 6x 0,2 + 8x 0,6 + lOx 0,2 = 8%
var(T) = 62x 0,2 + 82x 0,6 + 102x 0,2 - 82 = 1,6


Tương l ự :


=> Ơ T = 1,2649%


</div>
<span class='text_page_counter'>(91)</span><div class='page_container' data-page=91>

<i>ũhttedtg. 4: (Đai tườiiụ Iiạẫn nhiên hai </i> <i>chiều </i>


E(S) = -lOx 0,1 + lOx 0,4 + 20x 0,3 = 9%
var(S) = (-10)2X 0,1 + 102x 0,4 + 202x 0,3 - 92 = 89


=> ơs = 9,43398%


cov(T, S) = 0,lx 10x (-10) + 0,lx6x 10 + 0,3x8x 10 + 0,1x6x20 +
+ 0,2x 8x 2 0 - 8 x 9 = - 8



(a) Gọi p là tỷ lệ đầu tư cho trái phiếu (0 < p < 1) và gọi X là lãi
suất thu được khi đầu tư cho cả trái phiếu và cổ phiếu thì:


X = pT + (l-p)S
T ừ đ ó :


E(X) = pE(T) + (l-p)E(S) = 8p + 9(l-p) = 9- p
Ta thấy E(X) đạt cực đại khi p = 0, tức là khi đầu tư toàn bộ tiền cho
cổ phiếu.


(b) Độ rủi ro được đặc trưng bởi phương sai hoặc độ lệch chuẩn của
X. Ta có:


var(X) = p2 var(T) + ( Ì - p )2 var(S) + 2p( 1-p) cov(T, S)


= 106,6 p2- I94p + 89


var(X) sẽ đạt cực tiểu khi p = 0,9099437


<i>c- Ma trận hiệp phương sai: </i>


Ta 2Ọ1 ma trận sau đây ỉa ma trận hiệp phương Sui của hai b i ế n


ngẫu nhiên X , Y:


</div>
<span class='text_page_counter'>(92)</span><div class='page_container' data-page=92>

<i>(ịiú& trình Lị thuyết xóa mối ồ thống, hê tốn </i>


N ế u X , Y khơn g tương quan thì cov(X, Y ) = cov(Y, X ) = 0, k h i đổ
ma trận hiệp phương sai là ma trận đường c h é o .



IV- Phân phối xác suất có diều kiện và kỳ vọng
t o á n c ó đ i ể u k i ệ n


Ì- Xác suất có điều kiện


Khi cho X = Xk hoặc Y = yic c ố định, ta có thể tính được c á c xác
suất có điều k i ệ n theo các công thức sau:


p[(X = xk)(Y = yj)]_pkj ••'
P ( Y =y j / X = xk) =


P ( X = xk)


j = l , m


T ừ đó ta có thể tìm được p h â n phối xác suất có đ i ề u k i ệ n của X
(hoặc của Y )


2- Phân phối xác suất có điều kiện
Ta ký hiệu:


<i>P(X= Xj/Ỳ= y</i>k) = P(X= Xi/ yk<i>); P(Y= y/x= xứ = P(Y= y/ x</i>k)
Phân phối xác suất có điều kiện của X (điều kiện là Y = yk)


( X = Xi/Y= yk) Xi x2 Xn


P(X = Xi/yk) P ( X = x , / yk) P ( X = x2/ yk) . . . . P(X= x„/yk)
Kỳ vọng tốn có điều k i ệ n của đ ạ i lượng ngẫu n h i ê n r ờ i rạc X với
điều k i ệ n Y = yk [ký hiệu là E ( X / yk) ] được định nghĩa như sau:



</div>
<span class='text_page_counter'>(93)</span><div class='page_container' data-page=93>

<i>Qhườttq. 4/Đạỉ íuẹitg ngẫu nhiên hai </i> <i>chiều </i>


E ( X / yk) = £ Xi P ( X = xi/ yk)


<i>Tương tự, ta có ky vọng tốn có điều kiện của Y (điều kiện X = X|c) </i>


E(Y/Xk<i>) = f>.m = yịỉx1t) </i>


<i>Thí dạ: Cho biết bảng phân phôi xác suất của đại lượng ngẫu nhiên 2 </i>


c h i ề u ( X , Y ) , trong đ ó X là doanh thu và Y là chi ph í quảng c á o của
c á c cổng ty tư n h â n kinh doanh cùng một mặt h à n g n h ư sau (đơn vị
tính của X và Y đ ề u rà triệu đồng/tháng):


<i>Ìfi0 </i> 150 200 <sub>P Y </sub>


0 0,1 0,05 0,05 0,2


1 0,05 0,2 0,15 0,4


2 0 0,1 0,3 0,4


Px 0,15 0,35 0,5 1


T ừ bảng trên ta c ó : <-.


P(X = 100/Y ,0) = P[(X = 100)(Y = 0)] =M =0,


P ( Y = 0) 0,2
Tính tương tự ta được:



P ( X = 1 5 0 / Y = 0) = — = 0,25; P ( X = 2 0 0 / Y = 0) = 0,25


V ậ y p h â n p h ố i có đ i ề u k i ệ n của X (điều k i ệ n là Y = 0) như sau:


( X = Xị/Y= 0) 100 150 200


</div>
<span class='text_page_counter'>(94)</span><div class='page_container' data-page=94>

<i>{ịiúp trình lý tluuịỂl xác Mất ồ thang kê toán </i>


T ừ bảng p h â n phối x á c suất có đ i ề u k i ệ n ở trên, ta tính được kỳ vọng
toan có điều k i ệ n :


E(X/Y=0) = lOOx 0,5 + 150x 0,25 + 200x 0,25 = 137,5


Kết quả này cho biết doanh thụ trung bình của những cơng ty khơng
quảng c á o (Y = 0) là 137,5 triệu đồng/tháng.


Tính tương tự ta được:


Phân phối có điều kiện của X (điều kiện là Y= 2) như sau:


(X = Xị/Y= 2) 100 150 200


P(X = Xị/Y= 2) 0 0,25 0,75


E(X/Y= 2) = 150x 0,25 + 200x 0,75 = 187,5
Kết quả này cho biết doanh thu trung bình của những cơng ty có chi
phí quảng cáo ở mứcL2 triệu đ/tháng là 187,5 triệu đồng/tháng.
• Hiệp phương sai của (X, Y):



<i>cov(X, Y) = ẸẸx</i>iyjPij -E(X).E(Y) =


' j


= 100x Ox 0,1 + 150x Ox 0,05 + . . . + 200* 2x 0,3 - 167,5x 1,2
= 215-201 = 14


• Hệ số^aTơng quan giữa 2 biến X và Y:


cov(X,Y) 14


PXY = — — - = — — = 0,5153


<i>™ Ơ</i>XƠY 36,3146x0,7483


3- Hàm mật độ có điều kiện


</div>
<span class='text_page_counter'>(95)</span><div class='page_container' data-page=95>

<i>@hưtừtạ 4/Đổi lưọttạ HQỗỉt nhiên hai chiều </i>


T a g ọ i : fCx / y) = í £ i Z )
f > ( y )


là h à m m ậ t đ ộ có đ i ề u k i ệ n của X (điều k i ệ n là Y = y )
Tương tự,


f ( y / x ) - í £ 2 >
f , ( x )


là h à m mật đ ộ có đ i ề u k i ệ n của Y (điều k i ệ n là x = x)
Nếu X, Y là hai đại lượng ngẫu nhiên liên tục thì:



-no


E ( Y / X = x ) = J y f ( y / x ) d y
-00


+00


E ( X / Y = y ) = J x f ( x / y ) d x


4- H à m h ổ i q u i


H à m h ồ i qui của Y đ ố i với. X là kỳ vọng tốn có đ i ề u k i ệ n của Y
(điều k i ệ n la X = x)


f ( x ) = E ( Y / X = x )


f(x) cho biết giá trị trung bình của Y sẽ thay đổi như the nào khi X
nhận c á c giá trị k h á c nhau.


Tương tự, hàm hồi qui của X đối với Y là kỳ vọng tốn có điều
k i ệ n của X (điều k i ệ n là Y = y)


f(y) = E(X/y = y)


<i>fịy) cho biết giá trị trung bình của X sẽ thay đổi như thế nào khi Y </i>


nhận c á c giá trị k h á c nhau.


</div>
<span class='text_page_counter'>(96)</span><div class='page_container' data-page=96>

<i>íỳiáty trinh Lị thuyết xúc tuất oà tỊỊúutạ kê toán </i>



C h ư ơ n g 5


<i>H À M C Á C Đ Ạ I L Ư Ợ N G N G Ẫ U N H I Ê N </i>
<i>V À L U Ậ T S Ố L Ớ N </i>


I- Hàm của các đại lượng ngẫu nhiên


Trong thực t ế , ta thường gặp trường hợp một đ ạ i lượng ngẫu
nhiên là h à m số của một hay nhiều đ ạ i lượng ngẫu nhiên k h á c . K h i
đó n ế u biết được qui luật phân„phối xác suất của các đ ố i số thì ta có
thể tìm được qui luật phân phối xác suất của c á c h à m số tương ứng.
Ì- Qui luật phân phối xác suất của hàm một đại lượng ngẫu


n h i ê n


N ế u v ớ i m ỗ i giá trị có th ể GỊ của đ ạ i lượng ngẫu nhiê n X , qua
h à m f ( X ) , ta xác định được một giá trị của đ ạ i lượng ngẫu n h i ê n Y
thì Y được g ọ i là h à m của đ ạ i lượng ngẫu nhiên X :


Y = f(X)


<i>a- Trường, hợp X là đại lượng ngẫu nhiên rời rạc và ứng với các giá </i>
<i>trị khác nhau của X ía có các giá trị khác nhau của Y </i>


Trường hợp này, ứng với mỗi giá trị có thể nhận của X ta chỉ có
một giá trị có thể nhận của Y , tức:


(X=xi) = [Y=f(xi) = yi] (Vi)



Suy ra:


' P(X= Xi) = P(Y= yo ( V i )


</div>
<span class='text_page_counter'>(97)</span><div class='page_container' data-page=97>

<i>ŨhưỞ4UỊ. 5: Jốàni của ếe. đại lượng, ngẫu nhiên ồ. luật IJỐ lởn. </i>
<i>Thí dụ ỉ: Đ ạ i lượng ngẫu n h i ê n X có bang p h â n phối x á c suất n h ư </i>


sau:


X 2 3 4


p 0,3 0,5 0,2


2
T ì m qui luật p h â n p h ố i x á c suất của Y = X


<i>Giải: Các giá trị mà Y có thể nhận là: </i>
yi = 22 = 4; y2 = 32 = 9; y3 = 42 = 16


P(X= 2) = P(Y= 4) = 0,3; P(X= 3) = P(Y= 9) = 0,5;
<i>P(X= 4) = P(Ỷ= 16) = 0,2; </i>


Vậy phân phối xác suất của Y như sau:


Y 4 9 16


p 0,3 0,5 0,2


<i>b- Nếu tương ứng với hai (hay nhiều hơn 2) giá trị của X ta có một </i>
<i>giá trị của Y </i>



Chẳng hạn ứng với 2 giá trị có t h ể nhận của X ta chỉ có m ộ t giá trị
có t h ể nhận của Y, tức:


(Y=yk) = (X=xt)u(X=Xj)


Do các biến cố (X= Xt) và (X= Xj) xung khắc, áp dụng công thức
cộng x á c suất ta có:


P(Y=yk) = P(X= xt) + P(X=Xj)


<i>Thí dụ 2: Đại lượng ngẫu nhiên X có bảng phân phối xác suất như </i>


sau:


</div>
<span class='text_page_counter'>(98)</span><div class='page_container' data-page=98>

<i>éịiáữ trình bị tluiụẾt xịe, mủi tui thống, kè tốn </i>


X - 2 1 2


p 0,1 0,4 0,5


T i m qui luật p h â n phối x á c suất của Y = X


<i>Giải: Ta có: </i>


khi X = - 2 thì Y = ( - 2 )2 = 4; khi x = Ì thì Y = Ì2 = Ì;
K h i X = 2 thì Y = 4 ;


N h ư vậy:



( Y = 4 ) = [ ( X = - 2 ) U ( X = 2 ) ]
Do đó:


P ( \ = 4) = P(X= - 2 ) + P(X= 2) = 0,6
Và: P(Y= 1) = P(X= ì) = 0,4


V ậ y qui luật p h â n phối x á c suất của Y như sau:


Y 1 4


p 0,4 0,6


<i>c- Trường hợp X tò đại lượng ngẫu nhiên liên tục </i>


Giả sử đ ạ i lượng ngẫu n h i ê n X liên tục v ớ i h à m mật độ x á c suất
f(x) đã biết và Y la ham số của X : Y = f ( X )


Có thể chứng minh được rằng: Nếu Y = f(X) là hàm khả vi, đơn


đ i ệ u tăng hoặc đơn đ i ệ u g i ả m , có h à m ngược là X = *F(y) thì hàm
mật độ x á c suất (p(y) của đ ạ i lượng ngẫu nhiên Y được x á c định
bằng b i ể u thức:


9(y) = f [vĩ ' ( y ) ] | T ' ( y ) |


2- Qui luật phân phối xác suất của hàm hai đại lượng ngẫu
n h i ê n


</div>
<span class='text_page_counter'>(99)</span><div class='page_container' data-page=99>

<i>thường. 5: Vỗàm cùa các đại lưựnạ ngẫu nhiên oà luật iế lán </i>



N ế u ứng v ớ i m ỗ i cặp giá trị c ó th ể nhậ n của hai đ ạ i lượng ngẫ u
nhiêri X và z có một giá trị có thể nhận của đ ạ i lượng ngẫu n h i ê n Y
thì Y được g ọ i là h à m của 2 đ ạ i lượng ngẫu nhiên X và z


Y = q>(X, Z)


Nếu biết được qui luật phân phối xác suất của X và z, ta có


t h ể t ì m đ ư ợ c q u i l u ậ t p h â n p h ố i x á c suất của Y = (p(X, Z)
Để tìm các giá trị mà Y có thể nhận và tính các xác suất tương ứng


của Y n g ư ờ i ta thường t i ế n h à n h lập bảng, Đ ể biết c á c h lập bảng n à y
la x é t m ộ t thí dụ sau đ â y :


<i>Thí dạ: Có 2 máy cùng sản suất một loại sản phẩm, tỷ lệ sản phẩm </i>


l o ạ i A của m á y thứ nhất là 0,8; của m á y thứ hai là 0, 7; L ấ y 3 sản
p h ẩ m do m á y thứ nhất sản xuất và Ì sản p h ẩ m do m á y thứ hai sản
xuất đ ể k i ể m tra. T i m quy luật p h â n phối x á c suất của số sản p h ẩ m
l o ạ i A có trong 4 sản phẩm l ấ y ra từ hai m á y đ ể k i ể m tra ?


<i>Giải: Gọi X là số sản phẩm loại A có trong 3 sản phẩm lấy ra từ máy </i>


thứ nhất đ ể k i ể m tra. D ễ thấy rằng X ~ B(3; 0,8). N ê n ta d ễ d à n g tìm
được bảng p h â n phối x á c suất của X như sau:


X 0 1 2 3


p 0,008 0,096 0,384 0,512



G ọ i z là số sản phẩm l o ạ i A có trong Ì sản p h ẩ m l ấ y ra từ m á y t h ứ
hai đ ể k i ể m tra z ~ B ( l ; 0,7). Bảng p h â n p h ố i x á c suất của z n h ư
sau:


z 0 1


p 0,3 0,7


G ọ i Y là số sán phẩm l o ạ i A có ư ơ n g 4 sản phẩm l ấ y ra từ hai m á y
đ ể k i ể m ư a thì:


</div>
<span class='text_page_counter'>(100)</span><div class='page_container' data-page=100>

<i>íịiáo trình, lý. thuyết xịe, mất ồ. thống, kẻ tốn </i> <i>ì </i>


tức Y là h à m của hai đ ạ i lượng ngẫu n h i ê n X và z.
Để tìm qui luật phân phối xác suất của Y, trước hết ta tìm các giá
trị mà Y có t h ể nhận. M u ố n v ậ y ta lập bảng n h ư sau:


0 1 2 3


z \


0 0 1 2 3


1 1 2 3 4


Trong bảng trên dòng X ta ghi c á c giá trị mà X có thể nhận. (trong
thí dụ ta đ a n g xét, X có thể nhận c á c giá trị 0, Ì, 2, 3)


Cột z ghi cạc giá trị mà z có thể nhận. Trong thí dụ này, z'chỉ có
thể nhận một trong hai giá trị: 0 hoặc 1;



Các ô còn lại ta ghi các giá trị mà Y có thể nhận. Để xác định các


giá trị n à y ta c ă n cứ v à o b i ể u thức của h à m b i ể u đ i ể n m ố i quan hệ
giữa Y v ớ i X và z , trong thí dụ ta đ a n g x é t b i ể u thức h à m n à y có
dạng: Y = X + z , đồng thời c ă n cứ v à o giá trị của X và z ở cột và
dòng tương ứng.


Chẳng hạn: Y nhận giá trị 0 khi X = 0 đồng thời z = 0;


Y = l khi x = 0 đồng thời z = Ì hoặc X = Ì đồng thời z = 0
(tương ứng v ớ i hai ừường hợp này trên bảng có hai ơ ghi số 1)


Vậy các giá trị mà Y có thể nhận là: 0, Ì, 2, 3, 4.


<i>Ta có thể biểu diễn việc phân tích ề Xiên dưới dạng tổng và tích các </i>
b i ế n c ố nh ư sau:


( Y = 0) = [ ( X = 0)(Z = 0)]


( Y = 1) = [(X = 0)(Z = 1)] u [ ( X = 1)(Z = 0)]
( Y = 2) = [ ( X = 2)(Z = 0)] u [ ( X = 1)(Z = 1)]


</div>
<span class='text_page_counter'>(101)</span><div class='page_container' data-page=101>

<i>(Phương. 5: 7Càm eủa eáe đại /ưựttạ ngẫu nhiên g ã luật tố lởn </i>


( Y = 3) = [(X = 2)(Z = 1)] u Ĩ ( X = 3)(Z = 0)]
( Y = 4 ) = [ ( X = 3 ) ( Z = 1 ) ]


Á p dụn g côn g thức cộng x á c suất và côn g thức nhân xá c suất, ta tính
c á c x á c suất tương ứng v ớ i các giá trị của Y như sau:



P(Y = 0) = P(X = 0).P(Z = 0) = 0,08. 0,3 = 0,0024
• P(Y = 1) = P(X = 0).P(Z = 1) + P(X = 1).P(Z = 0)


= 0,008. 0,7 + 0,096. 0,3 = 0,0344
P(Y = 2) = P(X = 2).P(Z = 0) + P(X = 1).P(Z = 1)


= 0,384. 0,3 + 0,096. 0,7 = 0,1824
P(Y = 3) = P(X = 2).P(Z = 1) + P(X = 3).P(Z = 0)


= 0,384. 0,7 + 0,512. 0,3 = 0,4224


P(Y = 4) = P(X = 3).P(Z = 1) = 0,512. 0,7 = 0,3584
V ậ y ta có qui luật p h â n p h ố i x á c suất của Y như sau:


Y 0 1 '-. 2 3 4


p 0,0024 0,0344 0,1824 0,4224 0,3584


<i>• Trường hợp X, z là các đại lượng ngẫu nhiên liên tục </i>


C ó t h ể chứng (ninh được rằng: h à m mật độ x á c suất (p(y) của Y
(Y = X + Z) được x á c định theo công thức:


<i>y ' y </i>


cp(y)= J f1( x ) fỉ<i>( y - x ) d x Hoặc: Ịf, (y - z ) f</i>2 (z)dz


<i>f ị và Ỉ2 là các h à m mật độ xác suất của X và z tương ứng </i>



[với đ i ề u k i ệ n là khi một trong 2 h à m n à y . x á c định trong khoảng
(-00, +oo) bằng một b i ể u thức]


</div>
<span class='text_page_counter'>(102)</span><div class='page_container' data-page=102>

<i>íịiá& trịnh dị t/uiụết xác xuất MÌ thống, kê toán </i>


3- C á c t h a m s ố đ ặ c t r ư n g c ủ a h à m c á c đ ạ i l ư ợ n g n g ẫ u n h i ê n
Giả sử đ ạ i lượng ngẫu nhiên r ờ i rạc X có p h â n phối x á c suất như
sau:


X Xi x2


p <sub>P' </sub> <sub>P2 </sub> Pn


Ta cần tìm kỳ vọng tốn và .phương sai của đ ạ i lượng ngẫu nhiên Y
[Y = (p(X)]. C á c tham số đặc trưng này được xác định bằng c á c công
thức sau:


E(Y) = E[(p(X)]=ịọ(xi)pi


Var(Y) = Var[<p(X)] = £<p2(x,)Pl -[E(Y)]2
i = l


* Nêu X là đại lượng ngẫu nhiên liên tục với hàm mật độ xác suất là


f(x) thì kỳ vọng tốn và phương sai của đ ạ i lượng ngẫu nhiên
Y = (p(X) được xác định bằng cơng thức:


•KO


E(Y) = E [ Ọ ( X ) ] = J(p(x)f(x)dx


-co


+00


V a r ( Y ) = Var[(p(X)] = J(p2 ( x ) f ( x ) d x - [ E ( Y ) ]2
-00


li- Luật số lớn


Như ta đã thấy ở các phần trước, khơng thể dự đốn trước một cách


</div>
<span class='text_page_counter'>(103)</span><div class='page_container' data-page=103>

<i>thường. 5: 7õàtii của các đại lường. Iiạẫii nhiều oà luật tá' lân </i>


xét đồng thời một số lớn các đại lượng ngẫu nhiên thì tính "ngẫu


n h i ê n " của h i ệ n tượng mất đi và qui luật tất nhiên của nó được thể
h i ệ n .


Đối với thực tiễn thì điều quan trọng là phải xác định các điều


k i ệ n trong đó tác động đồng thời của nhiều nguyên nhàn niiẫn nhiên
sẽ dẫ n đ ế n k ế t quả gầ n như khôn g phụ thuộc gì và o cá c y ế u tô ngẫu
n h i ê n nữa và khi đó ta có thể dự đốn được tiến ưình của h i ệ n
tượng. C á c đ i ề u k i ệ n n à y được chỉ ra trong các định lý có tên là luật
số lớn. Định lý Chebyshev là định lý tổng quát nhấí của luật số lớn,
c ò n định lý Bernoulli là định lý đơn giằn nhất.


Để chứng minh' các định lý này ta sử dụng bất đẳng thức
Chebyshev.



Ì- Bất đẳng thức Chebyshev


C ó t h ể chứng minh được rằng: N ế u X là đ ạ i lượng ngẫu nhiên có
kỳ vọng tốn và phương sai hữu hạn thì v ớ i m ọ i số dương s bé tùy ý,
ta đ ề u có:


V a r ( X )
P ( | X E ( X ) 1 < £ ) > 1


-E2


B ấ t dẳng thức Chebyshev còn được b i ể u d i ễ n dưới dạng k h á c như
sau:


V a r ( X )
P ( | X - E ( X ) ị > 8 ) <


s2


</div>
<span class='text_page_counter'>(104)</span><div class='page_container' data-page=104>

<i>íịiấ trình lự thuyết xịe. Mất OĂ tkếttạ kẻ tôn </i>


<i>Thí dụ: Thu nhập trung bình của c á c hộ gia đình ở một vùng là 900 </i>


U S D / n ă m và độ lệch chuẩn là 120 USD. H ã y x á c định khoảng thu
nhập xung quanh giá trị trung bình của ít nhất 95% hộ gia đình ơ
vùng đó.


<i>Giải: Gọi X là thu nhập của một hơ gia đình ở vùng này thì X là đại </i>


lượng ngẫu nhiên với qui luật p h â n phối chưa biết, nhưng E(X) = 900


và ax = 120.'Do đó theo bất đẳng thức Chebyshev, ta có:


<i>p(jx-E(X)|.<e)>l-^^ y </i>


6
. ì


. = > P ( ị x - 9 0 0 | < e ) > l - ^ y - = 0,95
£


Từ đó ta tìm được s = 536,656


Vậy ít nhất 95% hộ gia đình ở vùng đó có thu nhập hàng năm nằm


trong khoảng (900 - 536,656; 90Ọ + 536,656) tức thu nhập của các
hộ gia đình trong khoảng (363,344;• 1436,656) U S D / n ă m .


2- Định lý Chebyshev


Nếu các đại lượng ngẫu nhiên X[, X2 , xn độc lập từng đơi,


có kỳ vọng tốn hữu hạn và các phương sai đ ề u bị chặn trên b ở i
hằng số c [Var(Xị) < c ; V i = thì Ve > 0 b é tùy ý cho trước ta
luôn có:


Lim P(|-ẳXi-lẳE(Xi)|<6) = l


<i>li t i n t i </i>


Ị n



<i>Chứng minh: X é t đai lương ngẫu nhiên: X = - Y x </i>


n t r
Ta có:


</div>
<span class='text_page_counter'>(105)</span><div class='page_container' data-page=105>

<i>@hưư4iạ 5: Jơàm của ốn đại tường, ngẫu nhiều oà luật- úi lứt Ị </i>


E ( X ) = E


Ị n \ Ị n


<i>\ n t í ) n t í </i>


Ì X2- 1 T2


<i>-yntỉ ) n i</i>= l


Var( X ) = Var


Áp dụng bất đẳng thức Chebyshev cho đại lượng ngẫu nhiên X ta
có:


, , V a r ( X ) , X V a r ( X i )
< £ ) > ! - - ^ 7 ^ = 1 - — Ì ;
P ( | X - E ( X ) |


n2. e2


Theo giả thiết: Var(Xị) < c (V i = 1,«). Do đó, trong b i ể u thức trên,


n ế u ta thay m ỗ i Var(Xi ) ( i = 1,«) bằng c thì bấ t đ ẳ n g thức sẽ chỉ
mạnh t h ê m .


P ( | X - E ( X ) | < s ) * l - - ~ 5 - = l - - £ r
n .e n.e
L ấ y g i ớ i hạn cả hai v ế khi n - » 00 ta có:


- 4 c


<i>L i m P ( l X - E ( X ) I < e ) > L i m ( l - -—J) = Ì </i>
n-»oo .n-»« n_g


Ta chú ý rằng, x á c suất của b i ế n c ố không thể lớn hơn 1. Do đ ó :
L i m P | x - E ( X ) | < e ) = l


Đó là điều cầaphải chứng minh.


<i>• Trường hợp riêng của định lý Chebyshev </i>


N ế u X i , X2, . . . , xn là c á c đ ạ i lượng ngẫu nhiê n độc lậ p từng đơi ,
có c ù n ể kỳ vọng toán, [E(Xị) = a ( V i = Ị , H ) ] thì Ve > 0 b é tùy ý
ta-luôn c ó :


</div>
<span class='text_page_counter'>(106)</span><div class='page_container' data-page=106>

L i m P
n—>00


ì JQ_


ni*' < 6 = 1



<i>• Bản chất của định lý Chebyshev </i>


I •!.!•; r i u In vhcv Jã chứng tỏ sự ổ n định của ư u n g bình số học
của một số lớn các đ ạ i lượng ngẫu nhiên xung quanh trung bình số
học các kỳ vọng toán của các đ ạ i lượng ngẫu nhiên ấy.


Như vậy, mặc dù từng đ ạ i lượng ngẫu nhiên độc lập có thể nhận
giá trị sai khác nhiều so với kỳ vọng tốn của chúng, nhưng trung
bình sù học của một số lớn c á c đ ạ i lượng ngẫu nhiên l ạ i nhận giá trị
gần bằng trung bình số học của các kỳ vọng toán của chúng v ớ i xác
suất rất lớn'. Đ i ề u đó cho p h é p dự đ o á n giá trị giá trị trung bình số
học của đ ạ i lượng ngẫu nhiên.


Trong thực tế, định lý Chebyshev được ứng dụng rộng rãi trong


n h i ề u lĩnh vực. Chẳng hạn, trường hợp r i ê n g của n ó là cơ sở cho
phương p h á p đo lường trong vật lý. N h ư chúng ta đ ề u b i ế t , đ ể xác
định một đ ạ i lượng n à o đ ó , người ta thường t i ế n h à n h đo nhiều lần
và l ấ y ừung bình số học của c á c k ế t quả đo ấy l à m giá trị thực của
đ ạ i lượng cần đo.


Thật vậy: ta có thể coi kết quả của n lần đo là các đại lượng ngẫu


<i>nhiên Xị, X2, . . . , X</i>n. C á c đ ạ i lương n à y độc l ậ p từng đơi, có cùng
kỳ vọng toán (kỳ vọng toán của c ác đ ạ i lượng ngẫu nhiên n à y chính
là giá trị thực của đ ạ i lượng cần đo) và phương sai của chúng đ ề u bị
chặn trên bởi chính độ chính x á c của thiết bị dùng đ ể đo. Vì t h ế
theo trường hợp riên g của định lý Chebyshev thì trung bìn h số học
của các k ế t quả đo sẽ sai lệeh rất ít so với giá trị thực của đ ạ i lượng
cần đo và điều đó xảy ra v ớ i x á c suất gần bằng 1.



Định lý Chebyshev còn là cơ sở cho một phương pháp được áp


</div>
<span class='text_page_counter'>(107)</span><div class='page_container' data-page=107>

<i>(?ilười UI 5: JCtưn cua eáe đai Ixíđ4iạ ngẫu nhiên ồ Lưu lơ lởn </i>


dựa v à o một mẫu khá nhỏ ta có thể k ế t luận về toàn bộ tập hợp các
đ ố i tượng cần nghiên cứu.


Chẳng hạn để đánh giá năng suất cây trồng ở một vùng nào đó


người ta k h ơ n g cần phải điều tra toàn bộ diện tích trồng l o ạ i cây này
mà chỉ cần dựa v à o k ế t quả thu hoa ch cửa một mẫu mà v ẫ n đưa ra
được các k ế t luận đủ chính x á c v ề năng suất cây trồng của vùng đó.
3- Định lý Bernoulỉi


Nếu Fn là tần suất xuất hiện biến cố A trong n phép thử độc lập và


p là x á c suất xuất h i ệ n b i ế n c ố trong m ỗ i p h é p thử đó thì v ớ i m ọ i e
dương b é tùy ý, ta luôn ln có:


Lim p(| Fn - p I < E) = Ì


<i>Chứng minh: Gọi X là số lần xuất hiện biến cô A trong n phép thử </i>


<i>độc lập. X i (ỉ = ỉ,n) là số l ầ n xuất hiện b i ế n cố A trong p h é p thử thứ </i>
I I >0 thú > M ne X j có p h â n phối xác suất như sau:


Xi 0 1


p <sub>q p </sub>



Trong dỏ.


q = Ì - p , Tri thấy: X li
i = l


V i=l
.2


<i>iu \ n </i>


£ x i = £ E ( X , ) = n p
<i>) i=i </i>


<i>E(Xi) = o.q + l.p = p => E(X) = E </i>


Var(Xị) = E( X?) - [E(Xi)]2 = p - p2 = p(l - p) = p.q
<i>í</i> n ^ "


=> Var(X) = Var X x . = L V a r ( X . ) = 'nP(l
i=i


</div>
<span class='text_page_counter'>(108)</span><div class='page_container' data-page=108>

<i>íịiáữ trình tụ. thuyết xịe, mất oà. tháng, kê tơón </i>


X é t đ ạ i lượng ngẫu nhiên Fn = — . Ta thấy Fn chính là tần suất
n


xuất h i ệ n b i ế n c ố A ương n p h é p thử độc l ậ p . '


E Í Fn) = E



X Ì Ì


- = - E ( X ) = - n . p = p
v n j n n


Var(Fn) = Var 1 V a r ( X ) = ^ U H
n n n
Á p đụng bất đẳng thức Chebyshcv cho đai lưrtng ngẫu n h i ê n Fn ta
có:


P ( | F n- p | < e ) > l - - £ ị
n.£^
L ấ y giới hạn cả 2 v ế khi n - > 00 ta có:


L i m P ( | Fn- p | < s ) > L i m ( Ì - ^ 4 ) = Ì
<i>ne </i>


M ặ t khác, vì xác suất k h ơ n g thể lớn hơn Ì, do đó:
Lim P(| fn - p| < e) = Ì


<i>* Ý </i> <i>nghĩa: </i>


</div>
<span class='text_page_counter'>(109)</span><div class='page_container' data-page=109>

<i>&uứfrtạ ó: Mẫu ngẫu nhiên </i>


P h ầ n 2


T H Ô N G K Ê T O Á N


Thống kê tốn là bộ mơn tốn học nghiên cứu qui luật của các hiện



tượng ngẫu n h i ê n có tính chất số lớn trên cơ sở thu thập và xử lý c á c
số l i ệ u thống k ê - các k ế t quả quan sát. Như vậy nội dung chủ y ế u
của thống kê toán là x â y dựng các phương p h á p thu thập và xử lý
c á c số1 l i ệ u thống k ê nhằm rút ra các k ế t luận khoa học. C á c phương
p h á p thống k ê tốn là cơng cụ đ ể giải quyết nhiều vấn đề khoa học
và thực t i ễ n nảy sinh trong c á c lĩnh vực khác nhau của tự nhiên và
kinh t ế xã h ộ i .


<i>C h ư ơ n g 5: M Ẫ U N G Ẫ U N H I Ê t y </i>


I- Tổng thể
Ì- Kh4i niệm


</div>
<span class='text_page_counter'>(110)</span><div class='page_container' data-page=110>

<i>QiáA trình bị ưuujẤ't xác uiất nả thấtig. kê tốn </i>


hàng của mình theo các dấu h i ệ u như: mức độ hài lòng của khách
h à n g v ề sản phẩm hay dịch vụ của doanh nghiệp (dấu h i ệ u định
tính) hoặc nghiên cứu theo dấu hiệu định lượng là nhu cầu của khách
hàng về số lượng sản phẩm của doanh nghiệp. Trong trường hợp này
thì tạp hợp gồm tất cả các k h á c h h à n g của doanh nghiệp là tổng thể.
Đối với tổng thể, ta sử dụng một số khái niệm và ký hiệu sau đây:


<i>• N: Số phần tử của tổng thể và được gọi là kích thước của tổng thề. </i>


Kích thước của tổng thể phụ thuộc v à o vấ n đ ề và phạ m v i nghiên
cứu.


• X* : Dấu hiệu ta cần khảo sát, nghiên cứu (trong kinh tế thường gọi



là chỉ tiêu).. Dấu hiệu nghiên cứu có thể là định tính hoặc định lượng.
Cần nhấn mạnh rằng, khi nói nghiên cứu một tổng thể có nghĩa là ta
n g h i ê n cứu dấu hiệ u X* được th ể h i ệ n trê n cá c phầ n tử của tổng thể.
• Xi (i = 1,2, k) là các giá trị của dấu hiệu X* đo được trên các


phần tử của tổng thể. Xi là những thông tin cần thiết đ ể ta nghiên cứu
v ề dấu hiệ u x \ còn cá c phần tử của tổng th ể là những đ ố i tượng
mang thơng tin.


• Ni (i = Ì, 2, .... k): Tần số của Xi - là số phần tử nhận giá trị Xj.
* Pi Ú = i, 2 k): Tần suất của X, - là tỷ số giữa tần số của Xi và


<i>* , N i</i> B / £


<i>kích thước tống thế: pi — . Ta ln ln có 2 ^ p ' l </i>


-2- Các phương pháp mơ tả tổng thể


</div>
<span class='text_page_counter'>(111)</span><div class='page_container' data-page=111>

<i>&ƯIUỊ ó: MÂU IUỊỖU</i> <i>nhiều </i>
<i>Bảng 6.1 </i>


Giá trị của X * Xi x2 xk .


T ầ n số (Ni) N i N2 Nk


k


H i ể n nhiên: 0 < N i < N và ta ln có: 2 ^ N ; = N
i=l



Ta cũng có.thể mơ tả tổng thể bằng bảng phân phối tần suất. Dạng
tổng q u á t của bảng n à y như sau:


<i>Bảng 6.2 </i>


Giá trị của X* Xi x2 xk


T ầ n suất (Pi) Pl P2 Pk


k


Ta ln ln có: 0 < Pi < Ì và ] T p í = 1 .
i=l


<i>* Chùy: Bảng (6.1) và (6.2ì,ró thổ lập dưới dạng cột. </i>


Về hình thức, bảng phân phối tần suất của tổng thể tương tự như


bảng p h â n phối xác suất của đ ạ i lượng ngẫu nhiên rời rạc. N ó phản
á n h cơ cấu của tổng thể.


3- Các số đặc trưhg của tổng thể


</div>
<span class='text_page_counter'>(112)</span><div class='page_container' data-page=112>

<i>cịiáo trình Lị thuyết xác mất ồ. tlÚHtọ. kê tữáiL </i>
<i>Ì- Trung bình của tổng thể </i>


<i>Trung bình của tổng thể (ký hiệu là ịi), được xác định theo công </i>
thức: .


k



H = 2 > i P i (6.3)
i = l


<i>2- Phương sai của tổng thể </i>


Phương sai của tổng thể (ký hiệu là ơ2) được xác định theo cơng
thức:


k
• i = l


I


<i>3- Độ lệch chuẩn của tổng thể </i>


Độ lệch chuẩn của tổng thể (ký hiệu là ơ) được xác định theo công
thức:


<i>ơ=Vỡ</i>r<i> (ỂL5). </i>
<i>4- Tỷ lệ tổng thể </i>


Tỷ lệ tổng thể (ký hiệu là p) được định nghĩa như sau:


Giả sử tổng thể gồm N phần tử, trong đó có M phần tử có tính chất
M


<i>Ạ . G ọ i p = — là tỷ l ệ các phần tử có tính chất A của tổng thể (hay </i>


gọi tắt là tỷ lệ tổng thể), p cũng chính là xác suất lấy được phần tử


có tính chất A khi lấy ngẫu nhiên một phần tử từ tổng thể.


<i>Thí dụ: Ngành cao su có 500.000 cơng nhân. Để nghiên cứu mức </i>


sống của họ, người tá khảo'sát chỉ tiêu X* :" Thu nhập thực tế của


</div>
<span class='text_page_counter'>(113)</span><div class='page_container' data-page=113>

<i>ót lứtfi tạ ó: Mẫu ngẫu nhiên </i>
<i>Bảng 6.6 </i>


Thu nhập số công nhân . T ầ n suất


X* (ngàn/tháng) <sub>(Ni) </sub> <sub>(Pi) </sub>


500 50.000 0,10


600 70.000 0,14


700 150.000 0,30


800 120.000 0,24


900 55.000 0,11


1000 30.000 0,06


1100 25.000 0,05


Tống 500.000 1,00


T ừ bảng 6.6 ta tính được:



• Thu nhập trung bình của cơng nhân ngành cao su (trung bình tổng
thể) là;


l i = 500x 0,1 + 600x 0,14 + 700x 0,3 + 800x 0,24 +


+900x 0,11 + lOOOx 0,06 + Ì lOOx 0,05 = 750 ngàn đồng.
• Phương sai của thu nhập (phương sai của tổng thể):


ơ2= (500 - 750)2.0,1 + (600 -750)2.0,14 + (700 - 7 5 0 )2 0,3 +
+ (800 - 750)2.0,24 + (900 - 750)2.0,11 + (K)00 - 750)2 0,06
+ (1100-750)2.0,05 =23100


• Độ lệch chuẩn của thu nhập (độ lệch chuẩn của tổng thể):
ơ = V23100 = 151,987


• T ỷ l ệ cơng nhân có thu nhập cao của n g à n h cao su (tỷ l ệ tổng thể):
N ế u ta coi những côn g n h â n có mức thu nhập từ 1000 (ngà n đồng)
-trở l ê n là những người có thu nhập cao thì tỷ l ệ cơng n h â n có thu


</div>
<span class='text_page_counter'>(114)</span><div class='page_container' data-page=114>

<i>4ỳiá& bình bị tluiụết xác tuất ồ tliếnạ kê tơÓMi </i>


30000 + 25000 _


n = •— = 0,11 hay 1 1 %


F 500000


li- Khái niệm mẫu



Đ ể nghiên cứu tổng thể theo m ộ t hay một số dấu hiệu n à o đó ta
cần nghiên cứu tồn bộ các phần tử của tổng thể, tức là thống kê
tồn bộ táp hợp và phân tích từng phần tử của nó theo dấu hiệu
nghiên cứu. Chẳng hạn đ ể nghiên cứu d â n số của một nước theo các
dấu hiệu như: giới tính, độ tuổi, nghề nghiệp, trình độ học v ấ n , nơi
cư trú, . . . . ta phải t i ế n hành tổng điều tra dân sô và p h â n tích từng
người theo các dấu hiệu trên sau đó tổng hợp cho tồn bộ d â n số của
cả nước. Tuy nhiên trong thực t ế cách l à m này gặp phải những khó
khăn sau đây:


• N ế u kích thước của tổng thể quá lớn thì việc nghiên cứu tồn bộ
phải chịu chi phí lớn về t i ề n của, thời gian, nhân lực, phương t i ệ n , . .
. dễ xảy ra sai sót trong quá trình thu thập thơng tin ban đầu, hạn c h ế
độ chính xác của k ế t quả p h â n tích.


• Nếu các phần tử của tập hợp lại bị phá hủy trong quá trình điều


tra thì phương phá p nghiê n cứu tồ n bộ trở thàn h vơ nghĩa . Chẳng
hạn: đ ể k i ể m tra chất lượng của các hộp sữa do một h ã n g sản xuất
thì ta không thể mở tất cả các hộp sữa do hãng này sản xuất đ ể k i ể m
tra được.


</div>
<span class='text_page_counter'>(115)</span><div class='page_container' data-page=115>

<i>CHúttiq. ó: Mẫu ngẫu nhiên. </i>


Vì vậy, từ t h ế kỷ 17, phương p h á p nghiên cứu mẫu đã ra đ ờ i , ngày
càng phát triển và được sử dụng rộng rãi trong nhiều lĩnh vực. T ư
tưởng cơ bản của phương p h á p mẫu như'sau:


T ừ tổng-thể ta l ấ y ra n phần tử và đo lường giá trị của dấu hiệu X*
trên chúng, n phần tử n à y lập n ê n một mẫu. s ố phần tử của mẫu (n)


<i>được g ọ i là kích thước mẫu. thơng thường kích thước của mẫu nhỏ </i>
hơn nhiều so với kích thước của tổng thể. Vì vậy ta có khả năng thực
t ế đ ể thu thập, x ử lý và khai thá c thôn g tin mẫ u mộ t các h nhanh
chóng, tồn d i ệ n hơn. Sử dụng các phương p h á p toán học (đặc b i ệ t
là lý thuyết xác suất), người ta t i ế n h à n h suy rộng k ế t quả nghiên
cứu trên m ẫ u cho tồn bộ tổng t h ể , đó là mục đích cuối cùng của
phương p h á p mẫu.


Để đạt được mục đích trên thì mẫu phải đại diện cho tổng thể.


M u ố n vậy, khi lấy mẫu phải đ ả m bảo tính ngẫu nhiên, khơng chọn
m ẫ u theo một tiêu chuẩn chủ quan đã định trước.


Trong thực t ế có nhiều cách lấy mẫu:


<i>Ì- Lấy mẫu ngẫu nhiên:! </i>


Ta đánh số các phần tử từ Ì đ ế n N (N là số phần tử của tổng
thể),-Đ ể có một mẫu kích thước n, ta- có thể dùng bảng số ngẫu nhiên'
hoặc dùng cách bốc thăm đ ể lấy cho iu n phần tử vào mẫu.


Bằng cách này, m ỗ i phần tử của tỏng thể đều có khả năng dược
chọn vào mẫu như nhau.


<i>2- Chọn mẫu cơ giới: </i>


</div>
<span class='text_page_counter'>(116)</span><div class='page_container' data-page=116>

<i>4ịỉá& trình lự. thuyết xác Mất ồ tìt éhiạ UẾ IOÚML </i>


Ta chia tổng thể thành một số lớp theo một chỉ tiêu phụ nào đó,



sao cho các phần tử trong m ỗ i lớp đồng đ ề u hơn. Sau đó mới lấy
ngẫu nhiên từ m ỗ i lớp một số phần tử đ ể đưa v à o mẫu. C á c h chọn
mẫu này thường được á p dụng khi phạm vi nghiên cứu rộng, số
lượng phần tử của tổng thể quá lớn.


Việc lấy mẫu được tiến hành chủ yếu theo 2 phương thức:


<i>a- Lấy mẫu có hồn lại (có lặp) </i>


Phương p h á p này được á p dụng khi tập hợp chính có ít phần tử.
Theo phương thức này, m ỗ i lần l ấ y vào mẫu chỉ một pịiần tử. Sau
khi đã được nghiên cứu ta trả l ạ i phần tử đỏ v à o tập hợp chính trước
khi lấy phần tử tiếp theo.


Như vậy, v ớ i cách l ấ y n à y , một phần tử có thể xuất h i ệ n nhiều lần
trong mẫu.


<i>b- Lấy mẫu khơng hồn lại (khơng lặp) </i>


Theo cách l ấ y này, phần tử được l ấ y ra nghiên cứu sẽ bị l o ạ i hẳn
ra khỏi tạp hợp chính.


Trong thực tế, nếu kích thước của tổng thể khá lổn thì phương thức


lây mẫu có hồn l ạ i và k h ô n g hoàn l ạ i cho ta k ế t quả sai lệch nhau
không đáng k ể . Đặc biệt khi kích thước của tổng thể là vơ hạn
CỊIL-kích thước của mẫu là hữu hạn thì khơng có sự k h á c b i ệ t giữa hai
phương thức lấy mẫu. Lúc đó có thể chọn mẫu theo phương thức
khơng hoàn l ạ i mà vẫn xem như mẫu được chọn theo phương thức có
hồn l ạ i .



Việc lựa chọn phương pháp lấy mẫu phụ thuộc vào mục đích, đối


</div>
<span class='text_page_counter'>(117)</span><div class='page_container' data-page=117>

<i>&uỉđti(Ị Ĩ: Mẫu ngầu </i> <i>/thiền </i>


H I - M ô h ì n h x á c s u ấ t c ủ a t ổ n g t h ể v à m ẫ u
Ta có thể dùng cơng cụ tốn học để mơ tả và khái qt các khái


n i ệ m : tổng t h ể , dấu h i ệ u n g h i ê n cứu và m ẫ u đã nêu ở phần trên. Tức
là x â y dựng m ơ hình tốn học của chúng.


Ì- Đại lượng ngẫu nhiên góc và qui luật phân phối gốc


Từ bảng 6.1 (hoặc 6.2) ta thấy có thể mơ hình hoa dấu hiệu X*
bằng m ộ t đ ạ i lượng ngẫu nhiên.


T h ậ t vậy, n ế u lấy ngẫu n h i ê n từ tổng thể ra một phần tử và g ọ i X
là giá trị của dấu hiệu X* đo được ư ê n phần tử lấy ra đó thì X là đ ạ i
lượng ngẫu nhiên có p h â n p h ố i x á c suất như sau


<i>Bảng 6.7 </i>


X <sub>Xi </sub> <i>Xi </i> Xi Xk


p <sub>P I </sub> <sub>P2 </sub> <sub>Pi </sub> <sub>Pk </sub>


N h ư v ậ y dấu h i ệ u mà ta nghiên cứu (X*) được mơ hình hóa bởi
đ ạ i lượng ngẫu nhiên X . Qui luật phân phối x á c suất của X được g ọ i


<i>, , ì. </i>



là qui luật p h â n phơi góc.


2- Các tham số của đại lượng ngẫu nhiên gốc


<i>a- Kỳ vọng toán: Với qui luật phàn phối xác suất (6.7) của X. </i>


Theo định nghĩa, kỳ vọng toán của X sẽ là:


E(X) = £xiPi


i = l


<i>So sánh với (6.3) ta thấy trung bình của tổng thể chính là kỳ </i>


</div>
<span class='text_page_counter'>(118)</span><div class='page_container' data-page=118>

<i>(ịiáữ trình bị thuyết xát Mất où điếng, kê tơáit </i>


V a r ( X ) = Ề [ Xi - E ( X ) ] 2 P ;
i = l


Nhưng E(X) = li, Do đ ó :


V a r ( X ) = Ề ( x , - | i ) 2 p?
i=I


<i>So s á n h vớ i (6.4) ta thấy phương sai của tổng thể chính là </i>
2


<i>phương sai của đại lượng ngẫu nhiên gốc X: ơ = V a r ( X ) </i>



3- Mầu ngẫu nhiên.


Giả sử lấy ra n phần tử từ tổng t h ể , tạo n ê n một m ẫ u có kích thước
n theo phương-pháp có h o à n l ạ i . G ọ i X j là giá trị của dấu h i ệ u X đo
được trên phần tử thứ i ( i = Ì, 2, . . . , n). Vì các phần tử được lấy ra
theo phương thức có hoàrt l ạ i n ê n X i , %2, . . . , x „ là các đ ạ i lượng
ngẫu nhiêiTđộc lập, có qui luật p h â n phối xác suất giống v ớ i qui
luật p h â n phối xác suất của X .


V ậ y n phần tử thuộc mẫu, nếu gạt bỏ c á c hình thức cụ t h ể , được
mô tả bằng n đ ạ i lượng ngẫu nhiên: X i , X2, . . . , xn. Do đó ta có thể
khái quát đ ể định nghĩa mẫu ngẫu nhiên như sau:


<i>Cho đại lượng ngẫu nhiên X vôi qui luật phân phối xác suất nào </i>
<i>đó. Một mẫu ngẫu nhiên kích thước n được thành lập từ đại lượng </i>
<i>ngẫu nhiên X là n đại lượng ngẫu nhiên độc lập, có cùng phân phối </i>
<i>xác suất với đại lượng ngẫu nhiên X. </i>


Ký h i ệ u mẫu ngẫu nhiên kích thước n được xây dựng từ đ ạ i lượng
ngẫu nhiên X là: Wx = ( X i , X2, . . . . , xn)


Thực hiện một p h é p thử đô'i v ớ i m ẫ u ngẫu nhiên Wx, tức là thực
h i ệ n một p h é p thử đ ố i v ớ i m ỗ i thành phần (Xi) của mẫu. (trong thực
t ế thường là lấ y ra n phần tử cụ th ể từ tổng thể) . G i ả sử X i nhậ n giá
trị Xi ( i = Ì, 2, . . , n). C á c giá trị X i , x2, . . . ., xn tạo thành một giá


</div>
<span class='text_page_counter'>(119)</span><div class='page_container' data-page=119>

<i>()li ương. ó: Jtlẫu ngẫu nhiên </i>


trị của m ẫ u ngẫu nhiên, hay còn được g ọ i là một m ẫ u cụ t h ể . Ký
h i ệ u là wx = ( x i , x2 xn)



<i>Thí dụ ì: K ế t quả thi m ô n toán của một lớp g ồ m 50 sinh v i ê n như </i>


sáu


<i>Bảng 6.8 </i>


<i>* Đ i ể m thi </i> 4 5 6 7 9


S ố h/s có đ i ể m tương ứng 8 15 13 9 5
. G ọ i X là đ i ể m thi m ơ n tốn của một sinh viên chọn ngẫu nhiên
trong danh sách của lớp thì X là đ ạ i lượng ngẫu nhiên có p h â n phối
x á c suất như sau:


<i>Bảng 6.9 </i>


X 4 5 6 7 9


p 0,16 0,3 0,26 0,18 0,1


Ta coi 50 sinh viên của lớp này là một tổng thể (kích thước của
tổng t h ể này là 50). T ừ lớp này ta lấy một mẫu g ồ m 5 học sinh. G ọ i
X j ( i = 1,5) là đ i ể m thi m ô n ' t o á n của sinh viên thứ i được l ấ y v à o
mẫu. V ậ y la có mẫu ngẫu n h i ê n kích thước n = 5 được xây dựng từ
đ ạ i lượng ngẫu nhiên X:


W x = ( X , , X2 ) x3, X4, x5)
Thực hiện một phép thử đối với mẫu ngẫu nhiên này, tức chọn


ngẫu nhiên (có hồn l ạ i ) 5 sinh viên của lớp. Giả sử đ i ể m thi của


<i>sinh viên thứ nhất là ỉ ; của s/v thứ hai .là 9 ; của h/s thứ ba là 5 ; của </i>
h/s thứ tư là 7 và của h/s thứ n ă m là 4, thì ta có một mẫu cụ t h ể là:


</div>
<span class='text_page_counter'>(120)</span><div class='page_container' data-page=120>

<i>cịiáo trình lự thuyết xác mất Ồ tỉtốttạ kê tối! </i>


w x = (4, 7, 9, 9, 5)


Nếu kích thước mẫu lớn, việc trình bầy một cách cụ thể kết quả


quan sát như trên là không thuận tiện. Trong trường hợp n à y ta sử
dụng các khái n i ệ m : giá trị cua dấu h i ệ u X (Xi); tần suất của Xi (Pi)
đã nêu ở phần trên đ ể trình bầy mẫu cụ I h ể dưới dạng bảng.


Đ ể phân biệt với các ký hiệu của tổng thể. Đ ố i v ớ i m ẫ u ta dùng
các ký hiệu sau đây:


ni: Tần số của Xj; fi = — : Tần suất của Xi


n


<i>Thí dụ 2: T ừ bảng (6.6) ta thấy thu nhập của công nhân n g à n h cao su </i>


có thể mô hĩnh hoa bởi đ ạ i lượng ngẫu n h i ê n X với bảng p h â n phối
xác suât như sau:


<i>Bủng 6.10 </i>


X 500 600 700 800 900 1000 1100


p 0,10 0,14 0,30 0,24 0,11 0,06 0,05



Trong thực t ế ta thường chưa b i ế t được bảng này (vì muốn có được
bảng đó ta phải điều tra v ề thu nhập của toàn bộ 500.000 cồng nhân
ngành cao su). Vì vậy người ta dự định đ i ề u tra v ề thu nhập của 500
công nhân được chọn trong sộ' 500.000 công n h â n của tồn ngành
một cách ngẫu nhiên, có hồn l ạ i .


Gọi Xi là "Thu nhập của công nhân thứ i được đưa vào mẫu"


( i = 1,500). Như vậy ta có 500 đ ạ i lượng ngẫu nhiên: X i x2
x5()(), độc lập, có cùng p h â n phối xác suất v ớ i X. Tức ta có m ẫ u ngẫu
nhiên: w x = ( X | , x2 X500) được x â y dựng từ đ ạ i lượng ngẫu
nhiên gốc X.


Thực hiện một phép thử đối với mẫu wx, tức điều ưa thu nhập


</div>
<span class='text_page_counter'>(121)</span><div class='page_container' data-page=121>

<i>Qhươnạ ó: Mầu tiạẫu nhiên </i>
<i>Bảng 6. ì ì </i>


Xi 500 600 700 800 900 1000 1100


ni 50 75 105 160 60 40


• i o


N h ư v ậ y , bảng trên là một mẫu cụ thể (kích thước mẫu n = 500)
được chọn từ tổng t h ể có kích thước N = 500.0ŨU


Nếu điều tra thu nhập của 500 cồng nhân khác ta lại có một mẫu
cụ t h ể k h á c (một giá trị khác) của mẫu ngẫu nhiên W x


Như vậy, mẫu ngẫu nhiên có thể phản ánh được kết quả điều tra


thực nghiệm. B ở i vì các k ế t quả này được coi là một giá trị của nó.
Tức là khái quát được thực nghiệm. Quan hệ giữa mẫu ngẫu nhiên
và m ẫ u cụ thể (hay một giá trị của nó) tươne tự như quan hệ giữa đ ạ i
lượng ngẫu nhiên và một giá trị có thể nhận của nó.


4- Các phương pháp mô tả số liệu mẫu


a- Mô tả mẫu bằng bảng phân phối tần số thực nghiệm:


<i>kBảng 6.12 </i>


Xi Xi *2 xk


ni ni n2 nk


li


Đ ố i với bảng trên, ta ln có: = n
i = l


b- Mô tả mẫu bằng bảng phân phối tần suất thực nghiệm


<i>Bảng 6. ì 3 </i>


Xi Xi X2 Xk


</div>
<span class='text_page_counter'>(122)</span><div class='page_container' data-page=122>

<i>ựịiáơ trình lý thuụểt xịe, mạt ồ thống, kê tốn </i>



trong đó: f j = — ; Đ ố i v ớ i bảng trên, ta ln có: 2 / 1 = 1


n i=i


<i>p </i>


c- Đ ể mô tả số l i ệ u mẫu một cách rõ r à n g1 Hơn cho p h é p ta đ ư a * a
những nhận x é t sơ bộ ban đầu v ề tổng thể người ta còn x â y dựng các
l o ạ i đồ thị k h á c nhau của p h â n phối thực nghiệm.


<i>o Đa giác tần số: là một đường gãy khúc nối các điểm (Xi, ni); </i>
( x2, n2) ; ; (Xk, nk)


<i>© Đa giác tần suất: là một đường gãy khúc nối các điểm (Xị, fi); </i>
(x2, Í2>; ; (Xk, fk)


I


<i>Thí dụ: V ẽ đa giác tần suất của phân phối thực nghiệm sau: </i>


Xi 1 3 5 7


fi 0,1 0,3 0,4 0,2


0.45
0.4
0.35 -'


0.3 '
0.25



0.2
0.15 .


0.1 ;
0.05


0
-0


Đa giác tần suất thường được dùng để mô tả các số liệu mẫu theo
thời gian


<i>© Biểu đố tần số: Khi dấu hiệu nghiên cứu có phân phối liên tục </i>


</div>
<span class='text_page_counter'>(123)</span><div class='page_container' data-page=123>

<i>&iươtiạ ó: Jtlmi ngẫu nhiên </i>


đó khoảng chứa tất cả các giá trị quan sát được của m ẫ u được chia
thành một số khoảng có chiều dài bằng h và ứng với mỗi khoảng ta


tính số quan sát của mẫu thuộc khoảng này, tức là tính tần số (ni)
tương ứng với từng khoảng. Biểu đồ tần số là biểu đồ dạng bậc
thang tạo nên bởi nhiều hình chữ nhật có đáy bằng h và chiều cao
bằng — . Lúc đó diên tích của hình chữ nhát thứ i bằng h. — = ni.


h h
Vậy diện tích tất cả các hình chữ nhật sẽ bằng kích thước mẫu n.


<i>"Ểơng tự biểu đồ tần suất là biểu đồ dạng bậc thang tạo nên bởi </i>
5 , f



nhiêu hình chữ nhát có đáy bằng h và chiều cao bằng — . L ú c đó
h


diện tích của hình chư nhật thứ i bằng h. — = fj và diện tích tất cả các
h


hình chữ nhật sẽ bằng 1.


<i>Thí dụ: Vẽ biểu đồ tần số của phân phối thực nghiệm cho ở bảng </i>


sau:


<i>Bảng 6. ì4 </i>


Xi"— Xị+1 ni


h


5 - 1 0 4 0,8


1 0 - 15 6 1,2


1 5 - 2 0 16 3,2


• 2 0 - 2 5 36 7,2


2 5 - 3 0 24 4,8


3 0 - 35 10 2,0



• 3 5 - 4 0 4 0,8


</div>
<span class='text_page_counter'>(124)</span><div class='page_container' data-page=124>

<i>Lịláo trình ỉ lị thuyết xác mối ồ Miếng, kê tốn </i>


lo 15 20 25 30 35 49


<i>© Biểu đồ hình bánh xe: Đ ố i với các dấu hiệu định tính thì người ta </i>
thường m ô tả số liệu mẫu bằng b i ể u đổ hình b á n h xe. Đ ó là một
hình trịn được chia thành các phần tương ứng v ớ i tỷ l ệ của các bộ
phận trong mẫu.


<i>Thí dụ: Điều tra ngẫu nhiên 100 khách hàng của một doanh nghiệp </i>


thì thấy các khách hàng được p h â n theo tỷ l ệ sau v ề tầng lớp xã hội.


<i>Bảng 6.15 </i>


Tầng lớp xã hội Số khách hàng tỷ l ệ


Công nhân 35 0,35


Nông dân 40 0,40


Thương nhân 15 0,15


Trí thức 10 0,10


Tổng số 100 1



</div>
<span class='text_page_counter'>(125)</span><div class='page_container' data-page=125>

<i>& tươi KỊ ó: Mẫn ít í/tí li ít hiền </i>


N ơ n g
d â n


40%


T r i X


<i>t h ứ c / \ </i>
• <i><sub>\<ị°ỉ/ T h ư ơ n g </sub></i>


/ n h â n 15%


C ô n g nhân
35%


Đ ồ ứiị của p h â n p h ố i m ẫ u có t h ể v ẽ d ễ dàng n ế u ta sử dùng c á c
phần m ề m thống k ê n h ư E x c e l , SPSS, S t a t a , . . .


IV- Các tham số đặc trưng của mẫu


K h i nghiên cứu m ẫ u , người ta thường quan t â m đ ế n c á c tham số
đặc trưng sau đ â y :


Ì - T r u n g b ì n h m ẫ u


<i>a- Định nghĩa: Cho m ẫ u ngẫu nhiên kích thước n, được xây dựng </i>


từ đ ạ i lượng ngẫu nhiên X : W x = ( X | , x2 ) . . - , xn) .


Trung bình mẫu ngẫu nhiên (ký hiệu là X) được định nghĩa:


i n
x n?xi


n j_i


(6.10)


Do X ị , X2, . . . , x „ là c á c đ ạ i lượng ngẫu nhiên , theo định nghĩa
t r ê n thì X là h à m của n đ ạ i lượng ngẫu nhiê n X i , X2, . . . , xn n ê n


</div>
<span class='text_page_counter'>(126)</span><div class='page_container' data-page=126>

<i>(ịiéuy trinh, lý thuyết xán suất oà thống, kè lơảỉi </i>


N ế u có mẫ u cụ thể : wx = ( X i , x2, , x„) thì ta sẽ tính được giá
<i>trị của X (ký h i ệ u là X). </i>


X được tính theo cơng thức:


— Ì n


n i=i (6.16)


Như vậy X là một giá trị của X , đồng thời là trung bình của mẫu
cụ thể wx = (X|, X2, . . . , xn) .


<i>b- Tính chất: Nếu đại lượng ngẫu nhiên gốc X có kỳ vọng tốn: </i>


<i>E(X) = ịi </i>
và phương sài:



Var(X) = ơ
thì:


E ( X ) = M- và V a r ( X ) = ơ / n
Thật vậy, theo tính chất của kỳ vọng tốn, ta có :


E(X) = Ì V Xj<i> ì = 1Ỳ E(X,) = i .nụ = n </i>


n 1=1 n


Đ ể ý rằng các đ ạ i lượng ngẫu nhiên Xi độc lập, có cùng p h â n phối
xác suất với đ ạ i lượng ngẫu nhiên gốc X.


Theo tính chất của phương sai thì:


<i>V a r ( X ) = Var - £ x , =-\ỵWaiỌí,) = - L . n . a</i>2 = . —


<i>Vn i . ! ) n ,</i>=| n n


Như vậy, bất kể ^ui luật phân phối xác suất của đại lượng ngẫu


</div>
<span class='text_page_counter'>(127)</span><div class='page_container' data-page=127>

<i>ẽhưtùtạ ó: jỊỊẫu Iiạẫu nhiên </i>


vọng_của đ ạ i lượng ngẫu' nhiên gốc [E(X) = E ( X ) J . Còn phương sai
của X nhỏ hơn phương sai của đ ạ i lượng ngẫu nhiên gốc n lần.
Nghĩa là c á c giá trị có th ể có của X ổ n định quanh kỳ vọng hơn cá c
giá trị có thể có của X .


Nếu lấy căn bậc hai của Var( X) ta được độ lệch chuẩn ơ( X ). Độ



lệch chuẩn này của X được dùng đ ể phẩn ánh sai số ước lượng do
đó người ta thường g ọ i là sai số chuẩn (ký hiệu là se( X ). V ậ y :


se(X) = o(X) = Vvar(X) = -^L


VII
ở trên ta luôn giả thiết rằng mẫu được rút ra từ tổng thể theo


phương thức có h o à n l ạ i . N ế u kích thước tổng thể là vơ hạn hoặc
kích thước tổng thể hữu hạn nhưng n < 0,1N thì có thể lấy mẫu
khơng h o à n l ạ i mà không ảnh hưởng đ ế n k ế t quả. Trường hợp
n > 0,1N thì đ ố i v ớ i các công thức trên phải sử dụng hệ số hiệu chỉnh
do m ẫ u là khơng lặp. K h i đó ta có:


- _N-n ạ2


i N - 1 n


se(X) = ' N - n < r
N - l ' n


<i>c- Qui luật phân phối của X </i>


</div>
<span class='text_page_counter'>(128)</span><div class='page_container' data-page=128>

<i>Lịiáo trình lý. thuyết xác tuất ồ tttếnạ Ui tốn </i>


2- P h ư ơ n g sai m ẫ u


<i>a- Định nghĩa: Cho mẫu ngẫu nhiên w</i>x = (Xi, x2,...., Xn)
Phương sai của nó (ký hiệu là s2) được định nghĩa:



S2=-ỉ-ấ(X,-X)1 (6.17)


n - 1 i=i
Trong đó X là trung bình của mẫu ngẫu nhiên.


<i>* Chú ý: Theo định nghĩa trên, ta thấy phương sai mẫu ngẫu nhiên là </i>
2


h à m của n đ ạ i lượng ngẫu nhiên X | , X 2 , . . . , Xn n ê n s cũng là một
đ ạ i lượng ngẫu nhiên.


I


N ế u có mẫ u cụ thể : wx = ( X i , X2,. . . , xn<i>) thì s sẽ nhận giá ừỵ. </i>


S2=^7ẳ(x,-x)2 (6.18)


n - 1 UI
s2 gọi là phương sai của mẫu cụ thể.


<i>2 ' </i>


<i>b- Tính chất của s </i>


2 - 2
Do s là đ ạ i lượng ngầu nhiên n ê n ta có thè inh E(S ).


<i>Giả sử: E(X) = ịi; Var(X) = a</i>2
Ta có:



(Xi-X)2=[(x,-^)-(X-n)]2


<i>= (X, - ịi)1 - 2(X - n).(Xi - ụ) + (X - ụ)1' </i>


Dođó: Iị(X,-X)2 =I£(X,-H)2


-n t i -n t r
-2(X-^)I^(Xl-^) + (X-M)2


</div>
<span class='text_page_counter'>(129)</span><div class='page_container' data-page=129>

<i>Qltítiạ ó: Mẫn ngẫu nhiên </i>


Vì:
Nên:


Do đó:


n M r í t /


2 ( X - n ) - ị ( X i - ^ ) = 2 ( X -M. )2
n i=i


i ị c x ^ x ) 2 = Ì J ( X l - n ) a - ( x - H ) a


E(S ) = E - L 7 Z ( X Í - X ) Ĩ


n-ltí [ n - 1 [ n - 1


i ẳ ( ^ i - X ) 2
n w



n


n - 1 <sub>n w </sub>




- 2 L - Ỉ £ E ( X 1 - H ) 2 - E [ ( X - ( I ) Ĩ
n-1 nlr


<i>E ( X Ị ) = l i (Vi) n ê n E(X, - ự)2 = Var(Xị) = Var(X) = ơ</i>2
E(X) = H nên E[(X-n)2] = Var(X) = ơ2/n


Do đ ó :


2 n
E(S2) =


n - 1


.2 N
.n.ơ


-n n


<i>n ( n - ỉ _ A </i>
ơ


<i>K</i> n /



n - 1 = ơ


N h ư vậy, kỳ vọng toán của phương sai mẫu bằng phương sai của
đại lượng ngẫu nhiên gốc X.


</div>
<span class='text_page_counter'>(130)</span><div class='page_container' data-page=130>

<i>íịiá& trình Lị thuyết xóa mất ồ- thống, kê tốn </i>


Đ ộ lệch chuẩn của m ẫ u ngẫu n h i ê n (ký h i ệ u S) là c ă n bậc hai
của phương sai mẫu:


S = V s ĩ (6.19)


Nếu có mẫu cụ thể thì độ lệch chuẩn của mẫu cụ thể này là một
giá trị của s (ký h i ệ u là s ì :


s = N / S7 (6.20)


4- Tỷ lệ mẫu


T ừ một tổng t h ể g ồ m N phần tử, trong đó có M phần tử có tính
chất A. Ta lấy ngẫu n h i ê n n phần tử v à o m ẫ u (lấy theo phương thức
-có h o à n l ạ i ) . G ọ i X i (i = Ì, 2,.... n) là số phần tử có tính chất A ư o n g
lần l ấ y phần tử thứ i v à o mẫu. X i ( i = Ì, 2, n) là các đ ạ i lượng
ngẫu nhiên chỉ có thể nhận m ộ t trong hai giá trị: X i nhận giá trị 0
n ế u phần tử thứ i l ấ y v à o m ẫ u k h ơ n g c ó tính chất A ; X i nhận giá trị Ì
n ế u phần tử thứ i l ấ y v à o m ẫ u có tính chất A .


Tỷ lệ mẫu ngẫu nhiên (ký hiệu Fn) được định nghĩa như sau:


n i_i



Vì X i ( i = Ì, 2, n) là c á c đ ạ i lượng ngẫu n h i ê n , Fn là h à m của các
đ ạ i lượng ngẫu n h i ê n n ê n Fn cũng là m ộ t đ ạ i lượng ngẫu n h i ê n .
<i>* Chú ý: Nhìn vào biểu thức định nghĩa của F</i>n ta thấy giống với biểu


</div>
<span class='text_page_counter'>(131)</span><div class='page_container' data-page=131>

<i>@hườitạ ồ: Mẫu ngẫu nhiên. </i>


N ế u có m ẫ u cụ thể , ta sẽ tính được giá trị của F„ (ký h i ệ u là f )
nA


f = — (6.22)
n .


Trong đ ó nA là tổng số phần tử có tính chất A có trong m ẫ u cụ t h ể ; n
là kích Ui ước mẫu.


Như vậy f là giá trị của F„ và cũng là tỷ lệ các phần tử có tính chất
A của m ẫ u cụ thể.


V- Phương pháp tính các tham số đặc trưng của
m ẫ u .


Giả sử có mẫu cụ thể w x = ( X i , x2, . . . , xn) , thì trung bình m ẫ u
( x ) và phương sai m ẫ u ( s2 ) là hai giá trị cơ bản nhất đ ố i v ớ i m ẫ u cụ
thể n à y , s có thể suy ra từ s2 ; cồn f thì tính rất đơn giản. Do đó phần


2


n à y c h ú n g ta chỉ nêu ra c ô n g thức tính X và s tương ứng v ớ i từng
trường hợp số l i ệ u h i ệ n có như sau



Ì- Trường hợp số liệu của mẫu cho dưới dạng không có
t â n so


Trường hợp này, để tính X ta sử dụng công thức định nghĩa:
_ Ì n


x = ~ Z x i (6.23)


n i=,


<i>ĩ </i> <i>' </i> <i>2 </i>


Đ ê tính s ta dùng c ơ n g thức:
2_ _L


s =
n


<i>-Chứng minh: </i>


</div>
<span class='text_page_counter'>(132)</span><div class='page_container' data-page=132>

<i>íịiáữ trình lý- thuyết xịe Mất Ồ í/iấnạ kề lồn </i>


Theo cơn g thức định nghĩa của s ta c ó :


Ta có:


V ậ y :


(xj - x )2 = ( X ị )2 - 2 xix + ( x )2



ẳ(x,-x)2=ỉ[(x,)2-2x.xi+(x)2]
1=1


= ẳx.2 " 2 x È x . + n (x )2 = ẳ x * - 2 x . n . x + n ( x )2
i=! i=l i=l


= ẳx.2"n02
Suy" ra:


s2= 1


<i>n - 1 Ẻx?-nW </i><sub>i=l </sub> đ p c m


<i>Thí dụ 3: Quan sát đ i ể m thi m ô n T o á n cao cấp của 10 sinh viên được </i>


chọn ngẫu nhiên từ một lớp ta thu được các số l i ệ u sau:
5; 6; 7; 4; 6; 9; 4; 5; 5; 7;


Tính X và s của mẫu này.


<i>Giải: Ta có: </i>


lo _ co
^ X i =58.; V ậ y : x = ^ = 5 , 8


i=i l o
10 I r ,


</div>
<span class='text_page_counter'>(133)</span><div class='page_container' data-page=133>

<i>phường ổjjtưui Iiạẫít nhiên </i>



=> s = V s7<i> = y[2Ã = 1,549193 </i>
<i>* Chùy: • Để tính X Ị ' có thể dùng hàm AVERAGE trong Excel </i>


<i>X = AVERAGEÍXỊ} </i>


<i>» 2 á </i>


• Đ ế tính s ta có thể dù ne h à m VAR trong Excel
S^=VAR{Xjj


• Để tính s ta có thể dùng hàm STDEV trong Excel
s = STDEV{Xi}


Cách thức thực hiện các lênh này cũng tương tự như lịnh
AVERAGE (xem phụ lục 1).


<i>Thí dụ 4: Có các số liệu về doanh số bán (Y) và chi phí chào hàng </i>


(X) của 12 cơng ty thương m ạ i tư nhân cho ở bảng dưới đây: H ã y
tính trung bình mẫu và độ lệch chuẩn mẫu của X và Y ?


<i>Bảng 6.25 </i>


Doanh số b á n Chi phí c h à o Doanh số bán Chi phí c h à o


ơ i ) h à n g (xi) ơ i ) hàng (Xi)


tr.đ/năm (tr. đ/năm) tr.đ/năra triệu đ/năm



1270 100 1610 140


1490 106 1280 120


1060 60 1390 116


1626 160 1440 120


1020 70 1590 140


1800 170 1380 150


</div>
<span class='text_page_counter'>(134)</span><div class='page_container' data-page=134>

<i>íịiá& trình lý. tíuiụết xác utấí ồ thốnạ kẻ tốn </i>
<i>Giải: Ta l ậ p bảng tính như sau: </i>


<i>Bủng 6.26 </i>


<i>yi </i> Xi y ,2 X i2


1270 100 1612900 10000


1490 <i>10Ổ </i> 2220100 11236


1060 <i>eo </i> 1123600 3600


1626 160 2643876 25600


102 <i>lồ </i> 1040400 4900


1800 170 3240000 28900



1610 140 2592100' 19600


1280 120 1638400 14400


1390 1 l ó 1932100 13456


1440 Ì? 2073600 14400


1590 1 2528100 19600


1380 1 1904400 22500


16956 la- <sub>24549576 </sub> <sub>188192 </sub>


V ớ i k ế t quả tính ở bải í.26, ta c ó :
- 16956


V =


12 413;


- 1452
X = — — = 121


12


<i>sị = ^ [ 2 4 5 > 5 7 6 - 1 2 . ( 1 4 1 3 )</i>2] = 53704,36364


sv = ./^3704,36364 =231,742



= 1136,363636


</div>
<span class='text_page_counter'>(135)</span><div class='page_container' data-page=135>

<i>ũítư&tiạ ó: Mẫu Iiạẫii nhiên </i>


<i>2- T r ư ờ n g h ợ p s ô l i ệ u c ủ a m â u c h o d ư ớ i d ạ n g c ó </i>


t â n s ò n , ( n ó i c h u n g n i > 1 ) .


<i>Trường hợp này, đ ể tính X và s ta á p dụng cơng thức: </i>
- Ì k


n i=i


s2 =


n - 1 <sub>i=I </sub>


(6.27)


(6.28)


<i>* Chú ý: ^ n j X j trong công thức (6.27) cũng chính là </i> trong


k=i i=i


k


Cồng thức (6.23); Tương tự 2 n i x ? t r o nê c ônẽ t h ứ c (6-2 8) c ũ ns
k=l



n


chính là 5 ] x ,2 trong c ô n g thức (6.24)
k=l


* V ớ i c á c số l i ệ u cho ở thí dụ 3, ta có thể trình bày số l i ệ u quan s á t
của m ẫ u n à y dưới dạng có tần số như sau:


Xi 4 5 6 7 9


ni 2 3 2 2 1


Đ ể tính các tổng V n j X j và ^ n , x ~ ta có thể lập bảng tính như


i=i i=i


</div>
<span class='text_page_counter'>(136)</span><div class='page_container' data-page=136>

<i>íịiáơ trình ít/, thuyết xác suất ồ thống, kê tốn </i>
<i>Bủng 6.29 </i>


Xi ni n.Xị <sub>•</sub> ni xf .


4 2 8 32


5 3 15 . 75


6 2 12 72


7 2 14 98



9 1 9 81


Tổng n = 10 58 358


k


Theo k ế t quả lính ở bảng trên, ta có Y n ị X ị = 58 (tổng cột thứ ba.
i=i


k , '


của bảng); ^ n , X ,2 = 358. So sánh v ớ i k ế t quả tính ở thí dụ 3 ta có
i=i


thể minh chứng cho nhận xét nêu trên.


<i>Thí dụ 5: Tính trung bình và phương sai của mẫu cho ở bảng sau: </i>
<i>Bdnfỉ6.30 </i>


Xi 4 5 7 y


ni 10 15 13 12


<i>Giải: Ta lập bảng tính như sau: </i>
<i>Bủnị>6.3l </i>


Xi ni n;.Xị Ilị.Xi


4 10 40 160



5 15 75 375


7 13 91 637


9 12 108 972


</div>
<span class='text_page_counter'>(137)</span><div class='page_container' data-page=137>

<i>Qltươuạ 6:JlíẪit tiạẫií nhiên </i>


T ừ k ế t quả tính tốn ở bảng trên, ta có:
- 314


<i>X = </i>


50 = 6,28


s2= - H 2 1 4 4 - 5 0 . ( 6 , 2 8 )2] =3,5118


<i>* Chú ý: Khi áp dụng các công thức (6.27) ; (6.28) nếu số-liệu của </i>


m ẫ u được phân chiạ thành Lừng khoảng ( x j ; x . ), thì khi tính tốn ta
thay m ỗ i khoảng bằng giá trị trung tâm của khoảng đó (ký h i ệ u là
Xi)


x; =


x; + X;


( V i = 1,2, . . . , k )


<i>Thí dụ 6: s ố l i ệ u cho ở cột Ì và cột 3 của bảng dưới đây (bảng 6.32) </i>



là số l i ệ u quan sát về thu nhập của một số người làm việc ở một
c ô n g ty (đơn vị: ngàn đ/tháng). Hãy tính trung bình mẫu và phương
<i>sai mẫu". '• </i>


<i>Bảng 6.32 </i>


Thu nhập S ố người
8 0 0 - 850 9


851 - 900 . 12


901 - 950 24


951 - 1000 36


1001 - 1050 25


Thu nhập S ố người


1051 - 1100 20


H O I - 1150 16
1151 - 1200 10
1201 - 1300 8


</div>
<span class='text_page_counter'>(138)</span><div class='page_container' data-page=138>

<i>íịiáo í rình tý ựutạểt xóa mất Ồ ihếtiạ kê tơáềi </i>
<i>Bảng 6.33 </i>


x ' i — X i+1 Xi ni lầị.Xi nị.Xị2



800 - 850 825 9 7425 6125625


851 - 900 875,5 12 10506 9198003


901 - 950 925,5 24 22212 20557206


951 - 1000 975,5 36 35118 34257609


1001 - 1050 1025,5 25 25637,5 26291256,25


1051 - 1100 1075,5 20 21510 23134005


1 l o i - 1150 1125,5 16 18008 20268004
1151 - 1200 1175,5 . 10 11755 13818002,5


1201 - 1300 1250,5 8 10004 12510002


l ô n g n = 160 162175,5 166159712,75
T ừ k ế t quả tính tốn ở bảng trên ta c ó :


x=162175-5 =1013,596875


160


s2= -^[l66159712,75-160.(1013,125)2]= 11189,51414


VI- Mấu ngẫu nhiên hai chiều
Ì - K h á i n i ệ m



Giả sử trên cùng một tổng t h ể phải nghiên cứu đồng thời hai dấu
hiệu định tính hay định lượng, trong đó dấu hiệu thứ nhất có t h ể xem
như đ ạ i lượng ngẫu nhiên X , dấu h i ệ u thứ hai có t h ể xem như đại
lượng ngẫu nhiên Y. K h i đó việc nghiên cứu đồng thời hai dấu hiệu
được xem như nghiên cứu một đ ạ i lượng ngẫu n h i ê n hai chiều.
Từ tổng thể lấy một mẫu kích thước n, tức thực hiện n phép thử đối


</div>
<span class='text_page_counter'>(139)</span><div class='page_container' data-page=139>

<i>Qỉuttíttg. ó: Mấu ngẫu tdùên </i>


đ ạ i lượng ngẫu nhiên hai chiều độc lập. T ừ đó ta có định nghĩa m ẫ u
ngẫu nhiên hai chiều như sau:


Mẩu ngẫu nhiên hai chiều kích thước n là tập hợp n đại lượng


ngẫu nhiên độc lập: ( X i , Y i ) , ( X2, Y2) ( Xn , Yn) được thành lập
từ đ ạ i lượng ngẫu nhiên hai chiều (X, Y ) và có cùng qui luật p h â n
phối x á c suất v ớ i ( X , Y )


M ầ u ngẫu nhiên hai chiều được ký hiệu là:


WX Y= [ ( X , , Y , ) , ( X2, Y2) , , ( Xn, Yn) ]
Thực hiện một phép thử đối với mẫu ngẫu nhiên WXY là thực hiện


m ộ t p h é p thử đ ố i v ớ i m ỗ i thành phần của mẫu. Giả sử (Xi, Yi) nhận
giá trị (Xi, yi) (i = Ì, n ) ta sẽ thu được một mẫu cụ thể:


wxy =[(x,,y,),(x2,y2), ,(xn,yn)]


2- Phương pháp mô tả mẫu ngẫu nhiên hai chiều



G i ả sử từ tổng thể chọn ra một mẫu ngẫu nhiên hai chiều kích
thước n . Trong đó thành phần X nhận các giá trị: X|, X2, . . . , Xfc. và
thành phần Y nhận các giaHrị: y i , y2, . . . , yh. Trong đó giá trị (Xi, Yj)
xuất h i ệ n v ớ i tần số rijj (i = Ì, k ; j = Ì, h ). Sau khi các giá trị Xi và y j
được sắp x ế p theo thứ tự tăng dần thì mẫu cụ thể wx y có thể được
mơ tả bằng biểu bảng p h â n phối tần số thực nghiệm sau:


y i Y2 yir ni


Xi n u ni2 nih ni


n2i n22 n2h n2


. . .


Xk n u nic2 Pkh nk


</div>
<span class='text_page_counter'>(140)</span><div class='page_container' data-page=140>

<i>Cịiủo trình lý thuyết xịe mất và tít ờ nợ kê tốt! </i>


h


Trong đó: l i , = n jj - tần số của Xi (i =.1 .k)
j=i


li


mJ<i> =ỴjnIỊ - tần số của yj ( j = l.h) </i>


1=1



3- Các tham số đặc trưng của mẫu ngẫu nhiên hai chiều
Từ hảnrr<i> " iigniẹni cua mau ngài! nhiên hai chiều ta </i>
co me Ì UI ra:


<i>a- Bảng phân phối thực nghiệm của thành phần X </i>


l . x V xk


1 n i


n i . . . ak


T ừ báng này ta sẽ tính được các thám số đặc trưng mẫu đ ố i v ớ i X.


<i>b- Bảng phân phối thực nghiệm của thành phần Y </i>


Y <i><sub>y i y2 Ỵh </sub></i>


Iĩij m i ĨĨ12 mh


T ừ bảng này ta sẽ tính được các tham số đặc trưng mẫu đ ố i v ớ i Y.


<i>c- Bảng phân phối có điều kiện thực nghiệm của Y khi X = Xi </i>


Y / X = Xi <i><sub>y> yi y</sub></i><sub>h </sub>


ny ni i tii2 n,h


</div>
<span class='text_page_counter'>(141)</span><div class='page_container' data-page=141>

<i>&ntưiiợ ó: Mẫu ngẫu nhiên </i>



T ừ b ả n g n à y ta sẽ tính được trung bình có điều kiện của Y (điều k i ệ n
X = Xi).


Ì h
ni j=r


<i>c- Bảng phân phối có điều kiện thực nghiệm của X khi Y = y>j </i>


X / Y = y j Xi x2 Xk


ny n i j n2j . . . . nkj


<i>ư ơ n g đ ó : 2 ^</i> <i>n</i> <i>n</i> <i>= </i> <i>m</i> <i>ì </i>


i=l


</div>
<span class='text_page_counter'>(142)</span><div class='page_container' data-page=142>

<i>{ịìáo- trùth bị tluiụết xác mất ồ íỉtếtiạ kè tốn </i>


C h ư ơ n g 7
<i>ƯỚC LƯỢNG CÁC SỐ ĐẶC TRƯNG </i>


<i>C Ủ A T Ổ N G T H Ể </i>


Như chúng ta đều biết, các số đặc trưng của tổng. thể như trung.


<i>bình tổng thể, tỷ l ệ tổng thể, phương sai của tổng t h ể , . . . </i>
đửỢesử-dụng rất.nhiều trong phân tích kinh t ế - xã h ộ i và các lĩnh vực kháci
Nhưng các số đặc trưng này thường là chưa biết. Vì v ậ y đặt ra vấn'*
đề cần ước lượng chúng bằng phương p h á p mẫu.



ở chương 6 ta đã biết các số đặc trưng của tổng thể cũng chính là'


c á c tham số đặc trưng của đ ạ i lượng ngẫu nhiê n gốc X , vì vậy ta có
thể nêu vấn đề thực t ế đó dưới dạng tốn họ.c như sau/


Cho đ ạ i lượng ngẫu nhiên X có thể đã biết hoặc chưa biết qui luật
phân phối xác suất và chưa biết tham số 0 n à o đó của nó. Hãy ước
lươn? 9 hằng phương pháp mẫu.


Bi Ì, ... la một trong những bài loàn cơ bản của thống kê


ti-vi tì là một hằng số nên ta có.thể dùng một con số nào đó để ước


<i>lượng e. Ước lượng như vậy được g ọ i là ước lượng điểm (nếu đưa c»n </i>
số dùng để ước lượng e lên trục số thì nó ứns v ớ i một điểm). Ngoài
<i>ước lượng đ i ể m , người ta còn dùng ước lượng khoảng. Tức là chỉ ra </i>
một khoảng số (9Ị, 02) nào đó có thệ chứa được 0.


Dưới đây chúng ta sẽ nghiên cứu các phương pháp tìm một ước


</div>
<span class='text_page_counter'>(143)</span><div class='page_container' data-page=143>

<i>@hitờtiạ 7: QỂ&C lưựtiạ. eáe lữ đặe trưng, của tầng, thể </i>


I - C á c p h ư ờ n g p h á p t ì m ư ớ c l ư ợ n g đ i ể m
Ì - P h ư ơ n g p h á p h à m ư ớ c l ư ợ n g


<i>a- Mô tả phương pháp: Giả sử cần ước lượng tham sô 9 của đ ạ i </i>


lượng ngẫu nhiên X. T ừ X ta lập mẫu ngẫu nhiên kích thước ni
W x = ( X1, X2, , . . . , Xn) l



Chọn


<i>Ồ = f ( X</i>1, X2, . . . , Xn)
ố là hàm của các đại lượng ngẫu nhiên Xi, x2,.. . . , xn nên nó là


m ộ t đ ạ i lượng ngẫu nhiên, ê được g ọ i là h à m ước lượng của ©.
Trong thựe tế người ta thường chọn hàm ước lượng như sau:


— li n


• Chọn ê = x = — V X ị n ế u là ước lượng trung bình của tổng
• n t i


thể


<i>• Chon Ồ = s</i>2 = — — y " ( X ị - X )2 n ế u là ước lượng phương sai
n - 1 M


của tổng thể


i n


<i>• Chọn Ồ = Fn = — y ^ - ^ i</i> n ê u l à ư ớ c 1 Ư (?nẽ l<i>Ỷ</i> Jệ lổnỗ thể
n t í1


T ừ m ẫ u cụ thể w x = ( xb x2, . . . , Xọ), ta tính giá trị của e (ký h i ệ u
là ê * ) . Tức là:


</div>
<span class='text_page_counter'>(144)</span><div class='page_container' data-page=144>

<i>Cịiáa trình hị thuyết xác xuất ồ tíiốnạ kê tốn </i>



Ta thấy có vơ số cách chọn dạng h à m f, lức có vơ số đ ạ i lượng
ngẫu nhiên z có thể dùng làm h à m ước lượng của 0. Vì vậy, cần đưa
ra một liêu chuẩn đ ể đánh giá chất lượng của ước lượng. T ừ đó lựa
chọn được một h à m ước lượng "tốt h ơ n " theo một nghĩa n à o đó.


Dưới đây ta sẽ xét một số tiêu chuẩn đ ó .
Ì- Ước lượng khơng chệch


<i>* Định nghĩa: ồ được gọi là ước lượng k h ô n g chệch của tham Số0 </i>
nếu:


E ( ố ) = 0 (7.1)
<i>Ngược lại, nếu E( ố) * 8 thì ồ được gọi là ước lượng chệch của 9. </i>


<i>* Ý nghĩa: Ta thấy (9 - 6) là đại lượng ngẫu nhiên biểu thị sai số </i>
của ước lượng. Theo tính chất của kỳ vọng lồn, ta có:
<i>E( Ồ - 0) = E( Ồ) - E(0) = e - e = 0 nếu ê là ước lượng không </i>


chệch.


Như vậy, ước lượng; khôniỉ chệch là ước lượng có sai số trung bình
bằng 0. Tức là giá trị của 9 không bị lệch v ề một phía, nếu dùng 6
đ ể ước lượng 9 thì khơng mắc phải sai số hộ thống. Rõ ràng trong hai
loại ước lượng: chệch và khơng chệch thì ta n ê n chọn ướciượng
không chệch.


Chú ý rằng, 9 là ước lượng không chệch của 9 khơng có nghĩa là


m ọ i giá trị của 0 đ ề u trùng khít với 8 mà chỉ có nghĩa là: Trung binh


c á c giá irị của 9 bằng 9 , một giá trị của 9 có th ể sai k h á c nhiều so
với 9.


<i>* Thí dụ: l- Trung bình mẫu ngẫu nhiên (X) là ước lượng khơng </i>


</div>
<span class='text_page_counter'>(145)</span><div class='page_container' data-page=145>

<i>& lươn ạ 7: (lức. íttựiiạ cát' lả' đặc trư/tạ cửu tổnạ thể </i>


2- Phương sai mâu ngẫu nhiên (S~) là ước lượng không chệch của


<i>ỉ s 2 2 _2 </i>


phương sai long the ( ơ ) v i : E(S ) = ơ .


3- Tỷ l ệ mẫu ngẫu nhiên (Fn) là ước lượng không chệch của tỷ l ệ
tổng the (p) v ì : E(F„) = p.


<i>Chứng minh: Thật vậy, theo định nghĩa tỷ lộ mẫu ngẫu nhiên ta </i>


có:


1 J2_
<i>F n = - Ẻ X , </i>


n UI


Trong đó X i là số phần tử có tính chất A có trong lần lấy phần tử thứ
. v à o mẫu. Xi (ĩ = Ì, 2, . . . . n) là các đ ạ i lượng ngầu nhiên có phân
Dhối xác suất như sau:


Xi 0 1



p <sub>q p </sub>


với q = Ì - p


Ta có : E(X|) = 0 x q + l x p = p (Vi)


Vậy: E(F„) = EÍ-£X, Ì = -ẳE(Xf) = -.np = p


2 - Ước lượng hiệu quả


Giả sử ẻ là ước lượng không chệch của 9 . Á p dụng bất đẳng
hức Chebyshev cho đ ạ i lượng ngẫu nhiên 9 , ta có:


« - , , V a r ( ê )
p(| 9 - E ( 9 ) | < e) > Ì


8


</div>
<span class='text_page_counter'>(146)</span><div class='page_container' data-page=146>

<i>{Ậiúa trình lý thuyết xác mất oà thống, kè toan </i>


<i>p(l Ồ - e I < s) > Ì -</i> V a r ( ẽ )


N h ư vậy, nếu phương sai V a r ( 0 ) c à n g nhỏ thì x á c suất đ ể 9
nhận giá trị gần 0 bao n h i ê u cũng được, sẽ càng lớn. Do đó phương
sai của 9 là một chỉ tiêu quan trọng phản á n h chất lượng của hàm
ước lượng 0 = f ( X j , X2, xn) . T ấ t n h i ê n một cách hợp lý là cần
chọn nhữqg h à m ước lượng k h ô n g chệch và phương sai nhỏ nhất.
<i>* Định nghĩa: ố = f(X], X2, . . . , x</i>n) là ước lượng không chệch của



9 và phương sai V a r ( ố ) bằng cận dưới c á c phương sai của các hàm
ước lượng "được x â y dựng từ mậu ngẫu nhiên Wx thì ồ được gọi là
ước lượng h i ệ u quả của 9.


Để tìm cận dưới của phương sai các hàm ước lượng ta dựa vào bất
đẳng thức Crame-Rao được nêu trong định lý dưới đây


<i>Định lý? Cho mẫu ngẫu nhiên Wx = (Xi, x</i>2 xn) được xây dựng


từ đ ạ i lượng ngẫu nhiên X có h à m mật độ xác suất (hay b i ể u thức
xác suất) f(x, 0). Thỏa m ã n một số đ i ề u k i ệ n nhất định (thường được
thỏa m ã n trong thực t ế ) và 9 là ước lượng không chệch bất kỳ của
e thì :


Ì
Var( e ) >


n.E a i n ( x , 0 )
<i>" dô" </i>
3 - Ước lượng vững


Một hàm ước lượng được coi là hợp lý nếu như kkh thước của!


</div>
<span class='text_page_counter'>(147)</span><div class='page_container' data-page=147>

<i>ẽhưưitợ 7: ơtớe ỉưựitọ các lố ttặe trưng cua tổng thể </i>


<i>Định nghĩa: Cho mẫu Wx = ( X i , X2, • . . , X</i>n) xây dựng từ đ ạ i lượng
ngẫu nhiên X. H à m ước lượng ê = f ( X ' j , x2, . . . , xn) của 6 được gọi
là vững nêu m ọ i e > 0 bé tùy ý cho trước ta đều có :


:.imP[|f(X1,X2,. . . ,x„)-e |<e] = 1.



<i>Điều kiện đủ của ướt iu".. i\z vững được phát biểu dưới dang định </i>
[ý sau:


<i>Định lý: Nếu 0 là ước lượng không chệch của 0 và </i>


Lim Var( 6 ) = 0 thì 0 là ước lương vững của 9.
n->GO


2 - Phương pháp ước lượng hợp lý tối đa


Giả sử đã biết qui luật phân phối xác suất dạng tổng quát của đại


lượng ngẫu nhiên X, chẳng hạn hàm mật độ í'(x, 0) (cũng cố thể xem
f(x, 8) là cơng thức tính xác suất nếu X là đ ạ i lượng ngẫu nhiên rời
rạc). Cần ước lượng tham số 9.


Lập mẫu cụ thể: Wx = (Xi, X?, . . . , xn).
Hàm của đối số 9:


0 L ( X j , x2, . . . , xn, 9) = f ( x , , 0 ) . f ( x2, 6). . . f(x„, 9)
và gọi là hàm hợp lý của tham số 8.


Giá trị của hàm hợp lý chính là xác suât (hay mật độ xác suất) tại
đ i ể m Wx = (Xi, x2, . . . , xn)


Giá trị 9* = f(X[, Ấ2, . . . , xn) được gọi là ước lượng hơp lý tối đa
nếu ứng với giá trị này h à m hợp lý đ ạ t cực đ ạ i .


</div>
<span class='text_page_counter'>(148)</span><div class='page_container' data-page=148>

<i>(ịiáci trình tụ tltuụĩt xúc XI lất vú tliốnạ kẽ tốn </i>


<i>Bước Ì : Tìm đạo h à m bậc nhất của lnL theo 9. </i>


c U n l . „


<i>Bước 2 : L ậ p phương trình : = 0. </i>


Phương trình này được gọi là phương trình hợp lý. Giả sử nó có
nghiệm là 9() = (p(Xj, X i , . . . , xn) .


. , ế<i> à2</i> InL


<i>Bước 3 : Tìm đạo h à m bậc 2 : — — — . </i>


a o2


Nếu tại điểm 0()= cp(xì, X-2, . . . , xn) đạo hàm bậc hai âm thì tại


<i>đ i ể m này h à m lnL đạt cực đ ạ i . Do đó Go H cp(X|, \->, . . . , x</i>n) là ước
lượng hợp lý t ố i đa của 9.


li- Phương pháp ước lượng bằng khoảng tin cậy


Ngoài cách dùng một con số để ước lượng tham số 9, ta cịn có


thể d ù n s mộL khoảng số n à o đó đ ể ước lượng 9. Đ ổ tìm một khoảng
số như Vcậy, ta nghiên cứu phương p h á p khoảng tin cậy. Phương pháp
này đã được nhà toán học Pháp p.s. Laplace nghiên cứu năm 1841
<i>và được hoàn thiện bởi nhà t h ố n " ke M ỹ Ị. Ncyman n ă m 1937. </i>
Ì- Mơ tả phương pháp khoảng tin cậy



<i>ĐỂ ước lương tham số 9 của đ ạ i lượng ngẫu nhiên X, l ừ X ta lập </i>
mẫu ngẫu nhiên W \ = ( X | , X2, . . . , xn) .


Chọn thống kê 9 = f(X|„ x2, . . . , Xn, 9) sao cho: mặc , ; chưa biếl


giá trị của 0 nhưng qui luật phâ n phối xá c suất của ẽ vẫn hoàn toàn
xác định. Do đó với xác suất Gí khá bé (trong thực t ố n«ười ta thường
lấy oe < 0,05) ta có thể lìm được hai số: a và b thỏa mãn:


</div>
<span class='text_page_counter'>(149)</span><div class='page_container' data-page=149>

<i>Qhườttq. 7:.(lùt4i LÙỊÌUỊ. tóe luấ ttúe ỉnởtạ éủa tổng </i> <i>thế </i>


N ế u từ (7.2) g i ả i ra dược 9. Tức là ta đưa b i ể u thức (7.2) v ề d ạ n g ; .
P ( ê ! < e < ê2) = 1-cế


thì:


<i>• Khoản g ( Ồ Ì, Ồ 2) đưclc coi là ích.VI IV.. tin câ y của e . Vì ơ Ì, ế 2 </i>
<i>là c á c đ ạ i lượng ngẫu n h i ê n n ê n khoảng ịặ ị, 0 2) là khoản g ngẫu </i>
nhiên.


• (1-ct) g ọ i là độ tin cậy (hệ số tin cậy) của ước lượng. Trong thực
t ế ngư ờ i ta thường y ê u cầ u Ì-oe > 95% đ ể có t h ể sử dụng n g u y ê n lý
xác suất lớn cho b i ế n cơ: ( 6 Ì < 0 < 9 2)


<i>• Ì = Ố 2 - Ồ Ì g ọ i là đ ộ d à i khoảng tin cậy. ỉ có thể là hằng số và </i>
cũng c ó th ể là đ ạ i lượng ngẫ u nhiên .


Đ o x á c suất Ì - a khá lớn; n ê n theo nguyên lý x á c suất lớn ta có
<i>A • Ạ;. </i>



thể coi b i ế n c ố ( 9 Ì < 0 < 8 2 ) hầu như chắc chắn x ả y ra trong một
p h é p thử. Thực hiện một p h é p thử đ ố i v ớ i m ẫ u ngẫu nhiên W x , ta sẽ
thu được mẫ u cụ t h ể : wx = ( X i , X2, . . . , xn) . T ừ mẫu cụ t h ể n à y ta
tính được giá trị của 9 Ì và 9 2, ký hiệu c á c giá trị đó tương ứng là


9 | , 62.


N h ư vậy có thể k ế t luận: V ớ i độ tin cậy Ì - oe, qua mẫu cụ thể
wx, e nằm trong khoảng ( ồ * , 9*2). Tức là: ( ó ; < 0 < 9*2).


Phương p h á p ước lượng n à y có ưu đ i ể m là: khơng những chỉ tìm,
được khồảng í ẻ l , 0 , ) đ ể ước l ư ợ n g 9 m à còn cho biết độ tin cậy
của ước lượng. Tuy nhiên nó cũng chứa đựng kha nâng mắc phải sai
lầm, xác suất mắc phải sai l ầ m là a.


</div>
<span class='text_page_counter'>(150)</span><div class='page_container' data-page=150>

<i>íịlá* ỉrhứi bị thuyết xác Uiấí ồ títấitạ kê tốn </i>


<i>2 - ƯỚC ỉ ư ự n g t r u n g b ì n h c ủ a t ổ n g t h ê </i>


Giả sử trong tổng thể đ ạ i lượng ngẫu n h i ê n gốc X p h â n phối theo
qui luật chuẩn N ( | i , ơ2<i>) nhưng chưa b i ế t ịi, ta cần ước lượng ụ với độ </i>
tin cậy Ì - a.


T ừ tổng t h ể ta lập m ẫ u ngẫu n h i ê n kích thước n:
Wx = ( XI, X2, xn)
và x é t các trường hợp sau:


<i>2.1 Đã biết phương sai của đại lượng ngẫu nhiên gốc X </i>


Chọn đ ạ i lượng ngẫu nhiên:



X - ư
z =


ơ / V n


ở chương 6 ta đã biết z có phân p h ố i N(0, 1)


V ớ i x á c xuất oe khá bé ta tìm được một số za thỏa m ã n :


P ( | z | < za) = l - a (7.3)


Thay b i ể u thức của z v à o (7.3), ta được:


<i>x - ị i </i>


hay:


Hay.


ơ / V ĩ ĩ = 1-a


ơ / V n = 1-a


V V n V n = 1-a


</div>
<span class='text_page_counter'>(151)</span><div class='page_container' data-page=151>

<i>Qỉiựơnạ 7: (lẻửe. tưựtiạ eáe lố đặn trưng, eủatẩiiạ </i> <i>thề </i>


C u ố i cùng ta được:



<i>\ Vn Vn; </i>


<i>Vậy với độ tin cậy Ì-oe, khoảng tin cậy của ụ. là: </i>


x-za -^L;X + za-^L


V v n V n y
Ký h i ệ u :


(7.4)
8 được g ọ i là độ chính x á c của ước lượng. N ó phản á n h mức độ sai
lệch của trung bình m ẫ u so v ớ i trung bình tổng thể v ớ i xác suất
(Ì-ót) cho trước.


Khi đó ta có thể viết:


<i>P(X-e<ịi< X + e) = p(| x-ịi\<e)=l-a (7.5) </i>


Ý nghĩa của biểu thức (7.5) là: Với xác suất Ì - a , trung bình của


<i>mẫu ngẫu nhiên nhận giá trị sai lệch so với ịi một lượng (theo giá trị </i>
tuyệt đ ố i ) nhỏ hơn 8.


( X - e ; X + s) được gọi là khoảng tin cậy đối xứng của ịi.
Trong trường hợp này, độ dài khoảng tin cậy là:


<i>ỉ-(X+e)-( X- z) = 2e </i>


Ưng với độ tin cậy 1-cc, khoảng tin cậy đối xứng có độ dài ngắn



nhất. Vì vậy khi cần tìm khoảng tin cậy, thơng thường ta chỉ cần tìm
khoảng tin cậy đ ố i xứng.


Vì độ tin cậy Ì- a khá lớn, nên theo nguyên lý xác suất lớn ta có


</div>
<span class='text_page_counter'>(152)</span><div class='page_container' data-page=152>

<i>ị gián ttùik tự ỉkuiịết xát tuất oà thống, ki toán </i>


một phép thử. Thực hiện một phép thử đối với mẫu ngẫu nhiên wx,
ta sẽ thu được mẫu cụ thể: wx = (X|, X2, . . ., x„).


— Ì "


T ừ m ẫ u cụ t h ể đó ta tính được: X = -7- V Xj


Với độ tin cậy Ì - a cho trước, tra bảng za (phụ lục 4) [hoặc dùng
hàm NORMSINV(l-a/2) trong Excel] ta sẽ tìm được giá trị za.
za là giá trị của đại lượng ngẫu nhiên z ~ N(0, 1) thỏa mãn điều
kiệủ: P(| zl > za) = a.


<i>Có thể minh họa giá trị Xa trên đồ thị nhử sau: </i>


<i>M</i> <i>Ạ </i>


N g o à i khoảng tin cậy đ ố i xứng ta cũng có t h ể tìm khoảng ù n cậy
bên phải và khoảng tin cậy bên trái.


</div>
<span class='text_page_counter'>(153)</span><div class='page_container' data-page=153>

<i>Qhiừtnợ. 7: CiỂte lượng, cát lá đát trưng, tủa. iểtếQ. thể </i>


V ớ i a khá b é ta có thể tìm được một số Z2a sao cho:
P(|Z|>z2a) = 2a



Ta c ó :


P(| z ị > z2 o) = 2a o P ( Z > z2 o t) = a


o p <i><sub>——7= £ z , </sub></i>X - L i
ơ / V n


= l - a o p H > X - Z <sub>2o </sub> = l - a


V ậ y khoảng tin cậy của | i trong trường hợp này là:


( X - z 2 a - i L ; +00) (7.7)


V n


<i>(7.7) d ù n g đ ể ước lượng giá-trị t ố i thiểu của ịi </i>


<i>• Khoảng tin cậy bên trái: </i>


Tiến hành tương tự như trên, ta tìm được khoảng tin cậy bên trái của
l i là:


<i>( - « > ; X + </i> <i>zĩa-^=) </i>


V n
<i>(7.8) d ù n g đ ể ước lươn g giá trị t ố i đa của ịi </i>


(7.8)



<i>2.2 Trưởng hợp chưa biết phương sai của đại lượng ngẫu nhiên gốc </i>
<i>X. </i>


<i>X - ị i </i>


Trường hợp n à y ta x é t đ ạ i lượng ngẫu nhiên: T =


Người ta đã chứng minh được rằng: đ ạ i lượng ngẫu nhiên T p h â n
phối theo qui luật Student v ớ i (n - 1) bậc tự do.


Với xác suất oe khá bé, ta có thể tìm được một số ta sao cho:
P(|T|>ta) = a


</div>
<span class='text_page_counter'>(154)</span><div class='page_container' data-page=154>

<i>cịiáữ trình lý. thuyết xóa mất ồ thốnạ kê tốn </i>


P(-ta < T < to) = Ì - a <sub>ơ-9) </sub>
Thay b i ể u thức của T v à o (7.9) ta được:


<i>ỉ V ^ </i>


X - L I


<i>- t „ < ỉ- < t </i> = Ì - éc
G i ả i p. tương tự như đã làm ở phần 2.1, ta được:


/ - s - S Ì


X - t a - ^ < n < X + ta- ) L


V n V n


= Ì - a


<i>V ậ y khoảng tin cậy của ịi (với độ tin cậy Ì - oi) là: </i>
(X-t A;X + t A)


v n V n
Từ mẫu cụ thể wx = (X|, x2, . . . , xn) ta tính được X và s. Từ đó
<i>x á c định khoảng tin cậy cụ t h ể của ịi theo công thức: </i>


x i t a - 7 =
V n


(7.10)
Trong đó ta là giá trị của đ ạ i lượng ngẫu n h i ê n T p h â n phối theo
qui luật Student với n - Ì bậc tự do thoa m ã n đ i ề u k i ệ n :


P(|T|>ta) = a


Để tìm ta ta có thể ưa bảng ở phần phụ lục hoặc dùng hàm TINV
trong Excel.


Chẳng hạn v ớ i độ tin cậy Ì- a = 95% (tức a = 0,05) và kích thước
mẫu n = 50 (lức bậc tự do là n - Ì = 49). Khi đ ó :


<i>ta = TINV(0.05,49) = 2,009574 * 2,1 </i>
<i>• Khoảng tin cậy bên phải: </i>


</div>
<span class='text_page_counter'>(155)</span><div class='page_container' data-page=155>

<i>&tưưuụ 7: (túc Ittẹtttạ các, xổ đọa tnútạeỉia tổ tui thi </i>


( x - t * ; +co) <sub>(7.11) </sub>



V n


<i>(7.11) dùng đ ể ước lượng giá trị t ố i thiểu của ịi </i>
<i>• Khoảng tin cậy bên trái: </i>


(-ao; x + t <sub>2 ót </sub> (7.12)


(7.8) d ù n g đ ể ước lượng giá trị t ố i đa của |J.


<i>* Chú ý: Khỉ kích thước mẫu n > 30 thì phân phối Student xấp xỉ </i>


<i>với phânyhối chuẩn NịO, 1) Vì vậy ta có thể dùng z</i>a<i> thay cho ta </i>
<i>trong cổng thức (7.10) </i>


<i>Thí đít ĩ: Điều tra năng suất lúa trên diện tích 100 héc ta trồng lúa </i>


của một vùng, người ta tính được: X = 46 tạ/ha; s = 3,3
Hãy ước lượng năng suất lúa trung bình của tồn vùng với độ tin


cậy 95% b i ế t n ă n g suất lúa của vùng này là đ ạ i lượng ngẫu nhiên
p h â n phối theo qui luật chuẩn


<i>Giải: Gọi ụ là năng suất lúa trung bình của tồn vùng. Ta cần ước </i>


lượng f i v ớ i độ tin cậy 95%.


X là đại lượng ngẫu nhiên biểu thị năng suất lúa ở vùng này. X phân


phối theo q luật chuẩn với kỳ vọng tốn là | i và phương sai là ơ2


chưa b i ế t .


<i>Áp dụng công thức (7.10) ta có khoảng tin cậy của ụ. là: </i>


V n


Với độ tin cậy Ì - oe = 95% và bậc tự do (n-L) = 99 tra bảng ta ở
phụ lục 6 (hoặc dùng h à m TINV trong Excel) la được:


</div>
<span class='text_page_counter'>(156)</span><div class='page_container' data-page=156>

<i>lịiáo trì nít Ị lị thuyết xác tuất gà thối tạ kè toán </i>


t a = to,05 =TINV(0.05,99) = 1,984
Theo số liệu của bài tốn ta có: X = 46 ; s = 3,3


nên:


e = 1 , 9 8 4 . ^ = 0 , 6 5 4 7 2
Vậy khoảng tin cậy của 1-1 là:


(46 - 0,65472 ; 46 + 0,65472)
Hay:


<i>(45,345 < ụ. < 46,655) tạ/ha </i>


<i>Thí dụ 2: Theo dõi mức nguyên liệu hao phí để sản xuất mót đơn vị </i>


sản phẩm người ta thu được các số l i ệ u cho ở bảng sau:
Mức ng/1 hao phí - Xi (gr) Sơ sản phẩm


19,0 - 19,5 2



19,6 - 20,0 10


20,1 - 20,5 8


20,6 - 21,0 5


. Ước lượng mức hao phí n g u y ê n l i ệ u trung bình mức cao nhất để
sản xuất một đơn vị sản phẩm với độ tin cậy Ì- a = 98% ? Giả thiết


mức hao phí nguyên liệu để sản xuất một đơn vị sản phẩm là đại
lượng ngẫu nhiên phân phối theo qui luật chuẩn.


<i>Giải: Gọi X là mức nguyên liệu hao phí để sản xuất một đơn vị sản </i>


p h à m . Theo giả thiêt thì X ~ N(f.i, ơ ) với | i là mức n g u y ê n liệu hao
phí trung binh đ ể sản xuất một đơn vị sản phẩm . Ta cần ước lượng
<i>giá trị t ố i đa của ụ. với độ tin cậy 98%. </i>


</div>
<span class='text_page_counter'>(157)</span><div class='page_container' data-page=157>

<i>Qhướtig. 7: (lùte Itáđng. ếe íố đăă trưng, ềa tơ nợ thể </i>


T ừ số l i ệ u đã cho, ta tính được: x = 20,116 ; s = 0,461365.
Với độ tin cậy Ì- a = 98% , tra bảng phân phối- Student với bậc tự dờ
n - Ì = 25 - Ì = 24 ta được: t2 a = to.04 = 2,1715.


<i>Giá trị tối đa của ịi\ằ: </i>


X + t2 a 4 = = 2 0 , 1 1 6 + 2T1 7 1 50 , 4^ 1 Ỉ .6 5 = 2031637 gr
Vrt V25



3- ựởc lượng tỷ lệ của tổng thể


Giả sử tổng thể ta đang nghiên cứu gồm N phần tử . Trong đó có M .
phần tử có tính chất A nào đó. p = — là tỷ lệ các phân tử có tính


chất A của tổng thể. Thơng thường p chưa biết, cần ước lượng p. Để


<i>ý rằng p cũng chính là xát suất đ ể lấy được phần tử có tính chất A </i>
khi l ấ y ngẫu nhiên từ tổng thể ra một phần tử , n ê n bài toán trên là
bài toán ước lượng tỷ l ệ tổng thể (hay ước lượng xác suất).


Gọi X là số phần tử có tính chất A khi lấy ngẫu nhiên một phần tử


từ tổng thể. X là đ ạ i lượng ngẫu nhiên có luật phân phối x á c suất
như sau:


X 0 1


p <sub>q </sub> p


E ( X ) = p ; Var(X) = pq
<i>Gọi Xi (i = Ì, 2, .... n) là số phần tử có tính chất Ạ có trong lần </i>


lấy thứ i . C á c đ ạ i lượng ngẫu nhiên Xi có p h â n phối x á c suất giống
X.


Ị n


Xét đ ạ i lượng ngẫu nhiên: Fn = 7 X X -l à lỷ !ệ m^ u ns ẫ u nhiên.
n i=i



</div>
<span class='text_page_counter'>(158)</span><div class='page_container' data-page=158>

<i>cịiáo trình tụ thuyết xịe. tuất ồ thốn// kẻ tốn </i>


Ta có t h ể chứng minh được: E ( Fn) = p ; V a r ( Fn) =
pq


n
Theo định lý Lindcberg - Levy, đ ạ i lượng ngẫu nhiên:
z= F" p


có phân phối xấp xỉ N(0, 1).


Vì vậy la có thể tìm được giá trị za thỏa mãn điều kiện:
p(Ịz|<0=l-a


Thay biểu thức của z xác định theo (7.13) vào (7.14) ta được:


(7.13


(7.14


(F„ - P ) V ^


= l - a
V P ( Ỉ - P )


(7.15) c>p[n(Fn -p)2 <(p-p2)zij=l-ct


o p[(n + z*)p2 -(2nF„ +z^)p + n(Fn)2J= 1-a
oP(p, <p<p2) = l-a



Trong đó:


(7.1Í


p . =


n Fn + 0,5z> - zaV n F n( l - Fn ) + 0,25z
•N
n + z


<i>> </i>


<i>Vi = </i>


n Fn + 0 , 5 z ^+zaV n Fn( l - Fn) + 0,25z*


(7.1«


</div>
<span class='text_page_counter'>(159)</span><div class='page_container' data-page=159>

<i>ggggỊMg 7: (lùừe íưưnợ ếe lá đặe ÍMúiíị. eủm. tổng thể </i>


N ế u có m ẫ u cụ th ể ta sẽ tính dược giá trị của P i và P2, ký h i ệ u c á c
j ạ i trị đó tương ứng là pt và pz. T ừ đó ta có khoảng tin cậy đ ố i


xứng của p là:


( P t < p < p2)
Việe áp đọng công thức (7.16) khá phức tạp và chỉ cho phép tìm


<i>khoảng tin. cậy đổi xứng của p. D o đó n ế u có t h ể đ i ề u ư a m ộ t m ẫ u </i>


có kích thước n khá lớn (n > ỉ00) thì thống k ê :


có p h â n phối xấp xỉ N(0, 1)


<i>Vì vậy, với độ tin cậy (Ì- a) cho trước ta có thể tìm được giá trị za </i>


thỏa m ã n d i ề u k i ệ n :


Thay b i ể u thức của z x á c định theo (7.17) vào (7.18) ta được:


z = (7.17)


(7.18)


p [ ( Fn- p ) V ^


<i><za</i> = l - c t (7.19)


Sau một số p h é p b i ế n đ ổ i tương đường v ớ i b i ể u thức trong ngoặc của
(7.19), ta được:


v<i>ớ i mẫu cụ thể ta có khoảng tin cậy đối xứng của p là: </i>


</div>
<span class='text_page_counter'>(160)</span><div class='page_container' data-page=160>

<i>(ịìáfr trình hị thuyết xịe mất DÙ thấu ạ kè toán </i>


<i>f ± z</i> <i>a</i> <i>ị</i> <i>ĩ</i> <i>{</i> <i>ỉ</i> - (7.20)


Trong đó í" là ly lệ phần lử có tính chất A của mẫu cụ thể (cũng
chính là m ộ t giá trị của Fn) ;



<i>• Khoảng tin cậy bên phải: </i>


<i>( r - * * , J í Ẹ * : + « ) OM </i>


Khoảng tin cậy (7.21) dùng đ ế ước lượng giá trị tôi thiêu của p.


<i>• Khoảng tin cậy bên trái </i>


( _ „ ; f + Z 2 a i p E £ > ) (7.22,


Khoảng tin cậy (7.22) dùng để ước lượng giá trị tối đa của p


<i>Thí dụ 1: Kiểm tra ngẫu nhiên 400 sản phẩm do một máy sản xuất </i>


thấy có 20 p h ế phẩm. V ớ i độ tin cậy 95% h ã y ước lượng tỷ l ệ phế
phẩm t ố i đa của m á y đ ó .


<i>Giải: Gụi p là tỷ lệ phế phẩm của máy nì V trì cần ước lượng giá trị </i>


t ố i đa của p v ớ i độ tin cậy 95%. Đ â y là bai loan ước lượng lý l ệ lổng
thể bằng khoảng tin cậy b ê n trái v ớ i kích thước m ẫ u là n = 400.
Khoảng tin cậy của p đ ư ợ A á c định theo cơng thức:


( _ „ ; f + í a J Í ( l _ í ) )


<i>V ớ i độ tin cậy Ì - a = 95% thi z2n = Z(,,1 = 1.645; </i>


20


</div>
<span class='text_page_counter'>(161)</span><div class='page_container' data-page=161>

<i>ẽku&ttợ. 7: (lừa lư&ttg đác tố đặe trưng, của tẨềtạ títể </i>



V ậ y khoảng tin cậy t ố i đa của p là:


<i>í ' n n c 0,05(1^0,05) \ </i>


( - 0 0 ; 0,05 + 1,645. — - )


v V 400 •


Hay:


p < 0,0679


Tức tỷ l ệ p h ế phẩm t ố i đa của m á y đó là 6,79%


<i>Thí du 2: Nghiên cứu nhu câu tiêu dùng của một loại hàng ở một </i>


thành phố, người ta t i ế n h à n h đ i ề u tra nhu cầu tiêu dùng v ề m ặ t
h à n g n à y ở 100 gia đình thì thấy có 60 gia đình có nhu cầu v ề l o ạ i
h à n g đó. H ã y ước lượng tỷ l ệ gia đình có nhu cầu về mặt h à n g đó
của tồn thành p h ố v ớ i độ tin cậy 95% ?


<i>Giải: Gọi tỷ lệ gia đình có nhu cầu về mặt hàng này là p (p chưa </i>


b i ế t ) . Ta cầ n ước lượng p v ớ i đ ộ tin cậy 95%.


Đây là b à i tốn tìm khoảng tin cậy đơi xứng của tỷ l ệ tổng thể.
Theo giả thiết của bài tốn ta có: .


Tỷ lệ gia đình có nhu cầu về mặt hàng này trong mẫu cụ thể là:


60


Với độ tin cậy Ì - a = 0,95 i> za,= 1,96


A i


<i>lõi </i>


1,96 < p


, 6 ( 1 - 0 , 6 )


1 100 = 0 , 0 9 6


V ậ y khoảng tin cậy đ ố i xứng của p (với đ ộ tin cậy 95%) là:
(0,6 - 0,096 ; 0,6 + 0,096)


Hay:


</div>
<span class='text_page_counter'>(162)</span><div class='page_container' data-page=162>

<i>ẨẬiảv trình lý thuyết xuê mất ồ thống, kê tốn </i>


Nếu sử dụng cơng thức (7.16) thì kết quả là:


_ 0 , 6 x l 0 0 + 0,5(l,96)2 - 1 , 9 6 ^ 0 ^ 5 ( 1 , 9 6 )2 + 0 , 6 x 0 , 4 x 1 0 0


P l ~ 100 + (1,96)2 ~


= 0,502


_ 0 , 6 x i 0 0 + 0,5(1,96)2 + l , 9 6 V o , 2 5 ( l , 9 6 )2 + 0 , 6 x 0 , 4 x 1 0 0


<i>Vĩ</i> " 1 0 0 + (1,96)2


= 0,6906
V ậ y :


(50,2% < p < 69,06%)


Ta thấy k ế t quả của hai c á c h ưnh c h ê n h l ệ c h k h ô n g đ á n g k ể .


4 - ước lượng phương sai của tổng thể


Giả sử đ ạ i lượng ngẫu n h i ê n X p h â n phối theo qui luật ehuẩn, chưa
b i ế t phương sai cua nó . c ầ n ước lượng V a r ( X ) v ớ i đ ộ tin cậy Ì - a.


T ừ X lập m ẫ u ngẫu n h i ê n Wx = ( X i , x2 - Xn) và x é t 2 trường
hợp sau đ â y :


<i>4.1- Đã biết kỳ vọng toán E(X) = ỊJ. </i>


2 » ( X i - l i )2
<i>X é t đ ạ i lượng ngẫu nhiên: X - 2li </i> <i>ĩ </i>


1=1 ơ"
2


N g ư ờ i ta đã chứng minh được rằng X p h â n p h ố i theo qui l u ậ t "Chi
bình p h ư ơ n g " v ớ i n bậc tự do. N ê n v ớ i x á c suất a khá b é ta có thể
<i>tìm được hai số xì lĩ</i> và XỈ-o/2 sao cho:


</div>
<span class='text_page_counter'>(163)</span><div class='page_container' data-page=163>

<i>@itương. 7: (fỉởe lương. eáe. Ằố đăe trtếitụ c ủ a téửiỢ- thể </i>



P(X2>X2a/2) = a/2 vàP(xỉ>xL/2) = l-a/2


<i>Để tìm xin</i> và XỈ-a/2 ta có thể tra bảng ở phần phụ lục (bảng xầ)
hoặc d ù n g h à m CHIINV trong Excel.


Chẳng hạn, v ớ i độ tin cậy Ì- (X = 95% (tức a = 0,05) và bậc tự do 46
thì:


<i>xin = XỈ,025=CHIINV(0.025,46) = 66,616468 </i>
<i>xlan = XỈ.97S - CHIINV{0.975,46) = 29,16 </i>


Thay biểu thức của X v à o (7.23) và g i ả i ta được:
Z ( X , - n ) a


Xã/2


< ơ <


XĨ-o/2


(7.24)


V ớ i m ẫ u cụ t h ể Wx = ( X i , x2, . . . , x„) ta có t h ể tính được:
I(Xi - ^I)2


2
và từ (7.24) ta tìm được khoảng tin cậy của ơ


<i>Xa/2 </i>



< ơ <


XĨ-a/2


(7.25)


Ta chú ý r ằ n g khoảng tin cậ y n à y k h ô n g đ ố i xứng.
<i>* Khoảng tin cậy bên phải của ơ </i>


V Xa


+ 00 (7.26)


</div>
<span class='text_page_counter'>(164)</span><div class='page_container' data-page=164>

<i>ịịiáo.tẹẬíth bị thuyết xác Mất ồ thốềiq. kê tốn </i>


Xl-a


Í7.27)


<i>4-2 Trường hợp chưa biết E(X) </i>


<i>VUA - 1 « * K -</i> 2 ( n - l ) S2*


Xét đ ạ i lượng ngẫu nhiên: X - ị
ơ


Người ta đã chứng minh được rằn?: đ ạ i l.ượng ngẫu n h i ê n n à y phân
phối theo qui luật "Chi bình phương " v ớ i (n'=- 1) bậc tự do.



L ậ p l ạ i các bước như đã tiên h à n h ở trường hợp 4-1 ta sẽ tìm được
2


khoảng tin cậy của ơ v ớ i độ tin cậy Ì - oe là:
( n - l ) s2 , ( n - l ) s3


< ơ < - — :
Xa/2 <i><sub>x ĩ - a li </sub></i>


(7.28)


<i>Thí dụ: Mứ c hao phí n g u y ê n l i ệ u cho mộ t đơn vị sản p h ẩ m là đ ạ i </i>


lượng ngẫu nhiên X p h à n phối theo qui luật chuẩn v ớ i E(X) = 20
(gr). Quan sái 25 sản phẩm, ta có các số l i ệ u cho ở bảng sau:


Trọng lượng na/1 hao phí (gr) 19,5 20,0 20,5


Sơ sản phẩm 5 18 2


V ớ i độ tin cậy Ì - a = 95%, h ã y ước lượng Var(X)


<i>Giải: Lập bảng tính như sau: </i>


X i <sub>ni </sub> (Xi - 20) (Xi - 20)2 n i C X i - 2 0 )2


19,5 5 - 0 , 5 0,25 1,25


20,0 1 8 ' 0 0 0



20,5 2 0,5 0,25 0,5


</div>
<span class='text_page_counter'>(165)</span><div class='page_container' data-page=165>

<i>&íừớiiạ. 7: (it&e. Iưưitij eáe SẨ ităe trtiitạ của tổng thể </i>


<i>Tra bảng ỵ1</i> với bậc tự do n = 25 ta được:


XỈ-c/2 = XỈ.975 = 13'12<i> ; xin = XỈ.025 = 40,6465 </i>
Vậy khoảng tin cậy của ơ2 là:


1,75 _2 1,75


< a <


40,6465 13,12 hay: (0,043054 < ơ2 < 0,133384)
• Trong thí dụ trên, nếu chưa biết E(X) = 20 thì ta tính s2. V ớ i số
l i ệ u đã cho, ta d ễ d à n g tính được s2 = 0,0692.


#


<i>Tra bảng "1 với bậc tự do n -*• Ì = 24 ta được: </i>
<i>xL/2 =xỉ,975 = 12,401 ; xiu =^Ỉ.M5 = 39,3641 </i>
Vậy khoảng tin cậy của ơ2 trong uường hợp này là:


hay (0,04219 < ơ2 < 0,133925)


24.(0,0692) 2 24.(0,0692)


39,3641 12,401


5- X á c đ ị n h k í c h t h ư ớ c m ẫ u



Ta thấy chất lượng của ước lượng được phản á n h qua độ tin cậy (Ì
- oe) và độ chính x á c E. Đ ộ tin cậy và độ chính x á c càng cao thì ước
lượng đó c à n g tốt. Nhưng độ chính x á c s l ạ i phụ thuộc v à o kích
thư^c mẫu (n) và độ Ún cậy Ì - a. v ấ n đ ề đặt ra là, ta muốn độ tin
cậy Ì - ót và đ ộ chính x á c s đạt được ở m ộ t mức nào đọ cho trước thì
cần kích thước mẫu (n) t ố i thiểu là bao nhiêu ?


<i>5.1- Xác định kích thước mẫu khi ước lượng trung bình tổng thể </i>


<i>2 . ơ </i>


<i>a- N ế u biết Var(X) = ơ , thì từ cơng thức: 8 = za-ị= </i>


V n


</div>
<span class='text_page_counter'>(166)</span><div class='page_container' data-page=166>

<i>íịỉán trình iụ thuyết xịe. mất ồ thốuạ kè lồn </i>


2 ơ2


<i>ta suy ra ti = ( z</i>a) - 7 - (7.29)


8


b- Nếu chưa biết ơ2 , khi đó ta căn cứ vào mẫu đã cho (nếu chưa


có mẫu thì ta có thể tiến hành lấy mẫu sơ bộ với kích thước n i , Từ
mẫu này ta tính s ; với bậc tự do nI - Ì , tra bảng p h â n phối Student
(hoặc dùng hàm TINV) đ ể lìm ta. T ừ đó x á c định kích thước mẫu (n)
theo cơng thức:"



. 2 s2


n = (ta) 2 (7.30)


8


<i>* Chú ý: N ế u bài tốn thực t ế địi h ỏ i n phải là số n g u y ê n mà khi </i>
tính n theo cơng thức (7.29) hoặc (7.30) ta l ạ i được n là số khơng
ngun thì khi đó ta lấy phần ngun của nó cộng v ớ i 1.


<i>5.2- Xác định kích thước mẫu khi ước lượng tỷ lệ tổng thể </i>


T ừ công thức:


£ - za 1
ta suy ra:


!f ( l - f )
n


/ x2 f ( l - f )


n = ( z „ r v (7.31)


£


<i>* Chú ý: Đ e có f thay v à o công thức (7.31) ta dùng mẫu đã cho hoặc </i>
<i>mẫu điều tra sơ bộ lần đ ầ u với kích thước ni > 100 đ ể tính ĩ. </i>



6- Xác định độ tin cậy


Khi ước lượng các số đặc trưng của tổng thể bằng c á c số l i ệ u quan
sát của một mẫu có kích thước n, nếu ta muốn độ chính x á c (e) đại
được ở một mức nào đó thi độ tin cậy ( 1 - a ) sẽ là bao n h i ê u ?


</div>
<span class='text_page_counter'>(167)</span><div class='page_container' data-page=167>

<i>& Ị ươi Ị Ị/ 7: (Ịtức Ịưựnạ etíe lố đặc trưng càu tổ MỊ thế </i>


b- N ế u b i ế t Var(X) = ơ , thì từ cơn g thức:


<i>ơ </i>


£ = za<i> Ị— </i>
V n
ta suy ra


Za= ^ (7.32)


ơ


Sau khi xác định được za la suy ra độ tin cậy Ì - a (tra bảng hoặc
dùng h à m NORMSDIST)


b- Nếu chưa biết ơ2 , khi đó la căn cứ vào rriSu đã cho (nếu chưa


có m ẫ u thì ta có thể tiến hành lấy mẫu sơ bộ kích thước ni đ ể tính s.
T ừ đó x á c định ta theo công thức:


e v n



ta = — (7.33)
s


R ồ i suy tiếp độ tin cậy Ì - a (tra bảng hoặc dùng h à m TDIST).


<i>6.2- Xác định độ tin cậy khi ước lượng tỷ lệ tổng thể </i>


T ừ c ô n g thức:


E = Za 1


f f ( l - f )
n
ta suy ra:


e v n


2 u = r — — (7.34)


Như vậy, trong 3 tham số: n ; 8 ; za (hay Ì - a) ; nếu ta biết được


hai tham số thì có thể tính được tham số cịn l ạ i (cơng thức tính bạn
đọc có thể suy từ cơng thức tính e ironiỉ các bài tốn ước lượng đã
B ế t )


</div>
<span class='text_page_counter'>(168)</span><div class='page_container' data-page=168>

<i>íịỉá& trình bị thuyết xịe mất ồ íhốểiợ. kè tơán </i>


C h ư ơ n g . 8


<i>KIỂM ĐỊNH GIẢ THIẾT THONG KÊ </i>



I. Các khái niệm
Ì- Giả thiết thống kê


<i>Giả thiết thốni> kê là những giả thiết nói về các tham số, dạng qui </i>


luật p h â n phối; hoặc tính độc lập cửa các cỉại lượng ngẫu nhiên.
Việc tìm ra kết luận bác bỏ hay chấp nhận một giả thiết gọi là


<i>kiểm định iịiả thiết thốníỊ kè. </i>


Kiểm định giả thiết thống k.ê là một trong các bài toán cơ bản của
thống kê tốn.


<i>Thí dự ỉ: Trọng một báo cáo nói rằng: năng suâựúa ưung bình của </i>


linh \ năm 2001 là 6,8 tân/ha thì ta có thể coi đó là một giả thiết
thống kê, giả thiết này nói về một tham số (kỳ vọng tốn) cùa đại
lượng ngẫu nhiên biểu thị năng suất lúa của tỉnh này. Dựa vào số
liệu của một mẫu điều ưa. về năng suất lúa của tỉnh và qui lặc kiểm
<i>định (sẽ nêu ở phần sau) đ ể đưa ra một kết luận là bác bỏ hay chấp! </i>
nhận giả thiết trên.


<i>Thí dụ 2: Người bán cho rằng tỷ lệ sản phẩm loại li của lơ hàng là </i>


10%, ta có thể coi đây là một giả thiết thống k ê . Giả thiết này nói về
một tham số (kỳ vọng toán) của đ ạ i lượng ngẫu nhiên X- là số sản
phẩm loai l i có trong sán phẩm chọn ngẫu nhiên từ lơ hàng. Bên
mua có thể tiến hành lấy mẫu đ ể " k i ể m tra" điều mà bên bán đã
khẳng đinh xem có đúng hay khơng, như t h ế lức là b ê n mua hàng đã


<i>l i ế n hanh k i ể m định một 2,'ìẪ thiết t h ố n</i>ơ k ê .


</div>
<span class='text_page_counter'>(169)</span><div class='page_container' data-page=169>

<i>@ltươnạ 8: Xiểm đinh già thiết thếiiụ kè </i>
<i>Cách đặt giả thiết thống kê: </i>


Ta có 2 cách để chứng minh một chân lý, nghĩa là có 2 cách để
thuyết phục ngư ờ i khá c thấy dược châ n lý đó .
<i>Ví dụ: Chân lý là Ạ * B -và cũng là điều mà người, nghiên cứu </i>


m u ô n chứng minh.


<i>Cách thứ nhất: Đưa ra giả thiết: A * B rồi tìm dữ kiện để chứng </i>


tỏ rằng giả thiết ấy là đúng, là phù hợp (tức là có ý đề nghị người
k h á c chấp nhận giả thiết đó)


<i>Cách thứ hai: Đưa ra giả thiết là: A = B và tìm dữ kiện để chứng </i>


tỏ rằng giả thiết này là không phù hợp và ta bác bỏ giả thiết này (tức
ìà có ý đ ề nghị người k h á c chấp nhận A 5* B)


Vây cùng một chân lý, ta có thể đưa ra 2 giả thiết. Vậy cách nào là
<i>hợp lý hơn ? </i>


Thống kê toán sử dụng phương pháp qui nạp, nghĩa tà đi từ trường


hợp cá biệt (mẫu) đ ể suy ra trường hợp tổng quát (tổng thể), bằng
cách dùng d ữ k i ệ n của m ẫ u đ ể chứng minh giả thiết về tổng thể đó
Khi dữ kiện phù hợp với giả thiết thì điều này không là cơ sở để



thuyết phục chấp nhận giả thiết đó vì khi d ữ liệ u phù hợp vớ i gi ả
thiết n à y , nó cũng đồng thời phù hợp vớ i giả thiết k h á c . Cho n ê n k h i
. hì k i ệ n phù hợp vớ i gi ả thiết ta cũng chưa chứng minh được giả thiết


là đún g mộ t các h chắc chắn.


Còn khi dữ kiện khơng phù hợp với íĩả thiết thì điều này chắc
chắn lạ cơ sở đ ể bác. bỏ giả thiết đó.


• Hơn nữa, một giả thiết khi nó đù lì ti thì bao giờ nó cũng phù hợp


với thực tiễn. K h i có bằng chứng rút l ừ thực tiễn thấy khơng phù hợp
thì ta có thể k ế t luận nia thiết đó là khơng đúng.


</div>
<span class='text_page_counter'>(170)</span><div class='page_container' data-page=170>

<i>éý/áo trình tý. thuyết xịe Mất DÙ tltốttụ kê toán </i>


Trong thống kê toán, việc b á c bỏ m ộ t giả thiết dựa v à o x á c suất
<i>xảy ra b i ế n c ố có liên quan đ ế n giả thiết đó. M ộ i giả thiết chỉ có ửể </i>
x ả y ra v ớ i xác suất rất nhỏ thì trên thực t ế già thiết đ ó hầu như
k h ô n g đ ú n g , nên ta bác bỏ giả thiết ấy.


Dư.i vì;• ì .ít !\ 'lịn, khi dặt giá thiết thống kê ta lưu ý một số
vàn de sau:


<i>o Giả thiết đát ra với ý đồ hác bỏ mi, nehĩíi là già thiết đặt ra </i>


li. • . . , uunu, m u ô n thuyết phúc. Vì vậy
khi b á c bỏ được giả thiết có nghĩa là ta đã chứng minh được điều
ngược l ạ i .



© Gia thiết đặt ra sao cho khi chấp nhận hoặc bác bỏ nó sẽ có tác
dụng trả l ờ i được câu h ỏ i mà b à i toán thực t ố đ ặ t ra.
© Giả thiết đặt ra nếu nó đúng thì ta sẽ xác định được qui luật


p h â n phối x á c suất của đ ạ i lượng ngẫu nhiên được chọn làm liêu
chuẩn k i ể m định.


o Khi đặt giả thiết ta thường so sánh cái chưa biết với cái đã biết.


" C á i đ ã b i ế t " mà ta nói ỏ đ â y thường là những thôn g tin qu á khứ,
cấc định mức kinh t ế , kỹ thuật.


© Giả thiết đặt ra thường mang nghĩa :"khơng khác nhau", hoặc
" k h á c mà khơng có ý nghĩa" hoặc "bằng nhau".
Chẳng hạn, qua thực tiễn cơng tác ta có nhận xét là mức thu nhập


bình quân của dân cư ở một thành p h ố hiện nay cao hơn ưước đây,
và giả sử rằng ta đã biết một thông tin là thu nhập trung bình ở thành
p h ố này n ă m 1998 là 400 ngàn đ/người/tháng. Khi đ ó la có thể đặt
giả thiết:


Thu nhập bình quân của một người ở thành phố hiện nay là 400


</div>
<span class='text_page_counter'>(171)</span><div class='page_container' data-page=171>

<i>ũliườiHị 8: "Kiểm định già thiết thống kê </i>


Giả thiết ta nêu ở trên nói vồ kỳ vọng toán của đ ạ i lượng ngẫu
nhiên b i ể u thị thu nhập của những người dân cư trú trên địa bàn
<i>thành p h ố này. Mức thu nhập bình quân của một người ở thành phố </i>
n à y hiện nay là bao nhiêu ta chưa biết, còn thu nhập trùn" bình của
một người ở thành phố n ă m 1998 là ihông tin quá khứ (đã biết).


Giả thiết đặt ra như vậy gọi là giả thiết cần kiểm định. Giả thiết


<i>cần k i ể m định còn được gọi là giả thiết không (null hvpoihesis) ký </i>
<i>hiệu là Ho (hoặc H). M ộ t mệnh đề đ ố i lập với Ho được gọi là giả </i>


<i>thiết đổi và được ký h i ệ u là H | (hoặc H ) </i>


Chẳng hạn:


Hụi 8 = Gi.: H i : , 8 * 9 n


(0 hì mơi tham số nào đó của đại lượng Iiíìẫu nhiên ta đan" nghiên
cứu ; Go-JỊà--giá-Ịf ị đ ậ i ú ố t ) .


Nếu kiểm định eiả thiết với ma Lli đối có dạng này được ÌĨỌ1 là


<i>k i ể m định giả thiết hai phía (.VI miền hác bỏ năm '.* hại phía của </i>
m i ề n chấp nhận).


Giả thiết đối dang: 9 * 0() thường được áp dụng khi la chưa biết rõ
trong thực t ế tì > «u.hiỊi_n-.<Jo


Nhưng nếu bằng kinh nghiệm hoặc qua phân tích la biết được


chiều hướng là 0 > 0() thì la có i h ể đ ặ t gi ả thiết đ ố i dạng: 0 > 0(1 .
Hoặc ta biết được-chiều hướng là 8 < Go thì ta có thể đặt giả thiết đ ố i
dạng: 0 < Bo


<i>Thí dụ: Tỷ lệ phế phẩm của nhà máy trước đây là 5<7( . Sau khi nhà </i>



</div>
<span class='text_page_counter'>(172)</span><div class='page_container' data-page=172>

<i>íịíảe trinh Ui thuyết xác mất ồ íhốitợ, kê tốn </i>


Ta đ ặ t p là tỷ l ệ p h ế phẩm của nhà m á y sau khi á p dụng công
nghệ sản xuất mới (p chưa biết). Ta có tỷ l ệ p h ế phẩm của mầu là:
f = - Ì — = 0 04 (tức 4%). N h ư v â y ta thấy tỷ lê m ẫ u nhỏ hem 5%. Mà


400


như ta đã biết, tỷ l ệ mẫu là ước lượng đ i ể m của tỷ l ệ tổng thể (p), vì
<i>t h ế p có xu hướng là nhỏ hờn 5%. M ặ t k h á c la đ ề u b i ế t , trong thực </i>
t ế , khi nhà m á y thay đ ổ i cồng nghệ sản xuấ t thì cơn g nghệ sản xuất
mới thường là h i ệ n đ ạ i hơn, t i ề n t i ế n hơn v ề nhiều mặt. Vì vậy việc
tỷ l ệ p h ế phẩm g i ả m hớn công nghệ cũ cũng là một xu thố phổ biến
trong thực t ế . Do. vậ y đ ể tra l ờ i cho câ u h ỏ i của bà i tốn , ta có thể
t i ế n h à n h k i ể m định gi ả t h i ế t :


Ho: p = 0,05; với giả thiết đối Hi: p < 0,05


Khi kiểm định giả thiết này, nếu ta bác bỏ Ho thì có nghĩa là tỷ lệ


p h ế ph ẩ m của nhà m á y nà y thực sự đ ã g i ả m . Ngược l ạ i , nếu He
không bị b á c bỏ thì ta chưa có cơ sở đ ể khẳng định tỷ l ệ p h ế phẩm
của nhà m á y này đã g i ả m .


Nếu kiểm định giả thiết với giả thiết đối có dạng: Hi: 8 > Go; hoặc


<i>H i : 9 < Go; thì được g ọ i là k i ể m định giả thiết một phía (vì m i ề n bác </i>
bỏ nằm v ề một phía của m i ề n chấp nhận).


Nếu giả thiết đối có dạng Hi: 0 > Go; thì được gọi là kiểm định giả



<i>t h i ế t v ề phiu bên phải ( v í m i ề n b á c b ỏ n ằ m v ề p h í a b ê n phả i của </i>
m i ề n chấp nhận).


Nếu giả thiết đối có dạng Hi: 9 < Go; thì được gọi là kiểm định giả


<i>t h i ế t v ề phía bên trái (vì m i ề n b á c b ỏ n ằ m v ề phía b ê n trái của m i ề n </i>
chấp nhận).


Nhiệm vụ của lý thuyết kiểm định giả thiết thống kê là: bằng thực


</div>
<span class='text_page_counter'>(173)</span><div class='page_container' data-page=173>

<i>(Ệhưđnạ 8: 'Xiểm định í/iu thiết Úiổ4iQ.-kỀ </i>
<i>2-Mức ý n g h ĩ a , m i ề n b á c b ỏ </i>


C ó thể mơ tả phương pháp k i ể m định giả thiết thống kê như sau:
Xuất phát từ yêu cầu của bài toán thực tế, ta nêu ra một giả thiết


Ho và gi ả thiết đ ố i của nó.


Giả sử rằng Ho đúng, từ đó tìm một biến cố cổ xác suất đủ bé để


có thể tin rằng biến cố đó hầu như khơng thể xảy ra trong một p h é p
thử. M u ố n vậy, từ mẫu ngẫu nhiên:


WX = (X,,X2, ...,xn)
ta chọn:


z = f ( X | . X2, • • • , x „ , 0o)
z được chọn sao cho: nếu Ho đúng thì ta sẽ xác định được qui luật



phân phối xác suất của z và với mẫu cụ thể ta có thể tính được giá
l ạ của z. Đ ạ i lượng ngẫu nhiên z được gọi là liêu chuẩn k i ể m định
giả thiết Ho.


Do qui luật phâ n phố i xá c suất của z đã b i ế t , n ê n với (X b é tùy ý ta
có thệ tìm được m i ề n wa sao cho P(Z e wa) = ót. M i ề n wa được gọi
<i>là miền bác bỗ giả thiết H(). Trong thực t ế thường chọn. a trong </i>
<i>khoảng ( 1 % ; 5%). a được g ọ i là mức ý nghĩa của k i ể m định. </i>


Thực hiện một phép thử đ ố i với mẫu ngẫu nhiên wx, ta thu được
mẫu cụ thể wx = (X|, X i , . . . . xn) . T ừ mẫu cụ thể này ta tính được
giá trị của z (ký hiệu là z) và gọi là giá trị thực nghiệm:


z = f(xi, x2)..., x„, e0).


<i>N ế u ỉ e W</i>a thì ta bác bỏ giá thiết Ho thừa nhận Hi
<i>N ế u z Ể w</i>a thì ta chấp nhận H(>.




* Cần lưu ý là: khi nói "chấp nhận Ho" điều đó khơng có nghĩa là
giả thiết Ho là đúng mà chỉ có nghĩa là với số l i ệ u của mẫu la chưa


</div>
<span class='text_page_counter'>(174)</span><div class='page_container' data-page=174>

<i>iịiúo trình uy t/tuyết xúc mất ồ thốnạ Uế tốn </i>


đủ cơ sở (chưa đủ bằng chứng) đ ể b á c bỏ H(). Trong thực hành tốt
<i>hơn là n ê n nói rằng: "có thể chấp nhận Ho" hoặc "chưa vó cơ sở để </i>


<i>bác bo Ho" </i>



3- Sai lầm loại Ì và sai lầm loại 2


Khi k i ể m định một giả thiết thống k ê , chúng ta có t h ể mắc phải
một trong hai loại sai l ầ m sau đây:


<i>ít" Sai lầm loại 1: Là sai l ầ m mắc phải khi ta b á c bỏ một giả thiết </i>


Ho trong khi thực t ế thì gi ả t h i ế t Ho đúng .


X á c suất mắc phải sai l ầ m l o ạ i này bằng mức ý nghĩa a. Tức là:
P(Z € wa) = a (Xác suất đ ể tiêu chuẩn z thuộc m i ề n b á c bỏ wn
n ế u gi ả thiết H().đúng). N ế u a c à n g b é thì kh ả n ă n g phạ m phả i sai
l ầ m loại Ì càng ít.


<i>b- Sai lầm loại 2: Là sai l ầ m mắc phải khi ta chấp nhận giả thiết </i>


Ho trong khi thực t ế thì gi ả t h i ế t Ho sai.


X á c suất mắc phả i sai l ạ m l o ạ i 2 là x á c suất đ ể z nhận giá trị
không thuộc m i ề n bác bỏ w a khi Ho sai (tức H i đúng). N ế u ký hiệu
xác suất mắc phải sai l ầ m loại 2 là ị3 thì:


|3 = P(ZẾ Wa/H,) (8.1)


Khi đó biến cố khơng mắc sai lầm loại 2 là biến cố để z nhận giá


trị thuộc m i ề n bác bỏ và do đó ta b á c bỏ Ho trong khi thực t ế thì H i
đúng. Ta ký hiệu biến cố này là (Z 6 Wa/ H | ) .



Biến cố trên đối lập với biến cố (Z £ Wa/H|) nên xác suất của nó
là:


</div>
<span class='text_page_counter'>(175)</span><div class='page_container' data-page=175>

<i>@jrggỊgg Si Xiểm đinh giả thiết tltổnụ kê </i>


1-P được gọi là lực k i ể m định giả thiết H(). Nó chính là xác suất
" k h ô n g mắc sai l ầ m loại 2". p càng nhỏ thì lực kiểm.định c à n g lớn.


C á c trường hợp xảy ra khi tiến hành k i ể m định giả thiết thống k ê
có thể tóm tắt dưới dạng bảng sau:


—^Tình huống
K ế t luận


Ho đúng Ho sai


B á c bỏ Sai l ầ m loại 1
(xác suất = a)


K ế t luận đún g
(xác suất = 1-P)
Chấp nhận K ế t luận đúng


(xác suất = 1-a)


Sai l ầ m loại 2
(xác suất = Ị3)
Cả hai loại sai l ầ m đ ề u gây ra tác hại. Chẳng hạn:


+ Chấp nhận một lô hàng xấu hoặc từ chối một lô hàng tốt đều là


tai h ạ i .


+ Cho đậu một thí sinh yếu kém (mà đáng lẽ ra phải rớt) hoặc


cho rớt một thí sinh g i ỏ i (mà đáng l ẽ ra phải đậu) đều là những sai
l ầ m tai h ạ i .


Dĩ nhiên ta cố gắng hạn chế các sai lầm, hạ thấp xác suất mắc


phải sai l ầ m . Nhưng nếu ta muốn g i ả m xác suất sai l ầ m loại Ì thì sẽ
l à m l ă n g xá c suất sai l ầ m l o ạ i 2 và ngược l ạ i . Chẳng hạn n ế u l ấ y a =
0 thì sẽ khơng bác bỏ bất kỳ giả thiết nào, k ể cả giả thiết sai, như
vậy {3 sẽ đ ạ t cực đ ạ i .


Có 2 cách khống chế khả năng mắc phải sai lầm:


<i>Cách thứ nhất: Ta ấn định trước mức xác suất sai lầm loại ì và sai </i>


lầm loại 2 r ồ i tính tốn tìm một mẫu có kích thước nhỏ nhất ứng với


</div>
<span class='text_page_counter'>(176)</span><div class='page_container' data-page=176>

<i>4ịiáo trúitt tụ thuyết xác Mất lùi tiiíùiQ. kè tơá/1 </i>


<i>Cách thứ hai: Ta ấn định trước xác suất sai l ầ m loại Ì (lức cho </i>


trước mức ý nghĩa oe) chọn m i ề n bác bỏ w a sao cho có xác suất sai
l ầ m loại 2 nhỏ nhất hay lực k i ể m định là lớn nhất. tức cần tìm miền
b á c bỏ w a thỏa m ã n các điều k i ệ n sau:


P(Z e Wn/H()) = oe cho trước và
P(Z e Wa/H|) = Ì - p lớn nhất.



Dựa vào định lý Neyman - Pearson được trình bày trong các tài


l i ệ u đầy đủ hớn có thể tìm được những m i ề n b á c bỏ "tốt nhất" như
vậy.


Các miền hác bỏ wa trong giáo trình này thỏa mãn điều kiện nêu


trên, tức đ ề u là những m i ề n b á c bỏ "tốt nhất" với mức ý nghĨ£ và
kích thước mẫu xá c định trước.


Việc chọn mức ý nghĩa CC bằng .bao nhiêu tùy thuộc vào từng


trường bợp cụ thể và hậu quả mà sai l ầ m Ì lại Ì và sai l ầ m loại 2
mang l ạ i .


Cần lưu ý rằng: bác bỏ hay chấp nhận một giả thiết tùy thuộc vào


<i>giá trị thực nghiệm của tiêu chuẩn z và mức ý nghĩa a. Kiểm định </i>


<i>giả thiết thống kê chỉ là một qui tắc giúp ta kết luận một vấn đề </i>
<i>của bài toán thực tế đặt ra sao cho kết luận đó có khả năng mắc </i>
<i>phái sai lầm nhỏ (ở mức nào đủ) chứ không phải là phép chứng </i>
<i>minh lồgỉc một mệnh đề. </i>


li- Kiểm định giả thiết về trung bình của tổng thể


</div>
<span class='text_page_counter'>(177)</span><div class='page_container' data-page=177>

<i>Wtưư«ạ 8:DCiểm định giả thiết thống, kê </i>


<i>Ho: ụ. = m„ với gia thiết đ ố i H , : ịi * m</i>0


(mo là một giá trị đã biết khi đặt gia thiêt Ho).


Để kiểm định giả thiết trên ta tiến hành lấy mẫu với kích thức n và
xét các trường hợp sau:


2


<i>ì - T r ư ờ n g h ợ p G đ ã b i ế t . </i>
<i>Trường hợp này ta chọn thống kê: z = </i>


jj-ơ / V n
làm tiêu chuẩn k i ể m địfth.


Nếu giả thiết Ho đùng thì z ~ N(0, 1)


yới mức ý nghĩa a, chọn miền bác bỏ giả thiết Ho:
Wot = {z:|z|>z(>}


Trong đó za là giá trị của z ~ N(0, 1) thoa mãn:
P(|z|>za) = a


Trên đồ thị, miền bác bỏ wa được minh họa như sau:


<i>/CUI </i>


T«,',.^lw.,'.,-.^'


<i>-<x </i>


M i ề n b á c bỏ



0


M i ề n chấp nhận M i ê n b á c bỏ
- >


</div>
<span class='text_page_counter'>(178)</span><div class='page_container' data-page=178>

<i>íậiảti trình ít/ thuyết xác suất và thống, kè tốn </i>


Ta có:


P ( Z e wa) = P(l z I > za) = P ( z < - za) + P ( z > za)
= a/2 + a/2 = a


Như vậy xác suất để giá trị của z rơi vào miền bác bỏ là a, tức xác


suất đ ể z rơi vào m i ề n chấp nhận sẽ là ì-OI. Vì Gt nhỏ, nên xác suất
đ ể z rơi v à o m i ề n chấp nhận sẽ lớn. Nghĩa là: nếu giả thiết Ho đúng
thì có thể coi rằng hầu hết các giá trị của z sẽ rơi v à o miền chấp
nhận. Còn nếu giá trị của z rơi v à o m i ề n bác bỏ có nghĩa là ta đã
tìm được "bằng chứng" đ ể chứng tỏ giả thiết Ho là khơng đúng và vì
t h ế ta b á c bỏ giả thiết đó .


Từ đó ta có quiìắc quyết định khi tiến hành kiểm định giả thiết Ho
trong trường hợp nà y nh ư sau:


• Lấy mẫu có kích thước n, từ mẫu cụ thể này tính


ơ
<i>(Trong đó X là trung bình mẫu). </i>
<i>• Với mức ý nghĩa oe cho trước , xác định za </i>



(bằng cách tra bảng ở phần phụ lục hoặc dùng hàm NORMSINV
trong Excel)


• Nếu I z I > za . Tức zeWa thì bác bỏ giả thiết Ho, chấp nhận
H , .


• N ế u I z l < za . Tức<i> Z Ể W Ơ thì có thể chấp nhận giả thiết tìị). </i>
Từ việc chấp nhận (hay bác bỏ) Ho la suy ra kết luận cuối cùng


theo u cầu của bài tốn thực tế.


<i>Thí dụ ỉ: Nếu máy đóng bao làm việc binh thường thì trọng lượng </i>


</div>
<span class='text_page_counter'>(179)</span><div class='page_container' data-page=179>

<i>Giường 8: "Kiểm định t/iả thiết thống, kè </i>


luật chuẩn với kỳ vọng toán là 100 gr và độ lệch chuẩn ơ = 1. Qua
một thời gian sản xuất, người ta nghi ngờ trọng lượng trung bình của
l o ạ i sản phẩm này đã thay đ ổ i . C â n thử 100 sản phẩm và tính được


<i>X = 100,3 gr. </i>


V ớ i mức ý nghĩa a = 0,05 hãy k ế t luận điều nghi ngờ trên có đúng
hay không (giả thiết độ lệch chuẩn không thay đổi).


<i>Giải: Gọi X là trọng lượng thực tế của loại sản phẩm này trong </i>


khoảng thời gian đang xét. Theo eiả thiết X ~ N(fA, ơ2<i>) . ụ. chính là </i>
trọng lượng trung bình thực t ế của loại sản phẩm do m á y đóng bao
<i>sản xuất trong khoảng thời gian đang xét (trung bình tổng thể), ụ. </i>


chưa b i ế l còn ơ = ] . Đ ặ t giả thiết:


<i>Ho: n= 100; Hi: ịi* 100 </i>


Đ ể k i ể m định giả thiết này ta áp dụng qui tắc k i ể m định nêu trên
[vì X ~ N(n, ơ2) và ơ đã biết]


Ì


V ớ i mức ý nghĩa a = 0,05 tra bảng ta được Z(),()5 = 1,96
Vì I z I = 3 > Z().()5 = 1,96 nên ta bác bỏ giả thiết Ho. Tức điều nghi


ngờ trên là đúng, trọng lượng trung bình của loại sản phẩm này đã
khác 100 gr thực sự.


Chùy:


• Nếu k i ể m định giả thiết H( )<i>: ụ = m</i>( )<i>; và giả thiết đ ố i H, : ịx > mo với </i>
mức ý nghĩa a thì chọn m i ề n bác bỏ giả thiết Ho là:


<i>Ị x-m</i>0 ì


wa = { z = - — ^ : z > z 2 a }
ơ / V n


</div>
<span class='text_page_counter'>(180)</span><div class='page_container' data-page=180>

<i>iịiủa trình lý (huyết xáe mất tui t/iấtiạ kè toán </i>


P( I Z | > z2 o t) = 2<x


Trên đồ thị, miền bác bỏ wa trong trường hợp này được minh họa


như sau:


<i>• N ế u k i ể m định giả thiết Ho: ụ. = m</i>0<i>; và giả thiết đ ố i H i : ụ< nhì với </i>
mức ý nghĩa a thì chọn m i ề n bác bỏ giả thiết Ho là:


<i>wa = ị z =</i> x— : z < -z2a}


<i>ơ i V n </i>


Trên đồ thị, miền bác bỏ wa trong trường hợp này được minh họa
như sau:


</div>
<span class='text_page_counter'>(181)</span><div class='page_container' data-page=181>

<i>(thương S: TCièm định giũ thiết lliốiu/ Ui </i>


Ta có thể l ỏ m lắt các loại giả thi ỐI và m i ề n hác bỏ lư.'' :'p. : tron"
n ường hợp này ba na bảne sau:


Giá thiết M i ề n b á c hò
<i>Ho; ụ = ni,, </i>


H,: Ị-I < nin W a = { 2 = l Z E » : Z < - Z2 ( I}
ơ / V n


Hi,: |A = ni,,


H,: (.L > in,, W a = { z = ^ : 2 > Z 2 u }
ơ / v n


Hi,: Ị I = m„



<i>H i : ụ. * in,, </i> W a = { z = ^ > : | Z | > 2U}
ơ / v n


2- T r ư ờ n g h ợ p ơ c h ư a b i ế t
Trường hợp này chọn:


s


làm tiêu chuẩn k i ể m định. N ế u Ho đúng thì T phàn phối theo qui luật
Studcnt với n-1 bậc l ự do.


Miền bác bỏ trong trường hợp này tùy thuộc vào già thiết đối và
được tóm tắt ở bảng sau:


Giả thiết M i ề n b á c bỏ
H0<i>: ụ = mo </i>


<i>H|.- ụ< m„ </i> W a = { t = ^ L : t < - t < r > }
s / V n


<i>H„: ụ = niu </i>


<i>H,: ịx > mu </i> v v0 = { t = i ^ : t > t < r }
s / v n


<i>H„: ụ. = mo </i>


</div>
<span class='text_page_counter'>(182)</span><div class='page_container' data-page=182>

<i>(ảiíw trình Ui thuyết x UI tít ồ ỉ/iốiự/ Ui tốn </i>


t,n " là giá trị của ĐLNN T ~ T(n-l) thỏa mãn điều kiện:



t(n_l)(viết tắt là ta) được xác định bằng cách tra bảng phân phối


Studcnt với bậc tự do n - 1 hoặc d ù n g h à m TINV trong Excel.


Ta có thể minh họa m i ề n bác bỏ với c á c dạng giả thiết đ ố i khác
nhau trên đồ thị như sau:


N ế u k i ể m định gi ả t h i ế t hai phía, tức gi ả t h i ế t đ ố i có dạng:
H i : IU* mu


thì m i ề n bác bỏ wa được minh họa trên đồ thị như sau:


M i ề n -ta 0 ta M i ề n t


b á c bỏ M i ề n chấp nhận b á c bỏ


< < •>


M i ề n chấp nhận


> ị >


N ế u k i ể m định cui t h i ế t mộ t phía vớ i gi ả t h i ế t đ ố i có dạng:
<i>ri,: ịi> mo </i>


</div>
<span class='text_page_counter'>(183)</span><div class='page_container' data-page=183>

<i>@ittiơittỊ 8: TKiếm điitli ijiả thiết thống, Uè </i>


N ế u k i ể m định nia thiết mộ t phía vớ i £Ìả thiết đ ố i có dạng:
H I : Ị.K nin



thì m i ề n b á c bỏ wư được minh họa trên đồ thị như sau:


M Í C H -t?u
bác bỏ


<i></i>


<-M i ề n chấp nhận


>


<i>Thí dụ 2: Trọng lượníĩ của các bao gạo do một m á y đóng bao sản </i>


xuất là đ ạ i lượng Iiiiẫu nhiên phân phối theo qui luật chuẩn với trọng
lượng trung bình qui định là 50 kg. Đ ể xem máy đóng bao làm việc
có bình thường không (theo niỉhĩa máy sản xuất ra những bao gạo có
trọng lượng truníi bình đúníi như qui định khơng), người ta cân thử 25
bao và tính được:


<i>X = 49,52 kg ; </i> 0,5


<i>V ớ i mức ý 11»hiu a = 0,01, hãy cho k ế t luận về tình hình làm việc </i>
của máy đóng bao đó ?


<i>Giải: Gọi f.L là trọng lượng trung bình thực tế của những bao gạo do </i>


máy sản xuất (|A chưa biết). Đ ặ t giả thiết:
Ho: n = 50 ; Hi: 1-1*50



do ơ chưa biết nên ta áp dụng qui tắc kiêm định như sau:
(49,52-50)


Tính:


0,5 '25 = - 4 , 8


</div>
<span class='text_page_counter'>(184)</span><div class='page_container' data-page=184>

<i>íịiáo trình lự títui/ết xáe mất ồ í/tốnạ kế tơtúi </i>


Vì í t I > 2 797. Tức teWa nên ta bác bỏ giả thiết H(). Tức là máy


đ ó n g bao l à m việc khơng bình thường. Nói cụ thể hơn, m á y đã sản
xuất ra những bao gạo có trọng lượng trung bình t h á p hơn trọng
<i>lưựns trung bình qui định (vì # = 49,52 < 50). </i>


3- Giá trị xác suất (p-value) của kiểm định


Thủ tục k i ể m định được trình b à y ở trên có tính chất ư u y ề n thống
và theo cách tiếp cận cổ đ i ể n . Trong nhưng n ă m gần đ â y nhiều nhà
n g h i ê n cứu thường sử dụng mộ t các h t i ế p cận k h á c . Thay vì kiểm
định giả thiết với m ộ i giá trị a định trước thì họ cho rằng ta nên định
rõ các giả thiết Hu và H i , sau đó thu thập số l i ệ u mẫu và tính giá trị
của tiêu chuẩn k i ể m định. T ừ đó có thể x á c định được xác suất mắc
phải sai l ầ m l o ạ i Ì n ế u ta bác bo giả thiết Ho. X á c suất này thường
được ỈĨỌÌ là giá trị p (p-value) của k i ể m định.


(.'hunổ ta sẽ minh họa cách tính p-value qua Ihí dụ sau:


<i>Thí dụ: Trong lương của những con sà khi xuất chuồng là đại lượng </i>



ngẫu nhiên phân phối theo qui luật chuẩn với độ lệch chuẩn là 0,32.
Trước đây trọng lượng trung bình khi xuất chuồn? của m ộ i con gà ở
một li l i chăn nuôi là 3,4 kg. N ă m nay người người la á p dụng thử
môi phướng p h á p chăn nuôi mới. Sau một thời iĩian á p dụng thử
người ta chọn ngẫu nhiên 50 con đ e m cân và tính được trọng lượn"
trùn" bình là 3,5 kg. Hãy cho biết phương p h á p chăn ni mới có tác
dụng làm lăng trone lương của gà khi xuất chuồn" hay khôniỉ?
<i>I a) Hãy xác định p-value của kiểm định? </i>


(h) p-value sẽ thay đ ổ i như t h ế n à o nếu trung bình mẫu khơng
phải là 3,5 kg mà là 3,6 kg?


<i>Giải: (a) Gọi |i là trọng lượng của gà khi xuất chuồne sau khi áp </i>


</div>
<span class='text_page_counter'>(185)</span><div class='page_container' data-page=185>

<i>thương 8: Xiểm định ỊỊÌÙ thiết ỊhổỊiạ kê </i>


Đ â y là bài toán k i ể m định giả thiết về irung hình tổng thể (giả
t h i ế t mộ t phía) ơ đã b i ế t .


Từ các giả thiết của bài tốn ta tính được giá trị của tiêu chuẩn
k i ể m định:


( x - m0) V ^ ( 3 , 5 - 3 , 4 ) V 5 Õ
<i>z = = —— = Z,11 </i>


ơ 0,32


p-value của k i ể m định (tức là xác suất mắc phải sai l ầ m loại Ì nếu la
b á c b ỏ gi ả t h i ế t Ho) chính là: P(Z > 2,21).



Để tính xác suất này ta có thể dùng bảng za hoặc dùng hàm
NORMSDIST.


Ta có:


p-value = P(Z > 2,21) =1-NORMSDIST(2.21) = 0,01355


Ta có thể minh họa giá trị p-value trên đồ thị như sau:


<i>/ \ p-value = 0,01355 </i>


<i>; •>•'.:.-ri. ^ </i>


0 2,21 z


<i>Nỉùr vậy với mẫu đã nêu ở thí dụ này, nếu ta bác bỏ giả thiết Ho, </i>


tức cho rằng việc á p dựng phương pháp chăn ni mới có tác dụng
làm tăng trọng lượng trung bình của gà khi xuất chuồng thì khá năng
mắc phai sai lam l o ạ i Ì là 0,01355 (hay 1,355%).


</div>
<span class='text_page_counter'>(186)</span><div class='page_container' data-page=186>

<i>íịiátì trình ti/ thuyết xác mất DÙ íltốnụ Ui' tốn </i>


( x - m0) V ^ _ ( 3 , 6 - 3 , 4 ) V 5 Õ


z = = : = 4,4 l y


<i>à 0,32 </i>


Khi đó la có:



p-value = P(Z > 4,419) =1-NORMSDIST(4.419) = 4.962E-06
4.962E-06 = 4.962X lo-6 = 0,000004962 < 0,00001.


Tức p-value tương ứng v ớ i z = 4,419 rất nhỏ


Như vậy p-value càn? nhỏ thì mức độ khẳng định của mẫu về việc


bác bỏ Ho càng rõ r ệ t hơn, nói cách khác ỉĩiả thiết Ho càng k é m tin
cậy hơn. Chẳng hạn p \alue = 0,01 cho thấy mức độ khẳng định để
bác bỏ giả thiết Ho là rõ r à n ? hơn so với giá trị p-value = 0,1.
ơ trên là p-value trong kiêm định một phía (phía bên phải).


N ế u k i ể m định gi ả thiết v ề phía b ê n trái hoặc k i ể m định gi ả thiết hai
phía thì ta cũng tìm được giá trị p-value tương ứng.


Cơng thức tính p-value cho kiểm định giả thiết về trung bình "tổng
thể như sau:


<i>a- Trường hợp đã biết ơ\ </i>


<i>• Nếu H,: ụ > m„ thì: </i>


p-value = p ( z > z) (8.4)
• Nếu Hi: Í-K m0 thì:


<i>p-value = p ( z < ì) (8.5) </i>
<i>• Nếu Hi: ụ.* TĨU) thì: </i>


p-value = P( z > I z I) (8.6)



<i>b- Trưởng hợp chưa biết (ỷ </i>


</div>
<span class='text_page_counter'>(187)</span><div class='page_container' data-page=187>

<i>@liứưii<j 8: 3Qếiti đỉnh giả. thiết tìtống. kè </i>


p-value = P(T > t) (8.7)


• N ế u H i : Ị.K m0 thì:


p-value = P(T t) (8.8)


<i>• N ế u H i : ịx * m</i>0 thì:


p-value = p( T > I t I) (8.9)
Trong thực tế, việc k i ể m định giả thiết theo p-value thường được t i ế n
h à n h theo n g u y ê n tắc sau:


Nếu p-value > 0,1 thì thường người ta thừa nhân Ho


N ế u 0,05 < p-value < 0,1 thì cần càn nhắc cẩn thận trước kh i
b á c bỏ Ho


N ế u 0,01 < p-value < 0,05 thì n g h i ê n g về hướng bá c bỏ Ho
n h i ề u hơn.


- N ế u 0,001 < p-value < 0,01 thì ít băn khoă n khi bá c bỏ Ho.
N ế u p-value < 0,001 thì có th ể hồ n tồn y ê n tâ m khi bá c bỏ


* M ặ t khác, nếu quy định trước mức ý nghĩa a thì có thể dùng
p-value đ ể k ế t luận theo a. Khi đó nguyên tắc k i ể m định như sau:



N ế u p-value < cc thì b á c bỏ Ho thừa nhận H | .
N ế u p-value > oe thì chưa có cơ sở đ ể b á c bỏ Ho.
Theo cách kiểm định này thì việc sử dụng p-value lại chính là kiểm
định theo cách tiếp cận truyền thống.


<i>Thí dụ: Nếu máy đóng bao làm việc bình thườn2 (hì trọng lượng các </i>


bao gạo dồ máy đóng bao này sản xuât là đ ạ i lương ngẫu nhiên p h â n
phối theo qui luật chuẩn với trọng lượng trung bình là 50 kg. N í h i
ngờ các bao gạo do m á y này sản xuât không đủ trọng lượng qui định,
người ta cân thử 25 bao và tính được x = 49,68 kg và s = u,r lây
cho kết luận về đ i ề u nghi ngờ trên?


</div>
<span class='text_page_counter'>(188)</span><div class='page_container' data-page=188>

<i>tụ tát) trình lý thuyết xác mất lùi thống kê toán </i>
<i>Giải: Gọi X là trụng lượng các bao gạo do máy đóng bao sản xuất. </i>


X ~ N(f.i, ơ2) . Ta cần k i ể m định giả thiết:
<i>Ho; ịí = 50; với giả thiết đối Hi: ụ. < 50 </i>


Đây là bài lồn kiểm định giả thiết về trung bình tổng thể, ơ2 chửa
b i ế t và khô nơ qui định trước mức ý nghĩa oe.


Để kiểm định giả thiết trên, trước hết ta tính:
(x-m0)V^ _ (49,68-50)725 _


t — : <i>— ~~>*L </i>


s 0,5



Theo côn g thức (8.8) ta có :
p-value = P(T < t) = P(T < -3,2)


Ta có:


P(T < -3,2) = P(T > 3,2) =TDIST(3.2, 24,1) = 0,00192
Như vậy 0,001 < p-value < 0,01 nên ta ít băn khoăn khi bác bỏ giả


thiết Ho, tức có th ể k ế t luậ n m á y đ ó n g bao đã sản xuâ t ra cá c bao
gạo có trọng lượng trung binh thấp hdn 50 kg.


<i>* Chú ý: Nếu ở thí dụ này ta cho trước mức ý nghĩa a (chẳng hạn ta </i>
cho a = 0,01) thì theo k ế t quả tính p-value ta thấy:


p-valuc = 0,00192 < 0,01


nên ta bác bỏ Ho. Như vậy ta cũng đi đ ế n cùng một k ế t luận như
trên.


4- Tính xác suất sai lầm loại 2


Ta có thể lính giá trị p là xác V- M mắc phải sai l ầ m loại 2.
Ti ó lại thi du về trong lương cùa ga khi xuất Chuồng đã nêu ỏ phần


</div>
<span class='text_page_counter'>(189)</span><div class='page_container' data-page=189>

<i>@lntƠ4UỊ. S: DCiểnt đinh t/iti thiết thổn lị hè </i>


•H„: H = 3,4;H,: n>3,4


Ta thấy xác suất để thừa nhận giả thiết sai Ho sẽ phụ thuộc vào



<i>việc giá trị thực của ị.1 sai lệch nhiều hay ít so với 3,4. Chẳng hạn </i>
<i>n ế u giá trị thực của ụ. là 3,6 thì p sẽ nhỏ hơn trường hợp giá trị thực </i>
<i>của ụ là 3,45. V ậ y tùy thuộc v à o giá trị thực của JA mà ta có các giá </i>
trị p k h á c nhau. Đ i ề u này được được minh họa trên hình 8.9 với 3 giá
trị thực của ỊJ. khác nhau là: 3,48; 3,54 và 3,6


Hình 8.9-a: Trường hợp H , : n = 3,48


</div>
<span class='text_page_counter'>(190)</span><div class='page_container' data-page=190>

<i>íj'itn/ ti mít ít/ thuyết </i> <i>xác tuất DÙ fliốiifỊ kê tốn </i>


Phân phơi của X
khi Ho đúng


P h à n phối của X
khi H | đ ù n ỉ


3,4 3,6 X
Hình 8.9-c: Trường hợp HI: ị.1 = 3,6


<i>Giả sử tá vẫn Ì lẩm <i\nh giả thiết H</i>0<i>: f.i = 3,4 ; H|I ịi> 3,4 với mức </i>


ý nghĩa cc = 0,01. D i ệ n tích phần gạch c h é o trên hình 8.9 b i ể u thị giạ
Ui của p ứng với các trường hợp giá trị thực của Ị.I là 3,48; 3,54 và
3,6.


" ( x - i r i , ) )
p = P ( Z ' < 2 , _B) = P ( Z » < z2 a) = P


se(X)



= p


= p


( x - m p ) ^ (m0 - m , )
= — - ^ = — < z
se(X) , s e ( X ) 2ct


( x ~m o ) ^ _ ( m „ - m , )
se(X)


=>(3 = p z <


Z-se(X)


( M ọ - M Ị )


se(X) (8.10)


</div>
<span class='text_page_counter'>(191)</span><div class='page_container' data-page=191>

<i>Qlutơttg. Sỉ DCiểin định giả thiết íỉiơuạ kẽ </i>


p = p <sub>z</sub><sub> <</sub><sub> Z</sub><sub>2a -</sub> ( • " Ị - m ọ )


se(X) (8.11)


T ừ đó ta có cơng thức chung đ ể tìm xác suất mắc phải sai l ầ m loại 2
: k bỏ là một phía (bên phải hoặc bên trái) như sau:


p = p <sub>Z</sub> <sub><</sub> <sub>Z</sub> <sub>2 „ -</sub> m0 - m ,



se(X) (8.12)


N ế u k i ể m định gi ả thiết hai phía thì p được xá c định bằng cơn g thức
sau:


p = p z < z . m0 - m ,


se(X) (8.13)


<i>Thí dụ: Ta xét t i ế p thí dụ về trọng lượng gà khi xuất chuồng. T i m </i>


xác suất mắc sai l ầ m loại 2 và lực k i ể m định nếu trọng lượng xuất
chuồng sau khi áp dựng phương p h á p chăn nuôi mới là 3,52 kg.


<i>Giải: Vì giả thiết đối là Hi: ịi > 3,4 nên với CC = 0,01; ni,) = 3 4- m, = </i>


3,52. Theo cơng thức (8.12) ta có:


p = p z < z <sub>0,02 </sub> 3,4 - 3,52


0,32 / V 5 0 P ( Z < 2,326 - 2 , 6 5 1 6 5 ) =


= P(Z < -0,32565) =P(Z > 0,32565)
=1-NORMSDIST(0.32565) = 0,372345


</div>
<span class='text_page_counter'>(192)</span><div class='page_container' data-page=192>

<i>í Ị HU* trinh hi ttutụết xuê mất nà thống, kí toán </i>


U I - K i ể m đ ị n h g i ả t h i ế t v ề t ỷ l ệ t ổ n g t h ể
Giả sử tỷ lệ các phần tử có tính chất A của tổng thổ là p (p chưa
b i ế t ) . Ta cần k i ể m định giả t h i ế t :



Ho: p = Po; và giả thiết đối Hi: p 5* Po với mức ý nghĩa a.
Để kiểm định giả thiết trên, ta lấy mẫu kích thước n khá lớn khi đó
nếu Ho đún g thì đ ạ i lượng lượng ngẫu nhiên :


<i>Z = ^pÉL (8.14) </i>


V P o O - P o )
phân phối xấp xỉ N(0, 1)


<i>Từ đó ta có thể đưa ra qui tắc quyết định như sau: </i>
+ ì nẫu cụ thổ lính f rồi tính:


(f - p„)Vn
VPoơ-Po)


<i>+ Với oe đã cho, xác định za</i> (tra bảng hoặc dùng hàm


NORMSINV)


+ Núc ị z Ị > za<i> thì ta bác bỏ Ao; Nếu I z I < z</i>a thì ta có thể chấp


nhận Hu, T ừ việc chấp n h ì n (hay bác bỏ) Ho ta suy ra k ế t luận cuối
cùnu theo yêu cầu của bài t c i p thực t ế .


</div>
<span class='text_page_counter'>(193)</span><div class='page_container' data-page=193>

<i>&tựưnạ 8: DCiẻiu định già thiết thống kê </i>


Giả thiết M i ề n b á c b ỏ
Ho: p = po



H i : P < Po


V P o O - P o )
H( ): p = Po


H1: p > Po


V P o O - P o )
Ho: p = po


H i : P *P<) W . . { z = < f - ' > - W " : | z l > z . , }
V P o ơ - P o )


<i>Thí dụ -ỉ: Tỷ l ệ p h ế phẩm của một nhà m á y là 5%. Sau khi t i ế n hành </i>


một cải tiến kỹ thuật, người ta k i ể m tra 400 sản phẩm thì thây có 16
p h ế ph ẩ m .


Với mức ý nghĩa a = 0,01. Hãy kết luận xem việc cải tiến kỹ thuật
có làm g i ả m tỷ l ệ p h ế phẩm hay không ?


<i>Giải: Gọi tỷ lệ phế phàm của nhà máy sau khi cải tiên kỹ thuật là p. </i>


Đặt giả thiết Ho: p = 0,05 ; H | I p < 0,05.
Với mức ý nghĩa a = 0,01 thì z2a = Z() ()2 = 2,326.
Tỷ l ệ phố phẩm của mẫu là:


<i>; .</i> 1 ( 1 . , m
Vậy:



400


_ ( 0 . 0 4 - 0 , 0 5 ) V 4 Õ Õ


<i>z = —, = - 0,92 </i>
, / 0 , 0 5 ( 1 - 0 , 0 5 )


</div>
<span class='text_page_counter'>(194)</span><div class='page_container' data-page=194>

<i>(Jìtiơ tễ-ỉiih< ỉĩj.Y/t(tụếf xoe mất ồ thống hè toán </i>


I V - K i ể m đ ị n h g i ả t h i ế t v ề s ự b ằ n g n h a u c ủ a h a i
t r u n g b ì n h


Giả sử hai ĐLNN X và Y độc lập, cùng có phân phối chuẩn với
E(X) và E(Y) đ ề u chưa biết. c ầ n k i ể m định giả thiết:
Ho: E(X) = E(Y) và giả thiết đối Hi: E(X) * E(Y)


với mức ý nghĩa a.
Qui tắc quyết định như sau:


+ Lấy mẫu kích thước ni (đối với X) và n2 (đối với Y) từ đó
tính:


X - y


<i>z = Ị (8.16) </i>
v a r ( X ) v a r ( Y )


V n i n2


n ế u b i ế t var(X) và var(Y)


hoặc:


(8.17]


nếu k h ô n g b i ế t var(X) và var(Y)


+ Các cơng việc cịn lại giống như qui tắc quyết định khi kiểm
định giả thiết v ề tỷ l ệ tổng t h ể .


<i>Thí dụ 5: Trọng lượng sản phẩm do hai nhà máy sán xuất là các đại </i>


lượng ngẫu n h i ê n p h â n p h ố i theo qui luật chuẩn và có c ù n g độ lệch
tiêu chuẩn là ờ = Ì kg.


Với mức ý nghĩa a = 0,05, có thể xem trọng lưựnạ trung bình của sản


</div>
<span class='text_page_counter'>(195)</span><div class='page_container' data-page=195>

<i>Ọhưtíiiạ 8: SKiểiu đình ạiá tíiìết tỉiốtiự kẻ </i>


<i>thử 25 sản phẩm của nhà m á y A ta tính được: X = 50 kg; Cân 20 sản </i>
<i>phẩm của nhà m á y B thì tính được: y=50,6 kg. </i>


<i>Giải: Gói trọng lượng sản phẩm của nhà máy A là X , của nhà máy </i>


B là "ì. Theo giả thiết ta có X , Y là các đ ạ i lượng ngẫu nhiên cung
p h â n phối theo qui luật chuẩn v ớ i Var(X) = Var(Y) = 1.


Đặt giả thiết Ho: E(X) = E(Y) ; Hi: E(X) * E(Y).
Với mức ý nghĩa a = 0,05 thì za = Ì ,96.


( 5 0 - 5 0 , 6 )


T í n h


l - U - L
25 20


= - 2


Ta thấy ỉ z Ị = 2 > za n ê n b á c bỏ H(). Tức trọng lượng trung bình
của sản phẩm sản xuất ở hai nhà m á y là k h á c nhau.


V- Kiểm định giả thiết về sự bằng nhau của hai tỷ lệ


Giả sử Pi, P2 tương ứng là tỷ l ệ các phần tử có tính chất A của
tổng thể thứ nhất, thứ hai ( p i , P2 chưa biết). Ta cần k i ể m định giả
thiết:


Ho: Pi = P2 = Po; và giả t h i ế t đ ố i H i : Pi * P2 vớ i mức ý nghĩa a.
Chọn thống k ê :


z= , 12 = (8.18)


P o O - P o )


<i>(</i> ỉ Ì


+
-vn. n <i>2 J </i>
làm tiêu chuẩn k i ể m định.


</div>
<span class='text_page_counter'>(196)</span><div class='page_container' data-page=196>

<i>tịiáo trinh Ị tị ư/111/i'ỉ Jí'áe Mất DỜ ttiốitq kè lồn </i>



f*2 là tỷ le ph.' ri tử CÓ dấu hiệu A của mẫu nsiảu nhiên kích thước n-)
được x â y dựn» lừ Y (Y là số phần tử có dấu hiệu A khi lấy ngẫu
nhiên một phẩn UI l ừ tổng thể thứ hai).


Với kích thước mẫu lớn và giả thiết Ho đúng ì hì 7 có phân phối
xấp xỉ chua li ì


Nếu chưn hir'' Do thì ta thay Po bằng ước lượng hợp lý tối đa của nó
<i>* lìịỉị +n</i>2f2


Khi đó ta chọn thốnu k ê :
z


ĩ i Ị + n2


f - f


p ( 1 - p )


<i>f</i> Ì p


(8.19)


(8.20)
+


n , n
V Ì <i>2 ) </i>



làm tiêu chuẩn k i ể m định.


<i>Qui tắc quyết dị nít như sau: </i>


+ L ấ y hai mẫu kích thước n i , n2. Tính f|, f2 tương ứng là tỷ-lệ
các phần tử có lính chất A của mẫu có kích thước n i , n?. sai! đó tính:


f - f


z = Ị ' (8.21)
P o ( l - P o ) <sub>- - + -</sub>1 1 ^


nếu b i ế t p<).
iìOãc:


x - y


(8.22)
v! p " ( l - p * )


<i>í </i>


Ì ỉ
— +
vn i n :
nếu khôn g hiõ


</div>
<span class='text_page_counter'>(197)</span><div class='page_container' data-page=197>

<i>@htểờmj s; DCiẻin định (tia thiết thống, kè </i>


C á c bước l i ế p theo tiến h à n h tương tự như qui tắc đã n ê u ở phần IV.



<i>Thí dụ 6: Kiểm tra những sản phẩm được chọn nĩa li nhiên ở hai nhà </i>


m á y cùng sản xuất loại sản phẩm này. Ta có c á c sô l i ệ u sau:
Nhà m á y


A
B


Số sp được k i ể m tra
1000


900


Sô phê phẩm
20


30


V ớ i mức ý nghĩa oe = 0,05, có t h ể coi tỷ l ệ p h ế phẩm của hai nhà
m á y là như nhau hay không ?


<i>Giải: Gọi Pi, P2 tương ứng là tỷ lệ phế phẩm của nhà máy A, B. </i>


Đặt giả thiết: Ho: Pi =P2 ; Hi: Pi *p2.


<i>Với mức ý nghĩa a = 0,05 thì z<),<)5 = Ì ,96. </i>
Từ số liệu đã cho ta tính được:


20



f I = = 0,02 ;
1000


20 + 30


30


f2 = —— = 0,033.
900


ì Ì - * = —


1000 + 900 38 ^ p 38


Vậy:


z = ( 0 , 0 2 - 0 , 0 3 3 )


Ì 37 Ì


38 38 v i 0 0 0 900


= - 1 , 8 1


Ta thấv I z I = 1,81 Z(),05 nên / h ấ p nhận giả thiết Ho, tức có thể coi
"tỷ lộ phí- ••him của h ú nhà máy là như nhau.


VI- Kiểm định giá thiết về phương sai của tổng thể.



</div>
<span class='text_page_counter'>(198)</span><div class='page_container' data-page=198>

<i>(ậẰáơ trình ít/ thuyết xác Mất và ti lị III/ kê tốn </i>


Ho: v a r ( X ) = ƠQ; và giả thiết đ ố i H i : v a r ( X ) * ƠQ
với mức ý nghĩa a.


L ậ p mẫu ngẫu nhiên w x<i> = ( X | , X2, . '. . , X</i>n) . Chọn thốnii k ê :
2 ( n - l ) . s2


<i>Ì = </i> (8.23)


làm tiêu chn:ín kiêm dinh.


N ế u H !.ing thì 7 " r ' . . ! i i phố i theo qui luật "Chi bình phương " với
1; Ì bậc tư ri


<i>V ƠI mức < nghĩa a, m i ề n b á c bỏ giả thiết Ho là: </i>


Wu= {x2 :%2 <xL/2^X2 >X«/J . (8-24)


T.I có thể minh họa m i ề n b á c bỏ w a n h ư sau:


fk(x2)


</div>
<span class='text_page_counter'>(199)</span><div class='page_container' data-page=199>

<i>Qhưởitạ S: Díiểm định giả thiết ti lốn ạ kè </i>


Q u i t ắ c q u y ế t đ ị n h :


+ L ấ y mẫu kích thước n, từ mẫu này tinh i» Ì.
, ( n - 1 ) . s2



v.'<i mức ý nghĩa a, tra bảng (bậc tự do n-1) đ ể lìm các giá


<i>(CĨ Ihc đung hàm CHIINV trong Excel để tìm ỵ2/2</i> và /2, xem
phụ lụi. í')


f N ế u x:<i> Ể ( x L / 2 ; X ầ / 2 )</i> t h ì b á c b ỏ Ho. thừa nhận Hi
+ N ế u X2 e ( x ĩ _a / 2<i>; </i> <i>xin.) </i> thì có th ể chấp nhận Ho
Từ việc bác bỏ (hoặc chấp nhận Ho) ta suy ra kết luận cuối cùng


cho bài toán thực t ế đang xét.


Ta có thể tóm tắt miền bác bỏ giả thiết này ứng với các loại giả
thiết đ ố i k h á c nhau ở bảng sau đây :


• Giả thiết M i ề n b á c bỏ


<i>Ho: var(X) = ơị </i>


H i : var(X) < ƠQ W u = { x - ^ . - X 2 < x L ( n - l ) }
<i>dị </i>


<i>Ho: var(X) = dị </i>


<i>H i : var(X) > dị </i> W a = { r = ^ ỉ : X 2 > x ; ( n - l ) }
<i>Ho: var(X) = aị </i>


Hi: var(X) * ơổ w « = { X2<i> - Ì1</i> < x L / 2 ( n- ! ) ;


</div>
<span class='text_page_counter'>(200)</span><div class='page_container' data-page=200>

<i>íịìáo trình lạ thuyết xóa mất ồ thống kẻ tối! </i>



<i>Thí dụ 8; N ế u m á y m ó c hoạt động bình thường thì trọng lượng sản </i>


phẩm là đ ạ i lượng ngẫu n h i ê n X p h â n phối theo qui luật chuẩn với
Var(X) = 12. Nghi ngờ m á y hoạt động khơng bình thường người la
cân thử 13 sản phẩm và tính được s = 14,6.


V ớ i mức ý nghĩa a = 0,05. H ã y k ế t luận đ i ề u nghi ngờ trên có
đúng hay khơng ?


<i>Giải; Để g i ả i bài toán trên ta cần k i ể m định ei.ì thiết: </i>


H • = 1 2 ; H i V a r ( X ) * 1 2 .
T ừ các số l i ệ u của bài tốn ta tính được:


( Ọ -1)14.6
12


<i>V ớ i oe = 0,05 ; Tra bảng x i v ớ i (n - 1) = 12 bậc tự do ta được: </i>


<i>Xa/2</i> = XÕ.025 =<i> 23,3 và XĨ-a/2</i> = XÕ.975 -4,4
2


<i>Ta thấy 4,4 < X < 23,3 n ê n chấp nhận gi ả t h i ế t Ho, lức là điều </i>
nghi ngừ trên là khôn g đ ú n g , M á y vẫ n làm*việc hình thường


VII- Kiểm định giả thiết về sự bằng nhau của hai
p h ư ơ n g s a i


Cho X i ~ N ( n , ; ơ f ) ; x2 ~ N ( f i2<i> ;ơị) v ớ i ơ ,</i>2v à ơ ; chưa biết. Ta
cần k i ể m ' ! .lia thiết H0 : ơ f = ơ ; .



Để kiểm định giả thiết trên từ hai tổng thể rút ra hai mẫu ngẫu
nhiên độc lập kích thước tương ứng là ni và o>.


</div>

<!--links-->

×