Tải bản đầy đủ (.doc) (590 trang)

thiết kế thực nghiệm trong công nghệ hóa học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (13.83 MB, 590 trang )

Zivorad R. Lazic

ThiÕt kÕ thùc nghiÖm
trong C«ng nghÖ Ho¸ häc


I.GIỚI THIỆU VỀ THỐNG KÊ CHO NGƯỜI THIẾT KẾ THÍ NGHIỆM
Các quá trình và hiện tượng trong tự nhiên xảy ra có điều kiện chịu ảnh hưởng của nhiều
yếu tố.Bằng cách nghiên cứu các yếu tố gây ra cũng như quan hệ trong các hiện
tượng(phenomenon-response), khoa học đã thành công trong việc đi sâu(penetrating into) vào
bản chất(essence) của các hiện tượng và các quá trình.
Khoa học có thể phân sự hiểu biết này làm ba mức. Mức cao nhất là mức mà các yếu tố ảnh
hưởng được xem như một phần của hiện tượng xem xét như các định luật tự nhiên mà chúng
ta có thể tác động và nhận ra hiện tượng từ nó. Các yếu tố ảnh hưởng tới hiện tượng tuân theo
một định luật tự nhiên thì liên hệ với nhau bởi một công thức toán học. Ví dụ một số biểu thức
này là:
E=

mw 2
; F=ma ; S=vt ; Q=FW
2
Mức hai thấp hơn một chút là mức mà tất cả các yếu tố cũng là một phần của hiện tượng

xem xét nhưng chúng ta chỉ biết mối quan hệ qua lại (interrelationship)giữa chúng tức là sự
ảnh hưởng lẫn nhau(influence). Đây là trường hợp phổ biến khi chúng ta xem xét các hiện
tượng mà bị ảnh hưởng bởi nhiều yếu tố khác nhau. Đôi khi chúng ta có thể liên kết các yếu
tố này bằng một hệ các phương trình vi phân tuyến tính (simultaneous differential equation)
nhưng không có lời giải. Ví dụ hệ phương trình vi phân tuyến tính Navier-Stokes’ sử dụng để
xác định dòng chảy của chất lỏng lý tưởng:

ρ




DW X
∂p
1 ∂Q f 
= − + µ ∇ 2W X +

∂X
∂x
3 ∂X 


ρ


DWY
∂p
1 ∂Q f 
= − + µ ∇ 2WY +

∂Y
∂y
3 ∂Y 


ρ


DWZ
∂p

1 ∂Q f 
= − + µ ∇ 2WZ +

∂Z
∂z
3 ∂Z 

Mức cuối cùng là mức mà chúng ta chỉ biết hiện tượng thông qua chỉ một số yếu tố, ví dụ

có một số lớn các yếu tố nhưng không chắc chắn yếu tố nào thì ảnh hưởng. Ở mức này chúng
ta không biết một định luật tự nhiên nào chi phối, ví dụ một biểu thức toán học mà các yếu tố
liên hệ với nhau. Trong trường hợp này chúng ta phải làm thí nghiệm để tìm ra một định luật
tự nhiên có thể.

2


Chúng ta có thể lấy một ví dụ cho mức này là định luật kinh nghiệm Darcy-Weisbah’s về áp
suất nhỏ giọt của chất lỏng khi đi qua một ống [1]:
∆p = λ

L W2
ρ
D
2

Hoặc phương trình Ergun’s về áp suất nhỏ giọt của chất lỏng khi chảy qua một lớp chất rắn
[1]:
2


∆p
1− ε
W2
 1 − ε  µf
= 150 3 
W
+
1
.
75
ρ
f
2
H
dp
ε2
 ε  dp
Hay phương trình xác định sự nóng hay lạnh của chất lỏng chảy bên trong hoặc ngoài ống
mà không thay đổi về thể (phrase) [1]:

α  cµ 
cG  λ 

0.67

 LH 
 D 

0.33


 µST 
 µ 



0.14

 DG 

= 1.86 / 
 µ 

0.67

Như vậy trong ba mức thì mức một khá rõ ràng, nó thể hiện những định luật có tính định
sẵn và thiết thực(deterministic anh functional), trong khi mức hai và ba là những ví dụ về các
hiện tượng ngẫu nhiên được xác định bởi sự phụ thuộc ngẫu nhiên. Sự phụ thuộc ngẫu nhiên
tức là những định luật tự nhiên không nói về các trường hợp riêng lẻ mà nó chỉ ra sự kết nối
chức năng chỉ khi những trường hợp này được xem xét tổng thể.Sự phụ thuộc ngẫu nhiên, do
đó, chứa hai khái niệm :hàm số được tìm thấy trong tất cả các trường hợp như một giá trị
trung bình, và độ lêch nhỏ hơn hoặc lớn hơn của các trường hợp riêng lẻ từ các mối quan hệ
đó.
Mức thấp nhất thường được xem với các hiện tượng mới khi mà các yếu tố và định luật về
sự thay đổi thì đều không biết, như sự trả lời có tính kết quả cho hiện tượng quan sát là giá trị
ngẫu nhiên với chúng ta. Sự ngẫu nhiên này là kết quả của sự thiếu khả năng quan sát tất cả
các mối quan hệ và những ảnh hưởng của tất cả các yếu tố lên sự trả lời hệ thống. Mặc dù sự
phát triển của nó, khoa học vẫn tiếp tục nghiên cứu để tìm ra những sự liên kết, mối quan hệ
và những yếu tố ảnh hưởng mới, cái sẽ làm cho sự ngẫu nhiên tiến gần tới thực tế hơn.
Trên cơ sở những phân tích đã đề cập chúng ta có thể kết luận rằng quá trình ngẫu nhiên là
những hiện tượng mà hoàn toàn ngẫu nhiên, không được xác định chính xác nghĩa là các hiện

tượng có sẵn và ngẫu nhiên thì ở giới hạn bên trái và phải của hiện tượng ngẫu nhiên. Để tìm
ra mối quan hệ ngẫu nhiên sự thực hành thiết kế ngày nay sử dụng ngoại trừ những cái khác,
còn có thực nghiệm và những tính toán thống kê để thu được kết quả.
Thống kê, ngành khoa học miêu tả và giải thích các số liệu, có xuất xứ thô sơ từ sự điều tra
dân số và hệ thống thuế bắt nguồn từ Ai Cập và Babilon cổ đại. Thống kê phát triển hơn đến
những bảng số liệu đơn giản và cho đến khi phát triển thành lý thuyết vào thế kỷ mười tám và
mười chín. Khi khoa học thực nghiệm phát triển, những phương pháp phân tích và thể hiện
3


mới cần được cải tiến. Những người đi tiên phong trong thống kê toán học như Bernoulli,
Poison, và Laplace, đã phát triển thống kê và lý thuyết xác suất vào giữa thế kỉ 19. Có lẽ ứng
dụng đầu tiên của thống kê là sử dụng lý thuyết xác suất trong những trò chơi may rủi. Thậm
chí ngày nay, những nhà lý thuyết về xác suất vẫn chọn một đồng xu hoặc một cỗ bài như
mẫu thí nghiệm của họ. Thống kê áp dụng cho sinh học được phát triển ở Anh vào nữa sau
của thế kỉ 19. Ứng dụng quan trọng đầu tiên của thống kê trong công nghệ hóa học là ở một
công ty của Dublin thuộc Ireland vào thời gian chuyển tiếp giữa hai thế kỉ. Vì sự cần thiết của
việc phải giải quyết một số vấn đề kĩ thuật, nhiều sinh viên toán của trường đại học Oxford và
Cambridge trong đó có cả W.S.Gosset, đã cam kết(engaged) tham gia. Anh được nhận việc
vào năm 1899, Gosset đã áp dụng những hiểu biết của anh về toán học và hóa học để điểu
khiển chất lượng của sản phẩm . Mà sau này phương pháp mẫu nhỏ của ông đã được áp dụng
trong hầu hết các lĩnh vực hoạt động của con người. Ông đã xuất bản thành sách phương pháp
này vào năm 1907 với bút danh ‘Student’, còn được biết đến tận ngày nay. Phương pháp này
cũng được áp dụng nhưng hạn chế trong công nghiệp đến năm 1920. Ứng dụng lớn hơn được
đăng kí trong suốt chiến tranh thế giới thứ 2 trong công nghệ quân sự. Từ đó xác suất và
thống kê được ứng dụng trong tất cả các lĩnh vực của khoa học công trình(engineering).
Cùng với sự phát triển của máy tính điện tử, phương pháp thống kê bắt đầu phát triển mạnh
và đóng vai trò quan trọng trong nghiên cứu đòi hỏi kinh nghiệm và tối ưu hóa hệ thống.
Phương pháp thống kê cho nghiên cứu các hiện tượng có thể được chia làm 2 nhóm cơ
bản. Nhóm đầu tiên bao gồm sự ghi(recording) và quá trình mô tả (processing-description)

của các biến trong hiện tượng được quan sát và nó thuộc về thống kê mô tả (Description
statistics). Kết quả chúng ta áp dụng thống kê mô tả cho ta thông tin số về hiện tượng quan sát
như số liệu thống kê được thể hiện trong bảng và đồ thị. Phương pháp thứ hai đặc trưng bởi
sự phân tích thống kê, lọc các biến quan sát được nhờ sự phân loại và sắp xếp chuỗi thống kê
tương quan. Đây là lĩnh vực của thống kê suy luận tuy nhiên không thể đặt ra ngoài thống kê
mô tả.
Đối tượng của những nghiên cứu thống kê là tập hợp (gồm:vũ trụ, khối thống kê, vũ trụ cơ
bản và sự đầy đủ) và các mẫu được đưa từ tập hợp. Tập hợp phải tiêu biểu cho một quá trình
hóa học liên tục bằng một vài đặc trưng như tính chất của sản phẩm. Nếu chúng ta muốn tìm
một tính chất của sản phẩm, chúng ta phải đưa ra một mẫu từ một tập hợp mà bằng lý thuyết
thống kê toán học nó là sự tụ họp vô hạn của nhiều đơn vị cơ bản
Ví dụ chúng ta có thể đưa ra hàng trăm mẫu từ một quá trình cân bằng và xem xét nó bằng
sự phân tích hóa học hoặc một vài xử lý khác để thiết lập tính chất nào đó( như đưa ra một
mẫu từ một phản ứng hóa học với mục đích thiết lập hiệu suất của phản ứng, hay đưa ra một
mẫu về một chất nổ đẩy tên lửa cùng với ý tưởng thiết lập những tính chất cơ học như cường
4


độ sức căng, độ giãn dài lúc nổ vv…). Sau khi đưa ra một mẫu và thu được những tính chất
của nó chúng ta có thể ứng dụng thống kê mô tả để tìm ra đặc trưng của mẫu. Tuy nhiên nếu
chúng ta muốn tìm ra những kết luận về tập hợp từ mẫu thì ta phải dùng sự suy luận thống kê.
Vậy chúng ta có thể suy ra những gì từ mẫu ?Rõ ràng mẫu phải là sự lựa chọn tiêu biểu từ
các giá trị đưa từ tập hợp hoặc ngược lại chúng ta sẽ không thu được gì. Do đó, chúng ta phải
lựa chon một mẫu ngẫu nhiên.
Một mẫu ngẫu nhiên tập hợp các giá trị được lựa chọn từ một tập các giá trị theo cách mà
mỗi giá trị trong tập có một sự thay đổi lựa chọn cân bằng.
Thường tập hợp cơ sở thì hoàn toàn có tính giả thuyết. Giả sử chúng ta làm năm bước cho
một phản ứng mới trong phản ứng gián đoạn ở điều kiện không đổi và sau đó phân tích sản
phẩm. Mẫu của chúng ta sẽ lấy số liệu từ năm bước nhưng tập hợp thì ở đâu? Chúng ta có thể
mặc nhiên công nhân một tập hợp giả thuyết là tất cả các bước đã làm và trong tương lai sẽ

làm ở cùng điều kiện này. Chúng ta đưa ra mẫu này và kết luận rằng nó là mẫu tiêu biểu của
tập hợp vì vậy tập hợp có thể không xác định.
Nếu sự suy luận của chúng ta về tập hợp là hợp lý, chúng ta phải tạo ra những điều kiện
làm việc đồng nhất với những điều kiện trong mẫu.
Để có một mẫu tiêu biểu cho tập hợp, nó phải chứa những dữ liệu trên toàn bộ giá trị của
các biến được đo. Chúng ta không thể ngoại suy ra kết luận tới toàn bộ biến số. Một giá trị
đơn tính từ một dãy những quan sát gọi là một thống kê.
Mean, median và mode:những tiêu chuẩn đánh giá.
Chúng ta hiểu giá trị trung bình X là giá trị trung bình số học của tính chất của các biến tính
chất X1, X2, X3, …, X3. Khi chúng ta nói tới giá trị trung bình chúng ta hiểu rằng nó là giá trị
trung bình của mẫu, cái được tính bằng cách lấy tổng tất cả các giá trị của biến chia cho số
biến trong mẫu. Giá trị trung bình là giá trị đơn giản nhất và quan trọng nhất trong tất cả các
số liệu để đánh giá.
X =∑

Xi
(1.1)
n

Ở đây X là giá trị trung bình của n biến
Xi là một giá trị trong mẫu.
Kí hiệu X chỉ giá trị trung bình của mẫu. Giá trị trung bình ước lượng của tập hợp được kí
hiệu là: μ. Chúng ta không thể nào xác định chính xác giá trị của μ từ mẫu trừ khi trong
trường hợp đơn giản ở đó chúng ta có thể ước lượng khá chính xác trên cơ sở giá trị trung
bình của mẫu. Một giá trị trung bình khác được sử dụng thường xuyên để đánh giá đó là giá
trị median. Giá trị này được định nghĩa như sự quan sát mẫu mà ở đó số quan sát trên và dưới

5



nó bằng nhau. Median được định nghĩa như sự quan sát trung tâm của mẫu nơi các giá trị thì
sắp xếp theo cỡ.
Giá trị thứ ba là mode, được định nghĩa là giá trị mà có số lần quan sát nhiều nhất. Mode là
giá trị có thể nhất trong các giá trị ngẫu nhiên riêng lẻ, khi với các biến ngẫu nhiên, nó là biến
ngẫu nhiên mà hàm mật độ xác suất đạt giá trị lớn nhất. Nói trong thực hành, nó là giá trị
được đo, ví dụ tính chất mà được lặp lại nhiều nhất trong mẫu. Giá trị trung bình được sử
dụng nhiều nhất trong phân tính thống kê thực hành. Giá trị median thì thỉnh thoảng thích hợp
hơn giá trị trung bình trong việc đánh giá. Giá trị mode thì hiếm khi được sử dụng. Sự phân
bố đối xứng như là phân bố Normal, giá trị đề cập thì xác định
Ví dụ 1.1 [2] về sự khác nhau của ba giá trị trên, chúng ta xem xét mức tiền lương trong
một công ty nhỏ. Lương hàng năm như sau:
Giám đốc :

50000

Người bán hàng nam:

15000

Kế toán :

8000

Quản đốc :

7000

Hai nhân viên kĩ thuật mỗi người được : 6000
Bốn công nhân mỗi người được :


4000

Nếu lấy tiền lương đặt trong một dãy chúng ta thu được :
4000 ; 4000 ; 4000 ; 4000 ; 6000 ; 6000 ; 7000 ; 8000 ; 15000 ; 50000
Mode

median

Trong suốt quá trình trả tiền lương, giám đốc khẳng định rằng lương trung bình chia cho 10
người làm công là 9000$/năm, và không cần một sự tăng.
Người đại diện của liên hiệp công ty khẳng định rằng cần thiết phải tăng lương vì hơn nửa số
người lao động đang có mức lương là 6000$ hoặc ít hơn và nhiều người đang làm với mức
4000$. Rõ ràng, giám đốc công ty đã sử dụng giá trị trung bình và liên hiệp công ty đã sử
dụng median và mode.
Phép đo sự thay đổi, phạm vi, độ trêch trung bình và phương sai (variance)
Như chúng ta thấy, giá trị trung bình, số trung bình, median, và mode là những phép đo xác
định vị trí (measure of Location). Khi xác định được vị trí của số liệu, chúng ta có thể đặt ra
câu hỏi số liệu trải ra ngoài khoảng giá trị trung bình như thế nào. Sự đo đơn giản nhất của
những biến đổi là phạm vi (range) và interval(khoảng, đoạn). Phạm vi thì được xác định như
là sự khác nhau giữa giá trị lớn nhất và nhỏ nhất trong mẫu.
(Interval-range) = Xmax- Xmin (1.2)
Phép đo này có thể được tính toán dễ dàng nhưng nó chỉ cho ta sự đo xấp xỉ những thay đổi
của dữ liệu, khi nó bị ảnh hưởng chỉ giới hạn các giá trị tính chất quan sát mà có thể khác so
6


với những giá trị khác. Để có phép đo chính xác hơn của những thay đổi chúng ta phải bao
gồm tất cả giá trị tính chất trả lời (property-response), ví dụ từ những sự trệch khỏi trung bình
mẫu, phần lớn là số trung bình. Như giá trị trung bình của các biến của sự trệch khỏi giá trị
trung bình mẫu thì bằng không, chúng ta có thể đưa ra phép đo của những biến đổi sự trệch

giá trị trung bình. Sự trệch giá trị trung bình được định nghĩa như là giá trị trung bình của các
giá trị tuyệt đối của sự trệch khỏi giá trị trung bình mẫu :
m=

1
N

N

∑X

i

−X

(1.3)

i =1

Phương pháp phổ biến nhất được dùng để đánh giá những biến đổi là phương sai mẫu
(sample variance), được định nghĩa là :

∑(X
n

S

2
X


=

i

−X

i =1

)

2

(1.4)

n −1

Giới thiệu về thống kê kỹ thuật
Công thức tính toán hũư ích thường được sử dụng là:
2
X

S =

n∑ X 2i − ( ∑ X i )

2

(1.5)

n( n − 1)


Biến mẫu thực chất là tổng bình phương của độ lệch điểm trung bình chia cho (n-1). Khoảng
giá trị rộng của biến chỉ ra rằng số liệu đã trải rộng khỏi giá trị trung bình. nguợc lại, nếu toàn
bộ giá trị gần như nhau thì độ lệch sẽ rất nhỏ. Giá trị độ lệch chuẩn Sx được định nghĩa là
bình phương của biến. Độ lệch chuẩn được biểu diễn bởi các đơn vị là biến giá trị ngẫu
nhiên. Cả độ lệch chuẩn và giá trị trung bình đều được biểu diễn bằng cùng một đơn vị nên có
thể so sánh sự biến thiên của các phân bố khác nhau bằng việc đưa ra mối liên hệ , được gọi là
hằng số biến:
Kv =

Sx Sx
= 100%
X
X

( 1.6)

Khoảng giá trị rộng của hằng số biến cho thấy số kiệu bị phân tán rộng quanh giá trị trung
bình và ngược lại, nếu các điểm thực nghiệm gần như nhau thì hằng số biến sẽ rất nhỏ.
Ví dụ 1.2 [2].Lấy 10 giá trị khác nhau của 5 quan sát ngẫu nhiên trên X và tính toán giá trị
trung bình và độ lệch của mỗi nhóm.
Mẫu
1
2

Giá trị
1;0.4;8;0
2;2;3;6;8

Trung bình

2.6
4.2
7

Độ lệch
11.8
7.2


3
4
5
6
7
8
9
10
Trung bình

2;4;1;3;0
4;2;1;6;7
3;7;5;7;0
7;7;9;2;1
9;9;5;6;2
9;6;0;3;1
8;9;5;7;9
8;5;4;7;5

2.0
4.0

4.4
5.2
6.2
3.8
7.6
5.8
4.58

2.5
6.5
8.8
12.2
8.7
13.7
2.8
2.7
7.69

Chúng ta có 10 giá trị khác nhau của độ lệch,có thể thấy rằng những giá trị nãy có giá trị trung
bình gần bằng với độ phân bố biến σx2 . nói cách khác, giá trị trung bình của các trung bình
mẫu sẽ gần bằng với độ phân tán trung bình µ. Thực chất, 10 nhóm giá trị trên không cho
chúng ta giá trị chính xác của σx2 và µ. Để thu được các giá trị này, ta cần số nhóm tham gia
là vô hạn. vì vậy các mẫu phải có sự phân bố vô hạn , điều này trong thống kê được gọi là quy
luật Glivenko[3].
Hãy xem xét ví dụ trên để minh thấy được sự khác nhau giữa mẫu ước lựơng và thông số
phân bố.giá trị trung bình của mẫu và độ lệch chuẩn được tính toán từ công thức và tạo bảng.
Thông thường, ta không thể tính toán hơn các gia trị ước lượng của thông số phân bố µ.và σx2
một cách tương ứng. tuy nhiên, trong trường hợp này, số được chọn từbảng các giá trị ngẫu
nhiênxắp xếp từ 1-9 bảng A. trong các bảng giá trị ngẫu nhiên, dù kích thức không xác định,
tỷ lệ của mỗi số bằng 1/10 và tỷ lệ này cho phép tính được giá trị thông số phân bố chính xác:

µ =

σx

2

0 +1+ 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9
= 4.50
10

2
2
2
(
0 − 4.5) + (1 − 4.5) + ... + ( 9 − 4.5)
=

10

= 8.25

Có thể thấy rằng giá trị trung bình của mẫu phân tán xung quanh trung bình phân bố. giá trị
trung bình của 10 nhóm là 4.58 rất gần với giá trị phân bố. hai giá trị này có thể được nhận
dạng nếu lượng mẫu là ô hạn.
Tương tự, sự biến thiên của mẫu phân tán quanh phân bố biến và giá trị trung bình 7.69 gần
với phân bố biến.

1.1 Sự rời rạc đơn giản và phân bố liên tục.
8



Chúng ta thường xây dựng các mô hình toán học nhằm mô tả các hệ kỹ thuật thực tế.
Các hệ này thừong dựa trên kinh nghiệm, trực giác, hay qua các giả thiết về tính chất vật lý
của đối tựợng.
Trong nhiều trừơng hợp, viẹc xây dựng mô hình lý tưởng là hết sức khó khăn vì các tính chất
vật lý của hệ quá phức tạp. Ngay cả đối với định luật khí cung phải dựa trên giả thiết khí là
khí hiếm và nhiều điều kiện lý tưởng khác mà trong thực tế hầu như khó có thể đạt được.
Tuy nhiên, khi gặp các vấn đề quá khó khăn, người ta thường sủ dụng mô hình thống kê có
thể lớn hơn hay nhỏ hơn hệ thực tế nhưng luôn cho kết quả chính xác và mô tả tôt đặc tính
của hệ.
Trong chương này, chúng ta làm quen với định luật xác xuất – một định luật cung cấp những
mô hình đơn giản nhưng rất hữu ích trong việc mô tả các mẫu trong phân bố ( tức là mô hình
xác xuất đơn giản tỏ ra hữu ích trong việc mô tả sự phân bố định trước nằm trong những mẫu
ngẫu nhiên bất kỳ).
Trong số các khái niệm quan trọng nhất cuả thuyết xác xuất có khái niệm về biến ngẫu nhiên.
Ta biết rằng mỗi biến ngẫu nhiên đều có thể được đặc trưng bằng nhiều số- các giá trị thay
đổi, mà các giá trị này đều có thể xảy ra được gọi là biến ngẫu nhiên. biến ngẫu nhiên thường
được định nghĩa là một hàm mà với mỗi sự kiện thành phần được định mức bởi một số. do
các tình huống ngẫu nhiên nên các biến ngẫu nhiên có thể có các giá trị số khác nhau và
không thể tiên đóan được giá trị mà biến ngẫu nhiên đó có thể mang vì nó khác với giá trị
thực nghiệm nhưng ta lại hoàn toàn có thể đoán trước được toàn bộ giá trị mà nó có thể
mang. Để đặc trưng một biến ngẫu nhiên một cách hoàn toàn, ta không chỉ biết đến giá trị có
thể của biến mà còn phải quan tâm đến tần số xuất hiện của mỗi giá trị . Số các giá trị khác
nhau mà biến ngẫu nhiên có thể mang trong thực nghiệm là giới hạn. Khi các biến ngẫu nhiên
lấy những giá trị xác định hữu hạn tương ứng với xác xuất của nó thì được gọi là biến ngẫu
nhiên rời rạc. ta nhận thấy rằng, các biến cố luôn xảy ra trong cuộc sống hàng ngày ví dụ như
khi tung đồng xu thì việc xấp ngửa của đồng xu đóng vai trò của một biến cố. Các biến ngẫu
nhiên là liên tục nếu với xác suất tương ứng, chúng có thể nhận các giá trị trong một khỏang
xác định. Ví dụ về biến ngẫu nhiên liên tục là thời gian chờ xe buýt, thời gian giữa các lần
phát xạ của sự phân rã chất phõng xạ.

Mô hình xác xuất đơn giản.
Thuyết xác xuất có nguồn gốc từ nhu cầu muốn tiên đoán khả năng có thể xảy ra của trò chơi
xác suất. Bắt đầu với một đồng xu, ta nhận thấy xác suất đồng xu sau khi tung có mặt xấp
hay ngửa là như nhau, vậy là mỗi biến cố đều có xác suất là 0.5 và tổng các khả năng xác suất
của các biến cố thông thường là 1.0.

9


Khi tung hai đồng xu, chúng ta chú ý rằng việc mỗi đồng xu xấp hay ngửa không phụ thuộc
vào đồng xu thứ hai (độc lập). xác xuất của mỗi đồng xu vẫn là 0.5 nhưng khả năng để cả hai
đồng xu cùng có mặt ngửa là hệ quả của hai biến cố đơn lẻ do các biến đơn lẻ là độc lập với
nhau.
P(đều ngửa) = 0.5*0.5=0.25
Tương tự, nếu có 100 đồng xu cùng tung lên và xác suất để có cùng mặt ngửa một lúc là:
P(100 ngửa ) =0.5100
Ví dụ về đồng xu là một ví dụ điển hình của phân bố Bernulli.
Sư phân bố xác xuất giới hạn giá trị các biến đến chính xác hai giá trị rời rạc,một là xác xuất
p, hai là xác suất (1-p). với đồng xu, hai giá trị xấp là p và ngửa là1-p với p=0.5 được gọi là
đồng xu công bằng.
Phân bố Bernulli áp dụng vứoi những trường hợp có hai khả năng cùng xảy đến cho một thực
nghiệm đơn lẻ và khi các sản phẩm tạo thành được chấp nhận hay có thiếu sót (bị loại), khi
nguồn nhiệt là tắt hay bật, khi một dự đoán là có hay không. Phân bố Bernulli thường biẻu
diễn bởi số 0( không thể ) hoặc1(có thể ) đại diện cho hai khả năng có thể xảy ra của biến cố.
Giá trị trung bình và biến.
Khi tung đồng xu, sự xấp ngửa của đông xu là biến cố ta nói rằng biến cố là do sự phân tán cơ
sở trong đó xác xuất để có mặt ngửa là 0.5. Tuy nhiên, khi chung ta tung 100 đông xu cùng
lúc thì có thể co 46 xấp và 54 ngửa. Ta không thể xác minh chính xác trực giác dù cho lượng
mâu lớn nhưng chúng ta có thể có giá trị gần đúng.
Các kết quả thực nghiệm liên quan tới trung bình phân bố vàbiến như thế nao? một định nghĩa

hữu ích khác là giá trị mong muốn( expected value). giá trị mong muốn là tổng của các giá trị
có thể của các kết quả thực nghiệm, với mỗi gía trị là xác suất của kết qủa thu được. giá trị
mong muốn là giá trị trung bình có lợi( weighed average).
Trung bình của xác suất dựa trên cơ sở của biến ngẫu nhiên X đựoc định nghĩa là giá trị mong
muốn của X:
µ = E(X) = ΣXipi

(1.7)

Trong đó,
µ: trung bình xác suất
E(X): giá trị mong muốn của X
Bằng việc lấy gần đúng, có thể xác định giá trị mong muốn của hàm biến X- là mục tiêu của
thuyết xác suất.
Ví dụ, giá trị mong muốn của biến X đơn giản làtổng biùnh phương ủacác giá trị, mỗi giá trị
chính là xác suất thu được của giá trị.

10


Phân bố biến của các biên ngẫu nhiẽn được định nghĩa làgiá trị mong muốn của bình phương
độ lệch của X và giá trị trung bình
σ2=E(X-µ)2

(1.8)

σ2=E(X2-2Xµ+µ2) = E(X2)-2µE(X)+µ2

(1.9)


Vì E(X)=µ
Nên ta có:
σ2=E(X2)-µ2

(1.10)

Ap dụng phân bố Bernulii
E(X)=ΣXipi =(p)(1)+(1-p)(0)=p

(1.11)

E(x2)= ΣX2ipi = (p)(12)+(1-p)(02)=p

(1.12)

Vì vậy, với đồng xu
µ = p, σ2= p-p2
P=0.5;µ =0.5; σ2=0.25
1.1.1 Phân bố rời rạc
Hàm phân bố rời rạc là hàm xác suất của nhiều kết quả riêng biệt, qua quy luật này,
tổng xác suất bằng 1 là sự phân bố các giá trịbiến ngẫu nhiên. Biến ngẫu nhiên được định
nghĩa đầy đủ khi phgân bố xác suất được tìm thấy. Phân bố xác xuất của một biến rời rạc là
khả năng thu được của một giá trị biến rời rạc – gián đoạn.Phân bố Bernulii cho thấy khả
năngcủa hai biến cố( sấp- ngửa, có- không.0 hoặc1) vì nó là phân bố rời rạc.
Ví dụ khác về sự các biến ngẫu nhiên là ván bài, môi quânbài tương ứng với xác suất 1/52 .
trong phép phân bố rời rạc định nghĩa về giá trị mong muốn là:
E(X)= Xipi

(1.13)


Trong đó,
Xi : giá trị của thực nghiệm
P : xác suất mà giá tị thực nghiệm có thể xảy ra.
Trung bình xác suất và biến ở đây có thể liên quan đến trung bình mẫu và biến qua công thức
sau đây.µ
E(X) = E(Σ Xi/n)=µE( Xi/n)=Σµ/n=nµ/n=µ

(1.14)

E(X) = µ

(1.15)

Phương trình 1.15 cho thấy giá trị mong muốn( hay trung bình) của mẫu bằng với giá trị trung
bình xác suất.
Giá trị mong mmuốn của biến mẫu là biến phân bố( population variance):

11


∑( X i − X )2 

E(S )= E 
n −1


2

(1.16)



Σ(Xi- X )2 =ΣXi2-2Σ X Xi +Σ X 2= ΣXi2-n X

2

(1.17)

Tìm ra:
E

E(S2)=

(∑

)

( ) = ∑ EX

X i2 − nE X 2
n −1

2
i

( )

− nE X 2

(1.18)


n −1

2

E( X i )= σ2 +µ2
(1.19)
E( X )2 =

σ2
+ µ2
n

nên

[

]

n σ 2 + µ 2 − σ 2 − nµ 2
n −1

E(S2)=

(1.20)

Công thức thường dùng là:
Cuối cùng :E(S2)= )σ2

(1.21)


Sự định nghĩa về biến mẫu với (n-1) dẫn đến sự không rõ ràng trong xác định phân bố biến
như đã chỉ ra ở trên. Đôi khi, biến mẫu có thể được xác định :
2
S

∑(X
=

i

− X)

2

n

(1.22)

Khi đó

( )

2
E S =

n −1 2
σ
n

(1.23)


Một phân bố khác cũng được sử dụng khá thường xuyên và hiệu quả là phân bố nhị thức.
Phân bố nhị thức bắt nguồn từ phân bố Bernuulii. Khi chúng ta thực hiện mọtt số hưũ hạn lần
các phép thử Bernuuli, mỗi lần thử chi có hai khả năng xảy ra, và mỗi khả năng của mõi lần
thử là độc lập với những lần thử khác. hân bố nhi thức sử dụng hằng số xác suất kđặc trưng
cho khả nẵnguất hiện của biến cố trong n lần thử.
P(X=k)=( nk)pk(1-p)n-k

(1.24)

kí hiệu :

( )=
n
k

n!/k!(n-k)!

(1.25)
12


Ví dụ 1.3
Tính trung bình ,cứ 10% lô hàng sản xuất có lỗi, vậy xác xuất để bắt gặp hai lô hàng bị lỗi
trong tòn bộ 10 mẫu kiểm tra, cỏiằng việc laays mẫu là hoàn toàn ngẫu nhiên.
Vì: n=10, k=2,p=0.1
2
8
Nên P(X)= ( 10
2 )*(0.1) *(0.9) =0.1938


Như vây khả năng là 19% lấy đúng hai sản phẩm bị lôi từ 10 sản phẩm bất kỳ. Nói cách
khác, khả năng là1 trong 10 tỷ là toàn bộ sản phẩm đó đều bị lỗi.
Giá trị p(X=k) cho các giá trị khác có thể được tính toán và biểu diễn trên đồ thị phân bố xác
xuất , hình 1.1

Hình 1.1. Phân bố nhị thức p = 0,1 và n = 10
bảng 1. Phân phối rời rạc
Phân phối

Giá trị Phương sai

Model

Ví dụ

kỳ
vọng
p

Bernoulli

P(1-p)

Mỗi phép thử có 2 2 mặt xấp ngửa

xi = 1 với p; xi = 0 với 1
–p
Binomial


kết quả. N phép thử của đồng tiền
có k kết quả như những
np

Np(1 - p)

n× M
N

n × M ( N − M ) ( N − n)
N 2 ( N − 1)

nhau

quyết

điểm của mẫu

 
P( x = k ) =   p k (1 − k ) n −k
k
n

Hypergecometric
 M  N − M   N 
Px =k =  
 / 
 k  n − k   n 

M đối tượng của Cũng là những

một loại, N đối quyết điểm của
tượng của loại khác. mẫu

đưa

ra

Mô tả n đối tượng không thay thế
13


tìm thấy k đối tược từ một giới hạn.
của loại M. n đối
tượng mô tả từ….
(population) không
thay thế sau mỗi mô
1− p
p

Geometric

(

P( x = k ) = p 1 − p

)

k

P


Poisson

tả.
những thất bại trước số lần xấp trước

1− p
p2

những thành công khi xuất hiện số
trong sự thử liên lần ngửa đầu

λt

tiếp cuả Bermulli
tiên.
những sự việc xảy Phân huỷ chất

λt

P( X = k ) = e γt (γt ) k / k!

ra cùng lúc xác suất phóng xạ, đập
xảy ra k lần trong vỡ thiết bị.
khoảng thời gian t.
λ là tham số

Một thiếu sót trong mẫu là đã đưa ra khả năng xảy ra nhất nhưng tỷ lệ mẫu đưa ra giảm
4/10 lần, dù vậy cũng giống tỷ lệ (population proportion). Trong ví dụ trước chúng ta kỳ vọng
sai số mắc phải là 1/10. Theo trực giác chúng ta lấy tỷ lệ p = 0,1 đó là giá trị kỳ vọng trong

mẫu ngẫu nhiên. Điều chứng minh này là đúng có thể chỉ ra đối với phân phối nhị thức:
µ = np; σ2 = np (1- p)

(1.26)

Đối với ví dụ trước:
µ = 10 × 0.1 = 1; σ2 = 10 × 0.1 × 0.9 = 0.9
Ví dụ 1.4 [4]
Xác suất nén thích hợp bằng 0.1. Giá trị kỳ vọng và phương sai là gì nếu có 200 mẫu
thử?
Mô tả hàm phân phối nhị thức, chúng ta có:
µ = n × p = 200 × 0.1 = 20; σ2 = np × (1- p) = 200 × 0.1 × 0.9 = 18
một số phân phối rời rạc khác đã được liệt kê trong bảng 1.1 theo đó mỗi mô hình đã
được cho là cơ sở trừ khi đề cập đến biến số ngẫu nhiên hypergeometrical là cũng được sử
dụng. Phân phối hypergeometrical là bằng với phân phối nhị thức trong trường hợp mẫu
không có giới hạn. Khi có giới hạn phân phối nhị thức được cho là thay thế những phân phối
khác như mô tả ở trên. Tuy nhiên, phân phối nhị thức là không thay thế.

14


1.12. PHÂN PHỐI LIÊN TỤC
Một hàm phân phối liên tục được cho là xác suất đối với một khoảng liên tục của biến
ngẫu nhiên. Nghĩa là xác suất nhận giá trị bằng không tại giá trị nào đó trong khoảng. Phân
phối liên tục tương phản với phân phối rời rạc. Phân phối rời rạc cho là chỉ một giá trị đối với
biến ngẫu nhiên. Do đó, biến ngẫu nhiên liên tục không thể đặc trưng cho những giá trị mà nó
được hiểu như xác suất tương đương. Bởi vậy trong trường hợp biến ngẫu nhiên liên tục
chúng ta thấy xác suất p (x < X < ∆x) mà nó lấy giá trị từ khoảng (x; x + ∆x). Với ∆x là rất
nhỏ. Sự thiếu xác suất này là phụ thuộc vào ∆x, xác suất tiến tới không khi ∆x tiến tới 0. Theo
sắp xếp vượt qua sự thiếu sót này hãy quan sát hàm:

f ( x) = lim
∆ →0

P ( x ≤ X ≤ x + ∆x )
dP ( x)
; f (x =
)
∆x
dx

(1.27)

Không dựa vào ∆x và gọi là hàm xác suất thống kê với biến có số ngẫu nhiên liên tục X.
Xác suất của biến số ngẫu nhiên nằm giữa 2 giá trị đặc biệt trong hàm phân phối nhị thức:
b

P (a ≤ X ≤ b) = ∫ f ( x )dx

(1.28)

a

Với f(x) là hàm mật độ xác suất của mẫu mô tả trên khi giá trị X đạt được từ âm vô cùng
đến dương vô cùng [- ∞; + ∞]. Xác suất tìm thấy x là một. Do đó, từ nay trở đi, phân phối nhị
thức có dạng:
+x

∫ f ( X )dx = 1

(1.29)


−x

Giá trị kỳ vọng của phân phối nhị thức hợp thành một thể thống nhất. Trong bảng tóm
tắt đã mô tả các phân phối rời rạc. Giá trị kỳ vọng của biến ngẫu nhiên X được định nghĩa
như:
E( X ) =

+∞

∫ xf ( x)dx

(1.30)

−∞

F(x)dx tương tự như định nghĩa p(x) rời rạc từ trước do đó phương trình 1.30 cũng
giống phương trình 1.13. Phương trình 1.30 cũng là định nghĩa giá trị kỳ vọng của phân phối
liên tục, khi µ= E(x). Phương sai được định nghĩa:
2

+∞

σ = ∫ ( x −′ µ ) f ( x)dx
2

(1.31)

−∞


Hoặc được biểu diễn bằng:
 +∞

σ = ∫ x f ( x )dx −  ∫ xf ( x)dx 
−∞
−∞

+∞

2

2

2

(1.32)
15


Phân phối liên tục đơn giản nhất là phân phối đồng dạng mà cho là hàm thống kê không
đổi với vùng giá trị từ a – b. Và cho là xác suất bằng 0 với tất cả giá trị của biến số ngẫu nhiên
[a,b] (hình 2).
Hàm xác suất thống kê đại diện cho phân phối đồng dạng là đạt được kết quả bằng cách
hợp thành một thể thống nhất tất cả các giá trị của x, với f(x) không đổi khi x ∈ [a,b], f(x) = 0
khi x ngoài [a,b].
+∞

b

−∞


a

∫ f ( x)dx = ∫ f ( x)dx = 1

(1.33)

Sau việc hợp thành mối liên quan này chúng ta có:
1

f ( x) =

=

b

∫ dx

1
; f ( x) = const
b−a

(1.34)

a

f(x)

F(x) =


1
b−a

0
0

a

b

x

Hình 1.2. Phân phối đồng dạng
Tiếp theo là:
b

xdx 1
= ( a + b)
b

a
2
a

µ = E( X ) = ∫

(1.35)

Chúng ta có:
x 2 dx  1

(b − a)

σ ∫
−  ( a + b)  =
b − a 2
12

a
2

b

2

2

(1.36)

Ví dụ 1.5.
Ví dụ về phân phối đồng dạng: hãy coi như chúng ta tình cờ bắt một chuyến xe buýt
thành phố nhưng chúng ta biết rằng xe buýt qua bến đỗ 15 phút một chuyến. Trung bình
chúng ta phải đợi xe bao lâu? Sẽ như thế nào nếu như chúng ta phải đợi sớm nhất 10 phút?
16


Giá trị ngẫu nhiên trong ví dụ này là thời gian T cho đến khi xe buýt kế tiếp đến. giả
thiết rằng chúng ta không biết được kế hoạch của xe buýt. T là phân phối đồng dạng từ 0 – 15
phút. Ở đây, chúng ta nói rằng xác suất của tất cả những lần xe buýt đỗ tiếp theo là như nhau.
Do đó:
f (t ) =


1
1
=
15 − 0 15

Trung bình đợi là:
15

E (T ) =

∫ tdt
0

15

= 7.5

Lùi lại sớm nhất 10 phút ngụ ý rằng T nằm giữa khoảng 0 và 15, do vậy phương trình
1.28:
15

P (10 ≤ T ≤ 15) =

dt

1

∫ 15 = 3


10

Chỉ có 1/3 trường hợp là cần đợi 10 phút hoặc lâu hơn. Xác suất mà chúng ta phải đợi
chính xác 10 là 0. Khi đó xác suất = 0 mô tả giá trị đặc biệt trong phân phối liên tục. Đặc
trưng của một vài phân phối liên tục được đưa ra ở bảng 1.2.
Bảng 1.2. Phân phối liên tục.
Phân phối và mật độ

Giá trị kỳ Phương

Model

Đồng dạng

vọng
1
( a + b)
2

sai
(b − a ) 2
12

f(x )kh«ng ®æi §ang chê xe

1
γ

1
γ2


f ( x) = 1 /(b − a )a < x < b
Negative exponential
f ( x ) λe − λ x ; x > 0

Ví dụ

Ph©n phèi rêi buýt
r¹c lµ sù thµnh Thêi gian bøt
c«ng cña ph©n ra
phèi Poisson

cña

trong

h¹t
qu¸

tr×nh ph©n hñy
Ph©n

Chuẩn hóa
 1 x − µ 2
f ( x) =
exp − (
) 
σ 2π
 2 σ


1

chuÈn Gauss

µ

thÝ

nghiÖm
Mét trêng hîp

 γ
exp −

 2
1

Mét vµi t×nh
huèng

σ2

Hµm ®îc chuẩn hóa
f ( y) =

phèi chÊt phãng x¹

2






®Æc biÖt cña Mét vµi t×nh
hµm

0
17

ph©n huèng

thÝ


1

nghiệm

Phân phối của

Khi bỡnh phng

tổng bình ph-

k
( 1)
2

x
x

exp
2;x > 0
f ( x) =
k
k

1!2 2
2

phối chuẩn

ơng

những Kiểm

tra

biến số đợc thống kê dựa

k
2k

chuẩn hóa. k trên hàm phân
là chỉ mức độ phối chuẩn
độc lập

1.13. PHN PHI CHUN
Phõn phi chun c c bi nh toỏn hc c Gauss.
Phõn phi ny ó c ng dng khi phõn tớch mó hoỏ thớ nghim v khi c lng
ngu nhiờn cỏc sai s. Nú c gi l phõn phi Gauss. S dng rng nht ca phõn phi liờn

tc l phõn phi chun. Vỡ nhng lý do sau:
+ Nhiu bin c ngu nhiờn c xut hin qua thớ nghim cú phõn phi chun.
+ Nhiu bin c ngu nhiờn tuõn theo quy lut gn chun.
+ Nu mt bin s ngu nhiờn khụng th lm mt phõn phi chun, khụng lm gn
chun, nú cú th bin thnh mt bin ngu nhiờn chun bng bin i toỏn hc n gin.
+ Chc chn phõn phi Complex cú th xp x bng phõn phi chun (phõn phi nh
thc).
+ Chc chn nhng bin s ngu nhiờn m cú nhng thay i c xỏc minh thng
kờ cú phõn phi chun.
Gauss ó gi nh rng tt c nhng sai s trong mu tp quan sỏt l do nhng tng tỏc
c lp ca quy lut s ln. Mi tng tỏc y ch to ra mt yu t nhiu nh. Nu theo gi
thit ú ng cong cú hỡnh chuụng chun c s dng. Mc dự mụ hỡnh chuụng chun ó
mụ t y nhng tỡnh hung thc gm cỏc mu tp quan sỏt c. Khụng cú lý do gỡ
coi rng nhng mu tp quan sỏt cn thit ú thớch ng vi mụ hỡnh Gauss. Cho vớ d,
Maxwell s dng mt mụ t mụ hỡnh phỏt sinh 1 hm phõn phi cho tc phõn phi ht ca
khớ. Nhng kt qu ch l giỏ tr xp x ca chuyn ng (Behavior) ca khớ thc. Li trong o
lng mu do kt qu tng hp ca quy lut s ln ca yu t nhiu c lp nh l gi s
chớnh gm mụ hỡnh m cỏc mụ hỡnh ú hm phõn phi chun c ng dng. Gi s chớnh
ny dn n dng mu tp ca phõn phi chun.
Gi thit ca mt phõn phi chun l thng xuyờn v thng khụng phõn bit ó c
lm trong vic thớ nghim. Bi vỡ nú l mt phõn phi gn chun. Trong ú, mt vi th tc

18


thống kê đã được ứng dụng, một vài tình huống mẫu tập như lỗi ngẫu nhiên, yield data có thể
mô tả đầy đủ phân phối chuẩn, nhưng nó không phải luôn luôn đúng.
Thuật ngữ µ và σ2 là định nghĩa đơn giản như tham số trong hàm phân phối chuẩn.
Thuật ngữ µ quyết định giá trị mà hình chuông úp là trung tâm và σ2 quyết định sự trải
rộng của đường cong hình 1.3.

Một phương sai lớn cho một đường cong rõ và phẳng, trong khi một phương sai nhỏ cho
một vùng cong cao và hẹp với xác suất tập trung giá trị gần µ.
Giá trị trung bình hay giá trị kỳ vọng của hàm chuẩn thu được bằng áp dụng phương
trình 1.28.

E( X ) =

 1  X − µ 2 
X
exp
 dx
− 

2
σ
σ 2π −∞

 



1

+∞

(1.37)

Phép tính tích phân trong công thức (1.37) là quá dài dòng và hầu như dễ dàng hoàn thành
bằng cách dung bảng tích phân xác định .Để mở rộng ,chúng ta định nghĩa thêm một biến
mới


Y=

x−µ
⇒ x = σy + µ ; dx = σdy
σ

(1.38)

Với µ , σ là những hằng số .phương trình (1.37) trở thành :
E( X ) =

+∞
 +∞ 2
 y2 
 y2  


σ
exp

dy
+
µσ
exp
∫
∫−∞  − 2 dy 
 2 
σ 2π − ∞





1

(1.39)

Tích phân thứ nhất là hàm chẵn và có cận đối xứng do vậy bằng 0. Với tích phân thứ 2 , từ
bảng tích phân , chúng ta xác định được kết quả là:
+∞

 y2 
exp
∫  − 2 dy = 2π ⇒ E ( X ) = µ
−∞

(1.40)

19


Qua phân tích tính ta thấy rằng : giá trị biến thiên của X tỉ lệ với σ (x )^ 2 .Để thu được dạng
phân phối chuẩn , ta định nghĩa một biến chuẩn z:

z=

x−µ
⇒ x = σz + µ ; dx = σdz
σ


(1.41)

Khi đó hàm phân bố mật độ xác suất có dạng :

f ( z) =

1


e



z2
2

(1.42)

Trong công thức này , µ ( z ) = 0, σ ( z )^ 2 = 1 .Đồ thị của dạng phân phối chuẩn được minh họa
như hình vẽ 1.4, và bảng tóm tắt ở hình 1.3.
Gần 68% của miền phân bố dưới đường cong từ z=-1 đến z=1.Theo phương pháp thống kê ,
từ phương trình (1.28), ta có:
P (−1 ≤ z ≤ 1) =

+1



f ( z )dz =


−1

1


+1

 z2 
exp
∫−1  − 2 dz

(1.43)

Từ bảng 1.3 ta tính được :
P (−1 ≤ z ≤ 1) = P (≤ 1) − P ( z ≤ −1) = 0.8413 − 0.1587 = 0.6816
f(z)

0.3
0.3413 0.3413
0.2

0.1

0.0214

0.0214
0.1360

0


-3

-2

-1

Hình 1.4 Đường cong mức phân bố chuẩn

P(Z
z

20

0.1360
0

1

2

3


z

P( Z ≤ z ) =




−∞

 y2 
1
exp − dy

 2 

Bảng rút ngắn của mức phân bố chuẩn
z
-3.0

0.0
0.0013

0.1

0.2

0.3

0.4

0.5

0.9

-2.0

0.0228


0.179

0.0139

0.0107

0.0082

0.0062

0.0019

-1.0

0.1587

0.1357

0.1151

0.0968

0.0808

0.0668

0.0287

-0.0

+0.0

0.500
0.500

0.4602
0.5398

0.4207
0.5793

0.3821
0.6179

0.3446
0.6554

0.3085
0.6915

0.1841
0.8159

+1.0

0.8413

0.8643

0.8849


0.9032

0.9192

0.9332

0.9713

+2.0

0.9772

0.9821

0.9893

0.9893

0.9918

0.9938

0.9981

+3.0

0.9987

Vídụ 1.6:

Giá sử chúng ta có một quy luật phân phối dạng chuẩn với µ = 6, σ ^ 2 = 4 ,và chúng ta
muốn biết có bao nhiêu phần trăm của phân bố đó có giá trị lớn 9?
Sử dụng phương trình (1.41) :
Z=(9-6)/2=1.5;tra bảng (1.3) ta được P(z<1.5)=0.9332 và P(z>1,5)=1P(z<1.5)=0.0668.vậy khoảng 6,68% quy luật phân bố có giá trị lớn hơn 9.
Luyện tập 1.2.4:
Sử dụng bảng 1.3 dạng phân phối chuẩn , xác định xác suất tương ứng với những khoảng
giá trị của z sau :
a)

0 ≤ z ≤ 10

b) − 0.78 ≤ z ≤ 0
c) − 0.24 ≤ z ≤ 1.9
d) − ∞ ≤ z1 ≤ .2
e) − ∞ ≤ z ≤ 1.2
f)

−1≤ z ≤1

g) − 2.58 ≤ z ≤ 2.58
h) − ∞ ≤ z ≤ 0.44
Phép tính gần đúng với sự phân bố rời rạc :

21


Điều đề cập là những phân phối nhất định có thể xấp xỉ tới một phân phối thông
thường .Đây là một sự gần đúng hữu ích cho những mẫu lớn .
Vídu1.7:
Gỉa thiết rằng chúng ta muốn biết xác suất để đạt được 40 hoặc ít hơn trong 100 lần tung

một đồng xu là bao nhiêu ?
Từ phương trình (1.24), chúng ta cộng lại tất cả 40 giá trị của P:
40

P(X<40) = ∑ (k ^100) * (0.5)^100
K =0

Biểu thức này quá dài dòng khi ước lượng , vì vậy , chúng ta sử dụng phép tính xấp xỉ . Bằng
phương trình (1.26), chúng ta có :

µ = 100 * 0.5 = 50; σ ^ 2 = 100 * 0.5(1 − 0.5) = 25
Sau đó ,từ phương trình (1.41) ta có:
Z=(40-50)/5=-2
P(Z ≤ -2)=1-P(Z ≤ 2)=1-0.9772=0.0228
Vậy ta có :P(X<40)=0.0228 hay 2.28%.
Với mẫu nhỏ , phép xấp xỉ chính xác hơn bằng cách cộng thêm 0,5 vào X trong phương trình
(1.41):
Z=(X+0.5-n*p)/ n * p (1 − p )

Bài 1.3
Xác định z1 biết xác suẩt :
a) P( − ∞ < Z < z1) =0.92
b) P(-1.6Bài 1.4
Quan sát 36 lần một mẫu được lấy ra từ một quy luật phân bố bình chuẩn có mức trung bình
là 20 và với sai lệch là 9 .Bao nhiêu phần của quy luật phân bố có giá trị lớn hơn 26 ?
Bài 1.5
Mức độ tập trung trung bình của các hạt hóa chất tại một phòng trong một nhà máy
công nghiệp hóa chất được đo 6 giờ trong một lần đo và đo trong 30 ngày bằng đồng hồ đo
hình khối siêu nhỏ. Kết quả đo được cho trong bảng sau :

5
18
15
7
23

7
24
6
13
24

9
6
11
14
12

12
10
16
8
220

13
16
12
17
25


16
14
22
19
13

17
23
9
11
8

22

19
19
8
21
9

23
8
15
9
20

24
20
18
55

61

41
26
13
72
48


565
130
85
103
25
80

65
82
95
72
15
65

10
55
28
76
46
84


43
26
110
30
30
91

20
52
16
21
35
71

45
34
19
122
40
78

27
66
61
42
16
58

20
112

67
125
53
26

72
40
45
50
65
48

12
34
34
57
78
21

115
89
32
56
98

Quy định về mức độ ô nhiễm mới yêu cầu : tổng số hạt tập trung phải được giữ dưới mức
70+5 mg /m3.
a)

Hỏi xác suất mà mức độ hạt tập trung tại một ngày bất kì nằm trong phạm vi cho phép là


bao nhiêu?
b)

Hỏi xác suất để vượt mức giới hạn trên là bao nhiêu ?

c)

Hỏi xác suất hoạt động an toàn tuyệt đối với mức dưới 65 mg/m3 là mấy?

Bài 1.6
Cho một biến ngẫu nhiên có phân bố chuẩn với những tham số như sau :

µ = 8, σ = 4 .tìm
a)

P(5
b) P(10c)

P(X>15)

d) P(X<5)
Bài 1.7
Giả thiết trọng lượng cơ thể của 800 sinh viên phân phối chuẩn

với µ = 66kg , σ = 5kg

.tính số lượng sinh viên có trọng lượng :

a)giữa 65và 75kg
b)trên 72 kg

Bài 1.8
Một cái máy sản xuất khung cần những thanh kim loại dài 24 cm với tỉ lệ dung sai là

ε = 0.05 cm.Qua một thời gian dài quan sát , nó phân bố với độ lệch chuẩn σ = 0.03 .
Giả thiết rằng chiều dài X của các thanh kim loại có phân phối chuẩn để phần trăm của các
thanh kim loại đặt trong pham vi dung sai .Hỏi với dung sai bằng bao nhiêu để có 95%trong
số các thanh kim loại được sản xuất nằm trong dung sai giới hạn ?
Bài 1.9

23


Trong phòng điều chế ,20 mẩu của một hợp chất phản ứng nhanh đã được trộn dưới điều kiện
chính xác , tấc cả chúng đều có thành phần giống nhau .Kiểm tra thành phần chất nổ thu được
và tốc độ đốt cháy ở áp suất 70 bar.Tốc độ đốt cháy trung bình là X =8.5mm/s và phương sai
tính toán là σ ^ 2 = 0.3 .Hỏi có bao nhiêu phần có tốc độ cháy :
a) trong khoảng 8 đến 9 mm/s
b) trên 9mm/s
c) dưới 8mm/s
1.2 giả thuyết thống kê
Sau khi tổng hợp từ dữ liệu thực nghiệm , chúng ta thường hi vọng sử dụng nó để rút ra một
kết luận chung về

.ví dụ ,từ dữ liệu về hiệu suẩt của một phản ứng hạt nhân , chúng ta có thể

muốn :
- giải quyết mặc dù hiệu suất trung bình của một vài phản ứng tại những điều kiện

phản ứng nhất định mà đáp ứng được yếu tố kinh tế;
- xác định mặc dù một điều kiện phản ứng đưa ra tính hiệu suất cao hơn các điều kiện
khác
- ước lượng hiệu suất trung bình có thể đạt tới trong những điều kiện đặc biệt
- tìm một phương trình định lượng để có thể dùng dự đoán trước hiệu suất tại những
điều kiện phản ứng khác
chúng ta có thể dùng phương pháp toán học khác của thống kê để đi đến những kết luận
này.Bởi vì dữ liệu nghiên cứu là những đối tượng từ những thí nghiệm có sai phạm và có thể
không chính xác như mô hình chúng ta dự đoán., chúng ta có thể rút ra những kết luận chỉ với
những điều kiện đặc biệt chắc chắn.Chúng ta có thể không bao giờ hoàn thành những kết luận
chung về một phân phối bằng những thống kê chung /
Thống kê có thể chia thành 2 phân lớp chính như sau :
- kiểm định thống kê
- ước lượng thông kê
Trong phân lớp thứ nhất , chúng ta đưa ra một giả thuyết về phân bố và nhận định chấp
nhận hoặc bác bỏ nó bằng kiểm định một mẫu dữ liệu .Hai ví dụ đầu trong phần đầu trên
thuộc nhóm kiểm định thống kê.Trong ví dụ thứ nhẩt , giả thiết rằng hiệu suất trung bình bằng
hiệu suất đề ra .
Ước lượng bao gồm số liệu giá trị của những tham số phân phối khác nhau như : kì vọng ,
độ lệch chuẩn ….Những số liệu này để đánh giá các tham số thực nhưng về mặt thống kê
chúng cho phép ta xác nhận độ chính xác của việc ước lượng .
24


1.2.1-Kiểm định thống kê
là bản trình bày đơn giản kết hợp với phân bô xác suấtcủa một biến ngẫu nhiên . Một
giả thuyết được đưa ra , sử dụng quy luật thống kê để kiểm định nó , vì vậy nó có thể được
chấp nhận hoặc có thể bị bác bỏ .Trước khi giả thuyết được trình bày rõ ràng , hầu như luôn
luôn cần thiết chọn lựa một mô hình mà chúng ta cho rằng nó phù hợp với mô hình phân phối
cơ sở .Việc chọn lựa một mô hình dựa vào điểm đặc của dạng phân phối xác suất của các

tham số mật độ mà chúng ta quan tâm .Đưa ra một giả thuyết thông kê , sau đó dựa vào
những kết luận thống kê để xác minh giả thuyết đưa ra có thể chấp nhận hay có thể bị bác bỏ
.Nói chung , chúng ta không thể trả lời được ngay câu hỏi giả thuyết thông kê trên là đúng hay
sai .Nếu thông tin từ mẫu là phù hợp với giả thuyết thì chúng ta chấp nhận nó .Tuy nhiên , nếu
dữ liệu trái với giả thuyểt thống kê đưa ra thì chung ta bác bỏ nó.
Theo nguyên tắc , có 2 giả thuyết được đưa ra :
- sơ cấp hoặc giả thuyết không H0
- giả thuyết loại từ H1
Nếu chúng ta chấp nhận giả thuyết không H0 , thì sẽ chính là bác bỏ H1.
Nhiều giả thuyết thống kê cùng loại đó có thể là các tính kiểm định riêng hoặc là thang giá
trị của một hay nhiều thông số thông kê.Như là những giả thuyểt đưa ra từ những đặc tính của
mẫu dữ liệu .Khi một mẫu được rút ra từ một phân bố không phải là dạng chuẩn thì chúng ta
thu được một mẫu đại diện đầy đù .Chúng ta có khả năng mắc sai lầm mỗi khi chấp nhận
hoặc bác bỏ một giả thuyết .
Những loại sai lầm sau :
Khi kiểm định giả thuyết thống kê , có 2 sai lầm có thể xác định được , cùng với xác suât
sai lầm xảy ra
- sai lẩm loại 1 :bác bỏ H0 khi nó là đúng . Gọi α là xác suất để xảy ra sai lầm loại 1
.
- sai lầm loại 2 : chấp nhận H0 khi nó là sai (điều đó có nghĩa là H1 đúng ).Gọi β là
xác suất để xảy ra sai lầm loại 2
- Người ta có thể nói rằng α và β là yếu điểm của giả thuyết chấp nhận sự sai lệch.
Một cách lí tưởng chúng ta sẽ thích 1 sự kiểm tra mà có thể giảm thiểu được cả 2 loại sai số.
Thật không may là khi α giảm, β cũng có xu hướng giảm theo, và ngược lại. Ngoài những
thuật ngữ chúng ta đã đề cập, chúng ta nên giới thiệu thêm một thuật ngữ mới : Khả năng
kiểm tra. Khả năng kiểm tra được định nghĩa như là một khả năng có thể xảy ra của sự loại trừ
25



×