Tải bản đầy đủ (.pdf) (106 trang)

hình thành khái niệm xác suất bằng cách giả lập ngẫu nhiên trong môi trường công nghệ thông tin

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.1 MB, 106 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH

BÙI HOÀNG NGUYÊN

LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC

Thành phố Hồ Chí Minh - 2012


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH

BÙI HOÀNG NGUYÊN

Chuyên ngành : Lí luận và phương pháp dạy học Toán
Mã số : 60 14 10

NGƯỜI HƯỚNG DẪN KHOA HỌC
TS. VŨ NHƯ THƯ HƯƠNG

Thành phố Hồ Chí Minh - 2012


LỜI CẢM ƠN
Tôi xin trân trọng cảm ơn :


Tiến sĩ Vũ Như Thư Hương, người đã hướng dẫn tôi về mặt nghiên cứu khoa

học, luôn động viên và giúp đỡ tôi có đủ niềm tin và nghị lực trong suốt quá trình


thực hiện luận văn này.


PGS. TS. Lê Thị Hoài Châu, PGS. TS. Lê Văn Tiến, TS. Lê Thái Bảo Thiên

Trung, đã nhiệt tình giảng dạy, giải đáp các thắc mắc, dẫn dắt chúng tôi tìm hiểu
những kiến thức ban đầu và truyền cho chúng tôi sự hứng thú với chuyên ngành
Didactic toán.
Tôi xin chân thành cảm ơn :


Ban lãnh đạo và chuyên viên phòng khoa học công nghệ - sau đại học, Ban

chủ nhiệm và giảng viên khoa Toán – Tin trường Đại học Sư phạm Tp. Hồ Chí
Minh đã tạo điều kiện thuận lợi nhất giúp chúng tôi hoàn thành luận văn này.


Ban Giám hiệu và đồng nghiệp tổ Toán trường THPT Hoàng Hoa Thám đã

tạo mọi điều kiện thuận lợi và giúp đỡ tôi tiến hành thực nghiệm.
Tôi xin tỏ lòng biết ơn đến :


Tập thể lớp Cao học Didactic Toán khóa 20 đã cùng chia sẻ những khó khăn

và giúp đỡ tôi về tinh thần trong suốt thời gian theo học tại trường ĐHSP Tp. HCM.


Chị Võ Mai Như Hạnh đã giúp đỡ tôi trong suốt quá trình tiến hành thực


nghiệm, đồng thời cũng là nguồn động viên đối với tôi về mặt tinh thần.


Cha mẹ, vợvà các anh chị em trong gia đình đã luôn nâng đỡ và là chỗ dựa

cho tôi về mọi mặt.

Bùi Hoàng Nguyên


MỤC LỤC
PHẦN MỞ ĐẦU ........................................................................................................1
I. Những ghi nhận ban đầu và câu hỏi xuất phát.........................................................1
II. Khung lý thuyết tham chiếu ...................................................................................2
III. Trình bày lại câu hỏi nghiên cứu – mục đích nghiên cứu .....................................4
IV. Phương pháp nghiên cứu và cấu trúc luận văn .....................................................5
Chương 1 : LUẬT SỐ LỚN : MỘT NGHIÊN CỨU TRI THỨC KHOA HỌC6
I. Đặc trưng khoa học luận về lịch sử hình thành khái niệm xác suất .....................6
II. Luật số lớn ở cấp độ tri thức khoa học ................................................................8
III. Kết luận chương 1 ............................................................................................22
Chương 2 : MỐI QUAN HỆ THỂ THẾ VỚI ĐỐI TƯỢNG TẦN SUẤTVÀ
ĐỐI TƯỢNG XÁC SUẤT ......................................................................................24
I. Tần suất trong thể chế 1 .....................................................................................24
II. Xác suất trong thể chế 2 ....................................................................................38
III. Kết luận chương 2 ............................................................................................45
Chương 3 : THỰC NGHIỆM ................................................................................46
I.

Giới thiệu thực nghiệm .......................................................................................48


II. Mục đích thực nghiệm ........................................................................................49
III. Nội dung thực nghiệm ........................................................................................49
IV. Kết luận chương 3 ...............................................................................................71
KẾT LUẬN ………………………………………………………………………73
TÀI LIỆU THAM KHẢO……………………………………….…………….…
PHỤ LỤC………………………………………………………………………….
BIÊN BẢN THỰC NGHIỆM…………………………………………………….


PHẦN MỞ ĐẦU
I. NHỮNG GHI NHẬN BAN ĐẦU VÀ CÂU HỎI XUẤT PHÁT
Xác suất và thống kê đã được đưa vào giảng dạy trong chương trình phổ thông
tại nhiều nước trên thế giới từ nhiều năm nay bởi đây là một mảng toán có rất nhiều
ứng dụng thực tiễn giá trị trong các lĩnh vựcVật lý, Sinh học, Xã hội học, Kinh tế,…
Trước xu thế đó, các nhà giáo dục Việt Nam cũng đã đưa thống kê mô tả và xác
suất vào giảng dạy ở các trường phổ thông với mục đích đáp ứng nhu cầu đổi mới
chương trình giáo dục cũng như phương pháp dạy học ở Việt Nam đồng thời bắt kịp
với xu thế giáo dục của thời đại và trên thế giới. Cụ thể, ở bậc tiểu học thống kê mô tả
(TKMT) được đưa vào chương trình toán lớp 3 - bài : “ Làm quen với số liệu thống
kê” nhằm giới thiệu dãy số liệu và bảng thống kê ở mức độ rất đơn giản. Tiếp đó, ở
bậc trung học cơ sở (lớp 6 đến lớp 9), một vài đối tượng cơ bản của TKMT như tần số,
biểu đồ, các số đặc trưng : số trung bình cộng, mốt được đưa vào trong chương trình
lớp 7. Chương “Thống kê” ở chương trình lớp 10 bậc trung học phổ thông đã hoàn
thiện các kiến thức còn lại của phần TKMT, ở đó, tần suất f i của một giá trị x i trong
mẫu số liệu được định nghĩa là tỉ số giữa tần số n i của giá trị đó với kích thước mẫu N.
Chúng tôi đặc biệt quan tâm đến đối tượng tần suất của một giá trị trong mẫu số liệu.
Do đó, liên quan đến đối tượng tần suất chúng tôi có một số ghi nhận như sau :
Trong phần thống kê mô tả, tần suất của một giá trị trong mẫu số liệu được biết
đến như là một đại lượng đặc trưng cho giá trị này trong mẫu số liệu, ở đó, các mẫu số
liệu được cho sẵn và có kích thước mẫu là không đổi.

Trong khái niệm xác suất mà cụ thể là định nghĩa thống kê của xác suất, đối
tượng tần suất được định nghĩa :« Tỉ số giữa tần số của A với số N được gọi là tần suất của
A trong N lần thực hiện phép thử T » (SGK11NC, tr. 74). Đối tượng tần suất được nhắc

đến trong định nghĩa là tần suất của một biến cố trong N lần thực hiện cùng một phép
thử ngẫu nhiên. Do đó, giá trị của tần suất thay đổi khi thay đổi số lần thực hiện phép
thử ngẫu nhiên.
Trong định nghĩa thống kê của xác suất, Sách giáo khoa Đại số & giải tích 11
Nâng cao trang 74 có viết :
« […]Số lần thử N càng lớn thì tần suất của biến cố A càng gần với một số xác
định, số đó gọi là xác suất của biến cố A theo nghĩa thống kê[…].Trong khoa học


thực nghiệm, người ta thường lấy tần suất làm xác suất. Vì vậy, tần suất còn
được gọi là xác suất thực nghiệm. »
Thế nhưng, cách tiếp cận theo quan điểm thống kê của xác suất lại không tiến
xa hơn trong tri thức cần giảng dạy, kiến thức về xác suất thực nghiệm chỉ dừng lại ở
phần định nghĩa trong khi cách tiếp cận này lại mang đến « nghĩa thực tế » của xác
suất.
« Việc xây dựng các tổ chức kiến thức cần giảng dạy về khái niệm xác suất dựa chủ yếu vào
cách tiếp cận cổ điển của Laplace. Quan điểm thống kê chỉ được thể hiện duy nhất trong
định nghĩa thống kê của xác suất, còn trong hệ thống ví dụ, bài tập thì quá sơ sài »

(Vũ Như Thư Hương (2005),tr. 56)
Điều này làm nảy sinh trong chúng tôi những thắc mắc sau :
Những khái niệm của thống kê mô tả (lớp 10) đã có những chuẩn bị gì cho các
tiếp cận khái niệm xác suất (lớp 11)? Ngược lại, khái niệm xác suất được dạy ở lớp 11
khai thác các kiến thức về thống kê mô tả được dạy ở lớp 10 ra sao? Có mối liên hệ
nào giữa tần suất xuất hiện của một giá trị trong mẫu số liệu với xác suất của một biến
cố? Cuối cùng, có thể nào xây dựng một tình huống giúp hình thành ý niệm về khái

niệm xác suất của một biến cố nơi học sinh lớp 10 sau khi học xong chương thống kê?
II. KHUNG LÝ THUYẾT THAM CHIẾU
Để tìm kiếm câu trả lời cho các câu hỏi trên, chúng tôi cần phải phân tích sách
giáo khoa 10 và 11 hiện hành để tìm hiểu cách mà các đối tượng của TKMT được đưa
vào giảng dạy ở chương trình lớp 10 cũng như khái niệm xác suất dạy ở lớp 11, đồng
thời, chúng tôi thật sự quan tâm đến các dạng câu hỏi hay bài tập làm nảy sinh khái
niệm xác suất. Để thực hiện được mong muốn này, chúng tôi đặt nghiên cứu của mình
vào trong khuôn khổ của lý thuyết Didactic toán mà cụ thể là lý thuyết nhân học.
Trong khuôn khổ của lý thuyết này, chúng tôi tiến hành làm rõ mối quan hệ giữa thể
chế dạy học hiện hành với đối tượng tần suất và đối tượng xác suất bằng cách phân
tích các tổ chức toán học liên quan ở SGK Toán 10 và SGK Toán 11 hiện hành để làm
sáng tỏ các tổ chức toán học nào liên quan đến đối tượng tần suất cũng như các tổ chức
toán học làm nảy sinh định nghĩa thống kê của xác suất.
Chúng tôi cố gắng tạo ra các tình huống học tập dưới dạng các hoạt động học tập
nhằm trang bị cho học sinh sau khi học xong chương Thống kê có thêm cơ hội để tiếp


cận khái niệm xác suất dễ dàng hơn. Để làm được điều này, trong khuôn khổ lý thuyết
didactic Toán, chúng tôi sử dụng lý thuyếtđồ án sư phạm và lý thuyết tình huống. Dựa
trên các phân tích có được, chúng tôi tổ chức các hoạt động học tập nhằm kiểm chứng
giả thuyết nghiên cứu mà chúng tôi đưa ra.
Chúng tôi tiến hành tóm tắt một số lý thuyết liên quan được được trình bày ở giáo
trình :
Lê Thị Hoài Châu, Lê Văn Tiến, Những yếu tố cơ bản của didactic toán, nhà xuất
bản Đại học Quốc gia Tp. HCM.
II.1 Lý thuyết nhân chủng học
Trong lý thuyết nhân chủng học, chúng tôi sẽ sử dụng các khái niệm : “ quanhệ thể
chế”, “quan hệ cá nhân”, “tổ chức toán học”.
• Quan hệ thể chế, quan hệ cá nhân
Quan hệ thể chế :

Quan hệ R(I,O) của thể chế I với tri thức O là tập hợp các tác động qua lại mà
thể chế I có với tri thức O. Nó cho biết O xuất hiện ở đâu, như thế nào, tồn tại ra sao,
có vai trò gì, … trong I ?
Quan hệ cá nhân :
Quan hệ R(X,O) của cá nhân X với tri thức O là tập hợp các tác động qua lại
mà cá nhân X có với tri thức O. Nó cho biết X nghĩ gì, hiểu như thế nào về O, có thể
thao tác O ra sao ?
Việc học tập của cá nhân X về đối tượng tri thức O chính là quá trình thiết lập
hay điều chỉnh mối quan hệ R(X,O). Hiển nhiên, đối với một tri thức O, quan hệ của
thể chế I mà cá nhân X là một thành phần, luôn luôn để lại một dấu ấn trong quan hệ
R(X,O). Muốn nghiên cứu R(X,O), ta cần đặt nó trong R(I,O).
• Tổ chức toán học
Mối quan hệ thể chế R(I,O), quan hệ cá nhân R(X,O) được xác định thông
quanghiên cứu các tổ chức toán học, các praxéologie là một khái niệm do
Chevallard(1998) đưa ra mà việc phân tích chúng cho phép ta xác định mối quan hệ
thể chếđối với đối tượng tri thức O.
Theo Chevallard, mỗi praxéologie là một bộ phận gồmbốn thành phần

, t , q ,  , trong đó T là một kiểu nhiệm vụ, τlà kỹ thuật cho phépgiải quyết kiểu




nhiệm vụ T, θlà công nghệ giải thích cho kỹ thuật τ, Θlà lý thuyết giải thích cho công
nghệ θ.
II.2. Đồ án sư phạm
Theo Artigue M. (1988) và Chevallard Y. (1982), đồ án didactique là một tìnhhuống
dạy học được xây dựng bởi nhà nghiên cứu, là một hình thức công việc didactique tựa
như công việc của người kỹ sư : nó dựa trênkiến thức khoa học thuộclĩnh vực của
mình để làm việc trên các đối tượng phức tạp hơn nhiều so với các đốitượng được sàng

lọc của khoa học.
Sau đây là một số yếu tố về khái niệm đồ án didactique :
• Chức năng kép của đồ án didactique
Đồ án didactique cho phép thực hiện :
– một hoạt động trên hệ thống giảng dạy, dựa trên các nghiên cứu didactique
trước.
– một kiểm chứng về những xây dựng lý thuyết được thực hiện bằng việc nghiên
cứu, bằng việc thực hiện chúng trong một hệ thống giảng dạy.
• Các pha khác nhau của phương pháp đồ án :
1. Các phân tích ban đầu : dựa trên
– Các kết quả nghiên cứu trong lĩnh vực
– Một phân tích khoa học luận về tri thức trong trò chơi
– Một phân tích các kiến thức của học sinh (các quan niệm), các khó khăn gặp
phải trong việc học (các chướng ngại)
– Một phân tích thể chế (chương trình, sách giáo khoa,…)
2. Quan niệm về lớp (kịch bản), phân tích a priori và việc tổ chức tập dữ liệu.
3. Thực nghiệm và tổ chức các quan sát.
4. Phân tích a posteriori và sự hợp thức hóa nội tại.
III. TRÌNH BÀY LẠI CÂU HỎI NGHIÊN CỨU – MỤC ĐÍCH NGHIÊN CỨU
Trong phạm vi lí thuyết này và từ các câu hỏi xuất phát ở trên, chúng tôi trình
bày lại hệ thống câu hỏi nghiên cứu của luận văn như sau :
Q 1 : Liên quan đến kiến thức về TKMT (lớp 10) và xác suất (lớp 11) của thể chế
dạy học hiện hành có những kiểu nhiệm vụ đặc trưng nào? Các kĩ thuật nào được đề


nghị? Những tổ chức toán học nào là đặc trưng cho phép làm xuất hiện khái niệm xác
suất ?
Q 2 :Có sự nối khớp nào giữa tần suất xuất hiện của một giá trị trong mẫu số liệu
và xác suất của một biến cố không?
Q 3 : Có thể xây dựng một tiểu đồ án nhằm hình thành nơi học sinh lớp 10 những

tư tưởng ban đầu về khái niệm xác suất sau khi học xong chương Thống kê không?
Mục đích nghiên cứu đặt ra chính là đi tìm câu trả lời cho các câu hỏi nêu trên.
IV. PHƯƠNG PHÁP NGHIÊN CỨU VÀ CẤU TRÚC CỦA LUẬN VĂN
Để đi tìm các câu trả lời cho những câu hỏi trên chúng tôi xác định phương pháp
nghiên cứu như sau :
Việc nghiên cứu các tri thức khoa học liên quan đến luật số lớn nhằm làm sáng tỏ
mối quan hệ giữa đối tượng tần suất và đối tượng xác suất chúng tôi đang quan tâm.
Cụ thể, đối tượng tần suất xuất hiện ở đâu và được khai thác ra sao trong quan hệ của
nó với xác suất theo quan điểm thống kê. Để làm rõ những điều này, chúng tôi tiến
hành những ghi nhận dựa trên các tri thức về Luật số lớn chủ yếu ở tài liệu :
- Đặng Hùng Thắng (1997), Mở đầu về lý thuyết xác suất và ứng dụng, NXB
Giáo dục.
Các kết quả có được giúp chúng tôi trả lời cho câu hỏi Q 2 .
Chương 2 là phần nghiên cứu về chương trình, tài liệu hướng dẫn giáo viên, sách
giáo khoa. Chúng tôi sẽ cố gắng chỉ rõ các kiểu nhiệm vụ, các kĩ thuật,… có mặt trong
phần thống kê mô tả và phần xác suất. Dựa trên những nghiên cứu đó, chúng tôi xác
định mối quan hệ thể chế với đối tượng tần suất, mối quan hệ thể chế với đối tượng
« xác suất » nhằm hình thành giả thuyết nghiên cứu. Tức là chúng tôi đã tìm được câu
trả lời cho câu hỏi Q 1 .
Các giả thuyết nghiên cứu này cần phải được kiểm chứng bằng một nghiên cứu
thực nghiệm ở chương 3. Chúng tôi tiến hành một thực nghiệm trên đối tượng học
sinh. Chúng tôi thực hiện một tiểu đồ án dạy học để bổ sung một số hoạt động nhằm
tạo cho học sinh cơ hội tìm hiểu đối tượng tần suất khi nó chịu sự chi phối của các yếu
tố ngẫu nhiên, từ đó, hình thành một chút ý tưởng về khái niệm xác suất theo quan
điểm thống kê. Thực nghiệm này dành cho đối tượng học sinh lớp 10 sau khi học xong
chương Thống kê hoặc học sinh lớp 11 trước khi học chương Tổ hợp và xác suất.


Chương 1 :
LUẬT SỐ LỚN : MỘT NGHIÊN CỨU TRI THỨC KHOA HỌC

Trong chương này, chúng tôi tiến hành nghiên cứu tri thức luật số lớn ở cấp độ
tri thức khoa học nhằm chỉ ra các đặc trưng khoa học, các kết quả toán học có liên
quan đến luật số lớn. Đồng thời, chúng tôi tập trung phân tích và chỉ ra mối quan hệ
giữa tần suất với xác suất của một biến cố. Các kết quả có được giúp chúng tôi trả lời
cho câu hỏi Q 2 (Có sự nối khớp nào giữa tần suất xuất hiện của một giá trị trong mẫu
số liệu với xác suất của một biến cố ?) cũng như làm tham chiếu để tiến hành các phân
tích quan hệ thể chế với đối tượng tần suất và đối tượng xác suất trong thể chế dạy học
trung học Việt Nam hiện hành.
I. ĐẶC TRƯNG KHOA HỌC LUẬN VỀ LỊCH SỬ HÌNH THÀNH KHÁI NIỆM
XÁC SUẤT
Trong phần này, chúng tôi sử dụng các kết quả phân tích khoa học luận về lịch sử hình
thành khái niệm xác suất trong tài liệu sau :
[A] Vũ Như Thư Hương (2005), Khái niệm xác suất trong dạy - học toán ở
trung học phổ thông, Luận văn Thạc sĩ ĐHSP Tp. Hồ Chí Minh.
Những kết quả này tác giả đạt được khi tiến hành phân tích đặc trưng về lịch sử hình
thành khái niệm xác suất ở các tài liệu :
- Introduction aux situations aléatoires dès le collège : de la modélisation à la
simulation d’expériences de Bernoulli dans l’environnement infomatique Cabrigéomètre 2, Coutinho C., 2001, Thèse de doctorat, Université Joseph Fourier,
Grenoble.
http ://em2000.imag.fr/Actes/Ateliers/COUTINHO.pdf
-

La

notion

de

probabilité


:

évolution

historique

et

applications

contemporaines, Michel Henry, IREM de Franche -Comté, 2004.
- Les Premiers apprenrissages en géométrie et en probabilités : des processus
de modélisation comparables, Michel Henry, IREM de Franche-Comté, 1994.
- L’enseignement des probabilités et de la statistique en France depuis 1965,
Bernard Parsysz.


- La théori des probabilités au tournant du XVIIe siècle et Frise historique sur
la probabilité et la statistique, Enseigner les prolabilités au lycée, 105-130,
Jean-François

Pichard,

Commisson

Inter-IREM

STATISTIQUE

ET


PROBABILITÉS, 1997.
- A propos de la définition de la probabilité, Jean-Claude Thiénard,
Commission Inter-IREM STATISTIQUE ET PROBABILITÉS, 1997.
Chúng tôi tóm tắt một số kết quả chính sau đây của tác giả Vũ Như Thư Hương.
1. Các giai đoạn nảy sinh và phát triển
Trong giai đoạn đầu (từ thời Trung đại đến nửa đầu thế kỉ XVII) : xác suất lấy
cơ chế của một khái niệm protomathématique (không tên, không định nghĩa) và xuất
hiện như một công cụ ngầm ẩn cho phép giải quyết các vấn đề về tính toán cơ hội
trong vài trò chơi may rủi.
Giai đoạn thứ hai (nửa sau thế kỉ XVII) : khái niệm xác suất nảy sinh và phát
triển với việc giải quyết vấn đề chia tiền cá cược mà người khởi xướng là Pascal và
Fermat. Thuật ngữ xác suất lần đầu tiên xuất hiệnnăm 1662 trong Nghệ thuật tư duy
của Antoine Arnauld và Pierre Nicole nhưng vẫn chưa có định nghĩa toán học chính
thức nào.
Giai đoạn thứ ba (đẩu thế kỉ XVIII đến cuối thế kỉ XIX) : Xác suất chính thức
có cơ chế của một khái niệm toán học. Với công trình công bố năm 1812 của Laplace,
xác suất được định nghĩa là tỷ số của số trường hợp thuật lợi với số tất cả các trường
hợp có thể xảy ra.
Giai đoạn thứ tư (Thế kỷ 2XX) : Với Andreï Kolmogorov (1933), khái niệm
xác suất được định nghĩa một cách hình thức bằng phương pháp tiên đề. Tính toán xác
suất ngày càng phát triển và là công cụ tường minh cho phép giải quyết nhiều bài toán
trong các lĩnh vực khác nhau của toán ứng dụng, vật lý học, cơ học, sinh vật học,…

2. Các cách tiếp cận xác suất
Về cách tiếp cận xác suất, khi tiến hành một nghiên cứu khoa học luận, tài liệu
[A] trang 25 đã đưa ra kết luận rằng : « Lý thuyết xác suất được hình thành và phát
triển dưới ba cách thức tiếp cận : tiếp cận theo Laplace (tiếp cận cổ điển), tiếp cận
thống kê, tiếp cận theo tiên đề ».



Cụ thể, theo « tiếp cận theo Laplace » thì xác suất của một biến cố là “tỉ số của
số trường hợp thuận lợi với số tất cả các trường hợp có thể xảy ra”. Theo cách tiếp cận
này, việc xác định xác suất của một biến cố được đưa về phép đếm và Đại số tổ hợp
đóng vai trò chính trong các tính toán. Ngoài ra, trong trường hợp phép thử có thể gắn
với một không gian hữu hạn các biến cố sơ cấp đồng khả năng xuất hiện thì bằng định
nghĩa Laplace người ta có thể tính xác suất mà không cần thực hiện phép thử. Bên
cạnh đó, theo « tiếp cận tiên đề » thì xác suất được định nghĩa như « một độ đo không
âm bị chặn được xác định trên một tập hợp trừu tượng mô hình hóa các kết cục có thể
của một phép thử ngẫu nhiên » và thỏa một hệ tiên đề.
Xác suất của một biến cố là độ đo µ của tập hợp mô tả biến cố A nào đó liên
quan đến một phép thử ngẫu nhiên. Đó là một số thực, được ghi là µ(A) sao cho

µ thỏa các tiên đề :
Tiên đề 1 : Với mọi biến cố A, 0  m A  1
Tiên đề 2 : Với Ω là không gian các biến cố sơ cấp, m   1
Tiên đề 3 : Với mọi dãy các biến cố đôi một rời nhau, A 1 , A 2 , …, thì :
m A1  A2  ...   m Ai 

([A], trang 22)
Ngoài ra, theo « tiếp cận thống kê » thì xác suất của một biến cố là một giá trị
mà tần suất tương đối của biến cố đó dao độngquanh giá trị này khi thực hiện một số
lượng lớn các phép thử. Do đó, xác suất theo quan điểm này được gọi là « xác suất
khách quan » vì giá trị của xác suất chỉ được biết sau thực nghiệm. Gắn với định nghĩa
xác suất theo quan điểm này thì các kết quả của luật số lớn đóng một vai trò vô cùng
quan trọng với tư cách là cơ sở lý thuyết cho cách tiếp cận thống kê, đồng thời, nó tạo
sự liên hệ và gắn kết chặt chẻ về mặt toán học giữa thống kê toán và lý thuyết xác suất.
II. LUẬT SỐ LỚN Ở CẤP ĐỘ TRI THỨC KHOA HỌC
1. Một chút lịch sử
Trong ba cách tiếp cận xác suất nêu trên, chúng tôi đặc biệt quan tâm đến tiếp

cận thống kê của xác suất. Cách tiếp cận này được Jacques Bernoulli đề nghị lần đầu
tiên trong tác phẩm “Thuật suy đoán” (1713).


« …xác định hậu nghiệm xác suất của biến cố mong đợi sau khi quan sátthực
nghiệm một số lớn phép thử giống nhau qua sự ổn định của tần suất. »
([A], trang 18)
« Nhưng thực ra ở đây, chúng ta còn có một con đường khác để có được cái mà
chúng ta tìm. Điều gì không có được ở tiên nghiệm thì tối thiểu cũng phải nhận
được ở hậu nghiệm, nghĩa là có thể khai thác nó bằng cách quan sát các kết cục
của nhiều ví dụ tương tự… »
(Bernoulli, 1713, trang 42 -44, trích theo [A], trang 39)
« …nó dẫn Bernoulli đến việc đề ra cách ước lượng tần suất cho khái niệm xác
suất… »
(Henry, 2004, trang 7, trích theo Vũ Như Thư Hương, 2005, trang 18)
Như vậy, có thể nói « Thuật suy đoán » của Bernoulli đã đặt nền móng cho
cách tiếp cận thống kê của xác suất mà cơ sở là luật số lớn. Vũ Như Thư Hương
(2005) nhận xét rằng : « …lần đầu tiên việc tính xác suất của một biến cố đã chuyển
từ chỗ sử dụng công cụ đại số tổ hợp sang sử dụng công cụ giải tích » (trang 19).
Về sau, các nhà toán học người Pháp như Moirve, Laplace, Poisson,… đã
chứng minh được những định lý đầu tiên liên quan luật số lớn và tìm cách xây dựng cơ
sở toán học cho luật số lớn, đồng thời giúp cho hướng tiếp cận thống kê của xác suất
trở thành một ngành toán học có nhiều ứng dụng thực tiễn.
Ở cấp độ tri thức khoa học, luật số lớn được trình bày ra sao?
Trước tiên, chúng tôi điểm qua một vài nét lịch sử về luật số lớn. Luật số lớn
được biết đến ở dạng trực giác : « càng thí nghiệm nhiều lần thì kết quả thống kê càng
chính xác » từ hàng nghìn năm trước đây. Nhà toán học và thiên văn học người Ấn Độ
Brahmagupta (598-668), và sau đó nhà toán học người Ý Gerolamo Cardino (1501 1576), có phát biểu nó mà không chứng minh rằng độ chính xác của các kết luận thống
kê thực nghiệm có xu hướng được cải thiện với số lượng phép thử lớn. Điều này sau
đó được phát biểu thành « luật số lớn ». Một dạng đặc biệt của luật số lớn (đối với

phân bố nhị thức) lần đầu tiên được chứng minh bởi Jacob Bernoulli. Ông phải mất 20
năm và bằng các chứng minh đầy đủ ông đã xuất bản cuốn Ars Conjectandi (Thuật suy
đoán) ông đã đặt tên định lý của mình này là « định lý vàng ». Nhưng nó được biết đến
nhiều hơn với cái tên « định lý Bernoulli ». Cái tên « luật số lớn »(la loi des grands
nombres) được Siméon Denis Poisson viết ra năm 1835, và ngày nay, người ta hay gọi


theo tên đó. Sau J.Bernoulli và Poisson còn có các nhà toán học khác tham gia hoàn
thiện luật số lớn như Chebyshev, Markov, Borel, Cantelli, Kolmogorov và Khinchin
(người đã có những chứng minh hoàn thiện liên quan luật số lớn cho trường hợp các
biến ngẫu nhiên tùy ý).
Về lý thuyết, « luật số lớn được phát biểu dưới dạng các định lý toán học, trong
đó, nêu lên những điều kiện khá tổng quát để trung bình cộng của các đại lượng ngẫu
nhiên khi n tăng sẽ tiến đến trung bình cộng các kì vọng toán học.» ([B], trang 49)
Song song với quá trình xây dựng cơ sở toán học cho luật số lớn, một số định
nghĩa cũng được đưa vào như : đại lượng ngẫu nhiên, phân phối xác suất, hàm phân bố
xác suất, tham số đặc trưng,…Để việc nghiên cứu các tri thức khoa học về « tiếp cận
thống kê » của xác suất và luật số lớn được đầy đủ, chúng tôi cố gắng đưa các lý
thuyết trên vào nghiên cứu của mình. Vì không có điều kiện tiếp xúc với các tài liệu
làm cơ sở tiến hành các nghiên cứu khoa học luận nên một nghiên cứu tri thức khoa
học là thật sự cần thiết giúp chúng tôi đi tìm câu trả lời thích đáng cho câu hỏi Q 2 đặt
ra ở trên.
Để thuận tiện cho nghiên cứu, chúng tôi tiến hành tóm tắt một số lý thuyết liên
quan đến tiếp cận thống kê của xác suất, đặc biệt là lý thuyết xây dựng luật số lớn.
2. Cơ sở lý thuyết của luật số lớn
Trong khuôn khổ của một luận văn cộng với các phân tích luật số lớn của chúng
tôi nhằm tìm ra mối quan hệ giữa tần suất xuất hiện của một giá trị trong mẫu số
liệu với xác suất xuất hiện của một biến cố cho nên một nghiên cứu tri thức khoa
học luận, theo chúng tôi nghĩ rằng, là không cần thiết.Trong khi đó, do không tìm
được các tài liệu chính thức nghiên cứu về tri thức khoa học của luật số lớn nên

chúng tôi sử dụng 2 tài liệu sau để viết phần tri thức khoa học liên quan đến luật số
lớn :
[B]Hoàng Quý (2002), Từ điển bách khoa phổ thông Toán học tập 2, NXBGD.
[C] Đặng Hùng Thắng (1997), Mở đầu về lý thuyết xác suất và ứng dụng, NXB
Giáo dục.
Chúng tôi phân tích chủ yếu ở giáo trình [C] bởi tài liệu này trình bày hết sức đầy
những tri thức khoa học cần thiết liên quan đếnnội dung cần nghiên cứu của chúng tôi.


Chúng tôi tiến hành tóm tắt một số lý thuyết liên quan đến luật số lớn. Một số khai
niệm mà chúng tôi tổng hợp sau đây làm cơ sở lý thuyết cho luật số lớn.. Cụ thể :
a. Đại lượng ngẫu nhiên (hay biến ngẫu nhiên)
Đại lượng ngẫu nhiên có nhiều định nghĩa khác nhau :
« Đại lượng ngẫu nhiên (hay còn được gọi là biến ngẫu nhiên) : là một khái niệm
toán học dùng làm mô hình cho các biến cố mà sự thực hiện của chúng phụ
thuộc vào những nguyên nhân mà ta không quan sát được hoặc ta cố tình không
kể đến” »
([B], trang 27).
« …nó là một hàm xác định trên không gian các biến cố sơ cấp nhận mỗi giá trị
tương ứng với một xác suất nào đó. »
([1], trang 35).
Chẳng hạn, các đại lượng như : số chấm xuất hiện khi gieo một con súc sắc, sai
số khi đo lường một đại lượng vật lý, tuổi thọ của một thiết bị đang hoạt động… là các
đại lượng ngẫu nhiên. đại lượng ngẫu nhiên thường được kí hiệu bởi các chữ cái X, Y,
Z…, tập giá trị của đại lượng ngẫu nhiên X là X  .
« Một biến ngẫu nhiên được coi là xác định nếu biết được : tập các giá trị của nó
và các xác suất mà nó nhận giá trị thuộc tập đó. »
([1], trang 35)
Các đại lượng ngẫu nhiên được phân loại theo dạng của tập các giá trị mà nó
nhận : rời rạc (chẳng hạn gieo con súc sắc), liên tục (chẳng hạn thời gian giữa hai lần

sét phóng điện trong cơn giông), nhiều chiều (chẳng hạn tọa độ của điểm rơi của thiên
thạch).Theo [C] thì : « đại lượng ngẫu nhiên gọi là rời rạc nếu nó chỉ nhận một số hữu
hạn các giá trị hoặc một số vô hạn đếm được các giá trị. Nói cách khác, đối với một
đại lượng ngẫu nhiên rời rạc, chúng ta có thể liệt kê tất cả các giá trị có thể của nó
bằng một dãy hữu hạn hay vô hạn x 1, x 2 ,..., x n ,... » ([C], trang 43)
Đại lượng ngẫu nhiên rời rạc X nhận các giá trị X   x 1, x 2 ,..., x n ,... . Ví dụ
gieo một con súc sắc và gọi X là số chấm xuất hiện trên con súc sắc, khi đó X là một
đại lượng ngẫu nhiên và X   1;2; 3; 4;5;6
Ngoài đại lượng ngẫu nhiên rời rạc, trong lý thuyết xác suất còn có đại lượng
ngẫu nhiên liên tục


« Một đại lượng ngẫu nhiên X được gọi là đại lượng ngẫu nhiên liên tục nếu :
Tập hợp các giá trị có thể của X lấp đầy một hay một số khoảng

i)

của trục số, thậm chí lấp đầy cả toàn bộ trục số.
ii)

Với mọi số a, P X  a   0 . »

([C], trang 79)
Một số ví dụ có thể kể đến các đại lượng ngẫu nhiên liên tục như là lượng mưa
vào một tháng hằng năm, trọng lượng của một đứa trẻ mới sinh là các đại lượng ngẫu
nhiên liên tục.
b. Phân bố xác suất của đại lượng ngẫu nhiên
Ngoài việc xác định tập hợp tất cả các giá trị có thể có của đại lượng ngẫu nhiên
X, chúng ta cần phải biết được xác suất để đại lượng ngẫu nhiên X nhận giá trị đó là
bao nhiêu. Để giải quyết nhu cầu trên, một đặc trưng quan trọng nhất và đầy đủ nhất

của đại lượng ngẫu nhiên là phân phối xác suất của nó.
« Phân phối xác suất của một đại lượng ngẫu nhiên là một cách biểu diễn quan
hệ giữa các giá trị của đại lượng ngẫu nhiên với các xác suất tương ứng” »
([1], trang 35).
Đối với đại lượng ngẫu nhiên rời rạc X thì phân bố xác suất của nó là bảng
phân bố có dạng như sau :
X

x1

x2



xn

p

p1

p2



pn

trong đó pi  P X  x i  (chú ý rằng

n


p
i 1

i

 1)

([C], trang 44)
Đối với đại lượng ngẫu nhiên liên tục, phân bố xác suất của nó được xác định
bởi một hàm f (x ) gọi là hàm độ mật xác suất. Hàm mật độ xác suất dùng để biểu diễn
một phân bố xác suất theo tích phân. Hàm mật độ xác suất luôn nhận giá trị không âm,
tích phân của nó từ -∞ đến +∞ có giá trị bằng 1.
« Hàm f(x) xác định trên toàn trục số được gọi là hàm mật độ của đại lượng
ngẫu nhiên liên tục X nếu
f x   0, x  

i)
ii)







f x dx  1


iii)


b

Với mọi a < b, ta có P a  X  b    f x dx »
a

([C], trang 80)
b

Nhưng vì P X  a   0, P X  b   0 nên ta cũng có P a  X  b    f x dx
a

c. Hàm phân phối xác suất của đại lượng ngẫu nhiên
Nếu đại lượng ngẫu nhiên X là rời rạc thì hàm phân bố xác suất của X là hàm số
F(X) xác định xác suất của tất cả các biến cố có dạng {X < x}. Theo định nghĩa này,
hàm phân phối F(X)là xác suất của đại lượng ngẫu nhiên X nhận giá trị trong khoảng

;x  .
« Hàm phân bố xác suất (hay hàm phân bố) của đại lượng ngẫu nhiên X là một
hàm F(X) xác định với mọi x theo công thức sau
F x   P X  x  »

([C], trang 46)
Tùy thuộc vào tập giá trị mà đại lượng ngẫu nhiên X nhận được mà hàm phân bố có
thể khác nhau. Chẳng hạn :
« Nếu X nhận một số hữu hạn các giá trị x 1  x 2  ...  x n với xác suất tương
ứng là pk  P X  x k  thì hàm phân bố được cho như sau :


neáu x  x1
0




F  x    p1  p2  ...  pk1 neáu xk1  x  xk



neáu x  xk

1

Nếu X nhận một số vô hạn đếm được các giá trị x 1  x 2  ...  x n  ... thì hàm
phân bố của X được cho như sau :
0
neáu x  x1
F  x   
»
 p1  p2  ...  pk1 neáu xk1  x  xk


([C], trang 46)
Về tính chất hàm mật độ của đại lượng ngẫu nhiên rời rạc thì nó là một hàm bậc thang
và không giảm.


«Hàm phân bố của đại lượng ngẫu nhiên rời rạc X là một hàm bậc thang, không
giảm có bước nhảy tại các giá trị có thể của X. Độ lớn của bước nhảy tại điểm x k
là pk  P X  x k  »
([C], trang 46)


p4
p3
p2
p1
x1

x2

x3

x4

([C], trang 46)
Nếu X là đại lượng ngẫu nhiên liên tục thì hàm phân bố xác suất của nó cũng tương tự
như trường hợp rời rạc.
« Hàm phân bố xác suất của đại lượng ngẫu nhiên X, kí hiệu bởi F(x), là hàm
xác định với mọi số thực x theo công thức sau F x   P X  x  »
([C], trang 81)
Về tính chất của hàm phân bố, [C] nêu một số tính chất như sau :
i)

0  F x   1

ii)

F(x) là một hàm không giảm

iii)

F(x) là một hàm liên tục


iv)
v)

lim FX x   1, lim FX x   0 .

x 

x 

(Quan hệ giữa hàm mật độ và hàm phân bố)

Nếu f(x) và F(x) tương ứng là hàm mật độ và hàm phân bố của đại
lượng ngẫu nhiên X thì f x   F ' x ; F x   

x



([C], trang 82)

f t dt


Ngoài phân phối xác suất, một số các tham số đặc trưng cũng được sử dụng để
đại diện cho đại lượng ngẫu nhiên trong một số trường hợp nào đó cụ thể như : kì vọng
toán học, phương sai, độ lệch chuẩn.
« Những thông tin cô đọng phản ánh từng mặt của đại lượng ngẫu nhiên được
gọi là các tham số đặc trưng. »
([C], trang 84)

d. Các tham số đặc trưng của đại lượng ngẫu nhiên
Liên quan đến các tham số đặc trưng của đại lượng ngẫu nhiên, trong lý thuyết
xác suất, chúng tôi tìm thấy các tham số đặc trưng như : kì vọng, phương sai, mốt,
momen, hệ số bất đối xứng, hệ số nhọn. Tuy nhiên, chúng tôi chỉ trình bày lý thuyết
của các tham số đặc trưng có mặt trong các định lý về luật số lớn
-

Các tham số đặc trưng cho xung hướng trung tâm của biến ngẫu nhiên : kỳ
vọng toán, trung vị, mốt,…

-

Các tham số đặc trưng cho độ phân tán của biến ngẫu nhiên : phương sai, độ
lệch chuẩn, hệ số biến thiên, giá trị tới hạn, momen,…

-

Các tham số đặc trưng cho dạng phân phối xác suất : hệ số bất đối xứng, hệ
số nhọn,…

+ Kì vọng
Kì vọng là một trong những đặc trưng số quan trọng của phân phối xác suất của
đại lượng ngẫu nhiên. Về bản chất và ý nghĩa của kì vọng, [6] có nhận xét :
« Về bản chất : kì vọng là trung bình theo nghĩa xác suất của các đại lượng ngẫu
nhiên
Về ý nghĩa : kì vọng toán phản ánh giá trị trung tâm của phân phối xác suất của
đại lượng ngẫu nhiên »
Đối với đại lượng ngẫu nhiên rời rạc, kì vọng là tổng các tích giữa tất cả các giá
trị của đại lượng ngẫu nhiên và xác suất tương ứng của chúng, được trình bày trong
[C] như sau :

« Đối với biến ngẫu nhiên rời rạc có bảng phân bố xác suất :
X

x1

x2



p

p1

p2




Ta định nghĩa kì vọng (hay còn gọi là giá trị trung bình) của X là số sau đây, kí
hiệu bởi EX :
E X    x i pi »
i 1

([C], trang 47)
Đối với đại lượng ngẫu nhiên liên tục, kì vọng được định nghĩa như sau :
«Nếu X là đại lượng ngẫu nhiên liên tục với hàm mật độf(x), khi đó kì vọng của
X, kí hiệu bởi E(X), là một sốxác định bởi công thức sau
E X  








xf x dx »

([C], trang 84)
+ Phương sai
Phương sai của đại lượng ngẫu nhiên X, kí hiệu D(X), là kì vọng của bình
phương sai lệch của đại lượng ngẫu nhiên X so với kì vọng của nó.
« Phương sai DX của đại lượng ngẫu nhiên X được định nghĩa như kì vọng E(Xm)2 là bình phương của độ lệch của đại lượng X so với kì vọng m = EX. »
([B], trang 59)
Chúng tôi tóm tắt định nghĩa phương sai của đại lượng ngẫu nhiên rời rạc và đại
lượng ngẫu nhiên liên tục trình bày trong [C] như sau :
Trường hợpX là đại lượng ngẫu nhiên rời rạc
« Phương sai của X kí hiệu là DX, là độ lệch bình phương trung bình tức là kì
vọng của X  m  . Vậy ta có định nghĩahay DX   x i 2 pi  m 2 »
2

i 1

([C], trang 48)
Trường hợp X là đại lượng ngẫu nhiên liên tục
“Phương sai của X, kí hiệu bởi DX, là một số xác định bởi DX  E X  m 

2

D X  




 x  m  f x dx , ở đó m  EX


2

»

([C], trang 84)
Ngoài công thức trên, [C] còn cung cấp thêm một công thức biểu diễn phương
sai.


« DX có thể tính theo công thức DX  





x 2 f x dx  m 2 »

([C], trang 84)
e. Một số phân bố xác suất của đại lượng ngẫu nhiên
a. Phân bố Poisson
Định nghĩa :X có phân phối Poisson, ( và kí hiệu là X  P l  ), nếu
X   1,2,... )
P X  k   e l




lk
k!

ở đó λ là một số dương cho trước.
Phân bố Poisson có các tham số đặc trưng : EX = λ, DX = λ, modX = [λ]1
b.Phân bố nhị thức
Xét một phép thử ζ và một biến cố A có liên quan đến phép thử đó có xác suất là
p. Kí hiệu H k là biến cố « A xảy ra đúng k lần trong n phép thử ζ ». Khi đó, theo công
thức Bernoulli ta có nếu kí hiệu P k (n; p) là xác suất để trong một dãy n phép thử độc
lập biến cố A xuất hiện đúng k lần : Pk n; p   C nk p kq n k ở đó p  P (A), q  1  p
Nếu áp dụng công thức Bernoulli với cách đặt X là số lần xuất hiện A trong n lần
thực hiện phép thử ζ thì X là một đại lượng ngẫu nhiên rời rạc và ta có định nghĩa
phân bố nhị thức như sau :
Định nghĩa : Biến ngẫu nhiên X được gọi là có phân bố nhị thức với tham số n,
p, và kí hiệu



X  B n; p  ,



đó

n

∈




0  p  1,

X   0;1;2;...; n  và pk  P X  k   C nk p kq n k ở đó q  1  p .

([C], trang 64)
Các tham số đặc trưng : EX  np , DX  npq ,
f. Khái niệm các loại hội tụ cơ bản của đại lượng ngẫu nhiên

[a] là phần nguyên của a

1

nếu


Trong lý thuyết xác suất, có nhiều khái niệm khác nhau về sự hội tụ của các biến
ngẫu nhiên như là : hội tụ theo phân phối, hội tụ theo xác suất, hội tụ hầu chắc chắn,
hội tụ theo trung bình bậc r. Chúng tôi đặc biệt quan tâm đến các khái niệm hội tụ làm
cơ sở cho luật số lớn, đó là hội tụ theo xác suất và hội tụ hầu chắc chắn. Việc tìm hiểu
khái niệm của hai dạng hội tụ này tạo điều kiện thuận lợi cho việc trình bày lý thuyết
về luật số lớn.
- Hội tụ theo xác suất của dãy đại lượng ngẫu nhiên X n về đại lượng ngẫu nhiên X
theo xác suất được [C] trình bày như sau :
« Ta nói rằng dãy Z1, Z 2 ,... các đại lượng ngẫu nhiên hội tụ theo xác suất tới đại
lượng ngẫu nhiên Z khi

n   nếu

:


Với mọi e  0 , P  Z n  Z  e   0 khi n   . »
([C], trang 151)
Định nghĩa hội tụ hầu chắc chắn được [C] trình bày như sau
« Dãy X n , n  1 được gọi là hội tụ hầu chắc chắn (h.c.c) đến X khi n →∞, kí
h .c .c
 X n   nếutồn tại tập N với P N   0 và với w  N c có
hiệu X n 

X n w   X w  n   »

([C], trang 135)
Trong hai dạng hội tụ trên thì dạng hội tụ hầu chắc chắn là dạng hội tụ mạnh hơn dạng
hội tụ theo xác suất, thể hiện ở định lý sau :
h .c .c
P
X khi n →∞. »
 X thì X n 
« Định lý :Nếu X n 

(theo [B])
Theo định lý này thì một dãy đại lượng ngẫu nhiênX n nếu đã hội tụ hầu chắc
chắn đến đại lượng ngẫu nhiênX thì nó sẽ hội tụ theo xác suất đến đại lượng ngẫu
nhiên X đó. Điều ngược lại nói chung không đúng. Đây cũng chính là cơ sở xây dựng
hai cách phát biểu khác nhau của luật số lớn là luật mạnh số lớn và luật yếu số lớn.
g.Luật số lớn và các định lý liên quan đến luật số lớn
Luật số lớn được biết đến như là « quy luật áp dụng toán học vào tự nhiên, phát
biểu rằng việc tác động đồng thời vô số yếu tố ngẫu nhiên thường dẫn tới những kết
quả hầu như không phụ thuộc vào từng trường hợp. » ([B], trang 49).



« Trong phạm vi của lý thuyết xác suất, luật này được khẳng định dưới dạng các
định lý trong đó nêu lên các điều kiện khá tổng quát để trung bình cộng
1
X1  X 2  ...  Xn  của các đại lượng ngẫu nhiên X1, X 2,..., Xn khi n tăng sẽ
n

tiến dần đến trung bình cộng của các kì vọng toán học 1 EX1  ...  EXn  theo
n

nghĩa xác suất
 X  ...  X n EX1  ...  EXn
P  1


n
n



  e  0 với mọi ε> 0 tùy ý và n →∞ »



([B], trang 49)
Theo phát biểu trên thì, mặc dù trong từng phép thử cụ thể, các giá trị của đại
lượng ngẫu nhiên X k có thể cách xa kì vọng của nó nhưng khi thực hiện càng lúc càng
nhiều phép thử thì xác suất để trung bình số học của dãy đại lượng ngẫu nhiên X k bằng
với trung bình kì vọng của chúng càng lúc càng cao.
Luật số lớn thường được phát biểu bởi hai cách khác nhau tương ứng là luật yếu

số lớn và luật mạnh số lớn. Sự phân biệt hai cách phát biểu trên của luật số lớn được
qui ước ở hai dạng hội tụ. Thuật ngữ « mạnh », « yếu » thể hiện mối quan hệ nội tại
của hai dạng hội tụ. Theo nghĩa đó, nếu dãy đại lượng ngẫu nhiên (X n ) thỏa mãn luật
mạnh số lớn thì nó cũng thỏa mãn luật yếu số lớn. Chúng tôi tiến hành trình bày hai
phát biểu của luật số lớn song song với kết quả ở các định lý có đề cập đến luật số lớn.
Luật số lớn được phát biểu dưới dạng tổng quát như sau :
Cho dãy X1, X 2 ,...X n ,... các đại lượng ngẫu nhiên bất kì có kì vọng EX i  m i

i  1,2,... . Ta nói rằng dãy (X n) tuân theo luật số lớn nếu với mọi ε> 0
 X  ...X



m  ...  m n
1
n
lim 
 1
 e

0
n  

n





Để chứng minh luật số lớn, người ta dùng bất đẳng thức Tchebychev và hệ quả của nó.

Bất đẳng thức Tchebyshev
Cho Y là đại lượng ngẫu nhiên không âm. Khi đó với mọi a > 0 ta có : có kì vọng
E(X) và phương sai D(X) hữu hạn. Khi đó P Y  a   EY
a

([C], trang 155)


« Bất đẳng thức Tchebyshev là bất đẳng thức xác định cận trên của độ lệch xác
suất của đại lượng ngẫu nhiên so với kì vọng toán học của nó »
([B], trang 62)
Hệ quả :Giả sử X là đại lượng ngẫu nhiên với µ = EX. Khi đó với mọi ε> 0 :





P x m  e 

DX
e2

Một cách tương đương ta có với mọi ε> 0





P x  m  e  1


DX
e2

([C], trang 156)
Bất đẳng thức Tchebychev và hệ quả của nó có nhiều ứng dụng và dùng để chứng
minh cho các định lý liên quan đến luật số lớn, phát biểu như sau :
«Giả sử X 1 , X 2 ,… X n ,… là dãy các đại lượng ngẫu nhiên độc lập có cùng phân bố và
có kì vọng là µ và phương sai s 2 . Khi đó trung bình cộng

X1  ...  X n
n

sẽ hội tụ tới µ

theo xác suất.
Một hệ quả quan trọng của luật số lớn đó là định lý Bernoulli hay còn gọi là
luật số lớn Bernoulli. Đây là định lý khẳng định rằng tần suất của một biến cố sẽ hội tụ
theo xác suất tới xác suất của biến cố đó. Nếu chúng ta đi xét một phép thử ngẫu nhiên
ζ và đặt A là một biến cố có liên quan tới phép thử ζ rồi tiến hành phép thử ζ n lần độc
lập và gọi k n là số lần xảy ra A trongn phép thử đó thì tần suất của A được định nghĩa
là tỉ số giữa số lần xảy ra với số lần thực hiện phép thử.
« Tỉ số fn 

kn
n

được gọi là tần suất xuất hiện A trong n phép thử. »

[C], trang 160)
Định lý Bernoulli được phát biểu « Tần suất f n hội tụ về p = P(A) khi n →∞ »

Chúng tôi còn tìm thấy một phát biểu khác tương tự như sau :
Định lý Bernoulli
Trong biểu đồ Bernoulli, khi tăng số phép thử n thì tần suất thành công

Sn
n

(S n

là tổng số thành công) gần tới xác suất thành công p trong một phép thử riêng
biệt. Công thức toán học của định lý Bernoulli được phát biểu như sau :


Khi

n 

thì với e  0 ta có :



 Sn

1
P

p

e





 n




([B], trang 33)
Trong định lý trên có nhắc đến biểu đồ Bernoulli mà theo [B, trang 27] định
nghĩa : « là một mô hình toán học của hai phép thử độc lập với hai kết thúc xác suất
không thay đổi từ phép thử này đến phép thử khác ». Thông thường, một trong các kết
quả được gọi là « thành công » có xác suất p, kết quả còn lại được gọi là « thất bại » có
xác suất q  1  p .
Rõ ràng, với dãy các biến cố với các kết cục bù nhau (trong biểu đồ Bernoulli),
khi thực hiện càng nhiều phép thử thì tần suất của biến cố đó ngày càng gần với xác
suất của nó. Đây được coi là một phương pháp hiệu quả để xấp xỉ xác suất. Chẳng hạn,
thực nghiệm gieo đồng xu của Buffon ở thế kỉ 18, nhà toán học này đã gieo một dồng
tiền cân đối trong 4040 lần và ghi lại được 2048 lần xuất hiện mặt ngửa. Như vậy, tần
suất xuất hiện mặt ngửa là 0,507. Nhà thống kê người Anh gieo 12000 lần và thu được
tần suất mặt ngửa là 0,5016, và gieo trong 24000 lần thì thu được tần suất xuất hiện
mặt ngửa là 0,5005. Trong khi, chúng ta đã biết theo công thức xác suất cổ điển, xác
suất để xuất hiện mặt ngửa là 0,5.
Luật số lớn còn được mở rộng cho trường hợp dãy đại lượng ngẫu nhiên (X n )
độc lập có cùng kì vọng, nhưng không nhất thiết cùng phương sai.
« Định lý : Giả sử X1, X 2 ,..., X n là các đại lượng ngẫu nhiên độc lập sao cho
EX1  EX 2  ...EX n  m và DXi  C với mọi i  1,2,...
n

Khi đó trung bình cộng X n 


X
i 1

n

i

hội tụ theo xác suất tới µ. »

([C], trang 161)
Kết quả định lý sau đây (định lý Markov) cho ta một điều kiện khác của một dãy đại
lượng ngẫu nhiên tuân theo luật số lớn.
« Nếu dãy X1, X 2 ,... thỏa mãn điều kiện
(X n ) tuân theo luật số lớn. »
([C], trang 162)


1  n
X

 i   0 khi n   thì dãy
n 2  i 1 


×