Tải bản đầy đủ (.pdf) (145 trang)

các tham số định tâm trong dạy học thống kê ở lớp 10

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.88 MB, 145 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH

PHẠM THỊ TÚ HẠNH

CÁC THAM SỐ ĐỊNH TÂM
TRONG DẠY HỌC THỐNG KÊ Ở LỚP 10

LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC

Thành phố Hồ Chí Minh - 2012


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH

PHẠM THỊ TÚ HẠNH

CÁC THAM SỐ ĐỊNH TÂM
TRONG DẠY HỌC THỐNG KÊ Ở LỚP 10

Chuyên ngành: Lý luận và phương pháp dạy học môn Toán
Mã số: 60 14 10

LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. VŨ NHƯ THƯ HƯƠNG

Thành phố Hồ Chí Minh – 2012



LỜI CẢM ƠN
Tôi xin dành những dòng đầu tiên để bày tỏ lòng biết ơn chân thành tới Tiến
sĩ Vũ Như Thư Hương. Chính Cô là người tận tình hướng dẫn, động viên tinh thần
và giúp đỡ tôi về mặt nghiên cứu khoa học trong suốt quá trình luận văn.
Bên cạnh đó, tôi cũng cảm nhận được sự tận tâm của PGS.TS. Lê Thị Hoài
Châu, PGS.TS. Lê Văn Tiến, TS. Trần Lương Công Khanh, TS. Lê Thái Bảo Thiên
Trung và Quý Thầy Cô trường Đại học Sư phạm Thành phố Hồ Chí Minh trong
công tác giảng dạy của mình. Tôi xin gửi lời cảm ơn sâu sắc đến Quý Thầy Cô vì đã
truyền thụ cho tôi kiến thức và niềm say mê đối với chuyên ngành didactic toán.
Mặc dù bất đồng về ngôn ngữ và thời gian tiếp xúc không nhiều, nhưng các
giáo sư Pháp đã khiến tôi khâm phục và vô cùng kính trọng vì tinh thần làm việc
hăng say và đầy trách nhiệm của họ. Xin chân thành cảm ơn PGS.TS. Claude
Comiti, PGS.TS. Annie Bessot, TS. Alain Birebent đã giúp chúng tôi có cái nhìn
rộng mở hơn đối với các vấn đề về didactic.
Đặc biệt, xin gửi lời cảm ơn ThS. Tăng Minh Dũng đã giúp đỡ tôi về phần tài
liệu tham khảo trong thời điểm bắt đầu nghiên cứu luận văn. Đồng thời, cho phép
tôi bày tỏ lòng biết ơn của mình với TS. Trần Lương Công Khanh vì những lời
khuyên chân thành và hữu ích của Thầy dành cho tôi khi tôi cần sự giúp đỡ.
Trong suốt quá trình thực hiện luận văn, sự động viên của gia đình, bạn bè, sự
giúp đỡ của Ban Giám hiệu và các đồng nghiệp trường THPT chuyên Trần Đại
Nghĩa trong hoạt động giảng dạy là động lực để tôi tiếp tục phấn đấu và hoàn thành
luận văn. Tôi xin gửi đến họ lòng biết ơn sâu sắc và những tình cảm yêu mến nhất.
Cuối cùng, tôi xin cảm ơn Ban giám hiệu và các học sinh trường THPT
Lương Thế Vinh, Q.1, Trung học thực hành Đại học sư phạm, Quận 5 đã giúp đỡ
tôi trong vấn đề thực nghiệm của luận văn.
Phạm Thị Tú Hạnh


MỤC LỤC

MỤC LỤC
DANH MỤC CÁC TỪ VIẾT TẮT
MỞ ĐẦU
1.

Những ghi nhận ban đầu và câu hỏi xuất phát .................................................1

2.

Mục đích nghiên cứu và khung lý thuyết tham chiếu ......................................3

3.

Phương pháp nghiên cứu .................................................................................4

4.

Tổ chức luận văn ..............................................................................................5

Chương 1: VAI TRÒ VÀ Ý NGHĨA CỦA SỐ TRUNG VỊ Ở CẤP ĐỘ TRI THỨC
KHOA HỌC
1.1. Một số nét sơ lược về sự hình thành và phát triển của số trung vị ..................8
1.2. Vai trò và ý nghĩa của số trung vị trong phạm vi toán ở bậc đại học ............12
1.3. Kết luận chương 1 ..........................................................................................21
Chương 2: VAI TRÒ VÀ Ý NGHĨA CỦA SỐ TRUNG VỊ Ở CẤP ĐỘ TRI
THỨC CẦN GIẢNG DẠY
2.1. Phân tích chương trình ...................................................................................23
2.2. Phân tích sách giáo khoa ................................................................................26
2.3. Kết luận chương 2 ..........................................................................................37
Chương 3: NGHIÊN CỨU THỰC HÀNH GIẢNG DẠY CỦA GIÁO VIÊN VÀ

THỰC NGHIỆM 1
3.1. Nghiên cứu thực hành giảng dạy của giáo viên .............................................39
3.2. Thực nghiệm 1 ...............................................................................................57
3.2.1. Hệ thống câu hỏi thực nghiệm 1 ...........................................................58
3.2.2. Phân tích thực nghiệm 1 .......................................................................58
3.3. Kết luận chương 3 ..........................................................................................75
Chương 4: THỰC NGHIỆM 2
4.1. Mục đích thực nghiệm ...................................................................................77
4.2. Hình thức và nội dung thực nghiệm...............................................................77
4.2.1. Hình thức thực nghiệm .........................................................................77


4.2.2. Bài toán thực nghiệm ............................................................................77
4.2.3. Dàn dựng kịch bản ................................................................................78
4.3. Phân tích tiên nghiệm.....................................................................................81
4.4. Phân tích hậu nghiệm .....................................................................................87
4.5. Kết luận chương 4 ..........................................................................................97
KẾT LUẬN
TÀI LIỆU THAM KHẢO
PHỤ LỤC


DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt

Từ đầy đủ

GV

Giáo viên


HS

Học sinh

SGK

Sách giáo khoa

SGV

Sách giáo viên

SGKnc

Sách giáo khoa nâng cao

SGKcb

Sách giáo khoa (bộ cơ bản)

SGVnc

Sách giáo viên (nâng cao)

SGVcb

Sách giáo viên (bộ cơ bản)

YN1


Ý nghĩa 1

YN2

Ý nghĩa 2


MỞ ĐẦU
1.

Những ghi nhận ban đầu và câu hỏi xuất phát
Khoa học tự nhiên, khoa học xã hội và khoa học kĩ thuật thường dựa trên các

khái niệm thống kê và sử dụng rộng rãi các phương pháp thống kê. Xác suất và
thống kê là mảng lý thuyết quan trọng trong lĩnh vực toán ứng dụng, có mặt trong
rất nhiều chương trình đào tạo của các chuyên ngành khác nhau như kinh tế, kĩ
thuật, ngân hàng, nông lâm,… Không chỉ trong khoa học mà cả trong đời sống, khi
xác định chiến lược phát triển kinh tế và văn hóa xã hội, ta luôn phải đụng chạm
đến những quá trình, hiện tượng chứa đựng các yếu tố ngẫu nhiên mà ở đó, nếu
không biết được các quy luật thống kê thì không thể điều khiển được quá trình sản
xuất và phát triển xã hội.
Với ý nghĩa như vậy, ở Việt Nam, thống kê được đưa vào chương trình phổ
thông ở lớp 7 và lớp 10 nhằm trang bị cho học sinh những khái niệm cơ bản về
thống kê, và quan trọng hơn hết là giúp học sinh hiểu được ý nghĩa “những con số
khô khan” trong bảng thống kê, rút ra được những kết luận, nhận xét hợp lý. Khái
niệm thường được sử dụng để làm căn cứ phân tích các số liệu thống kê bao gồm:
tính hội tụ (mode), trung vị (median), trung bình (mean), độ phân tán (biến thiên,
phương sai, độ lệch chuẩn), phân bố chuẩn.
Học sinh được tiếp cận các khái niệm số trung bình, mốt từ rất sớm (số trung

bình: lớp 4, 7; mốt: lớp 7), sau đó được tìm hiểu sâu hơn trong chương trình lớp 10
cùng với các khái niệm số trung vị, phương sai và độ lệch chuẩn. Theo quan sát của
chúng tôi (thông qua việc phân tích chương trình, SGK), chương trình Toán lớp 7
và lớp 10 đều tập trung vào việc tính các tham số định tâm hơn là việc phân tích ý
nghĩa của chúng. Điều đó gợi cho chúng tôi những suy nghĩ sau:

− Liệu học sinh có hiểu được vai trò và ý nghĩa của các tham số định tâm? Học
sinh có thể dựa vào các bảng số liệu thống kê để rút ra được một số nhận xét,
đánh giá của mình về vấn đề đang được xem xét?


− Nếu không, nguyên nhân của việc học sinh không nắm được vai trò và ý nghĩa
của các tham số định tâm là gì? Có phương pháp nào giúp học sinh vượt qua
những khó khăn đó?
Chúng tôi tiến hành một thực nghiệm nhỏ dành cho 80 học sinh lớp 11 (đối
tượng đã học xong chương “Thống kê”):
Điểm kiểm tra 1 tiết môn Toán của lớp 11A như sau:
9

10

7

6

9

6

8


3

5

7

7

3

10

9

10

6

10

6

7

8

5

5


5

3

10 6

5

9

9

8

6

10 7

6

8

7

7

8

Số trung vị của mẫu số liệu trên là .........................................................................

Kết quả nhận được như sau:
Câu trả lời của HS

7

7,1

6 và 7

Bỏ trống

Khác

Số lượng (80 HS)

16

38

12

6

8

20%

47,5%

15%


7,5%

10%

80%
Có thể thấy chỉ có 20% học sinh có câu trả lời chính xác, các học sinh còn lại
nhầm số trung bình và số trung vị (7,1), số trung vị và mốt (6 và 7), tính toán sai
(câu trả lời khác: 6,33; 7,6…)
Chúng tôi cũng tiến hành phỏng vấn một số học sinh này sau khi đã làm thực
nghiệm thì nhận được những câu trả lời như: “nhầm số trung bình và số trung vị”,
“không nhớ số trung vị là gì”,…
Đứng trước những ứng xử của học sinh như trên, chúng tôi tự hỏi liệu trong quá
trình giảng dạy, giáo viên có bỏ qua một khâu nào đó về các tham số định tâm hay
không? Chương trình, sách giáo khoa trình bày các tham số định tâm như thế nào?
Từ những ghi nhận ban đầu này, chúng tôi tìm hiểu một số tài liệu tham khảo, trong
đó có tài liệu của Quách Huỳnh Hạnh (Quách Huỳnh H. (2005), Một nghiên cứu sư
phạm về dạy – học thống kê mô tả ở trường trung học phổ thông (Luận văn tốt
nghiệp), Thành phố Hồ Chí Minh) và tài liệu của Mai Đức Thắng (Mai Đức T.


(2006), Máy tính bỏ túi trong dạy – học thống kê ở lớp 10 (Luận văn thạc sĩ giáo
dục học), Thành phố Hồ Chí Minh) đã trình bày những khó khăn trong việc dạy –
học thống kê mô tả trong trường trung học phổ thông. Đặc biệt, Mai Đức Thắng đã
chứng minh được giả thuyết nghiên cứu sau:
- “H1: Sau khi giải xong bài toán thống kê, giáo viên và học sinh không có nhiệm vụ
xem xét lại kết quả tìm được có phù hợp với thực tế bài toán thống kê hay không.”
- “H2: Học sinh không nắm được “nghĩa thống kê” của một số khái niệm cơ bản trong
thống kê mô tả.”


Và Quách Huỳnh Hạnh cũng đưa ra kết quả nghiên cứu:
“Giáo viên tập trung vào việc xây dựng kỹ thuật tính toán trên công thức và trên máy
tính cho học sinh, dành thời lượng thích đáng cho việc hướng dẫn học sinh biểu diễn số
liệu bằng bảng tần số và biểu đồ nhưng lại chưa chú trọng đến những bài toán yêu cầu
đưa ra nhận xét.”

Chúng tôi đặc biệt chú ý đến nội dung về sự quan tâm chưa đúng mức của giáo
viên trong việc tìm hiểu các khái niệm thống kê. Tuy nhiên, trong khuôn khổ luận
văn và một số lý do về thời gian, chúng tôi chỉ trình bày chi tiết về một tham số
định tâm chưa được khai thác nhiều: số trung vị.
2.

Mục đích nghiên cứu và khung lý thuyết tham chiếu
Với những câu hỏi xuất phát như trên, mục đích nghiên cứu của chúng tôi là:

− Làm rõ những lựa chọn sư phạm trong việc dạy học số trung vị.
− Tìm hiểu thực hành giảng dạy số trung vị của giáo viên.
Do đó, thuyết nhân học trong didactic toán với những khái niệm như “chuyển
hóa sư phạm”, “mối quan hệ cá nhân”, “mối quan hệ thể chế”… sẽ là công cụ lý
thuyết mà chúng tôi sử dụng trong nghiên cứu của mình. Ngoài ra, trong việc thiết
kế các tiểu đồ án dạy học, chúng tôi sẽ chọn lý thuyết tình huống, hợp đồng didactic
làm công cụ lý thuyết tham chiếu.
Trong phạm vi lý thuyết đã lựa chọn, từ các câu hỏi ban đầu, chúng tôi phát
biểu các câu hỏi nghiên cứu như sau:
Q1: Ở cấp độ tri thức khoa học, ý nghĩa và vai trò của số trung vị trong thực
hành thống kê là gì?


Q2: Trong thể chế dạy học toán ở Việt Nam, số trung vị có vai trò và ý nghĩa
gì? So với tri thức khoa học, vai trò và ý nghĩa nào được đặt ra? Vai trò và

ý nghĩa nào không được chú trọng?
Q3: Với những ràng buộc của thể chế, tổ chức toán học nào đã được hình thành
trong thực hành giảng dạy số trung vị của giáo viên? Điều đó ảnh hưởng
thế nào đến mối quan hệ của cá nhân học sinh với tri thức số trung vị?
3.

Phương pháp nghiên cứu
Để trả lời những câu hỏi nêu trên, chúng tôi xác định phương pháp nghiên cứu

như sau:

− Nghiên cứu tri thức ở cấp độ khoa học về vai trò và ý nghĩa của số trung vị trong
thực hành thống kê. Nghiên cứu này sẽ cho phép chúng tôi trả lời câu hỏi Q1,
kết quả của nghiên cứu sẽ làm cơ sở tham chiếu khi phân tích thực hành giáo
viên, đồng thời góp phần trả lời câu hỏi Q2. Phân tích một số tài liệu liên quan
đến thực hành giáo viên trong dạy học thống kê, những khó khăn của việc dạyhọc thống kê mô tả ở lớp 10. Điều này giúp chúng tôi có thể mô phỏng trước
những tình huống có thể xảy ra trong thực hành giáo viên, đồng thời đó chính là
cơ sở đối chiếu cho kết quả về kiến thức số trung vị của mẫu dữ liệu.

− Phân tích chương trình, sách giáo khoa lớp 10 hiện hành của Việt Nam để làm rõ
những tổ chức toán học cần giảng dạy và những ràng buộc của thể chế đối với tri
thức. Sau khi phân tích chương trình, sách giáo khoa, đối chiếu với những
nghiên cứu tri thức ở cấp độ khoa học, chúng tôi sẽ đưa ra các giả thuyết của
luận văn.

− Phân tích tiên nghiệm một số tình huống chọn lọc thuộc mảng tri thức nghiên
cứu. Tiến hành quan sát (ghi âm, ghi hình,…) một số tiết dạy của giáo viên về số
trung vị để tìm hiểu độ lệch giữa tổ chức toán học cần giảng dạy và tổ chức toán
học được giảng dạy. Sau đó dùng các khái niệm của didactic như tổ chức toán
học, tổ chức didactic… để phân tích các tiết học được quan sát, phân tích hậu

nghiệm, đối chiếu với phân tích tiên nghiệm,... rút ra những kết quả nghiên cứu.

− Từ đó, chúng tôi sẽ đề nghị một tiểu đồ án dạy học số trung vị để bổ sung nếu
cần thiết.


4.

Tổ chức luận văn
Luận văn gồm phần mở đầu, phần kết luận và 4 chương
Trong phần mở đầu, chúng tôi trình bày những ghi nhận ban đầu, câu hỏi xuất

phát, lý thuyết tham chiếu, mục đích và phương pháp nghiên cứu, tổ chức luận văn.
Chương 1: Vai trò và ý nghĩa của số trung vị ở cấp độ tri thức khoa học
Chương 2: Vai trò và ý nghĩa của số trung vị ở cấp độ tri thức cần giảng dạy

− Phân tích chương trình, sách giáo khoa Toán 10 hiện hành của Việt Nam.
− Kết luận
Chương 3: Nghiên cứu thực hành giảng dạy của giáo viên và thực nghiệm 1.

− Quan sát và phân tích một số tiết học về số trung vị.
− Tiến hành thực nghiệm 1 đối với lớp học được quan sát để điều tra quan
niệm của học sinh đối với số trung vị, ảnh hưởng của mối quan hệ thể chế
về vai trò và ý nghĩa của số trung vị lên mối quan hệ cá nhân tương ứng
của học sinh. Thực nghiệm 1 cũng được tiến hành với các đối tượng học
sinh cùng cấp lớp để khẳng định hoặc bác bỏ các nhận xét được rút ra khi
phân tích thể chế dạy học.
Chương 4: Thực nghiệm 2

− Xây dựng một tình huống nhằm cung cấp cho học sinh một “nghĩa” của

số trung vị.
Trong phần kết luận chung, chúng tôi trình bày một số kết quả đạt được của
chương 1, 2, 3, 4 đồng thời nêu lên một số hướng nghiên cứu mở ra từ đề tài.


Chương 1: VAI TRÒ VÀ Ý NGHĨA CỦA SỐ
TRUNG VỊ Ở CẤP ĐỘ TRI THỨC KHOA HỌC
Trước khi nêu lên những điểm chính trong chương này, chúng tôi muốn đề cập
đến hai thuật toán đã gây cho chúng tôi những thoạt nhiên nghi ngờ trong “lần gặp
gỡ đầu tiên”.
Trước tiên, xét một bài toán tương đối quen thuộc như sau:
Tìm giá trị nhỏ nhất của biểu thức A = x + 2 + x − 1 (1).
Rõ ràng

neáu a ≥ 0

a
a =
-a

neáu a < 0

Như vậy, chúng ta có thể “khử dấu giá trị tuyệt đối” bằng cách xét dấu các nhị
thức bậc nhất, sau đó dùng các phương pháp như vẽ đồ thị, khảo sát sự biến thiên
của hàm số,… để tìm giá trị nhỏ nhất của biểu thức A. Vấn đề đặt ra là nếu bài toán
yêu cầu tìm giá trị nhỏ nhất của biểu thức=
B

n


∑ x −a
i =1

thì phương pháp “khử dấu

i

giá trị tuyệt đối” trở nên không hữu hiệu.
Với bất đẳng thức về dấu giá trị tuyệt đối, ví dụ như:

a + b ≥ a+b
Dấu “=” xảy ra khi ab ≥ 0
thì chúng ta dễ dàng đưa ra thuật toán để tìm giá trị nhỏ nhất của biểu thức B.
Thuật toán như sau:
Bước 1: Sử dụng tính chất giao hoán của phép cộng, sắp xếp các số hạng x − a i
theo thứ tự tăng dần (hoặc giảm dần) các a i . Lúc này ta có=
B

{

} {a

b1 ≤ b 2 ≤ ... ≤ b n hoặc b1 ≥ b 2 ≥ ... ≥ b n ( bi ,i ∈1, n =

k

}

n


∑ x−b
i =1

i

với

, k ∈1, n ).

Bước 2: Giả sử các giá trị b i được sắp theo thứ tự tăng dần.
• Nếu n là số lẻ, biến đổi B=

n −1
2

∑ x − bi +
i =1

n



n +3
i=
2

bi − x + x − b n +1 . Áp dụng bất
2




n −1 
đẳng thức giá trị tuyệt đối với các cặp x − bi và b n +1−i − x với  i ∈1,
 , ta
2


có:
B≥

n

n −1
2

∑ b − ∑b

+ x−b



n −1
2

n

∑ b − ∑b

i
i

n +1
i
n +3
n +3
i 1=
i 1
=
2
i =
i
=
2
2

i

Xét dấu “=” xảy ra, ta có

 x ∈  [ bi ; b n +1−i ]


 x ∈  b n −1 ; b n +3 

n −1
i∈1,
2  ⇔ x =
 2
2
⇔
b n +1


2
 x = b n +1
 x = b n +1
2

2

Vậy B đạt giá trị nhỏ nhất khi x = b n +1
2

• Nếu n là số chẵn, biến đổi B=

n
2

∑ x − bi +
i =1

n



bi − x . Áp dụng bất đẳng

n
i= +1
2



n
thức giá trị tuyệt đối cho các cặp x − bi và b n +1−i − x với  i ∈1,  , ta có:
2

n
2

n

∑ b − ∑b

B≥

i

i=

n
+1
2

i =1

i



Xét dấu “=” xảy ra, ta có x ∈  [ bi ; b n +1−i ] ⇔ x ∈  b n ; b n 
n
 2 2 +1 

i∈1,
2



Vậy B đạt giá trị nhỏ nhất khi x ∈  b n ; b n  .
 2 2 +1 
Chúng tôi bắt gặp một chút bối rối và nghi ngờ khi so sánh thuật toán này với
thuật toán tìm số trung vị của mẫu số liệu:
Giả sử ta có một mẫu gồm N số liệu được sắp xếp theo thứ tự không giảm. Nếu
N là một số lẻ thì số liệu đứng thứ

N +1
(số liệu đứng chính giữa) gọi là số trung vị.
2

Trong trường hợp N là một số chẵn, ta lấy số trung bình cộng của hai số liệu
đứng thứ

N
N
và + 1 làm số trung vị.
2
2

Số trung vị được kí hiệu là M e
([4], trang 172)


Liệu rằng đây chỉ là sự trùng hợp ngẫu nhiên? hay có một mối liên hệ nào đó

giữa thuật toán tìm số trung vị của dãy số liệu trong thống kê và bài toán tìm giá trị
nhỏ nhất của biểu thức=
B

n

∑ x −a
i =1

i

? nếu có, mối liên hệ đó là gì? Nó có được làm

rõ trong các giáo trình đại học về thống kê hoặc trong mảng kiến thức về thống kê
được trình bày ở phổ thông hay không?
Để tìm câu trả lời cho những câu hỏi tương tự như vậy, chúng tôi theo dòng lịch
sử xuất hiện số trung vị nói riêng, và các tham số định tâm nói chung. Vì lý do thời
gian và hạn chế về tài liệu, chúng tôi chưa thực hiện được phân tích khoa học luận
cũng như phân tích lịch sử hình thành các tham số định tâm. Sau đây, chúng tôi chỉ
nêu một số nét khái quát về sự xuất hiện của các tham số định tâm, đặc biệt là số
trung vị, đồng thời nêu những kết luận, nhận định cá nhân rút ra từ các sự kiện này.
Từ những nét chính về sự ra đời của số trung vị, chúng tôi sẽ tiếp tục phân tích
các giáo trình đại học để thấy được vai trò và ý nghĩa của nó ở cấp độ tri thức khoa
học.
Những tóm tắt dưới đây chúng tôi chủ yếu dựa vào các tài liệu:
 Boyé A, Comairas M.-C. (2002), Moyenne, medidane, écart-type. Quelques
regards sur l’histoire pour éclairer l’enseignement des statistiques, Repères-IREM,
No48, p.27-40.

 Duperret J-C (2002), Des statistiques à la pensée statistique, IREM de Reims.

1.1. Một số nét sơ lược về sự hình thành và phát triển của số trung vị
Thống kê xuất hiện cùng lúc với những cấu trúc xã hội đầu tiên của loài người,
được sử dụng ở Châu Âu đầu tiên bởi các nhà buôn. Tuy nhiên, mãi đến thế kỉ thứ
18, người ta mới thấy được vai trò dự đoán của thống kê và đến thế kỉ 19, thống kê
mới thực sự phát triển.
Thống kê toán học xuất hiện dựa trên những công trình nghiên cứu liên quan
đến xác suất của Pierre de Fermat (1601 – 1665) và Blaise Pascal (1623 – 1662).
Người ta tìm thấy nguồn gốc của số trung bình và trung vị từ thiên văn học.
Vào thế kỉ 18, Copecnic, Kepler và đặc biệt là Newton đã nghiên cứu thiên văn học
dựa trên lý thuyết toán học. Nhưng công việc của các nhà thiên văn học lại dựa trên
công việc đo đạc, điều này không tránh khỏi các sai sót ngay cả khi đã có một lý


thuyết tốt. Những sai số này sinh ra một phần do con người, một phần do các dụng
cụ đo đạc không chính xác tuyệt đối. Chẳng hạn, khi người ta tiến hành đo đạc với
một dụng cụ quang học, vẫn còn đó những khuyết điểm khi quan sát, những biến
không thể kiểm soát được của sự khúc xạ trong môi trường, những rung động khác
nhau,… tất cả những nguyên nhân này ảnh hưởng đến độ chính xác của đo lường.
Khi người ta thực hiện cùng một phép đo 10 lần, 100 lần,… người ta không bao giờ
nhận được cùng một kết quả. Đặc biệt, trong các trường hợp quan sát gián tiếp (ví
dụ: đo khối lượng của một ngôi sao) thì kết quả thu được chỉ thông qua các phương
trình trung gian dựa trên rất nhiều sự đo đạc các biến tự nhiên.
Mặc dù con người đã cố gắng cải thiện, nhưng sai số vẫn tồn tại. Điều này
khiến cho các nhà khoa học bắt đầu quan tâm đến các sai số để có thể đưa ra các
tính toán hợp lý hơn. Phải tìm ra những phương tiện cho phép tính toán nhiều đo
đạc cùng một hiện tượng nhưng hạn chế thấp nhất có thể sai số cuối cùng trên giá trị
chính xác của hiện tượng. Trung bình số học thoạt tiên là một lựa chọn hàng đầu.
Tại sao? Bởi vì trung bình số học đã xuất hiện từ lâu, người ta đã luôn thực hiện nó
và cảm thấy an tâm về tính chắc chắn của nó. Tuy nhiên, số trung bình trong một số
trường hợp lại không tốt lắm.

Trong bài báo “milieu” (1770), Jean III Bernoulli đã đề xuất khái niệm
“milieu”. Ông không nói “milieu” là số trung bình hay trung vị, điều đó có nghĩa là
ông không đưa ra một định nghĩa toán học cho khái niệm “milieu” này; mà đặt ra
một vấn đề nghiên cứu một giá trị tối ưu, được gọi là “milieu” và bắt đầu mang đến
nó một câu trả lời cho cách tính đến yếu tố "xác suất chính xác của quan sát" ("du
plus ou moins de probabilité de l’exactitude des observations").
Vấn đề chọn một “milieu” tối ưu liên quan đến hai vấn đề khác: chọn một mô
hình phân bố các sai số và ước lượng giá trị chính xác.
Giá trị “milieu” tốt nhất chính là giá trị làm tối tiểu hóa các sai số. Nếu người
ta tối tiểu hóa tổng các chênh lệch (giữa giá trị đo được và giá trị chính xác), người
ta nhận được trung vị (trong mô hình mũ của Laplace thì “milieu” chính là trung
vị); và nếu người ta tối tiểu hóa tổng bình phương của cùng những chênh lệch ấy,
người ta nhận được số trung bình.


Nói một cách cụ thể hơn, cho một dãy thống kê ( x1 , x 2 ,..., x n ) có thể xem như
một vectơ của trong không gian R n . Vấn đề đặt ra là thay thế vectơ này bằng vectơ

( a ,a ,...,a )

làm tối tiểu hóa một khoảng cách cho trước trên R n từ tập X đến tập

vectơ ( u , u ,..., u ) .
n

∑(x

Xét khoảng cách Euclide d=
( X ,Y )


i =1

− yi ) , người ta tìm thấy lời giải
2

i

duy nhất: đó chính là hình chiếu vuông góc của X lên R n . Vectơ cần tìm lúc này
chính là vectơ mà các tọa độ của chúng bằng nhau và bằng trung bình của dãy dữ
liệu. Khoảng cách từ X đến “vectơ trung bình” chính là “độ lệch chuẩn”.
Xét khoảng cách d1 ( X=
,Y )

n

∑x
i =1

i

− yi . Khoảng cách này không phải là

khoảng cách Euclide, nhưng hai chuẩn sau là hai chuẩn tương đương (tức chúng
đẳng cấu nhau):

=
x
=
x


n

∑(x )

x1 , x 2 ,..., x n )  x e
(=

i =1

2

i

n

x1 , x 2 ,..., x n )  x 1 ∑ x i
(=
i =1

(chuẩn . e được gọi là chuẩn Euclide)
Sắp xếp các x i theo thứ tự tăng dần, người ta nhận được một dãy mới có sắp
thứ tự ( y1 , y 2 ,..., y n ) . Có hai trường hợp xảy ra:
• Nếu n là số lẻ ( n = 2k + 1, k ∈  ), người ta xét yếu tố trung tâm, tức là xét
giá trị y k +1 . Vectơ cần tìm lúc này chính là vectơ có các tọa độ bằng nhau và
bằng y k +1 và đây cũng là lời giải duy nhất. Giá trị y k +1 được gọi là trung vị
của dãy X.
• Nếu n là số chẵn=
( n 2k , k ∈  ), không có duy nhất một lời giải. Nói một
cách cụ thể hơn, tất cả các vectơ có tọa độ bằng nhau và bằng giá trị a với


a ∈ [ y k ; y k +1 ] đều thỏa mãn điều kiện. Người ta chọn trung vị chính là trung
bình cộng của y k và y k +1 .


Một câu hỏi đặt ra là trung bình hay trung vị sẽ được lựa chọn làm giải pháp
sau cùng. Việc dễ dàng tính được tổng bình phương hơn tổng giá trị tuyệt đối đã
giúp cho số trung bình có ưu thế hơn. Mặt khác, người ta cũng tìm thấy khái niệm
số trung bình đã được sử dụng từ trước đó nhiều năm (người ta biết về nó trong
những bài viết của người Babylon (500-300 trước công nguyên) với nguồn gốc là từ
việc thực hiện rất nhiều phép đo trên cùng một hiện tượng). Điều này giúp củng cố
niềm tin khi sử dụng số trung bình vốn quen thuộc hơn là số trung vị.
Năm 1805, trong tác phẩm “Nouvelles méthodes pour la détermination des
orbites des comètes” của mình, Legendre đã đề cập đến phương pháp bình phương
tối tiểu. Năm 1809, Gauss công bố lý thuyết đầu tiên của phương pháp bình phương
tối tiểu và đưa ra phân phối Gauss (cũng được xem như một phân phối các sai số):

1
Φ(x) = e
h π



x2
h2

(trong đó h là một hệ số tỉ lệ với số m mà Gauss gọi là “l’erreur moyenne à
craindre” mà ngày nay chúng ta gọi là độ lệch chuẩn)
Ở đây, phương pháp bình phương tối tiểu và đường cong Gauss có mối liên hệ
với nhau, không có gì cho thấy nó có sự liên hệ thực tiễn, đó chỉ thuần túy là một
bài tập toán học.

Bắt đầu từ thế kỉ 20, lí thuyết xác suất chứng tỏ vị trí trung tâm của nó với tất cả
các mối liên kết và các vấn đề mà khoa học hiện đại giới thiệu. Lý thuyết thống kê
bắt đầu cất cánh với sự xuất bản một nghiên cứu của R.A. Fischer (năm 1915) về sự
phân bố của hệ số tương quan của một mẫu số liệu. Việc nghiên cứu này là sự bắt
đầu của một dãy các công trình của tác giả về sự phân bố chính xác của những mẫu
thống kê khác nhau và kể từ thời của Fischer, khoa học thống kê này càng phát
triển, chạm đến nhiều vấn đề như mối liên hệ của chọn mẫu, lí thuyết ước lượng,
phân tích từng dãy, lí thuyết quyết định,...
Nhận xét
Như vậy, rõ ràng trung bình và trung vị của dãy dữ liệu có chung mục đích là
nhằm tối tiểu hóa các sai số; nhưng chúng được sinh ra bằng cách sử dụng các


chuẩn khác nhau (nhưng tương đương nhau). Điều này cho thấy chúng có mối quan
hệ chặt chẽ, đôi khi có thể tạo nên sự nhầm lẫn hoặc những khó khăn trong việc
phân biệt số trung bình và số trung vị của dãy dữ liệu. Theo dòng sự kiện, chúng tôi
nhận thấy số trung bình xuất hiện lâu đời và có nền tảng vững chắc nên ưu thế sử
dụng của nó vẫn trội hơn số trung vị. Tuy nhiên, trong nhiều trường hợp, trung bình
số học tỏ ra không hiệu quả, điều đó cho phép số trung vị thể hiện vai trò của mình
trong thống kê.
Ngoài nhận xét trên, chúng tôi còn băn khoăn những điểm sau đây:
− Số trung vị được sinh ra với mục đích tối tiểu hóa sai số, nhưng khi chuyển
qua tri thức cần dạy, liệu ý nghĩa ban đầu của nó có bị biến đổi? Quay lại hai thuật
toán mà chúng tôi đã đề cập ở đầu chương, liệu rằng học sinh có nhận biết được mối
quan hệ của chúng? hay chỉ nhìn nhận chúng như hai vấn đề khác nhau được trình
bày trong hai phân môn của toán học: thống kê và giải tích?
− Phương sai và độ lệch chuẩn có mối quan hệ mật thiết với trung bình, vì
chúng được xây dựng dựa trên số trung bình, nhưng trung bình và trung vị lại có
những nét tương đồng bởi chúng được sinh ra từ hai chuẩn tương đương. Như vậy,
liệu có thể xây dựng phương sai và độ lệch chuẩn thông qua trung vị? cách xây

dựng đó có tạo nên những điểm khác biệt về ý nghĩa của phương sai, độ lệch
chuẩn? có khó khăn hay thuận tiện gì so với việc xây dựng qua trung bình?
Để hiểu rõ hơn những vấn đề trên, ngoài việc tìm kiếm thêm các tư liệu lịch sử,
chúng tôi còn tiến hành phân tích, tổng hợp các kiến thức trình bày trong các giáo
trình đại học về các tham số định tâm, cụ thể là số trung vị của mẫu số liệu.
1.2. Vai trò và ý nghĩa của số trung vị trong phạm vi toán ở bậc đại học
Trong phần này, chúng tôi muốn tìm câu trả lời cho câu hỏi Q1:
Q1: Ở cấp độ tri thức khoa học, ý nghĩa và vai trò của số trung vị trong thực
hành thống kê là gì?
Để đạt được mục tiêu này, chúng tôi chọn nghiên cứu hai nhóm giáo trình sau:
Nhóm 1
[1] Đặng Hùng Thắng (2008), Thống kê và ứng dụng, NXB Giáo dục.


[2] Tống Đình Quỳ (2004), Giáo trình Xác suất thống kê, NXB Đại học Quốc
gia Hà Nội.
[3] Nguyễn Chí Long (2006), Xác suất thống kê và quá trình ngẫu nhiên,
NXB Đại học Quốc gia Thành phố Hồ Chí Minh.
Nhóm 2
[4] Lê Trung Chính, Đoàn Văn Điều, Võ Văn Nam, Ngô Đình Qua, Lý Minh
Tiên (Khoa tâm lý giáo dục trường Đại học sư phạm TP. HCM) (2004),
Đo lường và đánh giá kết quả học tập (phương pháp thực hành), lưu hành
nội bộ.
[5] Geogre A.Ferguson Youshio Takane, Statistical Analysis in Psychology
and Education (sixth edition), McGraw Hill International Editions.
Sở dĩ chúng tôi chọn các tài liệu thuộc nhóm 1 là vì những tài liệu này được
biên soạn và dùng giảng dạy trong các trường đại học, đặc biệt là sinh viên chuyên
ngành toán.
Ngoài ra, chúng tôi còn tìm hiểu thêm một số giáo trình thuộc các chuyên
ngành khác (kinh tế, y học, tâm lý giáo dục,…) mà trong đó, lý thuyết xác suất

thống kê được vận dụng phù hợp với từng chuyên ngành riêng biệt (nhóm 2). Mục
đích của việc này nhằm làm rõ hơn vai trò và ý nghĩa của các tham số định tâm
trong các tình huống thực tế và trong các lĩnh vực ngoài toán học. Trong quá trình
phân tích tiếp theo, chúng tôi sẽ trình bày rõ hơn lý do lựa chọn các giáo trình mang
tính vận dụng này.
1.2.1. Giáo trình nhóm 1
[1] chủ yếu giới thiệu các tham số định tâm thông qua công thức, thuật toán và
một vài ví dụ áp dụng.
Điều đầu tiên chúng tôi ghi nhận ở các giáo trình nhóm 1 là các kiến thức về số
trung vị được trình bày tương đối sơ sài. Nếu như [3] không đề cập đến số trung vị
của mẫu dữ liệu thì trọng tâm của [1] và [2] cũng chỉ nhắm đến thuật toán tìm số
trung vị và ví dụ áp dụng. Vai trò và ý nghĩa của số trung vị trong các giáo trình này
gần như là vắng mặt.
Trung vị của mẫu số liệu, kí hiệu bởi m, là một số có tính chất sau: Số các giá trị của mẫu
bé hơn hay bằng m thì bằng số giá trị của mẫu lớn hơn hay bằng m.


([1], tr.18)

Sau khi định nghĩa, [1] trình bày thuật toán tìm số trung vị trong các trường
hợp số các giá trị là số chẵn, số lẻ, các giá trị x i có tần số ri . Riêng đối với trường
hợp mẫu được cho dưới dạng bảng phân bố ghép lớp, [1] định nghĩa số trung vị theo
quan điểm hình học: “số trung vị m là số mà tại đó đường thẳng x = m chia đôi
diện tích của tổ chức đồ tần số” 1 ([1], tr. 19)
Cũng trong phần này, ([1], tr. 19) có đề cập đến thuật ngữ khoảng trung vị:
Khoảng Ck được gọi là khoảng trung vị nếu k là chỉ số bé nhất sao cho r1 + r2 + ... + rk ≥

n
2


Ở đây, Ci = ( a i −1 ,a i ) với các a i được sắp xếp theo thứ tự tăng dần.
Như vậy, với cách tính số trung vị đối với trường hợp bảng phân phối tần số
ghép lớp như trên, [1] đã thể hiện mối quan hệ giữa đồ thị và các đặc trưng mẫu.
Hơn nữa, điều kiện cần để thực hiện được thuật toán tìm số trung vị đối với bảng
phân phối tần số ghép lớp trong [1] là phải có kiến thức về tổ chức đồ tần số (hay
tên gọi khác là biểu đồ tổ chức).
Chúng tôi cũng bắt gặp kiểu nhiệm vụ tìm số trung vị trong trường hợp bảng
phân phối tần số ghép lớp trong [2], nhưng kĩ thuật giải lại có sự khác biệt. Sau khi
nêu thuật toán tìm số trung vị đối với trường hợp các dữ liệu rời rạc (thuật toán này
hoàn toàn tương tự với thuật toán trình bày trong [1], nhưng sơ sài hơn 2), [2] đưa ra
công thức tìm số trung vị đối với dữ liệu liên tục (được trình bày dưới dạng bảng
phân phối tần số ghép lớp):
Med
= x me +

n / 2 − n tl
h
n me

trong đó x me – điểm đầu của khoảng trung vị
n tl – tần số tích lũy trước khoảng trung vị

n me – tần số khoảng trung vị
Tổ chức đồ tần số được dùng để biểu diễn mẫu dữ liệu được trình bày dưới dạng bảng phân phối tần số
ghép lớp. Trên mỗi khoảng ta dựng một hình chữ nhật có chiều cao bằng tần số tương ứng với lớp đó nếu độ
rộng các khoảng bằng nhau; nếu độ rộng các khoảng không bằng nhau, trên khoảng Ci có độ rộng li ta

1

λri

( λ là hằng số dương tùy ý) ([2], tr. 15)
li
n +1
2
Trung vị thực nghiệm chính là giá trị thứ
của tập mẫu đã sắp xếp (nếu n lẻ thì đó là giá trị chính giữa
2
dựng hình chữ nhật có chiều cao là yi =

dãy số liệu, nếu n chẵn ta lấy trung bình cộng của hai giá trị chính giữa) ([2], tr. 129)


h – độ dài khoảng
n – tổng tần số hay kích thước mẫu

([2], tr. 132)
Với công thức này, [2] chỉ nêu một ví dụ áp dụng và hoàn toàn không giải thích
nguồn gốc hoặc chứng minh công thức. Điều này khiến chúng tôi nghi ngờ rằng liệu
sinh viên (hoặc những độc giả khác) có trình bày được các bước để xây dựng lại
công thức? họ có hiểu được ý nghĩa của số trung vị? hay chỉ xem nó là một "con
số" sinh ra từ công thức đó?
• Các tổ chức toán học gắn liền với số trung vị trong [1], [2]
Kiểu nhiệm vụ T tính : Tìm số trung vị của mẫu dữ liệu
 Nhiệm vụ TTpbính : Tìm số trung vị trong trường hợp các giá trị mẫu khác nhau đôi
một.
pb
: Sắp xếp các giá trị của mẫu theo thứ tự tăng dần (hoặc giảm dần).
Kĩ thuật τTính

Nếu số các giá trị n là số lẻ thì trung vị là giá trị thứ

là trung bình cộng của giá trị thứ

n +1
. Nếu n chẵn thì trung vị
2

n
n
và + 1 . 3
2
2

pb
Công nghệ θTính
: Định nghĩa số trung vị.

 Nhiệm vụ TTtsính : Tìm số trung vị trong trường hợp giá trị x i có tần số ri
ts
Kĩ thuật τTính
: Sắp xếp các giá trị theo thứ tự tăng dần (hoặc giảm dần). Sử

dụng bảng phân bố tần số tích lũy. Gọi k là chỉ số bé nhất để r1 + r2 + ... + rk ≥

n
2

thì số trung vị là giá trị thứ k.
Công nghệ: Định nghĩa số trung vị.
 Nhiệm vụ TTbgl
ính : Tìm số trung vị trong trường hợp mẫu được cho dưới dạng

bảng phân bố tần số ghép lớp.

3

Trong phần trình bày các tổ chức toán học, chúng tôi quy ước n là kích thước mẫu.


1

bgl
Kĩ thuật τTính
: Sắp xếp các khoảng
=
Ci

( a i−1 ,a i ) ( i ∈1,m )

ứng với tần số ri theo

thứ tự tăng dần (hoặc giảm dần) các điểm chia a i . Sử dụng công thức trong phần
trích dẫn của ([2], tr.19) nêu trên (phần ghi chú, trang 13).
2

bgl
: Gồm các bước theo thứ tự sau:
Kĩ thuật τTính

− Sắp xếp các khoảng
=
Ci


( a i−1 ,a i ) ( i ∈1,m )

ứng với tần số ri theo thứ tự tăng

dần (hoặc giảm dần) các điểm chia a i .
− Xác định khoảng trung vị là khoảng C k = ( a k −1 ; a k ) , với k là chỉ số bé nhất
sao cho r1 + r2 + ... + rk ≥

n
.
2

− Tính chiều cao của khoảng trung vị h =

ri
.
a k − a k −1

− Tính diện tích hình chữ nhật bên trái của khoảng trung vị là S=

n k
− ∑ ri
2 i =1

S
h
Công nghệ: Hoàn toàn vắng mặt
− Số trung vị =
m a k −1 +


([1], tr. 20)
Thí dụ 9. Tìm khoảng trung vị và số trung vị trong bảng phân bố ghép lớp nêu ở thí dụ 3
Giải: Ta có 18 + 58 + 62 = 138 < 200
18 + 58 + 62 + 72 = 210 > 200
Vậy khoảng trung vị là (13,5 ; 16,5). Để tính số trung vị, ta nhận thấy: Chiều cao của khoảng
trung vị này là

72
= 24 . Ta phải chia hình chữ nhật dựng trên khoảng này thành hai phần có diện
3

tích ở bên trái là 200 − 138 =
62
Ta phải có 24.( AC ) =62 ⇒ AC =2 ,583
Vậy số trung vị là
m=
13,5 + 2 ,583 =
16 ,083

62

24
A
13,5

10
C
16,083


D
16,5


 Phân tích
1

2

bgl
bgl
Hai kĩ thuật τTính
và τTính
đều cho kết quả giống nhau và chỉ là một số trung vị

ước lượng (số gần đúng), được xem là hợp lý. Điều này cũng được [2] đề cập đến
trong một bài tập (bài tập 5 trang 154) thông qua việc cho một bảng số liệu với các
giá trị rời rạc và yêu cầu lập bảng phân phối thực nghiệm với độ dài khoảng bằng
nhau là 30. Sau đó, [2] yêu cầu tính số trung vị theo bảng phân phối thực nghiệm
(kết quả là 60 nếu chia các khoảng dạng (a,b]) và tính trực tiếp từ bảng số liệu cung
cấp (kết quả là 60,5). Chúng tôi cũng để ý rằng việc [2] không nêu rõ cách chia
khoảng (chỉ nêu độ dài khoảng và giá trị bắt đầu, chứ không nêu dạng của khoảng)
có thể sẽ khiến cho độc giả lúng túng trong việc lập bảng phân phối thực nghiệm từ
một dữ liệu các số rời rạc. Việc lập bảng phân phối thực nghiệm không thích hợp sẽ
gây nên độ lệch khá lớn giữa hai cách tính. Ví dụ, nếu lấy khoảng có dạng [a,b) thì
1

2

bgl

bgl
trung vị trong bài toán trên sẽ là 65,625 (đối với τTính
), và 66 (đối với τTính
), lệch

khá lớn so với cách tính trực tiếp (60,5). Cũng thông qua điều này, chúng tôi nhận
thấy việc kiểm tra lại tính hợp lý của kết quả – một khâu trong dạy học mô hình hóa
– không được chú trọng. Hơn thế nữa, các con số 65,625 hay 60,5 hay 60 nói lên
điều gì? đó là kết quả của một phép tính hay có ý nghĩa gì khác? Chúng tôi không
tìm được câu trả lời cho những câu hỏi này trong các giáo trình nhóm 1.
Kiểu nhiệm vụ T ý nghĩa : Nêu ý nghĩa số trung vị
Trong các giáo trình nhóm 1, chỉ riêng [2] đưa ra một bài tập (phần luyện tập)
yêu cầu nêu ý nghĩa của số trung vị. Tuy nhiên, kĩ thuật, công nghệ của kiểu nhiệm
vụ này hoàn toàn vắng mặt.
([2], tr. 153)
Thống kê số km đã chạy của 100 xe tải của một hãng trong năm 1997:
Số km

Số xe tải

10000 – 14000

5

14000 – 18000

10

18000 – 22000


11

22000 – 26000

20

26000 – 30000

25

30000 – 34000

13

34000 – 38000

12


38000 – 42000

4

a) …
b) Tính các số đặc trưng mẫu: trung bình, mốt và trung vị. Cho biết ý nghĩa của chúng.
c)…
Bảng 1.1: Bảng tổng kết các tổ chức toán học về số trung vị trong các giáo trình nhóm 1

Kiểu nhiệm vụ


Kiểu nhiệm
vụ T tính

Nhiệm vụ
TTpbính
Nhiệm vụ
TTtsính
Nhiệm vụ
TTbgl
ính

Kiểu nhiệm
vụ T ý nghĩa

Kĩ thuật

Giáo trình
[1]

Giáo trình
[2]

Giáo trình
[3]

pb
τTính






Vắng mặt

ts
τTính





Vắng mặt



Vắng mặt

Vắng mặt

bgl
τTính

Vắng mặt



Vắng mặt

Vắng
mặt


Vắng mặt



Vắng mặt

1

bgl
τTính
2

Bảng 1.1 cho thấy các giáo trình nhóm 1 đặt nặng việc tính toán hơn là tìm hiểu
vai trò và ý nghĩa của số trung vị. Hơn nữa, nhu cầu sử dụng số trung vị trong thống
kê cũng không được nhắc tới. Với những điều này, có thể nói rằng trong các giáo
trình nhóm 1, phương pháp mô hình hóa không được tạo điều kiện phát triển 4, và
vai trò, ý nghĩa của số trung vị bị xem nhẹ.
1.2.2. Giáo trình nhóm 2
Các giáo trình nhóm 2 có đặc điểm chung là đề cập đến các tham số định tâm
thông qua các công thức, thuật toán và đưa ra các ví dụ liên quan đến chuyên ngành,
từ đó rút ra các nhận định về vai trò của các tham số định tâm. Các chứng minh, lập
luận toán học để dẫn tới các công thức, thuật toán đó hoàn toàn vắng mặt. Do đó,
chúng tôi chọn phân tích các giáo trình nhóm 2 với mục đích bổ sung cho các giáo
trình nhóm 1, nhằm tổng hợp đầy đủ nhất có thể được các kiến thức về số trung vị.

“Thống kê là một trong những phần hiếm hoi của chương trình phổ thông mang lại nhiều cơ hội dạy học mô
hình hóa và đặc biệt là dạy học bằng mô hình hóa. Thậm chí, nhiều nhà nghiên cứu đã khẳng định rằng nếu
không tận dụng điều đó thì chưa phải là dạy học thống kê, bởi nói đến thống kê là nói đến thực tiễn.” (Lê Thị
Hoài Châu (2011), Dạy học thống kê ở trường phổ thông và vấn đề nâng cao năng lực hiểu biết toán cho học

sinh, Tạp chí khoa học, số 25, trang 73)

4


Những thuật toán hay sự trùng lặp của giáo trình nhóm 2 so với nhóm 1 được chúng
tôi bỏ qua.
Sau khi đưa ra định nghĩa, thuật toán và một số ví dụ áp dụng để tính số trung
vị, [4] trình bày một số trường hợp cụ thể với mục đích giúp độc giả hiểu hơn công
dụng của số trung vị. Trường hợp 1 bàn về điểm thi tuyển sinh đại học năm 2002 và
2003, với điểm trung bình 3 môn của trên 800.000 thí sinh không tính hệ số là 8.53
(thang điểm đối đa là 10 cho một môn). Vấn đề đặt ra là có bao nhiêu thí sinh có
điểm dưới hay trên 8.53? [4] cho rằng cần sử dụng số trung vị để phục vụ nhu cầu
này.
Nếu dùng số trung vị thì theo định nghĩa, ta biết 50% (tức có trên 400 nghìn) thí sinh đạt
điểm thi 3 môn nằm dưới trung vị. Số liệu đã công bố cho biết trung vị = 7. Quan sát
thêm bảng phân bố tần số, ta thấy nhiều thí sinh cũng đạt tổng điểm = 7 (các điểm 7 này
sẽ nằm phía trên và phía dưới vị trí trung vị). Cho nên ta kết luận rằng có khoảng trên 400
nghìn thí sinh đạt tổng điểm thi 3 môn từ 7 trở xuống. ([4], tr. 95)

Như vậy, ngoài việc nêu ý nghĩa số trung vị (50% số thí sinh đạt điểm thi 3
môn nằm dưới trung vị), [4] còn quan tâm đến tính hợp lý của kết quả bài toán so
với thực tế. Số trung vị tính theo công thức là 7, nhưng giá trị 7 không chỉ xuất hiện
ở vị trí chính giữa, nên không hoàn toàn chia dữ liệu thành hai phần bằng nhau, mỗi
bên 50% điểm số. [4] lựa chọn cách dùng từ "khoảng trên 400 nghìn thí sinh" nhằm
nêu kết luận một cách ước lượng, gần đúng. Với ghi nhận này, chúng tôi cho rằng,
[4] có chú ý đến vai trò và ý nghĩa của số trung vị, đồng thời chúng tôi cũng tự hỏi:
liệu chương trình phổ thông có cung cấp những tình huống mà trong đó số trung vị
của dữ liệu xuất hiện ở nhiều vị trí? học sinh sẽ phản ứng như thế nào khi phải đưa
ra kết luận về số lượng giá trị nằm trên (hoặc dưới) số trung vị? Chúng tôi sẽ tiến

hành tìm hiểu vấn đề này trong chương 2 của luận văn.
Tiếp theo trường hợp 1, [4] trình bày tình huống một dãy dữ liệu có sự chênh
lệch lớn giữa một vài giá trị so với các giá trị còn lại: kết quả học tập của một học
sinh (hàng tháng hay học kì) học không đều, tức là có các điểm đột biến quá cao
hay quá thấp. Rõ ràng, số trung bình lúc này không phản ánh đúng chất lượng học
tập của học sinh. Cụ thể hơn, [4] nêu ví dụ như sau:


×