Tải bản đầy đủ (.pdf) (62 trang)

Tìm Hiểu Về Các Phương Pháp Tạo Chỉ Số Thống Kê Và Ứng Dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.24 MB, 62 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI

ĐẠI HỌC KHOA HỌC TỰ NHIÊN
—————————————–

Nguyễn Phương Ly

TÌM HIỂU VỀ CÁC PHƯƠNG PHÁP TẠO CHỈ SỐ THỐNG KÊ
VÀ ỨNG DỤNG

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội - Năm 2019


ĐẠI HỌC QUỐC GIA HÀ NỘI

ĐẠI HỌC KHOA HỌC TỰ NHIÊN
—————————————–

Nguyễn Phương Ly

TÌM HIỂU VỀ CÁC PHƯƠNG PHÁP TẠO CHỈ SỐ THỐNG KÊ
VÀ ỨNG DỤNG

Chuyên ngành: Lý thuyết xác suất và thống kê toán học
Mã số: 8460112.02

LUẬN VĂN THẠC SĨ KHOA HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:



Hà Nội - Năm 2019

TS. Trịnh Quốc Anh


Lời nói đầu

Trong bối cảnh hội nhập quốc tế như hiện nay, việc nâng cao năng lực của đội
ngũ cán bộ là một trong những yếu tố quan trọng nhất cần chú trọng; vì vậy, giáo
dục và kiểm định đánh giá giáo dục là một phần then chốt giúp Việt Nam ta hiểu
và phân tích được các thông tin để đối chiếu với mục tiêu, tiêu chuẩn đề ra, nhằm
có những quyết định thích hợp để điều chỉnh, nâng cao chất lượng và hiệu quả giáo dục.
Trong bài kiểm tra đánh giá năng lực, các phản hồi thô của học sinh có hai
khía cạnh quan trọng là độ chính xác và thời gian phản hồi. Từ trước đến nay, ở
các bài kiểm tra đánh giá người ta thường chỉ quan tâm đến độ chính xác của câu
trả lời và dựa vào số câu đúng sai để đánh giá năng lực của học sinh. Tuy nhiên
gần đây, với sự phát triển của máy tính và công nghệ thông tin, ta đã có thể dễ
dàng ghi lại được thời gian phản hồi từng câu hỏi của học sinh khi cho làm kiểm tra
trên máy tính để từ đó, đưa ra được kết quả chính xác hơn về năng lực của học sinh đó.
Luận văn này là bước phát triển tiếp nối sau khóa luận của em, nghiên cứu thêm
về yếu tố thời gian phản hồi trong đánh giá năng lực người học.
Luận văn gồm ba chương.
Chương 1: Kiến thức chuẩn bị. Chương này trình bày lại những kiến thức chuẩn bị
về mô hình ứng đáp câu hỏi, phân phối chuẩn, phân phối lognormal để làm tiền đề
nghiên cứu mô hình phản hồi thời gian lognormal ở chương hai. Các kiến thức về suy
luận Bayes, phương pháp xích Markov và đặc biệt là giải thuật Gibbs cũng được nhắc
lại để giúp cho phần ước lượng tham số ở chương hai và chương ba được rõ ràng hơn.
Chương 2: Mô hình thời gian phản hồi ứng đáp câu hỏi lô-ga-rit chuẩn (Lognormal
Item Response Theory). Chúng tôi giới thiệu lại về lịch sử phát triển của mô hình

phản hồi thời gian, nói về động lực để áp dụng mô hình lô-ga-rít chuẩn cho thời gian
phản hồi của thí sinh và so sánh nó với mô hình chuẩn cho thời gian phản hồi. Phương
1


Lời nói đầu

pháp ước lượng tham số bằng giải thuật Gibbs cũng được đưa ra ở phần này.
Chương 3: Nghiên cứu thực nghiệm. Phần này trình bày lại rõ ràng hơn về nghiên
cứu thực nghiêm đã áp dụng mô hình phản hồi thời gian lognormal cho phân tích dữ
liệu trong bài thi thích ứng ở Mỹ cũng như sắp xếp mẫu, ước lượng tham số và xem
xét độ phù hợp của mô hình.

Luận văn được hoàn thành tại trường Đại học Khoa học tự nhiên - Đại học quốc
gia Hà Nội, dưới sự hướng dẫn của TS. Trịnh Quốc Anh.
Em chân thành cảm ơn thầy Trịnh Quốc Anh, các nghiên cứu sinh và học trò của
thầy. Trong quá trình nghiên cứu, mặc dù còn nhiều sơ suất nhưng em đã được thầy
tận tình dạy dỗ, hướng dẫn, cũng như động viên em trong suốt thời gian làm viêc.
Ngoài ra em muốn gửi lời cám ơn sâu sắc đến các thành viên của nhóm seminar Xác
suất thống kê, Đại học Khoa học tự nhiên đã góp ý rất nhiều trong quá trình em hoàn
thành luận văn.
Em cũng xin bày tỏ lòng biết ơn các thầy cô và cán bộ của trường Đại học khoa
học tự nhiên đã quan tâm giúp đỡ trong quá trình học tập và nghiên cứu tại trường.
Em cũng xin tỏ lòng biết ơn sâu sắc đến gia đình, bố mẹ, anh chị em và anh Phạm
Hồng Việt đã bên cạnh đồng hành, giúp đỡ, tạo điều kiện trong suốt quá trình em học
tập và làm luận văn thạc sĩ. Cảm ơn hai thiên thần bé nhỏ Hồng Quân, Hồng Ngọc đã
là động lực to lớn giúp em cố gắng vượt qua những khó khăn trong quá trình nghiên
cứu để hoàn thành được luận văn.
Hà Nội, ngày 10 tháng 12 năm 2019


Nguyễn Phương Ly

2


Mục lục
Lời nói đầu

1

Danh mục ký hiệu và chữ viết tắt

8

1 Kiến thức chuẩn bị

10

1.1

Mô hình IRT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

1.2

Phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15


1.3

Phân phối lognormal . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

1.4

Suy luận Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

1.4.1

Suy luận Bayes cho biến ngẫu nhiên rời rạc . . . . . . . . . . . .

22

1.4.2

Suy luận của Bayes cho biến ngẫu nhiên liên tục . . . . . . . . .

23

Phương pháp xích Markov Monte Carlo (MCMC) . . . . . . . . . . . .

24

1.5.1


Phương pháp Monter Carlo . . . . . . . . . . . . . . . . . . . .

24

1.5.2

Phương pháp xích Markov Monte Carlo (MCMC) . . . . . . . .

26

Giải thuật Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

28

1.6.1

Bài toán sinh mẫu . . . . . . . . . . . . . . . . . . . . . . . . .

28

1.6.2

Thuật toán Gibbs giải bài toán sinh mẫu . . . . . . . . . . . . .

29

1.5

1.6


2 Mô hình phản hồi thời gian ứng đáp câu hỏi lognormal

33

2.1

Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

33

2.2

Mô hình thời gian phản hồi lognormal IRT - LNIRT . . . . . . . . . . .

37

2.2.1

Giả thiết của mô hình . . . . . . . . . . . . . . . . . . . . . . .

37

2.2.2

Mô hình LNIRT . . . . . . . . . . . . . . . . . . . . . . . . . . .

38

2.2.3


Mô hình chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . .

44

Ước lượng tham số . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

45

2.3.1

Phân bố tiên nghiệm . . . . . . . . . . . . . . . . . . . . . . . .

45

2.3.2

Phân bố hậu nghiệm . . . . . . . . . . . . . . . . . . . . . . . .

46

2.3.3

Giải thuật Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . .

46

2.3.4

Áp dụng giải thuật Gibbs để ước lượng tham số . . . . . . . . .


47

2.3

3


MỤC LỤC

2.3.5

Độ phù hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3 Nghiên cứu thực nghiệm

48
50

3.1

Mô tả mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

3.2

Ước lượng tham số . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

52


3.3

Độ phù hợp của mô hình . . . . . . . . . . . . . . . . . . . . . . . . . .

55

KẾT LUẬN

59

TÀI LIỆU THAM KHẢO

60

4


Danh sách hình vẽ
[1]

1.1

Đường cong đặc trưng câu hỏi mô hình một tham số

1.2

Vị trí độ khó của câu hỏi hoặc năng lực của thí sinh trên trục năng
lực/độ khó tương ứng với xác suất trả lời 0.5

1.3


[1]

. . . . . . . . .

12

. . . . . . . . . . . . . .

13

Hàm đặc trưng câu hỏi của năm câu hỏi trong mô hình một tham số.[1]

13

1.4

Hàm đặc trưng của ba câu hỏi trong mô hình hai tham số.

1.5

Hàm đặc trưng câu hỏi trong mô hình ba tham số.[1]

[1]

. . . . . .

14

. . . . . . . . . .


15

[wiki]

1.6

Hàm mật độ xác suất tuân theo phân phối chuẩn.

. . . . . . . . .

16

1.7

Hàm mật độ xác suất tuân theo phân phối lognormal.wiki . . . . . . . .

19

1.8

Hàm phân phối xác suất tích lũy tuân theo phân phối lognormal.

.

20

1.9

Minh họa thuật toán Gibbs . . . . . . . . . . . . . . . . . . . . . . . .


31

1.10 Sơ đồ khối giải thuật Gibbs . . . . . . . . . . . . . . . . . . . . . . . .

32

2.1

[wiki]

Biểu đồ miêu tả mô hình phân cấp của phản hồi và thời gian phản hồi
(RT) trong các câu hỏi của bài kiểm tra ở cáp tiếp cận thứ ba.[6] . . . .
[6]

2.2

Ví dụ hai phép tính số học yêu cầu cường độ thời gian khác nhau.

. .

2.3

Ảnh hưởng của tham số phân biệt đối với phân bố thời gian phản hồi

36
39

(phần trên) và phân bố phản hồi (phần dưới). Bên trái là các hình với
tham số phân biệt có giá trị nhỏ, phần bên phải có tham số phân biệt

có giá trị lớn hơn. Diện tích phần trùng nhau của hai phân bố lớn hơn
nếu giá trị tham số phân biệt lớn hơn.[4] . . . . . . . . . . . . . . . . .
3.1

43

Biểu đồ phân tán với trung bình và phương sai của thời gian phản hồi
tính theo giây cho 48 câu (ảnh trên) và 2000 thí sinh trong mẫu (ảnh
dưới).[4] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.2

Phân bố của thời gian phản hồi theo đơn vị giây của câu hỏi 3 (hình
trên; N=760) và câu hỏi 13 (hình dưới; N=490).[4] . . . . . . . . . . . .

3.3

53
54

Ước lượng cường độ thời gian (βi ) và tham số độ phân biệt (αi ) trong
mô hình lô-ga-rít chuẩn và mô hình chuẩn cho cả hai trường hợp không
có ràng buôc và có ràng buộc của αi .[4] . . . . . . . . . . . . . . . . . .
5

54


DANH SÁCH HÌNH VẼ


3.4

Phân bố của tham số tốc độ (τi ) đã ước lượng ở mô hình lô-ga-rít chuẩn
và mô hình chuẩn cho cả hai trường hợp tham số αi không có ràng buộc
và có ràng buộc.[4]

3.5

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

55

Tổng quan độ phù hợp của mô hình lô-ga-rít chuẩn và mô hình chuẩn
cho cả hai trường hợp tham số αi không có ràng buộc và có ràng buộc.
Càng phù hợp thì đường cong càng gần với đường thẳng đơn vị y=x.[4]

3.6

56

Độ phù hợp của mô hình lô-ga-rít chuẩn cho câu hỏi tốt nhất và câu hỏi
tệ nhất với cả hai trường hợp tham số αi không có ràng buộc và có ràng
buộc. Càng phù hợp thì đường cong càng gần với đường thẳng đơn vị
y=x[4] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6

56



Danh sách bảng
1.1
1.2

Định nghĩa và các giá trị tuân theo phân bố chuẩn: X ∼ N (µ, σ 2 ).[wiki]

16

2

Định nghĩa và các giá trị tuân theo phân bố lognormal ln(X) ∼ N (µ, σ ).
[wiki]

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

3.1

Số lượng câu hỏi của từng thí sinh trong mẫu.[4] . . . . . . . . . . . . .

52

3.2

Số thí sinh mỗi câu hỏi trong mẫu.

[4]

52


3.3

Tỷ lệ quan sát được và tỷ lệ kỳ vọng của thí sinh có thời gian phản hồi

. . . . . . . . . . . . . . . . . . .

nhỏ hơn phân vị 5 và 10 trong phân bố hậu nghiệm ở từng trường hợp
câu hỏi.[4] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4

57

Tỷ lệ quan sát được và tỷ lệ kỳ vọng của thí sinh có thời gian phản hồi
nhỏ hơn phân vị 5 và 10 trong phân bố hậu nghiệm ở từng trường hợp
câu hỏi.[4] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

58


Danh mục các ký hiệu và chữ viết
tắt


Không gian mẫu

X, Y, Z...


Biến ngẫu nhiên

F (x), FX (x)

Hàm phân phối tích lũy, hàm phân phối tích lũy của biến ngẫu nhiên X

p(x), pX (x)

Hàm mật độ xác suất, hàm mật độ xác suất của biến ngẫu nhiên X

X∈F

Biến ngẫu nhiên X có hàm phân phối tích lũy F

C(FX )

Tập các hàm phân phối tích lũy liên tục

E, EX

Kì vọng (giá trị trung bình), giá trị kì vọng của biến ngẫu nhiên X

Var, VarX

Phương sai, phương sai của biến ngẫu nhiên X

ϕ(t), ϕX (t)

Hàm đặc trưng, hàm đặc trưng của biến ngẫu nhiên X


X∼Y

Biến ngẫu nhiên X tương đương với biến ngẫu nhiên Y

Φ(x)

Hàm phân phối chuẩn tắc

φ(x)

Hàm mật độ chuẩn tắc

N (µ, σ 2 )

Phân phối chuẩn

N (0, 1)

Phân phối chuẩn tắc

exp(a)

Hàm e mũ

ai

Tham số độ phân biệt của câu hỏi trong mô hình IRT

bi


Tham số độ khó của câu hỏi trong mô hình IRT

ci

Tham số xác suất trả lời đúng ngẫu nhiên câu hỏi trong mô hình IRT

αi

Tham số độ dao động thời gian của câu hỏi trong mô hình LNIRT

βi

Tham số cường độ thời gian của câu hỏi trong mô hình LNIRT

exp(a)

Hàm e mũ

8


DANH SÁCH BẢNG

CTT

Lý thuyết trắc nghiệm cổ điển - Classical Test Theory

CH

Câu hỏi


TS

Thí sinh

IRT

Lý thuyết ứng đáp câu hỏi - Item Response Theory

ICC

Đường cong đặc trưng của câu hỏi - Item Characteristic Curve

LNIRT

Lý thuyết ứng đáp câu hỏi lô-ga-rit chuẩn - Lognormal Item Response Theory

MCMC

Xích Markov Monte Carlo - Monte Carlo Markov Chain

RA

Độ chính xác của phản hồi - Response Accuracy

RT

Thời gian phản hồi - Response Time

9



Chương 1

Kiến thức chuẩn bị
1.1

Mô hình IRT

Lý thuyết Ứng đáp Câu hỏi (Item Response Theory - IRT) là một lý thuyết của khoa
học về đo lường trong giáo dục, ra đời từ nửa sau của thế kỷ 20 và phát triển mạnh
mẽ cho đến nay. Trước đó, Lý thuyết Trắc nghiệm cổ điển (Clasical Test Theory –
CTT), ra đời từ khoảng cuối thế kỷ 19 và hoàn thiện vào khoảng thập niên 1970, đã
có nhiều đóng góp quan trọng cho hoạt động đánh giá trong giáo dục, nhưng cũng thể
hiện một số hạn chế. Các nhà tâm trắc học (psychometricians) cố gắng xây dựng một
lý thuyết hiện đại sao cho khắc phục được các hạn chế đó. Lý thuyết trắc nghiệm hiện
đại được xây dựng dựa trên mô hình toán học, đòi hỏi nhiều tính toán, nhưng nhờ sự
tiến bộ vượt bậc của công nghệ tính toán bằng máy tính điện tử vào cuối thế kỷ 20 –
đầu thế kỷ 21 nên nó đã phát triển nhanh chóng và đạt được những thành tựu quan
trọng.
Để đánh giá đối tượng nào đó CTT tiếp cận ở cấp độ một đề kiểm tra, còn lý thuyết
trắc nghiệm hiện đại IRT tiếp cận ở cấp độ từng câu hỏi, do đó lý thuyết này thường
được gọi là Lý thuyết Ứng đáp Câu hỏi.
Ta sẽ quy ước gọi người có thuộc tính cần đo lường là thí sinh (person) và một đơn
vị của công cụ để đo lường (test) là câu hỏi (item). Để đơn giản hóa mô hình nghiên
cứu ta có các giả thiết sau:

(i) Năng lực tiềm ẩn (latent trait) cần đo chỉ có một chiều (unidimensionality), hoặc
ta chỉ đo một chiều của năng lực đó.
(ii) Các câu hỏi là độc lập địa phương (local independence) , nghĩa là việc trả lời một

câu hỏi không ảnh hưởng đến các câu hỏi khác.

10


Chương 1. Kiến thức chuẩn bị

Khi thỏa mãn hai giả thiết nêu trên thì không gian năng lực tiềm ẩn đầy đủ chỉ
chứa một năng lực. Khi ấy, người ta giả định là có một hàm đặc trưng câu hỏi (Item
Characteristic Function) phản ánh mối quan hệ giữa các biến không quan sát được
(năng lực của TS) và các biến quan sát được (việc trả lời CH). Đồ thị biểu diễn hàm
đó được gọi là đường cong đặc trưng câu hỏi (Item Characteristic Curve).
Đối với các cặp thí sinh- câu hỏi(TS – CH), cần xây dựng một thang chung để biểu
diễn các mối tương tác giữa chúng. Trước hết giả sử ta có thể biểu diễn năng lực tiềm
ẩn của các TS bằng một biến liên tục θ dọc theo một trục, từ −∞ đến +∞. Khi xét
phân bố năng lực của một tập hợp TS nào đó, ta gán giá trị trung bình của phân bố
năng lực của tập hợp TS đó bằng không (0), làm gốc của thang đo năng lực, và độ
lệch tiêu chuẩn của phân bố năng lực bằng 1. Tiếp đến, chọn một thuộc tính của CH
để đối sánh với năng lực: tham số biểu diễn thuộc tính quan trọng nhất đó là độ khó b
của CH. Cũng theo cách tương tự có thể biểu diễn độ khó của các CH bằng một biến
liên tục dọc theo một trục, từ −∞ đến +∞. Khi xét phân bố độ khó của một tập hợp
CH nào đó, ta chọn giá trị trung bình của phân bố độ khó đó bằng không (0), làm gốc
của thang đo độ khó, và độ lệch tiêu chuẩn của phân bố độ khó CH bằng 1.
Chúng ta sẽ bắt đầu bằng cách xây dựng một hàm đáp ứng CH cho một CH nhị phân,
tức là CH mà câu trả lời chỉ có 2 mức: 0 (sai) và 1 (đúng). Giả thiết cơ bản sau đây
của George Rasch, nhà toán học Đan Mạch, được đưa ra làm cơ sở để xây dựng mô
hình hàm đáp ứng CH một tham số:
Một người có năng lực cao hơn một người khác thì xác suất để người đó trả lời đúng
một câu hỏi bất kì phải lớn hơn xác suất của người sau; cũng tương tự như vậy, một
câu hỏi khó hơn một câu hỏi khác có nghĩa là xác suất để một người bất kì trả lời đúng

câu hỏi đó phải bé hơn xác suất để trả lời đúng câu hỏi sau(Rasch,1960).
Với giả thiết nêu trên, có thể thấy xác suất để một TS trả lời đúng một CH nào đó
phụ thuộc vào tương quan giữa năng lực của TS và độ khó của CH. Chọn Θ để biểu
diễn năng lực của TS, và β để biểu diễn độ khó của CH. Gọi P là xác suất trả lời đúng
CH, xác suất đó sẽ phụ thuộc vào tương quan giữa Θ và β theo một cách nào đó, do
vậy ta có thể biểu diễn
f (P ) =

Θ
.
β

(1.1)

trong đó f là một hàm nào đó của xác suất trả lời đúng.
Lấy logarit tự nhiên của phương trình 1.1:
ln f (P ) = ln

Θ
β

= ln Θ − ln β = θ − b.

11

(1.2)


Chương 1. Kiến thức chuẩn bị


Để đơn giản, khi xét mô hình trắc nghiệm nhị phân, Rasch chọn hàm f chính
là mức được thua (odds) O, hoặc khả năng thực hiện đúng (likelyhood ratio), tức
P
O=
, biểu diễn tỉ số của khả năng trả lời đúng và khả năng trả lời sai. Như vậy:
(1 − P )
ln
với ln

P
= θ − b.
1−P

(1.3)

P
được gọi là logit (log odds unit). Từ đó
1−P
P
= eθ−b .
1−P

(1.4)

Như vậy, ta có:
P = (1 − P )eθ−b
P = eθ−b − P eθ−b
P + P eθ−b = eθ−b
P (1 + eθ−b ) = eθ−b
eθ−b

P =
1 + eθ−b
và biểu thức
P (Xij , θj , bi ) =

eθj −bi
.
1 + eθj −bi

(1.5)

với θj là năng lực của thí sinh thứ j; bi là độ khó của câu hỏi thứ i; Xij là câu
trả lời của thí sinh thứ j với câu hỏi thứ i chính là hàm đặc trưng của mô hình
IRT 1 tham số (IRT 1 PL) hay còn gọi là mô hình Rasch. Biểu đồ ở Hình 1.1 mô
ta đường cong đặc trưng của câu hỏi trong mô hình IRT 1 tham số. Về mặt ý

Hình 1.1: Đường cong đặc trưng câu hỏi mô hình một tham số

[1]

nghĩa, mẫu số trong phương trình chỉ nhằm mục đích đảm bảo hàm số không bao
giờ nhỏ hơn không hoặc lớn hơn 1. Phần thú vị nhất của phương trình 1.5 là tử
12


Chương 1. Kiến thức chuẩn bị

số exp(θj − bi ), ta thấy mô hình một tham số logistic đã dự đoán được xác suất
trả lời đúng câu hỏi dựa vào mối tương quan giữa năng lực thí sinh θj và tham
số câu hỏi bi . Tham số bi được gọi là tham số địa phương hay chính là tham số

độ khó câu hỏi. Trong Hình 1.1, ta xác định trục ngang là trục năng lực θi , cũng
chính là trục của độ khó bi . IRT đã quy đổi giữa năng lực của thí sinh với độ khó câu hỏi.

Ví dụ 1.1.1. Một thí sinh có thể tìm được vị trí của bi trên trục năng lực/độ khó tương
ứng với điểm xác suất dự đoán trả lời đúng Pij (θj − bi ) bằng 0.5. Điều này được thể
hiện trong Hình 1.2. Câu hỏi có đường cong đặc trưng trong hình cho ta thấy để có xác
suất trả lời đúng câu hỏi này là 0.5 thì năng lực của thí sinh bằng 1 hoặc cũng có thể
hiểu độ khó của câu hỏi này là 1.

Hình 1.2: Vị trí độ khó của câu hỏi hoặc năng lực của thí sinh trên trục năng lực/độ khó tương ứng
với xác suất trả lời 0.5 [1] .

Hình 1.3 cho ta thấy hàm đặc trưng của 5 câu hỏi có độ khó khác nhau (-2.2; -1.5; 0.0;
1.0 2.0) có độ dốc khác nhau trải dài trên khoảng xác định của năng lực thí sinh. Năm
đường cong này chạy song song và không bao giờ cắt nhau.

Hình 1.3: Hàm đặc trưng câu hỏi của năm câu hỏi trong mô hình một tham số.[1]

13


Chương 1. Kiến thức chuẩn bị
Mô hình IRT hai tham số

Mô hình IRT một tham số được Birnbaum mở rộng bằng cách gán cho mỗi câu hỏi
trong đề thi trắc nghiệm ứng với mộ độ phân biệt a khác nhau. Mô hình này được gọi
là mô hình IRT hai tham số có hàm đặc trưng câu hỏi như sau
P (Xij ; θj , bi , ai ) =

eai (θj −bi )

.
1 + eai (θj −bi )

(1.6)

Độ phân biệt của câu hỏi đặc trưng cho khả năng phân loại thí sinh. Thông thường
độ phân biệt của câu hỏi có giá trị dương. Trong trường hợp câu hỏi sai hoặc mắc lỗi
thiết kế thì độ phân biệt có thể mang giá trị âm. Câu hỏi có độ phân biệt dương càng
lớn thì sự chênh lệch về xác suất trả lời đúng của các thì sinh có năng lực cao và năng
lực thấp càng lớn. Nói một cách khác, câu hỏi có độ phân biệt cao phân loại thí sinh
tốt hơn câu hỏi có độ phân biệt thấp.
Ví dụ 1.1.2. Trong Hình 1.3 đường cong đặc trưng của các câu hỏi song song với nhau
và không bào giờ cắt nhau; các câu hỏi có tham số độ khó khác nhau sẽ có đường cong
đặc trưng di chuyển về bên trái hoặc phải trong khi hình dạng của chúng là không đổi.
Ta sẽ thấy một biểu đồ khác hẳng ở Hình 1.4. Hai câu hỏi có cùng độ khó -1.0. Giống
như trong mộ hình một tham số, xác suất câu trả lời bằng 0.5 cho ta độ khó của câu
hỏi. Tuy nhiên, một đường cong (đường 1) dốc hơn hẳn đường còn lại (đường 2). Đó
là do câu hỏi đó có tham số phân biệt ai lớn hơn. Tham số phân biệt ai còn được gọi
là tham số độ dốc (slope parameter), giống như độ khó câu hỏi bi được gọi là tham số
vị trí. Độ dốc của mô hình hai tham số tại b là a/4.
Đường cong còn lại (đường 3) và đường cong thứ 2 có cùng độ dốc nhưng đường 3 chạy
về phía bên phải nhiều hơn. Do đó, câu hỏi của đường 3 có cùng độ phân biệt với câu
hỏi của đường hai nhưng có độ khó lớn hơn.

Hình 1.4: Hàm đặc trưng của ba câu hỏi trong mô hình hai tham số.[1]

14


Chương 1. Kiến thức chuẩn bị

Mô hình IRT ba tham số

Thực tế cho thấy, trong quá trình kiểm tra trắc nghiệm khách quan nhiều lựa chọn,
thí sinh luôn dự đoán câu trả lời (theo cách chọn ngẫu nhiên một phương án hoặc theo
cách loại suy dựa trên kinh nghiệm bản thân). Trong lí thuyết trắc nghiệm cổ điển,
người ta giảm việc dự đoán của thí sinh khi trả lời câu hỏi bằng cách đưa vào điểm
may rủi. Tuy nhiên, cách làm này có nhược điểm là xem các câu hỏi có độ may rủi như
nhau. Điều này trái với thực tiễn vì thí sinh thường dự đoán để trả lời đúng câu hỏi
khi gặp câu hỏi khó hơn là khi gặp câu hỏi dễ. Vì vậy, Birnbaum đề xuất thêm tham
số cj ∈ (0, 1) vào mô hình IRT hai tham số để đo lường mức độ dự đoán của thí sinh
khi trả lời câu hỏi trắc nghiệm trong mỗi câu hỏi. Mô hình với tham số đo lường mức
độ dự đoán của thí sinh được gọi là mô hình IRT ba tham số có hàm đặc trưng câu
hỏi như sau:
P (Xij ; θj , bi , ai , ci ) = ci + (1 − ci )

eai (θj −bi )
.
1 + eai (θj −bi )

(1.7)

Ví dụ 1.1.3. Hàm đặc trưng của một câu hỏi có mô hình ba tham số như Hình 1.5.
Hình 1.5 biểu diễn hàm đặc trưng của câu hỏi 3 tham số a = 1.4, b = 0 và c = 0.3.
Năng lực thấp nhất ở đồ thị là −4 và còn có thể thấp hơn thế nữa đến −∞, nhưng
dường như đường cong có đường tiệm cận dưới là 0.2. Giống như trong mô hình một
tham số và hai tham số, đường cong chuyển dần từ lồi đến lõm tại điểm θ = b, nhưng
xác suất để trả lời đúng câu hỏi tại θ = b = 0 lúc này không còn là 0.5 nữa mà bằng
c + (1 − c)/2 = 0.2 + 0.4 = 0.6. Hơn nữa, độ dốc tại điểm b lúc này là (1 − c)/4 thay
vì là a/4.


Hình 1.5: Hàm đặc trưng câu hỏi trong mô hình ba tham số.[1]

1.2

Phân phối chuẩn

Phân phối chuẩn (normal distribution), còn gọi là phân phối Gauss, là một phân phối
xác suất cực kì quan trọng trong nhiều lĩnh vực. Nó là họ phân phối có dạng tổng
15


Chương 1. Kiến thức chuẩn bị

quát giống nhau, chỉ khác tham số giá trị trung bình (µ) và phương sai (σ 2 ).
Phân phối chuẩn tắc (standard normal distribution) là phân phối chuẩn với giá trị
trung bình bằng 0 và phương sai bằng 1 (đường cong màu đỏ trong Hình 1.6). Phân
phối chuẩn còn được gọi là đường cong chuông (bell curve) vì đồ thị của mật độ xác
suất có dạng chuông.
Ta có thể khảo sát phân phối chuẩn cho một biến ngẫu nhiên hoặc nhiều biến ngẫu
nhiêu; hay nói cách khác ta có thể khảo sát phân phối cho biến ngẫu nhiên một chiều
hoặc biến ngẫu nhiên nhiều chiều.

Biến một chiều (Univariate)
Biến ngẫu nhiên X tuân theo phân phối chuẩn X ∼ N (µ, σ 2 ) với tham số kỳ vọng µ
và phương sai σ 2 , ta sẽ có các thông số như trong bảng 1.1.
Định nghĩa
PDF-f (x)
CDF - F (x; µ, σ 2 )
Kỳ vọng - E[X]
Phương sai - V ar(X)


Giá trị
1
(x − µ)2

exp −
2σ 2
2πσ 2
1
x−µ

2
σ
µ
σ2

Bảng 1.1: Định nghĩa và các giá trị tuân theo phân bố chuẩn: X ∼ N (µ, σ 2 ).[wiki]

x−µ
ở đây là 1 phân phối chuẩn đã được tính toán từ trước.
σ
Biểu đồ hàm mật độ xác suất tuân theo phân phối chuẩn có dạng như trong Hình 1.6
Φ

sau:

Hình 1.6: Hàm mật độ xác suất tuân theo phân phối chuẩn.

[wiki]


Nhận xét: Phương sai σ 2 càng lớn thì mức độ phân tán xác suất cũng càng rộng,
16


Chương 1. Kiến thức chuẩn bị

đỉnh thấp hơn và trải rộng hơn. Đường màu đỏ với µ = 0 và σ 2 = 1 thể hiện phân phối
x2
1
- đây là hàm Gauss (Gauss function). Phân phối
chuẩn tắc f (x) = √ exp −
2

này thường được dùng để tính các phân phối chuẩn khác qua các phép biến đổi tuyến
tính.
Thường các phân phối chuẩn được tính toán theo các phép biến đổi tuyến tính tức
là dựa vào các phân phối chuẩn dễ tính và tính được từ trước (như phân phối chuẩn
tắc) để ước lượng cho phân phối cần tính. Giờ ta sẽ tìm cách biểu diễn một phân phối
chuẩn bất kì qua phân phối chuẩn tắc.
Giả sử Y = aX + b thì Y cũng sẽ là phân phối chuẩn có luật phân phối là: Y ∼
N (aµ + b, a2 σ 2 ).
X −µ
Ta có Z − score của phân phối chuẩn là Z =
.
σ
1
µ
Nếu đặt a =
và b = − . Ta sẽ biểu diễn được Z tuyến tính theo X với dạng:
σ

σ
Z = aX + b. Như vậy, Z sẽ tuần theo phân phối chuẩn:
Z ∼ N (aµ + b, a2 σ 2 )
1
µ 1
∼N
µ − , 2 σ2
σ
σ σ
∼ N (0, 1).
Như vậy Z tuân theo phân phối chuẩn tắc nên ta có thể biến đổi ngược lại để thu được
phép biểu diễn phân phối chuẩn qua phân phối của Z.
FX (x) = P (X ≤ x)
X −µ
x−µ
=P

σ
σ
x−µ
=P Z≤
σ
x−µ

.
σ
x−µ
có thể tra cứu từ các bảng tính có sẵn nên
σ
ta hoàn toàn có thể tích được các phân phối chuẩn khác qua nó.


Phân phối tích lũy chuẩn tắc Φ

Biến đa chiều (Multivariate)
Đây là tổng quát hoá của phân phối chuẩn đối với biến ngẫu nhiên một chiều và sử
dụng cho hợp của nhiều biến ngẫu nhiên - véc-tơ ngẫu nhiên. Giả sử véc-tơ ngẫu nhiên
17


Chương 1. Kiến thức chuẩn bị

có số chiều là k:X = [X1 , X2 , ..., Xk ]T . Lúc đó phân phối chuẩn của nó sẽ được tham
số hóa bởi:
• Vecto kỳ vọng: µ = E[X] = [E[X1 ], E[X2 ], ..., E[Xk ]]T .
= E[(X − µ)(X − µ)T ] = [Cov(Xi , Xj ), 1 ≤ i, j ≤ k].

• Ma trận hiệp phương sai:

Phân phối này sẽ được kí hiệu là X ∼ Nk (µ, Σ) hoặc giản lược k là X ∼ N (µ, Σ) và
có hàm mật độ xác suất
f (x) =

1

1
exp − (x − µ) Σ−1 (x − µ) .
2
det(2πΣ)

µ

Ví dụ với trường hợp có 2 biến ngẫu nhiên x, y (k=2) ta sẽ có véc-to kỳ vọng µ = µX
Y
2
σX
ρσX σY
và ma trận hiệp phương sai Σ =
. Hàm mật độ xác suất lúc đó sẽ có
ρσX σY
σY2
dạng
f (x) =

1.3

1
2πρX ρY

1−

ρ2

exp −

(x − µx )2
(y − µy )2
2(x − µx )(y − µy )
1
+

2

2(1 − ρ2 )
σX
σY2
σX σY

.

(1.8)

Phân phối lognormal

Phân phối xác suất loga chuẩn hay phân phối lognormal (Lognormal distribution) là
phân phối thống kê các giá trị logarit từ một phân phối chuẩn có liên quan. Phân
phối lognormal có thể được chuyển hóa thành phân phối chuẩn và ngược lại bằng cách
sử dụng các tính toán logarit liên quan. Cụ thể, nếu biến ngẫu nhiên X có phân bố
lognormal, thì Y = ln(X) có phân bố chuẩn. Hoặc ngược lại, nếu biến Y có phân bố
chuẩn thì hàm mũ của Y là X = exp(Y ) có phân bố lognormal.
Cho Z là biến chuẩn tắc, µ và σ > 0 là hai số thực thì phân bố của biến ngẫu nhiên
X = eµ+σZ
được gọi là phân bố lognormal với tham số µ và σ. Như vậy, tham số µ và σ là giá trị
kỳ vọng (hay trung bình) và độ lệch chuẩn logarit của biến tự nhiên chứ không phải
kỳ vọng và độ lệch chuẩn của biến X.
Mối quan hệ này đúng bất kể với hàm số logarit hay hàm số mũ. Với hai số dương
a, b = 1, nếu loga (X) tuân theo phân bố chuẩn thì logb (X) cũng vậy. Tương tự, với
0 < a = 1, nếu eY tuân theo phân bố lognormal thì aY cũng như vậy.
Thông thường, các tham số µ∗ = eµ và σ ∗ = eσ thường hay được sử dụng hơn. Với
tham số này ta có thể lý giải trực tiếp: µ∗ là trung bình của phân bố và σ ∗ hữu ích cho
việc xác định khoảng phân tán.
18



Chương 1. Kiến thức chuẩn bị

Biến một chiều (Univaraite)
Biến ngẫu nhiên dương X tuân theo phân bố lognormal nếu logarit của X tuân theo
phân bố chuẩn ln(X) ∼ N (µ, σ 2 ) với kỳ vọng µ và phương sai σ 2 . Ta sẽ có các thông
số như trong bảng 1.2.

Định nghĩa
PDF - f (x)
CDF - F (x; µ, σ 2 )
Giá trị trung bình (mean) - E[X]
Giá trị giữa (median)
Giá trị xuất hiện thường xuyên nhất (mode)
Phương sai (Variance) - V ar(X)
Độ xiên (skewness)

Giá trị
1
(ln x − µ)2
√ exp −
2σ 2
xσ 2π∞
2
2

e−t dt
π x
σ2
exp µ +

2
exp(µ)
exp(µ − σ 2 )
exp(σ 2 ) √
− 1 exp(2µ + σ 2 )
σ2
(e + 2) eσ2 − 1

Bảng 1.2: Định nghĩa và các giá trị tuân theo phân bố lognormal ln(X) ∼ N (µ, σ 2 ).

[wiki]

Đặt Φ và ϕ lần lượt là hàm phân bố xác suất tích lũy và hàm mật độ xác suất của
phân bố N (0, 1). Ta có hàm mật độ xác suất là
d
d
ln x − µ
d
P r(X ≤ x) =
P r(ln X ≤ ln x) =
Φ
dx
dx
dx
σ
ln x − µ d ln x − µ
ln x − µ 1


σ

dx
σ
σ
σx
2
1 1
(ln x − µ)
√ exp −
=
.
x σ 2π
2σ 2

fX (x) =

Biểu đồ hàm mật độ xác suất tuân theo phân phối lognormal có dạng như trong Hình
1.7.

Hình 1.7: Hàm mật độ xác suất tuân theo phân phối lognormal.wiki
19


Chương 1. Kiến thức chuẩn bị

Hàm phân bố tích lũy là
ln x − µ
σ

FX (x) = Φ


,

với Φ là hàm phân bố tích lũy của phân bố chuẩn tắc (ví dụ N (0, 1)). Phân bố tích
lũy có thể viết dưới dạng sau
ln x − µ

σ 2

1
1 + erf
2

,

(1.9)

với erf là hàm lỗi (error function) được định nghĩa như sau:


1
erf (x) = √
π
2
=√
π

2

e−t dt
x



2

e−t dt.
x

Biểu đồ hàm phân bố xác suất tích lũy tuân theo phân phối lognormal có dạng như
trong Hình 1.8.

Hình 1.8: Hàm phân phối xác suất tích lũy tuân theo phân phối lognormal.

[wiki]

Biến lognormal nhiều chiều (Multivariate lognormal)
Nếu X ∼ N (µ,

) là phân bố chuẩn nhiều chiều thì Y = exp(X) có phân bố lognormal

nhiều chiều với
µi +

• Véc tơ kỳ vọng: µ = E[Y ]i = e

1
2

ii

.


• Ma trận hiệp phương sai: V ar[Y ]ij = e

µi +µj +

1
(
2

ii

+

jj )

(e

ij

− 1).

Tuy vậy, trường hợp phân bố lognormal nhiều chiều hiếm khi được sử dụng.

20


Chương 1. Kiến thức chuẩn bị

1.4


Suy luận Bayes

Trong những năm gần đây, thống kê Bayes đang được sử dụng ngày càng rộng rãi hơn
tong mọi lĩnh vực của đời sống. Thống kê Bayes là phương pháp thống kê dựa trên
định lý Bayes nhằm củng cố quan điểm của chúng ta về các dữ liệu được đưa ra. Điểm
khác biệt căn bản giữa thống kê Bayes và thống kê tần suất thông thường là nếu thống
kê tần suất xem tham số là một giá trị cố định chưa biết nhưng không ngẫu nhiên thì
thống kê Bayes coi tham số là biến ngẫu nhiên. Ta có thể gán cho tham số một phân
phối xác suất để biểu thị sự tin cậy về giá trị thực của tham số. Ngoài ra, còn cá điểm
khác biệt sau:
• Thống kê Bayes sử dụng cả hai nguồn thông tin, thông tin tiên nghiệm về quá
trình và thông tin chứa trong dữ liệu bằng cách sử dụng định lý Bayes. Trong khi
thống kê tần suất bỏ qua các kiến thức về tiên nghiêm, khá lãng phí thông tin.
• Thống kê Bayes sử dụng một công cụ duy nhất là định lý Bayes, khác với thống
kê tần suất sử dụng nhiều phương pháp khác nhau.
• Thống kê Bayes dễ dàng giúp xử lý các khó khăn trong tính toán ước lượng tham
số. Định lý Bayes đưa ra các cách để tìm phân phối dự đoán của các quan sát
tương lai. Nhưng điều này không dễ thực hiện trong thống kê tần suất.
Những lợi thế này đã được biết đến từ lâu, tuy nhiên ta sẽ gặp khó khăn với các trường
hợp phải tính tích phân lớn. Lúc này, với sự phát triển của các thuật toán máy tính
như thuật toán Metropolis-Hasting hoặc giải thuật Gibbs (ta sẽ để cập ở phân tiếp
theo) sẽ giúp lấu mẫu ngẫu nhiên từ phân phối hậu nghiệm mà không phải đánh giá
toàn bộ nó. Chúng có thể xấp xỉ phân phối hậu nghiệm chính xác bằng cách lấy một
mẫu ngẫu nhiên đủ lớn từ nó. Điều này loại bỏ được những bất lợi của thống kê Bayes.
Định lý Bayes
Từ định nghĩa của xác suất có điều kiện
P (B|A) =

P (A ∩ B)
.

P (A)

(1.10)

Ta biết rằng xác suất biên của A được tìm bởi công thức
P (A) = P (A ∩ B) + P (A ∩ B),

(1.11)

từ đó suy ra
P (B|A) =

P (A ∩ B)
.
P (A ∩ B) + P (A ∩ B)
21

(1.12)


Chương 1. Kiến thức chuẩn bị

Sử dụng công thức nhân xác suất, ta có
P (B|A) =

P (B) × P (A|B)
,
P (B) × P (A|B) + P (B) × P (A|B)

(1.13)


trong đó, B là phần bù của B.
Giả sử biến cố A có thể xảy ra đồng thời với một trong

Công thức xác suất đầy đủ:

các biến cố B1 , B2 , ..., Bn . Nhóm B1 , B2 , ..., Bn là nhóm đầy đủ các biến cố. Có nghĩa
là:
A = (A ∩ B1 ) ∪ (A ∩ B1 ) ∪ .... ∪ (A ∩ Bn ).
Do đó

n

P (A ∩ Bj ).

P (A) =
j=1

Sử dụng công thức nhân xác suất, ta có
n

P (Bj ) × P (A|Bj ).

P (A) =
j=1

Vậy xác suất có điều kiện là
P (Bi |A) =

P (A ∩ Bi )

=
P (A)

P (Bi ) × P (A|Bi
.
P (Bj ) × P (A|Bj )

n
j=1

(1.14)

• Các biến cố B1 , B2 , ..., Bn gọi là các giả thuyết. Các xác suất P (B1 ), ...P (Bn ) được
xác định trước khi phép thử được tiến hành, do đó gọi là các xác suất tiên nghiệm
(prior ).
• P (A|Bi ) là xác suất có điều kiện của A nếu biết Bi xảy ra, còn được gọi là hàm
khả năng (likelihood ).
• Xác suất P (B1 |A), ..., P (Bn |A) được xác định sau khi các phép thử đã được tiến
hành và biến cố A đã xảy ra, gọi là các xác suất hậu nghiệm (posterior ).
Vậy công thức Bayes cho phép đánh giá lại xác suất xảy ra các giả thuyết sau khi đã
biết kết quả của phép thử là biến cố A đã xảy ra.
1.4.1

Suy luận Bayes cho biến ngẫu nhiên rời rạc

Ta xét tham số là biến ngẫu nhiên X, có các giá trị x1 , x2 , ....xI . Y là một biến ngẫu
nhiên phụ thuộc vào tham số và có các giá trị y1 , y2 , ..., yJ . Chúng ta sẽ sử dụng định
lý Bayes để suy luận về tham số của biến ngẫu nhiên X dựa trên quan sát Y = yj .
Không gian Bayes gồm một cặp (xi , yi ) với i = 1, ..., I và j = 1, ..., J, f () là phân phối
22



Chương 1. Kiến thức chuẩn bị

xác suất (có điều kiện hoặc không có điều kiện) của quan sát ngẫu nhiên Y và g() là
xác suất của biến ngẫu nhiên X.
Y là biến ngẫu nhiên mà ta sẽ quan sát còn X là tham số ngẫu nhiên không dùng
để quan sát mà dùng để suy luận. Mỗi xác suất trong không gian Bayes được tìm bởi
công thức:
f (xi ; yi ) = g(xi ) × f (yi |xi ),
trong đó
• g(xi ) với i = 1, ..., n là xác suất tiên nghiệm của tham số X.
• f (yj |xi ) với i = 1, ..., n là hàm hợp lý (hàm khả năng likelihood). Đây chính là
xác suất có điều kiện của Y với điều kiện X = xi .
• Khi đó, xác suất hậu nghiệm g(xi |yi ) tại xi với i = 1, ..., n cho bởi Y = yj được
xác định bởi công thức
g(xi |yi ) =
1.4.2

g(xi ) × f (yi |xi )
.
ni
i=1 ×f (yi |xi )

Suy luận của Bayes cho biến ngẫu nhiên liên tục

Hàm mật độ xác suất

Hàm mật độ xác suất dùng để biểu diễn một phân phối xác suất. f (y) là hàm mật độ
xác suất của biên ngẫu nhiên nào đó nếu nó thỏa mãn

1 f (y) ≥ 0 với ∀y ∈ (−∞, +∞),
2


−∞

f (y)dy = 1.

Xác suất của biến ngẫu nhiên trong khoảng (a,b) được tính bởi tích phân của hàm
mật độ xác suất trên khoảng đó
a

P (a < Y < b) =

f (y)dy.
b

Nếu với biến ngẫu nhiên rời rạc, công thức hậu nghiệm là
f (θ|y) =

f (θ) × f (y|θ)
f (θ) × f (y|θ)

,

(1.15)

θ

thì với biến ngẫu nhiên liên tục, công thức hậu nghiệm là

f (θ|y) =

f (θ) × f (y|θ)
+∞

f (θ) × f (y|θ)dθ
−∞

23

,

(1.16)


×