Tải bản đầy đủ (.pdf) (16 trang)

Nghiên cứu một số yếu tố gây ra lỗi thiên lệch (BIAS) trong câu hỏi thi PISA 2012 – lĩnh vực toán học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (352.33 KB, 16 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN ĐẢM BẢO CHẤT LƢỢNG GIÁO DỤC

Phạm Thị Thùy Linh

NGHIÊN CỨU MỘT SỐ YẾU TỐ GÂY RA LỖI THIÊN LỆCH (BIAS)
TRONG CÂU HỎI THI PISA 2012 – LĨNH VỰC TOÁN HỌC

LUẬN VĂN THẠC SĨ

Hà Nội – Năm 2015


ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN ĐẢM BẢO CHẤT LƢỢNG GIÁO DỤC

Phạm Thị Thùy Linh

NGHIÊN CỨU MỘT SỐ YẾU TỐ GÂY RA LỖI THIÊN LỆCH (BIAS)
TRONG CÂU HỎI THI PISA 2012 – LĨNH VỰC TOÁN HỌC

Chuyên ngành: Đo lƣờng và đánh giá trong giáo dục
Mã số: 60140120

LUẬN VĂN THẠC SĨ

Ngƣời hƣớng dẫn khoa học: TS. Sái Công Hồng

Hà Nội – Năm 2015



MỤC LỤC
LỜI CẢM ƠN .............................................................. Error! Bookmark not defined.
MỤC LỤC ................................................................................................................. 1
DANH MỤC CÁC TỪ VIẾT TẮT ............................ Error! Bookmark not defined.
DANH MỤC CÁC BẢNG .......................................... Error! Bookmark not defined.
MỞ ĐẦU .................................................................................................................... 3
1. Lý do chọn đề tài .................................................................................................... 3
2. Ý nghĩa khoa học và thực tiễn của đề tài ............................................................... 5
2.1. Ý nghĩa khoa học ................................................................................................ 5
2.2. Ý nghĩa thực tiễn ................................................................................................. 5
3. Mục đích nghiên cứu của đề tài ............................................................................. 5
4. Giới hạn nghiên cứu của đề tài............................................................................... 5
5. Câu hỏi và giả thuyết nghiên cứu:.......................................................................... 6
5.1. Câu hỏi nghiên cứu .............................................................................................. 6
5.2. Giả thuyết nghiên cứu .......................................................................................... 6
6. Khách thể, đối tượng nghiên cứu ........................................................................... 6
6.1. Đối tượng nghiên cứu .......................................................................................... 6
6.2. Khách thể nghiên cứu........................................................................................... 6
7. Phương pháp nghiên cứu ........................................................................................ 6
8. Cấu trúc luận văn ................................................................................................... 7
CHƢƠNG 1.CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU .... 8
1. Các khái niệm và quan niệm .................................................................................. 8
1.1. Đánh giá giáo dục ................................................................................................ 8
1.2. Thiết kế câu hỏi đánh giá năng lực học sinh ...... Error! Bookmark not defined.
1.3. Câu hỏi “Bias” ................................................... Error! Bookmark not defined.
1.3.1.

Khái niệm ................................................... Error! Bookmark not defined.

1.3.2.

Phương pháp phát hiện câu hỏi thiên lệch ............ Error! Bookmark not
defined.
1.3.2.1.

Chỉ số DIF .................................................. Error! Bookmark not defined.

1


1.3.2.2.

Các loại câu hỏi DIF .................................. Error! Bookmark not defined.

1.4. Lý thuyết Ứng đáp câu hỏi ................................. Error! Bookmark not defined.
2.

Tổng quan các tài liệu nghiên cứu ................... Error! Bookmark not defined.

CHƢƠNG 2.PHƢƠNG PHÁP LUẬN NGHIÊN CỨUError! Bookmark not defined.
1. Giới thiệu về Chương trình đánh giá học sinh quốc tế PISA Error! Bookmark
not defined.
1.1. Giới thiệu chung ................................................. Error! Bookmark not defined.
1.2. Mục tiêu của PISA .............................................. Error! Bookmark not defined.
1.3. Chọn mẫu PISA 2012 ......................................... Error! Bookmark not defined.
1.4. Quy trình xây dựng đề thi PISA.......................... Error! Bookmark not defined.
1.5. Khung đánh giá năng lực Toán học của PISA 2012Error! Bookmark not defined.
1.6. Mã hóa (chấm điểm)........................................... Error! Bookmark not defined.
2.

Phần mềm phân tích câu hỏi DIF .................... Error! Bookmark not defined.


3.

Bộ dữ liệu phân tích ......................................... Error! Bookmark not defined.

CHƢƠNG 3.KẾT QUẢ NGHIÊN CỨU VÀ KẾT LUẬNError! Bookmark not defined.
1.

Giới tính học sinh và lỗi thiên lệch trong câu hỏi thi PISAError! Bookmark not defined.

2.

Vị trí địa lý và lỗi thiên lệch trong câu hỏi thi PISAError! Bookmark not defined.

3.

Yếu tố vùng miền và lỗi thiên lệch trong câu hỏi thi PISAError! Bookmark not defined.

4.

Loại hình trường và lỗi thiên lệch trong câu hỏi thi PISAError! Bookmark not defined.

5.

Đánh giá chung .................................................. Error! Bookmark not defined.

KẾT LUẬN .................................................................. Error! Bookmark not defined.
1.

Kết quả đạt đƣợc của đề tài .......................... Error! Bookmark not defined.


2.

Hạn chế và hƣớng nghiên cứu tiếp theo ...... Error! Bookmark not defined.

2


MỞ ĐẦU
1. Lý do chọn đề tài
Hiện nay, nền giáo dục Việt Nam đang thực hiện công cuộc đổi mới căn bản,
toàn diện nhằm đáp ứng yêu cầu của sự nghiệp công nghiệp hoá, hiện đại hóa đất
nước. Chúng ta đang tiến hành đổi mới từ mục tiêu, nội dung, phương pháp tới hình
thức tổ chức, phương tiện giáo dục... Để đảm bảo công cuộc đổi mới giáo dục thành
công, chúng ta cần đẩy mạnh đổi mới kiểm tra, đánh giá. Chính vì nhu cầu như vậy,
ngày 03/11/2011, Bộ GD&ĐT đã ban hành Thông tư số 51/2011/TT-BGDĐT Quy
định về Đánh giá định kỳ quốc gia kết quả học tập của học sinh trong các cơ sở giáo
dục phổ thông. Thông tư đã tạo điều kiện thuận lợi cho các kỳ đánh giá học sinh ở
cả 3 cấp học: Tiểu học, Trung học cơ sở và Trung học phổ thông, tương ứng với các
lớp 5, lớp 9 và lớp 11. Bên cạnh các kỳ đánh giá quốc gia, Việt Nam cũng tích cực
tham gia hội nhập quốc tế thông qua các kỳ đánh giá quốc tế như PISA, PASEC...
Trong đó, đáng chú ý nhất là chương trình đánh giá học sinh quốc tế PISA.
Năm 2010, lãnh đạo Bộ Giáo dục và Đào tạo Việt Nam đã quyết định ký hợp
đồng với OECD (Tổ chức hợp tác và phát triển kinh tế) để Việt Nam tham gia
Chương trình đánh giá học sinh quốc tế (Programme for international student
assessment – gọi tắt là PISA) từ chu kỳ năm 2012. Đây là chương trình đánh giá
mang quy mô toàn cầu với sự tham gia của hơn 70 quốc gia/vùng lãnh thổ, được
tiến hành theo chu kỳ 3 năm 1 lần, mỗi chu kỳ sẽ tập trung đánh giá chuyên sâu một
trong ba lĩnh vực Toán học, Khoa học và Đọc hiểu. Năm 2012, PISA tập trung vào
đánh giá năng lực của học sinh ở lĩnh vực Toán học. Chương trình này xây dựng

các bài kiểm tra để đánh giá năng lực của học sinh ở độ tuổi 15 (Theo OECD, đây là
độ tuổi học năm cuối giáo dục bắt buộc). Các đề thi cũng như các tài liệu liên quan
sẽ được dịch sang các ngôn ngữ khác nhau tùy theo từng quốc gia để sử dụng cho
đánh giá. Các quốc gia/vùng lãnh thổ tham gia chương trình đánh giá này có thể có
được những so sánh có tính chất tham khảo về chất lượng giáo dục của nước mình
với những nước khác cùng tham gia, so sánh năng lực của học sinh theo thời gian

3


và đánh giá tác động của các quyết định chính sách giáo dục từ đó đưa ra những đề
xuất phù hợp. Tháng 12/2013, kết quả thi PISA 2012 đã được công bố. Việt Nam đã
đạt được các kết quả cao hơn nhiều so với mong đợi: Toán học (lĩnh vực chính)
đứng ở vị trí 17/65, Khoa học đứng ở vị trí 8/65 và Đọc hiểu đứng vị trí 19/65.
Việt Nam là một trong những quốc gia lần đầu tiên tham gia PISA vào chu kỳ
năm 2012. Từ lúc đăng ký và được OECD chính thức đồng ý để Việt Nam tham gia
PISA 2012 đến khi kỳ thi chính thức diễn ra (tháng 4/2012), Việt Nam đã trải qua
cả một giai đoạn căng thẳng để hoàn thành được các nhiệm vụ do OECD yêu cầu
để có thể tiến hành được kỳ khảo sát chính thức. Một trong những nhiệm vụ quan
trọng và khó khăn nhất là dịch thuật, thẩm định và thích ứng các bộ đề thi và phiếu
hỏi. Mặc dù bộ đề thi của PISA được đánh giá là bộ đề thi chuẩn quốc tế, nhưng
cho đến hiện tại, có nhiều quốc gia, kể cả những quốc gia sử dụng bản nguyên gốc
bằng tiếng Anh để tiến hành khảo sát, vẫn luôn băn khoăn về chất lượng của đề thi
khi áp dụng tại từng quốc gia, đặc biệt là những quốc gia phải dịch lại bộ đề thi.
Mặc dù đã trải qua 2 kỳ khảo sát (năm 2012 và năm 2015), tuy nhiên, cho tới
thời điểm hiện tại, Việt Nam vẫn chưa có một nghiên cứu chính thức nào về chất
lượng của các câu hỏi thi được sử dụng. Trong khi, như chúng ta đã biết, kết quả
làm bài của học sinh lại bị ảnh hưởng bởi rất nhiều yếu tố như bản thân học sinh,
điều kiện gia đình, môi trường xã hội, môi trường học tập và đặc biệt là bởi chất
lượng câu hỏi thi. Một đề thi tốt sẽ đánh giá được đúng năng lực, kết quả học tập

của học sinh. Nhưng một đề thi bị lỗi sẽ cho những kết quả sai lệch, nghiêm trọng
hơn có thể làm hỏng cả một kỳ đánh giá. Một đề thi lỗi có thể là một đề thi sai về
kiến thức, có các câu hỏi gây hiểu nhầm cho học sinh, hoặc có thể các câu hỏi chỉ
phù hợp với một nhóm đối tượng nhất định...
Sau kỳ khảo sát PISA 2012 thành công, đã có rất nhiều câu hỏi được đặt ra:
Liệu rằng một bộ đề thi chuẩn quốc tế khi áp dụng tại Việt Nam có mắc các lỗi
thiên lệch hay không? Có yếu tố nào khiến cho câu hỏi thi PISA trở nên thiên lệch
hay không? Nếu có, mức độ thiên lệch của bộ đề thi PISA như thế nào?

4


Với mong muốn giải đáp một phần những câu hỏi trên, tác giả đã chọn đề tài
"Nghiên cứu một số yếu tố gây ra lỗi thiên lệch (Bias) trong câu hỏi thi PISA 2012 lĩnh vực Toán học" làm đề tài luận văn thạc sỹ của mình.
2. Ý nghĩa khoa học và thực tiễn của đề tài
2.1.

Ý nghĩa khoa học
Đề tài nghiên cứu tập trung vào nghiên cứu hệ thống lý thuyết về câu hỏi

thực hiện chức năng khác biệt (differential item functioning – DIF) và quy trình
phân tích phát hiện DIF (điều kiện cần để kết luận câu hỏi thiên lệch). Vì vậy đề tài
nghiên cứu thành công sẽ góp phần vào hệ thống lý luận về những lý thuyết đánh
giá liên quan đến các nguy cơ gây ra lỗi thiên lệch (bias) trong câu hỏi thi.
2.2.

Ý nghĩa thực tiễn
Đề tài cung cấp một hệ thống lý thuyết về các yếu tố ngôn ngữ, vị trí địa lý,

vùng miền, giới tính có thể làm xuất hiện lỗi thiên lệch (bias) trong câu hỏi thi lĩnh

vực Toán học của PISA 2012 tại Việt nam.
3. Mục đích nghiên cứu của đề tài
Nghiên cứu nhằm tìm hiểu và xác định một số yếu tố gây ra lỗi thiên lệch
(bias) trong câu hỏi thi lĩnh vực Toán học PISA tại Việt Nam.
4. Giới hạn nghiên cứu của đề tài
Đề tài giới hạn trong việc tập trung phân tích kết quả thi Toán học PISA 2012
và đi tìm sự khác biệt về hiện tượng câu hỏi DIF giữa học sinh để tìm ra các yếu tố
gây ra lỗi thiên lệch (bias) trong câu hỏi thi lĩnh vực Toán học PISA 2012 tại Việt
Nam. Các yếu tố được chia thành các nhóm sau:
- Giới tính (nam, nữ);
- Vị trí địa lý (thành thị, nông thôn, miền núi);
- Vùng miền (Bắc, Trung, Nam);
- Loại hình trường (Công lập, ngoài công lập)

5


5. Câu hỏi và giả thuyết nghiên cứu:
5.1. Câu hỏi nghiên cứu
Đề tài nhằm trả lời câu hỏi nghiên cứu: Tại Việt Nam, các yếu tố giới tính, vị
trí địa lý, vùng miền và loại hình trường gây ra lỗi thiên lệch cho câu hỏi thi PISA
như thế nào?
5.2. Giả thuyết nghiên cứu
Dựa trên câu hỏi nghiên cứu đã đề ra, tác giả đặt ra 04 giả thuyết nghiên cứu
sau:
 Yếu tố giới tính gây ra lỗi thiên lệch trong câu hỏi thi PISA 2012 lĩnh vực
Toán học tại Việt Nam.
 Yếu tố vị trí địa lý gây ra lỗi thiên lệch trong câu hỏi thi PISA 2012 lĩnh vực
Toán học tại Việt Nam.
 Yếu tố vùng miền gây ra lỗi thiên lệch trong câu hỏi thi PISA 2012 lĩnh vực

Toán học tại Việt Nam.
 Yếu tố loại hình trường gây ra lỗi thiên lệch trong câu hỏi thi lĩnh vực Toán
học PISA 2012 tại Việt Nam.
6. Khách thể, đối tƣợng nghiên cứu
6.1. Đối tượng nghiên cứu
Các yếu tố có nguy cơ gây ra lỗi thiên lệch trong câu hỏi thi PISA 2012 lĩnh
vực Toán học.
6.2. Khách thể nghiên cứu
Câu hỏi thi PISA lĩnh vực Toán học.
7. Phƣơng pháp nghiên cứu
* Phƣơng pháp nghiên cứu định tính: phƣơng pháp nghiên cứu lý luận
Tác giả tiến hành thu thập tài liệu từ nhiều nguồn khác nhau: bài báo, các đề

6


tài nghiên cứu và các tài liệu khác có liên quan ở trong và ngoài nước. Sau khi thu
thập, phân tích, tổng hợp lý thuyết, tác giả phân loại, hệ thống hóa và khái quát hóa
cơ sở lý thuyết để từ đó xây dựng được cơ sở lý luận cho đề tài.
* Phƣơng pháp phân tích định lƣợng: Tác giả sử dụng các phần mềm SPSS
và CONQUEST để chạy dữ liệu và phân tích các kết quả cần thiết. Cụ thể:
- SPSS: chạy điểm trung bình, chênh lệch điểm trung bình và Independent
Samples T-test cho các cặp dữ liệu
- CONQUEST: chạy DIF cho câu hỏi theo các cặp yếu tố.
8. Cấu trúc luận văn
Chương I. Cơ sở lý luận và tổng quan vấn đề nghiên cứu
Chương II. Phương pháp luận nghiên cứu
Chương III. Kết quả nghiên cứu và kết luận
Kết luận
Tài liệu tham khảo

Phụ lục

7


CHƢƠNG 1.
CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU
1. Các khái niệm và quan niệm
1.1. Đánh giá giáo dục
Từ cuối thế kỷ 19, khái niệm Đánh giá giáo dục đã phát triển mạnh mẽ ở các
nước phương Tây. Đã có rất nhiều nghiên cứu cũng như cách tiếp cận khác nhau về
khái niệm này. Một trong những định nghĩa được đánh giá là đã khái quát khá đầy
đủ về khái niệm này là: “Đánh giá trong giáo dục được định nghĩa là quá trình thu
thập thông tin để đưa ra những quyết định giáo dục liên quan tới học sinh, để phản
hồi cho học sinh về sự tiến bộ, những điểm mạnh và điểm tồn tại trong học tập của
chúng, để đưa ra phán quyết về hiệu quả của công tác giảng dạy và sự phù hợp của
chương trình đào tạo, và cuối cùng là để cung cấp thông tin xây dựng chính
sách.”(AFT, NCME, NEA, 1990:1)
Như vậy, có thể thấy, mục tiêu chính của đánh giá giáo dục là dựa trên các
thông tin thu thập được để đưa ra những quyết định liên quan tới giảng dạy, chương
trình học và các chính sách giáo dục nhằm phát triển khả năng học tập của học sinh.
Hiện nay, trên thế giới, không chỉ có các chương trình đánh giá chất lượng học tập
của học sinh, mà còn có các chương trình đánh giá những đối tượng khác trong môi
trường học tập, ví dụ: chương trình TALIS nhằm đánh giá chất lượng của giáo
viên/hiệu trưởng nhà trường. Những chương trình này đánh giá trực tiếp các đối
tượng liên quan đến học sinh, chứ không thông qua việc đánh giá học sinh. Nhờ vậy
giúp các nhà đánh giá có cái nhìn toàn diện và chính xác hơn về môi trường giáo
dục, ví dụ như chất lượng giảng dạy của giáo viên, kinh nghiệm quản lý của điều
kiện cơ sở vật chất, sự phù hợp của các chương trình học.
Trong tiếng Anh, khi nhắc tới Đánh giá giáo dục, người ta thường dùng 4

thuật ngữ quan trọng: Test (Kiểm tra), Measurement (Đo lường), Assessment (Đánh
giá) và Evaluation (Định giá).

8


Ở Việt Nam, thường có sự đánh đồng giữa các thuật ngữ trên.Với nhiều người,
các thuật ngữ này đều là chỉ sự đánh giá. Trên thực tế, mỗi thuật ngữ này đều sử
dụng hình thức test (kiểm tra, bài kiểm tra) nhưng không từ nào đồng nghĩa với
testing (trắc nghiệm) cả, và các bài kiểm tra trong 3 quy trình này có thể khác
nhau...”. Cụ thể:
- Thuật ngữ Test (Kiểm tra): kiểm tra chính là một hoạt động đánh giá. Kiểm
tra là hoạt động đo lường nhằm thu được các kết quả, các nhận xét, phán quyết dựa
vào các thông tin thu được theo công cụ đã chuẩn bị trước với mục đích xác định
xem cái gì đã đạt được, cái gì chưa đạt được, những nguyên nhân….
- Thuật ngữ Measurement (Đo lƣờng): đây là một hoạt động của đánh giá
định lượng. Đo lường (Measurement) là việc gán các con số cho các đặc điểm
(lượng hóa) nhằm đánh giá được cá nhân.
- Thuật ngữ Assessment (Đánh giá): đánh giá (assessment) trong giáo dục là
quá trình mô tả đối tượng thông qua các thông tin thu thập được, bao gồm các loại
thông tin định tính, thông tin định lượng. Đối tượng được đánh giá có thể là học
sinh, giáo viên hoặc hiệu trưởng. Cách thức thu thập thông tin hết sức đa dạng,
không chỉ giới hạn trong việc đo lường (measurement) hay kiểm tra (test).
- Thuật ngữ Evaluation (Định giá): đây chính là quy trình hoàn thiện, bổ
sung bước cuối cùng cho đánh giá (assessement), người đánh giá sẽ đưa ra những
nhận định/quyết định thông qua những đánh giá đã được thực hiện.
Từ khi ra đời đến nay, đánh giá giáo dục đã trải quả rất nhiều xu hướng đánh
giá. Nhưng các chuyên gia đã tóm gọn trong 3 xu hướng chính: Đánh giá để phát
triển học tập hay đánh giá vì sự tiến bộ của người học (assessment for learning),
Đánh giá về kết quả học tập (assessment of learning), Đánh giá là một quá trình

học/ đánh giá là hoạt động học tập (assessment as learning).
Như chúng ta đã biết, đánh giá giáo dục giúp cho các nhà hoạch định chính
sách đưa ra các chiến lược và hoạt động nhằm khuyến khích việc học tập của học

9


TÀI LIỆU THAM KHẢO
I.
1.

Tài liệu nƣớc ngoài
AFT, NCME, NEA (1990) Teacher Competence in Educational Assessment of

Students,USA.
2.

Alan Davies (1999), Dictionary of Language Testing, Cambridge University

press.
3.

Anthony J. Nitko (2004), Educational Assessment of Students, 4th Edition, by

Pearson Education, Inc., Upper Saddle River, New Jersey.
4.

Anthony J. Nitko,Susan M. Brookhart, (2007) Educational Assessment of

Students, Pearson Merrill Prentice Hall.

5.

Berk, R.A. (Ed.). (1982) Handbook of methods for detecting test bias.

Baltimore, The Johns Hopkins University Press.
6.

Chappuis, A.& Chappuis, J. (December 2007 - January 2008). The Best

Value

in

Formative

Assessment.

Educational

Leadership.

Informative

Assessment, p14-19.
7.

Chipman, S.F. (1988, April) Word problems: Where test bias creeps, Paper

presented at the meeting of AERA, New Orleans.
8.


Earl, L.(2003).Classroom Assessment for Deep Understanding: Shifting

from Assessment Of Learning to Assessment For Learning and Assessment As
Learning. Downloaded from />9.

Frederick G. Brown (1973), Measurement and Evaluation, F. E. Peacock

Publishers, Inc.
10. Griffin, P.(1993). Program Development and Evaluation. Assessment
Research Centre.RMIT Coburg. Australia.
11. Grisay, A.&Monseur, C.(2007). Measuring equivalence of item difficulties in
the various versions of aninternational test. Studies in Educational Evaluation,
33(1), p69-86.
12. Grisay, A.Gonzalez, E. & Monseur, C. (2009). Equivalence of item
difficulties across national versions of the PIRLS and PISA reading assessment.

10


IERI monograph series: Issues and methodologies in large-scale assessment,
Vol.2, p63-83.
13. Gronlund, E.N.(1982). Constructing Achivement Test. USA: Prentice-Hall,
Inc.
14. Hall, T.&Mengel, M. (June2002). Curriculum-Based Evaluations. NCAC
Effective Classroom Practices. Downloaded from />15. Hambleton, R.& Jone, R.(1993). Comparison of Classical Test Theory and
Item Response Theory and Their Applications to Test Development. A module in
NCME Series of Instructional Topics in Educational Measurement. NCME
Journal of Educational Measurement: Issues and Practices. p253-262.
16. Hambleton, Ronald & Rodgers, Jane (1995). Item bias review. Practical

Assessment, Research & Evaluation,
17. Hambleton, R.K., & Jones, R.W (1985) Comparisons of empirical and
judgemental methods for detecting differential item functioning. Educational
Research Quarterly.
18. Harris, D. (1989). Comparison of 1-, 2-, and 3-paramater IRT models. A
module in NCME Series of Instructional Topics in Educational Measurement.
NCME Journal of Educational Measurement: Issues and Practices, 8(1), p35-41.
19. Herbert J Walberg, Geneva D Haertel (1990),The International Encyclopedia
of Educational Evaluation, Pergamon Press, USA.
20. Jean – Marie de Ketele (1989) L’évaluation de la productivité des institutions
d’éducation, Cahier de la Fondation Universitaire : Université et société, le
rendement de l’enseignement univeristaire.
21. Kubiszyn,

T.&Borich,

G.(2003).

Educational

Testing

and

Measurement: Classroom Application and Practice. John Wiley&Sons,
Inc.Singapore.

11



22. L. R. Gay, Lorrie R. Gay and Peter W. Airasian(Jun 10, 1999) Educational
Research: Competencies for Analysis and Applications (6th Edition), Prentice Hall
23. Lawrence, I.M., Curley, W.E., & McHale, F.J. (1988, April). Differential item
functioning of SAT-verbal reading subscore items for male and female examinees.
Paper presented at the meeting of AERA, New Orleans.
24. Le, LucT. (2009). Investigating Gender Differential Item Functioning Across
Countries and Test Languages for PISA Science Items. International Journal of
Testing, 9:2, p122–133.
25. Lord, F.M. (1977). Practical Applications of Item Characteristic Curve
Theory. Journal of Educational Measurement, 14, p117-138.
26. Mellenbergh, G.J. (1984, December). Finding the biasing trait(s). Paper
presented at the Advanced Study Institute Human Assessment: Advances in
Measuring Cognition and Motivation, Athens, Greece.
27. Mellenbergh, G.J. 1985, April). Item bias: Dutch research on its definition,
detection, and explanation. Paper presented at the meeting of AERA, Chicago.
28. OECD PISA 2006 Brochure: Downloaded from www.oecd.org
29. OECD. (2007). PISA 2006 Technical Report. Downloaded from OECD
website.
30. Patrick Griffin (2003), An Introduction to the Rash Model, Assessment
Research Centre, The University of Melbourne.
31. Patrick Griffin (2003), Measuring Achievement Using Sub Tests from a
Common Item Pool a cross National Application of the Rasch Model, Assessment
Research Centre, The University of Melbourne.
32. Pedrajita, Q.J.&Talisayon, M.V.(2009). Identifying Biased Test Items by
Differential Item Functioning Analysis Using Contingency Table Approaches: A
Comparative Study. Education Quarterly, 67(1), p21-43. U.P.College of
Education. University of Philippines, Duliman.
33. Program for International Student Assessment (2005), PISA 2003

Technical Report, OEDC.


12


34. Program for International Student Assessment (2008), PISA 2006

Technical Report, OEDC
35. Program for International Student Assessment (2011), PISA 2009
Technical Report, OEDC
36. Program for International Student Assessment (2013), PISA 2012
Results: What students know and can do – Volume I”, OEDC.
37. Scheuneman, J.D. (1982a). A new look at bias in aptitude tests. In P.
Merrifield (Ed.), New directions for testing and measurement: Measuring human
abilities, No. 12. San Francisco: Jossey-Bass.
38. Scheuneman, J.D. (1982b). A posteriori analyses of biased items. In R. A. Berk
(Ed.), Handbook of methods for detecting test bias. Baltimore, The Johns Hopkins
University Press.
39. Scheuneman, J.D. (1984). A theoretical framework for the exploration of
causes and effects of bias in testing.Educational Psychology, 19(4), 219-225.
40. Schmitt, A.P., Curley, W.E., Blaustein, C.A., & Dorans, N.J. (1988, April).
Experimental evaluation of language and interest factors related to differential item
functioning for Hispanic examinees on the SAT-verbal. Paper presented at the
meeting of AERA, New Orleans.
41. Scheuneman, Janice Dowd (1985) Exploration of Causes of Bias in Test Items,
ETS Research Report.
42. T. Anne Cleary (1986), Test Bias: Prediction of grades of negro and white
students in intergrated colleges, Journal of Educational Measurement.
43. />II.

Tài liệu tiếng Việt


1.

Nguyễn Hải Châu & Lê Thị Mỹ Hà (2012), PISA và các dạng câu hỏi, Nxb

Giáo dụcViệt Nam.
2.

Lê Thị Mỹ Hà (2001), Một số khái niệm cơ bản về đánh giá trong giáo dục,

Tạp chí giáo dục, (số 14), tr. 12-14.

13


3.

Trần Bá Hoành (1996), Đánh giá trong giáo dục, Nxb Giáo dục, Hà Nội.

4.

Nguyễn Công Khanh (2004), Đánh giá và đo lường trong khoa học xã hội:

Quy trình, kỹ thuật thiết kế, thích nghi, chuẩn hóa công cụ đo, Nxb Chính trị Quốc
gia, Hà Nội.
5.

Lê Đức Ngọc (2001),Tài liệu giảng dạy Đo lường và đánh giá trong giáo dục,

Chương trình đào tạo Thạc sĩ chuyên ngành Đo lường và đánh giá trong giáo dục.

Trung tâm ĐBCLĐT & NCPTGD, ĐHQGHN.
6.

Phạm Xuân Thanh (2007), Tài liệu bài giảng về Lý thuyết đánh giá, Chương

trình đào tạo Thạc sĩ chuyên ngành Đo lường và đánh giá trong giáo dục. Trung
tâm ĐBCLĐT & NCPTGD, ĐHQGHN.
7.

Lâm Quang Thiệp (2008), Trắc Nghiệm và Ứng Dụng, Nxb Khoa Học Kỹ

Thuật, Hà Nội.
8.

Lâm Quang Thiệp (2010), Đo lường trong giáo dục, lý thuyết và ứng dụng,

Nxb Đại học Quốc gia Hà Nội.
9.

Dương Thiệu Tống (1995), Trắc nghiệm và đo lường thành quả học tập,

Trường ĐH Tổng hợp TP. Hồ Chí Minh.

14



×