TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI & NHÂN VĂN
KHOA TÂM LÍ HỌC
Bài giảng
ĐÁNH GIÁ TÂM LÍ
Người soạn: PGS.TS. NGUYỄN SINH PHÚC
HÀ NỘI - 2015
ĐÁNH GIÁ TÂM LÍ
Chương 1. MỘT SỐ VẤN ĐỀ CHUNG
1. THUẬT NGỮ VÀ KHÁI NIỆM
Các thuật ngữ:
Đánh giá tâm lí (Psychological assessment)
Trắc nghiệm tâm lí (Psychological testing)
Đánh giá hành vi (Behavioral assessment)
Đo lường tâm lí (Psychological measurement)
Chẩn đoán tâm lí (Psychodiagnostics, psychological diagnosis)
Đánh giá tâm lí
Đánh giá tâm lí là một phương pháp kiểm tra tổng thể nhằm trả lời một câu hỏi cụ
thể về chức năng tâm lí của thân chủ trong một khoảng thời gian nhất định hoặc để
dự đoán hành vi của thân chủ trong tương lai (Các tiêu chuẩn trắc nghiệm tâm lí và
giáo dục của Hội Nghiên cứu giáo dục, Hội Tâm lí và Hội đồng Quốc gia về lượng
giá trong Giáo dục, Hoa Kì, 1999).
TÂM LÍ
HỌC
TLH
Đại cương
TLH
Xã hội
TLH
Quản lý
TLH
Lâm sàng
ĐÁNH
GIÁ
TÂM LÍ
Đánh giá tâm lí là chuyên ngành của TLH, sử dụng các phương pháp khác nhau để
xác định trạng thái tâm lí hiện tại (trí tuệ, năng lực, nhân cách…) của một cá nhân
nhằm đáp ứng một mục đích nhất định (tuyển chọn nghề, tư vấn, trị liệu…).
Nội dung
- Trong mỗi ngành khoa học, có các chuyên ngành lí thuyết và các chuyên ngành
ứng dụng.
- Trong mỗi chuyên ngành (dù là lí thuyết hay ứng dụng) có phần lí thuyết/lí luận
và phần/mảng ứng dụng.
2
- Đánh giá tâm lí là chuyên ngành ứng dụng. Tuy nhiên trong nó có cả:
+ Những vấn đề về lí luận
+ Những vấn đề ứng dụng/thực hành.
ĐÁNH GIÁ
TÂM LÍ
LÍ THUYẾT
THỰC HÀNH
- Cũng có thể đưa ra một mô hình khác, cụ thể hơn về nội dung của Đánh giá tâm
lí: Đánh giá tâm lí bao gồm 3 tiểu hệ thống:
+ Lí luận
+Thử nghiệm/thực nghiệm
+ Thực hành
THỰC
HÀNH
LÍ LUẬN
THỬ
NGHIỆM
Lý luận:
- Quan niệm về trí tuệ, nhân cách: cấu trúc, sự phát triển, rối loạn…
- Tiếp cận đánh giá: trắc nghiệm/đo; thực nghiệm, đánh giá hành vi
Thử nghiệm:
- Thiết kế công cụ đánh giá
- Xây dựng/xác định: chuẩn, độ tin cậy, độ hiệu lực.
Thực hành:
3
- Đưa các công cụ vào thực hành, đáp ứng những yêu cầu của đánh giá.
2. LỊCH SỬ PHÁT TRIỂN
Khởi đầu
Sự hình thành và phát triển Đánh giá tâm lí gắn liền với sự phát triển trắc nghiệm
tâm lí. Người được xem là khởi đầu cho đánh giá tâm lí chính là nhà tâm lí học
người Anh, F. Galton (1822 – 1911). Năm 1882 ông đã thành lập phòng thí nghiệm
nhân trắc để xác định những vấn đề khác biệt cá nhân như: độ nhạy cảm giác quan,
kĩ năng vận động và thời gian phản ứng.
Galton cho rằng có thể đánh giá được những khả năng tâm trí/trí tuệ (mind) của con
người trên cơ sở sự tinh tế của giác quan. Theo ông, tất cả những thông tin mà
chúng ta thu nhận từ bên ngoài đều thông qua các kênh giác quan. Các giác quan
càng nhạy bén bao nhiêu đối với những khác biệt tinh tế của thông tin thì khả năng
suy luận, phán đoán cũng như các hoạt động trí tuệ càng tốt bấy nhiêu.
Năm 1884, tại triển lãm các thiết bị y tế ở London, Galton đã tổ chức giới thiệu
rộng rãi các trắc nghiệm do ông xây dựng. Tại phòng thí nghiệm nhân trắc của ông,
khách tham quan có thể đo những “năng lực” của mình. Có 17 chỉ số, ví dụ như:
sức mạnh ngón tay, sức mạnh nắm đấm, thị lực, dung tích phổi, phân biệt mầu sắc,
ghi nhớ đối tượng…Sau khi triển lãm kết thúc, ông đã đưa phòng thí nghiệm của
mình vào Viện bảo tàng Nam Kesington. Tại đó, trong 6 năm, ông đã trắc nghiệm
cho hơn 9.000 người. Ngoài các phép đo về một số khía cạnh của trí tuệ, Galton
còn thực hiện những thí nghiệm đầu tiên về liên tưởng. Đây cũng được xem như là
bước đi ban đầu của trắc nghiệm phóng chiếu.
J.Mc.Keen Cattell, nhà tâm lí học Mỹ cũng được nhắc đến như là một trong những
người đặt nền móng ban đầu cho trắc nghiệm tâm lí. J. Cattell cũng đã từng làm
việc tại phòng thí nghiệm tâm lí đầu tiên trên thế giới- Phòng thí nghiệm tâm lí của
W. Wundt. Không thỏa mãn với TLH thực nghiệm theo kiểu Wundt, Cattell tìm
đến Galton. Năm 1890, trên tạp chí “Tư duy” (Mind), Cattell đã có bài báo: Test
tâm lí và cách đo (Mental test and Measurement) với lời đề dẫn của Galton. Không
lâu sau đó, thuật ngữ Mental test (Test tâm lí) đã trở thành phổ biến ở Mĩ và nhiều
nước khác. Những trắc nghiệm được Cattell xây dựng gồm: đo phạm vi vận động
(thời gian di chuyển tay từ điểm này sang điểm khác); đo vùng nhạy cảm; cảm giác
sai biệt tối thiểu trọng lượng; thời gian phản ứng với âm thanh; thời gian nhận biết
mầu sắc; ước lượng tăng gấp đôi đoạn thẳng dài 50 cm; xác định khoảng thời gian
10 giây; tái hiện thứ tự dãy các chữ cái.
Nếu F. Galton, J. Cattell là những người khởi đầu thì A. Binet và mới chính là
những người thực sự mở ra thời kỳ mới của đánh giá tâm lí bằng việc xây dựng
thành công thang đo trí tuệ đầu tiên.
Là một trong những người đặt nền tảng cho TLH thực nghiệm, Binet cho rằng TLH
phải tập trung vào những quá trình tâm lí cấp cao và những quá trình tâm lí phức
tạp. Vào cuối những năm 1890, Binet đã cùng với cộng sự xây dựng một loạt các
4
trắc nghiệm đo chú ý, trí nhớ, hiểu biết, cảm giác không gian, đánh giá đạo đức…
Năm 1902, ông đã cho ra đời quyển sách: “Nghiên cứu thực nghiệm trí tuệ”. Năm
1904, ông là thành viên của Ủy ban xây dựng các phương tiện đánh giá chậm phát
triển trí tuệ trẻ em của Bộ Giáo dục Pháp. Cũng trong năm 1904, theo đề nghị của
Bộ Giáo dục Pháp, Binet đã cùng với cộng sự của ông - bác sĩ T. Simon bắt tay vào
xây dựng thang đo trí tuệ. Một năm sau, năm 1905, thang trí tuệ đầu tiên trên thế
giới đã ra đời, Thang trí tuệ Binet – Simon. Thang gồm 30 bài tập nhỏ, xắp xếp
theo mức độ khó tăng dần.
- Năm 1904, Khi Thang Binet-Simon còn đang trong quá trình soạn thảo thì ở Anh,
C. Spearman đã đưa ra lí thuyết về trí tuệ chung (lí thuyết yếu tố g).
Năm 1908, phiên bản 2 của Thang Binet – Simon ra đời trên cơ sở bổ sung chỉnh lí
phiên bản 1. Thang gồm 59 bài, phân theo các nhóm tuổi từ 3 đến 13.
Sau khi ra đời, Thang Binet – Simon đã được ứng dụng ở nhiều nước Châu Âu. Tại
Mĩ, Thang Binet – Simon đã được Goddard dịch và đưa vào ứng dụng. Tuy nhiên
kết quả của ông đo trên người nhập cư Châu Âu đã gây sốc: 83% người Do Thái;
80% người Hungari; 79% người Italy; 77% người Nga là chậm phát triển trí tuệ.
Không hài lòng với việc dịch thuật và sử dụng thiếu thận trọng này, Terman L.M.
và cộng sự đã tiến hành việc thích ứng hóa Thang Binet – Simon. Nhiều bài tập đã
được chỉnh sửa, thang cũng được đo trên mẫu đại diện để kiểm tra độ tin cậy và độ
hiệu lực. Thang được mang tên Standford – Binet.
Chiến tranh thế giới lần thứ nhất cũng là một động lực thúc đẩy việc sử dụng các
trắc nghiệm tâm lí nói chung, trắc nghiệm trí tuệ nói riêng trong quân đội nhiều
nước Châu Âu. Hàng triệu người đã được làm test tâm lí để tuyển chọn vào các
ngành phục vụ quân sự. Đặc biệt là ở Mĩ, sau khi nước này tham chiến (1917),
nhiều nhà tâm lí học, ví dụ như Cattell, Hall, Thorndike đã tham gia vào Ủy ban tổ
chức, kiểm soát và đánh giá tâm lí trong quân đội. Trắc nghiệm tâm lí đã được dùng
để tuyển chọn gián điệp, tình báo, tuyển chọn các vị trí chỉ huy. Theo một số tài
liệu, đã có trên 1 triệu lượt quân nhân Mĩ được đánh giá tâm lí trong thời gian
Chiến tranh Thế giới lần thứ nhất. Tuy nhiên kết quả thu được lại tiếp tục gây sốc.
Có khoảng 3% số quân nhân trẻ tuổi có tuổi trí tuệ dưới 10; tuổi trí tuệ trung bình
của binh sĩ Mĩ là 13,5 (Burlatruk, 2003). Sau đó các nhà tâm lí lí giải rằng trắc
nghiệm mới chỉ giới hạn ở phạm vi hẹp một số năng lực, chưa đánh giá được
những thành tố quan trọng của trí tuệ.
Để khắc phục những hạn chế đó, các nhà TLH Mĩ đã xây dựng 2 bộ trắc nghiệm
mới: Alpha quân đội (Army Alpha) và Beta quân đội (Army Beta). Đây là 2 trắc
nghiệm nhóm. Nếu Alpha quân đội bao gồm những bài tập ngôn từ như: tìm từ
đồng nghĩa và trái nghĩa, khả năng suy luận, giải toán…thì trắc nghiệm Beta quân
đội bao gồm những bài tập phi ngôn ngữ. Phiên bản này là để dành cho những
người Mĩ không thạo tiếng Anh (Người Mĩ gốc Phi, gốc Á…)
5
Sau chiến tranh Thế giới lần thứ nhất, mặc dù Thang Binet - Simon đã được cải tiến
song nhiều trắc nghiệm trí tuệ khác vẫn được tiếp tục xây dựng. Tính đến cuối
1920, đã có khoảng 1.300 test được đưa ra sử dụng (Burlatruk, 2003).
Thời kì 1920 đến giữa thế kỉ 20
Năm 1921, H. Rorschach, nhà tâm thần học Thuỵ Sĩ đã cho ra đời công trình
Psychodiagnostick (Đánh giá tâm lí). Trong quyển sách này ông đã mô tả việc dùng
các vết mực để đánh giá bệnh tâm thần. Mãi đến năm 1937, S. Beck và B.Klopfer
cùng đưa ra các kỹ thuật tiến hành và tính điểm thì phương pháp Rorschach mới
thực sự trở lên phổ biến. Năm 1939, L. Frank đưa ra thuật ngữ Projective
techniques (kĩ thuật phóng chiếu) để giải thích cơ chế của phương pháp Rorschach.
Kể từ đó đến nay, hàng loạt các phương pháp, công trình nghiên cứu, tạp chí dựa
trên kỹ thuật phóng chiếu xuất hiện.
Năm 1935, TAT (Thematic Apperception Test) của Christiana Morgan và Henry
Murray ra đời. TAT cũng là một test nhân cách dựa trên kỹ thuật phóng chiếu. Mức
độ thông dụng của nó chỉ đứng sau test Rorschach (T.Trull và E.Phares, 2001).
Năm 1938, test trí tuệ Raven (Raven Progressive Matries) xuất hiện ở Anh. Năm
1939, Wechsler cho công bố test trí tuệ người lớn, mở đầu hướng đo trí tuệ theo
khuynh số (deviation).
Năm 1935, TAT (Thematic Apperception Test) ra đời đã góp phần làm tăng “trọng
lượng” các phương pháp phóng chiếu. Và đến 1939, Frank đã đưa ra thuật ngữ:
“các phương pháp phóng chiếu” (Projective Methods) để chỉ những phương pháp
dựa trên cơ sở phóng chiếu.
Năm 1943 xuất hiện trắc nghiệm nhân cách MMPI (Minnesota Multiphasic
Inventory). Trải qua các đợt điều chỉnh, phiên bản đang dùng phổ biến hiện nay là
MMPI- II.
Do những thành công của trắc nghiệm trí tuệ, các test nhân cách cũng phát triển
mạnh. Những năm 1940-1950 là thời kỳ bùng nổ của trắc nghiệm nhân cách, đặc
biệt là các test phóng chiếu. Trong thời gian giữa 2 cuộc đại chiến thế giới, đánh giá
tâm lí vẫn tiếp tục phát triển. Năm 1926, Goodenough dùng kĩ thuật Draw-a-Man
(vẽ người) để đo trí tuệ.
Lại một lần nữa, Chiến tranh thế giới đóng vai trò động lực thúc đẩy sự phát triển
đánh giá tâm lí trong quân đội. Tại Mĩ, các nhà tâm lí học đã xây dựng Trắc nghiệm
phân loại quân đội chung (Army General Classification Test). Đây là một trắc
nghiệm nhóm và nó đã được đo cho hơn 10 triệu lượt quân nhân Mĩ trong thời gian
Chiến tranh Thế giới lần II. Ngoài ra, các nhà tâm lí cũng xây dựng những bộ trắc
nghiệm chuyên biệt cho từng quân, binh chủng như: trắc nghiệm tuyển chọn dành
cho hải quân, không quân…Cũng trong thời kì này, một loạt các trắc nghiệm nhóm
khác được xây dựng như: trắc nghiệm Rorschach nhóm, TAT nhóm rút gọn. Theo
một số tài liệu, tính đến cuối năm 1944, đã có hơn 20 triệu lượt người được làm
test tâm lí để phục vụ công tác tuyển quân.
6
Cho đến giữa thế kỉ 20, đánh giá tâm lí đồng nghĩa với làm test, hoặc là test trí tuệ
hoặc là test nhân cách, thậm chí nhà tâm lí còn được gọi là các tester.
Thời kì từ giữa thế kỉ 20 đến nay
Mặc dù xuất hiện cũng khá sớm, ngay từ đầu thế kỷ thứ 20, song mãi đến cuối
những năm 50, Tâm lí học Hành vi mới vào cuộc. Đây chính là thời kỳ của chủ
nghĩa Hành vi Bảo thủ (Radical Behaviourism). Theo các nhà tâm lí học hành vi,
chỉ có thể đo được hành vi chứ không thể đo được nhân cách hay các nét nhân
cách.
Do sự "tấn công" của Tâm lí học Hành vi, việc lượng giá, đánh giá nhân cách trong
Tâm lí học vào những năm 60 đã chuyển sang hướng hành vi nhiều hơn.
Năm 1968, W. Mischel cho rằng cái gọi là nét nhân cách chỉ tồn tại trong ý thức
của nhà nghiên cứu hơn là trong hành vi của những người được quan sát. Chính các
tình huống/ hoàn cảnh (Situation) chứ không phải là các phức bộ nét nhân cách qui
định hành vi của con người.
Tuy nhiên đến những năm 80-90 lượng giá nét nhân cách lại khẳng định lại vị trí
của mình: vẫn có những nét nhân cách ổn định trong các tình huống khác nhau
(Epstein & Obrien, 1985; Costa & Mc Crae, 1980).
Cũng trong giai đoạn này, xu hướng của đánh giá tâm lí không gắn với một trắc
nghiệm mà là một tập hợp các trắc nghiệm (tổng nghiệm), và sau đó là sự kết hợp
với nhiều phương pháp khác nữa, ví dụ, lượng giá hành vi hoặc phỏng vấn đánh
giá.
Sự phát triển của Đánh giá tâm lí ở Liên Xô
Trong TLH Xô viết, chưa từng có chuyên ngành Đánh giá tâm lí mà chỉ có Chẩn
đoán tâm lí, tuy nhiên cũng chỉ là về sau này.
Ngay sau khi Cách mạng Tháng Mười Nga thành công (1917), các nhà tâm lí học
Nga đã bắt tay vào xây dựng một nền tâm lí học mới, dựa trên cơ sở phương pháp
luận là triết học Mác – Lê nin, một nền tâm lí học phục vụ nhân dân lao động.
Trong những năm 1920 – 1930 đã có nhiều trắc nghiệm tâm lí, đặc biệt là các trắc
nghiệm trí tuệ được ứng dụng vào các lĩnh vực giáo dục, lao động nhằm góp phần
giải quyết những vấn đề của thực tiễn. Tuy nhiên vào thời kì này, như chúng ta đã
thấy, ngay trên thế giới, thực hành các trắc nghiệm tâm lí đã vượt lên trước so với lí
luận và dẫn đến một số sai lầm. Các trắc nghiệm tâm lí được ứng dụng lúc bấy giờ
ở nước Nga Xô viết cũng chủ yếu là từ nước ngoài. Bên cạnh những ấu trĩ, non nớt
chung, tại nước Nga Xô viết, trắc nghiệm trí tuệ đã động chạm đến vấn đề nhạy
cảm. Vào cuối những năm 1920, kết quả trắc nghiệm trí tuệ cho thấy IQ trung bình
của học sinh phổ thông Nga thấp hơn học sinh Mĩ là khoảng 7%. Chưa hết, điểm
IQ của con em nông dân và công nhân thấp hơn điểm IQ của con giai cấp tiểu tư
sản, công chức.
Dấy lên cuộc tranh luận của các nhà tâm lí học về việc sử dụng các trắc nghiệm tâm
lí. Cuộc tranh luận này kết thúc bằng một Nghị quyết của Ban Chấp hành Trung
7
ương Đảng Cộng sản Bonsevich (7/1936). Nghị quyết này đã cho rằng các trắc
nghiệm tâm lí nói chung, kể cả các anket tâm lí, đều dựa trên cơ sở phản khoa học,
phục vụ lợi ích của giai cấp tư sản – thù địch với giai cấp công nhân. Do vậy,
những trắc nghiệm này phải bị bãi bỏ, không được phép sử dụng tại nước Nga Xô
viết.
Mãi cho đến những năm 1960, các ý kiến rằng cần sử dụng các trắc nghiệm tâm lí
đã tăng lên đáng kể. Không chỉ là tranh luận. Các trắc nghiệm tâm lí đã sớm được
ứng dụng trong lĩnh vực tâm lí – y học, nơi mà theo nhận định của một số tác giả, ít
động chạm hơn đến những vấn đề nhạy cảm so với lĩnh vực giáo dục, hướng
nghiệp và tuyển chọn nghề. Năm 1968, ba nhà tâm lí học hàng đầu Liên Xô là:
Leontiev N.A., Luria A.R., Xmirnov A.A. đã có một bài báo đăng tải trên tạp chí
“Giáo dục học Xô viết” (số 7/1968): Về các phương pháp đánh giá trong nghiên
cứu tâm lí học sinh. Một năm sau, năm 1969, Ban chấp hành Trung ương hội Tâm
lí học Liên xô chính thức tuyên bố: Chẩn đoán tâm lí là một trong những lĩnh vực
kém phát triển nhất của Tâm lí học Xô viết và lĩnh vực này rất cần sự quan tâm,
chú ý của các nhà nghiên cứu (Burlatruk, 2003).
Về Chẩn đoán tâm lí, các nhà tâm lí học Xô viết cho rằng không nên sử dụng tiếp
cận định lượng như trắc nghiệm mà phải là tiếp cận định tính. Thậm chí có tác giả
còn cho rằng tiếp cận định tính là duy nhất đúng. Cũng theo Burlatruk, việc khẳng
định chuyên ngành Tâm lí học Chẩn đoán cũng là nhấn mạnh đến khía cạnh/tiếp
cận định tính chứ không không như chuyên ngành Trắc nghiệm tâm lí gắn liền với
định lượng.
Mặc dù nhấn mạnh đến việc cần phải phát triển Tâm lí học Chẩn đoán, tuy nhiên
thực tiễn đã cho thấy việc từ chối các trắc nghiệm tâm lí đã hạn chế rất nhiều hiệu
quả của hoạt động đánh giá tâm lí. Từ những năm 1980 cho đến 1991 – năm Liên
xô tan rã, các trắc nghiệm tâm lí từ nước ngoài được đưa vào nhiều hơn. Tuy nhiên
do cơ sở lí luận của nhiều trắc nghiệm không được chấp nhận nên nhiều tác giả đã
tìm cách giải thích/đưa ra cơ sở lí luận mới. Thêm vào đó, có nhiều trắc nghiệm
không được thích ứng hóa một cách “bài bản” nên chưa có sự thống nhất cao giữa
các nhà tâm lí học thực hành đánh giá.
3. CÁC TIẾP CẬN ĐÁNH GIÁ TÂM LÍ
Các cấp độ
Khi xem xét đến tính độc lập của bất kì một lĩnh vực, một chuyên ngành nào, người
ta đều bàn đến đối tượng mà nó nghiên cứu và hệ phương pháp mà nó sử dụng.
Cũng như các chuyên ngành khác, khi đề cập đến các phương pháp nghiên cứu của
Đánh giá tâm lí, chúng ta đều tiếp cận nó trên cả 3 bình diện/cấp độ:
Cấp độ phương pháp luận
Cấp độ này là sự thể hiện cụ thể của các quan điểm triết học của nhà nghiên cứu.
Bản thân cái gọi là hiện thực khách quan không thể được nghiên cứu một cách
8
chung chung mà là từ góc độ nào. Ví dụ, những nguyên tắc phương pháp luận của
TLH Mac xít đã được cụ thể hóa:
- Nguyên tắc quyết định luận duy vật biện chứng
- Nguyên tắc thống nhất tâm lí, ý thức, nhân cách với hoạt động
- Phải nghiên cứu các hiện tượng tâm lí trong mối liên hệ giữa chúng với nhau
và trong mối liên hệ giữa chúng với các hiện tượng khác
- Phải nghiên cứu tâm lí của một con người cụ thể...(Nguyễn Quang Uẩn, Trần
Hữu Luyến, Trần Quốc Thành, 1999).
Cấp độ cách tiếp cận/hệ phương pháp
Đây là cấp độ thể hiện hệ phương pháp hoặc cách tiếp cận mà nhà nghiên cứu sử
dụng để tiếp cận đối tượng, ví dụ tiếp cận trắc nghiệm, tiếp cận thực nghiệm, tiếp
cận hành vi.
Cũng có thể xem các nhóm phương pháp, ví dụ, các phương pháp phóng chiếu nằm
ở cấp độ này.
Cấp độ các phương pháp cụ thể
Ví dụ: phương pháp Rorschach, TAT là những phương pháp cụ thể. Cũng có những
trường hợp, thuật ngữ “kĩ thuật” được sử dụng để chỉ một phương pháp cụ thể nào
đó.
Luận bàn về phương pháp (cụ thể):
- Một phương pháp nào đó được xây dựng/thiết kế thường dựa trên cơ sở lí thuyết
nào đó. Ví dụ, phương pháp TAT.
- Mỗi phương pháp lại có tính độc lập tương đối, nó có thể được ra đời từ khung lí
thuyết này sau đó lại được vận dụng/sử dụng theo khung lí thuyết khác.
- Mỗi phương pháp có một số khía cạnh:
+ Lí thuyết lấy làm cơ sở
+ kĩ thuật: các thao tác và quy trình thực hiện
+ Dạng sản phẩm.
Một phương pháp có thể được sử dụng trong nhiều lĩnh vực khoa học khác
nhau; có phương pháp được sử dụng trong một số lĩnh vực hoặc trong một số
chuyên ngành hay chỉ trong một chuyên ngành nhất định.
Tiếp cận trắc nghiệm
Khái niệm/thuật ngữ
Thuật ngữ:
Trong tiếng Anh có một số từ gần nghĩa với nhau, do vậy khi chuyển ngữ sang
tiếng Việt, chúng ta cũng gặp các thuật ngữ khác nhau:
9
- Trắc nghiệm: vừa là động từ và vừa là danh từ. Động từ: quá trình thực hiện đo
đạc/trắc nghiệm (testing). Danh từ: một cách tiếp cận, một nhóm phương pháp hoặc
một phương pháp cụ thể (test).
- Test: từ mượn, thường dùng với nghĩa là một phương pháp.
Khái niệm:
Trắc nghiệm tâm lí: đo đạc hay lượng giá một hiện tượng tâm lí nào đó. Là một
phép đo nên việc xây dựng/soạn thảo cũng như thực hành trắc nghiệm phải tuân
theo một số yêu cầu nhất định: các chuẩn, độ tin cậy, độ hiệu lực.
Tiếp cận thực nghiệm
Trong nhận thức khoa học có nhiều phương pháp khác nhau. Có những phương
pháp mang tính chất cơ bản mà ở bất kì lĩnh vực nào cũng phải sử dụng. Cũng có
những phương pháp phổ biến ở một số lĩnh vực và có những phương pháp mang
tính đặc thù của một lĩnh vực.
Cùng với quan sát và mô tả, thực nghiệm là phương pháp nhận thức cơ bản của
khoa học nói chung, TLH nói riêng.
Thực nghiệm tâm lí: là quá trình tác động vào đối tượng một cách chủ động, trong
những điều kiện đã được khống chế để gây ra ở đối tượng những biểu hiện về quan
hệ nhân – quả, tính quy luật, cơ cấu, cơ chế của chúng, có thể lặp đi lặp lại nhiều
lần và đo đạc, định lượng, định tính một cách khách quan các hiện tượng cần
nghiên cứu. (Nguyễn Quang Uẩn và cs, tr.26).
- Đặc điểm nổi bật của thực nghiệm là vai trò chủ động, tích cực của nhà nghiên
cứu. Đây cũng chính là nét khác biệt cơ bản giữa tiếp cận thực nghiệm với trắc
nghiệm.
- Đặc điểm khác nữa của thực nghiệm chính là nhấn mạnh đến phân tích định tính.
- Theo hình thức thực hiện có thể có: thực nghiệm tự nhiên và thực nghiệm trong
phòng.
-Theo mục đích: thực nghiệm phát hiện/xác định và thực nghiệm hình thành.
Thực nghiệm xuất hiện rất sớm trong Tâm lí học. Chính sự ra đời của Phòng tâm lí
thực nghiệm của Wund đã đánh dấu sự ra đời của Tâm lí học với tư cách là một
ngành khoa học. Cùng với các phương pháp thực nghiệm, trong Tâm lí học đã có
hẳn một chuyên ngành Tâm lí học Thực nghiệm (Experimental Psychology).
Trong Đánh giá tâm lí, các phương pháp được dùng chủ yếu là trắc nghiệm. Không
thể phủ nhận vai trò của các trắc nghiệm song nếu chỉ bằng tiếp cận trắc nghiệm thì
sẽ khó có thể có được đánh giá tâm lí đầy đủ, tổng thể. Lịch sử phát triển của Tâm
lí học ứng dụng cho thấy bằng cách testing (làm test/trắc nghiệm), các nhà tâm lí
học chưa thể đáp ứng được tốt yêu cầu của thực tiễn. Do vậy, thay cho testing (nở
rộ vào những năm 50), nhiều lĩnh vực ứng dụng tâm lí đã thực hiện đánh giá
(assessment)/hoặc chẩn đoán tâm lí.
10
Trong những năm tồn tại của Tâm lí học Xôviết, nhiều nhà tâm lí học Liên Xô đã
đem đối lập tiếp cận thực nghiệm với trắc nghiệm. Cơ sở chính của sự đối lập này,
theo họ, là không nên quy các hiện tượng tâm lí của con người ra số đo thuần túy,
vô hồn. Cũng trong khoảng thời gian dài, các trắc nghiệm trí tuệ không những
không được sử dụng mà còn bị phê phán mạnh ở Liên Xô. (Một trong những
nguyên nhân đẫn đến hiện tượng đó là việc sử dụng một cách thái quá các test trí
tuệ trong những năm đầu của chính quyền Xô Viết). Những trắc nghiệm nhân cách
sau này có được khai thác và vận dụng nhưng khá dè dặt.
Nói cho cùng, như nhà tâm lí học Tiệp Khắc nổi tiếng, J. Svancara (1978) đã nhận
xét: Test là một tình huống mô hình, nhờ nó mà chúng ta có thể thu nhận được các
mẫu hành vi hoặc trải nghiệm (hành động, các câu trả lời), mà chúng ta cho đó là
tập hợp/phức hợp các chỉ số của một dấu hiệu được nghiên cứu. Với góc độ này,
test là một dạng sơ đẳng của thực nghiệm mà chúng ta phải thực hiện nó trong
những điều kiện chuẩn, bởi những nhân viên đã được đào tạo.
Ưu điểm của thực nghiệm là phân tích định tính, còn thế mạnh của trắc nghiệm là
định lượng. Trong đánh giá tâm lí nhiều khi rất cần định lượng, ví dụ, đánh giá mức
độ giảm sút trí tuệ. Tuy nhiên nếu chỉ có định lượng không thì chúng ta sẽ rất khó
khăn trong việc phân tích quan hệ nhân – quả. Mà điều này lại rất cần trong phân
tích đánh giá tâm lí.
Không nên đối lập mà trái lại, nên khai thác những điểm mạnh của từng tiếp cận.
Thực tế đánh giá tâm lí hiện nay cho thấy dường như nó là sự tích hợp của cả thực
nghiệm và trắc nghiệm.
Đánh giá hành vi
Khái niệm
Mặc dù trị liệu hành vi đã xuất hiện khá sớm, từ những năm 20 của thế kỷ 20, song
phải mãi đến giữa thập kỷ 60, đánh giá hành vi (Behavioral Assessment) mới được
sử dụng nhiều hơn trong lâm sàng. Theo các nhà tâm lí học hành vi, sự chậm trễ
này là do nửa đầu thế kỷ 20, Phân tâm học và tiếp theo đó, như nhiều nhà tâm lí
thường gọi đối với định hướng phân tâm là Tâm lí Động thái (Psychodynamic) ngự
trị trong Tâm lí học Lâm sàng.
Quan sát
Quan sát là kĩ thuật chủ yếu của đánh giá hành vi. Đối với một số trường hợp, ví dụ
như thân chủ loạn thần hoặc trẻ nhỏ thì quan sát là kĩ thuật chủ đạo. Quan sát có thể
do một chuyên gia hoặc là người đã được hướng dẫn, luyện tập. Đây thường là
những người tiếp xúc trực tiếp với đối tượng quan sát, ví dụ như: cô giáo, cha mẹ.
Quan sát cũng có thể do chính đối tượng thực hiện (tự quan sát).
Có thể sử dụng các phương tiện kĩ thuật trợ giúp: đồng hồ, camera và các thiết bị
điện tử hoặc đơn giản là giấy bút.
Quan sát trong gia đình
11
Môi trường gia đình có ảnh hưởng rất lớn đến quá trình thích ứng của cá nhân. Do
vậy có rất nhiều qui trình đánh giá hành vi đã được xây dựng. Một trong những qui
trình như vậy là hệ thống mã hoá hành vi- BCS (Behavioral Coding System) do
Patterson và CS soạn thảo năm 1975 (bảng ). Qui trình này thường được dùng để
quan sát những đứa trẻ có những hành vi hung hãn và không nghe lời. Người quan
sát được tập huấn và sau đó có thể quan sát trẻ tại gia đình trong khoảng 1-2 giờ.
Điều khá lí thú là Patterson và Fongatch (1995) quan sát 67 trẻ đã phát hiện thấy
rằng điểm số về hành vi chống đối ở trẻ tại thời điểm kết thúc trị liệu có giá trị dự
báo với những trường hợp bị cảnh sát bắt giữ trong vòng hai năm sau. Ngược lại,
không có ai trong số những người quan sát: thầy cô giáo, cha mẹ lại dự báo được
chuyện này.
Quan sát ở trường học
Tương tự, cũng có những qui trình được thiết kế để quan sát hành vi của trẻ ở
trường học. Ví dụ quan sát trực tiếp Achenbach- DOF (Achenbach’s direct
observation form, 1994). Quan sát tại bệnh viện: các kĩ thuật quan sát đã được sử
dụng từ lâu trong lâm sàng, đặc biệt là trong các bệnh viện tâm thần và các cơ sở
quản lí, điều trị những người chậm phát triển trí tuệ.
Ví dụ, một trong những qui trình quan sát hành được ưa dùng trong thực hành lâm
sàng ở Mĩ là Phiếu liệt kê hành vi theo mẫu thời gian TSBC (Time Sample
Behavioral Checklist) của Gordon Paul và CS, 1974. Theo mẫu thời gian có nghĩa
là quan sát được tiến hành đều đặn cứ sau một khoảng thời gian. Với phiếu TSBC:
quan sát người bệnh được thực hiện mỗi giờ 1 lần, mỗi lần 2 giây (không tính thời
gian ngủ). Bằng phương pháp quan sát này, Menditto và CS. (1996) đã cho thấy tác
dụng của sự kết hợp giữa thuốc Clozapin (một loại thuốc chống tâm thần mới) với
chương trình học tập xã hội trong việc hạn chế những hành vi kích động và những
hành vi không phù hợp của những người bệnh tâm thần mạn tính điều trị nội trú sau
6 tháng.
12
Bảng . Mẫu phiếu mã hoá BCS
Số đăng ký gia đình:
Số đăng ký cá nhân:
PHIẾU MÃ HOÁ HÀNH VI
Giai đoạn:
Chủ thể....................Người quan sát .............. Ngày tháng........ Số ......
AP
Đồng tình
HU
Tiếu lâm
PP
Tiếp xúc cơ thể
tích cực
AT
Chú ý
IG
Tảng lờ
RC
Tiếp nhận
CM
Ra lệnh
LA
Cười to
SS
Tự kích thích
CN
Ra lệnh (tiêu cực)
NC
Không nghe lời
TA
Nói chuyện
CO
Nghe lời
NE
Làm ngược
TE
Chảy nước mắt
CR
Khóc
NO
Bình thường
TH
Động chạm, cầm nắm
DI
Không đồng tình
NR
Không phản ứng
WH
Nói lai nhai
DP
Lệ thuộc
PL
Chơi
WK
Làm việc
DS
Không xây dựng
PN
Tiếp xúc cơ thể tiêu
cực
YE
La hét
HR
Tần suất cao
1
2
.
.
10
Mô tả
(*) Mỗi ô là 6 sec, mỗi hàng là 30 sec, trong từng ô, nếu hành vi loại nào xuất hiện thì đánh
dấu vào ô
13
Các kĩ thuật đánh giá hành vi khác
Phỏng vấn
Mục đích chính của phỏng vấn trong đánh giá hành vi là nhằm xác định hành vi có
vấn đề, những yếu tố hoàn cảnh gây ra các hành vi đó và hậu quả của chúng. Mô
hình chung, theo quan niệm của các nhà hành vi là: A-B-C (Groth-Marnat, 1990, p.
89)
A- Những yếu tố của hoàn cảnh (Antecedents): trong rất nhiều trường hợp,
nhà tâm lí không thể dễ dàng nhận diện yếu tố hoặc kích thích nào là “thủ phạm”
của hành vi có vấn đề. Chính vì vậy phỏng vấn ở đây nhằm tìm hiểu hành vi có vấn
đề diễn ra trong hoàn cảnh nào, có những yếu tố nào hiện diện.
B- Hành vi (Behaviour). Những thông số chính về hành vi có vấn đề mà nhà
quan sát cần quan tâm:
- Tần suất: hành vi đó thường xuyên hay ít gặp. Thường xuyên có thể được
tính theo tháng, tuần, cũng có thể tính theo ngày, giờ. Ví dụ hành vi xung động có
thể tính trong một tháng nhưng những hành vi như: ngọ nguậy, huých bạn trong
tăng động giảm chú ý có thể tính theo giờ, phút.
- Cường độ: thông qua phỏng vấn để có thể đánh giá mức độ mạnh/yếu của
hành vi có vấn đề.
- Độ dài: hành vi có vấn đề đó kéo dài trong bao lâu?
C- Hậu quả (Concequence). Cũng có những hành vi không gây tổn hại nhiều
nhưng cũng có những hành vi gây nguy hiểm cho bản thân thân chủ hoặc cho người
khác hoặc gây ra những thiệt hại về vật chất.
Nhằm tăng độ tin cậy của đánh giá/ chẩn đoán xu hướng chung hiện nay là sử dụng
nhiều những phỏng vấn có cấu trúc.
Các thang đo/bảng hỏi (Scale, Inventory, Questionnaire)
Một điều đương nhiên là nhà hành vi không thể quan sát được liên tục hành vi của
thân chủ. Do vậy họ có thể hỏi/phỏng vấn những người khác hoặc hỏi chính thân
chủ. Phỏng vấn đánh giá hành vi cũng được chia ra 3 mức độ:
- Phỏng vấn không có cấu trúc/tự do
- Phỏng vấn bán cấu trúc
- Phỏng vấn có cấu trúc.
Các phương pháp cụ thể
Hiện nay có rất nhiều các phương pháp khảo sát tâm lí – nhân cách. Về cơ bản,
những phương pháp này đều có thể được sử dụng phục vụ chẩn đoán tâm lí. Chúng
ta có thể tạm chia thành 2 nhóm chính: các phương pháp bổ trợ và các phương pháp
chủ đạo.
Các phương pháp bổ trợ
14
Đây là những phương pháp mà kết quả của nó được nhà tâm lí sử dụng để định
hướng chung, tạo cơ sở cho sự lựa chọn các phương pháp chủ đạo hoặc làm sáng tỏ
một đặc điểm, một khía cạnh tâm lí nào đó.
- Quan sát
- Hỏi chuyện/phỏng vấn.
Trong nhiều tài liệu tâm lí học nước ngoài, thường chỉ có thuật ngữ interview và
thường được dịch là phỏng vấn. Dựa theo cấu trúc của phỏng vấn, người ta chia ra
làm 3 loại;
+ Phỏng vấn không có cấu trúc (trò chuyện tự do)
+ Phỏng vấn bán cấu trúc (hỏi chuyện)
+ Phỏng vấn có cấu trúc chặt chẽ. Dạng phỏng vấn này thường được dùng
trong chẩn đoán tâm lí và còn được gọi là phỏng vấn chẩn đoán.
- Phân tích tiểu sử
- Phân tích sản phẩm hoạt động (các sản phẩm của hoạt động thực tiễn cũng như
hoạt động trí tuệ)
Các phương pháp chủ đạo
Đây là những phương pháp chính để dùng khảo sát tâm lí - nhân cách. Các
phương pháp này thường được dùng dưới dạng trắc nghiệm:
+ Các phương pháp khảo sát trí nhớ
+ Các phương pháp khảo sát chú ý
+ Các trắc nghiệm trí tuệ
+ Các phương pháp khảo sát cảm xúc
+ Các phương pháp khảo sát nhân cách
Một vài nhận xét, bàn luận
Nhận xét chung: Có sự khác biệt nhất định về tiếp cận chẩn đoán tâm lí.
Tiếp cận trắc nghiệm đi sâu, nhấn mạnh đến việc đo. Có cả một mảng chuyên
nghiên cứu về đo và chúng ta thấy, đo tâm lí là phải đo gián tiếp. Do đó chúng ta
cảm thấy dễ hiểu khi có nhiều phương pháp đo tâm lí khác nhau, thậm chí người ta
có thể đo cả những biến đổi sinh lí để nhằm đo tâm lí hoặc đo các yếu tố vật lí để
nhằm đo tâm lí. Đã là đo lường thì cần phải chính xác (đến mức độ tối đa), phải
chuẩn…Do vậy trắc nghiệm tâm lí rất quan tâm đến khía cạnh kĩ thuật. Tuy nhiên
khi đi vào thực tiễn, nhiều vấn đề nảy sinh và người ta nhận thấy rằng không thể
đánh giá/ chẩn đoán tâm lí chỉ thông qua các con số - kết quả của các test. Sự việc
trở nên phức tạp hơn khi có những trắc nghiệm, mà cụ thể là các trắc nghiệm phóng
chiếu thì không thể quy ra các chỉ số đo thống nhất. Thậm chí còn có tác giả đề
nghị không gọi là test phóng chiếu mà chỉ là gọi phương pháp. Do vậy khi đánh giá
15
tâm lí, nhà tâm lí cũng cần phải xử lí kết quả trong mối quan hệ với các dữ liệu
khác về thân chủ.
- Tiếp cận thực nghiệm, đặc biệt là của các nhà TLH Xô viết thời kì đầu, nhấn
mạnh đến phân tích định tính kết quả. Một trong những ưu điểm lớn nhất của thực
nghiệm, đặc biệt là thực nghiệm chẩn đoán, đó là vai trò tích cực, sáng tạo của nhà
tâm lí. Thực nghiệm nhằm khẳng định/bác bỏ một giả thuyết. Trong quá trình thực
nghiệm, với từng bài tập, nhà tâm lí có thể chủ động tạo ra các thay đổi khác nhau
để thu nhận kết quả nhằm khẳng định/bác bỏ giả thuyết thông qua việc phân tích
biện chứng các dữ liệu. Như các nhà TLH Xô viết đã khẳng định, hệ thống động cơ
chi phối rất đáng kể quá trình thân chủ thực hiện các bài tập. Thông qua phân tích,
nhà TLH có thể có được nhận định/đánh giá rằng kết quả thu được đã phản ánh
đúng tình trạng tâm lí của thân chủ hay chưa. Tuy nhiên trong thực nghiệm nói
chung, thực nghiệm chẩn đoán nói riêng cũng rất cần định lượng. Do vậy các nhà
tâm lí theo hướng thực nghiệm cũng đã bổ sung các bài tập, kĩ thuật nhằm lượng
giá hiện tượng tâm lí.
Nếu như trắc nghiệm hay thực nghiệm chẩn đoán tâm lí thường phải thực hiện
trong phòng thì người ta có quyền đặt câu hỏi liệu hiện tượng tâm lí đã được chẩn
đoán có đúng như nó vốn có? Và như thế chúng ta có thể dễ dàng nhận thấy những
hành vi quan sát được là khách quan bởi quan sát thường được thực hiện trong điều
kiện tự nhiên. Ngay cả những tình huống mà nhà hành vi tao ra thì đối với thân
chủ, những người không biết rõ mục đích của nhà tâm lí cũng tiếp nhận những tình
huống đó là thật chứ không phải giả. Tuy nhiên cái mà quan sát hành vi vẫn phải đi
đến trong chẩn đoán, đó là định chuẩn: hành vi nào được xem là dị thường, hành vi
nào là bình thường, hoặc cũng là một loại hành vi nhưng tần số bao nhiêu trong
một đơn vị thời gian thì được xếp là dị thường/kém thích ứng? Do vậy vẫn cần phải
xây dựng các quy trình kĩ thuật quan sát (nếu không trực tiếp được thì gián tiếp)
chuẩn, và không nhất thiết phải là quan sát trực tiếp mà có thể là quy trình phỏng
vấn chuẩn để rồi xây dựng thành các thang đo, dù cho chúng có thể mang các tên
khác nhau: thang, bảng hỏi, bảng kiểm…
TRẮC NGHIỆM TÂM LÍ
Chỉ trừ một số trường hợp đặc biệt, trong hầu hết các đánh giá tâm lí đều sử dụng
trắc nghiệm. Nói một cách khác, làm các trắc nghiệm tâm lí chiếm phần lớn thời
gian trong đánh giá tâm lí. Do vậy chúng tôi dành một số mục bàn sâu về trắc
nghiệm tâm lí. Trước hết chúng ta đề cập đến một vài khía cạnh về thống kê và
thang đo vì rằng các trắc nghiệm tâm lí cũng là những thang đo.
Vài nét về thống kê
Tất cả chúng ta đều sử dụng các con số trong giao tiếp, ví dụ như hệ thống tiền tệ,
ước lượng thời gian, nhiệt độ…Các con số cho phép chúng ta khai thác thông tin
được nhiều hơn, sâu hơn. Thông qua các quy tắc/nguyên tắc của các con số, chúng ta
biết được nhiều điều từ thế giới bên ngoài.
16
Test/trắc nghiệm là một phương tiện chuyển những gì quan sát được sang các con số.
Điều mà các nhà tâm lí phải quan tâm khi làm test/trắc nghiệm là kết quả của nó thể
hiện dưới dạng các con số: các con số/kết quả của test nói lên điều gì?
Nhờ có các phương pháp khoa học. TLH đạt được những tiến bộ to lớn trong hơn một
thế kỉ vừa qua trong việc nghiên cứu bản chất con người. Và trong các trắc nghiệm
tâm lí mà nhà TLH sử dụng, không thể thiếu yếu tố thống kê. Nhiều sinh viên tâm lí
rất ngại toán nói chung và toán thống kê nói riêng. Và cũng không chỉ riêng họ. Một
số nhà tâm lí cũng ngại toán thống kê bởi họ cảm thấy nó phức tạp, khó hiểu.
Tại sao ta cần toán thống kê?
- Thống kê cho phép ta mô tả. Sau khi làm một bài trắc nghiệm tâm lí, ta đạt 54 điểm.
Vậy con số 54 này nói lên điều gì? Đây là dưới trung bình hay trung bình hoặc là trên
trung bình? Nếu như 54 điểm này nằm trong tốp 5% thì khả năng điểm A là chắc
chắn. Nhưng nếu như nằm trong tốp 5% dưới cùng? Đấy lại là chuyên khác.
- Thống kê cho phép ta suy luận. Khi đang xem một chương trình TV hay, ví dụ Tìm
kiếm tài năng Việt, chúng ta tự hỏi liệu có bao nhiêu người cũng xem chương trình
này? Chúng ta không biết được chính xác trừ phi ta đi hỏi từng người. Nhưng điều đó
là không thể. Tuy nhiên dựa vào một mẫu điều tra chúng ta có thể suy đoán được có
bao nhiêu % số người xem chương trình.
Các thang đo
Có nhiều định nghĩa khác nhau về đo, trong đó có một phát biểu: đo là ứng dụng
những nguyên tắc/quy tắc để ấn định các con số cho đối tượng. Ví dụ, để đánh giá
chất lượng rượu vang, người nếm rượu sử dụng những nguyên tắc nhất định, đánh
giá theo thang bậc 10: ngon nhất là 10 điểm và dở nhất là 1 điểm.
Các tính chất của thang đo
Biên độ (Magnitude)
Biên độ để nói lên đối tượng được đo hơn, kém hoặc bằng so với chuẩn. Một ví dụ,
lớp được chia thành 4 đội bóng đá: 1,2,3 và 4. Khi này các con số chỉ là gắn vào
thành mác/tên. Kết quả thi đấu: Đội ba xếp số 1; đội hai xếp số 2; đội bốn xếp thứ 3
và cuối cùng, đội một xếp thứ 4. Số 1/thứ nhất; số 2 … khi này đã là kết quả đo.
Khoảng cách đều
Các định khoảng phải đều nhau. Ví dụ, thang đo chiều cao, định khoảng là 1 cm thì
ta có: 1;2;3…101;102 cm. Tương tự, ví dụ ta định khoảng tuổi: 15-20 (cận) tuổi thì
nhóm tiếp theo phải là 20 đến (cận) 25 tuổi.
Điểm không (0) tuyệt đối
Trên thang đo, nếu có điểm 0 thì điều đó có nghĩa là không có gì để đo. Ví dụ, vận
tốc bằng 0 có nghĩa là không có sự di chuyển của sự vật/sự vật đứng im.
Trong TLH, không phải thang nào cũng có đủ 3 tính chất trên.
Các loại thang đo
Thang định danh (Nominal Scale)
Nam/nữ; thành thị/nông thôn; miền xuôi/ngược
Theo học lực: kém; trung bình; khá
Theo nhóm tuổi: mẫu giáo, tiểu học.
17
Thang định danh là phép đo khái quát, không cung cấp thông tin chính xác về sự
khác biệt cá nhân.
Thang định danh không phải là phép đo số lượng.
Thang định danh có thể được dùng để đo các biến số khác, ví dụ, chỉ số IQ của
nam/nữ.
Thang định danh không có cả 3 tính chất của thang đo.
Thang định hạng (Ordinal Scale)
Theo thứ tự, như ví dụ về 4 đội bóng. Thang định hạng chỉ có tính chất biên độ.
Thang định khoảng (Interval Scale)
Từ 10-20 tuổi
20-30 tuổi
30-40 tuổi.
Thang định khoảng có 2 tính chất: biên độ và khoảng cách đều.
Thang tỉ suất (Ratio Scale)
Thang tỉ suất có đủ cả 3 tính chất của một thang đo: biên độ, khoảng cách đều và
điểm không tuyệt đối.
Thang
Biên độ
Tính chất
Khoảng cách đều
Định danh
Định hạng
Định khoảng
Tỉ suất
Không
Có
Có
Có
Không
Không
Có
Có
Điểm không tuyệt
đối
Không
Không
Không
Có
Tỉ lệ: một phân số mà cả tử và mẫu số cùng đơn vị đo.
Tỉ suất: tỉ số của 2 đại lượng khác đơn vị đo, ví dụ: km/h
Tần suất: số lần xuất hiện của một hiện tượng trong một đơn vị thời gian, ví dụ, tần
suất chạy tầu: 15 chuyến/ngày.
Tần số: chu kì của một hiện tượng dao động trong 1 đơn vị thời gian, ví dụ tần số 90
hez.
Các bước xây dựng trắc nghiệm tâm lí
Xác định nhu cầu
Bước đầu tiên để xây dựng 1 trắc nghiệm là xác định nhu cầu. Có nhiều loại nhu
cầu khác nhau. Một số ví dụ:
- Nhà tâm lí học đường muốn xây dựng 1 trắc nghiệm trí tuệ để đánh giá những học
sinh các trường dân tộc nội trú.
-Một nghiên cứu sinh muốn xây dựng 1 thang đo “Chiều sâu cảm xúc” bởi chưa có
trắc nghiệm nào tương tự như vậy.
- Một nhà nghiên cứu muốn thiết kế thang đo “Cơ chế phòng vệ của Cái Tôi”.
18
- Một nhà tâm lí muốn cải tiến thang đo Năng lực lãnh đạo vì muốn bổ sung, điều
chỉnh cơ sở lí luận của thang hiện hành.
- Một nhà tâm lí lâm sàng thích thang đo trầm cảm nhưng thấy nó hơi dài, không
tiện sử dụng nên muốn xây dựng phiên bản rút gọn.
- Một công ty sản xuất trắc nghiệm tâm lí muốn đưa ra thị trường thang đo thái độ
mới, cạnh tranh với những thang đang hiện hành của các công ty khác. (Hiện nay ở
Việt Nam chưa có những doanh nghiệp như vậy).
Qua một loạt các ví dụ trên, chúng ta thấy có những nhu cầu xây dựng trắc nghiệm
mang tính lí thuyết, dạng như thang đo cơ chế phòng vệ; cũng có nhu cầu mang
tính thực tiễn như xây dựng thang đo trầm cảm. Cũng có nhu cầu xây mới hoàn
toàn nhưng cũng có thể là cải tiến cái đang có.
Xác định cơ sở lí luận
Một trắc nghiệm tâm lí phải có cơ sở lí thuyết của mình. Đó có thể là một lí thuyết
đã rất nổi tiếng, ví dụ như luận thuyết của Freud về cơ chế phòng vệ, lí thuyết của
Piaget về phát triển nhận thức. Cũng có thể không chỉ một mà là một số lí thuyết
được tích hợp, tạo cơ sở cho nhà nghiên cứu xây dựng 1 thang đo nào đó. Cơ sở lí
luận sẽ quy định đối tượng cần đo và lựa chọn các item thích hợp. Ví dụ, theo quan
niệm của nhiều nhà lâm sàng, trầm cảm gồm 2 nhóm triệu chứng: các triệu chứng
tâm thần/tâm lí và các triệu chứng cơ thể. Như vậy có một số thang đo trầm cảm đã
được xây dựng theo cơ sở này. Cũng có nhà tâm lí lâm sàng dựa vào lí thuyết cho
rằng trầm cảm bao gồm các triệu chứng:
- Tự đánh giá (Self-esteem) thấp
- Hỗ trợ xã hội (Social support) kém
- Rối loạn giấc ngủ
- Cảm xúc tiêu cực.
Chính vì vậy, thang trầm cảm được xây dựng nhằm đánh giá 4 thành tố trên.
Lựa chọn thực hành
- Lựa chọn kiểu thang: đúng-sai hay đa lựa chọn hoặc thang bậc 7?
- Có thể thiết kế phiếu để máy chấm điểm?
- Thang sàng lọc hay thang phủ kín toàn bộ các thành tố?
- Có phải sử dụng cách thức nào để đánh giá mức độ chân thành của câu trả lời?
- Thang dùng cho cá nhân hay nhóm?
Thiết kế, xác định số lượng item
Mỗi tiểu chủ đề/thành tố cần bao nhiêu item? Như ví dụ thiết kế thang đo 8 giai
đoạn phát triển của Erikson, ta có thể ấn định mỗi giai đoạn là 15 item và toàn
thang sẽ là 120 item.
Lựa chọn, viết, xây dựng các item từ nhiều nguồn khác nhau: từ các thang đo tương
tự đã có; từ các tài liệu; các công trình nghiên cứu; từ quan sát, phỏng vấn... Một số
tác giả gọi đây là việc xây dựng bể item (Pool of items). Những trắc nghiệm lớn, ví
dụ, trắc nghiệm thành tích học tập, thường do các doanh nghiệp xây dựng và không
19
phải là một mà là một tập thể thực hiện. Việc xác định và lựa chọn item thường
được thực hiện thông qua phương pháp chuyên gia.
Xác định độ tin cậy
Bất kì một phép đo nào, trong bất kì lĩnh vực khoa học nào cũng cần phải đạt được
độ tin cậy nhất định.
Về mặt lí thuyết, có thể xem điểm số đo được của một phép đo trên một đối tượng
gồm 2 thành phần: điểm thực của đối tượng đó và sai số của phép đo. Gọi là điểm
thực nhưng không bao giờ chúng ta có thể xác định được chính xác. Ở đây khái
niệm này mang tính chất giả định/lập luận. Như vậy ta có thể sử dụng công thức
dưới đây để biểu thị kết quả của phép đo:
X = T + E (1)
X – kết quả đo
T- điểm thực (True score)
E – Sai số (Error).
Từ công thức (1) ta có thể nhận thấy: nếu E càng nhỏ thì X càng gần với T.
Khi bàn đến độ tin cậy của phép đo, người ta thường sử dụng các đại lượng của
toán thống kê, đó là phương sai – bình phương của độ lệch chuẩn, được viết tắt
bằng chữ xích ma bình phương . Độ lệch chuẩn được kí hiệu bằng hoặc SD
(Standard Deviation). Ý nghĩa của độ lệch chuẩn: nếu 2 nhóm số liệu có cùng giá
trị trung bình (viết tắt là hoặc M (Mean), nhóm số liệu nào có độ lệch chuẩn nhỏ
hơn, các số liệu tập trung gần giá trị trung bình hơn, ngược lại, độ lêch chuẩn càng
lớn, các giá trị càng phân tán so với giá trị trung bình). Ví dụ, ta có 2 nhóm quan sát
có điểm trung bình cộng như nhau:
M1= 8,75 ± 1,36 và M2= 8,75 ± 0,95
Các phần tử của nhóm 2 tập trung gần giá trị trung bình hơn so với nhóm 1.
Và từ công thức (1), ta cũng có thể viết:
=
+
. Phương sai
(của các sai số) càng nhỏ thì phương sai của phép đo
càng gần với phương sai của điểm thực
. Nói một cách khác, phép đo có
độ tin cậy cao.
Trong các tài liệu khác nhau, các phép đo/xác định và theo đó là các loại độ tin cậy
và độ hiệu lực được đề cập đến cũng khác nhau. Trong bài giảng này, chúng tôi đề
cập đến một số khái niệm về độ tin cậy, độ hiệu lực có tính chất chung nhất. Khi
xác định độ tin cậy của một trắc nghiệm, độ tin cậy đo lại, độ tin cậy phiên bản lựa
chọn và độ tin cậy 2 nửa trắc nghiệm là được đề cập đến nhiều.
Độ tin cậy đo lại (test-retest reliability)
20
Có thể hiểu nôm na độ tin cậy test-retest giống như việc đếm đi rồi đếm lại số tiền
trong ví. Ta vừa đếm xong, cất ví rồi có gì đó khiến ta băn khoăn và đếm lại. Số
tiến đếm lại bằng với số tiền đếm lần đầu.
Để xác định/kiểm tra độ tin cậy của trắc nghiệm, ta có thể sử dụng kĩ thuật testretest. Lần đầu làm trên một nhóm khách thể, sau một khoảng thời gian ta lại tiếp
tục đo trên nhóm đó. Kết quả của 2 lần đo được xử lí tương quan. Về mặt lí thuyết,
nếu không có sự thay đổi nào ở nhóm khách thể, thang đo có độ tin cậy cao khi kết
quả đo giống nhau. Trong thực tế, do còn có nhiều yếu tố ảnh hưởng khác, nên hệ
số tương quan test-retest đạt 0,7 được xem là thang đủ độ tin cậy.
Khoảng thời gian giữa 2 lần đo bao nhiêu thì là hợp lí? Nếu ngắn quá, ví dụ, sau vài
giờ, kết quả đo lần sau có thể là kết quả của trí nhớ chứ chưa phải của thang đo
hoàn toàn. Nếu dài qua, ví dụ, một/hai năm? Khi đó có thể tất cả nhóm đều có thay
đổi cùng chiều, ví dụ, cùng tăng thêm, thì hệ số tương quan chặt chưa chắc đã phải
là của thang đo.
Mặc dù vậy, người ta cũng không thể ấn định được thời hạn nghiêm ngặt mà chỉ là
đề cập: có thể là vài ngày, vài tuần hoặc vài tháng. Bao nihêu lâu là còn tùy thuộc
vào người xây dựng trắc nghiệm cũng như loại trắc nghiệm.
Ngoài ra cũng còn phải kể đến những yếu tố khác như những đặc điểm tâm lí, trạng
thái cảm xúc của khách thể tại 2 thời điểm là khác nhau hoặc có sự khác biệt về
động cơ giữa 2 lần đo.
Độ tin cậy phiên bản thay thế/lựa chọn
Cách thứ 2 để tính độ tin cậy của trắc nghiệm là xây dựng một bản khác, tương
đương để dùng trong trường hợp cần thay thế/lựa chọn hoặc làm lại nhưng vì một
số lí do nào đó, ví dụ, khách thể có thể đã nhớ câu trả lời, không thể đo lại bằng
bản 1. Về mặt nguyên tắc, 2 bản A và B phải tương đồng với nhau về mọi phương
diện: cách thực hiện, số lượng item…Chỉ khác nhau một điểm duy nhất: các item
không giống nhau.
Có thể đo bằng 2 bản này trên cùng một nhóm khách thể tại hai thời điểm khác
nhau. Cũng có thể chia đôi một cách ngẫu nhiên nhóm khách thể, một nửa làm bản
A, nửa còn lại làm bản B. Nếu kết quả của bản A và bản B tương quan nhau chặt
chẽ thì trắc nghiệm được xem là tin cậy.
Độ tin cậy 2 nửa trắc nghiệm (Split-half reliability)
Trong thực tế, không phải bất kì trắc nghiệm nào cũng có 2 bản. Do vậy còn có một
cách nữa để đánh giá độ tin cậy của trắc nghiệm: chia đôi kết quả trắc nghiệm và
xử lí tương quan. Ví dụ, toàn bộ trắc nghiệm có 100 item. Sau khi có kết quả của
nhóm khách thể, ta có thể tách điểm của các câu lẻ và của các câu chẵn thành 2
nhóm. Sau đó xử lí tương quan. Nếu 2 nửa tương quan thuận, chặt, thì trắc nghiệm
được xem là tin cậy.
Xác định độ hiệu lực (Validity)
21
Domino & Domino (2006), đưa ra một ví dụ khá thú vị về tính hiệu lực của trắc
nghiệm. Chúng tôi xin dẫn ra đây.
Trong một giờ học, Ông (George Domino) hướng dẫn sinh viên làm bài tập như
sau: hãy lấy thước dây đo chu vi đầu, được bao nhiêu đem nhân với 6,93. Cộng kết
quả với 3 lần số ngón tay ở bàn tay trái, cộng tiếp với 6 lần số nhãn cầu mắt của
mình. Kết quả cuối cùng chính là chỉ số IQ của bạn. Nhiều sinh viên ngạc nhiên,
không hiểu giáo sư yêu cầu thật hay đùa. Giáo sư giải thích rằng phép đo này có độ
tin cậy đo lại/ test-retest rất cao: giữa 2 lần đo, chu vi đầu của bạn chẳng hề tăng,
các bộ phận trên cơ thể cũng không thay đổi. Do vậy kết quả lần 1 với lần 2 chênh
lệch nhau rất không đáng kể.
Ví dụ cho thấy một phép đo có độ tin cậy là chưa đủ. Nó phải đo được cái cần đo.
Trong trường hợp trên, phép đo này không đo trí tuệ. Khi nói một trắc nghiệm có
độ hiệu lực cao thì cần phải hiểu sâu hơn, cụ thể hơn về cái cần đo. Ví dụ, xây dựng
thang đo thành tích về môn số học của học sinh lớp 10 thì cái cần đo là những kiến
thức về số học đối với học sinh lớp 10 chứ không phải là kiến thức số học của sinh
viên đại học.
Độ hiệu lực nội dung (Content Validity)
Hiệu lực nội dung trả lời câu hỏi rằng liệu trắc nghiệm có bao phủ hết các miền cần
đo?
Khi thiết kế trắc nghiệm, các nhà nghiên cứu thường tập trung nỗ lực vào việc xây
dựng trắc nghiệm có hiệu lực cao về nội dung. Cụ thể, những item đã được lựa
chọn đã thực sự đại diện, phủ kín miền cần đo hay chưa. Để làm được điều này,
điều đầu tiên là nhà thiết kế phải có đầy đủ kiến thức về miền cần đo. Ví dụ, xây
dựng thang đo trí nhớ thì ta phải hiểu rõ về các loại trí nhớ: trí nhớ thị giác, thính
giác; trí nhớ ngôn ngữ, không gian, hình tượng; nhớ ngắn hạn, dài hạn…Tương tự,
xây dựng thang đo trầm cảm, ta phải hiểu rõ về trầm cảm: trầm cảm gồm các rối
loạn cảm xúc; rối loạn giấc ngủ; mất cảm giác ngon miệng; thu hẹp các hứng thú
hoạt động, kể cả hoạt động tình dục; giảm sút tự đánh giá…Việc xác định hiệu lực
nội dung trong quá trình soạn thảo những trắc nghiệm nghiệm lớn thường do một
nhóm chuyên gia đảm nhận.
Hiệu lực tiêu chuẩn (Criterion Validity)
Nếu trắc nghiệm được xây dựng nhằm đo trí tuệ thì kết quả của nó “giống” như các
thang đo trí tuệ khác: đó là tiêu chuẩn về trí tuệ. Thông thường để xác định hiệu lực
tiêu chuẩn, các nhà nghiên cứu thường sử dụng tiêu chuẩn thực tiễn hoặc so sánh
với một thang đo khác cùng loại, có độ hiệu lực cao.
Hiệu lực cấu trúc (Construct Validity)
Một số tác giả còn gọi đây là hiệu lực về quan niệm của tác giả. Khác với những
hiện tượng khác, đối tượng mà trắc nghiệm tâm lí hướng đến là hiện tượng tinh
thần. Và là hiện tượng tinh thần nên có thể có những quan niệm khác nhau về
một/một số hiện tượng tâm lí nói chung, hiện tượng mà trắc nghiệm tâm lí hướng
22
đến nói riêng. Ví dụ, cái gọi là trí tuệ hoặc nhân cách, chúng ta thấy, có rất nhiều
quan niệm khác nhau. Vậy tác giả trắc nghiệm lựa chọn quan niệm nào? Theo quan
niệm đó, đối tượng/hiện tượng tâm lí cần đo có “cấu trúc” ra sao? Thể hiện qua các
biến số nào? Và cuối cùng, trắc nghiệm được xây dựng đã phản ánh đúng cấu
trúc/những nội dung đó chưa?.
Trong ba độ hiệu lực: hiệu lực nội dung, hiệu lực tiêu chuẩn và hiệu lực cấu trúc thì
hiệu lực cấu trúc đóng vai trò quan trọng nhất. Nó chi phối, thậm chí bao trùm lên 2
độ hiệu lực còn lại.
Hiểu như thế nào là độ hiệu lực thì không khó. Nhưng để xác định độ hiệu lực của
một trắc nghiệm thì đó là công việc cũng không mấy đơn giản.
Các chuẩn
Chuẩn phát triển
Trong chẩn đoán phát triển tâm lí, vấn đề chuẩn của từng lứa tuổi luôn nằm trong
tiêu điểm của sự chú ý của các tác giả.
- Quá trình phát triển tâm lí diễn ra cùng với (nhưng không song song) quá trình
phát triển thể chất.
- Quá trình phát triển tâm lí diễn ra theo từng giai đoạn, trong từng giai đoạn có sự
biến đổi về lượng, từ giai đoạn này chuyển sang giai đoạn khác là sự thay đổi về
chất.
- Mỗi trường phái có lí luận khác nhau về sự phát triển tâm lí:
+ TLH hoạt động dựa vào hoạt động chủ đạo để phân kì phát triển
+ Phân tâm dựa vào sự phát triển tâm lí – tính dục
+ Cơ sở lí thuyết chính của Piaget là các giai đoạn nhận thức.
+ Lí thuyết hành vi
- Thường có sự gắn kết tâm lí – thể chất.
Chuẩn bệnh lí
Kết quả trắc nghiệm đến bao nhiêu là bệnh lí? Có thể không phải là một điểm mà là
một khoảng điểm, ví dụ như trong test trí tuệ. Theo ICD-10 (Bảng phân loại bệnh
quốc tế lần thứ 10), IQ < 70 là chậm phát triển trí tuệ. Từ 70 đến 84 là ranh giới, từ
85 đến 115 là trung bình. Tuy nhiên với một số trắc nghiệm nhân cách thì không
thể làm được theo cách này. Ví dụ, có 4 tiêu chuẩn bệnh lí:
Dị thường về mặt thống kê hàm ý những người khác biệt về mặt thống kê so với
chuẩn: càng xa chuẩn, tính dị thường càng lớn.
Dị thường về trắc nghiệm tâm lí được hiểu là những sai biệt so với chuẩn thống kê
dạng như kết quả IQ ở trên.
Sự hiện diện của hành vi dị thường hoặc lệch lạc/lệch chuẩn, không phù hợp về
văn hóa, tôn giáo.
Tiêu chuẩn thứ tư là: một cá nhân có thể đặt mình vào nguy hiểm khi có cách nhìn
sai lệch về thế giới mặc dù điều này cũng ít gặp ở những người được coi là có
những vấn đề về tâm thần. Các tiêu chuẩn này có thể khái quát thành “4D”
23
(Deviance - lệch chuẩn; Distress - đau buồn; Dysfunction - rối loạn chức năng và
Dangerous - nguy hiểm). Nhìn chung những tiêu chuẩn này đều đúng song vẫn có
những ngoại lệ quan trọng. Ví dụ, loạn dục với trẻ em không phải là do rối loạn
stress cá nhân, còn những người có hành vi nhân cách bệnh cũng không cảm thấy
hối hận về hành động của mình.
Điểm chuẩn
Một học sinh 12 tuổi thực hiện xong bài tập trí tuệ Wechsler - WISC- R. Làm thế
nào để xác định được chỉ số IQ của trẻ? Nhà tâm lí phải tính điểm thô của từng
item rồi tra bảng dành cho trẻ 12 tuổi để xác định điểm chuẩn của item đó. Cộng tất
cả điểm của phần lời, của phần thực thi và của tổng chung, từ đó xác định được chỉ
số IQ chung cũng như IQ phần lời hay IQ phần thực thi. Vậy những bảng đó,
những bảng dành cho từng độ tuổi đó lấy ở đâu ra?
Khi xây dựng trắc nghiệm cụ thể, sau khi đã trải qua các bước ban đầu, test được
đưa ra đo trên một mẫu chuẩn/đại diện. Cỡ mẫu đại diện này khá khác nhau đối với
các test khác nhau. Đối với trắc nghiệm nhóm hoặc trắc nghiệm thành tích, cỡ mẫu
đại diện có thể lên đến 100.000 người, trong khi đó cỡ mẫu đại diện cho test cá
nhân thường nhỏ hơn, có thể từ khoảng 2.000 đến 4.000 người. Tuy nhiên cỡ mẫu
lớn chưa đảm bảo cho tính đại diện. Việc lựa chọn mẫu đại diện phải tuân thủ các
nguyên tắc nhất định.
Lựa chọn nhóm đại diện
Để xây dựng/xác định được điểm chuẩn của một trắc nghiệm/test, các nhà sáng chế
test phải thực hiện trắc nghiệm trên một nhóm chuẩn/thường gọi là nhóm đại diện,
sử dụng kết quả của nhóm đó để xây dựng điểm chuẩn. Theo nhận xét của Domino
& Domino (2006), thường là các doanh nghiệp phát hành test, ví dụ như PsychCorp
của Hoa Kì, thường có nhiều các phương tiện kĩ thuật và tài chính để xây dựng
điểm chuẩn trên một nhóm lớn, mang tính đại diện. Nhóm đại diện lớn như vậy
thường được lựa chọn theo các tiêu chí đại diện: vùng miền địa lí, sắc tộc, tầng lớp
kinh tế - xã hội, tuổi, giới. Các tiêu chí này được xác định theo kết quả điều tra dân
số mới nhất.
Cũng có những trường hợp nhóm chuẩn/đại diện được lựa chọn ngẫu nhiên. Song
thông thường thì những nhà thiết kế trắc nghiệm, đặc biệt là những trắc nghiệm
không vì mục đích thương mại, lựa chọn mẫu thuận tiện. Ví dụ, một nhà nghiên
cứu muốn xây dựng thang đo năng lực lãnh đạo có thể lựa chọn mẫu gồm những
người lãnh đạo các doanh nghiệp tại địa phương để làm test. Đổi lại, nhà tâm lí có
thể dành cho họ một buổi giảng/nói chuyện miễn phí với chủ đề “Làm thế nào để
cải thiện năng lực lãnh đạo”. Điểm chuẩn này sẽ được cải thiện khi tác giả có dịp
triển khai trên một nhóm khác hoặc các nhà nghiên cứu khác thực hiện trắc nghiệm.
Điểm phần trăm
Như ở trên đã đề cập, sau khi thiết kế, xây dựng một trắc nghiệm, test được đưa ra
đo trên mẫu đại diện. Điểm thô của nhóm mẫu đại diện này có thể được sử dụng để
24
làm thang đo. Kết quả điểm được xếp theo thứ tự tăng dần. Ví dụ, mẫu đại diện có
200 người. Điểm cao nhất sẽ được kí hiệu là P99. Cứ như thế cho đến điểm thấp
nhất sẽ là P0
Như vậy khi đi vào thực hành, số điểm mà cá nhân đạt được sẽ được đối chiếu với
điểm của nhóm chuẩn. Điểm (thô) của cá nhân càng cao thì điểm P cũng càng cao.
Nói một cách khác, điểm phần trăm biểu thị tỉ lệ phần trăm số người trong mẫu
chuẩn nằm dưới điểm thô cụ thể. Ví dụ, trong mẫu chuẩn có 28% số người đạt 15
điểm trở xuống trong một bài tập. Như vậy điểm thô 15 tương ứng với 28 điểm
phần trăm (P28).
Điểm phần trăm thể hiện cá nhân nằm ở vị trí nào so với nhóm chuẩn. Kết quả thấp
thì điểm phần trăm càng thấp, vị trí của cá nhân đó so với nhóm (đại diện) càng
thấp. Điểm phần trăm 50 (P 50) tương ứng với trung vị. Điểm phần trăm bằng không
không có nghĩa là điểm không mà là điểm đạt được thấp hơn tất cả nhóm chuẩn,
ngược lại, điểm phần trăm bằng 100 có nghĩa là điểm mà cá nhân đó đạt được cao
hơn tất cả các thành viên của nhóm chuẩn.
Nhược điểm của điểm phần trăm là ở chỗ khoảng cách không đều nhau. Ví dụ giữa
40 điểm với 50 điểm phần trăm có thể chỉ cách nhau 4 điểm thô, trong khi đó giữa
80 điểm với 90 điểm phần trăm có thể có khoảng cách lớn hơn nhiều.
Điểm chuẩn phái sinh
Điểm mà cá nhân đạt được có thể được quy ra thang điểm khác. Ví dụ, điểm trắc
nghiệm môn tiếng Anh tối đa là 100. Điểm ban đầu của sinh viên đạt được lại được
quy ra điểm bậc 10. Như vậy thang điểm bậc 10 còn gọi là điểm phái sinh.
Trong trắc nghiệm tâm lí, có nhiều test quy ra điểm phái sinh (mà chúng ta thường
gọi là điểm chuẩn) thông qua giá trị trung bình ( M- Mean) và độ lệch chuẩn (SD/σ
– Standard Deviation)
Nhiều test mới hiện nay có xu hướng dùng điểm chuẩn, dạng điểm phái sinh được
xem như là có thể thoả mãn các quan điểm khác nhau.
- Điểm z
Điểm z biểu thị khoảng cách điểm của cá nhân so với giá trị trung bình thông qua
độ lệch chuẩn:
z= (x – M ): SD
Ví dụ: x = 60 SD = 5
Nguyễn Văn A được 65 điểm. Nguyễn Văn B được 58 điểm
Điểm của A là z = (65 – 60): 5 = +1
Điểm của B sẽ là z = (58 – 60): 5 = - 0,4
Ưu điểm của điểm chuẩn z là ở chỗ mọi giá trị âm của z đều là dưới trung bình và
điều này hiển thị khá trực quan. Tuy nhiên do sự chênh lệch của một giá trị bất kì
không vượt quá 3SD nên kết quả thường phải lấy đến phần 10 (0,1) để tiện so sánh.
25