Tải bản đầy đủ (.pdf) (55 trang)

Một vài nhận xét về cách đánh giá của giáo viên người mỹ và người việt nam đối với những bài luận tốt nghiệp của sinh viên khoa ngữ văn anh đề tài nghiên cứu khoa học cấp trường năm 2007

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (548.01 KB, 55 trang )

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN

ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP TRƯỜNG
NĂM 2007

Tên đề tài:

MỘT VÀI NHẬN XÉT VỀ CÁCH ĐÁNH GIÁ CỦA
GIÁO VIÊN NGƯỜI MỸ VÀ NGƯỜI VIỆT NAM
ĐỐI VỚI NHỮNG BÀI LUẬN TỐT NGHIỆP CỦA
SINH VIÊN KHOA NGỮ VĂN ANH

Chủ nhiệm đề tài:
Các thành viên:

Cao Thị Quỳnh Loan
Nguyễn Huỳnh Đạt
Nguyễn Đăng Nguyên
Peter T. Leonard

TP. HỒ CHÍ MINH - NĂM 2008


PHẦN MỞ ĐẦU
I. ĐẶT VẤN ĐỀ
Như tác giả Weigle, S. C. (2002) có nhận xét, khả năng viết có hiệu quả
ngày càng trở nên quan trọng trong cộng đồng thế giới, và vì thế, việc dạy kỹ
năng viết cũng ngày càng khẳng định vị trí quan trọng của mình trong các
chương trình dạy ngoại ngữ. Viết trở thành một hệ thống giao tiếp do càng ngày
càng có nhiều người từ những quốc gia và những nền văn hóa khác nhau có nhu


cầu giao tiếp với nhau chớ khơng chỉ là một môn học để củng cố từ vựng, ngữ
pháp như nhiều người quan niệm trước kia. Khi quá trình tiếp thu một kỹ năng
ngôn ngữ được xem là quan trọng, thì phát sinh ra một việc khơng kém phần
quan trọng là việc kiểm tra kỹ năng đó. Do đó, vai trò của kỹ năng viết càng trở
nên quan trọng trong các chương trình dạy ngoại ngữ, thì nhu cầu tìm ra những
cách có giá trị (valid) và tin cậy được (reliable) để đánh giá kỹ năng này ngày
càng bức thiết (trang 1). Tuy đã có nhiều cơng trình nghiên cứu về việc dạy và
học kỹ năng viết một cách có hiệu quả trong lĩnh vực giảng dạy ngoại ngữ,
nhưng những cơng trình nghiên cứu về đánh giá kỹ năng viết chưa được nhiều,
và hầu như chưa có cơng trình nào so sánh về cách đánh giá của giáo viên từ
những nền văn hóa khác nhau. Bài nghiên cứu của chúng tôi là một nỗ lực bước
đầu thử đi vào lĩnh vực còn tương đối mới mẻ này.

II. LỊCH SỬ VẤN ĐỀ
Đánh giá kỹ năng viết có nghĩa là gì? Câu trả lời đơn giản là "phương
pháp tốt nhất để đánh giá kỹ năng viết là bắt người ta viết" (Hughes, 1989: trang
75). Khi bắt người ta viết có nghĩa là phải đánh giá bài luận. Đánh giá bài luận
cho đến bây giờ thường là phải do người chấm thì lại không tránh khỏi yếu tố
chủ quan. Theo tác giả McNamara T. (2000), chúng ta có thể tưởng tượng có hai
thái cực trong việc chấm điểm bài luận. Ở một cực, việc cho điểm bài luận không
dựa trên chất lượng của bài viết mà hoàn toàn tùy hứng của người chấm. Việc
cho điểm tất nhiên hồn tồn khơng tin cậy được, và điểm chấm của người này

1


khơng có tương quan gì đến điểm chấm của người kia và dĩ nhiên là không thể
dùng làm cơ sở để dự đoán được điểm chấm của người kia. Ở cực hồn hảo bên
kia, thì việc chấm điểm hồn tồn dựa trên chất lượng của bài viết. Điểm chấm
của người này hoàn toàn trùng với điểm chấm của người kia vì được dựa trên

cùng một tiêu chí và có thể dùng làm cơ sở dự đoán điểm chấm của người kia.
Thực tế nằm ở khoảng giữa hai cực này, nghiêng về cực nào hơn còn tùy thuộc
vào thước đo được sử dụng như thế nào và việc huấn luyện những người chấm
khác nhau như thế nào (trang 56-57). Vấn đề ở chỗ không phải lúc nào các nhà
khoa học cũng đồng ý đánh giá kỹ năng viết thông qua bài luận. Một thí dụ điển
hình là Test of English as a Foreign Language (TOEFL). Điểm TOEFL được sử
dụng chủ yếu để quyết định những ai được nhận vào học ở những trường đại học
ở Bắc Mỹ (Mỹ và Canada), nhưng điểm TOEFL cũng có thể được sử dụng để
tuyển dụng nhân viên nhà nước hay các chương trình học bổng vào đại học ở
những nước khác. Từ đầu thập niên 60, khi TOEFL mới được áp dụng để đánh
giá trình độ thành thạo (proficiency) tiếng Anh của những người không sử dụng
tiếng Anh như tiếng mẹ đẻ, TOEFL chưa có phần kiểm tra kỹ năng nói và viết.
Sau đó, tùy theo mục đích sử dụng kết quả TOEFL để làm gì, người ta có thể
phải thi thêm phần viết Test of Written English (TWE) hoặc/và phần nói Test of
Spoken English (TSE). Điều này phản ánh quan điểm của các nhà khoa học Mỹ
cho rằng kỹ năng nói và viết có thể được đánh giá một cách gián tiếp và khách
quan thông qua kỹ năng nghe và đọc. Chỉ tới năm 1998, khi thi TOEFL bằng
máy tính (computer-based TOEFL) bắt đầu được áp dụng, TOEFL mới chính
thức có phần thi viết như là phần bắt buộc. Phần viết trong TOEFL chiếm 30
phút. (Weigle, 2002, trang 141-142)

Trong những năm gần đây, với chính sách làm cho Việt nam nhanh chóng
hội nhập vào thế giới, nhu cầu học ngoại ngữ, đặc biệt là tiếng Anh của người
Việt ngày càng tăng. Trong các kỹ năng ngơn ngữ, viết là kỹ năng khó do phải
diễn tả ý của người viết một cách rành mạch và khơng được thơng tin phản hồi
ngay như kỹ năng nói. Vì viết là kỹ năng bắt buộc phải có trong các kỳ thi quan
trọng trong nước và trên quốc tế, làm thế nào để đánh giá được kỹ năng này
2



tương đối công bằng, làm thế nào để đạt được sự đồng ý về các tiêu chí đánh giá
đối với những bài luận tiếng Anh giữa các giáo viên, đặc biệt là giữa giáo viên
người nước ngoài và giáo viên người Việt nam đang là mối quan tâm và yêu cầu
bức thiết của người dạy và người học tiếng Anh ở nhiều cơ sở đào tạo tiếng Anh
ở Việt nam, trong đó có khoa Ngữ văn Anh, trường Đại học Khoa học Xã hội và
Nhân văn, TPHCM.

III. PHẠM VI ĐỀ TÀI
Có rất nhiều yếu tố ảnh hưởng đến q trình đánh giá một bài viết như:
thước đo đánh giá (rating scales), đề mục đánh giá (scoring rubric), chi tiết nhận
diện các mức độ khác nhau trên thước đo đánh giá (scale descriptors), v.v. Trong
phạm vi bài nghiên cứu này, chúng tôi chỉ khảo sát đề mục đánh giá được hai
giáo viên người Mỹ và người Việt sử dụng để đánh giá bài luận tốt nghiệp của
sinh viên khoa Ngữ văn Anh trường Đại học Khoa học Xã hội và Nhân văn,
TPHCM. Đề mục đánh giá của giáo viên người Việt dựa trên cách phân điểm do
Khoa Ngữ văn Anh đưa ra khi chấm phần viết, trong khi giáo viên người Mỹ
dùng đề mục đánh giá riêng.

IV. PHƯƠNG PHÁP THỰC HIỆN
Trên cơ sở chọn dữ liệu một cách ngẫu nhiên từ các bài luận tốt nghiệp
của sinh viên khoa Ngữ văn Anh, chúng tôi tiến hành thống kê và đưa ra nhận xét.
Do đó, phương pháp khoa học cơ bản được ứng dụng trong bài nghiên cứu này là
phương pháp chọn mẫu ngẫu nhiên, phương pháp thống kê (các dữ liệu thu được)
và phương pháp tổng hợp (dựa vào kết quả thống kê để nêu lên một số nhận xét
bước đầu).

3


CHƯƠNG 1

NHỮNG KHÁI NIỆM CƠ BẢN CÓ LIÊN QUAN ĐẾN VIỆC
ĐÁNH GIÁ KỸ NĂNG VIẾT
I. VIỆC DẠY VÀ HỌC KỸ NĂNG VIẾT
Do mối quan tâm lớn nhất của việc đánh giá kỹ năng viết là thu hẹp
khoảng cách giữa việc dạy và đánh giá (theo White, 1985), chúng tôi xin bắt đầu
bằng cách xem xét bối cảnh của việc dạy và học viết. Theo Raimes (1987) (trích
trong Cohen, 1994, trang 304), giáo viên cho bài tập viết vì những mục đích khác
nhau như:
1) Cho người học bắt chước một kiểu viết mẫu;
2) Để huấn luyện người học về cách vận dụng những dạng thức ngôn ngữ
và tu từ (linguistic and rhetorical forms);
3) Để củng cố phần mới vừa học;
4) Để cải thiện kỹ năng viết trôi chảy (writing fluency) của người học;
5) Để khuyến khích việc giao tiếp có thực (authentic communication)
trong đó người viết thực sự muốn truyền đạt thơng tin và người đọc thật
sự thích thú nhận thơng tin đó;
6) Để học cách tổng hợp tất cả những mục đích nêu trên, với trọng tâm là
cải thiện kỹ năng viết một cách tồn diện, chớ khơng chỉ từng khía cạnh
riêng lẻ của kỹ năng này.
Đây là những mục đích giáo viên dạy viết muốn đạt được khi muốn người
học luyện tập hay giao tiếp, có nghĩa là từ phía giáo viên chớ khơng phải từ phía
người học. Về phía người học, Cumming (1990) (cũng trích trong Cohen, 1994,
trang 304) miêu tả ba loại bài học người học mong muốn rút ra từ bài viết của
mình như sau:
1) Đánh giá và tìm kiếm cách sử dụng ngơn ngữ tốt hơn, thí dụ như tìm từ
thích hợp để tạo ra cách diễn đạt tốt nhất;
2) Thử những giả thiết mang tính chức năng (functional hypotheses) về
cách dùng ngơn ngữ thích hợp trong khi viết, có nghĩa là thử tìm những

4



cách diễn đạt thích hợp với chuẩn trong ngơn ngữ đích trong việc tạo ra
những cấu trúc ngữ pháp;
3) So sánh những tương đồng trong hai ngôn ngữ, dùng cách viết như là
một phương tiện để thử những linh cảm về cách từ ngữ trong ngôn ngữ mẹ
đẻ được diễn đạt trong ngơn ngữ đích.

Tác giả Cohen (1994) nhận xét tiếp rằng chúng ta khơng chỉ viết vì những
mục đích khác nhau, mà cịn có thể chọn những thể loại viết khác nhau cho phù
hợp với mục đích của mình. Các thể loại viết gồm có:
1) giải thích (expository writing) - để giải thích hay thơng tin;
2) thuyết phục (persuasive/expressive writing) - để thuyết phục;
3) tường thuật (narrative writing) - để kể lại một loạt các sự kiện;
4) miêu tả (descriptive writing) - để gây ra ấn tượng về mặt cảm giác về
một vật thể hay tình cảm nào đó;
5) văn chương (literary writing) - để tạo ra bài mẫu (dưới dạng tiểu thuyết,
thơ, trường ca, ...).
Thông thường, khi chúng ta viết vì một mục đích cho sẵn nào đó, chúng ta có thể
phải kết hợp nhiều thể loại khác nhau (trang 304-305).

Cũng theo tác giả này, trong những năm gần đây, phương pháp tiếp cận
theo hướng quá trình (process approach) đang dần thay thế phương pháp tiếp cận
theo hướng sản phẩm (product-oriented approach) trong nhiều chương trình dạy
viết tiếng Anh như một ngoại ngữ. Phương pháp tiếp cận theo hướng quá trình
làm nổi bật quan điểm cho rằng viết là một q trình trong đó sản phẩm hồn
chỉnh là kết quả của việc sửa nhiều bản thảo. Ý thức của người viết về quá trình
viết được nâng cao, và lý tưởng nhất là người viết chỉ nộp cho giáo viên đánh giá
khi người viết thật sự hài lòng về sản phẩm của mình. Thơng thường, bài luận
được những người cùng học và bản thân người viết đánh giá vài lượt trước khi

được giáo viên đánh giá.

5


Quá trình viết càng được chú ý tương ứng với việc ngữ pháp và các qui
ước (mechanics) ngày càng trở thành thứ yếu. Ngữ pháp và các qui ước ngày
càng trở nên mờ nhạt bởi vì bài viết của người học tiếng Anh như một ngoại ngữ
được người chấm đánh giá từ gốc độ giao tiếp (communicative perspective). Khi
giáo viên quá chú trọng đến dạng thức (như lỗi ngữ pháp, lỗi chính tả, lỗi về phép
chấm câu) có thể sẽ ảnh hưởng tiêu cực đến động cơ viết của người học. Do đó,
mối quan tâm làm cho người viết ý thức được loại lỗi nào làm cản trở việc giao
tiếp dưới hình thức viết (written communication) và loại lỗi nào không làm trở
ngại việc giao tiếp ngày càng trở nên bức thiết hơn. Điều này dẫn đến việc lôi
cuốn người viết vào quá trình đánh giá, và tự đánh giá nhiều hơn.

Hơn nữa, viết khơng cịn được xem là một quá trình của những giai đoạn
theo thứ tự (linear set of stages) như bắt đầu bằng chuẩn bị viết (prewriting), viết
(writing), rồi đến xem lại (review). Thay vào đó, viết được coi là một q trình
đệ quy (recursive). Nói cách khác, người viết quay trở lại để tiến lên phía trước.
Mỗi người có cách khác nhau để quay trở lại giai đoạn trước hoặc hoạch định,
phát sinh ý tưởng, và đánh giá bài viết của mình. (Cohen, 1994, trang 305-306)

II. VIỆC ĐÁNH GIÁ KỸ NĂNG VIẾT
Tác giả Cohen (1994) cũng nhận xét, một khi bài viết đã trải qua một loạt
các bản thảo và đã sẵn sàng được đánh giá, vấn đề ở chỗ đánh giá cái gì. Đánh
giá có thể là cả một thách thức vì có rất nhiều thứ đáng lý ra phải được đánh giá
như:
1) nội dung (content) - chiều sâu và chiều rộng đề tài được triển khai;
2) cấu trúc tu từ (rhetorical structure) - sự rõ ràng (clarity) và nhất quán

(unity) của luận đề (thesis);
3) cách tổ chức (organization) - cách triển khai ý tưởng;
4) phạm vi từ vựng (register) - mức độ trang trọng (level of formality)
thích hợp;
5) phong cách (style) - cảm giác về chủ ý (control) và uyển chuyển (grace);

6


6) nguyên lý tiết kiệm (economy) - cách dùng ngôn ngữ có hiệu quả;
7) nghĩa chính xác (accuracy of meaning) - cách chọn và sử dụng từ;
8) mức thích hợp theo qui ước ngôn ngữ (appropriateness of language
conventions) - ngữ pháp, cách viết, phép chấm câu (punctuation);
9) mức độ hiểu của người đọc (reader's understanding) - bao gồm đầy đủ
thông tin để truyền đạt ý tưởng;
10) mức độ chấp nhận của người đọc (reader's acceptance) - những nổ lực
trong bài viết để đạt được sự đồng ý của người đọc.
Trong thực tế, chỉ một vài khía cạnh nêu trên của kỹ năng viết được đánh
giá do những yếu tố về thời gian, chi phí, mối liên quan giữa việc đánh giá và đề
thi, và mức độ việc đánh giá những khía cạnh này dễ hay khó. (Cohen, 1994,
trang 307)

Người ta có thể miêu tả việc đánh giá kỹ năng viết là sự tương tác phức
tạp giữa ba yếu tố: (1) kiến thức của người ra đề về cách ra đề thi, (2) kiến thức
của người làm bài về cách thức làm bài thi, và (3) kiến thức của người chấm về
cách đánh giá bài thi. (Ruth & Murphy, 1984, trích trong Cohen, 1994, trang
307-308)

III. QUÁ TRÌNH ĐÁNH GIÁ BÀI VIẾT
Theo tác giả S. C. Weigle (2002) quá trình đánh giá bài viết rất quan trọng

bởi vì điểm bài viết sẽ được sử dụng để có những quyết định về người viết.
Điểm bài viết là kết quả của nhiều yếu tố phối hợp lại như người làm bài, đề thi,
bài viết, người chấm, và thước đo đánh giá. Trong những yếu tố này hai yếu tố
quan trọng nhất trong quá trình đánh giá là: (1) xác định thước đo đánh giá và
(2) đảm bảo người chấm phải áp dụng thước đo này hợp lý và nhất quán. (Weigle,
2002, trang 108)

7


A. Các loại thước đo đánh giá
Có bốn loại chính: (1) thước đo dựa trên một điểm chính (primary trait
scales), (2) thước đo dựa trên nhiều điểm (multitrait scales), (3) thước đo toàn thể
(holistic scales), và (4) thước đo phân tích (analytic scales) dựa trên hai đặc điểm
chính: (1) thước đo được xây dựng cụ thể cho một bài thi hay có thể khái quát
hóa cho một loại bài thi và (2) cho một điểm duy nhất hay điểm từng phần.
(Cohen, 1994; Weigle, 2002)

1. Thước đo dựa trên một điểm chính (primary trait scales)
Lloyd-Jones (1977) phát thảo chương trình kiểm tra diện rộng cho các
trường học ở Mỹ. Thước đo được xây dựng để kiểm tra kỹ năng viết của sinh
viên về một loại diễn ngôn rất hẹp như để thuyết phục hay giải thích. Đối với loại
thước đo này, người ta định trước những tiêu chuẩn cần đạt tới cho một đề tài cụ
thể. Người viết đề thi (test constructor) xác định một điểm chính và quyết định
những tiêu chí của một bài làm tốt cho mỗi đề tài trong đề thi. Do đó những đề
tài khác nhau sẽ có những điểm chính khác nhau. (trích trong Weigle, 2002, trang
110)

Ưu điểm của loại thước đo này là:
a) trình bày những tiêu chuẩn cho một bài viết tốt một cách sâu sắc và chi

tiết;
b) có sự hướng dẫn rất cụ thể cho từng mức độ người viết đạt được, điểm
cụ thể cho từng chi tiết, kèm theo sự giải thích vì sao bài luận được đánh
giá như vậy;
c) cách tiếp cận này xác nhận quan điểm của giáo viên cho là khó có thể
làm một lúc nhiều việc được.
Khuyết điểm:
a) người làm bài phải chú trọng vào một đặc điểm, nhưng trong khi viết
có thể người làm bài khơng chú tâm và có thể bao gồm thêm những đặc
điểm khác;

8


b) bằng cách đánh giá chỉ một khía cạnh của bài viết, thước đo này không
thể hợp lại thành một thể thống nhất được;
c) một khía cạnh cụ thể nào đó của bài viết có thể khơng đáng trở thành
tiêu chí duy nhất;
d) phần hướng dẫn chi tiết cách đánh giá có thể cho điểm một câu trả lời
phiến diện nhưng hoàn hảo nhiều điểm hơn câu trả lời bao quát hơn;
e) phải xây dựng tiêu chí rất cụ thể và chi tiết nên loại này thường phải tốn
rất nhiều công sức và thời gian.
(Cohen, 1994, trang 320)

2. Thước đo dựa trên nhiều điểm (multitrait scales)
Theo thước đo này, bài viết được đánh giá ở nhiều đặc điểm khác nhau.
Những đặc điểm này (thường là ba hay bốn) do một nhóm giáo viên chọn ra sao
cho nhất quán với đề thi. Hai thí dụ của những đặc điểm này có thể là 'khả năng
đọc một bài khóa và viết tóm tắt' và 'xem xét hai mặt của một vấn đề và tranh
luận từ một mặt'. Đối với loại thước đo này, người viết đề thi phải tốn nhiều thời

gian để xây dựng thước đo và làm cho thước đo có giá trị. Người viết đề thi rất
lưu tâm đến những nhu cầu cũng như hạn chế của từng trường hợp và thay đổi
thước đo cho phù hợp. Khi người chấm có ý kiến khác nhau về một bài thi, loại
thước đo dựa trên nhiều điểm có tính linh hoạt cho phép những người chấm
thương lượng, dàn xếp với nhau để giải quyết sự khác biệt.

Ưu điểm của thước đo này là:
a) những đặc điểm không cần phải trùng với những tiêu chí đánh giá một
bài viết thơng thường, mà có thể phản ánh những khía cạnh cụ thể của kỹ
năng viết được xem là quan trọng ở tình huống cụ thể đó;
b) phương pháp này cho phép tính linh động trong những trường hợp
người viết viết khác hơn những người khác;
c) có tính giá trị hơn vì bài thi dựa trên những tiêu chí trong một tình
huống cụ thể (một trường nào đó hay một cơng ty nào đó);

9


d) việc đánh giá có thể cung cấp nhiều thơng tin mang tính chẩn đốn hơn;
e) có thơng tin phản hồi tích cực cho việc dạy và học.
Khuyết điểm:
a) có thể khó xác định và làm cho những đặc điểm này có giá trị, đặc biệt
là đối với những đặc điểm chỉ thích hợp trong những tình huống nhất định;
b) nếu những đặc điểm chỉ có thể áp dụng cho một địa phương cụ thể,
người chấm có thể trở về cách chấm truyền thống mà họ quen thuộc.
(Cohen, 1994, trang 322-323)

3. Thước đo toàn thể (holistic scales)
Theo thước đo này người chấm cho một điểm duy nhất cho bài viết dựa
vào nhận xét chung về bài viết. Với loại này bài viết được đọc nhanh qua và cho

điểm theo một thước đo đánh giá. Một thí dụ cho loại thước đo này là khi người
ta chấm phần viết của TOEFL trên thang điểm từ 0-6 dựa trên sáu mức độ nắm
vững cú pháp (syntactic qualities) và sử dụng tu từ (rhetorical qualities).

Ưu điểm của loại thước đo này là
a) người làm bài được đánh giá dựa trên toàn bộ bài làm chớ khơng chỉ
một khía cạnh của bài làm (thí dụ như tính đúng ngữ pháp);
b) phương pháp này thường chú trọng vào điểm mạnh chớ không phải
điểm yếu của bài làm.
Khuyết điểm:
a) một điểm không thể cung cấp thông tin mang tính chẩn đốn được
(diagnostic information);
b) gây khó khăn cho người chấm (raters) và người sử dụng điểm của bài
viết (score users) trong việc diễn giải ý nghĩa của một điểm hợp nhất,
không giúp đánh giá được người viết mạnh ở mặt nào như về ngữ pháp,
vốn từ hay cách tổ chức bài luận đặc biệt là đối với người học ngoại ngữ
vì những mặt này của kỹ năng viết không phát triển đồng đều và ở mỗi
người mỗi khác;

10


c) người chấm có thể bỏ qua một vài khía cạnh của bài viết;
d) bài viết dài hơn có thể nhận được điểm cao hơn;
e) người chấm chú trọng đến những khía cạnh khác nhau của bài viết có
thể đưa đến cách đánh giá khác nhau;
f) trong bối cảnh học tiếng Anh như một ngoại ngữ, thước đo đánh giá có
thể làm lẫn lộn khả năng viết (writing ability) và trình độ thành thạo ngơn
ngữ (language proficiency).
(Cohen, 1994, trang 314-315)


4. Thước đo phân tích (analytic scales)
Theo thước đo này bài viết được cho điểm thành từng phần dựa trên nội
dung, cách tổ chức, từ vựng, ngữ pháp, qui ước tùy theo mục đích của việc đánh
giá. Loại thước đo này cung cấp thơng tin chi tiết hơn về các khía cạnh khác nhau
về bài viết. Jacobs et al. (1981) có thiết kế một thước đo phân tích rất phổ biến
dùng trong ngữ cảnh dạy tiếng Anh như ngoại ngữ hai (ESL). Theo thước đo của
Jacobs et al. năm khía cạnh của bài viết được đánh giá khác nhau: quan trọng
nhất là nội dung chiếm 30 điểm, kế đến là cách dùng ngôn ngữ (language use)
chiếm 25 điểm, kế đến là cách tổ chức và từ vựng ngang nhau mỗi phần chiếm
20 điểm, sau cùng là các qui ước chiếm 5 điểm. (trích trong Weigle, 2002, trang
114-115)

Ưu điểm của loại thước đo này là:
a) không làm lẫn lộn các hạng mục;
b) việc huấn luyện người chấm dễ dàng hơn khi có thước đo phân tích rõ
ràng.
Khuyết điểm:
a) khơng đảm bảo được là thước đo phân tích được sử dụng theo những
tiêu chuẩn đưa ra, việc đánh giá phần này có thể ảnh hưởng đến việc đánh
giá phần khác;
b) kỹ năng viết khơng chỉ là tổng của các khía cạnh khác nhau;

11


c) có thể cho điểm cao những bài viết thể hiện các phần khác nhau rõ ràng,
từ đó người chấm có thể cho điểm từng phần nhanh chóng hơn;
d) thước đo có thể khơng cung cấp được thơng tin gì cho người làm bài,
đặc biệt là nếu người làm bài quan tâm đến thước đo khác với người chấm.

Loại thước đo này cung cấp thông tin chi tiết về các mặt của người viết
nên thông dụng hơn ở những nước khơng nói tiếng Anh như tiếng mẹ đẻ.
(Cohen, 1994, trang 317)

B. Phác thảo đề mục đánh giá (scoring rubric)
Theo tác giả Weigle (2002), sau khi chúng ta đã xác định được sẽ sử dụng
loại thước đo đánh giá nào, bước kế tiếp là phác thảo đề mục đánh giá. Đề mục
đánh giá rất quan trọng bởi vì nó miêu tả một cách tường minh những phần đề thi
muốn đánh giá. Khi phác thảo đề mục đánh giá chúng ta cần lưu ý những yếu tố
sau:
1) Ai là người sẽ sử dụng đề mục đánh giá? Alderson (1991) cho rằng đề
mục đánh giá có ba chức năng khác nhau tùy thuộc vào ai sẽ sử dụng đề
mục này: người viết đề thi, người chấm, và người làm bài.
2) Khía cạnh nào của bài viết quan trọng nhất, và cách phân chia khía
cạnh này ra những phần nhỏ ra sao? Thí dụ như cách dùng ngôn ngữ
chung chung hay chia thành từ vựng và ngữ pháp. Yếu tố này tùy thuộc
vào trọng tâm của việc đánh giá là việc tiếp thu phần nhỏ cụ thể nào của
kỹ năng viết như phải thành thạo hay chỉ cần đạt mục đích giao tiếp.
3) Có bao nhiêu mức độ đánh giá được sử dụng? Việc phân loại các bài
viết là quan trọng nhưng chúng ta cũng cần phải xem xét đến yếu tố người
chấm có thể phân biệt được bao nhiêu loại một cách thuần thục. Đối với
TOEFL, có 6 mức độ đánh giá, trong khi IELTS có 9 mức độ. Việc quyết
định có bao nhiêu mức độ đánh giá còn tùy thuộc vào việc cần phải phân
loại bao nhiêu mức độ làm bài (performance). Nếu chỉ để phân biệt đạt /
khơng đạt thì khơng cần nhiều mức độ. Còn nếu để phân loại sinh viên
theo các khóa học có trình độ khác nhau thì cần nhiều mức độ hơn. Ngoài

12



ra kinh nghiệm của người chấm cũng ảnh hưởng đến việc có thể sử dụng
bao nhiêu mức độ: người chấm càng có kinh nghiệm, càng có thể phân
biệt chính xác sự khác biệt giữa các bài viết.
4) Điểm sẽ được báo cáo như thế nào? Nếu chúng ta sử dụng thước đo
phân tích, thì điểm có thể là điểm tổng của các phần hoặc là báo cáo riêng
để dùng vào mục đích chẩn đốn. Một vấn đề khác có liên quan là xác
định mức độ quan trọng của các thành phần khác nhau của kỹ năng viết
trong thước đo phân tích. Theo Jacobs et al. (1981), các thành phần khác
nhau có mức độ quan trọng khác nhau, quan trọng nhất là nội dung và các
qui ước ít quan trọng nhất. Hamp-Lyons (1991), thì lại cho là các thành
phần khác nhau đều phải được coi trọng như nhau, vì nếu một thành phần
này quan trọng hơn thành phần khác thì tốt hơn là nên sử dụng thước đo
toàn thể tập trung vào thành phần đó. Chúng ta cũng cần phải xem xét hai
khía cạnh của việc định cán cân cho những thành phần khác nhau của kỹ
năng viết: (1) điều này phản ánh được lý thuyết về khả năng viết (có khía
cạnh nào của khả năng này quan trọng hơn / có liên quan hơn), và (2) sẽ
có ảnh hưởng đến kết quả cuối cùng được dùng làm cơ sở cho những
quyết định liên quan đến người làm bài.
(Weigle, 2002, trang 122-124)

C. Viết chi tiết nhận diện các mức độ khác nhau trên thước đo
đánh giá (scale descriptors)
Cũng theo tác giả Weigle (2002), có hai cách thực hiện việc viết chi tiết
nhận diện các mức độ khác nhau trên thước đo đánh giá.

Bước này có thể được thực hiện bằng cách xác định trước khả năng được
đánh giá và miêu tả những mức độ đạt được khác nhau (levels of attainment), từ
mức thấp nhất đến cao nhất. Dưới đây là bảng do Bachman and Palmer (1996)
viết cho thi xếp lớp vào một khóa học viết ở một trường đại học. Ưu điểm của
việc xác định trước các mức độ khác nhau trên thước đo đánh giá là giúp chúng


13


ta đi đến kết luận về trình độ của người làm bài trên cơ sở một thước đo tuyệt đối
hơn là tương đối so với những người làm bài khác hay là so với người bản ngữ.
Tuy nhiên, việc xác định trước các mức độ khác nhau có khả năng dẫn đến việc
phân biệt chưa chính xác các mức độ (thí dụ: xuất sắc, giỏi, khá, v.v.). Đối với
người chấm chưa có kinh nghiệm, có thể sẽ gặp khó khăn trong việc phân biệt
các mức độ khác nhau nếu không được huấn luyện lâu dài và tiếp xúc thường
xuyên với những bài tiêu biểu cho các trình độ khác nhau.

Thước đo: kiến thức về cú pháp (Bachman and Palmer, 1996)
0

Mức độ
Khơng (none)

1

Hạn chế (limited)

2 Trung bình
(moderate)

3

Bao qt (extensive)

4 Hồn chỉnh

(complete)

Miêu tả
Khơng có chứng cứ có kiến thức về cú pháp
Phạm vi: khơng
Độ chính xác: khơng liên quan.
Có kiến thức hạn chế về cú pháp
Phạm vi: nhỏ
Độ chính xác: kém, vừa phải, hoặc tốt. Nếu người
làm bài chỉ sử dụng rất ít cấu trúc, có thể đạt được
độ chính xác tốt.
Có kiến thức trung bình về cú pháp
Phạm vi: trung bình
Độ chính xác: vừa phải đến tốt trong phạm vi này.
Nếu người làm bài sử dụng những cấu trúc bên
ngoài phạm vi, có thể có độ chính xác kém.
Có kiến thức bao quát về cú pháp
Phạm vi: rộng, ít giới hạn
Độ chính xác: tốt, ít lỗi.
Có chứng cứ có kiến thức hồn chỉnh về cú pháp
Phạm vi: có chứng cứ phạm vi khơng giới hạn
Độ chính xác: có chứng cứ kiểm sốt được hồn
tồn

Cách thứ hai để thực hiện bước này là định ra những mức độ khác nhau
thông qua việc xem xét tại chỗ những bài viết thật sự. Người ta thu thập mẫu bài
viết của sinh viên từ đủ mọi trình độ, rồi đưa qua cho một nhóm giáo viên quen
thuộc với các trình độ thành thạo khác nhau để định nghĩa những đặc tính giúp
phân biệt các mức độ khác nhau. Cách miêu tả sự khác biệt này thường đề cặp tới
những khái niệm như ý thức về người đọc, mức độ hiệu quả chung của việc giao


14


tiếp, và tác động lên người đọc. Những khái niệm này thường không tương ứng
với những mức độ nắm vững khác nhau (levels of mastery) ở cách đầu tiên. Do
cách xác định những mức độ khác nhau tại chỗ này dựa vào sự phán đoán của
các chuyên gia hơn là sự phân tích thống kê, nên thơng thường có thể sử dụng
trong một hồn cảnh cụ thể, mà khơng thích hợp cho việc đánh giá ở qui mô lớn
(quốc gia, quốc tế).

Việc chọn thực hiện bước định ra các mức độ khác nhau trước hay tại chỗ
tùy thuộc vào việc khía cạnh mình muốn đo có thể so với thước đo tuyệt đối
(người làm bài có khả năng X) hay để biết người làm bài có thể làm X và từ đó
có thể dự đốn người đó có thể thực hiện những việc tương tự như vậy trong
tương lai tốt hay khơng. (Weigle, 2002, trang 125-127)

D. Cách tính điểm tổng
Trước khi hoàn thành đề mục đánh giá, chúng ta cần quyết định về cách
tính điểm được thơng báo như thế nào nếu như điểm tổng được rút ra từ điểm của
những người chấm khác nhau, độ khác biệt bao nhiêu là chấp nhận được và cần
phải thực hiện những bước nào để phân xử độ khác biệt. Ở đây, Weigle (2002)
giả định là hai người chấm chấm bài độc lập với nhau, và nếu có sự khác biệt thì
một người chấm thứ ba (có nhiều kinh nghiệm hơn) sẽ đọc lại bài viết.

Trường hợp đơn giản nhất là hai người chấm thống nhất ý kiến với nhau,
điểm tổng có thể là tổng hay trung bình của hai điểm. Nếu lấy tổng của hai người
chấm có nghĩa là thang độ sẽ được nhân lên gấp đôi (từ 1-6 thành 2-12).

Một yếu tố nữa cần phải quyết định là độ khác biệt bao nhiêu là chấp nhận

được. Thông thường với thang độ từ 1-6, độ khác biệt hơn 1 điểm là phải chấm
lại. Nếu có quy định mức đậu / rớt trên thang độ như với thang độ 1-6, 3 điểm là
rớt và 4 điểm là đậu, hai người chấm một người cho 3, một người cho 4 cũng
phải chấm lại (tuy chỉ khác nhau 1 điểm). Cách kết hợp điểm của người chấm lần

15


3 khác nhau tùy từng trường hợp cụ thể: có thể lấy trung bình của hai điểm gần
nhau hơn, hoặc lấy trung bình của cả ba điểm. Trong trường hợp đậu / rớt, điểm
của người chấm lần 3 có vai trị rất quan trọng, và trung bình của hai điểm ở cùng
một bên là điểm cuối cùng. (Weigle, 2002, trang 127-128)

E. Vấn đề đối với người chấm (raters)
Theo tác giả McNamara (2000), việc đánh giá kỹ năng viết thường mang
tính chủ quan. Nói cách khác, điểm đánh giá cho người làm bài phản ánh không
chỉ chất lượng bài làm mà cả chất lượng tư cách người chấm. Giả định là các
người chấm khác nhau đều được thông báo về tiêu chí rõ ràng để đánh giá bài
viết, và những người này đều đã được huấn luyện về qui trình đánh giá, việc
đánh giá vẫn còn mang yếu tố may rủi, liên quan đến người chấm và những yếu
tố khác. Có nghĩa là chúng ta có thể nghĩ về việc đánh giá như một hiện tượng
mang tính xác suất (probabilistic phenomenon). Kết quả là người làm bài có
được đánh giá là đạt những tiêu chuẩn hay không lại phụ thuộc ngẫu nhiên vào
việc bài viết do người chấm nào đánh giá. Tệ hại hơn nữa, có người chấm lại
khơng nhất qn với cách đánh giá của mình trong những tình huống khác nhau.
Điều này giải thích tại sao khi các nhà khoa học quan tâm đến độ tin cậy của việc
đánh giá ngôn ngữ, đánh giá bài luận lại được thay thế bằng việc đánh giá những
mặt khác có liên quan đến kỹ năng viết như việc nắm vững hệ thống ngữ pháp và
kiến thức về từ vựng. Nhưng dần dần các cơng trình nghiên cứu lại tìm ra chứng
cứ là quá nhiều thứ bị bỏ qua nếu người ta sử dụng cách kiểm tra gián tiếp này.

Chúng ta cần phải đối mặt và tìm cách hạn chế vấn đề tính chủ quan. Đặc biệt là
khi phương pháp giao tiếp trong giảng dạy ngày càng phổ biến với trọng tâm là
kiến thức về ngôn ngữ (linguistic knowledge) cần phải được sử dụng như thế nào,
việc hiểu và kiểm soát được qui trình đánh giá càng trở nên bức thiết.
(McNamara, 2000, trang 37-38)

16


F. Huấn luyện người chấm (rater training)
Một cách tốt để cải thiện chất lượng của những qui trình đánh giá có liên
quan đến người chấm (rater-mediated assessment) là phải cung cấp những khóa
huấn luyện ban đầu và thường xuyên cho người chấm. Những khóa huấn luyện
này thường ở dạng những buổi họp để điều tiết (moderation meeting). Thơng
thường, có một trưởng nhóm đọc qua tất cả các bài viết để tìm ra những bài
chuẩn (benchmark scripts) đại diện cho các mức độ khác nhau trên thước đo
đánh giá (đặc biệt là phải đưa vào những bài viết mấp mé ở điểm đậu / rớt). Tất
cả các thành viên trong nhóm đọc qua để tập làm quen với thang độ. Sau đó,
người chấm được đưa một bộ bài viết ở đủ các mức độ và xác định bài nào ở
mức độ nào. Dần dần người chấm sẽ thực hiện những việc khó hơn như trong
một bộ bài viết có thể có hai hay ba bài cùng một mức độ, và có những mức độ
khơng có bài nào. Những người chấm khác nhau chấm điểm độc lập, sau đó
những điểm khác biệt được đưa ra thảo luận. Người ta đặc biệt quan tâm đến
cách diễn giải khác nhau về cùng một tiêu chí. Ngay cả khi đạt được sự thống
nhất về cách hiểu những tiêu chí, vấn đề cịn lại là sự khác nhau giữa các người
chấm. Có người chấm rộng tay, có người chấm hơi khắt khe. Nhưng thơng
thường u tố tâm lý ngượng ngùng về việc mình làm khác với những người
khác làm những người này tự điều chỉnh cách đánh giá của mình. Tuy nhiên,
những người chấm cần phải được huấn luyện thường xun để bảo đảm tính
cơng bằng trong quá trình đánh giá. (McNamara, 2000, trang 44; Weigle, 2002,

trang 130)

G. Những vấn đề đặc biệt trong đánh giá
Theo tác giả Weigle (2002), có ba loại bài viết có vấn đề có thể gặp trong
q trình đánh giá: (1) lạc đề, (2) giống bài mẫu, và (3) chưa hoàn chỉnh.

1. Bài lạc đề
Vì một lý do nào đó người viết có thể hoặc là viết thiếu theo yêu cầu đề
bài (so sánh và đối chiếu thì chỉ so sánh, đưa ra thuận lợi và khó khăn thì chỉ viết
về khó khăn, ...), hay hiểu sai đề bài (đưa ra giải pháp thì viết về nguyên nhân),

17


trong trường hợp này người chấm cần phải giải quyết như thế nào? Người chấm
cần phải quyết định xem mức độ hoàn thành bài làm tới đâu, và mức độ hoàn
thành bài làm tới đâu lại tùy thuộc vào mục đích của việc đánh giá và loại thước
đo nào được sử dụng. Thí dụ như đối với TOEFL, phần viết được dùng để kiểm
tra về khả năng viết chứ không phải khả năng đọc, nên nếu bài viết được phát
triển hợp lý và có liên quan đến đề thi thì vẫn được đánh giá là không lạc đề.
Nhưng đối với thước đo dựa trên một điểm chính, việc hồn thành yêu cầu bài
làm rất quan trọng trong quá trình đánh giá, bài viết không thỏa mãn được yêu
cầu này được xem là khơng đạt.

2. Bài giống bài mẫu
Có khi thí sinh chuẩn bị cho kỳ thi bằng cách học thuộc lòng một bài văn
mẫu. Tất nhiên là bài văn mẫu không giúp người chấm xác định được khả năng
viết của thí sinh. Tuy nhiên, cũng tùy thuộc vào mục đích của việc đánh giá và
mức độ bám vào đề bài để quyết định bài viết có được chấp nhận hay không. Nếu
chỉ là bài viết thi xếp lớp vào một chương trình đại học nào đó, mức độ hồn

thành bài làm sẽ không quan trọng bằng kỳ thi chuẩn bị cho sinh viên có thể giao
tiếp trong nghề nghiệp của mình.

3. Bài chưa hồn chỉnh
Đối với loại bài này, người chấm phải quyết định cho điểm dựa trên
những gì viết được trong bài viết và nếu như người viết có thêm thời gian thì sẽ
có được một bài hồn chỉnh hay là phải bám vào những tiêu chí cho các mức độ
khác nhau trên thước đo đánh giá mà cho chỉ điểm dựa trên những gì được thực
viết. Điều này lại cũng tùy thuộc vào mục đích của việc đánh giá. Với những kỳ
thi xếp lớp, thông tin bổ sung về thí sinh có thể thay đổi quyết định ban đầu, thì
người chấm có thể chọn cách thứ nhất. Cịn nếu trong trường hợp bài viết có thể
dùng để dự đốn về khả năng viết của thí sinh trong mơi trường học thuật, thì
người chấm phải chọn cách thứ hai.
(Weigle, 2002, trang 131-134)

18


H. Đánh giá quá trình chấm điểm bài viết (evaluating scoring
procedures)
Khi nói đến đánh giá q trình chấm điểm, tác giả Weigle (2002) đưa ra
các khía cạnh như: (1) độ tin cậy (reliability), (2) độ giá trị (validity), và (3) tính
thiết thực (practicality).

1. Độ tin cậy
Có nhiều cách để tính độ tin cậy hay tính nhất quán (consistency) của
người chấm. Độ tin cậy có thể chia làm hai loại nhỏ: (1) độ tin cậy ở bản thân
người chấm (intra-rater reliability, self-consistency), và (2) độ tin cậy giữa những
người chấm khác nhau (inter-rater reliability). Độ tin cậy ở bản thân người chấm
nói về khuynh hướng cho cùng một điểm cho cùng một bài viết ở những thời

điểm khác nhau. Trong khi đó, độ tin cậy giữa những người chấm khác nhau nói
về khuynh hướng cho cùng một điểm cho cùng một bài viết của những người
chấm khác nhau. Trong những trường hợp đơn giản nhất, khi tính tốn độ tin cậy
của điểm của cùng một người chấm ở hai thời điểm khác nhau hay điểm của hai
người chấm của cùng một mẫu, người ta có thể sử dụng hệ số tương liên
(correlation coefficient). Hệ số tương liên là một con số giữa số 0 và số 1 biểu thị
sự tương quan giữa hai bộ điểm, càng gần số 0 có nghĩa là khơng có sự tương
quan hay tương quan yếu, và càng gần số 1 có nghĩa là giữa hai bộ điểm có sự
tương quan rõ rệt. Chúng ta có thể tính hệ số tương liên bằng chức năng
correlation trong Microsoft Excel.
(Weigle, 2002, trang 134-136)

2. Độ giá trị
Bên cạnh độ tin cậy, chúng ta cịn phải xem xét q trình đánh giá ảnh
hưởng đến độ giá trị như thế nào. Thông thường có bốn loại độ giá trị cần phải
xem xét: (1) độ giá trị bề ngoài (face validity), (2) độ giá trị nội dung (content
validity), (3) độ giá trị tiêu chuẩn (criterion validity), và (4) độ giá trị kiến tạo
(construct validity).

19


a) Độ giá trị bề ngoài là độ giá trị đơn giản nhất, hay chúng ta có thể hiểu
là bề ngồi của đề thi có vẻ có giá trị (chấp nhận được) đối với người không
chuyên môn.
b) Độ giá trị nội dung cũng tương tự như độ giá trị bề ngồi nhưng được
dựa trên bằng chứng có thật (actual evidence). Thí dụ như thơng thường khi
chúng ta muốn kiểm tra sinh viên chuyên ngành Sử thì phải yêu cầu người làm
bài viết một bài luận về lịch sử.
c) Độ giá trị tiêu chuẩn nói đến mối quan hệ có thể đo được (measurable

relationship), thông thường là mối quan hệ tương liên (correlational) giữa bài thi
viết và những phương pháp đánh giá khác (phương pháp chuẩn (criterial
measures)). Độ giá trị tiêu chuẩn bao gồm: (1) độ giá trị đồng thời (concurrent
validity) trong đó việc làm bài chuẩn được so sánh với việc làm một bài khác
được thực hiện cùng một thời gian hay là gần lúc đó, và (2) độ giá trị dự đốn
(predictive validity) trong đó việc làm bài chuẩn sẽ được so sánh với việc làm
một bài khác trong tương lai. Như trong các cơng trình nghiên cứu trong lĩnh vực
viết từ trước đến nay, vấn đề chính là xác định được một thước đo chuẩn hợp lý
để so sánh với bài luận. Một số cơng trình nghiên cứu đã chứng minh được là
điểm của bài luận tương quan rất cao với những thước đo "khách quan" đồng thời
khác. Đây là lý do vì sao trong một thời gian dài bài thi TOEFL khơng có phần
viết bắt buộc. Nhưng bây giờ các chuyên gia về dạy tiếng Anh như một ngoại
ngữ (ESL professionals) cho là khơng có cách nào kiểm tra viết ngoại trừ bắt
sinh viên viết thực sự.
(Hamp-Lyons, 2003, trang 164-165)
d) Độ giá trị kiến tạo nói về ý nghĩa và sự phù hợp của việc giải thích dựa
trên kết quả điểm. Độ giá trị kiến tạo nói đến q trình xác định xem bài thi có
thực sự đo được cái định đo hay không. Để cho những quyết định dựa trên kết
quả bài thi được công bằng, việc hiểu chính xác bài thi muốn đo khả năng nào rất
quan trọng. Hơn nữa, chúng ta cũng cần phải xác định được bài thi có thể khái
quát hóa phạm vi nào của kỹ năng viết. Thí dụ như một bài thi về kỹ năng viết
trong thương mại chỉ bao gồm những dạng như thư thương mại và thư báo
(memorandum) thì kết quả khơng thể khái qt hóa cho kỹ năng viết những dạng
20


khác như viết báo cáo hay viết tóm tắt quản trị (executive summaries) được. Do
đó, mỗi bài thi có độ giá trị kiến tạo khác nhau tùy thuộc vào việc chúng ta quan
tâm đến khía cạnh nào của kỹ năng viết trong từng trường hợp cụ thể. (Weigle,
2002, trang 49)


3. Tính thiết thực
Tính thiết thực của một bài thi liên quan đến nguồn lực để viết đề thi, cho
thi và chấm bài thi. Thơng thường người ta phải tính đến việc phân tích vốn-lãi
(cost-benefit analysis), tùy vào nguồn lực chúng ta có để quyết định xem có nên
thực hiện một việc gì khơng. Thí dụ như khi áp dụng thước đo phân tích thì có
nhiều thơng tin chi tiết hơn về người làm bài so với thước đo toàn thể nhưng lại
mất thời gian hơn (Weigle, 2002, trang 138).

Tóm lại, chương này bàn về những vấn đề có liên quan đến việc đánh giá
kỹ năng viết: từ việc dạy và học kỹ năng này đến những yếu tố cần phải cân nhắc
trong quá trình đánh giá như các loại thước đo, đề mục, các chi tiết nhận diện các
mức độ khác nhau, cách tính điểm, yếu tố người chấm, những vấn đề đặc biệt
trong quá trình đánh giá. Những yếu tố này tương tác với nhau rất phức tạp và có
khả năng gây ra sự đánh giá khác nhau đưa đến việc khơng đảm bảo được tính
cơng bằng trong những quá trình đánh giá do người chấm thực hiện. Để đảm bảo
tính cơng bằng hơn trong cách diễn giải kết quả bài thi, cần thực hiện việc đánh
giá quá trình chấm điểm bài viết nhằm hạn chế đến mức tối đa tính chủ quan của
người chấm.

21


CHƯƠNG 2
SO SÁNH CÁCH ĐÁNH GIÁ CỦA GIÁO VIÊN
NGƯỜI MỸ VÀ NGƯỜI VIỆT
I. PHƯƠNG PHÁP
Dữ liệu được thu thập từ việc chọn ngẫu nhiên 40 bài luận tốt nghiệp của
sinh viên khoa Ngữ văn Anh cho hai giáo viên, một người Mỹ và một người Việt,
chấm độc lập. Giáo viên người Mỹ là giáo viên thỉnh giảng của Khoa Ngữ văn

Anh, đã sống và giảng dạy ở Việt nam 18 năm nên phần nào hiểu được và quen
thuộc với lối sống và văn hóa Việt nam. Giáo viên người Việt là giáo viên cơ hữu
của Khoa Ngữ văn Anh đã có trên 15 năm kinh nghiệm giảng dạy tiếng Anh cho
sinh viên chuyên ngữ, đã từng đi du học ở Mỹ, và tham gia những hội thảo quốc
tế về giảng dạy tiếng Anh ở Singapore,Thái lan, Úc, Nhật bản và Mỹ.
Bài thi tốt nghiệp của Khoa Ngữ văn Anh có hai phần lớn: Ngữ nghĩa học
(Semantics) và phần viết (Writing) được làm trong 150 phút. Sinh viên được
chọn một trong hai dề tài: (1) bàn về giáo dục đại học (Your opinion on tertiary
education) và (2) sắp xếp giờ đi làm khác nhau (Arranging different work hours)
để viết thành bài luận dài khoảng 250-300 từ. Chúng tôi chọn 20 bài viết về đề
tài 'giáo dục đại học' và 20 bài viết về 'sắp xếp giờ đi làm khác nhau'. Vì sinh
viên phải làm hai phần của bài thi trong vòng 150 phút nên khơng thể biết chính
xác sinh viên làm phần viết trong bao lâu. Chúng tơi chỉ có thể khẳng định là
sinh viên tự viết bài và không được tham khảo tài liệu hay tự điển.
Trong chương trình học bốn năm của ngành ngữ văn Anh, môn Viết được
dạy trong ba học kỳ chiếm 9 đơn vị học trình (theo đề cương chương trình năm
1998, dựa vào khung chương trình do Bộ Giáo dục và Đào tạo quy định). Mục
tiêu của học phần là "học viên sẽ học cách nối từ lại thành nhóm mệnh đề, câu,
nối câu lại thành đoạn văn, và tổ chức các đoạn văn trong một bài nghị luận. Họ
cũng học các thể loại văn viết (miêu tả, thuật sự, nghị luận) và ôn lại một ít điểm
ngữ pháp và cách chấm câu để có thể viết câu chính xác bằng tiếng Anh. Quan

22


trọng hơn hết học viên sẽ có nhiều cơ hội sử dụng vốn tiếng Anh của mình qua
các bài viết có hướng dẫn và dần dần đến các bài viết tự do" (trang 15). Sinh viên
học môn Viết theo hai giáo trình chính (do Hội đồng Khoa học của Khoa quyết
định) là Effective Writing và Refining Composition Skills, Rhetoric and Grammar
for ESL students. Phần viết trong bài thi tốt nghiệp được coi là phần thực hành

kết hợp với một phần hỏi về lý thuyết (Ngữ nghĩa học). Mục đích của phần viết
là nhằm để đánh giá xem sinh viên có thể sử dụng văn viết một cách có hiệu quả
và thành thạo hay không. Điểm tối đa cho phần viết là 4/10.
Để tiện cho việc phân biệt sự khác nhau chúng tôi chấm lại bài viết trên
thang điểm 100 và quyết định áp dụng loại thước đo phân tích. Lý do là vì Khoa
Ngữ văn Anh có đưa ra đề mục đánh giá quy định cho từng phần của kỹ năng
viết chiếm bao nhiêu phần trăm trong tổng số nên giáo viên người Việt vẫn sử
dụng đề mục này, và để đảm bảo tính tương đương, giáo viên người Mỹ cũng
chấm bài viết theo đề mục riêng của mình. Trong bài nghiên cứu này chúng tơi
muốn bước đầu tìm hiểu xem có sự khác nhau giữa cách đánh giá bài luận giữa
giáo viên người Mỹ và người Việt hay không nên chúng tôi chưa thực hiện việc
viết chi tiết nhận diện các mức độ khác nhau trên thước đo đánh giá, mà chỉ cho
điểm từng phần theo nhận xét ban đầu có được và kinh nghiệm bản thân khi đọc
bài viết của sinh viên.
Bảng tóm tắt đề mục đánh giá của hai giáo viên
Giáo viên người Mỹ
Nội dung (content):
50%
Cách tổ chức
30%
(organization):
Ngữ pháp và cách dùng
20%
ngôn ngữ (Grammar and
Language Use):

Giáo viên người Việt
Nội dung:
25%
Cách tổ chức:

25%
Ngữ pháp:

25%

Cách dùng ngôn ngữ:

25%

II. KẾT QUẢ
Sau khi chấm bài độc lập, chúng tôi cộng điểm từng phần thành điểm tổng
và tổng kết lại kết quả của 40 bài luận trong bảng dưới đây:

23


Bảng tổng kết điểm bài viết của hai giáo viên
Stt

Điểm của giáo
viên người Mỹ

1
2
3
4
5
6
7
8

9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38

39
40

60
51
57
45
33
55
40
85
65
40
55
60
80
70
75
50
50
55
45
45
70
75
45
87
45
50
35

60
70
60
70
60
75
70
65
65
65
70
65
70

Điểm của giáo
viên người Việt
nam
65
65
63
60
75
50
63
87
68
45
63
63
75

63
80
60
60
50
60
53
63
75
50
87
40
60
30
63
77
53
62
50
50
77
72
72
80
63
68
75
24

Sự khác biệt


Tên đề tài

05
14
06
15
42
05
23
02
03
05
08
03
05
07
05
10
10
05
15
08
07
00
05
00
05
10
05

03
07
07
08
10
25
07
07
07
15
07
03
05

Giáo dục đại học

Sắp xếp giờ đi làm


×