Tải bản đầy đủ (.pdf) (179 trang)

Nghiên cứu xây dựng kho ngữ liệu giáo khoa tiếng Anh chuyên ngành Xã hội học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.82 MB, 179 trang )

ĐẠ I HỌ C QUỐ C GIA HÀ NỘ I
TRƯ Ờ NG ĐẠ I HỌ C KHOA HỌ C XÃ HỘ I VÀ NHÂN VĂN
____________________________

Lâm Thị Hòa Bình

NGHIÊN CỨ U XÂY DỰ NG
KHO NGỮ

LIỆ U GIÁO KHOA TIẾ NG ANH

CHUYÊN NGÀNH XÃ HỘ I HỌ C

LUẬ N ÁN TIẾ N SĨ NGÔN NGỮ

Hà Nộ i - 2017

HỌ C


ĐẠ I HỌ C QUỐ C GIA HÀ NỘ I
TRƯ Ờ NG ĐẠ I HỌ C KHOA HỌ C XÃ HỘ I VÀ NHÂN VĂN
-------------------------

Lâm Thị Hòa Bình

NGHIÊN CỨ U XÂY DỰ NG
KHO NGỮ

LIỆ U GIÁO KHOA TIẾ NG ANH


CHUYÊN NGÀNH XÃ HỘ I HỌ C

Chuyên ngành:

Ngôn ngữ họ c

Mã số :

62 22 02 40

LUẬ N ÁN TIẾ N SĨ NGÔN NGỮ

HỌ C

NGƯ Ờ I HƯ Ớ NG DẪ N KHOA HỌ C :
PGS.TS LÂM QUANG ĐÔNG
GS. TS NGUYỄ N THIỆ N GIÁP
Hà Nộ i – 2017


LỜ I CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên c ứ u củ a riêng tôi; các số liệ u, kế t
quả nghiên cứ u đư ợ c trình bày trong luậ n án là trung thự c, khách quan và chư a từ ng
đư ợ c công bố trong bấ t kỳ công trình nào khác.
Tôi xin cam đoan rằ ng mọ i sự giúp đỡ cho việ c thự c hiệ n luậ n án đã đư ợ c cả m
ơ n, các thông tin trích dẫ n trong luậ n án này đề u đư ợ c chỉ rõ nguồ n gố c.
Hà Nộ i, ngày 29 tháng 6 năm 2017
Tác giả luậ n án



LỜ I CẢ M Ơ N
Tôi xin chân thành cả m ơ n Ban chủ nhiệ m và các thầ y c ô giáo trong Khoa
Ngôn ngữ họ c – Trư ờ ng Đạ i họ c Khoa họ c Xã hộ i và Nhân văn – Đạ i họ c Quố c gia
Hà Nộ i đã tạ o cho tôi mộ t môi trư ờ ng họ c tậ p và làm việ c tố t nhấ t , vớ i sự giúp đỡ
tậ n tình trong công việ c cũng như tạ o điề u kiệ n để tôi có thể bả o vệ trong thờ i gian
sớ m nhấ t.
Tôi vô cùng trân trọ ng và biế t ơ n PGS.TS. Lâm Quang Đông, GS.TS.
Nguyễ n Thiệ n Giáp đã tậ n tình chỉ bả o và hư ớ ng dẫ n tôi trong suố t thờ i gian làm
luậ n án. Tôi xin gử i lờ i cả m ơ n chân thành tớ i GS. Vũ Đứ c Nghiệ u, PGS.TS Vũ Thị
Thanh Hư ơ ng, PGS.TS Nguyễ n Văn Chính, PGS.TS Trị nh Cẩ m Lan, PGS.TS.
Nguyễ n Xuân Hòa, PGS.TS. Lê Văn Canh, PGS.TS. Nguyễ n Văn Trào, GS.TS. Đỗ
Việ t Hùng cùng nhiề u thầ y cô giáo đã dành thờ i gian đọ c và đư a ra nhữ ng góp ý
nghiêm khắ c, xác đáng như ng cũng th ậ t chân tình cho bả n thả o luậ n án. Nhữ ng lờ i
khuyên bả o và độ ng viên củ a các thầ y cô là độ ng lự c để tôi cố gắ ng họ c tậ p và tin
tư ở ng vào bả n thân.
Giúp tôi vư ợ t qua nhữ ng khó khăn trong suố t quá trình họ c tậ p và nghiên
cứ u là sự quan tâm, chăm sóc đầ y yêu thư ơ ng củ a mọ i thành viên trong gia đ ình, là
nhữ ng cổ vũ, độ ng viên và khích lệ củ a bạ n bè, đồ ng nghiệ p trong và ngoài Khoa
Tiế ng Anh, các thầ y cô và bạ n bè trong Trư ờ ng Đạ i họ c Ngoạ i ngữ và Trư ờ ng Đạ i
họ c Khoa họ c Xã hộ i và Nhân văn.
Tôi xin trân trọ ng cả m ơ n .


MỤ C LỤ C
Lờ i cam đoan ……………………………………………………………………
Lờ i cám ơ n ……………………………………………………………………...
MỤ C LỤ C ………………………………………………………………………

Trang

i
ii

Danh mụ c bả ng ………………………………………………………………….
Danh mụ c hình …………………………………………………………………..
Danh mụ c chữ viế t tắ t ……………………………………………………………
MỞ ĐẦ U
1. Lý do chọ n đề tài ……………………………………………………………
2. Đố i tư ợ ng và phạ m vi nghiên cứ u củ a luậ n án …………………………….. .
3. Mụ c đích và nhiệ m vụ nghiên cứ u ………………………….........................
4. Phư ơ ng pháp nghiên cứ u củ a luậ n án ………………………….....................
5. Ý nghĩa khoa họ c và thự c tiễ n củ a luậ n án …………………………..............
6. Cấ u trúc củ a luậ n án …………………………..…………………………….
Chư ơ ng 1. TỔ NG QUAN TÌNH HÌNH NGHIÊN CỨ U VÀ CƠ SỞ LÝ LUẬ N CỦ A
LUẬ N ÁN

1
3
4
6
7
9
11
12
13
15

1.1. Tổ ng quan tình hình nghiên cứ u …………………………..……………
1.1.1. Tình hình nghiên cứ u kho ngữ liệ u giáo khoa tiế ng Anh chuyên ngành
trên thế giớ i …………………………..…………………………..……...

1.1.2. Tình hình nghiên cứ u kho ngữ liệ u giáo khoa tiế ng Anh chuyên ngành ở

16

Việ t Nam …………………………..…………………………................
1.2. Cơ sở lý luậ n củ a luậ n án …………………………..……………………
1.2.1. Nhữ ng khái niệ m cơ bả n củ a Ngôn ngữ họ c ngữ liệ u ………………..
1.2.2. Kho ngữ liệ u giáo khoa ………………………………………………
1.2.3. Kho ngữ liệ u giáo khoa ti ế ng Anh chuyên ngành vớ i việ c đị nh lư ợ ng vố n

23
24
24
41

từ trong dạ y và họ c tiế ng .....................................................................
1.2.4. Tiể u kế t ………………………………………………………………
Chư ơ ng 2. XÁC LẬ P NGUYÊN TẮ C, TIÊU CHÍ VÀ QUI TRÌNH XÂY DỰ NG
KHO NGỮ LIỆ U GIÁO KHOA VÀ XÂY DỰ NG KHO NGỮ
TIẾ NG ANH CHUYÊN NGÀNH XÃ HỘ I HỌ C

16

45
49

LIỆ U GIÁO KHOA

2.1. Các nguyên tắ c xây dự ng KNL giáo khoa tiế ng Anh chuyên ngành X HH
2.1.1. Nguyên tắ c chung ………………………………………………........

2.1.2. Nguyên tắ c xác lậ p cấ u trúc ………………………………………….
2.1.3. Nguyên tắ c lấ y mẫ u ……………………………………………….....

52
52
54
54


2.2. Các tiêu chí thiế t kế kho ngữ liệ u giáo khoa tiế ng Anh chuyên ngành XHH
2.2.1. Tiêu chí hình thứ c Kho ngữ liệ u
2.2.2. Tiêu chí cấ u trúc Kho ngữ liệ u …. ……..……………………………...

56
56
58

2.2.3. Tiêu chí mô tả văn bả n trong tậ p hợ p ngữ liệ u …………………..........
2.2.4. Tiêu chí độ lớ n Kho ngữ liệ u …………………………………………..
2.2.5. Tiêu chí về số lư ợ ng văn bả n trong Kho ngữ liệ u ……………………..
2.2.6. Tiêu chí về mẫ u đơ n vị ……..………………………………………….

59
62

2.2.7. Tiêu chí chú giả i..………………………………………….....................
2.3. Qui trình thiế t kế kho ngữ liệ u giáo khoa tiế ng Anh chuyên ngành Xã hộ i họ c
2.3.1. Qui trình chung ……………………………………………….............
2.3.2. Qui trình thiế t kế chi tiế t kho ngữ liệ u TESoC …………………….....
2.4. Xây dự ng kho ngữ liệ u giáo khoa tiế ng Anh chuyên ngành Xã hộ i họ c TESoC

2.5. Tiể u kế t ………………………………………………………………....
Chư ơ ng 3. KHAI THÁC ĐỊ NH LƯ Ợ NG TỪ VỰ NG TỪ KHO NGỮ LIỆ U GIÁO
KHOA TIẾ NG ANH CHUYÊN NGÀNH XÃ HỘ I HỌ C (TESoC)
3.1. Nhữ ng đơ n vị liên quan đế n đị nh lư ợ ng từ vự ng ………………..................
3.2. Phân tích đị nh lư ợ ng tổ ng quát từ vự ng tro ng KNL TESoC…….…............
3.2.1. Đị nh lư ợ ng vố n từ cơ bả n trong KNL TESoC.................… ..………....
3.2.2. Phân tích đị nh lư ợ ng vố n từ cơ bả n củ a KNL TESoC trong tư ơ ng quan
vớ i danh sách từ thông dụ ng tiế ng Anh
3.3. Đị nh lư ợ ng vố n từ trọ ng tâm trong KNL TESoC ………...…………….. ....
3.4. Tiể u kế t ……………………………………………………………….........
Chư ơ ng 4. SỬ DỤ NG KHO NGỮ LIỆ U GIÁO KHOA TIẾ NG ANH CHUYÊN
NGÀNH XÃ HỘ I HỌ C TESoC TRONG GIẢ NG DẠ Y NGOẠ I NGỮ
4.1.
Mố i quan hệ giữ a KNL giáo khoa vớ i việ c dạ y họ c ngoạ i ngữ ………….
4.2.
Kho ngữ liệ u TESoC trong đánh giá kiế n thứ c từ vự ng trong sách giáo khoa
4.3.
Kho ngữ liệ u TESoC trong đánh giá tư liệ u giả ng dạ y ……………….....
4.4.
Kho ngữ liệ u TESoC trong thiế t kế bài tậ p kỹ năng ……………….........
4.5.
Kho ngữ liệ u TESoC trong thiế t kế bài kiể m tra …………………………
4.6.
Tiể u kế t ………………………………………………………………......
KẾ T LUẬ N ……………………………………………………………. ……….
DANH MỤ C CÁC CÔNG TRÌNH KHOA HỌ C CỦ A TÁC GIẢ CÓ LIÊN QUAN
ĐẾ N LUẬ N ÁN
………………………………………………......................
TÀI LIỆ U THAM KHẢ O …………………………………………………….… ....
PHỤ LỤ C …………………………………………………… ………………….


63
64
68
69
69
70
90
95

97
101
102
107
113
127

130
133
135
143
150
154
156
159
160
180


DANH MỤ C CÁC BẢ NG

Bả ng 1.1
Bả ng 1.2
Bả ng 2.1
Bả ng 2.2

Mộ t phầ
Kho ngữ
Tỉ lệ lư ợ
Tỉ lệ lư ợ

Bả ng 2.3
Bả ng 2.4
Bả ng 2.5

Số lư ợ ng hiệ n dạ ng lấ y thự c tế trên các tiể u kho
Xác đị nh độ phong phú từ vự ng (R) củ a kiể u từ và tổ từ
Lư u kho ngữ liệ u TESoC theo mả ng và loạ i tư liệ u

Bả ng 2.6
Bả ng 3.1

Lư u kho ngữ liệ u TESoC theo bài và chủ đề
Đị nh lư ợ ng từ bị loạ i và vố n từ cơ bả n theo hiệ n dạ ng

Bả ng 3.2
Bả ng 3.3

Tư ơ ng quan giữ a hiệ n dạ ng và tổ từ
Tư ơ ng quan hiệ n dạ ng và tổ từ theo nhóm trình độ
Phân loạ i vố n từ cơ bả n theo trình độ

Thố ng kê tầ n số và phạ m vi phân bố tổ từ trong TESoC
Ma trậ n phân tích hiệ n dạ ng theo bậ c và phạ m vi tiể u kho
Mứ c độ sử dụ ng củ a tổ từ nộ i dung và chứ c năng Bậ c 1

Bả ng 3.4
Bả ng 3.5
Bả ng 3.6
Bả ng 3.7
Bả ng 3.8 Hiệ n dạ
Bả ng 3.9 Mứ c độ
Bả ng 3.10 Hiệ n dạ
Bả ng 3.11 Mứ c độ
Bả ng 3.12 Hiệ n dạ
Bả ng 3.13 Mứ c độ
Bả ng 3.14
Bả ng 3.15
Bả ng 3.16
Bả ng 3.17
Bả ng 4.1
Bả ng 4.2

n thiế t kế củ a Kho ngữ liệ u Brown
liệ u Anh ngữ quố c gia BNC
ng từ giữ a các tậ p SGK trong tiể u kho cơ sở
ng từ giữ a các tậ p SGK trong kho ngữ liệ u

ng củ a từ nộ i dung và từ chứ c năng Bậ c 1
sử dụ ng củ a tổ từ nộ i dung và chứ c năng Bậ c 2
ng củ a tổ từ nộ i dung và chứ c năng Bậ c 2
sử dụ ng củ a tổ từ nộ i dung và chứ c năng Bậ c 3

ng củ a tổ từ nộ i dung và chứ c năng Bậ c 3
sử dụ ng củ a tổ từ nộ i dung và chứ c năng Bậ c 4

Hiệ n dạ ng củ a tổ từ nộ i dung và chứ c năng Bậ c 4
Tổ từ trọ ng tâm theo bậ c
Hiệ n dạ ng củ a tổ từ trọ ng tâm các giai đoạ n
Cơ cấ u từ vự ng trong KNL TESoC
So sánh độ phong phú từ vự ng trong giáo trình
Phân bố từ vự ng trọ ng tâm trong giáo trình EAP

Trang
34
35
77
78
79
81
83
84
104
105
108
110
112
114
116
117
118
119
121

122
123
124
125
126
126
136
139


DANH MỤ C CÁC HÌNH

Hình 1.2
Hình 1.3

Thiế t kế và đánh dấ u trong Kho ngữ liệ u TeMa
Các tham số trong thiế t kế Kho ngữ liệ u giáo khoa
Trọ ng tâm từ vự ng tiế ng Anh chuyên ngành

Hình 2.1

Mứ c độ tăng củ a hiệ n dạ ng, kiể u từ và tổ từ trong sách giáo

Hình 1.1

Hình 2.2
Hình 2.3
Hình 2.4
Hình 2.5
Hình 2.6

Hình 2.7
Hình 2.8
Hình 2.9
Hình 2.10
Hình 3.1
Hình 3.2
Hình 3.3
Hình 3.4
Hình 3.5
Hình 3.6
Hình 3.7
Hình 3.8
Hình 3.9
Hình 3.10
Hình 3.11
Hình 3.12

khoa TACS
Số hiệ n dạ ng theo trình độ (từ TACS 1 đế n TACN 2)
Sơ đồ sắ p xế p ngữ liệ u trong KNL TESoC
Phầ n mề m xử lý từ vự ng trên mạ ng Compleat Lexical Tutor
Trình hiệ n kế t quả củ a từ elements trong KNL TESoC
Kho ngữ liệ u giáo khoa TESoC
Kho ngữ liệ u TESoC trên giao diệ n củ a phầ n mề m AntConc
Kho ngữ liệ u TESoC trên giao diệ n củ a phầ n mề m Range
Sắ p xế p tổ từ bằ ng phầ n mề m Range
Các kiể u từ nằ m ngoài da nh sách
Tư ơ ng quan giữ a hiệ n dạ ng và tổ từ trong vố n từ cơ bả n
Mứ c độ tăng tổ từ giai đoạ n cơ sở và chuyên ngành
Tư ơ ng quan lư ợ ng từ trong danh sách gữ a TACS và TACN

Độ tăng giả m củ a lư ợ ng từ vự ng tron g và ngoài danh sách
Baselist
Mứ c độ sử dụ ng tổ từ nộ i dung và chứ c năng Bậ c 1
Hiệ n dạ ng củ a tổ từ nộ i dung và chứ c năng Bậ c 1
Mứ c độ sử dụ ng tổ từ nộ i dung và chứ c năng Bậ c 2
Tư ơ ng quan hiệ n dạ ng giữ a nhóm tổ từ nộ i dung và chứ c năng
Bậ c 2
Mứ c độ sử dụ ng tổ từ nộ i dung và chứ c năng Bậ c 3
Tư ơ ng quan hiệ n dạ ng giữ a nhóm tổ từ nộ i dung và chứ c năng
Bậ c 3
Mứ c độ sử dụ ng tổ từ nộ i dung và chứ c năng Bậ c 4
Tư ơ ng quan hiệ n dạ ng giữ a nhóm tổ từ nộ i dung và chứ c năng
Bậ c 4

Hình 4.1

Các KNL và giả ng dạ y ngoạ i ngữ

Trang
21
44
49
77
79
82
88
89
91
92
93

94
94
106
106
109
111
116
117
119
120
121
122
123
124
133


Hình 4.2
Hình 4.3

So sánh vố n từ trong EAP vớ i trọ ng tâm TESoC (mả ng cơ sở )
So sánh vố n từ trong EAP vớ i trọ ng tâm trọ ng tâm TESoC
(mả ng chuyên ngành)

Hình 4.4

So sánh vố n từ trong bài đọ c vớ i trọ ng tâm TESoC (mả ng cơ
sở )

Hình 4.5


So sánh tổ từ trong bài đọ c vớ i trọ ng tâm TESoC
Kế t quả dẫ n mụ c củ a từ health

Hình 4.6
Hình 4.7
Hình 4.8
Hình 4.9
Hình 4.10
Hình 4.11
Hình 4.12
Hình 4.13

Dẫ n mụ c củ a cụ m từ going to
Nhậ n diệ n cụ m ký tự cho các bài tậ p phát âm (1)
Nhậ n diệ n cụ m ký tự cho các bài tậ p phát âm (2)
So sánh lư ợ ng hiệ n dạ ng và kiể u từ củ a đề thi 2009 và 2016
So sánh lư ợ ng tổ từ củ a đề thi 2009 và 2016
So sánh trọ ng tâm chuyên ngành củ a TESoC vớ i đề thi 2016
So sánh trọ ng tâm chuyên ngành củ a TESoC vớ i đề thi 2009

137
138
140
141
144
145
148
149
150

151
152
153


MỞ

ĐẦ U

1. Lý do chọ n đề tài
Nhữ ng năm cuố i thế kỷ 20 đầ u thế kỷ 21 chứ ng kiế n sự phát triể n mạ nh mẽ
củ a Ngôn ngữ họ c ngữ liệ u (NNHNL) và các nghiên cứ u về Kho ngữ liệ u (KNL).
Ngư ờ i ta nhắ c nhiề u đế n lĩnh vự c này bở i sự phát triể n đáng kinh ngạ c về số lư ợ ng
cũng như độ lớ n kế t hợ p vớ i công nghệ hiệ n đạ i trong xử lý ngôn ngữ tự nhiên đã
biế n các kho ngữ liệ u trở thành nguồ n dữ liệ u phong phú chư a từ ng có trong nghiên
cứ u ngôn ngữ . Ngôn ngữ họ c ngữ liệ u (NNHNL) mang lạ i mộ t cái nhìn mớ i cho
nhiề u vấ n đề tư ở ng chừ ng đã cũ. Nó chỉ ra nhữ ng khiế m khuyế t trong nghiên cứ u
đị nh tính đơ n thuầ n, thay đổ i quan niệ m củ a nhiề u nhà nghiên cứ u về nghiên cứ u
đị nh lư ợ ng và khẳ ng đị nh vị thế củ a đị nh lư ợ ng trong nghiên cứ u ngôn ngữ hiệ n
đạ i. NNHNL cũng tạ o ra nhữ ng thay đổ i căn bả n trong giả ng dạ y ngoạ i ngữ , đặ c
biệ t là tiế ng Anh. Các công trình về lý thuyế t cũng như thự c hành củ a Nation
(1990), Svatvik (1991), Kennedy (1992), Biber (1998), Biber, Conrad & Reppen
(2006), Aijmer (2009), Simpson (2011), Flowerdew (2012), Kohn (2013), ...cho
thấ y vai trò không thể thiế u củ a NNHNL trong nghiên cứ u giả ng dạ y ngôn ngữ nói
chung cũng như ngoạ i ngữ nói riêng.
Trong khi đó, ở Việ t Nam, nhu cầ u hộ i nhậ p và xu hư ớ ng toàn cầ u hóa khiế n
giao tiế p quố c tế ngày càng trở nên quan trọ ng trong đào tạ o ngoạ i ngữ cũng như
phát triể n kinh tế . Trong hầ u hế t các lĩnh vự c, ngoạ i ngữ chuyên ngành không còn
bó hẹ p trong môi trư ờ ng họ c thuậ t củ a sinh viên mà còn mở rộ ng ra các ngành
nghề , hỗ trợ nâng cao kiế n thứ c chuyên môn và phát triể n giao tiế p nghề nghiệ p củ a

mộ t bộ phậ n không nhỏ ngư ờ i lao độ ng. Kiế n thứ c tiế ng Anh chuyên ngành giờ đây
không nằ m ở điể m số hay tờ giấ y chứ ng nhậ n trong nhà trư ờ ng mà thể hiệ n trên
phư ơ ng diệ n giao tiế p thự c tế . Do đó, nghiên cứ u ngôn ngữ thự c và sử dụ ng ngôn
ngữ thự c trong giả ng dạ y và họ c tậ p là vô cùng cầ n thiế t và cấ p bách hiệ n nay.
Để đáp ứ n g mụ c tiêu phát triể n năng lự c ngoạ i ngữ cho nguồ n nhân lự c trong
nư ớ c, Bộ Giáo dụ c và Đào tạ o Việ t Nam đã xây dự ng Đề án Ngoạ i ngữ Quố c gia


2020 (giai đoạ n từ 2011 đế n 2015) xác đị nh nhiệ m vụ cho các cơ sở đào tạ o, các
trư ờ ng đạ i họ c: “triể n khai chư ơ ng trình dạ y bằ ng ngoạ i ngữ mộ t số môn cơ bả n,
chuyên ngành và chuyên sâu ở mộ t số ngành trọ ng điể m ở năm cuố i bậ c đạ i họ c”
(Đề án 2020: 40). Đề án cũng nhấ n mạ nh đế n đổ i mớ i giả ng dạ y ngoạ i ngữ bằ ng
cách khuyế n khích sử dụ ng “... các giả i pháp độ t phá nhằ m giả i quyế t các vấ n đề
cấ p bách trư ớ c mắ t trong việ c nhanh chóng nâng cao năng lự c ngoạ i ngữ củ a mộ t
số đố i tư ợ ng ư u tiên trong mộ t thờ i gian ngắ n, nhằ m đáp ứ ng ngay yêu cầ u hộ i
nhậ p, hiệ n đạ i hoá, công nghiệ p hoá đấ t nư ớ c ” (Đề án 2020: 25). Nhữ ng chủ
trư ơ ng trên khẳ ng đị nh vị thế củ a đào tạ o ngoạ i ngữ nói chung cũng như ngoạ i ngữ
chuyên ngành nói riêng trong giáo dụ c đạ i họ c, dạ y nghề , và nâng cao năng lự c giao
tiế p củ a độ i ngũ lao độ ng trí thứ c hiệ n nay.
Tuy nhiên, việ c nâng cao trình độ giáo viên, đổ i mớ i giáo trình hay xây dự ng
khung năng lự c để đánh giá chuẩ n đào tạ o ngoạ i ngữ sẽ đạ t hiệ u quả hơ n nế u nộ i
dung và tư liệ u họ c, trong đó có từ vự ng, đư ợ c nghiên cứ u rõ ràng và cụ thể . Hơ n
nữ a, việ c biên soạ n bài giả ng, giáo trình đặ c biệ t là giáo trình chuyên ngành cũng
không thể dự a mãi vào trự c giác cũng như kinh nghiệ m củ a giáo viên. N gôn ngữ
họ c ngữ liệ u, trong đó có các kho ngữ liệ u, vớ i đặ c điể m vư ợ t trộ i trong đị nh lư ợ ng
và công nghệ xử lý ngôn ngữ có thể giúp xác đị nh mộ t cách chính xác các kiế n thứ c
mà các nhà giáo dụ c cầ n đư a vào giả ng dạ y, hỗ trợ hiệ u quả nâng cao chấ t lư ợ ng
dạ y và họ c, xây dự ng chư ơ ng trình, giáo trình và kiể m tra đánh giá đúng nộ i dung
đề ra.
Thự c tế trong nư ớ c cho thấ y n ghiên cứ u Ngôn ngữ họ c ngữ liệ u nói chung

cũng như

kho ngữ

liệ u (KNL) dành cho dạ y họ c ngoạ i ngữ

nói riêng chư a phát

triể n. Mộ t số công trình củ a Đào Hồ ng Thu (2010) và Phạ m Hiể n (2012) mớ i chỉ
dừ ng ở việ c khai thác và sử dụ ng phầ n mề m trong phân tích ngữ liệ u mà chư a đề
cậ p đế n việ c xây dự ng KNL, nhấ t là KNL dành cho dạ y và họ c tiế ng Anh chuyên
ngành. Việ c xây dự ng KNL vẫ n còn là lĩnh vự c còn đang bỏ ngỏ ở Việ t Nam. Do
đó, nghiên cứ u xây dự ng mộ t KNL giáo khoa tiế ng Anh chuyên ngành Xã hộ i họ c
không chỉ đáp ứ ng nhu cầ u phát triể n NNHNL trong nư ớ c mà còn h ỗ trợ nghiên


cứ u giả ng dạ y tiế ng Anh chuyên ngành , góp phầ n đư a công nghệ vào dạ y họ c ngoạ i
ngữ , đồ ng thờ i giúp nâng cao chấ t lư ợ ng giả ng dạ y và họ c tậ p ngoạ i ngữ tạ i Việ t
Nam.
2. Đố i tư ợ ng và phạ m vi nghiên cứ u củ a luậ n án
Đố i tư ợ ng nghiên cứ u củ a luậ n án là KNL giáo khoa tiế ng Anh chuyên
ngành Xã hộ i họ c hiệ n đạ i đư ợ c xử lý trên máy tính cá nhân có thể ứ ng dụ ng trong
dạ y và họ c tiế ng. Do đó, luậ n án tìm hiể u các yế u tố hình thành nên KNL gồ m hệ
thố ng dữ liệ u ngôn ngữ cầ n có trong KNL, khung phầ n mề m phân tích để đư a ngữ
liệ u lên thành giao diệ n và tiế n hành các phân tích phù hợ p trong lĩnh vự c giả ng dạ y
và họ c tậ p tiế ng Anh .
Luậ n án xác đị nh phạ m vi nghiên cứ u nằ m trong khuôn khổ xây dự ng mộ t
KNL giáo khoa qui mô nhỏ , đơ n ngữ , bằ ng tiế ng Anh, phù hợ p vớ i thự c tế giả ng
dạ y tiế ng Anh chuyên ngành Xã hộ i họ c hiệ n nay ở Đạ i họ c Quố c gia Hà Nộ i . Vì
vậ y, dữ liệ u ngôn ngữ đư ợ c thu thậ p trong KNL đư ợ c giớ i hạ n trong phạ m vi sách

giáo khoa tiế ng Anh đang đư ợ c giả ng dạ y cho sinh viên Xã hộ i họ c tạ i trư ờ ng. Do
thiế u sách giáo khoa tiế ng Anh chuyên ngành Xã hộ i họ c biên soạ n trong nư ớ c và
nư ớ c ngoài nên luậ n án xây dự ng mả ng ngữ liệ u tiế ng Anh chuyên ngành trong
KNL chủ yế u từ sách giáo khoa Xã hộ i họ c bằ ng tiế ng Anh. Ngữ liệ u đư ợ c sử dụ ng
trong luậ n án gồ m :
- 3 bộ giáo trình New English Files bậ c sơ

cấ p, sơ

trung và trung cấ p

(Elementary, Pre-intermediate, Intermediate) củ a tác giả Clive Oxenden, Christina
Latham-Koening và Paul Seligson do Đạ i họ c Oxford xuấ t bả n năm 200 4, bao gồ m
cả sách họ c, sách bài tậ p và bả n ghi bài nghe. Ba bộ sách này hiệ n đang đư ợ c giả ng
dạ y ứ ng vớ i ba bậ c trình độ Tiế ng Anh cơ sở 1, cơ sở 2, c ơ sở 3 tạ i T rư ờ ng Đạ i họ c
Khoa họ c Xã hộ i và Nhân văn , Đạ i họ c Quố c gia Hà Nộ i.
- Giáo trình English for Students of Sociology (Tiế ng Anh chuyên ngành Xã
hộ i họ c) đư ợ c biên soạ n và thẩ m đị nh năm 2004 tạ i Trư ờ ng Đạ i họ c Khoa họ c Xã
hộ i và Nhân văn. Giáo trình đư ợ c đư a vào giả ng dạ y trong chư ơ ng trình đào tạ o


chính qui cho sinh viên chuyên ngành Xã hộ i họ c và Công tác Xã hộ i từ 2004 đế n
2011.
+ Hai giáo trình mang tên Introduction to Sociology (Nhậ p môn Xã hộ i họ c
đạ i cư ơ ng) bằ ng tiế ng Anh củ a Ryan T. Cragun, Deborah Cragun & Piotr
Konieczny (2010) xuấ t bả n bở i Wikibooks và củ a Openstax College 1 (2013), Đạ i
họ c Rice, bang Texas, Mỹ .
Việ c lự a chọ n giáo trình New English Files làm tư liệ u giáo khoa là tấ t yế u
bở i các giáo trình này đư ợ c dùng làm tư liệ u chính phụ c vụ cho giả ng dạ y tiế ng Anh
giai đoạ n đầ u cho sinh viên trong toàn Đạ i họ c Quố c gia Hà Nộ i. Tuy nhiên, các

giáo trình chuyên ngành Xã hộ i họ c đư ợ c sử dụ ng bở i nhiề u lý do.
Thứ nhấ t, bên cạ nh ý kiế n chuyên gia về nộ i dung cầ n họ c đố i vớ i sinh viên
bắ t đầ u vào chuyên ngành , nộ i dung kiế n thứ c trong các tư liệ u này cũng phù hợ p
vớ i kiế n thứ c đạ i cư ơ ng Xã hộ i họ c mà đơ n vị đào tạ o xác đị nh.
Thứ hai, các giáo trình vừ a nêu đề u phổ cậ p, văn phong chuẩ n mự c, kiế n
thứ c chuyên ngành đạ i cư ơ ng dễ hiể u, không quá chuyên sâu vào các chuyên ngành
hẹ p nên không gây hiệ n tư ợ ng thiên lệ ch về đặ c ngữ hay biệ t ngữ củ a các phân
ngành trong Xã hộ i họ c.
Thứ ba, chủ đề trong tư liệ u gầ n gũi vớ i kiế n thứ c cơ sở , tạ o mố i liên hệ cầ n
thiế t trong giai đoạ n chuyể n kiế n thứ c từ vự ng từ cơ sở sang chuyên ngành.
Thứ tư , chúng có sẵ n và đư ợ c phép sử dụ ng trong nghiên cứ u mà không đòi
hỏ i thủ tụ c và chi phí truy cậ p. Lý do này đư ợ c coi là mộ t trong nhữ ng tiêu chí thiế t
kế quan trọ ng mang tính kinh tế mà mọ i KNL đề u cầ n phả i cân nhắ c khi thu thậ p dữ
liệ u.
Ngoài ra, việ c quyế t đị nh loạ i sách, số lư ợ ng sách chuyên ngành Xã hộ i họ c
cầ n khai thác trong xây dự ng KNL cũng đư ợ c xem xét kỹ lư ỡ ng để đả m bả o tính
Openstax College: tiề n thân củ a đạ i họ c Rice (Mỹ ) là mộ t tổ chứ c phi lợ i nhuậ n cam kế t hỗ trợ sinh viên
tiế p cậ n vớ i tài liệ u họ c tậ p ch ấ t lư ợ ng cao. Các SGK củ a Openstax miễ n phí và đư ợ c các nhà giáo dụ c kiể m
duyệ t để đả m bả o độ chính xác, dễ đọ c và đáp ứ ng yêu cầ u củ a đào tạ o đạ i họ c hiệ n đạ i.
1


liên thông về từ vự ng giữ a các tiể u kho đạ i diệ n cho các bậ c trình độ trong KNL,
đồ ng thờ i đả m bả o sự nhấ t quán về độ tậ p trung từ vự ng củ a các tư liệ u trong mỗ i
tiể u kho. Vấ n đề này sẽ đư ợ c trình bày cụ thể trong chư ơ ng 2.
Chư ơ ng trình phầ n mề m sử dụ ng trong thiế t kế KNL và phân tích dữ liệ u
ngôn ngữ đư ợ c giớ i hạ n trong phạ m vi phân tích từ vự ng – yế u tố then chố t trong
quá trình đị nh lư ợ ng kiế n thứ c tiế ng Anh đư ợ c nhiề u giáo viên quan tâm.
3. Mụ c đích và nhiệ m vụ nghiê n cứ u củ a luậ n án
Mụ c đích củ a luậ n án là xây dự ng mộ t KNL giáo khoa phụ c vụ dạ y và họ c

tiế ng Anh chuyên ngành Xã hộ i họ c . KNL có thể sử dụ ng để hỗ trợ quả n lý chư ơ ng
trình họ c trong sách giáo khoa, xây dự ng họ c liệ u, hỗ trợ tổ chứ c các hoạ t độ ng họ c,
quả n lý và phát triể n vố n từ theo trình độ . Vì vậ y, luậ n án xác đị nh các nhiệ m vụ cụ
thể sau:
- Nghiên cứ u cơ sở lý thuyế t và phư ơ ng pháp cho việ c xây dự ng mộ t kho
ngữ liệ u giáo khoa tiế ng Anh chuyên ngành Xã hộ i họ c để làm cơ sở cho nghiên
cứ u họ c liệ u tiế ng Anh chuyên ngành.
- Xây dự ng KNL giáo khoa tiế ng Anh chuyên ngành Xã hộ i họ c phù hợ p vớ i
điề u kiệ n họ c tậ p tạ i Đạ i họ c Quố c gia Hà Nộ i.
- Phân tích KNL giáo khoa đã xây dự ng đư ợ c để tìm hiể u về đị nh lư ợ ng từ
vự ng dành cho dạ y tiế ng trong phạ m vi các giáo trình đư ợ c lự a chọ n, từ đó xem xét
mứ c độ thể hiệ n từ vự ng qua các giáo trình hiệ n có đố i vớ i việ c giả ng dạ y và họ c
tậ p tiế ng Anh chuyên ngành Xã hộ i họ c .
- Chỉ ra nhữ ng tiệ n ích và khả năng ứ ng dụ ng củ a KNL cũng như hư ớ ng khai
thác KNL vào việ c dạ y và họ c tiế ng Anh.
Xuấ t phát từ mụ c đích và nhiệ m vụ nghiên cứ u, luậ n án xác đị nh mộ t số câu
hỏ i nghiên cứ u như sau:
1- KNL giáo khoa tiế ng Anh chuyên ngành Xã hộ i họ c đư ợ c xây dự ng dự a trên
nguyên tắ c và tiêu chí nào?


2- KNL giáo khoa tiế ng Anh chuyên ngành Xã hộ i họ c có đặ c điể m gì về mặ t
cấ u tạ o và nộ i dung ngôn ngữ ?
3- KNL giáo khoa tiế ng Anh chuyên ngành XHH đư ợ c sử dụ ng như thế nào
trong việ c dạ y và họ c tiế ng Anh chuyên ngành Xã hộ i họ c tạ i Đạ i họ c Quố c
gia Hà Nộ i?
4. Phư ơ ng pháp nghiên cứ u củ a luậ n án
Xuấ t phát từ tính chấ t củ a đề tài, đố i tư ợ ng, cũng như mụ c đích nghiên cứ u,
luậ n án chủ yế u sử dụ ng các phư ơ ng pháp sau:
- Phư ơ ng pháp chuyên gia (expert judgement) là phư ơ ng pháp thăm dò ý

kiế n chuyên gia nghiên cứ u sâu mộ t lĩnh vự c chuyên môn, nghiệ p vụ nào đó và có
hiể u biế t sâu sắ c về lĩnh vự c đó. Trong luậ n án, phư ơ ng pháp chuyên gia đư ợ c sử
dụ ng trong việ c xác đị nh nguồ n tư liệ u có thể khai thác trư ớ c khi áp dụ ng các tiêu
chí cụ thể hơ n củ a Ngôn ngữ họ c ngữ liệ u để lự a chọ n ngữ liệ u phù hợ p.
- Phư ơ ng pháp thố ng kê ngôn ngữ (linguistic statistics) là phư ơ ng pháp dùng
để “đo đạ c các đơ n vị củ a lờ i nói và ngôn ngữ ”, phân xuấ t các đơ n vị theo từ ng cấ p
độ để tìm ra qui luậ t kế t hợ p củ a các đơ n vị đó, mố i quan hệ củ a các đơ n vị trong
cùng cấ p độ và giữ a các cấ p độ vớ i nhau” (Nguyễ n Đứ c Dân , 1984:11). Phư ơ ng
pháp thố ng kê ngôn ngữ đư ợ c sử dụ ng để nghiên cứ u đị nh lư ợ ng các đơ n vị từ vự ng
trong các giáo trình đư ợ c đư a vào xử lý, tính toán độ chênh lệ ch về từ vự ng giữ a
các giáo trình, giúp đư a ra kế t luậ n về mố i quan hệ về vố n từ giữ a các trình độ làm
cơ sở xây dự ng các tiể u kho trong kho ngữ liệ u. Ngoài ra, phư ơ ng pháp thố ng kê
cũng đư ợ c áp dụ ng để tính độ tậ p trung từ vự ng trong mỗ i tiể u kho và xác đị nh độ
lặ p chuẩ n củ a từ vự ng trong kho ngữ liệ u.
- Phư ơ ng pháp phân tích ngữ liệ u (linguistic data analysis): đư ợ c thự c hiệ n
trên máy tính vớ i sự hỗ trợ củ a các phầ n mề m xử lý ngôn ngữ tự nhiên như Range,
AntConc, và mộ t số chư ơ ng trình xử lý dữ liệ u trên trang mạ ng Compleat Lexical
Tutor. Phư ơ ng pháp phân tích ngữ liệ u giúp thố ng kê, sắ p xế p dạ ng từ , tổ từ , từ hình
trong phạ m vi tổ từ , hỗ trợ nhậ n diệ n tổ từ chứ c năng (hư từ ) và tổ từ nộ i dung (thự c


từ ), xác đị nh các yế u tố từ vự ng nằ m trong Danh sách từ bị loạ i (Stoplist), hỗ trợ
tính toán từ vự ng trọ ng tâm trong tiể u kho, tính toán hiệ n dạ ng và phân bố hiệ n
dạ ng cũng như tổ từ theo trình độ .
- Phư ơ ng pháp tính toán trên máy (Computer-based approach) đư ợ c áp dụ ng
phổ biế n trong tính toán từ vự ng trong KNL, trong đó ngư ờ i ta sử dụ ng quá trình
trích xuấ t thuậ t ngữ tự độ ng để xác đị nh thuậ t ngữ chuyên ngành. Về cơ bả n, đây là
phư ơ ng pháp thố ng kê so sánh tầ n số xuấ t hiệ n củ a mộ t từ trong KNL chuyên ngành
vớ i tầ n số xuấ t hiệ n trong KNL so sánh. Phư ơ ng pháp này đư ợ c áp dụ ng trong KNL
TESoC để xác đị nh từ vự ng trọ ng tâm chuyên ngành Xã hộ i họ c. Phư ơ ng pháp tính

toán trên máy giúp loạ i các từ trong Danh sách từ bị loạ i (Stoplist) và từ vự ng có
tầ n số thấ p, nằ m dư ớ i Điể m ngắ t (cut-off point), ra khỏ i văn bả n gố c. Ngoài ra,
phư ơ ng pháp tính toán trên máy còn hỗ trợ việ c lư u trữ , quả n lý và sắ p xế p dữ liệ u
ngôn ngữ vớ i số lư ợ ng lớ n trên máy tính như lư u trữ KNL, tính toán và sắ p xế p các
đơ n vị từ vự ng, đặ c biệ t là các đơ n vị nằ m ngoài phạ m vi phân loạ i mà các phầ n
mề m cung cấ p.
Quá trình nhậ p liệ u văn bả n cho KNL đư ợ c tiế n hành mộ t phầ n thủ công do
không truy cậ p đư ợ c văn bả n mạ ng phù hợ p (trư ờ ng hợ p củ a ba bộ giáo trình tiế ng
Anh cơ sở New English Files), mộ t phầ n đư ợ c thu thậ p từ mạ ng internet. Luậ n án
cũng sử dụ ng kỹ thuậ t xử lý dữ liệ u trên máy tính cá nhân để chuyể n dạ ng và phân
loạ i từ vự ng và dùng các phầ n mề m đã đề cậ p ở trên để kiể m tra độ chính xác trong
phân loạ i từ vự ng.
Ngoài ra, luậ n án cũng sử dụ ng phư ơ ng pháp nghiên cứ u thự c tiễ n, bao gồ m
nghiên cứ u hiệ n trạ ng ngôn ngữ họ c KNL ở Việ t Nam và nư ớ c ngoài, sử dụ ng tài
liệ u tiế ng Anh chuyên ngành Xã hộ i họ c tự biên soạ n để đư a vào nghiên cứ u.
5. Ý nghĩa khoa họ c và thự c tiễ n củ a đề tài
5.1. Ý nghĩa khoa họ c
Vớ i tư cách là luậ n án đầ u tiên trong nư ớ c nghiên cứ u xây dự ng kho ngữ
liệ u tiế ng Anh chuyên ngành Xã hộ i họ c, luậ n án tiế p thu lý thuyế t cơ bả n trong


nghiên cứ u ngôn ngữ họ c ngữ liệ u trên thế giớ i để xây dự ng cơ sở lý luậ n cho việ c
thành lậ p và phân tích KNL giáo khoa qui mô nhỏ có giá trị ứ ng dụ ng trong giả ng
dạ y tiế ng Anh cho các chuyên ngành bậ c đạ i họ c ở Việ t Nam. Đây là hư ớ ng nghiên
cứ u mớ i trong xây dự ng Kho ngữ liệ u giáo khoa, đáp ứ ng xu hư ớ ng ứ ng dụ ng công
nghệ hiệ n đạ i trong dạ y họ c ngoạ i ngữ , phát huy tính liên ngành giữ a nghiên cứ u
ngôn ngữ vớ i giả ng dạ y ngoạ i ngữ và công nghệ thông tin ở trình độ cao, phù hợ p
vớ i xu thế phát triể n khoa họ c công nghệ trong giáo dụ c hiệ n nay.
Trong phạ m vi nghiên cứ u, luậ n án đề cậ p đế n các vấ n đề về dạ y và họ c tiế ng
Anh chuyên ngành trong nư ớ c trên phư ơ ng diệ n từ vự ng trọ ng tâm dành cho sinh

viên đạ i họ c, đồ ng thờ i đư a ra giả i pháp ứ ng dụ ng KNL giáo khoa trong giả ng dạ y,
lự a chọ n tư liệ u theo trình độ , hỗ trợ đổ i mớ i tư liệ u dạ y họ c, nâng cao chấ t lư ợ ng
dạ y và họ c ngoạ i ngữ trong cá c trư ờ ng đạ i họ c ở Việ t Nam mà Đ ề án ngoạ i ngữ
quố c gia 2020 củ a Bộ Giáo dụ c và Đào tạ o đề ra.
5.2. Ý nghĩa thự c tiễ n
Luậ n án n ghiên cứ u xây dự ng KNL giáo khoa tiế ng Anh chuyên ngành Xã
hộ i họ c (TESoC) là đề tài đầ u tiên đư ợ c thự c hiệ n trong lĩnh vự c này ở Việ t Nam.
Nghiên cứ u củ a luậ n án đáp ứ ng nhu cầ u cấ p thiế t trong nghiên cứ u đị nh lư ợ ng từ
vự ng tiế ng Anh dành cho giả ng dạ y và họ c tậ p chuyên ngành Xã hộ i họ c tạ i Đạ i họ c
Quố c gia Hà Nộ i và có thể sử dụ ng trong lĩnh vự c giao tiế p ngành nghề thự c tế .
Nghiên cứ u củ a luậ n án phù hợ p vớ i điề u kiệ n nghiên cứ u và giả ng dạ y trong nư ớ c,
đáp ứ ng yêu cầ u đị nh lư ợ ng kiế n thứ c từ vự ng trọ ng tâm trong sách giáo khoa thuộ c
chư ơ ng trình họ c, giúp điề u chỉ nh kiế n thứ c phù hợ p vớ i thay đổ i về thờ i lư ợ ng, đổ i
mớ i giáo trình cũng như điề u chỉ nh chư ơ ng trình củ a sinh viên không chuyên ngữ .
Luậ n án hoàn thành việ c nghiên c ứ u xây dự ng mộ t KNL giáo khoa tiế ng
Anh chuyên ngành để tính toán tầ n số củ a các đơ n vị từ vự ng trong ngữ liệ u đư a
vào, qua đó xác đị nh các đơ n vị từ vự ng có tầ n số sử dụ ng cao cầ n chú trọ ng trong
giáo trình và tư liệ u họ c, đị nh hình vố n từ trọ ng tâm cầ n c ó trong chư ơ ng trình
giả ng dạ y. KNL giáo khoa trong luậ n án này khác vớ i các mô hình KNL giáo khoa


đã đư ợ c nghiên cứ u và áp dụ ng ở mộ t số nư ớ c như Đứ c, Bỉ , Nhậ t, Trung Quố c
(Römer, 2004; Anping, 2004; Chujo, 2004; Meunier & Gouverneur, 2007) ở đó hệ
thố ng giáo khoa qui chuẩ n đư ợ c sử dụ ng làm tư liệ u và thư ớ c đo trong nghiên cứ u
ngôn ngữ .
Trong giả ng dạ y thự c tế , KNL hỗ trợ phân tích, tổ ng hợ p và sử dụ ng dữ liệ u
giáo khoa thông qua các phầ n mề m hiệ n đạ i để nâng cao chấ t lư ợ ng bài giả ng và
thiế t kế bài tậ p trên lớ p trên cơ sở đị nh lư ợ ng kiế n thứ c phù hợ p. Đồ ng thờ i, KNL
giúp đánh giá tư liệ u họ c phù hợ p vớ i từ ng đố i tư ợ ng họ c viên, xây dự ng và đa dạ ng
các hoạ t độ ng kiể m tra đánh giá trong phạ m vi chư ơ ng trình họ c. Nhữ ng tính toán

trong KNL giúp cho việ c chỉ nh lý, hoàn thiệ n và đổ i mớ i tư liệ u mộ t cách nhanh
gọ n, hiệ u quả và tiế t kiệ m.
Đố i vớ i ngư ờ i họ c, KNL giúp tra cứ u các đơ n vị từ vự ng như từ , cụ m từ
cùng vớ i ngữ cả nh kèm theo để hỗ trợ quá trình tự họ c. Trê n cơ sở danh sách từ
vự ng và trọ ng tâm kiế n thứ c đư ợ c xác đị nh cho từ ng trình độ , ngư ờ i họ c có thể đị nh
hư ớ ng, lên kế hoạ ch họ c tậ p phù hợ p cho bả n thân, tiế t kiệ m thờ i gian tra cứ u, nâng
cao chấ t lư ợ ng họ c tậ p.
Ngoài ra, luậ n án gợ i mở mộ t số kiế n giả i giáo họ c pháp cho việ c xây dự ng
và quả n lý chư ơ ng trình, giáo trình tiế ng Anh chuyên ngành, cũng như nhữ ng tiêu
chí đị nh lư ợ ng từ vự ng trong kiể m tra, đánh giá trên cơ sở tư liệ u họ c tậ p trong điề u
kiệ n giả ng dạ y hiệ n nay.
6. Cấ u trúc củ a luậ n án
Ngoài phầ n mở đầ u, kế t luậ n, và tư liệ u tham khả o, luậ n án gồ m 4 chư ơ ng,
đư ợ c kế t cấ u như sau:
Chư ơ ng 1: Tổ ng quan tình hình nghiên cứ u và cơ sở lý luậ n củ a luậ n án
Chư ơ ng 2: Xác lậ p nguyên tắ c, tiêu chí, qui trình xây dự ng KNL giáo khoa và xây
dự ng KNL giáo khoa tiế ng Anh chuyên ngành Xã hộ i họ c


Chư ơ ng 3: Khai thác đị nh lư ợ ng từ vự ng từ

kho ngữ liệ u giáo khoa tiế ng Anh

chuyên ngành Xã hộ i họ c (TESoC)
Chư ơ ng 4: Sử dụ ng kho ngữ liệ u giáo khoa tiế ng Anh chuyên ngành Xã hộ i họ c
trong giả ng dạ y ngoạ i ngữ


Chư ơ ng 1. TỔ NG QUAN TÌNH HÌNH NGHIÊN CỨ U VÀ CƠ SỞ LÝ LUẬ N
CỦ A LUẬ N ÁN

Sự phát triể n củ a ngôn ngữ họ c ngữ liệ u (NNHNL) vớ i các công cụ xử lý
ngôn ngữ tự nhiên hiệ u quả có ả nh hư ở ng sâu rộ ng đế n nhiề u ngành nghiên cứ u
ngôn ngữ . Nhữ ng tính toán trong NNHNL về tầ n số sử dụ ng từ vự ng, mứ c độ phân
bố củ a các đơ n vị từ vự ng tron g văn bả n giúp hình dung rõ nét bứ c tranh văn bả n
thuộ c nhiề u lĩnh vự c vớ i nhữ ng phổ màu từ vự ng đậ m nhạ t khác nhau. Để nghiên
cứ u từ vự ng chuyên ngành thông qua KNL cầ n dự a trên việ c k ế t hợ p cả hai lý
thuyế t, lý thuyế t về xây dự ng KNL vớ i lý thuyế t dạ y tiế ng liên quan đế n từ vự ng
chuyên ngành. Do đó, trong chư ơ ng đầ u, bên cạ nh việ c tổ ng quan các nghiên cứ u
NNHNL có liên quan, luậ n án tiế n hành nghiên cứ u lý thuyế t từ hai mả ng này để
mộ t mặ t có thể xây dự ng đư ợ c mộ t kho ngữ liệ u phù hợ p, mặ t khác có thể xác đị nh
phạ m vi sử dụ ng từ vự ng trong khuôn khổ kho ngữ liệ u giáo khoa vừ a thành lậ p .
1.1.

Tổ ng quan tình hình nghiên cứ u

1.1.1. Tình hình nghiên cứ u kho ngữ liệ u giáo khoa tiế ng Anh chuyên ngành
trên thế giớ i
Kho ngữ liệ u máy tính hiệ n đạ i đầ u tiên - kho ngữ liệ u Brown (Francis &
Kucera, 1967) - ra đờ i trong bố i cả nh phát triể n mạ nh mẽ củ a tiế ng Anh chuyên
ngành nhữ ng năm 1960 đã mở ra triể n vọ ng cho sự hình thành các KNL tiế ng Anh
chuyên ngành nhữ ng năm cuố i thế kỷ . Các kho ngữ liệ u chuyên ngành khoa họ c kỹ
thuậ t, tài chính, y họ c, pháp lý, du lị ch,... đư ợ c đề cậ p đế n trong Granger, 1998;
Fang, 1992; Luzón, 2000; Romer, 2002; Hyland, 2007; Bin Zou, 2015 đã có nhữ ng
đóng góp đáng kể trong nghiên cứ u thể loạ i, phân tích và đị nh lư ợ ng từ vự ng trong
lĩnh vự c họ c thuậ t và ngành nghề . Tuy nhiên, xu hư ớ ng xây dự ng các KNL thế hệ
thứ hai (cuố i thế kỷ 20, đầ u thế kỷ 21) đi theo quan điể m tổ ng hợ p dữ liệ u qui mô
lớ n. Chúng giố ng như tổ ng kho vớ i đa dạ ng các thể loạ i văn bả n khai thác từ nhiề u
nguồ n vớ i thờ i gian, không gian và đố i tư ợ ng tạ o văn bả n khác nhau như ng lạ i ít



phù hợ p vớ i nhữ ng nghiên cứ u trên lĩnh vự c cụ thể . Do đó, việ c khai thác mả ng
chuyên ngành từ các tổ ng kho lớ n thư ờ ng gặ p nhiề u bấ t cậ p.
Trong khoả ng mộ t thậ p kỷ trở lạ i đây, các nhà giáo dụ c quan tâm khai thác
ngữ liệ u ở phạ m vi hẹ p hơ n là giáo khoa và tài liệ u họ c tậ p (Chujo, 2004; Biber,
2004 ; Anping, 2004 ; Meunier & Gouverneur, 2007), tiế p tụ c hư ớ ng tớ i phân tích
ngôn ngữ trên ba mả ng: vĩ mô (thể loạ i và tính chân thự c củ a văn bả n, giao tiế p
khẩ u ngữ ), vi mô (phân tích các yế u tố từ vự ng, các tiêu chí ngữ pháp) và mô tả
chư ơ ng trình. Các nghiên cứ u này h ình thành nên các KNL giáo khoa. Tuy nhiên,
các KNL vẫ n có xu hư ớ ng tổ ng h ợ p ngữ liệ u đa ngành hoặ c mộ t nhóm các chuyên
ngành gầ n mà không hư ớ ng tớ i mộ t chuyên ngành nào cụ thể .
Xuấ t phát từ quan điể m tìm hiể u các hư ớ ng thành lậ p KNL giáo khoa hơ n là
phủ nhậ n toàn bộ nhữ ng thiế t kế KNL giáo khoa không nghiên cứ u mộ t chuyên
ngành như hiệ n nay, chúng tôi xem xét các KNL có quan hệ gầ n nhấ t vớ i phạ m vi
tìm hiể u củ a luậ n án. Đó là các KNL lấ y tậ p hợ p ngôn ngữ từ sách, tư liệ u giáo
khoa và đư ợ c chú giả i dự a trên đặ c điể m củ a tậ p hợ p đó. Chúng đư ợ c sử dụ ng trong
phân tích thể loạ i, đị nh lư ợ ng từ vự ng, đánh giá giáo trình, chư ơ ng trình giả ng dạ y
và thiế t kế sách giáo khoa.
1.1.1.1. Kho ngữ liệ u giáo khoa dành cho phân tích thể loạ i
Các KNL giáo khoa dành cho phân tích thể loạ i ngôn ngữ thư ờ ng xác đị nh tư
liệ u theo tiêu chí tư ơ ng đồ ng về trình độ hoặ c chư ơ ng trình đào tạ o, đơ n cử như
KNL giáo khoa tiế ng Anh họ c thuậ t TOEFL 2000 (thuộ c KNL T2K-SWAL) (Biber
2004) hay KNL giáo khoa tiế ng Anh-Đứ c ( German English as a Foreign Language
Textbook Corpus (GEFL-TC) củ a Römer (2004).
Tuy nhiên, hai KNL trên khác nhau cả về độ lớ n lẫ n cách thứ c chú giả i. KNL
TOEFL 2000 thu thậ p ngôn ngữ họ c thuậ t từ SGK trong trư ờ ng đạ i họ c Mỹ vớ i
760.619 hiệ n dạ ng, còn KNL GEFL-TC nhỏ hơ n nhiề u, chỉ gồ m 108.424 hiệ n dạ ng
lấ y từ SGK dạ y tiế ng Anh ở trư ờ ng cấ p hai củ a Đứ c. KNL TOEFL 2000 đư ợ c chú
giả i chi tiế t về loạ i từ , cú pháp, giúp phân tích đặ c điể m ngữ pháp, phân tích ngữ



pháp từ vự ng, phân bố từ vự ng, chuỗ i đồ ng hiệ n2 đa ngữ vự c , trong khi KNL củ a
Römer khá đơ n giả n về kế t cấ u, tậ p hợ p thủ công và không chú giả i. Có thể lý giả i
mứ c độ chú giả i củ a hai KNL này qua mụ c đích nghiên cứ u. KNL TOEFL 2000
phân tích cả các yế u tố vĩ mô như tỉ lệ văn bả n đa ngữ vự c (36 ngành), và yế u tố vi
mô như từ loạ i, ngữ nghĩ a, ngữ pháp, diễ n ngôn,... KNL giúp tích hợ p các nộ i dung
vĩ mô và vi mô ngôn ngữ trong thiế t kế bài đọ c và nộ i dung kiể m tra đánh giá.
Trong khi đó, KNL GEFL-TC chỉ tậ p trung nghiên cứ u trên ở phư ơ ng diệ n vi mô là
diễ n đạ t tình thái và tiế p diễ n ở các bài hộ i thoạ i trong SGK.
Nhìn chung, cả hai KNL phân tích thể loạ i trên đề u không đư ợ c phổ biế n
rộ ng rãi. Nguyên nhân là do KNL TOEFL 2000 cầ n đư ợ c bả o mậ t trong kiể m tra
đánh giá, còn KNL GEFL-TC bị hạ n chế về tính đạ i diệ n khẩ u ngữ có trong tư liệ u
văn bả n sách giáo khoa. Xét về khả năng khai thác trong từ ng chuyên ngành cụ thể ,
TOEFL 2000 lấ y tư liệ u từ quá nhiề u ngành (36 ngành) nên số lư ợ ng ngữ liệ u củ a
mỗ i ngành ít, không đả m bả o phụ c vụ cho phân tích. Trong khi đó, KNL GEFL-TC
lạ i tậ p hợ p ngôn ngữ trong sách giáo khoa phổ thông, nên về cơ bả n KNL này
không phụ c vụ cho nghiên cứ u chuyên ngành.
1.1.1.2. Kho ngữ liệ u giáo khoa dành cho đị nh lư ợ ng từ vự ng và đánh giá giáo
trình
Các KNL giáo khoa tiế ng Anh thiế t kế cho đị nh lư ợ ng từ vự ng hay đánh giá
giáo trình thư ờ ng lấ y ngữ liệ u giáo khoa toàn văn theo nhiề u bậ c trình độ như KNL
củ a Nhậ t (Chujo, 2004) và KNL giả ng dạ y tiế ng Anh ở Trung Quố c (Corpora of
EFL Education in China - CEEC) (2005-2007) (Bin Zou et al, 2015). Mẫ u toàn văn
đả m bả o tỉ lệ củ a các tiể u kho chính là tỉ lệ củ a văn bả n thự c.
Tuy nhiên, để đị nh lư ợ ng từ vự ng, KNL củ a Nhậ t đư ợ c thiế t kế trên ngữ liệ u
tĩnh (non-dynamic) gồ m 222.308 hiệ n dạ ng. KNL bao gồ m các tiể u kho lấ y ngữ
liệ u từ giáo trình, bà i kiể m tra theo trình độ như năm đầ u và năm cuố i trung họ c phổ
thông, các bài thi vào cao đẳ ng và đạ i họ c, bài thi TOEFL và TOEIC, sách dạ y tiế ng
2

Chuỗ i đồ ng hiệ n (lexical bundles): là chuỗ i từ vự ng xuấ t hiệ n nố i tiế p nhau theo tầ n số và c ác tiêu chí phân

bố nhấ t đị nh, đư ợ c trích xuấ t từ kho ngữ liệ u (Chan & Baker, 2010:30)


Anh cho sinh viên đạ i họ c từ cơ sở đế n chuyên ngành (thuộ c lĩnh vự c kỹ thuậ t và
công nghệ ), và các bài báo tiế ng Anh thuộ c lĩnh vự c công nghệ trong trư ờ ng đạ i họ c
(Chujo, 2004). KNL củ a Nhậ t áp dụ ng kỹ thuậ t tính toán các đơ n vị từ vự ng trong
Danh sách từ cơ bả n (Base List) trong KNL Anh ngữ

quố c gia BNC (British

National Corpus) để đo lư ợ ng từ vự ng giả ng dạ y ở mỗ i trình độ .
Điể m ư u việ t củ a nghiên cứ u KNL củ a Nhậ t là dự a hẳ n vào mộ t hệ thố ng
giáo trình sẵ n có để tính toán lư ợ ng từ trong sách giáo khoa vớ i 3.200 từ đầ u mụ c ở
bậ c đầ u trung họ c và 6.300 từ đầ u mụ c ở bậ c đạ i họ c (Chujo, 2004:239). Vố n từ ở
các trình độ theo đánh giá là phù hợ p vớ i giao tiế p thự c tế củ a ngư ờ i bả n ngữ dự a
trên Danh sách từ cơ bả n (Base list) trong KNL Anh ngữ quố c gia là nhóm từ vự ng
có tầ n số sử dụ ng cao nhấ t. Tuy nhiên, nhậ n đị nh trên lạ i là như ợ c điể m củ a nghiên
cứ u bở i nó đồ ng nhấ t vố n từ cơ bả n củ a ngư ờ i bả n ngữ vớ i vố n từ củ a ngư ờ i họ c
ngoạ i ngữ . Ngoài ra, tuy có đề cậ p đế n nhóm từ chuyên ngành khoa họ c và công
nghệ cầ n họ c như ng nghiên cứ u chư a đề cậ p đế n mứ c độ phù hợ p củ a vố n từ vự ng
đư ợ c xác đị nh đố i vớ i khả năng tiế p thu củ a ngư ờ i họ c. Hơ n nữ a, KNL tậ p trung
vào đo lư ợ ng từ vự ng hơ n là xem xét tỉ lệ từ vự ng giữ a các tiể u kho trong quá trình
tiế p thu kiế n thứ c theo từ ng bậ c họ c.
Trong khi đó, cũng đư ợ c xây dự ng để đị nh lư ợ ng từ

vự ng và đánh giá

chư ơ ng trình, tiể u kho ngữ liệ u giáo khoa Anping (2004) nằ m trong KNL giám sát
CEEC có tính độ ng (dynamic) đư ợ c cậ p nhậ t hàng năm (đạ t 2,88 triệ u từ năm
2007). Tiể u kho này ban đầ u thố ng kê hơ n 1 triệ u hiệ n dạ ng vớ i các tiể u kho bậ c

dư ớ i đư ợ c xây dự ng từ ng ữ liệ u sách tiế ng Anh biên soạ n trong nư ớ c và nư ớ c ngoài
ở 5 trình độ từ trung họ c phổ thông đế n đạ i họ c. Nó có chú giả i khá điể n hình bở i
vừ a mang tính giáo khoa, vừ a mang tính sư phạ m. Nhờ hệ thố ng chú giả i này,
ngư ờ i sử dụ ng có thể khai thác ngữ liệ u từ các dạ ng bài tậ p, tìm hiể u đặ c điể m nổ i
bậ t trong thiế t kế các loạ i bài tậ p khác nhau , nghiên cứ u về số lư ợ ng và chấ t lư ợ ng
giáo trình, từ đó đánh giá mứ c độ phả n ánh lý thuyế t họ c tậ p và phư ơ ng pháp giả ng
dạ y hiệ n đạ i trong SGK. Đố i vớ i ngư ờ i họ c, KNL nói chung và tiể u kho nói riêng


đư ợ c sử dụ ng để phát huy phư ơ ng pháp họ c qui nạ p, thông qua ngữ liệ u khai thác
để tổ ng hợ p kiế n thứ c cầ n thiế t trong chư ơ ng trình, đị nh hư ớ ng họ c tậ p.
Mặ c dù t ính chấ t độ ng củ a KNL Anping thích hợ p cho nghiên cứ u nhữ ng
thay đổ i về ngôn ngữ hay kế t cấ u văn bả n như ng lạ i không ư u việ t trong nghiên cứ u
vố n từ cố đị nh cho các bậ c họ c bở i từ vự ng trong tậ p hợ p luôn thay đổ i . Bên cạ nh
đó, do đư ợ c thiế t kế cho ngư ờ i họ c ở Trung Quố c nên KNL không sử dụ ng phổ biế n
cho ngư ờ i họ c tiế ng Anh như mộ t ngoạ i ngữ (EFL) nói chung. Điề u đáng nói là dù
tậ p hợ p từ các giáo trình chuyên ngành như ng phân tích củ a KNL không thể hiệ n sự
khác biệ t giữ a các nhóm văn bả n chuyên ngành và cơ sở . Xét cho cùng, cũng giố ng
như KNL giáo khoa Chujo, KNL giáo khoa Anping thu thậ p ngữ liệ u từ toàn bộ
SGK có trong chư ơ ng trình họ c, chú trọ ng đế n khai thác đị nh lư ợ ng hơ n là thiế t kế
khung lấ y mẫ u cho các tiể u kho.
1.1.1.3. KNL giáo khoa tiế ng Anh dành cho thiế t kế giáo trình
KNL giáo khoa dành cho thiế t kế giáo trình đư ợ c xây dự ng dự a trên các tậ p
hợ p ngữ liệ u cùng trình độ , cùng cấ u trúc và có chú giả i văn bả n chi tiế t phụ c vụ
cho việ c khai thác ngữ liệ u theo tổ chứ c hay kế t cấ u dạ ng bài, đặ c trư ng thể loạ i
(ngôn bả n, văn bả n), và cả các yế u tố vi mô (từ vự ng, ngữ pháp) trong ngữ liệ u
SGK. Mặ c dù KNL củ a Trung Quố c và Nhậ t đư ợ c coi là có thể sử dụ ng trong xây
dự ng giáo trình, như ng để khai thác chi tiế t mọ i đặ c trư ng trong thiế t kế , ngư ờ i ta
chỉ nhắ c tớ i mộ t đ ạ i diệ n duy nhấ t cho đế n nay là KNL TeMa củ a trung tâm CECL
(Centre for English Corpus Linguistics) thuộ c Đạ i họ c Cơ


đố c giáo Louvain

(Université Catholique de Louvain).
KNL TeMa là KNL giáo khoa lớ n nhấ t từ

trư ớ c đế n nay (Meunier &

Gouverneur 2007) vớ i tậ p hợ p ngữ liệ u đáng tin cậ y gồ m 724.174 hiệ n dạ ng, tậ p
hợ p từ 10 bộ sách dạ y tiế ng Anh (32 tậ p) trình độ trung và cao cấ p đư ợ c sử dụ ng
nhiề u nhấ t trên giả ng dạ y Anh ngữ quố c tế . Ngữ liệ u trong KNL TeMa điể n hình và
phù hợ p vớ i nhiề u đố i tư ợ ng ngư ờ i họ c tiế ng Anh ở nhiề u nư ớ c trên thế giớ i.


Bộ sách Clockwise 1

Trung cấ p 11

Cao cấ p 12

Sách họ c 111

Sách bài tậ p 112

Sách họ c 121

Sách bài tậ p 122

Bài khóa 1111
Bả n ghi bài nghe

1112
Bài tậ p 1113
Hư ớ ng dẫ n 1114

Bài khóa 1121
Bả n ghi bài nghe
1122
Bài tậ p 1123
Hư ớ ng dẫ n 1124

Bài khóa 1211
Bả n ghi bài nghe
1212
Bài tậ p 1213
Hư ớ ng dẫ n 1214

Bài khóa 1221
Bả n ghi bài nghe
1222
Bài tậ p 1223
Hư ớ ng dẫ n 1224

Hình 1.1. Thiế t kế và đánh dấ u trong KNL TeMa
(Nguồ n: Taal Ann Den Lijve, 2008)

Về tổ chứ c thiế t kế , KNL TeMa đư ợ c phân tầ ng và đánh dấ u ngữ liệ u t heo 16
tiể u kho. Các tiể u kho đư ợ c chia theo trình độ , loạ i tài liệ u (sách họ c, sách bài tậ p),
dạ ng dữ liệ u (văn bả n, bả n ghi khẩ u ngữ , bài tậ p từ vự ng, chỉ dẫ n,...). Ngư ờ i ta sử
dụ ng trên 80 đuôi (tag) để đánh dấ u, xác đị nh 7 dạ ng bài tậ p từ vự ng chính gồ m:
hoàn thành câu, đị nh nghĩa, sắ p xế p từ trong nhóm, thay thế từ và cụ m từ , đọ c hiể u,

sử a lỗ i, viế t lạ i câu. Các tiể u kho cũng đư ợ c chú giả i theo hư ớ ng sư phạ m vớ i các
đuôi đặ c biệ t (Ad hoc) đánh dấ u vấ n đề nhằ m phụ c vụ cho các mụ c tiêu nghiên cứ u
đặ c thù. Hình 1.1 cho thấ y cách bố trí và đánh dấ u củ a mộ t bộ SGK có trong KNL.
KNL giáo khoa TeMa cho phép khai thác đa dạ ng và hiệ u quả các thông tin
để phụ c vụ giả ng dạ y, họ c tậ p, đánh giá sách giáo khoa, nghiên cứ u siêu ngôn ngữ
trong sách giáo khoa. Tuy nhiên, KNL này chỉ tậ p trung vào thiế t kế dạ ng bài và
siêu ngôn ngữ hơ n là nghiên cứ u đị nh lư ợ ng từ vự ng. Hơ n nữ a, việ c tậ p trung vào
các giáo trình trung và cao cấ p chư a thể hiệ n đặ c trư ng thiế t kế theo bậ c củ a các
SGK và bài tậ p tư ơ ng ứ ng.


×