Tải bản đầy đủ (.doc) (37 trang)

Bai giang ky thuat ban phim

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.5 MB, 37 trang )

Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

CHƯƠNG 1: KHÁI QUÁT CHUNG
1. Giới thiệu về bàn phím máy tính:
1.1. Giới thiệu:

- Mẫu bàn phím lâu đời nhất xuất hiện năm 1870 với tên gọi QWERTY đặt theo thứ
tự đặt từ trái qua phải trên dòng đầu tiên. Đến năm 1930, bàn phím Dvorak ra đời (do
August Dvorak và William Deay thiết kế), giúp nhân viên đánh máy tiết kiệm được nhiều
công sức.
- Và vào thời điểm chuẩn bị chuyển sang sử dụng bàn phím Dvorak thì chiến tranh
thế giới thứ 2 xảy ra. Lúc này, mọi bàn phím được sản xuất đều thống nhất theo chuẩn
QWERTY. Bởi vậy mà đến bây giờ chúng ta vẫn đang xài bàn phím QWERTY.
1.2. Chức năng:
- Bàn phím là thiết bị nhập thông tin vào cho máy tính xử lý, thông tin từ bàn phím
là các ký tự, số và các lệnh điều khiển. Bàn phím máy tính phổ biến hiện nay là bảng
chứa khoảng 104 nút với chức năng khác nhau.

1.3. Các cổng giao tiếp:
Biên soạn: Nguyễn Văn Phương ……………………………………………..

Trang 1


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

Bàn phím máy tính để bàn có nhiều loại cổng giao tiếp như PS2, USB, không dây.

Hình 1. bàn phím cổng PS2

Hình 2. bàn phím không dây



Hình 3. Bàn phím cổng USB
Hình 4. Bàn phím Laptop
2. Một số phần mềm đánh máy thông dụng:
- Hiện có rất nhiều phần mềm hỗ trợ cho việc học đánh máy như Rapid Typing, Typing
Master, Touch và một vài trang web online.

Giao diện của phần mềm RapidTyping

Biên soạn: Nguyễn Văn Phương ……………………………………………..

Trang 2


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

Giao diện của phần mềm Typing Master
- Nhóm phím: Có 4 nhóm phím chính
+ Nhóm phím đánh máy: Gồm các phím chữ, các phím chữ số và các phím ký tự
đặc biệt như ~ ! @ # $ % ^ & * ( ) + - = | \ [] { } ` < > ? . ,.
+ Nhóm phím chức năng: Gốm các phím từ F1 đến F12, các phím mũi tên
phím PageUp (lên trang màn hình), PageDown (xuống trang màn hình), Insert (chèn),
Delete (xóa), Home (về đầu), End (về cuối)…. Cho phép người dùng ra các lệnh dưới
dạng ngắn gọn. Ý nghĩa của một số phím chức năng không xác định trước mà tùy thuộc
vào từng chương trình.
+ Nhóm phím số: Phím NumLock (cho các ký tự số), CapsLock (tạo chữ in hoa),
ScrollLock (chế độ cuộn màn hình) thể hiện ở các đèn chỉ thị phía trên bên phải của bàn
phím và các phím số. Trong máy tính chữ số và giá trị số là khác nhau.
+ Nhóm phím trạng thái: Ctrl, Alt, Shift là các phím dùng để phối hợp với những
phím khác để tạo ra ý nghĩa như một phím mới, nhờ đó mà không cần đưa thêm quá

nhiều phím vào bàn phím.

CHƯƠNG 2: LÀM QUEN VỚI BÀN PHÍM MÁY TÍNH
Biên soạn: Nguyễn Văn Phương ……………………………………………..

Trang 3


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

1. Tìm hiểu về vùng bàn phím của máy tính để bàn:
1.1. Các phím chữ cái và số:
Chính là nhóm phím đánh máy, gồm các các phím chữ, các phím chữ số và các
phím ký tự đặc biệt như ~ ! @ # $ % ^ & * ( ) + - = | \ [] { } ` < > ? . ,
1.2. Các phím chức năng:
Bàn phím tiêu chuẩn chỉ có các phím chữ số và các ký hiệu, bàn phím cải tiến đã ra
đời với 12 phím chức năng mới từ F1 đến F12 giúp cho các thao tác trong các ứng dụng
được nhanh chóng hơn (chữ F là viết tắt của Function - phím chức năng). Dưới đây là
một số tính năng thông dụng nhất:
F1: Bật menu Help
F2: Alt+Shift+F2: Save văn bản (trong menu File hoặc bằng Ctrl+S).
Ctrl+Alt+F2: Lệnh Open (trong menu File hoặc bằng Ctrl+O)
F3: Shift+F3: Đổi chữ thường thành chữ in hoa.
Alt+F3: Tạo từ viết tắt trong Autotext.
F4: Ctrl+F4: Đóng văn bản đang mở.
Alt+F4: Đóng MS Word (áp dụng cho cả các ứng dụng khác).
F5: Lệnh GoTo/Find/Replace (trong menu Edit)
Ctrl+F5: Thu nhỏ lại kích thước vùng văn bản mặc định bị thu nhỏ.
Alt+F5: Thu nhỏ lại kích cỡ vùng làm việc mặc định chương trình.
F6: Ctrl+F6: Chuyển sang văn bản kế tiếp (trong trường hợp mở nhiều văn bản)

Ctrl+Shift+F6: Chuyển sang văn bản trước đó.
F7: Lệnh Spelling_kiểm lỗi (trong menu Tool).
Shift+F7: Lệnh Thesaurus_từ điển đồng nghĩa (trong menu Tool/Language).
Ctrl+Shift+F7: Cập nhật thông tin nối kết trong một văn bản nguồn Word.
F8: Mở rộng vùng đã chọn (đã bôi đen).
F9: Cập nhật trường đang chọn.
Shift+F9: Chuyển đổi qua lại giữa việc xem mã trường và xem kết quả trường.
F10: Bật thanh menu bằng bàn phím.
Shift+F10: Giống như chức năng nút chuột phải.
Ctrl+F10: Phục hồi cửa sổ văn bản bị thu nhỏ (ngược với lệnh Ctrl+F5).
Ctrl+Shift+F10: Phục hồi lại cửa sổ chương trình bị thu nhỏ (ngược Alt+F5).
F11: Đi tới trường kế tiếp (nếu trong văn bản có nhiều trường)
Shift+F11: Đi tới trường trước đó.
F12: Lệnh Save As (trong menu File).
Shift+F12: Lệnh Save.
Ctrl+F12: Lệnh Open.
Ctrl+Shift+F12: Lệnh Print (trong menu File)
Biên soạn: Nguyễn Văn Phương ……………………………………………..

Trang 4


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

1.3. Các phím điều khiển
Các phím mũi tên
phím PageUp (lên trang màn hình), PageDown (xuống
trang màn hình), Insert (chèn), Delete (xóa), Home (về đầu), End (về cuối)…. Cho phép
người dùng ra các lệnh dưới dạng ngắn gọn. Ý nghĩa của một số phím chức năng không
xác định trước mà tùy thuộc vào từng chương trình.

1.4. Vùng bàn phím phụ:
Bàn phím phụ thường nằm phía bên phải bàn phím, chức năng giống như các phím
có ký hiệu như bàn phím chính.
2. Hướng dẫn tư thế gõ của từng ngón tay
2.1. Tư thế gõ:
Cũng giống như quá trình tập viết, chúng ta để cuốn tập sao cho có thể viết với tư
thế thuận tiện nhất. Ở đây cũng vậy chúng ta phải đặt bàn phím ở vị trí sao cho khi để
hai bàn tay lên bàn phím thì có cảm giác thoải mái, thuận tiện trong quá trình đánh máy.

2.2. Tay phải:
Khi đặt tay phải lên bàn phím thì các ngón phải nằm ở vị trí như sau:
- Ngón cái đặt lên phím Spacebar;
- Ngón trỏ đặt lên phím J..
- Ngón giữa đặt lên phím K;
- Ngón áp đặt lên phím L
- Ngón út đặt lên phím ;
Còn trong quá trình đánh máy thì các ngón có thể gõ được các phím sau:
- Ngón trỏ phải phải phụ trách các phím: J, U, M, 7, 6, Y, H và N
- Ngón giữa phải phụ trách: 8, I, K, và phím , (dấu phẩy)
- Ngón đeo nhẫn (áp út) phải phụ trách: 9, O, L, và phím . (dấu chấm)
- Ngón út phải phụ trách: O, P, ; , / và các phím lân cận nó, nó cũng phụ trách
phim Enter và phím Back Space (mũi tên trên đỉnh phím Enter).
=> 2 ngón cái phụ trách phím Space Bar (phím dài nhất trên bàn phím).
2.3. Tay trái:
Biên soạn: Nguyễn Văn Phương ……………………………………………..

Trang 5


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím


Khi đặt tay trái lên bàn phím thì các ngón phải nằm ở vị trí như sau:
- Ngón cái đặt lên phím Spacebar;
- Ngón trỏ đặt lên phím F.
- Ngón giữa đặt lên phím D;
- Ngón áp đặt lên phím S
- Ngón út đặt lên phím A
Còn trong quá trình đánh máy thì các ngón có thể gõ được các phím sau:
- Ngón trỏ trái phụ trách các phím: F, R, V, 4, 5, T, G, B và luôn như vậy, không
được lấn sân ngón khác hoặc để ngón khác lấn sân, các ngón khác liệt kê bên dưới cũng
theo qui ước tương tự.
- Ngón giữa trái phụ trách các phím: 3, E, D, C
- Ngón đeo nhẫn (áp út) trái phụ trách: 2, W, S, X
- Ngón út trái phụ trách: 1, Q, A, Z, Alt và các phím Shift, Ctrl... gần nó.
2.4. Thư giãn:

Bài tập 1: Tìm hiểu về chức năng của các phím trên bàn phím:
a. Thực hiện thao tác gõ 26 chữ cái trên bàn phím
b. Thực hiện thao tác gõ 10 chữ số trên bàn phím
c. Thực hiện thao tác gõ các phím trên bàn phím phụ
Bài tập 2: Thực hiện gõ các phím cho từng bàn tay:
a. Thao tác các phím cho tay trái
b. Thao tác các phím cho tay phải
c. Thao tác các phím khi kết hợp tay trái và tay phải.
Bài tập 3. Thực hiện các động tác thư giản bàn tay.
CHƯƠNG 3: LUYỆN KỸ NĂNG ĐÁNH MÁY NHANH BẰNG PHẦN
MỀM
TYPING MASTER
1. Giới thiệu cách cài đặt phần mềm:
Biên soạn: Nguyễn Văn Phương ……………………………………………..


Trang 6


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

1.1. Giới thiệu phần mềm:
TypingMaster là phần mềm giúp người sử dụng đang làm quen với việc soạn thảo
văn bản trên máy tính một cách nhanh chóng. Ngoài ra phần mềm còn giúp người dùng
có sự nhanh mắt trong việc gõ bàn phím một cách chính xác nhấn, tránh người dùng máy
tính gõ sai cách; gõ đúng cách nghĩa là dùng cả 10 ngón tay đặt đúng vào vị trí theo đúng
quy tắc trên bàn phím.

1.2 Cài đặt phần mềm:
Khi cài đặt nên disible card mạng để không cho máy tính truy cập internet.
B1: Double click vào phần mềm TypingMaster.exe
B2: Tại giao diện Welcom to the TypingMaster Pro Setup Wizard nhấn nút Next

B3: Tại giao diện Liencse Agreement chọn mục I accept the agreement và tiếp tục
nhấn nút Next.

Biên soạn: Nguyễn Văn Phương ……………………………………………..

Trang 7


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

B4: Tại giao diện Select Destination Location nhấn nút Next


B5:Tại giao diện Choose Install Type chọn mục Standard Install và tiếp tục nhấn Next

B6: Tại giao diện Select Start Menu Folder nhấn nút Next

Biên soạn: Nguyễn Văn Phương ……………………………………………..

Trang 8


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

B7: Tại mục Ready to Install nhấn nút Install

B8: Đợi tiến trình cài đặt hoàn tất rồi nhấn finish

B9: Sau khi cài xong click vào StartProgramTyping MasterTyping Master
Pro sẽ xuất hiện giao diện Welcome to TypingMaster và tiếp tục chọn mục Enter license
nằm phía bên phải của giao diện
Biên soạn: Nguyễn Văn Phương ……………………………………………..

Trang 9


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

B10: Tại giao diện nhập license ta tiếp tục thực hiện như sau:
Tại mục License ID ta gõ: icycool and everybody
Tại mục Product Key ta gõ: S46PE-37AA-49Y-24MTNABJ
Sau đó nhấn nút Enter và đóng chương trình lại
B11: Vào C:\Program Files\TypingMaster click phải lên file tmaster8.net chọn

Properties check vào ô Read Only rồi nhấn Ok
2. Cách khởi động và thoát khỏi phần mềm:
2.1. Cách khởi động:
Click vào StartProgramTyping MasterTyping Master Pro sẽ xuất hiện giao
diện yêu cầu nhập tên người sử dụng tại mục Enter Your name hoặc là click vào mục I
am a new user để tạo người dùng mới

2.2. Thoát khỏi phần mềm:
Để thoát khỏi phần mềm ta click chọn vào dấu X trên cùng bên phải.
3. Hướng dẫn sử dụng phần mềm để luyện kỹ năng đánh máy nhanh
3.1. Lựa chọn bài tập đánh máy
Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 10


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

Phần mềm này có các bài tập luyện đánh chữ và số. rong phần luyện đánh chữ có
tổng cộng 12 bài, còn luyện đánh số thì có 2 bài.
3.1.1. Luyện đánh chữ:
Bài 1 là các bài tập đánh các chữ như A, S, D, F, J, H, L, ;
Bài 2 là kết hợp thêm các phím E, I
Bài 3 là kết hợp thêm các phím E, I
Bài 4 là kết hợp thêm các phím T, O
Bài 5 là kết hợp thêm các phím Shift
Bài 6 là kết hợp thêm các phím C
Bài 7 là kết hợp thêm các phím G, H
Bài 8 là kết hợp thêm các phím V, N
Bài 9 là kết hợp thêm các phím W, M
Bài 10 là kết hợp thêm các phím Q, P
Bài 11 là kết hợp thêm các phím B, Y

Bài 12 là kết hợp thêm các phím Z, X
3.1.2. Luyện đánh số:
Để chuyển sang các bài tập đánh chữ sang số thì ta chọn mục Change Course,
tiếp tục chọn Advance Typing Sourse, chọn mục Number Course và chọn nút Continue
Course. Gồm có 2 bài:
Bài 1 luyện gõ các số 3,4,5,6,7 và 8
Bài 2 luyện gõ các số 1,2,9 và 0
Ngoài ra phần mềm trên còn có mục Typing Test để luyện một bài hoàn chỉnh,
đồng thời có mục Game để giải trí trong việc luyện đánh chữ.
3.2. Hướng dẫn cách làm bài kiểm tra:
- Gõ đúng vị trí ngón tay cho từng phím.
- Nhớ phím.
- Gõ nhanh.
Bài tập 1:
a. Tìm hiểu phần mềm đánh máy Typing master
b. Cài đặt phần mềm đánh máy Typing master
c. Khởi động, cấu hình và thoát khỏi phần mềm đánh máy Typing master.
Bài tập 2: Thực hiện gõ các phím cho từng bàn tay:
a. Thao tác đánh máy nhanh trên bài tập của phần mềm Typing master
b. Thao tác tự làm bài tập kiểm tra và tự đánh giá trong bài tập của phần mềm
Typing master
CHƯƠNG 4. SỬ DỤNG BỘ GÕ TIẾNG VIỆT
Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 11


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

1. Tìm hiểu các bảng mã tiếng việt:
1.1. Bộ mã 8 bit:
1.1.1. Các cách mã hóa tiếng Việt

Văn bản là chuỗi văn, mỗi đoạn văn là gồm chuỗi các từ (word), mỗi từ là chuỗi
các ký tự (character). Một cách ngắn gọn: văn bản bất kỳ mà ta muốn xử lý là một chuỗi
nhiều ký tự. Cách mã hóa văn bản tự nhiên nhất là mã hóa rời rạc từng ký tự trong văn
bản đó. Do số lượng ký tự tiếng Anh (ngôn ngữ phổ biến nhất hiện nay) nhỏ, gồm 26 ký
tự chữ từ “a” đến “z” và biến thể chữ hoa, 10 ký số từ 0 đến 9 và một số ký tự đặc biệt)
nên người ta chỉ dùng 7 bit trong mỗi byte để mô tả một ký tự. Chuỗi 7 bit có thể mô tả
được 128 giá trị khác nhau, mỗi giá trị được gán cho một ký tự. Mã ASCII mà máy tính
đã, đang và sẽ còn dùng được tạo ra theo ý tưởng trên. Tóm lại mã ASCII dùng 1 byte để
mô tả một ký tự nhưng chỉ dùng 7 bit trong 1 byte, còn bit thứ 8 chưa dùng.
Đại đa số các tập ký tự của các quốc gia châu Âu thuộc họ La-tinh, gồm chủ yếu
các ký tự tiếng Anh, chỉ thêm một ít ký tự có dấu. Để có thể mô tả được nhiều tập ký tự
của các nước này, người ta đã nới rộng mã ASCII 7 bit thành ASCII 8 bit để có thể mô tả
được 256 ký tự khác nhau: 128 ký tự tiếng Anh đã có cộng thêm 128 ký tự có dấu của
một số nước châu Âu. Chuẩn mã hóa 8 bit này là ISO 8859. Do có những khác biệt nhỏ
giữa các tập ký tự của các quốc gia châu Âu nên người ta đã tạo ra các biến thể khác nhau
từ ISO 8859-1 đến ISO8859-15, trong đó chuẩn mã hóa ISO 8859-1 được sử dụng phổ
biến nhất. Khi được cài đặt ở chế độ mặc nhiên, Windows và Linux đều sử dụng chuẩn
mã hóa ISO 8859-1.
Tập ký tự tiếng Việt cũng thuộc họ La-tinh nên hầu hết các đơn vị tạo mã tiếng
Việt trước đây đều dựa vào cách mà các nước châu Âu đã làm: nới rộng mã ASCII 7 bit
thành mã tiếng Việt 8 bit, tuy nhiên việc tạo mã của các đơn vị chỉ có tính cục bộ, tự phát
và chưa được tổ chức chuẩn hóa quốc gia và quốc tế thông qua (ngoài bộ mã TCVN
5172). Hiện có trên 40 bảng mã tiếng Việt được tạo ra theo cách trên gồm 2 nhóm chính:
dạng mã dựng sẵn và dạng mã tổ hợp.
1.1.2. Dạng mã dựng sẵn (1 byte)
Cố gắng dùng chỉ 1 byte cho bất kỳ ký tự tiếng Việt nào. Phần nới rộng ASCII
chỉ có 128 giá trị nên không thể dùng để mô tả đủ số lượng ký tự tiếng Việt có dấu là 134
(chữ thường và chữ hoa). Thường ta phải chọn một trong 3 cách dung hòa sau: hoặc chỉ
mô tả chữ thường; hoặc cố gắng mô tả đầy đủ chữ thường và chữ hoa nhưng bỏ 6 ký tự ít
dùng nhất; hoặc lấy thêm 6 ký tự ASCII ít được dùng để mô tả cho đủ tập 134 ký tự có

dấu. Cách nào cũng có những hạn chế riêng của nó, hơn nữa có một số phần mềm sử
dụng một số mã nới rộng này như là mã điều khiển để thực hiện các chức năng riêng của
chúng nên nếu ta dùng nó làm ký tự tiếng Việt thì ký tự này sẽ không bao giờ được hiển
thị trong các phần mềm này.
Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 12


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

Ví dụ: TCVN 5712-VN1, VISCII, BachKhoa I, VietStar… là những mã dựng sẵn
với một bảng font (cho cả chữ thường và chữ hoa). TCVN 5712-VN3 (ABC), VietSea,
VNU, SC 3.0 là những mã dựng sẵn với hai bảng font (một cho chữ thường và một cho
chữ hoa).
1.1.3. Dạng mã tổ hợp (2 byte hay nhiều hơn)
Mỗi ký tự có dấu tiếng Việt được mô tả bởi nhiều thành phần cơ bản ghép lại: mã ký
tự cơ bản không dấu cộng thêm các mã ký tự mô tả các dấu. Để đơn giản hóa vấn đề, hầu hết
các bảng mã tiếng Việt dạng tổ hợp chỉ dùng 2 byte: 1 byte mô tả mã ký tự cơ bản + 1 byte
mô tả các dấu kèm theo (có thể từ 1 tới 2 dấu). Số lượng tổ hợp dấu cho các ký tự tiếng Việt
rất nhỏ nên ta có thể chọn lựa thoải mái trong phần mã nới rộng (>128). Lưu ý rằng với cách
mã hóa này, số lượng byte mô tả cho từng ký tự sẽ khác nhau: có ký tự chỉ chiếm 1 byte, có
ký tự chiếm 2 byte,… Kết quả là việc xử lý văn bản sẽ phức tạp hơn dạng mã dựng sẵn. Hiện
phương pháp xử lý tiếng Việt tổng quát là chuyển mã tiếng Việt cần xử lý về dạng mã trung
gian (thường là 1 byte), xử lý trên mã trung gian rồi chuyển kết quả về mã ban đầu, như vậy
phương pháp tổng quát này sẽ không hiệu quả, nhưng chúng ta phải chấp nhận nó trong bối
cảnh có quá nhiều bảng mã tiếng Việt khác nhau.
Ví dụ: VietWare-X, VNI for Windows, TCVN 5712-VN2, BachKhoa II, VS2,
3C25… là những mã tổ hợp.
Lưu ý: Trên Windows 2000 hay Windows 95 tiếng Việt, Microsoft cung cấp bộ mã
tiếng Việt với tên là “CodePage 1258”, đây là loại mã tiếng Việt 1 byte dạng tổ hợp. Có thể
nói Microsoft đã giải quyết vấn đề tiếng Việt rất tốt dựa trên bản mã này: nhập liệu thân

thiện, hiển thị, in ấn tốt và quan trọng hơn là tất cả các hoạt động xử lý như sắp xếp, tìm
kiếm dữ liệu tiếng Việt đều hoạt động rất tốt. Có thể nói rằng đây là bộ mã tiếng Việt được
hỗ trợ hoàn hảo nhất từ trước tới nay, nhưng tiếc rằng nó chưa được chấp nhận.
1.1.4. Mã Unicode tiếng Việt
Xu hướng toàn cầu hóa đã và đang diễn ra mạnh mẽ, để một phần mềm được
chấp nhận trên phạm vi toàn thế giới, nó phải xử lý được mọi tập ký tự của các quốc gia,
nhất là các quốc gia châu Á với số lượng dân đông nhất thế giới. Mặc dù tập ký tự của
mỗi quốc gia thường không lớn lắm (ngay cả tập ký tự của Trung Quốc cũng chưa tới
10.000 ký tự) nhưng hội các tập ký tự của các quốc gia (kể cả các tập ký tự của quá khứ
mà bây giờ đã hết dùng) là khá lớn. Trong những năm đầu của thập kỷ 90 có 2 tổ chức
khác nhau cùng cố gắng định nghĩa bộ mã hợp nhất thế giới này, đó là: Tổ chức chuẩn
hóa quốc tế ISO (International Organization of Standardization) với dự án ISO 10646 và
Hiệp hội các hãng sản xuất phần mềm đa ngữ với dự án Unicode.
1.2 Bộ mã Unicode 16 bit
May mắn cho chúng ta là vào năm 1991, các thành viên của cả 2 tổ chức này nhận
thấy rằng việc tạo 2 bộ mã khác nhau cho thế giới là không cần thiết nên họ đã hợp tác
với nhau để cùng đưa ra bộ mã thống nhất, mặc dù mỗi tổ chức vẫn xuất bản tài liệu và
Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 13


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

đặt tên riêng cho bộ mã thống nhất này: tổ chức ISO đặt tên bộ mã là ISO 10646 hay
UCS (Universal Character Set), còn Hiệp hội các hãng sản xuất phần mềm đa ngữ đặt tên
bộ mã là Unicode. Do Unicode là tên bộ mã thống nhất do hiệp hội các hãng sản xuất
phần mềm nên ta nghe nói về nó nhiều hơn là ISO 10646.
Unicode đã phát triển qua nhiều version từ 1.0 đến nay là 3.1 và từ 2.0 trở đi thì các
ký tự tiếng Việt đã được đưa vào bộ mã. Unicode hiện nay dùng 4 byte để mô tả một ký
tự trong không gian mã 231 ký tự (2 tỉ ký tự), con số rất lớn đủ để mô tả mọi ký tự của
mọi quốc gia, trong quá khứ lẫn hiện tại cũng như có dự trù cho việc phát triển trong

tương lai.
Để dễ quản lý bộ mã, người ta chia nó ra thành nhiều phần (plane – mặt phẳng)
khác nhau, mỗi mặt phẳng chứa 65.536 ký tự (dùng 16 bit để mô tả), được đánh số từ 0.
Hiện nay người ta mới chỉ tìm ra và thống nhất được khoảng một triệu ký tự, trong số này
chỉ có 65.534 ký tự đầu (mã từ 0000 đến fffd) được dùng phổ biến trên thế giới, tập con
này được gọi là mặt phẳng đa ngữ cơ bản BMP (Basic Multilingual Plane) và được ký
kiệu tắt là BMP0. Với tình hình thực tế trên, hầu hết các hệ điều hành và ứng dụng chỉ cố
gắng xử lý được các ký tự Unicode nằm trong BMP0. Để mô tả được 65.534 ký tự khác
nhau này, ta chỉ cần 2 byte cho mỗi ký tự là đủ. Unicode cũng cung cấp 2 phương pháp
mô tả ký tự khác nhau:
+ Mã dựng sẵn (precomposed characters): mỗi ký tự được mô tả bởi một mã
Unicode.
+ Mã tổ hợp (combining characters): mỗi ký tự được hợp thành từ nhiều thành
phần khác nhau như ký tự chính và các dấu, mỗi thành phần có một mã Unicode riêng,
như vậy một ký tự tổ hợp được mô tả bởi nhiều mã Unicode.
Ví dụ: Chữ ừ trong các dạng biểu diễn nói trên sẽ là chuỗi ký tự sau:
Chuỗi mã Hex Dựng sẵn
1EAB
Tổ hợp
01B0,0300
Chính tắc
0075,031B,0300
(Các dạng biểu diễn chữ ừ)
Mã dựng sẵn và mã tổ hợp là quá trình mã hoá các ký tự thành các ký tự dựng sẵn
hay thành các ký tự tổ hợp. Có thể coi chính tắc là một dạng của mã hoá tổ hợp.
Ưu điểm của mã tổ hợp
- Mã tổ hợp có phần gọn nhẹ và chiếm ít mã hơn trong bảng mã, chỉ cần 20 vị trí
cho ký tự thuần Việt ( ă, â, ê, ô, ơ, ư, Ă, Â, Ê, Ô, Ơ, Ư, các dấu thanh: huyền, hỏi, ngã,
sắc, nặng và dấu tổ hợp nguyên âm: nón, mũ, râu cho dạng chính tắc) trong khi mã dựng
sẵn cần đến 134 cho ký tự thuần Việt.

Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 14


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

- Mã tổ hợp có phần gần với ngôn ngữ tự nhiên (Việt) hơn trong quá trình ghép
chữ, ghép vần.
- Mã tổ hợp sẽ dễ dàng hơn trong việc chuyển đổi chữ hoa/chữ thường, trong một
số ứng dụng có thể dùng luôn tính năng Change Case có sẵn để chuyển đổi.
- Mã tổ hợp có vẻ như dễ dàng hơn trong việc sắp xếp tiếng Việt, nhưng thực ra
không phải như vậy, lý do là các dấu thanh huyền, sắc ngã, hỏi, nặng – thứ tự trong bảng
mã Unicode – lại nằm không đúng theo thứ tự sắp xếp tiếng Việt là huyền, hỏi, ngã, sắc,
nặng, do đó vẫn phải thiết kế thuật toán riêng để sắp xếp mà không thể dùng các hàm có
sẵn trong tiếng Anh. Khi đã phải dùng thuật toán riêng thì việc sắp xếp cho mã dựng sẵn
cũng không khó hơn, không phức tạp nhiều hơn so với việc sắp xếp mã tổ hợp.
- Mã tổ hợp có phần dễ dàng hơn trong việc tìm kiếm tiếng Việt gần đúng, ví dụ
những chữ tiếng Việt gần với âm "tha" chẳng hạn, thì các hàm tìm kiếm phổ thông sẽ tìm
ra được các chữ thà, thá, thả, thã, thạ… Nhưng nếu tìm những từ gần với âm "than" thì
lúc ấy lại phải thiết kế thuật toán riêng, mà khi đã phải dùng thuật toán riêng thì giữa tổ
hợp và dựng sẵn thuật toán không khó hơn nhau nhiều.
- Trong thực tế, mã tổ hợp được hỗ trợ tốt hơn trong môi trường Windows 2000,
và bộ Microsoft Office 2000, ý tốt hơn ở đây là chuyển đổi chữ hoa/thường, sắp xếp tiếng
Việt được thiết kế ngay trong hệ điều hành và một số ứng dụng. Mã tổ hợp có thể hiện thì
tốt hơn trong một số control có sẵn của Windows 2000, XP. Với Windows XP, Microsoft
đã hỗ trợ luôn cả mã dựng sẵn với tính năng sắp xếp tiếng Việt.
Nhược điểm của mã tổ hợp
- Cài đặt mã tổ hợp khá phức tạp, số lượng môi trường cài đặt bị hạn chế hơn
nhiều so với mã dựng sẵn, thông thường chỉ cài đặt được với font vector và bộ font cho
phép định nghĩa các ký tự có độ rộng âm, khi đó 2 ký tự có độ rộng âm và dương tổ hợp
lại sẽ cho ra ký tự cần hiển thị. Một khó khăn khá lớn nữa là phần lớn các công nghệ font

phổ biến ngày nay như TrueType, OpenType, Typel… không cho phép thay đổi động vị
trí nét trong hình chưa mà điều này lại rất cần thiết. Ví dụ chữ "à", và "À", thì vị trí của
dấu huyền phải nằm ở 2 cao độ khác nhau tùy theo chữ cái cơ sở là chữ thường hay chữ
hoa, việc thay đổi động cao độ của dấu than theo ngữ cảnh là chưa thực hiện được bằng
kỹ thuật font chữ hiện hành. Để khắc phục vấn đề này, VNI đã phải đề xuất 2 mã riêng
cho từng dấu thanh: 2 dấu huyền, một mã cho chữ hoa và một mã cho chữ thường. Trong
CP 1258 và Unicode để đảm bảo tính đơn trị (tính một- một) các dấu thanh chỉ có một mã
vì thế sẽ rất khó khăn trong hiển thị .
- Phương án thứ 2 mà Microsoft đưa ra để giải quyết vấn đề tăng giảm độ cao dấu
thanh là dùng kỹ thuật Hook API thay đổi các hàm Display qua đó ánh xạ (map) chuỗi ký
tự tổ hợp về chuỗi ký tự dựng sẵn để hiển thị và in ấn. Cơ chế này chỉ có trong Windows
95 tiếng Việt, Windows 2000, Windows XP mà không có trong Windows 95, Windows 98.
Cơ chế này không phải bao giờ cũng thực hiện tốt, ngay cả trên Windows XP.
Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 15


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

- Từ việc cài đặt mã tổ hợp phức tạp như vậy dẫn đến một nhược điểm thứ hai
khá nghiêm trọng, đó là tính tương thích của mã tổ hợp kém hơn. Có nghĩa là một văn
bảng bằng mã tổ hợp ở môi trường này có thể không đọc được trong môi trường khác.
Nhất là khi dùng font bitmap để làm font hệ thống thì hầu như không thể cài đặt được mã
tổ hợp, cũng như trong DOS, text console và nhiều môi trường Unix, Linux. Mã tổ hợp
cài đặt trên các hệ điều hành phổ biến hiện nay là Windows 98 thì chữ rất xấu không thể
chấp nhận được. Sẽ là một vấn đề lớn khi dùng mã tổ hợp phải nâng cấp phần cứng máy
tính lên Windows 2000, XP (theo khuyến cáo của Microsoft để chạy mã tổ hợp tốt hơn),
như vậy sẽ cần kinh phí rất lớn để nâng cấp, đào tạo lại…
- Độ mỹ thuật của mã tổ hợp thường kém hơn nhiều so với mã dựng sẵn, lý do là
một ký tự dấu thanh có vị trí và cao độ xác định trong font chữ thường được dùng chung
cho nhiều nguyên âm khác nhau và chúng được tổ hợp tự động sau khi nhập đoạn text. Vị

trí của dấu thanh có thể hợp và đẹp với nguyên âm này nhưng lại có thể không phù hợp
với nguyên âm khác. Ví dụ độ rộng của nguyên âm A thì khác với độ rộng của nguyên âm
I (độ rộng rất hẹp) vì thế nếu đẹp cho chữ A thì xấu cho chữ I và ngược lại, để khắc phục
tình trạng này, VNI phải định nghĩa riêng các mã cho các chữ ì, í, ỉ, ĩ, ị. Vì vậy chúng ta
thường coi VNI là giải pháp khắc phục tình thế hơn là một bộ mã, vì nó không đảm bảo
tính đơn trị, và nhất quán (có nhiều mã cho một dấu – với chữ lại có xử lý khác so với xử
lý các nguyên âm khác). Trong khi đó mã dựng sẵn được thiết kế từ trước (dựng sẵn) nên
có thể bố trí vị trí dấu thanh nhờ vào vị trí thích hợp nhất cho từng nguyên âm, nên bao
giờ cũng có khả năng đẹp hơn nhiều so với mã tổ hợp.
- Xử lý hiệu ứng với đoạn mã tổ hợp có nhiều vấn đề khó khăn hơn so với mã
dựng sẵn. Trong nhiều trường hợp, một con chữ tiếng Việt trong lưu trữ và hiển thị với
mã dựng sẵn lại không phải là một thể thống nhất (tổ hợp từ những ký tự rời rạc) cho nên
khi thực hiện các hiệu ứng với đoạn văn bản như co dãn text, xoay, dồn chữ, canh đều hai
bên… thì các dấu và chữ thường bị tách rời nhau, chữ đi một nơi và dấu đi một nơi, ảnh
hưởng đến mỹ thuật và độ chính xác. Có thể thấy trên các tít báo dùng font VNI hay xuất
hiện các hiện tượng xa rời dấu thanh.
- Xử lý với các ký tự mã tổ hợp phức tạp hơn so với mã dựng sẵn, do mỗi chữ cái
trong mã tổ hợp có độ rộng thay đổi, lúc có thể là một ký tự, lúc khác lại được tổ hợp từ
nhiều byte khác nhau. Khi tách từ, tách ký tự (theo ngôn ngữ tự nhiên), thường dùng để
phân tích cú pháp hay đánh chỉ số phải xây dựng thuật toán riêng khá phức tạp, trong khi
mã dựng sẵn có độ rộng cố định nên việc rút ký tự từ đoạn text ra rất đơn giản, không cần
xây dựng thuật toán riêng. Ngoài ra việc xử lý ký tự khác như: xóa ký tự, di chuyển cho
trỏ di theo đơn vị ký tự thì thực hiện với mã tổ hợp khó khăn và phức tạp hơn: thường
phải xóa 2 sẵn cho một chữ, di chuyển 2 lần con trỏ mới đi ra khỏi một chữ, điều này là
xa lạ với ngôn ngữ tự nhiên.

Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 16


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím


- Kích thước các tệp dữ liệu lưu ở dạng tổ hợp thường lớn hơn so với mã dựng
sẵn khoảng 25-30% do đó nó chiếm nhiều không gian trong đĩa cứng, bộ nhớ hơn, và trên
đường truyền mạng (internet/intranet) ngốn nhiều băng thông hơn.
- Trong cơ sở dữ liệu, thiết kế cấu trúc cơ sở dữ liệu với mã tổ hợp thường phức
tạp hơn. Vì mặc dù biết trước số chữ cái max nhưng lại khó đoán nhận chính xác độ dài
chuỗi byte tương ứng lớn nhất, nếu thiết kế không khéo sẽ bị tràn bộ nhớ. Và khó khăn
trong việc phân tách ký tự, phân tách từ cũng làm khó khăn thêm trong việc xử lý text
trong lĩnh vực cơ sở dữ liệu.
- Trong việc đánh chỉ số (index), và tìm kiếm toàn văn (full text search), mà tổ
hợp cũng gây nhiều khó khăn hơn (phân tách từ, phân tách ký tự) và các ký tự dấu thanh
trong mã tổ hợp thường bị coi là dấu phân cách từ, dẫn đến việc đánh chỉ số bị sai và tìm
kiếm toàn văn cũng không đúng. Hiện tượng này thường gặp với đa số các bộ search
engine, công cụ tìm kiếm toàn văn trong Oracle và Lotus Notes 5.0 đều bị lỗi đánh chỉ số
sai. Tuy rằng Oracle và Lotus Notes đều hỗ trợ Unicode trong phần encoding, nhưng
đáng tiếc phần tìm kiếm toàn văn mua lại của hãng thứ 3 INSO và Verity đều thực hiện
các phân cách từ sai với mã tổ hợp. Nhưng lỗi này không xảy ra với mã dựng sẵn.
- Tính thực tế của mã tổ hợp kém hơn mã dựng sẵn: đa số ở Việt Nam cùng như ở
nước ngoài, Unicode dựng sẵn được dùng rất phổ biến, các website của Việt Nam như
Vnexpress và VASC Orient hàng ngày có gần 2 triệu lượt truy nhập chứng tỏ số lượng
người dùng mã dựng sẵn rất lớn, trong khi các website dùng mã tổ hợp rất ít.
Dưới đây là một minh hoạ cho sự lệch lạc dấu thanh của mã tổ hợp, dòng trên là soạn
bằng mã tổ hợp, dòng dưới được soạn bằng mã dựng sẵn, được dùng cùng một font chữ
Verdana, trong hệ điều hành Windows XP, và đoạn text được soạn trong PowerPoint
2000, 2 dòng cuối được soạn bằng WordArt cũng trong Office 2000 và Windows XP. Tất
cả các đoạn text trên chưa hề qua một hiệu ứng text nào, mà chữ và dấu thanh đã bị lệch
và xa rời nhau trong khi mã dựng sẵn luôn hiển thị đúng và đẹp. Hiện tượng này còn bị
phổ biến hơn với tất cả các ứng dụng (kể cả Word XP, Excel XP…) chạy trên hệ điều
hành Windows 95, 98.
Ưu và nhược điểm của mã dựng sẵn

Những ưu và nhược điểm của mã dựng sẵn cũng đã được phân tích khá kỹ và
song song trong quá trình phân tích các ưu và nhược điểm của mã tổ hợp, chỉ xin được
tổng kết lại một cách tóm tắt: mã dựng sẵn không bị những nhược điểm của mã tổ hợp,
các file sử dụng mã dựng sẵn tốn ít không gian nhớ, cài đặt đơn giản hơn, chữ hiển thị
đẹp hơn, mỹ thuật hơn, xử lý với xâu ký tự dựng sẵn dễ dàng hơn (phân tách từ, phân
tách ký tự, xóa và di chuyển con trỏ), chữ và dấu là một khối thống nhất nên khi co dãn
text không bị hiện tượng xa rời dấu thanh, và đặc biệt tính tương thích của mã dựng sẵn
cao hơn có thể chạy được trên nhiều môi trường khác nhau (từ font vector đến bitmap, từ

Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 17


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

Windows, Macintosh đến Linux), vì chuyển mang văn bản dữ liệu giữa các môi trường
không đồng nhất (Multiplatform) là một điều cũng rất cần thiết.
Tất cả những ưu điểm của mã tổ hợp, thì lại không phải là căn bản và đều có thể
giải quyết được tương đối khá dễ dàng, trong khi đó mã tổ hợp có những vấn đề về kỹ
thuật khá phức tạp (cài đặt, hiển thị…). Vẫn biết kỹ thuật phải theo chuẩn, nhưng tại thời
điểm hiện nay có những giới hạn nhất định về kỹ thuật và công nghệ ví dụ cách đây 30
năm, mã hóa 8 bit là giới hạn chưa giải quyết được do không gian nhớ eo hẹp.. . ngày nay
cài đặt mã tổ hợp trong nhiều môi trường chưa thể làm được hoặc phải làm rất khó khăn
và đi vòng vo như ánh xạ từ tổ hợp về dựng sẵn.
Các nhược điểm của mã tổ hợp có thể khắc phục được một phần ở thời điểm hiện
nay và có thể khắc phục hoàn toàn trong tương lai, nhưng chúng ta nên chọn những
phương án đơn giản, dễ cài đặt, đẹp hơn… và nhiều ưu điểm ở trên là mã dựng sẵn bởi vì
cái lợi của mã tổ hợp mang lại thì không đáng kể mà để thực hiện hoàn hảo nó thì lại có
quá nhiều khó khăn.
Cái có thể nói nhược điểm của mã dựng sẵn hiện nay là chưa được Microsoft chú
ý hỗ trợ nhiều. Trong thời gian trước Microsoft có thiên hướng đi theo mà tổ hợp (là phần

nâng cấp từ mã 8-bit CP 1258 lên). Những xử lý về tiếng Việt như sắp xếp, chuyển đổi
chữ hoa/thường… được tích hợp luôn vào hệ điều hành như thế tốt hơn so với mã dựng
sẵn, nhưng điều này chỉ đúng với Windows 2000 (không đúng với Windows 95, 98 ),
ngoài ra trên Windows XP, Microsoft đã bắt đầu hỗ trợ thêm mã dựng sẵn vào trong hệ
điều hành: phần sắp xếp tiếng Việt và việc trong tương lai Microsoft sẽ hỗ trợ hoàn toàn
mã dựng sẵn vào hệ điều hành không phải là vấn đề phức tạp về kỹ thuật.
Ngoài ra, trước kia với các mã VNI, ABC-TCVN 5712, chúng ta đâu có được Microsoft
hỗ trợ tiếng Việt ở mức hệ điều hành, nhưng vẫn không bị ảnh hưởng máy, CNTT vẫn
tiến triển tốt. Thêm nữa, hiện đã có những hỗ trợ tiếng Việt ở mức thấp API (giống như
Windows) do các đơn vị ở trong nước thực hiện và đáp ứng đầy đủ các yêu cầu về xử lý
tiếng Việt ở tầng thấp.
Tóm lại mã dựng sẵn với nhiều ưu điểm nổi trội có thể đáp ứng được nhu cầu
trước mắt cũng như lâu dài và có thể sử dụng trong nhiều lĩnh vực: chế bản văn phòng,
web, email, cơ sở dữ liệu và nhiều lĩnh vực khác, chúng ta nên chọn mã dựng sẵn, và tổ
hợp chỉ có thể dùng trong một số bài toán đặc thù như phân tích chuỗi ký tự hay để biểu
diễn các hình chữ cho dấu thanh.
Unicode và TCVN 6909
Năm 2001, Khoa học Công nghệ và Môi trường ban hành bộ mã chữ quốc ngữ
mới với mã số TCVN 6909 nhằm công nhận và hợp pháp hóa bộ phận mã tiếng Việt
được định nghĩa trong bộ mã Unicode.
Trước tiên cần phải nêu rõ mối quan hệ giữa Unicode và TCVN 6909. TCVN
6909 là một tập con của Unicode, nhưng đã được chọn lọc kỹ lưỡng để lấy ra đúng những
Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 18


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

ký tự sẽ dùng trong ngôn ngữ Việt. TCVN 6909 quy định rõ ràng hơn và tính đơn trị mộtmột cao hơn trong Unicode. Ví dụ trong Unicode có đến 3 chữ ‘Đ’, 8 dấu nặng ‘.’ nếu
không quy định rõ sẽ gây nhầm lẫn, mà thực tế đã xảy ra nhầm lẫn chữ ‘Đ’ trong bộ gõ
Unicode: VPS của Việt kiều Pháp. TCVN 6909 chứa tất cả các ký tự dựng sẵn và cùng có

đầy đủ các mã để hiển thị cho dấu thanh, mã cho việc biểu diễn các dấu tổ hợp nguyên
âm, như vậy TCVN 6909 là bộ mã rất đầy đủ (trong đó có mã cho tất cả các thành phần
tiếng Việt). TCVN 6909 không quy định biểu diễn dựng sẵn hay tổ hợp. Vì vậy nói
TCVN 6909 là mã dựng sẵn là không chính xác.
TCVN 6909 kế thừa các ưu điểm của bộ mã Unicode và ISO 10646, cho nên nó
hoàn toàn cho phép hội nhập tiếng Việt với các ngôn ngữ khác trong cộng đồng Unicode.
Hiện nay đa số các ứng dụng phổ thông đều đa hỗ trợ Unicode: phần mềm văn phòng, cơ
sở dữ liệu, web, e-mail… Tuy nhiên, cũng còn một số các phần mềm chuyên ngành chưa
hỗ trợ Unicode.
Vấn đề chuyển mã sang Unicode
Vấn đề kỹ thuật của Unicode không chỉ là bộ gõ Unicode (như một số người đã
lầm tưởng) mà là một loạt các vấn đề khác, đặc biệt là các công cụ chuyển mã cho văn
bản dữ liệu (Microsoft Office,Webpages, Database…). Chuyển mã là vấn đề lớn hơn
nhiều, vì khối lượng dữ liệu cần chuyển đổi sang Unicode rất lớn, đa dạng về khuôn thức
loại hình, chủng loại. Ngoài ra còn các vấn đề sắp xếp, chuyển đổi chữ hoa, chữ thường,
tìm kiếm toàn văn, kiểm tra chính tả tiếng Việt, đặc biệt hỗ trợ ở mức lập trình cho các
công cụ phát triển cũng là điều rất cần thiết (hiển thị, lưu trữ…).
Có thể nói chuyển đổi sang Unicode là một việc làm rất cần thiết và phải làm
càng sớm càng tốt, vì càng để chậm, kho dữ liệu, các website càng ngày càng phát triển
với dữ liệu càng lớn thì quá thì quá trình chuyển mã về sau càng phức tạp, càng tốn kém
nhiều công sức và tiền của. Vấn đề Unicode, không chỉ là bộ gõ, mà phải nghĩ đó là một
loạt các công cụ đằng sau chuyển mã và hỗ trợ tiếng Việt ở mức hệ thống, ứng dụng
trong nhiều môi trường khác nhau.
Font chữ tiếng Việt: Ðể hiển thị tiếng Việt Unicode cần phải cài đặt font chữ
Unicode, chỉ cần cài 1 trong các phần mềm sau: Internet Explore 5 trở lên hoặc MS
Office 2000, 2003 hoặc cài đặt Windows 2000/XP. Khi cài đặt 1 trong những phần mềm
trên các font Unicode có tiếng Việt sẽ được tự động cài đặt hệ thống. Các font cơ bản của
Microsoft đi kèm với các phần mềm trên đã hỗ trợ tiếng Việt Unicode là Times New
Roman, Arial, Courier, Tahoma. Ngoài ra có thể tải xuống các font Unicode (có hỗ trợ
tiếng Việt) khác trên Internet: Verdana, Arial Narrow, Arial Black, Bookman Old Style,

Garamond, Impact, Lucida Sans, Comic Sans...
2. Thao tác với các phương pháp gõ tiếng việt khác nhau:
2.1. Bảng mã chuẩn Unicode:

Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 19


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

Bảng mã Unicode (hay còn gọi là bảng mã thống nhất , mã đơn nhất) : là bộ mã
chuẩn quốc tế được thiết kế để dùng làm bộ mã duy nhất cho tất cả các ngôn ngữ khác
nhau trên thế giới, kể cả các ngôn ngữ sử dụng ký tự tượng hình phức tạp như tiếng
Trung Quốc, tiếng Việt Nam , tiếng Thái Lan … Vì những điểm ưu việt đó, Unicode đã
và đang từng bước thay thế các bộ mã truyền thống, kể cả bộ mã tiêu chuẩn ISO 8859 và
hiện đang được hỗ trợ trên rất nhiều phần mềm cũng như các trình ứng dụng, chẳng hạn
Windows.
go tieng viet, bo go tieng viet, phan mem go tieng viet, gotiengviet, tai phan mem go
tieng viet, go tieng viet unikey, kieu go telex, go dau tieng viet, go tieng viet co dau,
khong go duoc tieng viet trong win 7, tai bo go tieng viet, tai go tieng viet, bo go tieng
viet unikey, bang go tieng viet, bo go unikey, go cai dat tren win 7, bang go telex, cach go
tieng viet, download phan mem go tieng viet, go phan mem tren win 7, go tieng viet win
10, kieu go vni, go chu co dau, phan mem go tieng viet cho may tinh, bo go tieng viet
vietkey, cai dat unikey de go tieng viet, download bo go tieng viet, download go tieng
viet, go tieng viet tren win 10, kieu go vni trong unikey, phan mem go tieng viet co dau,
tai go tieng viet ve may, cai dat go tieng viet, go chu tieng viet, kieu go tieng viet, phan
mem go tieng viet unikey, tai phan mem go tieng viet unikey, unikey go tieng viet

Sự khác biệt giữa các bảng mã là :
UTF 8 : UTF-8 là một cách mã hóa để có tác dụng giống như UCS-4 (cũng là
UTF-16), chứ không phải có code point nào khác. UTF-8 được thiết kế để tương thích

với chuẩn ASCII. UTF-8 có thể sử dụng từ một (cho những ký tự trong ASCII) cho đến 6
byte để biểu diễn một ký tự.
Chính vì tương thích với ASCII, UTF-8 cực kỳ có lợi thế khi được sử dụng để bổ
sung hỗ trợ Unicode cho các phần mềm có sẵn. Thêm vào đó, các nhà phát triển phần
mềm vẫn có thể sử dụng các hàm thư viện có sẵn của ngôn ngữ lập trình C để so sánh
(comparisons) và xếp thứ tự. (Ngược lại, để hỗ trợ các cách mã hóa 16 bit hay 32 bit như
ở trên, một số lớn phần mềm buộc phải viết lại do đó tốn rất nhiều công sức. Một điểm
mạnh nữa của UTF-8 là với các văn bản chỉ có một số ít các ký tự ngoài ASCII, hay thậm
Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 20


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

chí cho các ngôn ngữ dùng bảng chữ cái Latinh như tiếng Việt,tiếng Anh ,tiếng Đức …;
cách mã hóa kiểu này cực kỳ tiết kiệm không gian lưu trữ.
UTF-8 được thiết kế đảm bảo không có chuỗi byte của ký tự nào lại nằm trong
một chuỗi của ký tự khác dài hơn. Điều này khiến cho việc tìm kiếm ký tự theo byte
trong một văn bản là rất dễ dàng. Một số dạng mã hóa khác (như Shift-JIS) không có tính
chất này khiến cho việc xử lý chuỗi ký tự trở nên phức tạp hơn nhiều. Mặc dù để thực
hiện điều này đòi hỏi phải có độ dư (văn bản sẽ dài thêm) nhưng những ưu điểm mà nó
mang lại vẫn nhiều hơn. Việc nén dữ liệu không phải là mục đích hướng tới của Unicode
và việc này cần được tiến hành một cách độc lập.
Các quy định chính xác của UTF-8 như sau (các số bắt đầu bằng 0x là các số
biểu diễn trong hệ thập lục phân )
- Các ký tự có giá trị nhỏ hơn 0x80, sử dụng 1 byte có cùng giá trị.
- Các ký tự có giá trị nhỏ hơn 0x800, sử dụng 2 byte: byte thứ nhất có giá trị
0xC0 cộng với 5 bit từ thứ 7 tới 11 (7th-11th least significant bits); byte thứ hai có giá trị
0x80 cộng với các bit từ thứ 1 tới thứ 6 (1st-6th least significant bits).
- Các ký tự có giá trị nhỏ hơn 0x10000, sử dụng 3 byte: byte thứ nhất có giá trị
0xE0 cộng với 4 bit từ thứ 13 tới 16; byte thứ hai có giá trị 0x80 cộng với 6 bit từ thứ 7

tới 12; byte thứ ba có giá trị 0x80 cộng với 6 bit từ thứ 1 tới thứ 6.
- Các ký tự có giá trị nhỏ hơn 0x200000, sử dụng 4 byte: byte thứ nhất có giá
trị 0xF0 cộng với 3 bit từ thứ 19 tới 21; byte thứ hai có giá trị 0x80 cộng với 6 bit từ thứ
13 tới 18; byte thứ ba có giá trị 0x80 cộng với 6 bit từ thứ 7 tới thứ 12; byte thứ tư có giá
trị 0x80 cộng với 6 bit từ thứ 1 tới thứ 6.
Hiện nay, các giá trị khác ngoài các giá trị trên đều chưa được sử dụng. Tuy
nhiên, các chuỗi ký tự dài tới 6 byte có thể được dùng trong tương lai.
- Chuỗi 5 byte sẽ lưu trữ được mã ký tự chứa đến 26 bit: byte thứ nhất có giá
trị 0xF8 cộng với 2 bit thứ 25 và 26, các byte tiếp theo lưu giá trị 0x80 cộng với 6 bit có ý
nghĩa tiếp theo.
- Chuỗi 6 byte sẽ lưu trữ được mã ký tự chứa đến 31 bit: byte thứ nhất có giá trị
0xFC cộng với bit thứ 31, các byte tiếp theo lưu giá trị 0x80 cộng với 6 bit có ý nghĩa tiếp theo.

Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 21


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

UTF 32 :
Cách đơn giản nhất để lưu trữ tất cả các 220+216 Unicode code points là sử dụng
32 bit cho mỗi ký tự, nghĩa là, 4 byte – do đó, cách mã hóa này được Unicode gọi là UTF
32 và ISO/IEC 10646 gọi là UCS-4 . Vấn đề chính của cách này là nó hao chỗ hơn 4 lần
so với trước kia, do đó nó ít được dùng trong các vật nhớ ngoài (như đĩa, băng). Tuy
nhiên, nó rất đơn giản, nên một số chương trình sẽ sử dụng mã hóa 32 bit bên trong khi
xử lý Unicode.

UTF 16 :
Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 22



Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

UTF-16 là một cách mã hóa dùng Unicode 20 bit. Các ký tự trong BMP được
diễn tả bằng cách dùng giá trị 16-bit của code point trong Unicode CCS. Có hai cách để
viết giá trị 16 bit trong một dòng (stream) 8-bit. Có lẽ bạn đã nghe qua chữ endian. Big
Endian có nghĩa là cho Most Significant Byte đi trước, tức là nằm bên trái – do đó ta có
UTF-16BE. Còn Little Endian thì ngược lại, tức là Least Significant Byte đi trước – do
đó ta có UTF-16LE. Thí dụ, giá trị 16-bit của con số Hex1234 được viết là Hex12 Hex34
trong Big Endian và Hex34 Hex12 trong Little Endian.
Những ký hiệu không nằm trong BMP được biểu diễn bằng cách dùng surrogate
pair (cặp thay thế). Code points có giá trị từ U+D800 đến U+DFFF được dành riêng ra để
dùng cho mục đích này. Trước hết, một code point có 20 bit được phân ra làm hai nhóm
10 bit. Nhóm Most Significant 10 bit được map vào một giá trị 10 bit nằm trong khoảng
từ u+D800 đến u+DBFF. Nhóm Least Significant 10 bit được map vào một giá trị 10 bit
nằm trong khoảng từ U+DC00 đến U+DFFF. Theo cách đó UTF-16 có thể biểu diễn
được những ký hiệu Unicode có 20 bit.

UTF 7 :
Chuẩn hóa được ít dùng nhất có lẽ là UTF-7. Chuẩn MIME yêu cầu mọi thư điện
tử phải được gửi dưới dạng ASCII cho nên các thư điện tử nào sử dụng mã hóa Unicode
được coi là không hợp lệ. Tuy nhiên hạn chế này thường bị hầu hết mọi người bỏ qua.
UTF-8 cho phép thư điện tử sử dụng Unicode và đồng thời cũng phù hợp với tiêu chuẩn.
Các ký hiệu ASCII sẽ được giữ nguyên, tuy nhiên các ký tự khác ngoài 128 ký hiệu
ASCII chuẩn sẽ được mã hóa bằng một sequence hay một dấu ‘+’ theo sau một ký tự
Unicode được mã hóa bằng Base64, và kết thúc bằng một dấu ‘-‘. Ký tự ‘+’ nổi tiếng sẽ
được mã hóa thành ‘+-‘.
2.2. Các hệ thống bảng mã Unikey, Vietkey:
Unicode: unicode dựng sẵn.
Composed Unicode: unicode tổ hợp.
Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 23



Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

ABC, VNI, VISCII, VPS, VIETWARE, BKHCM: Đây là các bảng mã cũ, dần dần
sẽ không còn được dùng nữa.
MS CP 1258: bảng mã tiếng Việt do Microsoft quy định. Nếu dùng bảng mã này
trong các chương trình hỗ trợ unicode của Microsoft như Office, Outlook Express… thì
nó cho cùng một kết quả như unicode tổ hợp.
VIQR: Thực chất đây không phải là bảng mã mà chỉ là dạng thể hiện tiếng Việt
dưới dạng “thô sơ” thông qua các ký tự chuẩn. Dạng này vẫn còn được dùng nhiều trong
trao đổi email.
UTF-8 Literal, NCR Decimal, NCR Hexadecimal: Đây thực chất là các dạng thể
hiện khác nhau của Unicode dựng sẵn. Nếu bạn là người dùng bình thường và chưa nghe
đến chúng thì nhiều khả năng bạn sẽ không bao giờ cần đến chúng. Các dạng này chủ yếu
nhằm phục vụ những người soạn Web chuyên nghiệp khi chương trình soạn Web không
cho phép soạn unicode trực tiếp. Hiện nay nhiều người dùng NCR Decimal trong chương
trình Yahoo Chat để trao đổi tiếng Việt có dấu.
X UTF-8: dạng đặc biệt để soạn unicode trong các chương trình vốn xuất xứ từ môi
trường Unix, Linux như Emacs, gVim.
3. Sử dụng bộ gõ Unikey:
3.1. Hướng dẫn sử dụng bộ gõ Unikey:
Nếu muốn gõ Tiếng Việt trên máy tính bằng Unikey bạn cần khởi động (chạy) phần
mềm. Khi đó phần mềm sẽ hiện thị một biểu tượng nhỏ dưới khay hệ thống. Để gõ được
tiếng Việt có dấu bạn cần chuyển phần mềm này sang chữ V, ngược lại muốn tắt chế độ
gõ có dấu bạn cần chuyển nó về chữ E. Bạn có thể chuyển chế độ này dễ dàng bằng cách
click chuột vào biểu tượng ở khay hệ thống hoặc dùng tổ hợp phím chuyển, mặc đình
là CTRL + SHIFT hoặc tổ hợp ALT + Z, bạn có thể lựa chọn phím chuyển phù hợp với
máy bằng cách lựa trên ngay trên giao diện phần mềm.
Unikey hỗ trợ nhiều kiểu gõ với bảng mã khác nhau. Thông dụng nhất hiện nay vẫn

là bảng mã Unicode với kiểu gõ Telex
Unicode là bảng mã chuẩn quốc tế được sử dụng rộng rãi nhất hiện nay, hiện đang
được hỗ trợ trên rất nhiều phần mềm cũng như các trình ứng dụng.
Để sử dụng Unikey gõ tiếng việt trên máy tính bạn khởi động phần mềm lên và thiết
lập ở mục Bảng mã (thường lựa chọn Unicode) và Kiểu gõ (Telex - tương ứng với bảng
mã) sau đó click Đóng là có thể gõ tiếng việt được rồi.

Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 24


Trường cao đẳng nghề Đồng Tháp ………………..…….Bài giảng Kỹ thuật bàn phím

Cách gõ tiếng Việt có dấu trong kiểu gõ Telex
Khi ấn các ký tự này trên bàn phím, trên khung soạn thảo sẽ tự động chuyển
- aa: â
- oo: ô
- ee: ê
- dd: đ
- ow: ơ
- w hoặc uw: ư
- s: dấu sắc
- f: dấu huyền
- r: dấu hỏi
- x: dấu ngã
- j: dấu nặng
- z: xóa dấu đã gõ trước đó ( tairz = tai; xóa dấu hỏi)
Ngoài ra bạn có thể tham khảo thêm cách viết Tiếng Việt có dấu theo kiểu gõ VNI :
a8: ă
a6: â
d9: đ

e6: ê
o6: ô
o7: ơ
u7: ư
1: dấu sắc
2: dấu huyền
3: dấu hỏi
4: dấu ngã
5: dấu nặng
0: xóa dấu

Biên soạn: Nguyễn Văn Phương …………………………………………….. Trang 25


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×