Tải bản đầy đủ (.pdf) (29 trang)

đề tài nghiên cứu khoa học cấp nhà nước Các ứng dụng Unicode trong web site tiếng việt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (853.68 KB, 29 trang )

Các ӭng dөng Unicode trong web site tiӃng ViӋt 1
MӨC LӨC
Unicode cho chӳ ViӋt 2
Bҧng ÿӕi chiӃu encoding các bӝ chӳ hiӋn hành vӟi Unicode 4
Thӱ nghiӋm font Unicode chӭa glyphs chӳ ViӋt 8
Chѭѫng trình hoán chuyӇn trang web ViӋt ngӳ thành tiêu chuҭn Unicode 9
Dùng Frontpage 98/ 2000 viӃt webpage Unicode ViӋt ngӳ 10
Cách Dùng Unicode ĈӇ Gõ TiӃng ViӋt Trong MS-WORD 16
Cách chӑn Settings trong OutLook Express (IE 5) ÿӇ ÿӑc chӳ ViӋt
gӱi bҵng VoviMail hay NCR 18
Cách chӑn Settings trong OutLook 2000 ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR 22
Cách ÿánh chӳ ViӋt trong Hotmail 26
Cách ÿánh chӳ ViӋt trong Yahoo! Mail 28
Các ӭng dөng Unicode trong web site tiӃng ViӋt 2
Unicode cho chӳ ViӋt
Unicode là mӝt cách dùng chӳ ViӋt theo tiêu chuҭn quӕc tӃ cho tin hӑc. Ðһc
ÿiӇm chính cӫa nó là ngѭӡi ta dùng 2 bytes (16 bits) cho mӛi mүu tӵ nhѭ ô,
ѫ, ă. Cho ÿӃn nay có nhiӅu bӝ chӳ ViӋt Nam nhѭ VISCII, VPS, VNI vv…
ÿang ÿѭӑc dùng rҩt thӏnh hành trong nhiӅu áp dөng phҫn mӅm khác nhau.
VISCII là mӝt chuҭn cӫa nhóm khoa hӑc gia Tricholor. Trong chuҭn nҫy
mӛi mүu tӵÿѭӧc biӇu diӉn bҵng mӝt byte (8 bits). Nhóm Tricholor dùng
các con sӕ trӕng cӫa bӝ chӳ ASCII ( cӫa Mӻ - A là viӃt tҳt cho American,
trong khi VI cho Vietnamese) ÿӇ biӇu diӉn các chӳ ViӋt Nam có dҩu. Vì con
sӕ lӟn nhҩt có thӇ biӇu diӇn bҵng 1 byte là 255, ÿó chính là tәng sӕ mүu tӵ
ViӋt Nam tӕi ÿa ta có thӇ dùng ÿѭӧc bҩt cӭ lúc nào. Rҩt tiӃc chӳ ViӋt Nam
cҫn hѫn 255 mүu tӵ nên ngѭӡi ta phҧi ÿһt thêm bӝ chӳ Hoa (thí dө nhѭ
UHoàiH 1.1) hay thay thӃ các dҩu hiӋu ít dùng, nhѭ dҩu ngoһc kép, bҵng
nhӳng mүu tӵ ViӋt Nam cҫn phҧi có. Tӭc là hӉ muӕn có ÿҫy ÿӫ bӝ chӳ ViӋt
ta phҧi hy sinh vài dҩu hiӋu ít dùng cӫa bӝ chӳ ASCII.
Bӝ chӳ VPS cӫa Hӝi Vietnamese Professionals Society cNJng dùng cùng mӝt
nguyên tҳc nhѭ VISCII. Có ÿiӅu khác là vì VPS ÿѭӧc triӇn khai ӣ Pháp, nên


các khoa hӑc gia muӕn bҳt ÿҫu bҵng mӝt bӝ chӳ dùng cho tiӃng Pháp rӗi mӣ
mang thêm ÿӇ dùng cho chӳ ViӋt. Nói tóm lҥi, hai bӝ chӳ VISCII và VPS
khác nhau chӍӣ chӛ quy ѭӟc dùng con sӕ nào ÿӇ biӇu diӉn mӝt mүu tӵ ViӋt
Nam.
Ӣ ViӋt Nam có kiӇu chӳ .vnTimes rҩt thӏnh hành trên các trang Web. Các
khoa hӑc gia thiӃt kӃ kiӇu chӳ nҫy cNJng dùng mӝt nguyên tҳc giӕng nhѭ
trong VISCII và VPS. Nói mӝt cách khác, ta có thӇ dӏch (convert, map) tӯ
kiӇu chӳ nҫy qua kiӇu chӳ kia rҩt dӉ dàng vì có mӕi liên hӋ tӯng mүu tӵ mӝt
(one-to-one correspondence).
KiӇu chӳ VNI hѫi khác mӝt chút vì có nhiӅu chӛ ngѭӡi ta dùng 2 bytes ÿӇ
biӇu diӇn mӝt mүu tӵ. VNI là mӝt trong nhӳng bӝ chӳÿҫu tiên ÿѭӧc dùng
cho chӳ ViӋt trong tin hӑc. ÐiӅu ÿáng nói là sӵ thành công vӅ thѭѫng mҥi
cӫa VNI. Mһc dҫu muӕn ÿánh máy vӟi bӝ chӳ VNI ta phҧi trҧ tiӅn, công ty
VNI tích cӵc nhҩt trong viӋc triӇn khai các áp dөng phҫn mӅm cӫa VNI ÿӇ
phөc vө khách hàng. Trong khi ÿó các tә chӭc Tricholor và Vietnamese
Professionals Society là gӗm nhӳng khoa hӑc gia thiӋn nguyӋn, tҩt cҧÿӅu có
viӋc làm toàn thӡi gian nên công viӋc triӇn khai phҫn mӅm cho các bӝ chӳ
phҧi bӏ giӟi hҥn.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 3
Còn VietNet chҷng qua chӍ là mӝt quy ѭӟc vӅ cách dùng các mүu tӵ có sҹn
cӫa ASCII ÿӇ ÿánh tiӃng ViӋt. Nhӳng dҩu dùng cho các nguyên âm ÿѭӧc
ÿánh thêm, thí dө nhѭ chӳ "Ðѭa ÿón" ÿѭӧc ÿánh là "DDu+a ddón". Do ÿó,
nói cho ÿúng ra VietNet không phҧi là mӝt bӝ chӳ.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 4
Bҧng ÿӕi chiӃu encoding các bӝ chӳ hiӋn hành vӟi
Unicode
VIQR VPS
VPS
Hex
VISCII

VISCII
Hex
VNI
VNI
Hex
TCVN
TCVN
Hex
Unicode
Symbol
Unicode
Hex Dec
UTF-8 Hex
a' á E1 á E1 á
61
F9
¸ B8 á
00E1
225
C3 A1
a` à E0 à E0 à
61
F8
µ B5 à
00E0
224
C3 A0
a? ä E4 ä E4 ả
61
FB

¶ B6 ҧ
1EA3
7843
E1 BA A3
a~ ã E3 ã E3 ã
61
F5
· B7 ã
00E3
227
C3 A3
a. å E5 Õ D5 ạ
61
EF
¹ B9 ҥ
1EA1
7841
E1 BA A1
a( ỉ E6 å E5 ă
61
EA
¨ A8 ă
0103
259
C4 83
a(' ¡ A1 ¡ A1 ắ
61
E9
¾ BE ҳ
1EAF

7855
E1 BA AF
a(` ¢ A2 ¢ A2 ằ
61
E8
» BB ҵ
1EB1
7857
E1 BA B1
a(? £ A3 Ỉ C6 ẳ
61
FA
¼ BC ҷ
1EB3
7859
E1 BA B3
a(~ ¤ A4 Ç C7 ẵ
61
FC
½ BD ҹ
1EB5
7861
E1 BA B5
a(. ¥ A5 £ A3 ặ
61
EB
Ỉ C6 һ
1EB7
7863
E1 BA B7

a^ â E2 â E2 â
61
E2
© A9 â
00E2
226
C3 A2
a^' Ã C3 ¤ A4 ấ
61
Ê CA ҩ
1EA5
E1 BA A5
Các ӭng dөng Unicode trong web site tiӃng ViӋt 5
E1
7845
a^` À C0 ¥ A5 ầ
61
E0
Ç C7 ҫ
1EA7
7847
E1 BA A7
a^? Ä C4 ¦ A6 ẩ
61
E5
È C8 ҭ
1EA9
7849
E1 BA A9
a^~ Å C5 ç E7 ẫ

61
E3
É C9 ү
1EAB
7851
E1 BA AB
a^. Ỉ C6 § A7 ậ
61
E4
Ë CB ұ
1EAD
7853
E1 BA AD
e' é E9 é E9 é
65
F9
Ð D0 é
00E9
233
C3 A9
e` è E8 è E8 è
65
F8
Ì CC è
00E8
232
C3 A8
e? È C8 ë EB ẻ
65
FB

Ỵ CE ҿ
1EBB
7867
E1 BA BB
e~ ë EB ¨ A8 ẽ
65
F5
Ï CF Ӂ
1EBD
7869
E1 BA BD
e. Ë CB © A9 ẹ
65
EF
Đ D1 ҽ
1EB9
7865
E1 BA B9
e^ ê EA ê EA ê
65
E2
ª AA ê
00EA
234
C3 AA
e^' ‰ 89 ª AA ế
65
E1
Õ D5 Ӄ
1EBF

7871
E1 BA BF
e^` Š 8A « AB ề
65
E0
Ị D2 Ӆ
1EC1
7873
E1 BB 81
e^? ‹ 8B ¬ AC ể
65
E5
Ĩ D3 Ӈ
1EC3
7875
E1 BB 83
e^~ Í CD AD ễ
65
E3
Ơ D4 Ӊ
1EC5
7877
E1 BB 85
e^. Œ 8C ® AE ệ
65
E4
Ư D6 Ӌ
1EC7
7879
E1 BB 87

i' í ED í ED í ED Ý DD í
00ED
C3 AD
Các ӭng dөng Unicode trong web site tiӃng ViӋt 6
237
i` ì EC ì EC ì EC × D7 ì
00EC
236
C3 AC
i? Ì CC ï EF ỉ E6 Ø D8 Ӎ
1EC9
7881
E1 BB 89
i~ ï EF ỵ EE ó F3 Ü DC ƭ
0129
297
C4 A9
i. Ỵ CE ¸ B8 ò F2 Þ DE ӏ
1ECB
7883
E1 BB 8B
o' ó F3 ó F3 ó
6F
F9
ã E3 ó
00F3
243
C3 B3
o` ò F2 ò F2 ò
6F

F8
ß DF ò
00F2
242
C3 B2
o? Õ D5 ư F6 ỏ
6F
FB
á E1 ӓ
1ECF
7887
E1 BB 8F
o~ õ F5 õ F5 õ
6F
F5
â E2 õ
00F5
245
C3 B5
o. † 86 ÷ F7 ọ
6F
EF
ä E4 ӑ
1ECD
7885
E1 BB 8D
o^ ơ F4 ơ F4 ô
6F
E2
« AB ơ

00F4
244
C3 B4
o^' Ĩ D3 ¯ AF ố
6F
E1
è E8 ӕ
1ED1
7889
E1 BB 91
o^` Ị D2 ° B0 ồ
6F
E0
å E5 ӗ
1ED3
7891
E1 BB 93
o^? ° B0 ± B1 ổ
6F
E5
ỉ E6 ә
1ED5
7893
E1 BB 95
o^~ ‡ 87 ² B2 ỗ
6F
E3
ç E7 ӛ
1ED7
7895

E1 BB 97
o^. ¶ B6 µ B5 ộ
6F
E4
é E9 ӝ
1ED9
7897
E1 BB 99
o+ Ư D6 ½ BD ơ F4 ¬ AC ѫ
01A1
C6 A1
Các ӭng dөng Unicode trong web site tiӃng ViӋt 7
417
o+' § A7 ¾ BE ớ
F4
F9
í ED ӟ
1EDB
7899
E1 BB 9B
o+` © A9 ¶ B6 ờ
F4
F8
ê EA ӡ
1EDD
7901
E1 BB 9D
o+? ª AA · B7 ở
F4
FB

ë EB ӣ
1EDF
7903
E1 BB 9F
o+~ « AB Þ DE ỡ
F4
F5
ì EC ӥ
1EE1
7905
E1 BB A1
o+. ® AE þ FE ợ
F4
EF
ỵ EE ӧ
1EE3
7907
E1 BB A3
u'</Fon
Các ӭng dөng Unicode trong web site tiӃng ViӋt 8
Thӱ nghiӋm font Unicode chӭa glyphs chӳ ViӋt
Font-
Family:
Tahoma
Font-
Size:
5
Font-
Weight:
Norma l

Khi bҥn thay ÿәi font trong
combo box: Font-Family,
Font-Size hay Font-Weight,
văn bҧn trong khung bên phҧi
cNJng sӁ thay ÿәi và dùng theo
font bҥn chӑn. Bҥn sӁ không
ÿӑc ÿѭӧc chӳ ViӋt nӃu font
bҥn chӑn không chӭa mүu tӵ
glyphs Unicode tiӃng ViӋt.
Trang web này giúp bҥn lӵa
ra nhӳng font Unicode trong
máy cӫa bҥn, font nào có thӇ
sӱ dөng ÿӇ trình bày Unicode
chӳ ViӋt và font nào không
thӇ dùng ÿӇ trình bày
Unicode chӳ ViӋt.
Font chӳ trong khung này thay
ÿәi theo thӇ Font trong combo
box bên trái Ðây là font chӳ
trong mӝt phҫn cӫa mӝt câu.
NӃu font chӳ nào không có
glyphs mүu tӵ chӳ ViӋt thì bҥn sӁ
không ÿӑc ÿѭѫc chӳ ViӋt mà chӍ
thҩy ô vuông.
Bҥn có thӇ dùng phѭѫng tiӋn này
ÿӇ set Default font ѭa chuӝng
cho browser ÿang dùng cӫa bҥn.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 9
Chѭѫng trình hoán chuyӇn trang web ViӋt ngӳ
thành tiêu chuҭn Unicode

NӃu bҥn ÿã có mӝt mҥng ÿiӇm ÿѭӧc viӃt bҵng mӝt trong các mã tiêu chuҭn
ViӋt ngӳ sau ÿây: Viscii, VPS, VNI và .vnTime và bҥn muӕn biӃn toàn bӝ
mҥng ÿiӇm cӫa bҥn thành tiêu chuҭn Unicode thì ÿây ÿúng là chѭѫng trình
bҥn cҫn dùng.
Chѭѫng trình VNtoUnicode có thӇ chuyӇn các trang web ViӋt ngӳ trong mӝt
folder hay directory thành trang web ViӋt ngӳ Unicode. Các mã tiêu chuҭn
ViӋt ngӳÿѭӧc hӛ trӧ gӗm Viscii, VPS, VNI và .vnTime nhѭng bҥn có thӇ
nӟi rӝng hӛ trӧ cho các tiêu chuҭn khác bҵng cách thêm chúng vào mã lұp
trình. Chѭѫng trình này ÿѭӧc viӃt bҵng Microsoft Visual Basic 6.0, do tiӃn
sƭ Lê Ðӭc Hӗng thӵc hiӋn và tҩt cҧ các mã lұp trình và bҧng mүu chuyӉn mã
ÿӅu ÿѭӧc gói trong hӗ sѫ vntounicode.zip ÿӇ bҥn download.
Mӛi tiêu chuҭn ÿӅu có mӝt bҧng mã hoán chuyӇn (mapping table) nhѭ
VNItoUnicode.txt, VISCIItoUnicode.txt, VPStoUnicode and
VNTimetoUnicode. Bҥn có thӇ thêm bҧng mã ÿӕi chiӃu khác cho mã tiêu
chuҭn ViӋt ngӳ khác. Chѭѫng trình này chӫ yӃu làm 3 viӋc nhѭ sau:
x
ChuyӇn tҩt cҧ các cһp tӵ nhѭ "aù" thành Unicode tѭѫng ӭng.
x ChuyӇn tҩt cҧ tên Font thành "Tahoma".
x ChuyӇn mүu tӵ ViӋt thành mã sӕ Unicode.
Trong hӗ sѫ zip có chӭa các trang web mүu bҵng VPS, VNI, VISCII và
.vnTime vӟi các trang web Unicode mã sӕ và UTF-8 tѭѫng ӭng. Mӝt khi
bҥn ÿã có trang bҵng mã sӕ Unicode, thì bҥn có thӇ tiӃn thêm mӝt bѭӟc
chuyӇn trang Unicode mã sӕ thành trang web UTF-8. Vì chѭѫng trình này
làm viӋc theo tӯng nhóm trang web ÿѭӧc ÿһt trong mӝt folder nên tӕc ÿӝ
hoán chuyӇn sӁ tăng lên rҩt nhiӅu.
Bҥn có thӇ sӱa ÿәi mã lұp trình cӫa chѭѫng trình này ÿӇ sӱ dөng nhӳng Font
khác nhѭ Arial, Courier New, Times New Romans, Verdana vân vân. Bҥn
cNJng có thӇ sӱa ÿәi mã lұp trình này ÿӇ tӵÿӝng hóa chѭѫng trình hoán
chuyӇn theo nhu cҫu cӫa bҥn. NӃu bҥn biӃn cҧi mã lұp trình này, chúng tôi
kǤ vӑng bҥn sӁ thông báo cho chúng tôi biӃt và gӱi cho chúng tôi mӝt bҧn

biӃn cҧi cӫa bҥn ÿӇ nhӳng sӵ thay ÿәi hӳu dөng khác có thӇÿѭӧc ÿѭa vào
trong các bҧn chѭѫng trình tѭѫng lai.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 10
Dùng Frontpage 98/ 2000
viӃt webpage Unicode ViӋt ngӳ
NӃu bҥn ÿang dùng Windows 2000 Professional/ Server thì bҥn có thӇ gõ
chӳ ViӋt Unicode (dùng các chѭѫng trình gõ chӳ ViӋt nhѭ VPS, VietKey,
VNI vv ) trong Notepad hay WordPad 2000 ÿӇ viӃt webpage chӳ ViӋt trӵc
tiӃp bҵng HTML.
Nhѭng nӃu bҥn ÿang dùng Windows 95.x hay Windows 98.x thì Fronpage là
công cө không thӇ thiӃu ÿѭӧc ÿӇ giúp bҥn viӃt webpage Unicode ViӋt ngӳ
mӝt cách dӉ dàng tiӋn lӧi. HiӋn nay (tháng Tѭ 2001) trên thӏ trѭӡng Web
Editors thì Frontpage 98/ 2000 là mӝt trong vài wysiwyg editors hӛ trӧ
Unicode.
Các web editors khác nhѭ Cold Fusion 4.x, Dreamweaver 4, Dreamweaver
UltraDev 4, NetOject Fusion 5 vân vân ÿӅu không hӛ trӧ Unicode. Dƭ nhiên
chúng ta vүn có thӇ dùng nhӳng web editors trên ÿӇ viӃt webpage ViӋt Ngӳ
nhѭng bҩt tiӋn ӣ chӛ là không ÿӑc ÿѭӧc tiӃng ViӋt và không thҩy ÿѭӧc lӛi
chính tҧÿӇ sӳa lӛi câu văn
Bҥn có thӇ dùng các chѭѫng trình gõ chӳ ViӋt mӟi nhҩt cӫa VPS, VietKey,
VNI vân vân ÿӇ gõ chӳ ViӋt Unicode. Các chѭѫng trình trên có thӇ dùng
trong hҫu hӃt các ӭng dөng cӫa bӝ Office 97, Office 2000 và mӝt sӕӭng
dөng khác.
Trѭӟc kia Frontpage 97 và Frontpage 98 là chѭѫng trình ÿӝc lұp cӫa
Microsoft, nhѭng kӇ tӯ Frontpage 2000, Micorsoft ÿã nhұp nó vào thành
viên cӫa bӝ Office 2000. Tҩt cҧ các bӝ Frontpage nói trên ÿӅu hӛ trӧ
Unicode nhѭng dƭ nhiên là bӝ Frontpage 2000 là có hӛ trӧ Unicode ÿҫy ÿӫ
nhҩt.
Trong phҫn này chúng tôi chӍ bàn ÿӃn phҫn dùng Unicode cӫa Frontpage
2000 trong webpage ViӋt ngӳ và các bҥn có thӇ suy diӉn tӯ bӝ này cho bӝ

Frontpage 98.
Trong Frontpage 2000 bҥn có thӇ mӣ mӝt trang mӟi bҵng cách vào: File >
New > Page
Sau khi mӝt trang mӟi ÿã ÿѭӧc mӣ ra sҹn sàng cho bҥn ÿѭa dӳ liӋu và hình
ҧnh trang trí vào thì trong phҫn góc dѭӟi bên trái cӫa Window chánh View/
Các ӭng dөng Unicode trong web site tiӃng ViӋt 11
Page bҥn sӁ thҩy có 3 tab chӑn lӵa sau ÿây: Normal, HTML, Preview. Tóm
tҳc cách dùng cӫa 3 tabs này nhѭ sau:
Normal: cho phép bҥn nhìn wysiwyg cӫa trang web bҥn ÿang làm viӋc và
cho bҥn sӱa chӳa tùy ý trang web này.
HTML: bҥn ÿӑc thҩy toàn bӝ tag nӝi HTML cӫa trang và có thӇ sӱa chӳa
trang web bҵng HTML tag nhѭ bҥn làm viӋc trên trang web khi mӣ bҵng
NotePad.
Preview: bҥn chӍ nhìn thҩy wysiwyg cӫa trang web nhѭng không sӱa ÿѭӧc.
Sau khi gõ vào tab Normal ÿӇ có thӇ biên soҥn trang web, bҥn nhҩp chuӝt
phҧi trong bҩt kǤ chӛ nào trong trang web ÿӇ cho ra popup menu rӗi chӑn
Page Properties , mӝt window nhѭ sau hiӋn lên:
Tҩt cҧ các setting ÿӇ sӱ dөng Unicode cho mӑi trang web ÿӅu nҵm trong tab
Language nên bҥn gõ vào Language tab ÿӇ thҩy window sau:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 12
Tùy theo cách setting cӫa bҥn ÿһt trong Tools/ Web Setting, Page Properties/
Language sӁ hiӋn lên khác nhau. Hình trên là cách setting cӫa các trang
trong Vovisoft ÿӇ sӱ dөng Unicode NCR và phҫn setting trên sӁ tӵÿӝng viӃt
cho bҥn hàng meta tag sau (meta tag có chӳÿұm) trong phҫn Heading tag
cӫa trang:
<head>
<meta http-equiv=
"Content-Type" content="text/html;
charset=windows-1252"
>

<meta name=
"GENERATOR" content="Microsoft FrontPage 4.0">
<meta name=
"ProgId" content="FrontPage.Editor.Document">
<title>
Using Unicode in Frontpage 2000</title>
</head>
NӃu bҥn chӑn Vietnamese trong combo box (Mark current document as:)
nhѭ hình sau:
thì bҥn sӁ có thêm hàng meta tag nhѭ sau:
<meta http-equiv="Content-Language" content="vi">
Các ӭng dөng Unicode trong web site tiӃng ViӋt 13
Chӳ "vi" trong content="vi" là ký hiӋu tҳt (short string) cӫa locale ID Vietnam.
NӃu bҥn muӕn tìm hiӇu thêm vӅ các ký hiӋu tҳt locale ID dùng cho ngôn
ngӳ các quӕc gia thì
gõ vào ÿây. Meta tag này dùng xác ÿӏnh ngôn ngӳÿѭӧc
dùng trong trang web ÿӇ Frontpage ӭng dөng ÿúng phҫn mӅm kiӇm tra ÿánh
vҫn và giúp các Search Engine xác ÿӏnh ngôn ngӳÿѭӧc dùng trong trang
web mà nó ÿang lөc tìm.
Hàng meta tag vӅ locale theo bút giҧ là không cҫn thiӃt cho các trang sӱ
dөng Unicode cho tiӃng ViӋt nhѭ các trang web trong Vovisoft. Tuy nhiên
nӃu dùng locale Vietnam (Vietnamese Windows) theo Microsoft và dùng
codepage 1258 cho tiӃng ViӋt thì meta tag này sӁ giúp cho nhӳng ai ÿã set
trong browser sӱ dөng Vietnamese 1258 có thӇ chҥy thҷng vào các trang
dùng Vietnamese 1258 cӫa mҥng có ÿa ngôn ngӳ mà tiӃng ViӋt là mӝt trong
các ngôn ngӳÿѭӧc ӭng dөng. ÐiӅu ÿáng chú ý là code page 1258 không
phҧi là mã Unicode vì có mӝt sӕ mã ÿiӇm (code points) không xӃp theo tӵ vӏ
trong giҧi sӕ Unicode.
Nói tóm lҥi bҥn set Language Tab trong Page Properties cӫa Frontpage 2000
nhѭ sau nӃu dùng Unicode NCR:

Page Language
Mark current document as: <none>
HTML encoding
Save the document as: US/Western European (codepage 1252)
Reload the current document as: <Automatic Encoding>
và set Language Tab trong Page Properties cӫa Frontpage 2000 nhѭ sau nӃu
dùng Unicode UTF-8:
Page Language
Mark current document as: <none>
HTML encoding
Save the document as: Multilingual (UTF-8)
Reload the current document as: <Automatic Encoding>
Bҥn sӁ thҩy trong phҫn Header tag cӫa trang có phҫn meta tag sau:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
Mӝt ÿiӅu ÿӝc ÿáo cӫa Frontpage 2000 là bҥn có thӇ chuyӇn ÿәi tӯ NCR
thành UTF-8 hay ngѭӧc lҥi mӝt cách dӉ dàng bҵng cách set
charset=1252
thành
charset=utf-8 hay ngѭӧc lҥi rӗi "Save" trang web là bҥn có ngay mã Unicode
NCR hay UTF-8. Có lҿ cho ÿӃn giӡ cNJng chѭa có chѭѫng trình Web Editor
nào xӱ lý Unicode nhuyӉn nhѭ Frontpage 2000.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 14
NCR là mӝt phѭѫng pháp biӇu hiӋn Unicode bҵng tӵ vӏ trong giҧi sӕ ký tӵ
Unicode 16 bit còn UTF-8 là mӝt cách mã cӕt bҵng 8 bit cӫa Unicode. NӃu
bҥn chѭa rõ thӃ nào là Unicode NCR và thӃ nào là UTF-8 thì mӡi bҥn
gõ vào
ÿây.
NӃu bҥn chӍ dùng Frontpage 2000 ÿӇ viӃt website ViӋt ngӳ bҵng Unicode
thôi thì bҥn có thӇ set luôn cho trang mӟi default cӫa Frontpage 2000 có
charset là 1252 hoһc UTF-8. Bҥn vào Tools/ Web settings và trong hӝp

Window hiӋn lên, bҥn chӑn tab Language rӗi trong:
Server message language: chӑn English
Default page encoding: chӑn US/Western European
Rӗi nhҩn vào nút OK. Tӯ giӡ trӣÿi cӭ mӛi lҫn bҥn mӣ mӝt trang Frontpage
mӟi ÿӇ viӃt bài thì trang mӟi ÿó ÿã có sҹn hàng meta tag sau:
<meta http-equiv="Content-Type" content="text/html; charset=windows-
1252"
>
ÿӇ bҥn gõ Unicode chӳ ViӋt theo Decimal NCR.
NӃu bҥn muӕn dùng UTF-8 thì trong:
Default page encoding: chӑn Multilingual (UTF-8)
và khi mӣ mӝt trang mӟi bҥn sӁ có sҹn meta tag sau:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 15
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
Sau khi set sҹn các phҫn trên, bҥn chӍ còn mӝt ÿiӇm nên lѭu ý ÿó là luôn áp
dөng font: Tahoma, Arial, Times New Roman vv vào tҩt cҧ text ViӋt ngӳ
vì nӃu không sӁ có browser (ÿã set sҹn nhӳng fonts default không chӭa
glyphs chӳ ViӋt) không ÿӑc ÿѭӧc Unicode ViӋt ngӳ cӫa bҥn.
Ghi chú:
Các bҧn Internet Explorer 4.x trӣ vӅ sau ÿӅu có thӇ trình bày ÿúng Unicode
theo NCR hay UTF-8 khi ÿһt ÿúng charset theo dҥng cӫa nó nhѭng Netscape
4.x thì chӍ có thӇ hiӇn thӏ Unicode ÿúng nӃu trang web ÿѭӧc mã theo UTF-8.
NӃu bҥn muӕn cҧ hai browsers trên ÿӅu có thӇ hiӇn thӏÿѭӧc trang web ViӋt
ngӳ cӫa bҥn thì bҥn nên dùng UTF-8 cho các trang web ViӋt ngӳ.
Mӝt ÿiӇm lҥ nӳa là theo mӝt sӕ báo cáo và theo kinh nghiӋm cӫa bút giҧ thì
Netscape 4.x có thӇ hiӇn thӏÿѭӧc Unicode mã theo NCR vӟi ÿiӅu kiӋn là
meta tag phҧi set theo:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
Nhѭ vұy có nghƭa là Netscape 4.x ÿã xem UTF-8 nhѭ mӝt code page (giӕng nhѭ các codepages: 1251,
1252 1258 vân vân ) chӭ không phҧi là mӝt dҥng mã Unicode 8 bit nhѭng qua Netscape 6.x thì ÿiӅu này ÿã

ÿѭӧc chӍnh lҥi.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 16
Cách Dùng Unicode ĈӇ Gõ TiӃng ViӋt
Trong MS-WORD
ThiӃt KӃ MS-WORD Template:
1. Vào Tools \ Options \ File Location tab ÿӇ xem biӃt directory cӫa
Startup files.
2. Ra khӓi MS-WORD và copy vnunicode.dot vào directory cӫa startup
files. Thѭӡng thѭӡng directory này là C:\Windows\Application
Data\Microsoft\Word\Startup\
3. Mӣ MS-WORD trӣ lҥi và vào Tools \ Templates and Add-Ins và
check [check box] cӫa
vnunicode.dot
nӃu cҫn.
4. HiӋn giӡ nên dùng font Tahoma cho bҧo ÿҧm. Bҥn có thӇ vào Format
\ Styles ÿӇ set Tahoma làm default font. Trong tѭѫng lai có thӇ dùng
các fonts khác nhѭ Arial, Times New Roman, v…v…
5. NӃu muӕn thì vào Tools \ Auto Correct và uncheck hӃt tҩt cҧ các
check boxes ÿӇ MS-Word khӓi tӵÿӝng ÿәi nhӳng chӳ nhѭ i thành I
(ÿây là mӝt feature có thӇ rҩt phiӅn phӭc hѫn là ích lӧi).
Cách Ĉánh Dҩu:
Dùng các nút bҩm sau ÿây ÿӇ ÿánh dҩu trѭӟc khi bҩm nút nguyên âm.
Dҩu
Nút Bҩm Trѭӟc Khi Bҩm
Nút Nguyên Âm
Thí Dө
Sҳc Ctrl + 1
á : Ctrl + 1, A
Á : Ctrl + 1, Shift + A
HuyӅn Ctrl + 2

à : Ctrl + 2 , A
À : Ctrl + 2 , Shift+A
Hӓi Ctrl + 3
ҧ : Ctrl + 3 , A
Ҧ : Ctrl + 3 , Shift+A
Ngã Ctrl + 4
ã : Ctrl + 4 , A
à : Ctrl + 4 , Shift+A
Nһng Ctrl + 5
ҥ : Ctrl + 5 , A
Ҥ : Ctrl + 5 , Shift+A
 ê ô Ctrl + 6
â : Ctrl + 6 , A
 : Ctrl + 6 , Shift+A
Các ӭng dөng Unicode trong web site tiӃng ViӋt 17
Ă Ctrl + 7
ă : Ctrl + 7 , A
Ă : Ctrl + 7, Shift+A
Ѭѭ Ctrl + 8
ѭ : Ctrl + 8 , A
Ѭ : Ctrl + 8 , Shift+U
Ð Ctrl + 9
ÿ : Ctrl + 9 , D
Ð : Ctrl + 9 , Shift+D
ҩӃӕ Atl + 1
ҩ : Alt + 1 , A
Ҩ : Alt + 1 , shift+A
ҫӅӗ Atl + 2
ҫ : Alt + 2 , A
Ҫ : Alt + 2 , shift+A

ҭӇә Alt + 3
ҭ : Alt + 3 , A
Ҭ : Alt + 3 , Shift+A
үӉӛ Alt + 4
ү : Alt + 4 , A
Ү : Alt + 4 , Shift+A
ұӋӝ Alt + 5
ұ : Alt + 5 , A
Ұ : Alt + 5 , Shift+A
ҳӟӭ Ctrl + Alt + 1
ҳ : Ctrl+Alt + 1 , A
Ҳ : Ctrl+Alt + 1 , Shift+A
ҵӡӯ Ctrl + Alt + 2
ҵ : Ctrl+Alt + 2 , A
Ҷ : Ctrl+Alt + 2 , Shift+A
ҷӣӱ Ctrl + Alt + 3
ҷ : Ctrl+Alt + 3 , A
Ҷ : Ctrl+Alt + 3 , Shift+A
ҹӥӳ Ctrl + Alt + 4
ҹ : Ctrl+Alt + 4 , A
Ҹ : Ctrl+Alt + 4 ,Shift+A
һӧӵ Ctrl + Alt + 5
һ : Ctrl+Alt + 5 , A
Һ : Ctrl+Alt + 5 , Shift+A
Nói tóm lҥi:
1. ÿánh dҩu trѭӟc, nguyên âm sau.
2. dùng Ctrl cho dҩu ÿѫn, Alt cho ô hay â vӟi dҩu và Ctrl + Alt cho ѭ
hay ѫ vӟi dҩu
Các ӭng dөng Unicode trong web site tiӃng ViӋt 18
Cách chӑn Settings trong OutLook Express (IE 5)

ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR
Các bҥn sӱ dөng OutLook Express cӫa IE 5x ÿӇ nhұn email có thӇ chӑn các
settings cӫa OutLook Express nhѭ sau ÿӇ có thӇÿӑc ÿѭӧc chӳ ViӋt Unicode:
Trên Menu cӫa OutLook Express gõ vào Tools - Options - Read ÿӇ mӣ tab
box sau ÿây:
Hình 1
Gõ vào nút Fonts trong phҫn Fonts cӫa (hình 1) ÿӇ mӣ dialogue sau ÿây:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 19
Hình 2
Trong phҫn [Font settings] chӑn Western European nhѭ hình trên
Trong phҫn Proportional font chӑn Tahoma nhѭ hình trên
Trong phҫn Encoding chӑn Western European (windows) nhѭ hình trên
Gõ vào nút [Set as Default] rӗi gõ vào nút OK ÿӇ ÿóng dialogue trên lҥi
Gõ vào nút International settings trong (hình 1) ÿӇ mӣ dialogue sau ÿây:
Hình 3
Dialogue trên cho thҩy Western European (Windows) là Default encoding
cӫa OutLook Express
Các ӭng dөng Unicode trong web site tiӃng ViӋt 20
NӃu muӕn dùng OutLook Express ÿӇ gӱi email chӳ ViӋt thì có thӇ set nhѭ
sau:
Trong phҫn tab Send cӫa dialogue sau ÿây, gõ vào nút International
Settings
Hình 4
Trong phҫn Default encoding cӫa dialogue sau ÿây chӑn Western European
(Windows)
Hình 5
Các ӭng dөng Unicode trong web site tiӃng ViӋt 21
Gõ vào nút OK ÿӇ ÿóng dialogue trên lҥi
Trong hình 4 trên gõ vào nút HTML ÿӇ mӣ dialogue sau ÿây:
Hình 6

Trong phҫn [Encode text using] chӑn None rӗi gõ nút OK ÿӇ ÿóng dialogue
lҥi
Các phҫn khác giӳ nguyên nhѭ default cӫa nó.
Bҥn có thӇ dùng chѭѫng trình ÿánh chӳ ViӋt nhѭ Vps 4.0 ÿӇ ÿánh chӳ ViӋt
trong Outlook Express. Bҥn vô phҫn tab Kӻ Thuұt - Bҧng Mã - Bҧng Sӱa
Mã cӫa Vps và chӑn :Unicode ÿӇ chӍ thӏ cho Vps dùng mã chӳ Unicode khi
ÿánh chӳ ViӋt. Tuy nhiên nӃu bҥn không muӕn nhӭc ÿҫu vӅ các setting khi
gӱi ÿiӋn thѭ thì bҥn có thӇ dùng ngay
VoviMail ÿӇ ÿánh chӳ ViӋt mà không cҫn
chҥy mӝt chѭѫng trình bên ngoài.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 22
Cách chӑn Settings trong OutLook 2000
ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR
Các bҥn sӱ dөng OutLook 2000 ÿӇ nhұn email có thӇ chӑn các settings cӫa
OutLook nhѭ sau ÿӇ có thӇÿӑc ÿѭӧc chӳ ViӋt Unicode:
Trên Menu cӫa OutLook gõ vào Tools - Options - Mail Format ÿӇ mӣ tab
box sau ÿây:
Hình 1
Trong [Send in this message format] cӫa (hình 1) chӑn HTML nhѭ hình
trên
Gõ vào nút Settings ÿӇ mӣ dialogue sau ÿây:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 23
Hình 2
Trong phҫn [Encode text using] cӫa (hình 2) chӑn None nhѭ hình trên rӗi gõ
nút OK
Gõ vào nút International Options cӫa (hình 1) ÿӇ mӣ dialogue sau ÿây:
Hình 3
Chӑn Western European (Windows) cho cҧ hai combo box nhѭ hình trên
Trong phҫn Stationery and Fonts trong (hình 1), gõ vào nút Fonts ÿӇ mӣ
dialogue sau ÿây:

Các ӭng dөng Unicode trong web site tiӃng ViӋt 24
Hình 4
Trong phҫn Message Fonts cӫa dialogue trên chӑn font Tahoma cho cҧ hai
phҫn:
When composing a new message (NӃu bҥn muӕn chuyӇn Email bҵng chӳ
ViӋt)
when replying and forwarding (NӃu bҥn muӕn chuyӇn Email bҵng chӳ ViӋt)
Gõ vào nút Fonts cӫa phҫn Stationery and Fonts trong (hình 1) ÿӇ mӣ ra
dialogue sau ÿây:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 25
Hình 5
Trong phҫn Font settings chӑn Western European nhѭ hình 5
Trong phҫn Proportional font chӑn Tahoma nhѭ hình 5
Các phҫn còn lҥi cӭ giӳ nguyên nhѭ default cӫa OutLook
Cách chӑn setting nhѭ trên sӁ cho phép bҥn ÿӑc ÿѭӧc chӳ ViӋt Unicode
ÿӗng thӡi ÿiӋn thѭ gӳi trҧ lӡi cNJng sӁ chuyӇn chӳ ViӋt ÿúng cho ngѭӡi nhұn.
Bҥn có thӇ dùng chѭѫng trình ÿánh chӳ ViӋt nhѭ Vps 4.0 ÿӇ ÿánh chӳ ViӋt
trong Outlook 2000. Bҥn vô phҫn tab Kӻ Thuұt - Bҧng Mã - Bҧng Sӱa Mã
cӫa Vps và chӑn :Unicode ÿӇ chӍ thӏ cho Vps dùng mã chӳ Unicode khi
ÿánh chӳ ViӋt. Tuy nhiên nӃu bҥn không muӕn nhӭc ÿҫu vӅ các setting khi
gӱi ÿiӋn thѭ thì bҥn có thӇ dùng ngay
VoviMail ÿӇ ÿánh chӳ ViӋt mà không cҫn
chҥy mӝt chѭѫng trình bên ngoài.
ÐiӅu kiӋn cҫn có ÿӇ viӃt và ÿӑc Unicode:
Operating system: Windows 95.bx, 98.x, 98 Me, NT4, Windows 2000
Professional, Windows 2000 Server and up
Browser: IE 4.x and IE 5.x., NE 6x, Netscape còn gһp nhiӅu trӣ ngҥi vӅ xӱ
lý Unicode.

×