Tải bản đầy đủ (.pdf) (29 trang)

Tài liệu Ứng dụng Unicode trong website Việt pptx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (853.68 KB, 29 trang )

Các ӭng dөng Unicode trong web site tiӃng ViӋt 1
MӨC LӨC
Unicode cho chӳ ViӋt ......................................................................................................... 2
Bҧng ÿӕi chiӃu encoding các bӝ chӳ hiӋn hành vӟi Unicode............................................. 4
Thӱ nghiӋm font Unicode chӭa glyphs chӳ ViӋt................................................................ 8
Chѭѫng trình hoán chuyӇn trang web ViӋt ngӳ thành tiêu chuҭn Unicode........................ 9
Dùng Frontpage 98/ 2000 viӃt webpage Unicode ViӋt ngӳ ............................................. 10
Cách Dùng Unicode ĈӇ Gõ TiӃng ViӋt Trong MS-WORD............................................. 16
Cách chӑn Settings trong OutLook Express (IE 5) ÿӇ ÿӑc chӳ ViӋt
gӱi bҵng VoviMail hay NCR 18
Cách chӑn Settings trong OutLook 2000 ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR 22
Cách ÿánh chӳ ViӋt trong Hotmail ................................................................................... 26
Cách ÿánh chӳ ViӋt trong Yahoo! Mail............................................................................ 28
Các ӭng dөng Unicode trong web site tiӃng ViӋt 2
Unicode cho chӳ ViӋt
Unicode là mӝt cách dùng chӳ ViӋt theo tiêu chuҭn quӕc tӃ cho tin hӑc. Ðһc
ÿiӇm chính cӫa nó là ngѭӡi ta dùng 2 bytes (16 bits) cho mӛi mүu tӵ nhѭ ô,
ѫ, ă. Cho ÿӃn nay có nhiӅu bӝ chӳ ViӋt Nam nhѭ VISCII, VPS, VNI... vv…
ÿang ÿѭӑc dùng rҩt thӏnh hành trong nhiӅu áp dөng phҫn mӅm khác nhau.
VISCII là mӝt chuҭn cӫa nhóm khoa hӑc gia Tricholor. Trong chuҭn nҫy
mӛi mүu tӵÿѭӧc biӇu diӉn bҵng mӝt byte (8 bits). Nhóm Tricholor dùng
các con sӕ trӕng cӫa bӝ chӳ ASCII ( cӫa Mӻ - A là viӃt tҳt cho American,
trong khi VI cho Vietnamese) ÿӇ biӇu diӉn các chӳ ViӋt Nam có dҩu. Vì con
sӕ lӟn nhҩt có thӇ biӇu diӇn bҵng 1 byte là 255, ÿó chính là tәng sӕ mүu tӵ
ViӋt Nam tӕi ÿa ta có thӇ dùng ÿѭӧc bҩt cӭ lúc nào. Rҩt tiӃc chӳ ViӋt Nam
cҫn hѫn 255 mүu tӵ nên ngѭӡi ta phҧi ÿһt thêm bӝ chӳ Hoa (thí dө nhѭ
UHoàiH 1.1) hay thay thӃ các dҩu hiӋu ít dùng, nhѭ dҩu ngoһc kép, bҵng
nhӳng mүu tӵ ViӋt Nam cҫn phҧi có. Tӭc là hӉ muӕn có ÿҫy ÿӫ bӝ chӳ ViӋt
ta phҧi hy sinh vài dҩu hiӋu ít dùng cӫa bӝ chӳ ASCII.
Bӝ chӳ VPS cӫa Hӝi Vietnamese Professionals Society cNJng dùng cùng mӝt
nguyên tҳc nhѭ VISCII. Có ÿiӅu khác là vì VPS ÿѭӧc triӇn khai ӣ Pháp, nên


các khoa hӑc gia muӕn bҳt ÿҫu bҵng mӝt bӝ chӳ dùng cho tiӃng Pháp rӗi mӣ
mang thêm ÿӇ dùng cho chӳ ViӋt. Nói tóm lҥi, hai bӝ chӳ VISCII và VPS
khác nhau chӍӣ chӛ quy ѭӟc dùng con sӕ nào ÿӇ biӇu diӉn mӝt mүu tӵ ViӋt
Nam.
Ӣ ViӋt Nam có kiӇu chӳ .vnTimes rҩt thӏnh hành trên các trang Web. Các
khoa hӑc gia thiӃt kӃ kiӇu chӳ nҫy cNJng dùng mӝt nguyên tҳc giӕng nhѭ
trong VISCII và VPS. Nói mӝt cách khác, ta có thӇ dӏch (convert, map) tӯ
kiӇu chӳ nҫy qua kiӇu chӳ kia rҩt dӉ dàng vì có mӕi liên hӋ tӯng mүu tӵ mӝt
(one-to-one correspondence).
KiӇu chӳ VNI hѫi khác mӝt chút vì có nhiӅu chӛ ngѭӡi ta dùng 2 bytes ÿӇ
biӇu diӇn mӝt mүu tӵ. VNI là mӝt trong nhӳng bӝ chӳÿҫu tiên ÿѭӧc dùng
cho chӳ ViӋt trong tin hӑc. ÐiӅu ÿáng nói là sӵ thành công vӅ thѭѫng mҥi
cӫa VNI. Mһc dҫu muӕn ÿánh máy vӟi bӝ chӳ VNI ta phҧi trҧ tiӅn, công ty
VNI tích cӵc nhҩt trong viӋc triӇn khai các áp dөng phҫn mӅm cӫa VNI ÿӇ
phөc vө khách hàng. Trong khi ÿó các tә chӭc Tricholor và Vietnamese
Professionals Society là gӗm nhӳng khoa hӑc gia thiӋn nguyӋn, tҩt cҧÿӅu có
viӋc làm toàn thӡi gian nên công viӋc triӇn khai phҫn mӅm cho các bӝ chӳ
phҧi bӏ giӟi hҥn.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 3
Còn VietNet chҷng qua chӍ là mӝt quy ѭӟc vӅ cách dùng các mүu tӵ có sҹn
cӫa ASCII ÿӇ ÿánh tiӃng ViӋt. Nhӳng dҩu dùng cho các nguyên âm ÿѭӧc
ÿánh thêm, thí dө nhѭ chӳ "Ðѭa ÿón" ÿѭӧc ÿánh là "DDu+a ddón". Do ÿó,
nói cho ÿúng ra VietNet không phҧi là mӝt bӝ chӳ.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 4
Bҧng ÿӕi chiӃu encoding các bӝ chӳ hiӋn hành vӟi
Unicode
VIQR VPS
VPS
Hex
VISCII

VISCII
Hex
VNI
VNI
Hex
TCVN
TCVN
Hex
Unicode
Symbol
Unicode
Hex Dec
UTF-8 Hex
a' á E1 á E1 á
61
F9
¸ B8 á
00E1
225
C3 A1
a` à E0 à E0 à
61
F8
µ B5 à
00E0
224
C3 A0
a? ä E4 ä E4 ả
61
FB

¶ B6 ҧ
1EA3
7843
E1 BA A3
a~ ã E3 ã E3 ã
61
F5
· B7 ã
00E3
227
C3 A3
a. å E5 Õ D5 ạ
61
EF
¹ B9 ҥ
1EA1
7841
E1 BA A1
a( ỉ E6 å E5 ă
61
EA
¨ A8 ă
0103
259
C4 83
a(' ¡ A1 ¡ A1 ắ
61
E9
¾ BE ҳ
1EAF

7855
E1 BA AF
a(` ¢ A2 ¢ A2 ằ
61
E8
» BB ҵ
1EB1
7857
E1 BA B1
a(? £ A3 Ỉ C6 ẳ
61
FA
¼ BC ҷ
1EB3
7859
E1 BA B3
a(~ ¤ A4 Ç C7 ẵ
61
FC
½ BD ҹ
1EB5
7861
E1 BA B5
a(. ¥ A5 £ A3 ặ
61
EB
Ỉ C6 һ
1EB7
7863
E1 BA B7

a^ â E2 â E2 â
61
E2
© A9 â
00E2
226
C3 A2
a^' Ã C3 ¤ A4 ấ
61
Ê CA ҩ
1EA5
E1 BA A5
Các ӭng dөng Unicode trong web site tiӃng ViӋt 5
E1
7845
a^` À C0 ¥ A5 ầ
61
E0
Ç C7 ҫ
1EA7
7847
E1 BA A7
a^? Ä C4 ¦ A6 ẩ
61
E5
È C8 ҭ
1EA9
7849
E1 BA A9
a^~ Å C5 ç E7 ẫ

61
E3
É C9 ү
1EAB
7851
E1 BA AB
a^. Ỉ C6 § A7 ậ
61
E4
Ë CB ұ
1EAD
7853
E1 BA AD
e' é E9 é E9 é
65
F9
Ð D0 é
00E9
233
C3 A9
e` è E8 è E8 è
65
F8
Ì CC è
00E8
232
C3 A8
e? È C8 ë EB ẻ
65
FB

Ỵ CE ҿ
1EBB
7867
E1 BA BB
e~ ë EB ¨ A8 ẽ
65
F5
Ï CF Ӂ
1EBD
7869
E1 BA BD
e. Ë CB © A9 ẹ
65
EF
Đ D1 ҽ
1EB9
7865
E1 BA B9
e^ ê EA ê EA ê
65
E2
ª AA ê
00EA
234
C3 AA
e^' ‰ 89 ª AA ế
65
E1
Õ D5 Ӄ
1EBF

7871
E1 BA BF
e^` Š 8A « AB ề
65
E0
Ị D2 Ӆ
1EC1
7873
E1 BB 81
e^? ‹ 8B ¬ AC ể
65
E5
Ĩ D3 Ӈ
1EC3
7875
E1 BB 83
e^~ Í CD AD ễ
65
E3
Ơ D4 Ӊ
1EC5
7877
E1 BB 85
e^. Œ 8C ® AE ệ
65
E4
Ư D6 Ӌ
1EC7
7879
E1 BB 87

i' í ED í ED í ED Ý DD í
00ED
C3 AD
Các ӭng dөng Unicode trong web site tiӃng ViӋt 6
237
i` ì EC ì EC ì EC × D7 ì
00EC
236
C3 AC
i? Ì CC ï EF ỉ E6 Ø D8 Ӎ
1EC9
7881
E1 BB 89
i~ ï EF ỵ EE ó F3 Ü DC ƭ
0129
297
C4 A9
i. Ỵ CE ¸ B8 ò F2 Þ DE ӏ
1ECB
7883
E1 BB 8B
o' ó F3 ó F3 ó
6F
F9
ã E3 ó
00F3
243
C3 B3
o` ò F2 ò F2 ò
6F

F8
ß DF ò
00F2
242
C3 B2
o? Õ D5 ư F6 ỏ
6F
FB
á E1 ӓ
1ECF
7887
E1 BB 8F
o~ õ F5 õ F5 õ
6F
F5
â E2 õ
00F5
245
C3 B5
o. † 86 ÷ F7 ọ
6F
EF
ä E4 ӑ
1ECD
7885
E1 BB 8D
o^ ơ F4 ơ F4 ô
6F
E2
« AB ơ

00F4
244
C3 B4
o^' Ĩ D3 ¯ AF ố
6F
E1
è E8 ӕ
1ED1
7889
E1 BB 91
o^` Ị D2 ° B0 ồ
6F
E0
å E5 ӗ
1ED3
7891
E1 BB 93
o^? ° B0 ± B1 ổ
6F
E5
ỉ E6 ә
1ED5
7893
E1 BB 95
o^~ ‡ 87 ² B2 ỗ
6F
E3
ç E7 ӛ
1ED7
7895

E1 BB 97
o^. ¶ B6 µ B5 ộ
6F
E4
é E9 ӝ
1ED9
7897
E1 BB 99
o+ Ư D6 ½ BD ơ F4 ¬ AC ѫ
01A1
C6 A1
Các ӭng dөng Unicode trong web site tiӃng ViӋt 7
417
o+' § A7 ¾ BE ớ
F4
F9
í ED ӟ
1EDB
7899
E1 BB 9B
o+` © A9 ¶ B6 ờ
F4
F8
ê EA ӡ
1EDD
7901
E1 BB 9D
o+? ª AA · B7 ở
F4
FB

ë EB ӣ
1EDF
7903
E1 BB 9F
o+~ « AB Þ DE ỡ
F4
F5
ì EC ӥ
1EE1
7905
E1 BB A1
o+. ® AE þ FE ợ
F4
EF
ỵ EE ӧ
1EE3
7907
E1 BB A3
u'</Fon
Các ӭng dөng Unicode trong web site tiӃng ViӋt 8
Thӱ nghiӋm font Unicode chӭa glyphs chӳ ViӋt
Font-
Family:
Tahoma
Font-
Size:
5
Font-
Weight:
Nor mal

Khi bҥn thay ÿәi font trong
combo box: Font-Family,
Font-Size hay Font-Weight,
văn bҧn trong khung bên phҧi
cNJng sӁ thay ÿәi và dùng theo
font bҥn chӑn. Bҥn sӁ không
ÿӑc ÿѭӧc chӳ ViӋt nӃu font
bҥn chӑn không chӭa mүu tӵ
glyphs Unicode tiӃng ViӋt.
Trang web này giúp bҥn lӵa
ra nhӳng font Unicode trong
máy cӫa bҥn, font nào có thӇ
sӱ dөng ÿӇ trình bày Unicode
chӳ ViӋt và font nào không
thӇ dùng ÿӇ trình bày
Unicode chӳ ViӋt.
Font chӳ trong khung này thay
ÿәi theo thӇ Font trong combo
box bên trái Ðây là font chӳ
trong mӝt phҫn cӫa mӝt câu.
NӃu font chӳ nào không có
glyphs mүu tӵ chӳ ViӋt thì bҥn sӁ
không ÿӑc ÿѭѫc chӳ ViӋt mà chӍ
thҩy ô vuông.
Bҥn có thӇ dùng phѭѫng tiӋn này
ÿӇ set Default font ѭa chuӝng
cho browser ÿang dùng cӫa bҥn.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 9
Chѭѫng trình hoán chuyӇn trang web ViӋt ngӳ
thành tiêu chuҭn Unicode

NӃu bҥn ÿã có mӝt mҥng ÿiӇm ÿѭӧc viӃt bҵng mӝt trong các mã tiêu chuҭn
ViӋt ngӳ sau ÿây: Viscii, VPS, VNI và .vnTime và bҥn muӕn biӃn toàn bӝ
mҥng ÿiӇm cӫa bҥn thành tiêu chuҭn Unicode thì ÿây ÿúng là chѭѫng trình
bҥn cҫn dùng.
Chѭѫng trình VNtoUnicode có thӇ chuyӇn các trang web ViӋt ngӳ trong mӝt
folder hay directory thành trang web ViӋt ngӳ Unicode. Các mã tiêu chuҭn
ViӋt ngӳÿѭӧc hӛ trӧ gӗm Viscii, VPS, VNI và .vnTime nhѭng bҥn có thӇ
nӟi rӝng hӛ trӧ cho các tiêu chuҭn khác bҵng cách thêm chúng vào mã lұp
trình. Chѭѫng trình này ÿѭӧc viӃt bҵng Microsoft Visual Basic 6.0, do tiӃn
sƭ Lê Ðӭc Hӗng thӵc hiӋn và tҩt cҧ các mã lұp trình và bҧng mүu chuyӉn mã
ÿӅu ÿѭӧc gói trong hӗ sѫ vntounicode.zip ÿӇ bҥn download.
Mӛi tiêu chuҭn ÿӅu có mӝt bҧng mã hoán chuyӇn (mapping table) nhѭ
VNItoUnicode.txt, VISCIItoUnicode.txt, VPStoUnicode and
VNTimetoUnicode. Bҥn có thӇ thêm bҧng mã ÿӕi chiӃu khác cho mã tiêu
chuҭn ViӋt ngӳ khác. Chѭѫng trình này chӫ yӃu làm 3 viӋc nhѭ sau:
x
ChuyӇn tҩt cҧ các cһp tӵ nhѭ "aù" thành Unicode tѭѫng ӭng.
x ChuyӇn tҩt cҧ tên Font thành "Tahoma".
x ChuyӇn mүu tӵ ViӋt thành mã sӕ Unicode.
Trong hӗ sѫ zip có chӭa các trang web mүu bҵng VPS, VNI, VISCII và
.vnTime vӟi các trang web Unicode mã sӕ và UTF-8 tѭѫng ӭng. Mӝt khi
bҥn ÿã có trang bҵng mã sӕ Unicode, thì bҥn có thӇ tiӃn thêm mӝt bѭӟc
chuyӇn trang Unicode mã sӕ thành trang web UTF-8. Vì chѭѫng trình này
làm viӋc theo tӯng nhóm trang web ÿѭӧc ÿһt trong mӝt folder nên tӕc ÿӝ
hoán chuyӇn sӁ tăng lên rҩt nhiӅu.
Bҥn có thӇ sӱa ÿәi mã lұp trình cӫa chѭѫng trình này ÿӇ sӱ dөng nhӳng Font
khác nhѭ Arial, Courier New, Times New Romans, Verdana... vân vân. Bҥn
cNJng có thӇ sӱa ÿәi mã lұp trình này ÿӇ tӵÿӝng hóa chѭѫng trình hoán
chuyӇn theo nhu cҫu cӫa bҥn. NӃu bҥn biӃn cҧi mã lұp trình này, chúng tôi
kǤ vӑng bҥn sӁ thông báo cho chúng tôi biӃt và gӱi cho chúng tôi mӝt bҧn

biӃn cҧi cӫa bҥn ÿӇ nhӳng sӵ thay ÿәi hӳu dөng khác có thӇÿѭӧc ÿѭa vào
trong các bҧn chѭѫng trình tѭѫng lai.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 10
Dùng Frontpage 98/ 2000
viӃt webpage Unicode ViӋt ngӳ
NӃu bҥn ÿang dùng Windows 2000 Professional/ Server thì bҥn có thӇ gõ
chӳ ViӋt Unicode (dùng các chѭѫng trình gõ chӳ ViӋt nhѭ VPS, VietKey,
VNI vv...) trong Notepad hay WordPad 2000 ÿӇ viӃt webpage chӳ ViӋt trӵc
tiӃp bҵng HTML.
Nhѭng nӃu bҥn ÿang dùng Windows 95.x hay Windows 98.x thì Fronpage là
công cө không thӇ thiӃu ÿѭӧc ÿӇ giúp bҥn viӃt webpage Unicode ViӋt ngӳ
mӝt cách dӉ dàng tiӋn lӧi. HiӋn nay (tháng Tѭ 2001) trên thӏ trѭӡng Web
Editors thì Frontpage 98/ 2000 là mӝt trong vài wysiwyg editors hӛ trӧ
Unicode.
Các web editors khác nhѭ Cold Fusion 4.x, Dreamweaver 4, Dreamweaver
UltraDev 4, NetOject Fusion 5 vân vân ÿӅu không hӛ trӧ Unicode. Dƭ nhiên
chúng ta vүn có thӇ dùng nhӳng web editors trên ÿӇ viӃt webpage ViӋt Ngӳ
nhѭng bҩt tiӋn ӣ chӛ là không ÿӑc ÿѭӧc tiӃng ViӋt và không thҩy ÿѭӧc lӛi
chính tҧÿӇ sӳa lӛi câu văn...
Bҥn có thӇ dùng các chѭѫng trình gõ chӳ ViӋt mӟi nhҩt cӫa VPS, VietKey,
VNI vân vân ÿӇ gõ chӳ ViӋt Unicode. Các chѭѫng trình trên có thӇ dùng
trong hҫu hӃt các ӭng dөng cӫa bӝ Office 97, Office 2000 và mӝt sӕӭng
dөng khác.
Trѭӟc kia Frontpage 97 và Frontpage 98 là chѭѫng trình ÿӝc lұp cӫa
Microsoft, nhѭng kӇ tӯ Frontpage 2000, Micorsoft ÿã nhұp nó vào thành
viên cӫa bӝ Office 2000. Tҩt cҧ các bӝ Frontpage nói trên ÿӅu hӛ trӧ
Unicode nhѭng dƭ nhiên là bӝ Frontpage 2000 là có hӛ trӧ Unicode ÿҫy ÿӫ
nhҩt.
Trong phҫn này chúng tôi chӍ bàn ÿӃn phҫn dùng Unicode cӫa Frontpage
2000 trong webpage ViӋt ngӳ và các bҥn có thӇ suy diӉn tӯ bӝ này cho bӝ

Frontpage 98.
Trong Frontpage 2000 bҥn có thӇ mӣ mӝt trang mӟi bҵng cách vào: File >
New > Page
Sau khi mӝt trang mӟi ÿã ÿѭӧc mӣ ra sҹn sàng cho bҥn ÿѭa dӳ liӋu và hình
ҧnh trang trí vào thì trong phҫn góc dѭӟi bên trái cӫa Window chánh View/
Các ӭng dөng Unicode trong web site tiӃng ViӋt 11
Page bҥn sӁ thҩy có 3 tab chӑn lӵa sau ÿây: Normal, HTML, Preview. Tóm
tҳc cách dùng cӫa 3 tabs này nhѭ sau:
N ormal: cho phép bҥn nhìn wysiwyg cӫa trang web bҥn ÿang làm viӋc và
cho bҥn sӱa chӳa tùy ý trang web này.
HTML: bҥn ÿӑc thҩy toàn bӝ tag nӝi HTML cӫa trang và có thӇ sӱa chӳa
trang web bҵng HTML tag nhѭ bҥn làm viӋc trên trang web khi mӣ bҵng
NotePad.
Preview: bҥn chӍ nhìn thҩy wysiwyg cӫa trang web nhѭng không sӱa ÿѭӧc.
Sau khi gõ vào tab N ormal ÿӇ có thӇ biên soҥn trang web, bҥn nhҩp chuӝt
phҧi trong bҩt kǤ chӛ nào trong trang web ÿӇ cho ra popup menu rӗi chӑn
Page Properties..., mӝt window nhѭ sau hiӋn lên:
Tҩt cҧ các setting ÿӇ sӱ dөng Unicode cho mӑi trang web ÿӅu nҵm trong tab
Language nên bҥn gõ vào Language tab ÿӇ thҩy window sau:

×