Tải bản đầy đủ (.doc) (15 trang)

TÔI LẤY ĐƯỢC NÓ RỒI, LÀM GÌ VỚI NÓ ĐÂY?

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (199.25 KB, 15 trang )

Website: Email : Tel (: 0918.775.368
TÔI LẤY ĐƯỢC NÓ RỒI,
LÀM GÌ VỚI NÓ ĐÂY?
Trong chương này
 Ảo ảnh của các loại đam mê
 Năm cách để nén file, và làm thế nào để trả lại tình trạng cũ cho nó
 Các hình ảnh được số hoá, dành cho, à, những người yêu thích nghệ
thuật
 FTP bằng thư
B
ây giờ bạn đã biết cách dùng FTP và RCP, bạn có lẽ đã lấy hàng ngàn tỉ file
(vâng, có thể là ba hay bốn). Nhưng khi bạn nhìn chúng bằng trình soạn thảo văn
bản của mình, bạn có thể để ý rằng chúng chỉ là rác rến. Trong chương này, chúng
ta xem xét nhiều loại file khác nhau trên Net, làm thế nào để biết chúng là gì, và
làm gì với chúng.
Có bao nhiêu loại file?
ít nhất là hàng trăm. May mắn là chúng rơi vào một số phân loại.
Các file văn bản
Các file văn bản chứa văn bản có thể đọc được (Bạn nghĩ nó là cái gì?). Đôi
khi văn bản thực sự là văn bản nhân-loại-đọc-được (giống như bản thảo cuốn sách
này mà tôi đã gõ nó vào dưới dạng các file văn bản). Đôi khi văn bản là các mã
nguồn chương trình máy tính bằng các ngôn ngữ như C hay Pascal. Và thảng hoặc,
văn bản cũng là các dữ liệu cho các chương trình. Dữ liệu cho máy in Postcript là
một loại file văn bản đặc biệt sẽ được thảo luận sau trong chương này.
Các file thi hành được
Các file thi hành được là các chương trình thật sự mà bạn có thể chạy được
trên máy tính. Các chương trình thi hành được rất thường thấy ở những nơi chứa đồ
vớ vẩn là dành cho các máy PC và Mac. Một vài chương trình thi hành được cũng
có trên mạng cho các loại máy tính khác, như là các trạm làm việc.
Các file lưu trữ và nén
1


Website: Email : Tel (: 0918.775.368
Thông thường một chương trình trọn gói nào đó gồm một mớ các file liên
quan với nhau. Để dễ gởi gói này đi các nơi, các file có thể được gom lại với nhau
thành một file đơn giản gọi là một archive (Vâng, thuật ngữ archive cũng là nói
đến một máy chủ mà bạn có thể FTP đồ vớ vẩn từ đó. Xin lỗi. Cứ kiện tôi đi. ít
nhất trong chương này archive có nghĩa là nhiều file). Sau khi bạn lấy được một
archive, bạn dùng một chương trình giải lưu trữ (unarchiving program) để lấy ra
các file nguyên gốc.
Một vài file cũng được nén, nghĩa là chúng được mã hoá theo một cách đặc
biệt để ít chiếm chỗ hơn nhưng cũng chỉ có thể được giải mã bằng bộ giải mã
tương ứng. Phần lớn các file bạn lấy theo kiểu FTP vô danh là được nén bởi vì các
file nén dùng ít không gian đĩa hơn và mất ít thời gian để chuyển trên Net. Trong
thế giới PC, việc lưu trữ và nén thường đi cùng nhau, sử dụng các tiện ích như
PKZIP. Tuy nhiên, trong thế giới trạm làm việc, hai thủ tục luôn được thực hiện
riêng biệt - các chương trình tar hoặc cpio làm việc lưu trữ, các chương trình
compress, pack hay gzip làm việc nén.
Các file dữ liệu
Một vài file thì không phải là loại văn bản, thi hành được, lưu trữ, hay nén.
Không biết thuật ngữ nào tốt hơn nên tôi coi chúng là các file dữ liệu. Các chương
trình thường đi cùng với các file dữ liệu mà chương trình sử dụng. Các chương
trình Microsoft Windows thường đi cùng với các dữ liệu như file giúp đỡ.
Loại file dữ liệu bạn thường thấy nhất trên Net là các hình ảnh, phần lớn là
dạng hình GIF hoặc JPEG được số hoá. Trên Net cũng thấy ngày càng nhiều các
phim số hoá dạng GL và MPEG.
Thỉnh thoảng bạn cũng có thể thấy các file xử lý văn bản được định dạng để
dùng với các chương trình như WordPerfect và Microsoft Word. Nếu bạn gặp một
trong những file này và không có truy xuất đến chương trình xử lý văn bản tương
ứng, bạn luôn có thể nạp chúng vào một trình xử lý văn bản để thấy phần văn bản
trong file trà trộn với những thứ linh tinh không in được đại diện cho thông tin định
dạng. Cố lên thì bạn cũng có thể chỉnh xoá những ký tự linh tinh để khôi phục lại

2
Website: Email : Tel (: 0918.775.368
phần văn bản. Các chương trình xử lý văn bản thường dùng nhất trên Net, tuy già
nhưng vẫn còn phục vụ tốt là TexX và troff. Cả hai đều nhận các thông tin nhập
như là các file văn bản thuần túy với các lệnh định dạng ở dạng văn bản, giống như
sau:
\begin {quote}
Your mother wears army boots.
\end {quote}
Nếu bạn muốn biết thêm về TeX, xem nhóm tin tức USENET là
comp.text.tex. Các phiên bản không mất tiền có trên hầu hết các máy, được mô tả
trong một thông điệp hàng tháng trên các nhóm tin tức. Troff thường được phân
phối cùng với các hệ UNIX; xem comp.text.tex
Chỉ là văn bản dạng thô
Không có gì nhiều để nói về các file văn bản - bạn sẽ biết chúng khi bạn thấy
chúng. Như đã nói trong chương 16, cách lưu chứa văn bản trong các hệ thống
khác nhau thì khác nhau, thành ra bạn nên FTP các file văn bản trong chế độ ASCII
để tự động chuyển chúng thành dạng thức cục bộ của bạn.
Nếu bạn gặp một file văn bản bắt đầu hơi giống như sau, thì bạn đã gặp một
file tài liệu Postcript:
%!PS-Adobe-2.0
%%Title: Some Random Document
%%CreationDate: Thu Jul 5 1990
/pl transform 0.1 sub round 0.1 add exch
0.1 sub round 0.1 add exch transform bind def
Một tài liệu Postcript thật sự là một chương trình viết trên ngôn ngữ máy
tính Postcript mô tả một tài liệu. Trừ phi bạn là một thần dân Postcript tầm cỡ thế
giới, điều duy nhất có ý nghĩa đối với một tài liệu như thế là chạy chương trình và
xem tài liệu. Cách thông thường để làm điều đó là gởi nó đến một máy in Postcript.
Các trình thông dịch Postcript, chẳng hạn GNU Ghostscript (xem chương 18), cũng

có sẵn và có thể chuyển Postcript thành các dạng thức màn hình và máy in khác.
3
Website: Email : Tel (: 0918.775.368
Một vài tài liệu văn bản thật sự lại là các file lưu trữ hoặc phi văn bản. Xem
phần thảo luận về các file shar và uuencoded trong phần sau của chương này.
Có yêu cầu cuối cùng nào không trước khi chúng tôi thi hành bạn?
Các chương trình thi hành được thường thấy nhất là cho DOS và Windows.
Các file này có tên file như FOOG.EXE, FOOG.COM hoặc (đôi khi for windows)
FOOG.DLL. Bạn chạy chúng cũng giống như chạy các chương trình DOS và
Windows khác.
Luôn có cơ hội cho các chương trình Mac hay PC mới bị nhiễm virus máy
tính. (bởi vì hệ thống làm việc theo cách thức khác, ít có khả năng là các file trên
các trạm làm việc có thể chứa virus). Những thư vớ vẩn từ các kho lưu trữ chạy tốt
như SIMTEL-20 và wuarchive (xem chi tiết ở chương 18) thì khó bị nhiễm; nhưng
nếu bạn chạy một chương trình ngẫu nhiên từ một chỗ ngẫu nhiên, có nhận hậu quả
gì thì cũng phải thôi. Tôi không định bài xích gì về vấn đề an toàn phần mềm ở đây
- Để biết thêm chi tiết, xem quyển DOS dành cho những người không chuyên và
Mac dành cho những người không chuyên.
Các chương trình thi hành được trên các trạm làm việc có các tên file không
dễ nhận ra, mặc dù file nào chứa tên file là dấu chấm thì hầu như là không thi hành
được. Mặc dù hầu như tất cả các loại trạm làm việc đều chạy UNIX, các file thi
hành được thì không thể trao đổi qua lại được. Ví dụ, mã chương trình cho một
máy SPARC không chạy trên IBM RS/6000, hoặc ngược lại. Nhiều phiên bản
UNIX khác nhau chạy trên các PC 386, với các dạng thức thi hành được khác nhau.
Nói chung các phiên bản UNIX mới hơn trên PC chạy được các file thi hành được
của các phiên bản cũ, nhưng điều ngược lại thì không được.
Đóng gói nó
Nếu bạn lấy nhiều file từ Net, bạn phải học cách bung các thứ đó ra. Ba loại
chương trình nén là
 compress

 gzip
 ZIP
4
Website: Email : Tel (: 0918.775.368
Nén cổ điển
Trở lại năm 1975, một gã tên là Terry Welch xuất bản một bài viết về một sơ
đồ nén mới mà anh vừa phát minh ra. Một vài thảo chương viên UNIX thực hiện
nó thành chương trình compress, và nó nhanh chóng trở thành chương trình nén
chuẩn. Bây giờ thì có nhiều chương trình nén tốt hơn, nhưng chương trình
compression vẫn là chuẩn.
Bạn có thể nhận ra một chương trình được nén vì tên nó tận cùng là .Z. Bạn
khôi phục file gốc bằng một chương trình uncompress (thật sự là cùng chương
trình như compress nhưng chạy trong một chế độ khác), như trong ví dụ sau:
uncompress blurfle.Z
Lệnh này từ giã blurfle.Z và thay thế nó bằng file blurfle ban đầu. Đôi khi
chương trình giải nén không có, và bạn có thể làm tương đương như thế:
compress -d blurfle.Z
Trên các PC, Các file nén thường có tên tận cùng bằng .Z, như
BLURFLE.TAZ. Một phiên bản tương thích UNIX của compress cũng có trên
archive SIMTEL trong thư mục /msdos/compress tên là COMP430D.ZIP.(Bạn cần
phải UNZIP nó, xem phần "ZIP nó lại" ở phần sau của chương này). Thường các
file UNIX được lưu trữ và nén với các tên như blurfle.tar.Z. Trong trường hợp đó,
đầu tiên bạn phải giải nén để có file blurfle.tar rồi mới giải lưu trữ (unarchive).
Nếu bạn muốn xem những gì trong một file nén mà không cần phải giải nén
nó, bạn có thể dùng zcat, vốn gởi một bản giải nén của những gì nó nhận được ra
màn hình. File nào đủ lớn để nén thường dài hơn một màn hình, nên bạn cũng nên
chạy cùng với nó một chương trình phân trang như more:
zcat blurfle.Z | more
Điều đó hiển nhiên một cách hiển nhiên
Đôi điều mà người viết chương trình nén không nhận ra là Welch chỉ đưa ra

sơ đồ nén, anh ta cũng có sở hữu bằng phát minh đó. (Có hai gã khác ở IBM cũng
phát minh ra cùng một sơ đồ đó một cách độc lập và cũng có bằng phát minh như
thế. Điều này đúng ra không được phép vì chỉ có người phát minh đầu tiên là được
5
Website: Email : Tel (: 0918.775.368
có bằng. Nhưng các bằng phát minh đó thật sự là có). UNISYS, công ty thuê
Welch, đã nói nhiều lần là một ngày nào đó nó sẽ bắt đầu thu tiền sử dụng sơ đồ
này trên các chương trình nén.
Thành ra Viện Phần mềm Miễn phí, vốn đang thực hiện một dự án phần
mềm miễn phí GNU, đã viết gzip, dùng các giải thuật 100% chưa được cấp bằng
phát minh. Các file được gzip tận cùng bằng .gz và được giải nén bằng lệnh gunzip:
gunzip blurfle.gz
Sự việc đi đến chỗ là mặc dù việc nén của compress được cấp bằng phát
minh, không ai buồn đăng ký phát minh về kỹ thuật giải nén, thành ra gunzip cũng
làm việc giải nén các file .Z của compress cũng như một số dạng có sớm hơn và ít
dùng rộng rãi hơn. Nó còn có thể giải nén một archive ZIP miễn là chỉ có một file
trong đó. Nếu bạn có một file nén bí ẩn, thử dùng gunzip và xem nó ra sao. Cũng
có chương trình gcat, giống như zcat, gởi thông tin kết xuất ra màn hình. Thành ra
cách tốt nhất để biết bên trong một file bí ẩn là đưa vào câu lệnh sau:
gcat mysteryfile | more
Phiên bản trên UNIX của gzip và gunzip cũng có trên các file GNU ở
ftp.uu.net và nơi khác, và phiên bản trên DOS có ở chỗ SIMTEL (xem chương 18)
tên là GZIP123.ZIP ở /msdos/compress
ZIP nó lại
Chương trình nén và lưu trữ thường dùng nhất trên DOS là chương trình
chia sẻ (shareware) PKZIP. Các file được zip tận cùng bằng .ZIP và có thể được
giải nén và giải lưu trữ bằng PKUNZIP, có ở SIMTEL cũng như hầu hết các BBS
trên thế giới.
Các chương trình zip và unzip tương thích với UNIX gọi là zip và unzip (tác
giả của chúng là những thảo chương viên sáng tạo chứ không phải là những người

đặt tên sáng tạo) cũng có ở ftp.uu.net và những nơi khác. Khi có vấn đề về phần
mềm chia sẻ như PKUNZIP, đã có phiên bản trên DOS của unzip trên UNIX, mặc
dù chúng chỉ nhanh bằng một nửa PKUNZIP.
Những phần mềm lưu trữ khác
6

×