Tải bản đầy đủ (.doc) (8 trang)

Download - Những thủ thuật đáng giá

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (108.07 KB, 8 trang )

Download - Những thủ thuật đáng giá
10/08/2006
Download hay tải về tập tin (file) từ Internet là một nhu cầu không thể thiếu của "cư dân mạng". Đã
xa lắm rồi cái thời dial-up là cách duy nhất giúp người ta đến với Internet mà việc lướt web cũng
còn khó chứ nói chi tới tải về file dung lượng lớn. Hiện nay, download trở nên nhanh chóng hơn rất
nhiều, nhờ dịch vụ Internet tốc độ cao như ADSL đã trở nên phổ biến, cùng sự trợ giúp của các
phần mềm hỗ trợ download... Những thiết bị giải trí "hi-tech" như máy nghe nhạc MP3, xem phim
MP4, PDA... khiến nhu cầu download nhạc, phim, phần mềm, game... tăng lên từng ngày.
PHƯƠNG PHÁP TẢI VỀ
Ta có thể chia làm hai phương pháp download: chọn từng file và chọn hàng loạt nhiều file.
Chọn từng file
Đó là cách mà phần lớn người duyệt web sử dụng vì chỉ cần nhấn chuột phải vào liên kết rồi chọn
Save Target As. Dù vậy, cách này cũng lắm "trắc trở" như dễ mất liên kết (link), nhầm lẫn, thậm
chí cho dù có thêm phần mềm hỗ trợ, bạn cũng phải tốn không ít thời gian, công sức nếu tải nhiều
file và hiệu quả rất thấp khi cần tải số lượng lớn file ảnh nén (dung lượng nhỏ). Tuy nhiên khi tải
file từ một số dịch vụ chia sẻ như megaupload, rapidshare, yousendit... chúng ta chỉ có thể chọn
phương pháp này vì họ không cho dùng phần mềm hỗ trợ download nếu chỉ có tài khoản miễn phí
(hiện có các loại phần mềm tăng tốc dành riêng cho một dịch vụ hay keygen dùng để tạo tài khoản
thương mại,, nhưng chúng dễ dàng bị nhà cung cấp dịch vụ vô hiệu hóa và đó là hành động trái
phép nên tác giả xin được bỏ qua).
Bạn hẳn sẽ ngạc nghiên nếu biết rằng hầu hết chúng ta đều đã rất lãng phí khi sử dụng Internet
Explorer (IE): sau khi nghe hết một bài hát, xem xong một file flash... rồi mới tính đến chuyện
download file! Chúng ta không cần phải làm vậy, sự thực trình duyệt web có một nhiệm vụ chính là
tự động tải tất cả các file cần thiết để trình diễn hoàn chỉnh trước mắt người sử dụng dưới dạng
một trang web (điều này thể hiện rất rõ trong thanh Status Bar), tất nhiên trong đó có cả những file
bạn cần. Hãy để ý tới công cụ chơi nhạc Windows Media, được tích hợp trong các trang nhạc trực
tuyến, thường hiển thị Buffering: **% (dữ liệu đệm) rồi
Downloading... ** % (** là số phần trăm). Đã bao giờ bạn tự hỏi file được tải về nằm ở đâu? Câu
trả lời là vào thư mục C:Documents and Settings ên người sử dụngLocal SettingsTemporary
Internet Files với Windows XP hoặc C:Windows với Windows 9x (C là phân vùng cài hệ điều hành)
và tất nhiên có thể lấy các file ngay từ folder này.


Điểm đáng nói là bạn không nhất thiết phải đợi bài hát tự chạy hết, kéo nút trượt sẽ kết thúc nhanh
hơn, ngoài ra các file có thể bị xóa bất cứ lúc nào, hãy sao chép ngay khi chúng xuất hiện (nên
refresh thường xuyên). Tên file gốc trong Temporary Internet Files sẽ bị thay đổi chút ít lúc bạn
copy file sang thư mục khác (phần cuối có thêm [1] và nếu có dấu cách thì nó biến thành %20,
hiện tượng này không xảy ra khi sử dụng các phần mềm hỗ trợ download).
Chúng ta cũng có thể mở nhanh trong IE: chọn ToolsInternet Options trong tab Genenal nhấn nút
Settings ở dưới dòng "Delete temporary file, history, cookies, saved passwords, and web form
infomation", trong hộp thoại Temporary Internet Files and History Settings nhấn nút View Files
(hoặc View Trusted Files trong IE 7). Tất cả các file được tự động tải về đều nằm ở đây, bạn dễ
dàng tìm ra file cần dùng dựa trên phần mở rộng của các file.
Ngoài ra nếu muốn dùng cách này thường xuyên, bạn có thể thay đổi vị trí mặc định lưu file để tiện
cho việc quản lý. Ta cũng nên thay đổi dung lượng tối đa của thư mục cho phù hợp vì các file nằm
ở đây là các file tạm (temporary file) nên các file cũ sẽ bị xóa để nhường chỗ cho file mới khi tổng
dung lượng thư mục vượt qua ngưỡng giới hạn được thiết lập.
Bạn sợ tốn đĩa ư? Xin đừng lo vì mỗi khi chúng ta chạy Disk Cleanup tất cả file tạm có thể được
xóa hết. Đây là một cách làm thông dụng nên nếu muốn bảo vệ sự riêng tư thì cũng trong Internet
Options bạn mở tab Advanced, đánh dấu kiểm vào ô "Empty Temporary Internet Files folder when
browser is closed" ở phần Security để tự động làm trống thư mục sau khi duyệt web xong.
Nếu có thể dùng phần mềm hỗ trợ download tất nhiên tốc độ sẽ cao hơn rất nhiều, nhưng việc đó
không phải lúc nào cũng dễ dàng. Xin lấy ví dụ với các file video giới thiệu cuộc thi hoa hậu thế
giới lần thứ 54-55 (2004-2005) trên website www.missworld.tv (không cần nói cũng biết, khi cuộc
thi diễn ra thì số lượng người dùng trên toàn thế giới đổ dồn tải về các đoạn phim này rất lớn và
các nhà quản trị thường không cho sử dụng phần mềm hỗ trợ download).
Ngay liên kết tới trang web con dù sử dụng javascript, cũng không phải là vấn đề chính, khi xem
phim trong Windows Media Player bạn vẫn có thể nhấn chuột phải, chọn Properties và copy liên
kết ở phần Location (Hình-6). Nhiều người cũng áp dụng "tuyệt chiêu" thông dụng trên nhưng
đành thất vọng, mặc dù trông rất giống với liên kết video bình thường

nhưng khi dùng link này, phần mềm hỗ trợ chỉ tải về những file nhỏ xíu có phần mở rộng .WVX.
Xin đừng buồn, hãy làm cách trên một lần nữa với file bé hạt tiêu này, nó sẽ chỉ đường cho bạn

đấy. Thật vậy, lần này ta mới có liên kết thực
mms://gwmod10.streamos.com/wm10/74/48/7448d74769d79f7ba86319c75a7c2343-437dba1f.asf?
ts=1141812305&ttl=300&cs=CBE9CBBC4195BFDDDEFE837C11E13830FE3CD0C7. Vâng, trong
ví dụ này họ đã sử dụng file dạng WVX làm trung gian và khi có được liên kết thực trong tay, chỉ
cần dùng một phần mềm download hỗ trợ giao thức MMS (Microsoft Media Server) là chỉ chốc lát
bạn đã có trong tay những đoạn phim hấp dẫn này.
Chức năng khám phá website (có nhiều cách gọi khác nhau: Site Explorer trong Flashget và
NetTransport, Site Manager trong Internet Download Accelerator, hoặc FTP Browser trong
Download Accelerator Plus và Mass Downloader...) cũng khá hữu ích. Chỉ cần nhập địa chỉ vào
dòng URL (có thể cả thông tin đăng nhập nếu cần) và phần mềm sẽ tự động dò ra các file cho bạn
chọn lựa (Hình-8). "Thật đơn giản!", có người sẽ thốt lên như vậy, nhưng không đâu, như bạn
thường thấy, những trang web ngày nay đẹp và lộng lẫy hơn xưa, để có được điều này các nhà
xây dựng (website) phải sử dụng khá nhiều file flash, hình ảnh có định dạng khác nhau cũng như
các liên kết dày đặc... nhưng chức năng khám phá website lại thể hiện thật khô khan dưới dạng
danh sách file, liên kết, mà không phải là giao diện đồ họa trực quan với những chỉ dẫn bắt mắt
thường thấy khi duyệt web. Chưa kể hành động này có nhiều điểm tương đồng với việc do thám
mà tin tặc vẫn thường sử dụng, nên bạn cũng đừng ngạc nhiên khi một số website từ chối tất cả
các liên kết mà phần mềm yêu cầu từ tính năng này.
CHỌN HÀNG LOẠT FILE
Phương pháp này thích hợp cho số lượng file lớn, được áp dụng với các website chuyên nghiệp
và được chia làm hai kiểu:
1.Tải hàng loạt chưa chọn lọc
Với một số phần mềm hỗ trợ tăng tốc dowload như Internet Download Accelerator 5.02 (IDA5.02),
Internet Download Manager 5.02 (IDM5.02) , Flashget 1.71, HiDowload 6.9 (HiD6.9)... ta có thể
khai thác tính năng Batch Download (hoặc Downloads Group trong IDA5.02) để tải hàng loạt file
khi chúng tuân theo một quy luật về chữ số. Phần giống nhau ở các liên kết được nhập vào dòng
URL, còn các biến là nhóm ký tự do phần mềm quy ước, với 4 chương trình trên lần lượt là $, *,
(*), riêng HiD6.9 không dùng ký tự đại diện mà tách riêng phần cuối của URL (cũng là đuôi của file
với liên kết thông thường) ra một ô khác. Nếu IDM5.02 và Flashget 1.71 cho phép xem trước một
số liên kết được tạo ra, HiD6.9 có thể chỉnh sửa danh sách khi đang xây dựng URL thì IDA5.02 lại

vượt trội nhờ khả năng tạo bước nhảy số thứ tự bằng thiết lập Step.
Xin lấy một ví dụ tập trung hầu hết những lỗi thường xảy ra: bạn có được liên kết sau
và nhận ra đây là file ảnh thứ 129 và có thể còn có
128 file nữa. Bạn không muốn mở từng trang web để lưu từng file một mà vẫn có được tất cả các
file ảnh cùng chủ đề, giả sử phần mềm Flashget được dùng. Hãy chọn Jobs Add batch download
trong hộp thoại Add batch job, gõ vào dòng URL và
From (từ) 1 to (đến) 150 chẳng hạn, dựa vào đó phần mềm sẽ tạo ra các link. Nhiều người cũng
sử dụng Batch Download như trên nhưng không thành công hoàn toàn.
Vì sao lại thất bại? Bởi vì họ tưởng đã biết tất cả về liên kết này. Sự thực không phải vậy, vẫn còn
một ẩn số cần tìm, đó là số các chữ số tối thiểu trong thứ tự được thêm vào tên file (wildcard
bytes). Trong ví dụ này chứa tới 3 trường hợp có thể xảy ra với một số file còn lại vì thông số
wildcard bytes có thể là 1, 2 hoặc 3. Bạn cần download "thử" một file có số thứ tự thấp hơn ở hàng
chục hay hàng đơn vị: trong trường hợp này sẽ không
tải được, bạn cần thử lại lần hai: và file gt4_029.jpg
được download thành công, từ đó bạn biết chắc chắn số wildcard bytes là 3 chứ không phải là 2
như thiết lập mặc định của nhà sản xuất. Mọi chuyện vẫn chưa dừng lại ở đây, bạn có chắc là đã
download tất cả chưa? Thực tế file gt4_150.jpg đã được tải về, rất có thể tồn tại file gt4_151.jpg
hoặc rất nhiều tệp khác có số thư tự lớn hơn.
Và ta cần tải thêm chúng cho đủ, hãy chỉnh thêm "From 151 To 200" chẳng hạn, các file sẽ được
tải thêm đến gt4_164.jpg còn từ gt4_165.jpg đến gt4_200.jpg sẽ bị "đứt". Để hạn chế điều này, ta
cũng có thể thiết lập 1 tới 200 ngay từ đầu nhưng thời gian download sẽ lâu hơn do phần mềm
phải lần lượt tải thử những file không có thực.
Phương pháp trên tuy có thể tải hàng loạt nhưng không phải lúc nào liên kết cũng giúp bạn tìm ra
chính xác những file cần thiết, nhiều khi số thứ tự có thể lên tới hàng chục nghìn, vì vậy cách này
được gọi là chưa chọn lọc.
2.Tải hàng loạt tự động chọn lọc
Các trang web chuyên cung cấp nhạc, phim, phần mềm... thường có cấu tạo gồm một số trang lớn
dẫn đến rất nhiều trang nhỏ tạo thành mạng lưới. Nếu mỗi trang con khá cố định, chỉ chứa vài liên
kết dành cho việc download thì các trang mẹ lại tùy biến, có đến hàng trăm liên kết. Thế nên bạn
thường phải vào trang chính, mở trang con tìm liên kết tới file để download, rồi trở lại trang chính

để vào trang con tiếp theo... rồi cứ thế lặp đi lặp lại, thật là một công việc nhàm chán, hơn nữa khi
đang download thì trang web được nạp rất lâu, tốn nhiều thời gian, các trang con có cách trình bày
gần như giống nhau nên dễ bị nhầm lẫn.
Nhằm đơn giản hóa việc xây dựng, cũng như giấu đường dẫn thực tới máy chủ, các website
chuyên nghiệp thường sử dụng PHP để thực hiện các liên kết. Chính vì vậy việc tìm đường dẫn
bằng cách xem mã nguồn (View Source) của trang web đã trở nên "lạc hậu" với đa số website.
Tưởng chừng điều đó gây ra khó khăn cho bạn nhưng thực ra với người dùng có kinh nghiệm việc
download lại trở nên vô cùng dễ dàng. Bạn chẳng phải nhọc công tìm tên, đường dẫn thật của
từng file mà đơn giản chỉ cần biết số thứ tự của nó trong liên kết PHP.
Giữa liên kết tới file và liên kết tới trang web con tương ứng có rất nhiều điểm tương đồng. Ví dụ
để tải file Nero-7.0.1.4b_eng.exe từ website www.bestdownload.com bạn cần xem trang web con
với đường dẫn để tìm ra liên kết
cho việc download. Bạn dễ dàng nhận ra
hai liên kết rất giống nhau, đặc biệt có cùng một số thứ tự, vậy việc xem trang web con là không
cần thiết.
Đó cũng là nguyên tắc chính của phương pháp download hàng loạt, tự động chọn lọc. Nói là tự
động bởi vì để tạo sự thuận tiện cho khách, người ta thường tích hợp công cụ tìm kiếm nội dung
trong website. Khác với những dịch vụ chuyên nghiệp như Google, chúng có nhiều tiêu chí sát với
chủ đề, bạn chỉ cần nhập từ khóa, tiêu chí là máy chủ sẽ tự động lọc ra liên kết tới các trang web
con đạt tiêu chuẩn, để tạo ra kết quả tìm kiếm dưới dạng một trang web mẹ cho việc trả lời.
Để thực hiện phương pháp này bạn cần làm 2 bước: khảo sát website để tạo danh sách file, và
cuối cùng tất nhiên là ngồi đợi các file được tải về.
a) Khảo sát website chứa các file cần download để tạo danh sách file
Gọi là khảo sát cho thêm phần chuyên nghiệp, nhưng cách thực hiện lại khá đơn giản, bạn chỉ cần
kiểm tra sự hạn chế từ phía nhà quản trị và so sánh các liên kết mà thôi. Thật vậy, hạn chế đầu
tiên là việc bắt bạn phải làm thành viên của trang web. Điều này không thành vấn đề, bạn chỉ cần
nhấn "Đăng ký” (Register) để điền các thông tin vào biểu mẫu có sẵn. Nhiều bạn lúng túng khi
nhập Zip/Postal Code, nó đơn giản chỉ là mã thư tín của mỗi nước, bạn chỉ cần gõ năm chữ số bất
kỳ mà thôi. Sau đó một lá thư điện tử được gửi đến địa chỉ email mà bạn đăng ký, tài khoản sẽ
được kích hoạt bằng việc nhấn vào liên kết xác nhận trong bức thư này. Nếu là một người mới

nhập môn, chưa tạo được cho mình một địa chỉ email thì bạn chỉ cần đăng ký (Sign up) tại một
trang webmail như mail.yahoo.com chẳng hạn... (Ngoài ra còn có một vài hạn chế nữa và cách giải
quyết sẽ đề cập kỹ hơn ở những phần sau).
Nếu tốc độ download là quan trọng thì việc có được danh sách chứa liên kết tới tất cả file cần tải
cũng cần thiết không kém và nó sẽ được tạo ra một cách dễ dàng. Chúng ta cần so sánh hai liên
kết, một với file cần download và một với trang web con tương ứng, để từ đó tìm ra điểm khác và
giống nhau giữa chúng. Tiếp đó dùng chức năng dò tìm liên kết của phần mềm cho trang kết quả
tìm kiếm để có được tất cả các liên kết PHP với trang web con. Dựa vào sự so sánh trên bạn dễ
dàng suy ra các liên kết PHP tới những file cần tải, việc thay thế liên kết sẽ diễn ra trong file danh
sách. Ví dụ, với trang www.chinagba.com (chuyên cung cấp miễn phí ROM game cho các thiết bị
chơi game bỏ túi), ta có liên kết tới trang web con là
và tới file
/>Bạn dễ thấy chúng có cùng một số thứ tự 2910, còn Links=2 cho biết cùng nội dung file nhưng ban
quản trị cho phép tải về theo nhiều đường khác nhau. Giả sử phần mềm Flashget vẫn được dùng,
(cũng có thể sử dụng phần mềm khác miễn là có hỗ trợ xuất nhập danh sách URL và dò tìm liên
kết), bạn nhấn chuột phải vào trang kết quả tìm kiếm, trong trình đơn ngữ cảnh chọn Download All
by Flashget, phần mềm sẽ tự động tìm tất cả liên kết có trên trang web hiện thời, trong danh sách
liên kết được đưa ra bạn chọn các liên kết tới trang web con, chúng chỉ khác nhau ở số thứ tự.
Nếu chưa quen thì nên bật bộ lọc (Filter) phần mở rộng file (File Extention) hay liên kết tới máy
chủ (Host Name). Sau khi nhấn OK hộp thoại Add new download hiện ra, ở mục Start với lựa chọn
mặc định Immediately, ngay lập tức phần mềm sẽ bắt đầu lưu lại các trang web con khi bạn đồng
ý (chúng sẽ có lợi cho bạn sau này, được đề cập ở phần sau, vả lại dung lượng cũng rất nhỏ nên
tác giả khuyên bạn hãy đợi để tải về), còn không bạn đánh dấu vào ô Manual hoặc Schedule rồi
nhấn OK hai lần để giữ nguyên thiết lập đó với các liên kết khác.
Tiếp theo hãy bôi đen tất cả và chọn File Export list để lưu các liên kết thành file có tên WEBS.lst
chẳng hạn (phần mở rộng tùy thuộc vào mỗi chương trình). Mở danh sách file vừa tạo bằng
Notepad, chọn Edit Replace, trong Find what: gõ ".html", trong Replace with: gõ "Links=2", nhấn
Replace All để tự động tìm và thay thế. Lặp lại thao tác trên bạn thay "Software/View-Software-"
bằng "Download.php?Go=Software::". Ngay lập tức liên kết tới những trang web con được "hô
biến" thành link của các file cần tải. Ta lưu lại với tên FILES.lst và trở về với Flashget, vào File

Import list để chọn FILES.lst và tất cả các file bạn cần được liên tục tải về một cách chính xác.
(Cần lưu ý phiên bản Notepad ở các hệ điều hành cũ hơn như Windows 98 sẽ không có tính năng
Replace nên bạn cần thay thế bằng một công cụ sẵn có như WordPad).

×