Tải bản đầy đủ (.docx) (91 trang)

nghiên cứu và phát triển hệ thống xây dựng và vận hành tự động webbot thu thập thông tin trên internet để cung ứng các dịch vụ web theo yêu cầu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.67 MB, 91 trang )

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA CÔNG NGHỆ THÔNG TIN

NGHIÊN CỨU VÀ PHÁT TRIỂN HỆ THỐNG
XÂY DỰNG VÀ VẬN HÀNH TỰ ĐỘNG
WEBBOT THU THẬP THÔNG TIN
TRÊN INTERNET ĐỂ CUNG ỨNG
CÁC DỊCH VỤ WEB THEO YÊU CẦU

TP.HCM, 2008
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA CÔNG NGHỆ THÔNG TIN
 
 
NGHIÊN CỨU VÀ PHÁT TRIỂN HỆ THỐNG
XÂY DỰNG VÀ VẬN HÀNH TỰ ĐỘNG
WEBBOT THU THẬP THÔNG TIN
TRÊN INTERNET ĐỂ CUNG ỨNG
CÁC DỊCH VỤ WEB THEO YÊU CẦU

 !"#$
Th.S ĐỖ HOÀNG CƯỜNG - Th.S TRẦN MINH TRIẾT
NIÊN KHÓA 2005 – 2008
%&' !"#$
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………


………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
Khóa luận đáp ứng yêu cầu của LV cử nhân tin học.
TpHCM, ngày …… tháng …… năm 2008
Giáo viên hướng dẫn
%&' () *
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
………………………………………………………………………………
Khóa luận đáp ứng yêu cầu của LV cử nhân tin học.
TpHCM, ngày …… tháng …… năm 2008
Giáo viên phản biện

+,-
Chúng em xin chân thành cảm ơn Khoa Công Nghệ Thông Tin, trường Đại Học
Khoa Học Tự Nhiên, Tp.HCM đã tạo điều kiện tốt cho chúng em thực hiện đề tài
tốt nghiệp này.
Chúng em xin chân thành cảm ơn Thầy Đỗ Hoàng Cường và Thầy Trần Minh Triết
những người đã tận tình hướng dẫn, chỉ bảo chúng em trong suốt thời gian thực
hiện đề tài.
Chúng em cũng xin gửi lời cảm ơn sâu sắc đến quý Thầy Cô trong Khoa đã tận
tình giảng dạy, trang bị cho chúng em những kiến thức quí báu trong những năm
học vừa qua.
Chúng em xin gửi lòng biết ơn sâu sắc đến ba, mẹ, các anh chị và bạn bè đã ủng hộ,
giúp đỡ và động viên chúng em trong những lúc khó khăn cũng như trong suốt thời
gian học tập và nghiên cứu.
Mặc dù chúng em đã cố gắng hoàn thành luận văn trong phạm vi và khả năng cho
phép, nhưng chắc chắn sẽ không tránh khỏi những thiếu sót, kính mong sự cảm
thông và tận tình chỉ bảo của quý Thầy Cô và các bạn.
Nhóm thực hiện
Nguyễn Đức Huy & Nguyễn Huy Khánh
.!-/
01234: Nghiên cứu và phát triển hệ thống xây dựng và vận hành tự động
WebBot thu thập thông tin trên Internet để cung ứng các dịch vụ web theo yêu cầu
456740189:1;<=1>ThS. Đỗ Hoàng Cường – ThS. Trần Minh Triết
8?4;4@1A8BC84D1: từ ngày 07/12/2007 đến ngày 15/07/2008
E4187401A8BC84D1>
Nguyễn Đức Huy (05HC077) – Nguyễn Huy Khánh (05HC087)
6F4G2A34: Tìm hiểu công nghệ và xây dựng ứng dụng
H4#I1;234(mô tả chi tiết nội dung đề tài, yêu cầu, phương pháp thực hiện,
kết quả đạt được, …):
Đây là đề tài thuộc về hướng tìm hiểu công nghệ và phát triển ứng dụng. Đề tài
bao gồm các phần sau:

• Khảo sát hiện trạng các hệ thống phần mềm thu thập thông tin tự động hiện
đang có trên thế giới: @J6K,@L8IJEMN7MN, 4,@CN6L, MKO4MPMO
IA6Q@A461, IA6Q@A4611RK8MNM, EPSTJU6NMNIA6Q@A461.
• Thông qua việc khảo sát hiện trạng của các hệ thống trên, phân tích các vấn
đề cũng như giải pháp về kỹ thuật, công nghệ khi phát triển hệ thống xây
dựng và vận hành WebBot
o Nêu lên các vấn đề khi xây dựng hệ thống.
o Đề ra các giải pháp mang tính kĩ thuật, công nghệ.
o Trên cở sở tìm hiểu và phân tích các vấn đề, nhóm sẽ phát triển hệ
thống xây dựng và vận hành WebBot thu thập thông tin trên Web.
• Trên cơ sở phát triển hệ thống này, nhóm xây dựng website cung cấp dịch
vụ web cho phép những website khác đưa lên những thông tin đã được rút
trích, thu thập thông tin từ nhiều nguồn khác nhau
V6FC88BC4D1:
- 07/12/2007 đến 14/12/2007: Khảo sát hiện trạng các chức năng của công cụ
rút trích thông tin và các hệ thống so sánh giá hiện có.
- 15/12/2007 đến 15/01/2008: Phân tích các yêu cầu, vấn đề, giải pháp khi xây
dựng hệ thống.
- 16/01/2008 đến 16/02/2008: Tìm hiểu và hoàn tất các yêu cầu về mặt kĩ thuật.
- 17/02/2008 đến 31/02/2008: Xây dựng khung chương trình cho hệ thống thu
thập thông tin trên Web.
- 01/03/2008 đến 13/04/2008: Hoàn thành các chức năng chính của hệ thống.
- 14/04/2008 đến 31/04/2008: Nâng cấp, cải thiện hiệu suất tốc độ xử lý
- 01/05/2008 đến 11/05/2008: Xây dựng khung chương trình cho hệ thống dịch
vụ web
- 12/05/2008 đến 31/05/2008: Hoàn thành các chức năng của dịch vụ web
- 01/06/2008 đến 22/06/2008: Nâng cấp giao diện và tính tiện dụng của website
cung cấp dịch vụ
- 23/06/2008 đến 15/07/2008: Hoàn thành toàn bộ chương trình dựa trên qui
trình và giải pháp đã xây dựng.

%5C18W1CX@# ;3RYA851;Y1ZQ[
E8BC84D1
,\\
,]
Ngày nay, Internet đã trở thành một dịch vụ thông dụng và phổ biến trên thế giới.
Cùng với sự phát triển của Internet, nhu cầu truy xuất thông tin qua mạng của con
người ngày càng tăng. Với một khối lượng dữ liệu khổng lồ như hiện nay sẽ khiến
cho người dùng vô cùng khó khăn khi muốn tìm kiếm một thông tin nào đó phục
vụ cho nhu cầu của mình. Xuất phát từ thực tế này, nhu cầu tổng hợp và rút trích
thông tin đã trở thành một nhu cầu cấp bách và không thể thiếu được. Đây cũng
chính là mục tiêu trong đề tài nghiên cứu của chúng em.
Nội dung đề tài tập trung vào việc nghiên cứu và phát triển hệ thống xây dựng và
vận hành tự động WebBot thu thập thông tin trên Internet để cung ứng các dịch vụ
web theo yêu cầu. Hệ thống này sẽ giúp cho người dùng có thể thu thập nhiều
thông tin khác nhau một cách tự động. Quá trình thu thập thông tin sẽ được hệ
thống ghi nhận lại dưới tập tin XML được gọi là WebBot. Hệ thống sẽ tự động vận
hành các WebBot theo một chu kỳ định trước để thu thập các thông tin cần thiết
theo yêu cầu của người dùng. Đồng thời, hệ thống cung cấp các dịch vụ để truyền
dữ liệu đầu ra cho người dùng tại một địa chỉ nhất định theo các định dạng theo yêu
cầu của mà người dùng hoặc các hệ thống khác. Dựa vào hệ thống xây dựng sẽ là
một máy rút trích tổng quát phục vụ cho nhiều nhu cầu rút trích thông tin ứng dụng
trong nhiều lĩnh vực khác nhau như chứng khoán, tổng hợp tin tức, tìm kiếm bài
hát, phần mềm, …
Nội dung khóa luận bao gồm 9 chương:
89^1;Y> Mở đầu
89^1;[> Khảo sát hiện trạng
89^1;_> Các vấn đề và giải pháp cho hệ thống xây dựng và vận hành robot thu
thập thông tin trên web

89^1;`> Tổng quan toàn bộ hệ thống
89^1;> Phân hệ WebBot Creator
89^1;a> Phân hệ WebBot Online Manager
89^1;> Phân hệ WebBot Watcher
89^1;> Phân hệ WebBot Services
89^1;b> Kết luận và hướng phát triển hệ thống
Chương 1
Mở đầu

Nội dung của chương này trình bày xu hướng phát triển hiện nay và nhu cầu
của việc xây dựng các hệ thống rút trích và tổng hợp thông tin tự trên Internet đồng
thời nêu lên mục tiêu, nội dung và ý nghĩa của đề tài.
1.1. Giới thiệu Web 2.0 và xu hướng phát triển
Cách đây vài thập kỉ Internet là một khái niệm khá xa lạ với mọi người. Internet
dường như chỉ dành cho những nhà nghiên cứu, những người có chút kiến thức về
tin học, là nơi trao đổi thông tin dữ liệu qua lại với nhau. Thì ngày nay, người sử
dụng Internet có thể là bất cứ ai, phục vụ mọi nhu cầu thiết yếu của con người từ
vui chơi giải trí, nghe nhạc, chơi game, mua sắm, theo dõi thông tin thời sự, thời
tiết, chứng khoán, đến học tập, nghiên cứu, quảng bá sản phẩm, kinh doanh. Có thể
nói Internet là một một thư viện thông tin khổng lồ được cập nhật liên tục từng phút
từng giây, và phát triển với tốc độ chóng mặt. Cũng chính vì sự phát triển nhanh
chóng và rộng khắp của Internet, nội dung của một trang web được pha trộn rất
nhiều thông tin với nhau, ngoài thông tin chính còn có các thông tin liên quan và
các thông tin quảng cáo. Điều này gây nhiều bối rối với người muốn tìm chính xác
thông tin mình cần trên Internet.
Cùng với sự ra đời và phát triển của Web 2.0 trong thời gian gần đây. Web 2.0 đã
không còn làm một khái niệm khá xa lạ đối với nhiều người nó ngày càng trở nên
phổ biến hơn bao giờ hết. Dường như hiện nay hầu hết người sử dụng web không ai
mà không sử dụng ứng dụng của Web 2.0. Dù biết hay không nhưng họ cũng nhận
ra rằng các trang web hiện nay không chỉ đơn thuần là nguồn cung cấp thông tin

đơn thuần như báo hay truyền hình mà còn có thể tương tác với chúng. Nội dung
của trang web không chỉ gói gọn trong website đó mà có thể liên kết với những
trang web hoặc những ứng dụng khác.
13
Web 2.0 đã làm xuất hiện thêm các thuật mới như Web API, Syndication Feed,
Mashup, … Nếu như Web API mang đến khả năng cung cấp thông tin web mà
không cần phải vào trang web đó, Syndication Feed là dịch vụ cho phép cập nhật
nhanh chóng nội dung tóm lược của trang web thì Mashup như một công cụ có khả
năng lấy thông tin từ nhiều nguồn dữ liệu khác nhau nhằm tạo một dịch vụ mới tổng
hợp từ các nguồn dữ liệu đó.
1.2. Giới thiệu về đề tài
Web 2.0 đã mở ra một thời kì mới cho công nghệ web. Các trang web phát triển
theo Web 2.0 đa phần cung cấp các giao thức truyền thông SOAP hoặc REST để
trao đổi thông tin giữa trang web với người dùng hoặc các ứng dụng khác. Tuy
nhiên không hẳn các dịch vụ mà trang web đó cung cấp đáp ứng đúng nhu cầu của
người dùng, hơn nữa các trang Web 1.0 không có các dịch vụ này. Vì thế vấn đề đặt
ra ở đây là làm thế nào ta có thể thiết kế một Robot tự động hay bán tự động để có
thể thực hiện việc rút trích các thông tin cần thiết cũng như tổng hợp thông tin trên
web thành các dịch vụ API cung cấp cho người sử dụng hoặc các hệ thống khác.
1.3. Mục tiêu của đề tài
Đây là đề tài thuộc về hướng tìm hiểu công nghệ và phát triển ứng dụng. Đề tài
hướng vào mục tiêu là chính là hỗ trợ người dùng tạo ra các WebBot tổng hợp
thông tin tự động hoặc bán tự động từ các website theo yêu cầu của người dùng.
Đề tài bao gồm các phần sau:
- Khảo sát hiện trạng các hệ thống phần mềm thu thập thông tin tự động hiện
đang có trên thế giới: @J6K,@L8IJEMN7MN, 4,@CN6L, MKO4MPMO
IA6Q@A461, IA6Q@A4611RK8MNM, EPSTJU6NMNIA6Q@A461.
- Thông qua việc khảo sát hiện trạng của các hệ thống trên, phân tích các
vấn đề cũng như giải pháp về kỹ thuật, công nghệ khi phát triển hệ thống
xây dựng và vận hành WebBot.

- Xác định các vấn đề khi phát triển hệ thống.
- Đề ra các giải pháp kỹ thuật và công nghệ.
14
- Trên các cơ sở tìm hiểu và phân tích, nhóm sẽ phát triển hệ thống vận hành
các WebBot. Các WebBot này sẽ vận hành để lấy về kết quả là các thông
tin mà người dùng yêu cầu và cung cấp dịch vụ trả dữ liệu về theo các yêu
cầu như: SOAP Web Service, REST Web Service, RSS Feed, ATOM Feed.
- Trên cơ sở phát triển hệ thống này, nhóm xây dựng các ứng dụng minh họa
cho các tính năng chính của hệ thống.
1.4. Nội dung của luận văn
Luận văn bao gồm 9 chương, sau đây là nội dung chính của từng chương:
89^1;Y> Mở đầu
Nội dung của chương này trình bày xu hướng phát triển hiện nay và nhu cầu của
việc xây dựng các hệ thống rút trích và tổng hợp thông tin tự trên Internet đồng thời
nêu lên mục tiêu, nội dung và ý nghĩa của đề tài.
89^1;[> Khảo sát hiện trạng
Nội dung của chương 2 trình bày về việc khảo sát hiện trạng của các công cụ rút
trích thông tin tự động trên Internet trên thế giới.
89^1;_> Các vấn đề và giải pháp cho hệ thống xây dựng và vận hành robot thu
thập thông tin trên web
Nội dung chương này sẽ trình bày về các vấn đề cũng như giải pháp khi phát triển
hệ thống. Từ đó quyết định công nghệ và nền tảng xây dựng hệ thống.
89^1;`> Tổng quan toàn bộ hệ thống
Chương 4 sẽ giới thiệu tính năng của toàn bộ hệ thống đồng thời mô tả kiến trúc của
toàn hệ thống. Ứng với mỗi phân hệ chính sẽ có những mô tả tổng quát.
89^1;> Phân hệ WebBot Creator
Nội dung của chương 5 trình bày chi tiết qui trình thực hiện, kiến trúc hệ thống và
các tính năng của phân hệ WebBot Creator cộng với các dịch vụ mà hệ thống này
cung cấp trong việc hỗ trợ tạo WebBot.
15

89^1;a> Phân hệ WebBot Online Manager
Nội dung của chương 6 trình bày chi tiết qui trình thực hiện, kiến trúc hệ thống và
các tính năng của phân hệ WebBot Manager cộng với các dịch vụ mà hệ thống này
cung cấp trong việc quản lý các tài khoản người dùng, quản lý các WebBot, quá
trình thực hiện upload WebBot lên hệ thống máy chủ và hiển thị nộp dung kết quả
thực hiện của WebBot.
89^1;> Phân hệ WebBot Watcher
Nội dung của chương 7 trình bày chi tiết qui trình thực hiện, kiến trúc hệ thống và
các tính năng của phân hệ WebBot Watcher cộng với các dịch vụ mà hệ thống này
cung cấp trong việc giám sát các yêu cầu thực thi của các WebBot và tự động vận
hành các WebBot này khi có yêu cầu.
89^1;> Phân hệ WebBot Services
Nội dung của chương 8 trình bày chi tiết qui trình thực hiện, kiến trúc hệ thống và
các tính năng của phân hệ WebBot Services cộng với các dịch vụ mà hệ thống này
cung cấp trong việc định dạng các kết quả thực hiện của WebBot và cung cấp các
dịch vụ để kết xuất các kết quả này ra bên ngoài theo yêu cầu của người dùng.
89^1;b> Kết luận
Nội dung của chương 9 trình bày các kết quả đạt được và hướng phát triển của đề
tài.
16
Chương 2
Khảo sát hiện trạng

Nội dung của chương 2 trình bày về việc khảo sát hiện trạng của các công cụ
rút trích thông tin tự động trên Internet trên thế giới.
2.1. Khảo sát các công cụ tự động hóa và rút trích thông tin trên
web
2.1.1. Kapow Mashup Server
Website:
 c1;dI@18DA8e1;J8f1Q2Q

Kapow Technologies được thành lập năm 1998 bởi Stefan Andreasen và Ebbe
Groes. Đây là một trong những công ty hàng đầu thế giới về lĩnh vực cung ứng các
dịch vụ và công cụ trong lĩnh vực thu thập thông tin, tương tác web,… đặc biệt là
hệ thống thu thập thông tin tự động trên web với với phần mềm RobotMaker.
17
4g18[,h8i18@J6K,@L8IJEMN7MN
Kapow Mashup Server là một phần mềm rất mạnh về việc tạo ra các Robot để rút
trích thông tin hay tương tác với các website. Phần mềm được sử dụng để tạo ra các
robot có khả năng phân tích các RSS mà các website trên Internet có hỗ trợ hay khả
năng thu thập thông tin một cách tự động ví dụ như robot thu thập nhiều links tìm
được trong google, hay thu thập thông tin về các trận đấu bóng đá, thu thập các
email mới trong hộp mail yahoo, gmail, thực hiện việc gửi tin nhắn ABGH1; cho
danh sách các thuê báo từ một hệ thống web của Mobifone hay Vinaphone… Các
Robot là một loạt các hành động do người dùng thực hiện và phần mềm
RobotMaker của hệ thống Kapow Mashup Server sẽ ghi nhận lại tạo thành một file
kịch bản (script) được gọi là Robot.
18
4g18[4@6<4D1CX@J8f1Q2Qj6O6A,@kMNal`
Sau khi thực hiện đầy đủ các hành động cho Robot. RobotMaker sẽ hỗ trợ cơ chế
lưu trữ Robot này lại dưới dạng một file kịch bản (script) nhị nhân.
Để Robot này có thể vận hành được thì Kapow hỗ trợ cho người dùng 2 phương
thức sau:
Nếu bạn là người dùng thử thì sau khi tạo ra robot để thực thi được nó, người sử
dụng phải gửi robot này đến trang web mà công ty Kapow Technologies cung cấp
để có thể kiểm chứng và xem kết quả quá trình thực thi robot mà bạn đã tạo ra.
Nếu bạn là khách hàng của Kapow Technologies, thì bạn sẽ có phần mềm để có thể
thực thi robot, không cần đến service mà công ty này hỗ trợ
Sau khi đưa Robot vào vận hành tự động thì chúng ta cần phải thiết lập một số
thông số để định dạng dữ liệu đầu ra theo ý muốn.
19

m
g
18[,h8i18PMO[lS<4A61CX@8DA8e1;@J6K,@L8IJEMN7MN
Hệ thống Web 2.0 Edition của Kapow Mashup Server cung ứng cho người dùng
nhiều định dạng dữ liệu đầu ra:
Mashup Builder: là một cơ chế định dạng và tổ chức dữ liệu từ nhiều Robot lấy
thông tin từ nhiều nguồn khác nhau.
Java/.Net Toolkits: hỗ một số dịch cung ứng để các ứng dụng Java hay .Net có thể
lấy dữ liệu về được. Ví dụ: hệ thống Ajax, PHP, ….
Hiện nay, phần mềm RobotMaker của công ty Kapow Technologies đã được phát
triển lên đến 7MNL461al` và vẫn còn đang được tiếp tục phát triển để hoàn thiện các
chức năng.
Về giá của hệ thống này thì tùy thuộc vào nhu cầu của doanh nghiệp mà phía Công
ty Kapow Technologies sẽ có một định mức giá khác nhau. Khi muốn đang ký sử
dụng hệ thống thì khách hàng phải liên lạc trực tiếp với để thương lượng giá cả và
ký kết hợp đồng.
Ngôn ngữ xây dựng lên hệ thống: Java
 !Ik8IRVAG4nQ
• Ưu điểm
- Hệ thống hỗ trợ nhiều cơ chế định dạng dữ liệu đầu ra.
- Tính mềm dẻo trong việc thiết kế Robot.
20
• Khuyết điểm
- Thao tác duyệt web thực hiện qua nhiều thao tác khiến người dùng gặp
nhiều khó khăn trong việc thiết kết Robot.
- Hệ thông bị hạn chế không lấy được link trong các website có chứa Frame.
2.1.2. iMacros
Website: /> c1;dI@18DA8e1;J8f1Q2Q
Sử dụng iMacros để tạo các solution cho web automation, web scraping hoặc web
testing chỉ trong 5 phút.

m
g
18[4@6<4D1CX@8DA8e1;4,@CN6L
21
m
g
18[,h8i188DA8e1;4,@CN6L
Web Automation/ Web Scripting
iMacros cho phép bạn ghi và làm lại công việc có tính chất lặp đi lặp lại. iMacros
tương thích với bất kì và tất cả các trang web. Nó hoàn tất các form và tự động
download và upload các chuỗi ký tự, các hình ảnh, các tập tin, các trang web. Bạn
có thể import và export dữ liệu cho việc sử dụng các tập tin CSV & XML, các cơ sở
dữ liệu hoặc bất kỳ tài nguyên nào khác cho hoặc từ các ứng dụng web. iMacros hỗ
trợ cho việc xử lý định dạng PDF, chụp hình, giả lập lại các thao tác người dùng và
22
kết nối đến proxy servers. iMacros được quảng cáo là phần mềm web automation
duy nhất làm việc được với mọi trang web.
iMacros Scripting Interface cho bạn chương trình điều khiển đầy đủ trên toàn web
browser, thậm chí tác vụ phức tạp nhất cũng được script. Nó có thể được sử dụng
với tất cả ngôn ngữ scripting hoặc ngôn ngữ lập trình mà không cần phải học một
ngôn ngữ mới nào cả.
Data Extraction/Web Scraping/Web Mining/Enterprise Data Mash – Ups
iMacros có thể thực hiện chính xác các thao tác của việc phủ đầy form, tìm và rút
trích text (giá, mô tả sản phẩm, bảng báo giá, … ) và những hình ảnh từ trang web.
iMacros hỗ trợ đầy đủ Unicode và làm việc được với mọi ngôn ngữ, bao gồm cả
ngôn ngữ tượng hình như Trung Quốc.
Web Testing
Sử dụng iMacros cho functional, performance và regression testing của các ứng
dụng web. iMacros là công cụ có thể tự động hóa kiểm tra trong trình duyệt với
Internet Explorer và Firefox. Ngoài ra, nó còn là công cụ thực hiện kiểm tra trong

trình duyệt của Java, Flash, Flex hoặc Silverlight applets và tất cả AJAX elements.
Lệnh STOPWATCH của iMacros cho phép bắt giữ lại thời gian đáp ứng chính xác
của trang web trong mọi bước của một tiến trình.
Tự động điền biểu mẫu và quản lý mật khẩu
iMacros loại bỏ sự lặp lại nhàm chán của việc checking những trang web như nhau
hằng ngày, ghi nhớ mật khẩu, và hoàn tất các web forms. iMacros là form filler duy
nhất có thể tự động điền thông tin vào web forms trên nhiều trang. Tất cả thông tin
được lưu dạng plain-text dễ đọc hiểu và có thể sắp xếp dễ dàng. Mật khẩu được lưu
an toàn với sự mã hóa an toàn 256-Bit AES.
iMacros là một giải pháp lựa chọn tốt cho Enterprise Single Sign-On (SSO). Người
dùng chỉ nhớ duy nhất một mật khẩu chủ và iMacros ghi nhớ tất cả những mật khẩu
còn lại, và cảm nhận tính năng tự động đăng nhập cao cấp của Single Sign-On.
23
Sử dụng iMacros như một thành phần của phần mềm
Chỉ cần vài phút đã có thể thêm tự động hóa trên web cho ứng dụng thay vì phải
mất vài tuần hoặc vài tháng. Bạn có một kỹ thuật đã được minh chứng, đã được test
và debug trên 5 năm và được sử dụng trên 500,000 bản cài đặt.
Các ứng dụng khác
Muốn hiểu rõ hơn về cách sử dụng iMacros bạn có thể xem thêm thông tin ở
trang .
Phiên bản mới nhất :
iMacros for Firefox V6.0.5.3
iMacros for Internet Explorer V6.14
iOpus iMacros V6.14
Giá của sản phẩm:
Eo1J8pQ 45
iMacros Scripting Edition $499.00
iMacros PRO Edition $199.00
iMacros Power Surfer Edition $49.95
)@

(
1;[)o1;;45C5C;q4J8f1Q2Q8DA8e1;4,@CN6L
 !Ik8IRVAG4nQ
• Ưu điểm
- Tính mềm dẻo trong việc thiết kế Robot.
- Cho phép thiết kế các đoạn script cho các các tác vụ.
• Khuyết điểm
- Không hỗ trợ Unicode.
- Không tương tác được với các hệ thống có Frame và hệ thống Ajax.
24
2.1.3. Newbie Web Automation
Website: /> c1;dI@18DA8e1;J8f1Q2Q
Newbie Labs được nghiên cứu vào năm 2004 với nhiệm vụ tạo ra ứng dụng phần
mềm tự động hóa tính toán cá nhân và đơn giản hóa việc sử dụng Internet. Mục đích
là tạo sự dễ dàng cho người sử dụng Internet trong việc duyệt mạng an toàn, và truy
cập thông tin trên mạng trong khi bảo đảm tính riêng tư và thông tin cá nhân từ
những truy cập không cho phép.
Newbie viết tắt từ Network Enabled Web Browser Interface. Được thiết kế cho phép
người dùng thao tác trên những trang web bằng những đoạn mã tùy biến. Những
đoạn Script này cho phép người dùng định hướng tự động những trang web bằng
cách điền theo mẫu những trang web cho bạn, do đó bạn có thể điều khiển cách bạn
sử dụng trang Web. Nó cũng có thể quản lý username và password để vào những
trang yêu cầu chứng thực người dùng một cách bình thường. Tất cả thông tin người
dùng được mã hóa và lưu trữ cục bộ trên máy của bạn. Chỉ admin và những người
dùng đặc biệt mới có thể truy cập những thông tin này.
Newbie tích hợp Script Editor và Pascal Compiler cho phép người dùng gỡ lỗi, biên
dịch và thực thi những đoạn Script.
Tất cả thông tin bạn cung cấp trên Newbie được mã hóa và lưu trữ cục bộ trên máy
của bạn. Không có thông tin cá nhân nào được chuyển qua Internet. Newbie Labs
đã thiết lập những ưu tiên để chắc chắn thông tin người dùng như username,

password chỉ có người dùng được truy cập. Đây là giải thuật mã hóa Blowfish với
mẫu 64-bit.
25

×