Tải bản đầy đủ (.docx) (17 trang)

KẾT QUẢ ĐÁNH GIÁ VÀ HƯỚNG PHÁT TRIỂN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (422.1 KB, 17 trang )

KẾT QUẢ ĐÁNH GIÁ VÀ HƯỚNG PHÁT TRIỂN
1. Kết quả thử nghiệm
Hệ thống search engine thử nghiệm được cài đặt trên server có cấu hình máy
Pentium IV, CPU 1.5 GHz, bộ nhớ RAM 256MB, đĩa cứng 120 GB. Từ điển xử lý
khoảng 150000 từ bao gồm cả từ tiếng Việt và tiếng Anh. Hỗ trợ quản trị quản lý
webrobot và bộ lập chỉ mục thông qua ứng dụng (application) của Jbuilder, phục vụ
nhu cầu tìm kiếm thông tin của người dùng thông qua giao diện web. Dữ liệu đươc thu
thập chủ yếu trên mạng cục bộ (localhost). Dữ liệu mẫu gồm 8272 tài liệu, khoảng
145MB, (290MB trên đĩa).
Các website được đưa vào thử nghiệm:
 Azit Nexin
 Codeguru
 Covan
 Tự học tiếng Anh
 Su tích
 Tam quốc bình giảng
 Thơ Việt Nam
 Thuyền trưởng Blad
 Truyện cười
 Truyện ngắn
 Truyện Nguyễn Nhật Ánh
 Tuitor Java
 Tự Lực Văn Đoàn
 Unix Operating System
Kết quả lập chỉ mục: tạo ra tập tin nghịch đảo: file inverse.dat 4475KB
New Project
Project Property
Add StartUrl
Delete StartUrl
StartUrl Property
Start


Pause
Stop
Thread Bar
2. Hoạt động của chương trình
2.1 Giao diện quản trị
2.1.1 Giao diện chính của quản trị
Hình 10. Giao diện chính của quản trị
2.1.2 Tạo mới project
 Chọn File/New hoặc nhấn nút New trên thanh công cụ.
Hình 10.Màn hình thể hiện một số thông tin chung về project
 Nhập tên project mới trong textbox Project Name
Hình 10.Các tuỳ chọn thu thập dữ liệu của project
 Xác định các tuỳ chọn thu thập dữ liệu :
 Lấy mọi file [không | có] giới hạn kích thước.
 Chỉ lấy về các file có đuôi file và [không | có] giới hạn kích thước như liệt kê.
 Sửa chữa dạng file hiện có hoặc định nghĩa thêm dạng file mới bằng dialog
EditFileType
Hình 10.Màn hình sửa chữa thông tin hoặc thêm mới một dạng file
 Xác định số spider, thời gian đợi giữa các spider, số kết nối tạo sẵn đến CSDL,
thời gian đợi nhận kết nối khi hệ thống bận trong khung Tenacity.
 Chọn các dạng file cần xử lý lại khi cập nhật thông tin cho một StartUrl trong
khung Updating

×