Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (88.74 KB, 4 trang )
THIẾT KẾ VÀ CÀI ĐẶT
Ngôn ngữ lập trình : Java, HTML
Công cụ lập trình : JBuilder X, Microsoft Fontpage
Web Server : Resin
Hệ quản trị CSDL : Mircrosoft SQL Server 2000
Chương 1: THIẾT KẾ DỮ LIỆU
Khi thiết kế hệ thống tìm kiếm thông tin vấn đề khó khăn nhất phải đối mặt là tổ
chức cấu trúc dữ liệu . Vì khối lượng dữ liệu phải lưu trữ của hệ thống tìm kiếm thông tin
là rất lớn, và khối lượng yêu cầu tìm kiếm phải xử lý cũng rất lớn (trên môi trường Web)
nên cấu trúc dữ liệu phải được tổ chức tối ưu cho việc đáp ứng (về thời gian) đối với yêu
cầu tìm kiếm của người sử dụng.
Dữ liệu của hệ thống được xây dựng dựa trên mô hình vector, sử dụng phương
pháp tập tin nghịch đảo
1. Cơ sở dữ liệu trong SQL
CSDL trong SQL server phục vụ cho toàn bộ hệ thống gồm bảng Url : chứa các
thông tin cần thiết cho ứng dụng về 1 URL.
Bảng
UrlSTT
Tên thuộc
tính
Ý nghĩa Kiểu dữ liệu Miền giá trị Ghi chú
1 Depth Độ sâu
của
Integer 0 : đây là
FromURL StartURL
2 LastModified Ngày cập
nhật nội
dung URL
gần nhất
Bigint
3 ContentLength Kích