Tải bản đầy đủ (.pdf) (19 trang)

Bài giảng Web search - Bài 1: Tổng quan về các máy tìm kiếm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.92 MB, 19 trang )

BÀI SỐ

TỔNG QUAN VỀ
CÁC
MÁY TÌM KIẾM

1

TS. Nguyễn Trần Hưng
Khoa HTTT Kinh tế và TMĐT


NỘI DUNG CHÍNH
• 1.1. Khái niệm và đặc điểm của máy tìm kiếm dữ liệu
trên Internet
• 1.2. Cấu trúc của các máy tìm kiếm dữ liệu trên
Internet
• 1.3. Cấu trúc webpage trong kết quả tìm kiếm trả về
và nguyên tắc hoạt động của máy tìm kiếm.
• 1.4. Máy tìm kiếm theo chủ đề và máy tìm kiếm tồn
bộ văn bản

• 1.5. Máy tìm kiếm AND và máy tìm kiếm OR
• 1.6. Phối hợp toán tử và từ bổ nghĩa của các máy tìm
kiếm
Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

2




1.1. Khái niệm và đặc điểm của máy tìm
kiếm dữ liệu trên Internet
• Khái niệm máy tìm kiếm (Search Engines)

Khái
niệm

Web search

Máy tìm kiếm là một
website được thiết kế đặc
biệt để giúp đỡ người sử
dụng tìm kiếm các thơng
tin theo u cầu trên môi
trường mạng Internet

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

3


Đặc điểm của máy tìm kiếm dữ liệu trên
Internet
• Tìm kiếm trong cơ sở dữ liệu được tự động xây dựng
bởi một robot, khơng phải do con người xây dựng.
• Máy tìm kiếm sẽ so sánh các từ khóa người dùng
nhập vào vào cửa sổ tìm kiếm với các từ được viết ở

các trang web mà nó lưu trữ.
• Luợng thơng tin mà các máy tìm kiếm có thể chứa
đựng hơn 90% nội dung của các trang web có thể xử
lý được.
• Kết quả tìm kiếm của người dùng phụ thuộc vào khả
năng sử dụng nhuần nhuyễn các tính năng và cú
pháp của máy tìm kiếm.
Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

4


1.2. Cấu trúc của máy tìm kiếm dữ liệu
trên Internet

Bộ thu thập thông tin
(web spider, web
wanderer, web worm)

Các bộ
phận cấu
thành

Bộ lập chỉ mục (Index)
– Hệ thống phân tích
và xử lý dữ liệu


Bộ tìm kiếm thơng tin –
Search Engine
Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

5


1.3. Cấu trúc webpage trong kết quả trả về và
nguyên tắc hoạt động của máy tìm kiếm

• Cấu trúc webpage trong kết quả trả về

Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

6


Nguyên tắc hoạt động của máy tìm kiếm

Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT


7


1.4. Máy tìm kiếm theo chủ đề và máy tìm
kiếm tồn bộ văn bản.

Hai
trường
phái tìm
kiếm
thơng
tin

Máy tìm kiếm tồn bộ
văn bản
Google

Máy tìm kiếm theo chủ đề
Yahoo

Web search

Teoma

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

Yandex
8





Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

9




Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

10




Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

11



Tại sao lại có hai cách thức tìm kiếm

Máy tìm kiếm tồn bộ
văn bản

Tìm kiếm những kiểu
thơng tin được phân
biệt rõ ràng.
Những lời trích dẫn,
những bài hát.

Máy tìm kiếm theo
chủ đề

Rất hứu ích cho sự tìm
kiếm chung, tìm kiếm
các đề tài chung, các
tiêu đề chung.

Những địa chỉ, những
câu hỏi phức tạp,
những nơi ít được biết
đến

Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT


12


1.5. Máy tìm kiếm AND và máy tìm kiếm OR.
Điều đầu tiên và quan trọng nhất khi tiến hành tìm kiếm
thơng tin đó là cần phải biết về một máy tìm kiếm thuộc
loại nào: tìm kiếm tồn bộ văn bản hay là một máy tìm
kiếm theo chủ đề và sau đó là máy tìm kiếm đang sử dụng
được mặc định AND hay OR

Mặc định tìm
kiếm AND

Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

Mặc định tìm
kiếm OR

13


Ví dụ về một máy tìm kiếm được mặc định AND

Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT


14


Ví dụ về máy tìm kiếm mặc định OR

Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

15


1.6. Phối hợp toán tử và từ bổ nghĩa
của các máy tìm kiếm
• Những tốn tử và từ bổ nghĩa này sẽ khiến cho máy tìm
kiếm biết được chính xác bạn đang muốn những từ tìm
kiếm sẽ được xử lý như thế nào.

Tốn
tử

+: Phải xuất hiện trong kết quả tìm
kiếm
-: Khơng được xuất hiện trong kết
quả tìm kiếm

Web search


TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

16


Ví dụ về tìm kiếm có từ bổ nghĩa đại số Boolean
+Electronic Commerce –Security

Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

17


Những từ bổ nghĩa bên ngoài đại số Boolean
Ngoài các từ bổ nghĩa đại số Boolean cơ bản là : +
và -, cịn có rất nhiều các từ bổ nghĩa bên ngoài vượt
ra khỏi đại số Boolean tới những cú pháp đặc biệt.

OR(hoặc)

NEAR (gần)
“”(dấu
nháy kép)
Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT

Kinh tế và TMĐT

~ Synonym
(Từ đồng
nghĩa)
18


Web search

TS. Nguyễn Trần Hưng/ Khoa HTTT
Kinh tế và TMĐT

19



×