Tải bản đầy đủ (.doc) (22 trang)

thảo luận môn nghiên cứu marketing, đề tài tìm hiểu và thỏa luận các kỹ năng khai thác thông tin trên internet

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (926.18 KB, 22 trang )

Đề tài : Tìm hiểu và thỏa luận các kỹ năng khai thác thông tin trên Internet
A. Lý thuyết về các phương pháp thu thập dữ liệu
1. Khái niệm về dữ liệu và thông tin
2. Phân loại dữ liệu theo nguồn dữ liệu
2.1. Dữ liêu thứ cấp
2.2 .Dữ liệu sơ cấp
3. Các phương pháp thu thập dữ liệu
B. Tìm hiểu và thảo luận các kỹ năng khai thác dữ liệu trên internet
1.Internet và tìm kiếm dữ liệu trên internet
1.1.Internet là gì?
1.2. Tìm kiếm thơng tin ( dữ liệu ) trên internet
1.2.1. Thơng tin trên internet
1.2.2. Các bước cơ bản tìm kiếm thơng tin trên internet



1.2.2.1 Phân tích u cầu tìm
1.2.2.2 Diễn đạt lệnh tìm kiếm – Giới thiêu về cú pháp cảu lệnh tìm
1.2.2.3 Phân tích nhóm u cầu thơng tin ( dữ liệu )
1.2.2.4 Chọn cơng cụ tìm kiếm thích hợp
1.2.2.5 Tìm lời khun từ một người
1.2.2.6 Nếu bước đầu chưa thành công – hãy thử lại
1.2.2.7 Đánh giá kết quả tìm
1.2.3. Chọn cơng cụ tìm kiếm phù hợp với u cầu thơng tin
1.2.3.1 Máy tìm kiếm
1.2.3.2 Máy tìm kiếm liên thông
1.2.4. Giới thiệu về một số bộ máy tìm kiếm

1.2.4.1 .Giới thiệu về Yahoo
1.2.4.2. Giới thiệu về Bing
1.2.4.3. Giới thiệu về Socbay
1.2.4.4. Giới thiệu về Xalo.vn
2. Kỹ năng tìm kiếm và khai thác dữ liệu trên máy tìm kiếm Google
2.1 Giới thiệu về máy tìm kiếm google
2.2 Kỹ năng tìm kiếm và khai thác dữ liệu trên google
2.2.1. Kỹ năng tìm kiếm cơ bản
2.2.1.1 Xác định từ khóa chính xác
2.2.1.2 Lời khun khi xác định từ khóa
2.2.1.3 Suy nghĩ đơn giản
2.2.1.4 Suy nghĩ đến các từ có khả năng xuất hiên cao

2.2.2.Kỹ năng tìm kiếm nâng cao.
2.2.2.1 Loại bỏ một từ nào đó ra khỏi kết quả tìm kiếm
2.2.2.2 Bắt buộc phải có một từ nào đó ra trong kết quả tìm kiếm
2.2.2.3 Rút gọn từ khóa cần tìm
2.2.2.4 Tìm chính xác từ khóa
2.2.2.5 Tìm từ khóa theo tiêu đề trang web
2.2.2.6 Tìm từ khóa trong một Web Site
2.2.2.7 Tìm từ khóa trong địa chỉ trang Web
2.2.2.8 Tìm File (tập tin) có cùng loại
2.2.2.9 Tìm Web Site có từ khóa liên quan với nhau
2.2.2.10 Tìm lại Web Site khơng cịn hoạt động
2.2.2.11 Tìm giới hạn theo tên miền (domain):



2.2.2.12 Tìm thơng tin liên quan về 1 website
2.2.3 Một số lệnh tìm kiếm hữu ích khác
2.2.4 Hộp thoại “ Tìm kiếm nâng cao với Google”

Mở đầu: Hầu như mỗi bước trong q trình nghiên cứu marketing đều cần thơng tin.Họ cần
có thơng tin về khách hàng,về các đối thủ cạnh tranh,về những người buôn bán và những
lực lượng khác tác động trên thị trường.Hiện nay, thơng tin có vị trí quan trọng hàng đầu,
nó tạo tiền đề cho sự thành cơng trong kinh doanh. Vì vậy, tìm kiếm Internet có vai trị rất
quan trọng trong thu thập thơng tin
A. LÝ THUYẾT VỀ CÁC PHƯƠNG PHÁP THU THẬP DỮ LIỆU

TRONG NGHIÊN CỨU MARKETING
1. Khái niệm dữ liệu và thông tin
- Dữ liệu (Data):
 Dữ liệu biểu diễn một tập hợp các giá trị mà khó biết được sự liên hệ giữa
chúng (Ví dụ: Nguyễn Văn Nam, 845102, 14 / 10 / 02, 18, v.v…).
 Dữ liệu là các mẫu thông tin thô chưa được xử lý. Như vậy, khái niệm dữ liệu
hẹp hơn khái niệm thơng tin
 Dữ liệu có thể biểu diễn dưới nhiều dạng khác nhau (âm thanh, văn bản, hình
ảnh, v.v...)
- Thơng tin (Information):
 Thơng tin ln mang ý nghĩa và gồm nhiều giá trị dữ liệu, những ví dụ về dữ
liệu trên có thơng tin như sau:

 Thủ kho Nguyễn Văn Nam xuất mặt hàng có danh mục là: 845102 vào ngày
14/10/ 02 với số lượng 18
2. Phân loại dữ liệu: Phân loại dữ liệu theo nguồn thu thập dữ liệu
Dữ liệu trong nghiên cứu marketing có thể thu thập từ nhiều nguồn khác nhau, và
sau đây là các nguồn dữ liệu chính:
2.1. Dữ liệu thứ cấp:
 Dữ liệu thứ cấp là loại dữ liệu được sưu tập sẵn, đă công bố nên dễ thu thập, ít tốn
thời gian, tiền bạc trong quá tŕnh thu thập.
 Dữ liệu thứ cấp có đặc điểm là chỉ cung cấp các thơng tin mơ tả tình hhình, chỉ rõ
qui mô của hiện tượng chứ chưa thể hiện được bản chất hoặc các mối liên hệ bên
trong của hiện tượng nghiên cứu. Với dữ liệu thứ cấp, dù thu thập từ bên trong hoặc
bên ngồi doanh nghiệp, nó cũng là những thơng tin đă được cơng bố nên thiếu tính

cập nhật, đơi khi thiếu chính xác và khơng đầy đủ. Tuy nhiên, dữ liệu thứ cấp cũng
đóng một vai trị quan trọng trong nghiên cứu marketing do các lý do:


+) Các dữ liệu thứ cấp có thể giúp người quyết định đưa ra giải pháp để giải quyết vấn đề
trong những trường hợp thực hiện những nghiên cứu mà các dữ liệu thứ cấp là phù hợp mà
không cần thiết phải có các dữ liệu sơ cấp. Ví dụ như các nghiên cứu thăm dị hoặc nghiên
cứu mơ tả.
+) Ngay cả khi dữ liệu thứ cấp khơng giúp ích cho việc ra quyết định thì nó vẫn rất quan
trọng với nó giúp xác định và hình thành các giả thiết về các giải pháp cho vấn đề. Nó là cơ
sở để hoạch định việc thu thập các dữ liệu sơ cấp; cũng như được sử dụng để xác định tổng
thể chọn mẫu và thực hiện chọn mẫu để thu thập dữ liệu sơ cấp

2.2. Dữ liệu sơ cấp:
 Các dữ liệu sơ cấp được thu thập trực tiếp từ đối tượng nghiên cứu, có thể là người
tiêu dùng, nhóm người tiêu dùng... Nó cịn được gọi là các dữ liệu gốc, chưa được
xử lư. Vì vậy, các dữ liệu sơ cấp giúp người nghiên cứu đi sâu vào đối tượng nghiên
cứu, tt́m hiểu động cơ của khách hàng, phát hiện các quan hệ trong đối tượng nghiên
cứu. Dữ liệu sơ cấp được thu thập trực tiếp nên độ chính xác khá cao, đảm bảo tính
cập nhật nhưng lại mất thời gian và tốn kém chi phí để thu thập. Dữ liệu sơ cấp có
thể thu thập từ việc quan sát, ghi chép hoặc tiếp xúc trực tiếp với đối tượng điều tra;
cũng có thể sử dụng các phương pháp thử nghiệm để thu thập dữ liệu sơ cấp
3. Phương pháp thu thập dữ liệu
Dữ liệu có thể được thu thập bằng các phương pháp nghiên cứu khác nhau. Mỗi
phương pháp có những ưu điểm và hạn chế nhất định, do vậy phù hợp với những dự án

nghiên cứu nhất định. Các phương pháp nghiên cứu bao gồm: Nghiên cứu định tính,
quan sát, phỏng vấn và thử nghiệm. Các nghiên cứu định tính bao gồm phỏng vấn
nhóm, phỏng vấn chun sâu và kỹ thuật hiện ht́nh. Phương pháp quan sát có thể được
thực hiện bằng con người hoặc thiết bị. Các phương pháp phỏng vấn bao gồm phỏng
vấn cá nhân trực tiếp, phỏng vấn nhóm cố định, phỏng vấn bằng điện thoại, phỏng vấn
bằng thư tín. Phương pháp thử nghiệm có thể được thực trong pḥng thí nghiệm hoặc
thực hiện tại hiện trường. Khi thực hiện các cuộc thử nghiệm chúng ta có thể phải chịu
sai lệch trong kết quả do các nguyên nhân: lịch sử, lỗi thời, bỏ ngang, hiệu ứng thử
nghiệm, công cụ đo lường hoặc lấy mẫu. Do vậy, việc tổ chức một cuộc thử nghiệm
cần phải chuẩn bị tốt, lường trước những sai lầm có thể xảy ra và có hướng khắc phục
B. TÌM HIỂU VÀ THẢO LUẬN CÁC KỸ NĂNG KHAI THÁC THÔNG TIN TRÊN
INTERNET

Thế giới đang thay đổi từng giờ từng giây và khoa học công nghệ ngày càng phát triển.
Trong thời đại bùng nổ công nghệ thông tin, nghiên cứu marketing cũng luôn phát triển
đáp ứng sự phát triển của thời đại. Internet trở thành phương tiện hữu ích phục vụ cơng
việc thu thập dữ liệu trong nghiên cứu marketing.
I. Internet và tìm kiếm trên internet
1. 1 Giới thiệu Internet :
 Internet – cũng được biết với tên gọi Net – là mạng máy tính lớn nhất thế giới, hoặc
chính xác hơn là mạng của các mạng, tức bao gồm nhiều mạng máy tính trên thế


giới được nối lại với nhau.
 Internet bao gồm rất nhiều mạng trên thế giới kết nối với nhau và cho phép bất kỳ

một máy tính nào trong mạng có thể kết nối bất kỳ máy nào khác để trao đổi thông
tin với nhau. Một khi đã kết nối vào Internet, máy tính của bạn sẽ là một trong số
hàng chục triệu thành viên của mạng khổng lồ này.
1 .2. Tìm kiếm thơng tin ( dữ liệu ) trên internet
Tìm kiếm dữ liệu trên Internet là một công việc hoặc hết sức dễ dàng hoặc là khó khăn
khơng thể tưởng tượng nổi. Khi truy cập và tìm kiếm thơng tin trên Internet, cần chú ý một
số đặc điểm sau đây của mạng Internet để có thể tìm kiếm hiệu quả:
 Vì nội dung trên Internet ln được cập nhật và bổ sung, khơng có bất kỳ một số liệu
thống kê chính xác nào về lượng thơng tin có thể truy cập được trên Internet.
 Tài liệu trên Internet không được xử lý bằng một hệ thống hợp chuẩn nào. Nếu như
danh mục tài liệu trong các thư viện được xử lý bao gồm những từ khóa chuẩn có kiểm
sốt thì nguồn tin trên Internet hồn tồn khơng sử dụng bất cứ cơng cụ nào tương tự

như vậy. Vì vậy bạn cần phải ln ln phán đốn những từ ngữ, thuật ngữ khác nhau
sẽ được sử dụng trong các trang web mà bạn cần.
 Khi bạn tiến hành “tìm kiếm dữ liệu trên Internet”, bạn khơng tìm kiếm một cách trực
tiếp vì điều này là KHƠNG THỂ THỰC HIỆN ĐƯỢC. Internet là tổng hợp của rất
nhiều trang web được lưu trữ trên nhiều máy chủ khác nhau trên khắp thế giới. Máy
tính của bạn khơng thể tìm kiếm hoặc kết nối trực tiếp tới tất cả các máy chủ. Điều bạn
có thể làm trên máy tính của mình là truy cập vào một hoặc nhiều cơng cụ tìm kiếm
gián tiếp đang có hiện nay. Các cơng cụ tìm kiếm sẽ cho phép bạn tìm kiếm trong cơ sở
dữ liệu của nó – và mỗi cơ sở dữ liệu của một công cụ tìm kiếm cũng chỉ là một phần
nhỏ của tồn bộ mạng thơng tin tồn cầu. Cơng cụ tìm kiếm cung cấp cho bạn các
đường kết nối tới các trang web. Bạn nhấn chuột v ào các đường kết nối này và tải về
các văn bản, hình ảnh, âm thanh, và các thông tin khác từ các máy chủ khác nhau tr ên

khắp thế giới.
1.2.1 . Thông tin trên internet
Vậy những thơng tin gì bạn có thể tìm thấy trên Internet? Không thể liệt kê tất cả các loại
nguồn tin có trên Internet, đặc biệt khi Internet thay đổi rất thường xun và nhanh chóng.
Tuy nhiên, nhìn chung Internet hữu ích nhất khi tìm kiếm những thơng tin trong các nhóm
sau đây (chú ý phần lớn những thơng tin này là bằng tiếng Anh):
 Các sự kiện đang diễn ra, ví dụ: tin tức ngày hơm nay, hay những xu hướng mới nhất
 Thơng tin kinh tế, ví dụ: thơng cáo báo chí của một cơng ty, chỉ số chứng khốn, thơng
tin về sản phẩm
 Thơng tin của chính phủ, ví dụ: các chính sách hiện hành, luật pháp, các cuộc thảo luận
tại quốc hội, quyết định của tòa án, thơng cáo báo chí
 Văn hóa đại chúng, ví dụ: phim, nhạc, truyền hình, thể thao chuyên nghiệp



1.2.2. Các bước cơ bản tìm kiếm thơng tin ( dữ liệu ) trên internet

1.2.2.1 Phân tích u cầu tìm: Tự đặt ra câu hỏi để làm rõ yêu cầu thơng tin của mình.
Một số câu hỏi cần đặt ra:
Tơi muốn biết thông tin cụ thể ở nước nào, vùng nào?
Tơi cần những thơng tin về các vấn đề nóng hổi hiện nay hay là thơng tin mang tính lịch
sử?
1.2.2.2.Diễn đạt lệnh tìm kiếm - giới thiệu về cú pháp của lệnh tìm
Cú pháp của lệnh tìm là cách thức chúng ta sử dụng để liên kết các khái niệm một cách
phù hợp cho lệnh tìm của bạn. Các máy tìm kiếm có những cách thức khác nhau trong việc

liên kết các thuật ngữ tìm.Nguyên tắc cơ bản nhất cho hầu hết các máy tìm kiếm là tương
tự như nhau, tuy nhiên có một vài điểm khác biệt nhỏ về cách diễn đạt lệnh tìm. Nếu chưa
hiểu rõ, bạn nên tham khảo phần Phân nhóm u cầu thơng tin “help” để biết thêm thơng
tin.
1.2.2.3.Phân nhóm u cầu thơng tin: Loại yêu cầu tìm
Gồm các từ/cụm từ rõ ràng, dễ hiểu (gần như không thể bị hiểu nhầm sang nghĩa khác)
Gồm các từ phổ biến hoặc khái quát có thể có kết quả là q nhiều kết quả khơng phù hợp.
Tìm thơng tin khái qt về một chủ đề
Tìm kiếm thơng tin theo một chủ đề hẹp
Có thể diễn đạt bằng nhiều cách khác nhau
1.2.2.4.Chọn cơng cụ tìm kiếm phù hợp: Chọn cơng cụ tìm kiếm phù hợp với thơng tin mà
mình cần tìm.Xem xét cách thức làm việc của từng cơng cụ tìm và diễn đạt lại lệnh tìm để

có thể khai thác tối đa các chức năng của công cụ tìm đó. Cố gắng thực hiện việc tìm kiếm


trên nhiều cơng cụ tìm kiếm khác nhau. Xem các kết quả tìm và sử dụng các thuật ngữ
được sử dụng trong các văn bản tìm được để tìm kiếm lại.
1.2.2.5.Tìm lời khun từ một người: Bạn có thể tìm lời khun từ chun gia để chọn
được cơng cụ tìm kiếm hiệu quả nhất cũng như đưa ra được yêu cầu tìm kiếm thơng tin xác
thực nhất.
1.2.2.6 .Nếu bước đầu bạn chưa thành công - hãy thử lại: Trong một số trường hợp, có thể
bạn khơng may mắn. Vì vậy nếu chưa tìm được thơng tin bạn hãy quay lại từ bước đầu và
lần lượt thực hiện lại các bước.
1.2.2.7 .Đánh giá kết quả tìm kiếm: Trong quá trình tìm kiếm, đánh giá các dữ liệu thu thập

được là công việc cuối cùng của quy trình tìm kiếm dữ liệu. Q trình đánh giá là để loại
trừ ra những thơng tin khơng có giá trị đã đượ thu thập ở những bươc trên.


1.2.3. Chọn cơng cụ tìm kiếm phù hợp với u cầu thơng tin
Có thể truy cập đến rất nhiều cơng cụ tìm kiếm trên Internet. Sau đây là một vài công cụ
thông dụng nhất,tuy nhiên để hiểu sâu hơn về tính năng của từng cơng cụ, bản thân mỗi
người cần phải luyện tập và sử dụng nhiều.
1.2.3.1 Máy tìm kiếm
 Các máy tìm kiếm làm việc theo nguyên tắc tìm kiếm trong cơ sở dữ liệu được tự
động xây dựng bởi một robot, không phải do con người xây dựng. Máy tìm kiếm
sẽ so sánh các từ bạn đánh vào cửa sổ tìm kiếm với các từ được viết ở các trang

web mà nó lưu trữ.
 Luợng thơng tin mà các máy tìm kiếm có thể bao qt thường dao động từ một số
nhỏ và trong một phạm vi hẹp về nội dung cho đến 90% của các trang web có thể
xử lý được.
 Kết quả tìm kiếm của bạn có phù hợp hay khơng là phụ thuộc vào khả năng sử
dụng nhuần nhuyễn các tính năng và cú pháp của máy tìm kiếm và diện bao quát
của máy tìm kiếm mà bạn sử dụng.
 Điểm mạnh: Khi tìm kiếm một tài liệu cụ thể (tên tài liệu, tên người, tổ chức đã
biết), tìm kiếm các chủ đề khó phân loại.
 Điểm yếu: Khơng cho phép có một cái nhìn tổng quát về một chủ đề cụ thể (trong
đó có thể có những chủ đề nhỏ mà bạn chưa biết).
 Một số máy tìm kiếm tiêu biểu:

+) Google />+) alltheweb (trước đây là "Fast Search")

/>
+) AltaVista />+) Ask />=>Google có cơ sở dữ liệu lớn nhất, tuy nhiên cần lưu ý là khơng có một máy tìm kiếm
nào có thể tìm được tồn bộ thơng tin về một chủ đề.
1.2.3.2 Máy tìm kiếm liên thơng


 Các máy tìm kiếm liên thơng có thể cùng một lúc lướt qua một số máy tìm kiếm
khác, thường tìm được khoảng 10% kết quả tìm được ở mỗi máy tìm kiếm mà chúng
liên kết.
 Điểm mạnh: Thường tìm kiếm hiệu quả với nếu bạn chỉ sử dụng một từ hoặc một

cụm từ.
 Điểm yếu: Tuy nhiên bạn không thể sử dụng các chức năng tìm kiếm nâng cao của
từng máy tìm kiếm.
 Bạn cũng khơng thể tiến hành một phép tìm tồn diện và phức tạp.
 Một số máy tìm kiếm liên thơng tiêu biểu:
+)SurfWax />+) Ixquick />+) Metacrawler />1.2.4. Giới thiệu về một số bộ máy tìm kiếm
 Bộ máy tìm kiếm rất đa dạng và phong phú, vấn đề là bạn phải biết cách tìm kiếm
như thế nào để có được thơng tin mình cần tìm. Trên thế giới hiện có khoảng
263 cơng cụ tìm kiếm.
Ví dụ:

- Yahoo Search

- Altavista
- Infoseek
- Go.com Search
- Excite
- Lycos
- Hotbot Lycos Search
- Snap Search
- Google
- Netscape Search
- Direct Hit

- Lookmart

- Aj Search
- AboutSearch
- Asiaco
- Metacrawler
- Webcrawler
- American Online
Search
- Simple Search
- Businesseek
- CNET Search
- Company Site Locator


- MSN Internet Search
nay được phát triển
thành Bing.com
- Inference Find
- Euro Seek
- Search Port
- Find What Search
- Search Engine Guide
- Ask Jeeves Search
- Virtual Library
- InfoHighway
- Copernic


Tuy nhiên, phổ biến nhất là Google, Yahoo và Bing.
 Ở Việt Nam, Google là cơng cụ tìm kiếm được sử dụng phổ biến nhất, chiếm đến
90% số lượng tìm kiếm. Khoảng 74% người dùng Internet ở Việt Nam truy cập hàng
ngày vào Google trong khi đó Yahoo chí có 14% (theo khảo sát của cơng ty
VinaLink). Theo ComSore Inc, Google và Bing đã chiếm được những lợi thế nhất


định trong quý 1 năm 2010. Tại Mỹ thì google vừa dành được thêm 0.1 phần trăm,
tăng từ 65.4% lên 65.5%. Trong khi đó, Bing với những thay đổi tính năng liên tục
trong thời gian gần đây, đã tạo được sự tăng trưởng khá ấn tượng là thêm được 0.2%
thị phần, tăng từ 11.3% lên 11.5%.Với Yahoo thì việc dành thêm thị phần có vẻ

khơng đơn giản. Sau 2 tháng đầu năm, Yahoo đã để mất 0.2% thị phần của mình
giảm từ 17% xuống con 16.8%. Ngồi ra, hiện nay Việt Nam cũng đang phát triển
một số máy tìm kiếm
1.2.4.1 .Giới thiệu về một số máy tìm kiếm
1. Giới thiệu về máy tìm kiếm Yahoo
 Yahoo! Inc. là một tập đoàn đại chúng Hoa Kỳ với mục tiêu trở thành "dịch vụ
Internet toàn cầu hàng đầu cho người tiêu thụ và giới doanh nghiệp". Trang chính
của nó đặt tại , phiên bản tiếng Việt tại ,
một thư mục mạng lưới và một số dịch vụ khác, trong đó có Yahoo! Mail, Yahoo!
Search và Yahoo! New. Yahoo! được sáng lập bởi hai sinh viên cao học tại trường
Đại học Stanford là David Filo và Jerry Yang ( Dương Trí Viễn) vào tháng 1 năm
1994và được thành lập vào ngày 2 tháng 3 năm 1995. Trụ sở công ty được đặt tại

Sunnyvale, California. Ban đầu, Yahoo! Search bắt đầu như là một thư mục web của
các trang web khác, tổ chức trong hệ thống phân cấp một, trái ngược với một chỉ số
tìm kiếm của các trang. Vào cuối những năm 1990, Yahoo! đã phát triển thành một
cổng thơng tin chính thức với một giao diện tìm kiếm, vào năm 2007, một phiên bản
giới hạn tìm kiếm dựa trên lựa chọn ra đời
2.Giới thiệu về máy tìm kiếm Bing
 Được Giám đốc Điều hành của Microsoft Steve Ballmer tiết lộ vào ngày 28 tháng 5
năm 2009 tại hội nghị All Things D tại San Diego, Bing là một sự thay thế cho Live
Search; bộ máy tìm kiếm này được đưa lên trực tuyến hoàn toàn vào ngày 3 tháng 6
năm 2009. Mọi người biết nhiều đến cơng cụ tìm kiếm này là do nó được đặt mặc
định trong trình duyệt Internet Explorer. MSN Search ln gắn liền với trình duyệt
của Windows, và hệ điều hành của Microsoft luôn được xem là phổ biến nhất thế

giới. Vào năm 2006, MSN Search đã đổi tên thành Windows Live Search, sau đó
chuyển thành Live Search vào 2007, và cuối cùng Bing vào năm 2009. MSN Search
có thể trả về kết quả của bộ máy tìm kiếm do Microsoft xây dựng, chỉ mục của nó
được cập nhật hàng tuần. Windows Live Search là cơng cụ tìm kiếm thay thế hồn
tồn MSN Search giúp người dùng có thể tìm thơng tin cụ thể bằng cách dùng thẻ
(tab) tìm kiếm. Sau đó Microsoft đã tách Live Search ra khỏi dịch vụ Windows Live.
Cuối cùng, với nỗ lực cải tiến đáng kể về các dịch vụ tìm kiếm, một lần nữa Live
Search được chính thức thay thế bằng Bing.


3. Giới thiệu về Socbay
 Một trong số ít những trang tìm kiếm của Việt Nam xây dựng được bộ máy tìm kiếm

riêng. So vớiYahoo! hay Google, khả năng "hiểu" tiếng Việt của tỏ
ra tốt hơn nên đưa ra kết quả khá thuyết phục. Với mục tiêu đề ra là phát triển các
dịch vụ tìm kiếm chun biệt có tính liên kết nhằm đáp ứng nhu cầu đa dạng của
người sử dụng, Sóc bay đang khơng ngừng cải thiện chất lượng dịch vụ của mình.

 Được đưa vào nghiên cứu từ năm 2002, Sóc bay là hệ thống duy nhất được phát
triển trên nền tảng cơng nghệ tìm kiếm của Naiscorp. Trang web hiện tại đang cung
cấp các dịch vụ tìm kiếm đa dạng như: Tin tức, MP3, video, rao vặt, từ điển, hình
ảnh. Sự ra đời của Sóc bay là thành quả nghiên cứu lâu dài, bền bỉ của đội ngũ các
chuyên gia Việt Nam. Trang web có thể đáp ứng khoảng 80 triệu lượt truy cập mỗi
ngày, với tốc độ xử lí kết quả tìm kiếm chưa tới 1 giây.
4. Giới thiệu về Xalo.vn

Phát triển bởi công ty Tinh Vân, được phát triển theo hai hướng chủ
đạo.
Thứ nhất, Xa lộ tập trung đánh vào các nhu cầu quen thuộc của người dùng như tìm web,
tin tức, blog, MP3, video, ảnh…Sau đó, cơng cụ tìm kiếm này có thể đem đến cho người
xem những thơng tin chun sâu về một lĩnh vực nào đó như bất động sản, tài chính, thể


thao, du lịch…Đây thực sự là một lợi thế của Xa Lộ khi công ty Tinh Vân đã khéo léo kế
thừa kinh nghiệm sau nhiều năm cung cấp Vinaseek (một cơng cụ tìm kiếm khác) trước
đây.

 Trang web cung cấp thơng tin rất “Việt hóa” cho người dùng. Bởi lẽ giống Sóc bay,

Xa lộ cũng phát triển cơng cụ tìm kiếm riêng của mình, ưu tiên những kết quả trả về
của trang web Tiếng Việt. Với hơn 600.000 địa danh nổi tiếng của Việt Nam được
cung cấp thông tin đầy đủ, hơn 26.000 trò chơi mới kèm theo kho dữ liệu thơng tin
khổng lồ, người dùng khó lịng có thể bỏ qua phàn nàn điều gì về cơng cụ này.
C. Kỹ năng tìm kiếm thu thập dữ liệu hiệu quả trên Google.
1 . Giới thiệu về Google
 Các nhà sáng lập Larry Page và Sergey Brin đã đặt tên công cụ tìm kiếm mà họ tạo
ra là “Google”, cách chơi chữ của từ “googol”, thuật ngữ tốn học có nghĩa là số 1
được theo sau bởi 100 số 0. Tên này phản ánh khối lượng thông tin khổng lồ hiện có
và phạm vi sứ mệnh của Google: sắp xếp thơng tin của thế giới và làm cho thông tin
này trở nên hữu dụng và có thể truy cập trên tồn cầu.


Biểu trưng doodle đầu tiên của Google cho lễ hội Burning Man, tháng 8 năm 1998.


Bức vẽ nguệch ngoặc biểu trưng của Google cho ngày sinh của Robert Louis Stephenson,
tháng 11 năm 2010.
 Khi bạn truy cập www.google.com.vn hoặc một trong số hơn 150 miền khác của
Google, bạn có thể tìm thấy thơng tin bằng nhiều ngơn ngữ khác nhau, kiểm tra giá
chứng khốn và tỷ số các trận đấu thể thao, tìm các tiêu đề tin tức cũng như tra cứu
địa chỉ của bưu điện hoặc cửa hàng tạp hóa ở địa phương bạn. Bạn cũng có thể tìm
hình ảnh, video, bản đồ, bằng sáng chế và nhiều nội dung khác. Với công nghệ tìm
kiếm phổ qt, bạn có thể xem cùng lúc tất cả các nội dung này trong một trang kết
quả dành cho truy vấn của bạn và các dịch vụ như tìm kiếm được cá nhân hóa giúp

bạn thậm chí tìm thấy nhiều thông tin phù hợp với mối quan tâm của mình hơn.
Google cũng đang nỗ lực số hóa một số thông tin của thế giới mà cho tới gần đây
vẫn chưa được đăng trực tuyến như sách.
 Tìm kiếm là cách Google đã bắt đầu và đó vẫn là trọng tâm của những thứ mà
Google đang làm hiện nay. Google dành nhiều thời gian nghiên cứu cho lĩnh vực tìm
kiếm hơn bất kỳ sản phẩm nào khác vì tìm kiếm ln có thể trở nên tốt hơn và nhanh
hơn trong việc giúp bạn tìm thấy những điều mình muốn, khi bạn muốn, nơi bạn
muốn
 Google biết rằng bất kỳ khi nào bạn tìm kiếm trên web, bạn đều muốn tìm được càng
nhanh càng tốt, với tất cả những trang web mà bạn yêu thích nằm trong tầm tay bạn.
Do đó, Google cung cấp phần mềm, chẳng hạn như : Google Chrome để giúp bạn
duyệt web một cách nhanh chóng và dễ dàng. Và bởi vì có thể truy cập vào tất cả các

dịch vụ của Google cho dù bạn ở bất cứ đâu - ngay cả khi bạn không có máy tính
bên cạnh— Google giúp bạn dễ dàng sử dụng các sản phẩm mà bạn yêu thích
như Google Maps hay Gmail, ngay từ điện thoại của bạn.
 Google cũng đang nỗ lực đưa ra cải tiến nhằm giúp nhiều người hơn nữa có thể sử
dụng các điện thoại rẻ hơn và tốt hơn để truy cập Internet. Cùng với Open Handset
Alliance (Liên minh nguồn mở di động), Google đã phát triển Android, nền tảng
hoàn toàn mở đầu tiên của thế giới mà bất kỳ nhà phát triển điện thoại di động nào
cũng có thể sử dụng và bất kỳ nhà sản xuất phần cứng nào cũng có thể cài đặt trên
điện thoại.


 Năm 2006, Google đã mua lại YouTube, cho phép hàng tỷ người khám phá, xem và

chia sẻ các video gốc cũng như những nội dung chuyên nghiệp. Các nhà tạo nội
dung và các nhà quảng cáo lớn nhỏ đều có thể chia sẻ với nhau doanh thu được tạo
bởi những người xem và người hâm mộ của họ. Mỗi ngày trên YouTube, mọi người
khắp thế giới kết nối, chia sẻ thông tin và truyền cảm hứng cho những người khác
thơng qua video.
2.2 Kỹ năng tìm kiếm và khai thác dữ liệu trên google
2.2.1. Kỹ năng tìm kiếm cơ bản
2.2.1.1 Xác định từ khóa chính xác
 Để tìm kiếm thơng tin, trước tiên cần phải xác định Từ khóa (Key Word) của thơng
tin muốn tìm kiếm, đây là phần rất quan trọng, từ khóa là từ đại diện cho thơng tin
cần tìm. Nếu từ khóa khơng rõ ràng và chính xác thì sẽ cho ra kết quả tìm kiếm rất
nhiều, rất khó phân biệt và chọn được thơng tin như mong muốn. Cịn nếu từ khóa

q dài thì kết quả tìm kiếm có thể khơng có.
 Thơng thường chỉ cần nhập từ khóa muốn tìm và nhấn Tìm với Google (Search)
hoặc nhấn phím Enter thì Google sẽ cho ra nhiều kết quả tìm kiếm bao gồm địa chỉ
liên kết đến trang Web có từ khóa và vài dịng mơ tả bên dưới, chỉ cần nhấn trái
chuột vào địa chỉ liên kết sẽ mở được trang Web có thơng tin muốn tìm.
 VD : Muốn tìm thơng tin về khoa kế tốn đại học thương mại thì nhập “khoa kế
tốn đại học thương mại " (khơng có ngoặc kép) thay vì nhập "kế tốn thương
mại " sẽ cho kết quả khơng như mong muốn


 VD : Muốn tìm thơng tin về khoa kế tốn đại học thương mại thì nhập “khoa kế
tốn đại học thương mại " (khơng có ngoặc kép) thay vì nhập "kế tốn thương

mại " sẽ cho kết quả khơng như mong muốn


2.2.2.Kỹ năng tìm kiếm nâng cao
2.2.2.1 Loại bỏ một từ nào đó ra khỏi kết quả tìm kiếm
 Google sẽ tìm tất cả các trang Web có chứa từ khóa cần tìm nhưng khơng có từ bị
loại bỏ.
Cú pháp: từ khóa -từ loại bỏ
 VD : bạn muốn tìm các diễn đàn máy tính nhưng khơng có nói về hacking, bạn
có thể dùng từ khóa "computer forum -hack
2.2.2.2 Bắt buộc phải có một từ nào đó ra trong kết quả tìm kiếm
 Google sẽ tìm tất cả các trang Web có chứa từ khóa cần tìm và bắt buộc phải có

thêm từ bắt buộc.
Cú pháp: từ khóa +từ bắt buộc
 Ví dụ : nhập vào ơ tìm kiếm của Google vi tính +máy Google sẽ tìm các trang có
từ khóa vi tính và có từ máy trong đó.
2.2.2.3

Rút gọn từ khóa cần tìm

 Dùng để đại diện cho một, nhiều ký tự hoặc nhiều từ khóa quá dài.
Cú pháp: Từ khóa * từ khóa
Ví dụ : nhập vào ơ tìm kiếm của Google máy * tính Google sẽ tìm các trang có
từ khóa máy vi tính.

2.2.2.4 Tìm chính xác từ khóa
 Google sẽ cho ra các kết quả có chính xác từ khóa được chỉ định.
Cú pháp: “từ khóa“
Kỹ thuật này đặc biệt có ích khi bạn tìm kiếm một câu nói hoặc một câu thành
ngữ nổi tiếng, lời bài hát, lời thơ văn nổi tiếng
Thí dụ nhập vào ơ tìm kiếm của Google “máy tính“ Google sẽ cho ra kết quả là
máy tính, nhưng nếu dùng từ khóa máy tính thì kết quả có thể là máy vi tính.
 Các điều kiện lọc và thông số kèm theo từ khóa (từ muốn tìm) để giúp cho kết
quả tìm kiếm chính xác như mong muốn, các điều kiện lọc này được kết thúc
bằng dấu hai chấm (:) và tiếp liền theo sau (khơng có khoảng cách) là thơng số
hay từ khóa cần tìm
2.2.2.5 Tìm từ khóa theo tiêu đề trang web

 Google sẽ tìm tất cả các trang Web có tiêu đề chứa từ khóa cần tìm.
Cú pháp: intitle:từ khóa
Thí dụ nhập vào ơ tìm kiếm của Google intitle:Vnexpress Google sẽ tìm các trang
có từ Vnexpress trong tiêu đề.
 Từ khóa "intitle:từ_khóa_1 từ_khóa_2..." sẽ tìm các trang web có tiêu đề bắt buộc có
chứa từ_khóa_1 và nội dung hoặc tiêu đề có chứa từ_khóa_2.


VD "intitle:google search" sẽ tìm các trang web có tiêu đề chứa từ "google" và nội
dung có từ "search"
2.2.2.6 Tìm từ khóa trong một Web Site
 Google chỉ tìm các trang có từ khóa trong một website được chọn đó thôi. Không

cần chú ý đến các Web Site khác.
Cú pháp: từ khóa site:website.
Thí dụ nhập vào ơ tìm kiếm của Google cuộc sống số site:vtv.vn Google sẽ tìm các
bài viết có từ khóa cuộc sống số trong Web Site vtv.vn.
2.2.2.7 Tìm từ khóa trong địa chỉ trang Web
 Google sẽ tìm những địa chỉ liên kết có từ khóa cần tìm.
Cú pháp: inurl:từ khóa
Ví dụ nhập vào ơ tìm kiếm của Google inurl:facebook Google sẽ liệt kê những trang
có từ facebook trong địa chỉ liên kết của nó.
 Từ khóa "inurl:từ_khóa_1 từ_khóa_2..." sẽ tìm các trang web có địa chỉ URL bắt
buộc chứa từ_khóa_1 và nội dung trang web chứa từ_khóa_2.
Ví dụ nhập vào ơ tìm kiếm của Google inurl : dantri khuyen hoc" sẽ cho ra các trang

web có địa chỉ chứa từ "dantri" và chỉ đến phần "khuyen hoc".

2.2.2.8 Tìm File (tập tin) có cùng loại
 Google sẽ tìm những trang có File (tập tin) có cùng loại (ext) và có tên giống từ khóa
cần tìm.
Cú pháp: từ khóa filetype:ext
Các file được trợ giúp tìm kiếm bao gồm:
+)
+)
+)
+)
+)

Thí dụ nhập vào ơ tìm kiếm của Google vi tính filetype:html Google sẽ liệt kê
những File html có từ vi tính.
2.2.2.9 Tìm Web Site có từ khóa liên quan với nhau


 Google sẽ tìm những WebSite có từ khóa giống nhau.
Cú pháp: related:từ khóa
Thí dụ nhập vào ơ tìm kiếm của Google related:VnIndex Google sẽ liệt kê những
Web Site có từ khóa liên quan với VnIndex.
2.2.2.10 Tìm lại Web Site khơng cịn hoạt động
Google sẽ tìm những Web Site đã ngưng hoạt động nhưng vần còn lưu trữ trong kho dữ
liệu của Google.

Cú pháp: cache:website
Thí dụ nhập vào ơ tìm kiếm của Google cache:www.thuongmai.biz Google sẽ liệt kê
những trang của Web Site thuongmai.biz đã được lưu trữ trong kho dữ liệu của Google.
==>> Có thể sử dụng một trong các điều kiện và thông số trên hoặc ghép chúng lại
với nhau.
Ví dụ nhập vào ơ tìm kiếm của Google: gia vang filetype:doc site:vietnamnet.vn sẽ cho
kết quả là tất cả các File .doc có nội dung gia vang trên Web Site vietnamnet.vn
2.2.2.11 Tìm giới hạn theo tên miền (domain):
 Nếu bạn muốn tìm thơng tin trong 1 website cụ thể nào đó, hãy dùng từ khóa
"site:URL".
VD tìm thơng tin về chương trình CuteFTP trong
trang www.download.com , bạn nhập

"cuteftp :www.download.com"
2.2.2.12 Tìm thơng tin liên quan về 1 website
 Từ khóa "info:URL" sẽ tìm các thơng tin liên quan về 1 trang web nào đó.
VD bạn nhập "info:www.google.com" sẽ xuất các thơng tin về
trang www.google.com


2.2.3 Một số lệnh tìm kiếm hữu ích khác
Có lẽ mục đích duy nhất của bạn khi sử dụng cơng cụ tìm kiếm là muốn thấy kết quả càng
chính xác càng tốt, nhưng đơi khi những gì mà bạn có được khơng đúng như mong muốn
vì kết quả chứa q nhiều thơng tin tạp, thậm chí khơng liên quan gì tới chủ đề bạn cần tìm
kiếm. Trong trường hợp này, sử dụng vài thuật tốn tìm kiếm có thể giúp ích cho bạn rất

nhiều.
* Lệnh tìm kiếm thơng tin phục vụ cho mục đích nhất định
- Cấu trúc: "mục đích" text "nội dung"
- Ví dụ: vulnerabilities text yahoo (tìm kiếm danh sách, chi tiết về những lỗ hổng bảo mật
bằng cơng cụ tìm kiếm Yahoo).
* Lệnh tháo gỡ rắc rối về một chủ đề
- Cấu trúc: "mục đích" help "nội dung"
- Ví dụ: vulnerabilities help yahoo
* Lệnh tìm kiếm những thơng tin mới nhất
- Cấu trúc: What's news
* Lệnh tìm kiếm đối với các cụm từ nhất định
- Cấu trúc: "+" search

- Vì Google có xu hướng bỏ qua một số từ hoặc kí tự thơng dụng như: "where" và "how",
các con số đơn và chữ cái, nên nếu trong từ khoá của bạn những từ này, bạn cần phải cho
thêm dấu "+" vào trước (nhớ là có khoảng trắng trước dấu "+").
- Ví dụ: Bạn cần tìm kiếm bộ film Star Wars tập 1, thay vì bạn gõ cả cụm từ Star Wars
Episode I vào ơ tìm kiếm, bạn cần chia từ khố này thành 2 phần vì nó có chứa con số (số
1):
* Tìm từ đồng nghĩa
- Cấu trúc: " ~" Searches
Bạn khơng chỉ muốn tìm kiếm một từ khố đặc biệt mà cịn muốn tìm từ đồng nghĩa của
nó? Hãy đặt dấu "~" vào trước chúng:
* Lệnh gộp



- Cấu trúc: * "OR" Searches
- Google hỗ trợ cả thuật toán "OR", nên bạn muốn hiển thị cả nghĩa A và B, bạn cần bổ
sung thêm từ "OR" ở giữa.
Kể từ khi trở thành cơng cụ tìm kiếm Internet số một thế giới, Google đã không ngừng
nghiên cứu và phát triển các kỹ thuật mới nhằm cải thiện chất lượng dịch vụ. Tháng trước
Google đã cho mời các nhà xuất bản trên thế giới đăng tải bản mô tả về nội dung của sách
vào kho lưu trữ của Google, cho phép người dùng xem trước nội dung trước khi quyết định
mua.
Google cung cấp cho bạn rất nhiều dịch vụ và cơng cụ nhằm giới hạn vùng tìm kiếm cũng
như hỗ trợ bạn tìm kiếm thơng tin dễ dàng hơn. Ngồi ra, nó cịn hỗ trợ để bạn đưa cơng cụ
tìm kiếm này vào trình duyệt hoặc các trình ứng dụng do bạn tạo ra.

2.2.4 Hộp thoại “ Tìm kiếm nâng cao với Google”
Ngồi những thủ thuật tìm kiếm thơng thường, Google cịn cung cấp cho người sử dụng
một tính năng tìm kiếm nâng cao rất hữu dụng mà khơng phải ai trong chúng ta cũng biết
rất thuận tiện cho chúng ta khi khơng nhớ câu lệnh tìm kiếm . Với tính năng tìm kiếm nâng
cao này, bạn có thể dễ dàng tìm kiếm theo cụm từ hoặc theo từng từ riêng biệt. Bạn cũng
có thể tìm kiếm dưới dạng các file văn bản với các định dạng thông dụng… với rất nhiều
ngôn ngữ khác nhau.
Để sử dụng chức năng này của Google, bạn truy cập vào địa chỉ
/>Sau khi truy cập vào trang web, bạn sẽ thấy rõ tính năng tìm kiếm này của Google được
chia ra làm 3 phần cụ thể:
Phần đầu tiên sẽ giúp bạn tìm kiếm trang web thơng qua những từ khóa liên quan đến nội
dung của trang web:

- Để tìm kiếm theo một cụm từ, bạn điền nội dung tìm kiếm vào mục “tất cả các từ” hoặc
tìm từng từ cụ thể bắt cách điền nội dung của từng từ vào các mục của phần “một hoặc
nhiều những từ này”.
- Để kết quả không chứa những từ khóa khơng cần thiết, bạn điền những từ khóa khơng
mong muốn tìm được vào mục “bất kỳ từ nào trong số những từ không mong muốn
này” (tương tự như cách sử dụng dấu “-“ đã hướng dẫn ở trên).


Sau khi đã điền những thông tin cần thiết cho sự tìm kiếm, bạn click vào nút Tìm kiếm
nâng cao để bắt đầu quá trình tìm kiếm .

Để kết quả tìm kiếm được tốt và chính xác hơn, bạn xác nhận thêm các thông tin cần thiết

ở mục “ cần thêm công cụ? ” bên dưới.
- Tại phần này, bạn có thể xác lập số kết quả sẽ hiện trên 1 trang để Google hiển thị kết quả
tìm kiếm tại mục kết quả mỗi trang. Điều này sẽ giúp bạn dễ dàng theo dõi các kết quả tìm
kiếm mà khơng cần phải chuyển qua lại giữa các trang kết quả.
- Bạn cũng có thể tìm kiếm kết quả dưới nhiều ngôn ngữ khác nhau. Thông thường Google
sẽ dựa vào ip của lượt tìm kiếm để đưa ra kết quả cần thiết. Chẳng hạn những người sử
dụng internet Việt Nam sẽ nhận được kết quả tìm kiếm bằng tiếng Việt trước rồi mới đến
kết quả tiếng Anh sau. Tuy nhiên, bạn có thể thiết lập để nhận được kết quả bằng ngôn ngữ
mong muốn tại mục ngôn ngữ. Sau khi lựa chọn ngơn ngữ thích hợp, những kết quả liên
quan đến từ khóa tìm kiếm được viết dưới ngơn ngữ bạn đã chọn sẽ được ưu tiên xếp đầu
trong danh sách kết quả.
- Nếu bạn muốn tìm kiếm những kết quả dưới dạng các file văn bản hoặc các file nguồn,

bạn có thể sử dụng tính năng loại tệp. Chẳng hạn bạn muốn tìm 1 file văn bản word chứa
các thơng tin cần thiết để có thể dễ dàng tải về máy và sử dụng thì bạn sẽ chọn Microsoft
Word (.doc) tại mục này.


Tuy nhiên nếu như với những sự giúp đỡ như trên vẫn chưa đủ để giúp bạn có được 1 kết
quả mong muốn thì bạn có thể nhờ đến sự trợ giúp của tính năng tiếp theo bằng cách click
vào dấu + ở mục ngày, quyền sử dụng, phạm vi số và nhiều hơn nữa.
Sau khi click vào dấu + tại đây, một số các sự lựa chọn mới sẽ xuất hiện để bạn có thể lựa
chọn sao cho kết quả tìm kiếm là tối ưu nhất. Tuy nhiên trong số các mục lựa chọn mới
này, bạn chỉ cần quan tâm đến 3 nội dung:
-Quyền sử dụng : Điều này là cần thiết khi bạn tìm kiếm những nội dung có bản quyền

hoặc miễn phí… chẳng hạn như phần mềm, ebook, mp3…
- Khu vực: là quốc gia chứa những kết quả tìm kiếm của bạn. Chẳng hạn bạn tìm cửa hàng
để mua 1 vật dụng tại Việt Nam thì bạn sẽ chọn khu vực là Việt Nam.
- Và nội dung cuối cùng cần quan tâm đó là lựa chọn Tìm kiếm an toàn. Với lựa chọn này,
những trang web lừa đảo, chứa những đoạn mã độc hay những trang web với nội dung
khiêu dâm, bạo lực… sẽ bị lọc ra khỏi kết quả tìm kiếm. Điều này sẽ giúp bạn yên tâm hơn
cho kết quả tìm kiếm của mình.





×