Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (97.29 KB, 3 trang )
5 thách thức lớn của công nghệ tìm kiếm kế tiếp
Nhu cầu hiện hữu hoặc chưa hiện hữu. Ngày nay, chúng ta khá thỏa mãn với
những gì mà Google mang lại. Nhưng chưa chắc cảm giác này còn tồn tại ở
tương lai. Ngay cả với cha đẻ Google, Search Engine do họ tạo ra sẽ không
dừng ở khả năng hiện tại bởi những nhu cầu sắp tới, sự cạnh tranh dữ dội từ
đối thủ và thách thức phát triển của Internet. Bằng hiểu biết hạn hẹp, người
viết xin được đưa ra 5 vấn đề lớn mà các máy tìm kiếm đã, đang và sẽ cần
giải quyết trong tương lai gần.
Thách thức thứ nhất: Dữ liệu Web 2.0
Không cần phải đề cập nhiều, sự bùng nổ của Web 2.0 kéo theo trào lưu
người dùng tham gia tạo nội dung trên Internet. Sự bùng nổ này là một thách
thức lớn với việc xử lý dữ liệu trong hệ thống máy tìm kiếm.
Khoảng 5 năm trở lại đây, dữ liệu gia tăng đột biến về lượng. Lượng dữ liệu
này tồn tại trên các diễn đàn, blog, wiki, social network, multimedia
service, cùng với một lượng dữ liệu rác khổng lồ đang được tạo ra hàng
ngày. Bằng giải pháp lưu trữ và xử lý phân tán, máy tìm kiếm hiện tại giải
quyết khá hoàn hảo nhiệm vụ này. Tuy nhiên, tốc độ tăng trưởng dữ liệu
chẳng những không ngừng mà thậm chí còn mạnh hơn. Đồng nghĩa với nó,
chi phí băng thông, phần cứng lưu trữ, năng lực phần mềm, năng lượng,
duy trì trung tâm dữ liệu sẽ tăng lên đặt ra những thách thức về giá: giá phát
triển và giá vận hành hệ thống search engine.
Không phải bất cứ nhà quản trị nào cũng muốn Google đánh chỉ mục
Website của họ. Và cũng có rất nhiều trang bắt người dùng đăng ký thành
viên mới cho phép xem nội dung. Mỗi khi Crawler ghé thăm site là một lần
trang Web bị ngốn băng thông rất lớn, có thể vượt xa với lượng người vào
trang mỗi ngày.
Dịch vụ mạng 2.0 bùng nổ, dữ liệu cá nhân được sinh ra và tồn tại trên