XÂY DỰNG HỆ THỐNG QUÉT THƯ
RÁC TRÊN MÔI TRƯỜNG PHÂN
TÁN
Nhóm thực hiện:
Trần Kinh Lý – 0612252
Phạm Quốc Mỹ – 0612271
Giáo viên hướng dẫn:
GVC. Cao Đăng Tân
ThS. Đào Anh Tuấn
Page 2
Nội dung
Tổng quan về luận văn.
1
Tổng quan về thư rác
2
3
Hệ thống thử nghiệm
4
Các kết quả đạt được
5
Hướng phát triển
6
Các kỹ thuật quét thư rác sử dụng trong hệ thống
Page 3
Mục đích chọn luận văn
•
Thư rác là một trong những thách thức lớn nhất hiện nay.
•
Đa số các phần mềm chống thư rác là dựa trên header của thư hoặc
địa chỉ từ người gửi
=> luận văn dựa vào nội dung của thư
=> tốc độ quét thư chậm
=> quét thư trên môi trường song song
Vì những lý do trên đề tài “Xây dựng hệ thống quét thư rác trên
môi trường phân tán” được hình thành.
Tổng quan về luận văn
Page 4
Định nghĩa thư rác:
thư rác là thư điện tử không theo mong muốn của người nhận và trong số
đó các thư điện tử quảng cáo, thương mại chiếm đa số
Tổng quan về thư rác
Page 5
Các đặc tính của thư rác:
•
Thư rác mang tính tương đối.
•
Tính bất biến trong một thư rác.
Tổng quan về thư rác
Page 6
Blacklisting: danh sách địa chỉ không tin cậy.
Whitelisting: danh sách địa chỉ tin cậy.
Heuristic filtering: dựa vào tập luật.
Challenge/ Response: xác thực người dùng.
Throttling: khống chế số lượng email được gửi.
Address obfuscation: thay đổi định dạng chống thu thập
email.
Collaborative filtering: nhóm người dùng tin cậy.
Các kỹ thuật lọc thư rác
Page 7
Kỹ thuật thống kê
Kỹ thuật so khớp
Các kỹ thuật quét thư rác sử dụng trong hệ thống
xây dựng
Page 8
Kỹ thuật thống kê
Các kỹ thuật quét thư rác sử dụng trong hệ thống
xây dựng
Thư điện tử
Tập dữ liệu
lịch sử
Là spam ?
Gửi tới người dùng
Máy phân tích
Bộ tách từ
Huấn luyện
Đánh dấu
Người dùng
phản hồi
Bộ lọc xác
định đúng?
Sai
Không
PHÂN LOẠI HUẤN LUYỆN
Đúng