Tải bản đầy đủ (.pdf) (3 trang)

DSpace at VNU: Nghiên cứu giải quyết phân lớp địa hóa môi trường biển và áo dụng vào bài toán đánh giá địa hóa môi trường biển Việt Nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (195.85 KB, 3 trang )

Nghiên cứu giải quyết phân lớp địa hóa môi
trường biển và áo dụng vào bài toán đánh giá
địa hóa môi trường biển Việt Nam
Đoàn Thùy Linh
Trường Đại học Công nghệ
Luận văn Thạc sĩ ngành: Hệ thống Thông tin; Mã số: 60 48 05
Người hướng dẫn: TS. Đoàn Sơn
Năm bảo vệ: 2011
Abstract: Giới thiệu các khái niệm về môi trường biển, ô nhiễm môi trường và tổng
quan về địa hóa môi trường biển. Trình bày một số đặc trưng của địa hóa môi trường
biển (các thông số về trầm tích biển). Khảo sát miền dữ liệu về quan trắc môi trường
biển. Tìm hiểu các thuật toán liên quan đến hướng nghiên cứu về giải pháp phân lớp
địa hóa môi trường biển Việt Nam. Đưa ra mô hình đề xuất để giải quyết bài toán phân
lớp địa hóa môi trường biển Việt Nam và trình bày phương pháp giải quyết bài toán
phân lớp địa hóa môi trường biển Việt Nam dựa trên phương pháp máy hỗ trợ vector
(SVM) và phương pháp Naive Bayes. Tiến hành thực nghiệm việc xây dựng bộ dữ
liệu học, xây dựng bộ phân lớp SVM và Naive Bayes. Tóm lược những kết quả đạt
được của luận văn; nêu lên những hạn chế, những điểm cần khắc phục và đưa ra định
hướng nghiên cứu trong thời gian tới.
Keywords: Công nghệ phần mềm; Công nghệ thông tin; Phân lớp địa hóa; Môi
trường biển; Việt Nam
Content
Lời mở đầu

Bài toán phân lớp trong địa hóa môi trường biển là bài toán xác định xem các dữ liệu
đo các thông số từ trạm quan trắc sẽ nằm trong các mức nào theo qui định về môi trường. Đây
hiện là một trong những vấn đề đang được quan tâm vì thông qua việc phân lớp địa hóa môi
trường, ta có thể đưa ra các hướng xử lý nhanh cho vùng môi trường vừa được thực hiện công
tác đo đạc, khảo sát. Cũng từ đó có thể đưa ra được các chiến lược nhằm khắc phục, hạn chế
và bảo vệ các tác động do thiên nhiên hoặc con người gây ảnh hưởng đến môi trường biển.
Dựa trên cơ sở những yêu cầu của bài toán, dựa trên các đặc trưng của dữ liệu mà luận


văn chọn hai hướng tiếp cận sử dụng máy hỗ trợ vector (SVM) và Naive Bayes để giải quyết
bài toán phân lớp địa hóa môi trường biển. Ý tưởng của hướng tiếp cận là biểu diễn mỗi số
liệu trong mỗi kết quả đo là một vectơ đặc trưng. Sau đó được đưa vào bộ phân lớp SVM,
Naive Bayes để xác định tính chất tương đồng và đưa ra kết luận. Nguồn dữ liệu sử dụng là
các file dữ liệu về kết quả quan trắc môi trường biển thuộc các đơn vị có liên quan để xây
dựng dữ liệu học cho mô hình đề xuất.


Kết quả phần thực nghiệm bước đầu trên mô hình đề xuất đối với thuật toán Naive
Bayes và mô hình đề xuất đối với thuật toán SVM đạt độ chính xác là trên 80%. Tuy nhiên,
dựa vào kết quả thu được có thể cho thấy việc sử dụng thuật toán SVM cho kết quả cao hơn
so với thuật toán Naive Bayes và dựa kết quả này cũng có thể xem mô hình là khả thi và có
khả năng ứng dụng thực tế.
Nội dung của khóa luận bao gồm có 3 chương:
Chương 1: Giới thiệu các khái niệm về môi trường biển, ô nhiễm môi trường và tổng
quan về địa hóa môi trường biển. Trình bày một số đặc trưng của địa hóa môi trường biển
(các thông số về trầm tích biển).
Chương 2: Trên cơ sở những phương pháp tiếp cận trình bày ở chương 1 và thông qua
khảo sát miền dữ liệu về quan trắc môi trường biển, luận văn đã tìm hiểu các thuật toán liên
quan đến hướng nghiên cứu về giải pháp phân lớp địa hóa môi trường biển Việt Nam. Đây
cũng là cơ sở lý thuyết, phương pháp luận quan trọng để luận văn đưa ra mô hình đề xuất giải
quyết bài toán phân lớp địa hóa môi trường biển Việt Nam và đưa ra phương pháp giải quyết
bài toán phân lớp địa hóa môi trường biển Việt Nam dựa trên phương pháp máy hỗ trợ vector
(SVM) và phương pháp Naive Bayes.
Chương 3: Thực nghiệm, kết quả và đánh giá. Tiến hành thực nghiệm việc xây dựng
bộ dữ liệu học, xây dựng bộ phân lớp SVM và Naive Bayes.
Kết luận và định hướng phát triển: Tóm lược những kết quả đạt được của luận văn.
Đồng thời đưa ra những hạn chế, những điểm cần khắc phục và đưa ra định hướng nghiên cứu
trong thời gian tới.
References

Tiếng Việt
[1] Hà Quang Thụy, Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Nguyễn Thu
Trang, Nguyễn Cẩm Tú. Giáo trình khai phá dữ liệu Web. Nhà xuất bản Giáo dục Việt
Nam, 2009.
[2] Vũ Thanh Nguyên1, Trang Nhật Quang2 (2009) ,“Ứng dụng thuật toán phân lớp rút
trích thông tin văn bản FSVM trên Internet”, Tạp chí Phát triển Khoa học và Công
nghệ, tập 12, số 05-2009, tr25 -29, (1) Trường Đại học Công nghệ Thông tin – ĐHQG
HCM, (2) Sở Công nghiệp Thành phố Hồ Chí Minh.
[3] Bộ Tài nguyên và Môi trường. Báo cáo Hiện trạng môi trường quốc gia 2003 Hiện trạng môi trường Việt Nam, Hà Nội.
[4] Bộ Tài nguyên và Môi trường. Báo cáo hiện trạng môi trường quốc gia 2010 Tổng quan môi trường Việt Nam, Hà Nội
[5] Cục Điều tra và Kiểm soát tài nguyên - môi trường biển, Tổng cục Biển và Hải đảo
Việt Nam, Bộ Tài nguyên và Môi trường. Báo cáo Hiện trạng môi trường biển năm
2010, Hà Nội.
Tiếng Anh

2


[6] T. Finley, T. Joachims: Supervised clustering with Support Vector Machines,
Proceeding of the 22nd International Conference on Machine Learning, Germany 2005.
[7] Vincent Ng.: Machine Learning for Coreference Resolution: From Local
Classification to Global Ranking. Proceedings of the 43rd Annual Meeting of the
Association for Computational Linguistics (ACL-05), 2005
[8] Remco R. Bouckaert, Eibe Frank, Mark Hall, Richard Kirkby, Peter Reutemann,
Alex Seewald, David Scuse: WEKA Manual for Version 3-7-2, July 29, 2010
University of Waikato, Hamilton, New Zealand, …

3




×