Tải bản đầy đủ (.doc) (4 trang)

Thông tin luận văn tiếng việt + tiếng anh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (118.26 KB, 4 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

------------

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc

***********

THÔNG TIN VỀ LUẬN VĂN THẠC SĨ
1. Họ và tên học viên: Trịnh Việt Dũng ......................... 2. Giới tính: Nam......................
3. Ngày sinh: 31/12/1981................................................ 4. Nơi sinh: Hà Nội...................
5. Quyết định công nhận học viên số: 857/QĐ-ĐT, ngày 29 tháng 10 năm 2012.............
6. Các thay đổi trong quá trình đào tạo:
7. Tên đề tài luận văn: Xây dựng hệ thống khảo duyệt Web phân tán và thu thập dữ liệu
phục vụ các hệ hỗ trợ quyết định........................................................................................
8. Chuyên ngành: Truyền dữ liệu và Mạng máy tính..... 9. Mã số: Chương trình đào tạo
thí điểm
10. Cán bộ hướng dẫn khoa học: TS. Nguyễn Đại Thọ......................................................
11. Tóm tắt các kết quả của luận văn: ................................................................................
- Luận văn đã tìm ra giải pháp cho việc xây dựng hệ thống khảo duyệt và thu thập dữ
liệu từ các Website (Web Crawler) và mạng xã hội Twitter (Twitter Crawler).
- Thiết kế, xây dựng hệ thống theo giải pháp đã chọn thông qua việc nghiên cứu các hệ
thống thu thập dữ liệu được trình bày trong các bài khoa học và các công cụ đã được
triển khai thực tế.
- Đưa ra hướng phát triển tiếp theo để nâng cấp hệ thống giúp hệ thống vận hành hiệu
quả hơn, có khả năng mở rộng cao hơn.
12. Khả năng ứng dụng trong thực tiễn:
- Hệ thống khảo duyệt Web và thu thập dữ liệu được sử dụng trong hệ thống trong các
máy tìm kiếm, hệ thống phân tích, làm cơ sở cho các hệ hỗ trợ quyết định.


- Hệ thống đã được sử dụng để xây dựng các dịch vụ như tìm kiếm ngữ nghĩa, phân loại
và phân cụm dữ liệu, phân tích, và trực quan hoá dữ liệu, đồng thời đã được triển khai tới
cơ quan, doanh nghiệp tại Hàn Quốc và Nhật Bản.
13. Những hướng nghiên cứu tiếp theo:
- Web Crawler: hỗ trợ giao thức FTP cho hệ thống thu thập dữ liệu web
- Twitter Crawler: tìm giải pháp mới cho việc thu thập đủ dữ liệu tweet


- MongoDB: triển khai replica set cho hệ thống lưu trữ dữ liệu

14. Các công trình đã công bố có liên quan đến luận văn:
Ngày 22 tháng 10 năm 2015
Xác nhận của cán bộ hướng dẫn
(Kí và ghi rõ họ tên)

Ngày 22 tháng 10 năm 2015
Học viên
(Kí và ghi rõ họ tên)

Nguyễn Đại Thọ

Trịnh Việt Dũng


VIETNAM NATIONAL UNIVERSITY, HANOI
UNIVERSITY OF TECHNOLOGY AND ENGINEERING

------------

SOCIALIST REPUBLIC OF VIETNAM

Independence – Freedom – Happiness

***********

INFORMATION ON MASTER’S THESIS
1. Full name: Trinh Viet Dung......................... 2. Sex: Male...........................................
3. Date of birth: 31/12/1981.............................. 4. Place of birth: Hanoi.........................
5. Admission decision number: 857/QĐ-ĐT.... Dated: 29/10/2012..................................
6. Changes in academic process:
7. Official thesis title: Design distributed Web Crawling System to Support Decision
Management Systems.
8. Major: Data Communication and Computer Networks

9. Code: ......................

10. Supervisors: Dr. Nguyen Dai Tho................................................................................
11. Summary of the findings of the thesis: ........................................................................
- The thesis states a solution to design distributed Web Crawling system (named Web
Cralwer). It specifies a solution to design distributed Twitter Social Network crawling as
well (named Twitter Crawler).
- Design and implement following by the selected solution.
- Deploy and evaluate the Web Crawling system.
- Introduce next step to improve current system.
12. Practical applicability, if any:
- The system could become a main component in search engine, analysis system and it
could be considered as fundamental for decision management system.
- This system works with other systems implemented by Saltlux such as synmantic
search, classification and clustering, analysis, and visualization for providing certain
services. It also is deployed to companies, enterprises in South Korea and Japan.
13. Further research directions, if any:

- Web Crawler: support FTP protocol
- Twitter Crawler: find new solution to get full of tweet
- MongoDB: implement replica set in database


14. Thesis-related publications: .........................................................................................
(List them in chronological order)
Date: 22/10/2015

Date: 22/10/2015

Signature: …………………......

Signature: …………………

Full name: Dr. Nguyen Dai Tho

Full name: Trinh Viet Dung

Note: “Information on Master’s Thesis” must be processed on Microsoft Word, font Unicode Times
New Roman, letter size 13. “Summary of the findings of the thesis” should be one-A4 page long.



×