Tải bản đầy đủ (.ppt) (13 trang)

Bài giảng Giới thiệu các hướng nghiên cứu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (96.11 KB, 13 trang )

Giới thiệu các hướng nghiên cứu
Nhóm nghiên cứu
NLP@MMLab

UIT - NLP

1


Người hướng dẫn
 Trưởng nhóm


TS. Nguyễn Lưu Thùy Ngân
 Giảng viên Khoa Khoa học Máy tính
 Trưởng phòng Đào tạo Đại học

 Thành viên


Nguyễn Văn Kiệt
 Bộ môn Khoa học và Kỹ thuật Thông tin

 Lĩnh vực nghiên cứu





Xử lý văn bản
Khai thác thông tin từ văn bản


Dịch tự động
Hệ thống hỏi đáp
UIT - NLP

2


1. Phân tích ngữ pháp tiếng Việt
(Vietnamese parsing)







Phân tích ngữ pháp tiếng Việt là kỹ thuật nền tảng của nhiều ứng
dụng XLNNTN.
Mục tiêu
 Nghiên cứu các thuật toán phân tích ngữ pháp tiếng Việt.
 Các loại phân tích cú pháp: Dependency Structure, PhraseStructure, CCG.
Đề tài cử nhân/thạc sĩ:
 Cài đặt thử nghiệm một số thuật toán phân tích ngữ pháp tiên
tiến.
Tham khảo




Kiet Van Nguyen, Ngan Luu Thuy Nguyen, Error Analysis for Vietnamese

Dependency Parsing, The 7th International Conference on Knowledge and
System Engineering(KSE), 10-2015, Hochiminh, Vietnam.
Quy Nguyen, Ngan Nguyen, và Yusuke Miyao, Utilizing State-of-the-art
Parsers to Diagnose Problems in Treebank Annotation for a Less
Resourced Language, The 7th Linguistic Annotation Workshop &
Interoperability with Discourse(LAW 7), 08-2013, Sofia, Bulgaria
UIT - NLP

3


2. Hỗ trợ viết tiếng Anh
(Writing assistance)
 Mục tiêu: Nghiên cứu các kỹ thuật ứng dụng XLNNTN để
hỗ trợ người nước ngoài viết tiếng Anh.
 Số lượng đề tài: 2.
 Đề tài cử nhân/thạc sĩ




Thuật toán sửa lỗi chính tả, ngữ pháp (grammar checking).
Thuật toán sửa lỗi văn phong (style checking).
Xây dựng phần mềm hỗ trợ.

 Tham khảo


Ngan
Nguyen,

Yusuke
Miyao,
Alignment-based
Annotation
of
Proofreading
Texts
toward
Professional Writing Assistance, The 6th International
Joint Conference on Natural Language Processing(IJCNLP
2013), 2013, Nagoya, Japan
UIT - NLP

4


3. Phân tích cảm xúc (Sentiment
Analysis)
 Mục tiêu:
+ Nghiên cứu kỹ thuật rút trích quan điểm từ văn bản.
+ Ứng dụng phân tích cảm xúc vào một số lĩnh vực:
Thương mại điện tử, giáo dục, mạng xã hội.
 Số lượng đề tài: 2.
 Đề tài cử nhân/thạc sĩ
Ứng dụng phân tích cảm xúc và việc xây dựng hệ thống đánh
giá phản hồi của sinh viên.
Phân tích cảm xúc các post trên mạng xã hội.
Phân tích quan điểm từ các post trên forum.
Hệ thống lắng nghe đánh giá trên một số sản phẩm/chương
trình: điện thoại di động, laptop, gameshow.

UIT - NLP

5


4. Dịch tự động Việt-Nhật (VietnameseJapanese machine translation)
 Mục tiêu: Nghiên cứu kỹ thuật dịch tự động Việt-Nhật,
Nhật-Việt.
 Số lượng đề tài: 2.
 Yêu cầu thêm: Biết căn bản tiếng Nhật hoặc sẵn sàng học
thêm tiếng Nhật.
 Đề tài cử nhân/thạc sĩ



Xây dựng dữ liệu song ngữ phục vụ nghiên cứu
Cài đặt thử nghiệm các thuật toán dịch tự động

UIT - NLP

6


5. Hệ thống hỏi đáp tự động (Question
Answering)
 Mục tiêu: Xây dựng hệ thống hỏi đáp trên một lĩnh vực cụ
thể.
 Số lượng đề tài: 2.
 Đề tài cử nhân





Xây dựng dữ liệu phục vụ nghiên cứu – Question Treebank.
Tiếp cận theo cú pháp (syntax) và ngữ nghĩa (semantic).
Tiếp cận theo Linked Data.

UIT - NLP

7


6. Yêu cầu đối với sinh viên


Yêu cầu chung đối với các bạn sinh viên:
 Đăng kí từ đầu học kỳ 5. Có thể sớm hơn càng tốt.
 Có kĩ năng lập trình tốt: C++, Java, hoặc Python.
 Tiếng Anh đọc hiểu được.
 Ham học hỏi, kiên trì.
 Tuân thủ kỉ luật làm việc của nhóm.
 Nếu có kiến thức nền tảng về xử lí ngôn ngữ tự nhiên, nhận
dạng, máy học là một lợi thế.

UIT - NLP

8


7. Lợi ích

 Học tập và nghiên cứu theo kế hoạch.
 Được cấp và sử dụng máy ảo với cấu hình cao.
 Có cơ hội viết báo khoa học tham gia các hội nghị khoa
học/tạp chí trong và ngoài nước.

UIT - NLP

9


8. Thông tin liên hệ
 Cô Nguyễn Lưu Thùy Ngân
 Email:
 Thầy Nguyễn Văn Kiệt
 Email:
 Số điện thoại: 098. 660. 4744

UIT - NLP

10


Công trình đã công bố (1)

















International Journals 
1. Ngan Nguyen, Jin-Dong Kim, Makoto Miwa, Takuya Matsuzaki, Tsujii Junichi, Protein Coreference
Resolution by Simple Semantic Classification, BMC Bioinformatics(BMC Bioinformatics), 3.02, 2012,
1471-2105
2. Jin-Dong Kim, Nguyen Ngan, Yue Wang Yue, Junichi Tsujii, Toshihisa Takagi, Akinori Yonezawa, The
Genia Event and Protein Coreference tasks of BioNLP Shared Task 2011, BMC Bioinformatics (BMC
Bioinformatics ), 13, 8, 2012
National Journals
International Conferences/Workshops
1. Kiet Van Nguyen, Ngan Luu Thuy Nguyen, Error Analysis for Vietnamese Dependency Parsing, The 7th
International Conference on Knowledge and System Engineering(KSE), 10-2015, Hochiminh, Vietnam
2. Nhi-Thao-Thi Tran, Minh Quoc Nghiem and Ngan Luu-Thuy Nguyen, Improving Vietnamese Sentence
Compression by Segmenting Meaning Chunks, The 7th International Conference on Knowledge and
System Engineering(KSE), 10-2015, Hochiminh, Vietnam
3. Quy Nguyen, Ngan Nguyen, và Yusuke Miyao, Utilizing State-of-the-art Parsers to Diagnose Problems
in Treebank Annotation for a Less Resourced Language, The 7th Linguistic Annotation Workshop &
Interoperability with Discourse(LAW 7), 08-2013, Sofia, Bulgaria
4. Ngan Nguyen, Yusuke Miyao, Alignment-based Annotation of Proofreading Texts toward Professional
Writing Assistance, The 6th International Joint Conference on Natural Language Processing(IJCNLP
2013), 2013, Nagoya, Japan
5. Xinjian Li, Tian Ran, Ngan Nguyen, Yusuke Miyao và Aizawa Akiko, Question Answering System for

Solving Entrance Exams in QA4MRE, Conference and Labs of the Evaluation Forum 2013(CLEF 2013),
09-2013, Valencia, Spain

UIT - NLP

11


Công trình đã công bố (2)















National Journals/International Conferences/Workshops
6. Quy Nguyen, Ngan Nguyen, và Yusuke Miyao, Comparing Different Criteria for Vietnamese Word
Segmentation, Workshop on South and Southeast Asian Natural Language Processing (SSANLP 2012 ),
2012, Bombay, India
7. Ngan Nguyen, Ngan Nguyen, Jin-Dong Kim và Junichi Tsujii, Overview of the Protein Coreference Task
in BioNLP Shared Task 2011, Proceedings of BioNLP Shared Task 2011 Workshop, 06-2011, Portland,

Oregon, United States
8. Yoshinobu Kano, Ngan Nguyen, Rune Sætre, K. Yoshida, Y. Miyao, Yoshimasha Tsuruoka, Yuichiro
Matsubayashi, Sophia Ananiadou và Junichi Tsujii, Filling the Gaps Between Tools and Users: A Tool
Comparator, Using Protein-Protein Interactions as an Example, The Pacific Symposium on
Biocomputing(PSB), 01-2008, Hawaii, United States
9. Yoshinobu Kano, Ngan Nguyen, Rune Sætre, Keiichiro Fukamachi, Kazuhiro Yoshida, Yusuke Miyao,
Yoshimasa Tsuruoka, Sophia Ananiadou và Jun'ichi Tsujii, Sharable type system design for tool interoperability and combinatorial comparison, The First International Conference on Global Interoperability
for Language Resources (ICGL), 01-2008, -, Hong Kong
10. Yoshinobu Kano, Yoshinobu Kano, Ngan Nguyen, Rune Sætre, K. Yoshida, K. Fukamachi, Yusuke
Miyao, Yoshimasha Tsuruoka, Sophia Ananiadou and Junichi Tsujii, Towards Data And Goal Oriented
Analysis: Tool Inter-Operability And Combinatorial Comparison, The 3rd International Joint Conference on
Natural Language Processing (IJCNLP 2008), 2008, Hyderabad, India
11. Nguyen Ngan, Nguyen Ngan, Jin-Dong Kim and Junichi Tsujii, Challenges in Pronoun Resolution
System for Biomedical Text, The 6th edition of the Language Resources and Evaluation(LREC), 05-2008,
Marrakech, Morocco
12. Ngan Nguyen, Jin-Dong Kim, Exploring Domain Differences for the Design of a Pronoun Resolution
System for Biomedical Texts, The 22nd International Conference on Computational Linguistics
2008(COLING 2008), 2008, Manchester, United Kingdom

UIT - NLP

12


Công trình đã công bố (3)












National Journals/International Conferences/Workshops
13. Quang Do, Ngan Nguyen, Dien Dinh, An Advanced Approach in English-Vietnamese Syntactic Tree
Transfer, Recent Advances in Natural Language Processing(RANLP), 09-2005, Borovets, Bulgaria
14. Dien Dinh, Ngan Nguyen, Quang Do, Nam Van, A Hybrid Approach to Word Order Transfer in English
to Vietnamese Machine Translation, Machine Translation Summit IX(MT Summit), 09-2003, Louisiana,
United States
15. Dien Dinh , Ngan Nguyen, Quang Do, Word Alignment in English-Vietnamese Bilingual Corpus,
International Conference on East-Asian Language Processing and Internet Information Technology
(EALPIIT), 01-2002, Hà Nội, Vietnam
National Conferences/Workshops
1. Ngan Nguyen, Ngan Nguyen và Yusuke Miyao, A Corpus for Studies on Academic Writing Assistance,
The 27th Annual Conference of the Japanese Society for Artificial Intelligence 2013(JSAI 2013), 05-2013,
Nagoya, Japan
2. Ngan Nguyen, Ngan Nguyen, Yusuke Miyao, Jin-Dong Kim và Jun'ichi Tsujii, Machine Learning-Based
Pronoun Resolution for Biomedical Text, The 14th Natural Language Processing Conference(NLP 2008),
03-2008, Tokyo, Japan

UIT - NLP

13




×