BÀI GIẢNG
NGHIÊN CỨU KHOA HỌC
BẬC NGHIÊN CỨU SINH TIẾN SỸ
HỆ THỐNG THÔNG TIN
CHƯƠNG 2. TiẾN HÀNH NGHIÊN CỨU
PGS. TS. HÀ QUANG THỤY
HÀ NỘI 09-2015
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐẠI HỌC QUỐC GIA HÀ NỘI
1
Nội dung
Quá trình NCKH
2.
Lý thuyết hóa
3.
Phương pháp nghiên cứu
Một số bài học trong tiến hành nghiên cứu
1.
4.
2
1. Quá trình NCKH
1.1. Vai trò của tài liệu trong quá trình nghiên cứu
1.2. Đặt câu hỏi nghiên cứu
1.3. Thiết kế nghiên cứu
1.4. Phương pháp luận nghiên cứu khoa học
3
Vai trò của tài liệu trong QT nghiên cứu
Ba loại kiến thức cần có trong hành trình NCS
Kiến thức về miền nghiên cứu và chủ đề quan tâm
Kiến thức về lý thuyết liên quan giúp NCS lên khung được câu hỏi và hiện tượng
Kiến thức về phương pháp nghiên cứu liên quan được NCS áp dụng để phát triển
kiến thức mới, xây dựng các sản phẩm sáng tạo hay tường minh các câu hỏi mới.
Loài người hình thành truyền thống: Tích lũy tri thức bằng cách bổ sung công bố khoa
học và kho tri thức. NCS công bố bài báo, chương sách, sách
Sơ bộ về vai trò của tài liệu
Sách và bài báo; cập nhật hơn: thông báo các hội nghị quốc tế
cung cấp cả ba loại kiến thức trên đây
Cần suốt hành trình nghiên cứu
NCS cần dành thời gian đáng kể để tìm kiếm, chọn lọc, phân tích tài liệu: Hiểu vững
thân tri thức → đóng góp vào thân tri thức
4
Vai trò tài liệu
Hệ thống tài liệu chỉ dẫn
mức độ, chủng loại, và bản chất các vấn đề tới hiện thời: tạo độ khả thi để hình thức
hóa vấn đề nghiên cứu.
sự thiếu hụt tri thức xung quanh một vấn đề cụ thể: Hỗ trợ xác định câu hỏi NC hàn lâm
quan trọng (câu hỏi NC được quan tâm nghiên cứu vì câu trả lời sẽ đóng góp thân tri
thức).
mức độ mà lý thuyết hiện thời để giải thích được về các đặc thù của hiện tượng hoặc
vấn đề, và tương ứng là chỗ mà chúng còn thiếu hụt
chiến lược và phương pháp đã được dùng trong quá khứ để nghiên cứu các hiện
tượng/vấn đề (hoặc các hiện tượng hoặc các vấn đề liên quan)
các lý thuyết liên quan được dùng để lên khung cuộc khảo sát
thân tri thức hiện thời về phương pháp nghiên cứu có sẵn (như, các quy trình và hướng
dẫn thực hiện một loại nghiên cứu riêng cho vấn đề cụ thể)
• Hệ thống tài liệu: tri thức nền tảng quan trọng
5
Vai trò tài liệu
Hệ thống tài liệu cung cấp
phát hiện và hiểu biết sâu một miền bài toán cụ thể
lý thuyết sẵn có và/hoặc được sử dụng để khảo sát các vấn
đề/hiện tượng quan tâm
Tình trạng hiện thời của các phương pháp được làm phù hợp
và áp dụng cho nghiên cứu
Quá trình đọc-nghĩ-giải thích
Không phải mọi tài liệu /mọi phần trong tài liệu liên quan là liên
quan: đọc, nghĩ về sự liên quan, giải thích về sự liên quan.
Hầu hết NCS đánh giá thấp sự liên quan của các bài báo khác:
cần theo phương châm “đọc hơi nhiều còn hơn là đọc không đủ”
6
Đọc-nghĩ-giải thích
Những câu hỏi thu hoạch
Đóng góp cốt lõi của tài liệu cho thực tế hiện đại của lĩnh vực
nghiên cứu là gì?
Liên quan gì tới tài liệu khác và thực tế khác ?
đi theo một khía cạnh lý thuyết/phương pháp có ích để nghiên
cứu hiện tượng riêng được quan tâm ? Và tại sao nó là/không là
một trường hợp?
Ảnh hưởng ra sao đến suy nghĩ riêng của NCS tới lĩnh vực NC ?
Suy nghĩ như thế nào về tác động của bài báo tới thân tri thức
trong lĩnh vực tại thời điểm được công bố.
7
Đọc-nghĩ-giải thích
Những câu hỏi thu hoạch
Về lý thuyết: xem
Bỏ?
Về phương pháp
/>:88/quant/default.asp ...
Tài liệu ngoài miền nghiên cứu
Phát hiện lý thuyết phổ biến trong các lĩnh vực nghiên cứu khác, bên
cạnh miền nghiên cứu cụ thể
Thấy cách các phương pháp được áp dụng trong lĩnh vực nghiên cứu
khác, đặc biệt là về các hướng dẫn và tiêu chuẩn đánh giá có sẵn
Phát triển một tiếp xúc với cách thức của các học giả khác trong lĩnh
vực khác lên khung, kiểm tra, và giải vấn đề thế giới thực, theo nghĩa
chung nhất
8
Kinh nghiệm nhỏ
Hai thông tin cần thiết cơ bản nhất
Hội nghị/tạp chí hàng đầu thế giới về lĩnh vực NC
Nhà khoa học hàng đầu thế giới về lĩnh vực, về chủ đề NC riêng
(chú ý các NCS)
Hội nghị thế giới về lĩnh vực chuyên sâu
Các hiệp hội nghề nghiệp
Association for Computing Machinery - ACM: />Association for Information Systems – AIS: />IEEE-CS: />và các phân hội của các hiệp hội này,
chẳng hạn KDD: hoặc Process M:
/>
Các bài toán được đặt ra
Các báo cáo mời
Các bài báo được giải thưởng
Ví dụ: KDD 2016 (Xem trang sau)
9
Hội nghị KDD 2016
10
Hội nghị KDD 2016: Các ủy ban
11
Hội nghị KDD 2016: Các ủy ban
12
Hội nghị KDD 2016: Các ủy ban
13
KDD 2015: Keynote Talks
Ron
Kohavi .
Online
Controlled
Experiment
s: Lessons
from
Running
A/B/n ;
Tests for />12 years. rimentsKDDKeynoteNR.pptx
;
/>14
rimentsKDDKeynoteNR.pdf
KDD 2014: Keynote Talks. Oren Etzioni
/>
Deep learning has catapulted to the front page of the New York Times, formed
the core of the so-called 'Google brain', and achieved impressive results in
vision, speech recognition, and elsewhere. Yet researchers have offered simple
conundrums that deep learning doesn't address. For example, consider the
sentence: 'The large ball crashed right through the table because it was made of
Styrofoam.' What was made of Styrofoam? The large ball? Or the table? The
answer is obviously 'the table', but if we change the word 'Styrofoam' to 'steel',
the answer is clearly 'the large ball'. To automatically answer this type of
question, our computers require an extensive body of knowledge. We believe
that text mining can provide the requisite body of knowledge. My talk will
describe work at the new Allen Institute for AI towards building the nextgeneration of text-mining systems.
15
Kinh nghiệm nhỏ
Nhà khoa học hàng đầu
Các nhà khoa học được giải thưởng:
Ví dụ, ACM : />KDD: />Những người báo cáo mời tại các hội nghị hàng đầu
Những người hướng dẫn NCS được các giải thưởng
ACM: />KDD: />(có thể) Những người viết các bài tổng quan về vấn đề nghiên
cứu được công bố tại các ấn phẩm có uy tín
Trang web :
một danh sách các nhà khoa học có chỉ số h-index cao (Google
Scholar); Không chỉ ra chủ đề nghiên cứu
Lưu ý: Vào trang web của nhà khoa học hoặc các nguồn tra cứu
để loang tới những bài báo cập nhật nhất
16
Kinh nghiệm nhỏ: Tra cứu tài liệu
DBLP
Digital Bibliography & Library Project DBLP: The DBLP Computer
Science Bibliography
/>
Để tìm công bố của một tác giả trên DBLP
+ Tìm kiếm Google với câu hỏi ““tên_người"+DBLP”
+ Tìm dòng kết quả: dblp: tên_người
+ Vào trang web tương ứng
+ Có thể biết các chủ đề nghiên cứu cập nhật
Các danh mục ISI : Tạp chí SCI, SCIE (ISI) và Hội nghị
/> /> />
Danh mục Scopus
/>category=0&area=0&year=2013&country=&order=sjr&page=0&min=0&min
_type=cd&out=xls
17
18
: Trang web công đồng DM
May
11,
2017
19
/>
Winner: Mining Latent Entity Structures From Massive Unstructured
and Interconnected Data. Chi Wang (student) and Jiawei Han (advisor) at
University of Illinois at Urbana-Champaign
Runner-up: Modeling Large Social Networks in Context. Qirong Ho
(student) and Eric Xing (advisor) at Carnegie Mellon University
May
Runner-up: Computing Distrust in Social Media. Jiliang Tang (Student) 11,
and Huan Liu (Advisor) at Arizona State University. Định hướng Khóa 2017
luận đại học K56: Thái Thị Hoài, Nguyễn Quỳnh Nga, Mai Công Đạt
Tài liệu tham khảo
Vai trò của tài liệu tham khảo
Danh sách tài liệu tham khảo phản ánh tính khoa học và thời sự của
báo cáo nghiên cứu (bài báo, luận án)
“Có một tập TLTK tốt là thành công gần 50%”
Phân bổ vị trí TLTK trong báo cáo
Mô tả tài liệu tham khảo
Trình bày như hướng dẫn của ấn phẩm hoặc tổ chức
Đầy đủ thông tin: (Các) Tác giả, tên tài liệu, nơi công bố (ấn phẩm,
các trang), thời gian công bố
Tính dễ hiệu chỉnh: đầu tiên đánh theo tên sau đó mới theo số
DBLP là một ví dụ tốt
Một số sai sót điển hình tại Việt Nam:
“thừa kế” TLTK: lấy TLTK từ một TLTK khác
thiếu thông tin: không đầy đủ thông tin
Trình bày các thành phần trong một TLTK không đúng
sắp xếp không theo đúng thứ tự quy định (như theo tên tác giả đầu)…
20
Tài liệu tham khảo
Chỉ dẫn TLTK
Mọi TLTK phải được chỉ dẫn (tham chiếu) trong nội dung báo cáo
Mọi chỉ dẫn đều phải có TLTK tương ứng
Chỉ dẫn tác giả:
1 tác giả A: viết tên tác giả A: “A [.]”
Hai tác giả A, B: viết “A và B [.] “ ( “A and B [.]” tiếng Anh)
Từ ba tác giả trở lên A, B, C : viết “A và cộng sự [.]” (“A et al. [.]”)
Một số TLTK quan trọng, trong lần xuất hiện đầu tiên nên có chỉ dẫn
năm, chẳng hạn, như “A và B, 2014 [10]”
Một số sai sót:
TLTK không được chỉ dẫn: TLTK “vô ích”: một trong những lý do là
“thừa kế” từ TLTK khác.
chỉ dẫn TLTK không có trong danh sách: lấy một đoạn viết ở một TLTK,
Chỉ dẫn các tác giả: không theo quy ước trên: từ 2 tác giả trở lên lại chỉ
viết tên tác giả đầu tiên
21
Câu hỏi nghiên cứu
Năm đầu tiên của hành trình NCS
Dành riêng để đáp ứng hai thách thức
Phương pháp và lý thuyết: Khảo sát một cách hệ thống các tài liệu hiện có
Phát triển câu hỏi nghiên cứu và kế hoạch nghiên cứu
Khảo sát một cách hệ thống các tài liệu
Có tính cấu trúc cao
Tập các sách, bài báo liên quan, và các lớp tốt điển hình, hội thảo, và bài giảng
(tutorial). Nhấn mạnh luận án TS liên quan
Tính cấu trúc tốt cho phép NCS nắm vững các phương pháp và lý thuyết liên quan
Thường là một chương của luận án: literature review.
Làm ít hơn: Không chấp nhận. Thuyết bất khả tri miền ứng dụng (domain-agnostic)
cho phép nghiên cứu có tính độc lập miền
Nền tảng tạo năng lực phương pháp NC tốt.
22
Một số vấn đề đặt câu hỏi nghiên cứu
"Phát biểu thang máy"
Không thể diễn đạt câu hỏi NC nếu không có độc thoại 5 phút “người nghe đã rời khỏi thang máy”
Lý do: không hoàn toàn hiểu câu hỏi hoặc không thể nói rõ đúng cách
Câu hỏi NC tốt chỉ khi là câu hỏi ngắn
Đủ phân biệt với các hiện tượng, vấn đề liên quan khác
“Cái gì vậy"
Câu hỏi nghiên cứu không quan trọng cho bất cứ ai: thờ ơ!
Thu hút: cần được hưởng lợi thực tế từ câu hỏi nghiên cứu
Vấn đề “cái gì vậy” xảy ra khi NCS khó khăn trong động lực và biện minh câu hỏi nghiên cứu
“Giải quyết thế giới"
Câu hỏi thực sự quan trọng song không thể giải được do tài nguyên (chỉ một mình NCS) và/hoặc thời
gian (2-3 năm).
Không tìm được giải pháp với tài nguyên và thời gian cho phép
23
Một số vấn đề đặt câu hỏi nghiên cứu
“Không giải được"
Câu hỏi không thể trả lời được đúng nghĩa
Lý do logic: Thông tin cần cho giải đáp không thể nhận được một cách logic hoặc hợp lệ
Lý do khả thi: Tính khả thi với các ràng buộc tài nguyên
Ví dụ: Nghiên cứu theo chiều dọc: phải trải qua nhiều năm
“Nhiều"
Đưa quá nhiều câu hỏi: câu hỏi quá hẹp/quá không thích hợp/quá lớn
Nên 01/02 câu hỏi
Một số ví dụ (Danh sách đen)
Câu hỏi quá rõ ràng: “Có thách thức khi dùng CNTT ?”
Câu hỏi không liên quan: “tác động thời tiết tới mức lương của chuyên viên HTTT ?“ . Chẳng hề liên quan !
Câu hỏi vô lý: “Trái đất phẳng?” Mọi người đều phản đối !
Câu hỏi định nghĩa: “xung đột công nghệ đặc trưng bởi sự bất đồng?”
Câu hỏi khẳng định: “một công cụ hỗ trợ quyết định có thể được phát triển để tạo điều kiện ra quyết định
cho giám đốc điều hành cấp cao bán lẻ”.
24
Một số hướng dẫn tìm câu hỏi NC tốt
Gợi ý
một tuyên bố quan trọng xác định hiện tượng được nghiên cứu
(các) câu hỏi nghiên cứu cung cấp khung tiêu chuẩn mà toàn bộ nghiên cứu Tiến sỹ xoay
quanh và tiến hóa nó (chúng)/
các câu hỏi nghiên cứu cung cấp khung gới hạn toàn bộ điều tra của NCS và trình diễn nó
trong luận án
Một số câu hỏi hướng dẫn
Hãy cho biết các câu hỏi nghiên cứu của lĩnh vực đó là gì ?
Hãy cho biết thân tri thức của lĩnh vực đó là gì ?
Những câu hỏi nghiên cứu quan trọng được thiết lập trong lĩnh vực là gì ?
Những vùng nào cần được tiếp tục khảo sát ?
Nghiên cứu NCS có lấp được một lỗ trống quan trọng? Nó dẫn đến một hiểu biết nhiều
hơn?
25