Tải bản đầy đủ (.ppt) (47 trang)

Bài Giảng Nghiên Cứu Khoa Học Bậc Nghiên Cứu Sinh Tiến Sỹ Hệ Thống Thông Tin

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (949.16 KB, 47 trang )

BÀI GIẢNG
NGHIÊN CỨU KHOA HỌC
BẬC NGHIÊN CỨU SINH TIẾN SỸ
HỆ THỐNG THÔNG TIN
CHƯƠNG 2. TiẾN HÀNH NGHIÊN CỨU

PGS. TS. HÀ QUANG THỤY
HÀ NỘI 09-2015
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐẠI HỌC QUỐC GIA HÀ NỘI

1


Nội dung
Quá trình NCKH
2.
Lý thuyết hóa
3.
Phương pháp nghiên cứu
Một số bài học trong tiến hành nghiên cứu
1.

4.

2


1. Quá trình NCKH







1.1. Vai trò của tài liệu trong quá trình nghiên cứu
1.2. Đặt câu hỏi nghiên cứu
1.3. Thiết kế nghiên cứu
1.4. Phương pháp luận nghiên cứu khoa học

3


Vai trò của tài liệu trong QT nghiên cứu













Ba loại kiến thức cần có trong hành trình NCS
Kiến thức về miền nghiên cứu và chủ đề quan tâm
Kiến thức về lý thuyết liên quan giúp NCS lên khung được câu hỏi và hiện tượng
Kiến thức về phương pháp nghiên cứu liên quan được NCS áp dụng để phát triển

kiến ​thức mới, xây dựng các sản phẩm sáng tạo hay tường minh các câu hỏi mới.
Loài người hình thành truyền thống: Tích lũy tri thức bằng cách bổ sung công bố khoa
học và kho tri thức. NCS công bố bài báo, chương sách, sách

Sơ bộ về vai trò của tài liệu
Sách và bài báo; cập nhật hơn: thông báo các hội nghị quốc tế
cung cấp cả ba loại kiến thức trên đây
Cần suốt hành trình nghiên cứu
NCS cần dành thời gian đáng kể để tìm kiếm, chọn lọc, phân tích tài liệu: Hiểu vững
thân tri thức → đóng góp vào thân tri thức

4


Vai trò tài liệu









Hệ thống tài liệu chỉ dẫn
mức độ, chủng loại, và bản chất các vấn đề tới hiện thời: tạo độ khả thi để hình thức
hóa vấn đề nghiên cứu.
sự thiếu hụt tri thức xung quanh một vấn đề cụ thể: Hỗ trợ xác định câu hỏi NC hàn lâm
quan trọng (câu hỏi NC được quan tâm nghiên cứu vì câu trả lời sẽ đóng góp thân tri
thức).

mức độ mà lý thuyết hiện thời để giải thích được về các đặc thù của hiện tượng hoặc
vấn đề, và tương ứng là chỗ mà chúng còn thiếu hụt
chiến lược và phương pháp đã được dùng trong quá khứ để nghiên cứu các hiện
tượng/vấn đề (hoặc các hiện tượng hoặc các vấn đề liên quan)
các lý thuyết liên quan được dùng để lên khung cuộc khảo sát
thân tri thức hiện thời về phương pháp nghiên cứu có sẵn (như, các quy trình và hướng
dẫn thực hiện một loại nghiên cứu riêng cho vấn đề cụ thể)

• Hệ thống tài liệu: tri thức nền tảng quan trọng

5


Vai trò tài liệu


Hệ thống tài liệu cung cấp
 phát hiện và hiểu biết sâu một miền bài toán cụ thể
 lý thuyết sẵn có và/hoặc được sử dụng để khảo sát các vấn
đề/hiện tượng quan tâm
 Tình trạng hiện thời của các phương pháp được làm phù hợp
và áp dụng cho nghiên cứu



Quá trình đọc-nghĩ-giải thích
 Không phải mọi tài liệu /mọi phần trong tài liệu liên quan là liên
quan: đọc, nghĩ về sự liên quan, giải thích về sự liên quan.
 Hầu hết NCS đánh giá thấp sự liên quan của các bài báo khác:
cần theo phương châm “đọc hơi nhiều còn hơn là đọc không đủ”


6


Đọc-nghĩ-giải thích


Những câu hỏi thu hoạch

 Đóng góp cốt lõi của tài liệu cho thực tế hiện đại của lĩnh vực





nghiên cứu là gì?
Liên quan gì tới tài liệu khác và thực tế khác ?
đi theo một khía cạnh lý thuyết/phương pháp có ích để nghiên
cứu hiện tượng riêng được quan tâm ? Và tại sao nó là/không là
một trường hợp?
Ảnh hưởng ra sao đến suy nghĩ riêng của NCS tới lĩnh vực NC ?
Suy nghĩ như thế nào về tác động của bài báo tới thân tri thức
trong lĩnh vực tại thời điểm được công bố.

7


Đọc-nghĩ-giải thích



Những câu hỏi thu hoạch

 Về lý thuyết: xem
Bỏ?
 Về phương pháp
/>:88/quant/default.asp ...


Tài liệu ngoài miền nghiên cứu

 Phát hiện lý thuyết phổ biến trong các lĩnh vực nghiên cứu khác, bên
cạnh miền nghiên cứu cụ thể

 Thấy cách các phương pháp được áp dụng trong lĩnh vực nghiên cứu
khác, đặc biệt là về các hướng dẫn và tiêu chuẩn đánh giá có sẵn

 Phát triển một tiếp xúc với cách thức của các học giả khác trong lĩnh
vực khác lên khung, kiểm tra, và giải vấn đề thế giới thực, theo nghĩa
chung nhất

8


Kinh nghiệm nhỏ
Hai thông tin cần thiết cơ bản nhất



 Hội nghị/tạp chí hàng đầu thế giới về lĩnh vực NC
 Nhà khoa học hàng đầu thế giới về lĩnh vực, về chủ đề NC riêng

(chú ý các NCS)

Hội nghị thế giới về lĩnh vực chuyên sâu



 Các hiệp hội nghề nghiệp
Association for Computing Machinery - ACM: />Association for Information Systems – AIS: />IEEE-CS: />và các phân hội của các hiệp hội này,
chẳng hạn KDD: hoặc Process M:
/>





Các bài toán được đặt ra
Các báo cáo mời
Các bài báo được giải thưởng
Ví dụ: KDD 2016 (Xem trang sau)
9


Hội nghị KDD 2016

10


Hội nghị KDD 2016: Các ủy ban

11



Hội nghị KDD 2016: Các ủy ban

12


Hội nghị KDD 2016: Các ủy ban

13


KDD 2015: Keynote Talks

Ron
Kohavi .
Online
Controlled
Experiment
s: Lessons
from
Running
A/B/n ;
Tests for />12 years. rimentsKDDKeynoteNR.pptx

;
/>14
rimentsKDDKeynoteNR.pdf



KDD 2014: Keynote Talks. Oren Etzioni
/>
Deep learning has catapulted to the front page of the New York Times, formed
the core of the so-called 'Google brain', and achieved impressive results in
vision, speech recognition, and elsewhere. Yet researchers have offered simple
conundrums that deep learning doesn't address. For example, consider the
sentence: 'The large ball crashed right through the table because it was made of
Styrofoam.' What was made of Styrofoam? The large ball? Or the table? The
answer is obviously 'the table', but if we change the word 'Styrofoam' to 'steel',
the answer is clearly 'the large ball'. To automatically answer this type of
question, our computers require an extensive body of knowledge. We believe
that text mining can provide the requisite body of knowledge. My talk will
describe work at the new Allen Institute for AI towards building the nextgeneration of text-mining systems.

15


Kinh nghiệm nhỏ
Nhà khoa học hàng đầu



 Các nhà khoa học được giải thưởng:









Ví dụ, ACM : />KDD: />Những người báo cáo mời tại các hội nghị hàng đầu
Những người hướng dẫn NCS được các giải thưởng
ACM: />KDD: />(có thể) Những người viết các bài tổng quan về vấn đề nghiên
cứu được công bố tại các ấn phẩm có uy tín
Trang web :
một danh sách các nhà khoa học có chỉ số h-index cao (Google
Scholar); Không chỉ ra chủ đề nghiên cứu
Lưu ý: Vào trang web của nhà khoa học hoặc các nguồn tra cứu
để loang tới những bài báo cập nhật nhất
16


Kinh nghiệm nhỏ: Tra cứu tài liệu


DBLP

 Digital Bibliography & Library Project DBLP: The DBLP Computer
Science Bibliography
/>
 Để tìm công bố của một tác giả trên DBLP
+ Tìm kiếm Google với câu hỏi ““tên_người"+DBLP”
+ Tìm dòng kết quả: dblp: tên_người
+ Vào trang web tương ứng
+ Có thể biết các chủ đề nghiên cứu cập nhật



Các danh mục ISI : Tạp chí SCI, SCIE (ISI) và Hội nghị


 /> /> />


Danh mục Scopus

 />category=0&area=0&year=2013&country=&order=sjr&page=0&min=0&min
_type=cd&out=xls
17


18

: Trang web công đồng DM

May
11,
2017


19

/>
Winner: Mining Latent Entity Structures From Massive Unstructured
and Interconnected Data. Chi Wang (student) and Jiawei Han (advisor) at
University of Illinois at Urbana-Champaign
Runner-up: Modeling Large Social Networks in Context. Qirong Ho
(student) and Eric Xing (advisor) at Carnegie Mellon University

May

Runner-up: Computing Distrust in Social Media. Jiliang Tang (Student) 11,
and Huan Liu (Advisor) at Arizona State University. Định hướng Khóa 2017
luận đại học K56: Thái Thị Hoài, Nguyễn Quỳnh Nga, Mai Công Đạt


Tài liệu tham khảo


Vai trò của tài liệu tham khảo

 Danh sách tài liệu tham khảo phản ánh tính khoa học và thời sự của
báo cáo nghiên cứu (bài báo, luận án)
 “Có một tập TLTK tốt là thành công gần 50%”
 Phân bổ vị trí TLTK trong báo cáo


Mô tả tài liệu tham khảo

 Trình bày như hướng dẫn của ấn phẩm hoặc tổ chức
 Đầy đủ thông tin: (Các) Tác giả, tên tài liệu, nơi công bố (ấn phẩm,
các trang), thời gian công bố
 Tính dễ hiệu chỉnh: đầu tiên đánh theo tên sau đó mới theo số
 DBLP là một ví dụ tốt
 Một số sai sót điển hình tại Việt Nam:
 “thừa kế” TLTK: lấy TLTK từ một TLTK khác
 thiếu thông tin: không đầy đủ thông tin
 Trình bày các thành phần trong một TLTK không đúng
 sắp xếp không theo đúng thứ tự quy định (như theo tên tác giả đầu)…

20



Tài liệu tham khảo


Chỉ dẫn TLTK

 Mọi TLTK phải được chỉ dẫn (tham chiếu) trong nội dung báo cáo
 Mọi chỉ dẫn đều phải có TLTK tương ứng
 Chỉ dẫn tác giả:





1 tác giả A: viết tên tác giả A: “A [.]”
Hai tác giả A, B: viết “A và B [.] “ ( “A and B [.]” tiếng Anh)
Từ ba tác giả trở lên A, B, C : viết “A và cộng sự [.]” (“A et al. [.]”)
Một số TLTK quan trọng, trong lần xuất hiện đầu tiên nên có chỉ dẫn
năm, chẳng hạn, như “A và B, 2014 [10]”

 Một số sai sót:


TLTK không được chỉ dẫn: TLTK “vô ích”: một trong những lý do là
“thừa kế” từ TLTK khác.





chỉ dẫn TLTK không có trong danh sách: lấy một đoạn viết ở một TLTK,
Chỉ dẫn các tác giả: không theo quy ước trên: từ 2 tác giả trở lên lại chỉ
viết tên tác giả đầu tiên

21


Câu hỏi nghiên cứu













Năm đầu tiên của hành trình NCS
Dành riêng để đáp ứng hai thách thức
 Phương pháp và lý thuyết: Khảo sát một cách hệ thống các tài liệu hiện có
 Phát triển câu hỏi nghiên cứu và kế hoạch nghiên cứu

Khảo sát một cách hệ thống các tài liệu
Có tính cấu trúc cao
Tập các sách, bài báo liên quan, và các lớp tốt điển hình, hội thảo, và bài giảng
(tutorial). Nhấn mạnh luận án TS liên quan

Tính cấu trúc tốt cho phép NCS nắm vững các phương pháp và lý thuyết liên quan
Thường là một chương của luận án: literature review.
Làm ít hơn: Không chấp nhận. Thuyết bất khả tri miền ứng dụng (domain-agnostic)
cho phép nghiên cứu có tính độc lập miền
Nền tảng tạo năng lực phương pháp NC tốt.

22


Một số vấn đề đặt câu hỏi nghiên cứu
















"Phát biểu thang máy"
Không thể diễn đạt câu hỏi NC nếu không có độc thoại 5 phút “người nghe đã rời khỏi thang máy”
Lý do: không hoàn toàn hiểu câu hỏi hoặc không thể nói rõ đúng cách
Câu hỏi NC tốt chỉ khi là câu hỏi ngắn

Đủ phân biệt với các hiện tượng, vấn đề liên quan khác

“Cái gì vậy"
Câu hỏi nghiên cứu không quan trọng cho bất cứ ai: thờ ơ!
Thu hút: cần được hưởng lợi thực tế từ câu hỏi nghiên cứu
Vấn đề “cái gì vậy” xảy ra khi NCS khó khăn trong động lực và biện minh câu hỏi nghiên cứu

“Giải quyết thế giới"
Câu hỏi thực sự quan trọng song không thể giải được do tài nguyên (chỉ một mình NCS) và/hoặc thời
gian (2-3 năm).
Không tìm được giải pháp với tài nguyên và thời gian cho phép

23


Một số vấn đề đặt câu hỏi nghiên cứu










“Không giải được"
Câu hỏi không thể trả lời được đúng nghĩa

Lý do logic: Thông tin cần cho giải đáp không thể nhận được một cách logic hoặc hợp lệ


Lý do khả thi: Tính khả thi với các ràng buộc tài nguyên
Ví dụ: Nghiên cứu theo chiều dọc: phải trải qua nhiều năm

“Nhiều"
Đưa quá nhiều câu hỏi: câu hỏi quá hẹp/quá không thích hợp/quá lớn
Nên 01/02 câu hỏi
Một số ví dụ (Danh sách đen)

Câu hỏi quá rõ ràng: “Có thách thức khi dùng CNTT ?”

Câu hỏi không liên quan: “tác động thời tiết tới mức lương của chuyên viên HTTT ?“ . Chẳng hề liên quan !

Câu hỏi vô lý: “Trái đất phẳng?” Mọi người đều phản đối !

Câu hỏi định nghĩa: “xung đột công nghệ đặc trưng bởi sự bất đồng?”

Câu hỏi khẳng định: “một công cụ hỗ trợ quyết định có thể được phát triển để tạo điều kiện ra quyết định
cho giám đốc điều hành cấp cao bán lẻ”.

24


Một số hướng dẫn tìm câu hỏi NC tốt














Gợi ý
một tuyên bố quan trọng xác định hiện tượng được nghiên cứu
(các) câu hỏi nghiên cứu cung cấp khung tiêu chuẩn mà toàn bộ nghiên cứu Tiến sỹ xoay
quanh và tiến hóa nó (chúng)/
các câu hỏi nghiên cứu cung cấp khung gới hạn toàn bộ điều tra của NCS và trình diễn nó
trong luận án

Một số câu hỏi hướng dẫn
Hãy cho biết các câu hỏi nghiên cứu của lĩnh vực đó là gì ?
Hãy cho biết thân tri thức của lĩnh vực đó là gì ?
Những câu hỏi nghiên cứu quan trọng được thiết lập trong lĩnh vực là gì ?
Những vùng nào cần được tiếp tục khảo sát ?
Nghiên cứu NCS có lấp được một lỗ trống quan trọng? Nó dẫn đến một hiểu biết nhiều
hơn?

25


×