Tải bản đầy đủ (.pdf) (97 trang)

Xây dựng phần mềm quản lý và lựa chọn phản biện tự động cho Tạp chí Khoa học và Công nghệ Đại học Thái Nguyên

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.58 MB, 97 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC THÁI NGUYÊN
-----------------------

BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP ĐẠI HỌC
Tên đề tài: Xây dựng phần mềm quản lý và lựa chọn phản biện tự
động cho Tạp chí Khoa học và Công nghệ Đại học Thái Nguyên
Mã số: ĐH2017-TN01-01.ĐH
Chủ nhiệm: TS. Nguyễn Đình Dũng

THÁI NGUYÊN-2018


BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC THÁI NGUYÊN
-----------------------

BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP ĐẠI HỌC

Tên đề tài: Xây dựng phần mềm quản lý và lựa chọn phản biện tự
động cho Tạp chí Khoa học và Công nghệ Đại học Thái Nguyên
Mã số: ĐH2017-TN01-01.ĐH

Xác nhận của tổ chức chủ trì

Chủ nhiệm đề tài

TS. Nguyễn Đình Dũng


THÁI NGUYÊN-2018


DANH SÁCH NHỮNG NGƯỜI THAM GIA THỰC HIỆN ĐỀ TÀI

Stt

HỌ VÀ TÊN

ĐƠN VỊ

1

TS. Nguyễn Đình Dũng

Trung tâm CNTT - ĐHTN

2

ThS. Nguyễn Tuấn Anh

Ban KHCN&MT - ĐHTN

3

ThS. Nguyễn Thế Vịnh

Ban KHCN&MT - ĐHTN

4


TS. Nguyễn Thị Yến

Tạp chí KH&CN - ĐHTN

5

CN. Nguyễn Thị Phượng

Tạp chí KH&CN - ĐHTN

6

CN. Hoàng Thị Hồng Hạnh

Tạp chí KH&CN - ĐHTN

7

CN. Nguyễn Thị Thủy

Trung tâm CNTT - ĐHTN

8

ThS. Bùi Thị Xuân

Trung tâm CNTT - ĐHTN

CƠ QUAN PHỐI HỢP NGHIÊN CỨU


1. Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên
2. Trung tâm Công nghệ thông tin – Đại học Thái Nguyên


MỤC LỤC
DANH MỤC CÁC BẢNG.............................................................................................2
DANH MỤC CÁC HÌNH VẼ .......................................................................................3
LỜI MỞ ĐẦU ................................................................................................................4
CHƯƠNG 1. CƠ SỞ LÝ THUYẾT .............................................................................8
1.1.

Tổng quan về hệ thống hỗ trợ lựa chọn phản biện ............................................8

1.1.1.

Thuật toán Kalmukov ..................................................................................9

1.1.2.

Bài toán lựa chọn phản biện CMACRA ...................................................14

1.1.3.

Lựa chọn phản biện với thuật toán xấp xỉ 1/3 ...........................................17

1.2.

Một số phương pháp so khớp mẫu trong tính toán độ gần tựa ngữ nghĩa .......17


1.2.1.

Thuật toán Brute Force..............................................................................18

1.2.2.

Thuật toán Knuth-Morris-Pratt .................................................................19

1.3.

Phương pháp quy hoạch động và ứng dụng trong lựa chọn phản biện............21

1.3.1.

Phương pháp quy hoạch động ...................................................................22

1.3.2.

Thuật toán lựa chọn phản biện ..................................................................23

1.4.

Otomat hữu hạn mờ và ứng dụng trong lựa chọn phản biện bài báo...............27

1.4.1.

Độ gần tựa ngữ nghĩa theo mô hình Otomat hữu hạn mờ.........................27

1.4.2.


Thuật toán lựa chọn phản biện ..................................................................30

CHƯƠNG 2. XÂY DỰNG ỨNG DỤNG ...................................................................32
2.1.

Hệ thống hỗ trợ lựa chọn phản biện .................................................................32

2.1.1.

Mô tả yêu cầu của hệ thống.......................................................................32

2.1.2.

Phân tích hệ thống .....................................................................................37

2.1.3.

Thiết kế hệ thống .......................................................................................51

2.2.

Hệ thống quản lý tạp chí ..................................................................................77

2.2.1.

Sơ đồ thực thể liên kết và các đối tượng cơ sở dữ liệu .............................77

2.2.2.

Các chức năng của chương trình ...............................................................78


KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ...................................................................3


i

DANH MỤC CÁC BẢNG
Bảng 1: Các từ khóa của phản biện (ReviewerKeyword).............................................24
Bảng 2. Khoảng cách chuyên môn (ExpertiseDistance)..............................................24
Bảng 3. Bảng RK minh họa thuật toán……………………............................................26
Bảng 4. Kết quả thực hiện thuật toán ………………..................................................27
Bảng 5. Xác định các tác nhân……………….............................................................37
Bảng 6. Xác định các use case ……………….............................................................37
Bảng 7. Scenario cho use case Đăng nhập ………………...........................................40
Bảng 8. Scenario cho use case Cập nhật lý lịch sơ lược ..............................................42
Bảng 9. Scenario cho use case Tổng hợp bài báo theo phản biện................................43
Bảng 10. Scenario cho use case Tổng hợp bài báo theo tác giả……...........................46
Bảng 11. Scenario cho use case Chọn bài báo phản biện.............................................49
Bảng 12. Bảng tblCriticism lưu các thông tin về phản biện.........................................63
Bảng 13. Bảng tblJournal lưu các thông tin về bài báo................................................63
Bảng 14. Bảng tblChuyensan lưu trữ danh mục các chuyên san..................................64
Bảng 15. Bảng tblCri_Journal_and_Book ………………...........................................64
Bảng 16. Bảng tblCri_ProcessOfWork ………............................................................64
Bảng 17. Bảng tblCri_ScientificResearch....................................................................64
Bảng 18. Bảng tblGender lưu thông tin danh mục giới tính.........................................65
Bảng 19. Bảng tblKeywordKHX..................................................................................65
Bảng 20. Bảng tblKeywordNLY..................................................................................65
Bảng 21. Bảng tblKeywordTNK………………..........................................................65
Bảng 22. Bảng tblManageRegist………………..........................................................65
Bảng 23. Bảng tblMenu lưu thông tin danh mục menu trang chủ................................66

Bảng 24. Bảng tblPermission lưu thông tin danh mục phân quyền trong hệ thống....66
Bảng 25. Bảng tblResultOfCriticism ………………………………………………...66
Bảng 26. Bảng tblUser lưu thông tin người sử dụng hệ thống ....................................66


ii

DANH MỤC CÁC HÌNH VẼ
Hình 1. Bước 1-Xác định ma trận độ tương tự.............................................................11
Hình 2. Bước 2 – Xây dựng mảng cấu trúc invlovedReviewers; Bước 3 – Xử lý
involvedReviewers và phân bài báo cho phản biện tại hàng đầu tiên của ma trận K;
Bước 4 – Kết thúc lựa chọn phản biện………...............................................................12
Hình 3. Nhóm Use case Quản trị hệ thống...................................................................39
Hình 4. Use case Đăng nhập.........................................................................................40
Hình 5. Nhóm Use case Quản lý phản biện..................................................................41
Hình 6. Phân rã Use case Cập nhật thông tin phản biện...............................................41
Hình 7. Phân rã Use case Tổng hợp bài báo theo phản biện........................................42
Hình 8. Use case Thống kê và tìm kiếm.......................................................................43
Hình 9. Nhóm Use case Cập nhật bài báo....................................................................44
Hình 10. Phân rã Use case Cập nhật bài báo khoa học tự nhiên..................................44
Hình 11. Phân rã Use case Cập nhật bài báo khoa học Xã hội và Nhân văn................45
Hình 12. Phân rã Use case Cập nhật bài báo Nông Lâm Ngư Y Sinh..........................45
Hình 13. Nhóm Use case Tổng hợp bài báo theo tác giả..............................................46
Hình 14. Use case Đổi mật khẩu...................................................................................47
Hình 15. Use case Đăng ký làm phản biện...................................................................47
Hình 16. Nhóm Use case Tìm kiếm phản biện.............................................................48
Hình 17. Phân rã Use case chọn bài báo phản biện......................................................48
Hình 18. Nhóm Use case Chỉ định phản biện...............................................................49
Hình 19. Biểu đồ lớp phân tích.....................................................................................50
Hình 20. Biểu đồ trạng thái lớp Journal........................................................................51

Hình 21. Biểu đồ tuần tự cho chức năng đăng nhập.....................................................51
Hình 22. Biểu đồ tuần tự cho chức năng tìm kiếm phản biện theo từng từ khóa.........52
Hình 23. Biểu đồ tuần tự cho chức năng tìm kiếm phản biện theo dãy từ khóa...........53
Hình 24. Biểu đồ tuần tự cho chức năng Chọn bài báo................................................54
Hình 25. Biểu đồ tuần tự cho chức năng Cập nhật lý lịch sơ lược...............................55
Hình 26. Biểu đồ tuần tự cho chức năng Cập nhật từ khóa chuyên môn.....................56


iii

Hình 27. Biểu đồ tuần tự cho chức năng đổi mật khẩu.................................................57
Hình 28. Biểu đồ tuần tự cho chức năng Thêm bài báo...............................................57
Hình 29. Biểu đồ tuần tự cho chức năng Chỉ định phản biện 1....................................58
Hình 30. Biểu đồ tuần tự cho chức năng Chỉ định phản biện 2....................................59
Hình 31. Biểu đồ lớp chi tiết.........................................................................................60
Hình 32. Sơ đồ thực thể liên kết...................................................................................61
Hình 33. Các chức năng hệ thống hỗ trợ lựa chọn phản biện.......................................67
Hình 34. Form Đăng nhập hệ thống.............................................................................68
Hình 35. Form Chức năng tìm kiếm phản biện............................................................68
Hình 36. Form Đăng nhập lại hệ thống........................................................................69
Hình 37. Form Đổi mật khẩu........................................................................................69
Hình 38. Form Chức năng cập nhật thành viên............................................................70
Hình 39. Form Chức năng quản lý đăng ký phản biện.................................................70
Hình 40. Form Xem thông tin đăng ký tham gia phản biện.........................................71
Hình 41. Form Cập nhật lý lịch của phản biện.............................................................71
Hình 42. Form Cập nhật quá trình đào tạo...................................................................72
Hình 43. Form Cập nhật quá trình công tác.................................................................72
Hình 44. Form Cập nhật đề tài nghiên cứu khoa học...................................................73
Hình 45. Form Cập nhật công trình khoa học đã công bố............................................73
Hình 46. Form Cập nhật các từ khóa chuyên môn.......................................................74

Hình 47. Form Tổng hợp bài báo theo phản biện.........................................................74
Hình 48. Form Cập nhật bài báo...................................................................................75
Hình 49. Form Thống kê bài báo theo các tiêu chí.......................................................75
Hình 50. Form Tổng hợp bài báo theo tác giả..............................................................76
Hình 51. Form Chức năng xem hồ sơ của phản biện....................................................76


iv

THÔNG TIN KẾT QUẢ NGHIÊN CỨU

1. Thông tin chung
- Tên đề tài: Xây dựng phần mềm quản lý và hỗ trợ lựa chọn phản biện cho Tạp
chí Khoa học và Công nghệ Đại học Thái Nguyên.
- Mã số: ĐH2017-TN01-01.ĐH
- Chủ nhiệm đề tài: TS. Nguyễn Đình Dũng
- Tổ chức chủ trì: Đại học Thái Nguyên.
- Thời gian thực hiện: từ tháng 01 năm 2017 đến tháng 12 năm 2018.
2. Mục tiêu
- Thiết kế được Website Tạp chí Khoa học và Công nghệ Đại học Thái Nguyên
nhằm cập nhật những tin tức mới nhất về hoạt động của tạp chí đồng thời phản ánh
những vấn đề thời sự, cấp thiết trong các lĩnh vực khoa học, kinh tế, xã hội.
- Xây dựng được Phần mềm Quản lý Tạp chí Khoa học và Công nghệ Đại học
Thái Nguyên nhằm nhằm mục đích nâng cao chất lượng hoạt động của Tạp chí để dần
đạt chuẩn quốc tế.
- Xây dựng được Phần mềm hỗ trợ lựa chọn phản biện bài báo cho Tạp chí Khoa
học và Công nghệ Đại học Thái Nguyên dựa trên các phương pháp tìm kiếm mờ nhằm
hỗ trợ Tòa soạn tìm được danh sách người phản biện có cùng hướng nghiên cứu với
bài báo, am hiểu vấn đề mà bài báo quan tâm.
3. Tính mới và sáng tạo

Hiện nay phần lớn các tạp chí trong và ngoài nước đều đã ứng dụng CNTT trong
hoạt động quản lý tạp chí nhằm nâng cao hiệu quả tác nghiệp. Bài toán lựa chọn phản
biện bài báo cho tạp chí hay hội nghị cũng không phải là bái toán mới, hiện nay đã có
rất nhiều tác giả đã nghiên cứu tìm lời giải cho bài toán với các cách tiếp cận khác
nhau và đều dựa trên các phương pháp tìm kiếm chính xác và các thuật toán này thực
hiện thực sự không hiệu quả đối với tạp chí mà đặc thù là tạp chí đa ngành, đa lĩnh vực
như Tạp chí Khoa học và Công nghệ Đại học Thái Nguyên. Vì vậy, khắc phục hạn chế
này chúng tôi đề xuất các thuật toán tìm kiếm phản biện dựa trên các phương pháp tìm
kiếm mờ mà cụ thể ở đây là các thuật toán lựa chọn phản biện dựa trên phương pháp
quy hoạch động và phương pháp tính độ gần tựa ngữ nghĩa theo cách tiếp cận Otomat
hữu hạn mờ.


v

4. Kết quả nghiên cứu
(1) Nghiên cứu tổng quan về các hệ thống lựa chọn phản biện trong và ngoài nước.
(2) Nghiên cứu một số thuật toán so khớp mẫu và một số phương pháp tìm kiếm
xấp xỉ và từ đó xây dựng được các thuật toán lựa chọn phản biện dựa trên phương
pháp quy hoạch động và phương pháp tìm kiếm xấp xỉ theo cách tiếp cận Otomat hữu
hạn mờ.
(3) Xây dựng được hệ thống hỗ trợ lựa chọn phản biện, hệ thống quản lý Tạp chí
Khoa học và Công nghệ Đại học Thái Nguyên và Website tạp chí.
5. Sản phẩm
5.1 Sản phẩm khoa học
(1) Nguyễn Đình Dũng, Nguyễn Hữu Công, Nguyễn Tuấn Anh (2017), “Ứng
dụng phương pháp tính độ gần ngữ nghĩa theo mô hình Otomat hữu hạn mờ trong lựa
chọn phản biện bài báo”, Tạp chí khoa học và công nghệ Đại học Thái Nguyên, Tập
173 (13), tr. 19-23.
(2) Nguyen Dinh Dung, Nguyen Huu Cong, Nguyen Tuan Anh (2017),

“Algorithm Of Dynamic Programming For Paper-reviewer Assignment problem”,
International Research Journal of Engineering and Technology, vol. 11 (4), pp. 19281932.
5.2 Sản phẩm ứng dụng
(1) Phần mềm hỗ trợ lựa chọn phản biện bài báo cho tạp chí khoa học và công
nghệ ().
(2) Phần mềm quản lý tạp chí ().
6. Phương thức chuyển giao, địa chỉ ứng dụng, tác động và lợi ích mang lại
của kết quả nghiên cứu
i/ Kết quả của đề tài là tài liệu hữu ích cho sinh viên, học viên cao học ngành
Công nghệ Thông tin.
ii/ Các sản phẩm ứng dụng đáp ứng các yêu cầu đặt ra của Tạp chí Khoa học
Công nghệ và được sử dụng tại Đại học Thái Nguyên. Cụ thể:
- Hệ thống hỗ trợ lựa chọn phản biện dựa trên thuật toán được thiết kế theo cách
tiếp cận tìm kiếm mờ là công cụ hữu ích cho Tạp chí Khoa học Công nghệ ĐHTN tìm
phản biện phù hợp với bài báo nhất.
- Hệ thống quản lý Tạp chí khoa học và công nghệ góp phần nâng cao chất lượng
hoạt động của Tạp chí để dần đạt chuẩn quốc tế.


vi

INFORMATION ON RESEARCH RESULTS

1. General information
- Project title: Development of management and support of paper-reviewer
assignment software for Journal of Science and Technology, Thai Nguyen University
- Code number: ĐH2017-TN01-01.ĐH
- Project director: PhD. Nguyen Dinh Dung
- Organization: Thai Nguyen University
- Duration: from January 2017 to December 2018

2. Objectives
- Designing website of Journal of Science and Technology aims to update latest
news and reflecting current issues, necessary on science, economy and society areas.
- Developing the Science and Technology journal management software aims to
improve the quality of the journal's operations to gradually reach international
standards.
- Developing paper-reviewer assignment support software for science and
technology journal based on fuzzy search methods aims to assisting journal in finding
a list of reviewers who have the same research direction with the paper and a good
understanding of relevant content.
3. Creativeness and innovativeness
Nowadays, most domestic and overseas journals have applied information
technology in the journal management activities to improve the efficiency of the
operation. Problem of paper-reviewer assignment for journal or conference is not new
problem. Nowadays, Authors propose approachs to find a solution to the problem and
these approachs are base on exact matching algorithms that is effectless for multidisciplinary Journal such as Journal of Science and Technology of Thai Nguyen
University. So, we propose reviewers searching algorithms that based on fuzzy
searching methods that are paper-reviewer assignment algorithms based on dynamic
programming method and semantic close measure method by fuzzy finite automata to
overcome these restrictions.


vii

4. Research results
(1) Studying an overview of paper-reviewer assignment system of domestic and
overseas.
(2) Studying some pattern matching algrithms and approximate searching
methods and providing paper-reviewer assignment algorithms based on dynamic
programming method and approximate searching method by fuzzy finite automata

approach.
(3) Designing paper-reviewer assignment support system,
Technology journal management system and journal website.

Science and

5. Products
5.1. Scientific product
(1) Nguyen Dinh Dung, Nguyen Huu Cong, Nguyen Tuan Anh (2017),
“Application of a semantic close measure determining method by fuzzy automata in
paper-reviewer assignment”, Journal of Science and Technology, Thai Nguyen
University, vol. 173 (13), pp. 19-23.
(2) Nguyen Dinh Dung, Nguyen Huu Cong, Nguyen Tuan Anh (2017),
“Algorithm Of Dynamic Programming For Paper-reviewer Assignment problem”,
International Research Journal of Engineering and Technology, vol. 11 (4), pp. 19281932.
5.2. Applied product
(1) Paper-reviewer assignment support software for science and technology
journal ().
(2) Science and Technology journal management software ()
6. Transfer alternatives, applications, impacts and benefits of research
results
i/ The results of this project are useful for graduates, postgraduates majoring in
information technology.
ii/ Application softwares satisfy journal specific need and they are used by Thai
Nguyen university:
- Paper-reviewer assignment support system is based on fuzzy search methods is
useful tool for Journal of Science and Technology to find the most suitable reviewer
for each paper.
- Science and Technology journal management system improves the quality of
the journal's operations to gradually reach international standards.



1

LỜI MỞ ĐẦU
Trong thời đại ngày nay, cùng với các phương pháp về chế độ tài chính, chính
sách nhân sự, công nghệ thông tin (CNTT) được xác định là một trong các yếu tố quan
trọng của một tạp chí. Ứng dụng CNTT trong hoạt động tạp chí có thể hiểu
là việc nghiên cứu, phát triển, đầu tư đưa các công nghệ tiên tiến trong lĩnh vực CNTT
vào ứng dụng thực tiễn trong các công đoạn của quá trình hoạt động của tạp chí, từ
khâu nhận bài, phản biện, biên tập và xuất bản. Các hoạt động chủ yếu gồm thiết lập
một chiến lược tổng thể về phát triển CNTT, các quy chế, quy trình quản lý, xây dựng
hạ tầng phần cứng, đường truyền, cơ sở dữ liệu, phần mềm ứng dụng.
Hiện nay đã có một số tạp chí như Tạp chí Khoa học và Công nghệ Đại học Đà
Nẵng [26], Tạp chí Khoa học kỹ thuật Mỏ - Điạ chất [27]… đã có giải pháp ứng dụng
công nghệ thông tin và hệ thống tiện ích của Internet, tự động hóa một số bước trong
quy trình quản lý tạp chí. Nội dung chính của giải pháp là xây dựng hệ thống website
tự động hóa các khâu quản lý tạp chí như: quá trình nộp bài của tác giả, mời đọc phản
biện, theo dõi quá trình xử lý một công trình từ khi gửi đăng cho đến lúc bài được
nhận đăng vào các số của tập chí. Việc nghiên cứu xây dựng hệ thống phần mềm
website tạp chí khoa học đã từng bước hiện đại hóa quá trình quản lý trong thời kỳ hội
nhập quốc tế, tạo môi trường trao đổi giữa các nhà khoa học và tận dụng tối đa nguồn
tài liệu quý.
Để đạt được và giữ vững các tiêu chí cơ bản của một tạp chí khoa học quốc tế,
hiện nay một số các tạp chí quốc tế được xếp hạng bởi ISI ngoài việc đảm bảo phát
hành đều đặn, liên tục, đúng thời hạn theo kế hoạch thì tạp chí còn phải tuân thủ các
điều kiện chặt chẽ khác như quá trình biên tập, về nội dung bài, quá trình xét duyệt,
hình thức xét duyệt. Muốn vậy, việc tác nghiệp của những tạp chí này chủ yếu phải
thực hiện qua mạng, qua hệ thống phần mềm, vì qua hệ thống này các công ước biên
tập quốc tế được lưu giữ trong hệ thống cơ sở dữ liệu (nội dung bài báo, tác giả và tài

liệu tham khảo được trích dẫn), Ban biên tập là ban biên tập quốc tế gồm các nhà khoa
học tiêu biểu cho các hướng chính của tạp chí có thể trao đổi tác nghiệp một cách hiệu
quả; bài gửi đăng được tiếp nhận và xử lý theo đúng thông lệ quốc tế, được phản biện
kín, độc lập và khách quan.


2

Nhằm nâng cao hiệu quả của việc tiếp nhận, chọn lọc và phản biện, hiện nay một
số hội nghị trong nước và quốc tế đã đăng ký sử dụng dịch vụ quản lý và tổ chức hội
nghị khoa học của phần mềm Easychair [28], đây là một phần mềm được đặt tại máy
chủ của Khoa Khoa học máy tính thuộc Đại học Manchester. Việc nộp báo cáo của các
thành viên đều nộp qua mạng tại trang đó. Quá trình lấy bài, nhận xét và cho kết quả
phản biện của các thành viên trong Ban chương trình đều thực hiện trực tuyến thông
qua phần mềm. Việc cho điểm bài báo được các phản biện thực hiện khách quan theo
các tiêu chí và kèm theo nhận xét. Trao đổi thông tin giữa tác giả bài báo và thành viên
trong Ban chương trình hay giữa các thành viên trong Ban chương trình đều thực hiện
bằng email thông qua sự quản lý của hệ thống Easychair. Đối với kết quả phản biện,
những tác giả có bài được chấp nhận sẽ nhận được bản nhận xét và yêu cầu chỉnh sửa,
bài đã chỉnh sửa cũng sẽ được gửi lại thông qua phần mềm và cuối cùng là hệ thống sẽ
tự động lập danh sách mục lục tác giả, bài được tuyển chọn phục vụ cho việc in ấn.
Tạp chí Khoa học và Công nghệ Đại học Thái Nguyên thành lập theo quyết định
số 1571/QĐ-BGD&ĐT ngày 31 tháng 3 năm 2006 của Bộ trưởng Bộ Giáo dục và Đào
tạo; Giấy phép hoạt động báo chí số 149/GP-BVHTT ngày 17 tháng 04 năm 2001 do
Bộ Văn hóa Thông tin cấp và Giấy phép sửa đổi, bổ sung số 1270/GP-BTTTT ngày 26
tháng 8 năm 2010 do Bộ Thông tin và Truyền thông cấp với mục đích công bố các
công trình nghiên cứu khoa học và công nghệ của cán bộ, sinh viên Đại học Thái
Nguyên, của các nhà khoa học trong và ngoài nước; các thông tin về những kết quả
nghiên cứu và hoạt động khoa học công nghệ nổi bật của các đơn vị thành viên thuộc
Đại học Thái Nguyên. Sau hơn 10 năm hoạt động, Tạp chí đã góp một phần không nhỏ

trong việc quảng bá, nâng cao vị thế của Đại học Thái Nguyên trong lĩnh vực hoạt
động khoa học công nghệ, số lượng bài gửi đăng ngày càng lớn, chất lượng bài ngày
càng đòi hỏi được nâng cao. Để tiệm cận với chuẩn quốc tế, Tạp chí Khoa học và
Công nghệ Đại học Thái Nguyên cần tập trung nâng cao chất lượng các chuyên san,
xử lý linh hoạt và cải tiến hơn nữa trong quy trình phản biện, biên tập; nâng cao điểm
số công trình của bài báo; quảng bá rộng rãi hơn nữa các công trình nghiên cứu của tác
giả trên mạng. Muốn vậy, Tạp chí cần đẩy mạnh ứng dụng công nghệ thông tin trong
các hoạt động tác nghiệp của tạp chí mà đặc biệt là cần xây dựng phần mềm Quản lý
Tạp chí và hỗ trợ lựa chọn phản biện với các mục tiêu sau:
1. Thiết kế được Website Tạp chí Khoa học và Công nghệ Đại học Thái Nguyên


3

nhằm cập nhật những tin tức mới nhất về hoạt động của tạp chí đồng thời phản ánh
những vấn đề thời sự, cấp thiết trong các lĩnh vực khoa học, kinh tế, xã hội.
2. Xây dựng được Phần mềm Quản lý Tạp chí Khoa học và Công nghệ Đại học
Thái Nguyên nhằm nhằm mục đích nâng cao chất lượng hoạt động của Tạp chí để dần
đạt chuẩn quốc tế.
3. Xây dựng được Phần mềm hỗ trợ lựa chọn phản biện bài báo cho Tạp chí
Khoa học và Công nghệ Đại học Thái Nguyên nhằm hỗ trợ Tòa soạn tìm được danh
sách người phản biện có cùng hướng nghiên cứu với bài báo, am hiểu vấn đề mà bài
báo quan tâm.
Đề tài ”Xây dựng phần mềm quản lý và lựa chọn phản biện tự động cho Tạp
chí Khoa học và Công nghệ Đại học Thái Nguyên” mang mã số ĐH-TN01-01.ĐH
được nhóm tác giả thực hiện từ tháng 1 năm 2017 nhằm đáp ứng các mục tiêu đặt ra.
Ngoài phần mở đầu, kết luận và tài liệu tham khảo, nội dung báo cáo đề tài được trình
bày thành 02 chương. Chương 1 là cơ sở lý thuyết, trong chương này chúng tôi trình
bày các vấn đề tổng quan về hệ thống lựa chọn phản biện cho Hội nghị, tạp chí và đề
xuất thuật toán lựa chọn phản biện dựa trên các phương pháp tìm kiếm xấp xỉ. Chương

2 là các kết quả đạt được trong quá trình phân tích và thiết kế hệ thống và xây dựng
ứng dụng hỗ trợ lựa chọn phản biện bài báo và hệ thống quản lý Tạp chí Khoa học và
Công nghệ Đại học Thái Nguyên.
Các công trình đã công bố có liên quan đến đề tài:
[1] Nguyễn Đình Dũng, Nguyễn Hữu Công, Nguyễn Tuấn Anh, “Ứng dụng
phương pháp tính độ gần ngữ nghĩa theo mô hình Otomat hữu hạn mờ trong lựa chọn
phản biện bài báo”, Tạp chí khoa học và công nghệ Đại học Thái Nguyên, 173 (13),
19-23.
[2] Nguyen Dinh Dung, Nguyen Huu Cong, Nguyen Tuan Anh (2017),
“Algorithm Of Dynamic Programming For Paper-reviewer Assignment problem”,
International Research Journal of Engineering and Technology, 11 (4), pp. 19281932.
[3] Phần mềm hỗ trợ lựa chọn phản biện bài báo và Phần mềm quản lý tạp chí đã
được đặt tại các địa chỉ: ;


4

CHƯƠNG 1. CƠ SỞ LÝ THUYẾT
Trong chương này, chúng tôi tập trung trình bày một số thuật toán được ứng
dụng trong lựa chọn phản biện. Các kết quả được trình bày trong 4 mục. Mục 1.1 là
tổng quan về hệ thống hỗ trợ lựa chọn phản biện đã được công bố trong và ngoài nước,
mục 1.2 là một số thuật toán so khớp mẫu làm nền tảng cho thuật toán lựa chọn phản
biện, mục 1.3 là thuật toán lựa chọn phản biện dựa trên phương pháp quy hoạch động
và mục 1.4 là thuật toán lựa chọn phản biện dựa trên phương pháp tìm kiếm xấp xỉ
theo cách tiếp cận Otomat hữu hạn mờ.
1.1. Tổng quan về hệ thống hỗ trợ lựa chọn phản biện
Việc chọn ra người phản biện có cùng hướng nghiên cứu với nội dung bài báo từ
cơ sở dữ liệu các nhà khoa học đảm bảo tính chất khách quan, đúng vấn đề cần phản
biện là điều hết sức cần thiết đối với một tạp chí, hội nghị khoa học. Muốn vậy, việc
phân loại và chọn phản biện cần phải dựa vào nội dung bài báo, hay phần tóm tắt bài

báo hoặc các từ khóa cho mỗi bài báo…Điều này thực sự hết sức khó khăn cho việc
tìm kiếm phản biện trong cơ sở dữ liệu các nhà khoa học nếu thực hiện thủ công và
thay vào đó ta cần có thuật toán hữu hiệu cho việc lựa chọn phản biện.
Bài toán lựa chọn phản biện bài báo cho tạp chí hay hội nghị không phải là bái
toán mới, hiện nay đã có rất nhiều tác giả đã nghiên cứu tìm lời giải cho bài toán trên
nhiều góc độ khác nhau, với các cách tiếp cận khác nhau. Một số cách tiếp cận như:
Phương pháp của Chumki Basu và cộng sự đề xuất khi chọn tập bài báo phù hợp với
phản biện có sử dụng kết hợp các kỹ thuật thu thập thông tin và cơ sở dữ liệu bằng
cách khai thác các nguồn thông tin từ web [9]; phương pháp chỉ mục ngữ nghĩa ẩn [7];
phương pháp mô hình hóa chủ đề xác suất [10], phương pháp quy hoạch nguyên tuyến
tính lựa chọn tập người phản biện cho tập bài báo có xét đến các điều kiện ràng buộc
[11]; phương pháp luồng chi phí tối thiểu [8] và cách tiếp cận mô hình lai ghép tri thức
trong lựa chọn phản biện, đánh giá thẩm định cho các dự án nghiên cứu [21].
Gần đây, Tayal, Saxena, Sharma, Khanna và Gupta đưa ra một phương pháp mới
giải bài toán lựa chọn phản biện trong chính sách tài chính của chính phủ [23]; Li và


5

Watanabe đưa ra phương pháp tự động lựa chọn phản biện cho bài báo dựa trên mức
độ chuyên môn của phản biện [14]; Long, Wong, Peng, và Ye đã đưa ra thuật toán xấp
xỉ 1/3 nhằm giải bài toán cực đại hóa sự bao phủ chủ đề chuyên môn trong lựa chọn
phản biện [16], theo cách tiếp cận này mỗi bài báo sẽ được lựa chọn phản biện sao cho
các chủ đề của bài báo sẽ được phủ hoàn toàn (mức độ phủ là lớn nhất) bởi chuyên
môn của các nhà phản biện và thỏa mãn 3 điều kiện: (1) mỗi bài báo được phản biện
bởi một hay nhiều phản biện ở trong trạng thái “sẵn sàng”; (2) mỗi phản biện sẽ phản
biện số lượng bài báo không lớn hơn số lượng bài quy định; (3) Không có sự xung đột
giữa người phản biện và tác giả, điều này có nghĩa là không xảy ra trường hợp tác giả
hoặc đồng tác giả lại đóng vai trò là người tham gia phản biện. Sau đây chúng tôi trình
bày chi tiết một số phương pháp tìm lời giải cho bài toán lựa chọn phản biện.

1.1.1. Thuật toán Kalmukov
Thuật toán lựa chọn phản biện cho bài báo dựa trên từ khóa được thiết kế bởi
Yordan Kalmukov năm 2006 [25], theo cách tiếp cận này thì giữa bài báo và phản biện
có chung với nhau ít nhất một từ khóa thì bài báo sẽ được đưa vào phản biện; từ khóa
bài báo và từ khóa của phản biện sẽ được chọn trong tập từ khóa cho trước; mỗi người
phản biện sẽ có số lượng bài báo cần phản biện không được vượt quá giới hạn cho
phép. Ngoài ra, khi lựa chọn phản biện thuật toán phải đảm bảo tính phân phối đều về
số lượng bài báo được phân cho các phản biện và được xác định bởi (1).
Noppr= ceil((Nop * Norpp) / Nor);

(1)

Noppr: Số lượng bài báo được phân cho một người phản biện;
Nop: Số lượng bài báo;
Norpp: Số lượng người phản biện cho một bài báo;
Nor: Số người phản biện;
ceil: Hàm làm tròn trên.
Thuật toán lựa chọn phản biện phù hợp nhất cho mỗi bài báo dựa trên độ tương
tự và được xác định như sau:
Ta ký hiệu SF(Pi,Rj) là hàm xác định độ tương tự của bài báo Pi với phản biện
Rj và được xác định bởi công thức (2)


6

SF ( Pi , R j ) 

count( KWPi  KWR j )
count( KWPi  KWR j )


(2)

KWPi: Tập các từ khóa của bài báo Pi; KWRj: Tập các từ khóa của phản biện Rj;
count(S): Số lượng phần tử trong tập S. KWPi  KU; KWR j  KU
KU: là tập các từ khóa được xác định bởi hội nghị;
Như vậy, công thức (2) cho thấy SF(Pi , R j ) [0,1] là đại lượng chỉ ra mức độ
phù hợp của bài báo và phản biện và là đại lượng để xác định Pi có thể được phân cho
phản biện Rj hay không.
Để rõ hơn các khái niệm này, ta xét một ví dụ cụ thể như sau:
Trong một hội nghị khoa học, tập các từ khóa được xác định là KU = {A, B, C,
D, E, F, G, H, I}; một bài báo có các từ khóa là KWP = {A, C, F}; xét 2 phản biện lần
lượt có tập các từ khóa là KWR1 = {B, C, F, G}; KWR2 = {A, F}.
Xét trực quan ta dễ thấy khả năng chuyên môn phản biện của R1 và R2 cho bài
báo P là tương đương nhau, vì họ đều có cùng số lượng từ khóa thuộc vào KWP. Trong
trường hợp này, để tìm được phản biện phù hợp nhất ta phải sử dụng đến hàm xác định
độ tương tự SF(Pi,Rj) và ta có SF(P,R1) = 2/5 < SF(P,R2) = 2/3. Vậy, từ hàm tương tự
ta thấy bài báo P sẽ được phân cho phản biện R2 là phù hợp hơn.
Xét về mặt ý nghĩa thì việc phân bài báo P cho phản biện R2 sẽ tiết kiệm được
tài nguyên khi quan tâm tới giới hạn tối đa số bài báo cho mỗi phản biện, vì
count(KWR1)> count(KWR2), nên khả năng phản biện cho bài báo khác của R1 là lớn
hơn R2, hơn nữa nếu có một bài báo kế tiếp là P1 có KWP1 = {B, G} cũng cần được
phản biện và giả thiết mỗi phản biện chỉ phản biện tối đa là 01 bài báo. Khi đó, nếu ta
phân P cho phản biện R1 thì khi đó bài báo P1 sẽ không có người phản biện mặc dù R1
có chung 2 từ khóa với P1 (vì R1 đã bận phản biện cho P). Vậy P được phản biện bởi
R2 là phù hợp nhất.
Ta gọi, PS và RS lần lượt là các bản ghi thông tin về bài báo và người phản
biện và có cấu trúc như sau:


7


Thuật toán lựa chọn phản biện gồm 4 bước chính như sau:
Bước 1: Xây dựng ma trận độ tương tự K.
Trong bước này, mỗi bài báo Pi sẽ được tính độ tương tự với tất cả các phản
biện Rj ta thu được K[i]={SF(Pi,Rj)}. Sau đó sắp xếp K[i] theo thứ tự giảm dần của độ
tương tự khi đó phản biện phù hợp nhất sẽ nằm trên đầu danh sách.

Hình 1. Bước 1-Xác định ma trận độ tương tự
Chuyển sang các bước sau, thuật toán xử lý hàng đầu tiên của ma trận, đó là
hàng gợi ý chọn phản biện phù hợp nhất. Lưu đồ sau chỉ ra quá trình thực hiện thuật
toán:


8

Hình 2. Bước 2 – Xây dựng mảng cấu trúc invlovedReviewers; Bước 3 – Xử lý
involvedReviewers và phân bài báo cho phản biện tại hàng đầu tiên của ma trận
K; Bước 4 – Kết thúc lựa chọn phản biện.


9

Tại Bước 2, thuật toán xây dựng mảng cấu trúc involvedReviewers nhằm khắc
phục hạn chế đối với những phản biện có số lượng bài báo vượt quá giới hạn cho phép,
cấu trúc được xác định như sau:
involvedReviewers[‘revUsername’][index][k_pid];[SFactor]
revUsername: Username của phản biện;
Sfactor: Độ tương tự bài báo và phản biện
Ví dụ: ta có bảng K là


involvedReviewers[‘R1’][1][k_pid]=2; [SFactor]=0.54
Độ tương tự lưu trong involvedReviewers được xác định bao gồm hằng số C,
mục đích của đại lượng C là để xác định và đảm bảo rằng nếu giữa bài báo và phản
biện có chung nhau ít nhất một từ khóa thì bài báo sẽ được phân cho phản biện đó (đối
với phản biện phù hợp nhất và có số lượng bài báo không vượt quá số lượng bài báo
cho phép). Đại lượng C được chia làm 2 phần, C= C1+C2.
C1 được xác định như sau:
If (number of non-zero SFs == 0){
C1 = max;

(4)

}
else if (number of non-zero SFs > 2*(revsPerPaper – numberOfRevs for Pi)){
C1 = 0;

(5)

}
else{
C1 

revsPerPaper  numberOf Re vs for Pi
;
(nuber of non  zeroSFs) 3

(6)

}
Trong đó, number of non-zero SFs là số lượng các đại lượng đo độ tương tự

khác không đối với bài báo Pi; revsPerPaper số người phản biện cho mỗi bài báo, số
lượng này được xác định bởi hội nghị, thường chọn là 2 hoặc 3; numberOfRevs for Pi


10

là số người phản biện hiện thời được làm phản biện cho bài báo Pi.
Nếu người phản biện tại hàng đầu tiên của K[i] là phản biện duy nhất trong
hàng thì phản biện này (R) sẽ được gán cho bài báo Pi mà không cần quan tâm đến độ
tương tự của R với các bài báo khác. Nếu không có phản biện nào phù hợp với Pi (độ
tương tự bằng 0 trong K[i]) thì C1=0.
Đại lượng C2 đảm bảo rằng bài báo được gán cho phản biện thứ 2 là phản biện
có mức độ phù hợp thứ 2, C2 được xác định như sau:
C2 = 2 * (SF of first-suitable reviewer for Pi – SF of second-suitable reviewer
for Pi)
SF of first-suitable reviewer for Pi: Độ tương tự của phản biện thứ nhất đối với
Pi; SF of second-suitable reviewer for Pi: Độ tương tự của phản biện thứ 2 đối với Pi.
Trong quá trình thực hiện tại bước 3, thuật toán xác định bài báo sẽ được gán
cho phản biện nào trong hàng đầu tiên của ma trận K. Có thể minh họa cho bước này
bằng một ví dụ sau:
Nếu các điều kiện ràng buộc giới hạn đặt ra là mỗi phản biện được phản biện tối
đa là 2 bài báo, mỗi bài báo sẽ được phản biện bởi 2 người phản biện thì sau khi thực
hiện bước 2 ta được kết quả là

Sắp xếp lại involvedReviewers[‘R1’] theo thứ tự giảm dần của độ tương tự ta
được involvedReviewers[‘R1’]={P2, P5, P4, P1}.
Vì số lượng tối đa cho mỗi phản biện là 2 bài báo, nên P2 và P5 sẽ được gán
cho R1, quá trình thực hiện tiếp tục tại bước này và các bước sau được mô tả chi tiết
trong Hình 2. Trong trường hợp số lượng bài báo tối đa cho mỗi phản biện là khác
nhau (phụ thuộc vào chuyên môn và các điều kiện của phản biện) và số lượng phản

biện gán cho mỗi bài báo là khác nhau cũng đã được Maryam Karimzadehgan,
ChengXiang Zhai [11] đề xuất và đưa ra thuật toán tìm lời giải cho bài toán này.
1.1.2. Bài toán lựa chọn phản biện CMACRA
Năm 2009, Maryam Karimzadehgan và ChengXiang Zhai [11] mở rộng bài


11

toán của Yordan Kalmukov và đề xuất 2 thuật toán giải bài toán CMACRA
(ConstrainedMulti-Aspect Committee Review Assignment) bao gồm thuật toán
Greedy và thuật toán quy hoạch nguyên tuyến tính.
Bài toán CMACRA đặt ra là lựa chọn phản biện cho tập các bài báo sao cho
thỏa mãn 4 điều kiện sau:
(1) Mỗi bài báo sẽ được phản biện bởi ít nhất một phản biện luôn trong trạng
thái “sẵn sàng”;
(2) Số lượng bài báo cho mỗi phản biện không vượt quá giới hạn cho phép;
(3) Mỗi phản biện được gán cho mỗi bài báo phải có chuyên môn phù hợp với
bài báo;
(4) Chuyên môn tổng hợp của các phản biện phải phủ đủ tốt cho toàn bộ các
chủ đề của bài báo đề cập.
Để giải quyết các vấn đề của bài toán đặt ra, CMACRA được mô hình hóa như
sau: Gọi P={p1, p2,…,pn} là tập các bài báo pi; R={r1, r2,…,rm} - tập các phản biện ri;
NR={NR1, NR2,…, NRm} – tập các giới hạn số lượng bài báo cho mỗi phản biện, NRi là
số lượng bài báo tối đa cho phản biện ri; NP={NP1, NP2,…, NPm} – tập các số lượng
phản biện sẽ được gán cho mỗi bài báo, NPi là số lượng phản biện được gán cho bài
báo Pi. Kết quả tính toán sẽ cho ra một ma trận M={Mi,j}nxm, trong đó Mij  {0,1}
(Mi,j=1 nếu ri là phản biện cho bài báo pj).
Các điều kiện ràng buộc (1) và (2) có thể được mô tả như sau:
n


i  1, m,  M i , j  NRi ;

(7)

j 1

m

j  1, n,  M i , j  NPj .

(8)

i 1

Để đảm bảo đủ số lượng phản biện để phản biện cho các chủ đề của tất cả các
bài báo thì cần phải đảm bảo điều kiện

n

n

j 1

i 1

 NPj   NRi .

Giả sử trong một hội nghị có k chủ đề khác nhau, ta ký hiệu   { 1 , 2 , ..., k } là
tập các chủ đề,  i là ký hiệu chủ đề thứ i (mỗi chủ đề có thể được đặc trưng như là một
từ khóa mà đặc trưng chuyên môn của phản biện hay chủ đề bài báo đề cập sẽ được

lựa chọn trong tập này). Gọi P và R lần lượt là 2 ma trận chỉ mức độ tương tự của
các chủ đề với nội dung bài báo và độ tương tự của các chủ đề với chuyên môn phản


12

biện; P  {Pi , j }nk , Pi, j là mức độ tương tự của chủ đề  j với bài báo pi; R  {Ri , j }mk ,
Ri , j là mức độ tương tự của chủ đề  j với chuyên môn của phản biện ri; mức độ tương

tự Pi, j , Ri , j {0,1} .
Thuật toán Greedy giải bài toán gán phản biện cho bài báo được thực hiện như
sau:
Bước 1: Sắp xếp các bài báo theo thứ tự giảm dần về số lượng chủ đề mà bài
báo đề cập (Số lượng từ khóa của bài báo).
Bước 2: Chọn phản biện có mức độ chuyên môn phù hợp nhất cho bài báo đứng
đầu danh sách (phản biện có chuyên môn phủ các chủ đề bài báo đề cập).
Bước 3: Kiểm tra các ràng buộc: giới hạn về số lượng bài báo cho phản biện,
giới hạn về số lượng phản biện cho mỗi bài báo. Nếu đạt được giới hạn về số lượng bài
báo cho phản biện thì loại bỏ phản biện ra khỏi danh sách, làm tương tự như vậy đối
với bài báo nếu đạt được giới hạn về số lượng phản biện cho mỗi bài báo.
Bước 4: Lặp lại bước 2 cho đến khi các phản biện được gán cho tất cả các bài
báo.
Thuật toán thứ 2 mà Maryam Karimzadehgan sử dụng để tìm lời giải cho bài
toán CMACRA là thuật toán quy hoạch tuyến tính nguyên. Để sử dụng thuật toán này,
bài toán CMACRA được mô hình hóa như sau:
Nếu coi ti,j là số lượng phản biện có chuyên môn phủ chủ đề  j của bài báo pi,
thì bài toán đặt ra là tìm ti,j sao cho
n

k


 t
i 1 j 1

i, j

 max ;

(9)

ti, j [0, NPi ] ;

(10)

và thỏa mãn điều kiện
m

i  1,2,..., n; j  1,2,..., k; Pi , j ti , j   Rl , j M l ,i

(11)

l 1

Vậy, từ (9), (10), (11) kết hợp với các điều kiện (7), (8) ta có thể phát biểu bài
toán CMACRA như sau:
Tìm ti,j sao cho
n

k


 t
i 1 j 1

i, j

 max


13

và thỏa mãn các điều kiện
C1 :i  [1, m], j  [1, n], M i , j  {0,1}
C2 :i  [1, n], j  [1, k ], t i , j  {0,1,..., NPi }
m

C3 :j  [1, n],  M i , j  NPj
i 1
n

C4 :i  [1, m],  M i , j  NRi
j 1

m

C5 :i  [1, n], j  [1, k ], Pi , j t i , j   Rl , j M l ,i
l 1

1.1.3. Lựa chọn phản biện với thuật toán xấp xỉ 1/3
Tiếp tục mở rộng các kết quả của Maryam Karimzadehgan, năm 2013, Cheng
Long và cộng sự [16] đã xét bài toán khi bổ sung các ràng buộc xung đột giữa tác giả

và phản biện (COI-conflict of interest) đồng thời đưa ra thuật toán xấp xỉ 1/3 giải bài
toán lựa chọn phản biện đảm bảo cực đại hóa phủ chủ đề. Các ràng buộc COI được xét
đến ở đây gồm một số dạng như: phản biện được lựa chọn và tác giả bài báo lại là
đồng tác giả cho một số bài báo; mối quan hệ đồng nghiệp; mối quan hệ là thầy trò, tác
giả bài báo là thầy hướng dẫn của người phản biện… Có thể nói bổ sung ràng buộc
COI đảm bảo cho quá trình lựa chọn phản biện thực sự có tính khách quan nhằm nâng
cao chất lượng phản biện cho hội nghị.
Bài toán mà Cheng Long đưa ra được gọi là bài toán MaxTC-PRA (Maximum
Topic Coverage Paper- Reviewer Assignment), bài toán đặt ra là lựa chọn phản biện
cho bài báo sao cho tổng số các chủ đề khác nhau của bài báo được phủ bởi chuyên
môn của các phản biện là cực đại và thảo mãn 3 điều kiện: Mỗi bài báo phải được
phản biện bởi  p phản biện; Mỗi phản biện phản biện không quá  r bài báo; thỏa mãn
ràng buộc COI giữa tác giả bài báo và phản biện được chọn. Bài toán MaxTC-PRA
được mô hình hóa như sau: Gọi P={p1, p2,…,pn} là tập các bài báo pi; R={r1, r2,…,rm} tập các phản biện ri; T={t1, t2,…,tk} - tập các chủ đề; mỗi bài báo pi được đặc trưng bởi
các chủ đề trong miền T, ký hiệu là T(pi); mỗi phản biện rj được đặc trưng bởi các chủ
đề trong miền T, ký hiệu là T(rj); M=(pi, rj) là một phép gán (lựa chọn) bài báo pi với
phản biện rj (rj phản biện cho bài báo pi, M.p=pi, M.r=rj); A  P x R là tập tất cả các
phép gán, A(pi)={M: M  A, M.p=pi}, A(rj)= {M: M  A, M.r=rj};  i (A) là số lượng các
chủ đề của bài báo pi. Như vậy Bài toán MaxTC-PRA được phát biểu như sau:
Tìm tập các phép gán A sao cho


14
n

 ( A) :  i ( A)  max

(12)

A( pi )   p , i  1,2,..., n


(13)

A(rj   r , j  1,2,..., m

(14)

A C   , C là tập COI

(15)

i 1

Các kết quả trong [10] đã chỉ ra rằng đây là bài toán NP khó, để giải bài toán
này Cheng Long sử dụng thuật toán Greedy xấp xỉ 1/3. Thuật toán được mô tả như
sau:
Thuật toán Greedy
Input: P={p1, p2,…,pn}; R={r1, r2,…,rm}; C
Output: Nghiệm xấp xỉ của bài toán MaxTC-PRA
A=Ø
U=PxR-C
While (U  Ø){
Chọn M  U sao cho  ( A {M})   ( A)  max
if ( A{M} thỏa mãn các điều kiện ràng buộc)

A  A {M} ;
U  U  {M}
}
Return A


1.2. Một số phương pháp so khớp mẫu trong tính toán độ gần tựa ngữ nghĩa
Bài toán xác định độ gần ngữ nghĩa ngày càng được nhiều tác giả quan tâm và
có nhiều ứng dụng trong thực tế do sự tăng trưởng nhanh chóng của các hệ thống tìm
kiếm thông tin [3, 17, 18]. Các kết quả nghiên cứu thường tập trung vào các phương
pháp thống kê sử dụng độ đo dựa vào sự xuất hiện của từ, tần suất xuất hiện của từ [2,
6], độ đo Levenshtein tìm khoảng cách giữa hai từ [18]… hoặc các phương pháp dựa
trên quan hệ ngữ nghĩa giữa các từ. Phương pháp thống kê có ưu điểm tốc độ xử lý
nhanh đối với hệ thống dữ liệu lớn. Vì vậy, trong nội dung bài báo này chúng tôi tập
trung nghiên cứu phương pháp thống kê làm cơ sở lý thuyết cho việc xây dựng thuật
toán lựa chọn phản biện bài báo cho tạp chí.
Các nhà khoa học tham gia phản biện và các từ khóa chuyên môn được cập nhật
thường xuyên làm cho cơ sở dữ liệu ngày càng lớn. Vì vậy, nếu sử dụng nội dung bài
báo hay tóm tắt bài báo để làm dữ liệu tìm kiếm trong cơ sở dữ liệu phản biện sẽ phải
chấp nhận chi phí khá lớn về thời gian tính toán. Điều này hoàn toàn không khả thi mà


×