Tải bản đầy đủ (.pdf) (238 trang)

Nghiên cứu và phát triển thuốc bằng hệ thống phần mềm thông minh tự thành lập.

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.33 MB, 238 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ Y TẾ

ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH

CHUNG KHANG KIỆT

NGHIÊN CỨU VÀ PHÁT TRIỂN THUỐC
BẰNG HỆ THỐNG PHẦN MỀM THÔNG MINH
TỰ THÀNH LẬP

LUẬN ÁN TIẾN SĨ DƯỢC HỌC

Thành phố Hồ Chí Minh - 2018


BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ Y TẾ

ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH

CHUNG KHANG KIỆT

NGHIÊN CỨU VÀ PHÁT TRIỂN THUỐC
BẰNG HỆ THỐNG PHẦN MỀM THÔNG MINH
TỰ THÀNH LẬP

Ngành: Công nghệ Dược phẩm và Bào chế thuốc
Mã số: 9720202



LUẬN ÁN TIẾN SĨ DƯỢC HỌC

Người hướng dẫn khoa học:
GS.TS. Đặng Văn Giáp
PGS.TS. Đỗ Quang Dương

Thành phố Hồ Chí Minh – Năm 2018


ii

LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của tôi. Các số liệu và những kết quả nêu
trong luận án là trung thực và chưa từng được ai công bố trong bất kỳ công trình
nghiên cứu nào khác.

Chung Khang Kiệt


iii

MỤC LỤC
TRANG PHỤ BÌA

ii

LỜI CAM ĐOAN

ii


MỤC LỤC

iii

DANH MỤC CÁC TỪ VIẾT TẮT

iv

DANH MỤC CÁC HÌNH

vii

DANH MỤC CÁC SƠ đỒ

ix

DANH MỤC CÁC BẢNG

x

MỞ ĐẦU

1

Chương 1. TỔNG QUAN TÀI LIỆU

4

1.1. Nghiên cứu và phát triển thuốc


4

1.2. Các kỹ thuật thông minh

8

1.3. Thẩm định phần mềm trong GxP

25

Chương 2. ĐỐI TƯỢNG và PHƯƠNG PHÁP NGHIÊN CỨU

34

2.1. Đối tượng nghiên cứu

34

2.2. Xây dựng và đánh giá phần mềm

36

2.3. Kiểm chứng và áp dụng Phasolpro RD

41

Chương 3. KẾT QUẢ NGHIÊN CỨU

43


3.1. Xây dựng hệ thống Phasolpro RD

43

3.2. Đánh giá hệ thống Phasolpro RD

82

3.3. Kiểm chứng Phasolpro RD bằng cơ sở dữ liệu dã công bố

95

3.4. Áp dụng Phasolpro RD vào NC & PT thuốc

116

Chương 4. BÀN LUẬN

132

4.1. Xây dựng hệ thống Phasolpro RD

132

4.2. Đánh giá hệ thống Phasolpro RD

139

4.3. Kiểm chứng Phasolpro RD bằng CSLD đã công bố


143

4.4. Áp dụng Phasolpro RD trong nghiên cứu và phát triển thuốc

145

KẾT LUẬN

148

KIẾN NGHỊ

150

TÀI LIỆU THAM KHẢO
PHỤ LỤC

TLTK-1
PL -1-


iv

DANH MỤC CÁC TỪ VIẾT TẮT
ADL

Angle Driven Learning

ASTM


American Society for Testing and

Hiệp hội của Mỹ về Thử nghiệm

Materials

và Vật liệu

BIC

Bayesian Information Criterion

-

BPL

Back Propagation Learning

-

CSDL

-

Cơ sở dữ liệu

CV

Cross Validation


Thẩm định chéo

DQ

Design Qualification

Đánh giá thiết kế

EDQM

European Directorate for the

Ban chỉ đạo Châu Âu về Chất

Quality of Medicines

lượng thuốc

Food and Drug Administration

Cơ quan quản lý Thực Phẩm và

FDA

Dược Phẩm
GA

Genetic Algorithms


Thuật toán di truyền

GAMP

Good Automated Manufacturing

Thực hành tốt Sản xuất tự động

Practice

hóa

GCP

Good Clinical Practices

Thực hành tốt Lâm sàng

GLP

Good Laboratory Practices

Thực hành tốt Kiểm nghiệm

GMP

Good Manufacturing Practice

Thực hành tốt Sản xuất thuốc


GxP

Good Practices

Thực hành tốt

ICH

The International Conference for

Hội nghị quốc tế về sự hòa hợp

Harmonisation
IEEE

The Institute of Electrical and

Viện kỹ nghệ điện và điện tử

Electronics Engineers
IT

Intergration Testing

Thử nghiệm bộ phận

LOOCV

Leave One Out Cross Validation


-

LRA

Learning Rate Adaption

-


v

MDL

Minimum Description Length

-

MLP

Multilayer Perceptron Networks

Mạng thần kinh nhiều lớp

NC & PT

-

Nghiên cứu và phát triển

NNs


Neural networks

Mạng thần kinh

OQ

Operation Qualification

Đánh giá vận hành

Phasolpro*

Pharmaceutical Solution Provider

Nhà cung cấp các giải pháp trong
ngành Dược

PIC/S

Pharmaceutical Inspection Co-

Tổ chức hợp tác thanh tra Dược

operation Scheme
PQ

Performance Qualification

Đánh giá hiệu năng


QP

Quickprop

-

QTCX

-

Quy trình chiết xuất

RP

RPROP

-

SB

Standard Batch

-

SDP

Software development process

-


SI

Standard Incremental

-

SRM

Structural Risk Minimisation

-

SRS

Software requirement

Tiêu chuẩn kỹ thuật

specifications

*

ST

System Testing

Thử nghiệm hệ thống (phần mềm)

TG


-

Trung gian

URS

User’s Requirement Specification

Yêu cầu kỹ thuật

UT

Unit Testing

Thử nghiệm đơn vị

WHO

World Health Organization

Tổ chức Y tế Thế giới

Nhãn hiệu đăng ký số 106247 do Cục sở hữu trí tuệ - Bộ KHCN cấp theo quyết định số 1495/QĐ-SHTT

ngày 31/07/2008


vii


DANH MỤC CÁC HÌNH
Hình 1.1. Nguyên lý hoạt động của tối ưu hóa và dự đoán thông minh

8

Hình 1.2. Minh họa tổng quát về cấu trúc mạng thần kinh đa lớp

9

Hình 1.3. Quy trình xử lý của hệ thống logic mờ - thần kinh

20

Hình 3.4. Phác thảo giao diện Khởi động của Phasolpro RD

53

Hình 3.5. Phác thảo giao diện Đầu vào của Phasolpro RD

54

Hình 3.6. Phác thảo giao diện Tùy chọn của Phasolpro RD

55

Hình 3.7. Phác thảo giao diện Luyện mạng của Phasolpro RD

56

Hình 3.8. Phác thảo giao diện Mối liên quan của Phasolpro RD


57

Hình 3.9. Phác thảo giao diện Quy luật của Phasolpro RD

58

Hình 3.10. Phác thảo giao diện Biểu đồ của Phasolpro RD

59

Hình 3.11. Phác thảo giao diện Điều kiện của Phasolpro RD

61

Hình 3.12. Phác thảo giao diện Tối ưu hóa của Phasolpro RD

62

Hình 3.13. Phác thảo giao diện Dự đoán của Phasolpro RD

63

Hình 3.14. Phác thảo giao diện Báo cáo kết quả của Phasolpro RD

64

Hình 3.15. Phác thảo giao diện Thiết kế mô hình của Phasolpro RD

65


Hình 3.16. Biểu tượng của Phasolpro RD

66

Hình 3.17. Giao diện Giới thiệu của Phasolpro RD sau khi khởi động

66

Hình 3.18. Giao diện chính của Phasolpro RD

66

Hình 3.19. Giao diện Đầu vào của Phasolpro RD

67

Hình 3.20. Giao diện Tùy chọn biến số của Phasolpro RD

67

Hình 3.21. Giao diện Tùy chọn thông số của Phasolpro RD

68

Hình 3.22. Giao diện Luyện mạng của Phasolpro RD

69

Hình 3.23. Giao diện Mối liên quan của Phasolpro RD


70

Hình 3.24. Giao diện Quy luật của Phasolpro RD

70

Hình 3.25. Giao diện Biểu đồ của Phasolpro RD

70

Hình 3.26. Giao diện Điều kiện của Phasolpro RD

71


viii

Hình 3.27. Giao diện Tối ưu hóa của Phasolpro RD

71

Hình 3.28. Giao diện Dự đoán của Phasolpro RD

72

Hình 3.29. Giao diện Báo cáo kết quả của Phasolpro RD

72


Hình 3.30. Giao diện Thiết kế mô hình của Phasolpro RD

73

Hình 3.31. Mối liên quan y1 = f(x1, x2) đối với CSDL A bởi FormRules

92

Hình 3.32. Mối liên quan y1 = f(x1, x2)

92

Hình 3.33. Mối liên quan y1 = f(x1, x2) đối với CSDL B bởi FormRules

92

Hình 3.34. Mối liên quan y1 = f(x1, x2) đối với CSDL bởi Phasolpro RD

92

Hình 3.35. Mối liên quan đối với CSDL viên nén glimepirid 2 mg

96

Hình 3.36. Mối liên quan đối với CSDL viên nén loratidin

99

Hình 3.37. Mối liên quan đối với CSDL của viên nén gliclazid


102

Hình 3.38. Mối liên quan đối với CSDL của Rau Diếp cá

105

Hình 3.39. Mối liên quan đối với CSDL của Cao khô Diệp hạ châu

108

Hình 3.40. Mối liên quan đối với CSDL của quy trình HPLC

114

Hình 3.41. Mối liên quan đối với CSDL của viên nén chứa meloxicam

119

Hình 3.42. Mối liên quan đối với CSLD viên gliclazid cải thiện độ hòa tan

124

Hình 3.43. Mối liên quan đối với CSDL của quy trình tổng hợp metformin

129


ix

DANH MỤC CÁC SƠ ĐỒ

Sơ đồ 1.1. Minh họa quá trình xử lý của logic mờ

14

Sơ đồ 1.2. Tóm tắt quá trình tối ưu hóa bằng thuật toán di truyền

19

Sơ đồ 1.3. Minh họa nguyên lý hoạt động của quá trình tối ưu hóa thông minh

21

Sơ đồ 1.4. Mô hình chữ V’- thử nghiệm và đánh giá phần mềm (Arnold L.)

30

Sơ đồ 1.5. Mô hình chữ V’- thử nghiệm và đánh giá phần mềm (PIC/S)

30

Sơ đồ 1.6. Mô hình chữ V’- nhấn mạnh về đánh giá phần mềm

31

Sơ đồ 3.7. Quy trình vận hành INForm

47

Sơ đồ 3.8. Quy trình vận hành FormRules


49

Sơ đồ 3.9. Quy trình vận hành Phasolpro RD

52


x

DANH MỤC CÁC BẢNG
Bảng 1.1. Yêu cầu của FDA (Mỹ) chứng nhận thuốc gốc và generic

5

Bảng 1.2. So sánh các kỹ thuật cải tiến thuật toán lan truyền ngược

14

Bảng 1.3. Phân loại phần mềm và thẩm định theo PIC/S trong môi trường GxP

29

Bảng 3.4. Đặc điểm của phần mềm tối ưu hóa thông minh INForm (a)

46

Bảng 3.5. Đặc điểm của phần mềm tối ưu hóa thông minh INForm (b)

47


Bảng 3.6. Đặc điểm của phần mềm phân tích liên quan nhân quả FormRules

48

Bảng 3.7. Đặc điểm của hệ thống thông minh Phasolpro RD (a)

50

Bảng 3.8. Đặc điểm của hệ thống thông minh Phasolpro RD (b)

51

Bảng 3.9. Đặc điểm các công cụ trong giao diện Khởi động của Phasolpro RD

53

Bảng 3.10. Đặc điểm các công cụ trong giao diện Đầu vào của Phasolpro RD

54

Bảng 3.11. Đặc điểm các công cụ trong giao diện Tùy chọn của Phasolpro RD

55

Bảng 3.12. Đặc điểm công cụ trong giao diện Luyện mạng của Phasolpro RD

57

Bảng 3.13. Đặc điểm các công cụ trong giao diện Mối liên quan


58

Bảng 3.14. Đặc điểm các công cụ trong giao diện Quy luật của Phasolpro RD

59

Bảng 3.15. Đặc điểm các công cụ trong giao diện Biểu đồ của Phasolpro RD

60

Bảng 3.16. Đặc điểm các công cụ trong giao diện Điều kiện của Phasolpro RD

61

Bảng 3.17. Đặc điểm các công cụ trong giao diện Tối ưu hóa của Phasolpro RD 62
Bảng 3.18. Đặc điểm các công cụ trong giao diện Dự đoán của Phasolpro RD

64

Bảng 3.19. Đặc điểm công cụ trong giao diện Báo cáo kết quả

64

Bảng 3.20. Đặc điểm công cụ trong giao diện Thiết kế mô hình

65

Bảng 3.21. Kết quả nhận dạng giao diện Đầu vào của Phasolpro RD

75


Bảng 3.22. Kết quả nhận dạng giao diện Luyện mạng của Phasolpro RD

76

Bảng 3.23. Kết quả nhận dạng giao diện Tối ưu hóa của Phasolpro RD

78

Bảng 3.24. Kết quả nhận dạng giao diện Dự đoán của Phasolpro RD

78

Bảng 3.25. Kết quả nhận dạng giao diện Báo cáo kết quả của Phasolpro RD

79

Bảng 3.26. Kết quả nhận dạng giao diện Thiết kế thí nghiệm của Phasolpro RD

79


xi

Bảng 3.27. Kết quả kiểm tra vận hành luyện mạng của Phasolpro RD

80

Bảng 3.28. Kết quả vận hành phân tích nhân quả đối với Phasolpro RD


81

Bảng 3.29. Kết quả kiểm tra vận hành tối ưu hóa của Phasolpro RD

81

Bảng 3.30. Đánh giá về đóng gói và cài đặt Phasolpro RD

82

Bảng 3.31. Kết quả lựa chọn nhóm thử của Phasolpro RD - CSDL A

83

Bảng 3.32. Kết quả lựa chọn nhóm thử của INForm - CSDL A

83

Bảng 3.33. Các giá trị R2 sử dụng thuật toán mặc định - CSDL A

83

Bảng 3.34. Kết quả lựa chọn nhóm thử của Phasolpro RD – CSDL B

84

Bảng 3.35. Kết quả lựa chọn nhóm thử của INForm - CSDL B

84


Bảng 3.36. Các giá trị R2 sử dụng thuật toán mặc định - CSDL B

84

Bảng 3.37. Các giá trị R2 thử sử dụng thuật toán QP - CSDL A

85

Bảng 3.38. Các giá trị R2 sử dụng thuật toán QP - CSDL A

85

Bảng 3.39. Các giá trị R2 thử sử dụng thuật toán QP - CSDL B

86

Bảng 3.40. Các giá trị R2 sử dụng thuật toán QP - CSDL B

86

Bảng 3.41. Kết quả chọn thuật toán của Phasolpro RD - CSDL A

86

Bảng 3.42. Kết quả chọn thuật toán của INForm - CSDL A

87

Bảng 3.43. Các giá trị R2 sử dụng thuật toán phù hợp - CSDL A


87

Bảng 3.44. Kết quả chọn thuật toán của Phasolpro RD – CSDL B

87

Bảng 3.45. Kết quả chọn thuật toán của INForm - CSDL B

88

Bảng 3.46. Các giá trị R2 sử dụng thuật toán phù hợp - CSDL B

88

Bảng 3.47. Các xu hướng và mức độ liên quan của Phasolpro RD - CSDL A

89

Bảng 3.48. Các xu hướng và mức độ liên quan của FormRules - CSDL A

89

Bảng 3.49. Các xu hướng và mức độ liên quan của Phasolpro RD - CSDL B

90

Bảng 3.50. Các xu hướng và mức độ liên quan của FormRules - CSDL B

90


Bảng 3.51. So sánh kết quả tối ưu của 2 phần mềm - CSDL A

93

Bảng 3.52. So sánh kết quả tối ưu của 2 phần mềm - CSDL B

94

Bảng 3.53. So sánh kết quả dự đoán của 2 phần mềm - CSDL A

94

Bảng 3.54. So sánh kết quả dự đoán của 2 phần mềm - CSDL B

95

Bảng 3.55. Xu hướng và mức độ liên quan giữa x và y

96


xii

Bảng 3.56. So sánh kết quả tối ưu bởi Phasolpro RD và INForm v4.0

97

Bảng 3.57. So sánh kết quả dự đoán bởi Phasolpro RD và INForm v4.0

97


Bảng 3.58. Kết quả dự đoán bởi Phasolpro RD so với thực nghiệm kiểm chứng

98

Bảng 3.59. Xu hướng và mức độ liên quan giữa x và y

98

Bảng 3.60. So sánh kết quả tối ưu bởi Phasolpro RD và INForm v3.4

100

Bảng 3.61. So sánh kết quả dự đoán bởi Phasolpro RD và INForm v3.4

100

Bảng 3.62. Kết quả dự đoán bởi Phasolpro RD so với thực nghiệm kiểm chứng 101
Bảng 3.63. Xu hướng và mức độ liên quan giữa x và y

101

Bảng 3.64. So sánh kết quả tối ưu của Phasolpro RD và INForm v3.4

103

Bảng 3.65. So sánh kết quả dự đoán của Phasolpro RD và INForm v3.4

104


Bảng 3.66. Kết quả dự đoán của Phasolpro RD so với thực nghiệm kiểm chứng 104
Bảng 3.67. Xu hướng và mức độ liên quan giữa x và y

105

Bảng 3.68. So sánh kết quả tối ưu của Phasolpro RD và INForm v3.7

106

Bảng 3.69. So sánh kết quả dự đoán của Phasolpro RD và INForm v3.7

106

Bảng 3.70. Kết quả dự đoán của Phasolpro RD và thực nghiệm kiểm chứng

107

Bảng 3.71. Xu hướng và mức độ liên quan giữa x và y

107

Bảng 3.72. So sánh kết quả tối ưu của Phasolpro RD và INForm v3.6

109

Bảng 3.73. So sánh kết quả dự đoán của Phasolpro RD và INForm v3.6

109

Bảng 3.74. Kết quả dự đoán của Phasolpro RD so với thực nghiệm kiểm chứng 110

Bảng 3.75. Xu hướng và mức độ liên quan giữa x và y

111

Bảng 3.76. So sánh kết quả tối ưu của Phasolpro RD và INForm v4.0

115

Bảng 3.77. So sánh kết quả dự đoán của Phasolpro RD và INForm v4.0

115

Bảng 3.78. Kết quả dự đoán của Phasolpro RD so với thực nghiệm kiểm chứng 116
Bảng 3.79. Dữ liệu thực nghiệm đầu vào cho Phasolpro RD

117

Bảng 3.80. Các giá trị R2 thử và R2 luyện đối với CSDL viên nén rã nhanh

118

Bảng 3.81. Xu hướng và mức độ liên quan giữa y và x

118

Bảng 3.82. Kết quả tính chất sản phẩm của 3 lô kiểm chứng

121

Bảng 3.83. So sánh kết quả thực nghiệm với dự đoán của Phasolpro RD


121

Bảng 3.84. Dữ liệu thực nghiệm đầu vào cho phần mềm Phasolpro RD

122


xiii

Bảng 3.85. Các giá trị R2 thử và R2 luyện đối với CSDL viên chứa gliclazid

123

Bảng 3.86. Xu hướng và mức độ liên quan giữa y và x

123

Bảng 3.87. Kết quả tính chất sản phẩm của 3 lô kiểm chứng

125

Bảng 3.88. So sánh kết quả thực nghiệm với dự đoán của Phasolpro RD

125

Bảng 3.89. Dữ liệu thực nghiệm đầu vào cho Phasolpro RD

127


Bảng 3.90. Giá trị R2 thử và luyện đối với CSDL quy trình tổng hợp metformin 128
Bảng 3.91. Xu hướng và mức độ liên quan giữa y và x

128

Bảng 3.92. Kết quả hiệu suất và tạp chất của 3 lần thực nghiệm

131

Bảng 3.93. So sánh kết quả thực nghiệm với dự đoán của Phasolpro RD

131

Bảng 4.94. Tóm tắt kết quả luyện mạng của 6 CSDL kiểm chứng

143

Bảng 4.95. Tóm tắt kết quả phân tích nhân quả của 6 CSDL kiểm chứng

144

Bảng 4.96. Tóm tắt kết quả tối ưu của 6 CSDL kiểm chứng

144

Bảng 4.97. Tóm tắt kết quả dự đoán của 6 CSDL kiểm chứng bởi Phasolpro RD 145


1


MỞ ĐẦU
Theo nguyên tắc GMP, chất lượng của thuốc cần được thiết kế và xây dựng
ngay từ giai đoạn nghiên cứu và phát triển. Trong giai đoạn này, trước đây việc
thành lập công thức được thực hiện dựa trên kinh nghiệm nên thường tốn nhiều thời
gian, chi phí và công sức. Giữa thành phần công thức và/ hoặc điều kiện sản xuất (là
các nguyên nhân mà trong toán thống kê gọi là biến số độc lập) với tính chất sản
phẩm (là các kết quả mà trong toán thống kê gọi là biến số phụ thuộc) có các mối
liên quan biện chứng với nhau. Mối liên hệ này thường phức tạp, do có nhiều
nguyên nhân (loại tá dược, lượng tá dược, phương pháp điều chế, thiết bị sản
xuất…) và nhiều kết quả (các chỉ tiêu kiểm nghiệm lý hóa, tác dụng in vitro, in
vivo…). Đôi khi các kết quả này lại mâu thuẫn lẫn nhau (viên có độ cứng cao nhưng
lại cần độ rã thấp), có trường hợp một nguyên nhân cho nhiều kết quả (HPMC cho
độ nhớt và chỉ số khúc xạ), một kết quả do nhiều nguyên nhân (độ cứng do lực nén,
tá dược dính…). Ngày nay, việc xây dựng công thức bào chế hay quy trình sản xuất
có thể được thực hiện một cách khoa học hơn. Một mặt, nhà bào chế phải cân nhắc
nhiều yếu tố liên quan đến thành phần công thức (loại và lượng của mỗi nguyên
liệu) cũng như điều kiện sản xuất (loại thiết bị và thông số, phương pháp điều chế).
Mặt khác nhà bào chế cũng phải xem xét nhiều tính chất đối với mỗi dược phẩm
(các chỉ tiêu kiểm nghiệm, tác dụng in vitro...). Từ đó, nhà bào chế sẽ thiết kế mô
hình thực nghiệm, tiến hành bào chế và kiểm nghiệm để có dữ liệu về bào chế và
kiểm nghiệm làm đầu vào cho việc phân tích dữ liệu. Các phương pháp phân tích
dữ liệu truyền thống (toán học, toán thống kê) bị hạn chế đối với các dữ liệu phức
tạp, thiếu trị số hay có giá trị định tính; nhất là có nhiều biến số độc lập và nhiều
biến số phụ thuộc. Việc tối ưu hóa với nhiều biến phụ thuộc thì các phương pháp
truyền thống càng không thể thực hiện được.
Ngày nay, trí tuệ nhân tạo đã phát triển nhanh chóng và đa dạng. Sự ra đời của
các kỹ thuật thông minh như mạng thần kinh nhân tạo, thuật toán di truyền, logic


2

mờ-thần kinh… là cơ sở của các phần mềm thông minh, đã đóng góp trong nghiên
cứu và phát triển thuốc. Trên thế giới đã có nhiều nghiên cứu áp dụng các phần
mềm thông minh trong ngành Dược. Trong nghiên cứu phát triển thuốc, các kỹ
thuật thông minh (thông qua các phần mềm thông minh) được áp dụng trong lĩnh
vực xây dựng công thức sản phẩm ở quy mô phòng thí nghiệm, dự đoán nâng cấp
cỡ lô, xây dựng quy trình sản xuất, dự đoán tình huống xấu nhất trong quá trình sản
xuất….Ngoài ra, chúng cũng được áp dụng trong các lĩnh vực nghiên cứu phát triển
khác như chiết xuất dược liệu, bán tổng hợp hóa dược, xây dựng quy trình định
lượng bằng sắc ký lỏng hiệu năng cao….
Trên thế giới đã có một số phần mềm thông minh cho mục đích phân tích liên
quan nhân quả như FormRules (Intelligensys, UK), tối ưu hóa công thức/quy trình
như CADChem (AI Ware, USA), INForm (Intelligensys, UK)... Trong đó,
FormRules sử dụng logic mờ - thần kinh để phân tích liên quan nhân quả về xu
hướng, mức độ và quy luật; CADChem hay INForm kết hợp hai kỹ thuật thông
minh mạng thần kinh nhân tạo (thiết lập mô hình liên quan và dự đoán) và thuật
toán di truyền (tối ưu hóa).. Cả hai quá trình gồm phân tích liên quan nhân quả và
tối ưu hóa thông minh đều cần giai đoạn chung là luyện mạng với dữ liệu thực
nghiệm đầu vào.
Trong nghiên cứu phát triển thuốc, giai đoạn phân tích liên quan nhân quả giúp
nhà bào chế biết được các biến số độc lập (thành phần công thức và/ hoặc điều kiện
sản xuất) nào có liên quan đến các biến số phụ thuốc tương ứng (chỉ tiêu kiểm
nghiệm lý hóa, tác dụng in vitro/ in vivo…), nhờ đó có thể khảo sát biến số cần thiết
và không bỏ sót, không mất công thăm dò biến số không cần. Giai đoạn tối ưu hóa
bởi phần mềm thông minh (kết hợp mạng thần kinh và thuật toán di truyền) kế thừa
kết quả phân tích liên quan nhân quả (với cùng dữ liệu thực nghiệm đầu vào) có thể
ước tính có hiệu quả về thành phần và/ hoặc điều kiện sản xuất để có tính chất sản
phẩm như mong muốn, đồng thời có thể dự đoán tính chất sản phẩm từ công thức
hay điều kiện sản xuất biết trước. Nhờ đó, các phương pháp thông minh có hiệu quả
và tiết kiệm được thời gian và công sức hơn các phương pháp truyền thống.



3
Hiện nay, ở Việt nam chưa có phần mềm thông minh để phân tích liên quan
nhân quả và tối ưu hóa trong nghiên cứu phát triển thuốc. Bên cạnh đó, các phần
mềm thông minh nước ngoài chỉ có từng chức năng riêng lẻ như phân tích liên quan
nhân quả (FormRules) hay tối ưu hóa công thức/ quy trình (CADChem, INForm).
Với mong muốn tích hợp các kỹ thuật thông minh của 2 chức năng chính (Phân tích
liên quan nhân quả và Tối ưu hóa/ dự đoán) như các phần mềm nước ngoài trở
thành 2 giai đoạn trong 1 hệ thống thông minh, với giao diện hoàn toàn bằng tiếng
Việt, đề tài “Nghiên cứu và phát triển thuốc bằng hệ thống phần mềm thông minh tự
thành lập” được thực hiện với các mục tiêu:
1. Xây dựng hệ thống phần mềm thông minh Phasolpro RD có 2 chức năng chính
là phân tích nhân quả và tối ưu hóa/ dự đoán.
2. Đánh giá hệ thống phần mềm thông minh Phasolpro RD theo GMP.
3. Kiểm chứng hệ thống phần mềm thông minh Phasolpro RD với cơ sở dữ liệu đã
công bố trên các tạp chí chuyên ngành.
4. Áp dụng hệ thống phần mềm thông minh Phasolpro RD trong nghiên cứu và
phát triển thuốc.


4

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU
1.1. Nghiên cứu và phát triển thuốc
1.1.1. Khái niệm nghiên cứu và phát triển
Vai trò nghiên cứu và phát triển
Chất lượng của thuốc không phải chỉ được chứng nhận bởi giai đoạn kiểm tra
chất lượng mà phải được xây dựng trong mọi giai đoạn của quá trình sản xuất, bao
gồm giai đoạn nghiên cứu và phát triển thuốc. Mỗi sản phẩm thuốc đều có một
vòng đời nhất định từ bắt đầu, tiến triển, đỉnh cao, suy giảm và kết thúc. Vì thế nhà

sản xuất cần phải liên tục đổi mới về sản phẩm. Đổi mới một sản phẩm có liên quan
đến việc thành lập công thức, có thể được tiến hành theo hai hướng: cải tiến sản
phẩm cũ (về công thức, dạng bào chế...) hoặc thay bằng sản phẩm mới (với hoạt
chất khác) [29].

Xây dựng công thức/ quy trình
Theo FDA (Mỹ), một thuốc gốc hay thuốc của nhà phát minh (innovator drug)
muốn được phép sản xuất phải nộp hồ sơ đầy đủ, trong đó có việc đánh giá sinh khả
dụng và thử lâm sàng giai đoạn I-III mất nhiều thời gian và tốn kém. Đối với thuốc
generic nhà sản xuất có thể làm hồ sơ miễn giảm, tức là không cần làm các mục số
7, số 8 và số 9 nhưng phải đánh giá về tương đương sinh học [29] – Bảng 1.1.
Để thành lập một công thức, nhiều thông tin liên quan cần được xác định như:
tính chất của nguyên liệu, điều kiện thiết bị và nhà xưởng, tiêu chuẩn và phương
pháp kiểm nghiệm, yêu cầu kinh tế - thị trường...Thông thường, công thức được
thành lập theo kinh nghiệm qua 4 giai đoạn:
-

Xây dựng tiêu chuẩn: Phân tích tiêu chuẩn, xây dựng tiêu chuẩn.

-

Thành lập công thức theo truyền thống: tham khảo công thức cũ, chọn thành
phần, tỉ lệ.

-

Kiểm tra chất lượng sản phẩm: Chọn phương pháp kiểm nghiệm, tiến hành thử
nghiệm, phân tích kết quả.
Hoàn thiện công thức: Thay đổi nguyên liệu, điều chỉnh tỷ lệ.



5
Bảng 1.1. Yêu cầu của FDA (Mỹ) chứng nhận thuốc gốc và generic
STT
1
2
3
4
5
6
7
8
9
10

Yêu cầu chứng nhận
Nghiên cứu tiền công thức
Xây dựng tiêu chuẩn nguyên liệu
Thành lập công thức chế phẩm
Xây dựng quy trình sản xuất
Xây dựng tiêu chuẩn sản phẩm
Nghiên cứu độ ổn định và tuổi thọ
Thử nghiệm trên thú
Thử tác dụng lâm sàng
Đánh giá sinh khả dụng
Đánh giá tương đương sinh học

Thuốc gốc
+
+

+
+
+
+
+
+
+


Thuốc generic

+
+
+
+
+



+

“Nguồn: FDA-US, Office of Generic Drugs, 2000” [29]

Thành lập công thức bằng con đường truyển thống không cho nhà bào chế biết
yếu tố nào ảnh hưởng trên tính chất sản phẩm, sự ảnh hưởng tuân theo những quy
luật nào, làm sao tối ưu hóa công thức theo yêu cầu và dự đoán tính chất sản phẩm
nếu thay đổi công thức. Từ đó dẫn đến các sai sót như khảo sát yếu tố không cần mà
bỏ sót yếu tố cần thiết, gây mất nhiều thời gian và công sức mà không đạt được yêu
cầu về chất lượng. Công thức được thành lập một cách khoa học hơn bằng cách
trước tiên thiết kế công thức nhằm xây dựng mô hình thực nghiệm, xem xét các yếu

tố ảnh hưởng như thành phần và/ hoặc điều kiện pha chế (nhân) đối với tính chất
của sản phẩm (quả); Sau đó sẽ tối ưu hóa để xác định giá trị tối ưu của thành phần/
điều kiện pha chế sao cho sản phẩm có thể hoàn thiện hơn về tiêu chuẩn chất lượng,
hiệu quả hơn về tính sinh khả dụng, đạt yêu cầu về giá thành...

1.1.2. Mô hình thực nghiệm
Ý nghĩa của mô hình thực nghiệm
Mô hình thực nghiệm là bảng thiết kế gồm các yếu tố khảo sát cũng như định
hướng thu thập thông tin hay dữ liệu. Dữ liệu thu thập được là đầu vào cho quá
trình phân tích liên quan nhân quả và tối ưu hóa. Trong mô hình thực nghiệm có 2
biến: biến độc lập (nhân) ký hiệu là X, các giá trị là xi. (Thí dụ: loại nguyên liệu,
lượng nguyên liệu, dung môi...) và biến phụ thuộc (quả) ký hiệu là Y, các giá trị là
yi (Thí dụ: độ cứng, độ hòa tan, hiệu suất chiết...).


6

Phân loại mô hình thực nghiệm
Có 3 mô hình thực nghiệm thường gặp trong ngành Duợc:
-

Mô hình công thức

-

Mô hình quy trình

-

Mô hình kết hợp (công thức và quy trình).

Mô hình thực nghiệm có thể là mô hình đầy đủ cần nhiều thí nghiệm hay mô

hình phân đoạn cần số thí nghiệm tối thiểu. Trong các mô hình phân đoạn có mô
hình tối ưu, thí dụ: D-Optimal [4].
Trong sản xuất thuốc, với mỗi lô thuốc sản xuất, ngoài bào chế, thì cần kiểm
nghiệm bán thành phẩm, thành phẩm. Nên tốn nhiều công sức và chi phí để hoàn
thành 1 công thức từ bào chế đến kiểm nghiệm thành phẩm. Vì thế mô hình thí
nghiệm trong bào chế thuốc thường được thiết kế dựa trên các mô hình phân đoạn
tối ưu như mô hình D-Optimal, để đảm bảo vẫn đủ không gian thiết kế nhưng số
lượng thí nghiệm tối thiểu.

1.1.3. Phân tích liên quan nhân - quả
Mối liên quan là sự tương ứng giữa 2 biến số X và Y. Trường hợp đơn giản
trong toán thống kê gọi là tương quan, khi phức tạp được gọi là mối liên quan nhân
quả. Mối liên quan nhân quả này có tính biện chứng và đôi khi rất phức tạp. Mối
liên quan nhân quả có thể xảy ra trong nhiều lĩnh vực trong ngành Dược, như trong
Bào chế và Công nghiệp Dược thì nhân là thành phần công thức (loại tá dược, nồng
độ…) và/ hay điều kiện sản xuất (quy trình xát hạt, dập viên..) còn quả là tính chất
sản phẩm (độ rã, độ hòa tan,…); Trong chiết xuất dược liệu thì nhân có thể là đặc
tính của dược liệu (nguồn gốc, thời vụ, bộ phận xử lý…), dung môi, phương pháp
chiết…, còn quả là hiệu suất chiết, hàm lượng hoạt chất, tỉ lệ tạp… Trong kiểm
nghiệm thì nhân là loại cột, thành phần pha động, tốc độ dòng, kỹ thuật (đồng đẳng,
gradient)…, còn quả là thời gian lưu, đỉnh hấp thu, độ phân giải, hệ số đối xứng..
Trong hóa dược thì nhân có thể là chất tham gia, nhiệt độ, thời gian phản ứng,
phương pháp tổng hợp…, còn quả là hiệu suất tổng hợp, tỉ lệ tạp chất…


7

1.1.4. Tối ưu hóa thông minh

1.1.4.1. Ý nghĩa và phân loại tối ưu hóa
Tối ưu hóa một công thức là xác định giá trị tối ưu của thành phần/ điều kiện
(nhân) sao cho sản phẩm đạt tính chất như mong muốn (quả). Tùy theo số lượng
biến phụ thuộc y mà có các khái niệm "tối ưu hóa đơn giản" (y chỉ có một giá trị)
hay "tối ưu hóa đồng thời nhiều đáp ứng" (y có nhiều giá trị). Trong thực tế, đặc
biệt ở ngành Dược, lúc nào cũng có nhiều biến y và các giá trị này có thể mâu thuẫn
lẫn nhau. Khi biến độc lập X có giới hạn về giá trị ta có khái niệm "tối ưu hóa có
ràng buộc", ngược lại ta có khái niệm "tối ưu hóa không ràng buộc" [50].

1.1.4.2. Tối ưu hóa và dự đoán thông minh
Các phương pháp tối ưu hóa truyền thống (toán thống kê, đơn hình…) chỉ áp
dụng với các dữ liệu đơn giản và tuyến tính, không phù hợp với dữ liệu phức tạp và
phi tuyến. Ngoài ra, phương pháp truyền thống không tối ưu hóa được đồng thời
nhiều biến phụ thuộc (đa đáp ứng) trong khi sản phẩm thường có rất nhiều tính chất.
Ngày nay, việc xây dựng công thức thuốc có thể được thực hiện một cách khoa
học bằng cách sử dụng các kỹ thuật thông minh như: Logic mờ-thần kinh (neurofuzzy) cho phép thiết lập mối liên quan nhân quả giữa nhân (X) và quả (Y), để xác
định được xu hướng, mức độ và quy luật liên quan. Hay sự kết hợp mạng thần kinh
để thiết lập mô hình liên quan nhân quả và dự đoán quả (Y) từ nhân (X) biết trước;
Với thuật toán di truyền nhằm tối ưu hóa dựa trên mô hình liên quan nhân quả đã
được thiết lập bởi mạng thần kinh; Và logic mờ làm cho mạng thần kinh có hiệu
quả hơn trong việc thiết lập mô hình liên quan nhân quả đối với các dữ liệu phức
tạp đồng thời giúp cho thuật toán di truyền được thuận tiện hơn trong sự tối ưu hóa
với các hàm mục tiêu trực quan.
Sau khi thiết lập mô hình liên quan nhân quả thông qua quá trình luyện mạng,
nhà bào chế có thể ấn định các giá trị của nhân (X) để từ đó dự đoán được quả (Y).
Ví dụ: Trong bào chế công thức mới, thông qua mô hình nhân quả đã thiết lập, dễ
dàng biết được tính chất sản phẩm (độ hòa ta, độ cứng…) khi thay đổi thành phần/


8

điều kiện pha chế (loại tá dược, nồng độ tá dược…). Quá trình dự đoán hoàn toàn
phụ thuộc vào mô hình liên quan nhân quả. Nó có thể được áp dụng nhằm: dự đoán
các tính chất của sản phẩm từ công thức tối ưu, dự đoán giá thành sản phẩm từ công
thức tối ưu (nếu trong mô hình thực nghiệm có tính đến chi phí của nguyên liệu và
điều kiện sản xuất), dự đoán một số tình huống xấu (worst cases) có thể xảy ra nếu
như nhà bào chế sử dụng các thông số vượt quá những giới hạn đã được thiết lập
đối với công thức tối ưu [50].

1.1.4.3. Nguyên lý hoạt động của tối ưu hóa thông minh
Nguyên lý hoạt động của phần mềm tối ưu hóa thông minh là sự kết hợp hài
hòa giữa 2 kỹ thuật thông minh gồm mạng thần kinh và thuật toán di truyền. Mạng
thần kinh giúp thiết lập mô hình liên quan nhân quả và dự đoán kết quả (Y) từ nhân
(X) biết trước. Thuật toán di truyền giúp tối ưu hóa thông số dựa trên mô hình liên
quan nhân quả đã được thiết lập bởi mạng thần kinh. Sự phối hợp mạng thần kinh
với thuật toán di truyền làm cho sự phản hồi các giá trị thích hợp một cách nhanh
chóng từ mô hình liên quan nhân quả.
Mô hình hóa

Quy trình

Dự đoán

Tính chất
sản phẩm

Tối ưu hóa
Hình 1.1. Nguyên lý hoạt động của tối ưu hóa và dự đoán thông minh
“Nguồn: Đặng Văn Giáp, 2002” [14]

1.2. Các kỹ thuật thông minh

1.2.1. Khái niệm kỹ thuật thông minh
Trí tuệ nhân tạo dựa trên nhiều ngành khoa học (ngôn ngữ học, tâm lý học, kỹ
thuật học, triết học, tin học…) và được áp dụng rộng rãi trong nhiều lĩnh vực (máy


9
móc, tự động hóa, thiết lập mô hình, tối ưu hóa, xử lý ảnh, nhận dạng…). Trong
lĩnh vực tối ưu hóa công thức, trí tuệ nhân tạo ngày càng được áp dụng sâu rộng vì
tốc độ xử lý của máy tính luôn tăng lên và chi phí luôn giảm xuống [50]. Một số
công cụ trí tuệ nhân tạo thường được kết hợp để áp dụng trong lĩnh vực tối ưu hóa
công thức: Mạng thần kinh, logic mờ và thuật toán di truyền. Ngày nay, lĩnh vực
phân tích liên quan nhân quả thường sử dụng logic mờ-thần kinh.

1.2.2. Các kỹ thuật thông minh liên quan
1.2.2.1. Mạng thần kinh nhân tạo
Mạng thần kinh nhân tạo là sự mô phỏng toán học của mạng thần kinh sinh học,
được tạo thành bởi sự liên kết giữa nhiều đơn vị thần kinh nhân tạo. Những đơn vị
này có thu thập các tín hiệu, trọng số, tổng cộng và chuyển các tín hiệu ấy sang đơn
vị thần kinh khác. Các tín hiệu ở đây thuộc dạng vector và ma trận đại số. Cấu trúc
mạng thần kinh có nhiều loại khác nhau. Trong đó, cấu trúc mạng thần kinh đa lớp
thường gặp nhất là mạng bao gồm một lớp vào, một hay nhiều lớp ẩn và một lớp ra.
Cấu trúc mạng với một lớp ẩn (Hình 1.2) hay được dùng trong việc thiết lập mô
hình và tối ưu hóa công thức [56], [72].

Hình 1.2. Minh họa tổng quát về cấu trúc mạng thần kinh đa lớp
“Nguồn: Schiffmann W., Joost M., Werner R. , 1994” [72]


10
Thuật toán lan truyền ngược [11], [56], [68], [72]:

Năm 1986 Rumelhart và McClelland giới thiệu thuật toán lan truyền ngược cho
mô hình mạng phức tạp, nhiều lớp. Thông thường mô hình mạng lan truyền ngược
thường dùng có dạng: 1 lớp nhập – 1 lớp ẩn – 1 lớp xuất. Giả sử cho một tập luyện
k mẫu: {xi(k), yi(k)}, thuật toán lan truyền ngược cung cấp kỹ thuật hiệu chỉnh các
trọng số Wij trong mạng nhằm phân lớp các giá trị đầu vào một cách chính xác, hay
nói cách khác: mạng có thể “học” và “hiểu” được dữ liệu đưa vào.
Sai số trung bình bình phương E thường được dùng để đo lường sự trùng khớp
giữa ánh xạ cần xây dựng với hàm đích cho trước (hay nói cách khác là dùng đánh
giá khả năng “học” của mạng)
Cho tập mẫu gồm N mẫu {(Xk, T)} = {x1, x2, ..., xk, t}(n); n = 1, ..., N; gọi Z =
NN(Xk) = {z1, z2, ..., zN} là giá trị ước tính qua mạng thần kinh, thì sai số trung bình
bình phương E được tính:
N

1
E= ×
2

 (z

n

− tn ) 2

n =1

Công thức 1.1

N


Trong trường hợp mô hình mạng neuron là hàm phi tuyến, việc xác định được
tập trọng số W để mô hình đạt được sai số ít nhất là rất khó. Phương pháp giảm
gradient thường được sử dụng trong các trường hợp phức tạp này.
Phương pháp giảm gradient có các bước chính sau:
-

Chọn ngẫu nhiên một điểm x0 trong không gian trọng số

-

Tính độ dốc của mặt lỗi tại x0

-

Cập nhật các trọng số theo hướng dốc nhất của mặt lỗi

-

Xem điểm này như điểm x0 mới.
Lặp lại quá trình từ bước (2) đến (4) thì đến một lúc nào đó các giá trị của bộ

trọng số sẽ tiếp cận được điểm thấp nhất trong mặt lỗi.
Biến thiên trọng số ở mỗi bước (bước t) sẽ được tính theo công thức:
Δwt = −ε ×

∂E
+ α × Δwt −1
∂w

Công thức 1.2



11
với ε, α là hai hằng số dương đặc trưng cho tốc độ học và moment của quá trình học
(giảm lỗi). Tuy nhiên, có một số cải tiến cho phép thay đổi các hệ số ε, α trong từng
giai đoạn học, cũng như theo từng mẫu học để việc luyện mạng đạt hiệu quả cao
nhất. Như vậy, thuật toán lan truyền ngược có thể được tóm tắt thành hai quá trình
chính: lan truyền tiến, lan truyền ngược.
Lan truyền tiến: là quá trình tính giá trị đầu ra {z1, z2, ..., zN} dựa trên những
trọng số có sẵn. Giả sử tại một nút mạng như Hình 2.1.4, giá trị xuất zj được tính: zj
= f(u);
với u = x1.w1j + x2.w2j + ...+ xn.wnj + w0 (Công thức 1.3).
Hàm f() được gọi là hàm truyền có dạng chữ S nếu có các tính chất sau: bị chặn,
đơn điệu tăng, hàm liên tục trơn. Mọi hàm thỏa các tính chất trên đều có thể sử
dụng làm hàm truyền trong mạng. Các hàm thường được dùng trong mạng lan
truyền ngược:
Hàm logistic
f (u ) =

1
1 + e− u

Công thức 1.4

Hàm hyperbol
h(u ) =

1 − e−u
1 + e− u


Công thức 1.5

Hàm tang-hyperbol
tanh (u ) =

eu − e −u
eu + e − u

Công thức 1.5

Tuy nhiên, hàm logistic được sử dụng phổ biến nhất trong ba hàm trên. Khi các
giá trị {z1, z2, ..., zN} được tính, giá trị sai số trung bình bình phương E sẽ được xác
định. Quá trình lan truyền ngược sẽ được tiến hành.
Lan truyền ngược: là quá trình cập nhật lại các trọng số mạng W dựa trên sai số
trung bình bình phương. Gọi wt là trọng số tại bước thứ t, công thức cập nhật trọng
số là:
wt = wt −1 + Δwt

Công thức 1.6


12
Δwt được tính theo Công thức 1.2, công thức này cần xác định giá trị:
Công thức 1.7

∂E ∂E ∂u
∂u
=
x
= −δ x

∂w ∂u ∂w
∂w

trong đó u là giá trị đưa vào hàm truyền f(u) tương ứng ở mỗi nút.
Với mạng đang xét là mạng 3 lớp, tại nút xuất z theo qui tắc chuỗi:
∂E ∂E ∂z
=
x
∂u ∂z ∂u

Công thức 1.8

Đạo hàm của sai số trung bình bình phương và hàm logistic được tính:
∂E
=z−t
∂z

Công thức 1.9

∂z
= − z (1 − z )
∂u

Công thức 1.10

Vậy giá trị δ tại nút xuất z được tính:
−δ out = −

∂E
∂E ∂z

=−
x
= ( z − t ) z (1 − z )
∂u
∂z ∂u

Trong Công thức 1.7 giá trị
trọng số w. Tóm lại, giá trị

Công thức 1.11

∂u
= xi diễn tả sự thay đổi của u vào sự thay đổi
∂w

∂E
tại nút xuất được tính:
∂w

∂E ( z − t ) × z × (1 − z )
=
∂w ( z − t ) × z × (1 − z ) × y j

Công thức 1.12

Tương tự cho nút ẩn thứ j:
 pb, j
∂E
= f ( x) = 
∂w

 pb, i

Công thức 1.13

với p = (z-t)z(1-z); bj là trọng số cung nối từ nút ẩn thứ j đến nút xuất.
Như vậy, khi quá trình lan truyền ngược thực hiện, các trọng số sẽ được cập
nhật sao cho sai số trung bình bình phương có xu hướng giảm dần. Quá trình lan
truyền tiến và lan truyền ngược được thực hiện xen kẽ nhiều lần cho đến khi đạt
được giá trị sai số trung bình bình phương E mong muốn.
Vì các trọng số được điều chỉnh cho phù hợp với dữ liệu của nhóm luyện, có
thể mạng thần kinh trải qua sự luyện quá mức (overtraining). Khi ấy mạng thần


×