Tải bản đầy đủ (.pdf) (134 trang)

PHÂN cụm dữ LIỆU và LUẬT kết hợp ỨNG DỤNG TRONG PHÂN TÍCH dữ LIỆU CÔNG THỨC dược PHẨM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (14.21 MB, 134 trang )

ĐẠI HỌC QUỐC GIA TP HCM
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN


Hà Siu

PHÂN CỤM DỮ LIỆU VÀ LUẬT KẾT HỢP ỨNG DỤNG
TRONG PHÂN TÍCH DỮ LIỆU CÔNG THỨC DƯỢC PHẨM

LUẬN VĂN THẠC SĨ
NGÀNH: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01.01

TP HỒ CHÍ MINH – NĂM 2017


ĐẠI HỌC QUỐC GIA TP HCM
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN


Hà Siu

PHÂN CỤM DỮ LIỆU VÀ LUẬT KẾT HỢP ỨNG DỤNG
TRONG PHÂN TÍCH DỮ LIỆU CÔNG THỨC DƯỢC PHẨM

LUẬN VĂN THẠC SĨ
NGÀNH: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01.01
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS. TS. ĐỖ QUANG DƯƠNG


TP HỒ CHÍ MINH – NĂM 2017


LỜI CAM ĐOAN
Tôi xin cam đoan luận văn thạc sĩ này là công trình nghiên cứu của riêng tôi. Các
số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong
bất kỳ công trình nào khác.
Riêng phần lý thuyết và phần dữ liệu thực nghiệm, tôi có tham khảo từ các công
trình khác và tôi có liệt kê trong phần trích dẫn và phần tài liệu tham khảo của luận
văn này.
Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được
cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc.
Thành phố Hồ Chí Minh, ngày 20 tháng 03 năm 2017
Học viên thực hiện luận văn

Hà Siu

Trang i


LỜI CẢM ƠN
Trước tiên, tôi xin chân thành cảm ơn PGS. TS. Đỗ Quang Dương đã tận tình
hướng dẫn khoa học, giúp đỡ tôi về tài liệu nghiên cứu, dữ liệu thực nghiệm, đọc và
chỉnh sửa bản thảo luận văn và các đóng góp khoa học quan trọng để tôi có thể hoàn
thành luận văn tốt nghiệp này.
Tôi cũng xin gửi lời cảm ơn tới các thầy, cô giáo Trường Đại học Công nghệ
Thông tin (Đại học Quốc gia Thành phố Hồ Chí Minh) đã dạy dỗ và truyền đạt kiến
thức cho tôi trong suốt quá trình học tập và nghiên cứu của mình.
Tôi xin gửi lời cảm ơn chân thành đến ThS. Nguyễn Thành Tân, một người bạn,
một người đồng nghiệp đã có những góp ý chân thành và hữu ích, người đã giúp đỡ

tôi rất nhiều về tài liệu nghiên cứu có liên quan đến lĩnh vực Dược phẩm.
Tôi cũng xin gửi lời cảm ơn đến gia đình đã động viên và khích lệ tôi trong suốt
thời gian học tập và nghiên cứu vừa qua.
Cuối cùng, tôi xin chân thành cảm ơn quý thầy cô đồng nghiệp Trường Đại học
Y Dược Thành phố Hồ Chí Minh đã tạo điều kiện cho tôi sắp xếp thời gian đi học
và gánh vác một phần công việc thay tôi trong bộ môn.
Thành phố Hồ Chí Minh, ngày 20 tháng 03 năm 2017
Hà Siu

Trang ii


MỤC LỤC
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ............................................... ix
DANH MỤC CÁC BẢNG..........................................................................................x
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ .................................................................. xii
Chương 1: MỞ ĐẦU...................................................................................................1
1.1 Giới thiệu bài toán phân tích công thức dữ liệu dược phẩm .............................1
1.2 Các thách thức của bài toán phân tích công thức dữ liệu dược phẩm ...............2
1.3 Tình hình nghiên cứu .........................................................................................2
1.3.1 Tình hình nghiên cứu ngoài nước ...............................................................2
1.3.2 Tình hình nghiên cứu trong nước ................................................................3
1.4 Đề tài nghiên cứu “Phân cụm dữ liệu và luật kết hợp ứng dụng trong phân tích
công thức dữ liệu dược phẩm”.................................................................................5
1.4.1 Lý do lựa chọn đề tài ...................................................................................5
1.4.2 Mục tiêu của đề tài ......................................................................................5
1.5 Đối tượng và phạm vi nghiên cứu .....................................................................5
1.5.1 Bài toán phân cụm dữ liệu ...........................................................................6
1.5.2 Bài toán rút luật kết hợp ..............................................................................6
1.5.3 So sánh điểm mạnh và điểm yếu của các phương pháp ..............................7

1.6 Nội dung luận văn ..............................................................................................7
1.7 Ý nghĩa khoa học và thực tiễn của đề tài ...........................................................8
1.8 Kết luận chương 1 ..............................................................................................9
Chương 2: TỔNG QUAN VỀ CÔNG THỨC DƯỢC PHẨM .................................10
2.1 Tổng quan về công thức dược phẩm................................................................10
2.1.1 Thuốc .........................................................................................................11
2.1.2 Ngành công nghiệp dược phẩm .................................................................12
2.1.3 Phát minh thuốc .........................................................................................12
2.1.4 Phát triển thuốc ..........................................................................................12
2.1.5 Thiết lập công thức dược phẩm .................................................................13
2.1.6 Bào chế học ...............................................................................................15
2.1.7 Tối ưu hóa..................................................................................................16
2.1.7.1 Vấn đề tối ưu hóa trong thực tiễn .......................................................16
Trang iii


2.1.7.2 Khái niệm và định nghĩa tối ưu hóa ....................................................19
2.1.7.3 Phương pháp tối ưu hóa truyền thống .................................................22
2.1.7.4 Phương pháp tối ưu hóa thông minh ...................................................27
2.2 Trí tuệ nhân tạo ................................................................................................30
2.3 Ứng dụng trí tuệ nhân tạo trong nghiên cứu phát triển dược phẩm ................31
2.3.1 Liên quan nhân-quả ...................................................................................31
2.3.2 Lập mô hình thực nghiệm .........................................................................31
2.3.3 Phân tích liên quan ....................................................................................32
2.3.4 Ứng dụng của máy tính .............................................................................33
2.3.4.1 Phân cụm dữ liệu.................................................................................33
2.3.4.2 Luật kết hợp ........................................................................................34
2.4 Kết luận chương 2 ............................................................................................34
Chương 3: TỔNG QUAN CƠ SỞ LÝ THUYẾT .....................................................35
3.1 Phân cụm dữ liệu .............................................................................................35

3.1.1 Khái niệm ..................................................................................................35
3.1.2 Độ đo khoảng cách ....................................................................................36
3.1.2.1 Khoảng cách Minkowski ....................................................................36
3.1.2.2 Khoảng cách Manhattan .....................................................................36
3.1.2.3 Khoảng cách Euclide ..........................................................................37
3.1.2.4 Tính chất của độ đo khoảng cách ........................................................37
3.1.3 Các phương pháp phân cụm dữ liệu ..........................................................37
3.1.4 Thuật toán k-means ...................................................................................38
3.1.4.1 Xác định bài toán ................................................................................39
3.1.4.2 Giải thuật k-means ..............................................................................40
3.1.4.3 Ưu điểm của thuật toán k-means ........................................................41
3.1.4.4 Nhược điểm của thuật toán k-means...................................................41
3.2 Logic mờ ..........................................................................................................41
3.2.1 Khái niệm ..................................................................................................41
3.2.2 Các dạng hàm thành viên (Membership Function) thường gặp ................42
3.2.2.1 Hàm Triangular ...................................................................................42
3.2.2.2 Hàm Trapezoid ....................................................................................43
Trang iv


3.2.2.3 Hàm Gaussian .....................................................................................44
3.2.2.4 Hàm Bell .............................................................................................44
3.2.2.5 Hàm Sigmoid ......................................................................................45
3.2.2.6 Hàm Left-Right ...................................................................................45
3.2.3 Các hệ thống suy diễn mờ (Fuzzy Inference Systems) .............................46
3.2.3.1 Mô hình Mamdani...............................................................................46
3.2.3.2 Mô hình Sugeno (mô hình TSK) ........................................................49
3.2.3.3 Mô hình Tsukamoto ............................................................................50
3.2.4 Ưu điểm .....................................................................................................51
3.2.5 Hạn chế ......................................................................................................51

3.3 Luật kết hợp .....................................................................................................51
3.3.1 Định nghĩa .................................................................................................51
3.3.2 Ý nghĩa của luật kết hợp ............................................................................52
3.3.3 Một số tính chất .........................................................................................53
3.3.4 Phân loại luật kết hợp ................................................................................53
3.3.4.1 Luật kết hợp nhị phân (Boolean association rule) ..............................53
3.3.4.2 Luật kết hợp định lượng và hạng mục (quantitative and categorical
association rule) ..............................................................................................53
3.3.4.3 Luật kết hợp theo hướng tập thô (mining association rule based on
rough set).........................................................................................................54
3.3.4.4 Luật kết hợp đa mức (multi-level association rule) ............................54
3.3.4.5 Luật kết hợp mờ (fuzzy association rule) ...........................................54
3.3.4.6 Luật kết hợp có trọng số (association rule with weighted items) .......54
3.3.4.7 Luật kết hợp song song (parallel mining of association rule) .............54
3.4 Thuật toán Apriori khai phá luật kết hợp.........................................................54
3.4.1 Giới thiệu ...................................................................................................54
3.4.2 Thuật toán Apriori .....................................................................................55
3.4.3 Sơ đồ thuật giải ..........................................................................................56
3.5 Giới thiệu các công cụ phần mềm ...................................................................56
3.5.1 Phần mềm mã nguồn mở Weka ................................................................56
3.5.1.1 Giới thiệu ............................................................................................56
3.5.1.2 Các chức năng chính ...........................................................................56
Trang v


3.5.1.3 Môi trường chính ................................................................................57
3.5.2 Phần mềm chuyên nghiệp dành cho ngành Dược FormRules ..................57
3.5.2.1 Giới thiệu ............................................................................................57
3.5.2.2 Các chức năng chính ...........................................................................58
3.5.2.3 Giao diện .............................................................................................58

3.6 Kết luận chương 3 ............................................................................................59
Chương 4: CHƯƠNG TRÌNH ỨNG DỤNG............................................................60
4.1 Giới thiệu chương trình ứng dụng ...................................................................60
4.1.1 Hệ thống ....................................................................................................60
4.1.2 Cấu trúc chương trình ................................................................................60
4.1.2.1 Module 1: Dữ liệu ...............................................................................61
4.1.2.2 Module 2: Phân cụm dữ liệu với thuật toán k-means .........................61
4.1.2.3 Module 3: Sinh luật kết hợp với thuật toán C4.5 ................................62
4.1.2.4 Module 4: Sinh luật kết hợp với thuật toán Apriori ............................63
4.2 Kiến trúc của chương trình ứng dụng ..............................................................64
4.3 Kết quả cần đạt được .......................................................................................65
4.4 Bài toán “Phân cụm dữ liệu và luật kết hợp ứng dụng trong phân tích dữ liệu
công thức dược phẩm” ...........................................................................................65
4.4.1 Đặt vấn đề ..................................................................................................65
4.4.2 Mô tả bài toán ............................................................................................66
4.4.3 Ứng dụng hệ điều khiển mờ ......................................................................66
4.4.4 Minh họa với dữ liệu thực nghiệm công thức viên nén matrix .................67
4.4.5 Thử nghiệm và đánh giá phần mềm bằng dữ liệu thực nghiệm ở quy mô
phòng thí nghiệm và so sánh với phần mềm hiện có .........................................71
4.5 Kết luận chương 4 ............................................................................................72
Chương 5: KẾT QUẢ VÀ BÀN LUẬN ...................................................................73
5.1 Công thức dữ liệu: Công thức viên nén matrix ...............................................73
5.2 Thống kê ..........................................................................................................73
5.3 Kết quả phân cụm dữ liệu ................................................................................74
5.3.1 Kết quả phân cụm dữ liệu bằng phần mềm Weka.....................................74
5.3.2 Kết quả phân cụm dữ liệu bằng phần mềm ứng dụng ...............................74
5.3.2.1 Phân cụm dữ liệu đối với biến phụ thuộc y1 .......................................74
Trang vi



5.3.2.2 Phân cụm dữ liệu đối với biến phụ thuộc y2 .......................................75
5.3.2.3 Phân cụm dữ liệu đối với biến phụ thuộc y3 .......................................75
5.4 Kết quả rút luật kết hợp ...................................................................................76
5.4.1 Kết quả rút luật kết hợp bằng phần mềm Weka ........................................76
5.4.2 Kết quả rút luật kết hợp bằng phần mềm FormRules ...............................77
5.4.2.1 Rút luật kết hợp đối với biến phụ thuộc y1 .........................................77
5.4.2.2 Rút luật kết hợp đối với biến phụ thuộc y2 .........................................79
5.4.2.3 Rút luật kết hợp đối với biến phụ thuộc y3 .........................................80
5.4.3 Kết quả rút luật kết hợp bằng phần mềm ứng dụng với thuật toán Apriori
kết hợp với logic mờ...........................................................................................82
5.4.3.1 Rút luật kết hợp đối với biến phụ thuộc y1 .........................................82
5.4.3.2 Rút luật kết hợp đối với biến phụ thuộc y2 .........................................82
5.4.3.3 Rút luật kết hợp đối với biến phụ thuộc y3 .........................................83
5.4.4 Kết quả rút luật kết hợp bằng phần mềm ứng dụng kết hợp giữa phân cụm
dữ liệu, logic mờ và thuật toán cây quyết định C4.5..........................................84
5.4.4.1 Rút luật kết hợp đối với biến phụ thuộc y1 .........................................84
5.4.4.2 Rút luật kết hợp đối với biến phụ thuộc y2 .........................................84
5.5 Phân tích mối quan hệ nhân-quả ......................................................................85
5.5.1 Ảnh hưởng của x1 và x2 lên biến phụ thuộc y1 ..........................................85
5.5.2 Ảnh hưởng của x2 và x3 lên biến phụ thuộc y2 ..........................................85
5.5.3 Ảnh hưởng của x2 và x3 lên biến phụ thuộc y3 ..........................................85
5.6 Kết luận chương 5 ............................................................................................86
Chương 6: KẾT LUẬN VÀ KHUYẾN NGHỊ .........................................................87
6.1 Nhận xét và kết luận ........................................................................................87
6.1.1 Nhận xét 1: Về thuật toán cài đặt ..............................................................87
6.1.2 Nhận xét 2: Về tính hiệu quả của phần mềm ............................................88
6.2 Đánh giá ...........................................................................................................88
6.3 Những tồn tại cần giải quyết ............................................................................88
6.4 Hướng phát triển ..............................................................................................88
6.5 Kết luận chương 6 ............................................................................................89

TÀI LIỆU THAM KHẢO .........................................................................................90
PHỤ LỤC 1 ...............................................................................................................93
Trang vii


A. Công thức dữ liệu số 2: Công thức Diclofenac sodium microspheres .............93
B. Kết quả ..............................................................................................................94
C. Nhận xét ............................................................................................................97
PHỤ LỤC 2 ...............................................................................................................98
A. Công thức dữ liệu số 3: Cỡ hạt trong nhũ tương nano .....................................98
B. Kết quả ............................................................................................................100
C. Nhận xét ..........................................................................................................101
PHỤ LỤC 3 .............................................................................................................102
A. Công thức dữ liệu số 4: Viên nang acyclovir tác dụng kéo dài ......................102
B. Kết quả ............................................................................................................103
C. Nhận xét ..........................................................................................................105
PHỤ LỤC 4 .............................................................................................................106
A. Công thức dữ liệu số 5: Công thức kem Placebo ...........................................106
B. Kết quả ............................................................................................................107
C. Nhận xét ..........................................................................................................108
PHỤ LỤC 5 .............................................................................................................109
A. Công thức dữ liệu số 6: Công thức kem Vitamin E – Nghệ ...........................109
B. Kết quả ............................................................................................................110
C. Nhận xét ..........................................................................................................112
PHỤ LỤC 6 .............................................................................................................113
A. Công thức dữ liệu số 7: Viên nén rã nhanh chứa Loratadin 10 mg ................113
B. Kết quả ............................................................................................................114
C. Nhận xét ..........................................................................................................114
PHỤ LỤC 7 .............................................................................................................115
A. Công thức dữ liệu số 8: Viên Salbutamol 4 mg phóng thích kéo dài .............115

B. Kết quả ............................................................................................................116
C. Nhận xét ..........................................................................................................118

Trang viii


DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Ký hiệu viết tắt

Từ nguyên gốc

ANGNES

Anglomerative nesting

BIRCH

Balanced iterative reducing clustering using hierarchies

CLARA

Clustering large applications

CLARANS

Clustering large applications based on randomized search

CLIQUE

Clustering in quest


CURE

Clustering using representatives

DBSCAN

Density-based spatial clustering of application with noise

DENCLUDE

Density-based clustering

DIANA

Divisive analysis clustering

EM

Expectation–maximization

FCE

Fuzzy C-ellipse

FCM

Fuzzy C-means

FCMP


Fuzzy C-mixed prototype

OPTICS

Ordering points to identify the clustering structure

PAM

Partitioning around medoids

ROCK

Robust clustering using links

STING

Statistical information grid-based method

Trang ix


DANH MỤC CÁC BẢNG
Bảng 2.1: Quá trình phát triển sản phẩm và quy trình ..............................................13
Bảng 2.2: Công nghệ thông minh cho nghiên cứu và phát triển R&D .....................28
Bảng 2.3: So sánh trí tuệ con người với trí tuệ nhân tạo...........................................31
Bảng 4.1: Dữ liệu thực nghiệm của viên nén matrix ................................................67
Bảng 4.2: Dữ liệu thực nghiệm công thức dược phẩm được sử dụng để đánh giá
phần mềm ..................................................................................................................71
Bảng 5.1: Kết quả thống kê các thông số của các biến độc lập x và các biến phụ

thuộc y .......................................................................................................................73
Bảng 5.2: Kết quả phân cụm dữ liệu bằng phần mềm Weka ....................................74
Bảng 5.3: Phân cụm dữ liệu đối với biến phụ thuộc y1 .............................................74
Bảng 5.4: Phân cụm dữ liệu đối với biến phụ thuộc y2 .............................................75
Bảng 5.5: Phân cụm dữ liệu đối với biến phụ thuộc y3 .............................................75
Bảng 5.6: Kết quả rút luật kết hợp bằng phần mềm Weka .......................................76
Bảng 5.7: Ảnh hưởng của x1 và x2 lên biến phụ thuộc y1 .........................................85
Bảng 5.8: Ảnh hưởng của x2 và x3 lên biến phụ thuộc y2 .........................................85
Bảng 5.9: Ảnh hưởng của x2 và x3 lên biến phụ thuộc y3 .........................................85
Bảng phụ lục 1.1: Dữ liệu thực nghiệm của công thức Diclofenac sodium
microspheres .............................................................................................................93
Bảng phụ lục 1.2: Kết quả rút luật kết hợp ...............................................................94
Bảng phụ lục 2.1: Dữ liệu thực nghiệm của cỡ hạt trong nhũ tương nano ...............98
Bảng phụ lục 2.2: Kết quả rút luật kết hợp .............................................................100
Bảng phụ lục 3.1: Dữ liệu thực nghiệm của công thức Acyclovir ..........................102
Bảng phụ lục 3.2: Kết quả rút luật kết hợp .............................................................103
Bảng phụ lục 4.1: Dữ liệu thực nghiệm của kem Placebo ......................................106
Bảng phụ lục 4.2: Kết quả rút luật kết hợp .............................................................107
Bảng phụ lục 5.1: Dữ liệu thực nghiệm của kem Vitamin E - Nghệ ......................109
Bảng phụ lục 5.2: Kết quả rút luật kết hợp .............................................................110
Bảng phụ lục 6.1: Dữ liệu thực nghiệm của viên Loratadin ...................................113
Bảng phụ lục 6.2: Kết quả rút luật kết hợp .............................................................114
Trang x


Bảng phụ lục 7.1: Dữ liệu thực nghiệm của viên Salbutamol ................................115
Bảng phụ lục 7.2: Kết quả rút luật kết hợp .............................................................116

Trang xi



DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 2.1: Minh họa đồ thị biểu diễn độ hấp thu tối đa .............................................16
Hình 2.2: Minh họa đồ thị biểu diễn CV hàm lượng tối thiểu ..................................17
Hình 2.3: Phương pháp bề mặt đáp ứng....................................................................24
Hình 2.4: Phương pháp thay biến..............................................................................25
Hình 2.5: Phương pháp dốc nhất ...............................................................................26
Hình 2.6: Phương pháp đơn hình ..............................................................................27
Hình 2.7: Phần mềm thông minh trong nghiên cứu – phát triển thuốc .....................27
Hình 2.8: Phần mềm thiết kế Design-Expert 6.0.6 Stat-Ease Inc., Minneapolis
(2002) ........................................................................................................................28
Hình 2.9: Phần mềm thiết kế FormData v2 Intelligensys Ltd., UK (2003) ..............28
Hình 2.10: Phần mềm FormRules .............................................................................29
Hình 2.11: Nghiên cứu liên quan giữa nhân và quả ..................................................29
Hình 2.12: Phần mềm INForm ..................................................................................30
Hình 2.13: Tối ưu hóa và dự đoán ............................................................................30
Hình 3.1: Lưu đồ thuật toán k-means........................................................................40
Hình 3.2: Giải thuật k-means ....................................................................................40
Hình 3.3: Minh họa khái niệm logic cổ điển (a) và logic mờ (b) .............................42
Hình 3.4: Minh họa quá trình xử lí của logic mờ......................................................42
Hình 3.5: Hàm Triangular .........................................................................................43
Hình 3.6: Hàm Trapezoid ..........................................................................................44
Hình 3.7: Hàm Gaussian ...........................................................................................44
Hình 3.8: Hàm Bell ...................................................................................................44
Hình 3.9: Hàm Sigmoid ............................................................................................45
Hình 3.10: Hàm Left-Right .......................................................................................45
Hình 3.11: Minh họa quá trình xử lí các luật ............................................................46
Hình 3.12: Quá trình làm mờ trong mô hình Mamdani ............................................47
Hình 3.13: Minh họa Centroid of area (trong đó BO = OC).....................................47
Hình 3.14: Minh họa Bisector of area (trong đó SA1 = SA2)......................................48

Hình 3.15: Minh họa Mean of maximum (trong đó BO = OC) ................................48
Trang xii


Hình 3.16: Minh họa Smallest of maximum .............................................................48
Hình 3.17: Minh họa Largest of maximum...............................................................48
Hình 3.18: Quá trình làm mờ trong mô hình Sugeno ...............................................49
Hình 3.19: Quá trình làm mờ trong mô hình Tsukamono.........................................50
Hình 3.20: Giải thuật Apriori ....................................................................................55
Hình 3.21: Sơ đồ thuật giải Apriori...........................................................................56
Hình 3.22: Giao diện khởi đầu của Weka .................................................................57
Hình 3.23: Giao diện khởi đầu của FormRules.........................................................58
Hình 4.1: Giao diện module 1 – Dữ liệu ...................................................................61
Hình 4.2: Giao diện module 2 – Phân cụm dữ liệu với thuật toán k-means .............62
Hình 4.3: Giao diện module 3 – Sinh luật kết hợp với thuật toán C4.5 ....................63
Hình 4.4: Giao diện module 4 – Sinh luật kết hợp với thuật toán Apriori................64
Hình 4.5: Kiến trúc chương trình minh họa quá trình giải quyết bài toán rút luật kết
hợp và tối ưu hóa trong phân tích công thức dược phẩm..........................................64
Hình 5.1: Mô hình nhân-quả giữa biến độc lập x1, x2 với biến phụ thuộc y1 ...........78
Hình 5.2: Đồ thị nhân-quả ba chiều giữa biến độc lập x1, x2 với biến phụ thuộc y1 78
Hình 5.3: Mô hình nhân-quả giữa biến độc lập x2, x3 với biến phụ thuộc y2 ...........79
Hình 5.4: Đồ thị nhân-quả ba chiều giữa biến độc lập x2, x3 với biến phụ thuộc y2 80
Hình 5.5: Mô hình nhân-quả giữa biến độc lập x2, x3 với biến phụ thuộc y3 ...........81
Hình 5.6: Đồ thị nhân-quả ba chiều giữa biến độc lập x2, x3 với biến phụ thuộc y3 81

Trang xiii


Chương 1: MỞ ĐẦU


Chương 1: MỞ ĐẦU
Trong chương này sẽ trình bày các nội dung sau:
-

Giới thiệu bài toán phân tích công thức dữ liệu dược phẩm.

-

Các thách thức của bài toán.

-

Tình hình nghiên cứu trong và ngoài nước.

-

Giới thiệu đề tài nghiên cứu trong luận văn này.

-

Đối tượng và phạm vi nghiên cứu của đề tài.

-

Giới thiệu khái quát nội dung luận văn.

-

Ý nghĩa khoa học và thực tiễn của đề tài.


-

Kết luận chương.

1.1 Giới thiệu bài toán phân tích công thức dữ liệu dược phẩm
Quá trình thành lập công thức dược phẩm là quá trình bắt đầu bằng một vài thành
phần ban đầu đã được biết trước và kết thúc bằng một hoặc vài công thức dược
phẩm thỏa mãn yêu cầu đặt ra ban đầu. Công thức dược phẩm bao gồm một dãy các
mối quan hệ với nhau như thành phần, liều lượng, tỉ trọng và kinh nghiệm của
người bào chế giữa các chất, do đó kết quả có thể tạo ra công thức dược phẩm chứa
đựng những mâu thuẫn trong công thức được thiết lập. Do đó rất cần kiểm tra và
phân tích lại mối quan hệ giữa các thành phần đó trong công thức dược phẩm.
Mặc dù mạng nơron ra đời vào những năm 1940 nhưng mãi đến những năm 1990
mới xuất hiện trong các bài báo khoa học nghiên cứu ứng dụng trong lĩnh vực công
thức dược phẩm.
Các kỹ thuật khai phá dữ liệu ứng dụng trong lĩnh vực công thức dược phẩm tập
trung chủ yếu vào mạng nơron. Kỹ thuật mạng nơron có những ưu điểm và là một
sự kết hợp tốt với các phương pháp thống kê cổ điển nhằm phân tích các mô hình
công thức dữ liệu dược phẩm khác nhau. Kỹ thuật thông minh cho phương pháp xử
lí mối quan hệ phi tuyến phức tạp liên quan đến các điều kiện, các thành phần, các
phản ứng và thuộc tính dược phẩm trong phân tích công thức dược phẩm và kết hợp
linh hoạt với các phương pháp thống kê cổ điển.

Trang 1


Chương 1: MỞ ĐẦU

1.2 Các thách thức của bài toán phân tích công thức dữ liệu dược phẩm
Đầu tiên phải kể đến thành công của việc ứng dụng hệ chuyên gia trong phân tích

công thức dược phẩm. Tuy nhiên hệ chuyên gia chỉ thật sự hoạt động tốt khi được
cung cấp các tri thức đúng đắn và biết trước. Trên thực tế, không phải tri thức nào
cũng được biết trước và có sẵn, tình trạng này gọi là trạng thái “thắt cổ chai”.
Khó khăn sẽ lớn hơn nếu chúng ta không biết toàn bộ các tri thức hoặc một phần
của tri thức mà chỉ được cung cấp một tập hợp các bản ghi (record). Dựa vào các
bản ghi này, chúng ta cần rút ra các luật mà các thuộc tính có liên quan với nhau.
Trường hợp này thường xảy ra đối với các dược phẩm mới, thông thường chứa các
công thức mới.
Độ phức tạp và cơ sở dữ liệu lớn làm cho nhiệm vụ phân tích công thức thêm khó
khăn. Nhiệm vụ của chúng ta là cần tìm ra các tri thức ẩn dưới các lớp dữ liệu.
Trường hợp này chúng ta hay gọi là “giàu dữ liệu nhưng nghèo tri thức” (“data rich
but knowledge poor”).
Về nguyên tắc, khai phá dữ liệu có thể dùng mô hình và luật. Chúng ta có thể xây
dựng mô hình khai phá dữ liệu dựa trên tập số liệu thực nghiệm và từ đó tiên đoán
công thức mới. Tuy nhiên nếu sử dụng mô hình tiên đoán sẽ gặp khó khăn nếu thay
đổi thành phần và điều kiện cho trước của bài toán.

1.3 Tình hình nghiên cứu
1.3.1 Tình hình nghiên cứu ngoài nước
Đa số các công trình có liên quan đến phân tích công thức dược phẩm được viết
dưới dạng luận văn thạc sĩ và luận án tiến sĩ. Các công trình này tập trung chủ yếu
trong phân tích các công thức dược phẩm ở dạng đường uống và một số ít là các
dược phẩm dùng ngoài da. Cụ thể các công trình đó nghiên cứu về:
-

Công thức viên nén phóng thích có kiểm soát.

-

Công thức viên nén phóng thích tức thời.


-

Công thức dược phẩm dạng bột.

-

Công thức dược phẩm dùng ngoài da.

-

Lớp phủ bao phim của dược phẩm.

Các công trình sử dụng chủ yếu là thuật giải di truyền kết hợp mạng nơron và
logic mờ giúp tiên đoán các pha, các trạng thái, các điều kiện và tối ưu các thuộc
Trang 2


Chương 1: MỞ ĐẦU

tính của dược phẩm [13], [21], [22], [23], [24]. Các công trình về công thức dược
phẩm vẫn còn ít ỏi và khá mới mẻ, nhóm tác giả Q. Shao, R. C. Rowe, P. York là
một trong những nhóm tác giả tiên phong và đi đầu trong việc nghiên cứu các kỹ
thuật khai phá dữ liệu ứng dụng trong phân tích công thức dược phẩm.
Các nghiên cứu trên thế giới:
- Luận án tiến sĩ của Qun Shao (2004), Đánh giá các kỹ thuật mạng nơron, hệ
thống suy diễn mờ có bổ sung chức năng học của mạng nơron, cây quyết định và
cây mô hình trong việc khai phá dữ liệu công thức dược phẩm, Khoa Dược, Đại học
Bradford.
- Q. Shao, R. C. Rowe và P. York (2006), So sánh Nơron mờ (Neuro Fuzzy) và

mạng nơron trong mô hình hóa công thức sản xuất thuốc viên từ dữ liệu thực
nghiệm.
- Elizabeth A. Colbourn, Raymond C. Rowe (2006), Khai phá dữ liệu trong quy
trình sản xuất và công thức thuốc.
- Hiện tại khuynh hướng sử dụng trí tuệ nhân tạo trong các xí nghiệp dược lớn trên
thế giới đang tăng lên, việc nghiên cứu ứng dụng tại các xí nghiệp này cho thấy trí
tuệ nhân tạo kết hợp với thống kê cho kết quả tốt hơn là chỉ áp dụng thống kê đơn
thuần [20], [21].
- Hiện tại các công ty Dược ở nước ngoài (Anh, Mỹ) áp dụng khai phá dữ liệu
trong phân tích dữ liệu công thức thuốc.
1.3.2 Tình hình nghiên cứu trong nước
Tại Việt Nam, Đại học Y Dược Thành phố Hồ Chí Minh là trường đại học đi đầu
trong việc nghiên cứu các ứng dụng công nghệ thông tin trong ngành Dược. Đại học
Y Dược Thành phố Hồ Chí Minh đã công bố nhiều bài báo khoa học trong nước và
quốc tế về các ứng dụng cụ thể của công nghệ thông tin trong ngành Dược. Đặc biệt
nhóm nghiên cứu của PGS.TS. Đỗ Quang Dương là một trong những nhóm đầu tiên
nghiên cứu về phân tích công thức dược phẩm tại Việt Nam. Hiện nay, nhóm tập
trung vào việc nghiên cứu mối quan hệ nhân quả của các công thức dược phẩm [1],
[3], [5] từ đó so sánh, đánh giá các kỹ thuật ứng dụng khác nhau cho công thức
dược phẩm [2], [6] sau đó tối ưu hóa cho từng giai đoạn của quá trình phân tích
công thức dược phẩm [4], [7], [12], [13], [17], [18]. Tình hình nghiên cứu công
Trang 3


Chương 1: MỞ ĐẦU

nghệ thông tin trong nước trong lĩnh vực dược phẩm nói chung và phân tích công
thức dược phẩm nói riêng là rất mới mẻ và mang nhiều thách thức rất lớn.
Các nghiên cứu ở Việt Nam:
- Từ năm 2002, GS. TSKH. Hoàng Kiếm đã đề nghị ứng dụng triển khai khai phá

dữ liệu tại Đại học Y Dược, Thành phố Hồ Chí Minh.
- Hoàng Kiếm, Lê Hoài Bắc, Đỗ Quang Dương, Ứng dụng mạng nơron, logic mờ
và thuật toán di truyền giải quyết bài toán tối ưu hóa công thức và quy trình sản
xuất dược phẩm, Tạp chí Phát triển khoa học công nghệ, Đại học Quốc gia Thành
phố Hồ Chí Minh, Tập 6, 5 & 6/2003, 5 – 12.
- Các nghiên cứu ứng dụng FormRules cho nghiên cứu và phát triển thuốc tại
Khoa Dược – Đại Học Y Dược Thành phố Hồ Chí Minh.
- Hoàng Kiếm, Lê Hoài Bắc, Đỗ Quang Dương (2003), Kết hợp các kỹ thuật trí
tuệ nhân tạo (AI Technics) tối ưu công thức dược phẩm, Hội nghị thế giới lần thứ 7
về cơ thể học, người máy và công nghệ thông tin.
- Phan Ngọc Nhiên Thảo, Chung Khang Kiệt, Đỗ Quang Dương, Đặng Văn Giáp
(2014), Nghiên cứu quá trình tối ưu hóa công thức bào chế bằng phần mềm thông
minh Phasolpro IO, Tạp chí Y học Thành phố Hồ Chí Minh, Tập 18 Số 2, 32 – 37.
- Nguyễn Thành Phát, Trần Văn Thành, Chung Khang Kiệt, Đỗ Quang Dương
(2015), Thiết kế và tối ưu hóa công thức viên nén chứa GLICLAZID 80 mg cải thiện
độ hòa tan, Hội nghị Khoa học Kỹ thuật Dược, Khoa Dược – Đại học Y Dược
Thành phố Hồ Chí Minh, Lần thứ 32.
- Chung Khang Kiệt, Lê Công Thức, Nguyễn Ngọc Vinh, Đỗ Quang Dương
(2015), Tối ưu hóa quy trình tổng hợp Metformin Hydroclorid, Hội nghị Khoa học
Kỹ thuật Dược, Khoa Dược – Đại học Y Dược Thành phố Hồ Chí Minh, Lần thứ 32.
- Hiện nay các xí nghiệp dược tại Việt Nam và Khoa Dược (Đại học Y Dược
Thành phố Hồ Chí Minh) cũng muốn tiếp cận và đẩy mạnh khai thác ứng dụng trí
tuệ nhân tạo trong nghiên cứu thuốc. Đây là yêu cầu thực tế tại nơi tác giả đang
công tác.
- Hiện tại Khoa Dược (Đại học Y Dược Thành phố Hồ Chí Minh) là đơn vị nghiên
cứu ứng dụng khai phá dữ liệu cho công thức Dược phẩm khá hiệu quả. Khoa đã
hợp tác và chuyển giao công nghệ cho các đơn vị như Khoa Sinh học (Đại học
Trang 4



Chương 1: MỞ ĐẦU

Khoa học Tự nhiên – Đại học Quốc gia Thành phố Hồ Chí Minh), Khu Nông
nghiệp Công nghệ cao để phân tích dữ liệu công thức nuôi trồng nấm đông trùng hạ
thảo, sinh phẩm…

1.4 Đề tài nghiên cứu “Phân cụm dữ liệu và luật kết hợp ứng dụng trong
phân tích công thức dữ liệu dược phẩm”
1.4.1 Lý do lựa chọn đề tài
Bài toán khai phá dữ liệu ứng dụng trong phân tích dữ liệu công thức dược phẩm
hiện vẫn còn khá mới mẻ tại Việt Nam. Bằng các kiến thức trong lĩnh vực khoa học
máy tính và công nghệ thông tin, chúng ta có thể giúp cho các dược sĩ Việt Nam có
thể giảm thiểu các sai sót đáng tiếc trong quá trình bào chế dược phẩm.
Khai phá dữ liệu là một đề tài rộng, do đó luận văn tập trung chủ yếu trong hai
vấn đề chính đó là phân cụm dữ liệu và luật kết hợp ứng dụng trong phân tích dữ
liệu công thức dược phẩm để tìm ra mối liên quan nhân-quả giữa các thành phần
dược chất khác nhau trong công thức.
Luận văn sẽ tập trung vào bài toán phân cụm dữ liệu và bài toán rút luật kết hợp
ứng dụng cho việc phân tích các công thức dược phẩm trong cơ sở dữ liệu động,
các cơ sở dữ liệu này được lấy từ các tạp chí khoa học chuyên ngành Y Dược và
thực nghiệm. Sau đó luận văn sẽ tiến hành so sánh các ưu điểm và nhược điểm của
các kỹ thuật phân cụm dữ liệu và rút luật kết hợp đó để tìm ra giải pháp tối ưu cho
việc tìm mối quan hệ nhân-quả trong phân tích công thức dược phẩm.
1.4.2 Mục tiêu của đề tài
Luận văn tập trung giải quyết hai bài toán chính như sau:
-

Bài toán 1: Phân cụm dữ liệu ứng dụng trong phân tích công thức dữ liệu
dược phẩm.


-

Bài toán 2: Rút luật kết hợp ứng dụng trong phân tích công thức dữ liệu
dược phẩm.

1.5 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu là công thức dược phẩm cho dữ liệu động sử dụng công cụ
phân cụm dữ liệu và rút luật kết hợp cho các dạng dữ liệu công thức dược phẩm
khác nhau.
Trang 5


Chương 1: MỞ ĐẦU

Phạm vi nghiên cứu là bộ cơ sở dữ liệu động, các cơ sở dữ liệu này được lấy từ
các tạp chí khoa học chuyên ngành Y Dược và thực nghiệm.
1.5.1 Bài toán phân cụm dữ liệu
Phân cụm dữ liệu là một kỹ thuật trong khai phá dữ liệu nhằm tìm kiếm, phát
hiện các cụm, các mẫu dữ liệu tự nhiên tiềm ẩn và quan trọng trong tập dữ liệu lớn
để từ đó cung cấp thông tin, tri thức cho việc ra quyết định.
Phân cụm dữ liệu là sự phân chia một cơ sở dữ liệu lớn thành các nhóm dữ liệu
trong đó các đối tượng tương tự như nhau. Trong mỗi nhóm, một số chi tiết có thể
không quan tâm đến để đổi lấy dữ liệu đơn giản hóa.
Phân cụm dữ liệu không đòi hỏi phải định nghĩa trước các mẫu dữ liệu huấn
luyện. Ngoài ra phân cụm dữ liệu còn có thể được sử dụng như một bước tiền xử lí
cho các thuật toán khai phá dữ liệu khác như là phân loại và mô tả đặc điểm, có tác
dụng trong việc phát hiện ra các cụm.
Phương pháp tiến hành trong luận văn sẽ là lấy các số liệu, dữ liệu trên các tạp
chí khoa học chuyên ngành Y Dược và thực nghiệm để tiến hành phân cụm dữ liệu.
Sau khi có kết quả chúng ta tiến hành so sánh ưu và nhược điểm của các phương

pháp, từ đó đề nghị cải tiến các phương pháp để tìm ra phương pháp phân cụm thay
thế có hiệu quả tương đương hoặc tốt hơn cho việc phân tích công thức dược phẩm.
Học viên sẽ sử dụng các công cụ (tools) có sẵn để tiến hành phân cụm dữ liệu. Sau
đó, học viên sẽ viết một phần mềm thử nghiệm nhỏ để kiểm tra các kết quả sau khi
đã cài đặt các cải tiến cần thiết nêu trên.
1.5.2 Bài toán rút luật kết hợp
Luật kết hợp có ứng dụng trong nhiều lĩnh vực khác nhau của đời sống như:
khoa học, hoạt động kinh doanh, tiếp thị, thương mại, phân tích thị trường chứng
khoán, tài chính và đầu tư, dược phẩm... Ứng dụng luật kết hợp phải chỉ rõ các đặc
điểm về: nguồn gốc, điều kiện áp dụng, phạm vi ứng dụng, mục đích ứng dụng.
Phương pháp tiến hành trong luận văn sẽ là lấy các kết quả phân cụm dữ liệu
trong bài toán phân cụm dữ liệu nêu trên để tiến hành rút luật kết hợp. Luận văn sẽ
tiến hành so sánh, đối chiếu với kết quả khác khi áp dụng các kỹ thuật khác nhau và
kết hợp thêm logic mờ để tối ưu hóa cho việc phân tích công thức dược phẩm. Học
Trang 6


Chương 1: MỞ ĐẦU

viên sẽ sử dụng các công cụ (tools) có sẵn để tiến hành rút luật kết hợp. Sau đó, học
viên sẽ viết một phần mềm thử nghiệm nhỏ để kiểm tra các kết quả sau khi đã cài
đặt các cải tiến cần thiết nêu trên.
1.5.3 So sánh điểm mạnh và điểm yếu của các phương pháp
Từ việc so sánh các điểm mạnh và điểm yếu của các phương pháp trong từng
giai đoạn phân cụm dữ liệu và rút luật kết hợp giúp chúng ta nâng cao hiệu suất và
tính chính xác trong việc phân tích mối quan hệ nhân-quả trong công thức dữ liệu
dược phẩm.

1.6 Nội dung luận văn
Nội dung của luận văn tập trung chủ yếu trong việc:

- Nghiên cứu các lý thuyết về kỹ thuật phân cụm dữ liệu và luật kết hợp.
- Nghiên cứu lựa chọn và thăm dò dữ liệu thực nghiệm cho các dạng bào chế khác
nhau (viên nén, thuốc mỡ,…). Các công thức thực nghiệm sẽ được đề nghị có số
lượng các biến và công thức khác nhau. Ngoài ra, các công thức thực nghiệm sẽ
được nghiên cứu kỹ nhằm đạt được mục tiêu: công thức không phức tạp về mặt bào
chế và đánh giá chỉ tiêu kiểm nghiệm nhưng dữ liệu thực nghiệm mang đầy đủ các
đặc trưng của dạng bào chế nhằm kiểm chứng phần mềm một cách hiệu quả nhất.
- Đánh giá lại phần mềm một lần nữa với dữ liệu thực nghiệm.
Bố cục luận văn gồm 6 chương:
Chương 1: Mở đầu.
Chương 2: Tổng quan về công thức dược phẩm.
Chương 3: Tổng quan cơ sở lý thuyết.
Chương 4: Chương trình ứng dụng.
Chương 5: Kết quả và bàn luận.
Chương 6: Kết luận và khuyến nghị.
Nội dung chương 1 nêu khái quát về nội dung đề tài.
Nội dung chương 2 khảo sát tổng quan về bài toán phân tích công thức dữ liệu
dược phẩm, các phương pháp, các kỹ thuật hiện nay được sử dụng cho bài toán này.
Nội dung chương 3 tìm hiểu tổng quan cơ sở lý thuyết về phân cụm dữ liệu,
luật kết hợp, logic mờ. Để chuẩn bị cho việc so sánh các kết quả ở các chương sau,

Trang 7


Chương 1: MỞ ĐẦU

chương này cũng giới thiệu các phần mềm hỗ trợ các thuật toán khai phá dữ liệu là
phần mềm mã nguồn mở Weka và phần mềm chuyên nghiệp trong ngành Dược
FormRules.
Nội dung chương 4 giới thiệu chương trình ứng dụng minh họa và cách thức

hoạt động và vận hành của phần mềm này.
Nội dung chương 5 trình bày các kết quả chính thu được, từ đó so sánh, đối
chiếu và đánh giá kết quả so với các phần mềm, các công cụ khác.
Nội dung chương 6 đưa ra kết luận và khuyến nghị. Kết luận các kết quả chính
mà luận văn này thu được và hoạch định phương hướng cho các đề xuất mở rộng và
cải thiện của đề tài này nhằm cải thiện độ chính xác, tốc độ xử lí và tối ưu hóa trong
quá trình phân tích dữ liệu công thức dược phẩm.

1.7 Ý nghĩa khoa học và thực tiễn của đề tài
Đề tài không có tính mới trong việc nghiên cứu một công nghệ hay kỹ thuật
mới, tuy nhiên do nhu cầu thực tế từ các nhà bào chế mong muốn có một phần mềm
hỗ trợ phân tích mối liên quan nhân-quả trong công thức thuốc, từ đó nhà bào chế
có thể điều chỉnh công thức thuốc phù hợp với yêu cầu.
Đề tài đưa ra một hướng tiếp cận ứng dụng công cụ máy tính giúp cho nhà bào
chế có thể phân tích dữ liệu một cách chính xác, điều mà trước đây nhà bào chế
phải dựa vào kinh nghiệm mà không có công cụ hỗ trợ. Vì hiện tại việc tiếp cận và
sử dụng phần mềm chuyên ngành Dược FormRules là khá khó khăn, vì bản quyền
trên 1 máy tính của phần mềm này là khoảng 7.000 bảng Anh (khoảng 200 triệu
đồng) nên gần như các đơn vị tại Việt Nam không có kinh phí đầu tư. Ở Việt Nam
hiện tại chỉ có 1 bản quyền FormRules sử dụng trên 1 máy tính.
Đề tài có ý nghĩa thực tiễn trong việc hỗ trợ phân tích mối liên quan nhân-quả
trong công thức thuốc, từ đó nhà bào chế có thể điều chỉnh công thức thuốc phù hợp
với yêu cầu.
Có một số bài báo quốc tế đã ứng dụng C4.5 và k-means vào việc phân tích dữ
liệu dược phẩm, đề tài này muốn so sánh các kỹ thuật này và cũng như muốn có
nhiều công cụ cho nhà bào chế lựa chọn và so sánh.

Trang 8



Chương 1: MỞ ĐẦU

1.8 Kết luận chương 1
Chương này đã giới thiệu khái quát bài toán khai phá dữ liệu công thức dược
phẩm, các thách thức của bài toán này cùng các công trình nghiên cứu ở trong và
ngoài nước. Vì đây là một đề tài còn khá mới mẻ tại Việt Nam, nên tác giả quyết
định chọn đề tài này để nghiên cứu cho luận văn tốt nghiệp của mình. Luận văn tập
trung chủ yếu vào hai bài toán là bài toán phân cụm dữ liệu và bài toán rút luật kết
hợp đối với các dữ liệu công thức dược phẩm khác nhau. Qua đó đánh giá ưu điểm
và nhược điểm của các phương pháp khác nhau. Do khả năng của tác giả có hạn
nên chương này cũng nêu giới hạn lại mục tiêu của đề tài, đối tượng và phạm vi
nghiên cứu của luận văn, nhưng luận văn vẫn đảm bảo một ý nghĩa khoa học và
thực tiễn.

Trang 9


Chương 2: TỔNG QUAN VỀ CÔNG THỨC DƯỢC PHẨM

Chương 2: TỔNG QUAN VỀ CÔNG THỨC DƯỢC PHẨM
Trong chương này sẽ trình bày các nội dung sau:
-

Giới thiệu tổng quan về công thức dược phẩm.

-

Giới thiệu trí tuệ nhân tạo.

-


Ứng dụng trí tuệ nhân tạo trong nghiên cứu chế tạo Dược phẩm.

-

Kết luận chương.

2.1 Tổng quan về công thức dược phẩm
Việc thành lập công thức (dược phẩm, mỹ phẩm và thực phẩm) và quy trình sản
xuất (chiết xuất, bào chế, kiểm nghiệm hay tổng hợp) là các bước cơ bản trong giai
đoạn nghiên cứu và phát triển sản phẩm. Mỗi sản phẩm đều có một vòng đời và sản
phẩm cũ cần phải được cải tiến hay thay thế bằng sản phẩm mới. Do đó, việc thành
lập và phân tích công thức và quy trình là nhu cầu thường xuyên.
Theo truyền thống công thức hay quy trình được thành lập dựa trên kinh nghiệm
hay theo con đường dò dẫm. Tuy có nhiều thành công, các phương pháp truyền
thống đòi hỏi nhiều thời gian và công sức. Trong thực tế, công thức hay quy trình
chịu sự ảnh hưởng bởi nhiều yếu tố như nguyên liệu, phương pháp hay điều kiện
thực nghiệm. Nếu các yếu tố nêu trên không được xem xét một cách hệ thống và
khoa học thì việc thành lập công thức hay quy trình khó mà đạt được kết quả như
mong đợi.
Tính chất của sản phẩm không những phụ thuộc vào tính chất và tỉ lệ của các
nguyên liệu mà còn bị ảnh hưởng bởi điều kiện pha chế (nhiệt độ, độ ẩm, thời gian,
tốc độ…). Vì vậy, việc thành lập công thức không phải là một vấn đề đơn giản, mà
thực ra là một sự thử thách. Theo kinh nghiệm, công thức thường được thành lập
qua bốn giai đoạn: xây dựng tiêu chuẩn, thành lập công thức, kiểm tra chất lượng
sản phẩm và sửa đổi hoàn thiện, tối ưu hóa công thức.
Để đạt được mục tiêu trên, cần phải có các phương pháp nhằm xác định mối liên
quan giữa các yếu tố nghiên cứu với tính chất sản phẩm, từ đó đưa ra các công thức,
quy trình tối ưu để sản xuất trên quy mô nhỏ và quy mô công nghiệp. Một số
phương pháp tối ưu hóa đã được áp dụng tại Việt Nam cũng như trên thế giới:

Trang 10


×