Tải bản đầy đủ (.docx) (68 trang)

Xây dựng mô hình toán học dự đoán khả năng thẩm thấu qua da dựa trên cấu trúc phân tử

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (930.27 KB, 68 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA Y DƢỢC

Người thực hiện: ĐỖ TRẦN LONG

XÂY DỰNG MÔ HÌNH TOÁN HỌC
DỰ ĐOÁN KHẢ NĂNG THẨM THẤU QUA DA

DỰA TRÊN CẤU TRÚC PHÂN TỬ

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƢỢC HỌC

Khóa: QH.2013.Y
Người hướng dẫn: TS. LÊ THỊ THU HƢỜNG

Hà Nội - 2018


LỜI CẢM ƠN
Lời đầu tiên, em xin được gửi lời cảm ơn tới Ban giám đốc Đại học
Quốc Gia Hà Nội, các phòng ban đã cho phép em được thực hiện khóa luận
tốt nghiệp.
Em xin được cảm ơn các thầy giáo, cô giáo khoa Y Dược Đại học Quốc
Gia Hà Nội đã truyền đạt cho em những kiến thức, kĩ năng để trở thành một
dược sĩ.
Bằng cả tấm lòng, em xin gửi lời cảm ơn chân thành tới TS. Lê Thị
Thu Hƣờng (Bộ môn Dược liệu – Khoa Y dược Đại học Quốc Gia Hà Nội),
người đã dìu dắt em vào con đường nghiên cứu khoa học; đã tận tình chỉ bảo,
truyền đạt kinh nghiệm nghiên cứu, kinh nghiệm sống cho em; đã không quản
ngại khó khăn, dồn tâm huyết, sức lực để tôi luyện, rèn giũa cho em kĩ năng
và đạo đức nghiên cứu dù em còn nhiều thiếu sót, nhiều lần vấp ngã. Cô là


tấm gương sáng cho thế hệ học trò chúng em học tập.
Cuối cùng, con xin cảm ơn bố mẹ đã sinh thành, nuôi dạy con nên
người; cảm ơn mẹ đáng kính đã luôn bên con, ủng hộ con; cảm ơn chị gái và
bạn bè đã luôn dõi theo em trên mỗi chặng đường.
Em xin chân thành cảm ơn!
Hà Nội, ngày 9 tháng 5 năm
2018
Sinh Viên

Đỗ Trần Long


DANH MỤC KÝ HIỆU VIẾT TẮT

Tên viết tắt
ANN
CSDL
IVRT
Kow
Kp
LSEs
MLR
OD
PCA
PDMS
Q
Q2
Q2
QSAR


R2

ext


Te
Tr
TSPT


DANH MỤC HÌNH VẼ

Hình 1.1. Thiết bị Franz và chi tiết các bộ phận...............................................2
Hình 1.2. Cấu tạo gồm hai phần chính của thiết bị Franz.................................3
Hình 2.1. Các bước xây dựng mô hình QSAR................................................20
Hình 3.1. Miền ứng dụng của mô hình QSAR đối với các chất.....................26


DANH MỤC BẢNG
Bảng 1.1. Thuật toán tính hệ số thấm (Kp) được công bố bởi Flynn (1990) .. 10

Bảng 1.2. Các nghiên cứu về khả năng thẩm thấu qua da của các hợp chất
được công bố sau 1990................................................................................... 11
Bảng 2.1. Giá trị log Kp các hợp chất xây dựng mô hình QSAR...................18
Bảng 3.1. Thông số thống kê của các mô hình QSAR log Kp........................24


MỤC LỤC
DANH MỤC KÝ HIỆU VIẾT TẮT
DANH MỤC HÌNH VẼ

DANH MỤC BẢNG
ĐẶT VẤN ĐỀ.................................................................................................. 1
CHƢƠNG 1 - TỔNG QUAN........................................................................ 2
1.1. Thiết bị Franz..........................................................................................2
1.1.1. Vai trò của thiết bị Franz trong thí nghi ệm đo khả năng thẩm thấu
qua da......................................................................................................... 2
1.1.2. Cấu tạo của thiết bị Franz................................................................3
1.1.3. Cách hoạt động của thiết bị Franz................................................... 4
1.2. Tính thấm qua da.................................................................................... 4
1.2.1. Khó khăn khi nghiên cứu khả năng thẩm thấu qua da.....................4
1.2.2. Các phương pháp đánh giá khả năng thẩm thấu của các chất hóa
học qua da...................................................................................................5
1.2.3. Mối quan hệ định lượng cấu trúc-tác dụng (QSAR) và khả năng
thẩm thấu qua da........................................................................................ 7
1.2.4. Quá trình phát triển của QSAR trong nghiên cứu tính thấm qua da.
.................................................................................................................... 8
1.3. Tổng quan về mố i quan hệ định lượng cấu trúc-tác dụng của hợp chất
(QSAR)........................................................................................................11
1.3.1. Khái niệm và nguyên lý chung của QSAR...................................... 11
1.3.2. Xây dựng và đánh giá mô hình QSAR............................................ 13
CHƢƠNG 2 - NGUYÊN LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU. 18
2.1. Nguyên liệu...........................................................................................18
2.1.1. Cơ sở dữ liệu...................................................................................18
2.1.2. Phần mềm sử dụng..........................................................................19
2.2. Phương pháp nghiên cứu...................................................................... 19
2.2.1 Tính toán tham số mô tả phân tử.....................................................19
2.2.2. Phân chia tập huấn luyện / Tập kiểm tra........................................20


2.2.3. Xây dựng mô hình QSAR................................................................ 20

2.2.4. Đánh giá mô hình........................................................................... 22
CHƢƠNG 3 – KẾT QUẢ VÀ BÀN LUẬN................................................23
3.1. Kết quả..................................................................................................23
3.1.1. Mô hình toán học thu được.............................................................23
3.1.2. Đánh giá mô hình........................................................................... 24
3.1.3. Đánh giá mô hình theo 5 tiêu chí của OECD.................................25
3.2. Bàn luận..............................................................................................27
3.2.1. Về phương pháp..............................................................................27
3.2.2. Về kết quả của thu được................................................................. 28
3.2.3. So sánh với các mô hình khác trên thế giới....................................30
KẾT LUẬN VÀ KIẾN NGHỊ...................................................................... 31
TÀI LIỆU THAM KHẢO............................................................................32


ĐẶT VẤN ĐỀ
Da là cơ quan có diện tích lớn nhất của cơ thể con người (bao phủ 1,52,3m2 diện tích bề mặt và chiếm khoảng 16% trọng lượng cơ thể). Nó có cấu
tạo phức tạp nhiều lớp, bao gồm: biểu bì, bì và lớp mỡ dưới da cùng các thành
phần phụ (lông, móng, tuyến bã, tuyến mồ hôi) hình thành hệ da. Da người
đóng vai trò như một lớp bảo vệ cơ thể khỏi môi trường xung quanh, với chức
năng chính là điều chỉnh sự xâm nhập của các chất lạ vào cơ thể. Vai trò là
một hàng rào bảo vệ này của da đã thu hút sự quan tâm rất lớn trong giới khoa
học vì thông qua đó, các nhà khoa học có thể phát triển nhiều nghiên cứu có
tính ứng dụng cao [14].
Khả năng thẩm thấu của các hợp chất qua da đã được khai thác từ khá
lâu trước đây, ví dụ như phát triển thuốc bôi ngoài da, miếng dán ngoài da....
Ngoài ra, tính thấm qua da cũng dự đoán các độc tính có thể có của hoá chất
hay mỹ phẩm tiếp xúc với da người. Để h ỗ trợ cho việc phát triển các thuốc
dùng ngoài da cũng như nghiên cứu độc chất và mỹ phẩm, nhiều mô hình da
người đã được đề xuất, trong đó mô hình thiết bị Franz được sử dụng phổ biến
nhất.

Tuy nhiên mô hình này triển khai không đơn giản, đòi hỏi tốn kém thời
gian và chi phí cũng như hoá chất máy móc. Do đó từ hơn một thập kỷ qua,
giới khoa học sử dụng công cụ tính toán để dự đoán độ hấp thu qua da của
hoá chất. Một trong các cách tiếp cận được khai thác nhiều là sử dụng mô
hình liên quan định lượng giữa cấu trúc hoá học với độ thẩm thấu qua da. Các
mô hình toán học biểu diễn quan hệ định lượng cấu trúc-tác dụng QSAR
(Quantitative structure-activity relationship) là giải pháp ứng dụng hiệu quả
để giải quyế t vấn đề này. Qua đó, mục tiêu chung của nghiên cứu này là “Xây
dựng mô hình toán học dự đoán khả năng thẩm thấu qua da dựa trên cấu trúc
phân t ử”. Với mục tiêu cụ thể:
1.

Xây dựng mô hình QSAR nhằm dự đoán khả năng thẩm thấu qua da
thông qua của các hợp chất.

2.

Phân tích và đánh giá mô hình tìm được theo 5 tiêu chí của tố chức Hợp
tác và Phát triền Kinh tế thế giới (OECD).

1


CHƢƠNG 1 - TỔNG QUAN
1.1. Thiết bị Franz
1.1.1. Vai trò của thiết bị Franz trong thí nghiệm đo khả năng thẩm thấu
qua da
Thử nghiệm đo lường sự giải phóng thuốc từ một dạng thuốc được cho
là điều cơ bản để phát triển các sản phẩm thuốc. Xác định cụ thể kỹ thuật
được sử dụng bởi chính dạng liều lượng và đường phân phối mong muốn của

thuốc. Đối với các dạng thuốc rắn, thử nghiệm về độ tan của thuốc đã được sử
dụng trong 50 năm qua. Gần đây, đối với sản phẩm thuốc bán rắn, thử nghiệm
giải phóng thuốc in vitro (IVRT) là một phương tiện để đánh giá tính giải
phóng của thuốc. Tỷ lệ giải phóng in vitro có thể phản ánh hiệu quả kết hợp
của một số thông số vật lý và hóa học, bao gồm độ hòa tan và kích thước hạt
và các đặc tính lưu biến của dạng liều [18].
Phương pháp IVRT phổ biến nhất sử dụng thiết kế buồng mở như hệ
thống thiết bị khuếch tán Franz và có thể được sử dụng với màng tổng hợp,
cấu trúc mô hoặc mẫu sinh học, chẳng hạn như da người [18].

Hình 1.1. Thiết bị Franz và chi tiết các bộ phận

2


1.1.2. Cấu tạo của thiết bị Franz
Thiết bị Franz là các thiết bị giải phóng riêng biệt được làm từ hai phần
thủy tinh borosilicate. Phần trên có thể được gọi là nắp thiết bị, đỉnh của thiết
bị, buồng cấp, hoặc khoang cấp. Phần dưới thường được gọi là phần thân của
thiết bị, hay còn được gọi là buồng thụ thể.

Hình 1.2. Cấu tạo gồm hai phần chính của thiết bị Franz
Buồng trên hay buồng cấp được nối với buồng dưới hay còn là buồng
thụ thể bằng một khớp. Màng ngăn qua đó thẩm thấu hoặc vận chuyển chất
được đặt ở giữa khớp và gi ữ bằng một chiếc kẹp.
Các thiết bị có v ỏ bọc có thể được nối với nguồn nước để kiểm soát
nhiệt độ. Các thiết bị không có vỏ bọc có thể được đặt trong máy sấy khô, bồn
nước hoặc môi trường được kiểm soát nhiệt độ nếu cần. Mặc dù các thiết bị
có vỏ đắt hơn nhưng lại được sử dụng phổ biến hơn bởi vì chúng có thể dễ
dàng kiểm soát nhiệt độ.

Các thiết bị Franz thường sử dụng các máy khuấy V-Series. Nhưng nếu
chỉ sử dụng một thiết bị Franz đơn lẻ trong thí nghiệm in vitro thì cũng có thể
sử dụ ng máy khuấy thí nghiệm thông thường.
Tay lấy mẫu, ống dẫn, ống thoát nước nóng, và lưu lượng được tùy
chỉnh của các thiết bị Franz tiêu chuẩn được làm từ ống OD 6mm có độ dày
thành 1,0mm. Dung sai của ống được nhà sản xuất ống đưa ra, đường kính
bên trong của ống là khoảng 4mm. Các xi lanh với có kích thước kim tiêm
3


OD 2mm có thể dễ dàng được sử dụng để lấy mẫu thiết bị Franz. Lượng lấy
mẫu tiêu chuẩn của thiết bị Franz hiện chưa có quy chuẩn rõ ràng nên được
lấy một lượng càng nhỏ càng tốt [14].
1.1.3. Cách hoạt động của thiết bị Franz
Các sản phẩm được thử nghiệm được đặt ở buồng cấp. Màng ngăn tách
buồng cấp chứa mẫu thử nghiệm với buồng thụ thể chứa đầy các chất trung
gian. Muối Phosphate Buffered Saline (PBS) thường được lựa chọn đầu tiên
làm chất trung gian, mặc dù nó có thể không khả thi khi sử dụng trong một số
trường hợp [18]. Sự thẩm thấu của thuốc bán rắn qua màng được theo dõi
bằng cách lấy mẫu từ buồng thụ thể theo thời gian và kiểm tra. Tại các thời
điểm xác định trước, một lượng chất trung gian được lấy ra từ buồng thụ thể
để phân tích, thường là bằng HPLC. Chất trung gian sẽ được bù vào với mỗi
lần lấy mẫu như vậy. Buồng dưới chứa chất lỏng từ đó các mẫu được lấy theo
các khoảng thời gian đều đặn để phân tích. Thử nghiệm này nhằm xác định
lượng thẩm thấu qua màng tại mỗi thời điểm. Buồng được duy trì ở nhiệt độ
không đổi 37oC. Tùy thuộc vào phương tiện, khả năng thấm của từng chất
nhất định được xác định thông qua phân tích thiết bị Franz có thể thay đổi
đáng kể (có lẽ từ 10 đến 50 lần). Kết quả thử nghiệm trên thiết bị Franz không
nhất thiết phải dự đoán hiệ u quả của một cấu trúc; mà có thể là xác định liệu
cấu trúc đó có tác nhân hoạt động qua da hay không [24].

1.2. Tính thấm qua da
1.2.1. Khó khăn khi nghiên cứu khả năng thẩm thấu qua da
Rào c ản chính đối với khả năng thẩm thấu qua da là lớp sừng, và sự
xâm nhập c ủa một hợp chất được xác định chủ yếu bởi cấu trúc hóa học của
nó. Ngoài ra có nhiều yếu tố khác đóng vai trò trong việc ảnh hưởng đến sự
thẩm th ấu qua da bao gồm (i) cách sử dụng hoặc tiếp xúc với các hợp chất
trên bề mặt da, (ii) các cách thức làm thay đổi tính chất rào cản của tầng lớp
sừng, (iii) quy trình xảy ra trong các mô, (iv) các yếu tố sinh học. Lớp sừng
nằm trên bề mặt ngoài của da, là một lớp tế bào chết chứa đầy keratin được
bao quanh bởi một hệ thống ngoại bào giàu lipid. Trong cơ thể người, nó bao
gồm 10 và 25 lớp tế bào chết, kéo dài, các tế bào sừng ở trong một hệ thống
4


lipid kép. Lớp sừng chỉ dày 7–16 µm ở hầu hết các vùng của cơ thể nhưng
dày 400–600 µm ở lòng bàn tay và bàn chân. Tầng lớp sừng bao gồm 40%
protein trong đó 80% là keratin. Chủng loại và lượng lipid có trong l ớp sừng
phụ thuộc vào từng vùng của cơ thể có thể làm ảnh hưởng lớn đến tính thấm
qua da [13].
Nhiều nỗ lực đã được thực hiện để phát triển các phương pháp tiếp cận
thực nghiệm đo lường sự hấp thu qua da. Hầu hết các dữ liệu hiện nay đã thu
được bằng các thí nghiệm in vitro, trong khi dữ liệu in vivo thu được bằng các
xét nghiệm sinh học .Về tỷ lệ chuyển hóa qua da của các loại thuốc khác nhau
thì thường được nghiên cứu nhiều nhất bằng cách tiến hành các thí nghiệm
trong in vitro, đơn giản hơn nhiều so với các phép đo trên lâm sàng.
Mức độ thẩm thấu có thể được đo bằng :
i.
ii.
iii.


Sự chuyển hóa thuốc trong động vật hoặc người thử nghiệm.
Sử dụng da được cắt bỏ từ người hoặc động vật.
Sử dụng mô hình màng tổng hợp trong thí nghiệm in vitro.

Da người có từ nhiều nguồn khác nhau như từ phẫu thuật thẩm mỹ và
phẩu thuật cắt bớt, đã được sử dụng trong thí nghiệm in vitro. Da từ các loài
động vật bao gồm lợn, chuột, lợn, rắn, thỏ và các loài khác được lựa chọn
thay thế phù hợp cho da người. Trong số các loại, da của lợn và chuột thường
được sử dụng phổ biến nhất vì có nhiều điểm chung với da người. Mặc dù da
động vật cho thấy sự th ẩ m thấu các hóa chất trong nghiên cứu rất tốt, nhưng
nó không có sự phức tạp như lớp sừng ở da người.
1.2.2. Các phương pháp đánh giá khả năng thẩm thấu của các chất hóa
học qua da
Các phương pháp ex vivo và in vitro để thử nghiệm tính thẩm thấu của
da được thiết lập và công bố rộng rãi [2, 3]. Chúng được sử dụng phổ biến
trong nhiều lĩnh vực nghiên cứu. Da người từ nhiều nguồn khác nhau, bao
gồm phẫu thuật thẩm mỹ và phẩu thuật cắt bỏ đã được sử dụng để đánh giá ex
vivo về khả năng thẩm thấu qua da [2, 3, 8]. Việc sử dụng các loại da động vật
khác nhau cũng là một thành phần được chấp nhận phổ biến trong các nghiên
cứu thẩm thấu qua da trong thí nghiệm in vitro. Da từ các loài động vật bao
5


gồm lợn, chuột, khỉ, rắn và những loài khác đã được coi như là một sự thay
thế thích hợp cho da người [1, 4]. Trong đó, da từ lợn và chuột thường được
sử dụng rộng rãi nhất, vì chúng có các rào cản tương tự để thẩm thấu các phân
tử gần giống với da người [1, 4, 17].
Mặc dù da động vật có thể cung cấp các đặc tính rào cản và tạo ra các
đặc điểm thẩm thấu tương tự như da người, nhưng chúng không thể mang đầy
đủ tính chất phức tạp của da người nói chung, và đặc tính rào cản của lớp

sừng nói riêng. Vì vậy, một số nhà nghiên cứu đã nỗ lực phát triển da nhân tạo
có đặc điểm tương đương với da người để giảm bớt các vấn đề như vậy. Một
số loại da nhân tạo đã được sử dụng thành công trong cấy ghép da và trong
điều trị phẫu thuật bỏng [21]. Da nhân tạo có các vùng ưa nước và kỵ nước và
do đó mang đầy đủ các đặc điểm của lớp sừng trên da người.
Các mô hình tương đương với da người (LSEs) cũng được sử dụng để
đánh giá khả năng thẩm thấu qua da. Chúng bao gồm các màng da như: biểu
bì tái tạo được phát triển trong nuôi cấy mô và được sử dụng làm phương
pháp thay thế cho các mô động vật. Nói chung, các mô này yếu hơn và có ít
hơn đáng kể các rào cản như ở da người khi chúng được xây dựng với hàm
lượng Ceramide 1 và 3 thấp hơn bình thường ở da người. Một số nhà nghiên
cứu đã chỉ ra rằng chúng có thể cung cấp các đặc điểm thẩm thấu tương tự
cho da người nhưng trong nhiều trường hợp, chúng vượt quá mức ước lượng
thấm qua da [10, 11, 22, 28].
Khi không có da người hoặc da động vật, hoặc khi thực hiện thí nghiệm
với một số lượng lớn, đặc biệt là đối với các thí nghiệm sàng lọc, màng tổng
hợp thường được sử dụng thay thế. Các màng nhân tạo hay được sử dụng nhất
là polydimethylsiloxan (PDMS) và cellulose axetat. Màng PDMS là rào cản
đồng nhất đã được chứng minh giống với các đặc tính rào cản của lớp sừng và
đã sử dụng phổ biến trong các thí nghiệm [5, 36]. Màng cellulose acetate cũng
được sử dụng tương tự trong các thí nghiệm để mô phỏng tính thẩm thấu của
tế bào. Cấu trúc xốp của nó được so sánh như các đường nước và nang trong
da mà qua đó các phân tử có thể thẩm thấu [7]. Tuy nhiên, các màng này đã
được chứng minh thường làm tăng đáng kể khả năng thẩm thấu của các chất
nên việc sử dụng chúng đã bị giới hạn. Có rất nhiều các cách thức thử nghiệm
6


tính rào cản để xác định khả năng thẩm thấu qua da. Để đánh giá mối quan h ệ
giữa các phương pháp khác nhau, khả năng thẩm thấu tương đối thông qua

các màng của cùng một hợp chất sẽ được so sánh. Trong thực tế, có ít dữ liệu
so sánh cho mục đích này tồn tại. Để phá vỡ vấn đề này, mối quan hệ định
lượng giữa cấu trúc-tác dụng dựa trên các dữ liệu có thể được mang ra so
sánh. Các mối quan hệ định lượng cấu trúc-tác dụng (QSARs) thống kê khả
năng thẩm thấu qua da của một loạt các hóa chất ngoại sinh với các thông số
hóa lý đã biết khi được xác định bằng thực nghiệm. Tuy nhiên, có một số
phản đối do những hạn chế của việc phát triển mô hình thống kê, một số
thống kê khi xây dựng cần được cân nhắc [25].
1.2.3. Mối quan hệ định lượng cấu trúc-tác dụng (QSAR) và khả
năng thẩm thấu qua da
Mô hình QSAR thống kê sự liên hệ gi ữa hoạt tính sinh học của một
loạt các hợp chất với tính chất hóa lý và hoặc c ấu trúc của chúng [20]. Như
vậy, nó cung cấp các mô hình tiên đoán để ước tính hoạt động sinh học được
nghiên cứu. Trải dài hơn một thế kỷ, phần lớn công việc trong lĩnh vực này đã
tập trung chủ yếu vào việc tối ưu hóa hoạt động của thuốc và dự đoán độc
tính. Với mục đích của lu ận văn này để nghiên cứu dự đoán khả năng thẩm
thấu qua da của các chất [25].
Khả năng thẩm th ấu của một hợp chất qua da được xác định bằng
nhiều phương pháp. Trong đó, đầu tiên có định luật Fick bao gồm lưu lượng
và hệ số thấm như sau [25]:

J: Lưu lượ ng thẩm thấu
Dm: Hệ số khuyếch tán
Kp: Hệ số thẩm thấu
∆Cm: Chênh lệch nồng độ giữa 2 bên của màng
t:

Độ dày của màng

7



1.2.4. Quá trình phát triển của QSAR trong nghiên cứu tính thấm qua da.
 Trước 1990:
Những nghiên cứu liên quan đến tính thấm của các hợp chất qua da đối
với tính chất hóa lý của chúng đã được thực hiện trong ít nhất ba mươi năm.
Tuy nhiên, đặc biệt trong các nghiên cứu trước đây, hiếm khi các mô hình dự
báo định lượng (tức là QSPR) được thực hiện. Phần lớn các nghiên cứu dựa
trên việc phân tích các chuỗi phân tử tương đồng hoặc có liên quan chặt chẽ.
Thông thường chỉ có một số lượng nhỏ các hợp chất được đánh giá. Nhiều
nghiên cứu trong số này cho thấy mối quan hệ tuyến tính với khả năng kỵ
nước, tức là tăng tính kỵ nước có liên quan đến việc tăng cường độ thẩm thấu
của da [31, 32]. Một số nghiên cứu thì cho thấy mố i quan hệ dạng parabol
của độ thẩm thấu qua da với tính kỵ nước, đặc biệt là khi lựa chọn các hợp
chất bao gồm những chất có tính kỵ nước cao [32]. Qua những nghiên cứu
này, cho thấy rằng có thể áp dụng được các mô hình QSAR cho độ thẩm thấu
qua da, mỗi mô hình được thiết lập riêng cho một nhóm chất hóa học cụ thể,
hoặc một loạt các hợp chất.
 Tập dữ liệu Flynn (1990) và các phân tích QSAR sau đó:
Nỗ lực để phát triển cách tiếp cận mô hình QSAR toàn diện hơn và phổ
biến hơn về dự đoán khả năng thẩm thấu qua da được tạo điều kiện thuận lợi
nhờ công bố bởi Flynn vào năm 1990 của 97 hệ số thấm cho 95 hợp chất bằng
thí nghiệm in vitro qua da người. Nó cung cấp một cơ sở dữ liệu lớn đầu tiên
và là lớn nhất cho đến gần đây. Tại thời điểm này, cần lưu ý rằng trong khi các
dữ liệu này được đo bằng cách sử dụng da người trong thí nghiệm in vitro,
kho d ữ liệu này được biên tập từ 15 nguồn tài liệu khác nhau. Do đó, không
thể tránh khỏi rằng những dữ liệu này chứa rủi ro sai lệch giữa các thử nghiệ
m là cao, do sự biến đổi giữa các phòng thí nghiệm, đặc biệt là sự biến đổi
phát sinh từ việc sử dụng da từ các nguồn khác nhau và vị trí của phần da đó
trên cơ thể. Về phát triển QSAR cho dự đoán tính thấm của da, cơ sở dữ liệu

của Flynn là một mốc quan trọng [25].
Trong nghiên cứu ban đầu của Flynn (1990) một số thuật toán để dự
đoán khả năng thẩm thấu qua da được đề xuất [6]. Cách tiếp cận được thực
8


hiện dựa trên nguyên lý tính thấm của da phần lớn do chức năng phân vùng
giữa các lớp nước và không chứa nước, và do đó nó có thể được mô tả bởi hệ
số phân chia octanol-nước (Kow) và cũng bị ảnh hưởng bởi kích thước phân
tử. Flynn đã trình bày một cách tiếp cận đơn giản với các thuật toán cho
những hợp chất có trọng lượng phân tử thấp và cao. Các thuật toán chỉ đơn
giản chỉ ra rằng các hợp chất rất ưa nước và kỵ nước có độ thẩm thấu da thấp
và cao tương ứng, và log Kow khác nhau phụ thuộc vào mô hình QSAR có thể
được sử dụng để dự đoán tính thấm của da đối với các hợp chất có trọng
lượng phân tử cao và thấp. Không có biện pháp thống kê phù hợp nào được
cung cấp tại thời điểm này [6, 25].

9


Bảng 1.1. Thuật toán tính hệ số thấm (Kp) được công bố bởi Flynn (1990)

Log Kow < 0,5
0,5 ≤ Log Kow ≤ 3,0
0,5 ≤ Log Kow ≤ 3,5
Log Kow > 3
Log Kow > 3,5
Các dữ liệu được công bố bởi Flynn (1990) đã được phân tích sau đó
bởi rất nhiều nhà nghiên cứu được trình bày trong bảng 1.2 [6, 25, 27]. Potts
and Guy (1992) đã chứng minh việc sử dụng log K ow kết hợp với trọng lượng

phân tử (MW) hoặc thể tích phân tử để dự đoán độ thấm của da và so sánh với
Flynn (1990). Đối với 93 hợp chất, công thức sau được công bố [25, 27]:
Log Kp = 0.71 log Kow – 0.0061 MW – 6.3
2

(n = 93; r = 0.67; s : không công bố; F : không công bố)

Trong đó:
n là số quan sát
r

là hệ số tương quan

s

là sai số chuẩn của ước tính F

là số liệu thống kê của Fisher

10


Bảng 1.2. Các nghiên cứu về khả năng thẩm thấu qua da của các hợp chất
được công bố sau 1990
Tên tác giả
Potts và Guy
Pugh và Hadgraft
Lien và Gao
Barratt
Potts và Guy

Abraham
Hostynek and Magee
Roy và cộng sự
Abraham và cộng sự
Gute và cộng sự
Minghetti và cộng sự
Dearden và cộng sự
Poulin và Krishnan
Ghafourian và Fooladi
Gonzalez và Helguera
Pannier và cộng sự
Pannier và cộng sự
Degim và cộng sự
Moody và MacPherson
Majumdar và cộng sự

1.3. Tổng quan về mối quan hệ định lƣợng cấu trúc-tác dụng của
hợp chất (QSAR)
1.3.1. Khái niệm và nguyên lý chung của QSAR
QSAR là một hàm số biểu thị mối quan hệ định lượng giữa cấu trúc
phân tử và hoạt tính sinh học hoặc hóa học của hợp chất có dạng tổng quát
như sau:

11


Y = f1(x1) + f2(x2) + ... + fn(xn)
Trong đó, Y là biến đáp ứng sinh học hoặc hóa học thường thu được từ
thực nghiệm và thể hiện bằng giá trị log K p với Kp là hệ số thẩm thấ u qua da.
Các biến x1, x2,…xn là các đại lượng được sử dụng để mô tả cấu trúc phân tử

hợp chất gọi là các tham số phân tử (molecular descriptors). Đến nay đã có
hàng ngàn tham số phân tử (TSPT) được sử dụng trong nghiên cứu xây dựng
mô hình QSAR. Các TSPT này thu được bằng thực nghiệm hoặc tính toán
bằng lý thuyết bởi các phần mềm chuyên dụng như Dapt, Dragon, Padell,
MOE, Hyperchem.
Các mô hình QSAR được xây dựng trên nguyên lý cơ bản là cấu trúc
của mỗi phân tử chứa các yếu tố quyết định đặc tính sinh học, vật lý, hóa lý
của nó; do đó, các hợp chất có cấu trúc giống nhau thường có hoạt tính tương
tự nhau [26].
Từ năm 1868, Crum-Brown và Fraser đã đưa ra nhận định tác dụng
sinh học là hàm số của cấu trúc hóa học:


= f (C)

Đến năm 1893, Richet đã rằng sự khác nhau về tác dụng sinh học là do
sự thay đổi về tính chất hóa h ọc hay lý hóa [33]:


= f (∆C)

Đây là hai tư tưởng nền tảng để thiết lập các mô hình QSAR sau này.
Năm 1900, Meyer và Overton tìm ra mối quan hệ tuyến tính giữa mức
độ thân dầu và hoạt tính của thuốc gây mê [29].
Và đến năm 1935, phương trình Hammett ra đời, được coi là phương
trình đầu tiên biểu diễn mối quan hệ định lượng hoạt tính-cấu trúc [29]:
Log =ρσ
Với K, Ko là hằng số acid, σ là hằng số Hammett (thông số hóa lý đặc
trưng cho khả năng hút hoặc đấy điện tử của nhóm thế).


12


Từ những năm 60 của thế kỉ XX, mô hình QSAR thực sự được nghiên
cứu bởi Corwin Herman Hansch. Mô hình QSAR Hansch là phương trình hồi
quy nhiều tham số biểu thị mối quan hệ giữa hoạt tính sinh học và các thông
số hóa lý:
Log (1/C) = -k1×π2 + k2×π + k3×σ +k4×Es + k5
Trong đó: C biểu thị đáp ứng sinh học; π là hằng số thế kỵ nước; σ là
hằng số thế Hammett; Es là hằng số thế Taft và k 1, k2, k3, k4, k5 là các hệ số
phân tích hồi quy
Từ đó đến nay, số lượng nghiên cứu về xây dựng các mô hình QSAR
được công bố tăng đột biến và các phương pháp xây dựng, ứng dụng mô hình
QSAR ngày càng đa dạng.
1.3.2. Xây dựng và đánh giá mô hình QSAR
Mô hình QSAR được xây dựng và đánh giá gồm 5 bước như sau:
Bước 1: Chuẩn bị cơ sở dữ liệu
Cơ sở dữ liệu (CSDL) để xây dựng các mô hình QSAR thường là hoạt
tính, độc tính, đặc tính dược động học của các hợp chất được công bố trong
các nghiên cứu khoa học t ạo thành dữ liệu toàn cầu (global database). CSDL
cho một mô hình QSAR c ụ thể sẽ bao gồm cấu trúc phân tử của dãy chất và
hoạt tính của chúng, thường gặp nhất là hoạt tính thu được bằng thực nghiệm
in vitro [15].
CSDL ban đầu được chia thành tập huấn luyện (training set) và tập
kiểm nghiệm (test set). Tập huấn luyện chiếm khoảng 80-90% CSDL ban đầu
và được sử dụng để xây dựng mô hình QSAR [19]. Tập kiểm nghiệm được sử
dụng để đánh giá mô hình.
Bước 2: Tính toán tham số phân tử
Cấu trúc phân tử hợp chất được vẽ bằng các phần mềm như Chemdraw,
hoặc bằng chức năng tích hợp trong các phần mềm xây dựng mô hình QSAR

chuyên dụng. Từ các cấu trúc này, tham số phân tử (TSPT) mô tả thông tin
cấu trúc 1D, 2D, 3D của hợp chất được tính toán bằng phần mềm máy tính.

13


Một số phần mềm thường được sử dụng để tính toán các TSPT hiện nay là
Dragon, Padell, MOE, Hyperchem,... Cùng với sự phát triển của QSAR, ngày
càng nhiều nhóm TSPT được tính toán để mô tả chi tiết, chính xác hơn cấu
trúc của hợp chất. Phiên bản cập nhật Dragon 7.0 (2017) có thể tính toán được
đến 5270 TSPT.
Các TSPT có thể được phân loại thành 3 nhóm như sau:
Tham số phân tử 1D: Những TSPT có thể thu được từ công thức tổng
quát của hợp chất (khối lượng phân tử, số nhóm thế, số nguyên tử C...hoặc là
những TSPT tính toán từ sự tổng hợp các nguyên tử thành phần như chỉ số
khúc xạ, độ phân cực. Trong đó hệ số phân bố n-octal/nước là tham số thường
sử dụng để đánh giá sinh khả dụng, khả năng thấ m qua màng tế bào của hợp
chất.
Tham số phân tử 2D: Những TSPT để mô tả hình dạng, trật tự liên kết
của các nguyên tử trong cấu trúc của hợp chất. Ví dụ số liên kết π-π, số vòng
thơm, số liên kết H.
Tham số phân tử 3D: Những TSPT mô tả cấu trúc không gian hợp chất,
được xác định bằng hệ trục tọa độ nguyên tử thành phần, bao gồm các TSPT
như mô men lưỡng cực (dipole moment), diện tích bề mặt cực (polar surface
area), thể tích van der Waals ...
Bước 3: Xử lí số li ệu
Để xây dựng được một mô hình QSAR một cách thuận tiện và đảm bảo
tính tin cậy, dữ liệu ban đầu cần được xử lí sơ bộ. Công việc này có thể bao
gồm loại bỏ các giá trị nằm ngoài (outlier), chuẩn hóa đơn vị, chuyển đổi hàm
thức (logarit hóa, mũ hóa, nghịch đảo,...). Những công việc này giúp loại bỏ

các TSPT gây nhiễu khi xây dựng mô hình.
Bước 4: Xây dựng mô hình QSAR
Ngày nay, nhiều phương pháp xây dựng mô hình QSAR được phát triển
và ứng dụng phổ biến. Tuy nhiên, không có phương pháp nào được coi là hiệu
quả nhất. Một phương pháp có thể phù hợp để xây dựng mô hình QSAR này
nhưng có thể sẽ không hiệu quả khi xây dựng các mô hình QSAR

14


khác vì mỗi CSDL, mỗi mối quan hệ cấu trúc-hoạt tính sẽ có sự phụ thuộc
khác nhau giữa biến TSPT và biến đáp ứng [15].
Có hai dạng mô hình QSAR chính: một là mô hình QSAR định lượng,
biến đầu ra là biến liên tục; hai là mô hình QSAR định tính, biến đầu ra là giá
trị nhị phân có hoặc không, âm tính hoặc dương tính (còn gọi là mô hình
QSAR phân loại).
Đối với dạng thứ nhất, các phương pháp xây dựng mô hình thường áp
dụng là hồi quy đa biến tuyến tính - Multiple Linear Regression (MLR), bình
phương tối thiểu từng phần - Partial Least Squares (PLS), phân tích thành
phần chính - Principal Component Analysis (PCA). Các phương pháp thường
dùng để xây dựng mô hình QSAR phân loại là mạng nơ-ron nhân tạo Artificial Neural Networks (ANN), phân tích cụm (Cluster Analysis), thuật
toán k láng giềng gần nhất (k-nearest neighbors algorithm).
Các phương pháp này có thể có nguyên tắc lựa chọn biến giống hoặc
khác nhau tuy nhiên đều nhằm mục đích chung là TSPT nào có ảnh hưởng
nhiều nhất đến hoạt tính của phân tử sẽ được ưu tiên đưa vào mô hình trước;
nhờ đó, giá trị biến đáp ứng dự đoán được sẽ gần với giá trị thực nghiệm nhất.
Bước 5: Đánh giá mô hình QSAR
Đánh giá mô hình là giai đoạn quan trọng liên quan đến khả năng ứng
dụng của mô hình. Đánh giá mô hình thường sử dụng 5 nguyên tắc của OECD
[23].

Nguyên tắc 1: Có đích xác định (defined end-points).
Đích là những giá trị thực nghiệm về hoạt tính sinh học thu được từ
CSDL. Nế u toàn bộ CSDL đều sử dụng một protocol để xác định giá trị của
đích, thì mô hình xây dựng được có độ tin cậy cao, có thể dùng để dự đoán
hoạt tính các hợp chất mới (nếu thực nghiệm dùng theo quy trình này). Còn
nếu CSDL sử dụng nhiều protocol khác nhau thì mô hình sẽ không có độ tin
cậy cao.

15


Nguyên tắc 2: Các thuật toán sử dụng được mô tả rõ ràng.
Các thuật toán sử dụng để xây dựng mô hình cần được mô tả rõ ràng,
có khả năng ứng dụng để xây dựng các mô hình khác.
Nguyên tắc 3: Có miền cấu trúc ứng dụng xác định.
Miền cấu trúc ứng dụng là khoảng không gian cấu trúc được xác định
bởi các hợp chất trong tập huấn luyện để xây dựng mô hình. Những hợp chất
thuộc tập huấn luyện nếu có cấu trúc nằm ngoài miền cấu trúc ứng dụng sẽ
ảnh hưởng đến độ chính xác của mô hình. Những hợp chất thuộc tập dự đoán,
nếu có cấu trúc nằm ngoài miền này sẽ cho kết qu ả dự đoán không chính xác.
Các phương pháp xác định miền ứng dụng thường g ặp như: phương pháp đòn
bẩy, phương pháp ba lân cận gần nhất,...
Nguyên tắc 4: Có độ khớp, độ ổn đị nh, và khả năng dự đoán tốt.
Độ khớp hay độ tuyến tính được đánh giá thông qua giá hệ số xác định
2

2

R , R càng cao thì mức độ khớp (tuyến tính) của mô hình với các giá trị thực
nghiệm càng tốt. R2> 0,6 thì mô hình mới có ý nghĩa. Công thức tính hệ số

xác định như sau:

R2
^

Trong đó n là số các quan sát của tập huấn luyện; y i, y i , lần lượt là giá
trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực
tế trung bình của biến phụ thuộc.
Độ ổn định được đánh giá thông qua hệ số tương quan chéo Q 2, Q2
được đánh giá dựa trên phương pháp tham số chéo (cross validation leave one
out) b ằng cách lần lượt loại một quan sát ra khỏi tập huấn luyện, giữ nguyên
các bi ến đã lựa chọn và tính toán lại các thông số của mô hình. Q 2 càng gần
1, tính tổng quát hóa của mô hình càng cao, mô hình càng ổn định. Thông
thường, yêu cầu Q2 > 0,5 thì mô hình mới bền vững. Công thức hệ số tương
quan chéo tính như sau:

16


Q2
Trong đó n là số các quan sát tập huấn luyện; yi, là giá trị th ực tế của
^

quan sát thứ i; yi / i giá trị dự đoán của biến phụ thuộc ở quan sát thứ i sử dụng
mô hình đã loại biến i; y là giá trị thực tế trung bình của biến phụ thuộc.
Khả năng dự đoán ngoại được đánh giá thông qua giá trị Q2ext, Q2ext
càng lớn mô hình càng cho thấy độ tuyến tính của tập kiểm tra và do vậy
chứng tỏ khả năng dự đoán của mô hình cao.

Q2

ext

^

Trong đó n là số các quan sát tập kiể m tra; y i, y , lần lượt là giá trị thực
tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực tế trung
bình của biến phụ thuộc.
Nguyên tắc 5: Giải thích được cơ chế (nếu có thể).
Mô hình cần được giả i thích về vai trò của các biến trong mô hình, qua
đó giúp định hướng thi ết k ế các hợp chất mới. Tuy nhiên việc giải thích các
biến này nhiều khi gặp phải khó khăn vì cơ chế của chúng phức tạp đòi hỏi
những hiểu biết chuyên sâu về hóa lượng tử. Bên cạnh đó có nhiều biến chưa
có các tài liệu tham khảo, do đó chưa đủ cơ sở để giải thích.


×