Tải bản đầy đủ (.pdf) (67 trang)

Sàng lọc ảo hợp chất ức chế enzym tyrosinase từ hợp chất thiên nhiên việt nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.98 MB, 67 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA Y DƯỢC

NGUYỄN THỊ HƯƠNG GIANG

SÀNG LỌC ẢO HỢP CHẤT
ỨC CHẾ ENZYM TYROSINASE
TỪ HỢP CHẤT THIÊN NHIÊN VIỆT NAM
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC

Hà Nội – 2017


ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA Y DƯỢC

NGUYỄN THỊ HƯƠNG GIANG

SÀNG LỌC ẢO HỢP CHẤT
ỨC CHẾ ENZYM TYROSINASE
TỪ HỢP CHẤT THIÊN NHIÊN VIỆT NAM

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC

Khóa:

QH.2012.Y

Người hướng dẫn: TS. Lê Thị Thu Hường
TS. Phạm Thế Hải


Hà Nội – 2017


Lời cảm ơn
Tôi xin gửi lời cảm ơn sâu sắc tới TS. Lê Thị Thu Hường - Giảng viên Bộ
môn Dược liệu và Dược học cổ truyền, Khoa Y Dược, Đại học Quốc Gia Hà Nội,
TS. Phạm Thế Hải - Giảng viên Bộ môn Hóa dược, Trường đại học Dược Hà Nội
đã trực tiếp hướng dẫn, tận tình giúp đỡ và tạo điều kiện thuận lợi để tôi có thể nghiên
cứu và hoàn thành khóa luận này.
Tôi xin chân thành cảm ơn ThS. Ninh Bảo Yến đã giúp đỡ tôi rất nhiều trong
quá trình thực hiện khóa luận, cũng như xin gửi lời cảm ơn đến tất cả quý thầy cô tại
Đại học Quốc Gia Hà Nội đã dạy dỗ, trang bị kiến thức cho tôi trong suốt 5 năm theo
học tại trường.
Tôi cũng xin cảm ơn gia đình, bạn bè đã luôn theo sát động viên, quan tâm và
tạo điều kiện giúp tôi có thể hoàn thành khóa luận này.
Xin chân thành cảm ơn!
Hà Nội, tháng 06 năm 2017
Sinh viên

Nguyễn Thị Hương Giang


Bảng ký hiệu, chữ viết tắt
Asn

Asparagin

CSDL

Cơ sở dữ liệu


DHI

5,6-dihydroxyindol

DHICA

Acid 5,6-dihydroxyindol-2-cacboxylic

Glu

Acid glutamic

HC

Hợp chất

His

Histidin

HQ

Hydroquinon

L-DOPA

L-3,4-dihydroxyphenylalanin

Phel


Phenylalanin

PPO

Polyphenol Oxidase

QSAR

Quantitative Structure-Activity Relationships

TTHĐ

Trung tâm hoạt động

TSPT

Tham số phân tử

Val

Valin


Danh mục các bảng
Bảng 1: Các phân nhóm chính trong CSDL .............................................................14
Bảng 2: Ái lực liên kết với đích của 21 hợp chất được dự đoán là có khả năng ức
chế tyrosinase ............................................................................................................22



Danh mục hình vẽ, đồ thị
Hình 1: Quá trình oxy hóa phenol thông qua enzym tyrosinase ................................7
Hình 2: Các dạng oxi hóa của enzym tyrosinase........................................................7
Hình 3: Trung tâm hoạt động của enzym tyrosinase tương tác với Tropolon ...........8
Hình 4: Sơ đồ biểu diễn con đường sinh tổng hợp melanin .......................................9
Hình 5: Mô phỏng hệ thống sàng lọc ảo hợp chất ức chế enzym tyrosinase ...........16
Hình 6: Giá trị Tc của các chất trong CSDL tương ứng với 12 chất mẫu.................19
Hình 7: Khoảng phân bố của giá trị Tc max ................................................................19
Hình 8: Phân bố giá trị Tc max theo từng chất mẫu ....................................................20
Hình 9: Cấu trúc VNPD_ID929 được vẽ lại bằng TOMOCOMD-CARDD ...........20
Hình 10: Phân bố các nhóm chất ..............................................................................21
Hình 11: Phân bố năng lượng liên kết với trung tâm hoạt động của enzym ............21
Hình 12: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với
VNPD_ID929 ............................................................................................................27
Hình 13: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với
VNPD_ID722 ............................................................................................................28
Hình 14: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với
VNPD_ID889 ............................................................................................................28
Hình 15: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với
VNPD_ID723 ............................................................................................................29
Hình 16: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với
VNPD_ID1157 ..........................................................................................................30


MỤC LỤC
Lời cảm ơn
Bảng ký hiệu, chữ viết tắt
Danh mục các bảng
Danh mục hình vẽ, đồ thị
MỞ ĐẦU .................................................................................................................... 1

Chương 1 - TỔNG QUAN ........................................................................................ 2
1.1. Tổng quan về sàng lọc ảo ................................................................................... 2
1.1.1. Khái niệm ...................................................................................................2
1.1.2. Quy trình sàng lọc ảo..................................................................................2
1.1.3. Các kỹ thuật sàng lọc ảo .............................................................................2
1.2. Tổng quan về enzym tyrosinase ........................................................................ 6
1.2.1. Khái niệm enzym tyrosinase ......................................................................6
1.2.2. Trung tâm hoạt động của enzym tyrosinase ...............................................7
1.2.3. Vai trò của tyrosinase .................................................................................8
1.2.4. Các chất ức chế tyrosinase .........................................................................9
1.3. Tổng quan về hợp chất thiên nhiên Việt Nam ............................................... 12
1.3.1. Khái niệm hợp chất thiên nhiên ...............................................................12
1.3.2. Vai trò của hợp chất thiên nhiên trong nghiên cứu và phát triển thuốc ...12
1.3.3. Tiềm năng của hơp chất thiên nhiên Việt Nam ........................................13
Chương 2 - NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU ........ 14
2.1. Đối tượng, nguyên vật liệu và thiết bị nghiên cứu ........................................ 14
2.1.1 Đối tượng nghiên cứu ................................................................................14
2.1.2. Nguyên liệu ..............................................................................................14
2.1.3. Thiết bị .....................................................................................................15
2.2. Phương pháp nghiên cứu................................................................................. 15
2.2.1. Tìm kiếm đồng dạng.................................................................................16
2.2.2. Mô hình QSAR .........................................................................................17
2.2.3. Docking ....................................................................................................17
2.2.4. Xử lý số liệu .............................................................................................18
Chương 3 - KẾT QUẢ VÀ BÀN LUẬN ............................................................... 19
3.1. Kết quả tìm kiếm đồng dạng ........................................................................... 19
3.2. Kết quả mô hình QSAR ................................................................................... 20


3.3. Kết quả Docking ............................................................................................... 21

3.4. Bàn luận ............................................................................................................ 23
3.4.1. Về phương pháp sàng lọc ảo ....................................................................23
3.4.2. Về kết quả sàng lọc ảo ..............................................................................26
KẾT LUẬN VÀ KIẾN NGHỊ ................................................................................ 31
Tài liệu tham khảo
Phụ lục


MỞ ĐẦU
Hiện nay, khi xã hội ngày càng phát triển thì vấn đề về thẩm mỹ, làm đẹp của
con người càng được chú ý hơn đặc biệt là vấn đề chăm sóc da. Màu da của con người
được quyết định bởi nhiều yếu tố, trong đó, quan trọng nhất là sự sản xuất và phân
bố của sắc tố melanin bởi tế bào biểu bì tạo sắc tố [68]. Khi tế bào biểu bì tạo sắc tố
hoạt động mạnh hơn sẽ sản sinh ra nhiều melanin và phân tán mạnh hơn, gây ra hiện
tượng nám da, sạm da, tàn nhang… và ung thư da [22]. Melanin được hình thành
trong hạt sắc tố melanosom bởi hoạt động của enzym tyrosinase [63]. Vì vậy, hiện
nay nhiều sản phẩm làm sáng da, chống nám sử dụng hoạt chất là các chất ức chế
tyrosinase. Tuy nhiên, các chất có hoạt tính ức chế tyrosinase đang được sử dụng hiện
nay như Hydroquinon (HQ), Acid Kojic và Arbutin lại có nhiều vấn đề liên quan đến
độ an toàn và hiệu quả [17, 81]. Do vậy mà việc tìm kiếm các hợp chất mới ức chế
tyrosinase có độ an toàn và hiệu quả cao hơn đặc biệt là từ các hợp chất có nguồn gốc
thiên nhiên là một việc làm hết sức thiết thực và cấp bách.
Phát hiện và tối ưu hóa chất dẫn đường là một khâu quan trọng trong quá trình
nghiên cứu và phát triển thuốc hiện đại. Lâu nay, các nghiên cứu này chủ yếu dựa
vào phương pháp thực nghiệm “thử và lỗi” với nhược điểm là tốn thời gian, tiền bạc
và cho hiệu quả thấp. Các phương pháp trợ giúp bởi máy tính (in silico) đã giúp ích
nhiều cho việc phát hiện các hợp chất mới có hoạt tính sinh học ngay cả trước khi
chúng được tổng hợp hay phân lập thông qua quá trình sàng lọc ảo. Sàng lọc ảo không
những bổ sung cho các sàng lọc thật mà còn giúp định hướng quá trình tổng hợp/phân
lập các chất. Sàng lọc ảo tương đối rẻ, nhanh, cho phép làm việc với số lượng lớn lên

tới hàng triệu hợp chất, điều không thể làm được trong các mô hình thực nghiệm.
Bên cạnh đó, Việt Nam có nguồn dược liệu phong phú với hàng nghìn hợp
chất đã được phân lập và tổng hợp các thông tin liên quan lại thành một cơ sở dữ liệu
(CSDL) cung cấp các thông tin đầu vào hữu ích cho việc sàng lọc ảo. Cho đến thời
điểm hiện tại, chưa có bài báo nào công bố về một quy trình sàng lọc ảo để tìm kiếm
các chất ức chế tyrosinase từ CSDL này. Do đó, việc sàng lọc CSDL các hợp chất
phân lập từ dược liệu sẽ đóng góp nhiều cho quá trình nghiên cứu và phát triển thuốc
làm trắng da, chống nám tại Việt Nam.
Trên cơ sở đó, đề tài “Sàng lọc ảo hợp chất ức chế enzym Tyrosinase từ
hợp chất thiên nhiên Việt Nam” được thực hiện với mục tiêu: Phát hiện được các
hợp chất có khả năng ức chế tyrosinase mạnh thông qua sàng lọc ảo các hợp chất
phân lập từ thảo dược Việt Nam.
1


Chương 1 - TỔNG QUAN
1.1. Tổng quan về sàng lọc ảo
1.1.1. Khái niệm
Các khái niệm về sàng lọc ảo (virtual screening) xuất hiện vào những năm 60
của thế kỷ XX với các mô hình của Hansch [28]. Thế nhưng, chỉ từ năm 1990 thì lĩnh
vực này mới có nhiều bước tiến và từ đó đến nay, ngày càng phát triển mạnh mẽ [41].
Sàng lọc ảo đề cập đến một loạt các kỹ thuật in silico (các kỹ thuật được thự hiện với
sự trợ giúp của máy tính) được sử dụng để sàng lọc các CSDL hợp chất lớn nhằm lựa
chọn một số lượng nhỏ hơn cho thử nghiệm sinh học. Mô hình sàng lọc ảo không
những bổ sung cho các mô hình thực nghiệm mà còn giúp định hướng quá trình tổng
hợp/phân lập các chất. Ngoài ra sau khi được xây dựng, việc sử dụng các mô hình
này tương đối rẻ (tiết kiệm nguyên liệu thử), nhanh và cho phép làm việc với số lượng
lớn lên tới hàng triệu hợp chất, một điều không thể làm được trong các mô hình thực
nghiệm.
1.1.2. Quy trình sàng lọc ảo

Quá trình sàng lọc ảo gồm 5 bước như sau: 1) Lựa chọn đối tượng sàng lọc 2)
Lựa chọn kỹ thuật 3) Sắp xếp các kỹ thuật theo thứ tự phù hợp 4) Sàng lọc 5) Phân
tích kết quả.
1.1.3. Các kỹ thuật sàng lọc ảo
Các kỹ thuật sàng lọc ảo hiện nay được phân vào 2 nhóm chính là sàng lọc ảo
dựa trên phối tử (Ligand-based Virtual Screening) và sàng lọc ảo dựa trên cấu trúc
(Structure-based Virtual Screening). Sàng lọc ảo dựa trên phối tử được thực hiện
trong trường hợp không có cấu trúc 3D của protein, chỉ có cấu trúc của phối tử. Các
kỹ thuật có thể sử dụng lúc này là kỹ thuật xây dựng phần cấu trúc mang hoạt tính
(pharmacophore), kỹ thuật tìm kiếm đồng dạng (similarity searching), QSAR. Trong
trường hợp có cả cấu trúc 3D của protein và cấu trúc của phối tử, kỹ thuật sàng lọc
ảo dựa vào cấu trúc sẽ được áp dụng, sử dụng kỹ thuật docking [47].
Hệ thống sàng lọc ảo được trợ giúp bởi máy tính gồm nhiều phễu lọc khác
nhau, mỗi phễu lọc sử dụng một kỹ thuật sàng lọc khác nhau, được sắp xếp tuần tự
hợp lý dựa vào thời gian mà máy tính cần cho mỗi thuật toán và sự phức tạp của thông
tin đầu vào. Nghiên cứu sử dụng kết hợp 3 phễu lọc: Tìm kiếm đồng dạng, Mô hình
QSAR và Kỹ thuật docking.

2


1.1.3.1. Tổng quan về tìm kiếm đồng dạng
a. Khái quát về tìm kiếm đồng dạng
Kỹ thuật tìm kiếm đồng dạng (similarity searching) là kỹ thuật tìm kiếm các
hợp chất có cấu trúc tương tự với hợp chất mẫu (reference) trên cơ sở dữ liệu về cấu
trúc của các hợp chất. Kỹ thuật được thực hiện dựa trên nguyên lý tính chất giống
nhau, như vậy những phân tử có cấu trúc giống nhau được hy vọng có tính chất hoặc
hoạt tính sinh học giống nhau [40]. Kỹ thuật tìm kiếm đồng dạng được đưa vào sử
dụng rộng rãi kể từ thập niên 80, và được chứng minh là rất hữu ích trong lĩnh vực
dược phẩm. Hiện nay, phương pháp tìm kiếm đồng dạng đã được xây dựng bởi nhiều

nhóm nghiên cứu trên thế giới. Sàng lọc ảo sử dụng kỹ thuật tìm kiếm đồng dạng có
thể tiến hành một cách nhanh chóng, do đó, kỹ thuật này được sử dụng nhiều để sàng
lọc các cơ sở dữ liệu lớn [70].
Hai yếu tố quan trọng tham gia vào quá trình tìm kiếm đồng dạng là các tham
số phân tử đặc trưng cho các chất và thông số sử dụng để thiết lập mối liên hệ so sánh
giữa cặp phân tử (hệ số tương đồng). Sau khi so sánh có thể sắp xếp các hợp chất
trong CSDL theo thứ tự giảm dần về hệ số tương đồng so với các hợp chất mẫu. Khi
có được danh sách sắp xếp này, người nghiên cứu sử dụng một ngưỡng (cut-off) để
lựa chọn tập hợp các hợp chất nằm trên cùng danh sách [30].
Tham số phân tử là giá trị đại diện cho mô tả phân tử. Các mô tả phân tử
thường được định nghĩa dựa vào chiều của chúng. Mô tả phân tử 1 chiều là các đặc
tính như khối lượng phân tử, số lượng liên kết, đếm các mảnh cấu trúc. Mô tả phân
tử 2 chiều là mô tả biểu diễn các cấu trúc theo kích thước, độ phân nhánh và hình
dạng tổng thể, trong khi 3 chiều sử dụng các thông tin tử cấu trúc không gian 3 chiều
của phân tử. Mô tả phân tử được sử dụng thường xuyên nhất là mô tả phân tử 2D, là
mô tả nhị phân, mã hóa sự có mặt hoặc không của các mảnh cấu trúc [80].
Có nhiều hệ số được xây dựng để biểu diễn sự giống nhau giữa một cặp cấu
trúc, chẳng hạn như hệ số Tanimoto/Jaccard, hệ số Cosine/ Ochiai, hệ số Dice, hệ số
Fossum, hệ số Simpson, hệ số Pearson/Stile, khoảng cách Euclide, khoảng cách
Hamming, khoảng cách Soergel, khoảng cách Manhattan. Hệ số Tanimoto được sử
dụng rộng rãi nhất cho các dữ liệu nhị phân. Nhiều nghiên cứu đã chỉ ra rằng, hệ số
này cho kết quả tốt hơn so với nhiều hệ số khác [79].

3


b. Quy trình tìm kiếm đồng dạng
Quá trình tìm kiếm đồng dạng gồm các bước chính sau: 1) Tính toán tham số
phân tử đặc trưng cho hợp chất, 2) Tính toán hệ số tương đồng, 3) Sắp xếp các chất
theo chiều giảm dần hệ số tương đồng, 4) Chọn ngưỡng.

1.1.3.2. Tổng quan về các mô hình QSAR
a. Khái quát về mô hình QSAR
Mô hình QSAR (Quantitative Structure-Activity Relationships) là mô hình
biểu thị mối liên hệ định lượng giữa cấu trúc và hoạt tính của các hợp chất. Mô hình
QSAR được xây dựng dựa trên giả thuyết cấu trúc của một phân tử phải chứa những
đặc điểm cấu trúc chịu trách nhiệm cho tính chất hóa học, vật lý, sinh học. Mô hình
QSAR cho phép dự đoán tính chất của một phân tử mới dựa trên các hợp chất tương
tự có các tính chất đã được kiểm chứng.
Mô hình QSAR được biểu diễn dưới dạng một phương trình toán học (Phương
trình 1). Để có thể xây dựng được các mô hình này thì cả cấu trúc và hoạt tính đều
phải được định lượng hóa. Các cấu trúc được định lượng thông qua các tham số phân
tử (biến x). Các tham số phân tử là kết quả của một quá trình toán học chuyển đổi các
thông tin trong cấu trúc phân tử thành một số đặc trưng cho cấu trúc phân tử ấy. Hoạt
tính được sử dụng có thể là hoạt tính hoá học hay hoạt tính sinh học (biến Y) được
đánh giá bằng các phương pháp nghiên cứu thực nghiệm. Một số đại lượng hoạt tính
sinh học thường được dùng như: IC50 nồng độ ức chế 50% hoạt tính; MIC (Minimum
Inhibitory Concentration): nồng độ ức chế tối thiểu; MBC (Minimum Bactericidal
Concentration): nồng độ diệt khuẩn tối thiểu; EC50 (Effective Concentration): nồng
độ 50% tác dụng tối đa; KI: Hằng số ức chế...
Phương trình 1:

𝑌 = 𝑓1 (𝑥 ) + 𝑓2 (𝑥 ) + ⋯ + 𝑓𝑛 (𝑥
1

2

𝑛)

Trong đó:
Y: Biến đáp ứng (mang giá trị biểu thị tác dụng sinh học)

x1, x2,…xn: Các tham số đặc trưng cho cấu trúc
f1, f2,…fn: Các thuật toán thể hiện trọng số của tham số phân tử x, được tính toán bằng
các phần mềm phân tích thống kê sử dụng kỹ thuật xác suất thống kê hay trí tuệ nhân
tạo

4


b. Quy trình xây dựng mô hình QSAR
Các bước để xây dựng mô hình QSAR [76] gồm: 1) Xây dựng cơ sở dữ liệu;
2) Tính toán tham số mô tả phân tử đặc trưng cho cấu trúc; 3) Xây dựng mô hình
QSAR: Sử dụng các phương pháp xác suất thống kê và các kỹ thuật của trí tuệ nhân
tạo để xây dựng mối liên hệ giữa các tham số phân tử và các giá trị đại lượng biểu
diễn hoạt tính; 4) Đánh giá mô hình; 5) Giải thích các kết quả và sử dụng mô hình
trong quá trình sàng lọc ảo.
c. Hệ thống phân loại kếp hợp các mô hình QSAR
Dieterich đã nghiên cứu kết luận là một hệ thống phân loại phối hợp thường
tốt hơn việc sử dụng các mô hình đơn [18]. Sự thành công của các hệ thống phân loại
kết hợp (Multiple classifier system) phụ thuộc vào hai yếu tố là sự đa dạng của các
mô hình đơn để kết hợp và cách kết hợp các đầu ra [54].
Có nhiều cách để tạo nên sự đa dạng của các mô hình đơn. Trong các nghiên
cứu của mình, Kuncheva trình bày 4 cấp để tạo nên sự đa dạng của các mô hình đơn
[54]. Cấp độ 1 là thay đổi tập huấn luyện (training set). Cấp độ 2 là thay đổi tập hợp
của các biến độc lập (independent variables). Các biến độc lập dùng để xây dựng các
mô hình QSAR là các tham số phân tử khác nhau đặc trưng cho cấu trúc. Cấp độ 3,
sử dụng các kỹ thuật khác nhau để xây dựng các mô hình đơn. Cấp độ cuối cùng là
cách kết hợp các mô hình đơn. Kuncheva và Whitaker đã tổng kết 10 cách để định
lượng sự đa dạng giữa các mô hình đơn sử dụng các hệ số đa dạng. Có rất nhiều cách
kết hợp các đầu ra như: Biểu quyết đa số phiếu [8], Biểu quyết với trọng số [54],
Bagging (Boostrap AGGregatING) [8], Boosting [7], Stacking [8]. Mỗi cách kết hợp

đầu ra sẽ cho kết quả với độ chính xác khác nhau.
1.1.1.4. Tổng quan về kỹ thuật docking
a. Khái quát về docking
Docking là phương pháp đưa cấu trúc của một chất (dạng cấu trúc không gian
3 chiều) vào một trung tâm tương tác của mục tiêu phân tử (đích tác dụng của thuốc)
và tính toán các giá trị tương tác để đánh giá khả năng tương tác của chất đó với mục
tiêu phân tử. Mục đích của docking là xác định một cấu dạng tối ưu nhất cho phối tử
(phân tử hay anion liên kết trực tiếp với trung tâm hoạt động được gọi là phối tử) và
dự đoán chính xác hoạt động của phối tử để năng lượng tự do của phức hợp mục tiêu
phân tử - phối tử là nhỏ nhất [51].

5


Khi cơ chất gắn lên một phân tử protein, hai điểm cần chú ý là sự phù hợp về
hình dạng, kích thước và năng lượng tương tác giữa nó với protein. Sự phù hợp về
hình dạng tương tự như cơ chế chìa khoá - ổ khoá nhưng trong thực tế, cả cơ chất và
protein đều có thể thay đổi cấu hình, đặc biệt protein là phân tử lớn và có cấu trúc
mềm dẻo. Quá trình này trong thực tế phức tạp hơn. Ngoài yêu cầu phù hợp về hình
dạng, kích thước, giữa cơ chất và enzym còn có những tương tác khác như van der
Waals, tương tác tĩnh điện, trong nhiều trường hợp còn có tương tác hoá học. Nhưng
do protein thường có kích thước lớn và mềm dẻo, rất khó khảo sát hết tất cả khả năng
có thể nên trong docking, phân tử protein thường được đưa vào dưới dạng cấu trúc
cứng (rigid), cơ chất chuyển động tương đối so với protein và thay đổi cấu hình. Một
số phần mềm docking cũng cho phép thay đổi cấu hình trên một số amino acid. Hiện
nay, có rất nhiều phần mềm được sử dụng để docking: AutoDock [3], ICM-Docking
[35], MOE (Molecular Operating Environment) [59], SwissDock [73]...
Có 2 cách tiếp cận trong phương pháp docking: docking cơ học và docking tự
động [64]. Docking cơ học trong trường hợp đã biết các nhóm liên kết của phối tử và
vị trí liên kết của mục tiêu. Sử dụng một số chương trình cho phép phối tử chuyển

động trong vị trí liến kết và cố gắng lắp ghép chúng lại với nhau một cách phù hợp
nhất ở trạng thái cứng. Docking tự động được tiến hành nhờ sử dụng các phần mềm
tự động docking. Các chương trình này sẽ tự động quyết định việc làm thế nào để
dock phối tử vào vị trí liên kết.
Một chương trình docking gồm 2 phần chính: thuật toán tìm kiếm cấu dạng,
quay và dịch chuyển của phân tử trong vùng gắn và thuật toán để đánh giá sự phù
hợp của phối tử và receptor hoặc ái lực gắn giữa chúng. Docking yêu cầu thông tin
3D của phân tử và hình dáng 3D của protein đích. Để tìm cấu hình phù hợp nhất cần
liên hệ không gian cấu hình với các giá trị số đánh giá được khả năng gắn kết của cơ
chất lên protein và sau đó áp dụng thuật toán tìm kiếm.
b. Quy trình docking
Quy trình docking gồm 4 bước cơ bản: 1) Chuẩn bị protein; 2) Chuẩn bị cấu
tử; 3) Mô phỏng docking; 4) Giải thích kết quả.
1.2. Tổng quan về enzym tyrosinase
1.2.1. Khái niệm enzym tyrosinase
Tyrosinase (EC 1.14.18.1) hay còn gọi là enzym polyphenol oxidase (PPO),
là một enzym monooxygenase có chứa đồng tham gia vào hai phản ứng riêng biệt
6


của quá trình chuyển hóa melanin; một là hydroxyl hóa monophenol thành Odiphenol, hai là oxi hóa O-diphenol thành O-quinon (Hình 1) [9, 48]; sau đó, Oquinon tham gia một loạt các phản ứng để tạo thành melanin.

Hình 1: Quá trình oxy hóa phenol thông qua enzym tyrosinase
Enzym này được phân bố rộng rãi trong nấm, động vật và thực vật, nó đóng
vai trò quan trọng trong quá trình hình thành sắc tố. Enzym tyrosinase có thể tồn tại
ở 3 dạng là: oxy, deoxy, met-tyrosinase được biểu diễn qua sơ đồ trong Hình 2 [10,
45, 49]. Cả dạng met-tyrosinase và dạng oxy-tyrosinase đều có hoạt tính diphenolase,
trong khi chỉ có dạng oxy-tyrosinase là có hoạt tính monophenolase. Dạng deoxytyrosinase là dạng yếu, không ổn định; phản ứng với oxy để tạo thành dạng oxytyrosinase.

Hình 2: Các dạng oxi hóa của enzym tyrosinase

1.2.2. Trung tâm hoạt động của enzym tyrosinase
Việc phân tích về trung tâm hoạt động là cần thiết cho quá trình xác định hợp
chất ức chế enzym tyrosinae. Cấu trúc tinh thể tia X của enzym được tải về từ ngân
hàng dữ liệu protein (ID: 2Y9X). Trung tâm hoạt động gồm có túi enzym và 2 nguyên
tử đồng nằm ở đáy túi, đóng vai trò quan trọng trong cơ chế xúc tác của enzym. Mỗi

7


nguyên tử đồng tạo liên kết phối trí với 3 phân tử histamin. Miệng túi được hình thành
từ các chuỗi acid amin như Val283, Phel264, His244, Val248, Asn260… (Hình 3)
[36].

Hình 3: Trung tâm hoạt động của enzym tyrosinase tương tác với Tropolon
Như vậy, để một cấu tử thể hiện được vai trò ức chế enzym tyrosinase, nó cần
phải chui được vào túi enzym của trung tâm hoạt động và khóa được ion Cu2+ ở đáy
túi enzym [83].
1.2.3. Vai trò của tyrosinase
Sắc tố là một trong những đặc điểm kiểu hình rõ ràng nhất trong thế giới tự
nhiên. Trong các tế bào động vật hoặc thực vật, một sắc tố được định nghĩa là bất kỳ
chất tạo màu do chúng phản xạ và hấp thụ một số sóng ánh sáng đặc hiệu [57]. Trong
các sắc tố sinh học đó, melanin (theo tiếng Hy Lạp có nghĩa là đen) được phân bố
rộng rãi nhất và được tìm thấy trong suốt quá trình phát sinh loài, từ các vi sinh vật
cho đến động vật, có cả con người [66]. Ở người, melanin được tìm thấy chủ yếu
trong da, tóc, võng mạc [25]. Melanin được tiết ra bởi tế bào sắc tố phân bố ở lớp đáy
của biểu bì. Vai trò của melanin là bảo vệ da khỏi tác hại của tia tử ngoại, đặc biệt là
tia cực tím B bằng cách hấp thụ và tán xạ ánh sáng mặt trời và loại bỏ các gốc oxy
hóa tự do. Các rối loạn khác nhau ở da là kết quả của sự tích tụ quá mức sắc tố ở biểu
bì. Tăng sắc tố có thể do tăng tế bào tạo sắc tố hoặc do tăng hoạt động của các enzym
hình thành sắc tố.

Các tế bào biểu bì tạo sắc tố của động vật có vú có thể sản xuất hai loại melanin
là eumelanin và pheomelanin. Eumelanin có màu từ nâu đến đen, không tan trong
hầu hết các dung môi, liên kết chặt chẽ với protein thông qua các liên kết đồng hóa
trị. Pheomelanin có màu từ vàng đến đỏ, có bộ khung được tạo bởi các tiểu đơn vị là
các benzothiazin và cũng liên kết chặt chẽ với protein thông qua các liên kết đồng
8


hóa trị. Tỷ lệ về số lượng và mật độ của hai melanin này sẽ quyết định màu sắc của
da, mắt và tóc [78].
Con đường hình thành sắc tố melanin được tóm tắt trong Hình 4 [49, 65].
Bước đầu tiên và cũng là bước bắt buộc trong quá trình hình thành sắc tố là sự oxy
hóa tyrosin thành dopaquinon. Đây là bước giới hạn tốc độ trong quá trình sinh tổng
hợp tyrosin do chuỗi phản ứng còn lại có thể tự diễn ra tại một giá trị pH sinh lý nhất
định. Dopaquinon sinh ra được chuyển thành leukodopachrom, sau đó chuyển thành
dopachrom. Cuối cùng eumelanin được hình thành thông qua một loạt các phản ứng
oxy hóa từ các sản phẩm chuyển hóa của dopachrom là 5,6-dihydroxyindol (DHI) và
acid 5,6-dihydroxyindol-2-cacboxylic (DHICA). Trong trường hợp có sự có mặt của
cystein hoặc glutathion, dopaquinon sẽ được chuyển hóa thành cysteyldopa hoặc
glutathionyldopa. Cysteinyldopa hoặc glutathionyldopa tiếp tục trải qua một loạt các
phản ứng để tạo thành pheomelanin [12, 49].
Như vậy, tyrosinase tham gia vào phản ứng đầu của quá trình hình thành sắc
tố da melanin. Chính vì thế mà các chất ức chế tyrosinase đã và đang được sử dụng
rất rộng trong điều trị các bệnh tăng sắc tố và trong mỹ phẩm như một yếu tố làm
trắng da.

Hình 4: Sơ đồ biểu diễn con đường sinh tổng hợp melanin
1.2.4. Các chất ức chế tyrosinase

9



Tyrosinase đóng một vai trò quan trọng trong quá trình tổng hợp melanin, do
đó ức chế enzym này làm giảm hình thành sắc tố da [56]. Vì thế việc tìm kiếm các
chất ức chế tyrosinase ngày càng trở nên quan trọng trong các sản phẩm thuốc và mỹ
phẩm sử dụng để ngăn ngừa và điều trị rối loạn sắc tố.
1.2.4.1. Các chất ức chế tyrosinase có nguồn gốc thiên nhiên
Polyphenol thực vật là nhóm các hợp chất có nhiều nhóm chức phenol, tiêu
biểu là flavonoid. Hơn 4000 flavonoid phân bố trong lá, hạt, vỏ cây và hoa đã được
xác định. Ở thực vật các hợp chất này bảo vệ thực vật bằng cách chống lại tia cực tím
và tác nhân gây bệnh [27]. Một số flavonoid như kaempferol, quercetin và morin thể
hiện tác dụng ức chế tyrosinase, trong khi những chất khác, ví dụ catechin và
rhamnetin, đóng vai trò là các cơ chất của tyrosinase. Một số nghiên cứu cho thấy
rằng flavonoid có chứa nhóm α-keto có tác dụng ức chế tyrosinase mạnh [5].
Nhiều aldehyd và các hợp chất khác cũng được phân lập và xác định là có tác
dụng ức chế enzym tyrosinase như cinnamaldehyd, (2E) -alkenal, 2-hydroxy-4methoxybenzaldehyd, anisaldehyd, cuminaldehyd và acid cumic [52]. Hoạt động ức
chế tyrosinase của anisaldehyd và cuminaldehyd mạnh hơn khoảng 2,5 và 16 lần so
với benzaldehyd. Một số alkanal có tác dụng ức chế tyrosinase có thể là do sự tương
tác kỵ nước của chúng với các enzym, làm ảnh hưởng đến cấu trúc bậc 3 của enzym
[15]. (2E) - alkenal ức chế quá trình oxy hóa L-3,4-dihydroxyphenylalanin (L-DOPA)
của tyrosinase là chất ức chế không cạnh tranh, và phần alkyl kỵ nước có liên quan
đến hoạt động ức chế của chúng [15].
Bên cạnh những thực vật bậc cao thì trong nấm cũng có một số hợp chất có
tác dụng ức chế enzym tyrosinase. Acid dicacboxylic bão hòa được tạo thành bởi quá
trình peroxy hóa lipid và este hóa acid béo bằng nấm men, vi nấm Pityrosporum
ovale. Acid dicacboxylic này có tác dụng gây độc nhất định trên các tế bào biểu bì
tạo sắc tố của khối u ác tính ở da, mặc dù bình thường tế bào biểu bì tạo sắc tố không
bị ảnh hưởng [69]. Acid kojic, 5-hydroxy-2- (hydroxymethyl)-γ-pyron, một chất
chuyển hóa của nấm được sản xuất bởi nhiều loài thuộc chi Aspergillus và
Penicillium. Acid kojic ức chế sự hình thành sắc tố từ phản ứng oxy hóa L-DOPA,

norepinephrin và dopamin dưới sự xúc tác của tyrosinase. Điều này có nghĩa rằng
acid kojic có thể giảm chuyển hóa O-quinon thành O-diphenol ngăn cản tạo thành
các sắc tố [43].
1.2.4.2. Các chất ức chế tyrosinase có nguồn gốc tổng hợp

10


Một lượng đáng kể các hợp chất có nguồn gốc tổng hợp như hydroxylamin,
các hợp chất chứa thiol, acid cacboxylic thơm, dẫn xuất của acid cinnamic, trihydroxy
chalconas, peptid, acid alkylbenzoic [31], N-hydroxy-N’-phenyl ure và N-hydroxyN’-phenyl thioure [16] có tác dụng ức chế enzym tyrosinase.
Tropolon (2-hydroxy-2,4,6-cycloheptatrien-1-on) là một trong những chất ức
chế tyrosinase mạnh nhất. Nó có cấu trúc tương tự như các cơ chất O-diphenolic của
tyrosinase [42].
Resorcinol được gắn nhóm thế ở vị trí 4 là các chất ức chế tyrosinase yếu.
Trong các hợp chất này, tác dụng ức chế mạnh nhất đạt được khi thay thế nhóm kỵ
nước vào vị trí thứ 4, chẳng hạn như 4-hexyl resorcinol và 4-dodecyl resorcinol. 4hexyl resorcinol là các chất ức chế tyrosinase hiệu quả nhất sử dụng trong các ngành
công nghiệp thực phẩm vì nó hòa tan trong nước, ổn định, không độc hại, không gây
đột biến và không gây ung thư, và chất này cũng đã được công nhận là an toàn trong
việc kiểm soát sự sẫm màu của lát táo cũng như khoai tây và bơ khi để ngoài không
khí lâu [21].
1.2.4.3. Các thuốc được phát hiện có tác dụng ức chế tyrosinase
Captopril, (S)-1-(3-mercapto-2-metyl-1-oxopropyl)-L-prolin, ức chế hoạt
động monophenolase và diphenolase của tyrosinase [20]. Captopril được biết đến là
chất tạo chelat với đồng [38]. Do đó, có thể cho rằng captopril chủ yếu có tác dụng
ức chế là do tạo chelat với ion đồng ở vị trí hoạt động của tyrosinase.
Một số thuốc khác cũng có tác dụng ức chế hoạt động của tyrosinase, như
penicillamin, được sử dụng trong điều trị bệnh Wilson [55], và methimazol là thuốc
kháng tuyến giáp. Methimazol (1-methyl-2-mercaptoimidazol) ức chế cả hoạt động
monophenolase và diphenolase của tyrosinase nấm. Methimazol ức chế hoạt động

tyrosinase của nấm bằng hai cách: liên hợp với O-quinon, do đó ức chế rõ sự hình
thành sắc tố, và tạo chelat với đồng tại vị trí hoạt động của tyrosinase [1].
1.2.4.4. Một số chất ức chế đã được sử dụng
HQ làm giảm 90% hoạt tính của tyrosinase [77], là một hóa chất phổ biến có
trong mỹ phẩm và sản phẩm làm sáng da không cần đơn. Nó được coi là một trong
các chất ức chế hiệu quả nhất quá trình sản xuất melanin ở cả in vitro và in vivo. HQ
ảnh hưởng nghiêm trọng đến sức khỏe đặc biệt là sắc tố của mắt, và trong một số ít
trường hợp HQ gây tổn thương giác mạc vĩnh viễn. Hiện tượng này đã được quan sát
thấy ở các công nhân sản xuất HQ. HQ đã bị Cục quản lý Dược phẩm Hoa Kỳ cấm
11


sử dụng trong các chế phẩm mỹ phẩm ở Châu Âu vì không an toàn khi sử dụng trong
thời gian dài [17].
Arbutin, một hợp chất chuyển hóa thứ cấp của cây dâu gấu (tên khoa học là
Arctostaphylos uva-ursi), được sử dụng rộng rãi với hiệu quả làm sáng da. Arbutin
tự nhiên tương đối an toàn tuy nhiên lại có độ ổn định thấp và dễ dàng chuyển hóa
thành HQ. Vì thế, vào năm 2008, Hiệp hội Mỹ phẩm Châu Âu đã cấm sử dụng các
đồng dạng của beta-arbutin [81].
1.3. Tổng quan về hợp chất thiên nhiên Việt Nam
1.3.1. Khái niệm hợp chất thiên nhiên
Hợp chất thiên nhiên ( natural products) là các chất hóa học có nguồn gốc từ
thiên nhiên hoặc được chiết xuất từ các mô của động vật, thực vật trên cạn; sinh vật
biển; vi khuẩn lên men; vi sinh vật [37]. Hầu hết các hợp chất thiên nhiên có hoạt
tính sinh học là các chất chuyển hóa thứ cấp có cấu trúc rất phức tạp.
1.3.2. Vai trò của hợp chất thiên nhiên trong nghiên cứu và phát triển thuốc
Thực vật được cấu thành bởi một hệ thống lớn và đa dạng các chất hóa học,
chúng có thể cung cấp những hợp chất với cấu trúc có độ phức tạp cao mà không thể
tổng hợp được trong các phòng thí nghiệm. Những phân tử nhỏ này cung cấp nguồn
hoặc là tiền chất cho phần lớn các hoạt chất được FDA chấp thuận và hiện đang là

một trong những nguồn cảm hứng chính cho việc nghiên cứu và phát hiện thuốc mới.
Có nhiều chất dẫn đường có nguồn gốc từ thực vật [62] (ví dụ morphin,
cocain, digitalis, quinin, tubocurarin, nicotin, muscarin…). Một số đóng vai trò trực
tiếp là những loại thuốc hữu ích (ví dụ morphin và quinin), và một số khác là cơ sở
cho tổng hợp các hoạt chất làm thuốc (ví dụ như thuốc gây mê cục bộ phát triển từ
cocain). Gần đây trong lâm sàng, một số loại thuốc mới đã được phân lập từ thực vật
bao gồm thuốc chống ung thư paclitaxel (Taxol) từ cây thủy tùng, và thuốc chống sốt
rét artemisinin từ câu thanh hao hoa vàng.
Nhiều thực vật bậc cao chứa các chất chuyển hóa mới có tính kháng khuẩn và
kháng virus [26]. Ở những nước phát triển, các ca lâm sàng có dử dụng hóa trị liệu
thường dùng các thuốc đã được sản xuất bằng hóa tổng hợp in vitro; nhưng taxol và
vincristin là ngoại lệ [46], chúng là các chất chuyển hóa có cấu trúc phức tạp, rất khó
tổng hợp trong ống nghiệm. Nhiều loại thuốc tổng hợp và bán tổng hợp gây ra các
phản ứng phụ nghiêm trọng, nhất là các thuốc dùng điều trị cho bệnh nhân ung thư
với các tác dụng phụ biểu hiện trên da một cách rất nghiêm trọng. Các chất chuyển
12


hóa được phát hiện trong một số loài thực vật có thể tránh tác dụng phụ của thuốc
tổng hợp vì chúng đã từng tích tụ trong các tế bào sống [29].
Một trong những hợp chất tinh khiết được phân lập đầu tiên trong lịch sử y
học là morphin vào khoảng năm 1804 bởi Friedrich Serturner từ thuốc phiện. Vào
thời điểm đó, thuốc phiện được gọi là thuốc gây nghiện, mặc dù nó đã được sử dụng
nhiều trong điều trị giảm đau vào thời Trung cổ. Tiếp sau đó, thuốc kháng sốt rét,
quinin đã được Pelletier và Caventou phân lập từ cây vỏ cây cinchona vào năm 1820.
Loại vỏ cây này đã được sử dụng để điều trị sốt rét từ những năm 1600 và cũng là
một phần của y học cổ truyền Nam Mỹ để điều trị bệnh sốt. Sự gia tăng tính kháng
thuốc đối với quinin và dẫn chất của nó dẫn đến nhu cầu về thuốc sốt rét thay thế, đó
là artemisinin được phân lập từ cây thanh hao hoa vàng. Ngoài ra còn có thuốc giảm
đau aspirin là este của acid salicylic được tách chiết từ vỏ cây liễu, lá của cây này

được người Ai Cập cổ đại sử dụng với tác dụng giảm đau và chống viêm.
1.3.3. Tiềm năng của hơp chất thiên nhiên Việt Nam
Theo kết quả thống kê của Viện Dược liệu, tính đến năm 2017 đã ghi nhận
được 5.117 loài thực vật và nấm lớn, 52 loài tảo biển, 408 loài động vật và 75 loài
khoáng vật có công dụng làm thuốc. Trong số đó, có khoảng 70 loài có tiềm năng
khai thác với tổng trữ lượng khoảng 18.000 tấn/năm như diếp cá (5.000 tấn), cẩu tích
(1.500 tấn), lạc tiên (1.500 tấn), rau đắng đất (1.500 tấn)…Đặc biệt, Việt Nam sở hữu
nhiều loài dược liệu quý, hiếm, đặc hữu như: Sâm Ngọc Linh, Ba kích, Châu thụ,
Ngân đằng… Kết quả này cho thấy nguồn dược liệu ở nước ta rất phong phú. Con số
này còn có thể sẽ tăng thêm, nếu đi sâu điều tra cụ thể hơn một số nhóm động – thực
vật tiềm năng, mà trong đó số loài Tảo, Rêu, Nấm và Côn trùng làm thuốc mới được
thống kê còn quá ít.
Chiến lược quốc gia phát triển ngành dược đến năm 2020 đã đặt mục tiêu phấn
đấu sản xuất được 20% nhu cầu nguyên liệu cho sản xuất thuốc trong nước; thuốc
sản xuất trong nước chiếm 80% tổng giá trị thuốc tiêu thụ trong năm, trong đó thuốc
từ dược liệu chiếm 30%.

13


Chương 2 - NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Đối tượng, nguyên vật liệu và thiết bị nghiên cứu
2.1.1 Đối tượng nghiên cứu
Nghiên cứu được thực hiện trên cơ sở dữ liệu cấu trúc các hợp chất có nguồn
gốc từ thảo dược Việt Nam. Thông tin của 1376 hợp chất được phân lập từ 311 loài
thực vật và nấm thuộc 114 họ thực vật tại Việt Nam đã được xác định cấu trúc trong
418 nghiên cứu trong nước (được công bố trên các tạp chí Dược liệu, Dược học, Hóa
học và Khoa học công nghệ) và quốc tế được tập hợp lại thành một CSDL. CSDL Có
các thông tin về hợp chất (tên, biểu diễn cấu trúc dưới dạng SMILE, InChI và
InChiKey), tên nguồn dược liệu (tên thông thường, tên khoa học), địa chỉ thu hái, thời

gian thu hái, bộ phận sử dụng, tác dụng dân gian, tác dụng dược lý được chứng minh
và tài liệu tham khảo. Mỗi hợp chất trong CSDL được gán một số đăng ký VNPD_ID
từ VNPD_ID1 tới VNPD_ID1376. Ngoài ra, mỗi cấu trúc còn được phân loại, tính
toán các thông số lý hóa như khối lượng phân tử, AlogP, XlogP, số liên kết cho hydro,
số liên kết nhận hydro...
CSDL Có các hợp chất được được phân loại vào các nhóm khác nhau, chủ yếu
là lipid, phenylpropanoid và benzoid, được nêu cụ thể trong Bảng 1.
Bảng 1: Các phân nhóm chính trong CSDL
Số lượng
hợp chất
531
364
144
117
80
60
60
20
1376

Nhóm phân loại chính
Lipid và các phân tử giống lipid
Phenylpropanoid và polyketid
Benzenoid
Hợp chất có cấu trúc dị vòng
Hợp chất hữu cơ có chứa oxy
Alkaloid và các dẫn xuất
Lignan, neolignan
Khác
Tổng


Tỷ lệ (%)
38,59
26,45
10,46
8,50
5,81
4,36
4,36
1,46
100

2.1.2. Nguyên liệu
- Mô hình QSAR phân loại (Classify) và QSAR hoạt tính (Potency) đã được công bố
trong nghiên cứu trước đây [34]

14


- Cấu trúc tinh thể tia X của enzym tyrosinase (ID: 2Y9X) phân lập từ A.bisporus với
chất ức chế Tropolon được tải về từ ngân hàng Protein Data Bank
( />2.1.3. Thiết bị
- Máy tính Dell Vostro 3460, Ram 6GB, hệ điều hành Window 7, CPU Intel Core i5
Ivy Bridge với tốc độ xử lý 2.50GHz
- Phần mềm:
1. CDK DescUI-1.4.6 [11]
2.TOMOCOMD-CARDD (TOpological MOlecular COMputer Design Computer - Aided Racional Drug Design) [84]
3. Weka 3.6 (Waikato Environment for Knowledge Analysis) [75]
4. ChemBioDraw Ultra 12.0 [13]
5. UCSF Chimera 1.11.2 [14]

6. MOE 2009.10 (Molecular Operating Environment) [59]
7. Microsoft Office 2013
2.2. Phương pháp nghiên cứu
Nghiên cứu sử dụng phương pháp sàng lọc các hợp chất ức chế tyrosinase sử
dụng mô hình sàng lọc ảo. Hệ thống sàng lọc được định hướng phát triển theo các
bước giống Hình 5. Hệ thống này có nhiều phễu lọc cho phép sàng lọc được những
cơ sở dữ liệu lớn (hàng nghìn hợp chất) nhằm thu được một tập hợp nhỏ các hợp chất
có tiềm năng ức chế enzym tyrosinase.

15


Hình 5: Mô phỏng hệ thống sàng lọc ảo hợp chất ức chế enzym tyrosinase
2.2.1. Tìm kiếm đồng dạng
Phễu lọc tìm kiếm tương đồng được sử dụng nhằm sàng lọc được các hợp chất
có độ tương đồng cao (trên 75%) với các hợp chất mẫu, cung cấp một số lượng nhỏ
các chất có chất lượng cao cho phễu lọc tiếp theo.
Tham số phân tử MACCS [67] (là 1 mô tả phân tử sử dụng 166 bit để mã hóa
thông tin về nguyên tử, loại nguyên tử, vòng và các liên kết trong phân tử) được tính
toán bằng phần mềm CDK DescUI-1.4.6 trên tập hợp chất trong CSDL và tập hợp
mẫu. Tập hợp chất mẫu trong nghiên cứu này là tập hợp các chất ức chế mạnh
tyrosinase đã biết trước cấu trúc [33] (chi tiết cấu trúc hóa học của các hợp chất mẫu
được nêu trong Phụ lục 1). Sau đó, hệ số Tanimoto được tính toán bằng ngôn ngữ R
(là ngôn ngữ dành cho tính toán và đồ họa thống kê) [39], dựa theo Công thức (2).
Mỗi hợp chất của CSDL sẽ có 12 hệ số tương đồng ứng với 12 chất mẫu (từ Ref1 tới
Ref12). Nghiên cứu sử dụng quy tắc MAX để kết hợp các giá trị định lượng về sự
tương đồng cấu trúc theo: Tc max = Maximum (Tc1, Tc2,…Tc12). Sau đó, từng hợp chất
trong CSDL được sắp xếp theo giá trị Tc max giảm dần. Các hợp chất được giữ lại cho
quá trình sàng lọc tiếp theo khi có giá trị Tc từ 0.75 trở lên.
Công thức (2):


𝑇𝑐 =

𝑁𝑐
𝑁𝑎 +𝑁𝑏 −𝑁𝑐

Trong đó:

16


Tc: Hệ số Tanimoto
Na: Số lượng các đặc tính xuất hiện trong cấu trúc A
Nb: Số lượng các đặc tính xuất hiện trong cấu trúc B
Nc: Số lượng các đặc tính xuất hiện trong cả 2 cấu trúc A và B
2.2.2. Mô hình QSAR
Các hợp chất được xác định là có cấu trúc tương đồng với các hợp chất ức chế
tyrosinase mạnh (kết quả sàng lọc sử dụng phễu lọc tìm kiếm độ tương đồng), sẽ được
đánh giá khả năng ức chế sử dụng mô hình QSAR. Đầu tiên, nghiên cứu sử dụng mô
hình QSAR phân loại (Classify) nhằm phân loại hợp chất thành có tiềm năng ức chế
hay không có tiềm năng ức chế. Sau đó, các hợp chất được phân loại là có tiềm năng
ức chế, sẽ được sàng lọc qua mô hình QSAR hoạt tính (Potency) để đánh giá khả
năng ức chế tyrosinase mạnh hay yếu.
Các hợp chất thu được từ phễu lọc tìm kiếm đồng dạng sẽ được tính toán các
tham số phân tử đặc trưng biểu thị mối quan hệ giữa đặc tính, cấu trúc và hoạt tính
sinh học sử dụng phần mềm TOMOCOMD-CARDD. Danh sách các tham số phân
tử và ý nghĩa các tham số phân tử này được liệt kê trong Phụ lục 2. Tập kiểm tra
(testing set) được chuẩn bị từ danh sách kết quả các tham số phân tử vừa tính được
sử dụng phần mềm WEKA 3.6. Tập huấn luyện (training set) cho mô hình QSAR
phân loại gồm 1072 hợp chất, trong đó có 526 hợp chất có hoạt tính và 546 hợp chất

không có hoạt tính ức chế tyrosinase. Tập huấn luyện cho QSAR hoạt tính gồm 257
chất có hoạt tính mạnh và 141 chất có hoạt tính trung bình-yếu [34].
Nghiên cứu sử dụng mô hình QSAR là mô hình hợp kết hợp giữa các mô hình
đơn có độ chính xác cao được xây dựng từ việc áp dụng các thuật toán thống kê và
mô hình học máy khác nhau. Sau đó, sử dụng thêm trình huấn luyện stacking để kết
hợp đầu ra của các mô hình đơn nhằm đạt kết quả tốt nhất. 2 mô hình QSAR phân
loại và QSAR hoạt tính được sử dụng đều là các mô hình được nhóm nghiên cứu của
TS. Lê Thị Thu Hường đánh giá là tốt nhất [34], có độ tin cậy cao, 95,43% và 93,72%
tương ứng.
2.2.3. Docking
Cuối cùng, các hợp chất được dự đoán là có khả năng ức chế tyrosianse mạnh
sẽ được dock với enzym tyrosinase (ID: 2Y9X) nhằm xác định năng lượng liên kết

17


×