Tải bản đầy đủ (.pdf) (176 trang)

nghiên cứu 2d qsar trên dòng tế bào mcf7 và mô hình docking trên tubulin của các dẫn chất chalcon

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (8.83 MB, 176 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ

<b>ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH</b>

<b>PHAN NGUYỄN NHƯ Ý</b>

<b>NGHIÊN CỨU 2D-QSAR TRÊN DÒNG TẾ BÀO MCF7VÀ MƠ HÌNH DOCKING TRÊN TUBULIN</b>

<b>CỦA CÁC DẪN CHẤT CHALCON</b>

<b>LUẬN VĂN THẠC SĨ DƯỢC HỌC</b>

<b>THÀNH PHỐ HỒ CHÍ MINH, NĂM 2023</b>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

BỘ GIÁO DỤC VÀ ĐÀO TẠO <sub>BỘ Y TẾ</sub>

<b>ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH</b>

<b>PHAN NGUYỄN NHƯ Ý</b>

<b>NGHIÊN CỨU 2D-QSAR TRÊN DÒNG TẾ BÀO MCF7VÀ MƠ HÌNH DOCKING TRÊN TUBULIN</b>

<b>CỦA CÁC DẪN CHẤT CHALCON</b>

<b>NGÀNH: CÔNG NGHỆ DƯỢC PHẨM VÀ BÀO CHẾ THUỐCMÃ SỐ: 8720202</b>

<b>LUẬN VĂN THẠC SĨ DƯỢC HỌC</b>

<b>NGƯỜI HƯỚNG DẪN KHOA HỌC:GS.TS. TRẦN THÀNH ĐẠO</b>

<b>THÀNH PHỐ HỒ CHÍ MINH, NĂM 2023</b>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

<b>LỜI CAM ĐOAN</b>

Tơi cam đoan đây là cơng trình nghiên cứu của tôi. Các số liệu, kết quả nêutrong luận văn này là trung thực và chưa từng được ai cơng bố trong bất kỳcơng trình nào khác.

<b>Tác giả luận văn</b>

<b>Phan Nguyễn Như Ý</b>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>NGHIÊN CỨU 2D-QSAR TRÊN DỊNG TẾ BÀO MCF7 VÀMƠ HÌNH DOCKING TRÊN TUBULIN CỦA CÁC DẪN</b>

<b>CHẤT CHALCON</b>

<b><small>Phan Nguyễn Như Ý</small></b>

<b><small>Giáo viên hướng dẫn: GS. TS. Trần Thành Đạo</small></b>

<b><small>ĐẶT VẤN ĐỀ: MCF7 là dịng tế bào ung thư biểu mơ tuyến vú ở người và là một</small></b>

<small>mơ hình tiềm năng để nghiên cứu nhiều khía cạnh của sự phát triển của tế bào khốiu. Vi ống có cấu tạo từ protein tubulin và sự bất ổn định động học của vi ống là mụctiêu quan trọng trong các nghiên cứu về thuốc điều trị ung thư. Chalcon là các phântử nhỏ có nhiều hoạt tính sinh học, trong đó có tiềm năng kháng ung thư.</small>

<b><small>MỤC TIÊU: Xây dựng các mơ hình 2D-QSAR và docking nhằm ứng dụng 2 mơ</small></b>

<small>hình này vào sàng lọc để tìm ra các dẫn chất chalcon có khả năng ức chế MCF7 tốtvà đánh giá khả năng gắn kết sâu hơn bằng mô phỏng động lực học phân tử MDs.</small>

<b><small>PHƯƠNG PHÁP NGHIÊN CỨU: Mơ hình 2D-QSAR và docking được xây dựng</small></b>

<small>dựa trên cấu trúc tubulin (mã PDB: 1SA0) và các chalcon với pIC50 trên MCF7 đượcthu thập. Nghiên cứu tiến hành sàng lọc trên cơ sở dữ liệu 1269 chalcon gồm 269chalcon nội bộ và 1000 chalcon tổ hợp được tạo ra từ MOE để tìm ra chalcon tiềmnăng nhất. 10 chất có pIC50 và điểm số docking tốt nhất được MDs trên tubulin trong100 ns.</small>

<b><small>KẾT QUẢ: 10 dẫn chất chalcon tiềm năng được mô phỏng động lực học trong 100</small></b>

<b><small>ns và đánh giá năng lượng gắn kết tự do, thu được C28, E4, E6, E7, E9 có khả nănggắn kết tốt với tubulin, đặc biệt là E4 (-48,22 ± 3,77 kcal/mol).</small></b>

<i><b><small>KẾT LUẬN VÀ KIẾN NGHỊ: Các mô hình in silico đã được xây dựng và sàng lọc</small></b></i>

<small>thành công trên tập cơ sở dữ liệu với 1269 chất. Nghiên cứu kiến nghị tiến hành tổng</small>

<i><small>hợp và thử nghiệm hoạt tính in vitro để đánh giá khả năng ức chế MCF7 của các</small></i>

<b><small>chalcon tiềm năng trong thực tế, đặc biệt là dẫn chất E4.</small></b>

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<b>STUDY OF 2D-QSAR ON MCF7 CELL LINE ANDDOCKING MODELING ON TUBULIN OF CHALCONE</b>

<b><small>Phan Nguyen Nhu Y</small></b>

<b><small>Supervisor: Prof. PhD. Tran Thanh Dao</small></b>

<b><small>INTRODUCTION: MCF7 is human breast carcinoma cell, as well as a model</small></b>

<small>system to study many aspects of tumor cell growth. Microtubes structured fromtubulin and its dynamic instability have become one of the most drug targets forcancer treatment. Chalcones exhibit various biological activities, one of which isantiproliferative because of tubulin inhibition and the disruption of microtubules,leading that they are anticancer drugs. This study is conducted to find potential newchalcones as inhibitors of breast cancer.</small>

<b><small>OBJECTIVE: 2D-QSAR and docking modelings were set up and used for screening</small></b>

<small>new small molecules inhibitor of MCF7, followed by evaluating connection betweenligands and protein through molecular dynamics simulation MDs.</small>

<b><small>METHODS: 2D-QSARb and docking modelings were built based on MCF7 (PDB</small></b>

<small>ID: 1SA0) and chalcones with pIC50 values collected from those previous scientificresearchs. These models and Lipinski's Rule of Five were used to screen on twodatabases of 1269 chalcones to figure out potential chalcone as good MCF7inhibitors. 10 compounds having the highest pIC50 and docking score were moleculardynamics simulated on tubulin in 100 ns.</small>

<b><small>RESULT: 10 potential chalcones obtained from 2D-QSAR and molecular docking</small></b>

<b><small>were MDs in 100 ns and evaluated the binding free energy, identifying chalcone C28,</small></b>

<b><small>E4, E6, E7, E9 as the most potential MCF7 inhibitors, especially E4 with the best</small></b>

<small>binding affinity (-48,22 ± 3,77 kcal/mol).</small>

<i><b><small>CONCLUSION: In silico models have been successfully built and applied to screen</small></b></i>

<i><small>on databases of 1269 substances. This study proposes to conduct in vitro experiments</small></i>

<b><small>on MCF7 to confirm the actual value of inhibitory activity of E4.</small></b>

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<b>CHƯƠNG 1. TỔNG QUAN TÀI LIỆU ... 3</b>

1.1. Giới thiệu chung về chalcon ... 3

1.2. Giới thiệu chung về mục tiêu tác động ... 5

1.3. Phương pháp nghiên cứu mối liên quan định lượng giữa cấu trúc và tácdụng ... 11

1.4. Phương pháp docking ... 17

1.5. Mô phỏng động lực học phân tử ... 20

1.6. Các nghiên cứu liên quan ... 22

<b>CHƯƠNG 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU ... 23</b>

2.1. Đối tượng nghiên cứu... 23

2.2. Phương pháp nghiên cứu ... 25

<b>CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU ... 37</b>

3.1. Mơ hình QSAR ... 37

3.2. Mơ hình docking phân tử ... 49

3.3. Ứng dụng mơ hình sàng lọc ảo đã xây dựng để sàng lọc các chalcon tiềmnăng có hoạt tính ức chế MCF7 ... 58

<b>CHƯƠNG 4. BÀN LUẬN ... 75</b>

4.1. Mơ hình QSAR ... 75

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

4.2. Mơ hình mơ tả phân tử docking ... 79

4.3. Ứng dụng mơ hình sàng lọc ảo đã xây dựng để sàng lọc các chalcon tiềmnăng có hoạt tính ức chế MCF7 ... 80

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

<b>DANH MỤC CÁC CHỮ VIẾT TẮT</b>

ERM Enhanced replacementmethod

Phương pháp thay thế nâng cao

GA Genetic algorithm Thuật toán di truyền

GDP Guanosin diphosphate Nucleotid guanosin diphosphatGTP Guanosin triphosphate Nucleotid guanosin triphosphat

IC<small>50</small> Inhibitory concentration 50% Nồng độ ức chế 50% hoạt tính

<i>in vitro </i> Thí nghiệm trong ống nghiệm

<i>in silico </i> Thực hiện trên máy tính

MDs Molecular dynamicssimulation

MM/GBSA Molecular mechanics

generalized Born surface area

Diện tích bề mặt cơ học phân tửtheo lý thuyết Born tổng quátMM/PBSA Molecular mechanics Poisson

– Boltzmann surface area

Diện tích bề mặt cơ học phân tửtheo lý thuyết của Poisson –Boltzmann

PDB Protein Data Bank Ngân hàng dữ liệu protein

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

PLS Partial least squares Phương pháp bình phương tốithiểu từng phần

QSAR Quantitative structure –activity relationship

Mối liên quan định lượng giữacấu trúc và hoạt tính sinh học

RFE Recursive feature elimination Phương pháp oại bỏ đặc trưngđệ quy

RMSD Root mean square deviation Căn bậc hai độ lệch bình phươngtrung bình

RMSE Root mean square error Căn bậc hai sai số bình phươngtrung bình

RMSF Root mean square fluctuation Căn bậc hai dao động bìnhphương trung bình

ROC curve Receiver operatingcharacteristics curve

Đường cong đặc trưng hoạtđộng của bộ thu nhận

SASA Solvent accessible surfacearea

Diện tích bề mặt tiếp cận dungmôi

WHO World Health Organization Tổ chức Y tế thế giới

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

<b>DANH MỤC CÁC HÌNH</b>

Hình 1.1. Công thức chung của các dẫn chất chalcon. ... 3

Hình 1.2. Phản ứng ngưng tụ Claisen–Schmidt. ... 5

Hình 1.3. Cấu trúc và sự bất ổn định động học của vi ống. ... 7

Hình 1.4. Sáu vùng liên kết nhắm mục tiêu vi ống ở tubulin ... 9

Hình 1.5. Mơ hình docking cứng. ... 18

Hình 2.1. Cấu trúc 3D của protein 1SA0 ... 24

Hình 2.2. Vùng gắn kết giữa 2 đơn phân α và β-tubulin với phối tử đồng kếttinh DAMA-colchicin. ... 24

Hình 2.3. Quy trình xây dựng mơ hình 2D-QSAR. ... 27

Hình 2.4. Quy trình docking. ... 29

Hình 3.1. Công thức cấu tạo của 7 chất gây nhiễu được loại bỏ. ... 39

<i>Hình 3.2. Độ tương quan giữa giá trị hoạt tính sinh học dự đốn và giá trị hoạt</i>tính sinh học thực nghiệm trên tập xây dựng. ... 39

<i>Hình 3.3. Độ tương quan giữa giá trị hoạt tính sinh học dự đốn và giá trị hoạt</i>tính sinh học thực nghiệm trên tập đánh giá ngoại. ... 40

<i>Hình 3.4. Độ tương quan giữa giá trị hoạt tính sinh học dự đốn và giá trị hoạt</i>tính sinh học thực nghiệm trên cả tập dữ liệu. ... 40

Hình 3.5. Độ tương quan giữa giá trị hoạt tính sinh học dự đốn và giá trị hoạttính sinh học thực nghiệm trên cả tập xây dựng và tập đánh giá ngoại. ... 41

Hình 3.6. Độ tương quan giữa giá trị hoạt tính sinh học dự đốn và giá trị hoạttính sinh học thực nghiệm trên cả tập dữ liệu. ... 42

Hình 3.7. Độ tương quan giữa giá trị hoạt tính sinh học dự đốn và giá trị hoạttính sinh học thực nghiệm trên cả tập xây dựng ... 43

Hình 3.8. Độ tương quan giữa giá trị hoạt tính sinh học dự đốn và giá trị hoạttính sinh học thực nghiệm trên cả tập dữ liệu. ... 43

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

Hình 3.9. Tương tác giữa protein và phối tử đồng kết tinh trước (A) và sau (B)

tái gắn kết. ... 49

Hình 3.10. Sự gióng hàng DAMA-colchicin trước và sau tái gắn kết. ... 50

Hình 3.11. Kết quả đánh giá mơ hình docking theo đường cong ROC. ... 50

Hình 3.12. Kết quả docking 127 chalcon chọn lọc. ... 51

Hình 3.13. Tỷ lệ các chất gắn kết thành công trên tubulin theo khoảng điểm sốdocking. ... 51

Hình 3.14. Quy trình sàng lọc các chalcon. ... 58

Hình 3.15. Giá trị RMSD của protein theo thời gian của 10 chalcon. ... 62

Hình 3.16. RMSF của các acid amin trong quá trình MDs 100 ns. ... 63

Hình 3.17. Giá trị RMSD của phối tử theo thời gian của 10 chalcon tiềm năngtrong phức hợp với tubulin. ... 64

<b>Hình 3.18. Mật độ và tần suất liên kết hydro của phối tử C28 với tubulin trong</b>thời gian mô phỏng MDs 100 ns. ... 65

<b>Hình 3.19. Mật độ và tần suất liên kết hydro của phối tử C14 với tubulin trong</b>thời gian mơ phỏng MDs 100 ns. ... 66

<b>Hình 3.20. Mật độ và tần suất liên kết hydro của phối tử C16 với tubulin trong</b>thời gian mô phỏng MDs 100 ns. ... 67

<b>Hình 3.21. Mật độ và tần suất liên kết hydro của phối tử C4 với tubulin trong</b>thời gian mô phỏng MDs 100 ns. ... 67

<b>Hình 3.22. Mật độ và tần suất liên kết hydro của phối tử C13 với tubulin trong</b>thời gian mơ phỏng MDs 100 ns. ... 68

<b>Hình 3.23. Mật độ và tần suất liên kết hydro của phối tử E6 với tubulin trong</b>thời gian mô phỏng MDs 100 ns. ... 69

<b>Hình 3.24. Mật độ và tần suất liên kết hydro của phối tử E9 với tubulin trong</b>thời gian mô phỏng MDs 100 ns. ... 70

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

<b>Hình 3.25. Mật độ và tần suất liên kết hydro của phối tử E10 với tubulin trong</b>

thời gian mô phỏng MDs 100 ns. ... 71

<b>Hình 3.26. Mật độ và tần suất liên kết hydro của phối tử E7 với tubulin trong</b>

thời gian mơ phỏng MDs 100 ns. ... 72

<b>Hình 3.27. Số liên kết hydro của phối tử E4 với tubulin trong thời gian mô</b>

phỏng MDs 100 ns. ... 72

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<b>DANH MỤC CÁC BẢNG</b>

Bảng 1.1. Các phức hợp protein tubulin ở vùng colchicin. ... 9

Bảng 1.2. Các chỉ số và tiêu chí đánh giá khả năng dự đoán ở tập xây dựng 13Bảng 1.3. Các chỉ số và tiêu chí đánh giá khả năng dự đoán trên tập đánh giángoại. ... 16

Bảng 3.1. Bốn thông số mô tả được lựa chọn dựa theo phương pháp 1. ... 37

Bảng 3.2. Độ tương quan giữa các thơng số mơ tả tính bằng MOE. ... 37

Bảng 3.3. Sáu thông số mô tả được lựa chọn dựa theo phương pháp 2. ... 38

Bảng 3.4. Kết quả đánh giá nội. ... 39

Bảng 3.5. Kết quả đánh giá ngoại. ... 40

Bảng 3.6. Kết quả đánh giá mô hình QSAR ... 41

Bảng 3.7. Kết quả đánh giá mơ hình QSAR ... 42

Bảng 3.9. Kết quả dự đốn hoạt tính ức chế MCF7 của 3 mơ hình. ... 44

Bảng 3.10. Kết quả docking của 20 chalcon chọn lọc có điểm số docking tốtnhất ... 52

Bảng 3.11. Năm chất tiềm năng được sàng lọc từ tập chalcon nội bộ. ... 59

Bảng 3.12. Năm chất tiềm năng được sàng lọc từ tập chalcon tổ hợp. ... 60

Bảng 3.13. Các thông số đánh giá độ ổn định của protein trong phức hợp vớicác chất tiềm năng khi MDs 100 ns. ... 61

Bảng 3.14. Giá trị RMSD của các chalcon tiềm năng trong phức hợp. ... 64

<b>Bảng 3.15. Tần suất biểu hiện liên kết kỵ nước của phối tử C28 với tubulin</b>trong thời gian mô phỏng MDs 100 ns. ... 65

<b>Bảng 3.16. Tần suất biểu hiện liên kết kỵ nước của phối tử C14 với tubulin</b>trong thời gian mô phỏng MDs 100 ns. ... 66

<b>Bảng 3.17. Tần suất biểu hiện liên kết kỵ nước của phối tử C16 với tubulin</b>trong thời gian mô phỏng MDs 100 ns. ... 67

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<b>Bảng 3.18. Tần suất biểu hiện liên kết kỵ nước của phối tử C4 với tubulin trong</b>

thời gian mô phỏng MDs 100 ns. ... 68

<b>Bảng 3.19. Tần suất biểu hiện liên kết hydro của phối tử C13 với tubulin trong</b>

thời gian mô phỏng MDs 100 ns. ... 69

<b>Bảng 3.20. Tần suất biểu hiện liên kết hydro của phối tử E6 với tubulin trong</b>

thời gian mô phỏng MDs 100 ns. ... 70

<b>Bảng 3.21. Tần suất biểu hiện liên kết hydro của phối tử E9 với tubulin trong</b>

thời gian mô phỏng MDs 100 ns. ... 70

<b>Bảng 3.22. Tần suất biểu hiện liên kết hydro của phối tử E10 với tubulin trong</b>

thời gian mô phỏng MDs 100 ns. ... 71

<b>Bảng 3.23. Tần suất biểu hiện liên kết kỵ nước của phối tử E7 với tubulin trong</b>

thời gian mô phỏng MDs 100 ns. ... 72

<b>Bảng 3.24. Tần suất biểu hiện liên kết kỵ nước của phối tử E4 với tubulin trong</b>

thời gian mô phỏng MDs 100 ns. ... 73Bảng 3.25. Kết quả tính tốn năng lượng gắn kết tự do của phức hợp trong suốtquá trình MDs 100 ns. ... 73Bảng 4.1. So sánh các mơ hình QSAR đã xây dựng với các mơ hình khác trênthế giới. ... 90

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

<b>MỞ ĐẦU</b>

Ung thư là chứng bệnh nan y nguy hiểm của thế kỷ 21, với số lượng ngườimắc tăng nhanh, nhất là trong thời gian gần đây. Trong đó, ung thư vú là mộttrong những bệnh ác tính được chẩn đốn thường gặp nhất ở phụ nữ. Bất chấpnhững thành tựu đạt được trong những thập kỷ qua, ung thư vú vẫn là một vấnđề sức khỏe cộng đồng lớn.

Theo báo cáo của Tổ chức Y tế Thế giới (WHO) đến ngày 26/03/2021, trêntồn thế giới có 2,3 triệu phụ nữ được chẩn đoán mắc bệnh ung thư vú và685.000 ca tử vong trong năm 2020 khiến nó trở thành loại ung thư phổ biếnnhất thế giới<sup>1</sup>. Riêng tại Việt Nam, ung thư vú là một trong ba loại ung thư cótỉ lệ mắc nhiều nhất tại Việt Nam (21.555 ca) và là ung thư hàng đầu ở nữ giới(chiếm 25,8%)<small>2</small>.

Hiện nay nhiều nghiên cứu trên tồn thế giới đang được tiến hành để tìm raloại thuốc chống ung thư mới. Sự gia tăng liên tục về tỷ lệ mắc ung thư, nhiềutác dụng phụ của các loại thuốc đang sử dụng, cũng như sự phát triển đề khángcủa khối u đối với thuốc buộc phải nghiên cứu liên tục các phân tử mới với cấuhình hiệu quả an tồn hơn. Vì vậy, việc sàng lọc và tìm kiếm các hợp chất mớicó hoạt tính kháng ung thư là một việc làm hết sức thiết thực và cấp bách.

Chalcon là hợp chất flavonoid, thường được sử dụng cho việc thiết kế, tổnghợp nhiều hợp chất. Các báo cáo nghiên cứu cho thấy các dẫn xuất chalcon thểhiện được nhiều hoạt tính sinh học bao gồm: kháng viêm (Phrutıvorapongkulvà cộng sự, 2003)<sup>3</sup>, kháng oxy hóa (Christov và cộng sự, 2006)<sup>4</sup>, kháng khuẩn(Liaras và cộng sự, 2011)<sup>5</sup>, và đặc biệt là kháng ung thư (Ullah và cộng sự,2007)<small>6</small>. Chính vì những hoạt tính sinh học đa dạng mà các dẫn xuất chalconluôn thu hút được sự quan tâm của nhiều nhà hóa học cả trong và ngồi nước.

Theo nhiều cơng trình khoa học đã cơng bố, nhiều dẫn xuất chalcon đã chotác dụng ức chế sự tăng sinh, sự hình thành mạch và gây ra quá trình chết theo

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

chu trình của tế bào ung thư vú MCF7 như dẫn xuất chứa vòng pyrazol (MagdaF. Mohamed và cộng sự, 2014)<sup>7</sup>, dẫn xuất nitro và trifluoromethyl (FatimahHashim và cộng sự, 2018)<small>8</small>, dẫn xuất napthalen (Guangcheng Wang và cộngsự, 2020)<small>9</small>. Với những tiềm năng của chalcon trong điều trị ung thư vú, việcnghiên cứu tìm thêm nhiều dẫn chất chalcon mới có tác dụng sinh học tốt là hếtsức cần thiết.

Vi ống là thành phần quan trọng của tế bào nhân chuẩn và đóng vai trị quantrọng trong các chức năng của tế bào như duy trì hình thái tế bào, truyền tínhiệu, vận chuyển các bào quan, sự vận động của tế bào và nguyên phân. Vì vậyvi ống đã trở thành một trong những mục tiêu thuốc quan trọng nhất trong điềutrị ung thư. Các tác nhân nhắm mục tiêu vi ống có thể phá vỡ động lực học vàcấu trúc của vi ống, làm xáo trộn thêm sự hình thành trục phân bào, ngăn chặnchu kỳ tế bào ở kỳ giữa/kỳ sau của quá trình nguyên phân và gây ra cái chếttheo chương trình của tế bào<small>10</small>.

<b>Từ các cơ sở trên, nghiên cứu “Nghiên cứu 2D-QSAR trên dịng tế bào</b>

<b>MCF7 và mơ hình docking trên tubulin của các dẫn chất chalcon” được</b>

thực hiện với mục tiêu tìm ra các dẫn chất chalcon có khả năng ức chế MCF7để điều trị ung thư vú.

Để đạt được mục tiêu đã đề ra, nghiên cứu đề ra ba mục tiêu cụ thể sau:1. Xây dựng mơ hình 2D-QSAR nhằm xác lập mối liên quan giữa cácthơng số lý hóa đặc trưng và tác dụng kháng ung thư của các dẫn chất chalcon.2. Xây dựng mơ hình mơ tả phân tử docking nhằm đánh giá khả năng gắnkết của các dẫn chất chalcon trên tubulin.

3. Ứng dụng 2 mơ hình và mơ phỏng động lực học phân tử nhằm sàng lọctìm ra dẫn chất chalcon tiềm năng.

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

<b>CHƯƠNG 1. TỔNG QUAN TÀI LIỆU</b>

<b>1.1. Giới thiệu chung về chalcon1.1.1. Cấu trúc chung</b>

Chalcon là hợp chất flavonoid có chứa vịng, cấu trúc hóa học là diphenyl-2-propen-1-on tồn tại ở 2 cấu dạng là E hoặc Z, có hai vịng thơm(vịng A và B) được nối với nhau bằng mạch hở ba carbon không no hệ liênhợp α, β-carbonyl.

<i>1,3-Chalcon có hai đồng phân hóa học là đồng phân E và Z trong đó đồng phânE bền vững về mặt nhiệt động học hơn nên cấu hình E chiếm đa số trong các</i>

cấu hình chalcon được tìm thấy<sup>11</sup>.

<b>1.1.2. Các dẫn chất chalcon</b>

Hình 1.1. Cơng thức chung của các dẫn chất chalcon.

Các nhóm thế R, R’ trên vịng A, B có thể là CH<small>3</small>, OH, OCH<small>3</small>, isophenyl,…với các chalcon có nguồn gốc thiên nhiên hay NO<small>2</small>, các halogen,… trên cácchalcon tổng hợp.

Các chalcon có nguồn gốc tự nhiên thường là các monomer và đa dạng vềcấu trúc. Một số chalcon có khả năng chống ung thư được phân lập từ thiênnhiên như isoliquiritigenin, butein và isobavachalcon<small>11</small>.

Isoliquiritigenin (2’,4’,4-trihydroxychalcon) được biết là có tiềm năng điềutrị chống lại các bệnh ung thư khác nhau, bao gồm ung thư vú, ung thư ruột kết,ung thư đường tiêu hóa, ung thư phổi, ung thư buồng trứng, bệnh bạch cầu và

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

khối u ác tính<sup>12</sup>.

Isobavachalcon được tìm thấy trong các cây thuộc họ đậu Fabaceae và họDâu tằm Moraceae. Isobavachalcon hoạt động chống lại nhiều loại ung thưbằng cách nhắm mục tiêu vào con đường tín hiệu kinase điều hịa tín hiệu ngoạibào giúp chống tăng sinh khối u. Ngoài ra, isobavachalcon còn ức chế thụ thểestrogen alpha (ERα) và giảm biểu hiện kháng nguyên CD44, dẫn đến giảm đềkháng paclitaxel trong ung thư vú ER+<small>13</small>.

<b>1.1.3. Các phương pháp tổng hợp chalcon</b>

<i>Các hợp chất chalcon tồn tại ở 2 dạng trans và cis, và đồng phân trans ổn</i>

định hơn về mặt nhiệt động lực học, vì vậy nó là cấu hình chủ yếu giữa cácchalcon<sup>14</sup><b>. Các phương pháp được sử dụng trong quá trình tổng hợp khung</b>

chalcon (1,3-diphenyl-2-propen-1-on) gồm phản ứng ngưng tụ Claisen–Schmidt, phản ứng Heck, phản ứng cộng, phản ứng Sonogashira, phản ứngSuzuki–Miyaura, phản ứng qua trung gian chất xúc tác acid rắn,...<small>15,16</small>. Trongsố tất cả các phương pháp, phương pháp ngưng tụ Claisen–Schmidt là phươngpháp phổ biến nhất, thường được áp dụng để tổng hợp chalcon.

Phản ứng Claisen–Schmidt được tiến hành tương đối đơn giản khi cho dẫnchất acetophenon và benzaldehyd tác dụng với nhau ở nhiệt độ phòng hoặc gianhiêt đến 50<small>o</small>C với xúc tác là dung dịch hydroxyd kiềm hoặc natri ethoxyd(C<small>2</small>H<small>5</small>ONa) có nồng độ trong khoảng 10–60%. Sản phẩm tạo thành có chứa liên

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

kết đôi carbon-carbon không phụ thuốc vào độ phức tạp của cấu trúc của cácphân tử tham gia ngưng tụ.

Hình 1.2. Phản ứng ngưng tụ Claisen–Schmidt.

<b>1.1.4. Tác dụng sinh học</b>

Chalcon có cấu trúc flavonoid và có mặt ở khắp nơi trong nhiều sản phẩm tựnhiên. Chalcon có cấu trúc nhỏ và là chất nhận Michael, khiến chúng có khảnăng liên kết hoặc phản ứng với các phân tử sinh học khác nhau giúp chúng cótác dụng sinh học rất đa dạng. Các dẫn chất chalcon có tác dụng chống ung thư,chống viêm, chống đái tháo đường, chất chống oxy hóa, kháng khuẩn, khángnấm và chống sốt rét<small>11</small>.

<b>1.1.5. Ứng dụng trong lâm sàng</b>

Các dẫn chất chalcon đã chứng minh được tiềm năng sinh học rất lớn. Mộtsố ví dụ về các dẫn chất chalcon hiện đang được thử nghiệm trên lâm sàng làthuốc lợi tiểu Metochalcon và thuốc chống loét và bảo vệ niêm mạc nhầySofalcon<sup>17</sup>.

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

vài tháng. MCF7 và hai dòng tế bào ung thư vú khác là T-47D và 231, chiếm hơn hai phần ba tất cả các nghiên cứu báo cáo tóm tắt về các dịngtế bào ung thư. Các tế bào MCF7 bắt nguồn từ tràn dịch màng phổi, là dòng tếbào kém xâm lấn, được coi là có khả năng di căn thấp<small>18,19</small>.

<b>MDA-MB-1.2.2. Tubulin1.2.2.1. Vi ống</b>

Vi ống là những cấu trúc hình trụ dài rỗng giữa, khơng phân nhánh, đườngkính trung bình 25 nm, chiều dài thay đổi tuỳ tình trạng tế bào và có thể lên đếnvài µm. Vi ống có thể ở dạng tự do trong tế bào, vi ống thần kinh axon hay tạothành cấu trúc ổn định như trung tử, lông, roi. Vi ống có vai trị tạo thành thoivà sao phân bào kéo các nhiễm sắc thể về hai cực, vận tải nội bào, duy trì hìnhdạng của tế bào, tham gia hình thành, vận chuyển các bóng nhập bào, xuất bào,duy trì tính ổn định của màng sinh chất, tạo tính phân cực cho tế bào<small>20</small>.

<b>1.2.2.2. Tubulin và sự trùng hợp vi ống</b>

Vi ống có cấu tạo từ protein tubulin. Mỗi phân tử protein tubulin là một dị

<i>nhị tụ (heterodimer) gồm hai đơn phân (monomer) là α-tubulin và β-tubulin</i>

(kích thước 4 x 5 x 8nm, trọng lượng 100.000 – 120.000 đơn vị C) trùng phânthành nguyên sợi mảnh. α và β-tubulin có chung 40% chuỗi acid amin, tồn tạiở nhiều dạng isotype, trải qua một loạt các biến đổi sau dịch mã<small>21</small>. Mỗi đơnphân tubulin gắn với một phân tử guanosin triphosphat (GTP) giàu năng lượng.Trong α-tubulin (vị trí N), GTP khơng thể loại bỏ mà không làm biến tínhheterodimer, nhưng có thể trao đổi dễ dàng với GTP tự do trong β-tubulin (vịtrí E). Ngoài ra, cấu trúc của α và β-tubulin về cơ bản giống hệt nhau: một lõigồm hai phiến gấp β bao quanh bởi xoắn α. Một đơn phân có thể chia thành bamiền chức năng: đầu amino là vùng liên kết với nucleotid, miền trung gian lànơi gắn Taxol, đầu carboxy có thể liên kết với các protein vận chuyển.

Sự trùng hợp tubulin xảy ra trong pha G2, khi các nhiễm sắc thể co xoắn

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

chặt chuẩn bị cho nguyên phân, 13 protein tubulin sẽ xếp lại với nhau thànhvòng xoắn tạo nên thành vi ống dày 5 nm. Sự trùng hợp có tính thuận nghịchvà xảy ra với sự có mặt của ion Mg<small>2+</small> và GTP<small>22</small>. Sau khi hình thành, các vi ống

<i>này khơng bền. Chúng tồn tại trong trạng thái cân bằng, với các dimer </i>

GTP liên tục thêm vào đầu (+) của vi ống và thủy phân ở đầu (-) thành GDP. Sự cân bằng và kiểm soát chiều dài của các vi ống có vai trị quan trọngđối với các chức năng của chúng<small>23</small>.

tubulin-Hình 1.3. Cấu trúc và sự bất ổn định động học của vi ống<sup>10</sup>.

<b>1.2.2.3. Vai trò trong kháng ung thư</b>

Ung thư là tình trạng mất cân bằng giữa sự phân chia tế bào và sự chết tếbào, dẫn đến tăng sinh tế bào khơng kiểm sốt. Sự gia tăng này là một mục tiêuhấp dẫn và nhiều tiềm năng cho thiết kế thuốc kháng ung thư. Sự phát triển củacác phương pháp quan sát tế bào sống đã giúp làm rõ vai trò quyết định của cácvi ống trong quá trình phân bào. Trong q trình phân bào, thoi vơ sắc nối vớicác nhiễm sắc thể có cấu tạo từ các vi ống. Khi có mặt các chất ngăn cản sựtrùng hợp protein tubulin, thoi vơ sắc khơng thể hình thành dẫn đến rối loạn

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

phân chia nhiễm sắc thể: các nhiễm sắc thể bị mắc kẹt ở hai đầu trục chính, qtrình phân bào bị dừng lại ở kỳ giữa và gây ra sự chết tế bào theo chu trình. Tếbào ung thư tương đối nhạy cảm với các loại thuốc này hơn so với các tế bàobình thường là do sự phân chia tế bào nhanh và liên tục<small>20</small>. Vì vậy, vi ống đã trởthành một trong những mục tiêu thuốc quan trọng nhất trong điều trị ung thư.

<b>1.2.3. Các chất kháng ung thư tác dụng trên tubulin</b>

Nhiều dẫn chất tác động trên tubulin làm rối loạn cân bằng động của quátrình trùng hợp tubulin–vi ống dẫn đến ức chế sự hình thành thoi phân bào, tếbào dừng lại ở kỳ giữa, hình thành nhân đa bội ức chế sự phân bào của các tếbào ung thư.

Các chất này có thể được chia thành hai nhóm chính:

 Nhóm ức chế sự trùng hợp vi ống ở nồng độ cao, là tác nhân làm mất ổnđịnh vi ống gồm các vinca (vinblastin, vincristin), cryptophyin, halichondrin,estramustin, colchicin và combretastatin A-4.

 Nhóm kích thích sự trùng hợp, là tác nhân làm ổn định vi ống gồm cáctaxan (paclitaxel, docetaxel), epothilon, discodermolid, eleutherobin,sarcodictyin, laulimalid, rhazinalam và polyisoprenylbenzophenon<small>24</small>.

<b>1.2.4. Các vùng gắn kết trên tubulin</b>

Có 6 vùng gắn kết trên tubulin đã được tìm thấy, trong đó chỉ có 1 vùng trênα-tubulin là pironetin, cịn lại 5 vùng trên β-tubulin. Vị trí liên kết colchicinhiện nay đạt được nhiều sự quan tâm khi một lượng lớn phân tử nhỏ liên kếtvới colchicin được báo cáo với sự đa dạng cấu trúc và độ phức tạp phân tử củacác chất ức chế gắn kết ở vùng colchicin nhỏ hơn so với các chất gắn kết vớivùng taxan và vinca. Thêm vào đó, việc xem xét vùng colchicin như tác nhângây rối loạn mạch máu mà không phải là các tác nhân gây độc tế bào có thể làmgiảm các độc tính thứ cấp cũng như sự đề kháng đa thuốc như taxan và vincaalkaloid.

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

Hình 1.4. Sáu vùng liên kết nhắm mục tiêu vi ống ở tubulin (α-tubulin màube và β-tubulin màu xanh lam)<sup>10</sup>.

Tra cứu trên ngân hàng dữ liệu protein có 9 cấu trúc tubulin, mỗi cấu trúccó sự khác nhau cơ bản về phối tử có sẵn trong phức hợp và độ phân giải. Cáccấu trúc protein này được trình bày ở Bảng 1.1.

Bảng 1.1. Các phức hợp protein tubulin ở vùng colchicin.

GDP, GTP, Mg,CN2, HOS

<b>3E22: Phức hợp tubulin</b>

colchicin soblidotin

<i>Stathmin-like domain</i>

3,80 Å α-tubulin: chuỗi A, Cβ-tubulin: chuỗi B, DStathmin-4: chuỗi E

GDP, GTP, Mg ,LOC, TZT

<i>tubulin RB3 </i>

Stathmin-3,65 Å α-tubulin: chuỗi A, Cβ-tubulin: chuỗi B, D

GDP, GTP, Mg

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

<b>Mã PDB Độ phângiải</b>

E70, GDP, GTP,Mg

tubulin TN16 RB3

<i>Stathmin-like domain</i>

3,70 Å α-tubulin: chuỗi A, Cβ-tubulin: chuỗi B, DStathmin-4: chuỗi E

N16, GDP, GTP,Mg

tubulin T138067 RB3

<i>Stathmin-like domain</i>

3,60 Å α-tubulin: chuỗi A, Cβ-tubulin: chuỗi B, DStathmin-4: chuỗi E

T13, GDP, GTP,Mg

<b>1SA0: Phức hợp tubulin</b>

<i>colchicin Stathmin-likedomain</i>

3,58 Å α-tubulin: chuỗi A, Cβ-tubulin: chuỗi B, DStathmin-4: chuỗi E

4,10 Å α-tubulin: chuỗi A, Cβ-tubulin: chuỗi B, DStathmin-4: chuỗi E

GDP, Mg, GTP,Ca, LOC, IMD,

MES, PEGĐộ phân giải là thước đo mức độ chi tiết có trong mẫu nhiễu xạ và mức độ

</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">

chi tiết sẽ được nhìn thấy khi tính tốn bản đồ mật độ electron. Phức hợp phângiải tốt có giá trị độ phân giải càng thấp sẽ có chất lượng cao hơn. Dựa vào cấutrúc của các dẫn chất cần gắn kết với độ phân giải của phức hợp protein tiếnhành chọn ra phức hợp phù hợp để docking. Phức hợp 4O2B có độ phân giảithấp nhất tuy nhiên nghiên cứu lựa chọn xây dựng mơ hình docking dựa trênphức hợp có mã PDB là 1SA0.

<b>1.3. Phương pháp nghiên cứu mối liên quan định lượng giữa cấu trúc vàtác dụng</b>

<b>1.3.1. 2D-QSAR</b>

<i>QSAR (Quantitative structure-activity relationship) là nghiên cứu mối liên</i>

quan định lượng giữa cấu trúc và tác dụng sinh học, xác lập mối tương quangiữa các thông số đặc trưng cho cấu tạo, các tính chất lý hóa và tác dụng sinhhọc giữa các thông số đặc trưng cho cấu tạo, các tính chất lí hóa và tác dụngsinh học của một dãy chất. Mối tương quan này được thiết lập dưới dạng:

<i>- Hồi quy (Regression): kết quả được biểu thị dưới dạng phương trình hồi</i>

quy tuyến tính hoặc phi tuyến của các thông số mô tả với một hằng số.

<i>- Nhị phân (Binary): giả định kết quả thử nghiệm là giá trị nhị phân 1 hoặc 0</i>

đại diện cho có/khơng, ước tính khả năng một phân tử cho kết quả là 1<small>25</small>.Các tập chất được lựa chọn là các dẫn chất chalcon có hoạt tính đã được thửnghiệm thực nghiệm nên nghiên cứu này xây dựng mô hình QSAR dựa trên sựthiết lập dưới dạng hồi quy.

Hiện nay, để xây dựng mơ hình QSAR có 2 phương pháp chủ yếu là: phươngpháp phân tích cổ điển (2D-QSAR) và phân tích QSAR ba chiều (3D-QSAR).Nghiên cứu này được thực hiện nhằm mục tiêu xây dựng mơ hình 2D-QSAR.Thơng số mô tả 2D được phát triển bằng các nguyên tử và thông tin liên kếtphân tử, các thông số hóa lý như tương tác kỵ nước, tính khúc xạ, sự cho nhậnhydro, các hiệu ứng điện tử (hiệu ứng trường F, hiệu ứng cộng hưởng R hay

</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">

hằng số Hammett) thường được sử dụng.

Một số đại lượng hoạt tính sinh học thường được dùng như: IC<small>50</small>: nồng độức chế 50% hoạt tính; EC<small>50</small>: nồng độ 50% tác dụng tối đa; K<small>i</small>: hằng số ức chế...Các đại lượng này cần được chuyển đổi dưới dạng logarit thập phân nhưlog(1/IC<small>50</small>), log(1/EC<small>50</small>), log(1/K<small>i</small>) để có được các thơng số thích hợp chonghiên cứu QSAR.

Nghiên cứu này sử dụng giá trị log(1/IC<small>50</small>) hay pIC<small>50</small> của các dẫn chấtchalcon được thử nghiệm trên dòng tế bào MCF7 đã được công bố trong cácnghiên cứu tổng hợp trên thế giới.

<b>1.3.2. Phương pháp lựa chọn thông số mơ tả</b>

Cấu trúc hóa học có thể được mã hóa bởi một loạt các thơng số mơ tả nhưngchỉ nên lựa chọn một vài thông số phù hợp để xây dựng mơ hình vì:

 Lượng thơng số mơ tả đầu vào quá nhiều so với lượng phân tử khiến sốbậc tự do hiệu dụng lớn, mơ hình càng dễ biến đổi, độ tin cậy giảm.

 Càng nhiều thông số mơ tả thì độ lệch càng nhỏ nhưng phương sai cànglớn, làm giảm độ chính xác của mơ hình.

 Xây dựng mơ hình đơn giản hơn, diễn giải trở nên dễ dàng hơn.

 Tiết kiệm thời gian hơn so với phân tích hàng trăm thơng số mơ tả<small>25</small>.

<b>1.3.3. Phương pháp xây dựng mơ hình QSAR</b>

Mục đích của việc xây dựng mơ hình QSAR là xác định các thơng số tối ưuđể dự đốn hoạt tính sinh học trên một đích tác dụng cụ thể. Nghiên cứu này sửdụng phương pháp bình phương tối thiểu từng phần và phương pháp rừng ngẫunhiên để xây dựng mơ hình QSAR và so sánh mơ hình tạo ra từ 2 phương pháp.

<b>1.3.3.1. Phương pháp bình phương tối thiểu từng phần</b>

<i>Phương pháp bình phương tối thiểu từng phần (PLS – Partial least squares)</i>

được sử dụng nhằm mục đích xây dựng được phương trình hồi quy giữa pIC<small>50</small>

và các thông số mô tả. Phương pháp PLS là một trong những phương pháp cổ

</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27">

điển được sử dụng và xây dựng thành công nhiều mơ hình QSAR có khả năngdự đốn tốt. PLS có thể xử lý dữ liệu hiệu quả khi mà số lượng thông số mô tảnhỏ hơn hoặc lớn hơn số lượng dẫn chất.

<b>1.3.3.2. Phương pháp rừng ngẫu nhiên</b>

Mặc dù phương pháp PLS đã thành cơng xây dựng nhiều mơ hình QSAR cókhả năng dự đốn tốt, tuy nhiên, việc sử dụng phương pháp này vẫn còn nhiềuhạn chế. Một trong những lý do bắt nguồn từ việc PLS không thực sự phù hợpđể xử lý nhiều cơ chế hoạt động và q trình xây dựng mơ hình cần lặp lại nhiềulần để phân chia tập dữ liệu và chọn lựa các thơng số mơ tả phù hợp để dự đốn.

<i>Khơng như PLS, Rừng ngẫu nhiên (RF - Random Forest) là một phương pháp</i>

phân loại và hồi quy mới để dự đốn hoạt tính sinh học định lượng và phân loạidựa trên các thông số mô tả cấu trúc phân tử của các chất. RF có khả năng đề

<b>xuất các thơng số mô tả quan trọng với việc xây dựng mô hình QSAR cũng như</b>

đưa ra sự dự đốn về tính chính xác về khả năng dự đốn của mơ hình đượcxây dựng<sup>26</sup>.

<b>1.3.4. Phương pháp đánh giá1.3.4.1. Đánh giá nội</b>

Đánh giá nội được thực hiện để đánh giá sự phân chia tập dữ liệu và cácthơng số được lựa chọn có khả năng phù hợp với cấu trúc của các dẫn chất đượclựa chọn và có khả năng dự đốn tốt hay khơng.

Một mơ hình được xem là hiệu quả khi đáp ứng được cái tiêu chí được trìnhbày trong Bảng 1.2.

Bảng 1.2. Các chỉ số và tiêu chí đánh giá khả năng dự đoán ở tập xây dựng

</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28">

Sự tương quan giữa giá trị pIC<small>50 </small>dự đoán và giá trị pIC<small>50 </small>thựcnghiệm đượcbiểu diễn bằng hệ số tương quan R<sup>2</sup> có giá trị nằm trong khoảng [0;1]. Mơ hìnhđược xem là có khả năng dự đốn tốt khi R<small>2 </small>≥ 0,5<small>26</small>.

<i>Căn bậc hai của sai số bình phương trung bình (root mean square error </i>

-RMSE) được sử dụng để đánh giá chất lượng dự đốn của mơ hình. Mơ hìnhchấp nhận khi RMSE ≤ 0,5, giá trị RMSE cảng nhỏ càng tốt. Giá trị RMSE >0,5 phản ánh khả năng dự đốn kém chính xác của mơ hình, thậm chí khi hệ sốtương quan R<small>2 </small>≥ 0,7.

Giá trị RMSE được tính theo cơng thức:

𝑅𝑀𝑆𝐸 = √∑(𝑦<sub>𝑜𝑏𝑠</sub> − 𝑦<sub>𝑝𝑟𝑒𝑑</sub>)<small>2𝑛</small>

<i>Một mơ hình được coi là tốt (fit) nếu giá trị lỗi trên tập xây dựng (trainingset) và giá trị lỗi trên tập đánh giá ngoại (test set) đều thấp. Nếu giá trị lỗi trêntập xây dựng cao nhưng tập đánh giá ngoại lại thấp thì mơ hình bị underfitting</i>

(chưa khớp). Ngược lại khi giá trị lỗi trên tập xây dựng thấp nhưng tập đánh

<i>giá ngoại lại cao, mơ hình bị overfitting (q khớp). Overfitting sẽ dẫn đến dự</i>

đốn nhầm nhiễu, chất lượng mơ hình khơng cịn tốt nữa. Dữ liệu kiểm tra ngoạiđược giả sử là không biết trước và khơng dùng để xây dựng mơ hình. Vì vậy,để biết được chất lượng của mơ hình với dữ liệu chưa biết trước, một tập đánh

<i>giá (validation set) được trích ra từ tập xây dựng. Nếu lấy quá nhiều dữ liệu</i>

trong tập xây dựng để đánh giá, phần cịn lại sẽ khơng đủ để xây dựng mơ hình.Ngược lại, khi tập đánh giá quá nhỏ có thể xảy ra overfitting.

<i>Để giải quyết vấn đề này, thực hiện đánh giá chéo (cross-validation). Đánh</i>

giá chéo là một cải tiến của phương pháp trên, với lượng dữ liệu trong tập đánhgiá nhỏ nhưng chất lượng mơ hình được đánh giá trên nhiều tập đánh giá khác

<i>nhau. Một cách thường được sử dụng là kỹ thuật đánh giá chéo k lần (k-fold</i>

</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">

<i>cross validation). Chia tập xây dựng ra k tập con khơng giao nhau, kích thước</i>

gần bằng nhau. Tại mỗi lần kiểm thử, một trong số k tập con được lấy ra làmtập đánh giá. Mơ hình sẽ được xây dựng dựa vào hợp của (k–1) tập con cịn lại.Mơ hình cuối được xác định dựa trên trung bình cộng các giá trị lỗi trên tập xâydựng và tập đánh giá. Thường chọn k nhỏ nhất là 5 và lớn nhất là số lượng phần

<i>tử trong tập xây dựng, tức mỗi tập con có đúng một phần tử, gọi là out (LOO – bỏ một ra) – một trong những kỹ thuật đánh giá nội phổ biến nhất.Thông số đại diện do đánh giá này là Q<small>2</small>. Mô hình chấp nhận được khi Q<small>2</small></i> ≥0,5<small>26</small>.

leave-one-𝑄<sup>2</sup> = 1 −<sup>∑</sup> <sup>(𝑦</sup><sup>𝑜𝑏𝑠</sup> <sup>− 𝑦</sup><sup>𝑝𝑟𝑒𝑑</sup><sup>)</sup><small>2𝑛</small>

∑<small>𝑛</small> (𝑦<sub>𝑜𝑏𝑠</sub> − 𝑦̅<sub>𝑝𝑟𝑒𝑑</sub>)<small>2𝑖=1</small>

<i>Trong đó: y<small>pred</small></i> là giá trị pIC<small>50</small><i> dự đốn từ mơ hình, y<small>obs </small></i>là giá trị pIC<small>50</small> thựcnghiệm, 𝑦̅<sub>𝑝𝑟𝑒𝑑</sub> là giá trị pIC<small>50</small> dự đoán trung bình trên tập xây dựng.

Ngồi ra, khi xây dựng mơ hình, sẽ có một vài chất có độ lệch chuẩn cao sovới giá trị trung bình của tồn tập dữ liệu và được xem là những chất có giá trịbất thường. Thông số được dùng cho đánh giá này là Z-SCORE. Một chất cóZ-SCORE lớn (≥ 2,0) có khả năng cao nằm ngoài đường thẳng hồi quy và đượcgọi là các chất nhiễu và được loại bỏ để xây dựng mơ hình dự đốn trên tập xâydựng tốt hơn<sup>28</sup>.

Z − SCORE = <sup>∑</sup> <sup>|𝑦</sup><sup>𝑜𝑏𝑠</sup> <sup>− 𝑦</sup><sup>𝑝𝑟𝑒𝑑</sup><sup>|</sup><small>𝑛</small>

</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30">

học của các chất thuộc tập đánh giá ngoại (các chất không thuộc tập xây dựng).Để đánh giá khả năng dự đốn của mơ hình, Roy và Paul đã đề xuất chỉ số 𝑟<sub>𝑚</sub><small>2</small>và được tính tốn dựa trên phương trình<small>29</small>:

𝑟<sub>𝑚</sub><sup>2</sup> = 𝑟<sup>2</sup>(1 − √𝑟<small>2</small>− 𝑟<sub>𝑜</sub><small>2</small>)

Trong đó: 𝑟<sub>𝑜</sub><small>2</small> là hệ số tương quan giữa giá trị thực nghiệm và giá trị dự đoánkhi hệ số chắn bằng 0.

𝑟<sub>𝑚</sub><sup>2</sup><i> được xây dựng với trục y là các giá trị thực nghiệm và trục x là các giá trị</i>

dự đoán. Một thơng số ngược lại 𝑟′<sub>𝑚</sub><small>2</small> <i> có trục y là các giá trị dự đoán và trục x</i>

là các giá trị thực nghiệm. Hai thông số này khác nhau trừ khi dự đốn hồnhảo, điều này gần như khơng thể xảy ra. Vì vậy, giá trị khác biệt giữa hai thôngsố này cũng dùng để đánh giá khả năng dự đốn của mơ hình:

∆𝑟<sub>𝑚</sub><sup>2</sup> = |𝑟<sub>𝑚</sub><sup>2</sup> − 𝑟<sup>′</sup><sub>𝑚</sub><sup>2</sup> |

Theo Roy, mơ hình chấp nhận được khi 𝑟̅̅̅ ≥ 0,5 và ∆𝑟<sub>𝑚</sub><small>2</small> <sub>𝑚</sub><small>2</small> ≤ 0,2<sup>30</sup>.

Ngoài ra, Golbraikh và Trospha cũng đề xuất các chỉ số khác để đánh giánhư độ dốc k và k’ của phương trình hồi quy giữa giá trị thực nghiệm và giá trịdự đoán và ngược lại. k và k’ nằm trong khoảng [0,85; 1,15] thì mơ hình QSARđã xây dựng được xem là có khả năng dự đốn tốt<small>31</small>.

Bảng 1.3. Các chỉ số và tiêu chí đánh giá khả năng dự đốn trên tập đánhgiá ngoại.

</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">

<b>1.4. Phương pháp docking</b>

Docking là phương pháp đưa cấu trúc của một chất (ở dạng 3D) vào trungtâm tương tác với mục tiêu phân tử (thụ thể, enzym hay các protein, DNA) vàtính tốn các giá trị tương tác để đánh giá khả năng tương tác của chất đó vớimục tiêu phân tử. Mục đích của docking là xác định một cấu dạng tối ưu nhấtcho phối tử (phân tử hay ion liên kết trực tiếp với trung tâm hoạt động được gọilà phối tử) và dự đốn chính xác hoạt động của phối tử để năng lượng tự do củaphức hợp mục tiêu phân tử - phối tử là nhỏ nhất.

Docking có vai trị dự đốn ái lực và hoạt tính của các dược chất đối vớiprotein, dự đoán tâm hoạt động và vị trí, cấu dạng thuận lợi của phối tử thamgia phản ứng từ đó dự đốn khả năng hoạt hóa hoặc ức chế một protein.

<b>1.4.1. Mơ hình tương tác giữa mục tiêu và phối tử</b>

Mơ hình này thường được xây dựng bởi những tương tác đặc biệt như: liênkết hydrogen, liên kết ion, liên kết kỵ nước. Mỗi nhóm tương tác được biểudiễn bởi loại tương tác và hình dạng tương tác (trung tâm + bề mặt).

Điểm số docking hay mức năng lượng tự do dùng để đánh giá mức nănglượng tự do trong phức hợp giữa phối tử và protein mục tiêu. Mức năng lượngtự do càng thấp thì khả năng liên kết giữa phối tử và receptor càng cao, liên kếttạo thành sẽ càng bền vững. Vậy nên mức docking score (điểm số docking)

<i>càng thấp cũng cho thấy hoạt tính in silico càng cao thể hiện ở độ bền liên kết</i>

phối tử và thụ thể<small>32</small>.

<b>1.4.2. Thuật toán docking</b>

Docking tìm ra các tương tác giữa phân tử hợp chất và điểm tác động theo 3hướng khác nhau:

<i>– Docking cứng: xem hợp chất và protein đều là những phân tử cứng</i>

(phương pháp này bỏ qua tính quan trọng của sự linh động).

<i>– Docking bán linh động: xem hợp chất là phân tử linh động (phương pháp</i>

</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32">

này được sử dụng phổ biến).

<i>– Docking linh động hoàn toàn: xem cả hợp chất và protein đều linh động,</i>

tuy nhiên phương pháp này tính tốn rất phức tạp, đòi hỏi phải so sánh với cácphương pháp khác<small>33</small>.

<b>1.4.2.1. Docking cứng</b>

Phối tử được xem là một cấu trúc cứng nhắc trong các docking. Chỉ quantâm đến độ tự do của sự tịnh tiến và quay của phối tử. Phiên bản đầu tiên củathuật toán DOCK xem docking ở thể cứng nhắc và được thiết kế để xác địnhcác phân tử với một mức độ cao của hình dạng bổ sung cho vị trí gắn protein.

Hình 1.5. Mơ hình docking cứng: Các phần của phối tử sắp xếp vào vị tríphù hợp trong các quả cầu xếp chồng lên nhau ở vùng tác động<small>31</small>.

Giai đoạn đầu tiên của phương pháp DOCK liên quan đến việc xây dựng mộthình ảnh giả định các vị trí liên kết chứa một loạt các hình cầu chồng chéo cóbán kính khác nhau, xuất phát từ bề mặt phân tử của protein.

Phối tử được sử dụng làm trung tâm mặt cầu sao cho khoảng cách giữa cácnguyên tử tương đương với khoảng cách giữa các trung tâm hình cầu tươngứng. Cấu tạo phối tử sau đó được định hướng vào các vùng liên kết. Sau khikiểm tra để đảm bảo rằng khơng có sự tương tác về không gian không thể chấp

</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33">

nhận, tiếp theo là chấm điểm. Kiểu tương tác mới được hình thành bằng cáchthay đổi các kiểu sắp xếp nguyên tử của phối tử vào các trung tâm hình cầu.Quy trình liên tục cho đến khi tất cả các tương tác được xem xét<small>31</small>.

<b>1.4.2.2. Docking bán linh động</b>

Phương pháp này đặt các phối tử trong khu vực mục tiêu tác động, sau đóđịnh hướng các phối tử này sao cho các nhóm chức có thể tạo thành liên kếtcủa mục tiêu tác động. Có 2 thuật tốn được áp dụng trong docking đó là thuật

<i>tốn xây dựng lớn dần (Incremental construction algorithm) và thuật toán xácđịnh vị trí đặt mảnh cơ sở (Base placement algorithm).</i>

Với việc sử dụng thuật tốn xây dựng lớn dần, chương trình docking sẽ phânphối tử thành từng mảnh cứng, docking các mảnh cứng vào túi gắn kết củaprotein, và dần dần lắp ráp lại với nhau để thu được phối tử. Chương trình sẽthực hiện tính tốn cách gắn kết để thu được cấu dạng bền nhất.

Với việc sử dụng thuật tốn xác định vị trí đặt mảnh cơ sở, dựa vào phép tam

<i>giác phân (triangle matching) để tìm vị trí đặt mảnh cơ sở vào khoang bằng</i>

cách gắn các bộ ba điểm trên phối tử với ba điểm riêng biệt trong khoang gắn

<b>kết, khi các trung tâm và bề mặt bổ sung nhau được phủ lên nhau thì sự gắn kết</b>

được tạo thành. Sau mỗi bước lặp, một cấu dạng bền nhất hay có mức nănglượng thấp nhất sẽ được lựa chọn và ghi lại và chương trình docking sẽ tiếnhành tổng hợp và đưa ra những cấu dạng cũng như vị trí gắn kết bền nhất<small>32</small>.

<b>1.4.3. Đánh giá mơ hình docking</b>

Hiện nay có khá nhiều phần mềm về docking được sử dụng và sẽ có sự saikhác giữa điểm số docking giữa các phần mềm do sự khác nhau về thuật toán.Vậy nên để đánh giá độ tin cậy của một mơ hình docking trong một phần mềm,người ta thường đánh giá độ sai lệch khi tái gắn kết với phối tử đồng kết tinhbằng phần mềm và khả năng phân loại các chất có hoạt tính hoặc khơng có hoạt

<i>tính dựa trên đường cong ROC (Receiver Operating Characteristics curve)</i><small>34</small>.

</div><span class="text_page_counter">Trang 34</span><div class="page_container" data-page="34">

<b>1.4.4. Đánh giá kết quả docking</b>

Kết quả docking phân tử thường được đánh giá dựa trên điểm số dockinghay ái lực gắn kết giữa phối tử và mục tiêu tác động. Ái lực gắn kết càng âm,khả năng gắn kết càng mạnh. Tuy nhiên, đánh giá dựa trên điểm số docking làkhông đủ. Điều quan trọng trong thiết kế thuốc là các phối tử cần phải gắn kếtvới protein thông qua sự tương tác với các acid amin quan trọng quyết địnhhoạt tính sinh học của protein, vì vậy cần phải quân tâm đến tương tác giữaprotein và phối tử.

<b>1.5. Mô phỏng động lực học phân tử</b>

<b>1.5.1. Khái niệm mô phỏng động lực học phân tử</b>

<i>Mô phỏng động lực học phân tử (MDs - Moleculalr dynamics simulation) là</i>

sự mô phỏng sự tương tác của các nguyên tử hay phân tử dựa trên các định luậtvật lý cổ điển trên mơ hình máy tính, giúp giải thích được bản chất vi mơ củamối quan hệ giữa cấu trúc đến phân tử, trong khoảng thời gian mô phỏng gầnvới thời gian sinh học<sup>35</sup>. Ứng dụng cơ bản của MDs là đánh giá tính linh độngcủa các vùng khác nhau của phân tử sinh học. Trong lĩnh vực khám phá thuốc,MDs đặc biệt có giá trị trong việc tối ưu hóa các chất khởi nguồn, thiết kế thuốcnhắm vào các enzym tín hiệu (signaling receptor) và có thể hữu ích trong việcsàng lọc ảo<sup>36</sup>. Hiện nay, có nhiều phần mềm hỗ trợ phổ biến gồm GROMACS,NAMD, AMBER, CHARMM, Desmond, OpenMM... GROMACS là mộttrong những phần mềm mã nguồn mở và miễn phí được sử dụng rộng rãi đểMDs cho các cấu trúc sinh học, cơng cụ tính tốn, chuẩn bị và phân tích. Ngồira, GROMACS có thể xuất kết quả mô phỏng ở các định dạng tệp phổ biến đọcđược nguyên bản hoặc thông qua một phần mềm khác như VMD.

<b>1.5.2. Đánh giá MDs</b>

Một số thông số quan trọng có thể được sử dụng để đánh giá độ ổn định củaprotein và phối tử trong phức hợp trong suốt q trình mơ phỏng là RMSD,

</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35">

RMSF, SASA và Rg.

Công thức và ý nghĩa của các tham số được thể hiện như sau:

<i>- Căn bậc hai độ lệch bình phương trung bình (RMSD – Root mean squaredeviation): được dùng để đánh giá độ ổn định của phối tử và protein trong điều</i>

kiện mô phỏng thông qua việc so sánh mức độ biến đổi vị trí giữa protein hoặcphối tử) tại từng thời điểm trong quá trình MDs so với thời điểm ban đầu (0ns), thường dựa trên sự dao động của carbon xương sống (backbone) củaprotein và các phân tử nặng của phối tử. Cấu trúc được xem là ổn định và có ýnghĩa khi biên độ dao động của giá trị RMSD của protein và của phối tử trongphức hợp < 2,0 Å.

<i>- Căn bậc hai dao động bình phương trung bình (RMSF - Root mean squarefluctuation): được dùng để đánh giá sự linh động của acid amin trong protein.</i>

Khác biệt chính giữa RMSD và RMSF là RMSF cho giá trị trung bình của sựdao động của từng acid amin trong tổng thời gian mô phỏng. Giá trị RMSFcàng cao thể hiện sự linh động và ngược lại, khi giá trị RMSF thấp cho thấyphối tử dao động ổn định so với vị trí trung bình trong thời gian mơ phỏng<small>37</small>.Acid amin có giá trị RMSF > 2,0 Å được xem là linh động<small>38</small>.

<i>- Bán kính quay (Rg – Radius of gyration): thể hiện mức độ nén của protein.</i>

Quá trình duỗi xoắn do sự kém ổn định của protein trong quá trình MDs sẽđược ghi nhận bởi sự thay đổi của bán kinh quay<small>39</small>.

<i>- Diện tích bề mặt tiếp cận dung mơi (SASA – Solvent accessible surface</i>

duỗi xoắn, các cấu trúc bên trong của protein được mở ra và tiếp xúc với dungmôi của môi trường, giá trị SASA tăng.

- Tần suất tạo liên kết hydro: được đánh giá dựa trên sự tạo thành liên kếthydro giữa phối tử và protein trong suốt q trình mơ phỏng.

- Năng lượng gắn kết tự do (binding free energy), ký hiệu là ∆G<small>gắn kết </small>được

</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36">

<i>sử dụng để đánh giá độ bền của liên kết. Trong đó, MM/GBSA (Molecularmechanics generalized born surface area) và MM/PBSA (Molecularmechanics Poisson – Boltzmann surface area) là những phương pháp phổ biến</i>

để ước tính năng lượng tự do của liên kết giữa các phân tử nhỏ (phối tử) vớicác đại phân tử sinh học (protein). Các phương pháp này chỉ có tính trung gianvề độ chính xác do dựa trên kết quả mô phỏng động lực học phân tử phức hợpprotein và phối tử<sup>41</sup>.

<b>1.6. Các nghiên cứu liên quan</b>

- Wan M. Khairul và các cộng sự thiết kế, tổng hợp và thử nghiệm hoạt tínhmột số dẫn chất chalcon nhằm khảo sát ảnh hưởng giữa mật độ electron tronghệ liên hợp π và các hoạt động sinh học bằng cách thế alkoxy bằng các nhómthế hút điện tử khác nhau, cụ thể là nitro, cyano và trifluoromethyl<small>42</small>.

- Silvia Marquina và cộng sự đã thiết kế, tổng hợp và thiết lập QSAR củadẫn chất 2’-hydroxy-4’-alkoxy chalcon có nhóm thế ở vị trí số 3, cho thấychúng có gây ra độc tính chọn lọc trên dịng tế bào PC-3, cũng như làm tănghoạt hóa caspase-3 và các nhóm thế hút điện tử trên vịng A làm giảm hoạt tínhchống ung thư của dẫn chất<small>43</small>.

- Luis Bustos và cộng sự nghiên cứu khả năng gây độc tế bào của các dẫnchất chalcon tổng hợp và tiến hành docking và thử hoạt tính, kết quả là có 2dẫn chất chalcon ức chế MCF7 tốt hơn so với thuốc đối chiếu là doxorubicinvà sự có mặt nhóm hydroxyl ở vịng B là cần thiết cho để độc tính tế bào vàmethoxy ở vòng A giúp tăng tương tác kỵ nước giữa nhóm prenyl với acid aminLeu67 và Thr56<sup>44</sup>.

</div><span class="text_page_counter">Trang 37</span><div class="page_container" data-page="37">

<b>CHƯƠNG 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU</b>

<b>2.1. Đối tượng nghiên cứu2.1.1. Cơ sở dữ liệu</b>

Cấu trúc hóa học và hoạt tính kháng ung thư của các dẫn chất chalcon đượctổng kết từ các tài liệu tham khảo. Tổng cộng 127 dẫn chất chalcon với giá trịIC<small>50</small> được xác định bằng phương pháp khảo sát hoạt tính độc tế bào trên dòngtế bào ung thư vú MCF7.

– 12 dẫn chất có khung cấu trúc benzimidazol chalcon từ nghiên cứu cơngbố năm 2019 của Hsieh (Khoa Hóa học, trường Đại Học Thanh Hoa, TrungQuốc) và cộng sự<sup>45</sup>.

– 53 dẫn chất có khung cấu trúc methoxy chalcon, 1-methylpiperidin-4-ylchalcon, 1-ethylpiperidin, 1-methylpiperazin và 4-91-piperidinyl) piperidin từnghiên cứu công bố năm 2009 của Xiaoling Liu và Mei-Lin Go (Khoa Dược,Đại học Quốc gia Singapore)<small>46</small>.

– 11 dẫn chất có khung cấu trúc 2,4,5-trimethoxy chalcon (vịng B) từ nghiêncứu cơng bố năm 2013 của Suvarna Shenvi (Hiệp hội nghiên cứu khoa họcVittal Mallya, Ấn Độ) và cộng sự<small>47</small>.

– 11 dẫn chất có khung cấu trúc phenylpropiophenon từ nghiên cứu cơng bốnăm 2013 của Branka (Đại học Belgrade, Serbia) và cộng sự<small>48</small>.

– 18 dẫn chất 2,3,4,4’-chalcon từ nghiên cứu công bố năm 2018 của SuvithaSya (Đại học Putra Malaysia, Malaysia) và cộng sự<small>49</small>.

– 22 dẫn chất 2’-hydroxyl-4’,6’-dimethoxy chalcon từ nghiên cứu công bốnăm 2018 của Addila Abu (Đại học Pahang, Malaysia) và cộng sự<small>50</small>.

<b>2.1.2. Mục tiêu tác động</b>

Cấu trúc phức hợp tubulin và phối tử đồng kết tinh DAMA-colchicin deacetyl-N-(2-mercaptoacetyl)-colchicin) có mã PDB là 1SA0 được tải về dướidạng *.pdb từ Protein Data Bank (rcsb.org) như Hình 2.1.

</div><span class="text_page_counter">Trang 38</span><div class="page_container" data-page="38">

(N-Vùng gắn kết colchicin nằm giữa 2 chuỗi A và B và hơi lệch hơn về phíachuỗi B. Các chuỗi C, D và E sẽ được loại bỏ để dễ dàng quan sát hơn.

Hình 2.1. Cấu trúc 3D của protein 1SA0 (độ phân giải 3,58 Å).

Hình 2.2. Vùng gắn kết giữa 2 đơn phân α và β-tubulin với phối tử đồngkết tinh DAMA-colchicin<sup>29</sup>.

(A) Chuỗi α-tubulin màu xanh cyan ở bên phải, chuỗi β-tubulin cómàu xanhđậm ở bên trái. DAMA-colchicin đã được thể hiện ở dạng que, trong đó màu

xanh lục, xám, xanh lam, đỏ và vàng tương ứng là các nguyên tử carbon,

</div><span class="text_page_counter">Trang 39</span><div class="page_container" data-page="39">

hydro, nitơ, oxy và lưu huỳnh. (B) Cấu trúc của DAMA-colchicin.Vùng gắn kết colchicin là một túi gồm có ba vùng:

 Vùng 1 nằm ở tiểu đơn vị α và được bao bọc bởi các acid amin Asn101α,Ser178α, Val181α…

 Vùng 2 là túi kỵ nước phụ chủ yếu nằm ở tiểu đơn vị β và được bao quanhbởi Cys241β, Leu248β, Ala250β, Leu255β, Ala316β, Lys352β...

 Vùng 3 được chôn sâu hơn trong tiểu đơn vị β được hình thành bởi Ile4β,Asn167β, Phe169β, Tyr202β, Val238β,…

Trong đó, vùng 2 được công nhận là khoang chứa hầu hết các cấu trúc củaphối tử thường có ít nhất hai hệ thống thơm riêng biệt.

Vùng gắn kết colchicin được cho là hoạt động theo cơ chế chung thông qualiên kết với vị trí colchicin trên tubulin, vậy nên các acid amin gắn kết vớicolchicin được xem là các acid amin quan trọng, góp phần vào ái lực liên kếtgiữa các chất với tubulin.

<b>2.2. Phương pháp nghiên cứu2.2.1. Các phần mềm sử dụng</b>

 ChemDraw 19.0 của PerkinElmoer: thiết kế cấu trúc 2D của phân tử.

 MOE 2015.10 của Chemical Computing Group: chuẩn bị cơ sở dữ liệu,trích xuất các thơng số mơ tả, xây dựng mơ hình QSAR, tối thiểu hóa nănglượng, xem tương tác giữa phối tử và protein.

 Microsoft Excel 2010 của Microsoft: xử lý bảng tính, lọc thơ các thơng số,vẽ biểu đồ.

 Open Babel GUI 2.4.1: chuyển đổi định dạng dữ liệu.

 Rapidminer 9.6 của Rapidminer Studio: lọc các thông số mô tả, chuẩn hóadữ liệu từ 0 đến 1,0, loại bỏ các thơng số có độ tương quan lớn hơn 0,9.

 Weka Explorer của Weka 3.8.4: chọn các thông số tốt nhất.

 Autodock Vina 1.2.3 và Autodock tool 1.5.7: chuẩn bị protein và khoang

</div><span class="text_page_counter">Trang 40</span><div class="page_container" data-page="40">

gắn kết, docking các phối tử với mục tiêu tác động.

 DUD-E decoy: xây dựng tập chất khơng hoạt tính để đánh giá tính phânloại của mơ hình docking.

 Discovery Studio 2021: xem tương tác 2D giữa phối tử và protein.

 PLIP: xem liên kết hydro và liên kết kỵ nước giữa phối tử và protein.

 GROMACS 2022.4: mô phỏng động lực học phân tử, trích xuất khunghình và phân tích kết quả.

 VMD 1.9.4: xác định tần suất liên kết hydro và số liên kết hydro tạo thànhtheo thời gian.

 gmx_MMPBSA 1.6.3: tính tốn năng lượng gắn kết tự do theo mơ hìnhMM/GBSA và năng lượng đóng góp của từng vị trí acid amin.

<b>2.2.2. Phương pháp xây dựng mơ hình QSAR</b>

<b>Quy trình xây dựng mơ hình QSAR gồm 6 bước, được tóm tắt theo Hình 2.3.</b>

<b>2.2.2.1. Chuẩn bị cơ sở dữ liệu</b>

Thu thập và chọn lọc cơ sở dữ liệu được 127 chất đã đánh giá hoạt tính khángung thư bằng phương pháp khảo sát hoạt tính độc tế bào trên dịng tế bào ungthư vú MCF7. Các giá trị IC<small>50</small> được chuyển thành pIC<small>50</small> = -logIC<small>50</small>. Lập bảnghoạt tính sinh học trên Excel và vẽ cấu trúc 2D của 127 chất bằng ChemDrawtheo chuẩn ACS 1996.

<b>2.2.2.2. Tính các thơng số mơ tả</b>

Nhập dữ liệu vào phần mềm MOE. Tiến hành tối thiểu hóa năng lượng nhờcơng cụ Energy Minimize trong MOE. Lưu dữ liệu dưới dạng *.mdb gồm cơngthức hố học 3D, tên mã hóa của chất và chỉ số pIC<small>50</small>.

Tính tốn thơng số mơ tả phân tử bằng cơng cụ Calculate Descriptors trongMOE 2015.10 tính được 206 thơng số mơ tả phân tử 2D.

<b>2.2.2.3. Phân chia tập hợp</b>

Tập dữ liệu được phân chia ngẫu nhiên để đảm bảo khách quan: Phân chia

</div>

×