Tải bản đầy đủ (.pdf) (99 trang)

sàng lọc in silico các hợp chất tự nhiên tiềm năng được phân lập tại bộ môn dược liệu đại học y dược tp hồ chí minh ức chế trên protein e1 của hpv 18 human papilloma virus

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.67 MB, 99 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ

<b>ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH</b>

<b>ĐÀO THỊ HỒNG LOAN</b>

<i><b>SÀNG LỌC IN SILICO CÁC HỢP CHẤT TỰ NHIÊN TIỀM</b></i>

<b>NĂNG ĐƯỢC PHÂN LẬP TẠI BỘ MÔN DƯỢC LIỆU – ĐẠIHỌC Y DƯỢC TP. HỒ CHÍ MINH ỨC CHẾ TRÊN PROTEIN</b>

<b>E1 CỦA HPV 18 (HUMAN PAPILLOMA VIRUS)</b>

<b>LUẬN VĂN THẠC SĨ DƯỢC HỌC</b>

<b>THÀNH PHỐ HỒ CHÍ MINH - NĂM 2023</b>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ

<b>ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH</b>

<b>ĐÀO THỊ HỒNG LOAN</b>

<i><b>SÀNG LỌC IN SILICO CÁC HỢP CHẤT TỰ NHIÊN TIỀM</b></i>

<b>NĂNG ĐƯỢC PHÂN LẬP TẠI BỘ MÔN DƯỢC LIỆU – ĐẠIHỌC Y DƯỢC TP. HỒ CHÍ MINH ỨC CHẾ TRÊN PROTEIN</b>

<b>E1 CỦA HPV 18 (HUMAN PAPILLOMA VIRUS)</b>

<b>NGÀNH: CÔNG NGHỆ DƯỢC PHẨM VÀ BÀO CHẾ THUỐCMÃ SỐ: 8720202</b>

<b>LUẬN VĂN THẠC SĨ DƯỢC HỌC</b>

<b>NGƯỜI HƯỚNG DẪN KHOA HỌCPGS. TS. NGUYỄN THỤY VIỆT PHƯƠNG</b>

<b>THÀNH PHỐ HỒ CHÍ MINH - NĂM 2023</b>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

<b>LỜI CAM ĐOAN</b>

Tôi xin cam đoan luận văn này là cơng trình nghiên cứu của tơi. Những phần sử dụngtài liệu tham khảo trong luận văn đã được nêu rõ trong phần tài liệu tham khảo. Cáckết quả nghiên cứu được trình bày trong luận văn là trung thực, khách quan.

<b>Tác giả luận văn</b>

<b>Đào Thị Hồng Loan</b>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>TÓM TẮT</b>

<i><b>SÀNG LỌC IN SILICO CÁC HỢP CHẤT TỰ NHIÊN TIỀM NĂNG ĐƯỢC PHÂN</b></i>

<b>LẬP TẠI BỘ MÔN DƯỢC LIỆU – ĐẠI HỌC Y DƯỢC TP. HỒ CHÍ MINH ỨCCHẾ TRÊN PROTEIN E1 CỦA HPV 18 (HUMAN PAPILLOMA VIRUS)</b>

Đào Thị Hồng Loan

Giảng viên hướng dẫn: PGS. TS. Nguyễn Thụy Việt Phương

<b>Mở đầu: Ung thư cổ tử cung là một trong những bệnh ung thư phổ biến hàng đầu ở</b>

phụ nữ với hơn 95% ca mắc bệnh do Human Papillomavirus (HPV), trong đó 90%tổng số ca do HPV 16 và 18 gây ra. Hiện nay, các loại vắc xin lại kém hiệu quả ởnhững người đã tiếp xúc với một hay nhiều chủng HPV trước đó cũng như tỷ lệ tiêmchủng thấp. Vì thế, việc tìm ra thuốc điều trị HPV vẫn là vấn đề cấp thiết. Do đó mụctiêu của nghiên cứu là tìm kiếm các hợp chất tự nhiên tiềm năng được phân lập tại Bộmôn Dược liệu – Đại học Y Dược TP. Hồ Chí Minh ức chế protein E1 của HPV 18

<i>thơng qua sử dụng phương pháp in silico.</i>

<b>Đối tượng - Phương pháp nghiên cứu: Đối tượng của nghiên cứu là 286 hợp chất</b>

tự nhiên được phân lập tại bộ môn Dược liệu – Đại học Y Dược TP. Hồ Chí Minh.Các bước nghiên cứu in silico của đề tài bao gồm: (i) sàng lọc hợp chất tiềm năngbằng phương pháp gắn kết phân tử (PDB: 1R9W); (ii) khảo sát độ ổn định của cácphức hợp bằng mô phỏng động lực học phân tử; (iii) tính năng lượng gắn kết bằng 3phương pháp: MM/PBSA, MM/GBSA và LIE; (iv) đánh giá trình tự acid amin trongkhoang gắn của protein E1 HPV 18 với các tuýp HPV khác.

<b>Kết quả: Kết quả sàng lọc qua gắn kết phân tử thu được 5 hợp chất tự nhiên tiềm</b>

năng gồm: E157, E176, E186, E221, E254. Áp dụng mô phỏng động lực học phân tửtrong thời gian 100 ns cho thấy E176 và E221 đạt các thông số đánh giá về độ ổn địnhvà tính năng lượng gắn cho 5 phức hợp tiềm năng theo 3 phương pháp. Kết quả chothấy 2 hợp chất tiềm năng trong việc ức chế protein E1 HPV 18 được xác định làE186 (năng lượng gắn = -15,21 kJ.mol<small>-1</small>)và E221 (năng lượng gắn = 60,73 kJ.mol<small>-1</small>).Đánh giá trình tự acid amin cho thấy có sự bảo tồn cao giữa các acid amin trong

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

khoang gắn kết ADN của HPV 18 so với các tuýp HPV khác. Từ kết quả phân tíchphát sinh loài, có sự tách biệt đáng kể về nguồn gốc phát sinh giữa 2 loại HPV nguycơ thấp và nguy cơ cao.

<b>Kết luận: E186 (Hispidulin-7-O-rutinosid) và E221 (Limonin) là 2 hợp chất tiềm</b>

năng trong việc ức chế protein E1 HPV18. Ngoài ra, dựa trên kết quả căn chỉnh trìnhtự và phân tích phát sinh gợi ý rằng có thể phát triển các hợp chất ức chế protein E1có tác dụng trên nhiều tuýp HPV khác nhau, đặc biệt là các tuýp HPV nguy cơ cao.

<i><b>Từ khóa: Human Papillomavirus (HPV), protein E1 của HPV, sàng lọc in silico,</b></i>

năng lượng gắn kết tự do.

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<i><b>IN SILICO SCREENING OF POTENTIAL NATURAL COMPOUNDS ISOLATED</b></i>

<b>FROM THE DEPARTMENT OF PHARMACOGNOSY - UNIVERSITY OFMEDICINE AND PHARMACY AT HO CHI MINH CITY INHIBITING HPV 18 E1</b>

<b>PROTEIN (HUMAN PAPILLOMA VIRUS)</b>

Dao Thi Hong Loan

Supervisor: Assoc. Prof. Dr Nguyen Thuy Viet Phuong

<b>Introduction: Cervical cancer is one of the leading common cancers in women, with</b>

over 95% of cases attributed to Human Papillomavirus (HPV), of which HPV 16 and18 are responsible for 90% of all cases. Currently, available vaccines are less effectivein individuals who have been previously exposed to one or more HPV strains, as wellas having low vaccination rates. Therefore, finding a treatment for HPV remains anurgent issue. Thus, the research objective was to identify potential natural compoundsisolated from the Department of Pharmacognosy, University of Medicine andPharmacy at Ho Chi Minh City as the inhibitors of E1 protein of HPV 18 through

<i>using in silico methods.</i>

<b>Subjects and research methods: The study subjects comprised 286 natural</b>

compounds isolated from the Department of Pharmacognosy, University of Medicine

<i>and Pharmacy at Ho Chi Minh City. The in silico screening process of this study</i>

included: (i) screening potential compounds using molecular docking (PDB: 1R9W);(ii) investigating the stability of the complexes through molecular dynamicssimulations; (iii) calculating the binding energy using three methods: MM/PBSA,MM/GBSA, and LIE; (iv) evaluating the amino acid sequence in the binding pocketof the HPV 18 E1 protein with other HPV types.

<b>Results: The results of molecular docking screening yielded 5 potential natural</b>

compounds, namely E157, E176, E186, E221, and E254. Molecular dynamicssimulations conducted over a period of 100 ns showed that E176 and E221 exhibitedfavorable stability and binding energy characteristics among the 5 potential

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

complexes using all three methods. The outcomes indicated that E186 (∆G<small>bind </small>= 15,21 kJ.mol<small>-1</small>) and E221 (∆G<small>bind </small>= 60,73 kJ.mol<small>-1</small>) were identified as the two potentialcompounds for inhibiting the E1 protein of HPV 18. Sequence analysis of amino acidsrevealed a high conservation within the DNA binding pocket of HPV 18 comparedto other HPV types. The analysis of phylogenetic tree results demonstrated asignificant differentiation in the origin between the two types of low-risk and high-risk HPV.

<b>-Conclusion: E186 (Hispidulin-7-O-rutinoside) and E221 (Limonin) are two potential</b>

compounds that can inhibit the E1 protein of HPV 18. Furthermore, based onsequence alignment and phylogenetic analysis, it is suggested that the developmentof E1 protein inhibitors targeting multiple HPV types, particularly high-risk types, ispossible.

<i><b>Keywords: Human Papillomavirus (HPV), HPV E1 protein, in silico screening,</b></i>

binding free energy.

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

<b>LỜI CẢM ƠN</b>

Trước tiên, em xin gửi lời cảm ơn chân thành đến PGS. TS. Nguyễn Thụy ViệtPhương đã tận tình hướng dẫn, dành thời gian chỉ dẫn và góp ý chỉnh sửa giúp emhồn thiện luận văn. Cảm ơn cơ vì những bài học bổ ích mà cơ đã chỉ dạy cho emtrong suốt quá trình thực hiện đề tài.

Em xin cảm ơn thầy GS.TS. Thái Khắc Minh và thầy GS.TS. Phạm Văn Tấtđã dành thời gian đọc, phản biện giúp em hồn chỉnh luận văn cùng với các thầy cơtrong hội đồng đã đóng góp ý kiến cho đề tài luận văn của em được hoàn thiện hơn.

Em xin tri ân Thầy, Cô khoa Dược tham gia công tác giảng dạy chương trìnhCao học đã dành nhiều tâm huyết truyền đạt kiến thức, kinh nghiệm cho các học viên.Bên cạnh đó em cũng gửi lời cám ơn đến em Lê Nguyễn Như Quỳnh đã luônđồng hành, hỗ trợ và giúp đỡ em trong suốt quá trình thực hiện đề tài.

Cuối cùng, em xin kính chúc Q thầy cơ ln tràn đầy sức khỏe và gặp đượcnhiều thành công trong cuộc sống.

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

1.1.2. Cấu tạo của HPV ... 3

1.1.3. Protein E1 của virus HPV ... 6

<b>1.2.Tiềm năng phát triển thuốc ức chế virus HPV từ dược liệu ... 8</b>

1.2.1. Nghiên cứu thuốc ức chế trên virus HPV ... 8

1.2.2. Nghiên cứu thuốc ức chế trên E1 HPV 18 ... 9

<b>1.4.Tình hình nghiên cứu trong và ngồi nước ... 20</b>

1.4.1. Tình hình nghiên cứu trên thế giới ... 20

1.4.2. Tình hình nghiên cứu trong nước ... 21

<b>CHƯƠNG II: PHƯƠNG PHÁP NGHIÊN CỨU ... 22</b>

<b>2.1.Đối tượng nghiên cứu ... 22</b>

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

2.1.1. Mục tiêu tác động ... 22

2.1.2. Cơ sở dữ liệu ... 22

2.1.3. Phần mềm nghiên cứu ... 23

<b>2.2.Phương pháp nghiên cứu ... 24</b>

2.2.1. Quy trình nghiên cứu ... 24

2.2.2. Căn chỉnh nhiều trình tự và phân tích phát sinh lồi ... 24

2.2.3. Gắn kết phân tử ... 25

2.2.4. Mô phỏng động lực học phân tử ... 26

2.2.5. Tính tốn năng lượng gắn kết ... 27

<b>CHƯƠNG III: KẾT QUẢ ... 29</b>

<b>3.1.Căn chỉnh nhiều trình tự và phân tích phát sinh lồi ... 29</b>

3.1.1. Đánh giá trình tự acid amin bằng phương pháp MSA ... 29

3.1.2. Phân tích phát sinh loài ... 30

<b>3.2.Sàng lọc các hợp chất tự nhiên có tiềm năng ức chế protein E1 bằngphương pháp gắn kết phân tử ... 30</b>

3.2.1. Các cấu trúc flavonoid monoglycosid ... 37

3.2.2. Các cấu trúc flavonoid diglycosid ... 42

3.2.3. Các cấu trúc flavonoid triglycosid ... 43

3.2.4. Các cấu trúc flavonoid chỉ có phần aglycon ... 45

3.2.5. Các hợp chất khác ... 46

3.2.6. Các thuốc được sử dụng trong điều trị HPV... 47

3.2.7. Phân tích khả năng làm thuốc và ADMET của 5 hợp chất tiềm năng.. 48

<b>3.3.Khảo sát độ ổn định của các phức hợp tiềm năng thông qua mô phỏngđộng lực học phân tử ... 50</b>

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

3.3.1. Độ ổn định của phức hợp protein-ligand trong q trình mơ phỏng động

lực học phân tử ... 51

3.3.2. Độ dao động của acid amin trong q trình mơ phỏng động lực học ... 52

3.3.3. Diện tích bề mặt có thể tiếp cận dung mơi ... 53

3.3.4. Bán kính quay ... 54

3.3.5. Tần suất liên kết hydro giữa protein và ligand ... 54

<b>3.4.Tính toán và đánh giá năng lượng gắn kết bằng 3 phương pháp:MM/PBSA và MM/GBSA, LIE ... 55</b>

3.4.1. Phương pháp MM/PBSA ... 55

3.4.2. Phương pháp MM/GBSA ... 56

3.4.3. Phương pháp LIE ... 57

<b>CHƯƠNG IV: BÀN LUẬN ... 59</b>

<b>4.1.Căn chỉnh nhiều trình tự và phân tích phát sinh lồi ... 59</b>

<b>4.2.Sàng lọc các hợp chất tự nhiên có tiềm năng ức chế protein E1 bằngphương pháp gắn kết phân tử ... 60</b>

<b>4.3.Khảo sát độ ổn định của các phức hợp tiềm năng thông qua mô phỏngđộng lực học phân tử ... 65</b>

<b>4.4.Tính tốn và đánh giá năng lượng gắn kết tự do bằng 3 phương pháp:MM/PBSA và MM/GBSA, LIE ... 67</b>

<b>KẾT LUẬN VÀ KIẾN NGHỊ ... 72</b>

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

<b>DANH MỤC CHỮ VIẾT TẮT</b>

<b>Chữ viết tắt Tiếng Anh Tiếng ViệtATP </b> Adenosine triphosphate

<b>BFE </b> Binding free energy Năng lượng gắn kết tự do

<b>DBD </b> DNA Binding Domain Miền liên kết ADN

<b>DNA </b> Deoxyribonucleic acid Deoxyribonucleic acid

<b>EGCG </b> Epigallocatechin gallate

<b>HPV </b> Human Papilloma Virus Virus human papilloma

<b>HR HPV </b> High-risk HPV Loại HPV có nguy cơ cao

<b>IARC </b> International Agency forResearch on Cancer

Cơ quan Nghiên cứu Ung thưQuốc tế

<b>LIE </b> Linear Interaction Energy Năng lượng tương tác tuyến tính

<b>LR </b> Low-risk HPV Loại HPV có nguy cơ thấp

<b>MDs </b> Molecular dynamics simulation Động lực học phân tử

<b>MSA </b> Multiple sequence alignment Căn chỉnh nhiều trình tự

<b>ORF </b> Open reading frame Khung đọc mở

<b>PV </b> Papillomavirus Virus papilloma

<b>QSAR </b> Quantitative Structure-ActivityRelationship

Mối liên quan định lượng giữacấu trúc-tác dụng

<b>Rg </b> Radius of Gyration Bán kính quay

<b>RMSD </b> Root Mean Square Deviation Căn bậc hai của độ lệch bìnhphương trung bình

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<b>Chữ viết tắt Tiếng Anh Tiếng Việt</b>

<b>RMSF </b> Root Mean Square Fluctuation Căn bậc hai của độ dao độngbình phương trung bình

<b>RPA </b> Replication protein A Protein sao chép A

<b>SASA</b> Solvent accessible surface area Diện tích bề mặt tiếp cậndung môi

<b>TLTK </b> Tài liệu tham khảo

<b>TM-score </b> Template modelling Mơ hình mẫu

<b>Topo I </b> Topoisomerase I

<b>URR </b> Upstram Regulatory Region Vùng điều hòa ngược dòng

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<b>DANH MỤC CÁC HÌNH</b>

<b>Hình 1.1. Cấu trúc và chức năng các gen trên HPV</b><small>18</small> ... 4

<b>Hình 1.2. Cấu trúc protein E1 của HPV</b><small>34</small> ... 6

<b>Hình 1.3. Các hợp chất dược liệu ức chế HPV ... 9</b>

<b>Hình 1.4. Các hợp chất dược liệu ức chế trên protein E1 HPV ... 10</b>

<b>Hình 1.5. Cách tiếp cận của phương pháp điểm cuối (end-point method)</b><small>61</small> ... 17

<b>Hình 2.6. Hình minh họa cấu trúc của vùng gắn kết ADN của protein E1 HPV18 từ</b>ngân hàng dữ liệu Protein (PDB ID: 1R9W) ... 22

<b>Hình 2.7. Các giai đoạn thực hiện trong nghiên cứu ... 24</b>

<b>Hình 3.8. Căn chỉnh nhiều trình tự (MSA) các acid amin trong khoang gắn kết ADN</b>của 28 tuýp HPV ... 29

<b>Hình 3.9. Phân tích phát sinh loài cho protein E1 của 28 tuýp HPV. Nét màu đỏ là</b>nhóm các tuýp HPV nguy cơ cao và màu vàng là nhóm các tuýp HPV nguy cơ thấp... 30

<b>Hình 3.10. Trình tự acid amin trong vùng gắn với ADN của E1 HPV 18 ... 31</b>

<b>Hình 3.11. (A) Mơ hình dự đốn cấu trúc của protein E1 được bổ sung thêm 7 acid</b>amin vào loop gắn kết với ADN (cam). (B) Biểu đồ Ramachandran của mơ hình .. 32

<b>Hình 3.12. Giá trị độ che phủ và độ nhận dạng cho trình tự từ MSA ... 33</b>

<b>Hình 3.13. Kết quả 5 cấu trúc được xác định từ ColabFold v1.5.2</b><small>89</small> ... 35

<b>Hình 3.14. Khoang gắn của protein E1 HPV 18 (PDB ID: 1R9W) ... 35</b>

<b>Hình 3.15. Các vị trí gắn và số lượng các phân tử đường gắn trên khung flavonoid</b>aglycon. Mũi tên đỏ chỉ những vị trí gắn của nhóm thế đường ... 37

<b>Hình 3.16. Vị trí nhóm thế đường của một số flavonoid monoglycosid và điểm số</b>gắn kết vào E1 HPV 18 (PDB ID: 1R9W) ... 38

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

<b>Hình 3.17. Phương thức gắn và cấu trúc của một số hợp chất flavonoid monoglycosid</b>

(A: E019, B: E164, C: E060, D: E052) trong khoang gắn của protein E1 HPV 18(PDB ID: 1R9W). Vùng màu vàng là vị trí của khoang gắn ... 39

<b>Hình 3.18. Cấu trúc, vị trí trong khoang và tương tác 2D của 2 hợp chất có nhóm thế</b>

đường ở vị trí C8 (A) và vị trí C3 (B). Với nét xanh lá là liên kết hydro, nét hồng làliên kết kỵ nước, nét đỏ là liên kết cho/nhận không thuận lợi (unfavorable donor-donor/acept). Vùng màu vàng là vị trí của khoang gắn ... 40

<b>Hình 3.19. Tương tác 2D và điểm số gắn kết của các cấu trúc flavon monoglycosid</b>

với khoang gắn của protein E1 HPV 18 (PBD ID: 1R9W). Với nét xanh lá là liên kếthydro, nét hồng và cam là liên kết kỵ nước, nét đỏ là liên kết cho/nhận khơng thuậnlợi (unfavorable donor-donor/aceptor-aceptor) ... 41

<b>Hình 3.20. Vị trí nhóm thế đường của một số flavonoid diglycosid và điểm số gắn</b>

kết vào E1 HPV 18 (PDB ID: 1R9W) ... 42

<b>Hình 3.21. Cấu trúc và tương tác (A: 2D, B: 3D) của hợp chất E186 trong khoang</b>

gắn kết của E1 HPV 18 (PDB ID: 1R9W). Với nét xanh lá là liên kết hydro, nét hồngvà vàng là liên kết kỵ nước ... 43

<b>Hình 3.22. Cấu trúc của hợp chất E157 (A) và E176 (B) ... 44Hình 3.23. Cấu trúc flavonoid triglycosid (A: E157 màu xanh, B: E176 màu hồng)</b>

và tương tác 3D tương ứng trong khoang gắn kết của E1 HPV 18 (PDB ID: 1R9W).Với nét xanh lá là liên kết hydro, nét hồng và vàng là liên kết kỵ nước ... 44

<b>Hình 3.24. Cấu trúc 2D và điểm số docking tương ứng của các hợp chất flavonoid</b>

dạng aglycon ... 45

<b>Hình 3.25. Phương thức gắn của hợp chất E081 và một số cấu trúc của flavonoid</b>

aglycon với ái lực gắn kết trong khoang gắn của protein E1 của HPV 18 (PDB ID:1R9W). Vùng màu vàng là vị trí của 2 acid amin quan trọng Lys237 và Thr238 .... 46

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

<b>Hình 3.26. Cấu trúc của E221 (A), E254 (B) và tương tác của 2 hợp chất này trong</b>

khoang gắn kết với protein E1 HPV 18 (PDB ID: 1R9W). Với nét xanh lá là liên kếthydro, nét hồng là liên kết kỵ nước ... 47

<b>Hình 3.27. Cấu trúc, vị trí trong khoang và tương tác thuốc Podofilox (A) và</b>

Imiquimod (B). Với nét xanh lá là liên kết hydro, nét hồng là liên kết kỵ nước, nétnét hồng và cam là liên kết kỵ nước. Vùng màu vàng là vị trí của khoang gắn ... 48

<b>Hình 3.28. Các hợp chất được lựa chọn nghiên cứu mô phỏng động lực học phân tử</b>

... 50

<b>Hình 3.29. Giá trị RMSD của backbone của protein E1 (PDB ID: 1R9W) và dạng</b>

phức hợp với các chất trong q trình mơ phỏng động lực học 100 ns ... 51

<b>Hình 3.30. Giá trị RMSF của protein E1 HPV 18 (PDB ID: 1R9W) dạng apo-protein</b>

và dạng phức hợp trong q trình mơ phỏng động lực học phân tử 100 ns ... 52

<b>Hình 3.31. Tổng diện tích bề mặt có thể tiếp cận dung mơi (SASA) của protein E1</b>

HPV 18 (PDB ID: 1R9W) ... 53

<b>Hình 3.32. Bán kính quay (Rg) của protein E1 HPV 18 (PDB ID: 1R9W) trong q</b>

trình mơ phỏng động lực học 100 ns ... 54

<b>Hình 4.33. Cấu trúc tổng quát cho chất tiềm năng ức chế protein E1 của HPV 18</b>

thuộc khung flavonoid ... 63

<b>Hình 4.34. Cấu trúc và số lượng nhóm thế của hợp chất E186 và E221. Với nét xanh</b>

lá là nhóm alcol (-OH), nét cam là nhóm carboxyl (-COO), nét vàng là dị vòng furanvà nét đỏ là vòng epoxy ... 70

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

<b>DANH MỤC CÁC BẢNG</b>

<b>Bảng 1.1. Chức năng của các gen E trong cấu trúc của HPV ... 5Bảng 1.2. Các tương tác của E1 với một số protein của tế bào chủ. ... 7Bảng 1.3. Giá trị của tham số ∆β</b><small>i</small> và w<small>i</small> dựa trên cấu trúc hóa học của hợp chất<small>63</small> .. 19

<b>Bảng 2.4. Danh sách phần mềm sử dụng... 23Bảng 3.5. Đánh giá chất lượng mơ hình tương đồng được xây dựng ... 32Bảng 3.6. Giá trị pLDDT và TM-score của 5 mơ hình dự đốn bằng Alpha Fold .. 33Bảng 3.7. Số lượng hợp chất theo khung cấu trúc thuộc nhóm 1 có ái lực gắn kết tốt</b>

(<-7,0 kcal.mol<small>-1</small>) trên protein E1 HPV 18 (PDB ID: 1R9W) ... 36

<b>Bảng 3.8. Kết quả đánh giá khả năng làm thuốc của 5 hợp chất tiềm năng ... 48Bảng 3.9. Các giá trị ADMET dự đoán của 5 hợp chất tiềm năng ... 49Bảng 3.10. Tần suất hiện diện liên kết hydro giữa các acid amin giữa protein E1 của</b>

HPV 18 (PDB ID: 1R9W) với E157, E221 và E254 ... 55

<b>Bảng 3.11. Năng lượng gắn kết tự do theo phương pháp MM/PBSA của E157, E176,</b>

E186, E221 và E254 với protein E1 của HPV 18 (PDB ID: 1R9W) từ dữ liệu môphỏng động lực học 100 ns (đơn vị: kcal.mol<small>-1</small>) ... 56

<b>Bảng 3.12. Năng lượng gắn kết tự do theo phương pháp MM/GBSA của E157, E176,</b>

E186, E221 và E254 với protein E1 của HPV 18 (PDB ID: 1R9W) từ dữ liệu môphỏng động lực học 100 ns (đơn vị: kcal.mol<small>-1</small>) ... 57

<b>Bảng 3.13. Năng lượng gắn kết tự do theo phương pháp LIE của E186 và E221 với</b>

protein E1 HPV 18 (PDB ID: 1R9W) từ dữ liệu mô phỏng động lực học 100 ns (đơnvị: kJ.mol<small>-1</small>) ... 58

<b>Bảng 4.14. Tóm tắt giá trị năng lượng gắn kết tự do trung bình của 5 hợp chất với</b>

protein E1 của HPV 18 (PDB ID: 1R9W) bằng 2 phương pháp MM/PBSA vàMM/GBSA (đơn vị: kcal.mol<small>-1</small>) ... 69

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

<b>MỞ ĐẦU</b>

Ung thư cổ tử cung là bệnh xảy ra ở cổ tử cung của phụ nữ. Trong số khoảng 342.000ca tử vong do ung thư cổ tử cung ước tính vào năm 2020, khoảng 90% trong số nàyxảy ra ở các nước có thu nhập thấp và trung bình<small>1</small>. Tại Việt Nam, ung thư cổ tử cunglà bệnh ung thư phổ biến thứ 6 ở phụ nữ, với 4177 trường hợp mắc mới (ước tínhkhoảng 100.000 phụ nữ thì có 7,1 người mắc bệnh) và 2420 trường hợp tử vong vàonăm 2018<small>2</small>. Phần lớn ung thư cổ tử cung (hơn 95%) là do Human Papillomavirus(HPV)<small>3</small>. Các phân nhóm nguy cơ cao của papillomavirus ở người gây ra hầu hết cáctrường hợp ung thư cổ tử cung<small>3</small>. Trong đó các tuýp HPV 16 và 18 đã gây ra khoảng90% tổng số ca mắc bệnh<small>4</small>. HPV 18 chiếm 10-12% tất cả các loại ung thư cổ tử cungvà là loại chủ yếu trong ung thư biểu mô tuyến và ung thư biểu mô thần kinh tế bàonhỏ của cổ tử cung<small>5</small>. Ung thư biểu mơ tuyến rất khó phát hiện bằng phết tế bàoPapanicolaou (Pap), do đó ung thư do HPV18 thường liên quan đến bệnh tiến triểnnhanh và tử vong<small>5</small>.

Hiện nay, trên thị trường đã có các loại vắc xin ngăn ngừa nhiễm 9 chủng HPV baogồm: 6, 11, 16, 18, 31, 33 , 45, 52 và 58<small>6</small>. Tại Việt Nam, vắc xin phòng nhiễm HPVđã được sử dụng từ những năm 2006<small>7</small>, thế nhưng thực trạng tỷ lệ tiêm vắc xin phòngHPV ở Việt Nam còn thấp, ở mức 12% trong năm 2020-202<small>8</small>. Bên cạnh đó, các loạivắc xin này lại khơng có tác dụng phịng ngừa đối với các chủng cịn lại của virusHPV nên sẽ không ngăn ngừa tất cả các trường hợp ung thư cổ tử cung<small>9</small>. Đồng thời,vắc xin sẽ có tác dụng phịng ngừa kém hiệu quả ở những người đã tiếp xúc với mộthay nhiều chủng HPV trước đó<small>9</small>. Vì thế, việc tìm ra thuốc điều trị bệnh ung thư cổ tửcung vẫn là vấn đề cấp thiết.

Bên cạnh việc tìm kiếm các hợp chất ức chế oncoprotein E6, E7 của HPV, hoạt độngenzym của protein E1 được xem là mục tiêu hấp dẫn<small>10</small> để khám phá thuốc khángvirus, đặc biệt để điều trị các tổn thương liên quan đến HPV. Protein E1 nhận diện vịtrí sao chép của trình tự ori và biến tính ADN tại vị trí này<small>11</small>. Với số bản sao chép 50bản trên một tế bào, protein E1 HPV cần thiết cho cả giai đoạn bắt đầu nhân lên vàduy trì bộ gen của virus<small>12</small>. Protein E1 không chỉ tác động đến các gen liên quan đến

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

chu trình tế bào mà còn giảm hoạt động của các gen đáp ứng miễn dịch như IFNβ1,IFNλ1, ISG<small>13</small>.

<i>Trên thế giới đã có những nghiên cứu in silico, in vitro và in vivo liên quan đến việc</i>

tìm kiếm hợp chất tự nhiên trong điều trị bệnh ung thư cổ tử cung. Chẳng hạn nhưcurcumin làm giảm sự biểu hiện của protein E6 và E7 của HPV 16, HPV 18 dẫn đếnbiến đổi kiểu hình và ngừng tăng trưởng của các tế bào ung thư<small>14</small>, withaferin A ứcchế tốt E6, E7 của HPV 16 và HPV 18 với năng lượng tối thiểu<small>15</small>, jaceosidin và EGCGgiúp khôi phục hoạt động của protein ức chế khối u pRb trong bệnh u nguyên bàovõng mạc<small>16</small><i>, các hợp chất stigmasterol từ Berberis aristata và stereoemodin từ Rheumemodi đã được báo cáo có khả năng ức chế tốt protein E1 của HPV</i><small>17</small>. Tại Việt Nam,các nghiên cứu chỉ liên quan đến việc tầm sốt ung thư cổ tử cung, chưa có nghiêncứu thuốc nào liên quan đến điều trị ung thư cổ tử cung, đặc biệt là việc tìm kiếm hợpchất tự nhiên tác động trên protein E1.

Với mục đích tận dụng các hợp chất được chiết xuất và phân lập từ bộ mơn Dược liệunhằm tìm kiếm các hợp chất tự nhiên tiềm năng trong điều trị ung thư cổ tử cung dovirus HPV, đề tài được tiến hành với các mục tiêu như sau:

<i><b>Mục tiêu tổng quát: Sàng lọc in silico các hợp chất tự nhiên tiềm năng được phân</b></i>

lập tại Bộ môn Dược liệu – Đại học Y Dược TP. Hồ Chí Minh ức chế protein E1 củaHPV 18.

<b>Mục tiêu nghiên cứu:</b>

1. Đánh giá trình tự acid amin trong khoang gắn của protein E1 HPV 18 với cáctuýp HPV khác.

2. Khảo sát độ ổn định của các phức hợp tiềm năng thông qua mô phỏng độnglực học phân tử (molecular dynamics simulation).

3. Tính tốn và đánh giá năng lượng gắn kết của các chất tiềm năng trên E1 củaHPV 18 bằng 3 phương pháp: MM/PBSA, MM/GBSA và LIE.

4. Sàng lọc các hợp chất tự nhiên có tiềm năng ức chế HPV 18 bằng phương phápgắn kết phân tử (molecular docking).

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

<b>CHƯƠNG I: TỔNG QUAN</b>

<b>1.1. Human Papillomavirus</b>

Ung thư cổ tử cung là bệnh xảy ra ở cổ tử cung của người phụ nữ. Phần lớn ung thưcổ tử cung (hơn 95%) là do Human Papillomavirus (HPV)<small>18</small>. Cho đến nay, ung thưcổ tử cung là căn bệnh phổ biến nhất liên quan đến virus HPV. Mặc dù hầu hết cáctrường hợp nhiễm HPV do các tổn thương tiền ung thư đều có khả năng tự hồi phục,nhưng đối với tất cả phụ nữ, nhiễm HPV có nguy cơ trở thành bệnh mãn tính và cáctổn thương tiền ung thư tiến triển thành ung thư cổ tử cung xâm lấn<small>18</small>.

- Loại HPV nguy cơ cao (High-risk HPV hay HR HPV): gồm 12 loại HPV nguycơ cao, gây bệnh ung thư là: HPV 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58 và59 (nhóm 1) và 8 loại HPV có thể gây ra bệnh ung thư là: HPV 26, 53, 66, 67,68, 70, 73 và 82 (nhóm 2A và 2B) được phân loại bởi Cơ quan Nghiên cứuUng thư Quốc tế (IARC). Trong số các loại nguy cơ cao, HPV 16 là kiểu genđược phát hiện thường xuyên nhất với 60,5% các trường hợp ung thư cổ tửcung, tiếp theo là HPV 18 (32,3%)<small>19</small>.

<b>1.1.2. Cấu tạo của HPV</b>

HPV là một loại virus nhỏ, khơng có vỏ bao, vật liệu di truyền là chuỗi ADN kép vớibộ gen khoảng 8 kb, thuộc họ Papillomaviridae<small>20</small>. Bộ gen của HPV bao gồm ba vùngriêng biệt: Vùng sớm (Early - E) bao gồm 7 gen (E1, E2, E4, E5A, E5B, E6 và E7),vùng muộn (Late - L) bao gồm L1, L2 và vùng điều hòa ngược dòng (Upstream

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

Regulatory Region – URR)<small>20</small>. Cấu trúc và chức năng của từng gen của HPV được

<b>trình bày trong Hình 1.1</b>

<b>Chức năng cụ thể của các gen E được trình bày trong Bảng 1.1</b>

Trong nghiên cứu và phát triển thuốc là các phân tử nhỏ để điều trị ung thư cổ tửcung, các oncoprotein E6, E7 của HPV là đích tác động được nghiên cứu nhiều nhất<small>21</small>.Bên cạnh đó, protein E1 cũng là đích tác động đang được quan tâm nhằm phát triểncác thuốc với mục đích ức chế sự sao chép ADN của virus trong tế bào chủ. Đồngthời, với đặc tính bảo tồn cao của E1 giữa các loại HPV, việc phát triển thuốc ức chếtrên E1 được kỳ vọng sẽ có tác động hiệu quả trên nhiều loại HPV khác nhau. Do đó,ức chế protein E1 được chọn làm mục tiêu nghiên cứu của đề tài.

<b>Hình 1.1. Cấu trúc và chức năng các gen trên HPV</b><small>18</small>

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

<b>Bảng 1.1. Chức năng của các gen E trong cấu trúc của HPV</b>

<b>Gen Đặc điểm Số acidamin</b>

<b>Vai trò</b>

<b>E1 </b> Bảo tồn cao giữa các loại HPVkhác nhau và là protein HPVduy nhất có hoạt tính enzyme<small>10</small>.

600-650 Tham gia vào quá trình saochép ADN của virus<small>12</small>

<b>E2 </b> Tham gia tạo phức hợp với E1có ái lực cao với ADN của tếbào chủ<small>22</small>

350-500 E2 tương tác với E1 giúp choE1 dễ dàng gắn liền vào điểmkhởi động sao chép, tăngcường sao chép<small>22</small>

<b>E4 </b> E4 nằm ở vị trí trung tâm tronggen E2, tạo sản phẩm chínhtrong q trình phiên mã<small>23</small>

Chưagiải mã

Vùng bảo tồn LLXLL tại vị tríacid amin 12-16 trên proteinE4 đóng vai trị then chốt trongviệc sừng hóa tế bào<small>24</small>

<b>E5 </b> Protein nhỏ, liên kết màng vàrất kỵ nước<small>25</small>

108 Tăng cường chức năng của E6,E7 và đã được chứng minh làgóp phần vào sự tiến triển củakhối u trên cơ thể người<small>26</small>

<b>E6 </b> Chứa hai mơ-típ Cys-X-X-Cysgắn kẽm điều hòa và là mộttrong các protein gây ung thưchính của HPV<small>27</small>

151 Sự kích thích do E6 gây nên sựsuy giảm các chức năng sinhhọc của p53; do đó thúc đẩychu kỳ tế bào, cuối cùng dẫnđến tăng sự phát triển của tếbào khối u<small>28</small>

<b>E7 </b> Chứa 2 vùng gen bảo tồn<small>29</small> 98 Gây ung thư, hỗ trợ E6 tácđộng lên sự bất tử tế bào chủ<small>29</small>.

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

<b>1.1.3. Protein E1 của virus HPVCấu tạo và chức năng</b>

Trong vùng gen sớm từ E1 đến E7 của HPV có chứa khung đọc mở (Open readingframe – ORF) cần thiết cho sự nhân lên của virus và điều hịa phiên mã<small>30</small>. E1 là proteincó ORF lớn nhất và được bảo tồn cao nhất trong số các gen thuộc họ Papillomavirus(PV)<small>10</small>. Điều này phản ánh vai trò quan trọng của gen E1 trong quá trình sao chép bộgen của virus. Nhìn chung, protein có thể được chia thành ba phân đoạn chức năng

<b>chính được thể hiện trong Hình 1.2. Trong đó gồm: vùng điều hịa ở đầu N</b>cần thiết

<i>cho sự sao chép in vivo</i><small>31</small>, miền liên kết trung tâm hay còn được gọi là miền liên kếtADN (DBD) nhận biết các vị trí cụ thể của trình tự khởi đầu sao chép (ori)<small>11</small> và vùngenzym ở đầu C có hoạt tính như enzyme tháo xoắn ADN helicase/ATPase<small>32</small>. VùngDBD và vùng helicase ở đầu C đóng vai trị sao chép ADN phụ thuộc ori trong thí

<i>nghiệm in vitro và là vùng quan trọng thúc đẩy quá trình sao chép của virus</i><small>33</small>.

<b>Hình 1.2. Cấu trúc protein E1 của HPV</b><small>34</small>

<b>Cơ chế gây bệnh</b>

Sự sao chép ADN của virus: Đối với HR HPV nhóm 1, protein E1 có thể trực tiếpkhởi động sự sao chép ADN mà khơng cần có sự hỗ trợ định hướng của protein E2<small>35</small>.

<i>Ngược lại, đối với các loại PV khác, sự nhận dạng ori in vivo của E1 cần có E2 - loại</i>

protein virus duy nhất cần thiết để bắt đầu sao chép ADN<small>36</small>.

Sự tương tác của E1 với các protein tham gia điều hòa/sao chép ADN của tế bào chủ:các loại virus gây khối u có vật liệu di truyền là ADN, bao gồm cả PV chỉ mã hóamột số protein và do đó phải phụ thuộc nhiều vào vật chủ nhằm đảm bảo các chức

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

ngoại lệ và đã được báo cáo là tương tác với một số protein của tế bào được thể hiện

<b>trong Bảng 1.2</b>

<b>Bảng 1.2. Các tương tác của E1 với một số protein của tế bào chủ.</b>

<b>Tên protein Chức năng trong tếbào chủ của protein</b>

<b>Chức năng của tương tácprotein E1</b>

<b>Phức hợp ADNpolymerase α-primase</b>

Sao chép ADN Đóng vai trị trực tiếp trongquá trình tổng hợp ADNcủa virus

<b>Protein sao chépA (RPA)</b>

Protein liên kết ADNsợi đơn

Đóng vai trị trực tiếp trongq trình tổng hợp ADNcủa virus

<b>Topoisomerase I(Topo I)</b>

Tháo xoắn ADN Tăng hoạt động của

Topoisomerase I và liên kếtE1 với ori

<b>Histone H1 </b> Thành phần củanhiễm sắc thể

E1 có thể thay thế histoneH1 khỏi ADN, điều này cóthể làm giảm tác dụng kìmhãm của H1 đối với sự saochép ADN của virus

</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">

tế bào được ly giải để phát hiện hoạt động của luciferase bằng cách sử dụng thửnghiệm Pierce Firefly Luciferase Glow với Pierce Firefly Signal Enhancer (ThermoScientific) như mô tả của nhà sản xuất<sup>42</sup>. Sự phát quang được đọc trên đầu đọc vi tấmGemini EM (phát xạ 542 nm) bằng phần mềm Softmax Pro 3.2.1<small>43</small>. Độc tính tế bàođược ước tính bằng cách sử dụng xét nghiệm XTT<small>43</small>, bắt chước xét nghiệm khángvirus nhưng khơng có vius. Giá trị CC<small>50</small> và IC<small>50</small> được tính tốn bằng cách sử dụngphân tích liều - đáp ứng - ức chế trên phần mềm GraphPad Prism v5.0c. Từ đó, cácchỉ số điều trị (TI = CC<small>50</small>/IC<small>50</small>) được tính tốn<small>43</small>.

<b>1.2. Tiềm năng phát triển thuốc ức chế virus HPV từ dược liệu1.2.1. Nghiên cứu thuốc ức chế trên virus HPV</b>

Trong thời gian gần đây, dược liệu và các chất chuyển hóa có hoạt tính sinh học đãtrở thành một trong những trọng tâm chính được quan tâm nhằm tìm kiếm các loạithuốc hiệu quả với giá cả phải chăng để đáp ứng những nhu cầu thiết yếu. Các dượcliệu này được kỳ vọng có thể cản trở sự nhân lên của virus mà không ảnh hưởng đếnchức năng sinh lý của vật chủ hoặc hạn chế các tác dụng phụ<small>44</small>. Các nghiên cứu đãbáo cáo tác dụng ức chế của chất chiết xuất từ cây thuốc đối với sự nhân lên của mộtsố loại virus cụ thể như virus herpes, virus sốt xuất huyết, virus viêm gan C, virusSars-Cov-2, …<small>45</small>. Đối với virus HPV, nhiều dược liệu đã được báo cáo có tiềm năngức chế các oncoprotein của virus này. Các hợp chất tự nhiên như curcumin, withaferin

<b>A, apigetrin, theaflavin, hesperidin, epigallocatechin gallat đã được chứng minh có</b>

khả năng ức chế protein E6, E7 của HPV<small>14,20</small><b> (Hình 1.3).</b>

</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">

Bên cạnh việc tìm kiếm các hợp chất ức chế oncoprotein E6, E7 của HPV, ức chếenzym của protein E1 cũng được xem là mục tiêu hấp dẫn để khám phá thuốc khángHPV, đặc biệt để điều trị các tổn thương liên quan đến HPV. Tuy nhiên, hai loại chấtức chế E1 đã biết là: biphenylsulfonacetic acid và benzodiazepin được báo cáo là có

<i>hoạt động tốt trong các thử nghiệm in vitro lại khơng có hiệu quả trong các thí nghiệm</i>

ni cấy tế bào<small>10</small><b> (Hình 1.4). Trong nghiên cứu gần đây, các hợp chất stigmasterol từ</b>

<i>Berberis aristata và stereoemodin từ Rheum emodi đã được báo cáo có khả năng ứcchế tốt protein E1 của HPV trong các thí nghiệm in silico</i><small>17</small>. Tính tới thời điểm hiệntại thực hiện đề tài, các công bố nghiên cứu trên hợp chất tự nhiên có tác dụng ức chế

</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27">

protein E1 cịn khá ít. Điều này cho thấy việc tìm kiếm các hợp chất tự nhiên trên E1của HPV là một hướng mới trong việc thiết kế thuốc kháng virus này.

<b>Hình 1.4. Các hợp chất dược liệu ức chế trên protein E1 HPV</b>

<b>1.3. </b> <i><b>Sàng lọc in silico</b></i>

<i>Trong những nằm gần đây, nghiên cứu in silico đã được áp dụng rộng rãi nhằm giảm</i>

bớt thời gian cũng như chi phí và định hướng cho việc phát triển thuốc. Nghiên cứu

<i>in silico là phương pháp nghiên cứu dưới sự hỗ trợ của máy tính bao gồm các kỹ thuật</i>

như xây dựng mơ hình pharmacophore, mối liên quan giữa cấu trúc - tác dụng (QSARhay quantitative structure - activity relationship), mơ hình tương đồng (homologymodelling), học máy (machine learning), gắn kết phân tử (molecular docking), độnglực học phân tử (molecular dynamics simulation),…Tùy theo thiết kế và mục đíchnghiên cứu, các phương pháp phù hợp sẽ được lựa chọn.

<b>1.3.1. Căn chỉnh nhiều trình tự và phân tích phát sinh lồi</b>

<i>Khái niệm</i>

Căn chỉnh nhiều trình tự (multiple sequence alignment - MSA) là một cơng cụ dựđốn cấu trúc và chức năng của protein, suy luận phát sinh loài và các nhiệm vụ phổbiến khác trong phân tích trình tự<small>64</small>. MSA sắp xếp các chuỗi protein thành một mảnghình chữ nhật với mục đích căn chỉnh thứ tự sao cho các acid amin tương đồng, khônglà đồng phân quang học hoặc có chung một vai trị sẽ được xếp trên cùng một cột<small>64</small>.Phân tích phát sinh lồi (phylogenetic analysis) là sơ đồ phân nhánh được lập để thểhiện lịch sử tiến hóa hoặc mối quan hệ giữa các loài, sinh vật khác nhau hoặc các đặcđiểm của sinh vật như gen, protein, cơ quan, … được phát triển từ một tổ tiên chung<small>65</small>.

</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28">

<i>Vai trò</i>

Căn chỉnh nhiều trình tự và phân tích phát sinh loài đóng vai trị quan trọng trong dựđốn hoạt tính và tương tác của các phân tử thuốc. Nhờ việc so sánh các trình tự genhoặc protein có liên quan, nghiên cứu có thể dự đốn các vùng quan trọng cho hoạttính của những đại phân tử như protein. Những thơng tin này rất hữu ích trong việcthiết kế các phân tử thuốc có khả năng tương tác mạnh với mục tiêu mong muốn<small>64</small>.

<i>Quá trình thực hiện</i>

Quá trình căn chỉnh nhiều trình tự và phân tích phát sinh loài gồm có ba giai đoạnchính: thu thập trình tự, lựa chọn phương pháp căn chỉnh và trực quan hóa kết quả<small>66</small>.- Thu thập trình tự: Tập hợp các trình tự có sự liên hệ về họ hàng hoặc có cùngnguồn gốc tiến hóa hoặc tương tự chức năng được thu thập từ ngân hàngUniProt (), NCBI ().Các trình tự sau đó được lưu lại trong cùng 1 tệp *.txt.

- Lựa chọn phần mềm: Dựa trên 3 tiêu chí bao gồm độ chính xác sinh học, thờigian thực hiện và tài nguyên máy tính. Các phần mềm thường sử dụng baogồm: ClustalW, Clustal Omega, MUSCLE,…

- Trực quan hóa kết quả: Kết quả có thể được thể hiện ở dạng đồ thị đặc trưngbiểu diễn các đặc trưng quan trọng trên căn chỉnh, heatmap thể hiện mức độtương tự giữa các cặp trình tự trong căn chỉnh hoặc sơ đồ cây thể hiện mốiquan hệ tiến hóa giữa các trình tự.

<b>1.3.2. Gắn kết phân tử</b>

<i>Khái niệm</i>

Gắn kết phân tử (molecular docking) là phương pháp mơ phỏng q trình gắn kết củaphân tử này vào phân tử khác, hay nói cách khác dùng để tìm kiếm phối tử phù hợpvới các vị trí liên kết của protein nhằm đạt được cấu trúc tối ưu hóa cho cả protein vàphối tử, sao cho năng lượng gắn kết của phức hợp là nhỏ nhất<small>46</small>. Phương pháp này cóthể dự đốn ái lực liên kết giữa phối tử, protein và cấu trúc của phức hợp protein-phốitử, đây là thơng tin hữu ích để tối ưu hóa hợp chất. Việc gắn kết phân tử đã được áp

</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">

dụng trong hơn ba thập kỷ và một số lượng lớn các loại thuốc mới đã được phát hiệnvà phát triển tương ứng dựa trên phương pháp này<small>47</small>.

Có ba kiểu gắn kết thường gặp là gắn cố định (rigid docking), gắn bán linh động(semi-flexible docking) và gắn linh động tối đa (full flexible docking). Trong đó, kiểugắn bán linh động (protein tĩnh, ligand động) là phổ biến nhất<small>48</small>.

- Gắn cố định: dựa trên mơ hình chìa khóa - ổ khóa được Fisher đề xuất vàonăm 1984<small>49</small>, cả protein và phối tử đều được coi là cấu trúc cứng, nghĩa là cấutrúc khơng gian khơng thay đổi trong q trình gắn kết phân tử giữa phối tửvà protein, chỉ có vị trí khơng gian và tư thế của hai phân tử thay đổi<small>50</small>. Phươngpháp này thích hợp để khảo sát hệ thống gắn kết có cấu trúc tương đối lớn,chẳng hạn như phức hợp protein-protein và protein–acid nucleic.

- Gắn bán linh động: cấu trúc của protein cố định trong khi cấu trúc của phối tửđược phép thay đổi trong một phạm vi nhất định. Phương pháp này đã đượcsử dụng rộng rãi trong mô phỏng gắn kết giữa các phân tử nhỏ và các đại phântử sinh học (protein, enzym và acid nucleic) vì khả năng tính tốn và dự đốncủa mơ hình<small>51</small>.

- Gắn linh động tối đa: cấu trúc của phối tử và protein được phép thay đổi mộtcách linh động. Bởi vì phương pháp này có độ chính xác cao và gần với việcgắn kết thực tế nhất nên thường được sử dụng để nghiên cứu một cách chínhxác sự nhận diện giữa hai phân tử<small>52</small>.

<i>Q trình thực hiện gắn kết phân tử:</i>

Để thực hiện gắn kết phân tử cần có các thành phần sau:

- Cấu trúc ba chiều (3D) của protein: được xác định bằng phương pháp nhiễuxạ tia X hoặc NMR hay bằng thực nghiệm và được lưu trữ trên các cơ sở dữliệu như Protein Data Bank ( ReLiBase(), Binding MOAD(), ... Trong trường hợp cấu trúc protein chưa

</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30">

được xác định, có thể xây dựng cấu trúc bằng mơ hình tương đồng (homologymodelling) dựa trên các trình tự hay các protein đã biết.

- Cấu trúc của phối tử: có thể được tải từ các cơ sở dữ liệu có sẵn nhưChemSpider, PubChem, … hoặc được xây dựng từ phần mềm Chemdraw,Ghemical hay PRODRG khi chưa có sẵn cấu trúc 3D.

- Vị trí gắn của phối tử trên protein: Vị trí gắn trên protein thơng thường đã đượcnghiên cứu, tham khảo từ những protein đã biết cùng họ với protein khảo sáthay từ cấu trúc đồng kết tinh. Khi thơng tin về vị trí gắn bị thiếu, có hai cáchtiếp cận thường được sử dụng: tìm các vị trí liên kết có khả năng nhất được dựđoán theo thuật toán dự đoán<small>53</small> hoặc thực hiện phương pháp “docking mù”<small>54</small>.

<i>Đánh giá gắn kết phân tử</i>

Khả năng gắn kết của phức hợp protein-ligand được đánh giá bằng điểm số dockinghoặc năng lượng gắn kết (kcal.mol<small>-1</small> hoặc kJ.mol<small>-1</small>). Năng lượng gắn kết càng thấp,tức là điểm số docking càng thấp và ái lực gắn kết càng mạnh.

<b>1.3.3. Mô phỏng động lực học phân tử</b>

<i>Khái niệm</i>

Mô phỏng động lực học phân tử (molecular dynamics simulation – MDs) là việc sửdụng các kỹ thuật và thuật tốn máy tính để khảo sát độ bền, độ chuyển động của cácthành phần (nguyên tử, phân tử, hạt,…) khi đưa vào hệ, dưới ảnh hưởng của nhiệt độ,áp suất và dung môi dựa trên nguyên lý của định luật II Newton<small>55</small>.

<i>Quá trình thực hiện mơ phỏng động lực học phân tử</i>

Q trình mơ phỏng động lực học phân tử gồm có bốn giai đoạn chính: chuẩn bị cấutrúc ban đầu, tối thiểu hóa năng lượng, cân bằng hệ thống và mơ phỏng động lực họcphân tử<small>56</small>.

<b>- Bước 1: Chuẩn bị cấu trúc ban đầu bao gồm thơng số vị trí, tọa độ ban đầu của</b>

các nguyên tử trong hệ khi được đặt trong một từ trường thích hợp. Một số từtrường dùng trong MDs: CHARMM36, CHARMM27, AMBER, GROMOS,

</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">

OPLS-AA/L, … Sau đó, tạo hộp mô phỏng động lực học phân tử gồm haithông số là kích thước và hình dạng. Hai mơ hình dung môi phổ biến là bêntrong (implicit) hoặc bên ngoài (explicit), nhằm solvat hóa protein và bắtchước mơi trường sinh lý trong cơ thể. Một số mô hình dung mơi: TIP3P,TIP4P, TIP5P, SPC, SPC/E, … Một lượng ion cụ thể được thêm vào để trunghòa điện tích của hệ thống, thường là ion Na<small>+</small> hoặc Cl<small>-56</small>.

<b>- Bước 2: Thực hiện tối thiểu hóa năng lượng dựa trên thuật tốn gradient</b>

descent nhằm tìm ra cực tiểu của hàm số năng lượng<small>56</small>.

<b>- Bước 3: Cân bằng hệ thống trong các điều kiện “isothermal-isobaric” NVT</b>

(số hạt N, thể tích V và nhiệt độ T) và NPT (số hạt N, áp suất P và nhiệt độ T).Bể nhiệt (Berendsen, Velocity rescaling, Langevin, Andersen, …), được sửdụng để duy trì nhiệt độ và bể áp Parrinello-Rahman duy trì áp suất. Thuậttốn Particle Mesh Ewald dùng mô phỏng tương tác tĩnh điện học và thuậttốn Velvet được dùng để tìm các ngun tử xung quanh và biến thiên hệ theothời gian<small>56</small>.

<b>- Bước 4: Mô phỏng động lực học phân tử theo thời gian đã được thiết lập. Kết</b>

thúc q trình mơ phỏng động lực học dữ liệu kết quả sẽ được trích xuất vàphân tích kết quả để đánh giá sự chuyển động và độ bền của hệ thống<small>56</small>.

<i>Đánh giá mô phỏng động lực học phân tử</i>

Đánh giá kết quả MDs qua các đại lượng: RMSD (root‐mean‐square deviation),RMSF (root-mean-square fluctuation), tần suất của liên kết hydro, bán kính quay,diện tích bề mặt tiếp xúc với dung mơi hay tính năng lượng gắn kết, …

- RMSD (root‐mean‐square deviation): căn bậc hai của độ lệch bình phươngtrung bình của protein hoặc phối tử so với vị trí ban đầu, dùng để đánh giá độổn định của phức hợp. Giá trị RMSD được tính theo cơng thức<small>57</small>:

𝑅𝑀𝑆𝐷(𝑡<sub>1</sub>, 𝑡<sub>2</sub>) = [<sup>1</sup>

𝑁∑‖𝑟<sub>𝑖</sub>(𝑡<sub>1</sub>) − 𝑟<sub>𝑖</sub>(𝑡<sub>2</sub>)‖<small>2𝑁</small>

<small>12</small>

</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32">

Với 𝑟<sub>𝑖</sub>(𝑡<sub>1</sub>) là vị trí của nguyên tử i tại thời điểm t<small>1</small>, 𝑟<sub>𝑖</sub>(𝑡<sub>2</sub>) là vị trí của nguyêntử i tại thời điểm t<small>2</small> = 0, 𝑁 là tổng số nguyên tử trong hệ.

Thông thường, giá trị RMSD được tính trên mạch chính (backbone) củaprotein, bao gồm những nguyên tử N, Cα của protein. Cấu trúc được xem ổnđịnh và có ý nghĩa khi RMSD < 2,0 Å<small>57</small>.

- RMSF (root - mean - square fluctuation): Là căn bậc hai độ dao động trungbình bình phương để khảo sát dao động của các acid amin của protein so vớigiá trị trung bình, thể hiện độ linh động của mỗi acid amin.

Với 𝑟<sub>𝑖</sub>(𝑡<sub>𝑗</sub>) là vị trí của nguyên tử i tại thời điểm 𝑡<sub>𝑗</sub>, r<small>i</small><sup>ref</sup> là vị trí của i đối chiếu.Từ kết quả của RMSF của Cα ta có thể thấy được vùng nào của protein là ổnđịnh hoặc không. Thông thường các vùng có cấu trúc xoắn α hoặc β sẽ cóRMSF thấp do có mạng lưới liên kết hydro ổn định<small>57</small>.

- Tần suất của liên kết hydro (hydrogen bond occupancy): xem xét protein cóđược ổn định bởi các liên kết hydro giữa acid amin với phối tử hay không, daođộng bao nhiêu trong mơ phỏng<small>58</small>.

- Bán kính quay (radius of gyration - Rg) đo độ nén của protein. Nếu một proteingiữ vững cấu trúc trong q trình mơ phỏng động lực học thì giá trị Rg tươngđối ổn định<small>57</small>. Nếu một protein mở ra (không ổn định), Rg khơng tăng hoặc cóxu hướng giảm:

𝑅<sub>𝑔</sub> = (∑ |𝑟<sub>𝑖</sub> <sub>𝑖</sub>|<small>2</small>𝑚<sub>𝑖</sub>∑ 𝑚<sub>𝑖</sub> <sub>𝑖</sub> <sup>)</sup>

Với 𝑟<sub>𝑖</sub> là vị trí của nguyên tử 𝑖, 𝑚<sub>𝑖</sub> là khối lượng nguyên tử 𝑖.

Diện tích bề mặt tiếp xúc với dung môi (solvent accessible surface area SASA) cho biết diện tích bề mặt của một phân tử sinh học có thể tiếp xúc vớidung mơi, xác định độ hòa tan của protein trong nước, cách protein tương tácvới các phân tử khác và cách nó tạo thành một dạng hoạt động ổn định. Nếu

</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33">

-cấu trúc protein gấp ổn định thì diện tích bề mặt nhỏ, SASA ổn định. Nếuprotein khơng ổn định, khơng cịn cấu trúc gấp làm diện tích bề mặt lớn, giátrị SASA sẽ tăng<small>57</small>.

<b>1.3.4. Năng lượng gắn kết tự do</b>

<i>Khái niệm</i>

Trong nhiệt động lực học, năng lượng tự do (free energy) biểu diễn năng lượng dùngđể thực hiện công của một hệ và được dùng để xác định hướng diễn biến của quátrình nhiệt động cũng như xác suất hệ sẽ duy trì ở trạng thái ổn định<small>59</small>. Vì năng lượngtự do quyết định tất cả các quá trình của phân tử bao gồm khả năng gấp cuộn protein,liên kết phân tử, phản ứng học, ... nên việc xác định chính xác năng lượng tự do làmột trong những nhiệm vụ quan trọng khi nghiên cứu về các phân tử sinh học<small>59</small>.Trong lĩnh vực thiết kế thuốc hợp lý, khái niệm năng lượng gắn kết tự do (bindingfree energy-BFE) được sử dụng để mô tả độ mạnh của liên kết giữa protein và phântử thuốc. Trong đó, mục tiêu của việc thiết kế thuốc dựa trên đích tác động (structure-based) là tìm ra các hợp chất tiềm năng (lead compound) có khả năng gắn kết tốt vớiprotein đích. So với các phương pháp thử nghiệm, việc áp dụng máy tính để dự đoánnăng lượng gắn của các phức hợp protein và ligand có thể thực hiện bằng phươngpháp docking để tiết kiệm đáng kể về thời gian và chi phí thực hiện<small>59</small>.

<i>Các phương pháp tính năng lượng gắn kết</i>

Có hai cách tiếp cận để dự đoán BFE bằng phương pháp điểm cuối bao gồm tương

<b>đối và tuyệt đối (Hình 1.5). Đây là những phương pháp điểm cuối (end-point method)</b>

thường được sử dụng để dự đoán năng lượng gắn kết và đánh giá độ mạnh yếu củaliên kết giữa protein và ligand<small>79</small>. Phương pháp này dự đoán BFE dựa trên trạng tháicuối (end stage) để xác định sự chênh lệch về năng lượng giữa phức hợp protein-ligand sau khi gắn kết với protein và ligand ở dạng tự do<small>79</small>. Điều này khắc phục đượcnhược điểm về độ chính xác của dự đốn ái lực gắn kết bằng phương pháp gắn kếtphân tử<small>60</small>.

</div><span class="text_page_counter">Trang 34</span><div class="page_container" data-page="34">

<b>Hình 1.5. Cách tiếp cận của phương pháp điểm cuối (end-point method)</b><small>61</small>Các phương pháp tiếp cận tương đối gồm có MM/PBSA và MM/GBS<small>79</small>. Cả haiphương pháp này dự đoán năng lượng gắn bằng cách tính trung bình của các khunghình (hay hình ảnh chụp) thu được từ các mô phỏng động học phân tử tại các thờiđiểm khác nhau<small>61</small>. Các khung hình này có thể được thu thập từ ba quỹ đạo khác nhau:phức hợp protein-ligand, ligand và protein, hoặc chỉ một quỹ đạo giữa phức hợpprotein-ligand<sup>61</sup><b>, được trích xuất từ các mơ phỏng MDs trong dung mơi (Hình 1.5).</b>

Khi chỉ sử dụng một quỹ đạo mô phỏng, phương pháp này bỏ qua đóng góp nănglượng từ hình dạng của protein và ligand giữa trạng thái tự do và sau khi gắn kết<small>61</small>.Do đó, dự đốn dựa trên một quỹ đạo mô phỏng chỉ phù hợp khi protein và ligandkhông thay đổi nhiều về hình dạng trước và sau khi gắn kết, và được áp dụng để tiếtkiệm chi phí tính tốn<small>61</small>.

Trong khi đó, phương pháp tính tốn BFE tuyệt đối như LIE lại dự đoán năng lượnggắn dựa trên 2 mơ phỏng khác nhau<small>60</small><b> (Hình 1.5). Mơ phỏng thứ nhất bao gồm chỉ</b>

ligand trong dung mơi, cịn mơ phỏng thứ hai bao gồm phức hợp protein-ligand trongdung mơi. Sau đó, ligand và phức hợp protein-ligand sau khi được trích xuất từ 2 mơ

<i>phỏng này được sử dụng để tính tốn năng lượng van der Waals và năng lượng tĩnh</i>

điện trung bình của sự tương tác giữa ligand và dung mơi, cũng như giữa phức hợpvà dung môi<small>61</small>. Phương pháp LIE tính tốn giá trị BFE dựa trên sự chênh lệch năng

</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35">

<i>lượng van der Waals và năng lượng tĩnh điện giữa trạng thái liên kết (phức hợp) và</i>

trạng thái không liên kết (ligand) trong dung môi<small>61</small>.

Việc lựa chọn phương pháp tính tốn BFE dựa trên cách tiếp cận tương đối hay tuyệtđối phụ thuộc vào nhiều yếu tố bao gồm: tài nguyên máy tính, thời gian tiến hành vàđộ tin cậy của giá trị dự đoán.

<i><b>1.3.4.1 MM/PBSA và MM/GBSA</b></i>

Năng lượng gắn kết tự do (binding free energy) của phức hợp protein – ligand đượctính tốn bằng nguyên lý cơ học phân tử diện tích bề mặt Poisson – Boltzmann(MM/PBSA) hoặc tính tốn bằng ngun lý cơ học phân tử diện tích bề mặt sinh tổngquát (MM/GBSA).

∆𝐺<sub>𝑏𝑖𝑛𝑑𝑖𝑛𝑔</sub> = 𝐺<sub>𝑐𝑜𝑚𝑝𝑙𝑒𝑥</sub>− (𝐺<sub>𝑝𝑟𝑜𝑡𝑒𝑖𝑛</sub> + 𝐺<sub>𝑙𝑖𝑔𝑎𝑛𝑑</sub>) (1)∆𝐺<sub>𝑏𝑖𝑛𝑑𝑖𝑛𝑔</sub> = 𝐸<sub>𝑀𝑀</sub> + ∆𝐺<sub>𝑠𝑜𝑙𝑣 </sub>− 𝑇∆𝑆 (2)

∆𝐸<sub>𝑀𝑀</sub> = ∆𝐸<sub>𝑒𝑙𝑒𝑐 </sub>+ ∆𝐸<sub>𝑣𝑑𝑤</sub> (3)∆𝐺<sub>𝑠𝑜𝑙𝑣 </sub> = ∆𝐺<sub>𝑃𝐵/𝐺𝐵 </sub>+ ∆𝐺<sub>𝑆𝐴 </sub>(4)

Trong đó, 𝐺<sub>𝑐𝑜𝑚𝑝𝑙𝑒𝑥</sub>, 𝐺<sub>𝑝𝑟𝑜𝑡𝑒𝑖𝑛</sub>, 𝐺<sub>𝑙𝑖𝑔𝑎𝑛𝑑</sub> lần lượt là năng lượng của phức hợp, protein và

<i>ligand và có thể được tính bằng tổng năng lượng van der Waals (∆𝐸</i><sub>𝑣𝑑𝑤</sub><i>), năng lượng</i>

của tương tác tĩnh điện (∆𝐸<sub>𝑒𝑙𝑒𝑐 </sub>), năng lượng solvat hoá phân cực (∆𝐺<sub>𝑃𝐵/𝐺𝐵 </sub>) và nănglượng solvat hóa khơng phân cực (∆𝐺<sub>𝑆𝐴 </sub>). Sự khác biệt giữa phương pháp MM/PBSAvà MM/GBSA nằm ở các cách tính ∆𝐺<sub>𝑃𝐵/𝐺𝐵 </sub> khác nhau. Trong mơ hình MM/PBSA,thuật ngữ này được tính bằng cách giải phương trình Poisson – Boltzmann và tốn thờigian tính tốn. Trong khi trong mơ hình MM/GBSA, nó được ước lượng gần đúnghơn dựa trên mơ hình diện tích bề mặt sinh tổng quát và do đó được suy ra bằng cáchsử dụng cách tiếp cận nhanh hơn<small>59</small>.

<i>Ưu - nhược điểm</i>

Việc áp dụng tính tốn BFE bằng phương pháp này được đánh giá là có độ chính xác

</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36">

mơ phỏng động lực học<small>60</small>. Đồng thời, phương pháp này có thể tiết kiệm thời gian vàchi phí tính tốn khi các đặc điểm tương tác của dung môi được lấy giá trị trung bìnhthay vì tính trên tất cả phân tử dung mơi<small>60</small>. Vì vậy, độ chính xác của phương pháp cóthể được gia tăng khi sử dụng càng nhiều khung hình. Tuy nhiên, nhược điểm củaphương pháp chính là sự kém hiệu quả khi tính tốn các BFE của những hợp chất cóái lực tương tự nhau và tính toán năng lượng tuyệt đối của phức hợp protein-ligand<small>60</small>.

<i><b>1.3.4.2 LIE</b></i>

LIE (linear interaction energy) là phương pháp tính tốn năng lượng gắn kết tự do(BFE) bằng hàm tính điểm bán thực nghiệm và được xây dựng dựa trên liên quannăng lượng tự do tuyến tính. Năng lượng của phức hợp (bound) và ligand (free) trongdung mơi được trích xuất từ kết quả mô phỏng động lực phân tử<sup>62</sup>.

ΔG<small>bind</small> =  (Elj<small>bound</small> - Elj<small>free</small>) +  (Eqq<small>bound</small> - Eqq<small>free</small>) (5)

Trong đó: Elj<small>bound</small>, Elj<small>free</small><i> lần lượt là năng lượng tương tác van der Waals trung bình</i>

của phức hợp protein-ligand trong dung mơi và ligand với trong dung môi. Eqq<small>bound</small>,Eqq<small>free</small><i> lần lượt là năng lượng tương tác tĩnh điện trung bình của ligand-protein và</i>

ligand-dung môi. Giá trị  được xác định từ thực nghiệm là 0.181, giá trị  thay đổitùy theo cấu trúc hóa học của ligand và cơng thức sau<small>63</small>:

 = <small>o</small> +<small>∑ w</small><sub>i</sub> <sub>i</sub><small>∆β</small><sub>i</sub><small>∑ w</small><sub>i</sub> <sub>i</sub> <sup>(6)</sup>

Trong đó: <small>o </small>có giá trị là 0,43; ∆β<small>i</small>

w<small>i</small><b> được xác định dựa vào giá trị Bảng 1.3.</b>

<b>Bảng 1.3. Giá trị của tham số ∆β</b><small>i</small> và w<small>i</small> dựa trên cấu trúc hóa học của hợp chất<i><small>63</small></i>

<b>Tham số Giá trị Cấu tạo hóa học của hợp chất</b>

∆β<sub>i</sub> -0,06 Nhóm alcol

∆β<sub>i</sub> -0,04 Nhóm amin bậc 1, 2∆β<sub>i</sub> -0,02 Nhóm amid bậc 1∆β<sub>i</sub> -0,03 Nhóm acid carboxylic∆β<sub>i</sub> +0,02 Anion

</div><span class="text_page_counter">Trang 37</span><div class="page_container" data-page="37">

<b>Tham số Giá trị Cấu tạo hóa học của hợp chất</b>

∆β<sub>i</sub> +0,09 Cation

w<sub>i</sub> 1,0 Nếu cấu trúc khơng tích điệnw<sub>i</sub> 11,0 Nếu cấu trúc tích điện

<i>Ưu - nhược điểm</i>

Việc áp dụng phương pháp dự đốn BFE bằng LIE có thể cho kết quả BFE có độchính xác cao khi BFE được xác định bằng đường tuyến tính với các hệ số ,  đượcxây dựng từ thực nghiệm<small>62</small>. Vì vậy, LIE có thể dự đoán năng lượng gắn tuyệt đối giữacác ligand khác nhau trên cùng một protein<small>62</small>. Tuy nhiên, giữa các receptor/proteinkhác nhau thì các thơng số ,  là khác nhau, do đó cần xác định lại hai tham số này.Vì vậy, để khắc phục hạn chế khi chưa có dữ liệu thực nghiệm, ,  được dự đoán vàtinh chỉnh dựa trên cấu trúc hóa học của ligand<small>63</small>.

<b>1.4. Tình hình nghiên cứu trong và ngồi nước1.4.1. Tình hình nghiên cứu trên thế giới</b>

Cho đến nay, đã có nhiều nghiên cứu xác định các hợp chất tự nhiên có tiềm năng ức

<i>chế HPV thông qua sàng lọc in silico. Trong đó kỹ thuật được sử dụng nhiều nhất là</i>

gắn kết phân tử (phương pháp docking) đã xác định nhiều cấu trúc có khả năng gắntốt với các protein của HPV bao gồm: ginkgetin<small>20</small>, hợp chất 6-gingerol<small>67</small>, withaferinA<sup>15</sup>, withnolide D<sup>20</sup>, theaflavin<sup>20</sup>, hesperidin<sup>20</sup>, quercetin-3-glucoside<sup>20</sup> là chất ức chếmạnh với protein E6, E7 trong việc điều trị ung thư cổ tử cung.

<i>Nghiên cứu sâu hơn hướng đến việc kết hợp nhiều kỹ thuật in silico. Phương pháp</i>

kết hợp kỹ thuật gắn kết phân tử và mô phỏng động lực học phân tử đã xác định cácchất tiềm năng gồm: hợp chất ASK4<small>68</small>, một dẫn xuất valganciclovir<small>68</small>, hợp chất tiềmnăng dựa trên 2 khung cấu trúc đã biết là 2-aminobenzothiazole<small>69</small> và chromonemoiety<sup>69</sup><i>, stigmasterol từ Berberis aristata</i><sup>17</sup><i>, stereoemodin từ Rheum emodi</i><sup>17</sup>, n-hexadecanoic acid<small>70</small> và các chất tương tự<small>70</small> ức chế tốt protein E6, E7 của HPV.

<i>Stigmasterol từ Berberis aristata</i><small>17</small><i> và stereoemodin từ Rheum emodi</i><small>17</small><i> được nghiên</i>

</div><span class="text_page_counter">Trang 38</span><div class="page_container" data-page="38">

<i>cứu xác định là chất ức chế E1 trong điều trị ung thư cổ tử bằng phương pháp kết hợp</i>

kỹ thuật gắn kết phân tử và mô phỏng động lực học phân tử. Để khảo sát khả nănggắn kết đủ để thực hiện các hoạt tính sinh học của hợp chất tiềm năng trên proteinđích của HPV, các nghiên cứu sâu hơn sử dụng phương pháp tính tốn năng lượnggắn kết bằng phương pháp MM/GBSA đã xác định 3 thuốc tiềm năng trên thị trườngcho tác động ức chế E1 HPV 18 gồm Cinalukast, Lobeglitazone và Efatutazone<small>84</small>,bên cạnh các hợp chất tiềm năng khác như Cidofovir, Jaceosidin, ZINC111606147,ZINC362643639, ZINC96096545<sup>17,71</sup>.

<b>1.4.2. Tình hình nghiên cứu trong nước</b>

Tại Việt Nam, đã có các nghiên cứu liên quan đến việc tầm soát ung thư cổ tử cungvà tình hình nhiễm bệnh của các phụ nữ trên các tỉnh thành từ đó chỉ ra được nhữngcá thể có nguy cơ mắc bệnh ung thư hoặc đang ở giai đoạn tiền ung thư cổ tử cung,cho thấy tình hình nhiễm HPV trong cộng đồng từ đó vận động người dân thực hiệncơng tác phịng chống một cách có hiệu quả. Tuy nhiên, hiện nay chưa có nghiên cứunào nhằm tìm kiếm các hợp chất có tác dụng liên quan đến điều trị HPV, đặc biệt làcác hợp chất tác động trên protein E1.

</div><span class="text_page_counter">Trang 39</span><div class="page_container" data-page="39">

<b>CHƯƠNG II: PHƯƠNG PHÁP NGHIÊN CỨU</b>

<b>2.1. Đối tượng nghiên cứu</b>

Đối tượng bao gồm mục tiêu tác động protein E1 của HPV và chất ức chế tiềm năng.

- Được kết tinh ở dạng tự do, khơng gắn với ligand (apo-protein).

<b>Hình 2.6. Hình minh họa cấu trúc của vùng gắn kết ADN của protein E1 HPV18 từ</b>

ngân hàng dữ liệu Protein (PDB ID: 1R9W)

<b>2.1.2. Cơ sở dữ liệu</b>

Cơ sở dữ liệu cho quá trình sàng lọc gồm 286 hợp chất tự nhiên (HCTN) được phânlập và chiết xuất từ dược liệu. Các hợp chất này được thu thập từ các khóa luận củabộ môn Dược Liệu - Khoa Dược - Đại Học Y Dược TP.HCM từ năm 2005 đến năm2020. Hai thuốc sử dụng trong điều trị HPV là Podofilox và Imiquimod được tải vềtừ cơ sở dữ liệu PubChem. Cấu trúc 2D của các HCTN được chuẩn bị bằng phần

</div><span class="text_page_counter">Trang 40</span><div class="page_container" data-page="40">

mềm ChemSketch 2022.1.2 dưới dạng tập tin *.sdf, sau đó được chuyển sang cấu trúc3D dưới dạng tập tin *.pdb và *.pdbqt bằng phần mềm Discovery Studio Visualiser2021 và Autodock Tools 1.5.6 để làm dữ liệu cho quá trình xác định các cấu trúc tiềm

<b>năng (Phụ lục 1).</b>

<b>2.1.3. Phần mềm nghiên cứu</b>

<b>Các phần mềm được sử dụng trong nghiên cứu được liệt kê trong Bảng 2.4</b>

<b>Bảng 2.4. Danh sách phần mềm sử dụng</b>

<b>Phần mềm Mục đích Bản quyền TLTKChemSketch</b>

Vẽ cấu trúc 2D của ligand Mở <small>72</small>

<b>Discovery StudioVisualiser 2021</b>

<b>Autodock Tools1.5.6</b>

Chuẩn bị protein, ligand và thôngsố gắn kết

<b>Autodock Vina1.1.2</b>

<b>Gromacs 2022.5 </b> Mô phỏng động lực học phân tử Mở <sup>76</sup>

<b>CHARMM36 </b> Thiết lập các trường lực cho độnglực học phân tử

<b>gmx lie </b> Tính BFE bằng phương pháp LIE Mở <small>76</small>

<b>gmx_MMPBSA </b> Tính BFE bằng phương phápMM/PBSA và phương phápMM/GBSA

<b>Clustal Omega </b> So sánh trình tự acid amin trongkhoang gắn của E1 HPV 18 vớicác tuýp HPV còn lại và đánh giákết quả thu được từ MSA dựa trêncây phát sinh loài

</div>

×