Tải bản đầy đủ (.pdf) (179 trang)

Ứng dụng phương pháp mô phỏng động lực phân tử nghiên cứu tương tác giữa phối tử với Protein và ADN153824

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.51 MB, 179 trang )


MỤC LỤC


Trang
MỞ ĐẦU
1
CHƯƠNG 1 TỔNG QUAN
6
1.1. PHƯƠNG PHÁP ĐỘNG LỰC PHÂN TỬ
6
1.1.1. Phương trình Newton
6
1.1.2. Giải phương trình Newton trên máy tính
8
1.1.2.1. Thuật toán bước nhẩy ếch (Leap-frog)
8
1.1.2.2.Thuật toán Verlet
9
1.1.2.3.Thuật toán Beeman
10
1.1.2.4. Thuật toán thử - chỉnh
10
1.1.2.5. Thuật toán Gear
10
1.1.3. Tạo trạng thái khởi đầu
11
1.1.4. Điều kiện biên tuần hoàn
13
1.1.5. Thế tương tác cặp
13


1.1.6. Thế Lennard-Jones
14
1.1.7. Thế t
ương tác Coulomb
15
1.2. PHƯƠNG PHÁP HOÁ LƯỢNG TỬ
17
1.2.1. Phương trình Schroedinger
17
1.2.1.1. Toán tử Hamilton
17
1.2.1.2. Hàm sóng
19
1.2.2. Các phương pháp tính hoá lượng tử
20
1.2.2.1. Phương pháp trường tự hợp Hartree-Fock
20
1.2.2.2. Phương pháp tổ hợp tuyến tính các obitan nguyên tử
25
1.2.2.2.1. Phương pháp Huckel mở rộng 27
1.2.2.2.2. Phương pháp ZDO 27
1.2.2.2.3. Phương pháp CNDO 28
1.2.2.2.4. Phương pháp INDO 28
1.2.2.2.5. Phương pháp MINDO 29
1.2.2.2.6. Phương pháp MNDO 29

1.2.2.2.7. Phương pháp AM1 30
1.2.2.2.8. Phương pháp PM3 30
1.2.2.2.9. Phương pháp ZINDO 30
1.2.2.2.10. Phương pháp ZINDO/S 31

1.2.2.3. Phương pháp nhiễu loạn
31
1.2.2.4. Phương pháp phiếm hàm mật độ
32
1.3. PHƯƠNG PHÁP ĐỘNG LỰC PHÂN TỬ BÁN LƯỢNG
TỬ
37
1.3.1. Định lý Hellmann-Feynman
37
1.3.2. Hệ động lực phân tử cổ điển
40
1.3.3. Hệ động lực - một - phân tử lượng tử
41
1.3.4. Hệ động lực - nhiều - phân tử bán lượng tử
42
1.4. T
ỔNG QUAN CÁC NGHIÊN CỨU GẮN KẾT PHỐI T


LÊN ADN VÀ PROTEIN
44
1.4.1. Quá trình gắn kết và những nghiên cứu gắn kết trên
thế giới
44
1.4.2. Những nghiên cứu gắn kết ở Việt Nam
46
CHƯƠNG 2 PHƯƠNG PHÁP NGHIÊN CỨU
47
2.1. CHƯƠNG TRÌNH MÁY TÍNH
47

2.1.1. Ngôn ngữ lập trình FORTRAN
47
2.1.2. Thuật giải và chương trình
48
2.2. CÁC SUBROUTINE CHÍNH ĐƯỢC SỬ DỤNG TRONG
MD44
50
2.2.1. Thuật toán Verlet
50
2.2.2. Thuật toán Gear
51
2.2.3. Thuật toán xếp các phân tử vào nút mạng lập phương
tâm mặt
53
2.2.4. Cấp phát v
ận tốc ban đầu
55
2.2.5. Xếp các phân tử khác loại vào mạng
56
2.2.6. Điều kiện biên tuần hoàn
57
2.2.7 Thế Lennard - Jones
57
2.2.8. Thế tương tác Coulomb
61

2.3. SUBROUTINE GAMESS
67
2.4. CÁC ĐẠI PHÂN TỬ ĐƯỢC KHẢO SÁT TRONG LUẬN
ÁN

69
2.4.1. Phân tử ADN
69
2.4.2. Phân tử protein
70
2.4.3. Biểu diễn cấu trúc đám và cấu trúc phân tử
70
CHƯƠNG 3 KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN
71
3.1. CẢI TIẾN VÀ NÂNG CẤP PHẦN MỀM SQUARED
71
3.1.1. Hộp mô phỏng - kỹ thuật lưới
71
3.1.2. Nguyên tử hiđro thay thế
78
3.1.3. Gắn kết trên phân tử protein và những điểm khác với
nghiên cứ
u trên phân tử ADN
80
3.1.4. Xử lý số liệu và biểu diễn các phân tử
81
3.2. KẾT QUẢ MÔ PHỎNG GẮN KẾT CÁC PHÂN TỬ NHỎ
TRÊN PHÂN TỬ ADN
86
3.2.1. Gắn kết của các phân tử kém hoạt động
86
3.2.1.1. Cacbon monoxit gắn kết trên ADN
86
3.2.1.2. Fomanđehit gắn kết trên ADN
91

3.2.2. Gắn kết của các phân tử mang tính bazơ
94
3.2.2.1. Urê gắn kết trên ADN
94
3.2.2.2. Hiđrazin gắn kết trên ADN
97
3.2.3. Gắn kết của các phân tử mang tính axit
100
3.2.3.1. Axit fomic gắn kết trên ADN
100
3.2.3.2. Axit xianhyđric gắn kết trên ADN
103
3.2.4. Gắn kết của các phân tử trung tính
106
3.2.4.1. Nước gắn kết trên ADN
106
3.2.4.2. Rượu metylic gắn kết trên ADN
110
3.2.5. Gắn kết của phân tử có kích thước cồng kềnh
112
3.3. KẾT QUẢ MÔ PHỎNG GẮN KẾT CÁC PHÂN TỬ NHỎ
TRÊN PHÂN TỬ PROTEIN
115
3.3.1. Axit axetic gắn kết trên protein
115

3.3.2. Hiđrazin gắn kết trên protein
120
3.3.3. Urê gắn kết trên protein
122

3.3.4. Vai trò lực lượng tử trong quá trình gắn kết
126
3.3.4.1. Các yếu tố ảnh hưởng đến sự biến thiên năng lượn
g

của đám gắn kết
126
3.3.4.2. Toạ độ nguyên tử H của phân tử protein
128
3.3.4.3. Vai trò của lực lượng tử trong quá trình gắn kết
129
KẾT LUẬN
131
DANH MỤC CÁC CÔNG TRÌNH CÔNG BỐ CỦA TÁC GIẢ
133
TÀI LIỆU THAM KHẢO
134
PHỤ LỤC
148

CÁC KÝ HIỆU VIẾT TẮT


Å: Angstron (đơn vị đo độ dài, 1Å =10
-10
m).
a.u.: Đơn vị nguyên tử.
Cluster: Đám nguyên tử.
ADN: DNA - Deoxiribo nucleic acid.
Doking: Bến đỗ, gắn kết.

Gamess - General atomic and molecular electronic structure system. (Chương
trình tính toán hóa lượng tử Gamess).
SQADN: Semi Quantum for ADN.
SQDOCK: Semi Quantum for Docking on protein.
HF - Hatree Fock: Phương pháp gần đúng Hatree Fock.
LJ 6-12 - Lennard - Jones 6-12: Hàm thế Lennard - Jones.
MD - Molecular Dynamics: Động lực phân tử.
MM - Molecular mechanics: Mẫu cơ học phân tử.
PM3, AM1: Các phương pháp bán kinh nghiệm PM3 và AM1.
SQMD - Semi quantum molecular dynamics.
dQ: Biến thiên năng lượng lượng tử.
dE (ΔE): Biến thiên năng lượng tạo đám.
E
LJ
(LJ): Năng lượng hàm thế Lennard - Jones.
E
C
(C): Năng lượng tương tác Coulomb.
Relaxation: Sự hồi phục, quá trình hồi phục.
Active site: Vị trí hoạt động.
Pocket: Túi gắn kết (Chứa phối tử, nằm sâu trong phân tử lớn).
Binding site: Vị trí gắn kết.
Ligand: Phối tử, phân tử nhỏ.
Grid: Kỹ thuật lưới.
Cascadeur: Nguyên tử thay thế
Cell: Tế bào (không gian được khảo sát trong hộp mô phỏng).
Đại phân tử: Phân tử lớn (DNA hoặc Protein).
PC: Personal Computer (Máy tính cá nhân).
e


: Electron.
KS: Kohn - Sham.
HK: Hohenberg - Kohn.
OMQD: One molecule quantum dynamic
SQMD: Semi quantum molecules dynamic
BO: Bohrn Oppenheimer
Kí hiệu các nguyên tử:

Ghi chú:
Do chương trình máy tính sử dụng quy ước quốc tế, dấu (.) được sử
dụng thay cho dấu phẩy (,) để ngăn cách giữa phần nguyên và phần thập
phân của số. Để tiện cho việc xử lí số liệu, trong luận án này xin được giữ
nguyên cách dùng số của máy tính.

H
C
N
O
P
DANH MỤC HÌNH

Hình 1.1.
Minh họa hai phương trình Newton
Hình 1.2.
Thuật toán bước nhẩy ếch để tính tích phân các phương trình
Newton. Trục t, xác định các giá trị hằng số khi tính tích phân
Hình 1.3.
Sơ đồ bề mặt thế năng
{
}

{
}
[
]
Ii
R, E
ψ

Hình 2.1.
Lưu đồ thuật giải chương trình.
Hình 2.2.
Chuỗi đơn ADN được sử dụng trong khảo sát
Hình 2.3.
Cấu trúc các bazơ nitơ trong chuỗi ADN
Hình 2.4.
Phân tử protein được sử dụng trong khảo sát
Hình 3.1.
Hộp mô phỏng chuỗi ADN
Hình 3.2.
Phân tử protein trong hộp mô phỏng
Hình 3. 3.
Biến thiên năng lượng (a); Khoảng cách gần nhất đến ADN (b);
Độ dài liên kết CO (c)- phụ thuộc vào số bước hồi phục
Hình 3.4.
Cấu trúc đám khi gắn CO vào các nhóm bazơ nitơ của DNA C(2) -
(a), (b), (c); A(3) -(d); A(1) -(e); T(1) -(f)
Hình 3.5.
Cấu trúc phân tử ADN có phân tử CO gắn lên C(2)
Hình 3.6.
Cấu trúc đám, khi HCHO gắn kết lên các bazơ nitơ của ADN (a),

(b), (c) ứng với nhóm A(1), A(2), A(3); (d), (e) ứng với nhóm C(1),
C(2); (f), (g) ứng với nhóm T(1), T(2)
Hình 3.7
. Cấu trúc đám, khi urê gắn kết lên các bazơ nitơ của ADN (a), (b),
(c) ứng với nhóm A(1), A(2), A(3) ; (d), (e) ứng với nhóm C(1),
C(2) ; (f), (g), (h) ứng với nhóm G(1), G(2), G(3); (i), (j) ứng với
nhóm T(1), T(2)
Hình 3.8. Cấu trúc đám, khi hiđrazin gắn kết lên các bazơ nitơ của ADN (a),
(b), (c) ứng với nhóm A(1), A(2), A(3); (d), (e) ứng với nhóm
C(1), C(2); (f), (g), (h) ứng với nhóm G(1), G(2), G(3); (i), (j) ứng
với nhóm T(1), T(2)
Hình 3.9.
Cấu trúc các đám, khi HCOOH gắn kết lên các bazơ nitơ (a), (b),
(c) ứng với nhóm A(1), A(2), A(3); (d), (e) ứng với nhóm C(1),
C(2); (f), (g), (h) ứng với nhóm G(1), G(2), G(3); (i), (j) ứng với
nhóm T(1), T(2)
Hình 3.10
. Cấu trúc đám hình thành khi HCN gắn kết lên các bazơ nitơ ADN.
(a), (b), (c): ứng với nhóm A(1), A(2), A(3); (d), (e): ứng với
nhóm C(1), C(2); (f), (g), (h): ứng với nhóm G(1), G(2), G(3); (i),
(j): ứng với nhóm T(1), T(2)
Hình 3.11
. Cấu trúc các đám H
2
O gắn kết lên các bazơ nitơ trong ADN (a),
(b), (c) ứng với nhóm A(1), A(2), A(3); (d), (e) ứng với nhóm
C(1), C(2); (f), (g), (h) ứng với nhóm G(1), G(2), G(3); (i), (j) ứng
với nhóm T(1), T(2)
Hình 3.12
. Cấu trúc các đám CH

3
OH gắn kết lên các bazơ nitơ trong ADN
(a), (b), (c) ứng với nhóm A(1), A(2), A(3)
Hình 3.13
. Cấu trúc các đám C
6
H
5
CH
2
NH
2
(benzylamin) gắn kết lên các
bazơ nitơ trong ADN (a), (b), (c) ứng với nhóm A(1), A(2), A(3);
(d), (e) ứng với nhóm C(1), C(2); (f), (g), (h) ứng với nhóm G(1),
G(2), G(3); (i), (j) ứng với nhóm T(1), T(2)
Hình 3.14
. Cấu trúc đám khi axit axetic gắn kết lên Ala(151) -a, và Ser (194)
-b
Hình 3.15
. Cấu trúc đám khi axit axetic gắn kết lên:Ser (158) -a, và Phe(64) -b
Hình 3.16. Biến thiên năng lượng theo số bước hồi phục (a) Biến thiên độ dài
liên kết O-H của axit axetic theo số bước hồi phục (b) Biến thiên
r
min
, từ axit axetic đến protein theo bước hồi phục (c)
Hình 3.17
. Cấu trúc đám hiđrazin gắn kết lên Ser(176)-(a), Asn (210)-(b) và
Trp(192)-(c)
Hình 3.18

. Cấu trúc đám hiđrazin gắn kết lên Ser(66)-(a), Gly(4)-(b)
Hình 3.19.
Cấu trúc đám khi urê gắn kết lên Asn (54) -a, và Tyr (131) -b
Hình 3.20
. Cấu trúc đám urê gắn kết lên Gln(198)-(a), Gln(47)-(b) và
Tyr(42)-(c)
Hình 3.21
. Gln(242) nằm giữa Leu(241) và Cys(243), nguyên tử H thay thế
(vị trí cắt đám) ký hiệu là chấm đen
Hình 3.22
. Sự phụ thuộc các giá trị năng lượng vào số bước hồi phục
Hình 3.23
. Sự phụ thuộc của các giá trị năng lượng-(a) r
N-H
, r
min
-(b) vào số
bước hồi phục (SCF không hội tụ, Asn(37))

DANH MỤC BẢNG

Bảng 3.1. Năng lượng, khoảng cách r
min
, liên kết R
C-O
khi CO gắn lên các
đám của
ADN
Bảng 3.2. Khoảng cách của HCHO đến ADN trong các nhóm gắn kết
Bảng 3.3. Độ dài liên kết hiđro khi urê gắn kết lên các nhóm bazơ nitơ

Bảng 3.4. Độ dài liên kết hiđro của đám gắn kết hình thành khi hyđrazin gắn
lên các nhóm bazơ nitơ của ADN

Bảng 3.5. Độ dài liên kết hiđro của đám gắn kết hình thành khi HCOOH gắn
lên các nhóm bazơ nitơ của ADN
Bảng 3.6.
Độ dài liên kết hiđro của đám gắn kết hình thành khi HCN gắn lên
các nhóm bazơ nitơ của ADN

Bảng 3.7. Độ dài liên kết hiđro khi H
2
O gắn kết lên các nhóm bazơ nitơ
Bảng 3.8.
Độ dài liên kết hiđro khi CH
3
OH gắn kết lên các nhóm bazơ nitơ
Bảng 3.9.
Khoảng cách của C
6
H
5
CH
2
NH
2
đến nguyên tử gần nhất trong của
nhóm bazơ nitơ trong đám hình thành sau gắn kết
Bảng 3.10.
Năng lượng tổng cộng (E), Năng lượng tạo phức (
Δ

E),độ dài liên kết
O-H, Khoảng cách nguyên tử gần nhất giữa phối tử và protein (r
min
)
Bảng 3.11.
Năng lượng tổng cộng (E), Năng lượng tạo phức (
Δ
E),độ dài liên kết
N-H, Khoảng cách nguyên tử gần nhất giữa phối tử và protein (r
min
)
Bảng 3.12.
N ăng lượng tổng cộng (E), Năng lượng tạo phức (
Δ
E),độ dài liên kết
N-H, Khoảng cách nguyên tử gần nhất giữa phối tử và protein (r
min
)
Bảng 3.13.
Sự ảnh hưởng của kích thước, độ bội, nguyên tử H thay thế đến
năng lượng hình thành đám
Bảng 3.14
. Toạ độ và biến thiên năng lượng tạo đám của nhóm Ser(250)
trong quá trình hồi phục tạo đám gắn kết với urê




MỞ ĐẦU


1
MỞ ĐẦU
Trong cơ thể sinh vật luôn luôn xảy ra quá trình kết hợp và phân tách
của những phân tử, đó là các quá trình sinh hoá để duy trì sự tồn tại của sinh
vật. ADN và protein là những đại phân tử trong cơ thể, có vai trò vô cùng
quan trọng với sự sống, thể hiện ở khả năng kết hợp với các phân tử khác
cũng như khả năng phân tách của chúng. Quá trình gắn kết (docking) của các
phân tử nhỏ (phối tử - ligand) lên đại phân tử
ADN hay protein là một trong
những quá trình sinh hoá trong cơ thể sinh vật, đang được các nhà khoa học
trên thế giới rất quan tâm. Quá trình gắn kết khi được xét ở mức độ cơ sở
phân tử, luôn được bắt đầu bằng quá trình phối tử tiến lại gần đại phân tử rồi
gắn kết vào vị trí thích hợp (active site) trên đại phân tử. Xác định “vị trí thích
hợp” ở đâu trên đại phân tử, cũng như nghiên cứ
u cấu trúc của phức hình
thành: “phối tử - đại phân tử” chính là mục đích nghiên cứu của luận án.
Trong những thập kỷ gần đây, đặc biệt là những năm gần đây, công
nghệ máy tính, tin học phát triển một cách nhanh chóng và kỳ diệu, đủ đáp
ứng yêu cầu của những bài toán lớn, phức tạp mà trước đó không thể thực
hiện được. Song song với sự phát triển của công ngh
ệ máy tính, các ngôn ngữ
lập trình (Pascal, C++, Fortran, Visual basic…) liên tục được cải tiến, ngày
càng gần gũi, thân thiện và dễ sử dụng. Fortran là ngôn ngữ lập trình cấp cao,
được các nhà khoa học ưa chuộng và sử dụng rộng rãi, đặc biệt trong các
nghiên cứu về mô phỏng. Hiện nay có rất nhiều phần mềm được sử dụng
trong mô phỏng và tính toán các hệ “protein-phối tử” như là: Monte Carlo,
MD, Gamess, Fhi, Mopac… được viết bằng ngôn ngữ Fortran với mã nguồ
n
(source code) được cung cấp miễn phí.
Những nghiên cứu trước đây về gắn kết đều sử dụng tương tác cơ học

phân tử - MM (Molecular mechanics). Ưu điểm của mẫu cơ học phân tử là
khả năng tính toán nhanh và thích hợp với những hệ có số nguyên tử lớn. Tuy



MỞ ĐẦU

2
vậy, những kết quả thu được từ mẫu MM chỉ mang tính gần đúng và có
những giới hạn nhất định khi sử dụng. Để nghiên cứu bức tranh chi tiết của
quá trình gắn kết,


đặc biệt khi cần phải khảo sát quá trình di chuyển electron
giữa “phối tử với ADN hoặc protein” xảy ra trong quá trình hoạt động hoá
phức trung gian Michaelis, tương tác lượng tử cần được tính đến. Tuy có ưu
điểm là tính chính xác cao nhưng các phương pháp lượng tử lại đòi hỏi chi phí
thời gian tính toán rất lớn và rất khó khăn khi áp dụng với các đối tượng có
kích thước lớn như phân tử ADN và protein. Một trong những xu hướng gần
đ
ây để giải quyết những khó khăn gặp phải trong nghiên cứu gắn kết là sử
dụng gần đúng đám nguyên tử (cluster) [5, 15] kết hợp với gần đúng bán
lượng tử. Ý tưởng của phương pháp gần đúng này là: tương tác giữa phối tử
và những nguyên tử gần (của ADN hoặc protein) thuộc về đám thì sử dụng
tính toán lượng tử, tương tác giữa phối tử và nh
ững nguyên tử còn lại (nguyên
tử xa) nằm ngoài đám của đại phân tử được tính toán bằng cơ học phân tử.
Thước đo độ bền của phức được hình thành giữa phối tử và phân tử lớn là
năng lượng tổng cộng của hệ “phối tử - đại phân tử” đạt cực tiểu. Hiện nay
trên thế giới chưa có một tính toán nào sử dụng trực tiếp tính toán lượ

ng tử
vào nghiên cứu gắn kết của phối tử và đại phân tử. Theo những phần mềm
tính toán về gắn kết hiện nay [16, 20, 33, 34, 50, 91, 99], năng lượng tính
được có sai số khoảng 15% so với hàng rào năng lượng tạo phức gắn kết, nên
nhiệm vụ của luận án này mong muốn sử dụng ý tưởng “đám gắn kết” [59]
tính toán trực tiếp tương tác lượng tử trong các nghiên cứu gắn kết.
Nh
ằm đáp ứng nhu cầu cấp thiết về nghiên cứu quá trình gắn kết, cùng
với nguồn tài nguyên sẵn có (mã nguồn của MD44 và Gamess được cung cấp
miễn phí) nên chúng tôi chọn nghiên cứu đề tài “Ứng dụng phương pháp mô
phỏng động lực phân tử nghiên cứu tương tác giữa phối tử với protein và
ADN”. Bằng việc cải tiến, nâng cấp mã nguồn mở của hai phần mềm MD44



MỞ ĐẦU

3
và Gamess, đồng thời thêm các chương trình con cần thiết, các thuật toán mới
nhằm áp dụng trên đối tượng là các phối tử nhỏ gắn kết lên các đại phân tử.
Nghiên cứu gắn kết của phối tử lên ADN và protein cần tiến hành cải
tiến hai phần mềm MD44 và Gamess, tổ hợp hai phần mềm cho các tính toán
tương tác xa và tương tác gần. Phương pháp hồi phục động lực phân tử bán
lượng tử được sử dụ
ng trong luận án để nghiên cứu tìm cấu trúc và tìm vị trí
đám hình thành trên phân tử ADN và protein. Với phương pháp gần đúng
đám nguyên tử, kết hợp với kỹ thuật lưới (grid), kỹ thuật nguyên tử H thay thế
(cascadeur), sử dụng ngôn ngữ lập trình FORTRAN ghép nối hai phần mềm
MD44 và Gamess, nhằm nâng cấp phần mềm SQUARED (vẫn được sử dụng
để nghiên cứu các phản ứng trong pha khí) tạo ra phần mềm SQADN sử

dụng
để nghiên cứu sự gắn kết phối tử nhỏ (CO, HCHO, H
2
O, CH
3
OH, HCN,
HCOOH, H
2
N-NH
2
, (NH
2
)
2
CO, C
6
H
5
CH
2
NH
2
) cho đối tượng phân tử ADN.
Tiếp tục nâng cấp phần mềm SQADN thành phần mềm SQDOCK để nghiên
cứu sự gắn kết các phối tử nhỏ ((NH
2
)
2
CO, H
2

N-NH
2
, CH
3
COOH) lên phân
tử protein. Các nghiên cứu với các phối tử được chọn nhằm mục đích kiểm
chứng tính đúng đắn của hai phần mềm thu được, nên các tính toán trong luận
án tập trung vào các tính chất định tính, các quy luật tự nhiên ảnh hưởng đến
quá trình gắn kết, để minh chứng cho sự phù hợp của phương pháp tính và
mức độ tin cậy của các phần mềm thu được.
Trong luận án này, các phối tử nhỏ nêu trên được g
ắn kết lên một đoạn
mạch đơn ADN bao gồm 10 bazơ nitơ. Với mục đích xây dựng mô hình tính
toán, đoạn ADN được cắt ra từ một chuỗi xoắn kép ADN để đại phân tử có
mức độ phức tạp vừa phải, chứa các bazơ nitơ ở các vị trí ngẫu nhiên, phù
hợp yêu cầu cho mô hình thử nghiệm nghiên cứu quá trình gắn kết. Phân tử
protein được chọn để nghiên c
ứu là nhánh A của phân tử 3ptb gồm 222 axit



MỞ ĐẦU

4
amin cấu tạo nên, file cấu trúc phân tử Protein (3ptb.pdb) được lấy trong ngân
hàng dữ liệu protein (Protein Data Bank - pdb).
Những điểm mới của luận án:
Với ý tưởng đám, bằng việc kết hợp tính toán lượng tử ở khoảng cách
gần, lực cơ học phân tử ở khoảng cách xa, lần đầu tiên chúng tôi đã khảo sát
tính toán trực tiếp được tương tác “phối tử-đại phân tử

” bằng lực lượng tử.
Bằng việc viết thêm các chương trình con, với các ý tưởng mới: hộp
mô phỏng, kỹ thuật lưới, nguyên tử H thay thế, luận án đã nâng cấp phần
mềm SQUARED thành phần mềm mới SQADN và SQDOCK cho nghiên cứu
các đối tượng sinh hoá.
Sử dụng các phần mềm thu được, nghiên cứu quá trình gắn kết của các
phối tử nhỏ lên ADN cho những kết quả: xác định được cấu trúc
đám hình
thành sau gắn kết, tính được độ dài liên kết hiđrô trong các đám hình thành,
xác định được vị trí gắn kết tốt nhất trên đại phân tử ứng một phối tử xác
định, đồng thời xác định được các yếu tố ảnh hưởng đến khả năng gắn kết của
phối tử nhỏ lên đại phân tử. Những kết quả này phù hợp với các quy luật
chung đã khẳ
ng định phương pháp nghiên cứu là phù hợp và phần mềm thu
được có độ tin cậy và độ chính xác cần thiết.

Ý nghĩa khoa học và ý nghĩa thực tiễn của luận án:
Luận án nghiên cứu về gắn kết phối tử lên phân tử lớn lần đầu tiên
được thực hiện tại Việt nam, là một hướng nghiên cứu lý thuyết sẽ gắn liền
với thực tiễn trong tương lai. Những kết quả thu được của luận án là định
hướng cho nghiên cứu tìm vị trí gắn kết trên đại phân tử củ
a mỗi loại phối tử
khác nhau. Bên cạnh đó, cấu trúc đám hình thành và khả năng gắn kết của
phối tử lên đại phân tử có mối liên hệ rất gần gũi với cơ chế hoạt động của
thuốc cũng như khả năng nhiễm bệnh của cơ thể sinh vật. Kết quả của luận án
có thể mở rộng áp dụng cho việc
định hướng, đánh giá khả năng điều trị của




MỞ ĐẦU

5
thuốc chữa bệnh, cũng như phát hiện những nguyên nhân gây bệnh mà sinh
vật mắc phải. Đây là một trong những bước phát triển của Hoá lý thuyết áp
dụng trong Hoá dược để nghiên cứu khả năng và tác dụng của thuốc.
Bố cục của luận án:
Phần mở đầu: giới thiệu mục đích của đề tài, lý do chọn đề tài, đối tượng
nghiên cứu và ý nghĩa khoa học và ý ngh
ĩa thực tiễn của luận án.
Phần tổng quan: giới thiệu cơ sở lý thuyết của phương pháp động lực phân
tử, phương pháp hoá lượng tử và phương pháp động lực phân tử bán lượng tử.
Phần phương pháp nghiên cứu: giới thiệu về ngôn ngữ lập trình sử dụng
trong luận án, đồng thời giới thiệu các chương trình con quan trọng, các thuật
giải được sử
dụng trong hai phần mềm MD44 và Gamess.
Phần kết quả nghiên cứu và thảo luận: gồm 3 phần
Phần 1 trình bày về sản phẩm phần mềm của luận án: phần mềm
SQADN và SQDOCK, đồng thời giới thiệu các phần mềm xử lý số liệu và
các thuật toán mới sử dụng trong luận án.
Phần 2 trình bày các kết quả thu được khi sử dụng phần mềm SQADN
cho nghiên cứu gắn kết các ph
ối tử nhỏ lên phân tử ADN.
Phần 3 trình bày các kết quả thu được khi sử dụng phần mềm SQDOCK
cho quá trình gắn kết các phối tử nhỏ lên phân tử protein. Đồng thời chỉ ra vai
trò của lực lượng tử trong quá trình mô phỏng hồi phục.
Phần kết luận: Trình bày các kết quả chính của luận án.
Các kết quả chủ yếu của luận án đã được công bố trong 9 bài báo đăng
trên các tạp chí khoa học và các h
ội nghị chuyên ngành.



TỔNG QUAN

6
CHƯƠNG 1
TỔNG QUAN
1.1. PHƯƠNG PHÁP ĐỘNG LỰC PHÂN TỬ (MD: MOLECULAR
DYNAMICS)
1.1.1. Phương trình Newton [1, 3]
Phương trình Newton trong cơ học cổ điển xác định mối liên hệ giữa
quãng đường một vật có thể dịch chuyển với vận tốc, giữa vận tốc với gia tốc
và giữa gia tốc với lực tác dụng.
Khi xét chuyển động của một hạt A theo phương x. Biến thiên tọa độ x
của hạt theo th
ời gian xác định vận tốc v của hạt
dx
=v
dt

(1.1)
Đạo hàm bậc hai của x theo thời gian xác định gia tốc a của hạt
2
2
dx dv
==a
dt dt

(1.2)
Mặt khác, gia tốc tỷ lệ thuận với lực tác dụng f

fm.a
=

(1.3)
trong đó m là khối lượng của hạt. Kết hợp (1.2) và (1.3) ta được:
2
2
dx dv f
dt dt m
=
=
(1.4)

Hình 1.1.
Minh họa hai phương trình Newton
Trong một hệ có chứa N hạt tham gia vào chuyển động nhiệt, mỗi hạt
có vận tốc v
i
, i = 1, 2,…N, với v = (v
x
, v
y,
v
z
). Lực tương tác của các hạt lân
cận tác dụng lên hạt i là F
i
. Phương trình Newton có dạng:



TỔNG QUAN

7
a. Phương trình Newton 1
ii
i
s
rp
v
tm

==


(1.5)
trong đó
isi
p
mv=
là vectơ động lượng của i, s ký hiệu loại hạt s trong hệ.
b. Phương trình Newton 2
2
iiii
i
2
ss
rv p F
1
a
ttmt m

∂∂ ∂
== ==
∂∂ ∂
hay
i
i
p
F
t

=


(1.6)
trong đó F
i
là tổng hợp lực tác dụng của tất cả các lân cận lên i. Nên:


=
=
1
0
J
J
iji
fF

(1.7)
J<<N do chỉ tính đến các lân cận gần của i.

Các phương trình Newton
1 và 2 được viết cho N nguyên tử tạo thành
hệ 6N phương trình. Giải hệ 6N phương trình này sẽ thu được các giá trị của
p
i
, r
i
, và F
i
ở các thời điểm tương ứng.
Trong trường hợp đơn giản nhất nếu chọn ∆t đủ nhỏ sao cho các giá trị
động lượng và lực tương tác được xem là không đổi, ta có thể phân tích lần
lượt các phương trình (1.5) và (1.6) cho kết quả:
ii
ptF
Δ


(1.8)

Nên: (p
i
)
mới
= (p
i
)

+ ∆p
i

(1.9)
∆r
i
= ∆t.(p
i
)
mới
/ m
s

(1.10)
Ta có: (r
i
)
mới
= (r
i
)

+ ∆r
i

(1.11)
Nếu hình dung, xuất phát từ thời điểm
t
1
với các tọa độ hạt (r)
1
và động
lượng (

p)
1
thì từ (r)
1
có thể tính được lực tương tác lên mỗi hạt F
i
Với các
phương trình (1.8) và (1.9) dễ dàng tính được (
p)
2
ở thời điểm t+∆t. Biết (p)
2

từ các phương trình (1.10) và (1.11) có thể xác định được các tọa độ mới (
r)
2
.
Vậy, ở mỗi thời điểm bằng bội số của ∆t, đều có thể xác định được:
1) Tọa độ của mỗi hạt
2) Vận tốc (động lượng) của mỗi hạt.


TỔNG QUAN

8
Từ tọa độ các hạt có thể xác định được thế năng tương tác, từ vận tốc
có thể xác định được động năng của hệ. Tất cả các dữ liệu này đối với mỗi
bước, mỗi hạt đều có thể ghi được vào các tệp dữ liệu trên máy tính.
1.1.2. Giải phương trình Newton trên máy tính
Phần 1.1.1. đã trình bày những nguyên lý cơ bản của phương pháp

động lực phân tử dựa trên việc giải phương trình Newton chuyển động của hệ
N hạt. Các phương trình (1.9) và (1.11) thu được khi xem gần đúng trong
khoảng thời gian ∆t lực F và động lượng P không đổi. Có nhiều cách khác
nhau để giải gần đúng hệ phương trình vi phân nêu trên cho kết quả khá chính
xác. Dưới đây, chúng ta xem xét một số thuật toán phổ biến.
1.1.2.1. Thuật toán bước nhẩy ếch (leap-frog)
Nội dung cơ bản của thuật toán như sau:
Chọn một khoảng thời gian ∆t hợp lý. Lấy tích phân phương trình (1.5)
từ bước mô phỏng thứ n-1/2 đến bước n+1/2 khi chọn
F
i
của bước thứ n là
hằng số để lấy tích phân. Sau đó, tích phân phương trình (1.6) từ bước n đến
bước n+1 đồng thời chọn p
i
của bước thứ n+1/2 vừa được tính được là hằng
số để lấy tích phân (hình 1.2.)
n1/2 n1/2 n
ii i
pp tF
+−
=+Δ

(1.12)
n1/2
n1 n
i
ii
s
p

rrt
m
+
+
=+Δ

(1.13)
t
12
3
4
3/2
5/2
7/2
9/2

Hình 1.2. Thuật toán bước nhẩy ếch để tính tích phân các phương trình
Newton. (Trục t, xác định các giá trị hằng số khi tính tích phân)


TỔNG QUAN

9
Như vậy, để xác định được p
i
n+1/2
cần biết p
i
n-1/2


và F
i
n
, để biết r
i
n+1
cần
biết r
i
n
và p
i
n+1/2
(tức là cần biết vị trí và chuyển động của các hạt trước đó). Vì
vậy, bao giờ chúng ta cũng phải lựa chọn một trạng thái khởi đầu (initation
state) cho quá trình mô phỏng. Một trong những cách có thể là xếp các hạt
vào mạng đều đặn và cấp phát vận tốc cho các hạt theo phân bố Maxwell-
Boltzmann.
Khi đã biết p
i
n+1/2
và r
i
n
ta có thể tính được vị trí mới của các hạt và từ
đó tính p
i
mới. Quá trình cứ thế lặp lại cho đến khi hệ đạt được cân bằng
nhiệt. Mỗi lần lặp lại được gọi là một bước mô phỏng.
Giá trị động lượng trung bình của các hạt tại các bước mô phỏng n+1/2

và n-1/2
n n 1/2 n 1/2
iii
p0.5(p p )
−+
=+

(1.14)
Được sử dụng để tính động năng của hệ
n2
is
K|p|/m=


(1.15)
Sau mỗi bước, chúng ta cần phải tính thế năng tương tác
φ và từ đó tính
năng lượng toàn phần của hệ (E).
EK=φ+

(1.16)
E là một đại lượng không đổi được dùng để kiểm chứng độ chính xác
của việc giải phương trình Newton.
1.1.2.2.Thuật toán Verlet
Nếu xuất phát từ vị trí của hạt r
i
n
ở bước thứ n, gia tốc a
i
n

cũng ở thời điểm
đó và vị trí hạt r
i
n-1
tại thời điểm đó thì từ các phương trình Newton ta được:
n1 n n1 2 n
iii i
r2.rr ta
+−
=−+Δ

(1.17)
Đây là biểu thức của thuật toán Verlet. Trong biểu thức này không thấy
xuất hiện vận tốc hạt vốn cần để tính động năng của hệ. Tuy vậy, vận tốc hạt
có thể được dễ dàng tính từ hệ thức sau:


TỔNG QUAN

10
n1 n1
n
ii
i
rr
v
2t
+−

=

Δ

(1.18)
Code máy tính cho thuật toán Verlet sẽ được trình bày trong phần
Phương
pháp nghiên cứu
.
1.1.2.3.Thuật toán Beeman
Thuật toán Beeman xuất phát từ tọa độ r
i
n
, vận tốc v
i
n
và gia tốc a
i
n
của
hạt ở bước thứ n và gia tốc a
i
n -1
ở bước thứ n-1 trước đó, tức là:
n1 n n 2 n 2 n1
ii i i i
21
rrt.v ta ta
36
+−
=+Δ +Δ −Δ


(1.19)

n1 n n1 n n1
ii i i i
151
vv t.a t.a t.a
366
++ −
=+Δ +Δ −Δ

(1.20)
Thuật toán Beeman cho giá trị vận tốc tốt hơn so với thuật toán Verlet và
vì thế tạo ra một cải thiện đáng kể cho việc bảo toàn năng lượng khi mô phỏng.
1.1.2.4. Thuật toán thử - chỉnh
Cũng với mục đích xác định chính xác hơn vận tốc hạt tại mỗi bước mô
phỏng, người ta đưa ra phương pháp thử chỉnh (predictor - corrector). Thoạt
tiên giả định một tọa độ mới của hạt theo một công thức đơn giản:

n1 n1 n
p
rr2tv
+−
=+Δ

(1.21)
Từ đó có thể xác định được gia tốc a
i
n +1
. Vận tốc mới được tính từ gia
tốc trung bình:


n1 n n1 n
1
vv t(aa)
2
++
=+Δ +

(1.22)
Kế đó, tọa độ mới được tính từ vận tốc trung bình:

n1 n n1 n
1
rr t(vv)
2
++
=+Δ +

(1.23)
Lặp lại các bước cho đến khi hội tụ, tức là biến thiên tọa độ và vận tốc
sau mỗi bước lặp nhỏ hơn một giá trị nào đó.


TỔNG QUAN

11
1.1.2.5. Thuật toán Gear
Gear là thuật toán thử chỉnh đầy đủ để giải các phương trình chuyển
động Newton. Nội dung cơ bản của thuật toán là tọa độ hạt r
n+1

ở bước mô
phỏng thứ n+1 có thể tính toán từ tọa độ của hạt r
n
ở bước thứ n nếu ta khai
triển Taylor r
n+1
như sau:
(1.24)
(1.25)

(1.26)

n1 n n 2 n 3 n
n1 n n 2 n
n1 n n
n1 n
r r t v (1/ 2) t a (1/ 6) t b
v v t a (1/ 2) t b
a a t b
b a
+
+
+
+
=+Δ + Δ + Δ +
=+Δ+ Δ +
=+Δ +
=+

(1.27)


Nếu bỏ qua các số hạng bậc cao hơn [76, 79], chúng ta có các giá trị giả
định ban đầu (predictor). Quá trình sửa (corrector) được thực hiện như sau: từ
tọa độ mới tính lại lực tương tác, sau đó tính gia tốc mới
a
c
và xác định sai số
của giá trị thử của gia tốc:

n1 n1 n1
cp
aa.a
+++
Δ=

(1.28)
Sử dụng giá trị này, chỉnh các giá trị tọa độ, vận tốc, gia tốc…tương ứng:
(1.29)
(1.30)

(1.31)

n1 n1 n1
cp 0
n1 n1 n1
cp1
n1 n1 n1
cp2
n1 n1 n1
cp3

rrga
vvga
aaga
b
bga
++ +
++ +
++ +
++ +
=+Δ
=+Δ
=+Δ
=+Δ

(1.32)

Giá trị mới thu được này là các gần đúng tốt hơn các giá trị thử ban đầu
g
i
, i = 0, 1, 2, 3 là các giá trị Gear.
Code thuật toán
Gear sẽ được trình bày trong phần: Phương pháp nghiên cứu.
1.1.3. Tạo trạng thái khởi đầu
Việc tạo trạng thái khởi đầu cho MD bao gồm 2 bước: cấp phát vị trí và
cấp phát vận tốc cho các hạt. Có hai cách tạo trạng thái khởi đầu:
+
Cách thứ nhất: Xếp các hạt vào mạng tinh thể đều đặn (thường là mạng lập
phương tâm mặt - face centered cubic). Để cấp phát vận tốc ban đầu cho các



TỔNG QUAN

12
hạt, chúng ta cần biết nhiệt độ xuất phát T, (nhiệt độ này được bảo toàn trong
quá trình tính). Khi đã biết T có thể xác định hằng số momen
κ
s
của hạt loại s
như sau:

ssB
2mKTκ=

(1.33)
Trong đó:
K
B
là hằng số Boltzmann;
T là nhiệt độ tuyệt đối;
m
s
là khối lượng loại hạt s
Đối với mỗi loại hạt ta lại có:

isR
p.
α
=κ χ

(1.34)

Trong đó
α = x, y hoặc z,
χ
R
là số ngẫu nhiên phân bố đều trong
khoảng (-1, 1).
Sau khi loại bỏ phần chuyển dịch của toàn hệ theo hướng
α là < p

>,
trong đó dấu < > kí hiệu phép lấy trung bình cho tất cả các hạt trong hệ mô
phỏng, ta chuẩn hóa lại động lượng hạt theo nhiệt độ T theo công thức:

ii
T
pp
αα
=
τ

(1.35)
trong đó
()
1/2
T/τ được gọi là hệ số hiệu chỉnh tốc độ được sử dụng sau mỗi số
lặp xác định trong quá trình giải hệ phương trình Newton

21
is
aB aB

22K
pm
3N K 3N K

τ= =


(1.36)
+
Cách thứ hai: Chọn cấu hình của lần tính trước cho lần tính sau. Cách
này có ưu điểm hơn cách thứ nhất. Nó cho phép chia quá trình tính (vốn tốn
rất nhiều thời gian trên máy) thành nhiều giai đoạn. Sau mỗi lần chạy các kết
quả được lưu giữ cho lần tính tiếp trong các tệp
RESTART (thông thường
bằng mã ASCII). Ở lần tính kế tiếp các tệp RESTART sẽ tạo lại trạng thái


TỔNG QUAN

13
làm việc cũ. Như vậy cho dù chạy trên PC thì chúng ta vẫn có thể thực hiện số
bước mô phỏng đủ lớn và tăng độ chính xác của kết quả.
Xếp hạt vào mạng tinh thể đều đặn
Code thuật toán
xếp các phân tử vào nút mạng của một mạng lập phương tâm
mặt (face centered cubic - FCC) và code
cấp phát vận tốc ban đầu được trình
bày trong phần:
Phương pháp nghiên cứu.
1.1.4. Điều kiện biên tuần hoàn [1]

Khi xếp N phân tử vào hộp để mô phỏng một hệ rất lớn có hai câu hỏi
được đặt ra cần giải đáp:
1. Làm thế nào để triệt tiêu hiệu ứng bề mặt khi trong một hộp mô
phỏng, các phân tử nằm ở mép hộp sẽ chịu một lực tác dụng bất đối xứng so
với các phân tử nằm sâu trong thể tích hộp?
2. Nếu phân tử trong quá trình chuyển động vượt ra khỏi h
ộp thì cần bổ
sung lại cho hộp theo nguyên tắc nào?
Giải quyết hai vấn đề này chính là nội dung của
điều kiện biên tuần
hoàn
, theo đó, hộp mô phỏng được lặp lại theo tất cả các hướng và tạo nên
một hệ tuần hoàn không giới hạn.
Code thuật toán xếp các hạt vào
hộp tuần hoàn được trình bày trong phần
Phương pháp nghiên cứu.
1.1.5. Thế tương tác cặp [1]
Các lực xác định tính chất động lực của hệ được tính từ hàm thế tương
tác cặp
φ
ij
(r
ij
). Thế năng tương tác tổng cộng của hệ các phân tử đơn nguyên
tử hoặc ion là

ij ij
iji
U(r)
>


∑∑

(1.37)
Trong đó
ϕ
ij
(r
ij
) có liên hệ với f
ij
theo hệ thức: f
ij
= -∇ϕ
ij
(r
ij
), tổng lấy
theo tất cả các nguyên tử trong hệ.


TỔNG QUAN

14
Lực tổng cộng tác dụng lên một phân tử riêng biệt được chia thành các
lực tác dụng gần (hầu hết các loại lực đã biết) với độ giảm theo khoảng cách
nhanh hơn r
-3
và lực tác dụng xa (tương tác Coulomb) với độ giảm thế theo
khoảng cách chỉ r

-1
.
Với các lực tác dụng gần sẽ tồn tại một khoảng cách tại đó thế tương
tác
φ
ij
(r
ij
) được xem bằng 0 và bỏ qua không cần tính đến, để sau đó có cách
hiệu chỉnh chung khoảng cách đó được gọi là khoảng cắt lực (cut-off radius).
1.1.6. Thế Lennard-Jones
Với các hạt trung hoà có đối xứng cầu, thế tương tác cặp được biểu
diễn bằng phương trình kinh nghiệm Lennard-Jones 6-12.

12 6
ij ij
ij ij
(R) 4.
RR
⎛⎞
σσ
⎛⎞⎛⎞
⎜⎟
ϕ=ε −
⎜⎟⎜⎟
⎜⎟
⎝⎠⎝⎠
⎝⎠

(1.38)

với thế đẩy
12
ij
R
σ
⎛⎞
⎜⎟
⎝⎠
và thế hút
6
ij
R
σ
⎛⎞
⎜⎟
⎝⎠
, thế L-J6-12 được xếp vào loại thế tương
tác có khoảng tác dụng gần.
Có tham số
ε
ij
và σ
ij
được xác định từ thực nghiệm. Các tham số cho
các cặp ij (i
≠j) có thể tính được tương đối chính xác từ các tham số của các
cặp nguyên tử cùng loại (i = j).
ε
ij
là trung bình nhân (còn gọi là trung bình

hình học) của các tham số
ε
ii
và ε
jj
; σ
ij
là trung bình cộng (trung bình số học)
của các tham số
σ
ii
và σ
jj
tức là:

ij ii jj
ε= εε

(1.39)

()
ij ii jj
1
2
σ= σ+σ

(1.40)
Trong quá trình tính toán hàm thế được cắt tại khoảng cách r
c
=2,5σ÷

3,5
σ trong đó σ là tham số của hàm thế. Vì vậy ta có thể viết:

kkk0
u(r) (r)=ϕ −ϕ

(1.41)
Trong đó:
k0 k c
(r )ϕ=ϕ

(1.42)


TỔNG QUAN

15
Khi tính toán các đại lượng nhiệt động thế
k0
ϕ
được bổ sung trở lại. Thế
u
k
(r) được gọi là thế nâng (shift - hiểu theo nghĩa đã được tăng lên một đại
lượng là
k0
ϕ
).
Việc căn chỉnh khoảng cách xa cho thế L-J được tính dựa trên biểu thức
liên hệ hàm phân bố hướng tâm với các đại lượng nhiệt động khi mà ở khoảng

cách xa, hàm phân bố hướng tâm có giá trị
≈1. Nếu ký hiệu E
C
là thế đã cắt,
E
LRC
là hiệu chỉnh thế khoảng cách xa (long - range correction). E là thế
chung, ta có :

c
2
CLRCC
r
EE E E 2Nrv(r)dr (g(r)1)

=+ =+πρ =


(1.43)

c
2
CLRCC
r
2
(PV) (PV) (PV) (PV) N r w(r)dr
3

=+ =−πρ



(1.44)

c
2
CLRCC
r
4N rv(r)dr

μ=μ+μ =μ+πρ


(1.45)
Trong đó
μ là hoá thế. Thay thế giá trị của tương tác L-J 6 - 12 ta có :

***9**3
LRC c c
88
ENrNr
93


=πρ −πρ

(1.46)

* *2*9 *2*3
LRC c c
32 16

Prr
93


=πρ −πρ

(1.47)

***9**3
LRC c c
16 16
rr
93


μ=πρ −πρ

(1.48)
trong đó ký hiệu (*) chỉ các đại lượng rút gọn không thứ nguyên (khoảng cách
theo
σ và năng lượng theo ε, σ và ε là các tham số của thế tương tác L-J).
Code máy tính của thuật toán Lennard Jones và các đại lượng có liên
quan được trình bày trong phần:
Phương pháp nghiên cứu.
1.1.7. Thế tương tác Coulomb
Trong hệ các điểm điện tích, thế năng tổng cộng của ion trong một cell
được xác định bởi.

N
cell i

i1
EV(r)
=
=


(1.49)
Tổng lấy theo tất cả các ion của hệ. Trong đó V là thế tĩnh điện tác

×