Tải bản đầy đủ (.pdf) (123 trang)

Luận án tiến sĩ vật lí vai trò của trình tự amino acid kỵ nước và phân cực đối với cơ chế cuốn protein và sự kết tụ của peptide

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (8.1 MB, 123 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀM LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

———————

NGUYỄN BÁ HƯNG

VAI TRÒ CỦA TRÌNH TỰ AMINO ACID KỴ NƯỚC VÀ
PHÂN CỰC ĐỐI VỚI CƠ CHẾ CUỐN PROTEIN VÀ SỰ
KẾT TỤ CỦA PEPTIDE

LUẬN ÁN TIẾN SĨ VẬT LÝ

HÀ NỘI − 2018


VIỆN HÀM LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

.........***.........

NGUYỄN BÁ HƯNG

VAI TRÒ CỦA TRÌNH TỰ AMINO ACID KỴ NƯỚC VÀ
PHÂN CỰC ĐỐI VỚI CƠ CHẾ CUỐN PROTEIN VÀ SỰ
KẾT TỤ CỦA PEPTIDE



Chuyên ngành: Vật lý lý thuyết và Vật lý toán
Mã số chuyên ngành: 9 44 01 03

Người hướng dẫn khoa học: PGS.TS Trịnh Xuân Hoàng

HÀ NỘI − 2018


Lời cảm ơn
Tôi xin bày tỏ lòng biết ơn đến PGS. TS. Trịnh Xuân Hoàng đã hướng
dẫn tôi học tập nghiên cứu trong suốt thời gian làm nghiên cứu sinh và giúp
tôi hoàn thành luận án này. Xin cám ơn TS. Lê Duy Mạnh, NCS. Bùi Phương
Thúy trong nhóm nghiên cứu đã giúp đỡ và có nhiều ý kiến đóng góp trong quá
trình làm luận án của tôi.
Tôi xin chân thành cám ơn Học viện Quân Y nơi tôi đang công tác đã có
nhiều hỗ trợ và động viên tôi trong thời gian tôi làm nghiên cứu sinh. Xin cảm
ơn Viện Vật lý và Học viện Khoa học và Công nghệ là cơ sở đào tạo đã tạo điều
kiện thuận lợi giúp tôi trong quá trình làm nghiên cứu sinh và bảo vệ luận án.
Tôi cũng cám ơn các đồng nghiệp tại Bộ môn Vật lý - Lý sinh nơi tôi công tác
đã có nhiều giúp đỡ, chia sẻ trong công việc khi tôi đi làm nghiên cứu sinh.
Cuối cùng, tôi xin dành sự biết ơn sâu sắc tới gia đình đã luôn động viên,
ủng hộ và hỗ trợ về mọi mặt để tôi có thể yên tâm nghiên cứu và bảo vệ thành
công luận án này.

i


Lời cam đoan
Luận án này là kết quả bản thân tôi đã thực hiện trong thời gian làm nghiên

cứu sinh tại viện vật lý. Cụ thể, chương 1 là phần tổng quan giới thiệu những
kiến thức cơ sở về protein và vấn đề cuốn protein. Chương 2 là phần tổng quan
giới thiệu về hiện tượng kết tụ protein và sự hình thành amyloid. Chương 3 mô
tả các mô hình và các phương pháp mô phỏng. Chương 4 trình bày kết quả
nghiên cứu mà tôi đã thực hiện cùng thầy hướng dẫn là PGS. TS. Trịnh Xuân
Hoàng. Chương 5 trình bày kết quả nghiên cứu mà tôi thực hiện cùng PGS. TS.
Trịnh Xuân Hoàng và TS. Lê Duy Mạnh.
Cuối cùng tôi xin cam đoan và khẳng định, đây là các nghiên cứu của riêng
tôi. Các kết quả trong luận án “Vai trò của trình tự amino acid kỵ nước và phân
cực đối với cơ chế cuốn protein và sự kết tụ của peptide” là các kết quả mới,
không trùng lặp với bất kỳ luận án hay công trình nào đã được công bố.
Tác giả luận án

ii


Mục lục
Lời cảm ơn

i

Lời cam đoan

ii

Mục lục

iv

Danh mục các kí hiệu, các chữ viết tắt


v

Danh mục các bảng

vi

Danh mục các hình vẽ, đồ thị

xiv

Mở đầu

1

1 Sự cuốn của protein
1.1 Các đặc trưng cấu trúc của protein . .
1.2 Hiện tượng cuốn protein . . . . . . . .
1.3 Nghịch lý Levinthal . . . . . . . . . . .
1.4 Phễu cuốn . . . . . . . . . . . . . . . .
1.5 Nguyên lý thất vọng tối thiểu . . . . .
1.6 Mô hình hai trạng thái cho cơ chế cuốn
1.7 Tính hợp tác của quá trình cuốn . . . .
1.8 Tương tác kỵ nước . . . . . . . . . . .
1.9 Mô hình HP mạng . . . . . . . . . . .
1.10Mô hình Go . . . . . . . . . . . . . . .
1.11Mô hình ống . . . . . . . . . . . . . . .
1.12Kết luận . . . . . . . . . . . . . . . . .
2 Sự
2.1

2.2
2.3

.
.
.
.
.
.
.
.
.
.
.
.

8
8
10
11
12
13
14
16
18
19
21
22
25


hình thành amyloid
Cấu trúc sợi amyloid . . . . . . . . . . . . . . . . . . . . . . . . .
Cơ chế hình thành sợi amyloid . . . . . . . . . . . . . . . . . . . .
Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

27
28
30
35

. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
protein
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .

3 Các mô hình và phương pháp mô phỏng
3.1 Mô hình ống HP . . . . . . . . . . . . . .
3.1.1 Tính chất tự tránh dạng ống . . . .
3.1.2 Thế năng bẻ cong . . . . . . . . . . .
3.1.3 Hệ tọa độ Frenet . . . . . . . . . . .
iii


.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.

.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.

.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.

.

37
37
38
39
39


Mục lục

.
.
.
.
.
.
.
.
.
.
.

40
42
43
43
45
45
46

48
49
51
54

4 Vai trò của trình tự amino acid kỵ nước và phân cực đối với
cơ chế cuốn của protein
4.1 Nhiệt động lực học cuốn protein trong mô hình ống HP . . . . . .
4.2 Nhiệt động lực học cuốn protein trong mô hình ống Go . . . . . .
4.3 Chuyển pha cuốn trong mô hình ống HP và mô hình ống Go . . .
4.4 Ảnh hưởng cường độ tương tác kỵ nước lên tính chất cuốn . . . .
4.5 Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

55
55
61
62
70
74

5 Vai trò của trình tự amino acid kỵ nước và phân cực
sự kết tụ của peptide
5.1 Sự phụ thuộc của các cấu trúc kết tụ vào trình tự HP . .
5.2 Nhiệt động lực học của quá trình kết tụ . . . . . . . . .
5.3 Động học của quá trình hình thành sợi . . . . . . . . . .
5.4 Sự kết tụ của hệ peptide hỗn hợp . . . . . . . . . . . . .
5.5 Thảo luận . . . . . . . . . . . . . . . . . . . . . . . . . .
5.6 Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . .

75

76
79
82
87
89
92

3.2
3.3
3.4
3.5

3.6
3.7
3.8

3.1.4 Liên kết hydro . . . . . . . . . . . . . . . . . .
3.1.5 Tương tác kỵ nước . . . . . . . . . . . . . . . .
Mô hình ống Go . . . . . . . . . . . . . . . . . . . . .
Mô hình ống với tính định hướng của các chuỗi bên .
Các thông số cấu trúc protein . . . . . . . . . . . . .
Phương pháp mô phỏng Monte Carlo . . . . . . . . .
3.5.1 Thuật toán Metropolis . . . . . . . . . . . . . .
3.5.2 Các phép dịch chuyển Monte Carlo cho protein
Phương pháp điều nhiệt song song . . . . . . . . . . .
Phương pháp phân tích đa biểu đồ có trọng số . . . .
Kết luận . . . . . . . . . . . . . . . . . . . . . . . . .

.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.

.
.
.
.
.
.
.
.
.

đối với
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.

.

.
.
.
.
.
.

.
.
.
.
.
.

Kết luận

94

Danh mục công trình của tác giả

96

Tài liệu tham khảo

97

iv



Danh mục các kí hiệu, các chữ viết tắt
a.a.

Amino acid

ADN

Deoxyribonucleic acid

ARN

Ribonucleic acid

AFM

Hiển vi lực nguyên tử (Atomic Force Microscopy)

AD

Bệnh Alzheimer (Alzheimer Disease)

HP

Kỵ nước và phân cực (hydrophobic and polar)

MC

Monte Carlo


NMR

Cộng hưởng từ hạt nhân (Nuclear Magnetic Resonance

PDB

Ngân hàng dữ liệu protein (Protein Data Bank)

rmsd

Độ dịch chuyển căn quân phương (root mean square deviation)

v


Danh mục các bảng
Bảng 5.1 Trình tự amino acid kỵ nước (H) và phân cực (P) của các
peptide được xét trong nghiên cứu về sự kết tụ. Các trình tự trong
bảng được ký hiệu từ S1 tới S12. Tham số s ký hiệu khoảng cách
gần nhất giữa hai amino acid H liên tiếp nhau trong chuỗi. . . .

vi

76


Danh mục các hình vẽ, đồ thị
Hình 1.1 Hình vẽ minh họa a) cấu trúc hóa học của amino acid (trừ
proline), b) cấu trúc hóa học của proline (Pro) và c) chuỗi polypeptide với các amino acid liên kết với nhau bởi các liên kết peptide.
Mỗi amino acid gồm một nguyên tử carbon trung tâm Cα liên kết

với một nhóm amine (-NH2 ), một nhóm carboxyl (-COOH), một
nguyên tử H và một chuỗi bên R. Trong amino acid proline, chuỗi
bên R liên kết hóa trị với nguyên tử C trong nhóm carboxyl. Các
amino acid trong protein khác nhau bởi chuỗi bên R. . . . . . . .
Hình 1.2 Cấu trúc trạng thái cuốn của vùng B1 của protein G (a–c) và
của protein A (d–f). Các cấu trúc protein được biểu diễn ở dạng gồm
tất cả các nguyên tử (all-atom) (a,d), dạng dải (ribbon) (b,e) và
dạng mạch xương sống (backbone) (c,f).[Pleaseinsertintopreamble]
Trong biểu diễn dạng dải, các xoắn α được tô màu đỏ và các phiến
β được tô màu vàng. Trong biểu diễn mạch xương sống, các amino
acid khác nhau được phân biệt bằng các màu khác nhau. Các dữ
liệu cấu trúc được lấy từ ngân hàng dữ liệu protein (PDB) với mã
PDB 1pga cho vùng B1 của protein G và 2spz cho protein A. . . .
Hình 1.3 Địa hình năng lượng dạng sân gôn ứng với quá trình cuốn
trong nghịch lý Levithal. . . . . . . . . . . . . . . . . . . . . . . .
Hình 1.4 Phễu cuốn. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hình 1.5 Sơ đồ năng lượng tự do trong mô hình hai trạng thái. D và
N lần lượt là trạng thái duỗi và trạng thái cuốn. Trạng thái chuyển
tiếp (TS) là trạng thái có năng lượng tự do cao nhất giữa trạng
thái duỗi và trạng thái cuốn. ∆FN và ∆FD lần lượt là độ cao của
các bờ thế xuất phát từ các trạng thái duỗi và cuốn. . . . . . . .
Hình 1.6 Nhiệt động lực học của protein hai trạng thái. (a) Sự phụ thuộc
của enthalpy trung bình vào nhiệt độ có dạng chữ S (sigmoidal). (b)
Sự phụ thuộc của nhiệt dung riêng vào nhiệt độ có đỉnh tại vùng
chuyển pha. (c) Phân bố enthalpy tại nhiệt độ T1 < Tf và T2 > Tf .
(d) Phân bố enthalpy tại nhiệt độ T = Tf . Nhiệt độ chuyển pha
cuốn duỗi Tf được xác định là nhiệt độ mà nhiệt dung riêng đạt
cực đại. Độ lớn của sự thay đổi enthalpy nhiệt, ∆Hcal , và enthalpy
van’t Hoff, ∆HvH , được thể hiện một cách gần đúng trên hình vẽ.


vii

9

10
12
13

15

17


Danh mục các hình vẽ, đồ thị

Hình 1.7 Mô hình mạng HP trên không gian hai chiều, các amino acid
kỵ nước và phân cực tương ứng có màu xanh và màu đỏ. Cấu hình
gói chặt có năng lượng thấp nhất của chuỗi peptide gồm 14 amino
acid (a); hai cấu hình gói chặt khác có năng lượng cao hơn ứng với
5 cặp tương tác HH (b,c); Histogram số trạng thái phụ thuộc vào
năng lượng chỉ ra chỉ có một trạng thái duy nhất có năng lượng cực
tiểu (d) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
Hình 1.8 (a) Giản đồ pha trạng thái cơ bản của polymer đồng nhất dài
24 hạt trong mô hình ống. eR và eW là các tham số năng lượng bẻ
cong và năng lượng tương tác kỵ nước trong mô hình. Pha cận bó
chặt bao gồm các vùng được tô màu có trạng thái cơ bản là các cấu
trúc tương tự cấu trúc protein. (b) Các cấu trúc trạng thái cơ bản
và một số cực tiểu năng lượng trong pha cận bó chặt. (Hình vẽ từ
bài báo [21] được sự đồng ý của tác giả cho sử dụng lại). . . . . .

23
Hình 1.9 Hình ảnh đơn giản hóa trong hai chiều của một địa hình năng
lượng. (a) Địa hình năng lượng của một polymer đồng nhất trong
mô hình polymer thông thường với một thế năng hút thúc đẩy sự bó
chặt. Có rất nhiều trạng thái cơ bản gói chặt tối đa với năng lượng
xấp xỉ như nhau, phân cách nhau bởi các hàng rào năng lượng lớn.
(b) Địa hình năng lượng được tạc hình (presculpted) bởi các yếu
tố hình học và đối xứng trong mô hình ống của một chuỗi polymer
đồng nhất trong pha cận bó chặt. Số lượng cực tiểu sẽ giảm đáng
kể và chiều rộng của các hố thế tăng lên. (c) Địa hình năng lượng
dạng phễu của một protein được lựa chọn bởi trình tự amino acid.
(Hình vẽ từ bài báo [53] được sự đồng ý của tác giả cho sử dụng lại). 24
Hình 2.1 Hình ảnh mô tả cấu trúc nhiễu xạ thu được từ nhiễu xạ tia
X đối với sợi amyloid. Các cực đại nhiễu xạ thu được tại các vị trí
ứng với khoảng cách 4.7 ˚
A theo phương thẳng đứng và 8–10 ˚
A theo
phương ngang. Các khoảng cách này phù hợp với cấu trúc phiến β
chéo mô tả ở hình bên phải, trong đó các dải β có phương vuông
góc với trục của sợi. Một sợi amyloid có thể gồm nhiều protofibril
ghép lại với nhau. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hình 2.2 Mô hình cấu trúc của các sợi amyloid của bệnh Alzheimer tạo
bởi các peptide Abeta (1-42) có mã PDB là 2BEG thu được bằng
phương pháp NMR [68]: (a) nhìn theo hướng trục sợi, (b) nhìn theo
hướng vuông góc trục sợi. . . . . . . . . . . . . . . . . . . . . . .

viii

29


29


Danh mục các hình vẽ, đồ thị

Hình 2.3 Sơ đồ mô tả quá trình protein cuốn sai và hình thành các cấu
trúc kết tụ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hình 2.4 Động học của quá trình hình thành amyloid . . . . . . . . .
Hình 2.5 Sự phụ thuộc năng lượng tự do vào số đơn phân của cấu trúc
kết tụ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hình 3.1 Minh họa những thế năng được sử dụng trong mô hình ống
tinh chỉnh của protein. r, y là các bán kính cong địa phương, không
địa phương; z là khoảng cách giữa hai đơn phân a.a; eR và eW tương
ứng là năng lượng phạt, năng lượng tương tác kỵ nước (hydophobic)
của một liên kết. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hình 3.2 Minh họa sự tạo thành một liên kết hydro giữa đơn phân i
và j trong mô hình ống cho protein. Mỗi amino acid được xem xét
bởi vị trí nguyên tử Cα . Hệ tọa độ Frenet được hình thành bởi ba
vector đơn vị: tiếp tuyến t, pháp tuyến n và phó pháp tuyến b.
Liên kết hydro được hình thành khi các ràng buộc hình học đối
với vector nối cij và các vector binormal bi và bj được thỏa mãn.
Trong một liên kết hydro lý tưởng được mô tả trên hình vẽ, những
vector này nằm song song với nhau. . . . . . . . . . . . . . . . .
Hình 3.3 (a và b) Mô hình mô tả tương tác tiếp xúc giữa hai amino
acid với sự định hướng các chuỗi bên. Các chuỗi bên được coi là
có hướng ngược lại với hướng của các vector pháp tuyến ni và nj
từ các nguyên tử Cα . Hai amino acid được coi là có tương tác nếu
chuỗi bên của chúng có hướng không quá xa nhau (a) hoặc không
tương tác nếu chuỗi bên hướng xa nhau (b). (c) Phân bố xác suất
của tích vô hướng ni ·cij cho các tiếp xúc giữa các chuỗi bên được từ

500 cấu trúc protein trong cơ sở dữ liệu top500. Hai đỉnh của phân
bố ứng với các cấu trúc xoắn α và phiến β. Các chuỗi bên được coi
là có tiếp xúc nếu giữa chúng tồn tại 2 nguyên tử có khoảng cách
nhỏ hơn 1.5 lần tổng bán kính Van der Waals của 2 nguyên tử đó.
Hình 3.4 Hai phép dịch chuyển trạng thái cho polymer: a) phép quay
trục (crank-shaft move), b) phép quay điểm (pivot move). . . . .
Hình 3.5 (a) Hoán đổi replica cho phép xuyên qua rào thế. (b) Sự giao
nhau của các biểu đồ trạng thái theo năng lượng tại các nhiệt độ
khác nhau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

ix

30
31
32

38

41

44
49

49


Danh mục các hình vẽ, đồ thị

Hình 4.1 Cấu hình trạng thái có năng lượng thấp nhất của của hai
chuỗi HP bao gồm các amino acid kỵ nước (H) và phân cực (P) với

chiều dài N = 48 thu được từ mô phỏng trong mô hình ống HP, bao
gồm cấu trúc bó ba xoắn α (ký hiệu là 3HB) (a) và cấu trúc tương
tự vùng B1 của protein G (ký hiệu là GB1) (b). Các amino acid kỵ
nước (H) trong hình vẽ có màu xanh và các amino acid phân cực
(P) có màu vàng. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hình 4.2 Sự phụ thuộc của năng lượng trung bình E , bán kính hồi
chuyển trung bình Rg , và nhiệt dung riêng C vào nhiệt độ của
các protein 3HB (a–c) và GB1 (d–f) trong mô hình ống HP. Các
mũi tên chỉ một cách gần đúng vào các nhiệt độ chuyển pha cuốn
(folding) và chuyển pha sụp đổ (collapse). . . . . . . . . . . . . .
Hình 4.3 Các ví dụ về cấu hình protein tìm thấy ở các nhiệt độ khác
nhau ở các pha duỗi (a,d), pha sụp đổ (b,e) và pha cuốn (c,f) cho
protein 3HB (a–c) và GB1 (d–f). Các amino acid kỵ nước được tô
màu xanh đậm, các amino acid phân cực màu xanh nhạt. Đơn vị
của nhiệt độ là /kB . . . . . . . . . . . . . . . . . . . . . . . . . .
Hình 4.4 Sự phụ thuộc của năng lượng E trung bình, bán kính hồi
chuyển Rg trung bình, và nhiệt dung riêng C vào nhiệt độ của các
protein 3HB (a–c) và GB1 (d–f) trong mô hình ống Go. . . . . . .
Hình 4.5 Quỹ đạo thu được từ một mô phỏng dài 2 × 109 bước MC tại
nhiệt đô chuyển pha Tf = 0.296 /kB của protein 3HB trong mô
hình ống HP. Các đồ thị trên hình bao gồm năng lượng (a), độ dịch
chuyển căn quân phương rmsd (b), và bán kính hồi chuyển Rg (c)
phụ thuộc vào số bước mô phỏng MC và các biểu đồ tương ứng đã
chuẩn hóa của chúng (d–f) . . . . . . . . . . . . . . . . . . . . . .
Hình 4.6 Quỹ đạo thu được từ một mô phỏng dài 2 × 109 bước MC tại
nhiệt đô chuyển pha Tf = 0.243 /kB của protein GB1 trong mô
hình ống HP. Các đồ thị trên hình bao gồm năng lượng (a), độ dịch
chuyển căn quân phương rmsd (b), và bán kính hồi chuyển Rg (c)
phụ thuộc vào số bước mô phỏng MC và các biểu đồ tương ứng đã
chuẩn hóa của chúng (d–f) . . . . . . . . . . . . . . . . . . . . . .


x

56

57

59

60

63

64


Danh mục các hình vẽ, đồ thị

Hình 4.7 Quỹ đạo thu được từ một mô phỏng dài 2 × 109 bước MC tại
nhiệt đô chuyển pha Tf = 0.345 /kB của protein 3HB trong mô
hình ống Go. Các đồ thị trên hình bao gồm năng lượng (a), độ dịch
chuyển căn quân phương rmsd (b), và bán kính hồi chuyển Rg (c)
phụ thuộc vào số bước mô phỏng MC và các biểu đồ tương ứng đã
chuẩn hóa của chúng (d–f) . . . . . . . . . . . . . . . . . . . . . .
Hình 4.8 Quỹ đạo thu được từ một mô phỏng dài 2 × 109 bước MC tại
nhiệt đô chuyển pha Tf = 0.291 /kB của protein GB1 trong mô
hình ống Go. Các đồ thị trên hình bao gồm năng lượng (a), độ dịch
chuyển căn quân phương rmsd (b), và bán kính hồi chuyển Rg (c)
phụ thuộc vào số bước mô phỏng MC và các biểu đồ tương ứng đã
chuẩn hóa của chúng (d–f) . . . . . . . . . . . . . . . . . . . . . .

Hình 4.9 Bề mặt hai chiều của năng lượng tự do hiệu dụng phụ thuộc
vào năng lượng E và độ dịch chuyển căn quân phương rmsd tại các
nhiệt độ chuyển pha Tf = 0.296 /kB và Tf = 0.345 /kB lần lượt
đối với protein 3HB trong mô hình ống HP (a) và mô hình ống Go
(b); và Tf = 0.243 /kB và Tf = 0.291 /kB đối với protein GB1
trong mô hình ống HP (c) và mô hình ống Go (d). Giá trị của năng
lượng tự do được thể hiện theo bảng màu bên phải với đơn vị là kB T .
Hình 4.10Các cấu trúc có năng lượng thấp nhất thu được từ mô phỏng
protein 3HB với các cường độ tương tác kỵ nước khác nhau. Trong
hình các amino acid H (kỵ nước) có màu xanh đậm, các amino
acid P (phân cực) có màu xanh nhạt. Các cấu trúc hiển thị ứng
với eHH = −0.2 (a), eHH = −0.21 (b), eHH = −0.3 (c), eHH =
−0.5 (d), eHH = −0.7 (e). . . . . . . . . . . . . . . . . . . . .
Hình 4.11Sự phụ thuộc của nhiệt dung riêng vào nhiệt độ của protein
3HB tại các giá trị cường độ tương tác kỵ nước khác nhau eHH =
−0.2 , −0.3 , −0.5 và −0.7 . . . . . . . . . . . . . . . . . . . .
Hình 4.12Sự phụ thuộc của năng lượng trung bình E (a) và bán kính
hồi chuyển trung bình Rg (b) vào nhiệt độ của protein 3HB tại
các giá trị cường độ tương tác kỵ nước khác nhau eHH = −0.19 ,
−0.2 , −0.21 , −0.3 , −0.5 , −0.7 . . . . . . . . . . . . . . . . .

65

66

69

71

71


73

Hình 5.1 Cấu hình trạng thái có năng lượng thấp nhất thu được từ mô
phỏng của các hệ có N = 10 chuỗi peptide giống nhau với các trình
tự HP từ S1 tới S12 như được nêu trong Bảng 5.1. Các amino acid
H và P trong các peptide tương ứng có màu xanh đậm và xanh nhạt. 77

xi


Danh mục các hình vẽ, đồ thị

Hình 5.2 Sự phụ thuộc của nhiệt dung riêng vào nhiệt độ cho các hệ
peptide với trình tự S2 và với số peptide M lần lượt là 1, 2, 3,
4, 5, 6, 8 và 10 như được chỉ ra trên hình vẽ. Kích thước hộp mô
phỏng L được lựa chọn phụ thuộc vào số peptide M sao cho nồng
độ peptide được giữ không đổi ở 1 mM. Các cấu hình peptide trên
hình vẽ tương ứng với các trạng thái có năng lượng thấp nhất thu
được từ mô phỏng cho các hệ peptide được xét. Mũi tên đánh dấu
vị trí của nhiệt độ sinh lý giả định T ∗ . . . . . . . . . . . . . . . .
Hình 5.3 Tương tự như Hình 5.2 nhưng cho các hệ peptide với trình tự
S4. Để có thể quan sát rõ, số lượng hệ với M khác nhau được hiển
thị ít hơn so với trình tự S2. . . . . . . . . . . . . . . . . . . . . .
Hình 5.4 Sự phụ thuộc của giá trị đỉnh nhiệt dung riêng trên một phân
tử Cpeak /M (a) và nhiệt độ tương ứng của nó Tpeak (b) vào trình tự
của chuỗi đối với hệ M = 10 chuỗi peptide (đường liền nét), M = 6
(đường nét đứt) và M = 1 (đường chấm) peptide. Các trình tự
chuỗi được đánh số thứ tự theo Bảng 5.1. Đường nằm ngang trong
(b) tương ứng với nhiệt độ sinh lý giả định T ∗ trong mô hình. . .

Hình 5.5 Sự phụ thuộc của năng lượng của hệ vào số bước Monte Carlo
trong một mô phỏng tại nhiệt độ T = 0.2 /kB . Cấu hình peptide
trong hình là trạng thái cân bằng không bền với ba peptide tạo
thành một phiến β tiếp xúc với một xoắn α mất trật tự tạo bởi
peptide thứ tư. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hình 5.6 Sự phụ thuộc của năng lượng tự do, F , vào kích thước của
cấu trúc kết tụ lớn nhất, m, của hệ peptide có trình tự S2 với số
chuỗi peptide là M = 10 tại ba nhiệt độ khác nhau, T = 0.2, 0.21
và 0.22 /kB như được chú thích trên hình. Năng lượng tự do của
trạng thái không kết tụ, ứng với m = 1, được sử dụng như một giá
trị tham chiếu. Các đồ thị trên hình vẽ cho thấy một hàng rào năng
lượng tự do với cực đại tại vị trí m = 3. . . . . . . . . . . . . . .

xii

78

79

81

82

83


Danh mục các hình vẽ, đồ thị

Hình 5.7 Động học của quá trình kết tụ đối với hệ peptide có trình tự
S2 với kích thước hệ M = 20 peptide tại nồng độ 1 mM và nhiệt

độ T = 0.2 /kB . (a) Sự phụ thuộc của năng lượng, E, vào thời
gian, t, được đo bằng số bước MC cho ba quỹ đạo khác nhau. (b)
Sự phụ thuộc của kích thước của kết cụm lớn nhất m cho ba quỹ
đạo được chỉ ra trong hình (a). Các mũi tên trong mỗi quỹ đạo chỉ
ra thời điểm tạo nhân. (c) Biểu đồ kích thước kết cụm thu được
từ số peptide thu được sau thời gian mô phỏng dài t = 1.5 × 109
bước MC. (d) Hình ảnh của một cấu hình peptide tại thời điểm
tạo nhân. (e) Cấu hình của cụm tạo nhân được hình thành bởi ba
peptide từ cấu hình chỉ ra trong hình (d). (f) Cấu hình cấu trúc sợi
có dạng kéo dài tạo thành bởi 20 peptide thu được từ mô phỏng.
Hình 5.8 Sự phụ thuộc của số peptide trung bình tham gia phiến β,
nβ , vào thời gian cho quá trình kết tụ của hệ M = 20 peptide
với trình tự S2. Hệ được khảo sát tại các nhiệt độ T = 0.2 /kB
(a,b) và 0.21 /kB (c,d) tại vài nồng độ khác nhau: c = 1 mM (các
điểm hình vuông), 0.5 mM (các điểm hình tròn) và 0.25 mM (các
điểm hình tam giác) như chú thích trên hình. Đối với mỗi nồng
độ nβ được lấy trung bình từ 100 quỹ đạo mô phỏng độc lập. Các
hình bên phải (b và d) tương ứng được vẽ với cùng số liệu như
các hình bên trái (a và c) nhưng trong thang log-log. Các điểm dữ
liệu được khớp với hàm hồi phục M (1 − e−t/t0 ) (đường liền nét) với
t0 = 570 × 106 cho c = 1 mM trong hình (a) và t0 = 1850 × 106 cho
c = 0, 5 mM trong hình (a), và t0 = 109 cho c = 1 mM trong hình
(c). Các đồ thị trong thang tọa độ log-log chỉ ra rằng sự phát triển
của nβ trong thời gian ngắn ban đầu tuân theo quy luật hàm lũy
thừa, nβ ∝ tα , với α = 1 trong hình (b) và α = 1.25 trong hình
(d) cho cả hai nồng độ 1 mM và 0.5 mM. . . . . . . . . . . . . .

xiii

86


87


Danh mục các hình vẽ, đồ thị

Hình 5.9 (a) Hình ảnh cấu hình peptide thu được từ mô phỏng đối với
hệ hỗn hợp 10 chuỗi peptide có trình tự S2 và 10 chuỗi có trình tự
S4 tại nồng độ c = 1 mM và nhiệt độ T = 0.2 /kB . Các đơn phân
H có màu xanh đậm. Các đơn phân P có màu xanh nhạt và màu
hồng tương ứng với các chuỗi có trình tự S2 và S4. (b) Hình ảnh
nhìn từ trên xuống đã được phóng to đối với cấu trúc kết tụ trong
hình a. Chú ý rằng sáu chuỗi S4 có mặt trong kết cụm và 5 trong
số chúng tồn tại ở cấu hình phiến β. (c) Sự phụ thuộc số peptide
trung bình trong cấu hình phiến β, nβ , vào thời gian thu được từ
100 mô phỏng độc lập cho các peptide ở cả hai trình tự (các điểm
hình vuông) và chỉ với trình tự S4 (các điểm hình tròn). Dữ liệu
được khớp với hàm hồi phục dạng mũ đã được nêu ở Hình 5.8 cho
trường hợp cả hai trình tự với t0 = 832 × 106 (đường liền nét). .

xiv

88


Mở đầu
Trong khoảng 20 năm trở lại đây, nghiên cứu cơ bản trong lĩnh vực lý sinh
phân tử đã trở thành một hướng nghiên cứu phát triển mạnh trên thế giới. Đối
tượng nghiên cứu của lý sinh phân tử là các hệ sinh học với kích thước từ vài
tới vài chục nanomét như các protein, ADN, ARN, màng lipid và các phức hệ

bên trong tế bào. Các hệ phân tử sinh học này hiện nay có thể được nghiên cứu
bằng nhiều phương pháp thực nghiệm tiên tiến như cộng hưởng từ hạt nhân
(NMR), tán xạ tia X, kính hiển vi lực nguyên tử (AFM), đánh dấu phân tử và
huỳnh quang phổ v.v., cho phép thu được các thông tin về cấu trúc và các tính
chất động lực học của chúng. Bên cạnh đó, các phương pháp lý thuyết, tính
toán và mô phỏng máy tính là các công cụ rất quan trọng giúp tìm hiểu rõ hơn
các nguyên lý và các cơ chế vi mô liên quan tới các phân tử sinh học. Ngoài ra,
mô phỏng máy tính có thể đưa ra các tiên đoán cho thực nghiệm, giúp tiết kiệm
thời gian và chi phí nghiên cứu.
Trong các vấn đề của sinh học phân tử, vấn đề cuốn của protein luôn có
được sự quan tâm hàng đầu. Điều này trước tiên bởi vì protein đóng vai trò vô
cùng quan trọng đối với sự sống [1]. Protein tham gia vào tất cả các hoạt động
của cơ thể sống. Chúng thực hiện các chức năng như là thành phần cấu trúc
của tế bào, xúc tác các phản ứng hóa học (các enzyme), điều hòa và kiểm soát
các quá trình sinh hóa (các hormon protid, các protein hoạt hóa, ức chế), vận
chuyển oxy và các vi chất (hemoglobin, myoglobin, myosin), co cơ và vận động
(titin), bảo vệ (các kháng thể, bổ thể, yếu tố đông máu) v.v. Hầu hết các protein
chỉ thể hiện hoạt tính sinh học khi chúng nằm ở trạng thái cuốn với cấu trúc
3 chiều bó chặt và duy nhất cho mỗi protein, gọi là trạng thái tự nhiên (native
state) hoặc trạng thái cuốn (folded state) của protein. Khi protein bị duỗi hoặc
cuốn nhầm, chúng không chỉ mất đi các hoạt tính sinh học vốn có mà còn có
thể kết tụ thành các cấu trúc dạng sợi không hòa tan gọi là amyloid [2], được
biết là liên quan tới nhiều loại bệnh thoái hóa với tiến triển nghiêm trọng như
Alzheimer, Parkinson, tiểu đường tuýp 2, các loại bệnh xốp não, bệnh bò điên
v.v. Hầu hết các loại dược phẩm hiện nay được thiết kế nhằm tương tác với một
loại protein cụ thể nằm ở trạng thái cuốn. Do vậy, việc xác định cấu trúc cuốn
và làm rõ cơ chế cuốn của protein có vai trò to lớn đối với hiểu biết của chúng
ta về cơ thể sống cũng như đối với sức khỏe con người.
Về mặt hóa học, protein là một chuỗi polymer tuyến tính với các đơn phân
1



Danh mục các hình vẽ, đồ thị

(monomer) là các amino acid. Protein trong tự nhiên được tạo thành từ 20 loại
amino acid khác nhau. Mỗi phân tử protein được xác định bởi một chuỗi các
amino acid với một trình tự xác định. Hiện tượng cuốn của protein được biết
đến lần đầu vào những năm 50 của thế kỷ trước từ các thí nghiệm của Anfinsen
[3]. Trong các điều kiện sinh lý bình thường như trong một dung môi với nhiệt
độ 20-40◦ C, áp suất gần với áp suất khí quyển và pH ở vùng trung tính, protein
nằm ổn định ở trạng thái tự nhiên. Khi điều kiện của dung môi thay đổi, protein
có thể bị duỗi ra. Tuy nhiên, hầu hết các protein cuốn gần như ngay lập tức,
trong khoảng thời gian từ vài phần nghìn giây cho tới vài giây, về trạng thái tự
nhiên ban đầu khi các điều kiện sinh lý được hồi phục. Tính thuận nghịch của
các quá trình duỗi và cuốn protein đã đưa Anfinsen đến giả thiết rằng cấu trúc
3 chiều của trạng thái tự nhiên được quyết định hoàn toàn bởi trình tự amino
acid trong chuỗi protein. Giả thiết này cũng được biết đến với tên gọi là giả
thiết nhiệt động học (thermodynamic hypothesis) vì để trạng thái tự nhiên là
ổn định và duy nhất, nó phải là trạng thái cực tiểu năng lượng tự do của hệ
trong các điều kiện sinh lý bình thường. Với phát hiện của mình, Anfinsen đã
được trao giải Nobel hóa học vào năm 1972.
Vấn đề cuốn protein về cơ bản được coi là việc dự đoán cấu trúc 3 chiều của
phân tử protein khi biết trình tự amino acid của nó. Việc dự đoán này ngầm
định phải được thực hiện trên máy tính với các thuật toán xác định. Vấn đề
ngược của vấn đề cuốn protein là thiết kế protein: với một cấu trúc 3 chiều cho
trước, hãy tìm các trình tự amino acid có thể cuốn về cấu trúc này. Việc thiết
kế protein nhằm tạo ra các loại protein mới với các chức năng mong muốn, có
thể ứng dụng trong y sinh học. Trải qua hơn 4 thập kỷ, mặc dù các nhà nghiên
cứu đã có những thành công nhất định trong việc dự đoán cấu trúc cũng như
thiết kế protein [4], cho đến nay vấn đề cuốn protein về cơ bản vẫn chưa được

giải quyết. Điều này là do sự phức tạp của phân tử protein và của các tương
tác trong phân tử và tương tác của protein với dung môi. Mặc dù protein là hệ
mesoscopic với chiều dài khoảng từ vài chục tới vài nghìn amino acid, số lượng
các cấu hình khác nhau mà protein có thể có cũng như số lượng các trình tự
amino acid khác nhau là các con số vô cùng lớn. Việc dự đoán cấu trúc bằng
mô phỏng máy tính luôn gặp hạn chế bởi tốc độ máy tính, đặc biệt trong các
mô phỏng với tất cả các nguyên tử.
Song song với việc dự đoán cấu trúc protein từ trình tự amino acid, người
ta cũng đặt câu hỏi tại sao protein lại có thể cuốn nhanh chóng về trạng thái tự
nhiên như vậy. Lập luận của Levinthal vào cuối những năm 1960 cho thấy nếu
quá trình cuốn protein là một quá trình tìm kiếm mù lòa (blind search) trong
2


Danh mục các hình vẽ, đồ thị

không gian các cấu hình thì thời gian cuốn sẽ dài hơn tuổi của vũ trụ (nghịch
lý Levinthal) [5]. Do vậy, Levinthal cho rằng protein phải cuốn theo những lộ
trình cuốn (folding pathway) xác định nhằm giảm số cấu hình trung gian phải
trải qua. Vào thập niên 1990, Wolynes, Onuchic và Thirumalai đưa ra khái niệm
phễu cuốn [6], mô tả cấu trúc không gian cấu hình trong đó số cấu hình (hay
entropy) của hệ giảm khi năng lượng giảm. Protein được cho là có địa hình năng
lượng dạng phễu. Quá trình cuốn được coi là quá trình ngẫu nhiên có tính chất
hồi phục về trạng thái có năng lượng thấp nhất, trong đó việc giảm năng lượng
xảy ra đồng thời với việc giảm entropy. Với phễu cuốn, protein không nhất thiết
cuốn theo các lộ trình cuốn xác định, nhưng vẫn giảm được phần lớn số cấu
hình trung gian phải trải qua. Hầu hết các nghiên cứu hiện nay đều cho các kết
quả phù hợp với cách giải thích hiện tượng cuốn protein bằng phễu cuốn, mặc
dù vấn đề có tồn tại hay không các lộ trình cuốn xác định vẫn được đặt ra.
Hầu hết các protein nhỏ dạng cầu được biết cuốn theo cơ chế hai trạng thái

trong các thí nghiệm, với các đặc trưng về động học và cân bằng giống như các
phản ứng hóa học đơn giản. Quá trình cuốn của protein giống như một dạng
chuyển pha loại một với sự giải phóng ẩn nhiệt (latent heat). Protein được biết
có tính hợp tác cuốn (folding cooperativity) [7] cao, thể hiện ở đỉnh nhiệt dung
riêng sắc nét tại nhiệt độ chuyển pha cuốn. Nghiên cứu của Kaya và Chan [8]
cho thấy mức độ hợp tác cuốn của protein trong thực tế thu được từ các kết
quả thực nghiệm cao hơn đáng kể so với các mô hình thường sử dụng trong mô
phỏng. Trong các nghiên cứu về cơ chế cuốn của protein, việc tìm hiểu về trạng
thái chuyển tiếp (transition state) rất được quan tâm, do đây là trạng thái trung
gian quan trọng nhất quyết định tốc độ cuốn của protein. Các nghiên cứu thực
nghiệm của Fersht [9] cho thấy protein có thể có nhiều trạng thái chuyển tiếp
khác nhau, hay nói cách khác là tồn tại một tập hợp các trạng thái chuyển tiếp.
Điều này ủng hộ lý thuyết phễu cuốn vì cho thấy protein có thể có rất nhiều lộ
trình cuốn khác nhau.
Hiện tượng kết tụ protein và sự hình thành amyloid cũng được nghiên cứu
mạnh trong những năm gần đây. Người ta thấy rằng rất nhiều protein, kể các
cả các protein không liên quan tới các bệnh tật, và các đoạn protein (peptide),
trong các điều kiện thích hợp (thông thường khi protein bị làm duỗi và ở mật
độ cao) đều có thể kết tụ thành amyloid. Ngoài ra, các kết tụ amyloid có các
đặc trưng cấu trúc rất giống nhau (dạng sợi dài, giàu phiến β) mặc dù trình tự
amino acid của các protein hoặc peptide tạo thành chúng là rất khác nhau. Điều
này dẫn đến giả thuyết cho rằng amyloid là trạng thái chung của mọi protein,
và là trạng thái cơ bản của hệ khi các protein có thể hình thành các tương tác
3


Danh mục các hình vẽ, đồ thị

liên phân tử. Như vậy, xu hướng kết tụ và hình thành amyloid luôn tồn tại cho
mọi protein, và là một xu hướng cạnh tranh với quá trình cuốn protein. Tuy

vậy, các thí nghiệm cũng cho thấy rằng khả năng kết tụ và tốc độ kết tụ phụ
thuộc vào các điều kiện dung môi và vào trình tự amino acid của các protein.
Một số nghiên cứu cho thấy trong chuỗi protein có thể tồn tại các đoạn trình
tự amino acid nhỏ có ảnh hưởng lớn tới khả năng kết tụ của cả protein. Do vậy,
việc nghiên cứu để tìm ra mối liên hệ giữa trình tự amino acid và khả năng kết
tụ là rất cần thiết, có ý nghĩa cơ bản trong việc tìm hiểu các bệnh liên quan tới
amyloid cũng như tìm ra phương hướng để chữa trị các loại bệnh này.
Mặc dù các mô phỏng với mô hình đầy đủ các nguyên tử (all-atom simulations) hiện nay được sử dụng khá phổ biến trong các nghiên cứu về các hệ sinh
học phân tử, việc áp dụng các phương pháp này trong nghiên cứu cuốn protein
là không khả thi do giới hạn của tốc độ máy tính. Máy tính hiện nay chỉ cho
phép mô phỏng hệ đầy đủ các nguyên tử tới thời gian dưới 1 micro giây, trong
khi thời gian cuốn ở mức mili giây hoặc cao hơn. Một cách tiếp cận phù hợp
đối với vấn đề cuốn protein đó là dùng các mô hình lý thuyết đơn giản. Mặc dù
các mô hình này có thể không trực tiếp dự đoán được cấu trúc protein, chúng
mang lại nhiều hiểu biết cơ bản về hiện tượng cuốn protein, và có thể giúp tìm
ra phương hướng giải quyết vấn đề cuốn protein. Hạn chế chung của các mô
hình đơn giản đó là nhiều chi tiết về cấu trúc bị lược bỏ, do vậy các kết quả thu
được cần sự biện luận hoặc cần được kết hợp với các mô phỏng đầy đủ nguyên
tử (trong cách tiếp cận đa tỷ lệ) để có thể đưa ra các kết quả mang tính định
lượng cho các protein cụ thể. Có khá nhiều mô hình với các ý tưởng và mức độ
đơn giản hóa khác nhau, tuy nhiên đáng kể nhất là các mô hình sau đây. Mô
hình Go [10, 11], được đề xuất bởi G¯o và Abe vào năm 1981 và được áp dụng
trên trên mạng 2 chiều, trong đó các tương tác giữa các hạt (mỗi amino acid
được coi là một hạt) được lựa chọn sao cho chỉ các tiếp xúc trong trạng thái tự
nhiên có năng lượng âm, còn năng lượng của các tiếp xúc khác đều bằng không.
Mô hình Go luôn đảm bảo trạng thái tự nhiên có năng lượng thấp nhất và duy
nhất. Tuy nhiên, nó không xét tới trình tự amino acid của protein. Các mô hình
Go ngoài mạng, còn gọi là các mô hình tương tự Go, được xây dựng dựa trên
các cấu trúc thực của protein cho cơ chế cuốn khá phù hợp với các kết quả thực
nghiệm [12]. Cho tới nay, mô hình Go và các mô hình tương tự Go được sử dụng

khá rộng rãi trong các nghiên cứu về protein, ví dụ trong nghiên cứu về sự phụ
thuộc của các tính chất cuốn và chiều dài của protein [13], trạng thái chuyển
tiếp trong cuốn protein [14], các lộ trình cuốn [15, 16], kéo duỗi protein [17, 18]
v.v. Mô hình protein đơn giản thứ hai là mô hình HP trên mạng được nghiên
4


Danh mục các hình vẽ, đồ thị

cứu lần đầu tiên bởi Dill và các cộng sự vào năm 1989 [7, 19]. Mô hình này giả
thiết các amino acid được chia thành 2 loại, kỵ nước (H – hydrophobic) và phân
cực (P – polar), và tương tác hút chỉ tồn tại giữa các amino acid kỵ nước. Mô
hình HP cho phép tìm hiểu trên phương diện lý thuyết về mối liên hệ giữa trình
tự amino acid đối với cấu trúc của trạng thái cuốn ở mức độ đơn giản nhất, cũng
như các vấn đề liên quan tới cơ chế cuốn và địa hình năng lượng của protein.
Tuy vậy, mô hình HP khó có thể phát triển ra ngoài mạng do gặp vấn đề về sự
suy biến của trạng thái cơ bản (nhiều cấu hình có cùng năng lượng thấp nhất).
Do vậy, nó không áp dụng được cho các cấu trúc protein thực hoặc gần với cấu
trúc protein thực.
Vào năm 2000, nghiên cứu của Maritan và các cộng sự đăng trên tạp chí
Nature [20] cho thấy polymer dạng ống có cấu trúc đóng gói chặt nhất có dạng
xoắn (helix) với các thông số cấu trúc gần với các thông số cấu trúc của xoắn α
trong protein. Các nghiên cứu tiếp theo về polymer dạng ống với các thế năng
hai hạt và ba hạt cho thấy tại các miền tham số thích hợp trạng thái cơ bản
của hệ là các cấu trúc xoắn và cả cấu trúc phẳng, tương tự như phiến β trong
protein. Trong khi đó, các polymer thông thường, được mô hình hóa là chuỗi các
hạt hình cầu, chỉ có thể hình thành các cấu trúc bó chặt ngẫu nhiên và thiếu
các đặc trưng của cấu trúc protein. Điều này gợi ý rằng tính chất đối xứng dạng
ống là đặc trưng cơ bản của phân tử protein, giúp hình thành nên các cấu trúc
bậc hai của protein (xoắn α và phiến β). Trên cơ sở của ý tưởng này, mô hình

ống cho protein được phát triển bởi Hoàng cùng nhóm nghiên cứu của Maritan,
và được đề xuất vào năm 2004 [21]. Trong mô hình ống, ngoài tính chất lấp
đầy không gian của polymer dạng ống trong không gian liên tục, các tương tác
được xét bao gồm thế năng bẻ cong, thế năng tương tác kỵ nước và các liên kết
hydro có tính định hướng cao. Mô hình ống cho thấy trong một miền nhất định
của các tham số năng lượng bẻ cong và năng lượng tương tác kỵ nước, trạng
thái cơ bản và các cực tiểu năng lượng thấp của hệ có cấu trúc giống như cấu
trúc bậc ba của protein, ngay cả trong trường hợp hệ được xét là polymer đồng
nhất (homopolymer). Điều này dẫn đến giả thuyết cho rằng không phải trình tự
amino acid, mà tính chất đối xứng và các ràng buộc về hình học do các tương
tác trong phân tử protein dẫn tới việc hình thành các cấu trúc tương tự như
cấu trúc protein [21]. Hay nói cách khác, địa hình năng lượng tự do của protein
đã được tạo hình (presculpted) bởi tính đối xứng dạng ống và các ràng buộc về
hình học. Trình tự amino acid vẫn đóng vai trò quan trọng trong việc lựa chọn
một cấu trúc duy nhất trong không gian các cấu trúc tương tự như các cấu trúc
protein. Nghiên cứu sử dụng mô hình ống với 2 loại amino acid, kỵ nước và ưa
5


Danh mục các hình vẽ, đồ thị

nước, giống như trong mô hình HP, cho thấy có thể dễ dàng thiết kế các trình
tự HP có thể cuốn về các cấu trúc bậc ba giống protein được lựa chọn trước
[22].
Mô phỏng sử dụng mô hình ống cũng cho thấy các hệ với nhiều chuỗi protein
hoặc peptide có xu hướng hình thành các cấu trúc kết tụ giàu phiến β giống
như amyloid [23]. Điều này giúp củng cố quan điểm cho rằng xu hướng kết tụ
thành amyloid là tính chất chung của mọi protein [24]. Mô hình ống là mô hình
lý thuyết đầu tiên có thể giải thích một cách thống nhất hiện tượng cuốn protein
và sự hình thành amyloid [23]. Auer và các cộng sự [25, 26] đã sử dụng mô hình

ống để mô phỏng sự hình thành amyloid cho các hệ nhiều chuỗi peptide đồng
nhất (homopeptide). Các mô phỏng này cho thấy khi nồng độ peptide đủ lớn,
quá trình hình thành amyloid thường xảy ra theo hai bước: đầu tiên các peptide
trong dung dịch kết tụ thành các oligomer có cấu trúc mất trật tự, tiếp theo là
quá trình trật tự hóa (ordering) các oligomer này thành cấu trúc dạng phiến β.
Quá trình tạo nhân (nucleation) xảy ra ở bước thứ hai. Ngoài ra, Auer và các
cộng sự cũng tính toán được giản đồ pha mô tả khả năng hòa tan (solubility)
của các cấu trúc kết tụ với số lớp phiến β khác nhau phụ thuộc vào nhiệt độ và
nồng độ peptide trong dung dịch [27]. Các kết quả của mô hình ống cho thấy đây
là một mô hình đơn giản nhưng mô tả tốt nhiều đặc trưng cơ bản của protein.
Mô hình ống cũng là mô hình duy nhất hiện nay có thể đồng thời sử dụng cho
nghiên cứu cả quá trình cuốn và quá trình kết tụ.
Trong luận án này, chúng tôi sử dụng mô hình ống để nghiên cứu ảnh hưởng
của trình tự amino acid lên cơ chế cuốn của protein và sự kết tụ của peptide.
Tính chất lấp đầy không gian của polymer dạng ống và các liên kết hydro trong
mô hình đóng vai trò các tương tác nền, không phụ thuộc vào trình tự amino
acid. Trình tự amino acid sẽ được chúng tôi xem xét trong mô hình đơn giản
hóa chỉ gồm 2 loại amino acid, kỵ nước (H) và phân cực (P). Để nghiên cứu ảnh
hưởng của trình tự HP lên quá trình cuốn, chúng tôi sẽ so sánh tính chất cuốn
của mô hình ống sử dụng tương tác kỵ nước với trình tự HP (mô hình ống HP)
với mô hình ống sử dụng các tương tác cặp giống như trong mô hình Go (mô
hình ống Go). Việc so sánh này giúp làm rõ hơn vai trò của các tương tác cặp
kỵ nước không xuất hiện trong trạng thái tự nhiên (non-native interactions).
Để nghiên cứu vai trò của trình tự HP lên sự kết tụ của protein, chúng tôi sẽ so
sánh khả năng kết tụ của các chuỗi peptide với các trình tự HP khác nhau, bao
gồm việc xem xét tới hình dạng của các cấu trúc kết tụ và tính chất của quá
trình chuyển pha kết tụ. Trong nghiên cứu về sự kết tụ của protein chúng tôi
đề xuất một mô hình cải tiến cho tương tác kỵ nước trong mô hình ống, có xét
6



Danh mục các hình vẽ, đồ thị

tới tính định hướng của các chuỗi bên của các amino acid kỵ nước. Nghiên cứu
của chúng tôi cho thấy mô hình cải tiến này cho phép thu được các cấu trúc kết
tụ có trật tự cao và có dạng sợi dài giống như sợi amyloid. Ngoài ra, chúng tôi
cũng tìm hiểu đối với một hệ trộn 2 loại peptide với các trình tự HP khác nhau
thì quá trình kết tụ sẽ xảy ra như thế nào.
Các protein và peptide được nghiên cứu trong luận án là các chuỗi ngắn với
chiều dài 48 amino acid cho protein và 8 amino acid cho peptide. Các protein
được nghiên cứu như các hệ đơn phân tử, trong khi các peptide được xét trong
các hệ đa phân tử với các nồng độ khác nhau trong dung dịch. Các tính chất
cuốn và kết tụ được nghiên cứu thông qua việc khảo sát các cấu trúc cân bằng
thu được từ mô phỏng; các đặc trưng nhiệt động lực học như nhiệt dung riêng,
năng lượng tự do; quá trình tạo nhân và tiến diễn của sự hình thành các cấu trúc
theo thời gian. Phương pháp nghiên cứu được sử dụng là mô phỏng Monte Carlo
trong tập hợp chính tắc (NVT). Ngoài ra chúng tôi áp dụng một số phương pháp
mô phỏng và tính toán nâng cao bao gồm phương pháp điều nhiệt song song
(parallel tempering) và phương pháp phân tích đa biểu đồ có trọng số, nhằm
lấy mẫu hiệu quả và tính toán được chính xác các tính chất cân bằng của hệ.
Luận án được chia làm 5 chương không kể các phần mở đầu, kết luận và tài
liệu tham khảo. Chương 1 giới thiệu tổng quan về vấn đề cuốn protein. Chương
2 giới thiệu tổng quan về hiện tượng kết tụ protein và sự hình thành amyloid.
Chương 3 đề cập đến các mô hình, phương pháp mô phỏng và phương pháp xử
lý số liệu. Chương 4 trình bày kết quả nghiên cứu về vai trò của trình tự HP
đối với cơ chế cuốn protein. Chương 5 trình bày kết quả nghiên cứu vai trò của
trình tự HP đối với sự kết tụ của peptide.

7



Chương 1

Sự cuốn của protein
Trong chương này, chúng tôi sẽ giới thiệu tổng quan về sự cuốn của protein
bao gồm một số kiến thức cơ sở về cấu trúc protein và hiện tượng cuốn protein,
các quan điểm lý thuyết về cuốn protein, mô hình lý thuyết cho cơ chế cuốn
protein, và một số kết quả thu được từ các mô hình đơn giản hóa sử dụng trong
nghiên cứu cuốn protein.

1.1

Các đặc trưng cấu trúc của protein

Protein là các đại phân tử được tổng hợp bởi tế bào và chịu trách nhiệm
cho hầu hết các hoạt động sinh học của tế bào. Chúng là những hợp chất hữu
cơ cao phân tử (polymer) được tạo thành từ các đơn phân (monomer) gồm 20
loại amino acid khác nhau. Các amino acid trong protein chỉ khác nhau ở chuỗi
bên (side chain) của chúng và liên kết với nhau thông qua các liên kết peptide
tạo thành một chuỗi tuyến tính theo một trình tự cụ thể (Hình 1.1a). Trình tự
amino acid trong protein quyết định cấu trúc và chức năng của protein, và được
gọi là cấu trúc bậc một của protein. Do chứa các liên kết peptide, chuỗi amino
acid trong protein còn được gọi là chuỗi polypeptide, và các đoạn protein ngắn
được gọi là các peptide.
Ở các điều kiện bình thường của cơ thể sống, cụ thể là trong một dung môi
có pH trong vùng trung tính với nhiệt độ khoảng 20–40◦ C và dưới áp suất khí
quyển, phần lớn các protein nằm ở một trạng thái có cấu trúc ba chiều gói chặt
và duy nhất cho mỗi protein, được gọi là trạng thái tự nhiên (native state) hoặc
trạng thái cuốn (folded state) của protein. Hoạt tính sinh học của protein chỉ
được thể hiện khi nó nằm ở trạng thái cuốn. Hiện nay có khoảng hơn 130.000

cấu trúc protein và các phức hệ protein đã được xác định bởi thực nghiệm sử
dụng các phương pháp như tinh thể học tia X (X-ray crystallography) và cộng
hưởng từ hạt nhân (Nuclear Magnetic Resonance – NMR), được lưu giữ trong
ngân hàng dữ liệu protein PDB (Protein Data Bank).
Các cấu trúc protein có một điểm chung đó là được đặc trưng bởi các dạng
cấu trúc địa phương là xoắn α, phiến β và khúc ngoặt (turn), gọi là các cấu trúc
bậc hai [1]. Hình 1.2(a–c) cho ta thấy hình ảnh cấu trúc 3 chiều của vùng B1
8


Chương 1. Sự cuốn của protein

(b)

(a)

amino group

carboxyl group

(c)

Peptide bonds

Hình 1.1: Hình vẽ minh họa a) cấu trúc hóa học của amino acid (trừ proline), b) cấu trúc hóa học
của proline (Pro) và c) chuỗi polypeptide với các amino acid liên kết với nhau bởi các liên kết peptide.
Mỗi amino acid gồm một nguyên tử carbon trung tâm Cα liên kết với một nhóm amine (-NH2 ), một
nhóm carboxyl (-COOH), một nguyên tử H và một chuỗi bên R. Trong amino acid proline, chuỗi bên
R liên kết hóa trị với nguyên tử C trong nhóm carboxyl. Các amino acid trong protein khác nhau bởi
chuỗi bên R.


của protein G, gồm một xoắn α và một phiến β tạo bởi 4 dải β. Hình 1.2(d–f)
cho thấy một ví dụ khác với cấu trúc cuốn của protein A có dạng bó xoắn tạo
bởi 3 xoắn α. Có thể thấy rằng các cấu trúc bậc hai chiếm tỷ lệ lớn trong chuỗi
polypeptide. Cấu trúc trạng thái cuốn của toàn bộ protein, thường là của một
chuỗi polypeptide, được gọi là cấu trúc bậc ba. Các cấu trúc bậc ba của protein
rất đa dạng, tuy nhiên khá nhiều protein có cấu trúc giống nhau hoặc gần giống
nhau. Do đó người ta phân loại cấu trúc protein thành các họ (family) với số
lượng họ cấu trúc khoảng vài nghìn [28]. Các protein lớn có thể có nhiều vùng
cấu trúc khác nhau. Một số protein có thể gồm vài chuỗi polypeptide với các
cấu trúc bậc ba riêng biệt. Khi đó sự sắp xếp không gian của các cấu trúc bậc
ba trong protein được gọi là cấu trúc bậc bốn. Một dạng cấu trúc bậc bốn phổ
biến là dimer được lắp ghép bởi hai cấu trúc bậc ba của hai chuỗi polypeptide
giống nhau.
Các cấu trúc bậc hai xoắn α và phiến β lần đầu tiên được phát hiện bởi Linus
Pauling vào năm 1951 dựa trên sự tối ưu hóa số liên kết hydro giữa các nhóm
amine và carboxyl trong mạch xương sống của protein [29, 30]. Ramachandran
khảo sát các góc nhị diện của mạch xương sống của chuỗi polypeptide được cho
phép bởi sự chiếm giữ không gian của các nguyên tử và tìm thấy 2 vùng trên
bản đồ góc nhị diện (gọi là bản đồ Ramachandran) tương ứng với các cấu trúc
xoắn α và phiến β [31]. Dựa trên các phân tích thống kê, người ta phát hiện ra
các amino acid Proline (Pro) và Glycine (Gly) ít tham gia các cấu trúc bậc hai,
9


×