Tải bản đầy đủ (.pdf) (54 trang)

CẤU TRÚC VÀ CHỨC NĂNG CỦA PROTEIN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.27 MB, 54 trang )

Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
1

CHƯƠNG 7: CẤU TRÚC VÀ CHỨC NĂNG CỦA PROTEIN

Protein được cấu thành từ amino acid
Hai mươi amino acid cấu thành các chuỗi polypeptide sinh học
Những amino acid cho thấy sự bất đối quanh carbon alpha
Cấu trúc của protein phản ánh bốn cấp độ tổ chức
Cấu trúc bậc hai của protein hình thành dựa vào liên kết hydro
Cấu trúc bậc ba của protein
Rất nhiều lực tham gia duy trì cấu trúc 3-D của protein
Cysteine tạo thành các liên kết disulfide
Nhiều vùng cuộn gấp trong những protein lớn
Cấu trúc bậc 4 của protein:
Cấu trúc lắp ráp ở cấp độ cao và quá trình tự lắp ráp
Các cofactor và các ion kim loại thường được liên kết với protein
Nucleoprotein, lipoprotein và glycoprotein là các protein kết hợp
Bộ máy protein
Enzyme xúc tác phản ứng chuyển hóa
Các mức độ đặc hiệu của enzyme rất đa dạng:
Mô hình ổ khóa-chìa khóa và mô hình khớp cảm ứng miêu tả mối tương tác giữa
enzyme và cơ chất
Enzyme hoạt động bằng việc giảm năng lượng hoạt hóa
Tốc độ phản ứng của enzyme
Những chất chất đồng hình với cơ chất ức chế hoạt động của enzyme tại trung tâm
hoạt động
Enzyme có thể được điều hòa trực tiếp
Enzyme dị lập thể bị ảnh hưởng bởi phân tử tín hiệu
Enzymes có thể được kiểm soát bởi những biến đổi hóa học


Protein kết hợp với DNA theo một vài cách khác nhau
Sự biến tính protein
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
2

Protein được cấu thành từ amino acid
Các nucleic acid DNA và RNA phần lớn liên quan đến việc lưu trữ và truyền
thông tin di truyền, và vì vậy được gọi là các đại phân tử thông tin. Ngược lại, protein là
các polymer sinh học thực hiện hầu hết các chức năng thông thường của tế bào. Một số
protein là phân tử cấu trúc hay tham gia vào việc duy trì hình dạng tế bào và thực hiện
việc vận động của tế bào; một số khác tham gia vận chuyển chất dinh dưỡng và chất thải;
số khác nữa thực hiện chức năng xúc tác thông qua việc tổng hợp năng lượng và thực
hiện các phản ứng sinh hóa, bao gồm việc tổng hợp nucleotide và lắp ráp chúng thành
nucleic acid.
Những phân tử DNA và mRNA với chức năng chính là mang thông tin di truyền
là những đại phân tử mạch thẳng với cấu trúc lặp lại đều đặn.[Chú ý là điều ngược lại
không đúng: có một cấu trúc dạng thẳng, lặp đi lặp lại chưa chắc đã mang thông tin di
truyền như chất dẻo, polyethylen và một vài cấu trúc của protein như collagen cũng thuộc
loại kiểu cấu trúc này]. Những phân tử cấu trúc và chức năng vận chuyển và/hoặc là
enzyme thường cuộn gấp lại thành cấu trúc bậc ba (3-D). Chúng bao gồm protein và một
số phân tử RNA như: rRNA và tRNA. Tuy nhiên cả protein và phân tử RNA uốn nếp đều
cấu tạo từ polymer thẳng đầu tiên về sau mới gấp lại.
Protein bao gồm một chuỗi đơn phân mạch thẳng, được biết đến là các axít amin,
và uốn nếp tạo nhiều hình dạng 3-D phức tạp. Một chuỗi amino acid được gọi là một
chuỗi polypeptide. Sự khác biệt giữa một chuỗi polypeptide và protein là gì? Thứ nhất,
một số protein bao gồm nhiều hơn một chuỗi polypeptide và thứ hai, nhiều protein
có chứa các thành phần bổ sung như các ion kim loại hoặc các phân tử hữu cơ nhỏ được
biết đến là cofactor, thêm vào phần polypeptide (xem bên dưới).


Sự hình thành các chuỗi polypeptide
Hai mươi amino acid khác nhau được sử dụng để cấu thành các protein. Tất cả
các amino acid đều có một nguyên tử cacbon trung tâm, các carbon alpha, bao quanh bởi
một nhóm amino, một nhóm carboxyl, một nguyên tử hydro và một chuỗi bên hoặc
nhóm-R, như trong hình 7.01A (proline là một trường hợp ngoại lệ, xem dưới đây).
Amino acid đơn giản nhất là glycine (Hình 7.01B), trong đó gốc R chỉ là một nguyên tử
hydro duy nhất. Trong dung dịch, ở điều kiện sinh lý, các nhóm amin và nhóm carboxyl
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
3

của các amino acid đều bị ion hóa, tạo thành phân tử lưỡng cực hay ion lưỡng cực với
một cực tích điện dương và một cực tích điện âm (Hình 7.01C).

Amino acid được nối với nhau bằng liên kết peptide (Hình 7.02) để tạo thành một
chuỗi polypeptide. Amino acid đầu tiên trong chuỗi có nhóm amino (-NH
2
) tự do và đầu
này được gọi là đầu amino hay đầu N của chuỗi polypeptide. Amino acid cuối cùng được
gắn vào chuỗi với một nhóm carboxyl (-COOH) tự do, do đó đầu đó được gọi là đầu
carboxyl hay đầu C. Khi tổng hợp, polypeptide được kéo dài từ đầu amino (N) về phía
đầu carboxyl (C).




Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
4


Hai mươi amino acid cấu thành các chuỗi polypeptide sinh học



















Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
5

Hai mươi amino acid thấy trong protein có nhiều nhóm hóa học khác nhau (Hình
7.03). Khả năng hình thành nhiều monomer khác nhau làm thành tập hợp các protein rất
đa năng, với nhiều đặc tính và khả năng, bao gồm rất nhiều cấu hình 3-D có thể khác
nhau. Các amino acid có thể được phân chia thành các nhóm dựa vào các đặc điểm lý hóa
của chúng. Sự phân chia cơ bản chia chúng thành nhóm có nhóm bên (R-group) ưa nước
(hydrophilic) và nhóm có nhóm bên kỵ nước (hydrophobic). Glycine có nhóm bên là một

nguyên tử hydro, nên nó không thực sự phù hợp một nhóm nào trong hai nhóm kể trên.
Các amino acid ưa nước có thể được chia thành nhóm kiềm, axít và trung tính.
Các amino acid kiềm góp điện tích dương cho protein trong khi các gốc axít cung cấp
điện tích âm. Chính xác hơn, việc tích điện này chỉ đúng trong dung dịch ở khoảng pH
sinh lý. Các gốc trung tính có các chuỗi bên có khả năng hình thành các liên kết hydro.
Nhóm bên của các amino acid ưa nước mang các nhóm hóa học có thể tham gia trong các
phản ứng. Vị trí hoạt động của các enzyme (xem dưới đây) thường chứa serine,
histidine, amino acid kiềm và các amino acid axít.
Các amino acid kỵ nước có thể được chia thành nhóm các amino acid béo (Ala,
Leu, Ile,Val, Met) và nhóm có vòng thơm (Phe, Trp và Tyr). Các amino acid này phần
lớn có chức năng cấu trúc, ngoại trừ tyrosine trong đó có một nhóm hydroxyl đính vào
vòng thơm và do đó có thể tham gia vào một loạt các phản ứng. Việc phân loại tyrosine
còn nhập nhằng vì nó có nhóm hydroxyl có bản chất là phân cực. Proline có vòng không
thơm, nói đúng, nó là imino acid (chứ không phải là amino acid) vì nó có một nhóm-NH-
(imino) như là một phần của một vòng (thay vì một nhóm amin tự do).
Hai trong số các amino acid kỵ nước, Met và Cys, chứa lưu huỳnh. Khi một chuỗi
polypeptide lần đầu tiên tổng hợp, methionine luôn luôn là amino acid đầu tiên, mặc dù
nó có thể được cắt ra sau đó. Cysteine quan trọng với cấu trúc 3-D vì nó tạo ra liên kết
disulfide (xem dưới đây). Các nhóm sulfhydryl tự do của cysteine rất dễ tham gia phản
ứng và thường được sử dụng trong các vị trí hoạt động enzyme hoặc để liên kết với các
nhóm chất hóa học khác nhau vào protein.
Hai mươi amino acid khác nhau thấy trong các protein có thể được viết tắt bằng
hệ thống ba chữ cái và hệ thống một chữ cái (bảng 7.01). Chữ viết tắt các amino acid
thường là (những) chữ cái đầu của tên, nhưng một số amino acid đôi khi bắt đầu với cùng
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
6

một chữ của bảng chữ cái, những chữ khác cần một chút trí tưởng tượng. Chúng đặc biệt
được sử dụng khi viết ra các trình tự protein. Các amide, asparagine and glutamine, tương

đối không ổn định và bị phá vỡ một cách dễ dàng thành các axit tương ứng, là aspartate
và glutamate. Do đó, khi phân tích, nhiều nhà khoa học không phân biệt các amino acid
axit với amide của chúng. Các chữ viết tắt Asx và Glx đã được phát minh để biểu thị
chung cho các cặp không rành mạch này.
Những amino acid cho thấy sự bất đối quanh carbon alpha
Ngoài glycine, các amino acid có bốn nhóm hóa học khác nhau xung quanh các
nguyên tử carbon alpha trung tâm. Carbon này được gọi là chiral hoặc trung tâm bất đối
xứng (Hình 7.04). Do đó các amino acid như vậy tồn tại hai dạng đồng phân đối xứng
qua gương với đặc tính đối xứng hay chiều khác nhau. Một cặp đồng phân qua gương,
được biết đến như enantiomers hoặc đồng phân quang học. Chúng được gọi là dạng L
và D.
Việc phân chia thành kiểu L và D dựa vào việc các phân tử bất đối xứng làm quay
mặt phẳng phân cực ánh sáng sang hoặc bên trái (L = levorotatory ) hoặc bên phải (D =
dextrorotatory) (Xem thêm về mặt phẳng phân cực ánh sáng:

Sự quay quang
học bị triệt tiêu khi dạng L và D cùng có mặt với lượng tương đương. Một hỗn hợp bằng
nhau của đồng phân L và D được biết đến như một hỗn hợp đẳng quang (racemic
mixture) và enzyme chuyển đổi qua lại giữa đồng phân D và L của phân tử được gọi là
racemases. Một phân tử có nhiều các trung tâm bất đối xứng, chẳng hạn như một chuỗi
polypeptide, sẽ có thể có nhiều đồng phân lập thể, vì mỗi trung tâm có thể tồn tại dưới
dạng cấu tạo L hoặc D.
(
Tất cả các amino acid được tìm thấy trong protein là dạng L. Mặc dù L- axit min
đôi khi được gọi là đồng phân "tự nhiên", D- amino acid có tồn tại trong tự nhiên. Các
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
7

peptidoglycan trong vách tế bào vi khuẩn chứa vài loại D- amino acid khác nhau, và một

số kháng sinh peptide được amino acid.




Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
8

Cấu trúc của protein phản ánh bốn cấp độ tổ chức
Các chuỗi polypeptide thẳng phải được cuộn gấp thành cấu trúc 3-D để có thể
thực hiện đúng chức năng. Hơn nữa, nhiều protein được tạo thành từ nhiều hơn một chuỗi
polypeptide và cũng có nhiều protein còn có thêm các cofactor hay nhóm ngoại
(prosthetic group) là các phân tử kết hợp có bản chất không phải là amino acid. Cấu
trúc cuối cùng của một protein được xác định bởi trình tự amino acid của nó, do đó,
protein với các trình tự protein tương đồng sẽ có cấu hình 3-D tương tự.
Polypeptide điển hình dài khoảng 300-400 amino acid. Polypeptide ngắn hơn
nhiều hoặc lớn hơn nhiều ít phổ biến hơn. Tuy nhiên, nhiều hormone và các yếu tố tăng
trưởng, chẳng hạn như insulin, lại cấu tạo bởi các chuỗi polypeptide tương đối ngắn. Một
polypeptide đặc biệt với hơn một nghìn amino acid là rất hiếm và các protein rất lớn có
xu hướng cấu thành bởi vài chuỗi polypeptide riêng biệt nhiều hơn là một chuỗi đơn dài.
Cấu trúc của các đại phân tử sinh học, cả protein và nucleic acid, thường chia
thành bốn cấp độ tổ chức.
1. Cấu trúc bậc một là trình tự của các monomer: tức là trình tự của các
amino acid trong một protein hay của các nucleotide trong DNA hoặc
RNA.
2. Cấu trúc bậc hai là cấu trúc gấp hay vặn xoắn của các chuỗi polymer
nhờ liên kết hydro Trong trường hợp của protein, các liên kết hydro
hình thành giữa các nguyên tử của xương sống polypeptide (trong nhóm
peptide).

3. Cấu trúc bâc 3 là cấu trúc gấp hơn nữa tạo thành cấu trúc không gian 3
chiều cuối cùng của một polymer. Trong trường hợp protein, điều này
liên quan đến tương tác giữa nhóm R của các axit amin.
4. Cấu trúc bậc 4 là do sự lắp ghép các chuỗi polypeptide đơn để tạo
thành cấu trúc cuối cùng.

Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
9


Cấu trúc bậc hai của protein hình thành dựa vào liên kết hydro
Theo định nghĩa, cấu trúc bậc 2 là sự cuộn gấp chỉ phụ thuộc vào liên kết
hydro. Trong DNA, liên kết hydro do bắt cặp bổ sung là nền tảng của chuỗi xoắn kép
helix. Trong protein, liên kết hydro tạo thành cấu trúc bậc hai xảy ra giữa các nhóm
peptide làm xương sống của các polypeptide (hình 7.05). Các chuỗi polypeptide phải
được cuộn gấp lại để mang hai nhóm peptide sát với nhau. Các hydro trên nitơ của một
nhóm peptide sau đó liên kết với oxy của nhóm kia. [Chú ý rằng liên kết hydro cũng góp
phần tạo nên cấu trúc bậc 3, nhưng ở đây liên kết hydro không phải là liên kết duy nhất
hoặc thậm chí là liên kết chính tham gia tạo thành cấu trúc đó.]
Hầu hết các cấu trúc bậc 2 trong protein thuộc một trong hai của cấu trúc bậc hai là
chuỗi xoắn alpha (α-/ alpha helix) và nếp gấp beta (β- /beta sheet). Cả hai cấu trúc đều
cho phép tạo thành lượng liên kết hydro tối đa có thể và do đó rất ổn định.

Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
10

Trong một chuỗi xoắn α-helix (Hình 7.06), một chuỗi polypeptide đơn được cuộn
xoắn thành xoắn phải và liên kết hydro chạy theo chiều dọc lên xuống, song song với trục

xoắn. Trong thực tế, các liên kết hydro trong một chuỗi xoắn a-helix không phải là song
song với trục. nó hơi nghiêng so với trục xoắn vì có 3,6 amino acid cho mỗi vòng chứ
không phải là số nguyên. Chiều dài của một vòng xoắn là 0,54 nm và chiều cao của một
amino acid là 0,15 nm.
Các liên kết hydro giữ các vòng xoắn kế tiếp nhau của các chuỗi xoắn helix, và
chúng chạy từ nhóm C=O của một amino acid đến nhóm N-H của amino acid thứ 4 phía
dưới trong chuỗi. Chuỗi xoắn kép helix rất ổn định bởi vì tất cả các nhóm peptide (-NH-
CO-) đều tham gia vào hai liên kết hidro; một ở trên, một ở dưới dọc theo trục xoắn.
Chuỗi xoắn phải là ổn định nhất cho các L- axit amin. (một chuỗi xoắn ổn định không
thể được hình thành với cả D- và L- amino acid mặc dù xoắn bên trái có thể xoắn ổn định
về mặt lí thuyết khi được hình thành từ các D- axít amin.
Các nhóm R quay ra phía ngoài của xương sống peptide được gói chặt của chuỗi
polypeptide. Trong số 20 axit amin, Ala, Glu, Leu và Met là các amino acid hình thành
chuỗi xoắn alpha tốt nhưng nhưng Tyr, Ser, Gly và Pro thì không. Proline là hoàn toàn
không phù hợp với một chuỗi xoắn alpha, do cấu trúc của nó là dạng vòng tròn cứng
nhắc. Hơn nữa, khi proline có mặt trên chuỗi polypeptide, nó không còn nguyên tử
hydro nào trên nguyên tử nitơ tham gia liên kết peptide. Do đó, proline làm gián đoạn
các kiểu liên kết hydro. Ngoài ra, hai gốc amino acid cồng kềnh hay hai gốc có cùng
điện tích nằm cạnh nhau trong các chuỗi polypeptide sẽ không khớp vào một chuỗi
xoắn alpha. Nhìn chung, các chuỗi xoắn alpha tạo thành các gậy rắn hình trụ.
Các nếp gấp beta cũng được tổ chức với nhau bởi liên kết hydro giữa các nhóm
peptide nhưng trong trường hợp này chuỗi polypeptide được gấp ngược lại trên chính
nó để cho ra các cấu trúc mặt phẳng dẹt gấp kiểu zig-zag (Hình 7.07). Cũng giống như
các chuỗi xoắn alpha các nếp gấp beta cũng rất ổn định bởi vì tất cả các nhóm peptide
(ngoại trừ nhóm trên mép của dải) đều tham gia vào hai liên kết hydro. Trong các nếp
gấp beta các liên kết hydro hướng về hai bên cạnh nhóm peptide, mỗi liên kết một bên.
Trong cấu trúc beta- sheet, các đoạn của chuỗi polypeptide thường nằm cạnh nhau theo
kiểu, mặc dù không luôn luôn, đối song và nhóm R- nằm xen kẽ ở trên và dưới các mặt
phẳng zig -zag của nếp gấp beta.
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn

Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
11

Có nhiều dạng cấu hình beta – sheet đã biết. Mặc dù một số nếp gấp beta là
phẳng, hầu hết các gấp nếp beta được biết đến nhiều lại xoắn theo chiều phải nên các
dải cấu trúc beta không phải là phẳng mà cong. Trong một số trường hợp các nếp gấp
beta cong vòng xung quanh để sợi cuối liên kết với sợi đầu, tạo thành một cấu trúc như
là cái thùng.
Một cấu trúc quay ngược (cũng được biết như đoạn β-turn hay β-bend) là nơi
mà các chuỗi polypeptide quay ngược lại. Dải beta đảo ngược ở cuối của từng phân đoạn,
nhưng cũng tìm thấy ở những nơi khác. Pro và Gly thường được tìm thấy trong các đoạn
quay đảo ngược. Những vùng của protein không có dạng cấu trúc bậc hai gọi là xoắn
ngẫu nhiên-“random coil” mặc dù chúng không thực sự ngẫu nhiên mà chỉ là các cấu
trúc lặp không đều đặn.







Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
12



Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
13


Cấu trúc bậc ba của protein
Sự cuộn gấp thêm hơn nữa của chuỗi polpeptide tạo thành cấu trúc bậc 3. Trong
một nucleic acid cấu trúc bậc ba là do siêu xoắn tạo thành. Trong một protein, chuỗi
polypeptide, với các đoạn chuỗi xoắn alpha và nếp gấp beta, cuộn gấp lại để tạo thành
cấu trúc 3-D cuối cùng. Nhìn chung, các chuỗi polypeptide với trình tự các chuỗi amino
acid tương tự sẽ uốn gấp để tạo ra cấu trúc 3-D giống nhau. Uốn gấp cấu trúc bậc 3 phụ
thuộc vào sự tương tác giữa các nhóm bên của mỗi amino acid riêng biệt. Vì có 20 amino
acid khác nhau nên có thể có một lượng lớn có cấu trúc 3-D có thể, mặc dù hầu hết các
polypeptide là hình cầu.
Các mô đun xoắn alpha và nếp gấp beta là dạng cấu trúc cơ bản của protein (hình
7.09). Chúng được liên kết bởi các vòng của xoắn ngẫu nhiên (random coil) với độ dài
khác nhau. Nhiều trong số các vòng xoắn ngẫu nhiên nằm ở bề mặt của protein, tiếp xúc
với một dung môi và phần lớn chứa các gốc tích điện hay phân cực. Các cấu trúc vòng
cứng nhắc của proline làm quay xương sống của chuỗi polypeptide một góc khoảng 90
0
.
Do đó, proline phá vỡ cấu trúc bậc 2, góp phần vào hình thành các khúc cong/đoạn đổi
hướng để các cấu trúc bậc 2 cuộn gấp thành cấu trúc bậc 3. Khi nghiên cứu cấu trúc 3-D
của protein, người ta thấy hàng ngàn protein có trong thực tế đều có cấu tạo từ một số
kiểu-motif cấu trúc xác định. Motif cấu trúc như vậy thường bao gồm một số đoạn xoắn
alpha và/hoặc một số beta-sheet tạo thành một cấu trúc hữu ích và dễ nhận biết (hình
7.10).
Việc cuộn gấp thành cấu trúc 3-D chủ yếu là do hoạt động của hai yếu tố. Nhiều
amino acid có nhóm R rất dễ hòa tan trong nước (ưa nước). Những chuỗi bên này
“thích” nằm ở trên bề mặt của phân tử protein nơi chúng có thể hòa tan vào nước xung
quanh protein và tạo liên kết hidro với phân tử nước. Ngược lại, các nhóm R đẩy nước
(kỵ nước) tụm vào nhau bên trong phân tử protein, tránh xa nước (hình 7.11). Các phân
tử kỵ nước có tính chất của chất béo và không hòa tan. Sắp xếp này được biết đến như là
những cấu trúc kiểu giọt dầu (oil drop model) của protein. Thuật ngữ “tương tác kỵ

nước”, “liên kết kỵ nước” hay “liên kết không phân cực” ám chỉ xu hướng những nhóm
không phân cực kết tụ lại với nhau để tránh tiếp xúc với nước.
Sự hình thành liên kết kỵ nước chủ yếu do ảnh hưởng của nước chứ không phải
do sức hút vốn có của các nhóm kỵ nước với nhau. Nói đúng ra thuật ngữ kỵ nước (có
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
14

nghĩa là sợ/ không ưa nước) dẫn đến việc hiểu nhầm vì chính nước mới “không thích”
các nhóm hòa tan không phân cực. Các gốc hydrocarbon tiếp xúc với nước tạo ra một tác
động mang tính sắp xếp đối với các phân tử nước quanh nó. Điều này làm giảm entropy
của nước và không thuận về nhiệt động học. Việc loại bỏ lượng hydrocarbon cho phép
nước giảm cấu trúc liên kết hydro có tổ chức, kết quả, làm tăng entropy khoảng 0,7 Kcal
cho mỗi nhóm methylene được loại bỏ. Do đó việc loại bỏ chuỗi bên của leucin không
cho tiếp xúc với nước giải phóng ra 3,5 Kcal/mole.Vì tương tác kỵ nước phụ thuộc vào
entropy, độ mạnh của liên kết kỵ nước tăng khi nhiệt độ tăng, không giống như các liên
kết khác thường trở nên ít ổn định hơn ở nhiệt độ cao hơn.
Protein được chèn sâu vào màng sinh chất có cấu hình ngược với mô hình giọt
dầu chuẩn. chúng bộc lộ những nhóm kỵ nước trên bề mặt tiếp xúc với màng lipid. Phần
còn lại là nhóm ưa nước chúng cụm lại ở bên trong, nhưng một số ít lại tìm thấy tại bề
mặt ở những vùng mà protrein nhô ra ngoài màng (hình 7.12).



Rất nhiều lực tham gia duy trì cấu trúc 3-D của protein
Ngoài ảnh hưởng chủ yếu của liên kết kỵ nước trong lõi của protein và các liên
kết hydro của chuỗi bên ưa nước, một loạt các hiệu ứng cũng rất quan trọng (Hình 7.13).
Chúng bao gồm liên kết ion, liên kết hydro, lực van der Waals và liên kết disulfide.
Liên kết hydro có thể hình thành giữa các nhóm R của 2 amino acid gần nhau.
Những amino acid với nhóm hydroxyl, amin hoặc amide trên chuỗi bên có thể tham gia

liên kết hydro như vậy. Tương tự, liên kết ion
(-NH
3
+

-
OOC-)
có thể tạo thành giữa nhóm
R của amino acid bazơ và amino acid axít (hình 7.13). Trong thực tế có rất ít liên kết ion
được hình thành theo cách này vì các amino acid phân cực thường nằm trên bề mặt của
phân tử protein và hình thành liên kết hydro với nước.
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
15

Lực Van der Waals giữ các phân tử hoặc các phần của các phân tử với nhau nếu
chúng đủ gần. Lực Van der Waals là lực rất yếu và giảm theo khoảng cách. Chúng chỉ
quan trọng với vùng lớn bổ sung về cấu hình (lắp khít nhau về không gian). Liên kết
disulfide giữa các cysteine đôi khi cũng quan trọng trong việc duy trì cấu trúc 3-D ( xem
dưới đây).
Cysteine tạo thành các liên kết disulfide
Trong các điều kiện oxy hóa, các nhóm sulfhydryl của 2 cysteine có thể hình
thành một liên kết disulfide. Dimer gồm 2 cysteine (phát âm là "cystEEn") tham gia một
liên kết disulfide được biết đến như một cystine (phát âm là "cystYne") (hình 7.14). Liên
kết disulfide giữa cysteine rất quan trọng trong việc duy trì cấu trúc 3-D ở một số trường
hợp (xem hình 7.13 ở trên). Liên kết disulfide có thể giữ hai vùng của một chuỗi
polypeptide (liên kết disulfide trong cùng một chuỗi tạo thành cấu trúc bậc 3) lại với
nhau hoặc có thể liên kết hai chuỗi polypeptide riêng biệt (liên kết giữa các chuỗi tạo
thành cấu trúc bậc bốn).
Do liên kết disulfide dễ dàng bị khử thành hai nhóm sulfhydryl bên trong tế bào

nên chúng ít được sử dụng trong việc ổn định protein nội bào. Liên kết disulfide chủ yếu
để ổn định protein ngoại bào trong điều kiện oxy hóa. Ví dụ cổ điển là những kháng thể
lưu thông trong máu của động vật có xương sống. Các enzyme tiết ra ngoại bào như
lysozyme hoặc hormone, như insulin, cũng dựa vào liên kết disulfide. Những sinh vật
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
16

đơn bào ít protein ngoại bào hơn so với sinh vật đa bào bậc cao nên chúng sử dụng ít liên
kết disulfide hơn.

Nhiều vùng cuộn gấp trong những protein lớn
Những chuỗi polypeptide dài có thể chứa một số vùng cuộn gấp ít nhiều độc lập
được kết hợp với nhau qua các vùng nối có ít cấu trúc bậc 3. Những vùng như vậy được
biết đến như các domain và có thể dài 50-350 amino acid (Hình 7.15). Những protein
ngắn có thể có domain duy nhất, và những protein rất dài đôi khi có thể có đến cả tá
domain.
Chú ý rằng các protein bắt đầu cuộn gấp trước khi chúng được tổng hợp hoàn
toàn. Ngay sau khi chuỗi polypeptide đang được ribosome tổng hợp đủ dài, nó sẽ cuộn
gấp thành cấu trúc 3-D. Do đó domain cuộn gấp độc lập, đoạn này rồi đến đoạn tiếp theo
(bởi vì trình tự cuộn gấp khác nhau nên việc cuộn gấp lại của polypeptide đã biến tính
thường khác đáng kể so với sự cuộn gấp ngay từ đầu).
Nhiều yếu tố phiên mã bao gồm hai domain, một liên kết DNA và một liên kết
với các phân tử tín hiệu. Khi các phân tử tín hiệu được gắn vào, domain thay đổi hình
dạng của mình (hình 7.16). Sự thay đổi về cấu hình đó được truyền sang domain bám
DNA làm nó thay đổi cấu hình. Vì vậy mặc dù các domain không cuộn gấp cùng nhau,
chúng vẫn có tương tác mang tính vật lý với nhau.


Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn

Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
17



Cấu trúc bậc 4 của protein:
Nhiều protein bao gồm nhiều chuỗi polypeptide riêng biệt. Điều này đặc biệt đúng
với các protein có tổng khối lượng phân tử lớn hơn 50000 Dalton (khoảng 400 axit
amin). [Mặc dù thỉnh thoảng tìm thấy chuỗi polypeptide có 1000 amino acid hoặc nhiều
hơn thế, nhưng chúng tương đối hiếm]. Việc lắp ráp nhiều tiểu đơn vị lại với nhau tạo
nên cấu trúc bậc 4 (Hình 7.17).


(Protein chỉ với một chuỗi polypeptide không có cấu trúc bậc bốn). Số lượng các tiểu
đơn vị, hay protomer, thường tồn tại dạng số chẵn, hầu hết là hai hoặc là bốn. Thuật ngữ
trimer, tetramer, oligomer và multimer ám chỉ các cấu trúc tương ứng với 2, 3, 4, vài hay
nhiều tiểu đơn vị. Ít hơn 10 phần trăm protein phức có số lượng lẻ các tiểu đơn vị. Các
tiểu đơn vị có thể giống hệt nhau hoặc khác nhau hoàn toàn hay khác nhau một vài cặp
(có thể nhiều hơn). Ví dụ, chất ức chế lactose bao gồm bốn tiểu đơn vị giống hệt nhau,
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
18

trong khi hemoglobin có hai tiểu đơn vị alpha và hai tiểu đơn vị beta. Các tiền tố homo-
(giống) và hetero-(khác nhau) đôi khi được sử dụng để cho biết các tiểu đơn vị đều giống
nhau hoặc khác nhau. Do đó, chất ức chế lactose là một homo-tetramer, trong khi
hemoglobin là một hetero-tetramer.
Các lực kỵ nước chịu trách nhiệm cho phần lớn cấu trúc bậc 3 cũng là lực được
tham gia vào việc lắp ráp nhiều tiểu đơn vị. Protein hòa tan, chỉ với một chuỗi đơn
polypeptide, cuộn gấp sao cho gần như tất cả các gốc kỵ nước của chúng được ẩn bên

trong phân tử. Trong trường hợp của protein gồm nhiều tiểu đơn vị, các chuỗi
polypeptide được gấp lại, để lại một cụm các gốc kỵ nước tiếp xúc với nước ở bề mặt
protein (Hình 7.18). Đây là một sự sắp xếp không thuận lợi về nhiệt động học và khi hai
chuỗi polypeptide với các vùng kỵ nước lộ ra ngoài tiếp xúc với nhau, chúng có xu
hướng dính với nhau, giống như việc dính các miếng đính móc vào miếng đính
vòng. Như đã nói ở trên, liên kết kỵ nước sẽ yếu hơn khi ở nhiệt độ thấp hơn, do đó nhiều
tiểu đơn vị protein có xu hướng tách ra ngoài khi nhiệt độ thấp.
hook-and-loop fasteners

Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
19



Cấu trúc lắp ráp ở cấp độ cao và tự lắp ráp
Tiểu đơn vị được thiết kế với nhiều hơn một vùng liên kết có thể được dùng để
tạo thành cấu trúc vòng hoặc chuỗi. Các chuỗi dài của các tiểu đơn vị giống nhau thường
có dạng xoắn helix, như ở roi của vi khuẩn hoặc collagen của con người. Nếu một chuỗi
xoắn helix của nhiều tiểu đơn vị protein có dạng cuộn rộng được xếp gần nhau, nó sẽ tạo
thành một hình trụ rỗng (Hình 7.19). Các vỏ protein của một số virus (ví dụ như vi rút
khảm thuốc lá) và các vi ống được tìm thấy trong các tế bào nhân chuẩn đều được xây
dựng theo cách này. Trong một số trường hợp, chỉ đơn thuần trộn các tiểu đơn vị lại sẽ
hình thành cấu trúc cuối cùng. Hiện tượng này được gọi là sự tự lắp ráp và giống như với
vỏ của virus khảm thuốc lá. Trong trường hợp khác, cấu trúc cấp cao đòi hỏi các protein
khác và các cofactor giúp lắp ráp.
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
20




Các cofactor và các ion kim loại thường được liên kết với protein
Để hoạt động được, nhiều protein cần thêm thành phần, được gọi là cofactor hay
nhóm ngoại (prosthetic group) không có bản chất là protein. Nhiều protein sử dụng các
nguyên tử kim loại đơn làm cofactor; một số khác cần nhiều phân tử hữu cơ phức
tạp. Nói đúng ra, các nhóm ngoại được cố định vào một protein, trong khi cofactor được
di chuyển tự do xung quanh protein này đến protein khác. Tuy nhiên, việc phân loại này
không đúng vì cùng một cofactor có thể liên kết cộng hóa trị cố định với một enzyme nào
đó nhưng lại không liên kết cộng hóa trị với một enzyme khác. Do đó, các thuật ngữ trên
thường sử dụng một cách linh hoạt. Một protein mà không có nhóm ngoại được gọi là
một apoprotein.
Ví dụ, protein vận chuyển oxy như hemoglobin có một nhóm cofactor hữu cơ
hình chữ thập được gọi là nhân heme có chứa một nguyên tử sắt ở trung tâm. Nhân heme
được bao bọc trong vị trí hoạt động của apoprotein, trong trường hợp này là globin, tạo
thành phân tử hemoglobin. Ôxy liên kết với nguyên tử sắt ở trung tâm nhân heme và
hemoglobin mang nó đi khắp cơ thể. Nhóm ngoại thường được dùng chung bởi nhiều
hơn một protein, ví dụ: heme dùng cho cả hemoglobin và myoglobin, phân tử nhận oxy
và phân phối vào trong tế bào cơ.
Hầu hết các vi khuẩn và thực vật có khả năng tổng hợp được nhóm ngoại riêng
của chúng. Tuy nhiên, các động vật không thể tự tổng hợp nhiều nhóm ngoại hữu cơ của
enzyme và do đó chúng hay tiền chất trực tiếp của chúng phải được cung cấp thông qua
ăn uống. Các cofactor như vậy hay tiền chất của chúng được gọi là vitamin (Bảng7.02).
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
21



Một vài cofactor, chẳng hạn như heme, có thể được tổng hợp bởi động vật và vì

vậy chúng không được gọi là vitamin. Ngược lại, không phải tất cả các vitamin đều là
cofactor hoặc các tiền chất của chúng. Ví dụ, vitamin D là tiền chất của hormone.
Vitamin A khó phân loại vì một phần được chuyển đổi để tạo ra retinaldehyde- một
cofactor của protein và một phần thành axit retinoic- một hormone. Vitamin C không
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
22

hoạt động trực tiếp giống như cofactor, nhưng nó cần thiết để giữ các ion kim loại (chẳng
hạn như Cu và Fe) hoạt động như các cofactor ở “dạng khử”. Vấn đề phức tạp khi các
cofactor có thể được tổng hợp được ở một số loài động vật nhưng loài khác lại không
thể. Giống như vitamin C là một loại vitamin dành cho con người nhưng hầu hết các
động vật khác không cần có nó trong thức ăn.

Nucleoprotein, lipoprotein và glycoprotein là các protein kết hợp
Protein kết hợp là các protein liên kết với các phân tử khác. Ví dụ, các
nucleoprotein là phức hợp protein và nucleic acid, lipoprotein là các protein với các gốc
lipid đính vào, glycoprotein có các thành phần carbohydrate.

Nhiều glycoprotein được tìm thấy trên bề mặt của các tế bào. Chúng mang các
chuỗi carbohydrate ngắn cấu tạo từ vài phân tử đường, các phân tử thường thò ra ngoài tế
bào (hình7.21). Chuỗi đường thường được liên kết vào protein thông qua các nhóm
hydroxyl của serine hoặc threonin hoặc nhóm amide của nhóm asparagine. Glycoprotein
thường có chức năng kết dính tế bào, đặc biệt ở các sinh vật (động vật) mà thành tế bào
thiếu độ cứng. Ngoài ra, phần carbohydrate của các lipoprotein thường là nhân tố then
chốt trong sự nhận biết tế bào. Ví dụ, tinh trùng nhận ra tế bào trứng bằng cách gắn vào
các phần carbohydrate của glycoprotein bề mặt. Việc nhận biết của hệ thống miễn dịch
thường phụ thuộc vào cấu trúc chính xác của chuỗi carbohydrate của glycoprotein. Ví dụ,
các kháng nguyên A và B của hệ nhóm máu ABO được biết đến hiện nay là chuỗi
carbohydrate khác nhau mang trên protein với sự có mặt hay vắng mặt của đường đơn.


Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
23



Nhiều lipoprotein được gắn lên màng bằng đuôi lipit của chúng (hình 7.22). Một
ví dụ là β-lactamase được tìm thấy trong nhiều vi khuẩn Gram dương, chẳng hạn như
Bacillus (vi khuẩn hình que). B-Lactamase bảo vệ tế bào bằng cách phân hủy kháng sinh
họ β-lactam, trong đó bao gồm penicillin. Vì mục tiêu tác dụng của penicillin là thành tế
bào, nên các enzyme bảo vệ cần ở bên ngoài tế bào. Đuôi lipit đảm bảo cho nó không bị
trôi ra môi trường xung quanh.
Các proteolipid là phân lớp đặc biệt của lipoprotein, với đặc tính cực kì kỵ nước
và do đó không tan trong nước. Chúng hoà tan được trong dung môi hữu cơ và được tìm
thấy ở vùng kỵ nước bên trong màng. Các tính chất này không chỉ do các nhóm lipid đính
kèm. Một phần tính kỵ nước của chúng là do có tỉ lệ lớn các gốc amino acid kỵ nước.
Thay vì ẩn vào bên trong các protein, nhiều trường hợp các amino acid này được bộc lộ
trên bề mặt.

Protein thực hiện nhiều chức năng của tế bào
Protein chiếm khoảng 60% vật chất hữu cơ của các cơ quan tử của sinh vật.
Chúng chịu trách nhiệm cho hầu hết những phản ứng chuyển hoá và nhiều thành phần
cấu trúc của tế bào. Không ngạc nhiên khi chức năng của protein rất đa dạng. Tuy nhiên,
các protein có thể phân chia thành các loại chính như sau:
1. Các enzyme
2. Các protein cấu trúc
3. Các protein kết hợp (vận chuyển, mang, và protein dự trữ)
4. Các protein cơ học
5. Các protein xử lý thông tin

Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
24

Enzyme là những protein xúc tác cho những phản ứng hoá học. Vấn đề này sẽ
được thảo luận chi tiết hơn ở phần dưới. Enzyme có nhiều đặc tính giống với các protein
khác như có các “túi” gắn những phân tử nhỏ (trung tâm phản ứng) và có khả năng thay
đổi cấu hình.
Nhiều cấu trúc dưới tế bào cấu tạo phần lớn hoặc một phần bởi các protein cấu
trúc, chẳng hạn như: tơ của roi vi khuẩn có thể bơi lội, các vi ống có tác dụng điều chỉnh
dòng chuyển động bên trong tế bào sinh vật bậc cao, các “sợi” (fiber) trong mô liên kết,
và vỏ/áo ngoài của virus (xem ch. 17) là những ví dụ về các cấu trúc được xây dựng có
sử dụng protein.
Những protein chuyên biệt (specialized proteins) được biết có thể kiểm soát cấu trúc
của nước. Cá sống ở những vùng địa cực có protein chống đông để giữ máu của cơ thể
khỏi đóng băng. Những protein này liên kết với bề mặt đá và ngăn cản hình thành sự phát
triển của tinh thể. Ngược lại, những protein bề mặt của một số vi khuẩn lại là nhân tố
xúc tiến hình thành nên tinh thể đá và đóng vai trò quan trọng trong nguyên nhân tạo
sương giá làm huỷ hoại cây trồng. Các tế bào thực vật có hại giải phóng các chất mà chất
đó có các vi khuẩn có thể phát triển và mô thực vật cũng có thể chấp nhận sự xâm chiếm
của vi khuẩn đó.
Các protein kết hợp gắn các phân tử nhỏ nhưng không giống các enzyme chúng
không thực hiện phản ứng hoá học. Tuy nhiên, chúng cũng cần các “vị trí hoạt động” để
kết hợp với các phân tử nhỏ. Protein vận chuyển hay protein mang mang cơ chất của
chúng đi khắp cơ thể. Các protein vận chuyển hay permease nằm xuyên màng và vận
chuyển các phân tử mục tiêu của chúng qua màng. Các chất dinh dưỡng, như đường, phải
được vận chuyển vào trong tế bào, trong khi đó các chất thải bị bài xuất ra ngoài. Nhiều
permease bao gồm một bó của một đoạn xoắn helix (thường là 7 hoặc 11) nằm xuyên
màng tế bào và được nối bởi các vùng xoắn ngẫu nhiên (hình 7.23). Hầu hết các
permease cần năng lượng để hoạt động.

Trái ngược với permease, protein mang hoà tan được, không có màng giới hạn.
Hầu hết trong số chúng vận chuyển chất dinh dưỡng bên trong cơ thể các sinh vật đa bào.
Các protein mang đôi khi là protein ngoại bào, có trong máu và các chất dịch thể khác.
Trong trường hợp khác, các protein mang được tìm thấy trong các tế bào chuyên hóa di
chuyển khắp cơ thể như các tế bào máu. Các ví dụ cổ điển về protein vận chuyển là
Dịch từ “Molecular biology-understanding the genetic revolution” của David D. Clark bởi Đặng Xuân Nghiêm, Trần Hoài Nam, Nguyễn
Thanh Sang và Phạm Công Vũ – 2010. (Không được dùng cho mục đích xuất bản, thương mại).
25

hemoglobin và myoglobin, tương ứng nằm trong các tế bào máu và mô cơ, với vai trò
vận chuyển oxy ở động vật.
Protein dự trữ cất giữ các chất dinh dưỡng hoặc các phân tử khác, nhưng thay vì
vận chuyển chúng, các protein này dự trữ chúng. Ví dụ, ferritin ở tế bào động vật và
bacterioferritin tương ứng ở vi khuẩn dự trữ sắt. Metallothionein liên kết với các kim
loại nặng, và vai trò chính của nó là bảo vệ (hình 7.24).


×