Thông tin di truyền được
mã hóa như thế nào ?
Khi các nhà sinh học bắt đầu nghi ngờ rằng bản hướng dẫn tổng hợp protein
được ghi trong các phân tử ADN, họ nhận ra một vấn đề: Chỉ có 4 loại bazơ
trong các nucleotit để xác định cho 20 loại axit amin. Do đó, mã di truyền
không thể ở dạng ngôn ngữ kiểu tượng hình như Tiếng Trung quốc được,
nghĩa là mỗi ký tự tương ứng với một từ riêng. Vậy, bao nhiêu bazơ trong các
nucleotit thì tương ứng với một axit amin?
Codon: Mã bộ ba của các bazơ
Nếu mỗi bazơ nucleotit được dịch mã thành một axit amin, thì chỉ có nhiều
nhất 4 axit amin được xác định. Thế còn nếu mã di truyền là mã bộ hai thì
sao? Chẳng hạn, trình tự hai bazơ AG xác định một axit amin, còn trình tự
bazơ GT xác định một axit amin khác. Do ở mỗi vị trí, có 4 khả năng lựa
chọn các bazơ nucleotit khác nhau, nên chúng ta sẽ có tối đa 16 (tức là 42)
khả năng tổ hợp; điều này cho thấy mã bộ hai không đủ để mã hóa cho tất cả
20 axit amin.
Bộ ba các bazơ nucleotit là số nguyên nhỏ nhất, đồng đều có thể mã hóa cho
tất cả các axit amin. Nếu mỗi cách sắp xếp cứ 3 bazơ kế tiếp nhau xác định
một axit amin, thì chúng ta sẽ có 64 (tức là 43) khả năng mã hóa; số lượng
này thừa đủ để xác định tất cả các axit amin. Trên cơ sở đó, các số liệu thí
nghiệm sau này cũng đã xác nhận rằng: dòng thông tin đi từ gen đến protein
dựa trên mã bộ ba; nói cách khác, bản hướng dẫn tổng hợp một chuỗi
polypeptit được viết trên ADN là một chuỗi những “từ” gồm 3 nucleotit và
có đặc điểm không gối lên nhau. Ví dụ, bộ ba các bazơ AGT tại một vị trí
nhất định (trong vùng mã hóa) trên mạch ADN sẽ dẫn đến sự lắp ráp một axit
amin Serine tại vị trí tương ứng trên chuỗi polypeptit được tạo ra.
Mã bộ ba. Với mỗi gen, chỉ một trong hai mạch ADN được dùng làm khuôn
để phiên mã. Giống như trong sao chép ADN, nguyên tắc kết cặp giữa các
bazơ nucleotit cũng được dùng trong phiên mã, chỉ thay thế thymine (T)
trong ADN bằng uracil (U) trong ARN. Mỗi codon (mã bộ ba) xác định một
axit amin đ-ợc bổ sung vào chuỗi polypeptit đang kéo dài. Phân tử mARN đ-
ợc dịch mã theo chiều 5' → 3'.
Trong quá trình phiên mã, các gen xác định trình tự các bazơ nằm dọc chiều
dài phân tử mARN. Trong phạm vi mỗi gen, chỉ một trong hai mạch ADN
được phiên mã. Mạch này được gọi là mạch khuôn bởi vì nó cung cấp kiểu
mẫu, hay khuôn mẫu, cho sự lắp ráp các nucleotit trên bản phiên mã ARN.
Một mạch ADN thường làm khuôn cho một số hoặc nhiều gen nằm dọc theo
phân tử ADN; trong khi đó, mạch bổ sung với nó có thể làm khuôn cho sự
phiên mã của những gen khác. Điều đáng lưu ý là trong phạm vi mỗi gen
nhất định, luôn chỉ có một mạch ADN được làm khuôn để phiên mã.
Một phân tử mARN chỉ có trình tự bổ sung với mạch làm khuôn ADN theo
nguyên tắc kết cặp của các bazơ, chứ không giống hệt mạch làm khuôn này.
Sự kết cặp giữa các bazơ là giống nhau trong sao chép ADN và phiên mã, chỉ
có đặc điểm khác là U thay thế cho T là thành phần bazơ của ARN; ngoài ra
các nucleotit của ARN mang thành phần đường là ribose thay cho
deoxyribose trong phân tử ADN. Giống với mạch ADN mới, phân tử ARN
được tổng hợp theo chiều đối song song với mạch ADN làm khuôn. Ví dụ
như, trình tự ba bazơ ACC dọc phân tử ADN (viết là 3’-ACC-5’) làm khuôn
tổng hợp nên trình tự 5’-UGG-3’ trên phân tử mARN. Mỗi bộ ba các bazơ
của phân tử mARN được gọi là codon; và theo thói quen, chúng thường được
viết theo chiều 5’ → 3’. Trong ví dụ trên đây, UGG là codon mã hóa cho axit
amin Tryptophan (viết tắt là Trp). Thuật ngữ codon trong thực tế cũng được
dùng để chỉ bộ ba các bazơ thuộc mạch không làm khuôn trên phân tử ADN.
Những codon này có trình tự các nucleotit bổ sung với mạch ADN làm
khuôn, và vì vậy sẽ giống với trình tự các nucleotit trên mARN, trừ việc U
được thay thế bằng T. (Vì lý do này, mạch ADN không làm khuôn lại được
gọi là “mạch mã hóa”.)
Trong quá trình dịch mã, trình tự các codon dọc phân tử mARN được giải
mã, hay dịch mã, thành trình tự các axit amin từ đó hình thành nên chuỗi
polypeptit. Các codon được bộ máy dịch mã đọc theo chiều 5’ → 3’ của
mạch mARN. Mỗi codon xác định một trong 20 loại axit amin được lắp ráp
vào đúng vị trí tương ứng dọc chuỗi polypeptit. Do các codon là mã bộ ba,
nên số nucleotit cần để mã hóa một “thông điệp di truyền” cần nhiều hơn ít
nhất ba lần so với số các axit amin trong sản phẩm protein. Ví dụ như, để mã
hóa một chuỗi polypeptit gồm 100 axit amin, cần một trình tự gồm 300
nucleotit dọc mạch ARN.