Chương 1: HỆ GENE
Tóm tắt: Sự ra đời của sinh học phân tử được đánh dấu bằng thời điểm mà
Oatsơn và Cric (1953) phát hiện ra cấu trúc ADN. Trải qua hơn 40 năm (1953 -
2000) sinh học phân tử đã đạt được những thành tựu vĩ đại mà đỉnh cao của sự
phát triển này là những khám phá bản chất sinh học của sự sống ở cấp độ phân
tử và xây dựng các kĩ thuật sinh học phân tử ứng dụng váo thực tiễn. Geneomics
và Proteomics là vấn đề đang được đặc biệt quan tâm hiện nay mà cơ sở của
các lĩnh vực này là những phát hiện về cấu trúc và chức năng của axit nucleic,
về đặc điểm của genome nhân, genome ti thể, genome lạp thể. Những điểm khác
nhau về cấu trúc và chức năng của các hệ gene cho phép ứng dụng vào thực tế
chọn giống và nghiên cứu ở người. Cùng với cấu trúc ADN và ARN còn có đặc
điểm của quá trình tái bản ADN và phiên mã cũng được quan tâm, vì nó là cơ sở
của những kĩ thuật sinh học phân tử - các thao tác ở ADN và ARN. Nội dung cơ
bản của chương đề cập đến những cơ sở của sinh học phân tử.
Nội dung của chương gồm 4 vấn đề cơ bản: (1). Khái niệm hệ gene; (2). Axit
nucleic; (3). ADN vá tái bản ADN, (4). ARN và cơ chế phân mã.
§1. KHÁI NIỆM HỆ GENE (GENOME)
Quá trình sinh trưởng và phát triển của sinh vật trải qua rất nhiều giai
đoạn và tất cả quá trình đó đều phụ thuộc vào sự điều khiển của các gene. Cấu
trúc, chức năng của tế bào được quyết định trực tiếp bởi protein, đó là sản phẩm
cuối cùng của sự biểu hiện gene. Quá trình thể hiện hoạt động của gene qua
protein, bị ảnh hưởng rất lớn bởi các yếu tố ngoại cảnh như ánh sáng, chế độ
dinh dưỡng, sự cộng sinh và sự tương tác của các gene trong hệ gene của tế bào.
Như vậy, giữa các thành phần của hệ gene trong tế bào sống có sự tương tác với
nhau và có mối quan hệ với các yếu tố của môi trường. Trong tế bào, bên cạnh
genome trong nhân, hệ thống di truyền còn phân bố trong lục lạp, ti thể và
plasmid (vi khuẩn). Các cơ quan tử này cùng tham gia vào quá trình sinh tổng
hợp protein của tế bào. Tế bào là đơn vị cấu trúc và chức năng cơ bản của các cơ
thể sống, tế bào còn là đơn vị của sự di truyền.
Hệ gene là toàn hộ các gene trong tế bào của cơ thể sinh vật, hệ gene hứa
toàn bộ thông tin di truyền đặc trưng cho từng loài, cho từng cá thể trong loài. Ở
sinh vật Prokaryot hệ gene gồm toàn bộ các gene trong tế bào; còn ở Eukaryot
5
hệ gene gồm toàn bộ các gene trong tế bào đơn bội (n). Tế bào đơn bội có một
hệ gene, các sinh vật hoặc tế bào lưỡng bội có hai hệ gene, sinh vật đa bội có
nhiều hệ gene. Hệ gene của sinh vật Eukaryot bao gồm hệ gene nhân (genome
nhân), hệ gene ti thể (genome ti thể), hệ gene lục lạp (genome lục lạp). Hệ gene
ở Prokaryot chỉ có một thành phần gồm các đoạn ADN không giống nhau; còn
hệ gene ở Eukaryot có ba thành phần ADN không giống nhau: Các đoạn ADN
lặp lại nhiều (chiếm khoảng 25%), các đoạn ADN lặp lại ít (30%) và các đoạn
ADN không lặp lại (45%).
1.1. Hệ gene nhân
Hệ gene nhân là genome lớn nhất trong tế bào xét về mặt khối lượng cũng
như số lượng gene mã hoá. ADN nhân được sắp xếp gọn trong nhiễm sắc thể
trong sự liên kết với protein chứa histone và không chứa histone. ADN có vai
trò mã hoá thông tin di truyền, còn protein thì bảo vệ và tham gia điều khiển sự
sao chép, phiên mã được chính xác. Quá trình cơ bản trong phát triển động, thực
vật là sự nhân đôi vật chất di truyền và phân đều cho các tế bào con khi tế bào
phân chia. Tế bào thực vật chứa một lượng lớn ADN, khối lượng này thay đổi
theo loài. Arabidosis thaliana có lượng ADN nhỏ nhất (0.07 picogram). Allium
cepa có lượng ADN nhiều hơn 33,5 pg/ haploid genome (hệ gene đơn bội).
1.2. Hệ gene lục lạp
Cho đến năm 1962, người ta mới khám phá ra ADN và ribosom có trong
lục lạp. Như vậy, lục lạp hoặc trong lạp thể chứa tất cả bộ máy cần thiết để tự
mình biểu hiện hoạt động gene. Hệ gene lục lạp là toàn bộ các gene trong lục lạp
hay toàn bộ lượng thông tin di truyền chứa trong ADN của lục lạp.
Lượng ADN trong lục lạp rất lớn, chiếm tới 15% tổng lượng ADN cơ thể
thực vật, ribosom chiếm 60% lượng ribosom của tế bào, ADN lục lạp được cấu
tạo bởi các phân tử có cấu trúc mạch vòng, có trọng lượng phân tử 83 - 128 x
10
6
, trong đó gần 85% phân tử ADN là mạch đơn.
ADN lục lạp làm khuôn phiên mã tổng hợp mARN chloroplast. Ở đây các
phân tử mARN chỉ có khoảng 20 nucleotit, chúng thực hiện sự tổng hợp protein
tại chỗ trong chloroplast. Ribosom trong chloroplast là 70S bao gồm 30S và
50S. Sau khi tổng hợp xong protein được vận chuyển đến nơi mà lục lạp cần
thiết.
Về cơ bản hệ thống di truyền trong lục lạp tương tự với hệ thống di truyền
của sinh vật Prokaryot. Do vậy đã có nhiều cuộc tranh luận, có phải vật liệu di
truyền của sinh vật tiền nhân là nguồn gốc của ADN lục lạp? Ngoài ra ADN của
lục lạp không chứa một số gene đặc trưng cho những sinh vật có nhân thật. Điều
này đã tìm thấy trong ADN ở thuốc lá và ngô. Ribosom của lục lạp cũng giống
6
ribosom của sinh vật Procariot: 70S được cấu tạo bởi 2 tiểu phần 50S và 30S.
Ribosom của E. coli và lục lạp thực vật có đặc tính miễn dịch giống nhau.
Thông qua việc nghiên cứu sản phẩm biểu hiện gene là protein, người ta
đã phát hiện giữa hệ gene lục lạp và hệ gene nhân trong tế bào thực vật có mối
quan hệ chặt chẽ.
- Genome của lục lạp không có khả năng tổng hợp tất cả các protein có
trong chúng.
- Phần lớn polipeptid của lục lạp được tổng hợp do genome trong nhân tế
bào.
- Những polipeptid này được chuyển vào lục lạp theo cơ chế sau dịch mã
thực hiện qua vỏ lục lạp.
- Hệ thống di truyền lục lạp điều khiển tổng hợp các protein cần cho sự
phát triển của chúng với số lượng khoảng 100 polipeptid.
Bảng 1.1. Kích thước một số ADN lục lạp (ct. ADN), ADN nhân và vi khuẩn
AND Kích thước (bp)
Kích thước vòng (
μ
m)
Plasmid 1
≈
200 x 103 -
Trực khuẩn E-coli (chromosome) 3,8 x 10
6
-
Trùng roi (Euglena) (ct. ADN) 1,4 x 10
5
44 - 44
Thuốc lá (Tabaco) (ct. ADN) 1,6 x 10
5
-
Ngô (Maize) (ct. ADN) 1,36 x 10
5
43
Đậu xanh (mungbean) (ct. ADN) 1,21 x 10
5
39
- Polipeptid được mã hoá tổng hợp và ARN trong lục lạp đảm nhiệm chức
năng của cơ quan tử liên quan đến quá trình quang hợp. Ở lúa người ta đã xác
định được vị trí của các gene quan trọng điều khiển quá trình quang hợp như
rbcl, atpBE, pSbA, pstA, psbA. Các gene này đóng vai trò quan trọng trong quá
trình sinh tổng hợp protein ở hệ thống quang hoá II.
1.3. Hệ gene ti thể (Mitochondria Genome)
Để nghiên cứu hệ gene ti thể điều quan trọng đầu tiên là thu được ADN ti
thể. Có thể lấy ví dụ ở cây lúa theo Salech và cộng sự (1989), phương pháp phân
tích ADN trong ti thể gồm các bước sau:
- Li tâm với tốc độ chậm để loại bỏ nhân, lục lạp và các thành phần khác
của tế bào.
- Li tâm với tốc độ nhanh để tách ti thể.
- Li tâm với tốc độ chậm để lấy nhân, lục lạp và các thành phần khác.
7
- Xử lí ADN- ase I để phân giải các chất ADN nhân dính trong ti thể.
- Làm sạch ti thể.
- Tách chiết mtADN từ ti thể (mtADN).
Như vậy người ta có thể thu được ADN của mitochondria tinh sạch phục
vụ cho các công tác nghiên cứu tiếp theo.
mtADN thể hiện một sự khác biệt rất lớn về mặt kích thước và hình dạng.
Đối với động vật, mtADN có dạng vòng và kích thước xấp xỉ 15 - 20kb. Ngược
lại mtADN của thực vật có nhiều dạng (vòng.,thẳng vaà(cc dạng khác), cũng
như có kích thước lớn hơn nhiều: ở cây bắp cải là 200kb, hoặc ở một loại dưa là
2500 kb. Do vậy genome ti thể thực vật tương đối lớn và gồm một vài phân tử
ADN. Lượng mtADN trong thực vật chiếm khoảng 0,5 - 1% lượng ADN của tế
bào nhưng nó đóng vai trò sống còn cho sự phát triển và sinh sản thực vật.
Chức năng của mtADN giống như ctADN. Nó có khả năng mã hoóatổng
hợp một số lượng nhỏ pohlieptid nhưng rất quan trọng.,phục vụ cho những hoạt
động của chính nó.
Những sản phẩm chính mà mtADN điều khiển tổng hợp là 3 tiểu phần của
cytochromoxydaza, 2 tiểu phần của phức chất cytochrom bc và một số thành
phần khác (Andre, 1991). Ngoài ra mtADN còn đóng vai trò quan trọng trong
hiện tượng bất dục đực tế bào chất (CMS). Đây là một đặc tính được khai thác
trong sản xuất các dòng lai ở nhiều cây trồng như lúa, ngô... Spruill và cộng sự
(1981) đã chỉ ra ở cây ngô có sự khác nhau giữa mtADN trong tế bào cây
thường và trong tế bào cây có hiện tượng CMS. Khi phân tích sản phẩm protein
thì những mtADN ở cây CMS có khả năng tổng hợp chuỗi peptid 130000 MW,
nhưng nó mất khả năng tổng hợp chuỗi polipeptid 21000 MW ở nguyên sinh
chất tế bào cây bình thường.
Mặt khác người ta còn thấy hiện tượng bất dục tế bào chất còn liên quan
đến những phân tử ADN giống như plasmid tìm thấy trong ti thể.
Chẳng hạn ở ngô trong tế bào chất của cây CMS có mang hai phân tử
AND mạch thẳng với kích thước 6,2 kb và 5,2 kb. Việc sử dụng code mã hóa
tổng hợp protein của mtADN có những điểm cần lưu ý: trong hệ thống hoạt
động mã di truyền thông thường code UGA cung cấp tín hiệu kết thúc quá trình
tổng hợp một chuỗi polipeptid, nhưng ở ADN của ti thể nó lại là code của
tryptophan. Ngược lại ở ADN nhân code CGG mã hoá cho tryptophan thì ở ti
thể nó lại mã hoá arginin. Ngoài ra người ta đã phát hiện một dạng mới của
mARN trong genome ti thể cây trồng và nó được gọi là ARN - Editing. Đây là
một vấn đề thể hiện sự tiến hoá của thực vật bậc cao, giúp cho nó có khả năng
8
thích nghi hơn với điều kiện ngoại cảnh.
§2. AXIT NUCLEIC
2.1. Axit nucleic là vật chất di truyền
Axit nucleic bao gồm axit deoxyribonucleie (ADN) hoặc axit ribonucleic
(ARN) đều đáp ứng tiêu chuẩn của vật chất di truyền. Có rất nhiều bằng chứng
đã chứng tỏ ra axit nucleic là một vật chất di truyền ở cấp độ phân tử.
Axit nucleic hấp thụ tia tử ngoại cực đại ở bước sóng 260nm và điều này
phù hợp một cách chính xác với bước sóng mà tia tử ngoại có thể gây đột biến
tối đa ở tế bào, trong khi đó protein ở bước sóng 280nm.
- Năm 1928 F. Grifflth phát hiện thấy nòi phế cầu khuẩn S, khuẩn lạc
nhẵn do có vỏ bọc polisaccharid (vi khuẩn gây viêm phổi) của vi khuẩn
Diplococus pneumoniae làm chuột chết khi tiêm vào cơ thể chuột. Trong khi đó
khuẩn lạc R (khuẩn lạc không có vỏ bọc polisaccharid) không gây độc hại gì.
Hỗn hợp các phế cầu khuẩn R còn sống và phế cầu khuẩn S đã chết thì làm cho
chuột bị viêm phổi, chết và từ máu của chúng đã phân lập được vi khuẩn S sống.
Như vậy tác nhân nào đó từ phế cầu khuẩn đã biến nạp và làm cho phế
cầu khuẩn R thành S. Người ta đã chứng minh được rằng: ADN tách từ vi khuẩn
S nếu được đưa vào vi khuẩn R thì gây nên sự biến đổi kiểu R
→
S, phát hiện
này được khẳng định ADN là vật chất di truyền.
Năm 1944 O. T Avery, Mc Leod và Mc Carti đã chứng minh được rằng
tác nhân biến nạp là ADN. Phế cầu khuẩn S bị xử lí bằng protease hoặc ARN-
aza thì hoạt tính biến nạp vẫn còn: những nếu phế cầu khuẩn S bị xử lí bởi
ADN-aza thì hoạt tính biến nạp không còn nữa.
Hình 1.1. Sơ đồ chứng minh vật chất di truyền là ARN
Năm 1957, H. Fraen Kel - Conrat và B. Singer công bố thí nghiệm ở virut
đốm thuốc lá có lõi ARN và vỏ protein, có hai dạng a và b. Các thí nghiệm lắp
ráp lõi ARN của dạng này với protein của dạng kia và ngược lại đã thành công
tạo ra virut có vỏ và lõi thuộc hai dạng khác nhau. Sau đó đem gây nhiễm vào
9
thuốc lá, kết quả các virut con phân lập được từ vết đốm đều mang cả vỏ protein
và lõi ARN thuộc cùng một dạng là dạng của lõi ARN mang nhiễm chứ không
phải của vỏ protein. Như vậy thông tin di truyền được chứa đựng trong ARN
chứ không phải trong protein.
2.2. Axit nucleic ở virut, Prokaryot và Eukaryot
Virut là vật chất sống được cấu tạo rất đơn giản, gồm lõi là axit nucleic và
vỏ là protein. Vật chất di truyền của virut có hai loại: ADN và ARN. Đa số các
loài virut đều sống kí sinh, khi xâm nhập vào tế bào vật chủ (có thì toàn bộ virut
hay chỉ A. nucleic). Virut sống kí sinh ở tế bào Prokaryot được gọi là phage hay
bacteriophage (thực khuẩn thể). Một số virut có lõi là ARN chủ yếu kí sinh ở
thực vật, còn các virut kí sinh ở động vật và tế bào Prokarvot đa số có lõi là
ADN.
NST phải tạo ra môi trường vật lí để cho phân tử ADN hoạt động, tác
động qua lại với các hệ thống trao đổi chất trong tế bào. Hệ thống sắp xếp cách
tổ chức, bố trí ADN trong NST ở những tổ chức sinh vật chưa có nhân chính
thức và sinh vật nhân chuẩn có sự khác nhau như thế nào? Người ta đã sử dụng
ba hướng chính để nghiên cứu tổ chức ADN trong các đối tượng sinh vật khác
nhau, đó là việc sử dụng các thiết bị và kĩ thuật như kính hiển vi điện tử, nhiễu
xạ tia X, xử lí bởi enzyme biến đổi cấu trúc NST.
Đối với sinh vật Prokaryot, tổ chức ADN trong NST ở dạng nucleoid
(vùng nhân). Vùng nhân chứa ADN và ADN được gấp và cuộn thành nhiều
vòng xoắn: ADN ở dạng siêu xoắn, tính chất siêu xoắn chịu sự kiểm soát của
enzyme topoisomerase. Ví dụ ở E. coli ADN có kích thước 300
μ
m khi co ngắn
kích thước dài 25
μ
m và tiếp tục co ngắn thì kích thước chỉ còn 1,5
μ
m. Cách
sắp xếp này được phát hiện nhờ enzyme ribonuclease và deoxyribonuclease.
Prokaryot chứa ADN trần, chuỗi kép, dạng vòng, ngoài ra vật chất di truyền còn
ở plasmid (chiếm l-2%). E. coli chỉ có 1 phân tử ADN dạng vòng chứa 3000-
4000 gene.
Đối với sinh vật Eukaryot, ADN trong tế bào có cả trong nhân, ti thể và
lạp thể và chủ yếu ADN nằm trên nhiễm sắc thể trong nhân tế bào. ADN nhân
có dạng mạch kép, chủ yếu là B-ADN. ADN ti thể và ADN lục lạp có dạng kép
vòng. Tổ chức ADN trong nhiễm sắc thể ở dạng nucleosome (thể nhân). Mỗi
nucleosome gồm phân tử ADN và protein (kiềm) được gọi histon. Histon gồm 8
phân tử (octamer). Phân biệt 5 loại histon với tỉ lệ gần như nhau H1, H2A, H2B,
H3, H4. Trong đó có 2 phân tử H3, 2 phân tử H4 liên kết với ở vùng trung tâm;
2 phân tử H2A, 2 phân tử H2B liên kết ở vùng ngoài.
10
Các nucleosome nối với nhau bằng một đoạn nucleotit (ADN) dài 15 -
100 cặp nucleotit. NST có cấu trúc xoắn theo nhiều bậc: tập hợp nhiều
nucleosome thành sợi cơ bản có cấu trúc xoắn (100Å), sợi cơ bản tiếp tục xoắn
thành solenoit (sợi nhiễm sắc) có đường kính là: 250Å: solenoit cuộn xoắn lần
nữa tạo nên ống rỗng có đường kính 2000Å; ống rỗng này cuộn xoắn một lần
nữa thành sợi chromatit có đường kính bằng 6000Å.
§3. ADN VÀ TÁI BẢN ADN
3.1. Đặc điểm cấu trúc của phân tử ADN
Hàm lượng ADN trong nhân tế bào đặc trưng cho từng loài và phụ thuộc
và số lượng nhiễm sắc thể trong nhân. ADN là đại phân tử, có khối lượng và
chiều dài rất lớn. Ở sinh vật Prokaryot mỗi nhiễm sắc thể có thểcó nhiều phân tử
ADN, còn ở sinh vật Eukaryt mỗi nhiễm sắc thể chỉ có một phân tử ADN.
Bảng 1.2. Hàm lượng ADN của một số loài sinh vật
Người
Ruồi giấm
Tế bào lưỡng bội (2n)
6,6 pg ADN
2 pg ADN
Tế bào đơn bội (n)
3,3 pg ADN.
1 pg ADN.
1 picogram (pg) ADN = 0,965. 10
9
bp = 6,1.10
11
dalton = 29cm
Người ta đã phân biệt các dạng ADN là B, A. Z, C, D. Các dạng AND
khác nhau bởi chiều xoắn, chiều cao một chu kì xoắn, số cặp nucleotit trong một
chu kì.
11
Bảng 1.3. So sánh đặc điểm của một số loại AND
Dạng
AND
Chiều
xoắn
Số cặp
nucleotit
chu kì
Góc xoắn
(
0
)
Đường
kính
(Å)
Chiều cao
một chu kì
xoắn
Dạng
thiết điện
B Phải 10 36 20 34 Tròn
A Phải 11 32,7 23 28 Tròn
Z Trái 12 30 18 37,1 zigzac
C Phải 9,3 38,6 20 31 Tròn
D Phải 8 - - - Bát giác
Oatsơn và Cric (1953) đã xây dựng mô hình B-ADN (phổ biến nhất), đó
là chuỗi xoắn kép gồm 2 mạch polinucleotit xoắn theo chiều từ trái sang phải.
Mô hình của Oatsơn và Crick đã lí giải được những chức năng cơ bản của ADN
là bảo đảm cho việc tái sinh trong quá trình tự sao chép ở gian kì và điều chỉnh
việc tổng hợp các enzyme và các protein. Đây là mốc thời gian đánh dấu sự ra
đời của ngành sinh học phân tử.
ADN và ARN đều là những polime gồm nhiều monomer nối với nhau,
mỗi monomer gọi là nucleotit (ở ADN gọi là deoxynucleotit, còn ở ARN là
ribonucleotit). Mỗi deoxynucleotit và ribonucleotit gồm 3 thành phần bazơ nitơ (
purin và pirimidin) đường pentose và axit photphoric.
Hình 1.2. Sơ đồ cấu tạo phân tử đường deoxyribose và ribose
Các bazơ purin (kích thước khoảng 7Å) gồm Adeine (A); Guanine (G);
còn các bazơ pirimidin (kích thước khoảng 5Å) gồm Thymine (T); Cytosine (C);
Uracil (U).
12