Tải bản đầy đủ (.doc) (30 trang)

Một số vấn đề về di truyền học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (810.46 KB, 30 trang )

Một số vấn đề di truyền học
I. GEN
I. 1. Về khái niệm
Các thông tin di truyền sinh vật cần cho quá trình sinh trởng, phát triển và sinh sản nằm
trong phân tử ADN của nó. Những thông tin này nằm trong trình tự nucleotit của ADN và đợc
tổ chức thành các gen. Mỗi gen thờng chứa thông tin để tổng hợp một chuỗi polypeptit hoặc
một phân tử ARN có chức năng riêng biệt. Xét về cấu trúc, mỗi gen là một đoạn ADN riêng
biệt mang trình tự bazơ thờng mã hoá cho trình tự axit amin của một chuỗi polypeptit. Các gen
rất khác nhau về kích thớc, có thể từ dới 100 cặp đến vài triệu cặp bazơ. ở sinh vật bậc cao, các
gen hợp thành các phân tử ADN rất dài nằm trong các cấu trúc đợc gọi là nhiễm sắc thể. ở ng-
ời có khoảng 30.000 - 40.000 gen phân bố trên 23 cặp NST, trong đó có 22 cặp NST thờng
(autosome) và 1 cặp NST giới tính (X và Y). Nh vậy, ở ngời có 24 loại NST khác nhau. Trên
nhiễm sắc thể, các gen thờng nằm phân tán và cách biệt nhau bởi các đoạn trình tự không mã
hóa. Các đoạn trình tự này đợc gọi là các đoạn ADN liên gen. ADN liên gen rất dài, nh ở ngời
các gen chỉ chiếm dới 30% toàn bộ hệ gen. Xét ở mỗi gen, chỉ một mạch của chuỗi xoắn kép
là mang thông tin và đợc gọi là mạch khuôn dùng để tạo ra phân tử ARN mang trình tự bổ trợ
để điều khiển quá trình tổng hợp chuỗi polypeptit. Mạch kia đợc gọi là mạch không làm
khuôn. Cả hai mạch trên phân tử ADN đều có thể đợc dùng làm mạch để mã hoá cho các gen
khác nhau. Ngoài ra, ngời ta còn dùng một số thuật ngữ khác để chỉ mạch khuôn và mạch
không làm khuôn, nh mạch đối nghĩa / mạch mang nghĩa, mạch không mã hoá / mạch mã
hoá. Cần chú ý là, mạch đối nghĩa và mạch không mã hóa chính là mạch khuôn để tổng hợp
phân tử ARN.
Khả năng lu giữ thông tin di truyền của ADN là rất lớn. Với một phân tử ADN có n bazơ
sẽ có 4
n
khả năn g tổ hợp trình tự bazơ khác nhau. Trong thực tế, chỉ một số lợng hạn chế các
trình tự mang thông tin có ích (thông tin mã hóa các phân tử ARN hoặc protein có chức năng
sinh học).
I. 2. Về tổ chức của gen
Hầu hết các gen phân bố ngẫu nhiên trên nhiễm sắc thể, tuy nhiên có một số gen đợc tổ
chức thành nhóm, hoặc cụm. Có hai kiểu cụm gen, đó là các operon và các họ gen.


Operon là các cụm gen ở vi khuẩn. Chúng chứa các gen đợc điều hoà hoạt động đồng
thời và mã hoá cho các protein thờng có chức năng liên quan với nhau. Ví dụ nh operon lac ở
E. coli chứa ba gen mã hoá cho các enzym mà vi khuẩn cần để thủy phân lactose. Khi có
lactose làm nguồn năng lợng (và vắng mặt glucose) thì vi khuẩn cần ba enzym do operon lac
mã hoá. Sự dùng chung một trình tự khởi đầu phiên mã (promoter) của các gen trong operon
(hình 1) cho phép các gen đó đợc điều khiển biểu hiện đồng thời và sinh vật có thể sử dụng
nguồn năng lợng một cách hiệu quả.
ở các sinh vật bậc cao không có các operon, các cụm gen đợc gọi là các họ gen. Không
giống nh các operon, các gen trong một họ gen rất giống nhau, nhng không đợc điều khiển
biểu hiện đồng thời. Sự cụm lại của các gen trong họ gen có lẽ phản ánh nhu cầu cần có nhiều
bản sao của những gen nhất định và xu hớng lặp đoạn của nhiều gen trong quá trình tiến hóa.
Một số họ gen tồn tại thành nhiều cụm riêng biệt trên nhiều nhiễm sắc thể khác nhau. Hiện t-
ợng này có lẽ là do sự tái cấu trúc ADN trong quá trình tiến hoá đã phá vỡ các cụm gen. Các
họ gen có thể có cấu trúc đơn giản hoặc phức tạp. ở các họ gen đơn giản, các bản sao của gen
giống hệt nhau. Ví dụ nh họ gen mã hóa ARN ribosom 5S (rARN 5S). ở mỗi tế bào ngời, có
khoảng 2000 cụm gen của gen này, phản ánh tế bào cần số lợng lớn sản phẩm của gen này
(hình 2a). Trong khi đó, các họ gen phức tạp chứa các gen tơng tự nhng không giống hệt
nhau. Ví dụ nh họ gen globin ở ngời mã hóa cho cho các chuỗi polypeptit tơng ứng với các
loại globin , , , , và (hình 2b) chỉ khác nhau vài axit amin. Các chuỗi polypeptit globin
1
ADN
Trình tự điều hòa
lac Z lac Y lac A
Hình 1. Operon Lac. Ba gen (lac Z, lac Y và lac A) xếp liền kề nhau và đ ợc điều khiển chung
ADN
a)
Các gen mã hóa ARN ribosom (rARN)
Các trình tự liên gen (ADN đệm)
Nhóm gen mã hóa
globin ở ng ời

ADN
b)

G A
1

Hình 2. Một họ gen đơn giản (a), và một họ gen phức tạp (b)
tơng tác với nhau thành một phức hệ, và kết hợp với các phân tử hem để tạo ra hemoglobin
(một loại protein vận chuyển oxy trong máu).
I. 3. Trình tự khởi đầu phiên mã (promoter)
Sự biểu hiện của gen đợc điều khiển rất chặt chẽ. Không phải tất cả các gen có trong
ADN của tế bào đều đợc biểu hiện đồng thời. Những gen khác nhau đợc hoạt hoá biểu hiện
vào những thời điểm và ở những tế bào khác nhau. Tất cả các gen đợc biểu hiện trong một tế
bào sẽ xác định đặc tính và chức năng của tế bào đó. Ví dụ, các gen biểu hiện trong tế bào cơ
khác với các gen đợc biểu hiện trong tế bào máu. Sự biểu hiện của gen đợc điều khiển bắt đầu
từ một đoạn trình tự ADN đứng trớc (nằm ngợc dòng về phía đầu 5) so với đoạn trình tự mã
hóa đợc gọi là trình tự khởi đầu phiên mã (promoter, còn gọi là trình tự khởi động). Đoạn
trình tự khởi động chứa trình tự đặc hiệu đợc ARN polymerase và các protein đặc biệt gọi là
các yếu tố phiên mã nhận biết để gắn vào trong quá trình phiên mã của gen. Mức độ biểu
hiện của gen trong tế bào đợc xác định bằng mức độ gắn kết (ái lực) của ARN polymerase và
các yếu tố phiên mã với promoter.
I. 4. Exon và Intron
ở các sinh vật bậc cao (sinh vật nhân chuẩn), thông tin di truyền mã hoá trên các NST th-
ờng bị phân cắt thành nhiều đoạn trình tự ADN cách biệt đợc gọi là các exon. Các exon bị
ngăn cách bởi những trình tự không mang thông tin có ích đợc gọi là các intron (hình 3). Số l-
ợng các intron trong một gen biến động lớn, có thẻ từ 0 đến trên 50 phân đoạn. Độ dài của các
intron và exon cũng rất biến động, nhng các intron thờng dài hơn và chiếm phần lớn trình tự
của gen. Trớc khi thông tin trong gen đợc sử dụng để tổng hợp phân tử protein tơng ứng, thì
các intron phải đợc cắt bỏ khỏi phân tử ARN nhờ quá trình đợc gọi là quá trình cắt bỏ (quá
trình hoàn thiện phân tử mARN). Trong quá trình đó, các exon đợc giữ lại và nối lại với nhau

thành một trình tự mã hoá liên tục.
Việc xác định các intron trong trình tự một gen có thể thực hiện đợc nhờ các intron điển
hình có trình tự bắt đầu là 5-GU và kết thúc là AG-3. Tuy vậy, thực tế ngoài những dấu
hiệu này, việc cắt bỏ các intron còn cần các trình tự khác ở vùng nối giữa intron và exon
(xem thêm mục III.1).
2
ADN
Promoter
Intron
Exon
Intron
Exon
Hình 3. Cấu trúc của gen.
I. 6. Gen giả (pseudogene)
Có một số gen giống với các gen khác nhng trình tự bazơ của chúng có những sai sót
làm cho chúng không có khả năng chứa những thông tin sinh học hữu ích. Những gen đó đợc
gọi là những gen giả và những sai sót hoặc đột biến trong trình tự ADN của chúng xuất hiện
trong quá trình tiến hoá làm thông tin bị lẫn lộn đến mức không còn điều khiển quá trình sinh
tổng hợp protein bình thờng đợc nữa. Những gen giả là dấu vết của quá trình tiến hoá. Trải qua
tiến hoá, những sự biến đổi ban đầu các bazơ gây mất thông tin đợc lặp đi lặp lại đến mức
thậm trí trình tự bazơ của các gen giả khác hẳn với trình tự gen gốc ban đầu. Ví dụ nh các gen
globin giả trong các cụm gen globin.
II. Mã DI TRUYềN
II. 1. Khung đọc
Ngoài việc quy định điểm bắt đầu quá trình tổng hợp protein, bộ ba mã khởi đầu (AUG)
còn xác định khung đọc của trình tự ARN. Có thể có ba bộ ba cho bất kỳ một trình tự bazơ
nào, phụ thuộc vào bazơ nào đợc chọn làm bazơ bắt đầu của codon. Thực tế trong quá trình
tổng hợp protein, thờng chỉ có một khung đọc đợc sử dụng. Còn hai khung đọc kia thờng chứa
một số bộ ba kết thúc ngăn cản chúng đợc sử dụng để tổng hợp trực tiếp nên phân tử protein
(hình 4).

Khung đọc 1. 5 - AUG ACU AAG AGA UCC GG - 3
Met Thr Lys Arg Ser
Khung đọc 2. 5 - A UGA CUA AGA GAU CCG G - 3'
Stop Leu Arg Asp Pro
Khung đọc 3. 5 - AU GAC UAA GAG AUC CGG - 3
Asp Stop Glu Ile Arg
Hình 4. Mỗi trình tự ADN có thể đọc theo ba khung đọc khác nhau, phụ thuộc vào bazơ nào đợc chọn làm bazơ
khởi đầu. Trên mỗi phân đoạn ADN mạch kép về lý thuyết có thể có tối đa sáu khung đọc mở (ORF)
khác nhau.
Đoạn trình tự nằm giữa một bộ ba khởi đầu và một bộ ba kết thúc tơng ứng cùng khung
đọc đợc gọi là khung đọc mở (ORF = open reading frame). Đặc điểm này đợc dùng để xác
định các trình tự ADN mã hoá protein trong các dự án giải mã hệ gen.
II.2. Tính vạn năng của mã di truyền
Ban đầu, ngời ta tin rằng mã di truyền là vạn năng. Nghĩa là ở mọi sinh vật, các codon
giống nhau đều quy định những axit amin nh nhau. Tuy vậy, thực tế cho thấy có một số trờng
hợp ngoại lệ. Ví dụ, ở hệ gen ty thể có sự khác biệt về bộ ba khởi đầu và bộ ba kết thúc. Cụ
thể, AUG bình thờng là bộ ba kết thúc, thì ở ty thể nó lại mã hoá cho tryptophan; AGA và
AGG bình thờng quy định arginin, ở ty thể lại có vai trò là các bộ ba kết thúc; AUA bình th-
ờng mã hóa cho isoleucin thì ở ty thể lại xác định methionin. Ngời ta cho rằng những thay đổi
này có thể tồn tại đợc là nhờ ty thể là một hệ thống kín. Ngoài hệ gen ty thể, một số trờng hợp
ngoại lệ khác cũng đợc tìm thấy ở một số sinh vật đơn bào. Ví dụ ở một số động vật nguyên
sinh, các bộ ba UAA và UAG bình thờng là các bộ ba kết thúc thì lại mã hoá cho axit
glutamic.
III. sự hoàn thiện marn ở eukaryote
III.1. Cắt bỏ các intron
Quá trình này xảy ra trong nhân nhằm cắt bỏ các trình tự intron không mã hóa khỏi phân
tử tiền-mARN để hình thành nên phân tử mARN hoàn chỉnh chỉ chứa các trình tự mã hoá
liên tục tơng ứng với các exon. Sau đó, phân tử mARN hoàn chỉnh đợc chuyển ra tế bào chất
để làm khuôn tổng hợp protein.
Quá trình cắt bỏ intron phụ thuộc vào trình tự tín hiệu ở các đoạn nối giữa các intron và

exon. Các intron điển hình đợc giới hạn bởi đầu 5-GT và 3-AG. Đoạn trình tự tín hiệu đầy
đủ ở đầu 5 gặp ở phần lớn các gen là: 5-AGGTAAGT-3 và ở đầu 3 là 5-
YYYYYYNCAG-3 (Y = pyrimidin, N = nucleotit bất kỳ).
Việc cắt bỏ các intron đợc thực hiện bởi một phức hệ gọi là spliceosom, gồm phân tử
tiền-mARN liên kết với các hạt ribonucleoprotein nhân kích thớc nhỏ snRNP (small
nuclear ribonucleoprotein particle, đợc đọc tắt là snớp). snRNP đợc tạo thành tự sự liên kết giữa
snARN và protein. Có 5 loại snARN phổ biến đợc kí hiệu là U1, U2, U4, U5 và U6. Mỗi
loại liên kết với một số phân tử protein để hình thành nên snRNP. Trừ U4 và U6 thờng tìm
thấy trong cùng một snRNP, còn các loại khác tìm thấy trong các snRNP riêng biệt.
Quá trình cắt intron trải qua một số bớc nh sau (hình 5 và 6):
1) U1 snRNP gắn vào vị trí cắt đầu 5 của intron. Việc gắn này dựa trên nguyên tắc bổ
trợ của U1 snARN có trong snRNP với trình tự ở đoạn nối với exon ở gần đầu 5 của
intron.
3
2) U2 snRNP gắn vào một trình tự gọi là điểm phân nhánh nằm ngợc dòng so với
đoạn nối với exon về phía đầu 3 của intron. Điểm phân nhánh là vị trí đặc thù của
các intron, tại đó chứa một adenyl là vị trí gắn vào của đầu 5 tự do của intron trong
quá trình cắt bỏ intron.
3) Phức hệ U4/U6 snRNP tơng tác với U5 snRNP rồi gắn vào các phức hệ U1 và U2
snRNP làm hai đầu 5 và 3 của intron tiến lại gần nhau, tạo thành cấu trúc thòng
lọng.
4) U4 snRNP tách ra khỏi phức hệ, lúc này spliceosome chuyển thành dạng có hoạt
tính cắt (exonuclease).
5) snRNP cắt intron ở đầu 5 tạo ra một đầu 5 tự do. Đầu này sẽ liên kết với nucleotit A
tại điểm phân nhánh vào vị trí nhóm 2-OH (liên kết phosphodieste 5-2). Nhóm 3-
OH của adênyl này vẫn liên kết bình thờng với nucleotit khác trong chuỗi.
6) Intron đợc cắt ở phía đầu 5 (intron vẫn ở dạng thòng lọng) và các exon liền kề ở hai
đầu 5 và 3 của intron liên kết với nhau. Lúc này phức hệ snRNP rời khỏi phân tử
ARN. Và quá trình cắt intron nh vậy đợc lặp đi lặp lại.
4

Exon 1
Exon 2
Trình tự điểm phân nhánh
Vị trí cắt đầu 5
Vị trí cắt đầu 3
Intron
Tiền-mARN
Sự hình thành cấu trúc thòng lọng
Cắt đầu 3 và nối các exon
Các exon đ ợc nối với nhau
Cấu trúc thòng lọng (intron)
Hình 5. Quá trình cắt bỏ intron của phân tử mARN tiền thân ở sinh vật nhân chuẩn.
Quá trình cắt intron nh trên đợc tìm thấy ở các gen đợc phiên mã nhờ ARN polymerase
II. Ngoài cơ chế trên đây, một số loại phân tử ARN có thể tự cắt bỏ intron. Quá trình cắt bỏ
intron này không phụ thuộc vào protein và đợc gọi là các intron nhóm I. Cơ chế tự cắt của các
intron nhóm I đợc tìm thấy ở các gen rARN, một số gen mã hóa protein trong ti thể và một số
gen mã hóa mARN và tARN ở thực khuẩn thể.
Một ví dụ về quá trình tự cắt của intron nhóm I (ở Tetrachynema) đợc mô tả nh sau:
1) Phân tử tiền-mARN đợc cắt ở vị trí nối với exon ở phía đầu 5 và một nucleoit G gắn
vào vị chí cắt này.
2) Intron đợc cắt ở vị trí nối tại đầu 3.
3) Hai exon liền kề đợc nối lại với nhau.
4) Phần intron đợc cắt ra đóng vòng tạo thành một phân tử ADN dạng vòng. Sản phẩm
tạo ra là intron ở dạng mạch vòng còn phân tử ADN chứa các exon ở dạng mạch
thẳng.
Quá trình tự cắt của intron nhóm I do chính ARN tự xúc tác, và các ARN có hoạt tính
nh vậy đợc gọi là ribozym. Tuy vậy, hoạt tính tự xúc tác của ARN không nên coi là hoạt tính
enzym. Bởi, không giống nh enzym protein, các phân tử ARN không trở về dạng ban đầu sau
khi phản ứng kết thúc.
Việc tìm ra ARN có hoạt tính xúc tác gần giống với protein đã làm thay đổi quan điểm

về nguồn gốc sự sống. Trớc đây, ngời ta cho rằng protein là yếu tố thiết yếu để quá trình sao
chép các nucleotit có thể xảy ra. Nhng lý thuyết mới gần đây cho rằng các axit nucleic đầu
tiên có khả năng tự sao chép thông qua hoạt tính kiểu ribozym.
III.2. Lắp mũ
Đầu 5 của phân tử mARN ở sinh vật nhân chuẩn đợc sửa đổi bằng cách gắn thêm một
nucleotit bị cải biến là 7-methylguanosin (7-mG); quá trình đó đợc gọi là sự lắp mũ. Mũ 7-mG
đợc gắn nhờ enzym guanyltransferase nối GTP với nucleotit đầu tiên của mARN bằng liên kết
triphotphat 5 5 khác thờng. Sau đó enzym methyl transferase sẽ gắn thêm nhóm -CH
3
vào
nitơ số 7 của vòng guanin; đồng thời thờng gắn thêm cả vào nhóm 2-OH của đờng ribose của
hai nucleotit kế tiếp. Việc tạo mũ giúp bảo vệ đầu 5 của mARN không bị phân hủy bởi
exonuclease trong tế bào chất, đồng thời làm tín hiệu cho ribosom nhận biết điểm bắt đầu của
phân tử mARN.
III.3. Gắn đuôi poly(A)
Đầu 3 của phân tử tiền-mARN của hầu hết các sinh vật nhân chuẩn đợc sửa đổi bằng
cách thêm vào một đoạn trình tự poly A (còn đợc gọi là đuôi polyA) có thể dài tới 250 bazơ
adenin. Sự sửa đổi này đợc gọi là đa adenin hóa và cần có một trình tự tín hiệu trên phân tử
tiền-mARN. Đó là trình tự 5-AAUAAA-3 nằm gần đầu 3 của phân tử tiền-mARN. Khoảng
11 - 20 bazơ tiếp theo có trình tự là YA (Y = pyrimidin), rồi tiếp đến là đoạn trình tự giàu GU
nằm xuôi dòng. Có nhiều protein đặc hiệu có khả năng nhận biết và gắn vào đoạn trình tự tín
hiệu tạo thành một phức hệ cắt mARN ở vị trí khoảng 20 nucleotit phía sau của trình tự 5-
AAUAAA-3. Sau đó, enzym poly(A) polymerase sẽ bổ sung thêm các adenin vào đầu 3 của
mARN. Mục đích tạo đuôi A còn cha rõ, nhng có thể nó có vai trò bảo vệ cho mARN không
bị phân hủy ở đầu 3 bởi exonuclease. Tuy nhiên, một số mARN, nh mARN mã hoá các
protein histon, không có đuôi polyA (nhng thờng có thời gian tồn tại ngắn)
5
Exon 1
Exon 2
Trình tự điểm phân nhánh

Vị trí cắt đầu 5
Vị trí cắt đầu 5
Intron
Tiền mARN
U1, U2
U2
U1
U5, U4/6
Exon 1
Exon 2
Phức hệ cắt intron (spliceosom)
Intron
U1
U2
U6
U4
U5
5
3
Hình 6. Sự hình thành phức hệ cắt intron (spliceosom).
III.4. Tính bền vững của mARN
Không giống nh rARN và tARN có tính bền vững khá cao trong tế bào, các mARN có
vòng đời tơng đối ngắn. Điều đó có thể do tế bào cần điều tiết mức độ tổng hợp các loại
protein trong tế bào tùy theo yêu cầu thông qua sự thay đổi mức độ phiên mã. Sự thay đổi lợng
mARN đang dịch mã phản ánh sự thay đổi mức độ phiên mã. ở các tế bào vi khuẩn, mARN có
thời gian bán phân hủy khoảng vài phút. Trong khi, ở các tế bào nhân chuẩn, mARN có thời
gian bán phân hủy có thể lên đến hơn 6 giờ. Mặc dù một số mARN, nh các mARN mã hoá
globin cấu tạo nên hemoglobin, có thể tồn tại rất lâu trong tế bào.
III.5. Các phân tử mARN đợc hoàn thiện theo các cách khác nhau
Một trình tự ADN phiên mã chỉ cho ra một phân tử tiền-mARN, nhng phân tử tiền-mARN

có thể đợc hoàn thiện bằng các cách khác nhau để tạo ra nhiều loại phân tử mARN hoàn chỉnh
khác nhau trớc khi đợc sử dụng làm khuôn tổng hợp protein. Đó là các cơ chế cắt bỏ tiền-
mARN khác nhau, trong đó tế bào sử dụng những điểm cắt khác biệt để loại bỏ hay giữ lại các
exon trong quá trình cắt bỏ. Ngoài ra, việc tồn tại các tín hiệu poly(A) khác nhau trên phân tử
tiền-mARN cũng có thể dẫn đến việc sinh ra các phân tử mARN có trình tự dài ngắn khác nhau
ở đầu 3. Ví dụ, việc sử dụng điểm poly(A) nằm phía trớc điểm kết thúc đoạn trình tự mã hoá có
thể loại bỏ một số exon nằm sau nó và sinh ra mARN mã hóa cho một loại protein ngắn hơn.
Một phân tử tiền-mARN có thể đợc cắt bỏ các intron theo những cách khác nhau cùng
lúc hoặc ở những giai đoạn phát triển khác nhau của một tế bào, hoặc khác nhau giữa các tế
bào khác nhau. Các protein đợc sinh ra theo các cơ chế này thờng có quan hệ với nhau, song
chúng thờng biểu hiện chức năng hoặc có đặc điểm riêng. Ví dụ, quá trình hoàn thiện phân tử
tiền-mARN của globulin miễn dịch dẫn đến việc tổng hợp các protein có thể chứa hoặc không
chứa các trình tự axit amin kỵ nớc cho phép nó liên kết đợc vào màng tế bào. Điều này giúp
tạo ra nhiều dạng globulin miễn dịch có thể liên kết với màng và các dạng để tiết ra khỏi tế
bào.
Các phân tử tiền-mARN cũng còn có thể trải qua quá trình sửa đổi trình tự ARN. Trong
quá trình đó, trình tự của phân tử tiền-mARN bị biến đổi bằng cách thêm vào, bớt đi hay thay
thế các bazơ. Sự sửa đổi trình tự ARN đợc xác định đầu tiên ở một số nguyên sinh động vật ký
sinh. ở những loài này, ngời ta thấy các bản phiên mã của nhiều gen ty thể bị sửa đổi bằng
cách đợc bổ sung thêm các gốc uracil. Quá trình này cũng gặp ở động vật có xơng sống, nhng
mức độ sửa đổi ít hơn nhiều. ở ngời, phân tử tiền-mARN của gen apolipoprotein B bị sửa đổi ở
tế bào ruột non bằng cách thay thế bazơ C bằng U để tạo nên một bộ ba kết thúc, dẫn đến việc
tổng hợp một phân tử protein ngắn hơn. Trong khi đó ở tế bào gan, nơi trình tự ARN không bị
sửa đổi, protein đó có độ dài đầy đủ.
IV. Về bệnh di truyền
VI.1. Các dạng bệnh di truyền
Có một nhóm đa dạng các bệnh lý và rối loạn gây ra do các đột biến gen và sự thay đổi
bất thờng của nhiễm sắc thể. Các rối loạn có bản chất di truyền và có thể chia làm 3 nhóm
chính:
Các sai hỏng đơn gen

Các sai hỏng đơn gen còn đợc gọi là các rối loạn di truyền Mendel (Mendelian
disorders), các rối loạn đơn gen (monogenic disorders), hay các rối loạn đơn locut (single
locus disorders). Đây là một nhóm các dạng bệnh lý gây ra do sự có mặt của một gen đột biến
trong cơ thể bị bệnh. Đột biến gen làm thay đổi thông tin mã hóa của gen đó và, hoặc dẫn đến
việc tạo ra phân tử protein bị sai hỏng về chức năng, hoặc thậm trí ức chế hoàn toàn sự tổng
hợp protein mà gen đó mã hóa. Sự thiếu hụt protein do đột biến gen gây nên sự biểu hiện của
các trạng thái bệnh lý. Đột biến gen có thể đợc di truyền giữa các thế hệ (từ bố, mẹ sang con,
cháu) hoặc xuất hiện một cách tự phát (de novo) trong tế bào sinh dục (tinh trùng hoặc trứng)
trong cơ thể bố hoặc mẹ, và sau thụ tinh, đứa trẻ hình thành mang đột biến trong mọi tế bào.
Các rối loạn nhiễm sắc thể
Có các dạng bệnh lý gây ra do sự mất đi hoặc thêm vào một hoặc một số nhiễm sắc
thể, hay do sự thay đổi cấu trúc của nhiễm sắc thể. Phần lớn các rối loạn bất thờng về nhiễm
sắc thể xuất hiện ngay trong các tế bào sinh dục của cơ thể bố hoặc mẹ, nhng cũng có những
trờng hợp gây ra do di truyền từ thế hệ trớc. Các dạng bất thờng về số lợng nhiễm sắc thể (biến
dị số lợng nhiễm sắc thể) có thể biểu hiện bằng sự tăng lên số lợng bộ nhiễm sắc thể đơn bội
(hiện tợng đa bội thể), hoặc do sự thêm và hoặc mất đi của từng nhiễm sắc thể riêng lẻ (hiện
tợng lệch bội). Các dạng bất thờng về cấu trúc nhiễm sắc thể có thể gây ra do sự đứt gẫy
nhiễm sắc thể liên quan đến các hiện tợng mất đoạn, lặp đoạn hoặc đảo đoạn nhiễm sắc thể.
Các rối loạn đa nhân tố
Đây là một nhóm gồm nhiều bệnh phổ biến, ví dụ nh đái tháo đờng, các bệnh mạch
vành và phần lớn các dị tất bẩm sinh. Các bệnh này gây ra do ảnh hởng của nhiều gen theo các
6
cơ chế bệnh lý phức tạp cho đến nay cha đợc hiểu biết đầy đủ, nhng đợc biết có liên quan đến
sự tơng tác của nhiều gen với nhau, hoặc giữa các gen với các yếu tố môi trờng.
Trong khoảng 20 năm qua, nhờ sự phát triển của công nghệ ADN tái tổ hợp, đã có
nhiều phát hiện mới mang tính bớc ngoặt liên quan đến các bệnh lý do rối loạn đơn gen gây
ra. Thông tin đợc nêu trong phần dới đây liên quan đến một số rối loạn bệnh lý nh vậy.
VI.2. Hình thức di truyền
Các rối loạn di truyền đơn gen đợc truyền từ thế hệ bố, mẹ sang thế hệ con, cháu. Có ba
hình thức di truyền phổ biến: di truyền trội trên nhiễm sắc thể thờng, di truyền lặn trên

nhiễm sắc thể thờng và di truyền liên kết nhiễm sắc thể X (Bảng 1).
Trong trờng hợp bệnh di truyền do alen trội nằm trên nhiễm sắc thể thờng quy định, việc
truyền một alen gây bệnh từ bố hoặc mẹ sang con là đủ để cá thể con biểu hiện bệnh. Các cá thể
bị bệnh có một alen bình thờng và một alen đột biến gây bệnh đợc gọi là các thể dị hợp tử. Các
cá thể này có nguy cơ truyền cho 50 % số con alen đột biến và biểu hiện bệnh (hình 7a).
Trong trờng hợp bệnh di truyền do alen lặn nằm trên nhiễm sắc thể thờng quy định, cá
thể biểu hiện bệnh phải mang đủ một cặp alen đột biến gây bệnh, một bắt nguồn từ bố, một từ
mẹ. Cá thể biểu hiện bệnh trong trờng hợp này gọi là cá thể đồng hợp từ về alen đột biến. Các
cá thể dị hợp tử với một alen gây bệnh không biểu hiện bệnh nhng có khả năng truyền alen
gây bệnh sang 50% số cá thể con. Đối cả bố và mẹ là các cá thể dị hợp tử mang alen lặn gây
bệnh trên nhiễm sắc thể thờng, một phần t số con biểu hiện bệnh, một phần t bình thờng và
một nửa số cá thể con là thể mang alen gây bệnh nhng không biểu hiện bệnh (hình 7b).
Trong trờng hợp bệnh di truyền liên kết với nhiễm sắc thể X, gen đột biến gây bệnh chỉ
xuất hiện trên nhiễm sắc thể X. Do con đực chỉ có một nhiễm sắc thể X duy nhất, việc truyền
alen đột biến sang cá thể con giới đực là đủ để cá thể này biểu hiện bệnh. Các cá thể đực biểu
hiện bệnh gọi là các cá thể dị giao tử. Các con cái có hai nhiễm sắc thể X vì vậy thờng không
biểu hiện bệnh do phần lớn các gen đột biến gây bệnh nằm trên nhiễm sắc thể X là các alen
lặn. Đối với các con cái là cá thể mang gen gây bệnh nhng không biểu hiện bệnh, 50% con
đực thế hệ con có nguy cơ bị bệnh và 50% con cái là thể mang gen gây bệnh nhng không biểu
hiện bệnh (hình 7c).
Hình 7. (a) Alen trội trên NST thờng. Sự di truyền của một alen đột biến duy nhất (a) đều dẫn đến sự biểu hiện
của bệnh. (b) Alen lặn trên NST thờng. Các cá thể bị bệnh phải mang hai alen đột biến (aa). Các cá thể dị hợp tử
(Aa) là các thể mang. (c) Alen liên kết NST X, đối với các thể mang là cái, 50% số cá thể con giới đực bị bệnh, và
50% số cá thể con giới cái là thể mang.
Bảng 1. Một số bệnh lý di truyền đơn gen
Bệnh lý Tần số trên 1000
trẻ
Hình thức di truyền Gen đột biến Đặc điểm
Máu khó đông dạng
A

0,1 Liên kết NST X Nhân tố VIII Chảy máu bất thờng
Máu khó đông dạng
B
0,03 Liên kết NST X Nhân tố IX Chảy máu bất thờng
Loạn dỡng cơ
Duchene
0,3 Liên kết NST X Dystrophin Hao mòn cơ
Loạn dỡng cơ
Becker
0,05 Liên kết NST X Dystrophin Hao mòn cơ
Hội chứng NST X
yếu
0,5 Liên kết NST X FMR1 Chậm phát triển trí tuệ
Bệnh múa giật
Huntington
0,5 Trội, trên NST thờng Hungtingtin Chứng tâm thần phân liệt
U sơ thần kinh 0,4 Trội, trên NST thờng NF-1,2 Ung th
Hội chứng 0,05 Lặn, trên NST thờng Các gen globin Thiếu máu
7
(a)
Bị bệnh
Bị bệnh Bị bệnh
Bị bệnhBị bệnh
Bình th ờng
Bình th ờng Bình th ờng
Bình th ờng Bình th ờngBình th ờng Thể
mang
Thể
mang
Thể

mang
Thể mangThể mang Thể mangBình th ờng
Alen bình th ờng
Alen đột biến
Cá thể đực
Cá thể cái
(b)
(c)
thalassemi
Thiếu máu hồng cầu
hình liềm
0,1 Lặn, trên NST thờng
- globin
Thiếu máu; Thiếu máu cục bộ
Phenylketo niệu 0,1 Lặn, trên NST thờng Phenylalanine-
hydroxylase
Không có khả năng chuyển
hóa phenylalanin
Hóa xơ nang 0,4 Lặn, trên NST thờng CFTR Bệnh hỏng phổi tích lũy và
các triệu chứng khác
Để có sự cân bằng giữa con đực và con cái về lợng sản phẩm do gen nằm trên nhiễm sắc
thể X mã hóa, trong tự nhiên có hiện tợng một trong hai nhiễm sắc thể X trong tế bào con cái
bị bất hoạt. Quá trình này đợc gọi là hiện tợng Lyon hóa (giả thiết Lyon) và thờng diễn ra
trong quá trình phát triển của phôi. Trong mỗi tế bào, nhiễm sắc thể X bị bất hoạt đợc chọn
một cách ngẫu nhiên. Tuy vậy, một số con cái là thể mang gen gây bệnh nằm trên nhiễm sắc
thể X có thể biểu hiện bệnh ở mức độ nhẹ do sự bất hoạt của nhiễm sắc thể X bình thờng.
VI.3. Sai hỏng đơn gen
Có nhiều bệnh di truyền do gen đơn quy định xuất hiện ở ngời (Bảng 7). Các bệnh này
có các đặc điểm biểu hiện đa dạng khác nhau và hậu quả đối với các cá thể bị bệnh cũng khác
nhau tùy thuộc vào mức độ quan trọng của gen bị đột biến và bản chất của loại đột biến xuất

hiện. Một số bệnh, nh bệnh máu khó đông, gây nên các triệu chứng bệnh có thể điều trị đợc,
nhng các bệnh khác chẳng hạn nh hội chứng múa giật Huntington, đến nay cha có biện pháp
điều trị triệt để và ngời bệnh thờng chết khi còn trẻ.
Các bệnh di truyền do đơn gen quy định thờng xuất hiện với tần số tơng đối thấp nằm
trong khoảng giữa 0,01 đến 5,0 trờng hợp trong 1000 em bé sơ sinh. Tần số các rối loạn di
truyền này thờng khác nhau trong các chủng tộc ngời khác nhau. Chẳng hạn, tần số bệnh nhân
bị xơ nang là cao nhất ở các nớc Bắc Âu, bệnh thiếu máu hồng cầu hình liềm xảy ra với tần số
cao nhất ở Châu Phi và bệnh -thalassemia phổ biến hơn cả trong các quần thể Châu á. Đối
với các bệnh di truyền đơn gen phổ biến nhất ở ngời đến nay đã xác định và tách dòng đợc gen
gây bệnh đồng thời xác định đợc các đột biến gây bệnh.
VI.4. Các đột biến trong sai hỏng đơn gen
Có thể chia các loại đột biến tạo ra các alen gây bệnh thành hai loại chính: các đột biến
điểm liên quan đến sự thay đổi của một bazơ nitơ duy nhất và các đột biến lớn liên quan đến
sự thay đổi trình tự ADN với kích thớc lớn hơn. Đối với mỗi loại bệnh, có thể có vài dạng đột
biến khác nhau. Ngoài ra, các cá thể bị bệnh cũng có thể cùng lúc mang các gen đột biến khác
nhau. Ví dụ, có khoảng 20% trờng hợp bị bệnh máu khó động dạng A do kết quả của đột biến
lớn gây ra. Các trờng hợp còn lại là do các dạng đột biến điểm mà đến nay các nhà nghiên cứu
đã tìm ra và mô tả 250 kiểu đột biến khác nhau.
Các đột biến điểm
Các đột biến điểm gây nên các bệnh di truyền có thể chia thành một số kiểu sau:
(1) Các đột biến sai nghĩa (misense mutations). Đây là những thay đổi của các nucleotit trên
phân tử ADN gây nên sự thay đổi bộ ba mã hóa cho một axit amin dẫn đến sự thay thế bởi một
loại axit amin khác trên phân tử protein. Các đột biến sai nghĩa gây nên những hậu quả khác
nhau đối với phân tử protein đợc mã hóa. Do hiện tợng thoái hóa của mã di truyền, những thay
đổi liên quan đến vị trí bazơ thứ ba trong bộ ba mã hóa thờng không có ảnh hởng đến phân tử
protein. Ngoài ra, nhiều sự thay đổi thành phần bazơ nitơ dẫn đến sự thay thế của axit amin có
đặc tính tơng tự có thể không làm thay đổi chức năng và hoạt tính của phân tử protein. Chẳng
hạn nh đột biến ở bộ ba mã hóa CTT thành ATT làm thay thế axit amin kị nớc là leucin bằng
isoleucin cũng là một axit amin kị nớc khác. Tuy vậy, có nhiều ví dụ cho thấy các đột biến sai
nghĩa làm thay đổi rõ rệt chức năng của phân tử protein đợc mã hóa và vì vậy gây nên các

bệnh di truyền. Trong số này có thể kể đến đột biến thay thế A bằng T trong gen mã hóa -
globin, một trong các chuỗi polypeptit hình thành nên phân tử hemoglobin. Đột biến này làm
thay đổi bộ ba số sáu của gen thay đổi từ GAG mã hóa cho axit glutamic thành GTG mã hóa
cho valin. Đột biến này gây nên bệnh thiếu máu hồng cầu hình liềm do các tế bào hồng cầu bị
biến dạng thành hình liềm do thay đổi sự kết dính của các phân tử hemoglobin. Các tế bào
hồng cầu hình liềm có tuổi thọ ngắn gây nên hiện tợng thiếu máu và nằm trong các mao mạch
làm giảm khả năng cung cấp máu tới các cơ quan (chứng thiếu máu cục bộ).
(2) Các đột biến vô nghĩa. Đây là những thay đổi của các nucleotit trên phân tử ADN làm
chuyển một mã bộ ba mã hóa axit amin thành một mã bộ ba kết thúc vì vậy quá trình phiên
mã sẽ kết thúc sớm hơn bình thờng và dẫn đến sự hình thành phân tử protein có kích thớc ngắn
hơn. Các đột biến vô nghĩa thờng gây hậu quả nghiêm trọng đối với phân tử protein đợc mã
hóa, đặc biệt khi nó xuất hiện gần đầu 5 của gen. Nhiều bệnh di truyền khác nhau đã đợc xác
định có liên quan đến các đột biến vô nghĩa. Ví dụ nh đột biến C thành T ở bộ ba số 39 trong
gen mã hóa -globin làm thay đổi mã bộ ba bình thờng CAG quy định glutamin thành TAG là
một bộ ba mã kết thúc. Đột biến này gây nên sự kết thúc phiên mã sớm của phân tử mARN
8
mã hóa cho -globin dẫn đến sự thiếu hụt một chuỗi polypeptit và gây nên dạng bệnh lý gọi
là -thalassemia với triệu chứng bệnh thiếu máu do phân tử hemoglobin bình thờng không đợc
tạo thành.
(3) Các đột biến dịch khung. Những đột biến này xảy ra do sự thêm vào hay mất đi của một
hay một số bazơ nitơ làm thay đổi khung đọc và một tập hợp các bộ ba mã hóa mới đợc hình
thành kể từ điểm đột biến xảy ra. Đột biến dịch khung cũng thờng gây nên hậu quả nghiêm
trọng đối với phân tử protein đợc mã hóa, đặc biệt khi đột biến xuất hiện gần đầu 5 của gen.
Nhiều bệnh lý đợc mô tả liên quan đến đột biến dịch khung. Chẳng hạn đột biến dịch khung
đã đợc tìm thấy là nguyên nhân gây nên bệnh máu khó đông ở nhiều bệnh nhân mắc căn bệnh
này. Trong đó bao gồm các trờng hợp do mất đi 4 bazơ nitơ gây nên sự thay đổi khung đọc từ
bộ ba mã hóa thứ 50 và một đột biến thêm 10 bazơ làm thay đổi khung đọc từ bộ ba mã hóa
thứ 38. Cả hai kiểu đột biến này đều gây triệu chứng bệnh nghiêm trọng.
(4) Đột biến vị trí cắt intron. Đây là những đột biến làm thay đổi trình tự tín hiệu ở gần đầu
3 hoặc 5 của các đoạn intron dẫn đến việc cắt intron sai trong quá trình hoàn thiện phân tử

mARN ở sinh vật nhân chuẩn. Các đột biến kiểu này cũng có thể xảy ra bên trong intron tạo
nên điểm cắt intron mới và vì vậy cũng dẫn đến sự cắt sai trình tự intron. Một loạt các đột biến
vị trí cắt intron đợc tìm thấy liên quan đến đột biến gen -globin làm thiếu hoàn toàn các
chuỗi -globin trong các cơ thể đồng hợp tử và gây bệnh -thalassemia.
(5) Đột biến trình tự gen điều hòa. Các đột biến này xảy ra tơng đối hiếm và ảnh hởng đến
việc điều hòa hoạt động của gen, thờng hoặc làm giảm hoặc làm tăng mức độ biểu hiện của
gen. Một đột biến nh vậy đã đợc xác định trong trình tự chỉ huy của gen mã hóa protein đông
máu (là protein yếu tố IX) cũng là một nguyên nhân gây nên bệnh máu khó đông. Các cá thể
mang đột biến này không tạo đợc protein yếu tố IX và bị chảy máu một cách bất thờng. Thông
thờng, triệu chứng bệnh thờng mất đi sau tuổi dậy thì nhờ hócmôn steroid kích thích sự biểu
hiện của gen này.
Các đột biến lớn
Có nhiều bệnh lý gây ra do các đột biến liên quan đến một trình tự dài các nucleotit
trên phân tử ADN. Phần lớn các đột biến này có ảnh hởng nghiêm trọng đến chức năng của
gen và gây bệnh nặng.
(1) Các đột biến mất đoạn. Sự mất đi của gen có thể biểu hiển với mức độ kích thớc khác
nhau, từ một vài bazơ nitơ đến toàn bộ gen, thậm trí nhiều gen cùng lúc. Sự mất đi hoàn toàn
của các gen mã hóa -globin gây nên bệnh -thalassemia (bệnh mất khả năng sản xuất
hemoglobin bình thờng). Ví dụ nh, sự mất một phần gen mã hóa dystrophin gây nên bệnh mòn
cơ, bệnh loạn dỡng cơ; hay sự mất đi một bộ ba mã hóa duy nhất trong gen tổng hợp protein
điều hòa độ dẫn xuyên màng trong bệnh xơ nang CFTR (cystic fibrosis transmembrane
conductance regulator) là nguyên nhân gây bệnh gặp phải ở 70% số bệnh nhân bị bệnh xơ
nang.
(2) Các đột biến thêm đoạn. Nhiều đột biến thêm đoạn đã đợc ghi nhận. Ví dụ nh một trờng
hợp một bệnh nhân bị máu khó đông dạng A hiếm gặp có nguyên nhân gây bệnh là do sự thêm
vào gen mã hóa yếu tố VIII một trình tự lặp lại gọi là yếu tố LINE.
(3) Các đột biến thay thế đoạn gen. Cũng có nhiều đột biến thay thế đoạn gen gây nên bệnh
di truyền đã đợc ghi nhận. Ví dụ nh một đột biến gây bệnh máu khó đông dạng A xảy ra do sự
tái tổ hợp giữa các trình tự nằm trong vùng intron thứ 22 của gen mã hóa yếu tố VIII và các
trình tự lặp lại kép dọc theo nhiễm sắc thể X. Do một lỗi xảy ra trong quá trình tái tổ hợp, gen

mã hóa yếu tố VIII bị cắt thành 2 mảnh tách biệt nhau bởi hàng triệu cặp bazơ nitơ, làm mất
hoàn toàn chức năng của gen này.
(4) Các đột biến lặp lại bộ ba nucleotit. Một dạng đột biến gen hiếm gặp liên quan đến các
trình tự lặp lại từng bộ ba nucleotit kém bền vững. Trong quá trình giảm phân xảy ra hiện tợng
số lợng bản sao các trình tự lặp lại từng bộ ba nucleotit tăng lên trong các tế bào sinh dục dẫn
đến sự biểu hiện của bệnh trong các thế hệ sau. Cơ chế dẫn đến hiện tợng lặp lại nhiều lần của
các trình tự nucleotit và nguyên lý gây bệnh cho đến nay cha đợc biệt rõ. Sự tăng lên số lợng
các trình tự lặp lại tìm thấy liên quan đến một số bệnh di truyền bao gồm bệnh múa giật
Hungtington.
VI.5. Về một số bệnh di truyền
1) Trao đổi chéo trong nguyên phân có thể tạo ra thể khảm về di truyền và một số
bệnh ung th ở ngời
Trao đổi chéo là một đặc tính quan trọng của quá trình giảm phân. Phức hệ trao đổi chéo
xác định vị trí tái tổ hợp đồng thời giữ cho các NST tơng đồng gắn kết với nhau, cho phép
chúng thành từng cặp tiến về mặt phẳng xích đạo tại kỳ giữa của giảm phân I, rồi sau đó phân
ly về hai cực đối diện của tế bào. Ngoài ra, TĐC trong giảm phân là một cơ chế góp phần làm
tăng tính đa dạng của các dạng của các loại giao tử. Vì vậy, không có gì là ngạc nhiên khi các
cơ thể sinh vật nhân chuẩn biểu hiện một sự đa dạng lớn về các loại enzym tham gia khởi đầu
9
đặc hiệu sự TĐC trong giảm phân. TĐC cũng có thể xuất hiện trong nguyên phân. Tuy vậy,
không giống sự kiện diễn ra trong giảm phân, TĐC trong nguyên phân thờng xảy ra do lỗi
xuất hiện trong quá trình tái bản NST hoặc do bị chiếu xạ dẫn đến sự đứt gãy của các phân tử
ADN, chứ không phải là một chơng trình đợc điều hòa bình thờng của tế bào nh trong giảm
phân. Vì vậy, TĐC trong nguyên phân là một sự kiện hiếm khi xảy ra, chỉ xuất hiện với tần số
thấp hơn 10
-6
lần phân bào nguyên nhiễm. Tuy vậy, việc nuôi cấy các tế bào nấm men và quá
trình phát triển của một cơ thể đa bào phức tạp có số lần phân chia tế bào đủ lớn để các nhà di
truyền học có thể hàng ngày phát hiện và theo dõi đợc hiện tợng TĐC trong nguyên phân vốn
xảy ra với tần số thấp này. Khác với trong giảm phân, TĐC xảy ra trong nguyên phân xảy ra

ngẫu nhiên ở một số ít các tế bào soma, tạo nên những tế bào soma mang hệ gen khác nhau.
Do vậy, những cá thể mang những tế bào soma chứa các NST bị TĐC đợc gọi là các thể khảm.
ở ngời, một số TĐC xảy ra trong nguyên phân có thể gây nên sự hình thành khối u (ví
dụ: một số bệnh u mắt). ở một số quần thể ngời, số trẻ sơ sinh có bẩm chất di truyền có nguy
cơ bị ung th có tần số vào khoảng 1/20.000 trẻ sơ sinh. Gen gây khối u võng mạc (RB) nằm
trên NST số 13, trong khi alen kiểu dại bình thờng (RB
+
) mã hóa cho một loại protein điều hòa
sự phát triển và biệt hóa của võng mạc. Các tế bào trong mắt cần ít nhất một bản sao của alen
kiểu dại để duy trì sự điều hòa hoạt động phân chia của tế bào. Một đột biến trong alen RB
+

thể dẫn đến làm hỏng chức năng của alen kiểu dại và đợc ký hiệu là RB
-
. Nừu một tế bào mất
đi cả hai bản sao của RB
+
, thì nó mất đi khả năng điều hòa hoạt động phân chia tế bào bình th-
ờng và gây nên sự hình thành khối u. Ví lý do này, alen kiểu dại RB
+
có đợc xem là một gen ức
chế sự hình thành khối u.
Những cá thể có bẩm chất di truyền có nguy cơ ung th võng mạc đợc sinh ra mang một
alen RB
+
duy nhất. NST số 13 thứ hai của họ hoặc chỉ mang alen RB
-
hoặc hoàn toàn không có
gen RB. Nếu một tác nhân đột biến (ví dụ: chiếu xạ) hay một lỗi xảy ra trong quá trình nguyên
phân làm mất đi alen RB

+
còn lại duy nhất ở một tế bào trong một hoặc hai mắt thì khối u
võng mạc sẽ bắt đầu phát triển từ vị trí tế bào sai hỏng. Một nghiên cứu ở các bệnh nhân bị
bệnh u võng mạc cho thấy sự xuất hiện của các tế bào mắt với kiểu gen đồng hợp tử RB
-
/RB
-
,
trong khi tế bào bạch cầu của ngời bệnh là dạng dị hợp tử RB
+
/RB
-
. Nh minh họa ở hình A, một
TĐC trong nguyên phân giữa gen RB và tâm động của nhiễm sắc thể mang gen là cơ chế gây
nên sự hình thành tế bào mang kiểu gen RB
-
/RB
-
. Khi tế bào này hình thành, nó đợc phân chia
một cách không đợc kiểm soát và dẫn đến sự hình thành khối u.
Chỉ có 40% trờng hợp bị bệnh ung th võng mạc là có cơ chế gây bệnh nh trên, còn 60%
còn lại khi sinh ra có kiểu gen bình thờng là RB
+
/RB
+
. ở những ngời này, hai đột biến phải
cùng xảy ra ở cả hai bản sao của gen RB mới gây nên ung th. Đột biến đầu tiến có thể dẫn đến
alen RB
+
bị chuyển thành RB

-
, còn sau đó các tế bào con xảy ra TĐC trong quá trình nguyên
phân và dẫn đến sự phát triển ung th do alen đột biến bị đồng hợp tử hóa.
Đáng chú ý là TĐC trong nguyên phân gây nên sự hình thành một số bệnh ung th võng
mạc đã giúp giải thích sự biểu hiện mức độ bệnh lý khác nhau. Những trẻ sơ sinh có kiểu gen
RB
+
/RB
-
có thể không bị bệnh. Hoặc khi mắc bệnh, sự phát triển của khối u có thể xảy ra ở cả
hai mắt, nhng cũng có thể chỉ xảy ra ở một mắt. Tất cả những hiện tợng đó phụ thuộc vào việc
tế bào nào trong cơ thể xảy ra hiện tợng TĐC trong nguyên phân.
2) Đột biến gen mã hóa các protein cảm thụ ánh sáng và thị lực
Những nghiên cứu đầu tiên mô tả sự bất thờng trong khả năng cảm thụ ánh sáng ở ngời
đợc bắt đầu từ khoảng 200 năm trớc. Thời đó, ngời ta phát hiện ra nhiều đột biến có thể gây
ảnh hởng đến thị lực ở ngời. Bằng việc phân tích các kiểu hình liên quan đến mỗi loại đột biến
và sau đó kiểm tra sự biến đổi của ADN. Ngày nay, chúng ta đã có những hiểu biết chi tiết hơn
về cơ chế di truyền phân tử của tính trạng cảm nhận ánh sáng, màu sắc và các loại protein mà
những gen này mã hóa.
Có một số dạng bệnh rối loạn cảm nhận màu sắc khác nhau ở ngời đã giúp việc phân
tích và làm sáng tỏ cơ chế cảm nhận màu sắc ở ngời. Đầu tiên, các nhà nghiên cứu nhận biết
và mô tả sự khác biệt trong cách những ngời có rối loạn về cảm nhận màu sắc nhìn thấy sự vật
từ sự khác biệt nhỏ khi nhìn thấy mức độ màu đỏ, tới việc không phân biệt đợc màu đỏ và màu
xanh lục, đến việc không nhìn thấy bất cứ màu nào. Thứ hai, sự phát triển khoa học tâm- sinh
lý học cung cấp các phép thử để xác định và so sánh chính xác các kiểu hình. Chẳng hạn, một
phép phân tích dựa trên sự kiện là mọi ngời có thể cảm nhận mỗi một màu nh sự hòa trộn của
ba dải bớc sóng cơ bản tơng ứng với màu đỏ, xanh dơng (xanh lam) và xanh lục và có thể điều
chỉnh tỉ lệ cờng độ sáng của ba màu này để thu đợc một dải bớc sóng tơng ứng với một màu
thứ t, chẳng hạn màu vàng. Một ngời với thị lực bình thờng, sẽ chọn một tỉ lệ màu thích hợp
của màu đỏ và màu xanh lục để tạo nên màu vàng đặc thù, nhng nếu một ngời không có khả

năng phân biệt màu đỏ với màu xanh lục thì mọi sự kết hợp giữa hai màu này sẽ chỉ cho ra
một màu giống nhau. Cuối cùng, do những biến dị di truyền liên quan đến thị giác hiếm khi
gây ảnh hởng đến hoạt động sinh sản hay tuổi thọ trong các xã hội ngời hiện đại, những đột
biến này có thể tạo ra nhiều alen mới làm thay đổi khả năng cảm nhận màu sắc và những alen
đột biến này đợc duy trì lâu dài trong quần thể.
a) Cơ sở phân tử và tế bào của sự cảm nhận màu sắc ở mắt
10
Các tế bào cảm nhận ánh sáng và màu sắc
Chúng ta cảm nhận đợc hình ảnh qua các nơron thần kinh ở võng mạc phần phía sau
nhãn cầu (hình 8a). Những nơron này có hai loại: tế bào hình nón và tế bào hình que. Các tế
bào hình que chiếm 95% số lợng các tế bào cảm nhận ánh sáng và đợc kích thích bởi các ánh
sáng yếu trong các bớc sóng ánh sáng. ở cờng độ sáng lớn hơn, các tế bào hình que bị bão hòa
và không còn chức năng gửi các tín hiệu thêm nữa đến não bộ. Lúc này, các tế bào hình nón sẽ
tiếp quản chức năng này, xử lý các bớc sóng ánh sáng của cờng độ sáng mạnh và giúp chúng
ta có thể phân biệt đợc các màu sắc. Các tế bào hình nón có ba loại. Loại thứ nhất chuyên hóa
để cảm nhận ánh sáng đỏ, loại
thứ hai cảm nhận ánh sáng xanh
lục và loại thứ ba cảm nhận ánh
sáng xanh dơng. Đối với mỗi tế
bào thụ quan ánh sáng nh vậy,
hoạt động cảm nhận ánh sáng
bao gồm sự hấp thụ các photon
từ ảnh sáng ở một dải bớc sóng
nhất định, chuyển các thông tin
về số lợng và năng lợng của các
photon thành các tín hiệu điện,
và chuyển các tín hiệu đó qua tế
bào thần kinh thị giác tới bộ
não.
Bốn gen mã hóa bốn chuỗi

polypeptit cảm nhận màu sắc
Các protein cảm nhận photon và
khởi đầu quá trình truyền tín
hiệu trong các tế bào hình nón
là rhodopsin. Protein này là một
chuỗi polypeptit duy nhất gồm
348 axit amin xếp thành một
chuỗi zigzag xuyên màng tế bào
(hình 8.b.1). Một axit amin
lysine nằm trong chuỗi liên kết
với một phân tử carotenoid sắc
tố trên võng mạc có khả năng
hấp thụ photon. Các axit amin ở
gần vùng liên kết võng mạc cấu
trúc nên vị trí hoạt động của
rhodopsin. Bằng việc thay đổi vị
trí võng mạc qua một cơ chế đặc
biệt, các rhodopsin xác định sự
đáp ứng lại ánh sáng của các tế
bào võng mạc. Mỗi một tế bào
hình que thờng chứa khoảng
100 triệu phân tử rhodopsin trên
lớp màng đặc thù của nó. Gen
mã hóa tổng hợp rhodopsin ở
ngời nằm trên NST số 3.
Protein có vai trò cảm nhận và
khởi đầu quá trình truyền tín
hiệu trong các tế bào hình nón
đối với photon màu xanh dơng
có liên quan đến rhodopsin.

Protein này cũng là một chuỗi
polypeptit duy nhất gồm 348
axit amin và bao quanh một
phân tử sắc tố của võng mạc.
Gần 50% trên phân tử protein
cảm nhận ánh sáng xanh dơng
là giống hệt trình tự của
rhodopsin; phần còn lại có sự
khác biệt giữa hai protein này và
là phần đặc thù cho sự cảm nhận
11
Các tế bào hình nón
và hình que
ánh sáng
ánh sáng
Võng mạc
Biểu mô
sắc tố
Tế bào thụ
cảm ánh sáng
Hình que
Hình nón
Võng
mạc
Rhodopsin
a)
b)
1- Protein Rhodopsin
2- Protein cảm nhận màu xanh d ơng
4-Protein cảm nhận màu đỏ

3-Protein cảm nhận màu lục
Các gen mã hóa protein cảm nhận
màu đỏ (1) và lục (2) trên NST X
c)
1 2 2 2
d)
Sự tiến hóa của các gen
cảm nhận màu sắc
Gen tiền thân
Rhodopsin
Xanh d
ơng
Hình 8. Cơ sở phân tử và tế bào của sự cảm nhận màu sắc.
(a) các tế bào hình nón và hình que ở võng mạc chứa hàng triệu
protein thụ thể cảm nhận ánh sáng liên kết trên màng tế bào. (b)
các thụ thể cảm nhận ánh sáng ở các tế bào hình que là
rhodopsin. Các protein thụ thể cảm nhận màu đỏ, xanh d ơng và
lục có ở các tế bào hình nón giống với rhodopsin ở phần lớn trình
tự, nh ng vẫn đủ khác biệt dẫn đến khả năng thụ cảm màu sắc
khác nhau. (c) các gen mã hóa protein cảm nhận màu đỏ (1) và
lục (2) nằm thành chuỗi trên NST X. Ng ời bình th ờng có 1 bản sao
gen mã hóa protein cảm nhận màu đỏ và từ 1 đến 3 bản sao của
gen mã hóa protein cảm nhận màu lục. (d) sự tiến hóa của các
protein cảm nhận màu sắc cho thấy chúng cùng xuất phát từ một
gen tiền thân trải qua ba đột biến lặp đoạn gen độc lập tiếp theo đó
là sự phân ly về chức năng của các gen.
LụcĐỏ
ánh sáng màu xanh dơng (hình 8.b.2). Gen mã hóa protein cảm nhận ánh sáng xanh dơng nằm
trên NST số 7.
Cũng có quan hệ với protein rhodopsin là các protein cảm nhận ánh sáng màu đỏ và

xanh lục nằm trong các tế bào hình nón màu đỏ và xanh lục. Hai protein này cũng chỉ gồm
một chuỗi polypeptit duy nhất, gồm 364 axit amin, cũng liên kết với võng mạc và nằm xuyên
qua màng tế bào (các hình 8.b.3 và 4). Cũng giống nh protein cảm nhận màu xanh dơng, các
protein cảm nhận màu đỏ và xanh lục có khoảng gần 50% trình tự axit amin giống với
rhodopsin; các protein này chỉ khác biệt nhau trung bình 4 / 100 axit amin. Mặc dù chỉ khác
biệt nhau nhỏ nh vậy, những protein này đủ để để biệt hóa hai loại tế bào hình nón mẫn cảm
với các photon ánh sáng thuộc bớc sóng khác nhau, là các tế bào hình nón màu đỏ và xanh
lục. Cả hai gen mã hóa cho các protein màu đỏ và xanh lục đều nằm trên NST X thành một
chuỗi kế tiếp nhau. Phần lớn mỗi NST X trong tế bào ở ngời mang một gen duy nhất mã hóa
protein cảm nhận ánh sáng đỏ, còn có từ một đến ba bản sao gen mã hóa protein cảm nhận
ánh sáng xanh lục.
Họ gen rhodopsin hình thành do hiện tợng lặp đoạn và phân ly
Sự giống nhau về cấu trúc và chức năng giữa bốn loại protein rhodopsin cho thấy các
gen mã hóa các chuỗi polypeptit này xuất hiện do hiện tợng lặp đoạn của một gen thụ thể cảm
nhận ánh sáng tiền thân, rồi sau đó phân ly do sự tích lũy của nhiều đột biến. Các đột biến
thúc đẩy khả năng cảm nhận màu sắc đã đợc u tiên chọn lọc qua quá trình tiến hóa hàng triệu
năm. Các protein cảm nhận ánh sáng đỏ và xanh lục giống nhau hơn cả, và chỉ khác nhau
khoảng 15 axit amin. Điều này cho thấy hai gen này chỉ phân ly trong thời gian gần đây. Sự
khác biệt của hai protein này so với protein cảm nhận màu xanh dơng và rhodopsin cho thấy
các protein này phân ly sớm hơn trong quá trình tiến hóa từ gen mã hóa thụ thể cảm nhận ánh
sáng tiền thân (hình 8.d).
b) Các đột biến ở họ gen rhodopsin gây ảnh hởng đến thị lực và khả năng cảm nhận
màu sắc
Nhiều đột biến thay thế axit amin ở gen rhodopsin gây nên bệnh mù một phần hay mù
hoàn toàn
Ngời ta đã phát hiện đợc ít nhất 29 loại đột biến axit amin duy nhất trong gen mã hóa
rhodopsin gây nên một nhóm bệnh di truyền trội nằm trên NST thờng đợc gọi chung là các
bệnh loạn sắc tố võng mạc (retinitis pigmentosa) với những triệu chứng đầu tiên là sự mất
chức năng của các tế bào hình que, rồi dẫn đến sự thoái hóa dần dần của các tế bào võng mạc
ngoại vi. Những đột biến này thờng gây nên sự hình thành protein rhodopsin không đợc gấp

nếp theo đúng cấu trúc không gian thông thờng, hoặc trở nên kém bền vững. Do protein
rhodopsin bình thờng là thành phần cấu trúc quan trọng của màng tế bào hình que, những
protein đột biến mất chức năng này đợc duy trì trong tế bào những không đợc gắn vào màng tế
bào nh bình thờng. Các tế bào hình que không có đủ rhodopsin ở trên màng thờng bị chết sau
đó. Tùy thuộc vào số tế bào hình que bị chết, mà ngời bệnh có thể bị mù hoàn toàn hay mù
một phần.
Các đột biến khác ở gen mã hóa rhodopsin gây nên một dạng bệnh lý ít nghiêm trọng
hơn là bệnh mù ban đêm. Các đột biến có mức độ đa hình cao này làm thay đổi trình tự của
các axit amin trong phân tử protein theo hớng làm tăng ngỡng ánh sáng kích thích cần thiết để
khởi đầu chuỗi truyền tín hiệu cảm nhận ánh sáng. Với những thay đổi này, khi cờng độ ánh
sáng yếu, mắt không cảm nhận đợc màu sắc.
Các đột biến trong gen mã hóa các sắc tố của tế bào hình nón làm thay đổi thị lực theo
một số cách có thể phỏng đoán đợc
Các rối loạn thị lực gây ra bởi các đột biến liên quan đến các gen sắc tố thuộc tế bào
hình nón ít nghiêm trọng hơn so với các rối loạn thị lực gây ra bởi các đột biến tơng tự xảy ra
với các gen rhodopsin trong các tế bào hình que. Nguyên nhân chủ yếu có lẽ bởi vì các tế bào
hình que chiếm đến 95% số nơron thần kinh cảm nhận màu sắc ở ngời, trong khi các tế bào
hình nón chỉ chiếm 5%. Một số đột biến liên quan đến gen mã hóa protein cảm nhận màu
xanh dơng nằm trên NST số 7 gây nên hội chứng rối loạn thị lực sắc tố xanh (tritanopia). Các
đột biến ở gen mã hóa protein cảm nhận sắc tố đỏ trên NST X có thể làm mất chức năng cảm
nhận màu đỏ của các tế bào hình nón và gây bệnh mù màu đỏ. Với một số đột biến nhỏ khác
liên quan đến gen quy định protein cảm nhận màu đỏ có thể gây nên bệnh mù màu đỏ một
phần hoặc hoàn toàn tùy vào vị trị đột biến.
Trao đổi chéo không cân bằng giữa các gen mã hóa protein xanh lục và đỏ gây nên
phần lớn các biến dị về tính trạng cảm nhận màu sắc
Một ngời có thị lực bình thờng thông thờng có một gen mã hóa protein cảm nhận màu
đỏ. Một số trong những ngời bình thờng này có một gen xanh lục nằm gần kề, còn một số ng-
ời khác có số gen xanh lục dao động từ hai đến năm bản sao. Các gen đỏ và xanh lục giống
nhau đến 96% về trình tự ADN. Các gen màu xanh lục khác nhau giống nhau đến 99,9%. Do
sự giống nhau và nằm gần nhau của những gen này nên hiện tợng trao đổi chéo không tơng

đồng dễ xảy ra với những gen này. Hàng loạt các dạng TĐC khác nhau ở vùng gen này có thể
tạo ra các kiểu hình đột biến thiếu vắng hoàn toàn gen màu đỏ, hoặc gen màu xanh lục, có sự
tổ hợp khác nhau của các gen màu xanh lục, mang gen lai xanh lục - đỏ. Do khả năng cảm
12
nhận màu đỏ và xanh lục phụ thuộc vào tỉ lệ ánh sáng đỏ và xanh lục đợc phản chiếu từ hình
ảnh, những ngời thiếu các gen đỏ và xanh lục sẽ cảm nhận màu đỏ và xanh lục là một màu
giống nhau.
Một số đột biến có thể làm mất hoàn toàn khả năng nhìn màu đỏ và xanh lục
Đến nay, các nhà di truyền học đã tìm thấy bảy loại đột biến mất đoạn gây bệnh mù màu
đỏ và xanh lục liên kết với NST giới tính X. Bệnh lý này đợc gọi là hội chứng tế bào hình nón
đơn sắc xanh dơng (blue cone monochromacy), bởi những ngời này chỉ cảm nhận đợc màu
liên quan đến màu xanh dơng. Nghiên cứu phân tử cho thấy cả bảy đột biến mất đoạn này đều
liên quan đến một đoạn trình tự gồm 600 bp nằm ngoài vùng mã hóa của các gen đỏ và xanh
lục. Điều này cho thấy khả năng trình tự này là một đoạn trình tự (gen) điều hòa dài cần thiết
cho sự biểu hiện của chuỗi các gen đỏ và xanh lục.
Tóm lại, chúng ta nhìn đợc và cảm nhận đợc các màu sắc đa dạng, phong phú của vạn
vật một phần là nhờ bốn gen trực tiếp tạo ra bốn loại phân tử protein trong các tế bào hình que
và hình nón ở võng mạc mắt. Các đột biến làm thay đổi những chuỗi polypeptit này hoặc số l-
ợng của chúng đều có thể làm thay đổi hoặc làm hỏng thị lực hoặc khả năng cảm nhận màu
sắc của mắt.
V. Phân tích gen và sản phẩm của gen
V.1. Các kỹ thuật phân tích axit nucleic
V.1.1. Điện di phân tích ADN và ARN
Có nhiều phơng pháp khác nhau có thể đợc sử dụng để phân tích ADN và ARN, nhng
cho đến nay điện di trên gel là phơng pháp đợc sử dụng phổ biến hơn cả nhờ u điểm nhanh và
tơng đối đơn giản. Nguyên tắc của phơng pháp là do: dới tác động của điện trờng, các phân tử
ADN (thờng tích điện âm) khác nhau về kích thớc, điện tích, mức độ cuộn xoắn và dạng phân
tử (mạch thẳng hay mạch vòng) sẽ di chuyển qua hệ mạng của gel từ cực âm (cathode) sang
cực dơng (anode) với tốc độ di chuyển khác nhau. Vì vậy, chúng dần dần tách nhau ra trên tr-
ờng điện di, qua đó ngời ta có thể thu thập và phân tích đợc từng phân đoạn ADN hoặc gen

riêng rẽ. Trên điện trờng các phân đoạn ADN có kích thớc càng nhỏ càng có tốc độ di chuyển
trên điện trờng nhanh hơn. Sau khi điện di kết thúc, các phân tử ADN có thể quan sát thấy nhờ
sử dụng các thuốc nhuộm phát huỳnh quang, chẳng hạn nh ethidium (chất này gắn kết với
ADN bằng cách cài vào khe ở giữa các nucleotit). Mỗi một băng điện di thờng phản ánh một
tập hợp các phân tử ADN có cùng kích thớc.
Có hai loại vật liệu làm gel đợc sử dụng phổ biến trong điện di, đó là agarose và
polyacrylamid. Trong đó, gel polyacrylamid có khả năng phân tách cao, nhng khoảng kích
thớc ADN có thể phân tích hẹp. Vì vậy, điện di trên gel polyacrylamid có thể phân tách đợc
các phân đoạn ADN khác nhau thậm trí chỉ một cặp nucleotit (1 bp) duy nhất, nhng thờng chỉ
để phân tích các đoạn ADN kích thớc vài trăm bp. Còn gel agarose có khả năng phân tách thấp
hơn đối với các phân đoạn ADN kích thớc nhỏ, nhng rất hiệu quả khi phân tách các phân đoạn
ADN kích thớc lớn tới hàng chục hoặc hàng trăm kb (1 kb = 1000 bp).
Các phân đoạn ADN kích thớc lớn không
thể lọt qua các lỗ có kích thớc nhỏ trên các
bản gel, kể cả gel agarose. Thay vào đó, chúng
sẽ trờn qua mạng lới của gel bằng việc đầu này
của phân tử đi trớc, còn đầu kia theo sau. Kết
quả là các phân đoạn ADN kích thớc lớn (từ 30
đến 50 kb) có tốc độ di chuyển trên điện trờng
gần nh tơng đơng và khó phân tách đợc bằng ph-
ơng pháp điện di thông thờng. Đối với các phân
đoạn ADN kích thớc lớn nh vậy, ngời ta có thể
phân tách bằng việc sử dụng phơng pháp điện di
xung trờng (pulsed-field gel electrophoresis).
Trong phơng pháp này, ngời ta sử dụng 2 cặp
điện cực nằm chéo góc trên bản điện di (hình 9).
Việc bật và tắt luân phiên 2 cặp điện cực sẽ
làm cho các phân đoạn ADN lớn thay đổi chiều
di chuyển nh mình họa trên hình vẽ. Các phân
đoạn ADN có kích thớc càng lớn càng chậm hơn

trong quá trình thay đổi chiều di chuyển. Nhờ
vậy, các phân đoạn có kích thớc khác nhau sẽ
phân tách ra khỏi nhau trong quá trình di
chuyển. Kỹ thuật điện di xung trờng trong thực
tế có thể sử dụng để xác định đợc kích thớc đầy
đủ của nhiễm sắc thể vi khuẩn, hoặc nhiễm sắc
thể các loài sinh vật nhân chuẩn bậc thấp, nh
nấm men. Những loài này có kích thớc hệ gen
khoảng vài Mb.
13
Điện cực
Hình 9. Ph ơng pháp điện di xung tr ờng. A
và B là hai bộ điện cực. Chúng đ ợc bật và tắt
một cách luân phiên. Khi bật A, phân tử ADN
di chuyển về góc phải phía d ới. Khi A tắt và B
bật, phân tử ADN di chuyển về góc trái phía d
ới. Mũi tên mô tả h ớng di chuyển của phân tử
ADN trong điện di xung tr ờng.
Điện di không những có thể phân tách các phân đoạn ADN khác nhau về kích thớc mà
cả về hình dạng và cấu hình không gian của chúng. Các phân tử ADN ở dạng mạch vòng giãn
xoắn hoặc bị đứt gãy ở một số nucleotit di chuyển chậm hơn trên trờng điện di so với các
phân tử ADN ở dạng mạch thẳng có cùng khối lợng. Tơng tự nh vậy, các phân tử ADN ở dạng
siêu xoắn, kích thớc và thể tích thu nhỏ thờng di chuyển nhanh hơn trên trờng điện di so với
các phân tử ADN dạng mạch vòng giãn xoắn hoặc có mức độ cuộn xoắn thấp hơn có cùng
khối lợng.
Kỹ thuật điện di cũng đợc sử dụng để phân tách các phân tử ARN. Các phân đoạn ADN
sợi kép mạch thẳng có cấu trúc bậc hai đồng nhất nên tốc độ di chuyển trên trờng điện di tơng
quan tỉ lệ thuận với khối lợng phân tử của chúng. Cũng giống nh ADN, các phân tử ARN cũng
thờng tích điện âm, nhng ngoài cấu trúc cơ bản ở dạng mạch đơn, các cấu trúc bậc 2 và 3 của
phân tử ARN có ảnh hởng đến tốc độ di chuyển của chúng trên trờng điện di. Để hạn chế điều

này, thông thờng ngời ta phải xử lý ARN với một số hóa chất ngăn cản sự hình thành các liên
kết cục bộ trong phân tử ARN, chẳng hạn nh glyoxal. Hợp chất này liên kết với nhóm -NH
2
trong các bazơ nitơ và ngăn cản sự kết cặp của các nucleotit. Các phân tử ARN đợc xử lý
glyoxal không hình thành đợc các cấu trúc bậc 2 và 3 vì vậy có tốc độ di chuyển trên trờng
điện di dờng nh đơn thuần phụ thuộc vào khối lợng phân tử của chúng.
V.1.2. Sử dụng enzym giới hạn trong phân tích ADN
Hầu hết các phân tử ADN trong tự nhiên đều lớn hơn nhiều so với kích thớc có thể thao
tác và phân tích một cách thuận lợi trong phòng thí nghiệm. Trong các tế bào, phần lớn các
nhiễm sắc thể thờng là một phân tử ADN dài chứa hàng trăm thậm trí hàng nghìn gen khác
nhau. Vì vậy, để có thể phân lập và phân tích từng gen, ngời ta phải cắt các phân tử ADN kích
thớc lớn thành các phân đoạn nhỏ. Công việc này đợc thực hiện bởi một nhóm các enzym đặc
biệt gọi là enzym giới hạn.
Tất cả các enzym giới hạn đều có hai đặc tính: 1) nhận biết một trình tự đặc hiệu trên
phân tử ADN (gọi là trình tự giới hạn); và 2) cắt bên trong phân tử ADN tại vị trí đặc hiệu
(hoặc ngay tại vị trí giới hạn nh đối với nhóm enzym giới hạn loại II; hoặc cách vị trí giới hạn
một số nucleotit nhất định nh đối với các nhóm enzym giới hạn thuộc các nhóm I và III).
Trong các nhóm enzym giới hạn, nhóm thờng đợc dùng trong các nghiên cứu di truyền phân tử
và kỹ nghệ gen là nhóm II nhờ vị trí và trình tự cắt của chúng đợc xác định rõ. Trong phạm vi
giáo trình này, vì vậy chúng ta chỉ đề cập đến việc ứng dụng của nhóm enzym giới hạn này.
Các trình tự giới hạn của enzym nhóm II thờng gồm 4 - 8 bp, thông thờng có tính đối xứng và
vị trí cắt thờng nằm trong trình tự giới hạn này. Ví dụ nh enzym giới hạn EcoRI đợc tìm thấy ở
vi khuẩn E. coli có trình tự giới hạn là 5-GAATTC-3 với vị trí cắt ở giữa G và A. Tên enzym
gồm 3 ký tự đầu chỉ tên loài vi khuẩn mà từ đó enzym đợc tìm thấy (Eco = Escherichia coli),
các ký tự sau chỉ tên của chủng vi khuẩn và số thứ tự của enzym đợc tìm thấy ở loài vi khuẩn
đó (EcoRI là enzym giới hạn đầu tiên đợc tìm thấy ở E. coli).
Một enzym giới hạn có trình tự giới hạn gồm 6 bp giống EcoRI thông thờng đợc trông
đợi sẽ có trung bình một vị trí cắt trong một đoạn trình tự có kích thớc khoảng 4 kb (bởi theo
nguyên tắc xác suất tại một vị trí nhất định xác suất để có một loại nucleotit nhất định là 1/4,
vì vậy xác suất để có một trình tự nhất định gồm 6 bp sẽ là 1/4

6
= 1/4096). Giả sử có một phân
tử ADN mạch thẳng có 6 vị trí cắt của enzym EcoRI. Việc cắt phân tử ADN này bằng EcoRI
sẽ cho ra 7 phân đoạn ADN khác nhau. Do đó, khi điện di trên gel sản phẩm cắt, 7 phân đoạn
ADN sẽ phân tách nhau ra do chúng khác nhau về khối lợng (vì chúng khác nhau về thành
phần và trình tự các nucleotit). Nh vậy, một phân đoạn ADN sẽ tơng ứng với một vùng của
phân tử ADN ban đầu.
Việc sử dụng một enzym giới hạn khác, chẳng hạn HindIII cũng có trình tự giới hạn
gồm 6 bp, nhng có trình tự giới hạn thay đổi (5-AAGCTT-3) sẽ cho ra các sản phẩm cắt khác
với khi sử dụng EcoRI (với cùng phân tử ADN ban đầu). Nh vậy, việc sử dụng đồng thời nhiều
enzym giới hạn sẽ tạo ra một kiểu hình phổ điện di các phân đoạn cắt giới hạn đặc thù đối với
từng gen phân tích.
Đối với một số enzym giới hạn khác, chẳng hạn nh Sau3A1 (tìm thấy ở vi khuẩn
Staphylococcus aureus) có trình tự giới hạn ngắn hơn (5-GATC-3), nên tần số cắt của chúng
thờng cao hơn các enzym có trình tự giới hạn dài. Theo xác suất, Sau3A1 có trung bình 1 vị trí
cắt trong một đoạn trình tự khoảng 250 bp (1/4
4
= 1/256). Ngợc lại, enzym NotI có trình tự
giới hạn dài (5-GCGGCCGC-3) trung bình cứ một đoạn trình tự dài khoảng 65 kb, mới có 1
vị trí cắt (1/4
8
= 1/65536).
Các enzym giới hạn không chỉ khác nhau về trình tự giới hạn và độ dài đoạn trình tự giới
hạn đặc trng của chúng, mà chúng còn khác nhau về cách cắt phân tử ADN. Chẳng hạn nh
enzym HpaI tạo ra các phân tử ADN dạng đầu bằng (đầu tù), còn các enzym EcoRI, HindIII
và PstI cắt phân tử ADN tạo ra các phân đoạn có đầu dính. Sở dĩ gọi là đầu dính bởi phần
các trình tự ở hai đầu sau khi đợc enzym cắt ra bổ trợ với nhau theo nguyên tắc Chargaff và vì
vậy chúng có xu hớng dính trở lại với nhau, hoặc với các phân tử ADN đợc cắt bởi cùng một
loại enzym giới hạn. Tính chất này đợc ứng dụng rộng rãi trong công nghệ ADN tái tổ hợp và
các kỹ thuật tách dòng phân tử.

V.1.3. Các phơng pháp lai phân tử và mẫu dò
14
Các phân tử ADN sợi kép có một tính chất đặc biệt là khả năng biến tính (phân tách
thành hai mạch đơn) và hồi tính (hai mạch đơn có trình tự bổ trợ có xu hớng liên kết trở lại khi
vắng mặt các tác nhân gây biến tính). Khả năng liên kết bổ trợ giữa các bazơ nitơ cũng cho
phép hai mạch ADN có nguồn gốc khác nhau nhng có trình tự bổ trợ liên kết với nhau trong
điều kiện phù hợp (về nhiệt độ, độ pH, ion hóa ) để tạo nên một phân tử ADN mới. Hiện t-
ợng liên kết nh vậy cũng có thể xảy ra giữa hai mạch ADN với nhau, hoặc giữa hai mạch ARN
hoặc giữa ADN và ARN. Phân tử axit nucleic sợi kép mới hình thành đợc gọi là phân tử lai và
quá trình kết cặp giữa các bazơ thuộc hai mạch đơn axit nucleic có nguồn gốc khác nhau theo
nguyên tắc bổ trợ nh vậy đợc gọi là quá trình lai phân tử.
Nhiều kỹ thuật trong nghiên cứu di truyền phân tử đợc dựa trên nguyên tắc lai phân tử.
Chẳng hạn, bằng nguyên tắc này ngời ta có thể dùng một trình tự ADN biết trớc để xác định
một trình tự bổ trợ tơng ứng có trong hệ gen của mẫu phân tích. Phân đoạn ADN có trình tự
biết trớc dùng trong phản ứng lai nh vậy đợc gọi là mẫu dò. Các mẫu dò có thể có nguồn gốc
từ các phân đoạn ADN trong tự nhiên hoặc đợc tổng hợp theo nguyên tắc hóa học, và để nhận
biết đợc chúng, các mẫu dò thờng đợc đánh dấu với các chất phóng xạ hoặc phát huỳnh quang
(ở đây, gọi tắt là chất phát quang).
Có hai phơng pháp đánh dấu mẫu dò ADN. Phơng pháp thứ nhất dùng nguyên tắc tổng
hợp hóa học phân tử ADN mới với tiền chất là các phân tử đánh dấu. Phơng pháp thứ hai là
gắn một phân tử đánh dấu vào đuôi của một trình tự ADN có sẵn. Chẳng hạn, bằng việc sử
dụng enzym polynucleotide kinase, ngời ta có thể bổ sung nhóm phosphat của ATP vào
nhóm 5-OH của một phân tử ADN định đánh dấu. Nếu nhóm phosphat này đợc đánh dấu
bằng đồng vị phóng xạ
32
P thì phân tử ADN sẽ đợc dánh dấu phóng xạ.
Phơng pháp đánh dấu ADN thứ hai (sử dụng các tiền chất đánh dấu) thờng đợc thực hiện
dựa trên phản ứng PCR, hoặc đôi khi chỉ cần sử dụng các đoạn mồi ngắn rồi cho enzym ADN
polymerase thực hiện phản ứng kéo dài chuỗi. Các tiền chất đánh dấu đợc sử dụng thờng là 1
trong 4 loại nucleotit đợc cải biến thành dạng đợc đánh dấu bằng cách gắn với các nhóm chất

phát quang hoặc nguyên tử phóng xạ. Với phơng pháp này, khoảng 25% nucleotit trong phân
tử ADN đợc đánh dấu và điều đó đủ đáp ứng hầu hết các nhu cầu nghiên cứu khác nhau.
Các phân tử ADN đánh dấu với các tiền chất phát quang đợc phát hiện bằng cách chiếu
xạ mẫu ADN với ánh sáng UV có bớc sóng phù hợp và đo ở bớc sóng phát xạ tơng ứng. Các
phân tử ADN đợc đánh dấu phóng xạ thờng đợc phát hiện bằng cách chụp mẫu ADN với phim
tia X, hoặc đo bằng máy khuếch đại tín hiệu hạt từ các nguyên tố phóng xạ
32
P và
35
S (đây là
hai nguyên tố phóng xạ đợc sử dụng phổ biến để dánh dấu ADN).
Trong các nghiên cứu di truyền học phân tử hiện nay, có nhiều cách để xác định các
phân đoạn ADN và ARN đặc hiệu dựa trên các phơng pháp lai. ở đây, chúng ta chỉ đề cập đến
hai phơng pháp đợc dùng phổ biến:
Xác định các phân đoạn ADN và ARN bằng điện di và mẫu dò
Phơng pháp sử dụng mẫu dò kết hợp với điện di là một phơng pháp cơ bản có thể giúp
xác định mức độ phổ biến hoặc kích thớc của một đoạn trình tự ADN hoăc ARN đợc quan tâm
nghiên cứu. Chẳng hạn nh bằng kỹ thuật này, ngời ta có thể xác định và so sánh đợc mức biểu
hiện của một gen ở các loại tế bào và mô khác nhau thông qua định lợng bản phiên mã mARN
tơng ứng của gen đó tại các tế bào và mô tơng ứng; hay nh để xác định kích thớc của một đoạn
ADN cắt giới hạn mang trình tự gen đợc quan tâm nghiên cứu.
Giả sử chúng ta cắt hệ gen của nấm men bằng enzym giới hạn EcoRI và cần xác định đ-
ợc kích thớc của phân đoạn ADN cắt giới hạn mang trình gen A. Sản phẩm ADN tổng số sau
khi đợc cắt bằng EcoRI sẽ tạo ra một số lợng lớn các phân đoạn có kích thớc xấp xỉ 4 kb (vì 4
6
= 4096 bp). Vì vậy, nếu đem sản phẩm cắt giới hạn nhuộm với EtBr, thì sản phẩm điện di sẽ là
một dải các phân đoạn liên tục có kích thớc xấp xỉ 4 kb, và không thể xác định đợc chính xác
phân đoạn nào mang gen A. Trong trờng hợp đó, kỹ thuật thẩm tách Southern (còn gọi là lai
Southern) có thể đợc dùng để xác định phân đoạn mang gen đó. Lúc này, ngời ta sẽ đem sản
phẩm cắt giới hạn ngâm vào một dung dịch có tính kiềm để làm biến tính các phân đoạn ADN

sợi kép. Các phân đoạn này sau đó đợc chuyển sang một màng tích điện dơng gọi là màng
thẩm tách theo hình thức đóng dấu. Nghĩa là các phân đoạn ADN định vị trên màng thẩm
tách sẽ tơng ứng với các phân đoạn định vị trên gel điện di. Các phân đoạn ADN gắn trên
màng thẩm tách sau đó đợc ủ với mẫu dò là phân đoạn ADN chứa một đoạn trình tự đặc trng
bổ trợ với trình tự của gen A. Quá trình ủ đợc tiến hành trong điều kiện về nhiệt độ và nồng độ
muối tơng ứng với sự biến tính và hồi tính của axit nucleic. Trong điều kiện nh đó, các mẫu dò
sẽ chỉ lai đặc hiệu với phân đoạn ADN mang gen A. Do các phân đoạn gen có kích thớc thờng
lớn hơn nhiều so với mẫu dò, nên khả năng hồi tính khó xảy ra hơn khả năng lai với mẫu dò.
Sau đó, nhờ phơng pháp phóng xạ tự chụp (mẫu dò đợc đánh dấu phóng xạ), các phân đoạn
ADN bắt cặp với các mẫu dò có thể đợc xác định và phân lập rõ ràng. Các phân đoạn này
chính là các phân đoạn mang trình tự gen A cần phân tích.
Một phơng pháp tơng tự nh vậy cũng có thể đợc áp dụng trực tiếp để phân tích các sản
phẩm phiên mã của gen là mARN, và đợc gọi là phơng pháp thẩm tách Northern (lai
Northern). Tuy vậy, vì so với ADN các phân tử mARN thờng có kích thớc ngắn hơn (khoảng
15
5 kb), nên trong thẩm tách Northern, các phân tử mARN không cần cắt bằng enzym giới hạn
(nếu có cắt thì số vị trí cắt giới hạn của một enzym trên phân tử mARN thờng thấp). Các phân
tử mARN sau khi phân tách bằng điện di đợc chuyển lên màng tích điện dơng và lai với các
mẫu dò ADN có trình tự bổ trợ tơng ứng thờng đợc đánh dấu phóng xạ (trong trờng hợp này,
sản phẩm lai là do sự kết cặp của các bazơ nitơ thuộc hai mạch ARN và ADN có trình tự bổ
trợ).
Trong thực tiễn nghiên cứu, phơng pháp thẩm tách Northern thờng đợc sử dụng để định
lợng một loại phân tử mARN nhất định nào đó có trong một mẫu phân tích, hơn là để xác định
kích thớc của nó. Lợng mARN đợc xác định đợc xem nh thông số cơ bản phản ánh mức độ
biểu hiện của gen mã hóa tơng ứng. Chẳng hạn nh, bằng phơng pháp thẩm tách Northern, các
nhà nghiên cứu có thể đánh giá đợc ảnh hởng của một tác nhân phiên mã nào đó đến sự biểu
hiện của một gen nhất định khi tiến hành so sánh lợng mARN do gen đó mã hóa có trong các
tế bào đợc xử lý và không đợc xử lý với tác nhân phiên mã. Tơng tự nh vậy, kỹ thuật này cho
phép xác định và so sánh mức độ biểu hiện của các gen khác nhau ở các loại tế bào, mô và cơ
quan khác nhau của cùng một cơ thể trong cùng một giai đoạn hoặc ở các giai đoạn khác nhau

của quá trình phát triển cơ thể.
Trong kỹ thuật thẩm tách Northern, mẫu dò thờng đợc đa vào phản ứng lai với một lợng
d vừa đủ để đảm bảo lợng phân tử lai tạo thành tơng ứng với lợng mARN có mặt trong các
mẫu nghiên cứu. Hay nói cách khác, qua lợng sản phẩm lai, có thể định lợng đợc lợng mARN.
Nguyên lý của các phơng pháp lai Northern và Southern cũng chính là cơ sở của các kỹ
thuật phân tích gen bằng vi dãy phản ứng (microarray) đợc phát triển và ngày các đợc sử
dụng rộng rãi trong các nghiên cứu di truyền học phân tử gần đây. Trong các phơng pháp
microarray, các mẫu dò thờng là các đoạn cADN đợc tạo ra từ việc phiên mã ngợc các phân tử
mARN tơng ứng đợc tách chiết từ các mô hoặc tế bào. Các mẫu dò này sau đó đợc tiến hành
lai với một dãy các phân tử ADN, trong đó mỗi dãy thờng liên quan đến một hoặc một số gen
khác nhau trong cơ thể sinh vật nghiên cứu. Cờng độ biểu hiệu của sản phẩm lai (nhờ sự có
mặt của các phân tử đánh dấu) ở các dãy khác nhau sẽ góp phần phản ánh mức độ biểu hiện
khác nhau của các gen phân tích.
V.1.4. Tách dòng phân tử và xây dựng th viện hệ gen
Khái niệm về tách dòng phân tử và th viện hệ gen
Tách dòng phân tử (molecular cloning) là khái niệm chỉ một nhóm các phơng pháp đợc
sử dụng để: i) phân lập một một trình tự gen (ADN) đặc hiệu từ hỗn hợp các phân tử ADN ban
đầu đợc tách chiết từ các mẫu sinh học vốn có cấu trúc phức tạp, kích thớc lớn; và ii) khuếch
đại (sao chép) trình tự lên một số lợng lớn đủ để có thể tiến hành phân tích về cấu trúc và chức
năng của gen tơng ứng.
Khả năng tinh sạch các đoạn gen (ADN) đặc hiệu có số lợng đủ lớn là cần thiết để có
thể thao tác các đoạn gen đó vì các mục tiêu nghiên cứu khác nhau. Chẳng hạn, từ các phân
đoạn ADN đợc tách dòng, ngời ta có thể tạo ra các phân tử ADN tái tổ hợp mang các phân
đoạn ADN mang nguồn gốc khác nhau. Các phân tử ADN tái tổ hợp mới có thể làm thay đổi
mức độ biểu hiện bình thờng của một gen (chẳng hạn bằng việc dung hợp giữa một trình tự mã
hóa của một loài này với trình tự promoter của một loài khác) hoặc thậm chí mã hóa tổng hợp
một loại protein dung hợp mới (protein lai) mang các trình tự axit amin từ các protein có
nguồn gốc khác nhau. Hiện nay, các kỹ thuật tách dòng phân tử (bao gồm cả PCR) đã trở
thành các công cụ thiết yếu trong nghiên cứu về sự điều hòa và biểu hiện của các gen và hệ
gen ở các loài sinh vật khác nhau.

Quá trình tách dòng ADN và tạo nên các phân tử ADN tái tổ hợp điển hình thờng liên
quan đến việc sử dụng các véctơ là trình tự mang thông tin điều khiển hoạt động nhân lên
(khuếch đại) và/hoặc biểu hiện trong tế bào của phân tử ADN tái tổ hợp mang đoạn ADN cài
(đoạn trình tự đợc phân lập) bao gồm trình tự gen đợc quan tâm nghiên cứu. Các công cụ
chính để tạo nên các phân tử ADN tái tổ hợp là các enzym giới hạn giúp cắt các phân tử ADN
tại các vị trí xác định và các enzym nối cho phép ghép nối các phân đoạn ADN có nguồn gốc
khác nhau với nhau. Bằng việc tạo nên các phân tử ADN tái tổ hợp có thể tự nhận lên trong tế
bào chủ, một đoạn ADN cài xác định nào đó có thể đợc phân lập, tinh sạch và nhân lên thành
một số lợng lớn các bản sao.
Tiếp theo đây, chúng ta sẽ mô tả bằng cách nào các phân tử ADN đợc cắt, tái tổ hợp và
nhân lên, đồng thời đề cập đến việc xây dựng th viện hệ gen gồm tập hợp các phân tử ADN
lai chứa các đoạn cài xuất phát từ một hệ gen cần đợc thiết lập để phục vụ cho việc nghiên
cứu, phân tích một hệ gen. Thông thờng một th viện hệ gen đợc thiết lập bằng việc sử dụng
chung cùng một loại véctơ mang các phân đoạn ADN cài khác nhau. Chúng ta sẽ thấy bằng
cách nào các phân đoạn ADN đặc hiệu có thể đợc xác định và phân lập từ các th viện hệ gen.
Tách dòng ADN trong các véctơ plasmit
Sau khi một phân đoạn ADN đợc cắt khỏi một phân tử ADN có kích thớc lớn hơn bằng
enzym giới hạn, phân đoạn ADN đó cần đợc cài vào một véctơ để có thể nhân lên. Hay nói
cách khác là một phân đoạn ADN cần đợc cài vào một phân tử ADN thứ hai (véctơ) để có thể
nhân lên đợc trong tế bào chủ nh đã nói ở trên. Cho đến nay, tế bào chủ đợc sử dụng rộng rãi
nhất để nhân lên các đoạn ADN trong công nghệ ADN tái tổ hợp là vi khuẩn E. coli.
16
Các véctơ ADN điển hình thờng có 3 đặc tính:
1) Chúng phải chứa một trình tự khởi đầu sao chép (tái bản), cho phép chúng tự sao chép
độc lập với nhiễm sắc thể của tế bào chủ.
2) Chúng phải mang một dấu chuẩn chọn lọc cho phép dễ dàng xác định và phân lập đ-
ợc các tế bào mang véctơ tái tổ hợp (mang đoạn ADN cài) với các tế bào không mang
véctơ tái tổ hợp.
3) Có vị trí cắt của một hoặc nhiều enzym giới hạn khác nhau. Đây chính là vị trí cài
của phân đoạn ADN cần tách dòng vào véctơ.

Véctơ tách dòng phổ biến nhất là các phân tử ADN sợi kép, mạch vòng kích thớc nhỏ
(khoảng 3 kb) đợc gọi là các plasmit. Các véctơ này phần lớn có nguồn gốc từ các loài vi
khuẩn và một số từ các sinh vật nhân chuẩn đơn bào (nấm men). Trong nhiều trờng hợp, các
phân tử ADN này trong tự nhiên đã mang sẵn các gen mã hóa tính kháng chất kháng sinh. Nh
vậy, các plasmid trong tự nhiên đã có sẵn hai thuộc tính là: khả năng tự sao chép trong tế bào
chủ và có trình tự dấu chuẩn chọn lọc. Ngoài ra, các véctơ plasmit còn một u điểm nữa là
chúng có thể đồng thời tồn tại nhiều bản sao trong tế bào. Điều này có thể giúp khuếch đại và
phân lập đợc một số lợng lớn một phân đoạn ADN nào đó từ một quần thể tế bào nhỏ.
Trớc đây, một số véctơ plasmit chỉ có một vị trí cắt của enzym giới hạn duy nhất. Cùng
với thời gian, cấu trúc của các véctơ plasmit đợc cải tiến theo hớng cắt bỏ bớt các trình tự
không cần thiết và gắn thêm vào đoạn trình tự có thể đợc cắt bằng nhiều loại enzym giới hạn
khác nhau. Vị trí trên véctơ mang đoạn trình tự nh vậy đợc gọi là vị trí đa tách dòng
(polycloning site). Có những vị trí đa tách dòng hiện nay có kích thớc ngắn nhng có thể đợc
cắt bởi trên 20 loại enzym giới hạn khác nhau. Nhờ đặc tính này, một véctơ có thể đợc dùng để
tách dòng nhiều phân đoạn ADN có nguồn gốc khác nhau. Trên cơ sở các nguyên tắc tơng tự,
ngoài véctơ plasmit, hiện nay ngời ta đã phát triển đợc nhiều loại véctơ khác nhau có nguồn
gốc phagơ, hoặc lai giữa vi khuẩn - phagơ (nh phagemid, cosmid ), hoặc có nguồn gốc từ
nấm men (ví dụ: YAC).
Việc cài một phân đoạn ADN vào một véctơ thờng là một công việc tơng đối đơn giản.
Ngời ta thờng sử dụng cùng một loại enzym giới hạn để cắt véctơ và đoạn ADN cài. Chẳng
hạn nh việc sử dụng enzym EcoRI sẽ cắt và chuyển véctơ từ dạng vòng sang dạng mạch
thẳng có hai đầu dính. Do đợc cắt bởi cùng enzym giới hạn, nên đoạn ADN cài cũng có hai
đầu dính với trình tự bổ trợ với trình tự đầu dính của véctơ. Các đầu dính này sẽ liên kết véctơ
và đoạn ADN cài lại với nhau hình thành nên một phân tử ADN mạch vòng mới (phân tử ADN
tái tổ hợp) chỉ còn thiếu hai liên kết phosphodieste duy nhất còn lại ở mỗi mạch. Hai liên kết
này sẽ đợc hàn kín nhờ sử dụng enzym ADN ligase trong sự có mặt của ATP. Để hạn chế
khả năng gắn kết lại của hai đầu dính của chính véctơ (vì hai đầu dính này có trình tự bổ trợ)
sau khi đợc cắt bởi enzym giới hạn, ngời ta thờng cho lợng ADN cài d thừa so với véctơ để
phần lớn các véctơ sau khi gắn lại là các véctơ tái tổ hợp mang các đoạn ADN cài.
Một số loại véctơ không những cho phép phân lập và tinh sạch đợc một phân đoạn gen

nào đó, mà còn có thể điều hòa sự biểu hiện của gen nằm trong phân đoạn ADN cài. Những
véctơ nh vậy đợc gọi là các véctơ biểu hiện. Các véctơ này thờng phải chứa trình tự promoter
nằm ngợc dòng sát với vị trí cài gen. Nếu vùng mã hóa của gen (không chứa promoter) đợc
gắn vào véctơ theo đúng chiều khung đọc của gen, thì gen cài sẽ đợc phiên mã thành mARN
và dịch mã thành protein trong tế bào chủ. Các véctơ biểu hiện thờng đợc sử dụng để biểu hiện
các gen đột biến hoặc các gen lai để tiến hành phân tích chức năng của chúng. Chúng cũng có
thể đợc dùng để sản xuất một lợng lớn một loại protein nào đó vốn không thu đợc hiệu suất t-
ơng tự bằng các con đờng tự nhiên. Ngoài ra, các promoter trong các véctơ biểu hiện có thể đ-
ợc lựa chọn sao cho sự biểu hiện của gen cài có thể đợc điều hòa bằng việc bổ sung một hợp
chất đơn giản vào môi trờng nuôi cấy (nh một loại đờng hoặc axit amin chẳng hạn). Việc có
thể điều khiển chủ động sự biểu hiện của một gen nào đó có ý nghĩa quan trọng, đặc biệt đối
với các gen gây độc.
Biến nạp các véctơ ADN vào tế bào chủ
Biến nạp là quá trình ở đó một cơ thể chủ có thể tiếp nhận một phân tử ADN ngoại lai từ
môi trờng bên ngoài. Một số vi khuẩn (trong đó không có E. coli) có khả năng biến nạp tự
nhiên đợc gọi là các vi khuẩn khả biến di truyền. Vi khuẩn E. coli có thể trở nên khả biến
khi đợc xử lý với ion Ca
2+
. Mặc dù cơ chế khả biến cha đợc biết đầy đủ, nhng dờng nh ion Ca
2+
bao bọc lại các điện tích âm trên phân tử ADN và tăng cờng khả năng của chúng xuyên qua
màng tế bào. Các tế bào đợc xử lý với Ca
2+
vì vậy đợc gọi là các tế bào khả biến. Ngời ta có thể
sử dụng một chất kháng sinh mà véctơ plasmid mang gen dấu chuẩn mã hóa tính kháng chất
kháng sinh đó để chọn lọc đợc các thể mang plasmid tái tổ hợp. Các tế bào mang véctơ tái tổ
hợp có thể sinh trởng trong môi trờng chứa chất kháng sinh, trong khi các tế bào khác thì
không.
Thông thờng quá trình biến nạp có hiệu suất không cao. Chỉ có một tỉ lệ nhỏ các tế bào
đợc xử lý biến nạp có thể tiếp nhận đợc plasmid tái tổ hợp. Nhng, chính hiệu quả biến nạp thấp

giúp hầu hết các tế bào mang véctơ tái tổ hợp thờng chỉ tiếp nhận một plasmid duy nhất.
Thuộc tính này giúp cho các tế bào biến nạp và dòng tế bào do chúng sinh ra (do phân chia
trực phân) chỉ mang một véctơ ADN tái tổ hợp duy nhất và cho phép các nhà nghiên cứu thể
17
phân lập và tinh sạch đợc các gen hoặc hoặc sản phẩm của các gen riêng rẽ từ hỗn hợp biến
nạp mang cả các phân tử ADN khác.
Thiết lập th viện hệ gen
Đối với các hệ gen đơn giản, kỹ thuật tách dòng thờng khá đơn giản. Chẳng hạn nh với
hệ gen một số virut có kích thớc khoảng 10 kb, ngời ta có thể trực tiếp tách chiết ADN, cắt
chúng bằng enzym giới hạn rồi tiến hành phân tích điện di. Các phân đoạn ADN tách biệt trên
gel điện di đợc cắt khỏi gel, tinh sạch rồi cài vào các véctơ.
Trong khi đó, đối với các hệ gen phức tạp, kích thớc lớn (nh hệ gen ngời), việc cắt ADN
tổng số bằng enzym giới hạn rồi phân tích điện di thờng dẫn đến sự hình thành một dải băng
điện di liên tục do có sự phân bố liên tục của các phân đoạn ADN đợc cắt giới hạn chỉ khác
nhau một hoặc một vài nucleotit. Vì vậy, để đơn giản hóa quy trình tách dòng ở những hệ gen
này, ngời ta thờng tiến hành biến nạp toàn bộ các phân đoạn ADN (thu đợc sau khi cắt bằng
enzym giới hạn) vào véctơ tách dòng rồi
biến nạp tất cả chúng vào tế bào chủ, sau
đó mới phân lập các dòng tế bào mang
véctơ tái tổ hợp có các đoạn cài ADN khác
nhau. Tập hợp các dòng tế bào nh vậy đợc
gọi là th viện hệ gen. Nh vậy, th viện hệ
gen là tập hợp các dòng tế bào mang các
véctơ tái tổ hợp chứa các đoạn ADN cài
khác nhau có cùng nguồn gốc (cùng hệ
gen).
Để thiết lập một th viện gen, hệ gen
của tế bào đích (chẳng hạn ADN hệ gen
ngời) đợc cắt bằng enzym giới hạn để tạo
ra các phân đoạn ADN có kích thớc trung

bình mong muốn. Kích thớc các phân
đoạn (đoạn cài) có thể dao động từ 100 bp
đến trên 1 Mb (đối với các phân đoạn
ADN kích thớc rất lớn, phân tử ADN th-
ờng đợc cắt không hoàn toàn bằng một
enzym giới hạn). Các phân đoạn ADN cắt
giới hạn sau đó đợc trộn với một loại
véctơ phù hợp (trớc đó đợc cắt bởi cùng
loại enzym giới hạn) và ADN ligase. Kết
quả của bớc này sẽ tạo ra một tập hợp các
véctơ mang các đoạn ADN cài khác nhau.
Ngời ta có thể tạo ra nhiều th viện
gen khác nhau bắt nguồn từ các nguồn vật
liệu khác nhau. Th viện hệ gen đơn giản
nhất bắt nguồn từ ADN hệ gen tổng số đợc
cắt bằng một enzym giới hạn duy nhất, gọi
là th viện hệ gen. Loại th viện này có ý
nghĩa ứng dụng rõ rệt nhất nhằm giải mã
trình tự các hệ gen. Ngợc lại, đối với mục
đích tìm và phân lập ra một phân đoạn
mang gen mong muốn, thì th viện hệ gen
chỉ tỏ ra hiệu quả đối với hệ gen chỉ chứa
một phần tơng đối nhỏ các vùng không mã
hóa. Đối với các hệ gen phức tạp hơn, th
viện hệ gen không phù hợp cho việc tìm ra
phân đoạn mang gen mong muốn bởi vì
phần lớn các dòng trong th viện mang các
đoạn cài thuộc các vùng không mã hóa.
Để có đợc th viện gen mang hầu hết
các đoạn cài là các vùng mã hóa, ngời ta

sử dụng th viện cADN. Các bớc thiết lập
th viện cADN đợc minh họa trên hình 10.
Theo đó, trong bớc đầu tiên thay vì bắt
đầu từ ADN, ngời ta phiên mã ngợc trình
tự mARN thành trình tự ADN phiên bản
(cADN). Quá trình này đợc gọi là quá
trình phiên mã ngợc và đợc thực hiện nhờ
một enzym ADN polymerase đặc biệt là
reverse transcriptase. Enzym này có khả năng tổng hợp ADN bắt nguồn từ phân tử ARN mạch
đơn làm khuôn ban đầu. Khi có mặt enzym reverse transcriptase, các trình tự mARN đợc
18
Oligo dT
Reverse transcriptase
dNTP
Loại ARN
Mồi ngẫu nhiên
ADN polymerase
dNTP
Nối vào plasmit nhờ enzym
giới hạn và ADN ligase
Th viện cADN
mARN
ARN
ADN
ADN
ADN
Hình 10. Các b ớc xây dựng th viện cADN
phiên mã ngợc thành các phân tử ADN sợi kép, và những phân tử này có thể đợc gắn vào các
véctơ.
Để có thể phân lập đợc các đoạn cài riêng rẽ từ th viện hệ gen, các tế bào E. coli đợc tiến

hành biến nạp với tất cả các phân đoạn trong th viện. Mỗi một tế bào biến nạp thờng chỉ mang
duy nhất một véctơ mang đoạn cài ADN. Vì vậy, khi các tế bào nhân lên sau đó chúng sẽ sẽ
tạo ra nhiều dòng tế bào, mỗi dòng chứa nhiều bản sao của một phân đoạn trong th viện
cADN. Khuẩn lạc đợc tạo ra từ các tế bào mang các trình tự ADN mong muốn có thể đợc phân
lập và từ đó thu lại ADN. Có một số cách để xác định các dòng tế bào đã mang gen biến nạp.
Chẳng hạn phơng pháp đợc nêu dới đây sử dụng các mẫu dò ARN và/hoặc ADN để xác định
các quần thể tế bào mang một đoạn ADN nhất định nào đó.
Sử dụng lai mẫu dò để xác định các dòng tế bào trong th viện gen
Trong phơng pháp sử dụng mẫu dò, ngời ta sử dụng các đoạn trình tự ADN/ARN có
trình tự bổ trợ đợc đánh dấu và lai với các dòng tế bào mang các đoạn gen cài khác nhau trong
th viện hệ gen. Kỹ thuật này đợc gọi là phơng pháp lai khuẩn lạc. Một th viện hệ gen điển
hình thờng chứa hàng ngàn đoạn cài khác nhau đợc mang bởi cùng một loại véctơ tách dòng.
Sau khi véctơ đợc biến nạp vào một chủng vi khuẩn phù hợp, các tế bào vi khuẩn đợc cấy trên
bề mặt đĩa petri chứa môi trờng bắn rắn chứa agar. Mỗi tế bào sau đó sẽ phát triển lên thành
một khuẩn lạc riêng rẽ, và các tế bào trong cùng một khuẩn lạc đều mang cùng loại véctơ và
đoạn gen cài giống nhau.
Trong kỹ thuật lai khuẩn lạc, ngời ta cũng có thể sử dụng loại màng lai đợc dùng trong
các phơng pháp thẩm tách Southern và Northern để thu hồi đợc một lợng vết ADN đủ cho sự
kết cặp với mẫu dò. ở đây, ngời ta sẽ dùng màng lai ép lên bề mặt đĩa nuôi cấy chứa khuẩn lạc
và in hình chúng lên màng lai (cùng với ADN của chúng) sao cho vị trí của các dòng tế bào
trên màng lai tơng ứng với các vị trí khuẩn lạc của chúng trên đĩa petri (theo nguyên tắc đóng
dấu). Điều này đảm bảo cho việc khi chúng ta xác định đợc một vị trí trên màng lai có kết
quả dơng tính và việc bắt cặp với mẫu dò thì chúng ta sẽ xác định đợc tơng ứng khuẩn lạc
mang dòng tế bào chứa véctơ tái tổ hợp mang đoạn gen cài mong muốn.
Màng lai đợc đem lai với mẫu dò nh sau: ngời ta tiến hành xử lý màng lai sao cho màng
tế bào vỡ ra và các phân tử ADN thoát ra ngoài gắn lên màng lai tại chính vị trí tế bào của
chúng. Các màng lai sau đó đợc ủ với các mẫu dò đợc đánh dấu từ trớc trong các điều kiện
giống nh khi tiến hành các kỹ thuật thẩm tách Northern hay Southern.
Trong công nghệ ADN tái tổ hợp, ngoài các véctơ plasmit có nguồn gốc vi khuẩn, ngời
ta còn có thể sử dụng véctơ có nguồn gốc virut (bacteriophage), hoặc từ các sinh vật bậc cao

hơn nh nhiễm sắc thể nhân tạo nấm men (YAC), hay nhiễm sắc thể nhân tạo có nguồn gốc vi
khuẩn (BAC), hoặc một số véctơ lai giữa chúng (vd: cosmid, ). Trong các véctơ có nguồn
gốc bacteriophage, phage đợc sử dụng phổ biến. ADN của virut này đợc cải biến và sử dụng
nh véctơ tách dòng. Véctơ này đợc sử dụng để tách dòng các th viện hệ gen về nguyên tắc
giống hệt nh khi sử dụng các véctơ plasmit. Chỉ có một điểm khác lai khi tiến hành lai để xác
định các dòng gen biến nạp thì vị trí các mẫu dò đợc xác định trên màng lai tơng ứng với vị trí
các vết tan thay cho vị trí các khuẩn lạc nh khi sử dụng véctơ tách dòng plasmit.
V.1.5. Tổng hợp hóa học và sử dụng các đoạn oligonucleotit
Các đoạn ADN có trình tự xác định kích thớc ngắn đợc sử dụng nhiều trong các nghiên
cứu khác nhau của di truyền học phân tử, chẳng hạn nh sử dụng làm mồi trong các phản ứng
PCR, hay dùng làm mẫu dò trong các phơng pháp lai phân tử. Các đoạn trình tự này thờng đợc
tổng hợp theo phơng pháp hóa học và đợc gọi là các đoạn oligonucleotit. Phơng pháp hóa học
đợc sử dụng phổ biến nhất đợc tiến hành trên bề mặt cứng sử dụng máy tự động. Tiền chất để
tạo nên các nucleotit lần lợt gắn với đoạn oligonucleotit theo trật tự nhất định đợc gọi là các
hợp chất phosphoamidine (xem minh họa hình 11). Phản ứng kéo dài chuỗi oligonucleotit
diễn ra bằng việc gắn thêm tiền chất nucleotit mới vào phía đầu 5, nh vậy ngợc chiều với
phản ứng kéo dài chuỗi ADN sử dụng enzym ADN polymerase.
Phơng pháp tổng hợp hóa học có hiệu quả và
độ chính xác cao khi tiến hành tổng hợp các phân tử
ADN mạch đơn có độ dài tới 30 nucleotit. Với các
thiết bị tổng hợp oligonucleotit hiện nay, một ngời
nghiên cứu có thể dễ dàng tổng hợp bất cứ một
trình tự ADN ngắn nào đơn giản bằng cách gõ và
nhập trình tự nucleotit mong muốn vào phần mềm
máy tính điều khiển máy tổng hợp tự động. Tuy
vậy, khi phân tử ADN đợc tổng hợp có kích thớc lớn
thì độ chính xác của trình tự và độ đồng đều của sản
phẩm tạo thành giảm đi do các lỗi cố hữu mang tính
kỹ thuật. Thực tế, các phân tử ADN có trình tự dài
hơn 100 nucleotit khó có thể đợc tổng hợp bằng các

phơng pháp hóa học mà đảm bảo đợc số lợng và
chất lợng mong muốn.
19
Hình 11. Phosphoramidite gắn thêm
H
+
. Đầu 5-OH bị khóa bởi DMT
Nhóm 5-OH bị khóa bởi
dimethoxytrityl (DMT)
Các đoạn oligonucleotit kích thớc ngắn ngoài các ứng dụng làm mồi phản ứng PCR hay
làm mẫu dò nh đợc nêu ở trên, còn có thể đợc sử dụng cho nhiều mục đích khác trong nghiên
cứu di truyền học phân tử. Chẳng hạn nh các đoạn oligonucleotit kết cặp sai với một đoạn
ADN đợc tách dòng có thể đợc dùng để tạo ra một đột biến định vị trí. Phơng pháp này, gọi là
phơng pháp gây đột biến định vị trí, đợc thực hiện nh sau: một trình tự nucleotit nhất định
đợc tiến hành lai với một phân đoạn ADN, ở đây đoạn oligonucleotit đợc sử dụng làm mồi còn
phân đoạn ADN đích đợc dùng làm khuôn. Trong đoạn ADN sợi kép hình thành sẽ có một vị
trí kết cặp sai, và theo nguyên tắc PCR, các phân đoạn ADN đợc tạo ra trong các phản ứng về
sau đều mang đột biến tại vị trí kết cặp sai.
Các đoạn oligonucleotit cũng có thể đợc sử dụng theo cách tơng tự nh vậy để tạo nên
một điểm cắt giới hạn mới trong một phân tử ADN, để rồi sau đó điểm cắt giới hạn này đợc sử
dụng để cài đoạn ADN đích vào giữa một trình tự mã hóa và một trình tự không mã hóa, hoặc
sau một trình tự promoter hay vị trí gắn của ribosom, v.v
Nh vậy, rõ ràng trong các nghiên cứu di truyền học phân tử, việc các đoạn oligonucleotit
có thể đợc tổng hợp theo một trình tự bất kỳ có nhiều ý nghĩa ứng dụng quan trọng trong việc
xác định và khuếch đại các đoạn ADN đặc hiệu, để giải mã trình tự ADN, cũng nh trong các
nghiên cứu tạo đột biến điểm xác định vị trí, hay sử dụng cho công nghệ ADN tái tổ hợp.
V.1.6. Phản ứng PCR
Ngoài các kỹ thuật tách dòng và khuếch đại gen sử dụng các loại tế bào chủ, một phơng
pháp khuếch đại gen có hiệu quả cao giờ đây đã trở thành một kỹ thuật phổ biến trong hầu hết
các nghiên cứu di truyền học phân tử là kỹ thuật phản ứng chuỗi trùng hợp PCR

(polymerase chain reaction). Đây là một kỹ thuật hóa sinh invitro thuần túy. Kỹ thuật PCR sử
dụng enzym ADN polymerase để tổng hợp nên các phân tử ADN mới từ trình tự của phân tử
ADN làm khuôn với tiền chất là các deoxyribonucleotit. Nh đã nêu ở Chơng 2, các enzym
ADN polymerase tổng hợp ADN theo chiều 5 3 và có thể xúc tác gắn nucleotit tiếp theo
vào phía đầu 3 của một trình tự oligonucleotit có sẵn. Nghĩa là, nếu ta có một đoạn trình tự
oligonucleotit đã gắn vào một mạch ADN làm khuôn có trình tự bổ sung với trình tự của đoạn
oligonucleotit, thì enzym ADN polymerase có thể sử dụng đoạn oligonucleotit đó làm đoạn
mồi và tiếp tục kéo dài chuỗi ADN về phía đầu 3 dựa trên trình tự của mạch ADN làm khuôn.
Vậy, bằng cách nào ngời ta có thể sử dụng phản ứng PCR và enzym ADN polymerase để
khuếch đại một đoạn trình tự ADN đặc hiệu? Ngời ta sẽ tổng hợp và sử dụng hai đoạn
oligonuleotit. Đoạn thứ nhất có trình tự bổ sung với đầu 5 của một mạch phân đoạn ADN cần
khuếch đại (đoạn này gọi là mồi xuôi), còn đoạn trình tự thứ hai bổ sung với đầu 5 của mạch
đối diện (mồi ngợc). Phân tử ADN làm khuôn sẽ đợc làm biến tính (bởi nhiệt) và các mồi xuôi
và môi ngợc sẽ gắn vào trình tự bổ sung ở hai đầu đoạn ADN cần khuếch đại. Với sự có mặt
của các cơ chất là các deoxyribonucleotit, enzym ADN polymerase sẽ tổng hợp và kéo dài một
mạch phân tử ADN bắt đầu từ hai đoạn mồi.
Trong chu kỳ tiếp theo, phân tử ADN lại đợc gây biến tính và quá trình tổng hợp ADN
đợc lặp lại với cùng cặp mồi. Kết quả của chu kỳ thứ hai tạo ra 4 bản sao của phân đoạn gen
mong muốn. Theo cơ chế đó, chu kỳ biến tính và tổng hợp ADN diễn ra lặp đi lặp lại sẽ làm
khuếch đại phân đoạn ADN nằm giữa 2 trình tự mồi theo cấp số nhân (số bản sao tơng ứng
qua các chu kỳ sẽ lần lợt là 2, 4, 8, 16, 32, 64, v.v). Nh vậy, chỉ cần từ một bản sao ADN duy
nhất có mặt trong một lợng mẫu nhỏ, chúng ta có thể thu đợc một lợng lớn bản sao xuất phát
từ bản sao đầu tiên.
Xét về một khía cạnh nào đó, kỹ thuật tách dòng ADN và PCR đều đợc dùng để khuếch
đại một phân đoạn ADN đặc thù lên một số lợng lớn. Nhng điểm khác biệt là ở chỗ, trong kỹ
thuật tách dòng, chúng ta thờng sử dụng một hóa chất chọn lọc hay một thiết bị nào đó để
định vị đợc trình tự ADN đã đợc khuếch đại trong một th viện ADN đã có sẵn gồm nhiều dòng
tế bào khác nhau, trong khi ở kỹ thuật PCR, hóa chất chọn lọc chính là cặp mồi sẽ giúp hạn
chế phản ứng khuếch đại chỉ tập trung vào đoạn ADN đợc quan tâm ngay từ đầu.
V.1.7. Giải mã trình tự ADN

Trong phần này chúng ta sẽ xem xét bằng cách nào có thể xác định đợc trình tự nucleotit
của các phân đoạn hoặc toàn bộ phân tử ADN mong muốn. Về một khía cạnh nào đó, có thể
coi giải mã trình tự các nucleotit là việc đánh dấu mẫu dò triệt để nhất của một hệ gen với tính
chọn lọc cao. Chúng ta sẽ xác định toàn bộ trình tự hệ gen của các cơ thể sinh vật có mức độ
cấu tạo phức tạp khác nhau từ vi khuẩn cho đến loài ngời, và điều này cho phép chúng ta tìm
thấy mọi trình tự đặc hiệu một cách nhanh và chính xác thông qua việc sử dụng các phần mềm
máy tính với các thuật toán phù hợp. Hay nói cách khác, các chất chọn lọc của chúng ta ở
đây là các chuỗi bazơ nitơ đợc chúng ta nhập vào phần mềm máy tính. Do cơ sở dữ liệu về các
hệ gen ngày càng trở nên phong phú, nên ngày càng trở nên dễ dàng hơn để có thể tìm thấy
các bản sao của trình tự các hệ gen hoặc của các trình tự có liên quan trong cùng một loài hoặc
của các loài khác. Rõ ràng, việc giải mã trình tự các nucleotit đã tạo ra một cơ sở dữ liệu
khổng lồ phục vụ cho các nghiên cứu giải mã trình tự và so sánh giữa các hệ gen đợc đề cập d-
ới đây.
Nguyên tắc giải mã trình tự ADN về cơ bản dựa trên việc phân tách các phân đoạn ADN
có kích thớc khác nhau đợc giới hạn bởi hai đầu. Các phân tử ADN đều giống nhau ở phần đầu
20
5, nhng kết thúc ở phía đầu 3 có các nucleotit khác nhau. Các thành viên của một nhóm sẽ có
nucleotit ở phía đầu 3 giống nhau. Nh vậy, trong một nhóm sẽ bao gồm tất cả các phân tử
ADN tận cùng đầu 3 bằng G, nhóm khác tơng ứng là A, C và T. Trong mỗi nhóm các phân tử
sẽ có kích thớc khác nhau phụ thuộc vào vị trí của nucleotit tơng ứng (ví dụ nh G) nằm trên
phân tử ADN. Các phân đoạn khác biệt về chiều dài nh vậy có thể phân tách đợc nhờ sử dụng
kỹ thuật điện di trên gel polyacrylamid. Chẳng hạn khi chạy hỗn hợp các phân tử ADN tận
cùng đầu G ta sẽ thu đợc thang các băng điện di tơng ứng với các phân đoạn, trong đó mỗi
băng tơng ứng với một phân đoạn có chiều dài phản ánh vị trí của nucleotit G trên phân tử
ADN.
Giải mã trình tự hệ gen vi khuẩn bằng kỹ thuật shotgun ( giải mã từng đoạn ngẫu nhiên )
Vi khuẩn gây bệnh kiết lị ở ngời Hemophilus influenza là loài sinh vật đầu tiên đợc giải
mã toàn bộ hệ gen. Sở dĩ hệ gen của loài này đợc hoàn thành việc giải mã đầu tiên là nhờ hệ
gen của nó nhỏ, chỉ chứa một phân tử ADN duy nhất kích thớc 1,8 Mb. Hệ gen của vi khuẩn
này đợc cắt thành các phân đoạn nhỏ có kích thớc trung bình khoảng 1 kb. Các đoạn ADN

hệ gen này sau đó đợc tách dòng bằng các véctơ ADN plasmit tái tổ hợp. ADN từ các dòng vi
khuẩn chứa các phân đoạn ADN tái tổ hợp riêng rẽ rồi đợc giải mã trình tự riêng rẽ trên các
máy giải mã trình tự tự động sử dụng phơng pháp ddNTP nh mô tả ở phần trên. Phơng pháp
này đợc gọi là phơng pháp giải mã trình tự kiểu shotgun (bắn ngẫu nhiên). Các khuẩn lạc
mang các véctơ tơ tái tổ hợp mang đoạn ADN cài ngẫu nhiên đợc phân lập, xử lý và giải mã
trình tự. Để chắc chắn rằng mọi nucleotit trong hệ gen vi khuẩn đều có mặt trong các dòng vi
khuẩn của th viện hệ gen, tổng cộng có khoảng 30.000 - 40.000 dòng tái tổ hợp khác nhau đợc
sử dụng và giải mã trình tự. Từ đó, tạo ra khoảng 20 Mb dữ liệu thô về hệ gen (các phản ứng
tạo ra trình tự có kích thớc trung bình 600 bp, và 20 Mb = 600 bp x 33.000 dòng vi khuẩn). Dữ
liệu này đợc gọi là vùng trình tự 10x. Bởi vì, mỗi nucleotit trong hệ gen đợc đọc lặp lại
khoảng 10 lần.
Phơng pháp này dờng nh là tốn nhiều công sức, nhng chi phí rẻ hơn và nhanh hơn so với
các phơng pháp truyền thống khác. Một phơng pháp giải mã trình tự trớc đây dựa trên nguyên
tắc giải mã từng phân đoạn ADN cắt giới hạn trên bản đồ vật lý của nhiễm sắc thể vi khuẩn.
Một hạn chế của kỹ thuật này là hầu hết các phân đoạn cắt giới hạn có kích thớc lớn hơn kích
thớc có thể giải mã trình tự hoàn toàn trong mỗi phản ứng đợc thực hiện. Do vậy, để giải mã
toàn bộ hệ gen, ngời ta phải tiến hành cắt giới hạn, lập bản đồ và giải mã trình tự nhiều lần.
Các bớc này nếu lặp đi lặp lại nhiều lần sẽ tồn nhiều thời gian hơn khi sử dụng phơng pháp
giải mã trình tự tự động của các phân đoạn ADN ngẫu nhiên. Hay nói cách khác, nhờ sử dụng
phần mềm máy tính việc sắp xếp lại các phân đoạn ADN ngẫu nhiên vẫn nhanh hơn nhiều việc
lập bản đồ các phân đoạn cắt giới hạn trên NST vi khuẩn.
Khoảng 30.000 đoạn trình tự ADN đợc giải mã trình tự ngẫu nhiên đợc trực tiếp nhập
vào phần mềm máy tính. Nhiều phần mềm máy tính chuyên dụng hiện nay có thể xếp các
đoạn trình tự theo đúng thứ tự dựa trên các trình tự gối lên nhau của chúng. Sự lắp ráp thành
trình tự của các phân đoạn ADN ngắn cuối cùng sẽ có một trình tự liên tục duy nhất, còn đợc
gọi là một contig.
Kỹ thuật giải mã trình tự kiểu shotgun cho phép ráp nối từng phần của hệ gen lớn
Nh đã trình bày ở trên việc giải mã các đoạn trình tự ADN kích thớc khoảng 600 bp hiện
nay có thể thực hiện một cách tơng đối đơn giản và nhanh chóng. ở đây, chúng ta sẽ xem bằng
cách nào kỹ thuật shortgun đợc áp dụng để giải mã trình tự các hệ gen lớn.

Chẳng hạn, nhiễm sắc thể ngời có kích thớc trung bình khoảng 150Mb. Do vậy, mỗi
đoạn trình tự ~600 bp đợc giải mã chỉ chiếm 0,0004% của mỗi NST. Kết quả là để có thể xác
định đợc trình tự đầy đủ của một NST, ngời ta cần tạo ra một số lợng lớn các dữ liệu trình tự từ
nhiều phân đoạn ADN ngắn (hình 12). Các phân đoạn ADN nhỏ đợc tạo ra từ 23 NST của hệ
gen ngời, rồi sau đó đợc cắt ngắn thành một th viện các đoạn ADN nhỏ bằng một kỹ thuật
kim áp lực. Thông thờng, có 2 hoặc 3 th viện hệ gen chứa các đoạn trình tự có kích thớc
khác nhau (tăng dần) đợc tạo ra, chẳng hạn tơng ứng với các đoạn trình tự có kích thớc 1, 5 và
100 kb. Các phân đoạn này sau đó đợc tách dòng ngẫu nhiên vào các plasmit của vi khuẩn
theo phơng pháp đợc mô tả ở trên.
Các phân tử ADN tái tổ hợp mang các phân đoạn ngẫu nhiên của NST ngời sau đó đợc
phân lập từ các plasmit vi khuẩn rồi giải mã bằng máy giải mã trình tự tự động. Để đảm bảo
mọi nucleotit trong hệ gen đều đợc giải mã, ngời ta phải tiến hành giải mã riêng rẽ khoảng 2
triệu phân đoạn ADN khác nhau. Với kích thớc của mỗi phân đoạn có thể giải mã chính xác
khoảng 600 bp, quy trình này tạo ra dữ liệu khoảng 1 tỉ bp, hay nói các khác là gấp ~10 lần
kích thớc trung bình của một NST. Nh đã trình bày ở trên với kỹ thuật giải mã trình tự ở vi
khuẩn, việc phân tích các mẫu với lợng trình tự gấp khoảng 10 lần lợng ADN thực cần giải mã
trình tự sẽ đảm bảo mọi phần của NST đều đợc phân tích.
Quá trình tạo ra các th viện tái tổ hợp mang các trình tự ngẫu nhiên và một lợng lớn
ADN cần phải giải mã trình tự ngẫu nhiên dờng nh là một việc làm rất lãng phí. Tuy vậy, với
việc sử dụng hệ thống một trăm máy giải mã trình tự tự động gồm 384 cột sẽ cho phép phân
tích 10 lần một nhiễm sắc thể ngời chi tiết trong vòng 3 tuần. Phơng pháp này vì vậy vẫn
nhanh hơn nhiều phơng pháp phân lập từng phần đã biết trong NST, rồi sau đó giải mã trình tự
21
một tập hợp đã biết của các đoạn ADN đợc đặt so le. Vì vậy, bản chất của công nghệ cốt lõi đ-
ợc sử dụng để thúc đẩy việc giải mã hệ gen ngời dựa trên kĩ thuật giải mã trình tự ngẫu
nhiên tự động, rồi sau đó sử dụng phần mềm máy tính để sắp xếp lại các đoạn ADN khác
nhau giống nh trò chơi ghép hình vậy. Việc kết hợp sử dụng máy giải mã trình tự tự động
với phần mềm máy tính đã giúp dự án giải mã toàn bộ hệ gen ngời kết thúc sớm hơn nhiều
năm so với kế hoạch ban đầu.
Các chơng trình máy tính phức tạp đợc sử dụng để tập hợp các đoạn ADN ngắn đợc giải

mã trình tự ngẫu nhiên thành những đoạn trình tự dài kích thớc lớn kế tiếp nhau đợc gọi là
những contig. Các đoạn trình tự nằm gối lên nhau sẽ đợc phần mềm xử lý rồi nối lại với nhau
thành các trình tự lớn hơn. Kích thớc của các đoạn contig phụ thuộc vào lợng trình tự đã đợc
giải mã. Nếu lợng trình tự giải mã càng nhiều, thì các đoạn contig càng có kích thớc lớn và
khoảng cách trống cha đợc giải mã càng nhỏ.
Thông thờng các đoạn contig riêng rẽ thờng có kích thớc 50.000 - 200.000 bp. Nghĩa là
ngắn hơn nhiều so với kích thớc NST ở ngời. Tuy vậy, các đoạn contig rất hiệu quả khi phân
tích các hệ gen nhỏ. Chẳng hạn, hệ gen của ruồi dấm (Drosophila) trung bình có mật độ 1 gen
/ 10 kb. Vì vậy, một contig điển hình thờng chứa vài gen liên kết với nhau. Rất tiếc là các hệ
gen lớn lại thờng chứa mật độ gen thấp. Hệ gen ngời có mật độ trung bình là 1 gen / 100 kb, vì
vậy một contig điển hình thờng không chứa đợc trình tự trọn vẹn của một gen, chứ cha nói đến
là một dãy gen liên kết. Bây giờ, chúng ta sẽ nói đến bằng cách nào các đoạn contig tơng đối
ngắn có thể đợc lắp ráp lại thành các đoạn khung có kích thớc 1-2Mb.
Phơng pháp giải mã trình tự đầu cuối cho phép lắp ráp các contig thành các đoạn
khung ở các hệ gen kích thớc lớn
Một khó khăn lớn gặp phải khi thiết lập các đoạn contig là sự xuất hiện của các đoạn
ADN lặp lại. Các đoạn trình tự này làm việc ráp nối trở nên khó khăn và phức tạp do các đoạn
ADN không liên kết (từ các NST khác nhau) nhng có thể bị xếp thành các đoạn trình tự nằm
gối lên nhau do chúng có cùng trình tự lặp lại. Một phơng pháp đợc sử dụng để khắc phục trở
ngại này là kĩ thuật giải mã phần nối trình tự đầu cuối. Kỹ thuật này tơng đối đơn giản nhng
hiệu quả mà nó mang lại cao.
Ngoài việc ADN hệ gen đợc dùng để tạo nên một th viện các đoạn ADN ngắn nhằm giải
mã trình tự ngẫu nhiên, thì chính ADN hệ gen đó đồng thời đợc dùng để tạo nên các đoạn
ADN tái tổ hợp mang các đoạn có kích thớc lớn, thờng có kích thớc 3 - 100 kb. Giả sử chúng
ta có một mẫu ADN từ một NST ngời. Một phần của mẫu này đợc dùng để tạo nên các phân
đoạn có kích thớc 1 kb, trong khi một phần khác đợc dùng để tạo nên các phân đoạn có kích
thớc 5 kb. Kết quả của quá trình đó là ngời ta thu đợc 2 th viện hệ gen khác nhau, một mang
các đoạn cài kích thớc ngắn, còn th viện kia là các đoạn cài kích thớc lớn (hình 12).
Tiếp theo, ngời ta sử dụng các đoạn mồi đa năng (có tính chọn lọc thấp) có thể gắn
vào phần đoạn nối giữa plasmit và hai vùng biên của đoạn ADN cài kích thớc lớn. Mỗi một

phản ứng giải mã trình tự cho phép tạo ra thông tin về trình tự của một đoạn kích thớc khoảng
600 bp ở hai đầu của một đoạn cài bất kỳ. Một bản ghi nhớ sẽ ghi chép lại các trình tự ở hai
đầu của cùng một phân đoạn kích thớc lớn. Việc dùng phần mềm sau đó cho thấy một trình tự
đợc tìm thấy ở contig A, còn trình tự kia đợc tìm thấy ở contig B. Nếu contig A và B cùng có
các trình tự có mặt trong một phân đoạn kích thớc khoảng 5 kb thì có thể giả thiết chúng cùng
xuất xứ từ một vùng của một NST. Trong khi đó hầu hết các phân đoạn ADN lặp lại thờng có
kích thớc nhỏ hơn 2-3 kb. Vì vậy, các đoạn trình tự ADN đầu cuối xuất xứ từ các đoạn cài
~5kb là đủ để nối các contig bị ngắt quãng bởi các đoạn ADN có trình tự lặp lại.
22
Hệ gen ng ời
Th viện plasmid
1kb
Th viện plasmid
5kb
Th viện BAC
100kb
Các trình tự bao
phủ 6 lần hệ gen
Các trình tự bao
phủ 3 lần hệ gen
Các trình tự bao
phủ 1 lần hệ gen
15x10
6
dòng plasmid
7,5x10
6
dòng plasmid
2,5x10
6

dòng BAC
Ráp nối thành trình
tự liên tục của NST
Hình 12. Chiến l ợc xây dựng và giải mã toàn bộ trình tự Hệ gen ng ời. Các trình tự Contig đ ợc xây
dựng thành th viện và giải mã bằng ph ơng pháp shotgun (giải mã từng đoạn ngẫu nhiên) với sự kết
hợp so sánh các trình tự cài có kích th ớc khác nhau giao động từ 1 kb đến 100 kb.
Các nghiên cứu ban đầu thờng chỉ tạo ra các đoạn contig có kích thớc nhỏ hơn 500 kb. Để
thu đợc dữ liệu từ các đoạn có trình tự dài, có kích thớc vài Mb hoặc dài hơn, ngời ta cần dữ liệu
từ các trình tự đầu cuối từ các phân đoạn ADN lớn có kích thớc ít nhất là 100 kb. Các đoạn ADN
này có thể thu đợc từ bằng một véctơ tách dòng đặc biệt gọi là nhiễm sắc thể nhân tạo vi
khuẩn - BAC (bacterial artificial chromosome). Nguyên tắc các đoạn này đợc dùng để tạo nên
thông tin của các trình tự dài là giống nh trờng hợp sử dụng các đoạn 5 kb đợc mô tả ở trên. Các
đoạn mồi đợc dùng để xác định trình tự ~600kb ở hai đầu của đoạn cài BAC. Việc sử dụng BAC
cho phép sắp xếp nhiều đoạn contig khác nhau vào cùng một đoạn khung duy nhất có kích thớc
lớn tới vài Mb (hình 13).
Chất lợng của việc ráp nối hệ gen là một phép đo kích thớc đoạn khung trung bình.
Những đoạn khung nào có kích thớc từ 1 Mb trở lên đợc tìm thấy đợc xem là có kết quả ráp
nối tốt. Ví dụ nh, ở loài cá bể dẹt (Tetraodontidae) có kích thớc hệ gen 800 Mb, và trình tự ráp
nối của toàn hệ gen này gồm 500 đoạn khung khác nhau, nh vậy mỗi đoạn khung có kích thớc
trung bình 1,6 Mb. Một hiệu quả ráp nối cao nh vậy cũng tạo thuận lợi cho nhiều phân tích
di truyền khác, chẳng hạn nh có thể dễ dàng xác định đợc tất cả các vùng mã hóa của hệ gen.
Đến năm 2000, kích thớc trung bình của các đoạn khung đợc xây dựng cho hệ gen ngời có
kích thớc là 2 Mb. Điều này là đủ để có thể tin cậy về số gen ớc lợng có trong hệ gen (xấp xỉ
30.000 gen).
Phân tích mở rộng hệ gen
Đối với các hệ gen nhỏ nh của vi khuẩn hay các loài sinh vật nhân chuẩn đơn giản, việc
xác định các trình tự mã hóa protein thờng có thể ngoại suy trực tiếp từ kết quả giải mã trình
tự, mà thực chất là thông qua việc xác định các ORF. Mặc dù không phải tất cả các ORF (đặc
biệt là các ORF ngắn) đều thực sự là các gen mã hóa protein, thì việc xác định nh vậy thờng
cũng rất hiệu quả, việc khó khăn hơn thờng là việc xác định đợc chức năng của các gen đó

hoặc sản phẩm (protein) của nó.
Việc xác định đợc vùng mã hóa protein ở hệ gen các loài động vật vốn phổ biến chứa
cấu trúc exon - intron thực tế phức tạp hơn nhiều. Trong trờng hợp này, ngời ta phải sử dụng
một loạt các công cụ tin sinh học để xác định đợc các gen và thành phần di truyền của các
hệ gen phức tạp. Các chơng trình máy tính đã đợc lập trình để có thể xác định đợc các vùng có
tiềm năng mã hóa protein dựa trên một số tiêu chí nhất định, bao gồm sự xuất hiện của các
ORF đợc chặn bởi các vị trí cắt ở hai đầu và gần kề một trình tự khởi đầu phiên mã
(promoter). Tuy vậy, các chơng trình phân tích gen này đến nay vẫn cha hoàn thiện để có thể
khẳng định sự chính xác là 100%. Một tỉ lệ khoảng 3/4 số gen có thể đợc xác định bằng phơng
pháp này, nhng cũng có rất nhiều gen bị bỏ sót; và thậm chí chi tiết hơn trong một gen, một số
trình tự exon cũng có thể bị bỏ sót.
Một hạn chế đáng kể nữa của các chơng trình tìm gen hiện nay là đôi khi không xác
định đợc đầy đủ các promoter. Ví dụ nh một promoter lõi điển hình ở động vật đa bào có kích
thớc khoảng 60 bp, chứa các trình tự định dạng (motif), nh TATA, INR và DPE, là những
motif cần thiết cho sự gắn vào của phức hệ khởi động TFIID và phức hệ phiên mã của enzym
ARN Polymerase II. Đáng tiếc là trình tự của yếu tố khởi đầu phiên mã lõi này có mức độ
biến đổi rất lớn. Mặc dù trong khi phức hệ khởi đầu phiên mã của tế bào đủ thông minh để
xác định đợc những trình tự này, thì đến nay con ngời cha viết đợc các chơng trình máy tính
cho phép xác định đợc đầy đủ các promoter lõi dạng này. Tất nhiên, hiện nay các nhà sinh tin
học đang tiếp tục hoàn thiện các chơng trình phần mềm để đến một ngày nào đó chúng ta có
thể xác định, phân tích đợc tất cả các thuộc tính của gen đã nêu ở trên, bao gồm các yếu tố
23
Hình 13. Các contig đ ợc ráp nối với nhau nhờ đọc trình tự tại đầu của các phân đoạn lớn.
Chẳng hạn, một đầu của một phân đoạn ADN hệ gen ngẫu nhiên kích th ớc 100 kb (contig 1) chứa
đoạn trình tự ở một đầu giống với trình tự ở một đầu khác của phân đoạn thứ hai (contig 2). Kết quả
phân tích trình tự cho phép ráp nối hai contig vào cùng một đoạn khung chung.
Các trình tự
ADN ngắn
Đọc đoạn trình tự đầu nối Đọc đoạn trình tự đầu nối
Đoạn khung

Contig 1 đã giải mã trình tự Contig 2 đã giải mã trình tự
Contig 3 đã giải mã trình tự
promoter lõi, các ORF, các điểm cắt và tái tổ hợp gen, v.v để xác định đợc đúng và đầy đủ
các gen mã hóa protein.
Phơng pháp quan trọng nhất để kiểm chứng các gen mã hóa protein suy đoán và xác
định các gen bị bỏ sót bởi các phần mềm máy tính là sử dụng dữ liệu cADN. cADN đợc tạo ra
theo nguyên tắc phiên mã ngợc từ các phân tử mARN hoàn thiện, vì vậy nó phản ánh đúng các
trình tự exon thực sự. Các phân tử cADN đợc dùng để tạo ra cơ sở dữ liệu EST, hay còn gọi là
nhãn xác định trình tự biểu hiện (expressed sequence tag), thực chất là các đoạn trình tự
ngắn đợc trích ra từ một trình tự cADN đã biết. Các trình tự cADN ngẫu nhiên (có thể là trình
tự đầy đủ hay các trình tự một phần EST) đợc xác định bằng sử dụng phơng pháp giải mã trình
tự ngẫu nhiên rồi đợc đối chiếu với các đoạn khung của hệ gen. Các vùng tơng ứng với các
EST đợc xác định là các exon, còn các vùng nằm giữa các exon tơng ứng với các intron (mặc
dù, nguyên tắc cắt intron khác nhau có thể sử dụng một exon không có mặt trong cADN hay
EST đợc giải mã trình tự). Các thông tin giải mã trình tự cADN và EST cũng giúp tìm đợc sự
liên kết giữa các contig, giữa các đoạn khung và giữa chúng với nhau. Chẳng hạn nh giả sử có
một phân tử cADN đợc phiên mã từ một gen kích thớc rất lớn có chiều dài intron là 100 kb
hoặc hơn. Có hai đoạn khung cùng chứa các trình tự khác nhau của phân tử cADN chung này,
thì nhiều khả năng chúng là các vùng liên kết của hệ gen và biểu hiện là các đoạn của cùng
một gen.
V.1.8. Phân tích so sánh các hệ gen
Việc so sánh hệ gen giữa các loài động vật khác nhau là cơ sở trực tiếp để đánh giá sự
biến đổi về cấu trúc gen và trình tự của chúng xuất hiện trong quá trình tiến hóa. Việc so sánh
các hệ gen nh vậy đồng thời cùng giúp khẳng định chắc chắn hơn về các vùng gen mã hóa
protein trong một hệ gen của loài nào đó. Ví dụ nh các exon của các gen đồng tiến hóa có mức
độ bảo thủ cao hơn nhiều so với các intron. Việc so sánh hệ gen ngời và chuột đã tìm thấy
nhiều exon có tính bảo thủ cao. Việc so sánh giữa các hệ gen cũng đồng thời giúp xác định
các trình tự exon ngắn (hay tìm thấy ở phần đầu 5 của gen và vùng promoter lõi) vốn thờng bị
sót khi xác định bằng phần mềm máy tính.
Một trong những khám phá nổi bật của phép phân tích so sánh các hệ gen là việc tìm ra

sự phổ biến của tính bảo thủ liên kết giữa các gen trên cùng NST. ở ngời và chuột, sự bảo
thủ của tính liên kết giữa các gen trên cùng NST là rất phổ biến. Trong nhiều trờng hợp, tính
bảo thủ này đợc tìm thấy ở cả các loài rất xa nhau trong quá trình tiến hóa, ví dụ nh ở loài cá
bể dẹt có tổ tiên chung với các loài động vật có vú từ 400 triệu năm trớc đây. Hiện tợng phổ
biến của sự bảo thủ trong tính liên kết của nhiều gen cho thấy có nhiều khả năng các gen
láng giềng cùng dùng chung các trình tự điều hòa gen. Một điều tra dùng phần mềm máy
tính gần đây tìm thấy trong một đoạn NST có kích thớc 100 - 200 kb ở ruồi dấm Drosophila
có 10 - 20 gen liên kết có hình thức điều hòa sự biểu hiện giống hệt nhau. ở ruồi dấm có
khoảng 500 - 1000 đoạn NST duy trì sự liên kết bảo thủ này có thể là do các gen liên kết cùng
phụ thuộc vào các trình tự điều hòa chung ở vùng NST đó.
Các trình tự mã hóa protein không chỉ là các vùng của hệ gen đợc giới hạn về chức năng.
Các trình tự điều hòa (vị trí gắn của các yếu tố phiên mã và các yếu tố điều hòa hoạt động gen,
nh các yếu tố tăng cờng enhancer) thờng có tính bảo thủ cao. Các trình tự này thờng đợc xác
định là các trình tự không mã hóa protein ngắn và bảo thủ. Ví dụ một chơng trình máy tính gọi
là VISTA (không phải hệ điều hành mới đây của Microsoft) khi phân tích hệ gen ở nhiều loài
khác nhau tìm thấy sự bảo thủ ở ở tỉ lệ 70% trong một đoạn trình tự phân tích 50 - 75 bp đối
với một số trình tự ADN có vai trò điều hòa. Hai loài cá bể dẹt và chuột cùng có khoảng
10.000 các đoạn trình tự không mã hóa ngắn giống nhau, rất có thể chúng là các trình tự tăng
cờng đặc trng mô. Tuy vậy, cả hai loài này, đặc biệt ở chuột, dờng nh có nhiều trình tự điều
hòa bị bỏ sót khi sử dụng phần mềm máy tính để phân tích trình tự gen. Ngời ta đã xác định đ-
ợc ở loài động vật bậc thấp Ciona intestialis có chứa khoảng 20.000 các trình tự enhancer, và
vì vậy không có gì là ngạc nhiên nếu ngời và chuột sẽ có khoảng 50.000 - 100.000 các trình tự
enhancer trong hệ gen.
Các phơng pháp đợc sử dụng để xác định các trình tự tăng cờng dựa trên việc xác định
các vị trí liên kết của các yếu tố hoạt hóa hoặc ức chế phiên mã. Việc xác định đợc các trình tự
điều hòa trong phân tử ADN còn là thách thức lớn hơn so với việc xác định đợc các trình tự mã
hóa protein bởi các trình tự điều hòa không bị hạn chế bởi các nguyên lý của mã di truyền. Vì
vậy, dờng nh việc phải phối hợp nhiều phơng pháp sinh tin học và chơng trình máy tính là cần
thiết để có thể xác định đợc các trình tự ADN điều hòa trong toàn bộ hệ gen.
Công cụ phần mềm phân tích hệ gen đợc sử dụng rộng rãi nhất hiện nay là BLAST

(basic local alignment tool). Có một số cải biến khác nhau trong các chơng trình BLAST, tuy
vậy tất cả các chơng trình này đều có các đặc điểm chung là tìm đợc những vùng giống nhau
giữa các gen mã hoa protein khác nhau. Có nhiều cách để tìm dữ liệu từ BLAST. Một trong
những cách đó là sử dụng công cụ tìm kiếm hệ gen hoặc các hệ gen đối với tất cả các trình tự
protein đợc dự đoán trớc gọi là querry sequence. Chẳng hạn nh ví dụ sau: gen eve mã hóa
trong một protein điều hòa phiên mã thiết yếu cho sự phân hóa tế bào ở phôi Drosophila.
Protein Eve có 376 axit amin. Vùng chức năng của protein này nằm giữa các axit amin 71 -
130. Khi sử dụng trình tự của 60 axit amin này để tìm kiếm, kết quả cho thấy hệ gen
24
Drosophila có 75 gen mã hóa chứa trình tự này. Nh vậy, chơng trình BLAST đã nhanh chóng
xác định đợc một loạt các gen có chức năng tơng tự.
Một cách khác để khai thác cơ sở dữ liệu của BLAST là tra cứu theo trình tự nucleotit.
Chẳng hạn nh trong thí dụ trên, ngời ta có thể sử dụng tơng ứng trình tự 180 bp mã hóa cho
hộp định loại gen (homeobox).
Tóm lại, việc trình tự các hệ gen đầy đủ của các loài khác nhau ngày càng tăng lên đã
cung cấp một cơ sở dữ liệu ngày càng phong phú và đầy đủ cho các nghiên cứu hệ gen học so
sánh. Ngày càng có nhiều các chơng trình máy tính đợc phát triển và hoàn thiện để khai thác
vốn thông tin di truyền đang ngày càng đợc tạo ra đầy đủ hơn qua các chơng trình giải mã
ADN tự động.
V.1 Các kỹ thuật phân tích protein
V.1.1. Chuẩn bị dịch chiết tế bào để tinh sạch protein
Việc phân lập và tinh sạch đợc các loại protein riêng rẽ có ý nghĩa quyết định đến khả
năng tìm hiểu đợc chức năng của chúng. Mặc dù trong một số trờng hợp, chúng ta có thể
nghiên cứu chức năng của protein ở dạng hỗn hợp phức tạp, nhng phần lớn những nghiên cứu
này thờng dẫn đến những kết luận mù mờ. Chẳng hạn nh khi chúng ta nghiên cứu về hoạt
tính của một enzym ADN polymerase trong một hỗn hợp protein thô (chẳng hạn từ dịch phân
giải tế bào), các enzym ADN polymerase và protein thành phần khác cũng có thể ảnh hởng
đến hiệu suất tổng hợp ADN quan sát đợc trong thực nghiệm. Vì vậy, việc tinh sạch các
protein là một bớc quan trong trong quá trình tìm hiểu về chức năng của chúng.
Mỗi một protein thờng có một số đặc tính riêng làm việc tinh sạch chúng thờng có tính

đặc thù. Điều này thì trái ngợc với ADN, vốn cơ bản giống nhau về cấu trúc và thành phần, chỉ
khác nhau về trình tự của các nucleotit. Các bớc tinh sạch từng loại protein thờng dựa trên các
đặc tính đặc thù của nó về kích thớc, hình dạng, điện tích và nhiều khi là chức năng của
chúng.
Vật liệu khởi đầu cho hầu hết các quá trình tinh sạch protein từ sinh vật là các dịch chiết
tế bào. Không giống ADN vốn có tính phục hồi cao trong các điều kiện nhiệt độ sống khác
nhau, thì protein rất dễ bị biến tính và phá hủy sau khi bị giải phóng ra khỏi tế bào. Vì lý do
này, hầu hết quá trình chuẩn bị các dịch chiết và tinh sạch protein đợc tiến hành ở nhiệt độ
lạnh (4
o
C). Có một số cách chuẩn bị dịch chiết tế bào. Các tế bào có thể phân giải bằng sử
dụng chất tẩy, các lực làm vỡ thành tế bào, xử lý với dung dịch nhợc trơng (làm tế bào trơng
lên do nớc đi vào và vỡ ra), hoặc thay đổi đột ngột áp suất. Điểm chung của tất cả các phơng
pháp là làm thành tế bào vỡ ra và các protein đợc giải phóng. Trong một số trờng hợp, các tế
bào đợc chuyển về trạng thái đông lạnh trớc khi đợc nghiền bằng những máy nghiền mẫu
trong phòng thí nghiệm.
V.1.2. Sử dụng sắc ký cột trong tinh chế protein
Phơng pháp chiết xuất và tinh sạch protein phổ biến nhất là sắc ký cột. Trong trờng hợp
này, các phân đoạn protein đợc cho chạy qua cột nhồi bằng các hạt agarose hoặc
polyacrylamit nhỏ đợc cải biến cho phù hợp. Có một số phơng án khác nhau trong việc sử
dụng cột tách chiết và tinh sạch protein. Các quy trình khác nhau đợc thiết lập có thể khác
nhau do đặc tính khác nhau của các loại protein. ở đây mô tả ba phơng pháp. Trong hai phơng
pháp đầu, protein đợc phân lập dựa vào kích thớc và tính tích điện của chúng. Tóm tắt về các
phơng pháp này đợc nêu trên hình 14.
Sắc ký trao đổi ion: Trong phơng pháp này, các phân tử protein đợc phân lập dựa trên
điện tích ion hóa bề mặt của chúng bằng việc sử dụng các vật liệu làm cột là các hạt mang các
nhóm chức tích điện âm hoặc dơng (đây còn đợc gọi là pha tĩnh). Các phân tử protein tơng
tác yếu với các hạt (chẳng hạn nh một phân tử protein tích điện dơng đợc cho chạy qua cột
mang các hạt tích điện âm) sẽ đợc hồi lu khi sử dụng một dung dịch muỗi loãng chảy qua cột
sau đó (dung dịch chạy mẫu đợc gọi là pha động). Các phân tử tơng tác với pha động càng

mạnh, càng cần dung dịch hàm lợng muối cao để hồi lu mẫu (bởi muối làm trung hòa các
vùng mang điện tích và vì vậy cho phép các phân tử protein đợc giải phóng khỏi cột. Bằng việc
tăng dần nồng độ muối trong các dung dịch đệm thu hồi mẫu, các phân tử protein khác nhau,
kể cả các phân tử có đặc tính tích điện gần giống nhau cũng đợc phân tách thành các phân
đoạn khác nhau khi chúng đợc hồi lu từ cột.
Sắc ký lọc gel: Kỹ thuật này cho phép phân tách các loại protein trên cở sở đặc điểm
khác nhau của các loại protein về hình dạng và kích thớc. Khác với trong kỹ thuật sắc ký trao
đổi ion, các hạt đợc sử dụng để nhồi cột trong kỹ thuật này không mang các nhóm tích điện
mà thay vào đó là mang các lỗ có kích thớc khác nhau. Các phân tử protein càng nhỏ càng có
nhiều khả năng thâm nhập vào tất cả các lỗ; vì vậy, thời gian chạy qua cột dài hơn và thời gian
hồi lu muộn hơn. Ngợc lại, các phân tử protein kích thớc càng lớn càng có thời gian hồi lu
(chạy qua toàn bộ cột) sớm hơn.
Đối với mỗi loại cột, các phân đoạn sắc ký đợc thu ở các nồng độ muối khác nhau hoặc
ở các thời gian hồi lu khác nhau để thu đợc từng loại protein đợc quan tâm nghiên cứu. Các
phân đoạn có hoạt tính protein đợc quan tâm cao nhất sẽ đợc tích lũy và tiến hành tinh sạch bổ
sung.
25

×