Tải bản đầy đủ (.pdf) (84 trang)

Nghiên cứu đặc điểm đa hình Nucleotide đơn (SNPs) của một số vùng DNA ty thể và nhiễm sắc thể Y ở người Mường và người Katu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.11 MB, 84 trang )


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN



Đỗ Mạnh Hƣng




NGHIÊN CỨU ĐẶC ĐIỂM ĐA HÌNH NUCLEOTIDE ĐƠN (SNPs)
CỦA MỘT SỐ VÙNG DNA TY THỂ VÀ NHIỄM SẮC THỂ Y
Ở NGƢỜI MƢỜNG VÀ NGƢỜI KATU



LUẬN VĂN THẠC SĨ KHOA HỌC




Hà Nội – Năm 2012
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN



Đỗ Mạnh Hƣng

NGHIÊN CỨU ĐẶC ĐIỂM ĐA HÌNH NUCLEOTIDE ĐƠN (SNPs)


CỦA MỘT SỐ VÙNG DNA TY THỂ VÀ NHIỄM SẮC THỂ Y
Ở NGƢỜI MƢỜNG VÀ NGƢỜI KATU

Chuyên ngành: Sinh học thực nghiệm
Mã số: 60 42 30

LUẬN VĂN THẠC SĨ KHOA HỌC


NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS. TS. NÔNG VĂN HẢI



Hà Nội – Năm 2012
i


MỤC LỤC
DANH MỤC CÁC HÌNH
DANH MỤC CÁC BẢNG
MỞ ĐẦU 1
Chƣơng 1. TỔNG QUAN 3
1.1. NGHIÊN CỨU ĐA HÌNH NUCLEOTIDE ĐƠN (SNP) 3
1.1.1. Các dạng SNP 3
1.1.2. Ứng dụng và tầm quan trọng 4
1.2. ĐẶC ĐIỂM ĐA HÌNH CỦA DNA TY THỂ 5
1.2.1. Cấu trúc của DNA ty thể 6
1.2.2. Đặc điểm di truyền của DNA ty thể và ứng dụng trong nghiên cứu di
truyền tiến hóa 7
1.2.3. Vùng điều khiển (D-loop) ở DNA ty thể 13

1.3. ĐẶC ĐIỂM ĐA HÌNH CỦA NHIỄM SẮC THỂ Y 17
1.3.1. Cấu trúc nhiễm sắc thể Y 17
1.3.2. Các loại chỉ thị trên nhiễm sắc thể Y 18
1.3.3. Đa hình nhiễm sắc thể Y và ứng dụng trong nghiên cứu lịch sử di truyền
tiến hóa loài ngƣời 20
1.4. MỘT SỐ ĐẶC ĐIỂM DÂN TỘC HỌC CỦA NGƢỜI MƢỜNG VÀ
NGƢỜI KATU 24
1.4.1. Dân tộc Mƣờng 24
1.4.2. Dân tộc Katu 25
1.5. TÌNH HÌNH NGHIÊN CỨU QUAN HỆ DI TRUYỀN TIẾN HÓA Ở
NGƢỜI VIỆT NAM TRÊN DNA TY THỂ VÀ NHIỄM SẮC THỂ Y 26
1.5.1. DNA ty thể 26
1.5.2. Nhiễm sắc thể Y 27
ii

Chƣơng 2. ĐỐI TƢỢNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU 29
2.1. ĐỐI TƢỢNG NGHIÊN CỨU 29
2.2. HÓA CHẤT, THIẾT BỊ 30
2.3. PHƢƠNG PHÁP NGHIÊN CỨU 31
2.3.1. Tách chiết DNA tổng số từ máu 31
2.3.2. Nhân các đoạn DNA quan tâm bằng kỹ thuật PCR 32
2.3.3. Phƣơng pháp xác định trình tự DNA 33
Chƣơng 3. KẾT QUẢ VÀ THẢO LUẬN 34
3.1. TÁCH CHIẾT VÀ TINH SẠCH DNA TỔNG SỐ TỪ CÁC MẪU MÁU . 34
3.2. NHÂN VÙNG D-LOOP VÀ CÁC CHỈ THỊ TRÊN NHIỄM SẮC THỂ Y
BẰNG KỸ THUẬT PCR 34
3.2.1. Nhân vùng D-loop 35
3.2.2. Nhân các chỉ thị M175, P186, P191 và M216 trên nhiễm sắc thể Y 35
3.3. PHÂN TÍCH VÀ XỬ LÝ SỐ LIỆU TRÌNH TỰ VÙNG D-LOOP CỦA
DNA TY THỂ Ở CÁC MẪU NGHIÊN CỨU 37

3.3.1. Phân tích và xử lý số liệu trình tự vùng D-loop của DNA ty thể ở các mẫu
cá thể ngƣời Mƣờng 37
3.3.2. Phân tích và xử lý số liệu trình tự vùng HV1 của DNA ty thể ở các mẫu
cá thể ngƣời Katu 45
3.4. XÁC ĐỊNH CÁC CHỈ THỊ ĐA HÌNH NUCLEOTIDE (SNP) TRÊN
NHIỄM SẮC THỂ Y 51
3.4.1. Lựa chọn các chỉ thị SNP 51
3.4.2. Nhân các đoạn mang các chỉ thị SNP 52
3.5. CÁC ĐA HÌNH TRÊN DNA TY THỂ VÀ NHIỄM SẮC THỂ Y Ở CÁC
CÁ THỂ NGƢỜI MƢỜNG VÀ NGƢỜI KATU 60
KẾT LUẬN VÀ KIẾN NGHỊ 62
KẾT LUẬN 62
KIẾN NGHỊ 63
iii

TÀI LIỆU THAM KHẢO 64

DANH MỤC CÁC HÌNH
Hình 1.1. Sơ đồ cấu tạo của DNA ty thể 7
Hình 1.2. Cây phát sinh chủng loại của DNA ty thể ngƣời từ 5 vùng địa lý. 10
Hình 1.3. Mô hình tiến hóa di cƣ của các nhóm đơn bội DNA ty thể ngƣời 12
Hình 1.4. Cấu trúc vùng D-loop 14
Hình 1.5. Sơ đồ cấu trúc phân tử của nhiễm sắc thể Y ngƣời 17
Hình 1.6. Bản đồ mô tả tần số phân bố của các nhóm đơn bội theo nhiễm sắc thể Y
của ngƣời trên thế giới 22
Hình 3.1. Ảnh điện di DNA tổng số trên gel agarose 0,8% 34
Hình 3.2. Ảnh điện di sản phẩm PCR vùng D-loop của một số mẫu nghiên cứu sử
dụng cặp mồi D-loop F và D-loop R trên gel agarose 0,8% 35
Hình 3.3. Ảnh điện di sản phẩm PCR hai đoạn chỉ thị M175, M216, P191 và P186
một số mẫu nghiên cứu trên gel agarose 2% 36

Hình 3.4. Trình tự D-loop của 38 mẫu cá thể ngƣời Mƣờng so với trình tự chuẩn 44
Hình 3.5. So sánh trình tự nucleotide đoạn HV1 của DNA ty thể các mẫu cá thể
ngƣời Katu với nhau và với trình tự chuẩn. 48
Hình 3.6. Cây phát sinh chủng loại giữa các cá thể ngƣời Mƣờng, ngƣời Katu và các
dân tộc trong khu vực. 50
Hình 3.7. So sánh trình tự các chỉ thị SNP 53
Hình 3.8. Bản đồ phân bố của nhóm đơn bội O trên thế giới 57
Hình 3.9. Bản đồ mô tả thuyết di cƣ của các quần thể theo phụ hệ vào Đông Á 59
Hình 3.10. Sự phân bố của các nhóm đơn bội Y ở Đông Á và khu vực xung quanh 60
iv

DANH MỤC CÁC BẢNG
Bảng 2.1. Tên, kí hiệu và số lƣợng các mẫu nghiên cứu cá thể ngƣời Mƣờng và
ngƣời Katu 29
Bảng 3.1. Khoảng cách di truyền giữa các dân tộc dựa trên trình tự HV1 49
Bảng 3.2. Các chỉ thị SNP, trình tự mồi dùng để nhân đoạn mang các chỉ thị SNP
thuộc nhóm đơn bội O và C 52
Bảng 3.3. Đa hình các chỉ thị SNP thuộc nhóm đơn bội O và nhóm đơn bội C của
68 mẫu cá thể nam ngƣời Mƣờng và ngƣời Katu. 56


















v

DANH MỤC CÁC CHỮ VIẾT TẮT
bp
Cặp base (base pair)
DNA
Deoxyribonucleic acid
ddNTP
Dideoxynucleoside triphosphate
DHPLC
Denatured High Peformance Liquid Chromatography- Sắc ký lỏng
cao áp có biến tính
dNTP
Deoxynucleoside triphosphate
EDTA
Ethylene diamine tetra-acetic acid
EtBr
Ethidium bromide
EtOH
Ethanol
GWAS
Genome wide association studies
HV1
Hypervariable segment 1

HV2
Hypervariable segment 2
kb
Kilobase
Mb
Megabase
MSY
Male Specific region Y – Vùng đặc hiệu nam trên nhiễm sắc thể Y
NRY
Non-recombining region Y – Vùng không trao đổi chéo trên
nhiễm sắc thể Y
NST
Nhiễm sắc thể
PAR1
Pseudoautosomal Region 1 – vùng giả nhiễm sắc 1
PAR2
Pseudoautosomal Region 2 – vùng giả nhiễm sắc 2
PCR
Polymerase Chain Reaction
rCRS
Revised Cambridge Reference Sequence
vi

RFLP
Restriction Fragment Length Polymorphism
RNA
Ribonucleic acid
SDS
Sodium Dodecyl Sulphate
SNP

Single Nucleotide polymorphism – Đa hình nucleotide đơn
SRY
Sex determining region Y – Vùng xác định giới tính trên nhiễm
sắc thể Y
STR
Short Tandem repeat – đoạn lặp lại ngắn
TE
Tris - EDTA
TAE
Tris – acetate – EDTA
Yq
Long arm of Y chromosome – Cánh tay dài của nhiễm sắc thể Y
Yp
Short arm of Y chromosome – Cánh tay ngắn của nhiễm sắc thể Y














Luận văn Đỗ Mạnh Hưng
1


MỞ ĐẦU
Sự kiện toàn bộ hệ gen của con ngƣời đƣợc giải trình tự và công bố trên 2 tạp
chí khoa học danh tiếng nhất là Nature, Anh [54] và Science, Mỹ [79] vào tháng 2
năm 2001 đã tạo ra một cột mốc vô cùng quan trọng trong sinh học. Trình tự hệ gen
sau đó đã đƣợc công khai để các nhà khoa học trên khắp thế giới có thể tiếp cận và
cùng sử dụng tạo ra một điều kiện mới, thuận lợi hơn rất nhiều cho các nghiên cứu
sinh học, đặc biệt là sinh học phân tử. Tuy nhiên, để hiểu đƣợc hoàn toàn cấu trúc,
tổ chức, sự điều hòa và chức năng chi tiết của hệ gen ngƣời vẫn là một công việc
lớn và hết sức khó khăn. Do đó, trình tự đầu tiên đƣợc xem là “trình tự chuẩn” hay
“trình tự tham chiếu” giúp chúng ta tiếp tục đến với những nghiên cứu sâu hơn.
Kết quả quan trọng nhất sau khi có bản đồ gen ngƣời cho chúng ta thấy rằng,
các chủng tộc, các cá thể ngƣời giống nhau đến 99,9% và chỉ khác nhau một tỷ lệ
rất nhỏ (0,1%) về cấu trúc hệ gen. Tuy nhiên, phần khác biệt rất nhỏ này lại có có ý
nghĩa quyết định đối với đặc điểm nhân chủng học của một dân tộc, là yếu tố di
truyền liên quan đến sức khỏe của cả dân tộc và mỗi cá thể. Trong 0.1% khác biệt
giữa hai ngƣời thì có đến hơn 80% là các đa hình nucleotide đơn (SNP). Do đó, việc
nghiên cứu các SNP là vô cùng quan trọng, cụ thể đã có nhiều SNP đang đƣợc sử
dụng làm công cụ hữu ích trong những lĩnh vực nhƣ y dƣợc học, hình sự, và nghiên
cứu di truyền tiến hóa… [85]
Kể từ những năm 80 của thế kỷ trƣớc, các SNP của DNA ty thể và nhiễm sắc
thể Y đã đƣợc sử dụng trong nhiều lĩnh vực khác nhau của sinh học và y học.
Chúng ta có thể dễ dàng nhận thấy, với các đặc tính nhƣ di truyền đơn dòng, rất ít
trao đổi chéo, đồng thời lại lƣu giữ nhiều chỉ thị quạn trọng, những SNP này đặc
biệt hữu ích đối với việc nghiên cứu quá trình tiến hóa của con ngƣời. Hơn nữa, do
số lƣợng bản sao lớn trong mỗi tế bào và ít bị phân hủy theo thời gian DNA ty thể
thích hợp cho việc nghiên cứu các mẫu DNA cổ đại, trong khi gần đây hƣớng
nghiên cứu liên quan đến nhiễm sắc thể Y cũng rất phát triển. Trong một số công bố
gần đây, các nghiên cứu liên quan đến DNA ty thể và nhiễm sắc thể Y đã cung cấp
những kiến thức hữu ích về các vấn đề chủ chốt trong quá trình tiến hóa và làm sáng

Luận văn Đỗ Mạnh Hưng
2

tỏ lịch sử di truyền của các quần thể ngƣời ở các vùng địa lý trong các bối cảnh và
khoảng thời gian khác nhau [46].
Việc nghiên cứu di truyền tiến hóa đối với các dân tộc Việt Nam là hết sức
thiết thực, tuy nhiên việc tiến hành các nghiên cứu này vẫn còn là một vấn đề mới ở
nƣớc ta và chƣa có nhiều công trình đƣợc công bố. Nhận thức rõ đƣợc tầm quan
trọng của việc nghiên cứu nguồn gốc tiến hóa và tìm hiểu dữ liệu di truyền của các
dân tộc Việt Nam, chúng tôi định hƣớng nghiên cứu đặc điểm đa hình nucleotide
đơn ở cả DNA ty thể và nhiễm sắc thể Y. Theo hƣớng nghiên cứu này, đề tài luận
văn thạc sĩ: “Nghiên cứu đặc điểm đa hình nucleotide đơn (SNPs) của một số vùng
DNA ty thể và nhiễm sắc thể Y ở người Mường và người Katu” đã đƣợc thực hiện.
Các nội dung chính của đề tài luận văn gồm:
- Tách chiết DNA tổng số từ mẫu máu của 108 cá thể ngƣời Việt thuộc hai
dân tộc Mƣờng và Katu. Nhân vùng điều khiển D-loop của DNA ty thể và
một số chỉ thị trên nhiễm sắc thể Y.
- Xác định trình tự nucleotide của các trình tự đƣợc nhân từ các mẫu nghiên
cứu.
- Phân tích đa hình nucleotide đơn (SNP) trình tự các mẫu nghiên cứu thuộc
hai dân tộc Mƣờng và Katu.











Luận văn Đỗ Mạnh Hưng
3

Chƣơng 1. TỔNG QUAN
1.1. NGHIÊN CỨU ĐA HÌNH NUCLEOTIDE ĐƠN (SNP)
Việc nghiên cứu đa hình nucleotide đơn (SNP) không còn mới lạ gì đối với
các nhà sinh học, đặc biệt là các nhà nghiên cứu sinh học phân tử [46]. Tuy nhiên,
với tính chất đặc trƣng cho từng cá thể đồng thời lại nắm giữ vai trò vô cùng quan
trọng trong sinh học, y học, nhân chủng học, hình sự… việc nghiên cứu các đa hình
nucleotide đơn hầu nhƣ là không có giới hạn.
Một SNP đƣợc định nghĩa là một biến thể trình tự DNA xảy ra khi một
nucleotide đơn A, T, C hay G trong hệ gen khác biệt so với các cá thể khác trong
cùng một loài sinh học hoặc so với sợi nhiễm sắc thể còn lại trong cặp nhiễm sắc
thể tƣơng đồng. Ví dụ, hai đoạn trình tự tƣơng ứng của hai cá thể khác nhau,
AAGCCTA với AAGCTTA, chứa một sự khác biệt trong các nucleotide đó là hai
alen C và T. Sự phân bố của các SNP trong hệ gen không đồng nhất, SNP thƣờng
xảy ra trong các vùng không mã hóa hơn các vùng mã hóa [9] và hầu hết các SNP
đều ở dạng hai alen [18].
1.1.1. Các dạng SNP
Các SNP có thể nằm trong trình tự mã hóa của các gene, các trình tự không
mang mã hay trong vùng xen giữa các gene. Các SNP trong một trình tự mã hóa
không nhất thiết sẽ làm thay đổi trình tự các amino acid trong protein đƣợc tạo ra do
tính chất thoái hóa của mã di truyền.
Một SNP trong đó mà các alen cùng sản xuất ra một trình tự polypeptide
đƣợc gọi là đa hình đồng nghĩa (đôi khi gọi là đột biến câm). Nếu một chuỗi
polypeptide khác đƣợc tạo ra thì đa hình đó đƣợc gọi là một đa hình thay thế. Một
sự thay đổi đa hình thay thế có thể tạo ra một sản phẩm vô nghĩa. Cụ thể, những kết
quả đó có thể tạo ra một amino acid khác, một bộ ba vô nghĩa, một codon dừng quá
sớm. Hơn nửa trong số những đột biến bệnh đã đƣợc xác định có nguồn gốc từ các

đa hình thay thế [70].
Luận văn Đỗ Mạnh Hưng
4

Các SNP không nằm trong vùng mã hóa protein vẫn có thể gây ảnh hƣởng
đến sự ghép nối các gene, tác động lên các yếu tố phiên mã, làm suy thoái RNA
thông tin… Sự biểu hiện gene bị ảnh hƣởng bởi dạng này của SNP đƣợc gọi là một
eSNP (sự biểu hiện SNP) và có thể biểu hiện tăng hoặc giảm trong gen.
1.1.2. Ứng dụng và tầm quan trọng
Các biến thể trong trình tự DNA của con ngƣời có thể ảnh hƣởng đến cách
cơ thể phát triển bệnh, cách cơ thể đáp ứng với các tác nhân gây bệnh, các hóa chất,
thuốc, vaccine và các loại tác nhân khác. Các SNP đƣợc cho là chìa khóa tiềm năng
trong việc tiến hành y học cá nhân. Tuy nhiên, vai trò quan trọng nhất của chúng
trong các nghiên cứu y học là để so sánh các vùng của hệ gen giữa các nhóm ngƣời
(có thể là giữa bệnh nhân và ngƣời khỏe mạnh) trong các nghiên cứu ở mức toàn bộ
hệ gen (genome-wide association studies - GWAS).
Nghiên cứu về các SNP cũng rất quan trọng trong nông nghiệp đặc biệt là
trong các chƣơng trình nhân giống cây trồng và vật nuôi.
Một SNP đơn có thể là nguyên nhân gây ra một bệnh di truyền. Đối với các
bệnh phức tạp, các SNP thƣờng không hoạt động đơn lẻ, đúng hơn, chúng hoạt
động trong một sự kết hợp với các SNP khác để biểu hiện một tình trạng bệnh nhƣ
chúng ta thấy trong bệnh loãng xƣơng [67].
Tính đến ngày 26 tháng 6 năm 2012, dbSNP liệt kê đƣợc có 187.852.828
SNP ở ngƣời [87].
Phát hiện gần đây về các SNP trong các nghiên cứu so sánh ở mức toàn bộ
hệ gen (GWAS) tạo ra một điều kiện thuận lợi hơn rất nhiều không chỉ cho quá
trình phát hiện các biến thể di truyền và bệnh di truyền mà còn phát triển nghiên
cứu nhằm tìm ra cách phòng ngừa và chữa bệnh trong tƣơng lai. Trên thực tế, mỗi
ngƣời có những đặc điểm riêng và rất phức tạp. Các SNP có thể mang lại những
phản ứng khác nhau đối với thuốc điều trị thậm chí có trƣờng hợp dẫn đến tử vong.

Nhiều SNP đã đƣợc sử dụng nhƣ chỉ thị giúp cho việc lập bản đồ gen liên quan đến
Luận văn Đỗ Mạnh Hưng
5

bệnh hoặc một đặc điểm đặc trƣng nào đó. Các SNP có liên hệ với các bệnh trên
ngƣời nhƣ ung thƣ, các bệnh truyền nhiễm (AIDS, phong, viêm gan…) các bệnh tự
miễn, bệnh thần kinh và nhiều bệnh khác có thể đƣợc sử dụng để tìm ra đích tác
dụng của thuốc và các liệu pháp chữa trị [22].
Là kiểu đa hình phổ biến nhất, ƣớc tính chiếm 80% sự biến đổi trong hệ gen
ngƣời, các đa hình SNP nắm giữ chìa khóa phân tử quan trọng nhất đối với cơ thể
sống [18]. Chính vì lý do đó, các SNP nhanh chóng đƣợc nghiên cứu và ứng dụng
thành công trong việc tìm hiểu các bệnh di truyền, mối quan hệ di truyền, pháp y …
Đối tƣợng nghiên cứu phù hợp cho các nghiên cứu này là DNA ty thể và nhiễm sắc
thể Y. Với kích thƣớc nhỏ nhất trong bộ gen ngƣời (nhiễm sắc thể Y 60 Mb, DNA
ty thể 16,569 bp) đồng thời với đặc tính di truyền theo dòng đơn và nhiều đặc điểm
ƣu việt khác, nghiên cứu SNP trên nhiễm sắc thể Y và DNA ty thể đã, đang và sẽ
tiếp tục đem lại những thành quả quan trọng cho nhân loại.
1.2. ĐẶC ĐIỂM ĐA HÌNH CỦA DNA TY THỂ
Một trong những nghiên cứu phổ biến nhất đối với hệ thống di truyền ở
ngƣời là nghiên cứu DNA ty thể (mitochondrial DNA - mtDNA) [52]. Rất nhiều
SNP đã đƣợc xác định trong vùng mã hóa có liên quan với một loạt các rối loạn ty
thể làm ảnh hƣởng đến nhiệm vụ sản sinh năng lƣợng và gây ra nhiều loại bệnh
khác nhau. Bên cạnh vùng mã hóa, những biến thể trên vùng điều khiển D-loop lại
nắm giữ chìa khóa quan trọng đối với lịch sử tiến hóa và các mỗi quan hệ di truyền
quần thể.
1.2.1. Cấu trúc của DNA ty thể
DNA ty thể là một phân tử dạng tròn có kích thƣớc 16569 bp nằm bên trong
ty thể. Tuy nhiên, kích thƣớc này có thể sai khác đôi chút do có những đoạn chèn
vào, do mất đoạn, hoặc có những trình tự lặp lại nối tiếp. Là phân tử mạch kép,
vòng và không liên kết với protein histon làm cho DNA ty thể giống với DNA của

vi khuẩn. DNA ty thể của ngƣời đƣợc chia thành 2 vùng :
Luận văn Đỗ Mạnh Hưng
6

+ Vùng mã hóa với khoảng 15000 bp có chứa 37 gen khác nhau (22 gen mã
hóa cho RNA vận chuyển, 13 mã hóa cho các protein, và hai gen mã hóa cho các
RNA khác) chúng đƣợc liên kết và kế thừa nhƣ một đơn vị duy nhất.
+ Vùng không mã hóa (D-loop) hay vùng điều khiển có chức năng điều hòa
sự sao chép của DNA ty thể và sự biểu hiện của các gen. Vùng điều khiển đƣợc chia
nhỏ thành 3 đoạn siêu biến: HV1 với các nucleotide từ vị trí 16024 đến 16365, HV2
với các nucleotide từ 73 đến 340; và HV3 với các nucleotide từ 438 đến 574 [52].
Toàn bộ trật tự các gen cấu trúc và chức năng của hệ gen ty thể ngƣời đƣợc
sắp xếp theo sơ đồ hình 1.1. Phân tử DNA ty thể ngƣời gồm có hai chuỗi: chuỗi
nặng giàu guanin và chuỗi nhẹ giàu Cytosine, có 37 gen mã hóa cho 2 rRNA (12S
và 16S), 22 tRNA và 13 protein. 13 chuỗi polypeptide đƣợc mã hóa bởi DNA ty thể
là thành phần của phức hệ hô hấp của ty thể, trong đó có 7 tiểu phần (ND1, 2, 3, 4L,
4, 5, 6) trong số 46 chuỗi polypepetide của phức hệ I (NADH dehydrogenase), 1
tiểu phần (cytochrome b, Cytb) trong số 11 chuỗi polypeptide của phức hệ III (Phức
hệ bc
1
), 3 tiểu phần (CO I, II, III) trong số 13 polypeptide của phức hệ IV
(cytochrome c oxidase) và 2 tiểu phần (ATPase 6 & 8) trong số 16 protein của phức
hệ V (ATP synthase) [24]. Còn tất cả các protein khác của ty thể bao gồm tất cả 4
tiểu đơn vị của phức hệ II (succinate dehydrogenase), tiểu đơn vị DNA polymerase
 của ty thể, các thành phần của RNA polymerase của ty thể, yếu tố phiên mã của ty
thể (mtTFA), các protein ribosome của ty thể, các yếu tố kéo dài chuỗi và các
enzyme trao đổi chất của ty thể đều đƣợc mã hóa bởi DNA nhân [81].

Luận văn Đỗ Mạnh Hưng
7



Hình 1.1. Sơ đồ cấu tạo của DNA ty thể [86]
Phân tử DNA mạch vòng, kép, kích thƣớc 16569 bp. Chuỗi nhẹ (L-strand) nằm
phía trong và chuỗi nặng (H-strand) nằm phía ngoài. Vị trí của các gen mã hóa cho 13
chuỗi polypeptide, RNA ribosome và RNA vận chuyển đƣợc biểu diễn tƣơng ứng trên các
mạch. Vùng điều khiển D-loop chứa promoter của chuỗi nặng và chuỗi nhẹ và điểm khởi
đầu sao chép của chuỗi nặng. Điểm khởi đầu sao chép chuỗi nhẹ nằm trong vùng chứa một
loạt trình tự các RNA vận chuyển (W, A, N, C và Y).
1.2.2. Đặc điểm di truyền của DNA ty thể và ứng dụng trong nghiên cứu
di truyền tiến hóa
Đặc điểm đặc trưng
Mặc dù bộ gen ty thể ngƣời chỉ bằng 0.0005% so với toàn bộ kích thƣớc bộ
gen trong nhân, có 5 đặc điểm làm cho nó trở nên đặc biệt hữu ích cho việc đánh giá
mối quan hệ di truyền tiến hóa giữa các quần thể có mối quan hệ gần gũi:
Các đột biến trên DNA ty thể nhanh hơn 5 đến 10 lần so với DNA nhân,
khoảng 2% đến 4% trong một triệu năm [14]. Trong phân tử DNA ty thể, dù mang
chức năng quan trọng, nhƣng vùng điều khiển lại có tỷ lệ đột biến cao gấp 10 lần so
với vùng mã hóa. Tuy nhiên, sự biến đổi trên vùng điều khiển phân bố không đều,
Luận văn Đỗ Mạnh Hưng
8

mật độ biến đổi cao nhất của các vị trí đa hình đƣợc tìm thấy ở hai vùng siêu biến
HV1 và HV2 [17]. Tốc độ đột biến này có thể là do trong quá trình sao chép mắc
nhiều lỗi và ty thể thiếu cơ chế để sửa chữa các sai hỏng nhƣ ở DNA nhân. Mặt
khác, ty thể là nơi luôn diễn ra các quá trình oxy hóa và do đó, sản sinh ra các chất
oxy hóa mạnh nhƣ các gốc tự do. Các chất này sẽ tác động đến hệ gen của ty thể và
phát sinh ra các đột biến. Do các đột biến là ngẫu nhiên nên bất kỳ nucleotide nào
trong hệ gen ty thể, cả ở vùng mã hóa và không mã hóa. Hơn nữa do các tế bào đều
có hàng trăm đến hàng nghìn DNA ty thể nên các đột biến DNA ty thể có hại có thể

xảy ra ở tất cả các mô, sinh dƣỡng và sinh dục. Các đột biến bắt nguồn ở các mô
sinh dƣỡng (somatic tissue) làm giảm việc sản xuất năng lƣợng cho tế bào và những
ngƣời bị các đột biến này thƣờng sẽ chết. Còn các đột biến bắt nguồn từ tế bào sinh
dục của mẹ và đƣợc truyền cho thế hệ sau thì đƣợc xem là các đa hình DNA ty thể.
Nhìn chung, tốc độ biến đổi nhanh chóng của các chỉ thị DNA ty thể làm nó trở nên
hoàn toàn phù hợp với các nghiên cứu tiến hóa gần.
Mặc dù mỗi tế bào chỉ chứa 1 bản sao của DNA nhân, nhƣng có đến hàng
trăm bản sao của DNA ty thể (có thể lên đến trên 1000 bản sao trong mỗi tế bào)
[60]. Đặc điểm này cùng với việc DNA ty thể tồn tại ở dạng vòng và nằm trong tế
bào chất nên việc tách chiết, thu nhận DNA ty thể dễ dàng hơn. Điều này đặc biệt
có ý nghĩa trong trƣờng hợp phân tích những mẫu sinh phẩm còn sót lại sau hàng
chục hay hàng trăm năm. DNA nhân do có cấu trúc mạch thẳng nên không bền, dễ
bị phân huỷ, làm cho việc phân tích gặp nhiều khó khăn. Trong khi đó, DNA ty thể
mạch vòng, có kích thƣớc nhỏ nên bền theo thời gian trong các mô khó phân huỷ
nhƣ mô xƣơng, răng và tóc. Đặc tính này điều kiện cho việc phân tích các mẫu
DNA cổ xƣa hay các mẫu DNA đã xuống cấp.
DNA ty thể có đặc tính di truyền theo dòng mẹ đồng nghĩa rằng nó đƣợc
truyền từ mẹ sang con bao gồm cả trai và gái. Tuy nhiên chỉ có những ngƣời con gái
mới có thể truyền cho thế hệ tiếp theo [27]. Ty thể trong tinh trùng sớm biến mất
trong phôi bởi sự phá hủy có chọn lọc, sự bất hoạt, hoặc đơn giản bởi sự áp đảo của
Luận văn Đỗ Mạnh Hưng
9

số lƣợng ty thể của noãn. Nhƣ vậy, các phân tích DNA ty thể có thể đƣa ra một cái
nhìn sâu sắc về các quá trình di truyền theo mẫu hệ.
Vì tính thừa kế xảy ra theo một dòng duy nhất không có sự tái tổ hợp, điều
này loại bỏ các ảnh hƣởng gây nhiễu từ các mạng lƣới di truyền.Và do đó nếu
không có mặt của các phân tử DNA dị tế bào chất thì các phân tử DNA ty thể của
hợp tử không khác so với phân tử DNA ty thể ban đầu cho phép giải thích rõ ràng
hơn về các quá trình biến đổi.

Nhờ đặc tính chọn lọc vô tính nên các dạng DNA ty thể khác nhau không bị
loại bỏ trong quá trình chọn lọc và do đó chúng trở nên phổ biến thông qua quá
trình di truyền từ thế hệ này sang thế hệ khác. Do DNA ty thể đƣợc di truyền theo
mẫu hệ nên nó tích luỹ các đột biến và phát tán theo các dòng phả hệ mẫu hệ. Chính
điều này đã tạo nên tính đa hình đặc trƣng theo quần thể của DNA ty thể, hình thành
nên các nhóm kiểu đơn của DNA ty thể có quan hệ với nhau, hay còn gọi là nhóm
đơn bội (haplogroup).
Ứng dụng DNA ty thể trong nghiên cứu di truyền - tiến hóa
Wesley Brown và Douglas Wallace đã nghiên cứu DNA ty thể ngƣời nhƣ là
một nguồn marker phân tử từ những năm cuối thập niên 70 của thế kỷ trƣớc. Trong
những ngày kỹ thuật PCR mới ra đời (pre-PCR), việc xác định các chỉ thị đƣợc tiến
hành đầu tiên bằng phân tích RFLP, các phân tử đƣợc phân cắt với một enzyme giới
hạn áp dụng cho một lƣợng mẫu lớn [20] hoặc một số enzyme trên một vài mẫu.
Các nghiên cứu sau đó có xu hƣớng sử dụng 5 hoặc 6 enzyme trên một bộ mẫu lớn
[65]. Dù kết quả có “độ phân giải thấp - low resolution”, các dữ liệu RFLP từ những
nghiên cứu ban đầu đã nhanh chóng đƣợc sử dụng để trả lời cho các câu hỏi liên
quan đến nguồn gốc loài ngƣời. Dựa trên dữ liệu RFLP, cây phát sinh chủng loại
toàn cầu đã đƣợc xây dựng có có hình dạng ban đầu giống dạng ngôi sao; một kiểu
đơn bội RFLP ở trung tâm là nguồn gốc chung cho tất cả các các quần thể ngƣời từ
khắp nơi trên thế giới với các bức xạ là các loại DNA ty thể khác nhau, một số trong
đó là các quần thể cụ thể. Nhóm đơn bội trung tâm đƣợc giả định là tổ tiên chung
gần nhất của DNA ty thể ngƣời và đƣợc giải thích bởi một số mô hình “đa khu vực”
Luận văn Đỗ Mạnh Hưng
10

trong tiến hóa ngƣời, quan điểm đó cho rằng con ngƣời hiện đại đã tiến hóa từ
những tổ tiên cổ xƣa trong nhiều phần khác nhau của thế giới [72].
Tuy nhiên, vào năm 1987, một mô hình thay thế cho mô hình tiến hóa DNA
ty thể ngƣời đầu tiên đƣợc đƣa ra từ một nghiên cứu do nhóm Rebecca Cann và các
cộng sự tiến hành tại Đại học California ở Berkeley. Nhóm nghiên cứu này chiết

xuất DNA ty thể từ 147 ngƣời đại diện cho năm vùng địa lý khác nhau (Châu Phi,
Châu Á, Châu Âu, Australia và New Guinea ) và sử dụng các kỹ thuật phân cắt “độ
phân giải cao – high resolution” với 12 enzyme phân cắt nội chuỗi khác nhau để có
đƣợc một cây phát sinh loài DNA ty thể chi tiết hơn (hình 1.2).

Hình 1.2. Cây phát sinh chủng loại của DNA ty thể ngƣời từ 5 vùng địa lý [15].
Cây dựa trên dữ liệu RFLP với DNA ty thể của 147 cá nhân (ký hiệu bởi hình tròn đầy,
hình tam giác và hình vuông. Hai nhánh chính, một nhánh bao gồm các quần thể ở một
phần Châu Phi và nhánh khác gồm các quần thể ở những vùng còn lại của Châu Phi và
toàn bộ thế giới đƣợc ký hiệu tƣơng ứng là I và II tƣơng ứng.
Luận văn Đỗ Mạnh Hưng
11

Trái ngƣợc với hình ảnh từ các dữ liệu có “độ phân giải thấp”, cây này
không giống ngôi sao và cho thấy khoảng 200 000 năm trƣớc đã xảy ra một sự phân
chia quần thể ngƣời thành hai nhánh chính, một nhánh chỉ bao gồm các tiểu vùng
Sahara của Châu Phi, và nhánh lớn hơn đại diện cho phần còn lại của Châu Phi và
toàn thế giới. Điều này đã đƣợc giải thích bởi Cann và các đồng nghiệp nhƣ là bằng
chứng về nguồn gốc cho sự di cƣ rời khỏi Châu Phi của ngƣời hiện đại, và tổ tiên
Châu Phi của chúng ta đƣợc mệnh danh là “ty thể Eve”. Kể từ đó đến nay, đã có
nhiều kết quả nghiên cứu về DNA ty thể cũng ủng hộ cho thuyết di cƣ rời khỏi
Châu Phi của ngƣời hiện đại [33].
Trong những năm đầu của thập niên 1990, một hình ảnh cụ thể hơn về cây
phân loại DNA ty thể ngƣời đã bắt đầu hình thành dựa trên các phân tích RFLP “độ
phân giải cao” với các tập hợp mẫu đƣợc lấy trên mỗi lục địa tại một thời điểm [74].
Những phân tích này đầu tiên đƣợc tiến hành tại phòng thí nghiệm của Wallace ở
Đại học Emory, Atlanta, cho thấy rằng các biến thể DNA ty thể có thể đƣợc phân
loại vào một số các ngành đơn có tổ tiên chung, hoặc các nhóm đơn bội, đƣợc đặc
trƣng bởi một hoặc một số vị trí giới hạn nằm chủ yếu ở vùng mã hóa. Trong các
nghiên cứu sau đó, bắt đầu tập trung chuyển dịch theo hƣớng giải trình tự trực tiếp

vùng điều khiển vì các biến thể tập trung ở đó nhiều hơn [36], điều này cho phép
chúng ta điều tra mạnh mẽ hơn về sự khác biệt quần thể ở cấp độ khu vực và thuận
tiện hơn trong việc xác định các dƣới nhóm đơn bội.
Sự phân bố địa lý và mối quan hệ tiến hóa của các nhóm đơn bội DNA ty thể
ngƣời có thể đƣợc tóm tắt trong các nhóm sau đây. Để bắt đầu, phần rất lớn DNA ty
thể ở Châu Phi thuộc về “nhóm L” đƣợc định danh là các nhóm đơn bội L1, L2, và
L3. Châu Phi là châu lục có mức độ đa dạng DNA ty thể lớn nhất thế giới, với các
nhánh phát sinh loài sâu và chỉ có ở tiểu khu vực Sahara [38]. Điều này đã đƣợc
chứng minh bởi nhiều bằng chứng gần đây về nguồn gốc của ngƣời hiện đại. Tất cả
những ngƣời không thuộc Châu Phi ngày nay là hậu duệ của nhóm đơn bội L3, sau
khi rời khỏi Châu Phi L3 bắt đầu phân thành 2 nhánh là 2 nhóm đơn bội M và N,
Luận văn Đỗ Mạnh Hưng
12

đƣợc đặc trƣng bởi sự xuất hiện các vị trí cắt RFLP tại nucleotide 10394 (enzyme
Ddel) và nucleotide 10397 (Alul) (hình 1.3).

Hình 1.3. Mô hình tiến hóa di cƣ của các nhóm đơn bội DNA ty thể ngƣời [90]
Phần lớn DNA ty thể ở Châu Phi thuộc về các nhóm đơn bội “nhóm L” gồm L1,
L2, và L3. Tất cả những nhóm đơn bội ngoài Châu Phi ngày nay là hậu duệ của nhóm đơn
bội L3, sau khi rời khỏi Châu Phi L3 bắt đầu phân thành 2 nhánh là 2 nhóm đơn bội M và
N rồi sau đó hai nhóm này phân chia thành nhiều nhánh đơn bội khác trong quá trình di cƣ
chiếm lĩnh thế giới (Mỗi chữ cái là ký hiệu riêng của một nhóm đơn bội).

Từ việc tính toán ngày tháng phân ly giữa hai dòng sáng lập và các nhánh
nhỏ của nó đã đƣa ra ƣớc tính rằng những ngƣời di cƣ rời khỏi Châu Phi dƣờng nhƣ
đã chia rẽ thành hai tuyến đƣờng khác nhau vào khoảng 60 000 năm trƣớc [26].
Sớm nhất là theo tuyến đƣờng dọc theo bờ biển nhiệt đới miền Nam Châu Á đƣa
ngƣời hiện đại đến Australia và Papua New Guinea vào khoảng 46 000 năm trƣớc
[11] nhƣ kết quả đƣợc chỉ ra bởi các ghi nhận khảo cổ học. Ngƣời phía bắc lục địa

Á-Âu di cƣ theo một cách khác, cách này gặp phải nhiều điều kiện khắc nghiệt hơn
nhƣ địa hình, những ngƣời Neanderthal, và khí hậu bất ổn trong trong giai đoạn đầu
của thời kỳ băng hà cuối cùng. Ở Châu Âu, các nhóm đơn bội chính là H, I, J, K, T,
U, V, W, và X, tất cả đều thuộc đại nhóm đơn bội N. Các nhóm đơn bội chính ở
Đông Á là A, B, C, D, F, G, M*, Y và Z, [71]. Việc phân biệt các nhóm đơn bội ở
Luận văn Đỗ Mạnh Hưng
13

khu vực Trung Á thì phức tạp nhiều hơn, với một sự hỗn độn ở cả hai phía tây và
phía đông, các nhóm đơn bội ở giữa lục địa Á-Âu có khả năng là sản phẩm của
dòng gen gần đây do các tuyến đƣờng thƣơng mại và sự hình thành, phát triển của
các đế chế trong lịch sử. Cuối cùng, về những ngƣời ở Châu Mỹ, có một sự đồng
thuận chung cho rằng tổ tiên của những quần thể ngƣời Châu Mỹ bản địa có nguồn
gốc từ Châu Á đã di cƣ qua dải đất Bering trên băng đá sớm nhất vào khoảng 20
000 năm trƣớc, với các nhóm đơn bội B, C và D và một tỷ lệ nhỏ của nhóm đơn bội
X [13].
Cùng với sự phát triển của phƣơng pháp PCR và phƣơng pháp xác định trình
tự DNA tự động, việc phân tích DNA ty thể hiện nay không còn dựa nhiều vào kỹ
thuật RFLP nữa mà chủ yếu dựa trên việc đọc các trình tự của DNA ty thể, đặc biệt
là vùng điều khiển D-loop. Việc nghiên cứu hệ gen ty thể, đọc trình tự nucleotide
của các vùng siêu biến của đoạn D-loop cũng nhƣ các gen chức năng khác của ty
thể, dẫn đến giải mã toàn bộ hệ gen ty thể của nhiều đại diện dân tộc khác nhau sẽ
cung cấp số liệu để phân loại các nhóm đơn bội chính xác và chi tiết hơn [38].
1.2.3. Vùng điều khiển (D-loop) ở DNA ty thể
Cấu trúc vùng D-loop
Ở động vật có vú, vùng điều khiển của DNA ty thể, hay còn gọi là vùng D-
loop (displacement loop), là vùng điều hòa chính và là vùng duy nhất trong hệ gen
ty thể không mã hóa protein. Vùng này chứa các điểm khởi đầu sao chép của chuỗi
nặng và chuỗi nhẹ và chứa promoter cho sự phiên mã chuỗi nặng và chuỗi nhẹ.
Ở ngƣời, vùng D-loop có chiều dài khoảng 1,1 kb, nằm từ vị trí 16024 –

16569/0 – 576 và giữa hai gen tRNA vận chuyển. Do không mang các gen mã hóa
protein nên các đột biến trung tính xảy ra nhiều và có thể nói là cao nhất so với toàn
bộ hệ gen ty thể, cao hơn các vùng khác từ 1,8 lần [35] đến 4,4 lần [69].
Năm 1983, Greenberg và cộng sự [29] đã xác định đƣợc hai đoạn DNA trong
vùng D-loop có tần số đột biến cao nhất đƣợc gọi là vùng siêu biến 1 (HV1 –
Hypervariable region) (có kích thƣớc 359 bp, nằm ở vị trí 16024 – 16365) và vùng
Luận văn Đỗ Mạnh Hưng
14

siêu biến 2 (HV2) (có kích thƣớc 325 bp, nằm ở vị trí 57 – 372). Theo Vanecek và
cộng sự[78] còn có một trình tự và một vùng siêu biến HV3 với các trình tự lặp lại 2
nucleotide CA. Cấu trúc của vùng điều khiển D-loop đƣợc thể hiện ở hình 1.4.


Hình 1.4. Cấu trúc vùng D-loop [79]
TAS (Termination – associated sequence): trình tự liên quan đến kết thúc sao chép; F
đến B: Các hộp trình tự bảo thủ của vùng trung tâm; CSBs (Conserved Block Sequences): các
khối trình tự bảo thủ liên quan đến quá trình khởi đầu sao chép và phiên mã.
Trình tự hoàn chỉnh vùng D-loop của nhiều dân tộc thuộc các châu lục trên
thế giới đã đƣợc công bố trong ngân hàng dữ liệu gen quốc tế về DNA ty thể [88].
Đến nay đã có vài nghìn trình tự vùng D-loop đã đƣợc công bố, trong đó có 186
trình tự hoàn chỉnh của hệ gen ty thể ngƣời thuộc các chủng tộc ngƣời khác nhau
đƣợc nghiên cứu và đăng ký [37].Tuy nhiên với tần số đột biến cao, nhiều điểm đa
hình nên hai vùng siêu biến HV1 và HV2 đƣợc tập trung nghiên cứu hơn cả, đặc
biệt là vùng siêu biến 1.
Ở một số cá thể, vùng siêu biến HV1 và HV2 có các đoạn lặp lại liên tiếp các
nucleotide Cytosine, thƣờng đƣợc gọi là các đoạn poly C. Ở vùng HV1 (dài 359
bp), đoạn poly C nằm từ vị trí 16183 – 16193 còn ở vùng HV2 (dài 315 bp) đoạn
poly C nằm từ vị trí 303 – 327. Ở trình tự chuẩn rCRS (trình tự hệ gen ty thể hoàn
chỉnh của ngƣời đầu tiên đƣợc Anderson và cộng sự công bố vào năm 1981), đoạn

poly C của vùng HV1 đƣợc ngắt quãng bởi nucleotide Thymine ở vị trí 16189, tuy
nhiên rất nhiều trình tự DNA ty thể có đột biến T16189C tạo thành chuỗi có 10
nucleotide Cytosine liên tiếp. Đột biến T16189C đƣợc xem là có tốc độ đột biến cao
nhất trong hệ gen ty thể ngƣời [49]. Nghiên cứu cho thấy có hiện tƣợng “dị tế bào
chất” ở đoạn poly C này, tức là trong tế bào và cơ thể có nhiều loại DNA ty thể có
chiều dài và trình tự đoạn poly C khác nhau. Điều này có thể là do sự dịch khung
Luận văn Đỗ Mạnh Hưng
15

đọc trong quá trình sao chép DNA. Tỷ lệ phần trăm các phân tử DNA ty thể mang
các độ dài đoạn poly C khác nhau là ổn định ở mỗi cá thể, đƣợc duy trì theo dòng
mẹ và đƣợc tạo mới trong quá trình phát triển [51].
Vùng D-loop của DNA ty thể trong nghiên cứu đa hình ở người
Hầu hết các nghiên cứu về tiến hóa của ngƣời đều dựa trên việc giải trình tự
DNA ty thể, đặc biệt là trình tự vùng điều khiển D-loop. Việc phân tích các đa hình
di truyền trong các trình tự nucleotide của DNA ty thể đã làm sáng tỏ về tiến hóa
của loài ngƣời ở khía cạnh nguồn gốc của các quần thể ngƣời hiện đại và các mô
hình di cƣ của loài ngƣời. Phân tích đa hình trình tự DNA ty thể để phân loại cá thể
theo các nhóm đơn bội và dò tìm tổ tiên tập trung chủ yếu vào nghiên cứu trình tự
vùng siêu biến 1 và 2, đặc biệt là vùng siêu biến 1. Điều này có đƣợc do tính đa
hình rất lớn của đoạn HV1. Trong 419 trình tự nucleotide của đoạn HV1 có 275 ví
trí nucleotide thay đổi, 188 vị trí mang 2 nucleotide khác nhau (164 vị trí là đồng
hoán, 24 vị trí là dị hoán), 66 vị trí với 3 nucleotide và 21 vị trí có mặt cả 4
nucleotide.
Do tần số đột biến cao nhƣ vậy nên vùng điều khiển D-loop nói chung và hai
đoạn siêu biến HV1 và HV2 nói riêng cũng thu hút sự tập trung nghiên cứu về mối
liên hệ của nó với bệnh tật, đặc biệt là các bệnh ung thƣ, bệnh di truyền, bệnh về cơ,
thần kinh Đa số các nghiên cứu cho thấy có mối liên hệ nhất định giữa các bệnh
với trạng thái dị tế bào chất ở DNA ty thể của các bệnh nhân [10;47]. Mặc dù các
nghiên cứu về vùng siêu biến 2 đƣợc thực hiện trong những năm gần đây tuy nhiên

ngƣời ta vẫn chƣa tìm thấy mối liên quan giữa vùng siêu biến 1 và vùng siêu biến 2
của DNA ty thể. Các nghiên cứu khác nhau đã đánh giá tốc độ đột biến liên quan tới
phả hệ của vùng HV1 và HV2 tuy nhiên vấn đề này vẫn còn gây tranh cãi.
Hai vùng siêu biến HV1 và HV2 dƣờng nhƣ có quá trình tiến hóa nhƣ nhau
mặc dù tính đa hình ở hai vùng chƣa đƣợc nghiên cứu, so sánh ở mức độ sâu. Do
DNA ty thể không tái tổ hợp nên toàn bộ phân tử có một lịch sử tiến hóa chung.
Tuy nhiên hai vùng HV1 và HV2 lại có tốc độ đột biến khác nhau và nếu sự khác
Luận văn Đỗ Mạnh Hưng
16

nhau trong tốc độ đột biến này đủ lớn thì các yếu tố đa hình của hai vùng siêu biến
có thể phản ánh đƣợc các quá trình tiến hóa khác nhau [62].
Tốc độ đột biến của DNA ty thể cao nhất ở vùng điều khiển D-loop tuy nhiên
tốc độ đột biến này lại phụ thuộc vào các vị trí nucleotide khác nhau. Một vài vị trí
nucleotide trong vùng điều khiển đột biến thƣờng xuyên hơn các vị trí khác và
thƣờng đƣợc gọi là các điểm nóng đột biến (mutational “hotspots”) [25]. Có rất
nhiều loại đột biến trong vùng điều khiển nhƣng chủ yếu là các đột biến thay thế.
Các đột biến này có vai trò rất quan trọng trong việc nghiên cứu nguồn gốc của
ngƣời hiện đại. Sau khi trình tự hoàn chỉnh của DNA ty thể đƣợc công bố và sau bài
báo của Cann và cộng sự (1987) thì DNA ty thể thực sự trở thành một chỉ thị di
truyền trong việc tái dựng lại quá trình tiến hóa của loài ngƣời. Thêm vào đó, tổng
hợp các số liệu về vùng mã hóa và vùng điều khiển của DNA ty thể cho phép xếp
các đa hình DNA ty thể vào các nhóm đơn bội khác nhau. Việc nghiên cứu hệ gen
ty thể, giải mã trình tự nucleotide của các vùng siêu biến HV1 và HV2 của vùng
điều khiển D-loop cũng nhƣ các gen khác của ty thể, dẫn đến giải mã toàn bộ hệ gen
ty thể của nhiều đại diện các dân tộc khác nhau sẽ cung cấp số liệu để phân loại các
nhóm đơn bội chính xác và chi tiết hơn [38].
Ngoài mục đích nghiên cứu các quan hệ di truyền theo mẫu hệ, nghiên cứu
về hệ gen ty thể các tộc ngƣời trên thế giới, đặc biệt là hai vùng siêu biến HV1 và
HV2 còn đƣợc dùng để xác định cá thể và quan hệ huyết thống, trong giám định hài

cốt liệt sỹ, giám định pháp y, điều tra tội phạm… Hiện nay, cùng với các nghiên
cứu về DNA ty thể, một đối tƣợng khác cũng đƣợc chú ý trong nghiên cứu di truyền
quần thể là nhiễm sắc thể Y [12]. Nếu nhƣ DNA ty thể di truyền theo dòng mẹ thì
sự phân tích nhiễm sắc thể Y, đặc biệt là vùng không tƣơng đồng với nhiễm sắc thể
X, giúp ta có cái nhìn về quá trình di truyền theo dòng bố. Với sự kết hợp hai nguồn
số liệu về DNA ty thể và nhiễm sắc thể Y thì bức tranh về lịch sử tiến hóa của loài
ngƣời, mối quan hệ giữa các dân tộc trên thế giới đã trở nên rõ ràng và chính xác
hơn. Mặc dù vậy, DNA ty thể với những thế mạnh của nó, vẫn chứng tỏ là một công
cụ hữu hiệu trong các nghiên cứu về quan hệ di truyền ngƣời.
Luận văn Đỗ Mạnh Hưng
17

1.3. ĐẶC ĐIỂM ĐA HÌNH CỦA NHIỄM SẮC THỂ Y
Ngoài DNA ty thể, phần không trao đổi chéo của nhiễm sắc thể Y (NRY -
non recombining region of the Y chromosome) cũng sở hữu những đặc tính di
truyền rất phù hợp cho việc nghiên cứu sự tiến hóa của ngƣời đƣợc di truyền theo
dòng bố. Hệ thống di truyền này đƣợc đặc trƣng bởi một số lƣợng lớn các đoạn
trình tự lặp lại ngắn (STR - Short Tandem Repeat) và các đa hình nucleotide đơn
(SNP) đã cung cấp cho các nhà nhân chủng học những thông tin quan trọng bổ sung
cho các kết quả nghiên cứu trên DNA ty thể.
1.3.1. Cấu trúc nhiễm sắc thể Y
Nhiễm săc thể Y của ngƣời là một trong 2 nhiễm sắc thể giới tính, chiều dài
khoảng 60 Mb và chiếm khoảng 2% tổng số DNA trong tế bào nam giới, nhỏ hơn
nhiều so với nhiễm sắc thể X (165 Mb). Nhiễm sắc thể Y đƣợc biết có chứa khoảng
90 gen mã hóa cho các protein, trong đó 23 gen là giả thiết, và trên 60000 SNP đã
đƣợc xác định [92]. Sơ đồ cấu tạo của nhiễm sắc thể Y đƣợc đƣợc giới thiệu trong
hình 1.5.
Hình 1.5. Sơ đồ cấu trúc phân tử của nhiễm sắc thể Y ngƣời [59]
Cấu trúc đƣợc mô tả gồm tâm động (CEN), hai vùng giả nhiễm sắc (PAR1 và
PAR2), khối chất dị nhiễm sắc và ba lớp trình tự vùng NRY gồm lớp thoái hóa X (X-

degenerate), lớp chuyển vị X (X-transposed) và lớp có nhiều bản sao giống nhau
(ampliconic).

×