Tải bản đầy đủ (.pdf) (86 trang)

PHÂN TÍCH TÍNH ĐA HÌNH CỦA TRÌNH TỰ 16S RNA, CYTOCHROME B TY THỂ VÀ MỐI QUAN HỆ PHÁT SINH LOÀI CỦA HEO RỪNG VIỆT NAM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (15.02 MB, 86 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
YZ

LÊ NGỌC CHÂU

PHÂN TÍCH TÍNH ĐA HÌNH CỦA TRÌNH TỰ 16S RNA,
CYTOCHROME B TY THỂ VÀ MỐI QUAN HỆ PHÁT SINH
LOÀI CỦA HEO RỪNG VIỆT NAM

Chuyên ngành: Di truyền học
Mã số chuyên ngành: 60 42 70
LUẬN VĂN THẠC SĨ: SINH HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. HOÀNG NGHĨA SƠN

Thành phố Hồ Chí Minh, năm 2012


LỜI CẢM ƠN
Lời đầu tiên, con xin gửi lòng biết ơn sâu sắc đến Ba Mẹ, người đã sinh thành
và dưỡng dục con nên người. Ba Mẹ là chỗ dựa vững chắc, nguồn động viên, cho con
nghị lực mạnh mẽ vượt qua những khó khăn, thử thách trong cuộc sống.
Và với tất cả lòng biết ơn chân thành, em xin gửi lời cảm ơn đến:
Thầy Hoàng Nghĩa Sơn đã tận tình hướng dẫn, tạo mọi điều kiện tinh thần và
vật chất tốt nhất cho em học tập, nghiên cứu và hoàn thành luận văn này.
Anh Lê Thành Long đã chỉ dạy tận tình, cho em những lời khuyên bổ ích và giúp
đỡ em tháo gỡ khó khăn trong suốt thời gian làm luận văn.
Cô Vân, chị Phương Thảo, anh Phúc Chiến và bạn Khánh Thanh thuộc phòng
Công nghệ sinh học động vật, viện Sinh học Nhiệt đới thành phố Hồ Chí Minh, đã


quan tâm và tạo điều kiện tốt nhất cho em hoàn thành luận văn.


Mục lục
Phụ bìa
Lời cảm ơn
Mục lục ................................................................................................................... i
Danh mục ký hiệu, chữ viết tắt ................................................................................ ii
Danh mục bảng ....................................................................................................... iii
Danh mục hình ........................................................................................................ iv
Mở đầu ................................................................................................................... 1
Chương 1: Tổng quan tài liệu
1.1.

Giới thiệu về heo rừng .................................................................................. 3

1.2.

Tiến hóa phân tử và phát sinh loài phân tử .................................................... 7

1.3.

Khái niệm loài .............................................................................................. 8

1.4.

Các khái niệm về phát sinh loài .................................................................... 9

1.5.


Một số marker phân tử .................................................................................. 15

1.6.

Các nghiên cứu về quan hệ phát sinh loài phân tử của heo rừng .................... 21

Chương 2: Vật liệu – Phương pháp
2.1.

Vật liệu ......................................................................................................... 24

2.2.

Phương pháp ................................................................................................. 27

Chương 3: Kết quả ‒ Biện luận
3.1.

Mối quan hệ phát sinh loài dựa trên trình tự gen cytochrome b ..................... 35

3.2.

Mối quan hệ phát sinh loài dựa trên trình tự 16S ........................................... 44

3.3.

Xây dựng cây phát sinh loài dựa trên mối quan hệ với gen

cytochrome b và gen 16S ......................................................................................... 53
Kết luận .................................................................................................................. 57

Danh mục công trình của tác giả .......................................................................... 58
Tài liệu tham khảo ................................................................................................. 59
Phụ lục

i


Danh mục ký hiệu, chữ viết tắt

Lê Ngọc Châu

Danh mục ký hiệu, chữ viết tắt
A

Adenine

C

Cytosine

CI

Consistency Index

CSB

Conserved Sequence Block

DNA


Deoxyribonucleic Acid

EN

Endangered

G

Guanine

HSP

H-Strand Promoter

IUCN

International Union for Conservation of Nature

LSP

Light-Strand Promoter

ME

Minimum Evolution

ML

Maximum Likelihood


MP

Maximum Parsimony

mRNA

messenger Ribonucleic Acid

NCBI

National Center for Biotechnology Information

NIH

National Institutes of Health

NJ

Neighbor - Joining

PCR

Polymerase Chain Reaction

PKCi

Protein Kinase C iota

rRNA


ribosomal Ribonucleic Acid

SNP

Single-Nucleotide Polymorphism

T

Thymine

TAE

Tris-Acetate-EDTA

TAS

Termination Associated Sequence

tRNA

transfer Ribonucleic Acid

UPGMA

Unweighted Pair-Group Method with Arithmetic mean

ii


Danh mục bảng


Lê Ngọc Châu

Danh mục bảng
Bảng 1: Một số thiết bị sử dụng trong đề tài .............................................................. 24
Bảng 2: Một số dụng cụ sử dụng trong đề tài ............................................................ 25
Bảng 3: Một số hóa chất sử dụng trong đề tài ........................................................... 26
Bảng 4: Địa điểm thu nhận mẫu heo rừng ................................................................. 28
Bảng 5: Trình tự mồi sử dụng trong PCR và giải trình tự .......................................... 32
Bảng 6: Nhiệt độ phản ứng của các đoạn mồi ........................................................... 33
Bảng 7: Vùng phân bố các cá thể heo rừng Việt Nam khu vực Tây Nguyên dùng trong
phân tích trình tự cytochrome b ................................................................................. 36
Bảng 8: Thông tin trình tự cytochrome b của cá thể heo rừng nước ngoài dùng
trong phân tích .......................................................................................................... 37
Bảng 9: Mức độ tương đồng vùng trình tự gen cytochrome b và chuỗi polypeptide
cytochrome b ở một số loài động vật ......................................................................... 41
Bảng 10: Vùng phân bố các cá thể heo rừng Việt Nam dùng trong phân tích
trình tự 16S................................................................................................................ 45
Bảng 11: Thông tin trình tự 16S của cá thể heo rừng nước ngoài dùng trong
phân tích ................................................................................................................... 46
Bảng 12: Mức độ tương đồng vùng trình tự gen 16S ở một số loài động vật .............. 50
Bảng 13: Mã số các cá thể heo rừng nước ngoài được sử dụng trong so sánh trình tự
kết hợp gen cytochrome b và 16S ............................................................................... 53
Bảng 14: Khoảng cách di truyền giữa các nhóm heo rừng ........................................ 54
Bảng 15: Khoảng cách di truyền trung bình giữa các cá thể trong các nhóm
heo rừng .................................................................................................................... 55

iii



Danh mục hình

Lê Ngọc Châu

Danh mục hình
Hình 1: Heo rừng trong môi trường tự nhiên ............................................................. 5
Hình 2: Heo rừng khi còn non ................................................................................... 7
Hình 3: Phân loại cây phát sinh loài theo Page và Holmes (1998) ............................ 10
Hình 4: Những mối quan hệ giữa loài tổ tiên và loài hiện tại .................................... 12
Hình 5: Cấu trúc DNA ty thể của người..................................................................... 16
Hình 6: Cấu trúc của protein cytochrome b ............................................................... 18
Hình 7: Cấu trúc vùng kiểm soát của ty thể ở động vật có vú..................................... 19
Hình 8: Một số thiết bị sử dụng ................................................................................. 24
Hình 9: Một số dụng cụ sử dụng ................................................................................ 25
Hình 10: Kit PureLinkTM Spin Column ...................................................................... 26
Hình 11: Sơ đồ tóm tắt thí nghiệm ............................................................................. 27
Hình 12: Một cá thể heo rừng lai thu nhận ở khu vực Lâm Đồng .............................. 29
Hình 13: Sơ đồ tóm tắt quy trình tách chiết ............................................................... 30
Hình 14: Hình đại diện kết quả khuếch đại vùng gen CY2 ở các mẫu heo rừng ......... 35
Hình 15: Vị trí các điểm đột biến và điểm đa hình trong vùng trình tự cytochrome b
(1140 bp) ở các cá thể heo rừng ................................................................................ 39
Hình 16: Vùng trình tự polypeptide cytochrome b gồm 336 amino acid được dịch mã từ
đoạn gen cytochrome b dài 1140 bp .......................................................................... 41
Hình 17: Cây phát sinh loài NJ (Neighbor‒Joining) mô tả mối quan hệ giữa các cá thể
heo rừng Việt Nam, heo rừng lai, Hàn Quốc, Tây Ban Nha, Trung Quốc và Rumani
dựa trên trình tự 1140 bp của gen cytochrome b........................................................ 43
Hình 18: Hình đại diện kết quả khuếch đại vùng gen S1 ở các mẫu heo rừng ............ 44
Hình 19: Vị trí các điểm đột biến và điểm đa hình trong vùng trình tự 16S (997 bp) ở
các cá thể heo rừng ................................................................................................... 48


iv


Danh mục hình

Lê Ngọc Châu

Hình 20: Cây phát sinh loài NJ (Neighbor‒Joining) mô tả mối quan hệ giữa các cá thể
heo rừng Việt Nam, heo rừng lai, Hàn Quốc, Tây Ban Nha và Đài Loan dựa trên trình
tự 997 bp của gen 16S ............................................................................................... 52
Hình 21: Cây phát sinh loài NJ (Neighbor‒Joining) mô tả mối quan hệ giữa các cá thể
heo rừng Việt Nam, heo lai Việt Nam, heo rừng Châu Âu, và heo rừng Châu Á dựa trên
trình tự 2100 bp của gen cytochrome b và 16S .......................................................... 56

v


Mở đầu

Lê Ngọc Châu

Mở đầu
Heo không những là vật nuôi quan trọng mang lại hiệu quả kinh tế cao mà còn
là mô hình thí nghiệm trên người ở những nghiên cứu sinh hóa và y sinh. Trong đó,
heo rừng (Sus scrofa) với nhiều tiềm năng mà con người vẫn chưa khám phá hết được.
Việc nghiên cứu loài heo này còn ít được quan tâm và còn nhiều bỏ ngỏ.
Định danh loài chính xác có vai trò quan trọng trong khoa học pháp y, an toàn
thực phẩm và nhiều lĩnh vực khác. Ý tưởng sử dụng các trình tự DNA đặc hiệu loài để
định danh loài đã được đưa ra trong những năm đầu thập niên 70. Việc giải toàn bộ
trình tự DNA ty thể hoặc giải trình tự một số vùng trên DNA ty thể như vùng kiểm soát

(J. Koji Lum, 2006), cytochrome b (Y. N. Jiang, 2008),… giúp xác định những biến dị
cũng như cây phát sinh loài giữa các loài heo bản địa trên thế giới, từ đó xác định được
mức độ đa dạng cũng nguồn gốc của loài heo trên thế giới (E. Giuffra, 2000).
Hiện nay một số nghiên cứu trên heo rừng thuần Việt Nam đã được tiến hành.
Vùng D‒loop của DNA heo rừng của Việt Nam ở một số tỉnh miền Bắc đã được giải
trình tự và xác định các biến dị giữa các loài heo bản địa cũng như so sánh loài heo
Việt Nam với loài heo của Nhật Bản (Naotaka Ishiguro, 2008) hay việc sử dụng
microsatellites để đánh giá so sánh tính đa hình cũng như mức độ đa dạng di truyền của
một số loài heo rừng miền Bắc với châu Âu (N.T.D. Thuy, 2006). Tuy nhiên, các
nghiên cứu sử dụng heo rừng khu vực miền Trung, miền Nam cũng như trình tự
cytochrome b và 16S trong đánh giá biến dị và đa dạng di truyền vẫn chưa được quan
tâm nghiên cứu đầy đủ.
Trong đề tài này, chúng tôi tiến hành giải trình tự vùng cytochrome b và 16S của
DNA ty thể heo rừng Việt Nam khu vực Tây Nguyên và phân tích điểm đa hình cũng
như những khác biệt di truyền của heo rừng Việt Nam khu vực Tây Nguyên so với một
số loài heo rừng các nước khác. Kết quả nghiên cứu này là cơ sở cho các nghiên cứu
tiếp theo như bảo tồn hay sử dụng nguồn gen heo rừng Tây Nguyên trong công tác lai
tạo giống.

1


Mở đầu

Lê Ngọc Châu

Mục tiêu đề tài
1. Giải trình tự gen cytochrom b và gen 16S. Xác định các SNP (single nucleotide
polymorphism) và thiết lập bộ đa hình đặc trưng của heo rừng Việt Nam khu vực
Tây Nguyên.

2. Xác định cây phát sinh loài giữa heo rừng thuần Việt Nam với một số loài heo
rừng trên thế giới.

Tóm tắt nội dung đề tài
Gen cytochrome b và 16S được sử dụng nhiều trong nghiên cứu mối quan hệ
phát sinh loài. Sau khi thu nhận DNA tổng từ mẫu mô tai heo rừng, chúng tôi khuếch
đại trình tự gen mục tiêu bằng phương pháp PCR với các cặp mồi đặc hiệu. Kết quả
điện di trên gel 1% agarose cho thấy có sự hiện diện sản phẩm khuếch đại gen
cytochrome b và 16S ở 20 mẫu mô. Sản phẩm khuếch đại được giải trình tự, loại bỏ
những đoạn trùng lắp và những đoạn nhiễu ở hai đầu 5’ và 3’. Các trình tự vùng gen
cytochrome b và 16S của heo rừng Việt Nam được phân tích các điểm đa hình và so
sánh với trình tự tương ứng của heo rừng nước ngoài trên GenBank. Kết quả phân tích
riêng từng gen cho thấy heo rừng thuần Việt Nam khu vực Tây Nguyên có bộ đa hình
đặc trưng, phân biệt với heo rừng lai và heo rừng các nước. Kết quả phân tích dựa trên
trình tự kết hợp của hai gen càng củng cố những đặc điểm riêng của heo rừng Việt
Nam khu vực Tây Nguyên. Ngoài ra, trình tự nucleotide của 2 gen và chuỗi
polypeptide (chỉ ở gen cytochrome b) của heo rừng thuần Việt Nam được so sánh với
trình tự tương ứng của một số loài khác đã khẳng định tính bảo tồn cao ở động vật có
vú. Như vậy, bằng phương pháp PCR và giải trình tự, chúng tôi bước đầu xác định
được bộ đa hình đặc trưng cho heo rừng Việt Nam khu vực Tây Nguyên; phân biệt
giữa heo rừng lai và heo rừng thuần Việt Nam dựa trên nguồn trình tự cytochrome b và
16S.

2


CHƯƠNG 1

TỔNG QUAN TÀI LIỆU



Tổng quan tài liệu

Lê Ngọc Châu

1.1. Giới thiệu về heo rừng
1.1.1. Phân loại
Heo rừng (Sus scrofa) không phải là loài thú quý hiếm, nổi tiếng như sao la
(Psendoyx nghetinhensis) hay mang lớn (Megamuntiacus vuquangensis) nhưng lại là
loài thú có giá trị kinh tế cao. Theo IUCN, heo rừng được xếp vào nhóm gặp nguy
hiểm (Endangered – EN). Chúng phải đối mặt với nguy cơ tuyệt chủng trong tự nhiên
rất cao (Oliver, 2008).
Heo rừng còn gọi là lợn lòi, tên khoa học là Sus scrofa (Linnaeus, 1758) thuộc
họ heo (Suidae), bộ guốc chẵn (Artiodaclyta). Heo rừng có rất nhiều loài phụ. Các loài
phụ khác nhau có thể được phân biệt dựa trên chiều dài, hình dáng của xương hốc mắt
ví dụ như S.scrofa cristatus và S.scrofa vittatis có xương hốc mắt ngắn hơn các loài
Châu Âu (Kingdon, 1997). Dưới đây là một số phụ loài heo rừng đã được nhận biết
(Groves, 2008):
 Nòi Viễn Tây (nhóm scrofa)
a. Heo rừng phổ biến nhất: sus scrofa scrofa: phân bố chính từ Pháp tới vùng
phía tây Châu Âu (Nga).
b. Heo rừng Iberia: sus scrofa baeticus: một phụ loài nhỏ trên bán đảo Iberia.
c. Heo rừng Castilia: sus scrofa castilia: lớn hơn S. s. baeticus, phía bắc Tây
Ban Nha (Wilson, 2005).
d. Heo rừng Sandinia: sus scrofa meridionalis: một loài heo rừng nhỏ từ
Corsica, Sadinia và Andalisua. Heo rừng Italia: sus scrofa majori: loài heo
rừng này nhỏ hơn S. s. scrofa.
e. Sus scrofa Attila: loài heo rừng rất lớn sống ở phía tây Châu Âu từ
Kazakhstan, tới bắc Caucausus và Iran (Groves, 2008).
f. Heo rừng Barbary: sus scrofa algria: sống ở vùng Maghreb phía tây bắc

Châu Phi.

3


Tổng quan tài liệu

Lê Ngọc Châu

g. Sus scrofa lybica: một loài heo rừng nhỏ sinh sống ở khu vực Caucasus,
đồng bằng sông Nile, Thổ Nhĩ Kì và khu vực Balkan (Groves, 2008).
h. Sus scrofa sennaarensis: phân bố ở Ai Cập, và phía bắc Sudan.
i. Sus scrofa nigripes: loài heo rừng chân đen sinh sống ở dãy núi Tianshan,
khu vực Trung Á.
 Nòi heo Ấn Độ
a. Heo rừng Ấn Độ: sus scrofa cristatus: sinh sống ở vùng phía nam núi
Hymalaya tới trung Ấn Độ và phía tây Indonesia.
b. Sus scrofa affinis: phân bố vùng phía nam Ấn độ và Srilanka.
c. Sus scrofa davidi: phân bố phía đông Iran tới phía bắc Tajikistan.
 Nòi heo Đông Á
a. Heo rừng Manchuria: sus scrofa ussuricus, loài heo rừng lớn nhất, phân bố
từ Manchuria tới Hàn Quốc.
b. Heo rừng Nhật Bản: sus scrofa leucomystax: là loài heo nhỏ phân bố ở Nhật
Bản (trừ đảo Hokkaido).
c. Heo rừng Ruykyu: sus scrofa riukiuanus: phân bố ở quần đảo Ryukyu.
d. Heo rừng Formosa: sus scrofa taivanus, phân bố ở Đài Loan.
e. Sus scrofa moupinensis: phân bố ở Trung Quốc và Việt Nam.
f. Heo rừng Siberia: Sus scrofa sibiricus, phân bố ở Mông Cổ và Transbaikalia.
 Nòi Sundaic
Sus scrofa vittatus: loài heo rừng nhỏ, mặt ngắn, phân bố từ bán đảo Malaysia

và Indonesia từ đảo Sumatra và Java tới Komodo.

4


Tổng quan tài liệu

Lê Ngọc Châu

(A)

(B)
Hình 1: Heo rừng trong môi trường tự nhiên:
(A) Sus scrofa cristatus (Nguồn: haryana-online.com)
(B) Sus scrofa scrofa (Nguồn: en.wikipedia.org)

1.1.2. Đặc điểm chung
Heo rừng phân bố khắp nơi trên thế giới. Ở Việt Nam, chúng có mặt từ trung du
đến miền núi. Phạm vi hoạt động của heo rừng rất rộng. Chúng sống được trong nhiều
sinh cảnh khác nhau như rừng thứ sinh, rừng thưa (trừ núi đá) nhưng thích hợp nhất là
những thung lũng ven các suối nước có độ ẩm cao, nhiều thức ăn như rừng tre nứa, gần
nương rẫy. Chúng sống theo bầy đàn, có những bầy đàn lớn từ 20–100 con. Tuy nhiên,
chúng ta thường chỉ gặp những đàn dưới 20 con. Những con đực bình thường vẫn kiếm
ăn một mình, đến mùa động dục chúng mới nhập đàn, tìm bạn tình. Chúng thường
kiếm ăn vào ban đêm từ chập tối đến gần sáng và nghỉ ngơi trong bụi rậm vào buổi

5


Tổng quan tài liệu


Lê Ngọc Châu

sáng. Mùa đông, chúng làm tổ để nằm. Thỉnh thoảng chúng cũng ra khỏi rừng tìm đến
những nương rẫy hoặc những nơi có sẵn măng tre vào sáng sớm hoặc chiều tối.
Hình dáng của chúng rất giống heo nhà. Phần mông nhỏ hơn, phần đầu và ngực
rất phát triển. Bộ lông thô, dài, cứng, màu đen xám. Lông gáy dày và rậm, khi bị kích
động hàng lông này dựng lên rất dữ tợn. Bộ răng heo rừng rất phát triển, nanh chìa ra
ngoài khá dài. Đặc biệt mỗi đàn còn có con đực già, to lớn gọi là heo độc. Heo độc
thường rất khoẻ, có thể đánh nhau để bảo vệ đàn. Trọng lượng cơ thể của heo trưởng
thành từ 40‒200kg. Thân dài từ 135–150 cm, cao 50–70 cm, bàn chân sau phát triển.
Sọ heo rừng khá dài, khẩu cái tới 20–22cm, rất thích hợp cho việc đào bới, ủi đất tìm
kiếm thức ăn.
Heo rừng là loài ăn tạp, chúng có thể ăn bất cứ thứ gì từ quả cây, nấm, củ, rễ đến
giun đất, rắn rết, ốc sên, chuột, xác động vật kể cả khi đã thối rữa. Thức ăn khoái khẩu
nhất là các loại củ quả giàu tinh bột và các loại cây nhiều chất xơ như chuối, măng.
Heo rừng sinh sản quanh năm. Thời gian mang thai khoảng 4 tháng, mỗi năm
1‒2 lứa, mỗi lứa 5‒6 con. Tuy nhiên, thích hợp nhất vẫn là mùa xuân và mùa thu. Heo
mẹ làm tổ để đẻ rất chu đáo. Heo con sau khi đẻ 30 phút có thể đi lại bình thường, sau
một tuần có thể theo mẹ đi kiếm ăn và sau 2 năm thì trưởng thành sinh dục (theo
thiennhien.net).
1.1.3. Đặc điểm của heo rừng Việt Nam
Heo rừng Việt Nam nhỏ, thường chỉ nặng từ 35–50kg. Mõm dài và nhọn, đầu
nhỏ, tai nhỏ, cổ dài thắt ngẫng, không có má. Lông heo rừng thường là 3 lông mọc
cùng một chỗ, trong khi heo nhà thì lông mọc rời rạc. Con non chậm lớn, màu lông
thường là hung đen, có sọc vàng chạy dọc theo thân. Heo con mới đẻ nuôi rất khó và
hay bị chết do hay bị bệnh đi phân trắng. Heo mẹ thường đẻ ít con (2‒3 con/lứa)
nên hiệu quả kinh tế không cao. Trong sản xuất, người dân thường chỉ nuôi con lai giữa
heo rừng (heo bố) và heo nhà (heo mẹ).


6


Tổng quan tài liệu

Lê Ngọc Châu

Hình 2: Heo rừng khi còn non (Nguồn: fieldguides.eol.org)
1.2. Tiến hoá phân tử và phát sinh loài phân tử
Thông tin di truyền của mọi sinh vật trong sinh giới (trừ vài virus) được quy
định bởi trình tự sắp xếp của bốn loại nucleotide: adenine (A), thymine (T), guanine
(G), cytosine (C). Trong quá trình tồn tại và phát triển, trải qua quá trình tiến hóa, trình
tự thông tin di truyền của sinh vật xuất hiện những sai khác ở một hay một vài vị trí
nucleotide so với trình tự ban đầu. Vì vậy, trình tự thông tin di truyền của sinh vật này
có thể so sánh với các sinh vật khác để tìm ra mối quan hệ tiến hóa giữa chúng.
Kỷ nguyên sinh học phân tử thực sự bắt đầu sau sự kiện toàn bộ trình tự bộ gen
của Haemophilus influenza được công bố vào tháng 7 năm 1995. Ngày 14–04‒2003,
toàn bộ trình tự DNA người đã được giải mã và công bố tại hội nghị thường niên của

7


Tổng quan tài liệu

Lê Ngọc Châu

NIH. Theo đánh giá của các nhà khoa học: “đây là ngày chúng ta hoàn tất lần xuất bản
đầu tiên Cuốn sách của sự sống.” Rõ ràng, trình tự DNA được công nhận là tài liệu vô
giá ghi nhận lịch sử sự sống trên trái đất. Những thông tin sự sống được mã hóa bằng
trình tự gen như thế nào hay bằng cách nào có thể khôi phục lại nguồn thông tin này là

trách nhiệm vô cùng quan trọng của tiến hóa phân tử.
Những thông tin thu được từ hình thái các nhóm sinh vật còn tồn tại cũng như từ
những mẫu vật hóa thạch vẫn không thể giải thích đầy đủ và chính xác nguyên nhân
quá trình tiến hóa hình thành loài mới, bằng cách nào mà tỷ lệ hình thành loài mới vượt
qua thời gian. Những vấn đề này sẽ giúp chúng ta hiểu hơn về những mô hình cơ bản
và cả những quá trình tiến hóa hình thành loài mới và tồn tại sự sống.
1.3. Khái niệm loài (Ouithavon, 2009)
Kể từ thời Linnaeus, khái niệm “loài” ngày càng được hoàn thiện nhờ những
kiến thức từ sinh hóa và di truyền học. Ngày nay, nhiều khái niệm “loài” được phát
biểu dựa trên các quan điểm về hình thái, di truyền, nguồn gốc…vẫn tồn tại song song.
 Loài hình thái
“Loài là một nhóm các cá thể hay nhóm quần thể có đặc điểm hình thái giống
nhau hoặc tương tự nhau”. Đây là khái niệm loài được phát biểu từ thời Linnaeus
(1707–1778), khi ông cho rằng mọi sinh vật đều phải thuộc một đơn vị phân loại thấp
nhất là “loài”.
 Loài sinh học
“Loài là một hoặc một nhóm quần thể có khả năng giao phối với nhau trong tự
nhiên, sinh ra đời con có sức sống, có khả năng sinh sản, cách ly sinh sản với các nhóm
quần thể khác”. Tuy nhiên, khái niệm loài sinh học chỉ có thể áp dụng cho các loài sinh
sản hữu tính mà bỏ qua các loài sinh sản vô tính, trinh sản. Bên cạnh đó, khái niệm này
cũng không nêu được trình tự thời gian tồn tại loài, đánh giá mức độ cách ly sinh sản
giữa các loài.

8


Tổng quan tài liệu

Lê Ngọc Châu


 Loài tiến hóa
“Loài là một dòng duy nhất các cá thể hậu duệ của một tổ tiên chung, duy trì và
phân biệt đặc điểm với loài khác, chịu sự tác động của lịch sử và quá trình tiến hóa”,
(Wiley,1978). Theo quan điểm này, tất cả các loài trong quá khứ và loài hiện tại có
chung một con đường tiến hóa; không có dòng sinh vật nào có thể được chia thành loài
tổ tiên và loài hậu duệ. Mayr (1982) đã chỉ ra các khuyết điểm của khái niệm loài tiến
hóa như: giảm thiểu các vấn đề của loài, quá trình tích lũy và duy trì những gián đoạn
giữa các loài, làm thế nào để phân loại các loài đa chiều…(Ouithavon, 2009)
 Loài phát sinh
“Loài là một nhóm nhỏ nhất các cá thể mang một phần đặc điểm của tổ tiên và
của bố mẹ”, (Cracraft, 1983). Cracraft cho rằng nếu cách ly sinh sản không được coi là
vấn đề chính trong sự khác biệt phân loại thì đó phải là hoạt động sơ khai và sinh sản
ngẫu nhiên. Theo khái niệm này, loài được ghi nhận rất nghiêm ngặt về tình trạng của
chúng, chẳng hạn như thông tin quá trình tiến hóa. Theo đó, hai đơn vị phân loại thân
thuộc có thể giao phối và vẫn được xem là loài nếu như chúng có những đặc điểm riêng
biệt nhau (Ouithavon, 2009).
1.4. Các khái niệm về phát sinh loài
Ngày nay, các đặc tính loài kế thừa từ tổ tiên, được lưu giữ thông qua trình tự
DNA đã bổ sung thêm thông tin cho hình thái học, cung cấp những hiểu biết tốt hơn về
phát sinh loài. Điều này giúp cho chúng ta hiểu hơn về lịch sử của loài cũng như mối
quan hệ giữa loài này với các loài khác. Phát sinh loài hay cây tiến hóa là một cấu trúc
toán học được sử dụng để mô hình hóa thực tế lịch sử tiến hóa của các nhóm trình tự
hay các sinh vật.
1.4.1. Cây phát sinh loài
Một cây phát sinh loài gồm có các node (điểm) được nối với nhau bởi các
“nhánh”. Cấu trúc của nó bao gồm: “điểm tận cùng” là thông tin đại diện cho nhóm
trình tự hay loài sinh vật, vẫn đang tồn tại hoặc đã tuyệt chủng; “điểm trung gian” thể

9



Tổng quan tài liệu

Lê Ngọc Châu

hiện các tổ tiên giả thuyết; “gốc” thể hiện tổ tiên của tất cả trình tự trên cây tiến hóa.
Nghiên cứu phát sinh loài tập trung vào mức độ cấu trúc của loài, cụ thể là mối quan hệ
giữa các loài trong nhóm cao hơn (chẳng hạn như chi). Page và Holmes (1998) giải
thích rằng cây phát sinh loài phân thành ba dạng phân loại cơ bản dựa vào tên chính
thức của các nhóm, bao gồm:
 Monophyletic: tất cả các loài trong nhóm là hậu duệ từ một tổ tiên chung và tổ
tiên này không là tổ tiên của bất kì nhóm nào khác.
 Polyphyletic: những loài trong nhóm này là hậu duệ từ một vài tổ tiên mà tổ tiên
này cũng là tổ tiên của những loài trong nhóm khác.
 Paraphyletic: đây là nhóm không chứa những loài là hậu duệ từ những tổ tiên
chung gần nhất của các loài thành viên.

Hình 3: Phân loại cây phát sinh loài theo Page và Holmes (1998)

10


Tổng quan tài liệu

Lê Ngọc Châu

1.4.2. Các thuật ngữ dùng trong cây phát sinh loài (Page và Holmes, 1998)
Cây phát sinh loài bao gồm một tập hợp các trình tự bao hàm sự tiến hóa khác
nhau. Có vài cách khác nhau để biểu diễn những thay đổi tiến hóa trên cây phát sinh
loài thông qua các thuật ngữ.

 Plesiomorphy: sinh vật có trình tự thông tin tương đồng với tổ tiên chung của tất
cả những trình tự đã nghiên cứu trước đó.
 Apomorphy: ngược lại với plesiomorphy, là nhánh sinh vật có những khác biệt
cơ bản so với tổ tiên chung.
 Autapomorphy: tương tự như apomorphy, nhưng là những tình trạng đặc tính
tồn tại duy nhất.
 Synapomorphy: tương tự như apomorphy, nhưng chia sẻ những tình trạng tồn tại
với nhau và không tìm thấy những loài thân cận.


Homoplasy: sinh vật có những trình tự di truyền tương tự nhau, được thừa
hưởng một cách độc lập từ những tổ tiên của chúng. Những sinh vật này không
thấy rõ mối quan hệ tiến hóa do những điểm tương đồng không phản ánh được
mối quan hệ tổ tiên.

11


Tổng quan tài liệu

Lê Ngọc Châu

Hình 4: Những mối quan hệ giữa loài tổ tiên và loài hiện tại
 Chỉ số bootstrap: là tần số xuất hiện của một nhóm (cluster) trên số lần giản đồ
được thiết lập. Đơn vị tính là % (phần trăm). Theo Felsenstein (1985), bootstrap
là một công cụ hỗ trợ cho việc xây dựng cây phát sinh loài. Chỉ số bootstrap nói
lên độ tin cậy của sự gần gũi các thành viên trong nhóm của cây phát sinh loài.
 Chỉ số CI (Consistency Index): là tỷ số đo tương thích giữa một cây bất kỳ nào
đó trong tổng số các cây được phân tích có tổng số nhánh ít nhất. Giá trị CI biến
động trong khoảng 1.0 (tương thích tối đa) tiệm cận đến 0 (ít tương thích nhất).

Giá trị CI càng lớn thì kết quả có mức độ tin cậy càng cao.
 Khoảng cách di truyền: Khoảng cách di truyền giữa hai chuỗi trình tự là số sự
kiện tiến hóa xuất hiện kể từ khi hai chuỗi phân tách từ một tổ tiên chung.

12


Tổng quan tài liệu

Lê Ngọc Châu

Khoảng cách di truyền là cơ sở cho việc xây dựng cây phát sinh loài dựa trên
phương pháp khoảng cách. Tính khoảng cách di tuyền khi so sánh các trình tự
(DNA, polypeptide) phải căn cứ vào nhiều yếu tố, đặc biệt là mô hình thay thế
nucleotide (dùng trong phân tích DNA) và ma trận thay thế acid amin (trong
phân tích polypeptide).
1.4.3. Xây dựng cây phát sinh loài
Phân tích thông tin di truyền trong nghiên cứu phát sinh loài rất quan trọng
trong nghiên cứu lịch sử tiến hóa của sự sống. Nhiệm vụ cơ bản của tiến hóa phân tử là
chuyển đổi thông tin di truyền trong trình tự DNA thành cây phát sinh loài. Có hai
phương pháp thường được sử dụng dựa trên những dữ liệu đã được xử lý:
 Phương pháp khoảng cách: đầu tiên là chuyển đổi các trình tự thành những đơn
vị khoảng cách “pair–wise”, sau đó nhập các đơn vị này vào ma trận xây dựng
cây phát sinh loài.
 Phương pháp tách biệt: xây dựng cây dựa trên vị trí nucleotide một cách trực
tiếp.
1.4.3.1. Phương pháp khoảng cách (Page và Holmes, 1998)
Trong các phương pháp khoảng cách, khoảng cách tiến hóa của nucleotide thay
thế giữa hai đơn vị phân loại, tính cho tất cả các cặp của các đơn vị phân loại và cây
phát sinh loài được xây dựng bằng cách sử dụng một thuật toán dựa trên một số mối

quan hệ chức năng trong số các giá trị khoảng cách .
 Goodness of fit measures: phương pháp này tạo ra cây tốt nhất cho khoảng cách
quan sát đầu tiên, bước thứ hai tạo ra cây có tổng chiều dài nhánh là tối thiểu.
 Phương pháp ME (Minimum Evolution): cây tiến hóa ME là cây có tổng chiều
dài nhánh thấp nhất. Tuy nhiên, chiều dài trong trường hợp này được tính toán
từ khoảng cách pair–wise giữa những trình tự thì ít hơn từ vị trí của các
nucleotide. Một cây tương đồng được thiết lập trước tiên. Sau đó, cây này sẽ
được tính toán và sắp xếp lại tạo ra một cây tiến hóa ngắn hơn.

13


Tổng quan tài liệu

Lê Ngọc Châu

 Phương pháp NJ (Neighbor‒Joining): là phương pháp được sử dụng rộng rãi để
xây dựng cây tiến hóa dựa trên sự kết hợp giữa tốc độ tính toán và tính duy nhất
của kết quả. Phương pháp này là một phương pháp phân nhóm chứ không phải
phương pháp tối ưu. Tuy nhiên, đây là một phương pháp hữu ích để kiểm chứng
cây tiến hóa tối thiểu cũng được xem như dạng đơn giản của phương pháp tiến
hóa tối thiểu. Điểm chính của phương pháp này là hai đơn vị phân loại được kết
nối với nhau bằng một node nội bộ riêng lẻ thành một cây chia hai nhánh không
có gốc. Như vậy, hai loài được coi là có quan hệ thân thuộc nếu chúng được liên
kết bằng một node nội bộ riêng lẻ.
 Phương pháp UPGMA (Unweighted Pair‒Group Method with Arithmetic
mean): đây là phương pháp đơn giản nhất để xây đựng cây tiến hóa. Phương
pháp này ban đầu được sử dụng trong những bản ghi xây dựng nhưng nó cũng
được dùng để dựng cây tiến hóa khi tỷ lệ tiến hóa gần như không đổi. Trừ khi tỷ
lệ thay đổi vị trí thông tin di truyền là một hằng số, UPGMA thường cho một

cấu trúc liên kết không chính xác.
1.4.3.2. Phương pháp tách biệt (Page và Holmes, 1998)
Phương pháp này hoạt động trực tiếp trên những trình tự hoặc dữ liệu đặc điểm
riêng và hạn chế hoạt động trên những khoảng cách “pair–wise”. Do đó, phương pháp
này sẽ hạn chế tình trạng thiếu sót thông tin khi những trình tự ở quá xa nhau.
 Phương pháp MP (Maximum Parsimony): phương pháp này sẽ chọn lựa cây tiến
hóa thỏa điều kiện là số lượng đặc tính bị biến đổi phải thấp nhất để giải thích
những dữ liệu đã quan sát được. Phương pháp MP giả định cho rằng cây tiến
hóa tốt nhất mô tả tiến trình tiến hóa tốt nhất chính là cây mô tả được các loài ít
thay đổi nhất tức là có ít đột biến nhất, cây vì thế có điểm thấp nhất theo một
tiêu chuẩn định sẵn.
 Nhóm phương pháp ML (Maximum Likelihood): nhóm phương pháp này dựa
trên một hàm toán học tính toán xác suất khả năng một cây tiến hóa được tạo

14


Tổng quan tài liệu

Lê Ngọc Châu

thành từ dữ liệu đã quan sát. Hàm này cho phép việc tích hợp các quá trình tiến
hóa của đặc tính thành mô hình xác suất. Phương pháp ML chọn lựa cây tiến
hóa tối đa mà khi quan sát các dữ liệu dưới một mô hình nào đó có xác suất tối
đa.
1.5. Một số marker phân tử
1.5.1. DNA ty thể (mtDNA)
Mỗi ty thể có khoảng 12‒15 phân tử DNA dạng vòng trong chất nền. DNA của
ty thể (mtDNA) cũng có cấu trúc sợi xoắn kép theo mô hình Watson-Crick và giống
DNA của vi khuẩn (DNA dạng trần, không có histon và có cấu tạo vòng). DNA ty thể

chứa hệ gen mã hóa cho khoảng 13 protein của riêng ty thể. Các dạng mRNA, tRNA,
rRNA trong ty thể đều được phiên mã từ DNA ty thể và chúng là cơ sở để ty thể tự
tổng hợp lấy một số protein của mình. Hệ gen của ty thể được sắp xếp rất hiệu quả:
không có intron, vùng “trống” do khung đọc mở chồng lên nhau nhỏ. Vùng kiểm soát
là vùng không mã hóa chính, có chức năng điều hòa quá trình phiên mã ở chuỗi nặng
và chuỗi nhẹ cũng như quá trình sao chép chuỗi nặng.

15


Tổng quan tài liệu

Lê Ngọc Châu

Hình 5: Cấu trúc DNA ty thể của người
DNA ty thể được xem như một marker phân tử nhờ những ưu điểm sau
(Ouithavon, 2009):
 Tỷ lệ đột biến của DNA ty thể cao gấp 10 lần so với DNA trong nhân do cơ chế
sửa sai trong quá trình sao chép không hiệu quả. Chính vì vậy DNA ty thể rất
hữu ích cho việc phân tích mối quan hệ di truyền của từng cá thể trong nhóm
của cùng một loài hoặc đánh giá mối quan hệ giữa các cá thể (mối quan hệ tiến
hóa) giữa các loài khác nhau, từ đó có thể biết được khoảng cách tiến hóa giữa
các loài. Khi một loài nào đó có mối quan hệ tiến hóa càng xa thì số lượng sự
khác biệt trở nên lớn hơn.
 Những vùng khác nhau của DNA ty thể có mức độ tiến hóa khác nhau. Điều này
tạo điều kiện thuận lợi cho việc lựa chọn vùng gen thích hợp với từng mục tiêu
nghiên cứu.

16



Tổng quan tài liệu

Lê Ngọc Châu

 Ở động vật, DNA ty thể di truyền theo dòng mẹ ở hầu hết các loài, do đó nó rất
hữu ích trong việc nghiên cứu di truyền phả hệ theo dòng mẹ. Bên cạnh đó,
DNA ty thể còn là cơ sở nghiên cứu tổ tiên chung của các loài sau một quá trình
tiến hóa lâu dài do không xảy ra quá trình tái tổ hợp.
 DNA ty thể được xem như một marker trung tính do những đột biến xảy ra trên
DNA ty thể không làm ảnh hưởng đến khả năng tồn tại của sinh vật. Vì vậy, đột
biến xảy ra trên ty thể không làm mất đi những kiểu gen của sinh vật đã được
chọn lọc trong quá trình tiến hóa.
1.5.2. Gene cytochrome b
Cytochrome b là một thành viên trong họ cytochrome (a, b và c). Mỗi phân tử
mang 2 nhân heme có khối lượng khoảng 40 kDa và hấp thu ánh sáng ở bước sóng
556‒560 nm (Keilin, 1925). Cytochrome b có vai trò vận chuyển điện tử trong quá
trình hô hấp ở ty thể.
Gen cytochrome b được sử dụng rộng rãi trong nghiên cứu tiến hóa vì quá trình
đột biến xảy ra chậm chạp. Nhiều phần của gen cytochrome b được bảo tồn do chức
năng của nó còn hạn chế. Mặc dù gen cytochrome b đột biến chậm nhưng tỷ lệ những
đột biến im lặng lại xảy ra rất cao. Vì vậy, cytochrome b có tính ổn định và biến đổi
phù hợp để nghiên cứu sâu hơn về những mối quan hệ tiến hóa. Phần lớn những vị trí
hay xảy ra biến động nằm trong vùng mã hóa cho màng vận chuyển, các gốc amin và
gốc cacboxyl ở vùng đầu tận. (Ouithavon, 2009)

17



×