Tải bản đầy đủ (.pdf) (61 trang)

Nghiên cứu đa dạng di truyền nguồn gen dây thường xuân (hedera nepalensis k koch) ở miền bắc việt nam dựa trên chỉ thị matk​

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.26 MB, 61 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA Y DƯỢC
--------

ĐỖ HẠNH NGUYÊN

NGHIÊN CỨU ĐA DẠNG DI TRUYỀN NGUỒN GEN
DÂY THƯỜNG XUÂN (Hedera nepalensis K. Koch)
Ở MIỀN BẮC VIỆT NAM DỰA TRÊN CHỈ THỊ matK

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC

Hà Nội - 2020


ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA Y DƯỢC
--------

Người thực hiện: ĐỖ HẠNH NGUYÊN

NGHIÊN CỨU ĐA DẠNG DI TRUYỀN NGUỒN GEN
DÂY THƯỜNG XUÂN (Hedera nepalensis K. Koch)
Ở MIỀN BẮC VIỆT NAM DỰA TRÊN CHỈ THỊ matK

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
(NGÀNH DƯỢC HỌC)

Khóa

: QH2015.Y



Người hướng dẫn

: ThS. Phạm Thị Hồng Nhung

Lời cảm ơn

Để hồn thành khóa luận, tơi đã nhận được rất nhiều sự giúp đỡ quý
bạn

Hà Nội - 2020


LỜI CẢM ƠN
Để hồn thành khóa luận, tơi đã nhận được rất nhiều sự giúp đỡ quý báu cả
về vật chất lẫn tinh thần, về những kinh nghiệm và kiến thức chuyên môn của các
thầy cô, bạn bè và gia đình. Lời đầu tiên, tơi xin bày tỏ sự kính trọng và lòng biết ơn
sâu sắc tới ThS. Phạm Thị Hồng Nhung – Giảng viên Khoa Y Dược – Đại học
Quốc gia Hà Nội, người tận tình chỉ bảo và hướng dẫn tơi trong suốt q trình
nghiên cứu đề tài và hồn thành khóa luận này. Tơi xin cảm ơn ThS. Đỗ Thị Lệ
Hằng và bạn Bùi Thị Yến đã hỗ trợ và giúp đỡ tơi trong q trình thực nghiệm. Các
cô, các bạn không chỉ trang bị cho tôi kiến thức, mà cịn truyền cho tơi niềm đam
mê, lịng nhiệt huyết, sự kiên trì và ln sẵn sàng giúp đỡ mỗi khi tơi gặp khó khăn.
Tơi xin chân thành cảm ơn các thầy cô giáo Bộ môn Y Dược học cơ sở đã
hết lòng quan tâm, giúp đỡ và tạo điều kiện tốt nhất cho tôi thực hiện nghiên cứu và
hồn thành khóa luận tốt nghiệp này.
Tơi cũng xin cảm ơn những cán bộ tại Viện Dược liệu - Bộ Y tế đã khơng
quản ngại khó khăn thu thập và cung cấp mẫu vật giúp đỡ tôi thực hiện đề tài một
cách thuận lợi nhất.
Tôi xin gửi lời cảm ơn tới Ban chủ nhiệm khoa, cùng toàn thể các thầy cô

giáo Khoa Y Dược - Đại học Quốc gia Hà Nội đã cho tôi những kiến thức quý báu
trong q trình học tập tại nhà trường.
Chúng tơi trân trọng cảm ơn sự tài trợ kinh phí của Bộ Khoa học và Công
nghệ Việt Nam cho đề tài mã số NVQG-2018/02 do PGS.TS Đinh Đồn Long chủ
trì để thực hiện nghiên cứu này.
Cuối cùng, tơi xin được bày tỏ lịng biết ơn và sự yêu thương đến gia đình và
bạn bè đã luôn ở bên cổ vũ, động viên và tạo mọi điều kiện giúp đỡ tôi trong thời
gian học tập và thực hiện đề tài khóa luận này.
Xin chân thành cảm ơn!
Hà Nội, ngày 09 tháng 06 năm 2020
Tác giả

Đỗ Hạnh Nguyên


DANH MỤC TỪ VIẾT TẮT
bp

Cặp bazơ (base pair)

DNA

Axit deoxyribonucleic (Deoxyribonucleic acid)

dNTP

Deoxyribonucleotide 5’ triphosphate

GBSSI


Gen mã hóa enzyme tạo liên kết hạt (Granule-Bound Starch
Synthase)

Genbank

Ngân hàng dữ liệu gen quốc tế

H.helix

Thường xuân (Hedera helix L.)

H.nepalensis

Dây thường xuân (Hedera nepalensis K.Koch)

ITS

Vùng sao chép nội bộ (Internal transcribed spacer)

Kit Thermo

GeneJET Plant Genomic DNA Purification Mini Kit (Thermo
Scientific, Mỹ)

matK

Maturase K

ML


Maximum Likelihood

NCBI

Trung tâm Thông tin Công nghệ sinh học Quốc gia (National
Center for Biotechnology Information)

OD

Mật độ quang học (Optical Density)

PCR

Phản ứng chuỗi trùng hợp (Polymerase Chain Reaction)

RNA

Axit ribonucleic (Ribonucleic acid)

TrnK

Translocated tRNA-Lys gene

UPGMA

Unweighted PairGroup with Method using arthmetic Averages


DANH MỤC CÁC BẢNG
Trang

Bảng 1.1. Một số cặp mồi được sử trong nghiên cứu phân loại... ..............................9
Bảng 1.2. Các tác dụng dược lý của H. nepalensis ................................................. 20
Bảng 2.1. Thông tin mẫu thực vật dùng trong nghiên cứu ...................................... 21
Bảng 3.1. Nồng độ DNA tổng số của các mẫu nghiên cứu ..................................... 26
Bảng 3.2. Các thành phần và chu trình nhiệt của phản ứng PCR nhân dòng đoạn
gen matK .................................................................................................................. 30
Bảng 3.3. Các trình tự tham chiếu lấy từ Genbank sử dụng trong nghiên cứu........ 31
Bảng 3.4. Phân nhóm các mẫu trong nghiên cứu .................................................... 32
Bảng 3.5. Khoảng cách di truyền (phía dưới bên trái) và số lượng nucleotide sai
khác (phía tên bên phải) giữa 03 haplotype với 03 trình tự tham chiếu .................. 32
Bảng 4.1. Trình tự các mồi của gen matK được sử dụng trong các nghiên cứu về chi
Hedera trên thế giới ................................................................................................. 43


DANH MỤC CÁC HÌNH
Trang
Hình 1.1. Vị trí của gen matK .................................................................................... 11
Hình 1.2. Đặc điểm hình thái Dây thường xuân......................................................... 17
Hình 1.3. Phân bố địa lý của Dây thường xuân ở miền Bắc Việt Nam. .................... 18
Hình 2.1. Sơ đồ thiết kế nghiên cứu ........................................................................... 23
Hình 3.1. Ảnh điện di DNA tổng số trên gel agarose 1,2% ....................................... 26
Hình 3.2. Tối ưu nhiệt độ gắn mồi phản ứng nhân dòng gen matK .......................... 28
Hình 3.3. Tối ưu nồng độ DNA phản ứng nhân dịng gen matK ............................... 29
Hình 3.4. Tối ưu nồng độ mồi phản ứng nhân dòng gen matK .................................. 29
Hình 3.5. Kết quả PCR nhân dịng đoạn gen matK .................................................... 30
Hình 3.6. Kết quả hiển thị giải trình tự của mẫu đại diện H4 của gen matK qua phần
mềm BioEdit ............................................................................................................... 31
Hình 3.7. So sánh trình tự đoạn gen matK của các haplotype nghiên cứu với các
trình tự tham chiếu ...................................................................................................... 33
Hình 3.8. Cây phát sinh chủng loại xây dựng bằng phương pháp UPGMA của 03

haplotype nghiên cứu với 03 trình tự tham chiếu dựa trên chỉ thị matK .................... 34
Hình 3.9. Cây phát sinh chủng loại xây dựng bằng phương pháp Maximum
Likelihood của 03 haplotype nghiên cứu với 03 trình tự tham chiếu dựa trên chỉ thị
matK ............................................................................................................................ 35
Hình 3.10. Cây phát sinh chủng loại xây dựng bằng phương pháp UPGMA của 03
haplotype nghiên cứu với trình tự các loài Hedera dựa trên chỉ thị matK.................. 36


MỤC LỤC
Trang
ĐẶT VẤN ĐỀ ............................................................................................................ 1
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .................................................................. 3
1.1. Đa dạng và phân loại sinh học .......................................................................... 3
1.1.1. Khái niệm đa dạng sinh học ....................................................................... 3
1.1.2. Đa dạng di truyền ....................................................................................... 3
1.1.3. Thực trạng đa dạng sinh học tại Việt Nam................................................. 4
1.1.4. Các phương pháp phân loại học ................................................................. 5
1.2. Cơng cụ phân tích đa dạng di truyền và tiến hóa.............................................. 8
1.2.1. Tổng quan về mã vạch DNA ...................................................................... 8
1.2.2. Ứng dụng của mã vạch DNA ở thực vật .................................................... 9
1.2.3. Vùng gen lục lạp matK (maturase K)....................................................... 11
1.3. Phân tích phát sinh gen (Phylogenetic Analysis) ........................................... 12
1.3.1. Lựa chọn trình tự sinh học........................................................................ 12
1.3.2. Sắp xếp đa chuỗi....................................................................................... 13
1.3.3. Lựa chọn mơ hình tiến hóa ....................................................................... 13
1.3.4. Xây dựng cây phát sinh loài ..................................................................... 14
1.3.5. Đánh giá cây phát sinh loài ...................................................................... 15
1.4. Tổng quan về loài Dây thường xuân (Hedera nepalensis K.Koch) ............... 15
1.4.1. Đặc điểm hình thái chung của lồi Dây thường xn .............................. 15
1.4.2. Đặc điểm phân bố, sinh thái ..................................................................... 18

1.4.3. Thành phần hóa học ................................................................................. 19
1.4.4. Tác dụng dược lý ...................................................................................... 19
CHƯƠNG 2. ĐỐI TƯỢNG & PHƯƠNG PHÁP NGHIÊN CỨU ..................... 21
2.1. Đối tượng nghiên cứu ..................................................................................... 21
2.1.1. Đối tượng .................................................................................................. 21
2.1.2. Tiêu chuẩn lựa chọn mẫu ......................................................................... 21
2.2. Thời gian, địa điểm nghiên cứu ...................................................................... 22
2.3. Dụng cụ, trang thiết bị và hóa chất nghiên cứu .............................................. 22
2.3.1. Hóa chất .................................................................................................... 22


2.3.2. Trang thiết bị ............................................................................................ 23
2.4. Phương pháp nghiên cứu ................................................................................ 23
2.4.1. Tách chiết DNA tổng số ........................................................................... 24
2.4.2. Khuếch đại đoạn gen đích bằng kỹ thuật PCR ......................................... 24
2.4.3. Tinh sạch và giải trình tự .......................................................................... 25
2.4.4. Xử lý số liệu và phân tích kết quả ............................................................ 25
CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU .............................................................. 26
3.1. Tách chiết DNA tổng số ................................................................................. 26
3.2. Kết quả tối ưu hóa quy trình nhân dòng đoạn gen matK bằng kỹ thuật PCR 27
3.2.1. Tối ưu quy trình PCR ............................................................................... 27
3.2.2. Kết quả nhân dòng gen matK từ các mẫu thực vật ................................... 29
3.3. Giải trình tự ..................................................................................................... 31
3.4. Độ tương đồng của trình tự gen matK được khuếch đại................................. 31
3.5. Cây phát sinh chủng loại dựa trên vùng gen matK ......................................... 34
CHƯƠNG 4. BÀN LUẬN ....................................................................................... 38
4.1. Kết quả xây dựng quy trình phân tích đoạn gen matK ................................... 38
4.1.1. Tách chiết DNA tổng số ........................................................................... 38
4.1.2. Khuếch đại đoạn gen matK ...................................................................... 39
4.1.3. Giải trình tự và so sánh độ tương đồng .................................................... 40

4.2. Nghiên cứu đa dạng di truyền nguồn gen Dây thường xuân sử dụng mã vạch
matK.......................................................................................................................40
4.2.1. Khoảng cách di truyền .............................................................................. 40
4.2.2. Phân tích đa dạng di truyền nguồn gen Dây thường xuân ở miền Bắc
Việt Nam ............................................................................................................ 41
KẾT LUẬN VÀ KIẾN NGHỊ ................................................................................ 47
TÀI LIỆU THAM KHẢO ..........................................................................................


ĐẶT VẤN ĐỀ
Việt Nam nằm trong vùng khí hậu nhiệt đới ẩm gió mùa nên có hệ thực vật
phong phú và đa dạng, trong đó đặc biệt phải kể đến nhóm tài nguyên cây thuốc.
Theo kết quả điều tra của Viện Dược liệu, Việt Nam có 3948 lồi thực vật bậc cao,
bậc thấp và nấm lớn được dùng làm thuốc [2]. Tuy nhiên, phần lớn các cây thuốc
được sử dụng theo kinh nghiệm dân gian hoặc theo Y học cổ truyền mà chưa được
nghiên cứu một cách chuyên sâu và đầy đủ. Vì vậy, cần có thêm nhiều nghiên cứu
đánh giá chính xác mức độ đa dạng di truyền của các loài cây thuốc nhằm định
hướng bảo tồn, chọn, tạo và nhân giống để đáp ứng yêu cầu phát triển của nền công
nghiệp chế biến dược liệu bền vững.
Trong hệ thực vật đó, Hedera (L.) là một chi thuộc họ Nhân sâm
(Araliaceae) trên thế giới đã ghi nhận 16 loài, một số lồi được biết có giá trị làm
thuốc [15]. Trong số đó, 2 lồi đến nay được sử dụng rộng rãi và nghiên cứu nhiều
hơn cả về dược học là Thường xuân - H. helix và Dây thường xuân - H. nepalensis
đều có phạm vi phân bố tương đối hẹp trên thế giới. Theo đó H. helix được tìm thấy
chủ yếu ở Châu Âu và một phần Nam Á, còn H. nepalensis được phát hiện phân bố
ở các nước châu Á như: Trung Quốc, Ấn Độ, Pakistan, Nepal, Thái Lan,… Ở Việt
Nam, loài này được báo cáo xuất hiện tại một số tỉnh vùng núi phía Bắc như Lào
Cai, Hà Giang,... H. helix đã được các nhà khoa học trên thế giới chứng minh có
nhiều tác dụng dược lý trong điều trị các bệnh về hô hấp, nhiễm khuẩn, bảo vệ gan
và đã được phát triển thành thuốc điều trị viêm đường hơ hấp cấp và mạn tính

(Prospan). Trong khi đó ở Việt Nam, Dây thường xuân (H. nepalensis) chủ yếu
được dùng làm cây cảnh và chưa có một nghiên cứu nào về thành phần hoá học và
tác dụng dược lý.
Trong Dây thường xuân có chứa các hợp chất n-hexan và ethyl acetate có tác
dụng chống ung thư [55], ngồi ra cịn chứa lupeol, một triterpenoid có hoạt tính ức
chế dipeptidyl peptidase-4 với tiềm năng chữa bệnh tiểu đường [40, 83]. Không chỉ
vậy, nhiều nghiên cứu đã chứng minh rằng H. nepalensis có tác dụng bảo vệ thần
kinh [40], chống viêm, giảm đau, chống đông máu và chống trầm cảm [52]. Với
những tiềm năng dược lý như vậy, song hiện nay chưa có nhiều nghiên cứu về H.
nepalensis, đặc biệt là các nghiên cứu đánh giá tiềm năng đa dạng sinh học phục vụ
công tác bảo tồn, khai thác và phát triển nguồn gen. Chúng tôi cho rằng việc phân
tích đa dạng di truyền nguồn gen Dây thường xuân là thực sự cần thiết nhất là khi
phạm vi phân bố tự nhiên của loài này trên thế giới tương đối hạn chế. Ngoài yêu
1


cầu đánh giá đa dạng di truyền nguồn gen Dây thường xn ở Việt Nam, định loại
chính xác lồi để từ đó có chiến lược bảo tồn, khai thác và phát triển cũng là vấn đề
nghiên cứu cấp thiết hiện nay. Trên thế giới, việc sử dụng các chỉ thị DNA ngày
càng được dùng rộng rãi trong các nghiên cứu phân loại, phân tích đa dạng sinh
học, xác định khoảng cách di truyền và đặc trưng cá thể và quần thể thực vật nhằm
mục đích bảo tồn và chọn giống. So với các chỉ thị truyền thống (chỉ thị hình thái và
chỉ thị hóa học), thì chỉ thị DNA mang những ưu điểm nổi bật: dễ thực hiện trong
điều kiện phịng thí nghiệm, khơng phụ thuộc vào các yếu tố mơi trường và hiện
tượng tương tác gen, có thể xác định được các biến dị DNA trong các giai đoạn
khác nhau và ở các cơ quan khác nhau của thực vật. Để phục vụ cho nghiên cứu
này, chúng tôi sử dụng chỉ thị phân tử là matK (maturase K) trong vùng gen lục lạp
làm công cụ giúp xây dựng cây phát sinh loài. Mã vạch này là chỉ thị phân tử nổi
bật được ứng dụng thành công trong nhiều nghiên cứu giúp phân tích đa dạng di
truyền và định danh nhiều lồi thực vật, có thể kể đến như chi Panax, chi

Alium[14], họ Valerianaceae [46] hay chi Dalbergia [22],… Nhưng câu hỏi được
đặt ra là liệu matK có phải là chỉ thị DNA thích hợp để phân tích đa dạng di truyền
lồi Dây thường xn hay khơng?
Chính vì vậy, chúng tôi thực hiện đề tài “Nghiên cứu đa dạng di truyền
nguồn gen Dây thường xuân (Hedera nepalensis K.Koch) ở miền Bắc Việt Nam
dựa trên chỉ thị matK”. Nghiên cứu này hướng đến hai mục tiêu:
1. Xây dựng được quy trình nhân dòng đoạn gen matK của Dây thường xuân.
2. Xây dựng cây phát sinh chủng loại dựa vào chỉ thị matK và dùng chỉ thị
này để đánh giá mức độ đa dạng di truyền nguồn gen Dây thường xuân thu
thập ở miền Bắc Việt Nam.
Để thực hiện được mục tiêu nghiên cứu này, chúng tôi tiến hành các nội
dung nghiên cứu sau:
1. Tách DNA tổng số thu từ mẫu lá khô Dây thường xuân
2. Tối ưu phản ứng PCR và tiến hành nhân dịng đoạn gen matK
3. Giải trình tự vùng gen matK được nhân dòng
4. Xây dựng cây phát sinh chủng loại dựa trên chỉ thị matK

2


CHƯƠNG 1. TỔNG QUAN TÀI LIỆU
1.1. Đa dạng và phân loại sinh học
1.1.1. Khái niệm đa dạng sinh học
Năm 1982, định nghĩa của Wilcox “Đa dạng sinh học là sự đa dạng của các
dạng sống ở tất cả các cấp độ của hệ thống sinh học” được đưa ra bởi Liên minh
quốc tế về bảo tồn tài nguyên và tự nhiên (IUCN). Đến năm 1984, Wilcox cho rằng
đa dạng sinh học có thể được định nghĩa về mặt di truyền là sự đa dạng của các
alen, gen của sinh vật. Cho đến năm 1992, một định nghĩa khác được quốc tế công
nhận và được sử dụng trong Công ước Liên hợp Quốc về đa dạng sinh học: Đa dạng
sinh học là sự biến đổi sinh vật sống từ tất cả các nguồn bao gồm các hệ sinh thái và

các phức hợp sinh thái mà chúng là một phần: bao gồm sự đa dạng trong loài (đa
dạng di truyền, đa dạng gen), giữa loài (đa dạng loài) và hệ sinh thái (đa dạng hệ
sinh thái) [41]. Ngoài ra, trong cuốn sách “Biodiversity: an introduction”, Gaston và
Spicer định nghĩa “Đa dạng sinh học là sự biến đổi của sự sống ở tất cả các cấp độ
tổ chức sinh học” [35].
Đa dạng sinh học thường được sử dụng để thay thế các thuật ngữ đa dạng
loài và sự phong phú của loài. Các nhà sinh học thường định nghĩa đa dạng sinh học
là “tổng số gen, loài và hệ sinh thái của một khu vực” [67]. Định nghĩa này có lợi
thế trong việc bao trùm tất cả các trường hợp và trình bày một quan điểm thống nhất
về các loại sinh học truyền thống bao gồm: đa dạng phân loại (cấp độ loài), đa dạng
sinh thái (dưới góc độ hệ sinh thái), đa dạng hình thái (bắt nguồn từ đa dạng di
truyền và đa dạng phân tử) và đa dạng chức năng (thước đo số lượng các loài khác
nhau về chức năng trong quần thể). Đa dạng sinh học có vai trị quan trọng trong
việc phát triển kinh tế, xã hội và môi trường, là cơ sở đảm bảo an ninh lương thực;
duy trì nguồn gen vật ni, cây trồng; cung cấp các vật liệu cho xây dựng và các
nguồn nguyên liệu và dược liệu.
1.1.2. Đa dạng di truyền
Đa dạng di truyền là sự đa dạng ở cấp độ phân tử về thành phần gen giữa các
cá thể trong cùng một loài và giữa các loài khác nhau; là sự đa dạng về gen có thể di
truyền được trong một quần thể hoặc giữa các quần thể, tồn tại trong một loài và
giữa các loài khác nhau. Đa dạng di truyền là cơ chế giúp sinh vật tồn tại trong
những điều kiện khác nhau nên cần thiết cho tất cả các sinh vật để duy trì nịi giống.
Thơng qua đa dạng di truyền, sinh vật tạo nên những cơ chế mới, kháng lại các loại
dịch bệnh và thích nghi với biến đổi mơi trường [34]. Mỗi lồi có chứa những gen
3


riêng biệt thể hiện đặc tính riêng của nó như một cách để các quần thể có thể thích
nghi được với môi trường sống thay đổi. Với các áp lực như: chọn lọc nhân tạo, môi
trường sống khắc nghiệt,… một số cá thể trong một quần thể sẽ có cơ hội cao hơn

trong việc sở hữu những biến dị alen phù hợp với mơi trường giúp duy trì nịi giống
có alen đó. Quần thể đó sẽ tiếp tục có thêm nhiều thế hệ nhờ sự thành công của
những cá thể này.
Đa dạng di truyền là phân mức cơ bản nhất trong đa dạng sinh học, tạo nên
sự khác biệt của các cá thể trong quần thể. Đa dạng sinh học dù trong phạm vi một
loài hay giữa các loài và các hệ sinh thái với nhau thì cũng đều xuất phát từ đa dạng
di truyền. Nghiên cứu về đa dạng di truyền cũng là các nghiên cứu cơ bản và chính
xác nhất về sự khác biệt giữa các lồi. Tuy nhiên, đa dạng di truyền vẫn chưa được
quan tâm đúng mức mặc dù loại đa dạng này chính là nền tảng cho sự đa dạng của
sinh giới [5]. Ứng dụng của nghiên cứu đa dạng di truyền bao gồm: Bảo tồn nguồn
gen; Lai tạo giống mới và Nghiên cứu tiến hóa.
1.1.3. Thực trạng đa dạng sinh học tại Việt Nam
Việt Nam đứng thứ 16 về mức độ đa dạng sinh học trên thế giới và được biết
đến như một trung tâm đa dạng sinh học với các hệ sinh thái tự nhiên phong phú và
sự giàu có về các lồi và nguồn gen sinh vật. Trong đó, đã xác định được khoảng
49200 loài sinh vật bao gồm: khoảng 7500 chủng vi sinh vật; 20000 loài thực vật
trên cạn và dưới nước; 10500 loài động vật trên cạn; 2000 loài động vật không
xương sống và cá sống ở nước ngọt; khoảng trên 11000 loài sinh vật biển. Đặc biệt,
một bộ phận lớn của các giống thực vật, động vật này có các đặc tính q chỉ có ở
nước ta, nên tiềm năng phát triển và đem lại giá trị kinh tế rất cao [6]. Việt Nam có
số lượng lớn nguồn gen dược liệu, sở hữu nhiều loài dược liệu quý hiếm và là nơi
có nguồn đa dạng sinh học phong phú. Tuy nhiên, những sản phẩm từ dược liệu quý
của nước ta chưa trở thành hàng hóa có giá trị cao và chưa được sử dụng rộng rãi
trong cộng đồng. Cũng như nhiều quốc gia khác trên thế giới, Việt Nam đang đối
diện với nguy cơ suy thoái đa dạng sinh học và sự mất cân bằng sinh thái diễn ra
mạnh mẽ. Tài nguyên đa dạng sinh học đang trên đà suy giảm một cách đáng báo
động, các hệ sinh thái bị thu hẹp, suy giảm và bị chia cắt, nguồn gen bị thất thoát,
mai một. Nguyên nhân là do áp lực của gia tăng dân số kéo theo tài nguyên sinh vật
bị khai thác quá mức và không được tái tạo. Ngồi ra, cơng tác bảo tồn cịn nhiều
bất cập, hệ thống các quy định pháp luật về bảo tồn đa dạng sinh học chưa đồng bộ.

Vì vậy, vấn đề cấp thiết hiện nay là cần phải bảo tồn và phát triển nguồn gen.

4


1.1.4. Các phương pháp phân loại học
Phân loại học là lĩnh vực sinh học liên quan đến xác định, đặt tên và phân
loại các loài. Phân loại học là quá trình các nhà khoa học nhóm các sinh vật sống
dựa trên mức độ giống nhau của chúng nhằm phản ánh sự liên quan tiến hóa của các
sinh vật và các nhóm sinh vật. Trong lịch sử, sự giống nhau được xác định bằng
cách kiểm tra các đặc điểm vật lý, hóa học. Theo truyền thống những đặc điểm này
có thể quan sát bằng hình thái nhưng với sự ra đời và phát triển của giải trình tự
gen, trình tự DNA và các dấu hiệu phân tử cũng được sử dụng để phân loại, định
danh các loài.
1.1.4.1. Phương pháp phân loại học truyền thống
Phân loại học truyền thồng gồm 2 phân loại là phân loại dựa trên các chỉ thị
hình thái và dựa vào các chỉ thị hóa học (như sắc ký lớp mỏng - TLC hay sắc ký lớp
mỏng hiệu năng cao – HPLC,…). Trong đó, phân loại học hình thái được sử dụng
phổ biến hơn và đóng vai trị quan trọng trong lĩnh vực phân loại học.
Phân loại học hình thái dựa trên sự tương đồng rõ ràng nhất giữa các loài và
đã được đưa ra từ rất lâu trước khi ý tưởng về sự tiến hóa xuất hiện. Phân loại học
này chủ yếu dựa trên sự khác biệt đặc điểm hình thái các cơ quan của thực vật, đặc
biệt là hoa (cơ quan sinh sản). Phương pháp phân loại học hình thái có lịch sử lâu
đời và nhờ vào phương pháp này mà hệ thống phân loại thực vật được hồn thiện
khá đầy đủ. Ưu điểm của nó là có thể phân biệt các lồi dựa trên sự quan sát các đặc
điểm bên ngoài, dễ ứng dụng và thân thiện với nhiều đối tượng. Tuy nhiên, nhược
điểm của phương pháp này là sẽ gặp khó khăn khi phân loại các mẫu đang trong
giai đoạn phát triển (chưa ra hoa) hoặc có các đặc điểm hình thái giống nhau do
cùng sinh trưởng và phát triển trong cùng một điều kiện mơi trường địa lý hay có
nhiều điểm tương đồng do ở mức độ phân loại thấp như loài và dưới lồi [57].

Khơng chỉ vậy, phương pháp này thường được sử dụng bởi các chuyên gia hình thái
và cần một khoảng thời gian tương đối dài và tốn nhiều công sức [42]. Dù cịn tồn
tại nhiều nhược điểm nhưng khơng thể phủ nhận tầm quan trọng của phân loại học
hình thái trong lĩnh vực phân loại học hiện nay.
1.4.1.2. Phương pháp phân loại học hiện đại
Để khắc phục những nhược điểm của phương pháp phân loại học truyền
thống, hiện nay các nhà khoa học đã xây dựng nhiều phương pháp phân loại học
mới, trong đó:

5


Phân loại học phân tử
Với sự phát triển của sinh học phân tử vào những năm 1990 cùng với thành
công của việc giải trình tự gen, phân loại học phân tử được hình thành. Phương
pháp phân loại này dựa trên việc phân tích các dữ liệu về gen (DNA) trong hoặc
ngoài nhân hoặc cả hệ gen hay các sản phẩm của chúng như protein, enzyme. Từ đó
giúp định danh và xây dựng mối quan hệ tiến hóa và di truyền giữa các lồi. Tùy
vào mục đích nghiên cứu, có thể lựa chọn một trong các công cụ DNA hay protein.
Các kỹ thuật sinh học phân tử được sử dụng gồm: giải trình tự DNA, đa hình các
đoạn DNA nhân bản ngẫu nhiên (Random Amplified Polymorphic DNA), đa hình
chiều dài các đoạn cắt giới hạn (Restriction Fragment Length Polymorphism) hay
kỹ thuật đồng enzyme (isozyme),…[10] Các kỹ thuật này đã được ứng dụng thành
công trong việc phân loại, định danh và xác định mối quan hệ tiến hóa của nhiều
lồi sinh vật và ngày càng cho thấy những lợi ích thiết thực. So với phân loại học
truyền thống thì phương pháp này giúp q trình xác định các lồi trở nên nhanh,
chính xác và ít tốn kém hơn [9]. Mục tiêu chính của phân loại học phân tử là:
(i) Xác định mối quan hệ phân cấp giữa các lồi hiện có theo mối quan hệ
tiến hóa của chúng. Vì vậy, các sinh vật có chung một tổ tiên chung được nhóm lại
sớm hơn so với những sinh vật có tổ tiên chung xa hơn.

(ii) Ước tính thời gian phân kỳ giữa các loài, tức là thời gian tồn tại của tổ
tiên chung gần nhất.
Phân loại học hiện trạng số (Numerical taxonomy)
Phân loại học hiện trạng số là một hệ thống phân loại cho phép so sánh số
lượng lớn các đặc điểm (từ 60 dấu hiệu trở lên) cho số lượng lớn các chủng bằng
cách phân tích bộ dữ liệu được tạo ra bằng máy tính. Phương pháp này áp dụng các
quy trình toán học khác nhau cho dữ liệu trạng thái ký tự được mã hóa số. Nó nhằm
mục đích tạo ra một phân loại sử dụng các thuật toán số như phân tích cụm thay vì
sử dụng đánh giá chủ quan các thuộc tính. Các bộ dữ liệu về ma trận cho thấy mức
độ tương đồng giữa từng cụm rồi từ đó tạo thành một bức tranh chung về đặc điểm
kiểu hình của một nhóm cụ thể. Khái niệm này được đưa ra lần đầu tiên bởi Robert
R. Sokal và Peter HA Sneath vào năm 1963 [87], sau đó được xây dựng và phát
triển bởi cùng nhóm tác giả [86]. Ưu điểm của phương pháp này là dữ liệu phân loại
được thu thập từ nhiều nguồn khác nhau, như hình thái, hóa học, sinh lý,… Sự trợ
giúp của hệ thống dữ liệu điện tử cho phép nhiều công việc phân loại được thực

6


hiện. Tuy nhiên, vẫn tồn tại nhược điểm bao gồm: Đối xử với sinh vật như những
đối tượng phi sinh vật; Loại trừ yếu tố tiến hóa, khơng phân loại được phát sinh gen;
Sự lựa chọn trọng số ngầm định hoặc rõ ràng của các đặc điểm bị ảnh hưởng bởi dữ
liệu sẵn có và lợi ích của điều tra viên. Phân loại số đã được áp dụng thành công
trong các nghiên cứu về sự tương đồng và khác biệt ở vi khuẩn và một số nhóm
động vật, phân định một số chi như Oryza, Sarcostemma Solarium.
Phân loại học PhyloCode
PhyloCode hay còn gọi là Bộ luật danh pháp phát sinh quốc tế (International
Code of Phylogenetic Nomenclature) là một dự thảo phát triển một bộ chính thức
của quy tắc chi phối danh pháp phát sinh loài [85]. Khác với phân loại học truyền
thống, PhyloCode không chia thành nhiều thứ hạng phân loại (như bộ, họ, chi,

loài,…) mà chỉ gồm các bậc tiến hóa được xác định bởi các đặc điểm tổ tiên và các
đặc điểm phân ly từ tổ tiên ban đầu từ đó tạo thành các nhánh tiến hóa đơn dịng [9].
Tất cả các bậc tiến hóa hình thành trong một nhánh đều được xác định như các lồi,
khơng có thứ hạng trên loài như trong phân loại học truyền thống. Ưu điểm của
phương pháp này là cho phép đặt tên các cấp bậc trung gian; Cải thiện sự ổn định
danh pháp; Tạo điều kiện cho việc đặt tên của các nhánh mới khi chúng được phát
hiện; Cho phép loại bỏ các cấp bậc phân loại, loại bỏ khía cạnh chủ quan nhất của
phân loại truyền thống và được áp dụng ở tất cả các cấp độ của phân loại. Tuy
nhiên, PhyloCode còn gây nhiều tranh cãi và chưa được sử dụng rộng rãi [73].
Cận phân loại học (Parataxonomy)
Cận phân loại học là một hệ thống phân công lao động sử dụng trong nghiên
cứu đa dạng sinh học. Trong đó các nhiệm vụ sắp xếp sơ bộ của việc thu thập mẫu,
nhận dạng và bảo quản được thực hiện bởi người ít chun mơn hơn do đó giảm bớt
khối lượng công việc cho các chuyên gia phân loại học. Phương pháp này được sử
dụng để cải thiện hiệu quả và đẩy nhanh tốc độ phân loại [19]. Xu hướng của cận
phân loại học không phân loại sinh vật thành các loài theo những nguyên tắc chung
mà phân thành các đơn vị phân loại có thể thừa nhận dựa trên những đặc điểm dễ
nhận biết bằng mắt thường [9]. Tuy nhiên, không thể sử dụng Parataxonomy vào
việc thống kê sinh vật như trong phân loại học mà chỉ nên coi là một biện pháp kỹ
thuật hỗ trợ phân loại học chứ không thể thay thế phân loại hoc truyền thống.

7


1.2. Cơng cụ phân tích đa dạng di truyền và tiến hóa
1.2.1. Tổng quan về mã vạch DNA
Để định danh lồi cũng như phân tích mối quan hệ di truyền và tiến hóa, các
nhà khoa học thường sử dụng chỉ thị phân tử như dấu vân tay DNA (DNA
fingerprinting), PCR RFLP (sử dụng enzyme giới hạn kết hợp với lai DNA) và đặc
biệt là mã vạch DNA (DNA barcode). Nguyên lý chung của các phương pháp này

đều dựa trên sự khác biệt của trình tự nucleotide (base nitơ) trong cấu trúc hóa học
của DNA để xác định lồi. Mã vạch DNA được ứng dụng và có tiềm năng trong
nhiều ngành khoa học như phân loại học, công nghệ sinh học, công nghệ thực
phẩm, pháp ý,...giúp nhận diện và định danh nhiều mẫu vật [42].
DNA Barcode hay mã vạch DNA lần đầu tiên được đề xuất là phương pháp
định danh loài bởi Paul Hebert (Đại học Guelph – Cananda) vào năm 2003 [42]. Mã
vạch DNA có thể là vùng gen trong nhân hay ngồi nhân mã hóa hoặc khơng mã
hóa protein. Mã vạch này tương tự như mã vạch sọc đen dán vào các sản phẩm
trong siêu thị. Tuy nhìn hai sản phẩm bên ngồi giống nhau và khơng thể phân biệt
được bằng mắt thường nhưng khi quét mã vạch lại có thể xác định được chúng [88].
Để trở thành một mã vạch DNA, cần đáp ứng những yêu cầu sau:
(i) Tồn tại phổ biến (có mặt trong nhiều lồi sinh vật);
(ii) Trình tự có hiệu suất nhân dịng cao và đặc hiệu;
(iii) Khả năng phân biệt được nhiều loài [50].
Hiện nay thì nhiều mã vạch DNA ngày càng được sử dụng phổ biến, có thể
kể đến chỉ thị nằm trong hệ gen nhân (ITS,...) [18, 27, 28], hệ gen ty thể (Cytb,
COI...) [18, 25, 43] hay hệ gen lục lạp (matK, trnK, rbcL,...) [48, 49, 71]. Đặc điểm
chung của những chỉ thị này là đều có tính đặc hiệu cao và dễ sử dụng. Chúng có
những đặc tính lý tưởng bao gồm: đủ độ bảo thủ để xác định những sinh vật cùng
loài nhưng cũng đủ đột biến để phân biệt các lồi [65]; có độ dài thích hợp (khơng
q ngắn để xuất hiện vị trí đa hình giữa các taxon, khơng q dài để thuận lợi trong
q trình giải trình tự); vị trí mồi bảo tồn cao, DNA được khuếch đại và giải trình tự
có độ tin cậy cao. Trong đó, ở động vật, vùng gen ty thể có ưu thế hơn vùng gen
nhân do có tốc độ tiến hóa nhanh [26, 81]. Cịn ở thực vật, vùng gen ty thể không
được lựa chọn làm mã vạch DNA do hệ gen này tiến hóa chậm [38, 48]. Thay vào
đó, hệ gen lục lạp được cho thấy khả năng phân biệt tốt các loài [23, 48, 74]. Ngoài
ra, để tăng độ chính xác khả năng phân loại, các nghiên cứu thường kết hợp nhiều
8



hơn một chỉ thị phân tử. Thông tin về một số cặp mồi trong nghiên cứu phân loại
được trình bày chi tiết trong Bảng 1.1.
Bảng 1.1: Một số cặp mồi được sử trong nghiên cứu phân loại
Barcode
ITS

rbcL

matK

Mồi

Trình tự

TLTK

P1 F

ATT GAA TGG TCC GGT GAA GTG TTC G

[77]

P2 R

AAT TCC CCG GTT CGC TCG CCG TTAC

[77]

Is2P1 F


ATG CGA TAC TTG GTG TGA AT

[27]

Is2P1 R

TCC TCC GCT TAT TGA TAT GC

[27]

rP1 F

ATG TCA CCA CAA ACA GAG ACT AAA GC

[63]

rP1 R

GTA AAA TCA AGT CCA CCT CG

[63]

KIM 3F

CGT ACA GTA CTT TTG TGT TTA CGA G

[38, 58]

KIM 1R


ACC CAG TCC ATC TGG AAA TCT TGG TTC

[38, 58]

390F

CGA TCT ATT CAT TCA ATA TTT C

[29]

1326R

TCT AGC ACA CGA AAG TCG AAG T

[29]

1F

ACC GTA TCG CAC TAT GTA TC

[93]

1R

GAA CTA GTC GGA TGG AGT AG

[93]

1.2.2. Ứng dụng của mã vạch DNA ở thực vật
1.2.2.1. Ứng dụng ở thực vật nói chung

Ở thực vật, nghiên cứu mã vạch DNA không chỉ dùng để đánh giá sự khác
nhau giữa các vùng DNA mà còn tiến tới những ứng dụng thực tế hơn. Các ứng
dụng này bao gồm:
(i) Cung cấp thông tin sâu hơn về phân loại học ở cấp độ loài đồng thời tham
gia vào quá trình phân loại học: Nhận diện và phân biệt các loài.
(ii) Hỗ trợ nhận diện các mẫu vật chưa được nhận biết thuộc loài nào hoặc
xác định loài mới (Đây là ứng dụng chính).
Với những lồi có hình thái đơn giản, phân bố rộng, kích thước nhỏ hay hệ
thống phân loại chưa đầy đủ và chưa được phân loại một cách triệt để thì mã vạch
DNA giúp hồn thiện hệ thống phân loại. Ngồi ra, nó cịn cung cấp thêm thông tin

9


hữu ích về đa dạng lồi có thể kể đến như nghiên cứu về nhóm thực vật bryphytes
(rêu) [71] hay nhận diện những loài lan ẩn danh [66]. Ngày nay, mã vạch DNA
được ứng dụng nhiều trong các nghiên cứu bao gồm:
(i) Nghiên cứu đánh giá đa dạng di truyền của một vùng địa lý (các mẫu
nghiên cứu thuộc nhiều bộ, họ, chi, loài);
(ii) Phân biệt tập hợp mục tiêu các lồi họ hàng có khả năng thay thế lồi có
giá trị thương mại;
(iii) Nhận diện mẫu vật mà người sử dụng khơng có khái niệm quen thuộc.
1.2.2.2. Ứng dụng trong nhận biết dược liệu
Ngày nay, thuốc được phát triển từ dược liệu ngày càng trở nên phổ biến và
nhu cầu sử dụng các sản phẩm chăm sóc sức khỏe có nguồn gốc thiên nhiên ngày
càng tăng. Tổ chức Y tế Thế giới (WHO) ước tính khoảng 80% dân số thế giới sử
dụng cây thuốc để chăm sóc sức khỏe ban đầu [17]. Ở nước phương Tây, cây thuốc
là nguồn gốc của nhiều loại thuốc thảo dược hỗ trợ chăm sóc sức khỏe. Cịn ở các
nước phương Đơng, đặc biệt là Trung Quốc, việc sử dụng nguyên liệu thảo dược đã
có lịch sử lâu đời, thống kê cho thấy có đến hơn 10000 loài, hơn 2000 chi và 400 họ

được sử dụng để làm thuốc [27]. Thị trường toàn cầu cho dược liệu và cây cho tinh
dầu thơm là 62 tỷ đơ la vào năm 2002 và có thể đạt 5 nghìn tỷ đơ la vào năm 2050
[85]. Nhu cầu sử dụng dược liệu thúc đẩy sự mở rộng và phát triển của thị trường
xuyên quốc gia về nguồn nguyên liệu thảo dược. Tuy nhiên, nó cũng làm xuất hiện
tình trạng giả mạo dược liệu. Các loài thảo dược này có thể bị thay thế bởi các lồi
có quan hệ gần gũi, thậm chí là bị giả mạo hồn tồn. Tồn tại tình trạng này là do:
(i) Ngun liệu khơng phân biệt được bằng đặc điểm hình thái.
(ii) Nguyên liệu có đặc điểm tương tự nhau.
(iii) Thay thế các nguyên liệu có giá trị kinh tế bằng các nguyên liệu dễ kiếm
và rẻ tiền hơn.
Ngoài ra, việc định danh và xác định nguyên liệu thảo dược theo phương
pháp truyền thống như đặc điểm cảm quan và phân tích hóa học đơi khi gặp khó
khăn nhất là khi ngun liệu được chế biến thành các dạng bào chế như bột hay bị
phân cắt thành các đoạn nhỏ. Chính vì vậy, mã vạch phân tử có lợi thế ưu việt trong
việc nhận biết nguồn gốc dược liệu từ các mẫu mô nhỏ. Khơng chỉ vậy, mã vạch
phân tử cịn được sử dụng phổ biến trong những năm gần đây để đánh giá đa dạng

10


sinh học phục vụ công tác bảo tồn và kiểm soát chất lượng sản phẩm. Việc định
danh các nguyên liệu thảo dược bằng cách sử dụng mã vạch DNA giúp bảo vệ
người dùng khỏi nguy cơ bị tổn hại sức khỏe bởi các thuốc giả mạo.
1.2.3. Vùng gen lục lạp matK (maturase K)
Gen matK (maturase K), trước đây được gọi là orfK, là chỉ thị quan trọng
được biểu hiện từ bộ gen lục lạp [47]. Gen này có tỷ lệ thay thế cao trong loài và nổi
lên như một ứng cử viên tiềm năng để nghiên cứu hệ thống tiến hóa thực vật [75].
matK là một trong hai gen plastid (rbcL và matK) được Nhóm cơng tác thực vật
(PWG) của Hiệp hội mã vạch sự sống (CBOL) khuyến nghị sử dụng làm mã vạch
DNA thực vật tiêu chuẩn [38, 50]. matK là gen mã hố một protein có liên quan đến

q trình cắt nối intron - exon nhóm II, dài khoảng 1500 bp, nằm trong intron của
gen lục lạp trnK [20, 47] (Hình 1.1). Trong số các maturase, protein này chỉ giữ lại
một miền X được bảo tồn tốt và tàn dư của một miền phiên mã ngược [72]. Các
phức hợp gen matK-trnK thường được sử dụng cho các nghiên cứu tiến hóa thực vật
và giải quyết quan hệ di truyền ở các mức phân loại khác nhau [54].

Hình 1.1:Vị trí của gen matK [47]
Gen matK có tính đa dạng hơn những gen khác trong lục lạp, do vậy nó trở
thành chỉ thị quan trọng giúp phân loại thực vật. Những đặc điểm của gen được khai
thác bao gồm: có kích thước lý tưởng, tỷ lệ chuyển đổi cao và có trình tự bảo thủ.
Tỷ lệ thay thế trong matK cao hơn gấp ba lần ở mức nucleotide và cao gấp sáu lần ở
mức axit amin so với rbcL. Mặt khác sự hiện diện của vùng 3' tương đối được bảo
tồn và vùng 5' ít được bảo tồn có thể được sử dụng để giải quyết các mối quan hệ
phát sinh lồi từ các mức độ phân loại nơng đến sâu [31, 47].
Việc khuếch đại và giải trình tự vùng mã vạch matK rất khó khăn do tính
biến thiên trình tự cao trong các vị trí liên kết mồi, đặc biệt khi đối tượng nghiên
cứu không phải là thực vật hạt kín [38, 48, 50]. Hiện tại, có ba cặp mồi matK được
sử dụng phổ biến để khuếch đại là: 390F/1326R [29, 90], KIM 3F /KIM 1R [38, 58]
và XF/5R [33]. Kress và cộng sự (2009) đã sử dụng ba cặp mồi này để khuếch đại
11


mã vạch DNA từ 296 loài thực vật [64]. Sự kết hợp mồi này đã thành công khuếch
đại trong 85% và thành cơng tuần tự ở 69% các lồi, chứng minh rằng khuếch đại là
đáng tin cậy. Tuy nhiên, việc sử dụng nhiều hơn một cặp mồi có thể tốn thời gian
cũng như kinh phí và thường phức tạp đối với các dự án quy mô lớn [44].
Gen matK cho thấy khả năng phân biệt cao các loài thực vật hạt kín và hỗ trợ
định danh cho nhiều lồi thực vật [80]. Chỉ thị này đã được ứng dụng thành cơng để
xây dựng cây phát sinh lồi cho họ Valerianaceae [46], Saxifragaceae,
Polemoniaceae, Poaceae [47],… và giải quyết mối quan hệ di truyền của họ

Aurantioideae đặc biệt là chi Citrus [76],… Mã vạch này được sử dụng thành công
để phân biệt Panax notoginseng (Araliaceae) giữa các vùng địa lý khác nhau [95]
và xây dựng cây phân loài của Panax vietnamensis và 5 trình tự liên quan [62].
1.3. Phân tích phát sinh gen (Phylogenetic Analysis)
Việc xác định mối quan hệ phân cấp giữa các loài và ước lượng thời gian
phân kỳ giữa chúng dựa trên các trình tự sinh học như protein hoặc DNA được thực
hiện bởi các nghiên cứu phát sinh gen. Các nghiên cứu phát sinh gen thường được
chia làm 5 giai đoạn:
Giai đoạn 1: Lựa chọn trình tự sinh học cần phân tích.
Giai đoạn 2: Xây dựng sự liên kết (sắp xếp đa chuỗi) giữa các trình tự sinh
học được chọn.
Giai đoạn 3: Lựa chọn các mơ hình thay thế, các mơ hình thống kê về tiến
hóa phân tử cho các trình tự.
Giai đoạn 4: Xây dựng các cây phát sinh loài
Giai đoạn 5: Đánh giá thống kê các cây phát sinh lồi
1.3.1. Lựa chọn trình tự sinh học
Các nghiên cứu phát sinh gen dựa trên việc so sánh các trình tự sinh học
tương đồng. Nghiên cứu về sự khác biệt giữa các trình tự cho phép ước tính mối
quan hệ tiến hóa giữa các lồi tương ứng và thời gian phân kỳ của chúng. Để có
được các chuỗi tương đồng, các cơ sở dữ liệu như RefSeq, Uniprot hoặc
HomoloGene có thể rất hữu ích. Một cách khác để có được các chuỗi tương đồng là
sử dụng các trình tự từ các kết quả BLAST.
Hai trình tự DNA ở hai sinh vật khác nhau tiến hóa từ một trình tự DNA tổ
tiên thì được gọi hai trình tự DNA tương đồng. Tuy nhiên, vẫn có những khác biệt
12


giữa hai trình tự tương đồng trong quá trình tiến hóa do những đột biến (biến đổi).
Có 3 loại biến đổi chính là: Thay thế (một nucleotide này bị thay thế bằng một
nucleotide khác); Xóa (một hoặc một số nucleotide bị xóa khỏi trình tự); Chèn (một

hoặc một số nucleotide được chèn vào trình tự).
1.3.2. Sắp xếp đa chuỗi
Việc sắp xếp các trình tự sinh học cần phân tích (sắp xếp thẳng hàng) là bước
quan trọng nhất trong nghiên cứu phát sinh gen vì nó liên quan trực tiếp đến việc so
sánh sự giống và khác nhau giữa các trình tự. Có một số cơng cụ để thực hiện sắp
xếp chuỗi trong đó có BioEdit, MEGA. Các cơng cụ này cho phép căn chỉnh nhiều
chuỗi thông qua các phương pháp căn chỉnh MUSCLE và ClustalW.
1.3.3. Lựa chọn mơ hình tiến hóa
Sau khi hồn thành việc sắp xếp chuỗi, có thể tính được khoảng cách di
truyền giữa các trình tự khác nhau. Khoảng cách di truyền giữa hai chuỗi tương
đồng được định nghĩa là số lượng thay thế được tích lũy giữa chúng kể từ khi chúng
tiến hóa từ một tổ tiên chung. Ước tính khoảng cách di truyền là quan trọng vì
khơng phải tất cả các sự biến đổi đều có thể quan sát được, đặc biệt là trong những
chuỗi có 2 dạng biến đổi là đồng hốn và dị hốn. Phân tích phát sinh gen dựa trên
sự lựa chọn chính xác mơ hình tiến hóa, phổ biến nhất là:
Mơ hình JC69 (Jukes và Cantor, 1969) [59]: Là mơ hình thay thế đơn giản
nhất. Nó giả sử xác suất đột biến một nucleotide là độc lập với vị trí của nucleotide
và chính nucleotide đó. Nghĩa là tần số cơ bản và tỷ lệ đột biến của mỗi loại
nucleotide (A, T, G, C) bằng nhau. Do đó tham số duy nhất của mơ hình này là tỷ lệ
thay thế tổng thể. Tuy nhiên, JC69 khơng đủ để tính khoảng cách tiến hóa theo các
mơ hình phức tạp hơn.
Mơ hình K80 (Kimura 1980) [61]: Thường được gọi là mơ hình hai tham số
của Kimura (hoặc mơ hình K2P), phân biệt giữa đồng hoán (A<=>G, tức là từ
purine đến purine, hoặc C<=>T, tức là từ pyrimidine sang pyrimidine) và dị hoán
(từ purine sang pyrimidine hoặc ngược lại). Trong mô tả ban đầu về mơ hình, α và β
được sử dụng để biểu thị tốc độ của các loại thay thế này.
Mơ hình T92 (Tamura 1992) [91]: T92 là một phương pháp toán học đơn
giản được phát triển để ước tính số lượng thay thế nucleotide trên mỗi vị trí giữa hai
chuỗi DNA, bằng cách mở rộng phương pháp hai tham số của Kimura (1980) cho


13


trường hợp tồn tại sự thiên về hàm lượng G+C. Phương pháp này hữu ích khi có
nhiều chuyển đổi đồng hốn, dị hốn và sự thiên về hàm lượng G+C.
Mơ hình TN93 (Tamura và Nei 1993) [92]: Mơ hình TN93 phân biệt giữa hai
loại đồng hoán, nghĩa là (A <=> G) được phép có tỉ lệ khác với (C <=> T). Các dị
hoán được giả định xảy ra ở tỷ lệ tương tự, nhưng tỷ lệ này được phép khác tỷ lệ
đồng hốn.
1.3.4. Xây dựng cây phát sinh lồi
Cây phát sinh lồi (Phylogenetic tree) hay cịn gọi là cây phả hệ hay cây
phân lồi được sử dụng để mơ hình hóa lịch sử tiến hóa của một nhóm các trình tự
hay các sinh vật. Theo thuyết tiến hóa của Darwin, nhóm các lồi với những đặc
tính khác nhau đều tiến hóa và hình thành từ một tổ tiên chung trong quá khứ. Đối
tượng nghiên cứu truyền thống của cây phân loài là biểu diễn mối quan hệ giữa các
loài. Để xây dựng cây phát sinh lồi, có một số phương pháp sau:
Phương pháp ma trận khoảng cách – Distance Matrix
Ma trận khoảng cách được tính tốn dựa trên khoảng cách di truyền giữa các
chuỗi được phân loại bao gồm một nhóm các thuật tốn. Trên cơ sở khoảng cách
giữa từng cặp trình tự (số nucleotide khác nhau giữa các trình tự), biểu diễn thành
dạng ma trận khoảng cách. Trong đó, thuật tốn lập nhóm khơng có trọng số dùng
trung bình số học (UPGMA - Unweighted PairGroup with Method using arthmetic
Averages) [86] phân tích tất cả các dấu hiệu qua đó xác định khoảng cách di truyền
giữa tất cả các cặp trình tự, biểu diễn thành dạng ma trận khoảng cách (dạng đối
xứng) rồi gộp từng cặp mẫu có khoảng cách di truyền giữa chúng là nhỏ nhất [8].
Phương pháp Neighbor – Joining
Phương pháp này tương tự phương pháp gom cụm. Tuy nhiên, hai trình tự
được coi là hàng xóm trong một cây nếu như giữa chúng chỉ có duy nhất một nút.
Phương pháp NJ tương đối nhanh nhưng nó chỉ tạo ra một cây và bỏ qua các cây
khác có thể tốt hơn. Hơn nữa, vì các lỗi ước tính khoảng cách theo cấp số nhân,

trong một số điều kiện, phương pháp này sẽ tạo ra một cây thiên vị.
Phương pháp tiết kiệm tối đa – Maximum Parsimony
Phương pháp này sẽ lựa chọn cây tiến hóa thỏa mãn điều kiện là số lượng
đặc tính bị biến đổi phải thấp nhất để giải thích những dữ liệu đã quan sát được.
Maximum Parsimony giả định rằng cây tiến hóa tốt nhất mơ tả q trình tiến hóa tốt

14


nhất là cây mơ tả được các lồi ít thay đổi nhất (ít đột biến nhất) nên cây có điểm
thấp nhất.
Phương pháp khả năng xác suất: Hợp lý tối đa – Maximum Likelihood và
phương pháp Bayes
Phương pháp này dựa trên một hàm tốn học tính xác suất khả năng một cây
tiến hóa được tạo thành từ dữ liệu có sẵn. Hàm này cho phép tích hợp qua trình tiến
hóa các đặc tính dưới dạng mơ hình xác suất. Cây phát sinh được xây dựng bởi
phương pháp hợp lý tối đa là cây tiến hóa có khả năng xảy ra cao nhất (xác suất tạo
thành lớn nhất). Khác với Maximum Likelihood thì phương pháp Bayes khơng tìm
đỉnh cao nhất (xác suất tối đa) mà tích hợp các thơng số trong khơng gian dữ liệu.
1.3.5. Đánh giá cây phát sinh loài
Sau khi xây dựng cây phát sinh loài, cần đánh giá cây và phương pháp đánh
giá phổ biến nhất hiện nay là Bootstrapping. Phân tích bootstrap được thực hiện
nhằm kiểm tra độ chính xác và độ tin cậy cho từng nhánh trong cây tiến hóa. Đầu
tiên, các vị trí từ các chuỗi trình tự đã sắp xếp thẳng hàng sẽ được đảo chỗ một cách
ngẫu nhiên và được xây dựng cây. Quá trình này được lặp lại một số lần nhất định
(gọi là sự lặp lại bootstrap) để tính tốn giá trị ủng hộ cho một nhánh. Do giá trị ủng
hộ được biểu diễn bằng tỷ lệ % nên ít nhất phải có 100 lần lặp lại (thơng thường
1000 lần lặp lại). Đối với mỗi nhánh được chỉ định một tỷ lệ xuất hiện trong các cây
và một nhánh có ý nghĩa nếu nó xuất hiện hơn 50% hoặc 70%.
1.4. Tổng quan về loài Dây thường xuân (Hedera nepalensis K.Koch)

1.4.1. Đặc điểm hình thái chung của lồi Dây thường xn
* Đặc điểm hình thái chung của chi Hedera
Hedera thường được gọi là cây thường xuân (ivy) là một chi gồm 16 loài
theo thơng tin phân tích từ dữ liệu DNA lục lạp [15]. Chi Hedera là đại diện dạng
dây leo duy nhất trong họ Nhân sâm (Araliaceae). Chi này có nguồn gốc ở miền tây,
miền trung và miền nam châu Âu, Macaronesia, tây bắc châu Phi và khắp Đông Á
đến Nhật Bản và Đài Loan.

15


Vị trí của chi Hedera trong hệ thống phân loại thực vật như sau:
Liên giới: Eukaryota (Sinh vật nhân thực)
Giới: Plantae (Thực vật)
Phân giới: Viridaeplantae (Thực vật xanh)
Ngành: Magnoliophyta (Thực vật có hoa; Ngọc Lan; Hạt kín)
Lớp: Magnoliopsida (Ngọc lan; Hai lá mầm)
Phân lớp: Rosidae (Hoa hồng)
Bộ: Apiales (Hoa tán)
Họ: Araliaceae (Nhân sâm)
Chi: Hedera
Chi Hedera gồm những cây dạng dây leo mọc thành lớp bao phủ trên bề mặt.
Trên mặt đất, cây leo không quá 5-20 m, nhưng trên bề mặt thích hợp như mỏm đá,
chúng có thể leo cao tới 30 m [32]. Cây leo thường xanh có rễ móc kí sinh. Lá đơn
khơng có lá kèm, dài 5-10 cm, rộng 3-8 cm, phiến lá phân thùy, gân chân vịt, mọc
so le. Cụm hoa chùy gồm nhiều tán có lông sao. Hoa nhỏ, màu vàng xanh, trắng
xanh, tràng 5, có một mào cuốn ở giữa, nhị 5, bầu 5. Quả màu xanh đen, tím đậm
hoặc vàng (hiếm khi) chín vào cuối mùa đông đến giữa mùa xuân. Quả hạch trịn có
đường kính 5-10 mm, dài 5-9 mm, khối lượng trung bình khoảng 281,5 mg, chứa từ
1-5 quả [1, 45].

* Đặc điểm hình thái lồi Hedera nepalensis
Hình thái của H.nepalnensis K.Koch (Hình 1.2) được mơ tả trong các tài liệu
nghiên cứu vẫn chưa có sự thống nhất, đặc biệt là hình dạng và màu quả khi chín.
Cụ thể:
Trong “Cây cỏ Việt Nam” (2000): Dây thường xuân được mô tả là Dây bị.
Lá khơng lơng, hình thể hơi biến thiên, thon hình thoi, chóp nhọn, gân từ đáy 3, gân
phụ 2-3 cặp, mặt trên oliu đậm, mặt dưới oliu nâu. Phát hoa mang tán như hoa đầu
nhiều hoa, có lơng sét. Trái tròn, màu cam đỏ [7].
Trong “Danh lục thực vật Việt Nam” tập II (2003) có mơ tả H. nepalensis:
Dây bị dài tới 20 m, có nhiều rễ móc khí sinh ở các mắt, lá đơn; cụm hoa có lơng
màu đỏ nâu [1].

16


A

B

D

C

E

F

Hình 1.2. Đặc điểm hình thái Dây thường xuân
A, B: Một đoạn Dây thường xuân; C: Cành mang hoa;
D: Cành mang quả; E: Cụm hoa; F: Cụm quả


17


×