Tải bản đầy đủ (.pdf) (49 trang)

Nghiên cứu xác định đoạn ADN mã vạch cho cây kim ngân lonicera japonica ở việt nam phục vụ giám định loài

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.01 MB, 49 trang )

LỜI CẢM ƠN
Trong suốt quá trình học tập tại trƣờng Đại học Lâm nghiệp, em đã nhận
đƣợc rất nhiều sự quan tâm và chỉ bảo tận tình của các thầy cô, đặc biệt là các
thầy cô giáo trong Viện Công nghệ sinh học Lâm nghiệp.
Em xin gửi lời cảm ơn chân thành tới PGS. TS. Bùi Văn Thắng và Th.S
Nguyễn Thị Huyền Bộ môn Công nghệ tế bào, Viện Công nghệ sinh học Lâm
nghiệp, là ngƣời đã hƣớng dẫn trực tiếp em thực hiện khóa luận tốt nghiệp này.
Em cũng xin cảm ơn tới toàn thể các cán bộ Viện Công nghệ sinh học
Lâm nghiệp, Trƣờng Đại Học Lâm Nghiệp đã tạo điều kiện thuận lợi để em có
thể hồn thành bài luận văn một cách tốt nhất.
Cuối cùng em xin chân thành cảm ơn tới gia đình và bạn bè đã luôn ủng
hộ, động viên và giúp đỡ em trong suốt quá trình thực hiện đề tài.
Do thời gian có hạn nên bài làm khó tránh khỏi những thiếu sót, em rất
mong nhận đƣợc những ý kiến đóng góp của thầy cơ và bạn bè để bài làm đƣợc
hồn thiện hơn.
Em xin chân thành cảm ơn!
Hà nội, ngày 6 tháng 5 năm 2019
Sinh viên

Nguyễn Thế Hải

i


MỤC LỤC
LỜI CẢM ƠN ........................................................................................................ i
MỤC LỤC ............................................................................................................. ii
DANH MỤC CÁC TỪ VIẾT TẮT ..................................................................... iv
DANH MỤC BẢNG ............................................................................................. v
DANH MỤC HÌNH ............................................................................................. vi
ĐẶT VẤN ĐỀ ....................................................................................................... 1


1.1. Tổng quan cây Kim ngân ............................................................................... 2
1.1.1. Giới thiệu về Kim ngân ............................................................................... 2
1.1.2. Đặc điểm hình thái ...................................................................................... 2
1.1.3. Đặc điểm về sinh thái và phân bố ............................................................... 3
1.1.4. Giá trị của Kim ngân ................................................................................... 3
1.1.5. Tình trạng .................................................................................................... 4
1.2. Tổng quan về ADN mã vạch .......................................................................... 4
1.2.1. ADN mã vạch (DNA barcode).................................................................... 4
1.2.2. Ứng dụng và những lợi ích của mã vạch ADN ........................................... 6
1.2.3. Các đặc điểm cơ bản của trình tự mã vạch ................................................. 8
1.3. Một số mã vạch ADN đƣợc sử dụng phổ biến và tình hình nghiên cứu ....... 8
1.3.1. Mã vạch ADN ở động vật .......................................................................... 8
1.3.2. Mã vạch ADN ở thực vật ............................................................................ 9
1.3.3. Hiện trạng của các mã vạch ở thực vật ..................................................... 15
CHƢƠNG 2. MỤC TIÊU, NỘI DUNG, VẬT LIỆU VÀ PHƢƠNG PHÁP
NGHIÊN CỨU .................................................................................................... 22
2.1. Mục tiêu nghiên cứu ..................................................................................... 22
2.2. Nội dung nghiên cứu .................................................................................... 22
2.3. Địa điểm nghiên cứu .................................................................................... 22
2.4. Vật liệu, hóa chất, và các thiết bị sử dụng trong nghiên cứu ....................... 22
2.4.1. Vật liệu nghiên cứu ................................................................................... 22
2.4.2. Hóa chất..................................................................................................... 23
2.4.3. Các thiết bị dùng trong nghiên cứu ........................................................... 24
ii


2.5. Phƣơng pháp nghiên cứu .............................................................................. 24
2.5.1. Phƣơng pháp tách chiết ADN tổng số....................................................... 24
2.5.4. Phƣơng pháp tinh sạch sản phẩm PCR và giải trình tự............................. 28
CHƢƠNG 3. KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN ............................ 29

3.1. Kết quả tách chiết ADN tổng số .................................................................. 29
3.2. Kết quả nhân gen với các cặp mồi đặc hiệu ................................................. 29
3.2.1. Kết quả nhân bản gen ropB ....................................................................... 29
3.2.2. Kết quả nhân bản gen trnL-trnF................................................................ 30
3.3. Kết quả giải trình tự nucleotit đoạn gen rpoB và gen trnL-trnF.................. 31
3.3.1. Kết quả giải trình tự nucleotit đoạn gen rpoB ........................................... 31
3.3.2. Kết quả giải trình tự đoạn gen trnL-trnF .................................................. 33
3.4. Xác định và phân tích trình tự nucleotide của đoạn mã vạch ADN ............ 35
3.4.1. Kết quả so sánh đoạn gen rpoB phân lập đƣợc từ cây Kim ngân với các
trình tự cơng bố trong Ngân hàng gen NCBI ...................................................... 35
3.4.2. Kết quả so sánh đoạn gen trnL-trnF phân lập đƣợc từ cây Kim ngân với
các trình tự cơng bố trong Ngân hàng gen NCBI ............................................... 36
KẾT LUẬN VÀ KIẾN NGHỊ............................................................................. 39
TÀI LIỆU THAM KHẢO ................................................................................... 40

iii


DANH MỤC CÁC TỪ VIẾT TẮT

1
2
3

Các chữ
viết tắt
ATP
Bp
BOLD


4

CBOL

5

cpDNA

6

CTAB

7

DNA

8

dNTP

9

EDTA

10
11

IGS
Kb


12

NAD(P)H

13

NCBI

14
15
16
17
18
19
20

ORF
PCR
RNA
rRNA
cs
TAE
tRNA

TT

Nghĩa tiếng anh

Nghĩa tiếng việt


Adenosin triphosphat
Base pair
Barcode of Life Data Systems

Adenosin triphosphat
Cặp base
Cơ sở dữ liệu mã vạch ADN
Consortium for the
Consortium for the Barcode of Life
Barcode of Life
Chloroplast DNA
Bộ gen lục lạp
Cetyl trimethylammonium
Cetyl trimethylammonium bromide
bromide
Axit deoxyribonucleic acid
Axit deoxyribonucleic
Deoxyribonucleotid
Deoxyribonucleotide triphosphate
triphosphate
axit ethylenediamine
Ethylenediamine tetraacetic acid
tetraacetic
intergenic
Vùng liên kết gen
Kilobase (1000 base)
1000 cặp base
Nicontinamide adenine
Trung tâm Quốc gia về Thông
dinucleotide phosphate

tin Công nghệ sinh học
National Center for Biotechnology
Trung tâm thông tin Công nghệ
Information
sinh học Hoa Kỳ
Open Reading Frame
khung đọc mở
Polymerase Chain Reaction
phản ứng chuỗi polymerase
Ribonucleic acid
Axit ribonucleic
Ribosomal RNA
ARN ribosome
Partner
Cộng sự
Tris – Acetic acide – EDTA
Tris – Acetic acide – EDTA
Transfer RNA
ARN vận chuyển

iv


DANH MỤC BẢNG
Bảng 1.1: Thông tin của một số mồi DNA Barcode thiết kế cho hệ gen lục lạp 11
Bảng 2.1: Thành phần đệm chiết ADN tổng số .................................................. 23
Bảng 2.2: Thành phần phản ứng PCR................................................................. 26
Bảng 2.3: Chu trình nhiệt phản ứng PCR với cặp mồi nhân gen rpoB ............... 26
Bảng 2.4: Chu trình nhiệt phản ứng PCR với cặp mồi nhân gen trnL-trnF ....... 26
Bảng 2.5: Trình tự và thông tin về cặp mồi ........................................................ 27


v


DANH MỤC HÌNH
Hình 1.1: Cây Kim ngân (Nguồn ảnh: caythuoc.org) ........................................... 3
Hình 1.3: Hoa kim ngân khơ (Nguồn ảnh: caythuoc.org)..................................... 4
Hình 3.1: Kết quả điện di ADN tổng số của 3 mẫu Kim ngân ........................... 29
Hình 3.2: Kết quả nhân bản đoạn gen rpoB từ các mẫu kim ngân thu đƣợc ...... 30
Hình 3.3: Kết quả nhân bản đoạn gen trnL-trnF từ các mẫu kim ngân. ............. 30
Hình 3.4: So sánh trình tự nucleotit đoạn gen rpoB phân lập từ cây Kim ngân
với trình tự rpoB của lồi Lonicera nervosa mã số MK176510.1...................... 32
Hìnsh 3.5: So sánh trình tự nucleotit đoạn gen trnL-trnF phân lập đƣợc từ cây
Kim ngân với lồi Lonicera japonica mã số MH028738.1 ................................ 34
Hình 3.6: So SÁNH trình tự nucleotit đoạn gen rpoB phân lập đƣợc từ cây Kim
ngân với 6 trình tự gen này cơng bố trong Ngân hàng gen NCBI. ..................... 35
Hình 3.7: Cây phân loại đƣợc xây dựng dựa trên trình tự đoạn gen rpoB.......... 36
Hình 3.8: So sánh trình tự nucleotit đoạn gen trnL-trnF phân lập đƣợc từ cây
Kim ngân với 6 trình tự gen này cơng bố trong Ngân hàng gen NCBI. ............. 37
Hình 3.9: Cây phân loại đƣợc xây dựng dựa trên trình tự đoạn gen trnL-trnF. ............ 38

vi


ĐẶT VẤN ĐỀ
Cây Kim Ngân còn đƣợc biết đến với nhiều tên gọi: cây vàng bạc, cây
nhẫn đông, (tên khoa học là: Lonicera japonica). Là loại cây leo, có nguồn gốc
ở vùng Đông Á, phân bố ở Trung Quốc, Nhật Bản, Triều Tiên còn tại Việt Nam
cây mọc hoang và đƣợc trồng nhiều ở các miền núi, rừng nhƣ Cao Bằng, Hịa
Bình, Thanh Hóa, Lào Cai … Cây kim ngân dễ trồng, khơng cầu kỳ chăm sóc,

chịu đƣợc cả khí hậu nóng và lạnh, thích nơi đất ẩm nhƣng thốt nƣớc, đất mùn,
màu mỡ, sẽ cho hoa tốt trong ánh nắng mặt trời đầy đủ nhƣng sẽ ít bị rệp tấn
cơng trong một phần bóng râm.
Trong Đơng y, cây kim ngân để làm thuốc lại là một loại cây thảo dƣợc
với nhiều công dụng nhƣ: điều trị rối loạn tiêu hóa, nhiễm trùng đƣờng hơ hấp,
đau đầu, đái tháo đƣờng … Bởi vậy, lồi hoa này ln thu hút đƣợc sự quan
tâm, chú ý của nhiều ngƣời dẫn đến nhu cầu sử dụng trong thị trƣờng ngày càng
lớn. Thế nên rất cần thiết để xây dựng ADN mã vạch cho loài cây giá trị này
nhằm làm cơ sở cho chiến lƣợc phát triển, kinh doanh bền vững và phục vụ cơng
tác giám định lồi.
ADN mã vạch (DNA barcode) là một phƣơng pháp định danh và giám
định loài dựa trên những trình tự ADN ngắn ở những vùng chuẩn hóa của ADN
hệ gen (Hebert và cs., 2003). Ở thực vật, việc nghiên cứu truy tìm những vùng
ADN hệ gen thích hợp đƣợc chứng minh là khó khăn hơn so với động vật rất
nhiều. Tuy nhiên, qua nghiên cứu thấy rằng có một vài vùng gen trong hệ gen
lục lạp nhƣ rpoB, trnL-trnF, rbcL, matK hay trong vùng đệm sao chép (internal
transcribed spacer – ITS) đã đƣợc sử dụng trong việc xác định các đoạn mã vạch
ADN ở thực vật phục vụ cho các mục đích khác nhau.
Xuất phát từ các lý do trên tôi tiến hành đề tài: “Nghiên cứu xác định
đoạn ADN mã vạch cho cây Kim ngân (Lonicera japonica) ở Việt Nam phục
vụ giám định lồi” nhằm góp phần cung cấp thông tin và cơ sở dữ liệu việc xác
định chính xác lồi ở cấp độ phân tử.

1


CHƢƠNG 1: TỔNG QUAN TÀI LIỆU
1.1.

Tổng quan cây Kim ngân


1.1.1. Giới thiệu về Kim ngân
Kim ngân còn đƣợc gọi là cây vàng bạc, cây nhẫn đơng. Có tên khoa học
là Lonicera japonica thuộc bộ Dipsacales, họ Caprifoliaceae, chi Lonicera.
Chúng phân bố tại Bắc Mỹ, Đông Á (Trung Quốc, Nhật Bản, Triều Tiên…) và
Việt Nam (Cao Bằng, Hịa Bình, Thanh Hóa, Lào Cai …)
Kim ngân là lồi cây khơng chỉ có giá trị về kinh tế nhờ ứng dụng trong
cảnh quan, phong thủy mà bên cạnh đó nó cịn có giá trị lớn về y dƣợc nhờ khả
năng điều trị các chứng bệnh nhƣ: rối loạn tiêu hóa, nhiễm trùng đƣờng hơ
hấp…
1.1.2. Đặc điểm hình thái
Kim ngân là một loại dây mọc leo, thân quấn, thân có thể vƣơn dài tới
10m hay hơn. Cành lúc cịn non máu lục nhạt, có phù lơng mịn, khi cành già thì
chuyển màu nâu đỏ nhạ nhẵn và có vân. Lá mọc đối, hơi dày, đơi khi mọc vịng
3 lá một, hình trứng dài hay hình mũi mác – trái xoan, đầu hơi tù, phía cuống
tròn, dài 4 – 7cm, rộng 2 – 4cm, cuống ngắn 2 – 3cm có lơng, cả hai mặt đều
phủ lông mịn.
Vào tháng 5 – 8 hoa kim ngân mọc từng đơi ở kẽ là, mỗi kẽ lá có 1 cuống
mang 2 hoa. Hai lá mọc đối mang 4 hoa. Lá bắc giống lá nhƣng nhỏ hơn. Hoa
hình ống xẻ hai môi. Môi lớn xẻ thành 3 hay 4 thùy nhỏ. Phiến của tràng dài gần
bằng ống tràng, lúc đầu màu trắng, sau khi nở một thời gian chuyển sang màu
vàng, cùng một lúc trên cây có hoa mới nở màu trắng nhƣ bạc, lại có hoa nở đã
lâu màu vàng nhƣ vàng nên có tên là kim ngân (kim là vàng, ngân là bạc). Cây
kim ngân xanh tốt vào mùa đơng nên cịn có tên là nhẫn đơng, nghĩa là chịu
đựng mùa đơng. 4 nhị thịi dài cao hơn tràng, vòi nhụy lại thòi dài cao hơn nhị,
mùi thơm dễ chịu.

2



Hình 1.1: Cây Kim ngân (Nguồn ảnh: caythuoc.org)
1.1.3. Đặc điểm về sinh thái và phân bố
Cây kim ngân là loài cây sống ngồi trời, ƣa nơi thơng thống. Cây có thể
sống đƣợc trong bóng râm nhƣng dễ bị rệp tấn cơng. Cây rất dễ trồng, chịu đƣợc
cả khí hậu nóng và lạnh. Cây có sức sống tốt, tốc độ sinh trƣởng nhanh và khỏe
khoắn nên rất dễ dàng chăm sóc.
Phân bố: Kim ngân có nguồn gốc ở vùng Đơng Á, phân bố ở Trung Quốc,
Nhật Bản, Triều Tiên còn tại Việt Nam cây mọc hoang và đƣợc trồng nhiều ở
các miền núi, rừng nhƣ Cao Bằng, Hịa Bình, Thanh Hóa, Lào Cai …
1.1.4. Giá trị của Kim ngân
Giá trị trong y dƣợc, sức khỏe: Theo tây y cây kim ngân bắt đầu ra hoa
trong khoảng từ tháng 6 – 7. Hoa kim ngân chứa tinh dầu, trong đó có α-pinen,
geraniol, carvacrol, eugenol, đặc biệt là flavonoid gồm: luteolin, luteolin-7glucosid, axit clorogenic, lonicerin… Cành lá chứa loganin giúp kháng khuẩn,
tăng cƣờng chuyển hóa chất béo. Theo đơng y Kim ngân hoa tính mát lạnh, vị
ngọt, hơi đắng, khơng độc. Cây có công năng thanh nhiệt, lợi thấp, giải độc, giải
biểu, lợi tiểu, dùng chữa dƣơng bệnh. Kim ngân có rất nhiều tác dụng, trong đó
phải nói đến tác dụng quan trọng là kháng khuẩn, kháng nấm, kháng vi rút.
Nhiều nghiên cứu đã đƣợc chứng minh kim ngân có tác dụng ức chế nhiều loại
vi khuẩn nhƣ tụ cầu vàng, liên cầu khuẩn dung huyết, phế cầu khuẩn, trực khuẩn

3


lị, trực khuẩn ho gà, trực khuẩn thƣơng hàn, trực khuẩn mủ xanh, cùng một số
loại nấm, vi rút cúm. Ngồi ra kim ngân cịn có tác dụng chống viêm, làm giảm
chất xuất tiết, giải nhiệt và làm tăng tác dụng thực bào của bạch cầu. Kim ngân
khi làm thuốc thì tất cả bộ phận của nó đều có thể dùng để làm thuốc nhƣng hoa
là bộ phận thƣờng đƣợc sử dụng nhiều nhất, bởi hoa có cơng dụng nhiều hơn khi
làm thuốc.


Hình 1.3: Hoa kim ngân khơ (Nguồn ảnh: caythuoc.org).
1.1.5. Tình trạng
Hiện nay, mặc dù là lồi cây mọc hoang và đƣợc trồng nhiều nhƣng do
tình trạng con ngƣời khai thác một cách bừa bãi, khơng có kế hoạch để bảo tồn
và phát triển nguồn tài nguyên thực vật, nạn cháy rừng xảy ra thƣờng xuyên vào
các mùa hanh khô với mức độ ngày càng nghiêm trọng, rất nhiều lồi thực vật
nói chung trong đấy có cây Kim ngân đang dần bị suy giảm về số lƣợng cá thể,
quần thể cũng đang dần bị thu hẹp, giảm bớt dần. Do đó, cần tiến hành phát triển
các quần thể cịn sót lại cũng nhƣ nghiên cứu nhân giống để gieo trồng tạo hàng
hóa sử dụng, xuất khẩu và bảo vệ nguồn gen.
1.2.

Tổng quan về ADN mã vạch

1.2.1. ADN mã vạch (DNA barcode)
Khái niệm mã vạch ADN đƣợc biết đến rộng rãi từ những năm đầu thế kỷ
21, khi các nhà khoa học Canada trình bày nghiên cứu sử dụng một đoạn gene
dài 648 nucleotid từ bộ gene ti thể - gọi là Co1 - để định loại 260 loài chim và đề

4


xuất dùng nó nhƣ một "mã vạch" để lƣu trữ, chuẩn hóa thơng tin các lồi động
vật.

Việc sử dụng DNA trong nghiên cứu định loại không phải ý tƣởng quá
mới, bởi loài ngƣời đã biết đến DNA từ năm 1953. Đột phá của mã vạch
DNA nằm ở tính chuẩn hóa và đồng bộ của nó. Nghĩa là với một sinh vật bất
kỳ, chỉ cần giải mã đoạn gene Co1 (hoặc một số lƣợng gene rất ít và xác định
trƣớc), so sánh với các thƣ viện DNA hiện có là có thể xác định danh tính lồi

và xác định lồi mới.
Mã vạch DNA đƣợc giới khoa học hƣởng ứng rất nhiệt tình. Nhiều
ngƣời cho rằng cơng cụ này sẽ đánh dấu sự "phục hƣng" của lĩnh vực phân
loại sinh vật truyền thống. Nó đƣợc kỳ vọng sẽ giúp hiện thực hóa việc định
loại sinh vật từ các giai đoạn khác nhau trong vòng đời hoặc từ các bộ phận
cơ thể riêng lẻ, tạo thuận lợi cho việc phát hiện loài mới, thúc đẩy hình thành
cơng nghệ giải trình tự DNA cầm tay ứng dụng trong lĩnh vực đa dạng sinh
học và giúp nghiên cứu sâu hơn về sự đa dạng của sự sống.
Từ giữa những năm 1990, với sự phát triển mạnh mẽ của sinh học phân
tử, một phƣơng pháp nghiên cứu mới trong lĩnh vực phân loại học đã hình thành
và đƣợc gọi là phƣơng pháp phân loại học phân tử. Phƣơng pháp này dựa trên
các dữ liệu thông tin về hệ gen (DNA) trong và ngoài nhân hoặc các sản phẩm
của chúng (protein). Tùy mục đích hoặc đối tƣợng nghiên cứu, ngƣời ta có thể
lựa chọn các gen (đoạn DNA) khác nhau hoặc các sản phẩm khác nhau của hệ
gen (Nguyễn Đức Lƣợng, 2002).

Tháng 2/2005, tại hội nghị về xây dựng mã vạch sự sống ở Bảo tàng
Lịch sử tự nhiên London, Anh, các nhà khoa học đã thống nhất thực hiện dự
án "Sáng kiến xây dựng mã vạch sự sống" với tham vọng nhanh chóng lƣu
trữ thơng tin của khoảng 10 triệu loài sinh vật trên Trái đất bằng mã vạch
DNA.
Mã vạch DNA đã trở thành mảng nghiên cứu thu đƣợc nguồn tài trợ rất
lớn và đƣợc thực hiện rộng khắp. Có thể chứng kiến sự phát triển của "ngành
5


cơng nghiệp" này qua sự ra đời của Liên đồn Xây dựng mã vạch sự sống
(CBOL), Liên hiệp quốc tế về Mã vạch sự sống (iBOL) và Cơ sở dữ liệu về
mã vạch sự sống (BOLD). Trong giai đoạn 2003-2010, có tới 411 bài báo
khoa học chứa "mã vạch DNA" trong tiêu đề và công cụ này đƣợc sử dụng

trong rất nhiều lĩnh vực, từ xác định các giai đoạn trong vịng đời cơn trùng
cho đến kiểm tra giám sát cá bán trong chợ.
1.2.2. Ứng dụng và những lợi ích của mã vạch ADN
Hiện nay, mã vạch ADN là một kỹ thuật mở rộng áp dụng trên nhiều đối
tƣợng động - thực vật và đƣợc sử dụng làm tài liệu tham khảo cụ thể, thiết lập cơ
sở dữ liệu để xác định các mẫu động - thực vật và khám phá loài mới. Trong hệ
sinh thái, mã vạch ADN rất hữu ích trong việc tìm mối quan hệ giữa các mẫu
mặc dù chúng hầu nhƣ khơng giống nhau về hình thái.
Trong bối cảnh kinh tế phát triển đang gây ra hậu quả là tác động lên các
hệ động - thực vật của các quốc gia khác nhau, đặc biệt là trong khu vực nhiệt
đới và cận nhiệt đới. Do đó, việc nhận dạng loài bằng cách sử dụng một phƣơng
pháp nhanh là điều cần thiết để đánh giá, bảo tồn trong các khu vực với mục
đích bảo vệ các lồi q và lồi có nguy cơ tuyệt chủng. Tuy nhiên, cần lƣu ý
rằng, ADN mã vạch không phải là một phƣơng pháp thay thế cho phân loại mà
là một công cụ hữu ích cung cấp thơng tin về đơn vị phân loại. Để thúc đẩy việc
sử dụng ADN mã vạch cho tất cả sinh vật có nhân điển hình, một ngân hàng mã
vạch cho sinh giới đƣợc thiết lập có tên CBOL (Consortium for the Barcode of
Life) đƣợc thành lập vào tháng 5 năm 2004 (hiện tại bao gồm hơn 120 tổ chức
với 45 quốc gia). Với sự hỗ trợ của CBOL, ADN mã vạch tạo một lịch sử về mã
vạch của sinh giới với các thơng tin hữu ích có trên các trang thơng tin trên thế
giới(Võ Thƣơng Lan và cs., 1990; Anders R., 2012).
Theo CBOL, ADN mã vạch có nhiều ứng dụng quan trọng trong rất nhiều
lĩnh vực:
 Kiểm sốt tác nhân gây hại trong nơng nghiệp:
Sử dụng mã vạch ADN giúp định danh nhanh chóng các lồi gây bệnh ở
giai đoạn tiềm ẩn (giai đoạn ấu trùng), hỗ trợ chƣơng trình kiểm sốt sâu bệnh
6


bảo vệ cây trồng. Cung cấp thông tin cho các nhân viên hải quan của nhiều quốc

gia để họ có thể xác định và ngăn cản sự lan truyền của trái cây nhiễm sâu bệnh.
Kinh doanh sản phẩm nông nghiệp sẽ đƣợc đẩy mạnh hơn và nhờ đó rút ngắn
thời gian, đạt kết quả trong việc đối phó với sâu bệnh
 Xác định vật chủ trung gian gây bệnh:
Mã vạch ADN cũng đƣợc sử dụng để nhận diện những vật chủ trung gian
gây bệnh và để hiểu biết thêm những bệnh truyền nhiễm cũng nhƣ phƣơng pháp
điều trị nhằm đạt đƣợc hiệu quả nhanh chóng. Mã vạch ADN cho những vật chủ
gây bệnh đang đƣợc xây dựng và ngày càng phổ biến. Điều này cung cấp cho
các tổ chức và các cơ quan y tế cộng đồng các công cụ và phƣơng pháp hiệu quả
để ngăn cản và hạn chế sự phát triển của ruồi và các côn trùng gây hại.
 Bảo vệ loài nguy cấp:
Một thực tế đáng báo động, đa dạng sinh học trên thế giới đang liên tục
giảm sút, trong đó nhiều lồi có nguy cơ tuyệt chủng. Vì vậy, mã vạch ADN có
thể giúp những cơ quan có thẩm quyền chỉ ra thịt có nguồn gốc từ những loài
nguy cấp, ngăn chặn săn bắn bất hợp pháp và giúp bảo tồn sự đa dạng sinh học.
 Duy trì nguồn tài nguyên thiên nhiên:
Mã vạch ADN giúp kiểm sốt hành vi săn bắn trái phép các lồi nguy cấp
mà nó cịn đƣợc ứng dụng trong nơng nghiệp và khai thác lâm nghiệp. Để kiểm
soát khai thác, nhà chức trách phải thiết lập quản lý một cách hiệu quả để kiểm
sốt kinh doanh các sản phẩm nơng nghiệp, biển và lâm nghiệp. Có ít nhất hai
dự án về mã vạch cho cá (fish-BOL) và cây thân gỗ (Tree-BOL) nhằm thúc đẩy
công tác quản lý và bảo vệ nguồn tài nguyên thiên nhiên.
 Kiểm tra chất lƣợng nƣớc:
Hiện tại, nguồn nƣớc bị ô nhiễm cần đƣợc xác định để phịng ngừa và có
biện pháp xử lý. Tuy nhiên, ơ nhiễm càng cao thì càng khó khăn hơn trong việc
xác định các chỉ số ơ nhiễm. Vì vậy, tại thời điểm này các nhà khoa học đang cố
gắng xây dựng thƣ viện mã vạch ADN cho những “chỉ số mập mờ”. Điều này
giúp cho cán bộ quản lý môi trƣờng tiêu chuẩn hóa các loại chỉ số trong việc
đánh giá nƣớc và thiết lập quy trình đánh giá tiêu chuẩn tốt hơn ở mỗi quốc gia.
7



 Ứng dụng trong điều tra tội phạm:
Trong lĩnh vực pháp y, chỉ cần một lƣợng mẫu nhỏ, thậm chí vài biến
dạng cũng có thể giúp cảnh sát truy tìm nguồn gốc. Gần đây, cơ sở dữ liệu mã
vạch ADN của chó đã đƣợc các cơ sở pháp y của nhiều quốc gia sử dụng nhằm
hỗ trợ công việc của họ.
1.2.3. Các đặc điểm cơ bản của trình tự mã vạch
Đặc điểm quan trọng nhất của ADN mã vạch là nó phổ biến và đặc hiệu
trong các biến dị, dễ dàng sử dụng. Điều này có nghĩa là các đoạn gen đƣợc sử
dụng nhƣ một mã vạch nên thích hợp cho nhiều đơn vị phân loại, có sự biến đổi
giữa các loài nhƣng ổn định và bảo thủ cao bên trong lồi hoặc biến đổi khơng
đáng kể. Do đó, ADN mã vạch lý tƣởng thƣờng xuyên đƣợc thu hồi với cặp mồi
đặc hiệu tuân thủ theo trình tự hai chiều với các yêu cầu nhỏ để chỉnh sửa trình
tự định ra. Do đó, trình tự gen sử dụng cho mã vạch nên ngắn để dễ dàng khuếch
đại bằng PCR. Nhìn chung, ADN mã vạch dựa trên việc sử dụng một vùng gen
ngắn, tiêu chuẩn cho phép nhận dạng các loài hiệu quả.
Ngày càng có nhiều nghiên cứu chỉ ra rằng CO1 có trình tự biến đổi thấp
bên trong lồi (dƣới 1-2%), do đó nó có thể xác định lồi với độ chính xác cao.
Tuy nhiên, ở thực vật ADN ty thể có tỉ lệ biến đổi thấp và nhanh chóng
thay thế bởi gen cấu trúc và gen chức năng làm cho CO1 khơng cịn phù hợp với
mã vạch trong thực vật do đó cần phải tìm kiếm trình tự gen mã vạch phù hợp
với các loài thực vật. Dựa trên thống kê có sẵn từ những nghiên cứu phát sinh
lồi, một số trình tự gen, kể cả trình tự mã hóa và khơng mã hóa từ ADN lục lạp
cùng với gen từ nhân đã đƣợc kiểm tra cho phù hợp với chúng nhƣ là mã vạch.
1.3.

Một số mã vạch ADN đƣợc sử dụng phổ biến và tình hình nghiên cứu

1.3.1. Mã vạch ADN ở động vật

ADN mã vạch đƣợc thành lập ở động vật sử dụng CO1 trong gen ty thể
(mtADN) có kích thƣớc 648 nucleotide dễ dàng khuếch đại, giải trình tự và phân
tích.
Mã vạch ADN locus gen CO1 ở động vật thƣờng đƣợc dùng rộng rãi do
có các tiêu chí: Đây là một gen đơn bội, đƣợc di truyền từ mẹ, gen này cho mức
8


độ phân biệt cao. Đó là một vùng gen mã hóa cho protein có mặt với nhiều bản
sao trong mỗi tế bào. Ở động vật nó có tính bảo thủ với những vùng đảo ngƣợc
nhỏ, hoặc thƣờng xuyên lặp đi lặp lại đơn nucleotide. Những đặc điểm này kết
hợp với cặp mồi đƣợc thiết kế tốt, hiệu quả. Sử dụng gen CO1 để phân biệt
nhiều mẫu động vật có cùng tổ tiên đƣợc ghi nhận tốt, thậm chí hiệu suất sử
dụng cao ngay với các mẫu đƣợc lƣu giữ qua thời gian dài.
Nhiều nghiên cứu cho thấy CO1 giúp phân biệt đƣợc khoảng 98% các lồi
với nhau. Trong phần cịn lại, nó xác định hẹp đến các cặp hoặc bộ nhỏ của các
lồi có mối quan hệ gần gũi, nói chung là các loài chỉ mới vừa tách ra hoặc các
loài lai thƣờng xuyên.
Ngoài locus gen CO1, các đoạn gen ty thể Cytb (cytochrome b), gen
ribosome 12S, 16S cũng đƣợc dùng nhƣ ADN mã vạch trong nhận dạng ở động vật.
1.3.2. Mã vạch ADN ở thực vật
Không giống nhƣ động vật, ngoài bộ gen nhân và ty thể, thực vật cịn có
bộ gen đặc trƣng là bộ gen lục lạp (cpADN). ADN nhân, ty thể và lục lạp đều
đƣợc sử dụng trong phân tích phát sinh lồi. Tùy vào mức độ phân tích mà mỗi
vùng gen và mỗi phƣơng pháp đƣợc áp dụng thích hợp. Sau đây là một số locus
đƣợc sử dụng trong phƣơng pháp DNA barcode ở thực vật:
 Gen nhân:
Do tính phức tạp và lặp đi lặp lại, chỉ có một số gen nhân nhƣ 18S, 26S,
vùng ITS đƣợc sử dụng. Vùng 18S và 5,8S thƣờng đƣợc sử dụng để xác định ở
mức độ bộ hoặc họ; vùng 26S thƣờng đƣợc xác định ở mức dƣới họ cho đến

loài; vùng ITS và vùng 5,8S spacer thƣờng đƣợc dùng để phân tích ở mức độ
lồi cho tới mức dƣới lồi
 Vùng gen mã hóa ribosome
Gen rADN là hệ thống đa gen mã hóa phần RNA của ribosome. Các gen
ADN ribosome (rADN) mang trình tự vừa có tính bảo thủ vừa có tính đa dạng
thích hợp để phân biệt các loài gần gũi. Trong tế bào, rADN đƣợc sắp xếp nhƣ
các đơn vị đƣợc lặp lại ngẫu nhiên bao gồm ADN mã hóa ribosome 18S; 5,8S;
28S và xen giữa các trình tự khơng mã hóa ITS1, ITS2 (internal transcribed
9


spacers) nằm ở hai bên sƣờn của vùng 5,8S. Vùng mã hóa của ba gen rADN
đƣợc bảo tồn cao hơn hai vùng ITS. Nhìn chung các đơn vị rADN đƣợc lặp lại
hàng nghìn lần và đƣợc sắp xếp tập trung tại vùng lớn trên nhiễm sắc thể. Một
trong những tính năng đáng chú ý nhất của rADN là từng đơn vị trong hệ thống
đa gen khơng tiến hố độc lập, thay vào đó tất cả các đơn vị tiến hố một cách
phối hợp nhờ vậy mà rADN đạt mức ổn định cao hơn trong loài nhƣng khác biệt
giữa các loài khác nhau
Hiện tại, vùng ITS của gen nhân đƣợc xem là một trong những cơng cụ
hữu ích nhất để đánh giá phát sinh loài ở cả thực vật và động vật vì nó phổ biến
trong tự nhiên, kế thừa từ bố mẹ và biến đổi cao do ít hạn chế chức năng. Một số
nghiên cứu gần đây ở cây sinh sản hữu tính và cây sinh sản vơ tính cho thấy một
số mức độ biến đổi số các bản sao của trình tự ITS1 và ITS2 do nhiều nguyên
nhân nhƣ lai gần, phân ly, tái tổ hợp, tỷ lệ đột biến cao và hình thành gen giả của
các gen chức năng dẫn đến những thay đổi đó (Lê Đình Lƣơng và cs., 2004).
Trên cơ sở này ADN có thể đƣợc sử dụng để phân định chính xác và hiệu quả
thực vật trong cùng loài với đặc điểm lịch sử đời sống khác nhau (một năm, lâu
năm, trên cạn, dƣới nƣớc) và nguồn gốc tiến hóa khác nhau.
 Gen ycf5
ycf5 mã hóa cho một protein có chứa 330 amino acids. Gen này đƣợc bảo

tồn trên tất cả các vùng thực vật và đã đƣợc kiểm nghiệm cho phù hợp với DNA
barcode của một vài nhóm. Tuy nhiên, gen này chƣa đƣợc cơng nhận và sử dụng
nhiều trong vai trị của một DNA barcode.
 Gen lục lạp
Hệ gen lục lạp của thực vật gồm phân tử DNA mạch vịng có kích thƣớc
120 - 160 kb chia làm hai bản sao đơn là bản sao đơn lớn (large single-copy
region) và bản sao đơn nhỏ (small single-copy region). Hai bản sao đƣợc phân
cách bởi hai chuỗi lặp lại đảo nhau (IRa và IRb) có độ dài trung bình 20 - 30 kb.
Hệ gen lục lạp chứa tất cả các gen rRNA (4 gen ở thực vật bậc cao), các gen
tRNA (35 gen) và các gen khác mã hóa cho các protein tổng hợp trong lục lạp
(khoảng 100 gen) cần thiết cho sự tồn tại của chúng.
10


Bảng 1.1: Thông tin của một số mồi DNA Barcode thiết kế cho hệ gen lục lạp
Gen
rbcL

matK

rpoB

poC1

ycf5
(ccsA)

trnH–
psbA


trnL-F

Mồi
a-f
a-r
matK 1F
matK 1R
matK 2F
matK 2R
rpoB 1
rpoB 2
rpoB 3
rpoB 4
rpoC1 1
rpoC1 2
rpoC1 3
rpoC1 4
ycf5 1
ycf5 2
ycf5 3
ycf5 4
trnH2
psbAF
trnH(GUG)
psb A
trnL-c
trnL-d
trnL-e
trnL-f
trnL-g

trnL-h

Trình tự 5’→3’
ATGTCACCACAAACAGAGACTAAAGC
CTTCTGCTACAAATAAGAATCGATCTC
GAACTCGTCGGATGGAGTG
GAGAAATCTTTTTCATTACTACAGTG
CGTACTTTTATGTTTACAGGCTAA
TAAACGATCCTCTCATTCACGA
AAGTGCATTGTTGGAACTGG
ATGCAACGTCAAGCAGTTCC
CCGTATGTGAAAAGAAGTATA
GATCCCAGCATCACAATTCC
GTGGATACACTTCTTGATAATGG
GGCAAAGAGGGAAGATTTCG
TGAGAAAACATAAGTAAACGGGC
CCATAAGCATATCTTGAGTTGG
GGATTATTAGTCACTCGTTGG
ACTTTAGAGCATATATTAACTC
ACTTACGTGCATCATTAACCA
CCCAATACCATCATACTTAC
CGCGCATGGTGGATTCACAATCC
GTTATGCATGAAAGTAATGCTC
ACTGCCTTGATCCACTTGGC
CGAAGCTCCATCTACAAATGG
CGAAATCGGTAGACGCTACG
GGGGATAGAGGGACTTGAAC
GGTTCAAGTCCCTCTTATCCC




















ATTTGAACTGGTGACACGAG3’
GGGCAATCCTGAGCCAA
CCATTGAGTCTCTGCACCTATC














Ký hiệu: →: mồi xi; ←: mồi ngƣợc
Hệ gen lục lạp có tính bảo thủ cao và mang tính đặc thù của từng lồi do
vậy việc sử dụng các kết quả phân tích hệ gen lục lạp vào nghiên cứu phát sinh
loài và phân loại thực vật đƣợc các nhà khoa học rất quan tâm. Dựa trên những
thơng tin có sẵn từ các nghiên cứu về phát sinh loài và các nghiên cứu gần đây,
một số locus là đoạn gen hay các gen đƣợc chọn để nghiên cứu làm chỉ thị
barcode tiềm năng cho các lồi thực vật trên trái đất. Có khoảng 20 gen lục lạp
có độ dài phù hợp (khoảng 1 kb) đƣợc sử dụng trong nghiên cứu phát sinh loài.

11


Các gen này chứa đựng nhiều mức độ tiến hoá và vì vậy phù hợp cho nhiều mức
độ phân loại.
 Gen rbcL
Trong các gen lạp thể, rbcL là trình tự gen đặc trƣng nhất, mã hóa các tiểu
đơn vị lớn của rubilose - 1,5 - bisphosphate cacboxylase/ oxygenase
(RUBISCO). rbcL là gen đầu tiên đƣợc giải trình từ thực vật. rbcLđã đƣợc sử
dụng rộng rãi trong nghiên cứu phát sinh loài và phân loại thực vật với hơn
10000 trình tự rbcL có sẵn trong GenBank. Do sự dễ dàng trong khuếch đại
PCR ở một số nhóm thực vật, CBOL gần đây đã cơng nhận rbcL là một trong
những trình tự gen tiềm năng nhất cho các nghiên cứu DNA barcode ở thực vật.
Tuy nhiên, do khả năng phân biệt loài thấp, nên hầu hết các nhóm đều cho rằng
nên sử dụng kết hợp rbcL với các với các chỉ thị barcode khác, ví dụ
nhƣ matK là hai locus barcode chuẩn cho thực vật.
 Gen matK
Gen matK (Maturase K), thƣờng đƣợc biết đến nhƣ ORF (khung đọc mở),

dài khoảng 1500 bp, nó nằm bên trong gen trnK và mã hóa cho protein maturase
K tham gia quá trình sau phiên mã của quá trình sinh tổng hợp RNA vận chuyển
amino acid Lysin. Khu vực mã vạch matK bao gồm một khoảng 841 bp ở trung
tâm gen nằm giữa vị trí 205 - 1046 (bao gồm cả vùng mồi) trong trình tự tồn bộ
hệ gen lục lạp của A.thailiana. MatK là một trong những khu vực mã hóa tiến
hóa nhanh nhất của hệ gen lục lạp và cho thấy khả năng phân biệt cao các lồi
trong thực vật hạt kín.
Xem xét tỉ lệ tiến hóa cao của matK, nó đã đƣợc cơng nhận là mã vạch
thực vật và đƣợc đề xuất một mình hay kết hợp các locus khác. CBOL đã thử
nghiệm matK trên gần 500 loài thực vật và thấy rằng 90% mẫu thực vật hạt kín
dễ dàng khuếch đại trình tự bằng cách sử dụng cặp mồi đơn vị và đề nghị sử
dụng matK kết hợp với rbcL nhƣ hai locus mã vạch chuẩn cho thực vật (Hà Văn
Huân và cs., 2015).
Sự chọn lựa rbcL + matK nhƣ mã vạch lõi đƣợc dựa trên sự khuếch đại
đơn giản của khu vực rbcL (rbcL đƣợc khuếch đại thành công trong phạm vi
12


rộng bao gồm thực vật có hoa, thực vật hạt trần và thực vật khơng có hoa) và
khả năng phân biệt của khu vực matK (matK là một trong những khu vực mã
hóa tiến hóa nhanh nhất của hệ gen lục lạp, và có thể nói là gần nhƣ tƣơng tự mã
vạch CO1 ở động vật) (Nguyễn Hoàng Nghĩa, 1999). Hai dấu chuẩn mã vạch
gen lục lạp phân biệt tốt hơn so với sử dụng một dấu chuẩn mã vạch duy nhất,
nhƣng khơng có hai dấu chuẩn hoặc đa dấu chuẩn gen lục lạp cho độ phân giải
tốt hơn sự kết hợp giữa 2 dấu chuẩn rbcL + matK (Hamilton và cs., 1999). Khi
cả 2 dấu chuẩn đều là vùng mã hóa, sự đọc dịch các trình tự trên ADN thành các
acid amin của protein của gen đó có thể đƣợc sử dụng để tự động hóa kiểm tra cho
sự chỉnh sửa, lắp ráp lỗi, sự hiện diện của gen giả và định hƣớng đúng trình tự.
 Gen trnH – psbA
Một dấu chuẩn mã vạch gen lục lạp khác cũng đƣợc sử dụng rộng rãi

ngoài rbcL + matK là trnH – psbA. Ở hầu hết thực vật có hoa, kích thƣớc ở vùng
này hầu hết dao động từ 340-660 bp, dễ dàng đƣợc khuếch đại và là một trong
những vùng liên gen (IGS- intergenics spacer) ở thực vật (Joey Shaw và cs.,
2007). Nó đã đƣợc sử dụng thành cơng trong một loạt các nghiên cứu và là một
sự lựa chọn rõ ràng cho mã vạch bổ sung. Trong những nghiên cứu so sánh trực
tiếp, nó thành cơng cao hơn trong việc phân loại loài so với rbcL + matK ở
những nhóm nhƣ Ficus và Alnus (Nguyễn Hồng Nghĩa, 1999) và giải quyết
những nhóm phức tạp nhƣ Quercus và Salix (Lê Đình Lƣơng và cs., 2004). Sự
hiện diện của những vùng lặp lại có thể dẫn đến vài vấn đề ở một số nhỏ của các
nhóm. Một trong những mối quan tâm chính liên quan đến việc có sử dụng
tnrH-psbA nhƣ là một mã vạch tiêu chuẩn hay không là vấn đề trình tự đƣợc đọc
bị dùng lại sớm do xuất hiện các đơn nucleotid lặp đi lặp lại. Tuy nhiên, thử
nghiệm với các polymerase mới đã cải thiện chất lƣợng đọc trình tự ngay cả khi
có sự hiện diện của các đơn nucleotid (Joey Shaw và cs., 2007).
 Gen rpoB và rpoC1
Gen rpoB, rpoC1, rpoC2 mã hóa 3 trong 4 tiểu đơn vị của RNA
polymerase lục lạp. Khi nghiên cứu họ Dipterocarpaceae, Tsumura và cs.,
(1996) đã nhận thấy gen rpoB là thích hợp để nghiên cứu phát sinh lồi. Hiện
13


nay, rpoB là gen đƣợc sử dụng nhiều trong nghiên cứu phát sinh loài và xác định
các loài vi khuẩn, đặc biệt là khi nghiên cứu các chủng có quan hệ gần gũi. Cùng
với gen 16S rRNA, rpoB đƣợc sử dụng trong nhiều nghiên cứu để xác định loài
vi khuẩn mới, do vậy các gen này đƣợc đề xuất là chỉ thị barcode độc lập hoặc
kết hợp với một số gen khác. Trong các nghiên cứu gần đây, CBOL đã thử
nghiệm 7 locus và thấy rằng khả năng phân biệt loài cuả đoạn gen rpoC1 là thấp
nhất (43%). Mặc dù vậy, trong nghiên cứu Liu và cs., (2010) đã chỉ ra rpoC1 là
một chỉ thị rất hữu ích khi đƣợc sử dụng để phân biệt các loài bryophytes. Do
vậy cần có các nghiên cứu tiếp theo để chứng minh sự phù hợp khi sử dụng

rpoB và rpoC1 làm chỉ thị barcode trong các nghiên cứu giám định loài
(Hamilton và cs., 1999).
 Gen atpF-atpH và psbK-psbI
Các IGS atpF-atpH và psbK-psbI đã đƣợc đề xuất nhƣ các khu vực mã
vạch thực vật tại Hội nghị Barcode Of Life quốc tế thứ hai (Ki-Joong Kim).
Trong nghiên cứu của nhóm thực vật CBOL psbK-psbI cho khả năng phân biệt ở
mức độ cao nhƣng cho trình tự chất lƣợng kém hơn, trong khi atpF-atpH cho
thấy khả năng phân biệt tƣơng đối khiêm tốn và chất lƣợng trình tự trung bình.
Một số các nghiên cứu gần đây đã cung cấp các báo cáo tích cực về hiệu suất sử
dụng và hiệu quả của cả atpF-atpH và psbK-psbI, báo cáo đã chỉ ra rằng chúng
rất hữu ích trong các nghiên cứu về thực vật ở Hàn Quốc (Ki-Joong Kim) (Hà
Văn Huân và cs., 2015)
 Hai gen trnL (UAA)-trnF (GAA)
Locus trnL (UAA) - trnF (FAA) chứa gen intron trnL và vùng IGS giữa
trnL và trnF đã đƣợc sử dụng rộng rãi trong các hệ thống thực vật và phát sinh
lồi địa lí kể từ đầu những năm 1990. Các khu vực này có thể thu đƣợc các trình
tự một cách đơn giản, mặc dù các đơn nucleotid lặp lại có thể ảnh hƣởng đến
việc đọc các trình tự ở một số đơn vị phân loại. Những bản sao lặp lại của gen
trnF đã đƣợc báo cáo ở họ Brassicaceae và trong một vài đơn vị phân loại, bộ
gen lục lạp đã bị mất một IGS (ví dụ nhƣ Manihot esculenta, Selaginella

14


moellendorffi), ở một vài đơn vị khác thì mất intron (ví dụ nhƣ Lathyrus sativus,
Lotus japonicus, Trifolium subterraneum).
Một số nghiên cứu đã chỉ ra rằng các khu vực khác của bộ gen lục lạp có
thể có nhiều biến đổi và cung cấp thơng tin cho nghiên cứu phát sinh lồi, nhƣng
tiền năng chính của intron trnL cho nhận diện lồi là sự hiện diện của cấu trúc
thân - vòng nhỏ trong intron, đó là vịng P6. Đây là một “minibarcode” ngắn đã

đƣợc chứng tỏ rất hữu ích cho các nhà sinh thái học nghiên cứu ADN thối hóa
cao và sử dụng kĩ thuật giải trình tự ở các thế hệ tiếp theo và đánh giá sự đa
dạng của các mẫu trong môi trƣờng phức tạp (Hamilton và cs., 1999).
Nhƣ vậy, có 7 vùng ADN gồm: spacer atpF-atpH, gen matK, gen rbcL,
gen rpoB, gen rpoC1, spacer psbK-psbI, và spacer tnrH-psbA đƣợc chọn làm mã
vạch ADN cho thực vật, trong đó có 4 vùng là các phần của gen mã hóa (gen
matK, gen rbcL, gen rpoB, gen rpoC1) và 3 vùng đệm khơng mã hóa cho protein
(atpF-atpH, psbK-psbI, tnrH-psbA). Qua khảo sát đã chọn đƣợc 3 vùng là: rbcL
(dễ sử dụng nhƣng khó phân biệt), matK (khả năng phân biệt và mã hóa cao hơn,
gần với CO1, nhƣng tính phổ qt thấp) và trnH-psbA (có tính phổ qt, có khả
năng phân biệt cao nhƣng chiều dài hay thay đổi).
Mã vạch ADN thực vật đƣợc xem là một công cụ hữu hiệu trong việc
nhận diện và phân chia ranh giới giữa các loài. Đồng thời hỗ trợ quá trình nhận
diện các mẫu vật không nhận biết đƣợc hoặc chƣa xác định đƣợc thuộc lồi nào.
Vì vậy, hƣớng nghiên cứu ADN mã vạch đang đƣợc phát triển mạnh mẽ và
đƣợc ứng dụng rộng rãi trong nhiều ứng dụng liên quan đến việc thực hiện hoặc
sử dụng nhận dạng thực vật nhƣ phân loại học, sinh thái học, bảo vệ môi trƣờng,
lâm nghiệp, nông nghiệp, hải quan, kiểm dịch và trong nhiều trƣờng hợp cần xác
định “nhóm lồi”.
1.3.3. Hiện trạng của các mã vạch ở thực vật
Trọng tâm nghiên cứu mã vạch ở thực vật chủ yếu là về đánh giá hiệu quả
tƣơng đối của phân tử đánh dấu đã đƣợc sử dụng trong nghiên cứu phát sinh
loài. Từ việc đánh giá này cho thấy rằng không đoạn ADN nào đƣợc thử nghiệm
cho đến nay có tất cả ƣu điểm cần thiết cho mã vạch chuẩn ở thực vật. Mặc dù
15


một vài locus đã đƣợc thử nghiệm có nhiều đặc điểm hứa hẹn song vẫn còn
những hạn chế. Điều này cho thấy việc sử dụng kết hợp các locus để bổ sung
cho nhau đem lại hiệu quả cao hơn trong đánh giá, phân loại các loài ở thực vật.

Trên thực tế, từ lâu rbcL đã đƣợc nghiên cứu phát sinh lồi cho trình tự
chất lƣợng cao qua phát sinh các dịng phân ly và nó cũng thực hiện tốt khi kết
hợp đồng thời với các locus khác. Trình tự gen matK có tỷ lệ tiến hóa cao nhất
trong các gen lạp thể, do đó khả năng phân biệt lồi cao. Trên cơ sở đó CBOL
kết hợp hai locus của rbcL và matK mang lại hiệu quả cao (70% sự khác biệt
lồi) và giảm nhiều chi phí cho việc xây dựng mối quan hệ cũng nhƣ phân loại
đánh giá các loài thực vật. CBOL cho rằng “rbcL + matK” kết hợp đại diện cho
một giải pháp thực tế để trao đổi giữa tính phổ biến, chất lƣợng trình tự, sự phân
biệt và giá trị. Hiệu quả tƣơng tác, kết hợp giữa hai gen này có thể thích hợp cho
một vài ứng dụng nhƣ là điều tra tƣơng tác thực vật - động vật, xác định các loài
cây đƣợc bảo vệ, các cuộc khảo sát đa dạng sinh học quy mô lớn và phân biệt
cây giống trong các chƣơng trình tái sinh rừng và cho mục đích xác định lồi và
phân loại (Nguyễn Đức Lƣợng, 2002).
Năm 2010, Spooner và cs., sau khi xem xét hiệu quả của psbA-trnH,
matK, nrITS trên 63 loài khoai tây dại đã chỉ ra rằng trình tự của psbA-trnH,
matK và nrITS không cung cấp đầy đủ các thông tin về loài cụ thể, đặc biệt
trong khoai tây. Gen lạp thể không cho thấy đầy đủ sự khác biệt, trong khi các
trình tự nrITS cho thấy sự khác biệt trong lồi cao. Những khó khăn đó tƣơng tự
thấy trong chi Magnolia, họ Magnoliaceae và trong họ Lauraceae khi giải thích
mối quan hệ lồi. Từ những nghiên cứu cụ thể trên ba nhóm thực vật khác nhau
(thực vật hạt kín, hạt trần và rêu) các nhà phân loại kết luận rằng việc kết hợp
các locus hệ gen lạp thể nhƣ rbcL+rpoCl+matK+ trnH-psbA mang lại hiệu quả
cao nhƣ một hệ thống mã vạch duy nhất cho xác định các nhóm lồi rộng. Vì
vậy, trong các dự án nhƣ nhận dạng hay giới hạn lồi có u cầu sự phân tích
cao, việc đề xuất mã vạch hai locus tiêu chuẩn là không đủ, đồng thời cũng cho
thấy sự phân ly trong loài và quần thể ở nhiều thực vật hạt kín là rất lớn. Đặc
biệt trong cùng khu vực phân bố trải qua giao phối và giao phối cận huyết, sự
16



thay đổi của một hoặc hai trình tự gen lạp thể khơng đủ để đánh giá dấu ranh
giới lồi. Do vậy, để xác định các loài khác nhau cần sử dụng các vùng ADN
khác nhau
Hiện nay, hệ thống ADN mã vạch cho thực vật chƣa hoàn chỉnh. Tuy
nhiên với các trình tự mã vạch này, các nhà khoa học đã có những nghiên cứu,
ứng dụng với đầy hứa hẹn cho xác định loài ở thực vật, mở ra một triển vọng
mới cho công tác đánh giá, phân loại và bảo tồn đa dạng sinh học.
1.4.

Những nghiên cứu về ứng dụng DNA barcode trong giám định loài
thực vật.

1.4.1. Trên thế giới
Ngày nay, việc sử dụng ADN mã vạch để nhận dạng các lồi trên quy mơ
tồn cầu có ý nghĩa ngày càng lớn. Do đó, có nhiều cơng trình đƣợc cơng bố từ
nhiều nhóm các nhà khoa học đến từ khắp nơi trên thế giới.
Năm 2011 Sun Z và cs., đã tiến hành nghiên cứu đề tài “Xác định loài kim
ngân (Lonicera japonica) và các loài liên quan bằng phƣơng pháp DNA
barcode”. Ở nghiên cứu này để chọn ra vùng ADN phù hợp nhất trong việc xác
định loài, các tác giả đã thử nghiệm khả năng ứng dụng của bảy vùng ADN là
rbcL, matK, psbA-trnH, ITS2, ITS, trnL intron, trnL-F trên 40 mẫu kim ngân và
các lồi có quan hệ gần gũi làm mã vạch để xác định. Dựa trên đánh giá tỷ lệ
thành công của phản ứng PCR, chất lƣợng trình tự, mức độ phân biệt di truyền
cụ thể, khoảng cách mã vạch ADN kết quả cho thấy psbA-trnH là tốt nhất trong
số 7 locus đƣợc thử nhiệm với tỷ lệ nhận dạng đến 100%. Nghiên cứu này đã
cung cấp những thông tin quan trọng giúp xác thực nguồn gốc thực vật của dƣợc
liệu đƣợc liệt kê trong Dƣợc điển Trung Quốc.
Jiang C. và cs, (2012) đã tiến hành nghiên cứu “Xác định loài kim ngân
bằng cách khuyếch đại PCR hai chiều của các alen cụ thể”. Họ đã xác định SNP
và các ngoại chất của nó bằng cách sử dụng ClustulW để sắp xếp các chuỗi trnL

– trnF của chi kim ngân từ cơ sở dữ liệu của ngân hàng gen, sau đó mồi BiPASA đƣợc tạo ra kết hợp với hệ thống PCR sử dụng trên 84 mẫu để xác định
17


lồi kim ngân và các lồi lai với nó. Kết quả thu đƣợc ở 61oC ADN của loài kim
ngân sẽ đƣợc khuyếch đại lên 468bp trong khi các loài lai chỉ là 324bp. Phƣơng
pháp này có thể phát hiện 5% ADN loài lai với loài kim ngân.
He L. và cs, (2017) đã nghiên cứu và hoàn chỉnh đƣợc bộ genome lục lạp
của cây kim ngân. Kim ngân là 1 cây thuốc phổ biến ở Bắc Mỹ và Đông Á, đã
đƣợc giải trình tự và phân tích. Chiều dài bộ genome loài kim ngân là 185.078bp
chứa 1 cặp lai đảo ngƣợc (Ira và iRb) mỗi vùng dài 23.774bp, vùng lớn LSC là
88.858bp và vùng nhỏ SSC là 18.672bp, tổng cộng có 129 gen đƣợc xác định
trong bộ gen, 16 trong số đó đã đƣợc nhân đơi trong khu vực IR. Bộ gen của lồi
kim ngân có cách sắp xếp độc đáo giữa trnI-CAU và trnN-GUU. Ở loài kim
ngân các gen rps19, rpl2, và rpl23 di chuyển từ khu vực IR đến LSC. Gen ycf1 ở
vùng IR bị mất và chỉ có 1 bản sao nằm trong khu vực SSC. Nghiên cứu này đã
xác định đƣợc điểm độc đáo của bộ gen lồi kim ngân góp phần vào sự hiểu biết
của con ngƣời về sự thay đổi, tiến hóa của ADN, cung cấp thơng tin có giá trị
cho mã hóa thực vật và mã vạch của cây thuốc này.
1.4.2. Ở Việt Nam
Việc sử dụng ADN mã vạch cho nhận dạng loài ở Việt Nam cũng đang
phát triển, rất nhiều những loài quý nhờ phƣơng pháp này đã giảm thiểu nguy cơ
tuyệt chủng và tạo đƣợc cơ sở dữ liệu giúp cho việc định danh loài và truy xuất
nguồn gốc đƣợc thực hiện một cách dễ dàng.
Nguyễn Thị Thanh Nga và cs, (2012) đã tiến hành đề tài “Đánh giá tính
đa dạng di truyền một số loài Codonopsis ở Việt Nam bằng kỹ thuật mã vạch
ADN”. Đề tài góp phần xác định các mã vạch có thể phân biệt đƣợc các lồi
thuộc chi Codonopsis bằng cách kết hợp giữa phƣơng pháp phân loại hình thái
truyền thống với phƣơng pháp phân tích trình tự ADN của một gen mã vạch nhƣ
ITS, matK, trnK

Nguyễn Thị Phƣơng Trang và cs., (2014) đã giải mã trình tự ba vùng gen
lục lạp, đó là rbcL, matK và psbA-trnH nhằm phân biệt ba loài Sao (Hopea) là
18


Sao Hòn Gai (Hopea chinensis Hand-Mazz), Sao hải nam (Hopea hainanensis
Merr. & Chun) và sao mặt quỷ (Hopea mollissima C.Y.Wu) là những lồi cây
lấy gỗ có giá trị cao về khoa học và y học. Hiện nay, nhóm cây này đều đang bị
khai thác quá mức và có tên trong danh sách các loài đang bị đe dọa. Kết quả
cho thấy, có 6 vị trí sai khác nucleotide đƣợc tìm thấy giữa hai lồi H. chinensis
và H. mollissima, theo đó khoảng cách di truyền giữa hai loài này là 2%. Số
nucleotit sai khác giữa loài H. hainanensis và H. chinensis là 7, khoảng cách di
truyền của H. hainanensis với H. chinensisvà H. mollissima lần lƣợt là 4% và
6% (Nguyễn Thị Phƣơng Trang và cs., 2014).
Bùi Thanh Tùng và cs, (2016) đã xác định tên khoa học của cây Ô đầu
bằng phƣơng pháp giải trình tự gen ADN. Từ mẫu lá cây ô đầu trồng ở tỉnh Hà
Giang, đƣợc chiết tách, phân tích, giải trình tự gen và so sánh với mẫu trình tự
gen của lồi thuộc chi Aconitum. Kết quả đã giải đƣợc trình tự gen của cây Ơ
đầu và khi so sánh với trình tự gen của lồi A. carmichaeli Debx. thấy có sự
tƣơng đồng đến 99%. Nhƣ vậy bằng phƣơng pháp giải trình tự gen ADN đã xác
định đƣợc tên khoa học của cây Ô đầu trồng ở tỉnh Hà Giang là: A. carmichaeli
Debx. họ Ranunculaceae.
Hoàng Minh Trang và cs, (2016) đã tiến hành đề tài “Xác định một số
đoạn mã vạch ADN cho một số loài trà hoa vàng ở vƣờn quốc gia Tam Đảo”.
Từ các mẫu lá của 5 loài Hải đƣờng vàng (Camellia tienii Ninh), Trà vàng
Hakoda (Camellia hakoda Ninh, Tr.), Trà vàng lá dày (Camellia crassiphylla
Ninh et Hakoda), Trà vàng Tam Đảo (Camellia tamdaoesis Hakoda et Ninh),
Trà vàng Petelo (Camellia petelotii (Merr.) Sealy) đƣợc mang đi tách chiết ADN
để tiến hành phản ứng PCR so sánh với kích thƣớc các băng marker cho thấy
đoạn gen matK có kích thƣớc khoảng 950bp, đoạn rbcL có kích thƣớc khoảng

600bp, đoạn trnH-psbA là 500bp, đoạn ITS2 khoảng 400bp và đoạn ycf1b là
750bp. Các sản phẩm PCR này có thể giải trình tự trực tiếp để thu đƣợc trình tự
các đoạn Mã vạch ADN cho các lồi trà hoa vàng ở vƣờn quốc gia Tam Đảo.

19


×