Tải bản đầy đủ (.doc) (79 trang)

phân tích trình tự ITS và matK cây họ Gừng Zingiberaceae

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.87 MB, 79 trang )

- i -
MỤC LỤC

- ii -
DANH MỤC CHỮ KÍ HIỆU, CHỮ VIẾT TẮT
AFLP Amplified fragment length polymorphism
AP - PCR Arbitrary primed polymerase chain reaction
bp base pair
cpDNA Chloroplast geneome, bộ gene lục lạp
CTAB Cetyl trimethyl ammonium bromide
DAF DNA amplification fingerprinting
DNA Deoxyribonucleic acid
DNase Deoxyribonuclease
dNTPs Deoxynucleotide triphosphate
EDTA Ethylenediamine tetraacetate
ISSR Inter simple sequence repeat
ITS Internal transcribed spacer
matK maturaseK, gene mã hóa cho megakaryocyte - associated tyrosine kinase
Mega Molecular evolutionary genetics analysis
ML Maximum likelihood
MP Maximum parsimony
mtDNA Mitochondrial DNA, DNA ti thể
nDNA Nuclear DNA, DNA nhân
NJ Neighbour joining
nrDNA Nuclear ribosomal DNA, DNA ribosome nhân
NTSYSpc Numerical taxonomy and multivariate analysis system for personal computer
OD Optical density
ORF Open reading frame, khung đọc mở
OTU Operational taxonomic units
PCR Polymerase chain reaction
PVP Polyvinylpyrrolidone


RAPD Random amplification of polymorphic DNA
rDNA Ribosomal DNA
RFLP Restriction fragment length polymorphism
RNA Ribonucleic acid
Rnase Ribonuclease
rRNA Ribosomal ribonucleic acid
SM Simple matching coefficient
SSR Simple sequence repeat
TAE Tris – acetic acid – EDTA
TE Tris- HCl + EDTA
ts Transition, đồng hoán
ts/tv Transition/transversion, tỉ lệ đồng hoán / dị hoán
tv Transversion, dị hoán
trnK Translocated tRNA-Lys gene
- iii -
U Unit
UPGMA Unweighted pair group method with arithmetic mean
UV Ultraviolet
V Volt
VNTR Variable number tandem repeat
- iv -
DANH MỤC BẢNG
- v -
DANH MỤC HÌNH VẼ, ĐỒ THỊ
Hình 1.1. Các vùng gene dùng trong phân tích phân loại thực vật ở các mức độ
khác nhau [33] 9
Hình 1.2. Sơ đồ vùng ITS [37] 11
Hình 1.3. Sơ đồ mô tả các phương pháp dùng để định danh thực vật ở mức loài
[33] 13
Hình 1.4. Sơ đồ các mã vạch DNA được đề cử để xác định loài thực vật [10] 14

Hình 2.1. Sơ đồ mô tả vị trí các mồi dùng trong giải trình tự đoạn ITS 24
Hình 2.2. Sơ đồ mô tả vị trí các mồi dùng trong giải trình tự đoạn trnK 25
Hình 3.1. Sơ đồ cây thể hiện mối tương quan về di truyền giữa 25 mẫu ngải trên
cơ sở kiểu gene 31
Hình 3.2. Sản phẩm khuyếch đại vùng ITS. M: thang 100 bp 33
Hình 3.3. Sản phẩm khuyếch đại vùng trnK. M: thang 1 Kb 35
39
Hình 3.4. Cây phát sinh loài có gốc trình tự ITS. Giá trị bootstrap từ trái qua phải:
ML / MP / NJ. Mô hình tiến hóa theo Akaike Information Criterion:
TrNef+G. Phần chữ in đậm là các trình tự mới. -lnL = 2733.7436. 39
41
Hình 3.5. Cây phát sinh loài có gốc trình tự matK. Giá trị bootstrap từ trái qua
phải: ML /MP /NJ. Mô hình tiến hóa theo Akaike Information Criterion:
TPM1uf+G. Phần chữ in đậm là các trình tự mới. -lnL = 3737.1652 41
43
Hình 3.6. Cây phát sinh loài có gốc kết hợp trình tự ITS và matK. Giá trị
bootstrap từ trái qua phải: ML /MP /NJ. Mô hình tiến hóa theo Akaike
Information Criterion: GTR+I+G. Phần chữ in đậm là các trình tự mới.
-lnL = 6832.0743 43
- 1 -
MỞ ĐẦU
Họ Gừng (Zingiberaceae) ở Việt Nam rất phong phú, có từ 17 đến 20 chi và trên
100 loài [3]. Các cây họ Gừng được sử dụng từ lâu đời, làm gia vị hoặc làm thuốc,
bộ phận dùng thường là thân rễ. Với sự phát triển của khoa học, người ta đã nghiên
cứu và chứng minh được các tác dụng dược lý quý giá của các cây họ Gừng.
Các nghiên cứu ban đầu về cây thuốc có khả năng chữa ung thư ở Việt Nam cho
thấy có 50 loài thuộc 36 chi và 24 họ có khả năng chữa ung thư, trong đó
Zingiberaceae là đa dạng nhất (16%) [8]. Ngoài ra, trong một nghiên cứu sàng lọc
tác dụng kháng ung thư trên 77 cây thuốc Việt Nam thu thập từ vùng Bảy Núi, An
Giang và Lâm Đồng cho thấy 15 dịch chiết của 6 cây có khả năng kháng ung thư

trên một số dòng tế bào, trong đó có các loài nằm trong chi Alpinia thuộc họ Gừng
[43].
Ở vùng Bảy Núi, bên cạnh gừng, nghệ, riềng, đồng bào còn trồng và sử dụng một số
cây ngải thuộc họ Gừng để chữa các chứng đau bụng khí, viêm đại tràng, bó chữa
trật chân. Thực tế các loài ngải nói riêng, họ Gừng nói chung rất phong phú, lại có
đặc điểm hình thái khá giống nhau, phân bố ở các vùng khác nhau với tên gọi khác
nhau, nên nếu chỉ dựa vào đặc điểm hình thái thực vật, vi phẫu, hoá học (kiểu hình)
thì chưa đủ để xác định, rất dễ bị nhầm lẫn. Để góp phần xây dựng cơ sở dữ liệu
phục vụ công tác bảo tồn nguồn gene cũng như phát triển nguồn dược liệu nhiều
tiềm năng này, chúng tôi tiến hành đề tài khảo sát đa dạng di truyền một số cây
thuốc họ Gừng (Zingiberaceae) ở vùng Bảy Núi – An Giang.
Nội dung nghiên cứu của đề tài:
1. Sử dụng phương pháp PCR – RAPD khảo sát đa dạng di truyền.
2. Xây dựng cây phát sinh loài dựa vào trình tự DNA vùng ITS, vùng trnK –
matK và kết hợp vùng ITS và trnK – matK.
3. Bước đầu định danh các mẫu ngải dựa vào trình tự ITS và matK.
Mở đầu
- 2 -
CHƯƠNG 1. TỔNG QUAN
1.1. Khái quát về họ Gừng (Zingiberaceae)
1.1.1. Đặc điểm hình thái
Các cây trong họ Gừng (Zingiberaceae) gồm những cây thân thảo sống lâu năm. Rễ
nhỏ, hình sợi; đôi khi đầu rễ phình to lên thành dạng củ. Thân rễ to, nạc, nằm
ngang, chứa nhiều chất dự trữ, có khi rất ngắn hoặc chỉ mang hoa. Các bẹ lá ôm
chặt lấy nhau tạo thành thân giả, rất ngắn hoặc không có (Distichochlamys,
Kaempferia…) hay cao 1 - 3 m, đôi khi cao tới 4 - 5 m (Alpinia, Amomum…),
không phân nhánh. Cây thường có mùi thơm hoặc mùi hắc như một số loài trong
chi Zingiber. Lá đơn, mọc cách, các lá xếp thành hai hàng, thường hướng lên trên,
đôi khi nằm ngang gần như song song với mặt đất (Kaempferia galanga,
K. pulchra); có khi lá chỉ là bẹ lá dạng vảy. Lá gồm các phần: bẹ lá, cuống lá, lưỡi

lá và phiến lá. Bẹ lá mở đến gốc, phần dưới bẹ lá thường ôm chặt lấy nhau thành
thân giả. Cuống lá có thể có hay không có, ngắn hay dài (có thể dài tới 25 cm), hình
lòng máng nông hoặc sâu. Lưỡi lá (thìa lá) là phần giữa bẹ lá và cuống lá, từ bẹ lá
kéo dài lên. Lưỡi dày hay mỏng dạng màng, đầu nguyên hay xẻ hai, cụt ngang, dài
1 - 2 mm tới vài cm. Phiến lá: hình mác, hình trứng hẹp, bầu dục, ít khi gần tròn
(K. pulchra), gốc phiến nhọn, hình nêm hay gần tròn; đầu phiến thường nhọn, đôi
khi thót nhỏ thành dạng đuôi, hiếm khi tròn. Thông thường phiến lá màu xanh,
nhưng ở một vài loài trong một số chi mặt trên lá có đốm trắng loang lổ
(Stahlianthus) hay dọc gân chính mặt trên nâu đỏ (Curcuma) hoặc mặt dưới nâu đỏ
(Distichochlamys, Stahlianthus, Zingiber). Cụm hoa mọc trên ngọn thân có lá hay
từ thân rễ sát mặt đất, tách biệt với thân có lá, hoặc từ giữa các bẹ lá. Cụm hoa dạng
chùy, chùm hay bông. Cuống cụm hoa mọc từ thân rễ ở một số chi được bao phủ
bởi các bẹ lá dạng vảy thưa hay dày. Cụm hoa thường không phân nhánh, trừ một
số ít loài trong các chi Globba, Alpinia, Elettaria, Elettariopsis [2].
Mở đầu
- 2 -
1.1.2. Phân bố
Họ Gừng phân bố chủ yếu ở vùng nhiệt đới. Nó được tìm thấy ở các vùng nhiệt đới
châu Á, châu Phi và châu Mỹ; đặc biệt phân bố rộng rãi nhất ở vùng Đông Nam Á.
Một chi được tìm thấy ở Trung và Nam Mỹ là Renealmia; bốn chi
Aframomum, Aulotandra, Siphonochilus, và Renealmia được tìm thấy ở Châu Phi;
các chi còn lại phân bố ở vùng Đông Á và các đảo thuộc Thái Bình Dương [23].
Bảng 1.1 trình bày sự phân bố họ Gừng ở châu Á, vùng Đông Dương có tới 120 loài
(số liệu năm 1998) [40].
Bảng 1.1. Phân bố họ Gừng ở Châu Á [40].
Vùng địa lý Chi Loài
Thế giới (tổng cộng) 52 1500
Trung Quốc 21 200
Ấn Độ 18 120
Đông Dương 14 120

Malaysia 25 650
Nepal 11 35
Philippines 15 103
Thái Lan 20 200
1.1.3. Giá trị sử dụng
Trong bộ Gừng (Zingiberales) ở Việt Nam, họ Gừng (Zingiberaceae) là họ có số
lượng loài nhiều nhất. Đây là một họ có nhiều đại diện có giá trị làm thuốc chữa
bệnh, nhiều loài được sử dụng làm gia vị, làm cảnh [2].
Các cây thuộc họ Gừng được sử dụng làm thuốc theo các bài thuốc dân gian như
Riềng (Alpinia officinarum Han.) dùng làm gia vị và làm thuốc. Nghệ (Curcuma
domestica-Val. hay C. Longa L.) có thân rễ làm gia vị, làm thuốc chữa bệnh dạ dày,
bệnh vàng da, dùng cho phụ nữ sau khi sinh đẻ. Gừng (Zingiber officinale Rosc.) có
thân rễ thơm cay, dùng làm gia vị, làm mứt và làm thuốc, có tác dụng hưng phấn, dễ
tiêu. Gừng gió (Z. zerumbet Sm. ex L.) có thân rễ vị đắng và cay, cũng được dùng
làm thuốc. Ở rừng Việt Nam, còn gặp một số cây mọc ở tầng thấp như Ré (Alpinia
speciosa K. Chum.) có cánh môi vàng viền đỏ, quả mọng hình cầu, cây dùng lấy
Tổng quan
- 3 -
sợi. Thảo quả (Amomum tsaoko Roxb.) và Sa nhân (A. villosum Lour.) là hai loại
cây dùng làm thuốc, được khai thác nhiều để xuất khẩu, gặp nhiều ở các rừng miền
Bắc Việt Nam.
1.1.4. Phân loại thực vật
Hệ thống phân loại
Giới (Kingdom) Thực vật (Plantae)
Phân giới (Subkingdom) Tracheobionta
Ngành (Division) Magnoliophyta
Lớp (Class) Liliopsida
Phân lớp (Subclass) Zingiberidae
Bộ (Order) Zingiberales
Họ (Family) Zingiberaceae

Tại hội nghị chuyên đề lần III về Zingiberaceae tổ chức tại Thái Lan từ ngày 7 - 12
tháng 7 năm 2002 , Dr. W. John Kress đã đề nghị một cách phân loại họ Gừng mới,
dựa trên những nghiên cứu gần đây, bao gồm các phân tích về đặc điểm phân tử và
hình thái. Ông đã đề nghị chia họ Gừng thành 4 phân họ lớn, gồm 6 tông và 53 chi,
được thể hiện ở Bảng 1.2.
Bảng 1.2. Phân loại họ Gừng theo W. John Kress [23].
Phân họ
Siphonochiloideae
Phân họ
Tamijioideae
Phân họ Alpinioideae Phân họ Zingiberoideae
Tông
Siphonochileae
Tông
Tamijieae
Tông
Alpinieae
Tông
Riedelieae
Tông
Zingibereae
Tông
Globbeae
Siphonochilus Tamijia *Aulotandra Burbidgea Curcuma Globba
Aframomum Pleuranthodium Smithatris Mantisia
Renealmia Riedelia Hitchenia Gagnepainia
*Elettaria Siamanthus Stahlianthus Hemiorchis
*Leptosolena *Paracautleya
*Geostachys *Laosanthus
*Geocharis Camptandra

Tổng quan
- 4 -
*Cyphostigma Pyrgophyllum
Amomum Hedychium
Paramomum Rhynchanthus
*Elettariopsis Pommereschea
Alpinia *Stadiochilus
Plagiostachys *Nanochilus
Vanoverberghia Cautleya
Etlingera Roscoea
Hornstedtia Haniffia
Siliquamomum (Incertae Sedis) Boesenbergia
Curcumorpha
Kaempferia
*Haplochorema
Zingiber
Distichochlamys
Scaphochlamys
Cornukaempferia
*Parakaempferia
Caulokaempferia (Incertae
Sedis)
* các chi chưa có mẫu được phân tích về phát sinh loài dựa trên các đặc tính phân tử
Theo các nghiên cứu trong nước gần đây, họ Gừng ở Việt Nam có 19 chi với
khoảng 136 - 145 loài [2]. Sau đây là các chi thuộc họ Gừng (Zingiberaceae) có ở
Việt Nam [2]:
Chi 1. Alpinia Roxb. – Riềng, Sẹ
Chi 2. Amomum Roxb. nom. cons. – Sa nhân, thảo quả
Chi 3. Boesenbergia Kuntze – Bồng nga truật
Chi 4. Caulokaempferia K. Larsen – Đại bao khương

Chi 5. Cauley (Benth.) Royle ex Hook. f. – Cầu ly
Chi 6. Curcuma L. nom. cons. – Nghệ
Chi 7. Distichochlamys M. F. Newman – Gừng đen
Chi 8. Elettaria (L.) Maton – Trúc sa, tiểu đậu khấu
Tổng quan
- 5 -
Chi 9. Elettariopsis Baker – Tiểu đậu
Chi 10. Etlingera Giseke – Ét ling
Chi 11. Gagnepainia K. Schum. – Găng ba
Chi 12. Geostachys (Baker) Ridl. – Địa sa
Chi 13. Globba L. – Lô ba
Chi 14. Hedychium Koen. – Ngải tiên, bạch diệp
Chi 15. Hornstedtia Retz. – Giả sa nhân
Chi 16. Kaempferia L. – Địa liền, thiền liền
Chi 17. Siliquamomum Baill. – Sa nhân giác
Chi 18. Stahlianthus Ktunze – Tam thất gừng
Chi 19. Zingiber Boehm. – Gừng, khương
1.2. Marker phân tử trong nghiên cứu đa dạng di truyền họ Gừng
1.2.1. Marker phân tử và ứng dụng trong nghiên cứu bộ gene thực vật
Có rất nhiều kĩ thuật phân tử dùng để phân tích đa hình DNA. Nhìn chung chúng có
thể chia làm 3 loại là: các phương pháp dựa trên kĩ thuật lai, các phương pháp dựa
trên PCR và các phương pháp dựa trên giải trình tự [9].
Tổng quan
- 6 -
1.2.1.1. Các phương pháp dựa trên kĩ thuật lai
Các phương pháp dựa trên kĩ thuật lai gồm RFLP (restriction fragment length
polymorphisms) và VNTR (variable number tandem repeat). Các mồi đánh dấu
được lai trên màng lai chứa enzyme cắt giới hạn DNA. Sự hiện diện hay vắng mặt
của các băng trong kết quả lai giúp tìm ra tỉ lệ đa hình [9].
1.2.1.2. Các phương pháp dựa trên PCR

Các kĩ thuật dựa trên khái niệm này gồm các PCR mồi ngẫu nhiên (AP-PCR), sự đa
hình các đoạn DNA được khuếch đại ngẫu nhiên (RAPD) và dấu vân tay khuếch đại
DNA (DAF) [33]. Ngoài ra còn có ISSRs, SSR, AFLP… Hiện nay, các marker
thường được sử dụng nhất là RAPD [9].
RAPD là một trong những công cụ đơn giản, kinh tế và mạnh nhất để khảo sát các
biến đổi di truyền. Trong các nghiên cứu đã công bố, kĩ thuật RAPD thường cho số
lượng locus đa hình lớn, khá dễ thu được ngay cả với các loài không có sẵn thông
tin di truyền. So với các marker quần thể khác, marker RAPD cho kết quả khá
tương đồng với AFLP, ISSR và allozyme. Các marker RAPD được sử dụng khá phổ
biến, trong 307 nghiên cứu (từ năm 1993-2003), để đánh giá đa dạng di truyền cùng
loài [16].
Tuy đơn giản và rẻ tiền, nhưng kết quả đa hình từ RAPD lại rất dễ bị ảnh hưởng bởi
các yếu tố của phản ứng PCR, đòi hỏi độ tinh sạch của khuôn DNA cao. DNA
khuôn có lẫn RNA, ethanol, polysaccharide, phenolics cũng là những nguyên
nhân dẫn đến sự đa hình. RAPD chỉ phát hiện tính trạng trội nên những gene mang
tính trạng lặn sẽ khó tìm thấy sự đa hình, gây khó khăn và không xác định được cá
thể dị hợp tử. Ngoài ra, độ lặp lại của RAPD không cao khi tiến hành tại các phòng
thí nghiệm khác nhau. Những nhược điểm trên đòi hỏi chúng ta phải thực hiện việc
tối ưu hóa điều kiện phản ứng trước khi sử dụng phương pháp này. Do đó, kỹ thuật
RAPD thường được kết hợp với những kỹ thuật cao cấp khác để đánh giá đa dạng
di truyền và nhận diện chỉ thị phân tử có độ tin cậy cao.
Tổng quan
- 7 -
1.2.1.3. Các phương pháp dựa trên giải trình tự
Nhiều thông tin có thể thu được từ trình tự DNA. Trình tự DNA có thể được sử
dụng để nghiên cứu mối liên hệ phát sinh loài giữa các loài khác nhau. Trình tự
cũng cho phép phát hiện các loài mới hay các loài khác thường. Một ứng dụng ưu
việt khác là xác định loài tranh cãi bằng cách so sánh trình tự này với trình tự đã
được công bố trên cơ sở dữ liệu (như GenBank). Tuy nhiên để giải trình tự, chúng
ta cần biết trước trình tự để thiết kế mồi khuếch đại vùng gene mong muốn.

Sự đa hình và biến đổi trong trình tự DNA có thể xảy ra do sự thay thế, thêm hoặc
bớt các nucleotide. Các biến đổi này có thể được phát hiện một cách trực tiếp và có
thể thu được thông tin về một locus. Biến đổi di truyền ở mức độ một nucleotide
xảy ra khắp nơi. Giải trình tự trực tiếp có thể xác định được đa hình đơn nucleotide
ở từng loài nghiên cứu.
Một chiến lược khác của giải trình tự là phân tích sự đa dạng của trình tự ITS của
rDNA. Vùng ITS của rDNA 18S-26S cung cấp một trình tự hữu ích để nghiên cứu
sự phát sinh loài của nhiều họ thực vật hạt kín. Các trình tự DNA khác như trnK của
DNA lục lạp và vùng 5S rDNA cũng là các công cụ nhận định [9].
Các vùng khác nhau trong bộ gene có tỉ lệ tiến hóa khác nhau, có thể sử dụng để
định danh ở các mức độ phân loại khác nhau. Các vùng không mã hóa cho protein
có áp lực chọn lọc thấp nên tính đa dạng tăng và có thể dựa vào các vùng này để
xác định loài thực vật. Các vùng này thường là các vùng gene rRNA, các gene ti
thể, lục lạp [33]. Các gene này có khoảng hơn 100 bản sao, nên các phương pháp
sử dụng chúng có tính nhạy cao và thuận tiện cho việc khuếch đại. Đây cũng là một
thuận lợi cho PCR các mẫu dược liệu [33].
1.2.2. Ứng dụng marker phân tử trong nghiên cứu cây họ Gừng
1.2.2.1. Các nghiên cứu về đa dạng di truyền cây họ Gừng trên thế giới
Áp dụng phân tích DNA để khảo sát phân loại và nhận diện các cây họ Gừng đã
được nhiều nhà nghiên cứu trên thế giới quan tâm. Phân tích RAPD được dùng
Tổng quan
- 8 -
nghiên cứu đánh giá đa dạng di truyền DNA trên Nghệ C. aerugeneosa Roxb ở Thái
Lan [32], trên cây Riềng nếp (Alpinia spp.) [29], trên chi Curcuma ở Bangladesh
[16], giữa các loài thuộc chi Boesenbergia [28]. Phân tích đa dạng di truyền loài
Curcuma zedoaria (Christm.) Roscoe ở Bangladesh bằng RAPD cho thấy các quần
thể này duy trì tính đa dạng cao, có sự khác biệt giữa các vùng trồng [16]. RAPD
marker cũng được dùng để nghiên cứu nhận định và khảo sát mối quan hệ di truyền
8 dòng Gừng ở Ấn Độ [39].
Bên cạnh RAPD, các nhà nghiên cứu Ấn Độ đã chứng minh trình tự vùng internal

transcribed spacer (ITS) của ribosome nhân và gene matK (các nucleotide vị trí giữa
115 đến 130, 680 đến 690 và 1455 đến 1465 của gene matK) thuộc gene trnK có thể
dùng làm mã vạch DNA (DNA barcoding) cho cây họ Gừng [11].
1.2.2.2. Các nghiên cứu về đa dạng di truyền cây họ Gừng trong nước
Ở trong nước, các nghiên cứu về về họ Gừng đã được tiến hành từ rất lâu, chủ yếu
tập trung vào phân tích thành phần hóa học và khảo sát một số tác dụng sinh học.
Nghiên cứu về tính đa dạng của họ Gừng cũng được tiến hành nhưng không nhiều.
Một số nghiên cứu tiêu biểu như: khảo sát mối quan hệ di truyền và hàm lượng
curcumin một số loài Nghệ từ các vùng khác nhau của Việt Nam [7], nghiên cứu
đặc điểm vi học, thành phần hóa học và một số tác dụng sinh học của tinh dầu 3 cây
ngải sậy ở An Giang là Ngải sậy củ lớn, Ngải sậy củ nhỏ và Ngải sậy Campuchia
[6].
Qua các tài liệu thu thập được, có thể nói rằng nghiên cứu về nhận định loài, xây
dựng cây phát sinh loài, khảo sát tính đa dạng của các cây thuộc họ Gừng đã được
thực hiện rất nhiều trên thế giới. Thái Lan, một nước thuộc Đông Nam Á gần nước
ta, cũng đã có rất nhiều công bố về đa dạng di truyền họ Gừng ở mức độ phân tử.
Tuy nhiên, vấn đề này ở nước ta vẫn chưa được phát triển mạnh.
1.3. Nghiên cứu phát sinh loài họ Gừng
1.3.1. Trình tự DNA và phân loại thực vật
Tổng quan
- 9 -
1.3.1.1. Sơ lược về phân loại thực vật dựa vào trình tự DNA
Không giống như động vật, ngoài bộ gene nhân (nDNA) và ti thể (mtDNA), thực
vật còn có có một bộ gene bổ sung là bộ gene lạp lục (cpDNA). DNA nhân, lục lạp
và ti thể đều được sử dụng trong phân tích phát sinh loài. Tùy vào mức độ phân tích
mà mỗi vùng gene và mỗi phương pháp được áp dụng phù hợp. Do tính phức tạp và
lặp đi lặp lại, chỉ có một số gene thuộc nDNA như 18S, 26S, vùng ITS….được sử
dụng. Vùng 18S và vùng 5.8S thường được sử dụng để xác định ở mức bộ hoặc họ;
vùng 26S thường được dùng để xác định ở mức dưới họ cho đến loài; vùng ITS và
vùng 5S spacer thường được dùng để phân tích ở mức loài cho tới mức dưới loài

(Hình 1.1) [33].
Bộ gene ti thể phù hợp cho phân biệt ở mức loài vì chúng có đặc điểm là cấu trúc
kích thước, cấu hình, và trật tự gene thay đổi nhanh chóng. Gene cytochrome b và
vùng control thường được sử dụng ở mức từ loài đến dưới loài. Trước đây chúng
thường được sử dụng ở mức loài và gần đây chúng thường được sử dụng hơn ở mức
dưới loài (Hình 1.1) [33].
Hình 1.1. Các vùng gene dùng trong phân tích phân loại thực vật ở các mức độ
khác nhau [33].
Tổng quan
- 10 -
DNA lục lạp, ký hiệu là cpDNA (chloroplast DNA), là DNA sợi đôi, có chiều dài
trong khoảng 35 - 217 kb tùy loài thực vật, trong đó phần đông các loài có DNA dài
khoảng 115 - 165 kb. Trong mỗi tế bào thực vật có chứa 1000 – 10000 bản sao
cpDNA. Các gene thuộc cpDNA có tính bảo tồn cao và có thể được chia thành 3
nhóm như sau: Nhóm một là các gene mã hóa những yếu tố thuộc hệ thống quang
hợp như phytosystem (psaA, psaB, psbA, psbB ), cytochrome b6f (petA, petB ),
ATP synthase (atpA, atpB ), Rubisco (rbcL) và NAD(P)H dehydrogenease (ndhA,
ndhB ); Nhóm hai là các gene mã hóa cho các rRNA (rrn16, rrn5 ), trnA (trnH,
trnK ), RNA polymerase (rpoA, rpoB ), các gene tiểu phần ribosome (rps2,
rps3 ); Và nhóm ba gồm các khung đọc mở ORF gọi là ycfs (chưa rõ chức năng)
và các gene mã hóa protein như matK, cemA [34].
Có rất nhiều gene cpDNA tham gia trong phân tích phân loại thực vật như: 16S,
rbcL, atpβ, ndhF, intron trnL và matK …trải rộng từ bộ cho đến mức dưới loài.
Vùng 16S phù hợp ở mức bộ, trong khi rbcL, atpβ và ndhF phù hợp từ mức bộ đến
mức loài. Vùng intron trnL, spacer trnL-trnF và matK có thể áp dụng trong một
biên độ rộng từ bộ cho tới dưới loài. Trước đây chúng thường được sử dụng từ mức
họ cho tới mức loài; hiện nay chúng thường được sử dụng từ mức họ cho đến phụ
loài. Vùng atpβ-rbcL có thể được sử dụng từ mức chi đến mức dưới loài, nhưng
chúng cũng thường được sử dụng từ mức chi đến mức phụ loài (Hình 1.1) [33].
Gene rbcL được sử dụng nhiều để dựng cây phát sinh loài ở các hạt. Tuy nhiên, đối

với mối quan hệ di truyền ở mức dưới loài thì sự phân tích trên gene này gặp nhiều
hạn chế. Vì vậy, việc cần phải tìm một vùng DNA khác tiến hóa nhanh hơn gene
rbcL để xây dựng cây phát sinh loài ở mức dưới loài và gene matK là một gene đầy
hứa hẹn cho mục tiêu này [14].
1.3.1.2. Vùng ITS
ITS (internal transcribed spacer) là một đoạn RNA không có chức năng, nằm giữa
các RNA cấu trúc của ribosome thường được dịch mã. Cấu trúc vùng ITS gồm ITS1
Tổng quan
- 11 -
– 5.8S – ITS2 (Hình 1.2). Trong quá trình trưởng thành của rRNA, phần ITS bị cắt
và nhanh chóng phân hủy.
Hình 1.2. Sơ đồ vùng ITS [37].
Một lợi thế của vùng ITS là nó bao gồm 2 locus riêng biệt (ITS1 và ITS2) được nối
với nhau qua locus 5.8S. Vùng 5.8S khá bảo tồn, trên thực tế có đủ tín hiệu phát
sinh loài phân biệt ở mức bộ và ngành. Do đó các locus 5.8S có thể phục vụ như là
một điểm neo liên kết quan trọng để so sánh trình tự trong cả phát sinh loài và nhận
diện. Tiện ích của vùng bảo tồn như 5.8S tạo thuận lợi cho việc so sánh cơ sở dữ
liệu, đặc biệt là khi so sánh một chuỗi không tương đồng với thư viện trình tự [21].
1.3.1.3. Vùng gene matK
Gene matK (gene mã hóa cho maturaseK) được phát hiện đầu tiên bởi Sugita và
cộng sự (1985) trên cây thuốc lá (Nicotiana tabacum) khi giải trình tự vùng gene
trnK mã hóa cho tRNALys (UUU) của lục lạp. Nó gồm 1 đoạn ORF chứa 509
codon nằm trong intron của gene trnK và dường như chưa rõ chức năng [14].
Đã có một số nghiên cứu sử dụng trình tự gene matK để xây dựng cây phát sinh loài
như: Saxifragaceae (Johnson và Soltis, 1994, 1995; Johnson et al., 1996),
Polemoniaceae (Steele và Vilgalys, 1994; Johnson và Soltis, 1995), Orchidaceae
(Jarrell và Clegg, 1995), Myrtaceae (Gadek et al. 1996), Poaceae (Liang và Hilu
1996), Apiaceae (Plunkett et al. 1996) và thực vật có hoa (Hilu và Liang, 1997).
Thông qua các phân tích chi tiết trên trình tự gene matK có trên GenBank và các
nghiên cứu sơ bộ (Liang và Hilu, 1996; Hilu và Liang, 1997), cho thấy gene matK

có tính đa dạng hơn những gene khác có trong lục lạp [14].
Tổng quan
- 12 -
1.3.1.4.Giới thiệu sơ lược về cây phát sinh loài (phylogeney)
Phylogeney xuất phát từ sự kết hợp hai từ gốc Hy Lạp. Phylo nghĩa là trực hệ
(tuyến tính của một dòng họ) và genesis tức là nguồn gốc – tạm dịch phylogeney là
sự phát sinh loài.
Trong ngành molecular phylogeney, người ta nghiên cứu mối quan hệ giữa các loài
sinh vật thông qua các bằng chứng phân tử, cụ thể là trình tự DNA và protein. Như
vậy, sự phân kỳ di truyền được đánh giá thông qua sự khác biệt giữa các trình tự, là
kết quả của quá trình tiến hóa phân tử theo tiến trình thời gian. Bằng cách sử dụng
công cụ máy tính, các chuỗi dữ liệu sẽ mô phỏng tiến trình tiến hóa và phân tích
tiến trình phát sinh loài.
1.3.1.5. Nghiên cứu phát sinh loài họ Gừng bằng trình tự ITS và matK
Trình tự ITS được sử dụng để tiến hành phân tích xây dựng cây phát sinh loài trên
Roscoea [26], xác định nhanh các đột biến trên Aframomum [13]; xây dựng cây phát
sinh loài trên tông Zingibereae dựa trên trình tự ITS (nrDNA) và trình tự trnL - F
(cpDNA) [27].
Năm 2001, Hui Cao và cộng đã sự nghiên cứu nhận định nguồn gốc dược liệu các
cây thuộc chi Nghệ được dùng làm thuốc ở Nhật dựa trên trình tự gene 18S rRNA
và trnK [15]. Dựa trên phân tích riêng biệt và kết hợp trình tự ITS và matK để xây
dựng cây phát sinh loài chi Amomum (Alpinioideae: Zingiberaceae) [44]; xây dựng
cây phát sinh loài, mối quan hệ tiến hóa và phân loại chi Globba và tông Lobbeae
[24], xây dựng cây phát sinh loài ở mức độ phân tử trên chi Alpinia [22], chi Gừng
[23], phân tích đa dạng di truyền và định danh chi Boesenbergia Thái Lan [18].
Paul S. Manos và Kelly P. Steele (1997) đã nghiên cứu xây dựng cây phát sinh loài
Hamamelididae dựa trên dữ liệu trình tự DNA lục lạp, cụ thể là trên gene matK. So
sánh việc phân tích trình tự của gene matK với các trình tự của gene rbcL đã được
công bố trước đây cho thấy rằng cây phát sinh loài tạo ra từ trình tự của matK có độ
phân giải tốt hơn và tính ổn định cao hơn [30].

Tổng quan
- 13 -
1.3.2. Định danh cây họ Gừng
Hình 1.3. Sơ đồ mô tả các phương pháp dùng để định danh thực vật ở mức loài [33].
Mã vạch DNA (DNA barcoding) là trình tự của một chuỗi DNA ngắn, có cùng
nguồn gốc tổ tiên (orthologous), được đề xuất và khởi xướng để tạo điều kiện
nghiên cứu đa dạng sinh học, xác định người chưa thành niên, giới tính liên kết,
phân tích pháp y [21], [22].
Tại hội nghị “The Second International Barcode of Life Conference” được tổ chức
tại Đài loan (16 - 21/12/2007), các nhà khoa học đã đưa ra các mã vạch DNA sử
dụng trên thực vật (Bảng 1.3 và Hình 1.4). Tuy nhiên các nhà khoa học vẫn chưa
thống nhất chọn vùng gene hay vùng spacer nào cho tất cả các loài thực vật.
Bảng 1.3. Các mã vạch DNA thực vật được đề nghị [12].
Nhóm nghiên cứu Gene Spacer
Kress và cộng sự rbcL trnH-psbA
Chase và cộng sự matK, rpoC1, rpoB
Chase và cộng sự matK, rpoC1 trnH - psbA
Tổng quan
Nhận định mẫu
các loài chưa biết
Phát hiện
các loài đích /
sự khác biệt của
các loài trong cùng chi
Phát hiện các loài
trong danh sách
các loài nghi ngờ
Mức loài
Giải trình tự các vùng
đặc hiệu cho loài

Lai vi bản trải
SCAR /
ARMS
- 14 -
Kim và cộng sự matK, atpF/H trnH - psbA
Kim và cộng sự matK, atpF/H psbK/I
Hình 1.4. Sơ đồ các mã vạch DNA được đề cử để xác định loài thực vật [10].
Như vậy có 7 vùng DNA plastid gồm spacer atpF - atpH , gene matK, gene rbcL,
gene rpoB, gene rpoC1, spacer psbK – psbI, và spacer trnH – psbA được chọn làm
ứng cử viên làm mã vạch DNA cho thực vật trên đất liền; trong đó, có bốn vùng là
các phần của gene mã hóa (gene matK, gene rbcL, gene rpoB và gene rpoC1), và
ba vùng đệm không mã hóa cho protein (atpF - atpH, trnH - psbA, và psbK - psbI).
Qua khảo sát đã chọn ra được 3 vùng plastid là: rbcL (dễ sử dụng nhưng khó phân
biệt); matK (khả năng phân biệt và mã hóa cao hơn, gần với CO1, nhưng tính phổ
quát thấp) và trnH - psbA (có tính phổ quát, có khả năng phân biệt cao nhưng chiều
dài hay thay đổi [10].
Tổng quan
- 15 -
CHƯƠNG 2. VẬT LIỆU VÀ PHƯƠNG PHÁP
2.1. Mẫu nghiên cứu
Các mẫu nghiên cứu gồm 25 mẫu ngải hiện có ở vùng Bảy Núi, huyện Tịnh Biên,
tỉnh An Giang; trong đó có một số mẫu đã được Trung tâm Sâm và Dược liệu
Thành Phố Hồ Chí Minh thu thập, nhân giống; một số do công ty DOMESCO cung
cấp. Các mẫu này bao gồm củ tươi hoặc cây nguyên vẹn. Ngoài ra, chúng tôi sử
dụng 28 loài có trình tự ITS và/hoặc trnK – matK trên GenBank để phân tích; trong
đó có 25 loài thuộc nhóm trong và 3 loài thuộc nhóm ngoài (Bảng 2.1) (xem thêm
phụ lục A).
Bảng 2.1. Danh sách các mẫu vật liệu được sử dụng trong nghiên cứu.
A. Các mẫu thực nghiệm
Stt Ký hiệu mẫu Nguồn cung cấp

1 N1 TT Sâm và Dược liệu TPHCM
2 N2 TT Sâm và Dược liệu TPHCM
3 N3 TT Sâm và Dược liệu TPHCM
4 N4 TT Sâm và Dược liệu TPHCM
5 N5 TT Sâm và Dược liệu TPHCM
6 N6 TT Sâm và Dược liệu TPHCM
7 N7 Công ty DOMESCO
8 N8 Công ty DOMESCO
9 N9 Công ty DOMESCO
10 N10 Công ty DOMESCO
11 N11 Công ty DOMESCO
12 N12 Công ty DOMESCO
13 N13 Công ty DOMESCO
14 N18 Bảy Núi, Tịnh Biên, An Giang
15 N19 Bảy Núi, Tịnh Biên, An Giang
16 N20 Bảy Núi, Tịnh Biên, An Giang
17 N21 Bảy Núi, Tịnh Biên, An Giang
18 N22 Bảy Núi, Tịnh Biên, An Giang
19 N23 Bảy Núi, Tịnh Biên, An Giang
20 N24 Bảy Núi, Tịnh Biên, An Giang
21 N25 Bảy Núi, Tịnh Biên, An Giang
22 N26 Bảy Núi, Tịnh Biên, An Giang
Vật liệu và phương pháp
- 16 -
23 N27 Bảy Núi, Tịnh Biên, An Giang
24 N28 Bảy Núi, Tịnh Biên, An Giang
25 N29 TT Sâm và Dược liệu TPHCM
B. Các mẫu có trình tự ITS và trnK - matK trên GenBank
Tên loài
Accession number

ITS matK
26 Aframomum libatum JF848584
27 Aframomum sp. Kress 99-6368
AF478707 AF478807
28 Aframomum sp. Waimea W86S127 AF478708 AF478808
29 Alpinia elegans K. Schum. AF478713 AF478813
30 Alpinia galanga (L.) Willd AY424739
AF478815
31 Amomum yunnanense S. Q. Tong AY352012 AY352039
32 Boesenbergia aff. burttiana Sakai
378
AB097226
33 Boesenbergia rotunda AF478726 AF478827
34 Curcuma amada Roxb. AY424752
35 Curcuma longa AB557689 AB557670
36 Curcuma roscoeana AF478739 AF478839
37 Curcumorpha longiflora AF478743
38 Globba sp. Williams 00 334 AY339741 AY341104
39 Hedychium villosum AF478762 AF478861
40 Hitchenia glauca AF478765 AF478864
41 Kaempferia paviflora AF478768 AF478869
42 Kaempferia rotunda L. AY424765 AF478868
43 Smithatris supraneanae W.J. Kress
& K. Larsen
AY424772 AF478896
44 Stahlianthus involucratus (Baker)
R. M. Sm.
AY424773 AF478897
45 Zingiber ellipticum AF478799 AF478901
46 Zingiber fragile

DQ064581
47 Zingiber officinale DQ064590 AB047756
48 Zingiber rezumbet AF478803
49 Zingiber sp. Takano cult 21 (KYO) AB049291
50 Zingiber spectabile AF414499
51 Siphonochilus decorus* AY769810 AF478894
52 Siphonochilus aethiopicus* AY769811 AF478893
53 Siphonochilus kirkii* AF478794 AF478895
* nhóm ngoài
Vật liệu và phương pháp
- 17 -
2.2. Thiết bị
Tủ âm (-) 86
o
C Nuaire ILS-DF8517E
Tủ âm (-) 20
o
C Sanaky VH-130
Tủ lạnh
Nồi hấp tiệt trùng
Tủ sấy
Lò vi sóng
Máy ổn nhiệt Wealtec HB-2
Máy khuấy từ
Máy đo pH Digimed DM-21
Bộ thiết bị điện di ngang, gel agarose, Advance Mupid EXu
Bộ thiết bị đọc gel Dolphin Doc (Wealtec)
Máy PCR BioRad MyCycle
Máy đo quang phổ UV-VIS
Micropipette và các loại đầu tip tương ứng từ hãng BIOHIT: 0.1 - 3µL,

2 - 20 µL, 10 - 100 µL, 20 - 200 µL, 100 - 1000 µL, 1 - 10mL.
2.3. Phương pháp nghiên cứu
2.3.1. Chiết tách và tinh sạch DNA
 Nguyên vật liệu
Nitơ lỏng (Sovigaz)
Tris - HCl: cân Tris - base ở nồng độ cần dùng, hòa tan trong 80% lượng
nước, thêm HCl, dùng máy đo pH để chỉnh dung dịch về pH 8,0; thêm nước
vừa đủ. Lưu ý nhiệt độ tăng 1
o
C thì pH giảm khoảng 0,03 đơn vị.
EDTA 0,5 M pH 8: hòa tan Na
2
EDTA trong nước, điều chỉnh pH đến 8 bằng
NaOH, thêm nước vừa đủ 1 lít.
Isopropanol.
Vật liệu và phương pháp
- 18 -
Nuclei lysis buffer (N.L.B): 1,4 M NaCl; 0,1 M Tris - HCl (pH 8.0); 20 mM
EDTA; 2% PVP - 40; 1% 2 - mercaptoethanol.
Extraction buffer (CTAB 2%, PVP 2%, NaCl 5M, Tris - HCl 1M, EDTA
0.5M)
Chloroform : isoamylalcohol (24:1).
Cồn tuyệt đối và cồn 70%.
TE
0,1
(10 mM Tris - Cl, pH 7,4 và 0,1 mM EDTA) : phối hợp 0,5 mL Tris -
HCl 2 M; pH 7,4 và 20 ml EDTA 0,5 M (pH 8); thêm 99,48 mL nước. Tiệt
trùng bằng lò hấp, bảo quản ở nhiệt độ phòng.
RNase 10 mg/mL: hòa tan 10 mg/mL RNase trong TE, đun sôi 10 phút để
diệt DNase. Chia thành các phần nhỏ và bảo quản -20

o
C.
 Tiến hành chiết DNA từ lá [16]
1. Cân lượng mẫu khoảng 100 mg.
2. Nghiền mịn mẫu với nitơ lỏng bằng bộ cối chày rồi cho vào tuýp 1,5 mL.
3. Thêm 600 µL dung dịch đệm chiết N.L.B và 3 µL RNase, ủ 60
o
C trong 1
giờ, lắc tay định kỳ.
4. Thêm đồng lượng Chloroform : Isoamylalcohol, lắc mạnh trong 1 phút, sau
đó để yên ở nhiệt độ phòng trong 5 phút.
5. Ly tâm 10000 vòng/phút, trong 10 phút, sau đó lấy dịch nổi (lớp trên) sang
tuýp mới.
6. Thêm đồng lượng Chloroform : Isoamylalcohol, lắc mạnh trong 1 phút, sau
đó để yên ở nhiệt độ phòng trong 5 phút.
7. Ly tâm 10000 vòng/phút trong 10 phút, sau đó lấy dịch nổi (lớp trên) sang
tuýp mới.
8. Cho vào 2/3 thể tích isopropanol, lắc đều, ủ ở -20
o
C trong 1 giờ, sau đó ly
tâm 10000 vòng/phút trong 10 phút, rồi bỏ isopropanol lấy phần cắn.
9. Rửa cắn với 1 mL ethanol 70%, sau đó ly tâm 10000 vòng/phút trong 1 phút,
để khô cồn.
Vật liệu và phương pháp
- 19 -
10. Hòa tan cắn trong 50 µL dung dịch bảo quản đệm TE
0,1
và bảo quản ở
-20
o

C.
 Tiến hành chiết DNA từ củ [1]
1. Cân lượng mẫu khoảng 100 mg
2. Nghiền mịn mẫu với nitơ lỏng bằng bộ cối chày rồi cho vào tuýp 1,5 mL.
3. Thêm 600 µL dịch EB, lắc liên tục trong đá khoảng trong 5 phút. Sau đó, ly
tâm 10000 vòng/phút, trong 10 phút, lấy phần cắn.
4. Tương tự từ bước 3 đến bước 10 như ở qui trình li trích DNA từ lá.
2.3.2. Kiểm tra dịch chiết DNA
Pha loãng dịch chiết DNA trong nước cất để đạt độ pha loãng 300 lần.
Tiến hành đo quang ở 3 bước sóng: 230 nm (A
230
), 260 nm (A
260
), và 280 nm
(A
280
).
Cách tính nồng độ DNA khi đo quang.
A
260
=1 tương ứng với 50 ng/µL.
Nồng độ DNA (ng/µL) = Số đơn vị A
260
x 50 x độ pha loãng
Vậy: Nồng độ DNA (ng/µL) = A
260
x 15000
Kiểm tra dịch chiết DNA bằng điện di trên gel agarose 1% và đọc kết quả
dưới đèn UV ở bước sóng 254 nm.
DNA tinh sạch được bảo quản ở -20

0
C đến khi dùng.
2.3.3. Điện di
 Nguyên vật liệu
Dung dịch đệm TAE 1X: pha từ dung dịch mẹ TAE 50X.
Agarose tinh khiết dùng cho điện di (Merck).
Dung dịch ethidium bromide 10 mg/mL.
Dung dịch đệm nạp mẫu (loading buffer) 10X (Promega).
Thang DNA chuẩn 1 Kb hoặc 100 bp (Promega).
 Tiến hành
Vật liệu và phương pháp

×