Tải bản đầy đủ (.doc) (27 trang)

Tách chiết ADN với số lượng cực lớn, chất lượng cao của 30 giống lúa bản địa ưu tú được tuyển chọn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (599.14 KB, 27 trang )

CHUYÊN ĐỀ 1.1
Tách chiết ADN với số lượng cực lớn, chất lượng cao của 30 giống lúa
bản địa ưu tú được tuyển chọn
I. MỞ ĐẦU
Việt Nam là một trong những trung tâm phát sinh và đa dạng di truyền nguồn
gen cây lúa. Với nhiều tập đoàn giống lúa địa phương phong phú, đa đạng và rất nhiều
nguồn gen lúa có các đặc tính nông sinh học quí (như: chịu hạn, chịu mặn, kháng rầy
nâu, đạo ôn, khô vằn, bạc lá…vv) nhưng chưa được khai thác và sử dụng một cách có
hiệu quả. Để khai thác và sử dụng có hiệu quả các nguồn gen lúa bản địa trong các
chương trình chọn và lai tạo giống, đòi hỏi phải có những thông tin về phenotype và
genotype. Việc giải mã toàn bộ hệ gen của các giống lúa bản địa sẽ cung cấp thông tin
ở mức phân tử một cách đầy đủ nhất. Dựa vào trình tự bộ gen có thể lập bản đồ và xây
dựng được hệ thống marker phân tử bao phủ toàn bộ genome; chú giải cấu trúc hệ
gen; nghiên cứu chức năng sinh học của gen và chức năng của gen trong việc điều hòa
hay tương tác với các gen và các phân tử khác; nghiên cứu biểu hiện của gen; xác định
các locus tính trạng số lượng (QTL - Quantitative Trait Loci)..vv.
Để giải mã thành công hệ gen của một loài thực vật nào đó, một công đoạn rất
quan trọng là quá trình tách chiết ADN với số lượng lớn, nồng độ cao, tinh sạch và
chất lượng cực tốt (ADN không bị đứt gãy) để xây dựng thư viện hệ gen phục vụ cho
quá trình giải mã.
II. TỔNG QUAN
2.1. Các phương pháp và chiến lược giải trình tự hệ gen mới
Do yêu cầu cao của việc giải trình tự trong một thời gian ngắn với chi phí thấp
đã dẫn đến kĩ thuật giải trình tự hiệu suất cao: bằng cách tạo ra hàng nghìn hay hàng
triệu trình tự cùng lúc. Giải trình tự hiệu suất cao được mong đợi làm giảm giá thành
giải trình tự ADN so với phương pháp trước kia [13].
2.1.1. Phương pháp khuếch đại dòng tại chỗ
Hầu hết các phương pháp giải trình tự đều sử dụng bước nhân dòng trong ống
nghiệm để khuếch đại các phân tử ADN, bởi vì các kĩ thuật phát hiện ADN không đủ
nhạy cho việc giải trình tự một phân tử riêng lẻ. Trong kĩ thuật PCR nhũ tương
(Emulsion PCR): từng phân tử ADN riêng lẻ cùng với hạt mang mồi được bao bọc


trong các giọt nước nằm trong pha dầu, phản ứng chuỗi trùng hợp sau đó bao bọc các
hạt cùng với các bản sao của phân tử ADN được bất động hóa cho việc giải trình tự
tiếp theo. Phản ứng PCR nhũ tương được sử dụng trong phương pháp của Marguilis
và cộng sự (được thương mại hóa trong hệ thống máy 454 Life Sciences, Roche).
Shendure và cộng sự còn đưa ra phương pháp “giải trình tự xúc xích” (Polony
1


sequencing) và phương pháp giải trình tự rắn (Solid sequencing), (được phát triển bởi
Agencourt, nay là Applied Biosystems). Một kĩ thuật khác là PCR cầu: các phân đoạn
được khuếch đại dựa vào các mồi được gắn với bề mặt rắn, được sử dụng trong hệ
thống phân tích hệ gen Illumina. Kĩ thuật đơn phân tử được phát triển bởi phòng thí
nghiệm của Stephen Quake (sau này được thương mại hóa bởi hãng Helicos) là một
ngoại lệ: nó sử dụng huỳnh quang phát sáng và sự kích thích tia laze để phát hiện từng
sự kiện pyrosequencing ở từng phân tử ADN riêng lẻ đã cố định trên một bề mặt, loại
bỏ sự cần thiết phải khuếch đại phân tử ADN [21], [22].
2.1.2. Giải trình tự ngang hàng
Các phân tử ADN được gắn vào một bề mặt và việc giải trình tự được diễn ra
song song (ngang hàng giữa các phân tử ADN). Giải trình tự bằng cách tổng hợp,
giống như giải trình tự bằng cách điện di phần kết thúc nhuộm, sử dụng một phân tử
ADN polymerase để xác định trình tự cơ sở. Các kĩ thuật phần kết thúc thuận nghịch
(được sử dụng trong hệ thống Illumina và Helicos) sử dụng các phiên bản thuận
nghịch của phần kết thúc nhuộm, bổ sung một nuleotide vào cùng một thời điểm, cố
định huỳnh quang ở mỗi vị trí trong thời gian thực hiện, bằng cách lặp lại việc loại bỏ
nhóm bị khóa để cho phép việc kéo dài chuỗi với các nuleotide khác. Pyrosequencing
(được sử dụng trong hệ máy 454, Roche) cũng sử dụng sự kéo dài chuỗi ADN, bằng
cách bổ sung một loại ADN vào một thời điểm và đồng thời xác định số lượng
nucleotide được bổ sung để đưa ra vị trí thông qua phát sáng bằng cách loại bỏ nhóm
pyriphosphate gắn kèm [22].
2.1.3. Giải trình tự bằng phản ứng gắn

Giải trình tự bằng phản ứng gắn sử dụng một enzyme ADN ligase để xác định
trình tự đích, nó được sử dụng trong phương pháp “xúc xích” và trong công nghệ
SOLiD của AB. Phương pháp này sử dụng một tập hợp có thể tồn tại các
oligonucleotide có chiều dài xác định, được đánh dấu theo vị trí biết trước. Các
oligonucleotide được tôi luyện và gắn lại; các ADN có trình tự bổ sung sẽ bắt cặp vào
từng vị trí và sẽ được xác định trình tự [37].
2.1.4. Giải trình tự bằng phương pháp Sanger vi lỏng
Trong phương pháp này, toàn bộ chu trình nhiệt khuếch đại ADN cũng như phân
tách chúng bằng điện di được thực hiện trong một bản kích xốp (đường kính xấp xỉ 10
cm) do đó giảm thiểu hóa chất cũng như chi phí. Tuy nhiên phương pháp này vẫn chỉ
đang trong giai đoạn thử nghiệm chưa có báo cáo cụ thể về việc thương mại hóa [37].

2.2. Sự phát triển của thiết bị giải mã ADN và phương pháp giải mã hệ gen
2


Từ khi phương pháp giải mã ADN được phát minh giữa thập niên 70 của thế kỷ
20, thiết bị công nghệ cho giải đã trải qua các thế hệ sau:
- Thiết bị giải mã ADN thủ công (1975-1985): dựa trên phương pháp hóa học
hoặc kết thúc chuỗi với các thiết bị cần thiết như: điện di tấm/bản gel, đánh dấu phóng
xạ, chụp ảnh phóng xạ tự ghi. Quá trình giải mã ADN diễn ra chậm chạp hoàn toàn
thủ công và độc hại.
- Thiết bị giải mã ADN bán tự động và thiết bị giải mã gen tự động thế hệ I
(1986-2000) dựa trên phương pháp kết thúc chuỗi với một số thay đổi, đánh dấu
huỳnh quang mồi, đọc qua đầu dò phát hiện bằng tia laze.
- Thiết bị giải mã ADN tự động thế hệ I nâng cấp (từ 2000 đến nay): dựa trên
phương pháp kết thúc chuỗi nhưng cải tiến đánh dấu huỳnh quang trên các ddNTPs
(nhuộm phần kết thúc), điện di mao quản. Các thiết bị thuộc thế hệ I nâng cấp cho
phép giải trình tự cùng một lúc vài trăm phân mảnh ADN với kích thước từ 300-900
nucleotide (số lượng và kích thước phân mảnh ADN có thể xác định trình tự phụ

thuộc đời máy). Hiện nay, các thiết bị thuộc thế hệ I (đang chiếm số lượng lớn trên thế
giới và cả ở Việt Nam) là thiết bị cơ bản cho bất kỳ phòng thí nghiệm liên quan đến
nghiên cứu di truyền học và phân tích hệ gen. Tuy nhiên, với các hệ gen có kích thước
lớn thì cần có các phòng thí nghiệm trang bị nhiều máy thế hệ I nâng cấp hoặc cần sự
kết hợp của nhiều phòng thí nghiệm của quốc gia hoặc quốc tế cho từng dự án lớn bên
cạnh yêu cầu về số lượng nhân sự có trình độ để vận hành và phân tích kết quả.
- Thiết bị giải mã ADN tự động thế hệ II (từ 2007): dựa trên công nghệ chip
ADN, khuếch đại từng phân tử ADN, giải trình tự ngang hàng cùng lúc hàng nghìn
hoặc hàng triệu phân tử ADN cho phép nâng hiệu suất giải trình tự lên vài trăm lần
thậm chí vài nghìn lần so với thế hệ thứ I nâng cấp [37]. Hiện nay, có nhiều hãng với
nhiều công nghệ khác nhau đã thương mại hóa các thiết bị thế hệ II này. Tuy nhiên,
giá thành còn rất cao nên mới được các phòng thí nghiệm có quy mô và ngân sách lớn
đưa vào sử dụng. Các máy thế hệ thứ II là công cụ quan trọng không thể thiếu với các
dự án genome quy mô lớn để phân tích hệ gen của nhiều cá thể.
- Thế hệ giải mã ADN tự động thế hệ III: đây là thế hệ dự kiến có tính năng vượt
trội, như hệ thống Helicos Biosciences' Heliscope của Helicos Biosciences dự kiến là
hệ thống giải trình tự ADN thế hệ thứ III đầu tiên được thương mại hóa vào cuối năm
2010 (next-next generation sequencing).
Về phương pháp giải mã hệ gen, cùng với sự phát triển của kĩ thuật giải mã
ADN và sự xuất hiện của các thiết bị giải mã ADN tự động có hiệu suất cao phương
pháp giải mã hệ gen đã có nhiều thay đổi. Khởi đầu với kĩ thuật cũ sử dụng đánh dấu
phóng xạ và phương pháp giải trình tự thủ công người ta chỉ giải được hệ gen của các
sinh vật có kích thước tương đối nhỏ như các thực khuẩn thể, các virus. Các gen được
3


nhân bản và giải mã lần lượt và được sắp xếp lại với nhau nhờ bản đồ liên kết (bản đồ
di truyền) đã được xây dựng trước đó. Nhưng với các hệ gen lớn hơn thì để giải mã
chúng, con người phải chờ đợi các máy giải trình tự tự động ra đời. Lúc này người ta
tiến hành cắt nhỏ hệ gen và đưa chúng vào các vector (xây dựng thư viện hệ gen: thư

viện BAC hay YAC...) và việc giải trình tự được tiến hành lần lượt trên các NST nhân
tạo này, đây được gọi là chiến lược nhân dòng lần lượt (clone by clone). Tiếp đó khi
có các thế hệ máy giải trình tự ADN thế hệ I nâng cấp cùng với sự phát triển của tin
sinh học và giá thành của các siêu máy vi tính giảm đi người ta đã tiếp cận vấn đề theo
cách khác, giải trình tự ngẫu nhiên (shotgun sequence) [10]. Nếu tiến hành theo cách
giải trình tự lần lượt thì với các bộ gen lớn (bộ gen của người) chúng ta không thể
hoàn thành trong 13 năm như thực tế, bởi nó có tốc độ quá chậm chạp. Bằng cách giải
trình tự ngẫu nhiên hệ gen được chia nhỏ hơn nữa, việc giải trình tự được tiến hành
độc lập giữa các phân mảnh nhỏ, sau đó dữ liệu được thu thập và xử lý bằng các phần
mềm với các thuật toán đặc biệt để sắp xếp chúng thành các đoạn có kích thước lớn
hơn. Theo cách tiếp cận này một đoạn ADN có thể được giải tình tự nhiều lần, các
phần trùng lặp sẽ được phần mềm xác định và sử dụng để lắp ghép chúng lại với nhau.
Mặc dù giải nhiều lần nhưng do hệ thống máy thế hệ I nâng cấp có hiệu suất tương đối
cao và sự phát triển của tin sinh học cùng nỗ lực của nhiều viện nghiên cứu mà dự án
hệ gen ở người đã được hoàn thành năm 2003 [7]. Đó là bước đột phá trong kĩ thuật
giải mã hệ gen ở các sinh vật có hệ gen phức tạp, hàng loạt dự án giải mã hệ gen cá
thể người, giải mã hệ gen các động vật quan trọng hay hệ gen người cổ, các sinh vật
hóa thạch đã được tiến hành và đã có hàng loạt hệ gen được công bố. Bên cạnh đó, hệ
gen của các cây trồng quan trọng cũng đã được giải mã và công bố lần lượt từ năm
2003 đến nay. Tuy nhiên cách tiếp cận bằng các thiết bị giải mã gen thế hệ I nâng cấp
vẫn không đủ đáp ứng nhu cầu về tốc độ cũng như số lượng với các dự án giải mã hệ
gen hiện nay, đặc biệt là với các dự án phân tích SNPs (sự đa hình trình tự nucleotide
đơn lẻ).
2.4. Các chương trình, dự án giải mã gen trên thế giới
Kể từ năm 1977 khi Sanger và cộng sự bằng phương pháp giải trình tự kết thúc
chuỗi đã giải mã thành công hệ gen ADN của sinh vật đầu tiên là thực khuẩn thể ΦX174 có kích thước hệ gen tương đối nhỏ (5386bp), đã mở ra thời kỳ giải mã hệ gen
của các sinh vật sống trên thế giới. Tuy nhiên, do hạn chế về kĩ thuật nên trong 2 thập
kỷ tiếp theo chỉ có các sinh vật có kích thước hệ gen nhỏ được giải mã hoàn thiện như
các vi khuẩn hay virus gây bệnh. Cho đến cuối thập niên 90, mới có giun tròn là sinh
vật đa bào đầu tiên có hệ gen được giải mã. Riêng với hệ gen người, chương trình giải

mã hệ gen người được manh nha từ đầu thập niên 80 của thế kỷ trước tại Mỹ và chính
thức được thực hiện từ năm 1990 với nguồn quỹ của Bộ Năng lượng và Viện sức khỏe
4


quốc gia Mỹ (quỹ ban đầu là 3 tỷ USD để giải mã hệ gen người trong 15 năm) [3], [6],
[7]. Tuy nhiên, thời kỳ đầu dự án tiến triển rất chậm chạp, hầu như không có tiến bộ
đáng kể nào được công bố do hạn chế của thiết bị và phương pháp tiếp cận. Đến năm
2000, nhờ sự ra đời của máy giải trình tự ADN thế hệ I nâng cấp cùng với các siêu
máy tính và phần mềm tin học, dự án gen người đã tăng tốc, phiên bản đầu tiên của bộ
gen đã được công bố bởi tổng thống Mỹ Bill Clinton và Thủ tướng Anh Tony Blair
vào ngày 26 tháng 6 năm 2000 [41]. Hầu hết dữ liệu quan trọng đạt được vào giai
đoạn cuối, đến tháng 4 năm 2003 (sớm hơn 2 năm so với dự tính) phiên bản hoàn
thiện đã được công bố dự án gen người của chính phủ Mỹ và công ty tư nhân Celera.
Sau đó, tổng thống Mỹ quyết định công bố toàn bộ dữ liệu hệ gen người cho toàn thế
giới cùng sử dụng. Sau thành công của dự án hệ gen người hàng loạt dự án giải mã hệ
gen ở các sinh vật khác được khởi động và tái khởi động với hàng loạt các mục tiêu đề
ra nhằm cải thiện hiểu biết cơ bản của chúng ta về sự sống của chính con người và
sinh giới: tiến hóa, tổ chức và chức năng của các gen và đồng thời làm cơ sở cho việc
dự báo di truyền, cảnh báo bệnh, bảo tồn và tạo ra các giống cây, con có ưu thế với
nhu cầu ngày càng đa dạng của con người [39].
2.5. Các chương trình, dự án giải mã gen ở thực vật (cây trồng)
Tương tự như động vật, chương trình giải mã hệ gen ở các loài thực vật quan
trọng cũng đã được tiến hành như dự án giải mã hệ gen lúa Indica của trung quốc, dự
án giải mã hệ gen ngô của Mỹ, dự án giải mã hệ gen nho của Pháp và Ý. Hiện nay,
theo công bố chính thức thì đã có các cây trồng sau được giải mã hệ gen:
- Lúa Indica, hệ gen kích thước khoảng 420 Mb gồm khoảng 32-50.000 gen,
hoàn thành năm 2002 bởi viện nghiên cứu gen Bắc Kinh và Viện Hàn lâm Khoa học
Trung Quốc [35].
- Lúa Japonica, hệ gen kích thước khoảng 466 Mb, gồm khoảng 46.022-55.615

gen, hoàn thành năm 2002 bởi công ty Syngenta và Myriad [13].
- Nho PN40024, hệ gen kích thước khoảng 490 Mb, gồm khoảng 30.434 gen
hoàn thành năm 2007 bởi sự hợp tác giữa Pháp và Ý [19].
- Giống đu đủ “Sun up”, hệ gen kích thước khoảng 372 Mb gồm khoảng 28.629
gen hoàn thành năm 2008 bởi trung tâm nghiên cứu nông nghiệp Hawaii [23].
- Giống ngô B73, hệ gen kích thước khoảng 2.800 Mb gồm khoảng 32.000 gen
hoàn thành năm 2009 bởi viện NSF [27].
- Giống dưa chuột dài (dòng 9930), hệ gen kích thước 367 Mb gồm khoảng
26.682 gen hoàn thành năm 2009 bởi viện Hàn Lân khoa học Nông nghiệp Bắc Kinh,
Trung Quốc [17].
- Gần đây nhất là đậu tương với hệ gen 1100 Mb gồm khoảng 46.430 gen được
công bố năm 2010 bởi đại học Purdue, Mỹ [18].
5


Ngoài ra còn có các cây công nghiệp lấy dầu như Brassica napus, Elaeis
guineensis đã được các công ty tư nhân giải mã nhưng không công bố trình tự rộng
rãi.
2.6. Quá trình giải trình tự hệ gen của lúa trồng
Lúa được cho là cây lương thực quan trọng nhất của thế giới và do kích thước bộ
gen của nó nhỏ so với các loại ngũ cốc khác. Lúa đã được chọn là loài cây trồng mô
hình cho việc giải mã bộ gen đầy đủ. Dự án giải trình tự hệ gen lúa gạo (IRGSP) bao
gồm nhiều phòng thí nghiệm từ mười quốc gia khác nhau đã giải trình tự dựa trên bản
đồ chất lượng cao của 12 nhiễm sắc thể của giống lúa 'Nipponbare'.
Dự án IRGSP được thành lập năm 97 nhằm giải trình tự hệ gen giống lúa
Nipponbare với chiến lược giải trình tự nhân dòng lần lượt (clone by clone) dựa trên
bản đồ chất lượng tốt của 12 NST của giống lúa này. Để xây dựng trình tự dựa trên
bản đồ vật lý có sẵn, 2 phương án tiếp cận đã được sử dụng. Nhóm nghiên cứu hệ gen
(RGP) tại Nhật đã gắn các clone của hệ gen bằng cách sử dụng các vị trí EST/STS
(Expressed Sequence Tags/Sequence Tagged) và các dấu chuẩn từ bản đồ di truyền và

bản đồ phiên mã của lúa [41], [14]. Viện nghiên cứu hệ gen của đại học Clemson,
Viện nghiên cứu hệ gen Arizona sử dụng một hệ thống hiệu suất cao dấu vân tay các
nhiễm sắc thể nhân tạo (BAC) và hệ thống lắp ghép tự động các BAC thành các
contig bằng phần mềm FPC [28] và gắn các contig với hệ gen lúa bằng việc sàng lọc
dựa trên các phép lai [4]. Trình tự được tạo ra dựa trên bản đồ vật lý có sẵn theo 2
hướng trên đã bao phủ 95% hệ gen của lúa, và từ 92%-100% đối với từng NST. Có
tổng cộng 3453 BAC đã được sử dụng để xây dựng hệ thống này. Tháng 12 năm
2002, một trình tự nháp chất lượng tốt với kích thước khoảng 336 Mb đã được công
bố. Cho đến tháng 12 năm 2004, trình tự hoàn chỉnh có kích khoảng 370 Mb bao phủ
khoảng 95% hệ gen, khoảng 99% vùng NST thật đã được hoàn thành và đến ngày 11
tháng 8 năm 2005 đã công bố trên tạp chí Nature và công khai cho tất cả những ai có
nhu cầu sử dụng. Trình tự này cũng bao hàm 3 trình tự của vùng trung tâm, các vùng
rDNA, các vùng chứa các yếu tố di truyền vận động khác nhau (chiếm đến 35% kích
thước hệ gen). Trình tự này hiện nay được coi là chuẩn mực vàng (gold stADNard)
cho các nghiên cứu về hệ gen của lúa.
Một chiến lược khác cũng được sử dụng giải trình tự ngẫu nhiên (shot-gun) toàn
bộ hệ gen đã được sử dụng bởi nhiều dự án khác. Trong chiến lược này, một chương
trình hiệu suất cao sẽ sắp xếp hàng triệu trình tự shot-gun thành trình tự hệ gen hoàn
chỉnh. Hai nhóm độc đã sử dụng phương pháp này là Viện nghiên cứu hệ gen Bắc
Kinh trên giống lúa indica 93-11 và công ty Syntagen (Basel, Thụy Sỹ) trên giống lúa

6


Nipponbare [35], [17] (Đây cũng là chiến lược đã được sử dụng trong việc giải trình
tự 2.9 Gb hệ gen người [32]).
2.7. Ứng dụng của việc giải trình tự hoàn chỉnh hệ gen ở lúa
Để biết được thực sự có bao nhiêu gen trong hệ gen của lúa, cần phải có các
trình tự các cDNA hoàn chỉnh cùng với thông tin về các codon mở đầu và codon kết
thúc mà không bị ngắt quãng. Trình tự hệ gen hoàn chỉnh sẽ cung cấp các thông tin

thống kê cần thiết để xác định các điểm ghép nối. Một vài chương trình dự đoán đã
được phát triển sử dụng cho từng hệ gen thực vật khác nhau, với cây lúa chương trình
FGENESH đã được sử dụng để phân tích tổng số gen và mô hình hóa cấu trúc gen.
Nếu không tính các yếu tố di truyền vận động, hệ gen của lúa chứa khoản 45 nghìn
trình tự mã hóa protein, mật độ gen tương ứng là 1 gen/8200bp. Nhiễm sắc thể số 1 và
số 3 là những NST giàu gen nhất trong khi NST số 12 lại là NST ít gen nhất. Việc giải
trình tự hệ gen cũng cung cấp câu trả lời quan trọng về cấu trúc hệ gen của lúa. Các
gen liền nhau có rất nhiều trong cả 12 NST . Mật độ cao các gen đa bản trong hệ gen
của lúa chưa từng được biết đến trong các bộ gen khác kể cả cây mô hình Arabidopsis
thaliana. Bên cạnh đó người ta còn thấy một tần số thấp của việc cắt nối trong hệ gen
của lúa khi so sánh trình tự hệ gen với các cDNA hoàn chỉnh. Có lẽ điều này là cần
thiết cho cây lúa trong việc chuẩn bị một tập hợp gen cho một bản phiên mã tương tự
trong điều kiện nào đó. Các nghiên cứu sâu hơn về promoter sẽ làm sáng tỏ câu hỏi
bằng cách nào và khi nào các gen tương đồng đa bản này được biểu hiện ở từng loại
mô khác nhau ở lúa.
Trình tự hoàn chỉnh của hệ gen lúa còn được ứng dụng trong công tác chọn
giống. Dựa vào trình tự hệ gen của lúa, chúng ta có thể kiểm soát tính di truyền các
tính trạng nông học và cung cấp các công cụ cho công tác cải tiến giống cây trồng.
Hầu hết các tính trạng nông học được kiểm soát đa gen và cơ chế di truyền số lượng
phức tạp. Do đó, các nỗ lực đều tập trung vào việc phân lập các QTL (Quantitative
Trait Loci) liên kết với các tính trạng có giá trị. Các allen QTL có giá trị kinh tế đều
đã được đánh dấu bằng các marker ADN và đã được chuyển vào các giống lúa ưu tú
theo phương pháp chọn lọc nhờ dấu chuẩn phân tử (Marker Assisted Selection MAS). Các allen QTL là nguồn biến dị di truyền hữu dụng và không bị giới hạn khi
áp dụng cho các sản phẩm nông nghiệp, hiện đã có khoảng 8000 QTL được phát hiện
và được tập hợp trên cơ sở dữ liệu Gramme – QTL, Một yếu tố quyết định thành công
trong việc xác định và sử dụng các QTL cho các tính trạng nông học là mức độ ảnh
hưởng của kiểu gen so với ảnh hưởng của môi trường. Một vài QTL có ảnh hưởng lớn
đã được nhân dòng bằng chiến thuật dựa trên bản đồ, ví dụ điển hình là QTL quy định
số lượng hạt [2]. Tuy nhiên việc lập bản đồ chính xác các allen QTL vẫn còn là một
7



thách thức cho dù tính trạng đã được đặc trưng hóa bởi nhiều nhà nghiên cứu khác
nhau [33]. Nguyên nhân chính của vấn đề là khả năng phát hiện thấp của việc phân
tích QTL bằng việc sử dụng quần thể F2 và các dòng cận giao phối tái tổ hợp
(Recombinant inbred Lines - RIL). Để khắc phục hạn chế của việc lập bản đồ dựa trên
quần thể truyền thống người ta đã phát triển các dòng thay thế các đoạn NST
(Chromosome Segment Substitution Line – CSSL). Khi có sự khác biệt về kiểu hình
giữa một CSSL và cây bố mẹ người ta có thể xác định ngay vùng NST có chứa QTL
vì mỗi CSSL thường chỉ có chứa một mảnh NST của cây cho [1], [8], [16], [31]. Bằng
cách sử dụng CSSL Fukuoka và cs đã xác định QTL pi21 quy định tính kháng đạo ôn
gồm 12 allen và chỉ có những cây thiếu 2 allen trở lên mới có khả năng kháng và các
allen này có mặt trong một số giống Japonica điều này có thể giúp cải thiện việc
kháng đạo ôn của lúa trên thế giới [11] [12]. Bên cạnh đó, CSSL còn rút ngắn thời
gian trong việc xác định mối tương tác giữa các QTL đặc biệt là các trường hợp có
mức độ nhiễu cao do đồng dạng di truyền bằng cách sử dụng con cháu của cặp lai
giữa các CSSL có chứa các QTL quan tâm [34]. Tuy vậy, khả năng của các nghiên
cứu sử dụng CSSL lại phụ thuộc vào việc xác định và mức độ sẵn sàng của các dòng
cho, điều này phụ thuộc vào việc chúng ta phải phân tích cấu trúc di truyền của các
giống lúa qua phân tích RFLP toàn bộ hệ gen. Việc giải trình tự toàn bộ hệ gen sẽ giúp
chúng ta đánh giá mức độ đa dạng di truyền toàn hệ gen nhanh và chuẩn xác hơn, xác
định được các dòng cho để từ đó xác định ý nghĩa của từng allen cũng như giải thích
các tính trạng nông học phức tạp ở lúa.
Hiện nay, các trình tự SSR vẫn là một nguồn dấu chuẩn ADN quan trọng trong
phân tích di truyền và chọn giống lúa, nhưng các đa hình đơn nucleotide (SNPs) sẽ trở
thành một nguồn dấu chuẩn di truyền thường gặp nhất của đa hình ADN. Sau khi chi
tiết trình tự hệ gen lúa được IRGSP công bố năm 2005, các SNPs giữa giống
Nipponbare và 2 giống lúa indica (93-11 và GLA3) đã được công bố [9], [15], [37].
Với sự sáng tạo về công nghệ trong các máy giải trình tự hiệu năng cao, thông tin về
SNPs giữa các giống lúa có thể được xác định nhanh và chi phí thấp. Gần đây, với

việc giải trình tự lại 20 giống lúa Japonica và Indica 160.000 SNPs đã được xác định
[36], điều này cho phép chúng ta đưa được một lượng lớn các QTL ở mức độ chi tiết
vào chương trình chọn giống. Việc sự dụng các SNPs có thể xác thực hiệu quả của
việc lập bản đồ kết hợp toàn bộ hệ gen (Genome Wide Association Mapping - GWA)
trong việc phát hiện các nguồn tài nguyên di truyền tự nhiên có giá trị kinh tế [25].
Việc tập hợp thông tin về SNPs sẽ giúp chúng ta trong việc lập kế hoạch cho chương
trình chọn giống và phát hiện tái tổ hợp xảy ra giữa các khối haplotype (các cá thế có
SNPs). Để có được số lượng SNPs đủ cho mục tiêu này, chúng ta phải giải trình tự
toàn bộ hệ gen của các giống đại điện để xây dựng được một cơ sở dữ liệu dựa trên
8


các SNPs toàn bộ hệ gen để chọn lọc các SNPs và xác định tần số SNPs trong quần
thể. Dữ liệu SNPs đầy đủ của hệ gen sẽ tạo điều kiện cải tiến cây lúa một cách hiệu
quả khi kết hợp với hệ thống chọn giống dựa trên dấu chuẩn (MAS) [34].
Ngoài ra, khả năng sử dụng dữ liệu hệ gen lúa phụ thuộc vào hiệu quả của cơ
sở thông tin hạ tầng bởi dữ liệu về hệ gen lúa tăng theo cấp số nhân theo từng ngày do
sự nỗ lực của rất nhiều nhà khoa học. Trình tự hệ gen là nền tảng cho các phân tích
phía sau như: xác định từng gen, dự đoán các protein mà gen đó quy định, xác định
khi nào và ở đâu gen đó biểu hiện và sự tương tác với từng điều kiện cụ thể. Vì vậy,
cần phải kết nối nhiều nguồn thông tin khác nhau dựa trên một trình tự hệ gen lúa tiêu
chuẩn. Hiện nay, các nghiên cứu giải trình tự hệ gen các giống lúa vẫn đang tiếp tục
để làm rõ bức tranh về bản chất hệ gen của cây lúa.
2.8.Phương pháp giải trình tự bằng hệ thống Illumina.
Công nghệ giải trình tự tổng hợp (SBS) của Illumina hiện nay là một nền tảng
thành công nhất và được sử dụng rộng rãi trong các hệ thống máy giải trình tự thế hệ
II trên thế giới hiện nay. Công nghệ của Illumina được cấu thành dựa trên quyền sử
dụng hai phát minh quan trọng là công nghệ nano của nhóm Oxford Nanopore
Technologies và công nghệ giải trình tự trên sợi ADN trong quá trình tổng hợp của
Solexa. Sự kết hợp hai phát minh này trong công nghệ SBS cho phép Illumina sở hữu

độc quyền công nghệ giải trình tự ngang hàng ADN quy mô lớn. Công nghệ nano của
nhóm Oxford Nanopore Technologies cho phép Illumina gắn hàng loạt các
oligonucleotide ngẫu nhiên trên diện tích rất nhỏ và đầu dò (camera) có thể thu nhận
tín hiệu riêng biệt của từng oligonucleotide.
Để giải trình tự bằng hệ thống Illumina chúng ta cần tạo ra một thư viện các
phân mảnh đại diện cho mẫu genome cần giải trình tự, đây là giai đoạn chuẩn bị mẫu .
Trước hết các mẫu DNA quan tâm sẽ bị cắt thành các phân mảnh có kích thước thích
hợp (trung bình 400 ~ 500bp) bằng cách sử dụng một thiết bị cắt bằng sóng âm. Các
đầu tận cùng của các phân mảnh DNA được làm bằng, và hai trình tự adapter đặc hiệu
được gắn vào các phân mảnh theo quy trình của hãng (Genomic DNA Sample Prep
Kit). Tổng thời gian cho quá trình này ít hơn 6 giờ và thời gian thao tác chỉ có 3 giờ.
Khác với hệ thống 454 và hệ thống của ABI sử dụng một phản ứng PCR dựa
trên hạt nhũ tương để tạo ra "polonies", Illumina sử dụng một phản ứng duy nhất "cầu
nối" khuếch đại xuất hiện trên bề mặt của tế bào dòng chảy (flow cell), về cơ bản là
một tấm kính rất nhỏ có khả năng bám nước rất chặt để cung cấp một diện tích bề mặt
lớn cho hàng ngàn phản ứng hóa học song song có thể xảy ra trên đó. Giai đoạn này
gồm 5 bước có thể tạm dịch là giai đoạn tạo ra các cụm bằng phương pháp khuếch đại
9


cầu (bridge amplification) trên hệ thống chuyên biệt Cbot cluster generation system
(tạm dịch là hệ thống tạo các cụm Cbot). Với hệ thống Cbot tổng thời gian cho giai
đoạn này chỉ hết 4 giờ trong đó thao tác chỉ hết 10 phút.
Các dòng tế bào bề mặt được phủ chuỗi đơn oligonucleotides tương ứng với các
trình tự của các adapter đã gắn với các phân mảnh trong giai đoạn chuẩn bị mẫu. Các
phân mảnh sợi đơn đã gắn với adapter được liên kết với bề mặt của tế bào dòng chảy;
được tiếp xúc với các chất phản ứng và được mở kéo dài trên enzyme polyermase.
Mồi để xảy ra phản ứng tổng hợp chính là trình tự chuỗi đơn oligonucleotide đã gắn
trên bề mặt tế bào dòng chảy. Quá trình lặp đi lặp lại việc biến tính và mở rộng dẫn
đến việc khuếch đại tại chỗ một phân tử thành hàng triệu phân tử tại từng vị trí duy

nhất trên bề mặt tế bào. Quá trình này xảy ra trong những gì được gọi là "trạm cluster"
của Illumina (một dòng tế bào xử lý tự động).
Quá trình giải trình tự trong khi tổng hợp được tiến hành trên hệ thống máy
Illumina cũng theo nguyên lý gắn mầu huỳnh quang cho nucleotide cuối cùng như
trên máy giải trình tự thế hệ I nhưng với sự khác biệt là đầu dò có thể thu nhận tín
hiệu huỳnh quang của từng loại nucleotide riêng biệt khi gắn vào từng cụm các trình
tự (cluster hay còn được gọi là polony) nên phương pháp này còn được gọi là giải
trình tự xúc xích (polony sequencing) trong quá trình tổng hợp. Ưu điểm của hệ thống
Illumina là không bị hạn chế về số lượng cụm được giải trình tự tuy nhiên lại bị hạn
chế về độ dài của phản ứng khuếch đại cầu. Với thế hệ máy Illumina mới nhất độ dài
đã được nâng lên đến 100bp mỗi chiều và hiệu suất của hệ thống là sau 8 ngày có thể
giải trình tự tổng cộng từ 150-200Gb.
Giai đoạn cuối cùng sẽ sử dụng phần mềm chuyên biệt (RTA version 1.7 và
CASAVA version 1.7) để sắp xếp các trình tự riêng biệt thành một trình tự thống nhất
của hệ gen. Giai đoạn này tùy theo kích thước hệ gen và trình tự tham khảo có sẵn hay
không, thông thường với hệ gen như của người hệ thống mất 2 ngày và với 30 phút
thao tác. Người ta đã từng đặt câu hỏi về khả năng của các hệ thống giải trình tự
ngang hàng khi so sánh với phương pháp giải trình tự truyền thống (Sanger), tuy nhiên
Takasi và cs khi tiến hành giải trình tự lại một vùng 800-kb ở vai ngắn của NST số 6
của giống lúa Nipponbare bằng hệ thống của Roche, đã chứng minh phương pháp này
chính xác đến 99.95%. Các tác giả cũng cho rằng khi kết hợp đúng đắn các phương
pháp giải trình tự thế hệ mới với các phương pháp hiện tại (cơ sở dữ liệu có sẵn) sẽ
tạo ra một cuộc cách mạng về giá thành và hiệu quả giải trình tự lại hệ gen lúa và sẽ
làm sáng tỏ quá trình tiến hóa của lúa gạo hiện nay từ các loài lúa hoang dại [30].
2.9 Các phương pháp tách chiết ADN
10


Phân tích sinh học phân tử được bắt đầu từ việc thu nhận dịch chiết ADN từ tế
bào sống đủ sạch để thực hiện các phân tích tiếp theo. Tuỳ theo vật liệu nghiên cứu

mà có phương pháp tách chiết ADN phù hợp. Dung dịch ADN sau khi kiểm tra hàm
lượng và độ sạch được sử dụng để phân tích theo những mục đích khác nhau như
Southem blot, Northem blot, PCR, RFLP, AFLP,...và xác định trình tự ADN. Điều
quan tâm hàng đầu là các kĩ thuật tách chiết axit nucleic để thu nhận các phân tử ở
trạng thái nguyên vẹn không bị phân huỷ bởi các tác nhân cơ học hoặc hoá học. Tất cả
các phương pháp đều thực hiện theo nguyên lý cơ bản sau:
* Nguyên tắc
Để tiến hành tách ADN từ tế bào thì ta phải tiến hành phá bỏ màng tế bào và
màng nhân, sau đó biến tính protein để loại bỏ lượng protein chứa trong dịch tách,
loại bỏ RNA và sau cùng là kết tủa ADN. Tủa sau khi thu được được hòa tan lại trong
dung dịch đệm TE hoặc nước cất vô trùng tùy theo mục đích nghiên cứu. Khác với
tách mô động vật, khi tách mô thực vật thì ta phải tiến hành loại bỏ đường (thành phần
có nhiều trong mô thực vật). Để loại bỏ đường, chủ yếu dùng phương pháp tách
CTAB tức là dùng dung dịch đệm CTAB để tách ADN ra khỏi mô thực vật. Chất này
chỉ hòa tan ADN chứ không hòa tan được đường, nhờ vậy mà có thể loại bỏ đường ra
khỏi dịch chiết tách ADN.
* Các bước tiến hành
- Phá bỏ màng tế bào và màng nhân: Người ta có thể phá bỏ màng tế bào và
màng nhân bằng phương pháp hóa học hay cơ học (phương pháp cơ học, nghiền nát
bằng máy xay trong nitơ lỏng).
- Chiết ADN và loại bỏ protein: Sau khi phá bỏ màng tế bào thì dùng dung dịch
đệm CTAB để hòa tan ADN. Nhưng trong dịch chiết có lẫn protein và ARN nên để
thu nhận được ADN tinh sạch ta phải tiến hành bước loại bỏ protein và ARN. Ở đây
thường dùng phenol, chloroform và isoamylalcohol. Phenol có tác dụng làm biến tính
protein và không hòa tan nucleic acid. Chloroform cũng có tác dụng làm biến tính
protein nhưng nó còn có tác dụng loại bỏ hoàn toàn phenol ra khỏi phần dung dịch có
chứa ADN. Isoamylalcohol có tác dụng ổn định giữa hai pha nước và pha chloroform.
- Kết tủa ADN: Để loại bỏ CTAB thì cần phải kết tủa CTAB và ADN rồi sau
đó hòa tan ADN trong dung dịch NaCl mà tủa CTAB không tan trong dung dịch này.
- Loại bỏ CTAB và làm sạch ADN: Sau khi loại bỏ CTAB bằng dung dịch HCl

1M, ta tiến hành kết tủa ADN bằng etanol nguyên chất lạnh, để tăng khả năng kết tủa
ta có thể pha thêm dung dịch muối CH3COONa 3M (2 thể tích ethanol/thể tích dung
dịch cần tủa, 0.1 thể tích dung dịch muối/ thể tích dung dịch cần tủa. Ngoài ra còn có
11


thể tủa bằng isopropanol (0.8-1 thể tích Isopropanol/ thể tích dung dịch cần tủa. Muối
lẫn trong ADN sẽ ảnh hưởng đến kết quả các thí nghiệm sau này nên người ta
thường tiến hành rửa tủa ADN bằng dung dịch ethanol 70%.
Genome chứa toàn bộ thông tin di truyền và các chương trình cần thiết cho cơ
thể hoạt động. Ở các sinh vật nhân thật (eukaryote), 99% genome nằm trong nhân tế
bào và phần còn lại nằm trong một số cơ quan tử như ty thể và lạp thể. Trình tự
genome của những sinh vật mô hình rất có ý nghĩa trong những nghiên cứu của một
chuyên ngành khoa học mới đó là genome học (genomics). Dựa vào đây, các nhà sinh
học phân tử có thể phân tích cấu trúc, hoạt động và chức năng của các gen, làm sáng
tỏ được vai trò của DNA lặp lại, DNA không chứa mã di truyền. Điều đặc biệt có ý
nghĩa là khi so sánh các genome với nhau, có thể hiểu được hoạt động của genome
trong các cơ thể sống, mối quan hệ giữa chúng, sự đa dạng sinh học và mức độ tiến
hóa. Do vậy chúng ta cần phải tìm phương pháp tối ưu nhất để tách chiết được toàn bộ
genome của chúng mà không bị đứt gãy trong quá trình thao tác để trong quá trình
giải trình tự không bị rối và nhiễu.
Để xây dựng thư ADN hệ gen, có nhiều phương pháp phải được phát triển để
phân lập ADN phân tử lượng rất lớn - kích thước megabase từ thực vật. Để phân lập
lượng ADN như vậy, protoplasts hoặc nhân trước tiên phải được nhúng vào trong nút
thạch agarose hoặc microbeads. Thạch agarose đóng vai trò như là một lưới cứng
vững chắc đồng thời có các lỗ xốp cho phép khuếch tán của các chất phản ứng khác
nhau để tinh chế ADN và những thao tác sau đó trong khi ngăn chặn hiện tượng biến
dạng DNA. Microbeads được sử dụng nhiều hơn các nút thạch do sử dụng các hạt
tăngdiện tích bề mặt xung quanh các mẫu mô khoảng 1000 nếp gấp do đó cho phép sự
khuếch tán nhanh và hiệu quả hơn là đưa hóa chất và enzyme vào và ra khỏi các hạt

agarose. Sau khi nhúng, protoplasts hoặc nhân được phân giải và loại protein đã biến
tính với sự hiện diện của 0,5M EDTA 1% sarcosyl, và 0,1-1,0 mg/ml proteinase-K ở
500 C. Sau khi ly giải tế bào và sự thoái hóa protein, ADN còn lại là phù hợp với
những tác động biến đổi gây ra bởi enzym. Hầu hết các quy trình tách chiết ADN kích
thước megabase từ cây cỏ sử dụng phương pháp này [5]. Mặc dù phương pháp
protoplast tách được lượng lớn DNA megabase chất lượng cao, nhưng quá trình này
lại tốn kém và tốn nhiều công lao động. Một ví dụ là để chuẩn bị tách protoplasts từ
cà chua, lá non được cạo sạch lông với một lưỡi dao cạo trước khi được ủ 4-5 giờ với
các enzyme phân hủy thành vách tế bào. Với cây lúa miến, Woo và cs (1995) tìm thấy
cách tốt nhất để tạo ra lượng lớn . Protoplasts để tách DNA megabase là để chà
carborundum trên cả hai mặt của lá cây với một cây cọ, 50 vết mỗi bên, trước khi ủ 45 giờ với emzyme cellulysin. Do đó, lượng thời gian trước khi nhúng trong agarose có
12


thể lên tới 7-9 tiếng, tùy thuộc vào lượng nguyên liệu lá được xử lý. Hơn nữa, vì mỗi
loài thực vật đòi hỏi một tập hợp các điều kiện khác nhau để tạo ra protoplasts,
phương pháp chỉ hiệu quả nếu được nghiên cứu thiết kế đặc trưng cho từng loài thực
vật.
Một số nhà nghiên cứu đã thử nghiệm tách ADN kích thước megabase từ nhân
với mức độ thành công khác nhau: Mô tươi hoặc đông lạnh được đồng nhất với một
máy xay hoặc cối và chày. Nhân sau đó bị tách và nhúng như trên. Chất lượng của
ADN tốt tương đương ADN tách từ protoplasts, thường đậm đặc hơn, và có chứa một
lượng thấp hơn của ADN lục lạp. Ưu điểm chính của phương pháp này là kinh tế và
không mất nhiều công lao động như các phương pháp tách từ lục lạp. Thời gian cần để
tách DNA nhân và gắn trên thạch thường ít hơn 2 giờ.
Năm 1997, Peterson và cộng sự đã xây dựng một qui trình tách chiết ADN để
thu được nồng độ ADN lớn và độ tinh sạch cao từ cây cà chua. Quy trình có những
đặc điểm đặc trưng phù hợp để sử dụng trong việc xây dựng thư viện ADN cũng như
nhiều ứng dụng sinh học phân tử khác:
(a) Trước khi đồng nhất hóa, mô được được xử lý với ether để làm nhân dễ vỡ vụn

hơn. Xử lý bằng ether làm tăng đáng kể lượng nhân [38]. Quá trình đồng nhất
được thực hiện sử dụng máy trộn đơn giản.
(b) Đệm phân lập nhân (MEB) được thiết kế để xử lý các vấn đề thường gặp trong
quá trình tách chiết ADN thực vật. Đầu tiên, đệm có chứa 2-methyl-2,4pentanediol (MPD), một chất giúp ổn định nhân và ngăn quá trình phân giải
trước trưởng thành (premature). Lượng nhân thu được sử dụng MEB cao hơn
10 lần so với đệm chỉ sử dụng sucrose [24]. Đệm cũng có chứa chất chống oxi
hóa beta-mercaptoethanol, sodium diethyldithiocarbamate và sodium
metabisulfite. Các chất này hạn chế sự oxi hóa của các polyphenols. Ở dạng đã
oxy hóa, polyphenols tạo liên kết đồng hóa trị với ADN làm chuyển thành màu
nâu và không còn sử dụng được. Polivinylpyrrolidone trong đệm hấp phụ các
chất polyphenolic ngăn nó tương tác với ADN L-lysine và EGTA ngăn enzyme
nội sinh tiêu hủy ADN.
(c) pH thấp của đệm (pH 6.0) ngăn quá trình oxi hóa polyphenol. Sau khi đồng
nhất hóa, thêm triton X-100 với nồng độ 0.5% tác dụng ưu tiên phân giải lục
lạp và ti thể. Sự có mặt của cation hóa trị 2 (Mg2+) trong MEB ngăn sự phân
giải nhân gây ra bởi Triton X-100.
(d) Nhân được tách ra khỏi đám tạp vụn bằng cách ly tâm theo thang gradient
Percoll. Các bước ly tâm tốc độ thấp được dùng để loại bỏ một số (thậm chí là
đa số) các hạt tinh bột thường kết vón với nhân.

13


Trong suốt quy trình, quá trình tách nhân được theo dõi sử dụng một kính hiển
vi nhỏ cho phép nghiên cứu viên có thể đánh giá thông qua quan sát nồng độ và độ
tinh khiết của nhân. Một hạn chế qui trình này là nó được thiết kết để tách nhân với
lượng lớn (khoảng 500g) mô tươi.
Một quy trình khác đã được sử dụng để xây dựng thư viện ADN từ nhiều loài
trong đó có Lúa, Lúa miến, Lúa mì, Mía, Vải, Đỗ tương, Lúa mạch và Arabidopsis.
Trong qui trình này, mô thực vật được nghiền trong Nitơ lỏng. Hỗn hợp được đồng

nhất trong đệm chứa sucrose (SEB). Triton X-100 được thêm vào để phá hủy lục lạp
và ti thể, hỗn dịch được lọc nhiều lần để loại bỏ phần lớn vụn tế bào và nhân được thu
lại bằng cách ly tâm. pH cao của SEB (pH 9.1) ức chế hoạt động của enzyme nội bào.
Sự có mặt của beta-mecarptoethanol và PVP trong SEB làm trung hòa một số tác
dụng âm tính của polyphenol oxi hóa. Qui trình này đã được sử dụng để phân lập
ADN kích thước dài hàng triệu bp từ cây một lá mầm và một số ít cây hai lá mầm.
Phương pháp đặc biệt thích hợp với các loài/mô có chứa ít các sản phẩm chuyển hóa
bậc hai hoặc carbohydrates. Hạn chế của qui trình này là lượng ADN nhân thu được ít
hơn, nhiễm bẩn các chất tạp trong quá trình phân lập như vụn tế bào, carbohydrates và
khả năng kiểm soát polyphenol kém hơn.

14


III. VẬT LIỆU VÀ PHƯƠNG NGHIÊN CỨU
3.1. Vật liệu nghiên cứu
- Vật liệu thực vật: Vật liệu nghiên cứu gồm 30 giống lúa bản địa ưu tú của
Việt nam có các đặc tính nông sinh học quí được tuyển chọn từ 6 tập đoàn khác nhau
(chất lượng tốt, kháng đạo ôn, bạc lá, rầy nâu, chịu mặn, chịu hạn) (bảng 1).
Bảng 1. Danh sách các giống lúa sử dụng trong nghiên cứu
STT

Tên giống lúa

Nguồn gốc

1

Tám xoan Bắc Ninh


Bắc Ninh

2

Tám xoan Hải Hậu

Nam Định

3

Tẻ Nương

Thanh Hóa

4

Nàng thơm chợ đào

Long An

5

Thơm Lài

Long An

6

Nếp mặn


Quảng Nam

7

Chiêm đỏ

Quảng Trị

8

Lúa Ngoi

Quảng Ninh

9

Một bụi đỏ

Bạc Liêu

10

Nàng cờ đỏ 2

Bạc Liêu

11

Ble te lo


Sơn La

12

Chiêm nhỡ Bắc Ninh 2

Bắc Ninh

13

Nếp lùn

Hà Giang

14

Kháu mặc buộc

Nghệ An

15

OM6377

Cần Thơ

16

Chấn thơm


Khánh Hòa

17

Xương gà

Tây Ninh

18

Khâu giáng

Nghệ An

19

Coi ba đất

Khánh Hòa

20

OM5629

Cần Thơ

21

Nếp bồ hóng Hải Dương


Hải Dương

22

Tan ngần

Yên Bái
15

Đặc tính

Chất lượng

Kháng mặn

Kháng đạo ôn

Kháng rầy nâu

Kháng hạn


23

Ba chơ K’te

Bình Định

24


Blào sinh sái

Hòa Bình

25

Nàng quớt biển

Bạc Liêu

26

Tép Thái Bình

Thái Bình

27

Kháu điển lư

Thanh Hóa

28

Nếp mèo nương

Lào Cai

29


Tốc lùn

Thừa Thiên Huế

30

Hom râu

Nam Định

Kháng bạc lá

- Hóa chất
1. Tris 1M pH8.0 1L (Tris: 121.1g hòa tan trong H2O, pH 8.0,autoclave).
2. Potassium chloride (KCl) 2.5M 1L (372.75g KCl hòa tan trong H2O,
,autoclave)
3. EDTA 0.5M 1L (EDTA: 292.24g hòa tan trong H2O, autoclave)
4. Sucrose 1.1M 2L (Sucrose: 753.06g hòa tan trong H2O, khử trùng bằng màng
lọc 0.22µM)
5. Spermidine trihydrochloride 1M (5g Spermindine hòa tan trong 19.66ml
H2O Bảo quản -20oC)
6. Spermine tetrahydrochloride 0.5M (5g Spermine, hòa tan trong 28.72ml
H2O, Bảo quản -20oC)
7. Carbamic acid (65 mg ml-1) 1L(Sodium diethyldithiocarbamate trihydrate)
( 32.5g carbamic acid hòa tan trong H2O, khử trùng bằng màng lọc 0.22µM)
8. PVP40 (50 mg ml-1) 500ml (25g PVP40 hòa tan trong H2O, khử trùng bằng
màng lọc 0.22µM)
9. 2-Mercaptoethanol (β-mercaptoethanol)
10. Triton X-100
11. SDS 20% (10g SDS hòa tan trong 50ml H2O)

12. 5M Sodium perchlorate (NaClO4) 175.6g NaClO4 hòa tan trong 250ml H2O
khử trùng bằng màng lọc 0.22µM)
13. Proteinase K 10mg ml-1
14. RNase A 10 mg ml-1
16


- Các dung dịch đệm
1 - NEB 1L
Thành phần

Nồng độ cuối cùng

Dung dịch mẹ

Thể tích (1L)

100mM

1M

100ml

1mM

2.5M

400ml

100mM


0.5M

200ml

Dung dịch mẹ

Thể tích (1L)

Tris, pH8.0
KCl
EDTA

2 - SEB-M 1L (Dùng ngay sau khi pha)
Thành phần

Nồng độ cuối cùng

NEB

10%

Sucrose

100ml

550mM

1.1M


500ml

Spermidine

4mM

1M

4ml

Spermine

1mM

0.5M

2ml

Carbamic acid

0.13% w/v

32.5 mg ml-1

40ml

PEG 8000

1.20% w/v


powder

1.2g

100%

100%

2ml

β-mercaptoethanol

3 - SEB-MT 1L (Dùng ngay sau khi pha)
Thành phần

Thể tích (50ml)

SEB-M

45ml

Triton X-100

5ml

4 -TE 4L (Dùng ngay sau khi pha)
Thành phần

Nồng độ cuối cùng


Dung dịch mẹ

Thể tích (4L)

Tris pH 8.0

10mM

1M

40ml

EDTA

1mM

0.5M

8ml

3.2. Phương pháp nghiên cứu
3.2.1. Phương pháp tách chiết ADN
Ngày thứ nhất:
1. Thu 30g lá lúa, nghiền mịn trong ni tơ lỏng,
2. Bổ sung 450ml SEB-M lạnh,
3. Ủ trên đá 10 phút, khuấy nhẹ
17


4. Lọc bằng màng vải 2 lần

5. Bổ sung 1/20 thể tích SEB-MT (có chứa Triton). Ủ trên đá 10 phút, khuấy nhẹ
6. Li tâm 650 x g, 10 phút, 4oC trong ống 250ml.
7. Bỏ dịch nổi, hòa tan tủa vào 20ml SEB-M
8. Li tâm ở 650 x g, 10 phút, 4oC trong Falcon 15ml.
9. Bỏ dịch nổi, hòa tan tủa vào 20ml SEB-M
10. Li tâm ở 650 x g, 10 phút, 4oC trong Falcon 15ml.
11. Bỏ dịch nổi, hòa tan tủa vào 7,5 ml SEB-M
12. Bổ sung 20% SDS (w/v) (đến nồng độ cuối cùng là 2% ). Đảo nhẹ đều
13. Ủ trong bể ổn nhiệt 60oC trong 10 phút, để về nhiệt độ phòng
14. Bổ sung 5M sodium perchlorate (20oC) đến nồng độ cuối cùng là 1M
15. Li tâm 400 x g trong 20 phút để loại tinh bột
16. Thu dịch nổi
17. Bổ sung tỉ lệ 1:1 thể tích Phenol/Chloroform/Isoamyl alcohol (25:24:1) lắc nhẹ 15
phút.
18. Li tâm 3000 x g trong10 phút.
19. Thu dịch nổi
20. Bổ sung tỉ lệ 1:1 thể tích Phenol/Chloroform/Isoamyl alcohol (25:24:1) lắc nhẹ 15
phút. Thu dịch nổi
21. Chuyển sang màng thẩm tích, ngâm trong TE (pH7.0) ở 4oC qua đêm.
Ngày thứ hai:
22. Chuyển dịch từ màng sang falcon 15ml
23. Bổ sung RNase T1 50U/ml ADN RNase A 50 ug/ml , ủ ở 37oC trong 45 phút
24. Bổ sung Proteinase K đến nồng độ 150 µg/ml ủ ở 37oC trong 45 phút .
25. Bổ sung tỉ lệ 1:1 thể tích Phenol/Chloroform/Isoamyl alcohol (25:24:1) lắc nhẹ 15
phút
26. Li tâm ở 3000 x g trong 10 phút.
27. Chuyển dịch nổi sang ống15ml .
28. Bổ sung tỉ lệ 1:1 thể tích Phenol/Chloroform/Isoamyl alcohol (25:24:1) lắc nhẹ 15
phút , Li tâm ở 3000 x g trong 10 phút.
18



29. Bổ sung tỉ lệ 1:1 thể tích Chloroform/Isoamyl alcohol (24:1) lắc nhẹ 15 phút
30. Li tâm ở 3000 x g trong 10 phút.
31. Chuyển dịch nổi sang ống15ml
32. Bổ sung tỉ lệ 1:1 thể tích Chloroform/Isoamyl alcohol (24:1) lắc nhẹ 15 phút, Li
tâm ở 3000 x g trong 10 phút , Chuyển dịch nổi sang ống15ml
33. Bổ sung 1/10 thể tích 3M sodium acetate (pH5.2)
34. Chuyển sang ống li tâm đáy tròn.
35. Bổ sung 2-2.5 thể tích100% ethanol và lắc nhẹ
36. Li tâm 14,000 RPM trong 30 phút ở 4oC
37. Rửa bằng 1ml 70% ethanol, Li tâm 14,000 RPM trong 15 phút ở 4oC
38. Loại bỏ dịch và để khô ở nhiệt độ phòng trong 1 giờ.
39. Hòa tan ADN bằng 500µl H2O.
3.2.2. Phương pháp kiểm tra chất lượng ADN
-

Kiểm tra chất lượng ADN bằng phương pháp điện di trên gel agarose 1%

-

Đo nồng độ ADN và độ tinh sạch (OD 260/280) bằng máy đo quang phổ

-

Kiểm tra chất lượng ADN bằng phương pháp ADN chip Analyzer (thí nghiệm
này được thực hiện tại Trung tâm Phân tích genome, Vương quốc Anh)

19



IV. KẾT QUẢ NGHIÊN CỨU
4.1. Kết quả kiểm tra chất lượng ADN trên gel Agarose
Sau khi tách chiết ADN được hòa tan bằng nước cất vô trùng khử Ion. Lấy 1µl
mẫu ADN tổng số với 2µl loading dye để điện di so sánh với Ladder ADN 50 ηg/µl
trên gel agarose 1%. Kết quả điện di cho thấy rằng các băng ADN tổng số của các
giống lúa thu được gọn, sáng đồng đều, không đứt gẫy hay lẫn tạp. Nồng độ ADN cao
hơn so với Marker ADN (50 ηg/µl).

Hình 1. Ảnh kiểm tra chất lượng ADN trên gel Agarose 1%
4.2. Kết quả kiểm tra chất lượng ADN bằng máy đo quang phổ
ADN tổng số được kiểm tra nồng độ và độ tinh sạch bằng máy quang phổ. Lấy
70µl ADN tổng số đã tan hoàn toàn trong nước cất vô trùng khử Ion để vào cuvet và
đo với hai bước sóng OD260 và OD280. Kết quả được tổng hợp trong bảng 2.
Bảng 2: Nồng độ và độ tinh sạch của ADN các mẫu lúa sau khi tách chiết
STT

Tên giống lúa

Thể tích (µl)

Nồng độ ηg/µl

OD
260/280

1

Tám xoan Bắc Ninh


500

68.8

2.00

2

Tám xoan Hải Hậu

500

65.9

2.09

3

Tẻ Nương

400

67.3

2.06

4

Nàng thơm chợ đào


400

66.7

1.99

5

Thơm Lài

500

60

1.97

6

Nếp mặn

500

93

1.87

7

Chiêm đỏ


450

76.2

1.80

8

Lúa Ngoi

320

71.8

1.98

20


9

Một bụi đỏ

500

86

1.92

10


Nàng cờ đỏ 2

400

62.5

2.00

11

Ble te lo

500

78.2

1.83

12

Chiêm nhỡ Bắc Ninh 2

450

112.4

1.81

13


Nếp lùn

500

88.9

1.86

14

Kháu mặc buộc

500

83.6

1.93

15

OM6377

500

97.2

1.82

16


Chấn thơm

500

84.1

1.88

17

Xương gà

500

79

1.83

18

Khâu giáng

500

65.6

2.00

19


Coi ba đất

500

57.2

1.80

20

OM5629

500

74.5

1.89

21

Nếp bồ hóng Hải Dương

416

70

1.87

22


Tan ngần

500

57.9

1.95

23

Ba chơ K’te

500

62.5

1.85

24

Blào sinh sái

500

82.9

1.85

25


Nàng quớt biển

500

46.1

1.92

26

Tép Thái Bình

500

62.9

1.86

27

Kháu điển lư

500

67.4

1.99

28


Nếp mèo nương

400

62.7

1.98

29

Tốc lùn

500

79.7

1.85

30

Hom râu

400

60.9

1.99

Qua kết quả đo bằng máy đo quang phổ với hai bước sóng OD260 và OD280

cho thấy: nồng độ ADN tổng số thu được rất cao. Mẫu Chiêm nhỡ Bắc Ninh 2 thu
được nồng độ cao nhất là 112,4 ηg/µl, mẫu Nàng quớt biển thu được nồng độ thấp
nhất là 46,1 ηg/µl. Độ tinh sạch (tỷ lệ OD260/280) của các mẫu ADN nằm trong
khoảng 1,8-2,0 chứng tỏ rằng ADN tổng số tách chiết được không có lẫn tạp protein.

21


4.3. Kết quả kiểm tra chất lượng ADN bằng ADN chip với phần mềm ADN chip
Analyzer
Thí nghiệm kiểm tra chất lượng ADN được thực hiện tại Trung tâm Phân tích
genome, Vương Quốc Anh với các bước như sau:
-

Pha loãng mẫu ADN đến cùng nồng độ 20ηg/µl

-

Lấy mỗi mẫu 55µl cho vào ống eppendorff mới và dán nhãn

-

Chuyển 52,5 µl mỗi mẫu ADN cho vào mỗi ống Covaris

-

Cắt đoạn ADN bằng sóng siêu âm của máy Covaris với các thông số như sau:

• Chu kỳ
• Cường độ

• Bursts mỗi giây
• Thời gian
• Nguồn
• Nhiệt độ
-

10%
5.0
200
120 giây
23W
5,5° đến 6°C

Li tâm 600xg trong 5 giây

- Chuyển 50 µl các đoạn ADN của mỗi mẫu từ ống Covaris sang ống eppendorff
mới và dán nhãn.
- Lấy 1µl ladder và 1µl mẫu ADN của từng giống cho vào từng giếng của plate
ADN chip. Sử dụng phần mềm ADN chip Analyzer để kiểm tra chất lượng ADN của
từng mẫu. Kết quả kiểm tra của từng mẫu hiển thị trên đồ thị:

Hình 2: Đồ thị kiểm tra sản phẩm ADN sau khi cắt đoạn
22


Sản phẩm ADN sau khi cắt đoạn được kiểm tra bằng phần mềm ADN chip
Analyzer cho thấy kích thước đoạn cắt tập trung trong khoảng 400-500bp. Không thấy
có những bit khác chứng tỏ ADN có chất lượng rất tốt không bị đứt gãy.
Sản phẩm ADN sau khi cắt bằng sóng âm tiếp tục được kiểm tra lại trên gel
agarose 1% trước khi xây dựng thư viện:


500bp

Hình 3: Ảnh điện di kiểm tra ADN sau khi cắt bằng sóng âm
Mẫu ADN sau khi cắt đoạn được điện di kiểm tra trên gel agarose 1% cho thấy:
kích thước đoạn cắt trong khoảng 400-500bp, không có smear chứng tỏ ADN có chất
lượng rất tốt.

V. KẾT LUẬN
-

Chúng tôi đã tách chiết và tinh sạch ADN của 30 giống lúa đạt tiêu chuẩn cho
công tác giải mã hệ gen.

-

Hiện nay các mẫu ADN tinh sạch đã được gửi đến trung tâm TGAC, Vương
quốc Anh và đã hoàn thành công việc giải mã hệ gen của từng giống lúa.

23


TÀI LIỆU THAM KHẢO
1.

ADNo T., Yamamoto T., Shimizu T., Ma X. F., Shomura A., Takeuchi Y., et al. (2008).
Genetic dissection ADN pyramiding of quantitative traits for panicle architecture by
using chromosomal segment substitution lines in rice. Theor Appl Genet 116: 881-890.

2.


Ashikari M., Sakakibara H., Lin S., Yamamoto T., Takashi T., Nishimura A., et al.
(2005). Cytokinin oxidase regulates rice grain production. Science 309: 741-745.

3.

Barnhart B. J. (1989). DOE Human Genome Program. Human Genome Quarterly 1.

4.

Chen M., Presting G., Barbazuk W. B., et al. (2002). An integrated physical ADN
genetic map of the rice genome. The Plant Cell 14 (3): 537-545.

5.

Cheung WY, MD Gale.1990. The identification of high molecular weight DNA from wheat,
barley, ADN rye for analysis by pulsed field gel electrophoresis. Plant Mol. Biol. 14:881-888

6.

Cook D. R. (1989). The Alta Summit, December 1984 Genomics 5 (3): 661-663.

7.

Delisi C. (2001). Genomes: 15 Years Later A Perspective by Charles DeLisi, HGP
Pioneer. Human Genome News 11: 3-4.

8.

Ebitani T., Takeuchi Y., Nonoue Y., Yamamoto T., Takeuchi K., Yano M. (2005).

Construction ADN evaluation of chromosome segment substitution lines carrying
overlapping chromosome segments of indica rice cultivar 'Kasalath' in a genetic
background of japonica elite cultivar 'Koshihikari'. Breed Sci. 55: 65-73.

9.

Feltus F. A., Wan J., Schulze S. R., Estill J. C., Jiang N., Paterson A. H. (2004). An SNP
resource for rice genetics ADN breeding based on subspecies indica ADN japonica
genome alignments. Genome Res. 14: 1812-1819.

10. Fiers W., Contreras R., Duerinck F., Haegeman G., Iserentant D., Merregaert J., Min J.
W., Molemans F., Raeymaekers A., Van B. A., Volckaert G., Ysebaert M. (1976).
Complete nucleotide sequence of bacteriophage MS2 RNA: primary ADN secondary
structure of the replicase gene. Nature 260 (5551): 500-507.
11. Fukuoka S., Okuno K. (2001). QTL analysis ADN mapping of pi21, a recessive gene for
field resistance to rice blast in Japanese uplADN rice. Theor Appl Genet. 103: 185-90.
12. Fukuoka S., Saka N., Koga H., Ono K., Shimizu T., Ebana K., et al. (2009). Loss of
function of a proline-containing protein confers durable disease resistance in rice.
Science. 325: 998-1001.
13. Goff S. A., Ricke D., Lan T. H. (2002). A draft sequence of the rice genome (Oryza
sativa L. ssp. japonica). Science 296 (5565): 92-100.
14. Harushima Y., Yano M., Shomura A., et al. (1998). A high-density rice genetic linkage
map with 2275 markers using a single F2 population. Genetics 148 (1): 479-494.
15. Han B., Xue Y. (2003). Genome-wide intraspecific DNA-sequence variations in rice.
Curr Opin Plant Biol. 6: 134-138.

24


16. Hori K., Sugimoto K., Nonoue Y., Ono N., Matsubara K., Yamanouchi U., et al. (2010).

Detection of quantitative trait loci controlling pre-harvest sprouting resistance by using
backcrossed populations of japonica rice cultivars. Theor Appl Genet. 120:1547-57.
17. Huang S., Li R., Zhang Z. (2010). The genome of the cucumber, Cucumis sativus L.
Nature Genetic 41 (12): 1275-1280.
18. Huang S., Li R., Zhang Z. (2010). Genome sequence of the palaeopolyploid soybean.
Nature 463 (12): 178-183.
19. Jaillon O., Aury J. M., Noel B. (2007). The grapevine genome sequence suggests
ancestral hexaploidization in major angiosperm phyla. Nature 449 (7161): 463-467.
20. Go S. A., Ricke D., Lan T. H., et al. (2002). A draft sequence of the rice genome
(Oryzasativa L.ssp. japonica). Science 296 (5565): 92-100.
21. Karl V., Shale A. D. ADN Jacob D. D. (2009). Next Generation Sequencing: From Basic
Research to Diagnostics. Clinical Chemistry 55 (4): 41-47.
22. Metzker M. L. (2010). Sequencing technologies - the next generation. Nat Rev Genet 11
(1): 31-46.
23. Ming R., Hou S., Feng Y. (2008). The draft genome of the transgenic tropical fruit tree
papaya (Carica papaya Linnaeus). Nature 452 (7190): 991-997.
24. Peterson, D.G., Boehm, K.S. ADN Stack, S.M. (1997) Isolation of milligram quantities
of ADN from tomato (Lycopersicon esculentum), a plant containing high levels of
polyphenolic compounds. Plant Mol. Biol. Reptr., 15, 148-153.
25. Rostoks N., Ramsay L., MacKenzie K., Cardle L., Bhat P. R., Roose M. L., et al. (2006).
Recent history of artificial outcrossing facilitates whole genome association mapping in
elite inbred crop varieties. Proc Natl Acad Sci USA103: 18656-18661.
26. Sasaki T., Takashi M., Kimiko Y. et al. (2002). The genome sequence ADN structure of
rice chromosome 1. Nature 420: 312-316.
27. Schnable P., Ware D., Fulton R. S. (2009). The B73 Maize Genome: Complexity,
Diversity, ADN Dynamics. Science 326 (5956): 1112-1115.
28. Soderlund C., Longden I., ADN Mott R. (1997). FPC: A system for building contigs
from restriction fingerprinted clones. Computer Applications in the Biosciences 13 (5):
523-535.
29. Staden R. (1979). A strategy of ADN sequencing employing computer programs.

Nucleic Acids Research 6 (7): 2601-2610.
30. Takai T., Nonoue Y., Yamamoto S., Yamanouchi U., Matsubara K., Liang Z. W., et al.
(2007). Development of chromosome segment substitution lines derived from backcross
between indica donor rice cultivar ‘Nona Bokra’ ADN japonica recipient cultivar
‘Koshihikari’. Breed Sci. 57: 257-61.
31. Venter J. C., Smith H. O., ADN Hood L. (1996). A new strategy for genome sequencing.
Nature 381 (6581): 364-366.
25


×