VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
VIỆN CÔNG NGHỆ SINH HỌC
NGUYỄN THỊ MINH THANH
NGHIÊN CỨU ĐA HÌNH HỆ GEN CÁC DÒNG
TÔM SÚ (Penaeus monodon) VIỆT NAM NHẰM PHỤC
VỤ CÔNG TÁC CHỌN GIỐNG TÔM
Chuyên ngành: Di truyền học
Mã số: 9 42 01 21
TÓM TẮT LUẬN ÁN TIẾN SỸ SINH HỌC
Hà Nội 2019
Luận án được hoàn thành tại:
Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Người hướng dẫn khoa học:
1. PGS.TS. ĐINH DUY KHÁNG
Viện Công nghệ sinh học
2. PGS.TS. NGUYỄN HỮU NINH
Viện Nghiên cứu Nuôi trồng thủy sản III
Phản biện 1:
Phản biện 2:
Phản biện 3:
Luận án được bảo vệ tại Hội đồng đánh giá luận án Phiên chính thức họp tại
Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam,
18 Hoàng Quốc Việt, Cầu Giấy, Hà Nội.
Vào hồi …giờ …, ngày … tháng … năm 2019
Có thể tìm đọc Luận án tại:
Thư viện Quốc Gia Việt Nam
Trang web của Bộ Giáo dục và đào tạo (http:luanvan.moet.gov.vn)
Viện Công nghệ sinh học.
1
MỞ ĐẦU
1. Tính cấp thiết của Đề tài
Tôm sú Penaeus monodon Fabricius (1798) là loài thủy sản nuôi kinh tế quan trọng ở nhiều
quốc gia trên thế giới. Ở Việt Nam, tôm sú là một trong những đối tượng nuôi chủ lực cho
xuất khẩu thủy sản. Nền tảng cho chiến lược phát triển bền vững ngành công nghiệp nuôi
tôm sú là chú trọng phát triển nguồn tôm bản địa với các chương trình nhân giống khoa học để
nâng cao tỷ lệ sống và sự tăng trưởng. Để đạt được mục tiêu này, nghiên cứu cấu trúc và chức
năng của hệ gen tôm sú là vấn đề khoa học cơ bản có định hướng ứng dụng hết sức quan
trọng.
Hiện nay, các nghiên cứu về di truyền phân tử trên đối tượng tôm sú vẫn còn ít ỏi và chưa
tương xứng với vai trò của một đối tượng nuôi kinh tế quan trọng. Thông tin về các locus tính
trạng định lượng (QTLs) liên quan đến tính trạng tăng trưởng hầu như rất hiếm. Vì vậy, việc
nghiên cứu đa dạng di truyền và xác định mối tương quan giữa các SNP (đa hình nucleotide
đơn) loại biến dị phổ biến nhất trong hệ gen với tính trạng tăng trưởng ở tôm sú để tạo cơ
sở dữ liệu cho các nghiên cứu về chọn giống dựa trên chỉ thị phân tử (CTPT) là hướng nghiên
cứu quan trọng đối với ngành công nghiệp nuôi tôm sú.
Trong khuôn khổ Đề tài “Lập bản đồ bộ gen tôm sú (Penaeus monodon)” thuộc Nhiệm vụ
đánh giá di truyền nguồn gen cấp Nhà nước, chúng tôi đã thực hiện đề tài “Nghiên cứu đa
hình hệ gen các dòng tôm sú (Penaeus monodon) Việt Nam nhằm phục vụ công tác chọn
giống tôm”.
2. Mục tiêu nghiên cứu
Đánh giá đa hình hệ gen các quần đàn tôm sú thu từ các vùng biển Việt Nam; Sàng lọc các
đa hình nucleotide đơn (SNPs) có tiềm năng liên kết với tính trạng tăng trưởng bằng cách áp
dụng công nghệ giải trình tự gen thế hệ mới (phương pháp GBS) trên hai nhóm tôm sú tăng
trưởng nhanh và tăng trưởng chậm.
3. Đối tượng nghiên cứu
Tôm sú Penaeus monodon Fabricius (1798).
4. Các nội dung nghiên cứu
(1) Đánh giá đa hình hệ gen ba quần đàn tôm sú thu từ các vùng biển khác nhau của Việt
Nam bằng kỹ thuật AFLP;
(2) Lai hỗn hợp 4 dòng tôm sú bố mẹ khác nhau về nguồn gốc địa lý để tạo vật liệu nghiên
cứu thế hệ Go và G1;
(3) Áp dụng kỹ thuật xác định kiểu gen bằng phương pháp giải trình tự (GBS) để phân tích
hệ gen tôm sú thuộc hai nhóm tăng trưởng nhanh và tăng trưởng chậm thế hệ Go và G1 nhằm
sàng lọc các đa hình nucleotide đơn (SNP) liên quan đến tính trạng tăng trưởng;
(4) Sàng lọc chỉ thị SNP G>A ở tôm sú tăng trưởng nhanh bằng kỹ thuật PCR đặc hiệu alen
cạnh tranh (KASP) để đánh giá tiềm năng ứng dụng của SNP này đối với việc đánh giá nhanh
chóng và chính xác các cá thể tôm nhằm hỗ trợ trong công tác chọn giống tôm sú.
5. Những đóng góp mới của Luận án về mặt khoa học và thực tiễn
2
(1) Luận án là nghiên cứu đầu tiên đưa ra đánh giá về đa dạng di truyền của ba quần đàn
tôm sú tự nhiên từ các vùng biển Việt Nam bằng kỹ thuật AFLP.
(2) Sàng lọc được bộ chỉ thị SNP ở nhóm tôm sú tăng trưởng nhanh làm cơ sở cho việc tìm
kiếm chỉ thị SNP liên kết với tính trạng tăng trưởng nhanh ở tôm sú. Hai chỉ thị SNP được xác
định trong nghiên cứu của luận án là phát hiện đầu tiên về chỉ thị SNP nằm trong exon của gen
MHC ở họ giáp xác. Những kết quả này cung cấp dẫn liệu khoa học hữu ích cho việc ứng
dụng chỉ thị phân tử trong chọn giống tôm sú.
6. Bố cục của Luận án
Luận án gồm tổng cộng 194 trang cả bìa, trong đó: Mở đầu 4 trang; Chương 1 Tổng quan
tài liệu 34 trang; Chương 2 Vật liệu và Phương pháp nghiên cứu 22 trang; Chương 3 Kết
quả nghiên cứu 38 trang; Chương 4 Bàn luận kết quả 25 trang; Kết luận và Kiến nghị 2
trang; Danh mục các công trình công bố 2 trang; Tóm tắt kết quả nghiên cứu bằng tiếng Anh 7
trang; Tài liệu tham khảo 28 trang; Phụ lục 17 trang; Trong Luận án có 24 bảng và 23 hình.
Chương 1. TỔNG QUAN TÀI LIỆU
1.1. Khái quát về tôm sú Penaeus monodon và tình hình nuôi tôm sú trên thế giới
Tôm sú Penaeus monodon thuộc họ Penaeidae, bộ Decapoda, lớp Malacostraca, ngành phụ
Crustatacea, ngành Arthropoda.
Với những tiến bộ về kỹ thuật nuôi và công nghệ chế biến thức ăn thủy sản thì ngành công
nghiệp nuôi tôm sú đã nhanh chóng lan rộng khắp Châu Á, Châu Mỹ trong những thập niên
cuối thế kỷ 20. Tuy nhiên trong những năm sau đó, dịch bệnh gia tăng trong các quần đàn tôm
tự nhiên khiến chất lượng giống liên tục sụt giảm đã dẫn đến sự thay thế dần tôm sú bởi tôm
thẻ chân trắng (Litopenaeus vannamei) sạch bệnh có nguồn gốc Nam Mỹ. Việc các nước Châu
Á dần từ bỏ đối tượng bản địa quan trọng này chủ yếu là do chưa gia hoá và kiểm soát được
dịch bệnh nên không đảm bảo chất lượng tốt của con giống. Việt Nam nằm trong nhóm gồm
các quốc gia sản xuất tôm sú hàng hoá lớn nhất thế giới. Khác với các nước Châu Á láng
giềng (chủ yếu nuôi tôm thẻ chân trắng), Việt Nam hiện là một trong số ít các nước vẫn đang
sản xuất tôm sú cỡ to, chất lượng cao và chiếm phần lớn sản lượng tôm nuôi. Tuy nhiên nghề
nuôi tôm sú ở Việt Nam hiện nay cơ bản vẫn dựa vào nguồn tôm giống đánh bắt từ tự nhiên
và các thành tựu gia hóa dựa trên phương pháp chọn giống truyền thống. Do đó, nghề nuôi tôm
sú vẫn đối mặt với không ít thách thức, trong đó có vấn đề về chủ động nguồn tôm giống
đảm bảo chất lượng.
Nhìn chung, xu thế ở các quốc gia trên thế giới trong sản xuất tôm giống là từng bước gia
hóa đàn tôm, tiến hành các giải pháp công nghệ để khép kín vòng đời, chọn giống tôm sạch
bệnh, tạo ra các dòng mới chất lượng cao và tăng trưởng tốt. Những nỗ lực trong vấn đề gia
hoá (tạo tôm bố mẹ) và nâng cao chất lượng di truyền (nghiên cứu đa dạng di truyền, tìm
kiếm các CTPT liên kết với các tính trạng tăng trưởng nhanh, chống chịu bệnh tốt, sức sinh
sản cao…) được coi là những vấn đề then chốt.
1.2. Kỹ thuật phân tích chỉ thị DNA và ứng dụng trong nghiên cứu đa hình hệ gen và
trong chọn giống tôm sú
Các CTPT được sử dụng rộng rãi như những công cụ chọn lọc đắc lực đối với các tính
trạng quan tâm trong các chương trình chọn giống ở nhiều loài vật nuôi, cây trồng và các loài
3
thủy sản. Việc ứng dụng các CTPT giúp cho các nhà chọn giống nhận diện chính xác các gen
quan tâm nhằm rút ngắn thời gian chọn giống. Hiệu quả cải tiến giống sẽ gia tăng gấp nhiều
lần so với các phương pháp chọn giống cổ điển nhờ thực hiện việc chọn lọc không cần trực
tiếp trên tính trạng mong muốn mà thông qua CTPT liên kết với tính trạng đó. Các CTPT là
công cụ hữu hiệu để đánh giá sự đa dạng di truyền, xây dựng bản đồ di truyền và ứng dụng
trong nghiên cứu cải tạo, chọn giống tôm chất lượng tốt, sạch bệnh như: RAPD (Garcia &
Benzie, 1995), RFLP (Benzie et al., 1993, Klinbunga et al., 1999), xác định các chỉ thị RAPD ở
quần đàn tôm sú kháng bệnh đốm trắng (Dutta et al., 2013), phát triển chỉ thị microsatellite
trong chọn tôm sú bố mẹ (Jerry et al., 2006), kỹ thuật microsatellite nghiên cứu đa hình di
truyền trên đối tượng tôm sú (Saeid et al., 2011, Nguyễn Thị Thảo et al., 2004; Rumisha et al.,
2017; Staelens et al., 2018…), sử dụng kỹ thuật AFLP để lập bản đồ di truyền trên đối tượng
tôm Trung Quốc (Zhaoxia et al., 2006, You et al., 2010), đa hình SNP tại thụ thể vitellogenin
(PmVtgr) gắn liền với các kiểu hình liên quan đến sinh sản (chỉ số gonadosomatic và trọng
lượng buồng trứng) của tôm sú P. monodon đã được phát hiện (Klinbunga et al., 2015), biểu
hiện của protein gắn kết Xbox 1 (PmXbp1) trong quá trình phát triển buồng trứng ở tôm sú bố
mẹ P. monodon hoang dã và sự liên kết giữa SNP với các tham số liên quan đến tăng trưởng đã
được phát hiện (Prasertlux et al., 2015)…
Kỹ thuật AFLP được sử dụng để phân tích đa hình DNA bằng cách nhận biết đồng thời
nhiều phân đoạn DNA sau khi cắt bởi enzyme và khuếch đại chọn lọc. Đây là công cụ hiệu
quả để nhận biết các locus đa hình mà không cần biết trước thông tin về trình tự DNA của
chúng (Richard et al., 1998). Phương pháp này có thể ước lượng nhanh sự đa dạng di truyền
trong và giữa các quần thể với nhau (Watson và Barker, 2004). AFLP được sử dụng cho nhiều
mục đích như: nghiên cứu biến dị di truyền (Mueller và Wolfenbarger, 1999); đánh giá đa dạng
di truyền các quần đàn ở các đối tượng khác nhau như cá trê (Liu et al., 1998), cá thơm (Seki et
al., 1999), cá chép (Wang et al., 2000); lập bản đồ di truyền (Zhaoxia et al., 2006, You et al.,
2010; Staelens et al., 2018); xác định quan hệ giữa các giống ( Jacobs et al., 2008); xây dựng các
nhóm liên kết chéo; các nghiên cứu về đa dạng di truyền và phát sinh loài phân tử ( Wang et al.,
2004)…
SNP là một trong những CTPT hiệu quả được ứng dụng trong chọn giống. Các vị trí SNP
trong hệ gen là nơi mà ở đó chuỗi DNA được phân biệt bởi một base duy nhất khi hai hoặc
nhiều cá thể được so sánh. Sự khác nhau về nucleotide này có thể dẫn đến thay đổi tính trạng
và được sử dụng để đánh giá đa dạng trong tiến hóa. SNP có số lượng lớn, ổn định , thích hợp
cho việc tự động hóa trong phân tích và chỉ ra được các đa hình có thể không phát hiện được
bởi các phương pháp khác (Vaseeharan et al., 2013; Liu and Cordes, 2004). SNP có thể xuất
hiện ở các vùng mã hóa và không mã hóa trong hệ gen của sinh vật, tác động trực tiếp đến tính
trạng quan tâm, rất hiệu quả trong việc xác định tương quan giữa SNP và tính trạng (Beuzen et
al., 2000). SNP đã được sử dụng để sàng lọc các gen tiềm năng liên quan đến tính trạng tăng
trưởng của một số đối tượng thuỷ sản: cá hồi Salvelinus alpinus (Tao và Boulding, 2003), cá
chẽm (Xu et al., 2006), tôm thẻ chân trắng Litopenaeus vannamei và tôm sú P. monodon (Glenn
et al., 2005)...
1.3. Kỹ thuật GBS và ứng dụng trong chọn giống
4
GBS (Genotyping By Sequencing: Kỹ thuật xác định kiểu gen bằng phương pháp giải trình
tự) là một ứng dụng mới của kỹ thuật NGS (Next Generation Sequencing: công nghệ giải trình
tự thế hệ mới) để phát hiện SNP. Những cải tiến không ngừng của các hóa chất giải trình tự
và các công cụ phần mềm cho phép các kỹ thuật NGS cung cấp những thông lượng lớn về dữ
liệu giải trình tự trong mỗi lần thực hiện, nhờ đó giảm giá thành, khiến cho GBS trở thành
giải pháp thay thế có tính cạnh tranh so với các phương pháp phân tích gen khác. NGS cho
phép tạo ra các bản đồ SNP mật độ cao được dự đoán sẽ là hướng ứng dụng rộng rãi trong
nhiều chương trình chọn giống. Các nhà chọn giống có thể giải trình tự các bộ gen lớn và xây
dựng các bản đồ liên kết mật độ cao từ các quần thể chọn giống. Các ứng dụng trong tương
lai của GBS đối với việc cải thiện giống cây trồng, vật nuôi có thể cho phép các nhà chọn
giống kiểm soát được các chương trình MAS (chọn giống dựa trên CTPT) hay GS (chọn lọc
hệ gen) trên phôi mầm hay loài mới mà không cần phát triển các công cụ phân tử trước đó.
Khi việc phân tích gen dựa trên việc giải trình tự có thể thực hiện được đối với toàn bộ các
lĩnh vực nghiên cứu về hệ gen thì GBS sẽ trở thành nhân tố chính trong di truyền và chọn
giống (He et al., 2014).
1.4. Phương pháp PCR đặc hiệu alen cạnh tranh (KASP)
KASP là một dạng biến đổi của kỹ thuật PCR để phân tích hệ gen dựa trên sự kéo dài
chuỗi oligo đặc hiệu alen và sự chuyển năng lượng cộng hưởng huỳnh quang để tạo ra tín
hiệu (Kumpatla et al., 2012; He et al., 2014). Công nghệ này có nhiều ứng dụng trong phân tích
kiểm soát chất lượng hệ gen, lập bản đồ QTL, chọn giống dựa trên CTPT (MAS)...
Chương 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Vật liệu
* Các mẫu tôm sú sử dụng cho nghiên cứu đa hình AFLP do Viện Nghiên cứu NTTS I cung
cấp. Mẫu được thu từ 3 quần đàn tự nhiên khác nhau: Quần đàn Bắc Trung Bộ (kí hiệu: BTB)
thu mẫu tại vùng biển tỉnh Nghệ An, Quần đàn Nam Trung Bộ (NTB) thu mẫu tại vùng biển
tỉnh Khánh Hòa và Quần đàn Nam Bộ (NB) thu mẫu tại vùng biển tỉnh Bạc Liêu. M ỗi quần
đàn thu trên 50 mẫu.
* Các mẫu tôm sú sử dụng cho nghiên cứu sàng lọc SNP do Viện Nghiên cứu NTTS II cung
cấp: Vật liệu gốc bao gồm 4 dòng tôm sú bố mẹ có nguồn gốc địa lý khác nhau, trong đó 3
dòng có nguồn gốc tự nhiên là tôm sú Ấn Độ Dương (kí hiệu: A) Nhập từ Thái Lan (vùng
biển Amanda) và từ Myanmar, tôm sú Thái Bình Dương (T) Nhập từ Singapore, tôm tự nhiên
của Việt Nam (thu thập từ Cà Mau, Đà Nẵng, Phú Yên) gọi chung là tôm nội địa (N) và dòng
tôm Gia hóa (G) được cung cấp bởi Công ty Moana Ninh Thuận Đây là dòng tôm được
thương mại hóa dùng làm tôm bố mẹ sản xuất tôm giống phục vụ cho nuôi thương phẩm.
Tôm sú thế hệ Go và G1 được tạo ra từ các đàn tôm bố mẹ này bằng cách lai hỗn hợp giữa bốn
dòng tôm bố mẹ.
Từ các cá thể trong đàn con của các gia đình tôm sú thế hệ G o và G1, chọn ra các cá thể (bao
gồm cả tôm cái ♀ và tôm đực ♂) thuộc hai nhóm khác nhau theo tiêu chí mức độ tăng
trưởng: tăng trưởng nhanh (F) và tăng trưởng chậm (S) để sử dụng cho nghiên cứu sàng lọc
SNP. 40 mẫu tôm sú cái lớn nhanh thế hệ G1 được chọn để thực hiện kỹ thuật KASP.
5
* Các hóa chất và kit tinh sạch được sử dụng của các hãng: Sigma Aldrich, Qiagen,
Invitrogen, Life Technologies, Fermentas, Promega; Các hóa chất thông dụng khác trong phòng
thí nghiệm đạt độ tinh khiết cần thiết cho các nghiên cứu.
* Các thiết bị sử dụng trong nghiên cứu thuộc Phòng Vi sinh vật học phân tử và Phòng thí
nghiệm trọng điểm Công nghệ gen, Viện Công nghệ sinh học, Viện hàn lâm Khoa học và
Công nghệ Việt Nam.
2.2. Các phương pháp nghiên cứu chính
2.2.1. Thu mẫu tôm sú
Thu mẫu tôm sú tự nhiên phục vụ nghiên cứu đa hình hệ gen: các mẫu tôm sú được thu
gom bằng cách đặt hàng cho người dân đánh bắt bằng lưới ở ngoài biển xa bờ.
Thu mẫu tôm sú tự nhiên làm tôm giống bố mẹ, sàng lọc mầm bệnh và chăm sóc tôm bố
mẹ: Các quy trình thu mẫu tôm sú bố mẹ, sàng lọc mầm bệnh và chăm sóc tôm bố mẹ được
thực hiện tại Trung tâm Quốc gia Giống hải sản Nam Bộ Viện NCNTTS II.
2.2.2. Thiết lập các gia đình tôm sú tạo thế hệ Go, G1
Các phương pháp: lai hỗn hợp giữa các dòng tôm sú bố mẹ, ghép phối, sinh sản nhân tạo,
ương nuôi, đánh dấu huỳnh quang và truy xuất nguồn gốc tôm sú… được thực hiện theo quy
trình sản xuất giống đã được nghiên cứu và thực hiện thành công nhiều năm tại Trung tâm
Quốc gia Giống hải sản Nam Bộ, thuộc Viện Nghiên cứu nuôi trồng thủy sản II.
2.2.3. Tách chiết, tinh sạch, xác định nồng độ và độ tinh sạch của DNA tổng số từ mô cơ tôm
sú
DNA tổng số từ mô cơ tôm sú được tách chiết theo quy trình của Eurobiobank (2004).
DNA tổng số được tinh sạch bằng Kit PureLinkTM Genomic DNA (Life Technologies).
Nồng độ và độ tinh sạch của DN A được xác định bằng máy quang phổ NanoDrop®
Spectrophotometer ở bước sóng λ = 260 nm và λ = 280 nm (Thermo Fisher Scientific
NanoDrop Products, www.nanodrop.com).
2.2.4. Kỹ thuật AFLP đánh giá đa hình hệ gen
Kỹ thuật AFLP được thực hiện theo quy trình của hãng Applied BioSystems.
Phân tích kết quả AFLP trên máy xác định trình tự tự động ABI3100 ( Invitrogen) sử dụng
điện di mao quản và phần mềm phân tích đoạn GeneMapper® Software Version 4.1 AFLP®
System Analysis (Invitrogen) để đánh giá tính đa hình di truyền hệ gen tôm sú;
Xây dựng cây phát sinh chủng loại giữa các quần đàn tôm sú Việt Nam bằng phần mềm
MEGA (Kumar et al., 2001).
2.2.5. Kỹ thuật GBS phân tích hệ gen tôm sú, sàng lọc SNP liên kết với tính trạng tăng
trưởng
Xây dựng thư viện GBS và giải trình tự DNA: Kỹ thuật GBS được thực hiện theo các
bước như mô tả trong công bố của Elshire et al. (2011). Enzyme cắt hạn chế được sử dụng là
ApeKI (New England Biolabs). DNA tổng số sau khi được cắt và gắn với adaptor được tinh
sạch bằng QIAquick PCR Purification Kit (Qiagen). Các đoạn DNA tinh sạch từ các mẫu được
trộn lại với nhau với tỷ lệ tương đương. Khoảng 100 ng sản phẩm DNA trộn từ các mẫu
được sử dụng làm khuôn để tạo thư viện cho NGS với cặp mồi primer1 và primer2 bắt cặp
bổ sung với barcode adaptor và common adaptor:
6
Primer1:(5’3’)AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT
Primer2:(5’3’)
CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT
Sản phẩm PCR có kích thước 300500 bp được thu nhận bằng phương pháp cắt gel và tinh
sạch bằng QIAquick PCR Purification Kit. Kích thước và độ sạch của thư viện DNA sau đó
được đánh giá trên Bioanalyzer 2100 (Agilent Technology). Thư viện DNA được làm giàu và
xác định trình tự cả hai chiều (pairend) trên hệ thống Illumina NextSeq®500, sử dụng
NextSeq 500/550 High Output v2 kit (300 cycles).
Xử lý dữ liệu GBS, lắp ráp hệ gen tham chiếu tạm thời và xác định SNP:
Dữ liệu GBS được xử lý và phân tích để phát hiện SNP dựa theo phương pháp GBSSNP
CROP (GBS SNPCalling Reference Optional Pipeline) được mô tả bởi Melo et al. (2016). Dữ
liệu thô được chuyển thành định dạng fastq bằng công cụ BCL2FASTQ 2.1. Chất lượng trình
tự được đánh giá bằng FastQC. Trình tự adaptor được loại bỏ bằng phần mềm Trimmomatic
software v.0.3.6 (Bolger et al., 2014). Trình tự của từng mẫu được tách ra trên cơ sở nhận biết
trình tự barcode sử dụng công cụ Inhouse script do nhóm nghiên cứu tự phát triển. Do hệ gen
tôm sú chưa được công bố trình tự tham chiếu nên chúng tôi đã sử dụng các mẫu lắp ráp de
novo để tạo trình tự tham chiếu tạm thời theo phương pháp được mô tả bởi Melo et al. (2016),
sử dụng các công cụ PEAR v.0.96 và USEARCH v.8.0.162 (Zhang et al., 2014; Edgar, 2010).
Trình tự của các mẫu tôm sú được so sánh với trình tự tham chiếu bằng BWAMEM v.0.7 (Li
et al., 2009a). Dữ liệu SNP được truy xuất bằng công cụ SAMtools v.1.2 (Li et al., 2009b).
SNP được xác định khi gióng hàng các contig và sự sai khác nucleotide được phát hiện trên ít
nhất bốn trình tự. Chỉ các SNP hai allen đáp ứng mức độ l ặp lại như trên mới được xác định là
SNP (Melo et al., 2016; Nguyễn Minh Thành et al., 2015; Kumar, 2014).
Chú giải các đoạn trình tự và xác định gen liên quan:
Công cụ BlastX (Evalue< 1e6) được sử dụng để so sánh sự tương đồng giữa các contig với
cơ sở dữ liệu NCBI nonredundant (NrNCBI) ( tìm
kiếm được truy xuất dưới dạng danh sách các gen chức năng với các thông tin về geneID,
protein được mã hóa và tên loài tương ứng. Danh sách này được sử dụng để xác định gen mã
hóa protein liên quan đến tăng trưởng ở tôm sú bằng cách đối chiếu với 22 loại protein đã biết
liên quan đến tăng trưởng trong họ giáp xác trong công bố của Jung et al. (2013).
Xác định trình tự amino acid của contig và đánh giá mức độ tương đồng với gen mã hóa
protein quan tâm:
Công cụ Expasy () được sử dụng để xác định trình tự amino acid tương
ứng với trình tự nucleotide của contig quan tâm bằng cách kiểm tra toàn bộ 6 khung đọc mở
5’3’Frame 1 (+1), 5’3’ Frame 2 (+2), 5’3’ Frame 3 (+3), 3’5’ Frame 1 (1) , 3’5’ Frame 2 (2),
3’5’ Frame 3 (3). Sáu khung đọc mở này tạo ra 6 kiểu trình tự amino acid khác nhau đối với
mỗi contig, tiếp tục sử dụng công cụ Uniprot () để chọn ra kiểu trình tự
amino acid có tỷ lệ tương đồng cao nhất so với trình tự amino acid của protein quan tâm.
2.2.6. Phương pháp PCR đặc hiệu alen cạnh tranh (KASP)
Phương pháp KASP sử dụng bộ kit của Hãng LGC Genomics. Các bước tiến hành theo quy
trình của Hãng ( SNP liên quan đến tính trạng tăng trưởng
nhanh ở tôm sú thuộc gen mã hóa Myosin heavy chain type 1 được sử dụng để kiểm tra trên 40
7
cá thể tôm sú tăng trưởng nhanh thuộc thế hệ G1 bằng kỹ thuật KASP. Các mồi xuôi và mồi
ngược được thiết kế đặc hiệu với trình tự DNA chứa SNP này. Nồng độ DNA mỗi mẫu sử
dụng là 50ng. Thí nghiệm bố trí 2 ống đối chứng âm để so sánh (ở ống đối chứng âm, DNA
template được thay thế bằng nước).
Trình tự mồi xuôi allele kiểu dại (gắm HEXtail):
5’GAAGGTCGGAGTCAACGGATTGAGCAGAGCTCCTTCGGCC3’
Trình tự mồi xuôi allele kiểu đột biến (gắn FAMtail):
5′GAAGGTGACCAAGTTCATGCTCGCACGCATCTTGGTCTTCTCC3’
Trình tự mồi ngược: 5’CGCACGCATCTTGGTCTTCTCC3’
Chương 3. KẾT QUẢ NGHIÊN CỨU
3.1. Đa hình AFLP ở các quần đàn tôm sú Việt Nam
Kết quả phân tích AFLP sử dụng cặp mồi chọn lọc MseICTT/EcoRIACC JOE cho thấy
với các mẫu tôm sú thu thập từ 3 quần đàn tự nhiên của Việt Nam, có 309 alen được phát
hiện.
Số lượng alen ở các quần đàn là khác nhau và không có sự trùng nhau về vị trí xuất hiện
của các alen: Quần đàn BTB có số lượng alen dao động từ 32 đến 76, Quần đàn NTB là 29
đến 64 và Quần đàn NB là 38 đến 77.
Trong phạm vi mỗi quần đàn, quân đan NTB co 4 alen trung nhau gi
̀ ̀
́
̀
ưa cac ca thê cung quân
̃ ́ ́ ̉ ̀
̀
đan,
̀ ở quân đan NB có 8 alen trùng nhau, đ
̀ ̀
ặc biệt không phat hiên th
́ ̣
ấy bất kỳ alen trùng nhau
nào giưa cac ca thê trong quân đan BTB cho th
̃ ́ ́ ̉
̀ ̀
ấy tính đa dạng di truyền rất cao giữa các cá
thể ngay trong quần đàn này. Không phát hiện thấy alen nào chung cho cả 3 quân đan.
̀ ̀
Quan hệ phát sinh chủng loại giữa các quần đàn tôm sú Việt Nam: Cây phát sinh chủng loại
giữa các cá thể thuộc ba quần đàn tôm sú BTB, NTB và NB cho thấy mối liên hệ họ hàng giữa
các cá thể. Về cơ bản cây được chia làm 3 nhánh, mỗi nhánh tương ứng với các cá thể thuộc
cùng một vùng (một quần đàn) được xếp vào cùng một nhánh. Tuy nhiên, có một vài cá thể
của một trong 3 quần đàn này được xếp về nhánh của quần đàn khác (BTB7 và BTB16 thuộc
cùng nhánh của quần đàn Nam Trung Bộ, NTB2 và NTB3 thuộc cùng nhánh của quần đàn Bắc
Trung Bộ. Kết quả này có thể được lý giải do quá trình di cư của tôm sú đến vùng biển khác
theo các dòng hải lưu để tìm kiếm nguồn thức ăn và môi trường mới thích hợp với giai đoạn
sinh trưởng của chúng.
B
A
C
Hình 3.1. Cây phát sinh
chủng loại các quần đàn tôm
sú thu từ ba vùng biển Việt
Nam: A Nhánh Bắc Trung
Bộ (BTB), B Nhánh Nam
Trung Bộ (NTB), C Nhánh
Nam Bộ (NB) (Vòng tròn màu
đỏ biểu thị các cá thể tôm sú
của một trong ba quần đàn này
xuất hiện trên nhánh của quần
8
3.2. Sản xuất tôm sú thế hệ Go, G1
3.2.1. Sàng lọc nguồn tôm bố mẹ đầu vào
Từ các cá thể tôm bố mẹ thuộc 4 dòng tôm sú có nguồn gốc địa lý khác nhau (vật liệu gốc),
tổng cộng có 460 tôm cái và 376 tôm đực được sử dụng làm vật liệu đầu vào để tiến hành
sàng lọc. Kết quả (Bảng 3.1) cho thấy số tôm được giữ lại sau sàng lọc bệnh nghiêm ngặt
tương đối thấp: chỉ có 48,0% tôm cái và 54,5% tôm đực được giữ lại. Trong đó, tỷ lệ giữ lại
thấp nhất là tôm dòng Nội địa, chỉ đạt 21,6% đối với tôm cái và 39,8% đối với tôm đực. Các
dòng tôm tự nhiên nhập ngoại có tỷ lệ sạch bệnh và được giữ lại sau sàng lọc khá hơn như ở
tôm cái dòng Ấn Độ Dương là 51,3% và ở tôm cái dòng Thái Bình Dương là 80,2%. Tỷ lệ tôm
đầu vào sạch bệnh và được giữ lại cao nhất là tôm Gia hóa: 100% đối với cả tôm đực và tôm
cái.
Về khối lượng thân trung bình, nhìn chung các dòng tôm có nguồn gốc nhập ngoại có khối
lượng lớn hơn so với tôm Việt Nam: nhóm tôm Nội địa và nhóm tôm Gia hóa có khối lượng
trung bình lần lượt là 165,7g và 160,8g, thấp hơn so với nhóm tôm Ấn Độ Dương (222,2g) và
nhóm tôm Thái Bình Dương (220,0g).
Bảng 3.1. Kết quả sàng lọc tôm sú bố mẹ đầu vào
Dòng tôm
Ấn Độ Dương (A)
Thái Bình Dương (T)
Nội địa (N)
Gia hóa (G)
Tổng
Số lượng thu
thập
Cái
Đực
76
71
86
58
236
186
62
61
460
376
Số tôm sạch
bệnh
Cái
Đực
39
34
69
36
51
74
62
61
221
205
% sạch bệnh
Cái
51,3
80,2
21,6
100
48,0
Đực
47,9
62,1
39,8
100
54,5
Khối lượng
(g/con)
TB ± SD
222,2 ± 25,4
220,0 ± 23,1
165,7 ± 19
160,8 ± 10,4
3.2.2. Thiết lập các gia đình tôm sú thế hệ Go, G1
Từ 16 phép lai tổ hợp toàn phần 4 dòng tôm sú khác nhau đã tạo ra được các gia đình thế
hệ Go. Kết quả có 69 gia đình Go được thả nuôi thành công. Số lượng gia đình Go được ương
nuôi thành công đến kích cỡ đánh dấu, thả nuôi chung của từng phép lai được trình bày ở
Bảng 3.2.
Bảng 3.2. Số lượng gia đình tôm sú thế hệ Go thả nuôi thành công từ 16 phép lai
Phép lai
Tôm
cái
Dòng tôm
A
G
N
A
6
2
4
Tôm đực
G
N
5
5
2
2
6
6
T
5
3
5
Tổng cộng
21
9
21
9
T
Tổng cộng
4
16
4
17
4
17
18
69
6
19
Kết quả ở Bảng 3.2 cho thấy: có sự khác nhau khá rõ về tỷ lệ thả nuôi thành công giữa các
gia đình Go khác nhau về nguồn gốc tôm bố và tôm mẹ, đặc biệt là khác nhau về nguồn gốc
tôm mẹ, cụ thể: Các phép lai giữa tôm mẹ nguồn gốc Nội địa với 4 dòng tôm bố khác nhau
đều cho tỷ lệ thả nuôi thành công của các gia đình ở mức cao (tổng cộng là 21 gia đình) ; Tôm
mẹ nguồn gốc A cũng cho tỷ lệ các gia đình thả nuôi thành công khá cao (21 gia đình); Tôm
mẹ nguồn gốc T cho tỷ lệ các gia đình thả nuôi thành công thấp hơn (18 gia đình); Trong khi
đó, các phép lai có tôm mẹ nguồn gốc G cho tỷ lệ các gia đình thả nuôi thành công thấp nhất
(chỉ có 9 gia đình).
Kết quả trên đây cho thấy: tôm mẹ thuộc các dòng khác nhau sau khi được cấy tinh nhân
tạo và thả nuôi để chuẩn bị cho sinh sản tạo thế hệ Go đã có sự khác nhau rõ rệt về khả năng
sống.
Xét về ảnh hưởng của nguồn gốc tôm bố đối với tỷ lệ thả nuôi thành công của các gia đình
thế hệ Go thì không thấy sự khác biệt lớn: Số lượng các gia đình khác nhau về nguồn gốc tôm
bố (A, G, N, T) lần lượt là 16, 17, 17 và 19 gia đình.
Tỷ lệ góp vật liệu di truyền theo dòng của 4 dòng tôm sú ở thế hệ Go và số lượng cá thể
tôm đực và tôm cái (tôm bố mẹ) của từng dòng tham gia sinh sản để tạo thế hệ G o được trình
bày ở Bảng 3.3. Tổng số có 108 cá thể tôm bố mẹ (bao gồm 55 tôm cái và 53 tôm đực) được
chọn từ 4 dòng tôm (vật liệu ban đầu) để tạo thế hệ Go.
Bảng 3.3. Tỷ lệ góp vật liệu di truyền theo dòng ở thế hệ Go
Dòng tôm
Giới tính
Số lượng
(con)
Tỷ lệ (%)*
Tổng
A
Cái
Đực
19
10
G
Cái Đực
6
16
(34,5) (18,9) (10,9) (30,2)
29 (26,9%)
22 (20,4%)
N
T
Cái
Đực
Cái
Đực
17
14
13
13
(30,9) (26,4) (23,7) (24,5)
31 (28,7%)
26 (24,1%)
(Ghi chú * : Các con số tỷ lệ % trong ngoặc được tính theo tôm cái riêng và tôm đực riêng, tổng là 100%
đối với mỗi nhóm tôm đực cái).
Kết quả ở Bảng 3.3 cho thấy:
+ Trong 69 gia đình được nuôi thành công, có sự cân bằng tương đối về tỷ lệ tôm bố mẹ
tham gia tạo vật liệu cho thế hệ G o, cụ thể: Dòng tôm sú A chiếm tỷ lệ 26,9% với tổng số
29/108 cá thể, trong đó có 19 cá thể tôm đực và 10 cá thể tôm cái; Dòng tôm sú G chiếm tỷ lệ
20,4% với tổng số 22/108 cá thể, trong đó có 6 cá thể tôm đực và 16 cá thể tôm cái; Dòng tôm
sú N chiếm tỷ lệ 28,7% với tổng số 31/108 cá thể, trong đó có 17 cá thể tôm đực và 14 cá thể
tôm cái; Dòng tôm sú T chiếm tỷ lệ 24,1% với tổng số 26/108 cá thể, trong đó có 13 cá thể tôm
đực và 13 cá thể tôm cái. Như vậy, tỷ lệ góp vật liệu di truyền của dòng tôm Nội địa (N) là
cao nhất (28,7%) và thấp nhất là nhóm tôm Gia hóa (20,4%).
10
+ Xét trong cùng một dòng: có sự chênh lệch lớn về tỷ lệ góp vật liệu di truyền giữa tôm
cái (tôm mẹ) và tôm đực (tôm bố) trong cùng một dòng tôm ở nhóm tôm Ấn Độ Dương (19
tôm cái, 10 tôm đực) và nhóm tôm Gia hóa (6 tôm cái, 16 tôm đực); Ở hai nhóm còn lại là Nội
địa và Thái Bình Dương, tỷ lệ tôm đực và tôm cái tham gia sinh sản tạo thế hệ G o là tương
đương nhau (lần lượt là 17 tôm cái và 14 tôm đực ở dòng N; 13 tôm cái và 13 tôm đực ở dòng
T). Sự chênh lệch cũng thể hiện rõ ở tỷ lệ đóng góp tôm mẹ (nhóm Ấn Độ Dương là 34,5% so
với nhóm Gia hóa là 10,9%) và tôm bố (nhóm Ấn Độ Dương là 18,9% so với nhóm Gia hóa là
30,2%) giữa bốn nhóm vật liệu ban đầu.
Tôm bố mẹ Go được ghép cặp để sản xuất các gia đình G1 cùng cha mẹ (fullsibs family)
và các cặp gia đình cùng cha khác mẹ (halfsibs group). Tổng cộng có 246 cá thể tôm thế hệ G o
(bao gồm 112 tôm cái và 134 tôm đực) thuộc 69 gia đình Go được sử dụng làm tôm bố mẹ để
sản xuất thế hệ G1. Kết quả đã tạo được 76 gia đình thế hệ G 1. Số lượng các nhóm gia đình
và số lượng cá thể tương ứng được trình bày ở Bảng 3.4.
Bảng 3.4. Số lượng các nhóm gia đình tôm sú thế hệ G1
Kiểu gia
đình
Cùng cha
khác mẹ
Cùng cha mẹ
Tổng
Tôm
bố
Tôm
mẹ
15
50
26
26
Số Tôm bố
lượng
x tôm
tôm con
mẹ
5.155
2.257
7.412
Số lượng
Số Tổn
nhóm gia
lượng
g
đình cùng gia đình
cha khác
cùng
mẹ cha mẹ
1 x 2
6
12
1 x 3
1 x 4
1 x 5
1 x 7
3
3
2
1
9
12
10
7
50
26
76
Kết quả ở Bảng 3.4 cho thấy: Trong tổng số 76 gia đình của thế hệ G 1 có 15 nhóm gia
đình cùng cha khác mẹ (bao gồm 50 gia đình, chiếm tỷ lệ 65,8%) và 26 gia đình cùng cha mẹ
(không có nhóm cùng cha khác mẹ tương ứng), chiếm tỷ lệ 34,2%. Tổng số cá thể tôm sú thế
hệ G1 thu được là 7.412, trong đó có 5.155 cá thể (chiếm tỷ lệ 69,5%) thuộc nhóm gia đình
cùng cha khác mẹ và 2.257 cá thể (chiếm tỷ lệ 30,5%) thuộc nhóm gia đình cùng cha mẹ.
Tôm sú thế hệ Go, G1 ở các giai đoạn khác nhau (từ ấu trùng đến giai đoạn thành thục)
được ương nuôi trong điều kiện kiểm soát nghiêm ngặt về các thông số môi trường sống. Tất
cả mẫu của các gia đình lai đều được sàng lọc mầm bệnh và đều cho kết quả âm tính với
mầm bệnh virus. Các quần đàn tôm lai thế hệ Go và thế hệ G1 sẽ là nguồn vật liệu được sử
dụng cho các nghiên cứu tiếp theo nhằm sàng lọc các chỉ thị phân tử (SNP) liên kết với tính
trạng tăng trưởng.
11
Số lượng contig
3.3. Sàng lọc đa hình nucleotide đơn (SNP) liên quan đến tính trạng tăng trưởng ở tôm sú
3.3.1. Giải trình tự, kết nối các đoạn
trình tự và thiết lập hệ gen tham
chiếu tạm thời
Giải trình tự hệ gen tôm sú thuộc
hai nhóm tôm tăng trưởng nhanh và
tôm tăng trưởng chậm trên hệ thống
Illumina NextSeq®500 thu được
145.836.644 đoạn trình tự thô (raw
read); trong số đó có 120.438.739
(83%) đoạn trình tự mang barcode và
điểm cắt của ApeKI. Sau khi tinh sạch
thu được 102.505.713 (70,2%) đoạn
trình tự có chất lượng tốt để sử dụng
Phân bố độ dài contig
cho việc kết nối contig và thiết lập hệ
gen tham chiếu tạm thời, với dung Hình 3.2. Phân bố độ dài các contig sau tinh sạch
lượng dữ liệu ~100 GB. Từ Các contig có kích thước 70 150 bp chiếm số lượng
102.505.713 đoạn trình tự sau khi kết nhiều nhất (211.389), ít nhất là các contig có kích thước
>450 bp, loại bỏ các contig kích thước ngắn < 70bp.
nối thu được 510.076 contig với sự
phân bố kích thước các contig được thể hiện ở Hình 3.2. Các contig có chiều dài 70150bp
chiếm số lượng lớn nhất (211.389), tiếp đến là các contig có chiều dài 150 300 bp và ít nhất
là các contig có chiều dài 450 547 bp. Các contig kích thước ngắn dưới 70 bp bị loại bỏ.
Hệ gen tham chiếu tạm thời của tôm sú có kích thước 76.299.742 bp (được thiết lập từ dữ
liệu giải trình tự các đoạn DNA có chất lượng tốt nhất), được sử dụng để sàng lọc SNP.
Bảng 3.5. Tóm tắt kết quả xử lý dữ liệu giải trình tự GBS
Chỉ số phân tích
Độ sâu giải trình tự
Dung lượng dữ liệu (GB)
Số lượng đoạn trình tự thô (raw reads)
Số lượng đoạn trình tự (read) sử dụng kết nối
contig
Tổng số contig
Kích thước hệ gen tham chiếu tạm thời (bp)
3.3.2. Sàng lọc SNP
Tổng cộng có 2887 SNP đã được phát hiện,
trong đó có 1799 SNP chỉ xuất hiện ở nhóm tôm
lớn nhanh, 587 SNP chỉ xuất hiện ở nhóm tôm lớn
chậm và 501 SNP xuất hiện ở cả hai nhóm (Hình
3.3).
Giá trị
50x
100
145.836.644
102.505.713
510.076
76.229.742
A
C
B
Hình 3.3. Số lượng SNP ở hai nhóm
tôm tăng trưởng nhanh và tăng trưởng
chậm
A Số lượng SNP ở nhóm tôm sú lớn nhanh
(1799), B Số lượng SNP ở nhóm tôm sú lớn
12
C Số lượng SNP ở cả hai nhóm (501).
3.3.3. Chú giải gen chức năng từ dữ liệu
giải trình tự tôm sú
Từ dữ liệu giải trình tự và dữ liệu sàng
lọc SNP, chỉ những đoạn trình tự chứa SNP
được sử dụng để chú giải nhằm tìm kiếm
sự tương đồng với các trình tự gen chức
năng được lưu trữ ở GenBank (NCBI). Toàn
bộ 2887 đoạn trình tự chứa SNP ở cả hai
nhóm tôm sú Lớn nhanh và Lớn chậm được
chú giải. Kết quả có 510 (17,67%) contig Hình 3.4. Kết quả chú giải gen chức năng
chứa SNP có trình tự nucleotide tương đồng Có 2377 contig chứa SNP không cho kết quả chú
với các trình tự trên cơ sở dữ liệu nrNCBI giải,
510 contig chứa SNP cho kết quả chú giải, trong đó:
(với tham số Evalue < 1e6); trong đó có 287
287 contig chứa SNP ở nhóm tôm sú lớn nhanh, 126
(56,27 %) trình tự contig chứa SNP thuộc contig chứa SNP ở nhóm tôm sú lớn chậm và 97
nhóm tôm sú Lớn nhanh, 126 (24,71 %) trình contig chứa SNP ở cả hai nhóm.
tự contig chứa SNP thuộc nhóm tôm sú Lớn chậm và 97 (19,02 %) trình tự contig chứa SNP
thuộc cả hai nhóm. Một lượng lớn (85,33%) contig của nghiên cứu này không cho kết quả chú
giải gen chức năng (Hình 3.4).
Bảng 3.6. Kết quả chú giải các gen liên quan tính trạng tăng trưởng ở tôm sú
Loài
tương
ứng
gi|
343183153|
dbj|
BAK61429.
1|
Myosin
heavy
chain
Marsupen
aeus
japonicus
CAAGGTCGTCGATCTTCAGCT
TCCATTCAGAGATGATCTTAT
CGAAGTTCTTCTGTTTCTTCTC
AGCGGAGTTGGCCAGAGTCT
GTGCACGTTCAGCA
gi|
410509306|
dbj|
BAM65719
.1|
Myosin
heavy
chain
Penaeus
monodon
CTCGTCTCGAGGAAGCCGAA
ATGCAGATTGAGTCTCTCAAT
GTTAAGAACTTGCATTTGGAG
AAGACCAAGATGCGTGCG
Gen bank
ID
Contig83953
(98 bp)
Cluster26034
7
(80 bp)
Trình tự nucleotide
Protein
tương
ứng
Contig được
chú giải
type a
type 1
(đối với contig83953 là trình
tự bổ sung)
Từ kết quả BlastX, chúng tôi thu được danh sách chú giải gồm các protein đã biết chức
năng hoặc các protein dự đoán cùng với tên loài tương ứng. Với mục tiêu nghiên cứu là tìm
kiếm và xác định sự liên quan giữa các gen mã hóa các protein có liên quan đến tăng trưởng ở
tôm sú với các SNP đã sàng lọc được, chúng tôi đã đối chiếu lần lượt 22 protein liên quan đến
13
tính trạng tăng trưởng trong họ giáp xác (Jung et al., 2013) với các protein đã chú giải được để
rà soát và tìm ra loại protein tương ứng với trình tự contig chứa SNP của hai nhóm tôm sú
nghiên cứu. Kết quả đã xác định được hai contig (contig83953 dài 98 bp và contig260347 dài
80 bp) ở nhóm tôm sú tăng trưởng nhanh có trình tự amino acid tương ứng tương đồng với
trình tự amino acid của protein Myosin Heavy Chain (MHC). Trong đó, contig83953 tương
đồng với MHC type a (MHCa) và contig260347 tương đồng với MHC type 1 (MHC1). Trong
nghiên này, chúng tôi không tìm thấy contig nào của nhóm tôm sú Lớn chậm có sự tương đồng
với 22 protein liên quan đến tính trạng tăng trưởng trong họ giáp xác đã được công bố bởi
nhóm tác giả Jung et al. (2013).
Trình tự nucleotide của contig83953 và contig260347 được trình bày ở Bảng 3.6.
3.3.4. Xác định chỉ thị SNP và tương quan giữa các contig chứa SNP với gen MHC
Từ các kết quả sàng lọc SNP và kết quả chú giải protein liên quan đến tính trạng tăng
trưởng ở tôm sú (chỉ các contig chứa SNP được chọn để chú giải gen chức năng, sau đó so
sánh trình tự của contig chứa SNP với trình tự của gen chức năng tương ứng để xác định loại
nucleotide thay thế), chúng tôi đã xác định được vị trí SNP trên contig83953 và contig260347
như sau (Bảng 3.6): SNP T C tại vị trí nucleotide thứ 20 trên mạch bổ sung với contig83953,
tức là SNP A G trên mạch gốc contig83953 và SNP G A tại vị trí nucleotide thứ 19 trên
contig260347.
Bảng 3.7. Kết quả xác định SNP trên contig83953 và contig260347
Tên Contig
Contig83953
Contig260347
Nucleotide
tham
chiếu
Ghi chú
C
T
Trình tự bổ sung
G
A
Trình tự mạch gốc
A
G
Mạch gốc
Ký pháp HGVS của SNP Nucleotide
tương ứng
thay thế
Contig83953:g.20T>C
Contig260347:g.19G>A
Để xác định tương quan giữa các contig83953 và contig260347 chứa SNP với gen mã hóa
protein MHC liên quan đến tăng trưởng ở tôm sú, chúng tôi đã tiến hành dịch mã các trình tự
nucleotide của contig83953 và contig260347 thành các chuỗi amino acid tương ứng, sau đó so
sánh với trình tự amino acid của gen mã hóa protein MHC. Kết quả dịch mã được trình bày ở
Bảng 3.8.
Bảng 3.8. Trình tự amino acid tương ứng của contig83953 và contig260347
Tên contig
Trình tự amino acid tương ứng
()
Tổng số
amino acid
của chuỗi
Contig83953
AERAQTLANSAEKKQKNFDKIISEWKLKIDDL
32
Contig260347
RLEEAEMetQIESLNVKNLHLEKTKMetRA
30
Để kiểm tra sự chính xác của các trình tự amino acid, chúng tôi đã tiến hành Blast (Basic
Local Alignment Search Tool) bằng công cụ Uniprot () với cả hai loại
14
dữ liệu đầu vào là trình tự amino acid và trình tự nucleotide của contig83953 và contig260347.
Kết quả thu được từ hai loại dữ liệu đầu vào hoàn toàn trùng khớp nhau về tỷ lệ tương đồng
giữa chuỗi amino acid của contig83953 và contig260347 so với protein MHC ở các loài khác
nhau (Bảng 3.9 và Bảng 3.10).
Kết quả ở Bảng 3.9 cho thấy: trình tự amino acid tương ứng của contig83953 đạt tỷ lệ
tương đồng cao nhất (90,6%) với trình tự amino acid của protein MHCa ở loài tôm P.
japonicus, tỷ lệ tương đồng với MHC1 ở hai loài tôm khác là P. monodon và L. vannamei cũng
tương đối cao (đều đạt 87,5%). Kết quả ở Bảng 3.10 cho thấy: trình tự amino acid tương ứng
của contig260347 đạt tỷ lệ tương đồng cao nhất (96,2%) với trình tự amino acid của protein
MHC ở cả ba loài tôm P.monodon, P. japonicus và L. vannamei.
Bảng 3.9. Các tỷ lệ tương đồng cao nhất giữa contig83953 với protein MHC
STT
GenBank
ID
1
F8WR03
2
K4Q111
3
K4Q4N8
4
Q6XGZ8
5
B0W188
Protein MHC
(loài tương ứng)
Myosin heavy chain type a
(Penaeus japonicus)
Myosin heavy chain type 1
(Litopenaeus vannamei)
Myosin heavy chain type 1
(Penaeus monodon)
Slow muscle myosin S1 heavy
chain (Homarus americanus)
Myosin heavy chain
(Culex quinquefasciatus)
Tỷ lệ tương
đồng (%)
Vị trí amino acid
trên protein MHC
90,6%
14311462
87,5%
14311462
87,5%
14321463
83,9%
3060
80,6%
13991429
Bảng 3.10. Các tỷ lệ tương đồng cao nhất giữa contig260347 với protein MHC
STT
GeneBank
ID
1
K4Q4N8
2
F8WR03
3
K4Q111
4
K4Q2Y1
5
K4Q2S1
Protein MHC
(loài tương ứng)
Myosin heavy chain type 1
(Penaeus monodon)
Myosin heavy chain type a
(Penaeus japonicus)
Myosin heavy chain type 1
(Litopenaeus vannamei)
Myosin heavy chain type 2
(Penaeus monodon)
Myosin heavy chain type 2
(Litopenaeus vannamei)
Tỷ lệ tương Vị trí amino acid
đồng (%)
trên protein MHC
96,2
13961425
96,2
13951420
96,2
13951420
76,0
13961418
76,0
13961418
3.3.5. Xác định vùng tương đồng giữa contig chứa SNP so với gen mã hóa protein MHC,
xác định codon chứa SNP và vị trí tương ứng của chỉ thị SNP trên gen MHC
Bằng cách so sánh các chuỗi trình tự (nucleotide, amino acid) của contig83953 và
contig260347 với trình tự của gen MHCa và MHC1 để xác định vùng tương đồng giữa chúng,
chúng tôi đã xác định được vị trí phân vùng chức năng trên gen MHCa và MHC1 phù hợp với
15
trình tự các contig83953 và contig260347 chứa SNP, đồng thời xác định chính xác codon chứa
SNP cũng như sự biến đổi của amino acid có thể xảy ra do sự xuất hiện SNP (Hình 3.5, Hình
3.6, Hình 3.7, Hình 3.8).
Kết quả ở Hình 3.5 và Hình 3.6 cho thấy: vùng tương đồng về amino acid của contig83953
ở tôm sú P. Monodon trong nghiên cứu này so với protein MHCa ở tôm he Nhật bản P.
Japonicus nằm trong khoảng vị trí amino acid 1431 1462; vị trí nucleotide tương đồng từ 4408
4505. Vùng tương đồng này thuộc phân vùng chức năng LMM (light meromyosin) trên phân
tử protein myosin.
Kết quả ở Hình 3.7 và Hình 3.8 cho thấy: vùng tương đồng về amino acid của contig260347
ở tôm sú P. monodon trong nghiên cứu này so với protein MHC 1 ở tôm sú trên genBank nằm
trong khoảng vị trí amino acid 1396 1422; vị trí nucleotide tương đồng từ 4302 4379. Vùng
tương đồng này cũng thuộc phân vùng chức năng LMM (light meromyosin) trên phân tử protein
myosin.
Các kết quả chỉ ra trên Hình 3.5, Hình 3.6, Hình 3.7, Hình 3.8 cho thấy rõ các codon chứa
các SNP. Cụ thể như sau:
SNP T C tại vị trí nucleotide thứ 20 trên mạch bổ sung với contig83953
[Contig83953:g.20T>C], tức là SNP A G trên mạch gốc contig83953 được xác định là
vị trí SNP A4486G trên gen MHCa (Hình 3.5). SNP này là nucleotide thứ 3 trong bộ ba
Contig 83953
(codon) mã hóa amino acid, làm bi
ến đổi codon AAA thành AAG. Cả hai codon này đều
mã hóa amino acid Lysine (K) với vị trí amino acid tương ứng trên protein MHCa là
K1456K (Hình 3.6). Nói cách khác, SNP này không làm thay đổi amino acid tương ứng.
SNP G
A tại vị trí nucleotide thứ 19 trên contig260347 [Contig260347:g.19G>A]
Contig 83953
được xác định là vị trí SNP G4320A trên gen MHC1 (Hình 3.7). SNP này là nucleotide
thứ 2 trong bộ ba mã hóa amino acid, làm biến đổi codon GGA (mã hóa amino acid
Glycine G) thành GAA (mã hóa amino acid Glutamic E). Vị trí amino acid tương ứng
Contig 83953
trên protein MHC
1 là G1401E (Hình 3.8).
Như vHình 3.5. Vùng t
ậy, với việc sươ
ử d
ụng hệ gen tham chiếu tạm thời của tôm sú P. monodon được thiết
ng đồng nucleotide giữa mạch bổ sung của contig83953 của tôm sú P.
lập de novo đ
ể sàng l
ọc SNP, nghiên c
ứu của chúng tôi đã xác đ
ịnh đ
ược hai SNP ở nhóm tôm
monodon so v
ới trình t
ự gen MHCa ở tôm he Nh
ật Bản P. japonicus (v
ị trí nucleotide 4408 4505)
sú tăng trưởng nhanh. Hai SNP này nằm trong phân vùng chức năng LMM của gen MHC liên
quan đến tính trạng tăng trưởng.
S2
LMM
Contig 83953
Contig 83953
Contig 83953
Hình 3.6. Ánh xạ trình tự amin oacid thể hiện vùng tương đồng giữa contig83953 của tôm
sú P. monodon với protein MHCa ở tôm he Nhật Bản P. japonicus (vị trí amino acid 1431
1462)
16
Contig260347
Contig260347
Hình 3.7. Vùng tương đồng nucleotide giữa contig260347 so với trình tự gen
MHC1 ở tôm sú P. monodon (vị trí nucleotide 4302 4379)
S2
LMM
Contig260347
Contig260347
Hình 3.8. Ánh xạ trình tự acid amin thể hiện vùng tương đồng giữa
contig260347 với MHC1 ở tôm sú P. monodon (vị trí acid amin 1396 1422)
3.4. Sàng lọc chỉ thị SNP G>A ở tôm sú tăng trưởng nhanh bằng phương pháp KASP
Kết quả kiểm tra trên 40 mẫu tôm sú cái tăng trưởng nhanh thế hệ G 1 (Hình 3.9) cho thấy:
hầu hết mẫu tôm sú tăng trưởng nhanh (28/40 mẫu) chứa SNP dạng đồng hợp tử A:A (màu
xanh dương); chỉ có 2/40 mẫu chứa SNP dạng đồng hợp tử G:G (màu đỏ); còn lại là 10/40
mẫu chứa SNP dạng dị hợp tử G:A (màu xanh lá cây).
Kết quả này cho thấy: việc sử dụng các mồi xuôi và mồi ngược được thiết kế đặc hiệu
với trình tự DNA chứa SNP G>A, trong đó trình tự mồi xuôi đặc hiệu với alen kiểu dại được
gắn HEXtail (màu đỏ) và trình tự mồi xuôi đặc hiệu với alen đột biến được gắn FAMtail
(màu xanh dương) đã phát hiện thấy đột biến G4320A thuộc gen MHC1 có mặt ở 38 trong số
40 mẫu tôm sú được kiểm tra (chiếm 95%). Trong số 38 cá thể tôm sú mang đột biến G4320A,
có 28 cá thể mang kiểu gen đồng hợp tử (tương ứng với 28 tín hiệu huỳnh quang màu xanh
dương) và có 10 cá thể mang kiểu gen dị hợp tử (tương ứng với 10 tín hiệu huỳnh quang màu
xanh lá cây).
17
Hình 3.9. Kết quả phân tích tín hiệu huỳnh quang
trong kỹ thuật KASP sàng lọc chỉ thị SNP G>A
thuộc gen MHC1 ở tôm sú tăng trưởng nhanh
Các chấm màu xanh dương thể hiện các mẫu tôm sú tăng
trưởng nhanh có đồng hợp tử A:A (28/40 mẫu);
Các chấm màu đỏ thể hiện các mẫu tôm tăng trưởng
nhanh có đồng hợp tử G:G 2/40 mẫu;
Các chấm màu xanh lá cây thể hiện các mẫu tôm tăng
trưởng nhanh có dị hợp tử G:A 10/40 mẫu.
Các chấm màu đen là tín hiệu huỳnh quang bị nhiễu;
Các mẫu đối chứng không có tín hiệu huỳnh quang
(không xuất hiện trên hình).
Chương 4. BÀN LUẬN KẾT QUẢ
4.1. Đa hình AFLP ở các quần đàn tôm sú
Kết quả phân tích đa hình AFLP sử dụng cặp mồi chọn lọc MseICTT/EcoRIACC JOE đối
với các mẫu tôm sú thuộc ba quần đàn BTB, NTB và NB với số lượng alen ở các quần đàn là
khác nhau, không có sự trùng nhau hoàn toàn về vị trí xuất hiện của các alen đã cho thấy
genome của các mẫu tôm sú có cấu trúc khác nhau, tức là có sự đa hình về mặt di truyền giữa
các cá thể.
Khi so sánh chi tiết vị trí các alen của các mẫu tôm sú giữa các quần đàn với nhau cho thấy:
không những các alen ở các mẫu là không trùng nhau hoàn toàn khi so sánh hai mẫu bất kỳ
thuộc cùng một quần đàn hay thuộc hai quần đàn khác nhau, mà ở mỗi quần đàn đều có những
alen đặc trưng cho quần đàn đó, tức là chỉ xuất hiện ở một hoặc một vài cá thể của một quần
đàn mà không thấy có ở các quần đàn khác. Trong đó: Quần đàn BTB có số lượng alen đặc
trưng quần đàn nhiều hơn hẳn so với quần đàn NTB và NB.
Trong phạm vi từng quần đàn, khi so sánh sự đa hình AFLP giữa các cá thể thuộc cùng một
quần đàn cho thấy: trong khi ở quân đan NTB co 4 alen trung nhau,
̀ ̀
́
̀
ở quân đan NB có 8 alen
̀ ̀
trùng nhau thì điểm đặc biệt của quần đàn Bắc Trung Bộ là không có bất kì alen nào trùng
nhau. Điều này cho thấy tính đa dạng di truyền rất cao của các cá thể trong quần đàn này.
Phân tich sâu h
́
ơn chung tôi nh
́
ận thây, gi
́ ữa 3 quân đan nay không co alen nao trùng nhau.
̀ ̀ ̀
́
̀
Từ những nhận định trên đây có thể kết luận: các mẫu tôm sú nghiên cứu thuộc 3 quần đàn
khác nhau thể hiện tính đa hình di truyền rõ rệt. Mỗi cá thể đều là khác biệt hay nói cách
khác chúng có kiểu gene khác nhau. Sự đa hình này không chỉ thể hiện giữa các cá thể bên
trong mỗi quần đàn mà còn là sự đa hình giữa các quần đàn tôm sú thuộc các khu vực phân bố
khác nhau về mặt địa lý. Trong số 3 quần đàn tôm sú nghiên cứu, quần đàn BTB thể hiện tính
đa hình di truyền (đa hình AFLP) cao nhất và thấp nhất là quần đàn NB.
18
Các nhận định này cũng phù hợp với kết quả nghiên cứu của Nguyễn Thị Thảo et al. (2004)
khi nghiên cứu tính đa hình của ba quần đàn tôm sú (gồm 2 quần đàn tôm sú Việt Nam và 1
quần đàn tôm sú nhập ngoại từ Singapore) bằng phương pháp phân tích microsatellite. Kết quả
nghiên cứu của nhóm tác giả này cho thấy: ngay trong nội bộ một quần đàn và giữa các quần
đàn tôm cũng thể hiện tính đa hình di truyền cao ; Ba quần đàn với tổng số 83 cá thể là 83 sự
khác biệt với 83 kiểu gene khác nhau, có rất ít hoặc không có alen trùng nhau ; Khi phân tích
cây phát sinh chủng loại thì 2 quần đàn tôm Việt Nam thuộc cùng một nhánh tách biệt hoàn
toàn với nhánh tôm nhập từ Singapore còn lại; Quần đàn tôm sú ở vùng Phú Yên (thuộc vùng
Trung Bộ) thể hiện tính đa hình cao hơn so với quần đàn vùng Rạch Gốc (Nam Bộ).
Trong nghiên cứu của chúng tôi, dòng tôm Nội địa là tôm tự nhiên của Việt Nam được thu
từ các vùng biển Đà Nẵng, Phú Yên… (vùng biển Nam Trung Bộ). Kết quả đánh giá đa hình di
truyền AFLP trong nghiên cứu này đã cho thấy quần đàn ở vùng này có sự đa hình di truyền
khá rõ nét. Nghiên cứu của Nguyễn Thị Thảo et al., (2004) với chỉ thị microsatellite cũng
khẳng định điều này. Đây là những dẫn liệu quan trọng bước đầu định hướng cho việc lựa
chọn dòng tôm bố mẹ từ các quần đàn bản địa có tính đa hình di truyền để tạo ưu thế lai trong
công tác chọn giống tôm sú. Tuy nhiên đây mới chỉ là nhận định bước đầu trong phạm vi kết
quả nghiên cứu của đề tài này. Để có thể khẳng định được mức độ đa hình di truyền của các
quần đàn tôm sú tự nhiên Việt Nam thì cần phải tiến hành thêm nhiều nghiên cứu trên nhiều
quần đàn với số lượng mẫu lớn hơn, đặc biệt cần có các số liệu nghiên cứu về các chỉ số đa
dạng di truyền của các quần đàn đó.
Một số kết quả nghiên cứu của các nhóm tác giả khác trên các đối tượ ng tôm sú thuộc
các quần đàn địa lý khác nhau trong khu v ực Đông Nam Á cũng cho thấy những nhận định
tươ ng tự về tính đa dạng di truyền của các quần đàn tôm.
Khamnamtong et al. (2009) đã nghiên cứu sự đa hình di truyền và sự khác biệt về địa lý trên
đối tượng tôm sú thu ở 3 vùng địa lý khác nhau ở Thái Lan. Kết quả nghiên cứu cho thấy có sự
đa hình di truyền cao trên các đối tượng tôm khảo sát, không có sự tương đồng di truyền mà có
sự khác biệt rất lớn trong thông tin di truyền của các cá thể. Sự đa dạng di truyền trên tôm
cũng được thể hiện trong các nghiên cứu sử dụng kỹ thuật microsatellite (Supungul et al.,
2000).
Klinbunga et al. (2001) nghiên cứu tính dị hợp về thông tin di truyền trên tôm sú Thái Lan
bằng kỹ thuật RAPD và phân tích DNA ty thể bằng kỹ thuật RFLP. Kết quả nghiên cứu của
nhóm này cho thấy sự khác biệt về vật chất di truyền giữa các cá thể thu ở 5 vùng địa lý khác
nhau. Các cá thể thuộc cùng một khu vực địa lý cũng ít cho thấy sự tương đồng, mỗi cá thể
mang một kiểu gene riêng.
4.2. Quan hệ phát sinh chủng loại giữa các quần đàn tôm sú Việt Nam
Cây phát sinh chủng loại của các mẫu tôm sú nghiên cứu thuộc 3 quần đàn tự nhiên vùng
biển BTB, NTB và NB của Việt Nam phản ánh rõ mối tương quan về mặt di truyền giữa
chúng. Nhìn chung, các cá thể thuộc cùng một quần đàn có mức độ tương đồng về mặt di
truyền (thể hiện ở các nhánh gần nhau trên cây phân loại) cao hơn so với các cá thể thuộc các
quần đàn khác nhau.
Hiện tượng một số cá thể thuộc quần đàn này lại xuất hiện trên nhánh phân loại của quần
đàn khác có thể được giải thích bởi các nguyên nhân sau: (1) Do sự di cư của các đàn tôm sú
19
trong tự nhiên từ vùng biển này đến vùng biển khác theo các dòng hải lưu để tìm kiếm nguồn
thức ăn và môi trường mới thích hợp với giai đoạn sinh trưởng của chúng; (2) Do người nuôi
tôm đánh bắt tôm sú bố mẹ từ tự nhiên đem về để sản xuất tôm giống, bán cho người nuôi ở
các khu vực khác (Bắc, Trung, Nam), khi nuôi có thể tôm thoát ra ngoài tự nhiên nên có sự pha
tạp.
Các kết quả này phù hợp với đặc điểm nuôi trồng thủy sản ở Việt Nam cũng như ở các khu
vực khác trên thế giới. Tính chất đa hình về mặt di truyền giữa các cá thể trong cùng một
quần đàn và giữa các quần đàn, cũng như sự pha tạp cá thể giữa các quần đàn tiếp giáp cũng
phù hợp với nhận định của các tác giả khác khi nghiên cứu về đa hình di truyền ở các quần
thể tôm tự nhiên. Mặc dù vị trí địa lý của các quần đàn thu mẫu là khác nhau giữa các nghiên
cứu nhưng về cơ bản đều cho thấy các quần thể tôm sú ở các vùng phân bố khác nhau có sự
khác biệt rõ rệt về mặt di truyền giữa các quần thể địa lý (Pan et al., 2004). Theo đó, tôm
giống tự nhiên ở những vùng khác nhau cũng sẽ khác nhau về sức sinh sản, tỷ lệ sinh trưởng,
khả năng chống chịu bệnh và nhiều đặc tính khác (Kim Thị Phương Oanh et al., 2010).
Mặt khác, tùy thuộc vào phương pháp đánh giá đa hình được sử dụng mà kết quả phân tích
và mô hình cây phát sinh chủng loại được thể hiện giữa các nghiên cứu cũng khác nhau, thậm
chí trên cùng một đối tượng nghiên cứu hoặc trên các mẫu nghiên cứu được thu thập từ các
quần thể khá tương đồng về mặt địa lý. Trong nghiên cứu của Nguyễn Thị Thảo et al. (2004),
phương pháp phân tích microsatellite được sử dụng để đánh giá đa hình ở ba quần đàn tôm sú
tự nhiên cũng đã cho thấy có rất ít hoặc không có alen trùng nhau. Tuy nhiên mô hình cây phát
sinh chủng loại biểu thị 2 quần đàn tôm sú Việt Nam (thu thập tại các vùng biển Phú Yên
(thuộc vùng Trung Bộ) và vùng Rạch Gốc (Nam Bộ) thuộc cùng một nhánh tách biệt hoàn toàn
với nhánh tôm nhập từ Singapore còn lại.
Trong nghiên cứu này, cây phát sinh chủng loại được xây dựng bằng các công cụ phần
mềm tương thích với dữ liệu đầu vào về phân tích AFLP. Về cơ bản, cây phát sinh chủng loại
ở Hình 3.3 thể hiện được nội dung kết quả nghiên cứu, phản ánh mức độ gần gũi về mặt di
truyền giữa các mẫu tôm sú được thu từ cùng một quần đàn cũng như sự pha tạp giữa các
quần đàn.
4.3. Tạo vật liệu tôm sú thế hệ G0, G1
Kết quả sàng lọc nguồn tôm bố mẹ đầu vào đối với 4 dòng tôm sú Ấn Độ Dương (A), Thái
Bình Dương (T), Nội địa (N) và Gia hóa (G) theo tiêu chí sạch bệnh cho thấy: tỷ lệ sạch bệnh
cao nhất là tôm G (100%). Kết quả này là phù hợp vì thực tế dòng tôm G là tôm chọn giống
được thương mại hóa dùng làm tôm bố mẹ sản xuất tôm giống phục vụ cho nuôi thương
phẩm. Dòng tôm này được nuôi trong điều kiện đảm bảo an toàn sinh học một cách nghiêm
ngặt. Các dòng tôm tự nhiên nhập ngoại (A, T) cũng có tỷ lệ sạch bệnh khá cao. Riêng dòng
tôm tự nhiên trong nước (N) có tỷ lệ giữ lại sau sàng lọc bệnh thấp nhất.
Sau khi hoàn thiện việc ghép cặp cho lai hỗn hợp bốn dòng tôm sú có nguồn gốc địa lý khác
nhau đã tạo ra được các gia đình, bước đầu tạo được nguồn vật liệu đa dạng về mặt di truyền
cho các nghiên cứu tiếp theo về sàng lọc chỉ thị phân tử SNP. Kết quả ghép phối hỗn hợp 4
dòng tôm sú có nguồn gốc địa lý khác nhau với 16 phép lai để tạo ra các gia đình cho thấy: tôm
mẹ thuộc các dòng khác nhau sau khi được cấy tinh và thả nuôi để chuẩn bị cho sinh sản tạo
thế hệ Go đã có sự khác nhau rõ rệt về khả năng sống. Nói cách khác, các phép lai có sự khác
20
nhau về nguồn gốc tôm mẹ và tôm bố sẽ dẫn đến sự khác nhau về số lượng gia đình được
thả nuôi thành công. Điều này có thể được lý giải do sự khác nhau về sức sống của tôm mẹ
thuộc các dòng khác nhau. Chẳng hạn: tôm mẹ N là dòng tôm sú có nguồn gốc bản địa trong
nước nên có thể chúng thích nghi tốt hơn với điều kiện môi trường, điều kiện dinh dưỡng,
chăm sóc quản lý trong thời gian lưu giữ nuôi vỗ kéo dài để ghép cặp cho sinh sản nhân tạo.
Do đó, các phép lai giữa tôm mẹ N với 4 dòng tôm bố khác nhau đều cho tỷ lệ thả nuôi thành
công của các gia đình ở mức cao (tổng cộng là 21 gia đình). Trong khi đó, các phép lai có tôm
mẹ nguồn gốc G cho tỷ lệ các gia đình thả nuôi thành công thấp nhất (9 gia đình). Điều này có
thể giải thích là do tôm gia hóa ở các cơ sở sản xuất khác nhau được nuôi trong điều kiện
nhân tạo với các chỉ tiêu nghiêm ngặt về điều kiện sống tại cơ sở sản xuất đó. Do đó dòng
tôm này có tính thích nghi hẹp. Khi được nuôi trong điều kiện môi trường nhân tạo tại địa
điểm khác thì khả năng thích nghi và do đó sức sống của dòng tôm này giảm hẳn, tôm cái gia
hóa thành thục sinh dục không tốt nên kết quả tất yếu là tỷ lệ thả nuôi thành công của các gia
đình có tôm mẹ nguồn gốc gia hóa đạt thấp. Tôm mẹ thuộc hai dòng tôm tự nhiên nhập ngoại
T và A cho tỷ lệ gia đình nuôi thả thành công khá cao. Những nhận định này rất có ý nghĩa về
mặt thực tiễn chọn giống trong việc lựa chọn các dòng tôm phục vụ cho mục đích ghép phối
để sản xuất thành công các thế hệ tôm lai.
Một kết quả khác bổ trợ cho việc đánh giá các dòng tôm bố mẹ có nguồn gốc khác nhau
dùng làm vật liệu ban đầu đó là đánh giá tỷ lệ góp vật liệu di truyền theo dòng ở thế hệ Go.
Kết quả khi so sánh chung giữa các dòng tôm về tỷ lệ tôm bố mẹ tham gia tạo vật liệu cho
thế hệ Go cho thấy có sự cân bằng tương đối, nhưng trong đó tỷ lệ đóng góp vật liệu di
truyền của nhóm tôm Nội địa vẫn cao nhất và thấp nhất là nhóm Gia hóa. Khi so sánh giữa
tôm đực và tôm cái trong cùng một dòng hoặc so sánh cùng một giới tính giữa các dòng khác
nhau về tỷ lệ góp vật liệu di truyền tạo thế hệ Go thì có sự chênh lệch, trong đó tôm cái G vẫn
chiếm tỷ lệ thấp nhất. Điều này góp phần minh chứng thêm vai trò của yếu tố khả năng thích
nghi trong thực tiễn chọn giống.
Những nhận định trên đây có ý nghĩa khoa học và thực tiễn vì tôm sú N là tôm tự nhiên của
Việt Nam được thu từ các vùng biển Đà Nẵng, Phú Yên… (vùng biển Nam Trung Bộ). Đây là
nguồn tôm có thể cung cấp chủ động trong nước. Kết quả đánh giá đa hình di truyền AFLP đã
cho thấy quần đàn tôm sú ở vùng này có sự đa hình di truyền rõ nét. Nghiên cứu của Nguyễn
Thị Thảo et al. (2004) với chỉ thị microsatellite cũng khẳng định điều này. Kết quả nghiên cứu
này là dẫn liệu quan trọng bước đầu định hướng cho việc lựa chọn dòng tôm bố mẹ từ các
quần đàn bản địa có tính đa hình di truyền cao. Đây sẽ là nguồn vật liệu đáng quan tâm trong
các chương trình chọn giống tôm sú vì có tiềm năng hội tụ được cả ưu điểm về khả năng
thích nghi tốt với điều kiện sống bản địa và tính đa dạng di truyền, cho phép khai thác hiệu
quả ưu thế lai.
4.4. Ứng dụng kỹ thuật GBS để sàng lọc các đa hình nucleotide đơn (SNP) liên quan đến
tính trạng tăng trưởng ở tôm sú
4.4.1. Đánh giá thư viện, giải trình tự, kết nối các đoạn trình tự và thiết lập hệ gen tham
chiếu tạm thời
Công nghệ giải trình tự gen thế hệ mới có thể phân tích được hàng triệu đoạn trình tự
(read) với giá thành thấp nhưng hạn chế đi kèm là kích thước các đoạn trình tự thường rất
21
ngắn (DW & Mockler, 2012). Vì vậy, các thuật toán lắp ráp đối với các loài không có hệ gen
tham chiếu đã được phát triển để lắp ráp và phân tích cơ sở dữ liệu được tạo ra từ các thiết bị
giải trình tự gen thế hệ mới. Hiện nay chưa có phương pháp chuẩn và phổ biến để đánh giá
chất lượng các phần mềm lắp ráp (Nguyễn Giang Thu et al., 2015; Narzisi & Mishra, 2011).
Lựa chọn phần mềm kết nối phù hợp cho kết quả kết nối tin cậy là điểm then chốt trong
phân tích hệ gen của các loài chưa có hệ gen tham chiếu. Phần mềm kết nối tối ưu là phần
mềm sử dụng gần như hoàn toàn các đoạn trình tự để kết nối thành các contig (Zhou et al.,
2012; Nguyễn Minh Thành et al., 2015). Trong khi một số phần mềm như CLC Genomic
Workbench v.6.0.4 (Nguyễn Minh Thành et al., 2015), Velvet/Oases (Robertson et al., 2010) hay
Trinity (Grabherr et al., 2011) phù hợp cho kết nối các đoạn trình tự được giải mã từ thiết bị
Ion Torrent thì phần mềm PEAR được sử dụng trong nghiên cứu này đã được đánh giá là công
cụ mới có khả năng kết nối với độ chính xác cao các dữ liệu được giải trình tự từ thiết bị
Illumina (Zhang et al., 2014).
Đối với công nghệ giải trình tự của Illumina, kích thước các đoạn đọc trình tự phù hợp
thường có độ dài < 150 bp (nếu đọc hai chiều, pairedend) hoặc < 300 bp (nếu đọc một chiều,
singleend). Vì hệ gen được cắt ngẫu nhiên nên trong nghiên cứu này, thư viện giải trình tự có
kích thước trung bình 208 bp được xem là phù hợp để giải trình tự hai chiều trên thiết bị
Illumina NextSeq500. Kích thước này ngắn hơn so với kích thước trung bình của thư viện
trong nghiên cứu của Hampton et al. (2011) (trung bình là 335 bp) khi sử dụng thiết bị Genome
Analyzer FLX để đánh giá thư viện và công nghệ giải trình tự Roche GS GLX Titanium
Sequencing với PicoTiterPlate Kits.
Tôm sú Penaeus monodon có 44 nhiễm sắc thể. Kích thước hệ gen tôm sú có dung lượng
khá lớn, khoảng 2.17×109 bp (You et al., 2010). Với kích thước hệ gen như vậy thì tùy thuộc
vào mục tiêu nghiên cứu, đồng thời theo khuyến nghị của Illumina ( ),
độ sâu giải trình tự phù hợp đã được chọn là 50x để thu được dung lượng dữ liệu giải trình tự
khoảng 100 Gb. Điều này có nghĩa là số lần đọc đối với mỗi vị trí nucleotide trong giải trình
tự là khoảng 50 lần. Vì hệ gen tôm sú chưa được giải trình tự toàn bộ nên việc chọn độ sâu
giải trình tự 50x nhằm tăng độ chính xác cho các kết quả đọc. Hầu hết các công nghệ giải
trình tự NGS đều bắt đầu bằng việc cắt nhỏ hệ gen thành các phân đoạn ngắn một cách ngẫu
nhiên, các phân đoạn DNA này được giải trình tự và sau đó được kết nối lại với nhau bằng
các công cụ phần mềm. Vì sự phân đoạn là ngẫu nhiên nên sự kết nối càng thành công khi
mức độ bao phủ giữa các đoạn trình tự càng lớn. Do đó trong nghiên cứu này, mặc dù dung
lượng dữ liệu giải trình tự thu được lên đến gần 100 GB (vì có rất nhiều tập dữ liệu đọc trình
tự được tạo ra từ tập hợp các mẫu phân tích) nhưng kết quả giải trình tự thu được số lượng
đoạn trình tự (tiền xử lý) chỉ là 145.836.644.
Từ 102.505.713 đoạn trình tự sau tinh sạch, kết quả kết nối thu được 510.076 contig. Kết
quả này là do GBS chỉ giải mã một phần hệ gen ở các vùng ngẫu nhiên sau khi cắt bằng
enzyme chứ không giải mã toàn bộ. Sau khi giải trình tự và sử dụng phần mềm để kết nối thì
tất cả các đoạn trình tự không đáp ứng được độ sâu bao phủ đều bị loại bỏ, đồng thời cũng có
một tỷ lệ nhất định các đoạn read không được sử dụng để kết nối do những hạn chế nhất
định của phần mềm kết nối. Mặc dù phần mềm kết nối được sử dụng là phù hợp nhưng
không phải tối ưu để có thể sử dụng hết 100% các đoạn read cho lắp ráp contig. Do đó, mặc
22
dù số lượng đoạn trình tự thu được sau giải mã rất lớn nhưng số lượng contig thu được không
nhiều. Nhận định này cũng phù hợp với kết quả nghiên cứu của Baranski et al. (2014) trên tôm
sú Penaeus monodon Ấn Độ sử dụng công nghệ giải trình tự Illumina RNAseq: từ 196 triệu
đoạn trình tự sau khi kết nối đã thu được 136.223 contig; hay nghiên cứu của Hampton et al.
(2011) trên hệ gen loài Ictidomys tridecemlineatus (một loài gậm nhấm thuộc họ Sóc) sử dụng
công nghệ giải trình tự Roche 454: từ 3.125.337 đoạn trình tự sau khi kết nối thu được
140.703 contig, có 619.767 read không được sử dụng để kết nối (chiếm tỷ lệ khoảng 19,8%).
Kích thước trung bình của contig trong nghiên cứu của Baranski et al. (2014) là 446 bp,
trong đó contig ngắn nhất có kích thước 100 bp. Kết quả này cho thấy có sự phù hợp nhất
định so với kết quả nghiên cứu của luận án với dải phân bố kích thước của contig sau khi
chọn lọc là từ 70 bp đến > 450 bp.
Về sự phân bố contig theo kích thước: các contig có độ dài trong khoảng 70 150 bp chiếm
tỷ lệ cao nhất; thấp nhất là các contig kích thước > 450. Kết quả này được lý giải là do chất
lượng giải trình tự của thiết bị Illumina NextSeq500 tạo ra các đoạn đọc (reads) kích thước
ngắn (tương ứng với các phân đoạn DNA được cắt ngẫu nhiên thành rất nhiều đoạn nhỏ);
chất lượng đọc không đồng đều ở tất cả các vị trí gắn DNA trên giếng gắn mẫu (Flow cell).
Do đó khi kết nối để tạo contig với độ sâu bao phủ đáp ứng cho kết nối chính xác nhằm hạn
chế sai số do lỗi kết nối thì số lượng các contig thu được có kích thước ngắn chiếm tỷ lệ lớn.
Trong nghiên cứu của Baranski et al. (2014) cũng cho thấy kích thước trung bình của các read
trước khi xử lý là 73 bp, sau khi xử lý còn lại 67 b Theo nhận định của Nguyễn Minh Thành et
al. (2015), tiêu chí số lượng lớn contig không phải là tiêu chí tối ưu để lựa chọn phần mềm
kết nối phù hợp. Trong khi đó, tiêu chí chiều dài trung bình của các contig là một trong những
tiêu chí chuẩn cho việc đánh giá và lựa chọn phần mềm kết nối (Liu et al., 2013; Nguyễn
Minh Thành et al., 2015).
Cho đến nay, các nghiên cứu về tôm sú nói chung và genome tôm sú nói riêng trên thế giới
phần lớn tập trung vào các lĩnh vực nghiên cứu đa hình di truyền, xây dựng các nhóm gen liên
kết, chọn giống, bệnh học tôm, nghiên cứu hệ gen phiên mã...; rất ít các công bố về genome
và thiết lập hệ gen tôm sú giả định. Một số công bố về gen chủ yếu là nghiên cứu gen chức
năng ở tôm sú và các đối tượng tôm khác như: gen CHH ở tôm tôm càng xanh Macrobrachium
rosenbergii (Nguyễn Minh Thành et al., 2011), gen kinase 1 ở Penaeus monodon (Qiu et al.,
2018), các gen liên quan đến bệnh tôm... Do đó, việc giải trình tự được một phần genome tôm
sú và thiết lập được trình tự genome tôm sú giả định trong nghiên cứu này sẽ là cơ sở khoa
học hữu ích cho các nghiên cứu tiếp theo.
4.4.2. Sàng lọc SNP và chú giải gen chức năng
Tổng số SNP xác định được trong nghiên cứu này nhiều hơn so với một số nghiên cứu của
các tác giả khác trên các đối tượng tôm như nghiên cứu của Kumar (2014) trên tôm sú P.
monodon (422 SNP), nghiên cứu của Du et al. (2010) trên tôm thẻ chân trắng Litopenaeus
vannamei (1344 SNP); tuy nhiên ít hơn so với nghiên cứu của Nguyễn Minh Thành et al. (2015)
trên đối tượng cá tra (21.302 SNP). Trong nghiên cứu của Baranski et al. (2014) trên tôm sú P.
monodon Ấn Độ sử dụng công nghệ giải trình tự Illumina RNAseq: 473.620 SNP giả định đã
được xác định. Sự khác nhau đáng kể về số lượng SNP sàng lọc được ở các nghiên cứu khác
nhau trên các đối tượng tôm khác nhau do nhiều nguyên nhân gây nên. Tuy nhiên nếu loại trừ