Tải bản đầy đủ (.pdf) (31 trang)

Tóm tắt Luận án tiến sĩ Sinh học: Nghiên cứu đa hình hệ gen các dòng tôm sú (Penaeus monodon) Việt Nam nhằm phục vụ công tác chọn giống tôm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (857.8 KB, 31 trang )

VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

VIỆN CÔNG NGHỆ SINH HỌC
­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

NGUYỄN THỊ MINH THANH

NGHIÊN CỨU ĐA HÌNH HỆ GEN CÁC DÒNG 
TÔM SÚ (Penaeus monodon) VIỆT NAM NHẰM PHỤC 
VỤ CÔNG TÁC CHỌN GIỐNG TÔM

Chuyên ngành: Di truyền học
Mã số: 9 42 01 21

TÓM TẮT LUẬN ÁN TIẾN SỸ SINH HỌC


Hà Nội ­ 2019


Luận án được hoàn thành tại: 
Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Người hướng dẫn khoa học: 

1. PGS.TS. ĐINH DUY KHÁNG
Viện Công nghệ sinh học
2. PGS.TS. NGUYỄN HỮU NINH
Viện Nghiên cứu Nuôi trồng thủy sản III


Phản biện 1:
Phản biện 2:
Phản biện 3:

Luận án được bảo vệ tại Hội đồng đánh giá luận án Phiên chính thức họp tại 
Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam, 
18 Hoàng Quốc Việt, Cầu Giấy, Hà Nội.
Vào hồi  …giờ …, ngày  …   tháng   …  năm 2019

Có thể tìm đọc Luận án tại:
­ Thư viện Quốc Gia Việt Nam
­ Trang web của Bộ Giáo dục và đào tạo (http:luanvan.moet.gov.vn)
­ Viện Công nghệ sinh học.


1

MỞ ĐẦU
1. Tính cấp thiết của Đề tài
Tôm sú Penaeus monodon Fabricius (1798) là loài thủy sản nuôi kinh tế quan trọng ở nhiều 
quốc gia trên thế  giới.  Ở  Việt Nam, tôm sú là một trong những đối tượng nuôi chủ  lực cho 
xuất khẩu thủy sản. Nền tảng cho chiến lược phát triển bền vững ngành công nghiệp nuôi 
tôm sú là chú trọng phát triển nguồn tôm bản địa với các chương trình nhân giống khoa học để 
nâng cao tỷ lệ sống và sự tăng trưởng. Để đạt được mục tiêu này, nghiên cứu cấu trúc và chức 
năng của hệ  gen tôm sú là vấn đề  khoa học cơ  bản có định hướng  ứng dụng hết sức quan  
trọng.
Hiện nay, các nghiên cứu về di truyền phân tử trên đối tượng tôm sú vẫn còn ít ỏi và chưa 
tương xứng với vai trò của một đối tượng nuôi kinh tế quan trọng. Thông tin về các locus tính 
trạng định lượng (QTLs) liên quan đến tính trạng tăng trưởng hầu như rất hiếm. Vì vậy, việc 
nghiên cứu đa dạng di truyền và xác định mối tương quan giữa các SNP (đa hình nucleotide 

đơn) ­ loại biến dị phổ biến nhất trong hệ gen ­ với tính trạng tăng trưởng ở tôm sú để tạo cơ 
sở dữ liệu cho các nghiên cứu về chọn giống dựa trên chỉ thị phân tử (CTPT) là hướng nghiên 
cứu quan trọng đối với ngành công nghiệp nuôi tôm sú.  
Trong khuôn khổ Đề tài “Lập bản đồ bộ gen tôm sú (Penaeus monodon)”  thuộc Nhiệm vụ 
đánh giá di truyền nguồn gen cấp Nhà nước, chúng tôi đã thực hiện đề  tài “Nghiên cứu đa  
hình hệ  gen các dòng tôm sú (Penaeus monodon) Việt Nam nhằm phục vụ công tác chọn  
giống tôm”.    
2. Mục tiêu nghiên cứu 
Đánh giá đa hình hệ gen các quần đàn tôm sú thu từ các vùng biển  Việt Nam; Sàng lọc các 
đa hình nucleotide đơn (SNPs) có tiềm năng liên kết với tính trạng tăng trưởng bằng cách áp 
dụng công nghệ  giải trình tự  gen thế  hệ  mới (phương pháp GBS)  trên hai nhóm tôm sú tăng 
trưởng nhanh và tăng trưởng chậm.
3. Đối tượng nghiên cứu 
Tôm sú Penaeus monodon Fabricius (1798).
4. Các nội dung nghiên cứu
(1) Đánh giá đa hình hệ  gen ba quần đàn tôm sú thu từ  các vùng biển khác nhau của Việt 
Nam bằng kỹ thuật AFLP;
(2) Lai hỗn hợp 4 dòng tôm sú bố mẹ khác nhau về nguồn gốc địa lý để tạo vật liệu nghiên 
cứu thế hệ Go và G1;
(3) Áp dụng kỹ thuật xác định kiểu gen bằng phương pháp giải trình tự (GBS) để phân tích 
hệ gen tôm sú thuộc hai nhóm tăng trưởng nhanh và tăng trưởng chậm thế hệ Go và G1 nhằm 
sàng lọc các đa hình nucleotide đơn (SNP) liên quan đến tính trạng tăng trưởng;           
(4) Sàng lọc chỉ thị SNP G>A ở tôm sú tăng trưởng nhanh bằng kỹ thuật PCR đặc hiệu alen 
cạnh tranh (KASP) để đánh giá tiềm năng ứng dụng của SNP này đối với việc đánh giá nhanh 
chóng và chính xác các cá thể tôm nhằm hỗ trợ trong công tác chọn giống tôm sú.
5. Những đóng góp mới của Luận án về mặt khoa học và thực tiễn


2
(1) Luận án là nghiên cứu đầu tiên đưa ra đánh giá về  đa dạng di truyền của ba quần đàn 

tôm sú tự nhiên từ các vùng biển Việt Nam bằng kỹ thuật AFLP.
(2) Sàng lọc được bộ chỉ thị SNP ở nhóm tôm sú tăng trưởng nhanh làm cơ sở cho việc tìm 
kiếm chỉ thị SNP liên kết với tính trạng tăng trưởng  nhanh ở tôm sú. Hai chỉ thị SNP được xác 
định trong nghiên cứu của luận án là phát hiện đầu tiên về chỉ thị SNP nằm trong exon của gen  
MHC  ở  họ  giáp xác. Những kết quả  này cung cấp dẫn liệu khoa học hữu ích cho việc  ứng 
dụng chỉ thị phân tử trong chọn giống tôm sú.
6. Bố cục của Luận án
Luận án gồm tổng cộng 194 trang cả bìa, trong đó: Mở đầu 4 trang; Chương 1 ­ Tổng quan  
tài liệu 34 trang; Chương 2 ­ Vật liệu và Phương pháp nghiên cứu 22 trang; Chương 3 ­ Kết  
quả  nghiên cứu 38 trang; Chương 4 ­ Bàn luận kết quả  25 trang; Kết luận và Kiến nghị  2  
trang; Danh mục các công trình công bố 2 trang; Tóm tắt kết quả nghiên cứu bằng tiếng Anh 7 
trang; Tài liệu tham khảo 28 trang; Phụ lục 17 trang;  Trong Luận án có 24 bảng và 23 hình.
Chương 1. TỔNG QUAN TÀI LIỆU
1.1. Khái quát về tôm sú Penaeus monodon và tình hình nuôi tôm sú trên thế giới 
Tôm sú Penaeus monodon thuộc họ  Penaeidae, bộ  Decapoda, lớp Malacostraca, ngành phụ 
Crustatacea, ngành Arthropoda. 
Với những tiến bộ về kỹ thuật nuôi và công nghệ chế biến thức ăn thủy sản thì  ngành công 
nghiệp nuôi tôm sú  đã nhanh chóng lan rộng khắp Châu Á, Châu Mỹ  trong những thập niên 
cuối thế kỷ 20. Tuy nhiên trong những năm sau đó, dịch bệnh gia tăng trong các quần đàn tôm 
tự nhiên khiến chất lượng giống liên tục sụt giảm đã dẫn đến sự thay thế dần tôm sú bởi tôm 
thẻ chân trắng (Litopenaeus vannamei) sạch bệnh có nguồn gốc Nam Mỹ. Việc các nước Châu 
Á dần từ bỏ đối tượng bản địa quan trọng này chủ yếu là do chưa gia hoá và kiểm soát được 
dịch bệnh nên không đảm bảo chất lượng tốt của con  giống. Việt Nam nằm trong nhóm gồm 
các quốc gia sản xuất tôm sú hàng hoá lớn nhất thế  giới.  Khác với các nước Châu Á láng 
giềng (chủ yếu nuôi tôm thẻ chân trắng), Việt Nam hiện là một trong số ít các nước vẫn đang 
sản xuất tôm sú cỡ to, chất lượng cao và chiếm phần lớn sản lượng tôm nuôi. Tuy nhiên nghề 
nuôi tôm sú ở Việt Nam hiện nay cơ bản vẫn dựa vào nguồn tôm giống đánh bắt từ  tự nhiên 
và các thành tựu gia hóa dựa trên phương pháp chọn giống truyền thống. Do đó, nghề nuôi tôm  
sú vẫn đối mặt với không ít thách thức, trong đó có vấn đề  về  chủ  động nguồn tôm giống  
đảm bảo chất lượng.

Nhìn chung, xu thế  ở các quốc gia trên thế giới trong sản xuất tôm giống là từng bước gia  
hóa đàn tôm, tiến hành các giải pháp công nghệ  để  khép kín vòng đời, chọn giống  tôm sạch 
bệnh, tạo ra các dòng mới chất lượng cao và tăng trưởng tốt. Những nỗ lực trong vấn đề gia 
hoá  (tạo tôm bố  mẹ)  và  nâng cao chất lượng di truyền  (nghiên cứu đa dạng di truyền, tìm 
kiếm các CTPT liên kết với các tính trạng tăng trưởng nhanh, chống chịu bệnh tốt, sức sinh  
sản cao…) được coi là những vấn đề then chốt. 
1.2. Kỹ  thuật phân tích chỉ  thị  DNA và  ứng dụng trong nghiên cứu đa hình hệ  gen và 
trong chọn giống tôm sú  
Các CTPT được sử dụng rộng rãi như những công cụ  chọn lọc đắc lực đối với các tính 
trạng quan tâm trong các chương trình chọn giống  ở nhiều loài vật nuôi, cây trồng và các loài 


3
thủy sản. Việc ứng dụng các CTPT giúp cho các nhà chọn giống nhận diện chính xác các gen 
quan tâm nhằm rút ngắn thời gian chọn giống. Hiệu quả cải tiến giống sẽ gia tăng gấp nhiều  
lần so với các phương pháp chọn giống cổ điển nhờ thực hiện việc chọn lọc không cần trực 
tiếp trên tính trạng mong muốn mà thông qua CTPT liên kết với tính trạng đó.  Các CTPT là 
công cụ hữu hiệu để đánh giá sự đa dạng di truyền, xây dựng bản đồ  di truyền  và  ứng dụng 
trong nghiên cứu cải tạo, chọn giống tôm chất lượng tốt, sạch bệnh như: RAPD (Garcia &  
Benzie, 1995), RFLP (Benzie et al., 1993, Klinbunga et al., 1999), xác định các chỉ thị RAPD ở 
quần đàn tôm sú kháng bệnh đốm trắng (Dutta  et al.,  2013), phát triển chỉ  thị  microsatellite 
trong chọn tôm sú bố  mẹ  (Jerry  et al., 2006),  kỹ  thuật microsatellite nghiên cứu đa hình di 
truyền trên đối tượng tôm sú (Saeid et al., 2011, Nguyễn Thị Thảo et al., 2004; Rumisha et al., 
2017; Staelens et al., 2018…), sử dụng kỹ thuật AFLP để lập bản đồ di truyền trên đối tượng 
tôm Trung Quốc (Zhaoxia et al., 2006, You et al., 2010), đa hình SNP tại thụ thể vitellogenin 
(PmVtgr) gắn liền với các kiểu hình liên quan đến sinh sản (chỉ  số  gonadosomatic và trọng 
lượng buồng trứng) của tôm sú P. monodon đã được phát hiện (Klinbunga et al., 2015), biểu 
hiện của protein gắn kết X­box 1 (PmXbp1) trong quá trình phát triển buồng trứng ở tôm sú bố 
mẹ P. monodon hoang dã và sự liên kết giữa SNP với các tham số liên quan đến tăng trưởng đã  
được phát hiện (Prasertlux et al., 2015)…

Kỹ  thuật AFLP được sử  dụng để  phân tích đa hình DNA bằng cách nhận biết đồng thời  
nhiều phân đoạn DNA sau khi cắt bởi enzyme và khuếch đại chọn lọc. Đây là công cụ hiệu 
quả  để  nhận biết các locus đa hình mà không cần biết trước thông tin về  trình tự  DNA của 
chúng (Richard et al., 1998). Phương pháp này có thể   ước lượng nhanh sự đa dạng di truyền 
trong và giữa các quần thể với nhau (Watson và Barker, 2004). AFLP được sử dụng cho nhiều 
mục đích như: nghiên cứu biến dị di truyền (Mueller và Wolfenbarger, 1999); đánh giá đa dạng 
di truyền các quần đàn ở các đối tượng khác nhau như cá trê (Liu  et al., 1998), cá thơm (Seki et  
al., 1999), cá chép (Wang et al., 2000); lập bản đồ  di truyền (Zhaoxia et al., 2006, You et al., 
2010; Staelens et al., 2018); xác định quan hệ giữa các giống ( Jacobs et al., 2008); xây dựng các 
nhóm liên kết chéo; các nghiên cứu về đa dạng di truyền và phát sinh loài phân tử ( Wang et al., 
2004)… 
SNP là một trong những CTPT hiệu quả được  ứng dụng trong chọn giống. Các vị  trí SNP  
trong hệ  gen là nơi mà  ở  đó chuỗi DNA được phân biệt bởi một base duy nhất khi hai hoặc  
nhiều cá thể được so sánh. Sự khác nhau về nucleotide này có thể dẫn đến thay đổi tính trạng 
và được sử dụng để đánh giá đa dạng trong tiến hóa. SNP có số lượng lớn, ổn định , thích hợp 
cho việc tự động hóa trong phân tích và chỉ  ra được các đa hình có thể  không phát hiện được  
bởi các phương pháp khác (Vaseeharan et al., 2013; Liu and Cordes, 2004). SNP có thể  xuất 
hiện ở các vùng mã hóa và không mã hóa trong hệ gen của sinh vật, tác động trực tiếp đến tính  
trạng quan tâm, rất hiệu quả trong việc xác định tương quan giữa SNP và tính trạng (Beuzen  et 
al., 2000). SNP đã được sử dụng để sàng lọc các gen tiềm năng liên quan đến tính trạng tăng  
trưởng của một số đối tượng thuỷ  sản: cá hồi Salvelinus alpinus (Tao và Boulding, 2003), cá 
chẽm (Xu et al., 2006), tôm thẻ chân trắng Litopenaeus vannamei và tôm sú P. monodon (Glenn 
et al., 2005)...
1.3. Kỹ thuật GBS và ứng dụng trong chọn giống


4
GBS (Genotyping By Sequencing: Kỹ thuật xác định kiểu gen bằng phương pháp giải trình 
tự) là một ứng dụng mới của kỹ thuật NGS  (Next Generation Sequencing: công nghệ giải trình 
tự thế hệ mới) để phát hiện SNP. Những cải tiến không ngừng của các hóa chất giải trình tự 

và các công cụ phần mềm cho phép các kỹ thuật NGS cung cấp những thông lượng lớn về dữ 
liệu giải trình tự  trong mỗi lần thực hiện, nhờ  đó giảm giá thành, khiến cho GBS trở  thành 
giải pháp thay thế  có tính cạnh tranh so với các phương pháp phân tích gen khác. NGS cho  
phép tạo ra các bản đồ  SNP mật độ  cao được dự  đoán sẽ  là hướng  ứng dụng rộng rãi trong 
nhiều chương trình chọn giống. Các nhà chọn giống có thể giải trình tự các bộ gen lớn và xây  
dựng các bản đồ liên kết mật độ cao từ các quần thể chọn giống. Các ứng dụng trong tương  
lai của GBS đối với việc cải thiện giống cây trồng, vật nuôi có thể  cho phép các nhà chọn  
giống kiểm soát được các chương trình MAS (chọn giống dựa trên CTPT) hay GS (chọn lọc 
hệ  gen) trên phôi mầm hay loài mới mà không cần phát triển các công cụ  phân tử  trước đó.  
Khi việc phân tích gen dựa trên việc giải trình tự có thể  thực hiện được đối với toàn bộ  các  
lĩnh vực nghiên cứu về  hệ  gen thì GBS sẽ  trở  thành nhân tố  chính trong di truyền và chọn 
giống (He et al., 2014).          
1.4. Phương pháp PCR đặc hiệu alen cạnh tranh (KASP)
KASP là một dạng biến đổi của kỹ  thuật PCR để  phân tích hệ  gen dựa trên   sự  kéo dài 
chuỗi oligo đặc hiệu alen và sự  chuyển năng lượng cộng hưởng huỳnh quang để  tạo ra tín  
hiệu (Kumpatla et al., 2012; He et al., 2014). Công nghệ này có nhiều ứng dụng trong phân tích 
kiểm soát chất lượng hệ gen, lập bản đồ QTL, chọn giống dựa trên CTPT (MAS)...
Chương 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Vật liệu
* Các mẫu tôm sú sử dụng cho nghiên cứu đa hình AFLP do Viện Nghiên cứu NTTS I cung 
cấp. Mẫu được thu từ 3 quần đàn tự nhiên khác nhau: Quần đàn Bắc Trung Bộ (kí hiệu: BTB) 
thu mẫu tại vùng biển tỉnh Nghệ An,  Quần đàn Nam Trung Bộ (NTB) thu mẫu tại vùng biển  
tỉnh Khánh Hòa và Quần đàn Nam Bộ  (NB) thu mẫu tại vùng biển tỉnh Bạc Liêu. M ỗi quần 
đàn thu trên 50 mẫu.
* Các mẫu tôm sú sử dụng cho nghiên cứu sàng lọc SNP do Viện Nghiên cứu NTTS II cung 
cấp: Vật liệu gốc bao gồm 4 dòng tôm sú bố  mẹ  có nguồn gốc địa lý khác nhau, trong đó 3  
dòng có nguồn gốc tự  nhiên là tôm sú  Ấn Độ  Dương (kí hiệu: A) ­ Nhập từ  Thái Lan (vùng 
biển Amanda) và từ Myanmar, tôm sú Thái Bình Dương (T) ­ Nhập từ Singapore, tôm tự nhiên 
của Việt Nam (thu thập từ Cà Mau, Đà Nẵng, Phú Yên) ­ gọi chung là tôm nội địa (N) và dòng 
tôm Gia hóa (G)  được  cung cấp bởi Công ty Moana Ninh Thuận ­ Đây là  dòng tôm  được 

thương mại hóa dùng làm tôm bố  mẹ  sản xuất tôm giống phục vụ  cho nuôi thương phẩm.  
Tôm sú thế hệ Go và G1 được tạo ra từ các đàn tôm bố mẹ này bằng cách lai hỗn hợp giữa bốn  
dòng tôm bố mẹ. 
Từ các cá thể trong đàn con của các gia đình tôm sú thế hệ G o và G1, chọn ra các cá thể (bao 
gồm cả  tôm cái ­  ♀  và tôm đực ­  ♂) thuộc hai nhóm khác nhau theo tiêu chí mức độ  tăng  
trưởng: tăng trưởng nhanh (F) và tăng trưởng chậm (S) để  sử  dụng cho nghiên cứu sàng lọc  
SNP. 40 mẫu tôm sú cái lớn nhanh thế hệ G1 được chọn để thực hiện kỹ thuật KASP.


5
*   Các   hóa   chất   và   kit   tinh   sạch   được   sử   dụng   của   các   hãng:  Sigma   Aldrich,  Qiagen, 
Invitrogen, Life Technologies, Fermentas, Promega; Các hóa chất thông dụng khác trong phòng 
thí nghiệm đạt độ tinh khiết cần thiết cho các nghiên cứu.
* Các thiết bị sử dụng trong nghiên cứu thuộc Phòng Vi sinh vật học phân tử  và Phòng thí  
nghiệm trọng điểm Công nghệ  gen, Viện Công nghệ  sinh học, Viện hàn lâm Khoa học và 
Công nghệ Việt Nam.
2.2. Các phương pháp nghiên cứu chính 
2.2.1. Thu mẫu tôm sú 
­  Thu mẫu tôm sú tự nhiên phục vụ nghiên cứu đa hình hệ  gen: các mẫu tôm sú được thu  
gom bằng cách đặt hàng cho người dân đánh bắt bằng lưới ở ngoài biển xa bờ. 
­ Thu mẫu tôm sú tự nhiên làm tôm giống bố mẹ, sàng lọc mầm bệnh và chăm sóc tôm bố 
mẹ: Các quy trình thu mẫu tôm sú bố mẹ, sàng lọc mầm bệnh và chăm sóc tôm bố  mẹ được 
thực hiện tại Trung tâm Quốc gia Giống hải sản Nam Bộ ­ Viện NCNTTS II. 
2.2.2. Thiết lập các gia đình tôm sú tạo thế hệ Go, G1 
Các phương pháp: lai hỗn hợp giữa các dòng tôm sú bố  mẹ, ghép phối, sinh sản nhân tạo, 
ương nuôi, đánh dấu huỳnh quang và truy xuất nguồn gốc tôm sú… được thực hiện theo quy 
trình sản xuất giống đã được nghiên cứu và thực hiện thành công nhiều năm tại Trung tâm  
Quốc gia Giống hải sản Nam Bộ, thuộc Viện Nghiên cứu nuôi trồng thủy sản II. 
2.2.3. Tách chiết, tinh sạch, xác định nồng độ và độ tinh sạch của DNA tổng số từ mô cơ tôm  


­ DNA tổng số từ mô cơ tôm sú được tách chiết theo quy trình của Eurobiobank (2004).
­  DNA tổng số được tinh sạch bằng Kit PureLinkTM Genomic DNA (Life Technologies).
­ Nồng độ  và độ  tinh sạch của DN A  được xác định  bằng  máy quang phổ  NanoDrop® 
Spectrophotometer  ở   bước   sóng   λ   =   260   nm   và   λ   =   280   nm   (Thermo  Fisher  Scientific  ­ 
NanoDrop Products, www.nanodrop.com).
2.2.4. Kỹ thuật AFLP đánh giá đa hình hệ gen
­ Kỹ thuật AFLP được thực hiện theo quy trình của hãng Applied BioSystems.
­ Phân tích kết quả AFLP trên máy xác định trình tự tự động ABI3100 ( Invitrogen) sử dụng 
điện di mao quản và phần mềm phân tích đoạn GeneMapper® Software Version 4.1 AFLP® 
System Analysis (Invitrogen) để đánh giá tính đa hình di truyền hệ gen tôm sú;
­ Xây dựng cây phát sinh chủng loại giữa các quần đàn tôm sú Việt Nam bằng phần mềm  
MEGA (Kumar et al., 2001).  
2.2.5. Kỹ  thuật GBS phân tích hệ  gen tôm sú,  sàng lọc  SNP liên kết với tính trạng tăng  
trưởng
Xây dựng thư  viện GBS  và giải trình tự  DNA:  Kỹ  thuật  GBS  được thực hiện theo các 
bước như mô tả trong công bố của Elshire et al. (2011). Enzyme cắt hạn chế được sử dụng là 
ApeKI (New England Biolabs). DNA tổng số  sau khi được cắt và gắn với adaptor được tinh 
sạch bằng QIAquick PCR Purification Kit (Qiagen). Các đoạn DNA tinh sạch từ các mẫu được 
trộn lại với nhau với tỷ  lệ  tương đương. Khoảng 100 ng sản phẩm DNA trộn từ  các mẫu 
được sử  dụng làm khuôn để  tạo thư  viện cho NGS với cặp mồi primer1 và primer2 bắt cặp  
bổ sung với barcode adaptor và common adaptor: 


6
Primer1:(5’­3’)AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT
Primer2:(5’­3’) 
CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT

Sản phẩm PCR có kích thước 300­500 bp được thu nhận bằng phương pháp cắt gel và tinh 
sạch bằng QIAquick PCR Purification Kit. Kích thước và độ  sạch của thư  viện DNA sau đó 

được đánh giá trên Bioanalyzer 2100 (Agilent Technology). Thư  viện DNA được làm giàu và 
xác   định   trình   tự   cả   hai   chiều   (pair­end)   trên   hệ   thống   Illumina  NextSeq®500,   sử   dụng 
NextSeq 500/550 High Output v2 kit (300 cycles).
Xử lý dữ liệu GBS, lắp ráp hệ gen tham chiếu tạm thời và xác định SNP:
Dữ liệu GBS được xử lý và phân tích để  phát hiện SNP dựa theo phương pháp GBS­SNP­
CROP (GBS SNP­Calling Reference Optional Pipeline) được mô tả bởi Melo et al. (2016). Dữ 
liệu thô được chuyển thành định dạng fastq bằng công cụ BCL2FASTQ 2.1. Chất lượng trình 
tự được đánh giá bằng FastQC. Trình tự adaptor được loại bỏ bằng phần mềm Trimmomatic  
software v.0.3.6 (Bolger et al., 2014). Trình tự của từng mẫu được tách ra trên cơ sở nhận biết 
trình tự barcode sử dụng công cụ In­house script do nhóm nghiên cứu tự phát triển. Do hệ gen 
tôm sú chưa được công bố trình tự  tham chiếu nên chúng tôi đã sử  dụng các mẫu lắp ráp de  
novo để tạo trình tự tham chiếu tạm thời theo phương pháp được mô tả bởi Melo  et al. (2016), 
sử  dụng các công cụ  PEAR v.0.96 và USEARCH v.8.0.162 (Zhang  et al., 2014; Edgar, 2010). 
Trình tự của các mẫu tôm sú được so sánh với trình tự tham chiếu bằng BWA­MEM v.0.7 (Li  
et al., 2009a). Dữ  liệu SNP được truy xuất bằng công cụ  SAMtools v.1.2 (Li   et al., 2009b). 
SNP được xác định khi gióng hàng các contig và sự sai khác nucleotide được phát hiện trên ít 
nhất bốn trình tự. Chỉ các SNP hai allen đáp ứng mức độ l ặp lại như trên mới được xác định là 
SNP (Melo et al., 2016; Nguyễn Minh Thành et al., 2015; Kumar, 2014). 
Chú giải các đoạn trình tự và xác định gen liên quan:
Công cụ BlastX (E­value< 1e­6) được sử dụng để so sánh sự tương đồng giữa các contig với 
cơ  sở  dữ  liệu NCBI non­redundant (Nr­NCBI) (  tìm 
kiếm được truy xuất dưới dạng danh sách các gen chức năng với các thông tin về  geneID, 
protein được mã hóa và tên loài tương ứng. Danh sách này được sử dụng để  xác định gen mã 
hóa protein liên quan đến tăng trưởng ở tôm sú bằng cách đối chiếu với 22 loại protein đã biết  
liên quan đến tăng trưởng trong họ giáp xác trong công bố của Jung et al. (2013). 
Xác định trình tự amino acid của contig và đánh giá mức độ tương đồng với gen mã hóa 
protein quan tâm:
Công cụ Expasy () được sử dụng để xác định trình tự amino acid tương 
ứng với trình tự  nucleotide của contig quan tâm bằng cách kiểm tra toàn bộ  6 khung đọc mở 
5’3’Frame 1 (+1), 5’3’ Frame 2 (+2), 5’3’ Frame 3 (+3), 3’5’ Frame 1 (­1) , 3’5’ Frame 2 (­2), 

3’5’ Frame 3 (­3). Sáu khung đọc mở này tạo ra 6 kiểu trình tự  amino acid khác nhau đối với 
mỗi contig, tiếp tục sử dụng công cụ Uniprot () để chọn ra kiểu trình tự 
amino acid có tỷ lệ tương đồng cao nhất so với trình tự amino acid của protein quan tâm. 
2.2.6. Phương pháp PCR đặc hiệu alen cạnh tranh (KASP)
Phương pháp KASP sử dụng bộ kit của Hãng LGC Genomics. Các bước tiến hành theo quy 
trình của Hãng  (  SNP liên quan  đến  tính trạng tăng trưởng 
nhanh ở tôm sú thuộc gen mã hóa Myosin heavy chain type 1 được sử dụng để kiểm tra trên 40 


7
cá thể tôm sú tăng trưởng nhanh thuộc thế hệ G1 bằng kỹ thuật KASP. Các mồi xuôi và mồi 
ngược được thiết kế đặc hiệu với trình tự  DNA chứa SNP này. Nồng độ  DNA mỗi mẫu sử 
dụng là 50ng. Thí nghiệm bố  trí 2 ống đối chứng âm để  so sánh  (ở  ống đối chứng âm, DNA 
template được thay thế bằng nước).
Trình tự mồi xuôi allele kiểu dại (gắm HEX­tail): 
5’­GAAGGTCGGAGTCAACGGATTGAGCAGAGCTCCTTCGGCC­3’
Trình tự mồi xuôi allele kiểu đột biến (gắn FAM­tail): 
5′­GAAGGTGACCAAGTTCATGCTCGCACGCATCTTGGTCTTCTCC­3’
Trình tự mồi ngược: 5’­CGCACGCATCTTGGTCTTCTCC­3’
Chương 3. KẾT QUẢ NGHIÊN CỨU
3.1. Đa hình AFLP ở các quần đàn tôm sú Việt Nam 
Kết quả phân tích AFLP sử  dụng cặp mồi chọn lọc  MseI­CTT/EcoRI­ACC JOE cho thấy 
với các mẫu tôm sú thu thập từ  3 quần đàn tự  nhiên của Việt Nam, có 309 alen được phát  
hiện. 
Số  lượng alen  ở  các quần đàn là khác nhau và không có sự  trùng nhau về  vị  trí xuất hiện 
của các alen: Quần đàn BTB có số  lượng alen dao động từ  32 đến 76, Quần đàn NTB là 29  
đến 64 và Quần đàn NB là 38 đến 77. 
Trong phạm vi mỗi quần đàn, quân đan NTB co 4 alen trung nhau gi
̀ ̀
́

̀
ưa cac ca thê cung quân
̃ ́ ́ ̉ ̀
̀ 
đan, 
̀ ở quân đan NB có 8 alen trùng nhau, đ
̀ ̀
ặc biệt không phat hiên th
́ ̣
ấy bất kỳ alen trùng nhau 
nào giưa cac ca thê trong quân đan BTB ­ cho th
̃ ́ ́ ̉
̀ ̀
ấy tính đa dạng di truyền rất cao giữa các cá  
thể ngay trong quần đàn này. Không phát hiện thấy alen nào chung cho cả 3 quân đan. 
̀ ̀
Quan hệ phát sinh chủng loại giữa các quần đàn tôm sú Việt Nam: Cây phát sinh chủng loại 
giữa các cá thể thuộc ba quần đàn tôm sú BTB, NTB và NB cho thấy mối liên hệ họ hàng giữa 
các cá thể. Về cơ bản cây được chia làm 3 nhánh, mỗi nhánh tương ứng với các cá thể thuộc  
cùng một vùng (một quần đàn) được xếp vào cùng một nhánh. Tuy nhiên, có một vài cá thể 
của một trong 3 quần đàn này được xếp về nhánh của quần đàn khác (BTB7 và BTB16 thuộc  
cùng nhánh của quần đàn Nam Trung Bộ, NTB2 và NTB3 thuộc cùng nhánh của quần đàn Bắc 
Trung Bộ. Kết quả này có thể được lý giải do quá trình di cư của tôm sú đến vùng biển khác 
theo các dòng hải lưu để tìm kiếm nguồn thức ăn và môi trường mới thích hợp với giai đoạn 
sinh trưởng của chúng. 
B

A

C


Hình  3.1.  Cây  phát  sinh 
chủng loại các quần đàn tôm 
sú  thu  từ  ba  vùng  biển  Việt 
Nam:  A­  Nhánh  Bắc  Trung 
Bộ  (BTB),  B­  Nhánh  Nam 
Trung  Bộ  (NTB),  C­  Nhánh 
Nam Bộ (NB)  (Vòng tròn màu 
đỏ  biểu  thị  các  cá  thể  tôm  sú 
của một trong ba quần đàn này 
xuất hiện trên nhánh của quần 


8

3.2. Sản xuất tôm sú thế hệ Go, G1 
3.2.1. Sàng lọc nguồn tôm bố mẹ đầu vào
Từ các cá thể tôm bố mẹ thuộc 4 dòng tôm sú có nguồn gốc địa lý khác nhau (vật liệu gốc),  
tổng cộng có 460 tôm cái và 376 tôm đực được sử  dụng làm vật liệu đầu vào để  tiến hành 
sàng lọc. Kết quả  (Bảng 3.1) cho thấy số tôm được giữ  lại sau sàng lọc bệnh nghiêm ngặt 
tương đối thấp: chỉ có 48,0% tôm cái và 54,5% tôm đực được giữ lại. Trong đó, tỷ lệ  giữ lại  
thấp nhất là tôm dòng Nội địa, chỉ đạt 21,6% đối với tôm cái và 39,8% đối với tôm đực. Các 
dòng tôm tự nhiên nhập ngoại có tỷ lệ sạch bệnh và được giữ lại sau sàng lọc khá hơn như ở 
tôm cái dòng Ấn Độ Dương là 51,3% và ở tôm cái dòng Thái Bình Dương là 80,2%. Tỷ lệ tôm  
đầu vào sạch bệnh và được giữ lại cao nhất là tôm Gia hóa: 100% đối với cả tôm đực và tôm  
cái.    
Về khối lượng thân trung bình, nhìn chung các dòng tôm có nguồn gốc nhập ngoại có khối 
lượng lớn hơn so với tôm Việt Nam: nhóm tôm Nội địa và nhóm tôm Gia hóa có khối lượng 
trung bình lần lượt là 165,7g và 160,8g, thấp hơn so với nhóm tôm Ấn Độ Dương (222,2g) và 
nhóm tôm Thái Bình Dương (220,0g).

Bảng 3.1. Kết quả sàng lọc tôm sú bố mẹ đầu vào
Dòng tôm
Ấn Độ Dương (A)
Thái Bình Dương (T)
Nội địa (N)
Gia hóa (G)
Tổng

Số lượng thu 
thập
Cái
Đực
76
71
86
58
236
186
62
61
460
376

Số tôm sạch 
bệnh
Cái
Đực
39
34
69

36
51
74
62
61
221
205

% sạch bệnh
Cái
51,3
80,2
21,6
100
48,0

Đực
47,9
62,1
39,8
100
54,5

Khối lượng 
(g/con)
TB ± SD
222,2 ± 25,4 
220,0 ± 23,1 
165,7 ± 19
160,8 ± 10,4


3.2.2. Thiết lập các gia đình tôm sú thế hệ Go, G1 
Từ 16 phép lai tổ hợp toàn phần 4 dòng tôm sú khác nhau đã tạo ra được các gia đình thế 
hệ Go. Kết quả có 69 gia đình Go được thả nuôi thành công. Số lượng gia đình Go được ương 
nuôi thành công đến kích cỡ  đánh dấu, thả  nuôi chung của từng phép lai được   trình bày  ở 
Bảng 3.2.  
Bảng 3.2. Số lượng gia đình tôm sú thế hệ Go thả nuôi thành công từ 16 phép lai 
Phép lai
Tôm
cái

Dòng tôm
A
G
N

A
6
2
4

Tôm đực
G
N
5
5
2
2
6
6


T
5
3
5

Tổng cộng
21
9
21


9
T
Tổng cộng

4
16

4
17

4
17

18
69

6
19


Kết quả ở Bảng 3.2 cho thấy: có sự khác nhau khá rõ về tỷ lệ thả nuôi thành công giữa các  
gia đình Go khác nhau về nguồn gốc tôm bố  và tôm mẹ, đặc biệt là khác nhau về  nguồn gốc 
tôm mẹ, cụ  thể: Các phép lai giữa tôm mẹ  nguồn gốc Nội địa với 4 dòng tôm bố  khác nhau  
đều cho tỷ lệ thả nuôi thành công của các gia đình ở mức cao (tổng cộng là 21 gia đình) ; Tôm 
mẹ  nguồn gốc A cũng cho tỷ lệ các gia đình thả  nuôi thành công khá cao (21 gia đình); Tôm 
mẹ nguồn gốc T cho tỷ lệ các gia đình thả nuôi thành công thấp hơn (18 gia đình);  Trong khi 
đó, các phép lai có tôm mẹ nguồn gốc G cho tỷ lệ các gia đình thả nuôi thành công thấp nhất  
(chỉ có 9 gia đình).
Kết quả  trên đây cho thấy: tôm mẹ  thuộc các dòng khác nhau sau khi được cấy tinh nhân  
tạo và thả nuôi để chuẩn bị cho sinh sản tạo thế hệ Go đã có sự khác nhau rõ rệt về khả năng 
sống. 
Xét về ảnh hưởng của nguồn gốc tôm bố đối với tỷ lệ thả nuôi thành công của các gia đình  
thế hệ Go thì không thấy sự khác biệt lớn: Số lượng các gia đình khác nhau về nguồn gốc tôm 
bố (A, G, N, T) lần lượt là 16, 17, 17 và 19 gia đình.
Tỷ lệ góp vật liệu di truyền theo dòng của 4 dòng tôm sú ở thế hệ Go và số lượng cá thể 
tôm đực và tôm cái (tôm bố mẹ) của từng dòng tham gia sinh sản để tạo thế hệ G o được trình 
bày ở Bảng 3.3. Tổng số có 108 cá thể tôm bố mẹ (bao gồm 55 tôm cái và 53 tôm đực) được  
chọn từ 4 dòng tôm (vật liệu ban đầu) để tạo thế hệ Go. 
Bảng 3.3. Tỷ lệ góp vật liệu di truyền theo dòng ở thế hệ Go
Dòng tôm
Giới tính
Số lượng 
(con)
Tỷ lệ (%)*
Tổng 

A
Cái


Đực

19

10

G
Cái Đực
6

16

(34,5) (18,9) (10,9) (30,2)
29 (26,9%)
22 (20,4%)

N

T

Cái

Đực

Cái

Đực

17


14

13

13

(30,9) (26,4) (23,7) (24,5)
31 (28,7%)
26 (24,1%)

(Ghi chú * : Các con số tỷ lệ % trong ngoặc được tính theo tôm cái riêng và tôm đực riêng, tổng là 100%  
đối với mỗi nhóm tôm đực ­ cái).

Kết quả ở Bảng 3.3 cho thấy: 
+ Trong 69 gia đình được nuôi thành công, có sự  cân bằng tương đối về  tỷ  lệ  tôm bố  mẹ 
tham gia tạo vật liệu cho thế hệ G o, cụ  thể: Dòng tôm sú A chiếm tỷ  lệ  26,9% với tổng số 
29/108 cá thể, trong đó có 19 cá thể tôm đực và 10 cá thể tôm cái; Dòng tôm sú G chiếm tỷ lệ 
20,4% với tổng số 22/108 cá thể, trong đó có 6 cá thể tôm đực và 16 cá thể tôm cái; Dòng tôm 
sú N chiếm tỷ lệ 28,7% với tổng số 31/108 cá thể, trong đó có 17 cá thể tôm đực và 14 cá thể 
tôm cái; Dòng tôm sú T chiếm tỷ lệ 24,1% với tổng số 26/108 cá thể, trong đó có 13 cá thể tôm 
đực và 13 cá thể  tôm cái. Như  vậy, tỷ  lệ  góp vật liệu di truyền của dòng tôm Nội địa (N) là 
cao nhất (28,7%) và thấp nhất là nhóm tôm Gia hóa (20,4%).


10
+ Xét trong cùng một dòng: có sự chênh lệch lớn về tỷ lệ góp  vật liệu di truyền giữa tôm 
cái (tôm mẹ) và tôm đực (tôm bố) trong cùng một dòng tôm  ở  nhóm tôm  Ấn Độ  Dương (19 
tôm cái, 10 tôm đực) và nhóm tôm Gia hóa (6 tôm cái, 16 tôm đực); Ở hai nhóm còn lại là Nội  
địa và Thái Bình Dương, tỷ  lệ  tôm đực và tôm cái tham gia sinh sản tạo thế hệ G o là tương 
đương nhau (lần lượt là 17 tôm cái và 14 tôm đực ở dòng N; 13 tôm cái và 13 tôm đực ở dòng  

T). Sự chênh lệch cũng thể hiện rõ ở tỷ lệ đóng góp tôm mẹ (nhóm Ấn Độ Dương là 34,5% so  
với nhóm Gia hóa là 10,9%) và tôm bố (nhóm Ấn Độ Dương là 18,9% so với nhóm Gia hóa là  
30,2%) giữa bốn nhóm vật liệu ban đầu.       
Tôm bố mẹ Go được ghép cặp để sản xuất các gia đình G1 cùng cha mẹ (full­sibs family) 
và các cặp gia đình cùng cha khác mẹ (half­sibs group). Tổng cộng có 246 cá thể tôm thế hệ G o 
(bao gồm 112 tôm cái và 134 tôm đực) thuộc 69 gia đình Go được sử dụng làm tôm bố mẹ để 
sản xuất thế hệ G1. Kết quả đã tạo được 76 gia đình thế hệ G 1. Số lượng các nhóm gia đình 
và số lượng cá thể tương ứng được trình bày ở Bảng 3.4. 
Bảng 3.4. Số lượng các nhóm gia đình tôm sú thế hệ G1
Kiểu gia 
đình

Cùng cha 
khác mẹ

Cùng cha mẹ
Tổng

Tôm 
bố

Tôm 
mẹ

15

50

26


26

Số  Tôm bố 
lượng 
x tôm 
tôm con
mẹ

5.155

2.257
7.412

Số lượng 
Số  Tổn
nhóm gia 
lượng 
g
đình cùng  gia đình 
cha khác 
cùng 
mẹ cha mẹ

1 x 2

6

12

1 x 3

1 x 4
1 x 5
1 x 7

3
3
2
1

9
12
10
7

50

26
76

Kết quả   ở Bảng 3.4 cho thấy: Trong tổng số 76 gia đình của thế  hệ  G 1 có 15 nhóm gia 
đình cùng cha khác mẹ (bao gồm 50 gia đình, chiếm tỷ lệ 65,8%) và 26 gia đình cùng cha mẹ 
(không có nhóm cùng cha khác mẹ tương ứng), chiếm tỷ lệ 34,2%. Tổng số cá thể tôm sú thế 
hệ  G1 thu được là 7.412, trong đó có 5.155 cá thể  (chiếm tỷ  lệ  69,5%) thuộc nhóm gia đình  
cùng cha khác mẹ và 2.257 cá thể (chiếm tỷ lệ 30,5%) thuộc nhóm gia đình cùng cha mẹ. 
Tôm sú thế  hệ  Go, G1  ở  các giai đoạn khác nhau (từ   ấu trùng đến giai đoạn thành thục) 
được ương nuôi trong điều kiện kiểm soát nghiêm ngặt về các thông số môi trường sống. Tất  
cả  mẫu của các gia đình lai đều được sàng lọc mầm bệnh và đều cho kết quả  âm tính với 
mầm bệnh virus. Các quần đàn tôm lai thế hệ Go và thế hệ G1 sẽ là nguồn vật liệu được sử 
dụng cho các nghiên cứu tiếp theo nhằm sàng lọc các chỉ  thị  phân tử (SNP) liên kết với tính 
trạng tăng trưởng. 



11

Số lượng contig

3.3. Sàng lọc đa hình nucleotide đơn (SNP) liên quan đến tính trạng tăng trưởng ở tôm sú 
3.3.1. Giải trình tự, kết nối các đoạn  
trình   tự   và   thiết   lập   hệ   gen  tham  
chiếu tạm thời  
Giải trình tự  hệ  gen tôm sú thuộc 
hai   nhóm   tôm   tăng   trưởng   nhanh   và 
tôm tăng trưởng chậm trên hệ  thống 
Illumina  NextSeq®500  thu   được 
145.836.644   đoạn   trình   tự  thô  (raw 
read);   trong   số   đó   có   120.438.739 
(83%) đoạn trình tự  mang barcode và 
điểm cắt của ApeKI. Sau khi tinh sạch 
thu   được   102.505.713   (70,2%)   đoạn 
trình tự  có chất lượng tốt để  sử  dụng 
Phân bố độ dài contig
cho việc kết nối contig và thiết lập hệ 
gen  tham   chiếu   tạm   thời,   với   dung  Hình 3.2. Phân bố độ dài các contig sau tinh sạch
lượng   dữ   liệu   ~100  GB.  Từ  Các  contig  có  kích  thước  70  ­  150  bp  chiếm  số  lượng 
102.505.713 đoạn trình tự  sau khi kết  nhiều nhất  (211.389),   ít nhất  là  các contig  có kích thước 
>450 bp, loại bỏ các contig kích thước ngắn < 70bp.
nối   thu   được   510.076   contig   với   sự 
phân bố  kích thước các contig  được thể  hiện  ở  Hình 3.2.  Các contig có chiều dài 70­150bp 
chiếm số lượng lớn nhất (211.389), tiếp đến là các contig có chiều dài 150 ­ 300 bp và ít nhất  
là các contig có chiều dài 450 ­ 547 bp. Các contig kích thước ngắn dưới 70 bp bị loại bỏ.

Hệ gen tham chiếu tạm thời của tôm sú có kích thước 76.299.742 bp (được thiết lập từ dữ 
liệu giải trình tự các đoạn DNA có chất lượng tốt nhất), được sử dụng để sàng lọc SNP. 
Bảng 3.5. Tóm tắt kết quả xử lý dữ liệu giải trình tự GBS
Chỉ số phân tích
Độ sâu giải trình tự
Dung lượng dữ liệu (GB)
Số lượng đoạn trình tự thô (raw reads)
Số   lượng   đoạn   trình   tự   (read)  sử   dụng   kết   nối 
contig
Tổng số contig
Kích thước hệ gen tham chiếu tạm thời (bp)
3.3.2. Sàng lọc SNP 

Tổng   cộng   có   2887   SNP   đã   được   phát   hiện, 
trong đó có 1799 SNP chỉ  xuất hiện  ở  nhóm tôm  
lớn nhanh, 587 SNP chỉ xuất hiện  ở nhóm tôm lớn 
chậm và 501 SNP xuất hiện  ở cả  hai nhóm (Hình 
3.3). 

Giá trị
50x
100
145.836.644
102.505.713
510.076
76.229.742
A

C


B

Hình  3.3.  Số  lượng  SNP  ở  hai  nhóm 
tôm tăng trưởng nhanh và tăng trưởng 
chậm
A­  Số  lượng  SNP  ở  nhóm  tôm  sú  lớn  nhanh 
(1799),  B­  Số  lượng  SNP  ở  nhóm  tôm  sú  lớn 


12

C­ Số lượng SNP ở cả hai nhóm (501).

3.3.3.  Chú giải  gen chức năng từ  dữ  liệu  
giải trình tự tôm sú
Từ  dữ  liệu giải trình tự  và dữ  liệu sàng  
lọc SNP, chỉ  những đoạn trình tự  chứa SNP 
được sử  dụng để  chú giải nhằm tìm kiếm 
sự   tương   đồng   với   các   trình   tự   gen   chức 
năng được lưu trữ ở GenBank (NCBI). Toàn 
bộ  2887 đoạn trình tự  chứa SNP  ở  cả  hai 
nhóm tôm sú Lớn nhanh và Lớn chậm được 
chú   giải.  Kết   quả   có   510   (17,67%)   contig  Hình 3.4. Kết quả chú giải gen chức năng
chứa SNP có trình tự  nucleotide tương đồng  Có  2377  contig  chứa  SNP  không  cho  kết  quả  chú 
với các trình tự  trên cơ  sở  dữ  liệu nr­NCBI  giải,
510 contig chứa SNP cho kết quả chú giải, trong đó: 
(với tham số E­value < 1e­6); trong đó có 287 
287 contig chứa SNP  ở nhóm tôm sú  lớn nhanh, 126 
(56,27   %)   trình   tự   contig   chứa   SNP   thuộc   contig  chứa  SNP  ở  nhóm  tôm  sú  lớn  chậm  và  97 
nhóm tôm sú Lớn nhanh, 126 (24,71 %) trình  contig chứa SNP ở cả hai nhóm.

tự  contig chứa SNP thuộc nhóm tôm sú Lớn chậm và 97 (19,02 %) trình tự  contig chứa SNP  
thuộc cả hai nhóm. Một lượng lớn (85,33%) contig của nghiên cứu này không cho kết quả chú  
giải gen chức năng (Hình 3.4). 
Bảng 3.6. Kết quả chú giải các gen liên quan tính trạng tăng trưởng ở tôm sú
Loài 
tương 
ứng

gi|
343183153|
dbj|
BAK61429.
1|

Myosin 
heavy 
chain 

Marsupen
aeus 
japonicus

CAAGGTCGTCGATCTTCAGCT
TCCATTCAGAGATGATCTTAT
CGAAGTTCTTCTGTTTCTTCTC
AGCGGAGTTGGCCAGAGTCT
GTGCACGTTCAGCA

gi|
410509306|

dbj|
BAM65719
.1|

Myosin 
heavy 
chain 

Penaeus  
monodon

CTCGTCTCGAGGAAGCCGAA
ATGCAGATTGAGTCTCTCAAT
GTTAAGAACTTGCATTTGGAG
AAGACCAAGATGCGTGCG

Gen bank 
ID

Contig83953
(98 bp)

Cluster26034
7
(80 bp)

Trình tự nucleotide

Protein 
tương 

ứng

Contig được 
chú giải

type a

type 1

(đối với contig83953 là trình
 tự bổ sung)

Từ  kết quả  BlastX, chúng tôi thu được danh sách chú giải gồm các protein đã biết chức  
năng hoặc các protein dự  đoán cùng với tên loài tương  ứng. Với mục tiêu nghiên cứu là tìm  
kiếm và xác định sự liên quan giữa các gen mã hóa các protein có liên quan đến tăng trưởng ở 
tôm sú với các SNP đã sàng lọc được, chúng tôi đã đối chiếu lần lượt 22 protein liên quan đến  


13
tính trạng tăng trưởng trong họ giáp xác (Jung et al., 2013) với các protein đã chú giải được để 
rà soát và tìm ra loại protein tương  ứng với trình tự  contig chứa SNP của hai nhóm tôm sú  
nghiên cứu. Kết quả đã xác định được hai contig (contig83953  dài 98 bp và contig260347 dài 
80 bp)  ở  nhóm tôm sú tăng trưởng nhanh có trình tự  amino acid tương  ứng tương đồng với  
trình tự  amino acid của protein Myosin Heavy Chain (MHC).   Trong đó, contig83953 tương 
đồng với MHC type a (MHCa) và contig260347 tương đồng với MHC type 1 (MHC1). Trong 
nghiên này, chúng tôi không tìm thấy contig nào của nhóm tôm sú Lớn chậm có sự tương đồng  
với 22 protein liên quan đến tính trạng tăng trưởng trong họ  giáp xác đã được công bố  bởi  
nhóm tác giả Jung et al. (2013). 
Trình tự nucleotide của contig83953 và contig260347 được trình bày ở Bảng 3.6.  
3.3.4. Xác định chỉ thị SNP và tương quan giữa các contig chứa SNP với gen MHC 


Từ  các  kết quả  sàng lọc SNP và kết quả  chú giải protein liên quan đến tính trạng tăng  
trưởng  ở  tôm sú  (chỉ  các contig chứa SNP được chọn để  chú giải gen chức năng, sau đó so 
sánh trình tự của contig chứa SNP với trình tự của gen chức năng tương ứng để xác định loại 
nucleotide thay thế), chúng tôi đã xác định được vị  trí  SNP trên contig83953 và contig260347 
như sau (Bảng 3.6): SNP T C tại vị trí nucleotide thứ 20 trên mạch bổ sung với contig83953,  
tức là SNP A G trên mạch gốc contig83953 và SNP G  A tại vị trí nucleotide thứ  19 trên 
contig260347. 
Bảng 3.7. Kết quả xác định SNP trên contig83953 và contig260347
Tên Contig
Contig83953

Contig260347

Nucleotide 
tham 
chiếu

Ghi chú

C

T

Trình tự bổ sung

G

A


Trình tự mạch gốc

A

G

Mạch gốc

Ký pháp HGVS của SNP  Nucleotide 
tương ứng
thay thế
Contig83953:g.20T>C

Contig260347:g.19G>A

Để xác định tương quan giữa các contig83953 và contig260347 chứa SNP với gen mã hóa 
protein MHC liên quan đến tăng trưởng  ở tôm sú, chúng tôi đã tiến hành dịch mã các trình tự 
nucleotide của contig83953 và contig260347 thành các chuỗi amino acid tương  ứng, sau đó so 
sánh với trình tự  amino acid của gen mã hóa protein MHC. Kết quả dịch mã được trình bày ở 
Bảng 3.8. 
Bảng 3.8. Trình tự amino acid tương ứng của contig83953 và contig260347
Tên contig

Trình tự amino acid tương ứng
()

Tổng số 
amino acid 
của chuỗi


Contig83953

AERAQTLANSAEKKQKNFDKIISEWKLKIDDL

32

Contig260347

RLEEAEMetQIESLNVKNLHLEKTKMetRA

30

   

Để  kiểm tra sự  chính xác của các trình tự   amino acid, chúng tôi đã tiến hành Blast (Basic 
Local Alignment Search Tool) bằng công cụ  Uniprot () với cả  hai loại 


14
dữ liệu đầu vào là trình tự  amino acid và trình tự nucleotide của contig83953 và contig260347. 
Kết quả thu được từ hai loại dữ liệu đầu vào hoàn toàn trùng khớp nhau về tỷ lệ tương đồng 
giữa chuỗi amino acid của  contig83953 và contig260347 so với protein MHC  ở  các loài khác 
nhau (Bảng 3.9 và Bảng 3.10). 
Kết quả   ở  Bảng 3.9  cho thấy: trình tự  amino acid  tương  ứng của  contig83953  đạt tỷ  lệ 
tương   đồng   cao   nhất   (90,6%)   với   trình   tự  amino   acid  của   protein   MHCa  ở   loài   tôm  P. 
japonicus, tỷ lệ tương đồng với MHC1  ở hai loài tôm khác là P. monodon và L. vannamei cũng 
tương đối cao (đều đạt 87,5%). Kết quả ở Bảng 3.10 cho thấy: trình tự amino acid tương ứng 
của contig260347 đạt tỷ  lệ  tương đồng cao nhất (96,2%) với trình tự  amino acid của protein 
MHC ở cả ba loài tôm P.monodon, P. japonicus và L. vannamei.  
Bảng 3.9. Các tỷ lệ tương đồng cao nhất giữa contig83953 với protein MHC

STT

GenBank 
ID

1

F8WR03

2

K4Q111

3

K4Q4N8

4

Q6XGZ8

5

B0W188

Protein MHC
(loài tương ứng)
Myosin heavy chain type a 
(Penaeus japonicus)
Myosin heavy chain type 1

(Litopenaeus vannamei)
Myosin heavy chain type 1
(Penaeus monodon)
Slow muscle myosin S1 heavy 
chain (Homarus americanus)
Myosin heavy chain 
(Culex quinquefasciatus)

Tỷ lệ tương 
đồng (%)

Vị trí amino acid 
trên protein MHC

90,6%

1431­1462

87,5%

1431­1462

87,5%

1432­1463

83,9%

30­60


80,6%

1399­1429

Bảng 3.10. Các tỷ lệ tương đồng cao nhất giữa contig260347 với protein MHC
STT

GeneBank 
ID

1

K4Q4N8

2

F8WR03

3

K4Q111

4

K4Q2Y1

5

K4Q2S1


Protein MHC
(loài tương ứng)
Myosin heavy chain type 1
(Penaeus monodon)
Myosin heavy chain type a
(Penaeus japonicus)
Myosin heavy chain type 1
(Litopenaeus vannamei)
Myosin heavy chain type 2
(Penaeus monodon)
Myosin heavy chain type 2
(Litopenaeus vannamei)

Tỷ lệ tương  Vị trí amino acid 
đồng (%)
trên protein MHC
96,2

1396­1425

96,2

1395­1420

96,2

1395­1420

76,0


1396­1418

76,0

1396­1418

3.3.5. Xác định vùng tương đồng giữa contig chứa SNP so với gen mã hóa protein MHC,  
xác định codon chứa SNP và vị trí tương ứng của chỉ thị SNP trên gen MHC
Bằng   cách  so   sánh   các   chuỗi   trình   tự   (nucleotide,   amino   acid)   của   contig83953   và  
contig260347 với trình tự của gen MHCa và MHC1 để  xác định vùng tương đồng giữa chúng, 
chúng tôi đã xác định được vị  trí phân vùng chức năng trên gen  MHCa và MHC1 phù hợp với 


15
trình tự các contig83953 và contig260347 chứa SNP, đồng thời xác định chính xác codon chứa  
SNP cũng như sự biến đổi của amino acid có thể xảy ra do sự xuất hiện SNP (Hình 3.5, Hình 
3.6, Hình 3.7, Hình 3.8).
Kết quả ở Hình 3.5 và Hình 3.6 cho thấy: vùng tương đồng về   amino acid của contig83953 
ở  tôm sú  P.  Monodon  trong nghiên cứu này  so với protein MHCa   ở  tôm he  Nhật bản   P.  
Japonicus nằm trong khoảng vị trí amino acid 1431 ­ 1462; vị trí nucleotide tương đồng từ 4408 
­ 4505. Vùng tương đồng này thuộc phân vùng chức năng LMM (light meromyosin) trên phân 
tử protein myosin. 
Kết quả ở Hình 3.7 và Hình 3.8 cho thấy: vùng tương đồng về amino acid của contig260347 
ở  tôm sú P. monodon trong nghiên cứu này so với protein MHC 1  ở  tôm sú trên genBank nằm  
trong khoảng vị trí amino acid 1396 ­ 1422; vị trí nucleotide tương đồng từ 4302 ­ 4379. Vùng  
tương đồng này cũng thuộc phân vùng chức năng LMM (light meromyosin) trên phân tử protein 
myosin.
Các kết quả  chỉ  ra trên Hình 3.5, Hình 3.6, Hình 3.7, Hình 3.8 cho thấy rõ các codon chứa 
các SNP. Cụ thể như sau: 
SNP   T    C  tại   vị   trí   nucleotide   thứ   20   trên   mạch   bổ   sung   với   contig83953 

[Contig83953:g.20T>C], tức là SNP A  G trên mạch gốc contig83953 được xác định là 
vị  trí SNP A4486G trên gen MHCa (Hình 3.5). SNP này là nucleotide thứ 3 trong bộ ba 
Contig 83953
(codon) mã hóa amino acid, làm bi
ến đổi codon AAA thành AAG. Cả hai codon này đều 
mã hóa  amino acid  Lysine (K)  với  vị  trí  amino acid  tương  ứng  trên protein MHCa  là 
K1456K (Hình 3.6). Nói cách khác, SNP này không làm thay đổi amino acid tương ứng. 
SNP G
   A  tại vị  trí nucleotide  thứ  19 trên contig260347  [Contig260347:g.19G>A] 
Contig 83953
được xác định là vị  trí SNP G4320A trên gen MHC1 (Hình 3.7). SNP này là nucleotide 
thứ  2 trong bộ  ba mã hóa amino acid, làm biến đổi codon  GGA  (mã hóa amino acid 
Glycine ­ G) thành GAA (mã hóa amino acid Glutamic ­ E). Vị trí amino acid tương ứng 
Contig 83953
trên protein MHC
1 là G1401E (Hình 3.8). 
Như vHình 3.5. Vùng t
ậy, với việc sươ
ử d
ụng hệ gen tham chiếu  tạm thời của tôm sú P. monodon được thiết 
ng đồng nucleotide giữa mạch bổ sung của contig83953 của tôm sú P. 
lập de novo đ
ể sàng l
ọc SNP, nghiên c
ứu của chúng tôi đã xác đ
ịnh đ
ược hai SNP ở nhóm tôm 
monodon so v
ới trình t
ự gen MHCa ở tôm he Nh

ật Bản P. japonicus (v
ị trí nucleotide 4408 ­ 4505)
sú tăng trưởng nhanh. Hai SNP này nằm trong phân vùng chức năng LMM của gen MHC liên 
quan đến tính trạng tăng trưởng.
S2
LMM

Contig 83953

Contig 83953

Contig 83953

Hình 3.6.  Ánh xạ trình tự amin oacid thể hiện vùng tương đồng giữa contig83953 của tôm 
sú P. monodon với protein MHCa ở tôm he Nhật Bản P. japonicus (vị trí amino acid 1431 ­ 
1462)


16

  
Contig260347

Contig260347

Hình 3.7. Vùng tương đồng nucleotide giữa contig260347 so với trình tự gen 
MHC1 ở tôm sú P. monodon (vị trí nucleotide 4302 ­ 4379)
S2

LMM


Contig260347

Contig260347

Hình 3.8.  Ánh xạ trình tự acid amin thể hiện vùng tương đồng giữa 
contig260347 với MHC1 ở tôm sú P. monodon (vị trí acid amin 1396 ­ 1422)

3.4. Sàng lọc chỉ thị SNP G>A ở tôm sú tăng trưởng nhanh bằng phương pháp KASP
Kết quả kiểm tra trên 40 mẫu tôm sú cái tăng trưởng nhanh thế hệ G 1 (Hình 3.9) cho thấy: 
hầu hết mẫu tôm sú tăng trưởng nhanh (28/40 mẫu) chứa SNP dạng đồng hợp tử  A:A (màu  
xanh dương);  chỉ  có 2/40 mẫu chứa SNP dạng đồng hợp tử  G:G (màu đỏ); còn lại là 10/40  
mẫu chứa SNP dạng dị hợp tử G:A (màu xanh lá cây). 
Kết quả  này cho thấy: việc sử  dụng các mồi xuôi và mồi ngược được thiết kế  đặc hiệu 
với trình tự DNA chứa SNP G>A, trong đó trình tự mồi xuôi đặc hiệu với alen kiểu dại được 
gắn HEX­tail (màu đỏ) và trình tự  mồi xuôi đặc hiệu với alen đột biến được gắn FAM­tail  
(màu xanh dương) đã phát hiện thấy đột biến G4320A thuộc gen MHC1  có mặt ở 38 trong số 
40 mẫu tôm sú được kiểm tra (chiếm 95%). Trong số 38 cá thể tôm sú mang đột biến G4320A, 
có 28 cá thể  mang kiểu gen đồng hợp tử  (tương  ứng với 28 tín hiệu huỳnh quang màu xanh 
dương) và có 10 cá thể mang kiểu gen dị hợp tử (tương  ứng với 10 tín hiệu huỳnh quang màu 
xanh lá cây).


17

Hình 3.9. Kết quả phân tích tín hiệu huỳnh quang 
trong kỹ thuật KASP sàng lọc chỉ thị SNP G>A 

thuộc gen MHC1 ở tôm sú tăng trưởng nhanh
Các chấm màu xanh dương thể hiện các mẫu tôm sú tăng 

trưởng nhanh có đồng hợp tử A:A (28/40 mẫu);
Các  chấm  màu  đỏ  thể  hiện  các  mẫu  tôm  tăng  trưởng 
nhanh có đồng hợp tử G:G 2/40 mẫu;
Các  chấm    màu  xanh  lá  cây  thể  hiện  các  mẫu  tôm  tăng 
trưởng nhanh có dị hợp tử G:A 10/40 mẫu.

Các chấm màu đen là tín hiệu huỳnh quang bị nhiễu;
Các  mẫu  đối  chứng  không  có  tín  hiệu  huỳnh  quang 
(không xuất hiện trên hình).

Chương 4. BÀN LUẬN KẾT QUẢ
4.1. Đa hình AFLP ở các quần đàn tôm sú 
Kết quả phân tích đa hình AFLP sử dụng cặp mồi chọn lọc MseI­CTT/EcoRI­ACC JOE đối 
với các mẫu tôm sú thuộc ba quần đàn BTB, NTB và NB với số lượng alen ở các quần đàn là  
khác nhau, không có sự  trùng nhau hoàn toàn về  vị  trí xuất hiện của các alen  đã  cho thấy 
genome của các mẫu tôm sú có cấu trúc khác nhau, tức là có sự đa hình về mặt di truyền giữa  
các cá thể. 
Khi so sánh chi tiết vị trí các alen của các mẫu tôm sú giữa các quần đàn với nhau cho thấy:  
không những các alen  ở  các mẫu là không trùng nhau hoàn toàn khi so sánh hai mẫu bất kỳ 
thuộc cùng một quần đàn hay thuộc hai quần đàn khác nhau, mà ở mỗi quần đàn đều có những  
alen đặc trưng cho quần đàn đó, tức là chỉ xuất hiện ở một hoặc một vài cá thể của một quần  
đàn mà không thấy có  ở  các quần đàn khác. Trong đó: Quần đàn BTB có số  lượng  alen đặc  
trưng quần đàn nhiều hơn hẳn so với quần đàn NTB và NB.
Trong phạm vi từng quần đàn, khi so sánh sự đa hình AFLP giữa các cá thể thuộc cùng một 
quần đàn cho thấy: trong khi  ở quân đan NTB co 4 alen trung nhau, 
̀ ̀
́
̀
ở quân đan NB có 8 alen
̀ ̀

 
trùng nhau thì điểm đặc biệt của quần đàn Bắc Trung Bộ  là không có bất kì alen nào trùng 
nhau. Điều này cho thấy tính đa dạng di truyền   rất  cao của các cá thể  trong quần đàn này.  
Phân tich sâu h
́
ơn chung tôi nh
́
ận thây, gi
́ ữa 3 quân đan nay không co alen nao trùng nhau.
̀ ̀ ̀
́
̀
Từ những nhận định trên đây có thể kết luận:  các mẫu tôm sú nghiên cứu thuộc 3 quần đàn  
khác nhau thể  hiện tính đa hình di truyền rõ rệt. Mỗi cá thể  đều là khác biệt hay nói cách  
khác chúng có kiểu gene khác nhau. Sự  đa hình này không chỉ  thể  hiện giữa các cá thể bên 
trong mỗi quần đàn mà còn là sự đa hình giữa các quần đàn tôm sú thuộc các khu vực phân bố  
khác nhau về mặt địa lý. Trong số 3 quần đàn tôm sú nghiên cứu, quần đàn BTB thể hiện tính  
đa hình di truyền (đa hình AFLP) cao nhất và thấp nhất là quần đàn NB. 


18
Các nhận định này cũng phù hợp với kết quả nghiên cứu của Nguyễn Thị Thảo  et al. (2004) 
khi nghiên cứu tính đa hình của ba quần đàn tôm sú (gồm 2 quần đàn tôm sú Việt Nam và 1  
quần đàn tôm sú nhập ngoại từ Singapore) bằng phương pháp phân tích microsatellite. Kết quả 
nghiên cứu của nhóm tác giả này cho thấy: ngay trong nội bộ một quần đàn và giữa các quần 
đàn tôm cũng thể hiện tính đa hình di truyền cao ; Ba quần đàn với tổng số 83 cá thể là 83 sự 
khác biệt với 83 kiểu gene khác nhau, có rất ít hoặc không có alen trùng nhau ; Khi phân tích 
cây phát sinh chủng loại thì 2 quần đàn tôm Việt Nam thuộc cùng một nhánh tách biệt hoàn 
toàn với nhánh tôm nhập từ Singapore còn lại; Quần đàn tôm sú ở vùng Phú Yên (thuộc vùng 
Trung Bộ) thể hiện tính đa hình cao hơn so với quần đàn vùng Rạch Gốc (Nam Bộ). 

Trong nghiên cứu của chúng tôi, dòng tôm Nội địa là tôm tự nhiên của Việt Nam được thu 
từ các vùng biển Đà Nẵng, Phú Yên… (vùng biển Nam Trung Bộ). Kết quả đánh giá đa hình di 
truyền AFLP trong nghiên cứu này đã cho thấy quần đàn  ở  vùng này có sự  đa hình di truyền 
khá rõ nét. Nghiên cứu của Nguyễn Thị  Thảo  et al.,  (2004) với chỉ  thị  microsatellite cũng 
khẳng định điều này. Đây là những dẫn liệu quan trọng bước đầu định hướng cho việc lựa 
chọn dòng tôm bố mẹ từ các quần đàn bản địa có tính đa hình di truyền để tạo ưu thế lai trong  
công tác chọn giống tôm sú. Tuy nhiên đây mới chỉ là nhận định bước đầu trong phạm vi kết  
quả nghiên cứu của đề tài này. Để có thể khẳng định được mức độ đa hình di truyền của các 
quần đàn tôm sú tự nhiên Việt Nam thì cần phải tiến hành thêm nhiều nghiên cứu trên nhiều  
quần đàn với số lượng mẫu lớn hơn, đặc biệt cần có các số liệu nghiên cứu về các chỉ số đa 
dạng di truyền của các quần đàn đó.
Một số  kết quả  nghiên cứu của các nhóm tác giả  khác trên các đối tượ ng tôm sú thuộc  
các quần đàn địa lý khác nhau trong khu v ực Đông Nam Á cũng cho thấy những nhận định  
tươ ng tự về tính đa dạng di truyền của các quần đàn tôm. 
Khamnamtong et al. (2009) đã nghiên cứu sự đa hình di truyền và sự khác biệt về địa lý trên  
đối tượng tôm sú thu ở 3 vùng địa lý khác nhau ở Thái Lan. Kết quả nghiên cứu cho thấy có sự 
đa hình di truyền cao trên các đối tượng tôm khảo sát, không có sự tương đồng di truyền mà có  
sự  khác biệt rất lớn trong thông tin di truyền của các cá thể. Sự  đa dạng di truyền trên tôm 
cũng được thể  hiện trong các nghiên cứu sử  dụng kỹ  thuật microsatellite (Supungul  et al., 
2000).
Klinbunga et al. (2001) nghiên cứu tính dị  hợp về  thông tin di truyền trên tôm sú Thái Lan  
bằng kỹ thuật RAPD và phân tích DNA ty thể bằng kỹ thuật RFLP. Kết quả nghiên cứu của  
nhóm này cho thấy sự khác biệt về vật chất di truyền giữa các cá thể thu ở 5 vùng địa lý khác 
nhau. Các cá thể  thuộc cùng một khu vực địa lý cũng ít cho thấy sự  tương đồng, mỗi cá thể 
mang một kiểu gene riêng.
4.2. Quan hệ phát sinh chủng loại giữa các quần đàn tôm sú Việt Nam  
Cây phát sinh chủng loại của các mẫu tôm sú nghiên cứu thuộc 3 quần đàn tự  nhiên vùng 
biển BTB, NTB và NB của Việt Nam phản ánh rõ mối tương quan về  mặt di truyền giữa  
chúng. Nhìn chung, các cá thể  thuộc cùng một quần đàn có mức độ  tương đồng về  mặt di  
truyền (thể hiện ở các nhánh gần nhau trên cây phân loại) cao hơn so với các cá thể thuộc các  

quần đàn khác nhau.
Hiện tượng một số cá thể thuộc quần đàn này lại xuất hiện trên nhánh phân loại của quần  
đàn khác có thể được giải thích bởi các nguyên nhân sau: (1) Do sự di cư của các đàn tôm sú 


19
trong tự nhiên từ  vùng biển này đến vùng biển khác theo các dòng hải lưu để tìm kiếm nguồn 
thức ăn và môi trường mới thích hợp với giai đoạn sinh trưởng của chúng; (2) Do người nuôi 
tôm đánh bắt tôm sú bố mẹ từ tự nhiên đem về để sản xuất tôm giống, bán cho người nuôi ở 
các khu vực khác (Bắc, Trung, Nam), khi nuôi có thể tôm thoát ra ngoài tự nhiên nên có sự pha 
tạp.  
Các kết quả này phù hợp với đặc điểm nuôi trồng thủy sản ở Việt Nam cũng như ở các khu  
vực khác trên thế  giới. Tính chất đa hình về  mặt di truyền giữa các cá thể  trong cùng một  
quần đàn và giữa các quần đàn, cũng như sự pha tạp cá thể giữa các quần đàn tiếp giáp cũng  
phù hợp với nhận định của các tác giả  khác khi nghiên cứu về  đa hình di truyền  ở  các quần  
thể tôm tự nhiên. Mặc dù vị trí địa lý của các quần đàn thu mẫu là khác nhau giữa các nghiên  
cứu nhưng về cơ bản đều cho thấy các quần thể tôm sú ở các vùng phân bố khác nhau có sự 
khác biệt rõ rệt về  mặt di truyền giữa các quần thể  địa lý   (Pan  et al., 2004). Theo đó, tôm 
giống tự nhiên ở những vùng khác nhau cũng sẽ khác nhau về sức sinh sản, tỷ lệ sinh trưởng,  
khả năng chống chịu bệnh và nhiều đặc tính khác (Kim Thị Phương Oanh et al., 2010). 
Mặt khác, tùy thuộc vào phương pháp đánh giá đa hình được sử dụng mà kết quả phân tích  
và mô hình cây phát sinh chủng loại được thể hiện giữa các nghiên cứu cũng khác nhau, thậm 
chí trên cùng một đối tượng nghiên cứu hoặc trên các mẫu nghiên cứu được thu thập từ  các 
quần thể khá tương đồng về mặt địa lý. Trong nghiên cứu của Nguyễn Thị Thảo  et al. (2004), 
phương pháp phân tích microsatellite được sử dụng để đánh giá đa hình ở ba quần đàn tôm sú 
tự nhiên cũng đã cho thấy có rất ít hoặc không có alen trùng nhau. Tuy nhiên mô hình cây phát 
sinh chủng loại biểu thị  2 quần đàn tôm sú Việt Nam (thu thập tại các vùng biển Phú Yên  
(thuộc vùng Trung Bộ) và vùng Rạch Gốc (Nam Bộ) thuộc cùng một nhánh tách biệt hoàn toàn  
với nhánh tôm nhập từ Singapore còn lại.        
Trong nghiên cứu này, cây phát sinh chủng loại được xây dựng bằng các công cụ  phần 

mềm tương thích với dữ liệu đầu vào về phân tích AFLP. Về cơ bản, cây phát sinh chủng loại 
ở Hình 3.3 thể hiện được nội dung kết quả nghiên cứu, phản ánh mức độ  gần gũi về mặt di  
truyền giữa các mẫu tôm sú được thu từ  cùng một quần đàn cũng như  sự  pha tạp giữa các  
quần đàn.
4.3. Tạo vật liệu tôm sú thế hệ G0, G1
Kết quả sàng lọc nguồn tôm bố mẹ đầu vào đối với 4 dòng tôm sú Ấn Độ Dương  (A), Thái 
Bình Dương (T), Nội địa (N) và Gia hóa (G) theo tiêu chí sạch bệnh cho thấy: tỷ lệ sạch bệnh  
cao nhất là tôm G (100%). Kết quả này là phù hợp vì thực tế dòng tôm G là tôm chọn giống 
được thương mại hóa dùng làm tôm bố  mẹ  sản xuất tôm giống phục vụ  cho nuôi thương  
phẩm. Dòng tôm này được nuôi trong điều kiện đảm bảo an toàn sinh học một cách nghiêm 
ngặt. Các dòng tôm tự  nhiên nhập ngoại (A, T) cũng có tỷ  lệ sạch bệnh khá cao. Riêng dòng 
tôm tự nhiên trong nước (N) có tỷ lệ giữ lại sau sàng lọc bệnh thấp nhất.     
Sau khi hoàn thiện việc ghép cặp cho lai hỗn hợp bốn dòng tôm sú có nguồn gốc địa lý khác  
nhau đã tạo ra được các gia đình, bước đầu tạo được nguồn vật liệu đa dạng về mặt di truyền  
cho các nghiên cứu tiếp theo về sàng lọc chỉ  thị  phân tử SNP. Kết quả  ghép phối hỗn hợp 4 
dòng tôm sú có nguồn gốc địa lý khác nhau với 16 phép lai để tạo ra các gia đình cho thấy: tôm  
mẹ thuộc các dòng khác nhau sau khi được cấy tinh và thả nuôi để chuẩn bị cho sinh sản tạo  
thế hệ Go đã có sự khác nhau rõ rệt về khả năng sống. Nói cách khác, các phép lai có sự khác  


20
nhau về  nguồn gốc tôm mẹ  và tôm bố  sẽ  dẫn đến sự  khác nhau về  số  lượng gia đình được 
thả  nuôi thành công. Điều này có thể  được lý giải do sự khác nhau về  sức sống của tôm mẹ 
thuộc các dòng khác nhau. Chẳng hạn: tôm mẹ  N là dòng tôm sú có nguồn gốc bản địa trong 
nước nên có thể  chúng thích nghi tốt hơn với điều kiện môi trường, điều kiện dinh dưỡng,  
chăm sóc quản lý trong thời gian lưu giữ nuôi vỗ  kéo dài để ghép cặp cho sinh sản nhân tạo. 
Do đó, các phép lai giữa tôm mẹ  N với 4 dòng tôm bố khác nhau đều cho tỷ lệ thả nuôi thành 
công của các gia đình ở mức cao (tổng cộng là 21 gia đình). Trong khi đó,  các phép lai có tôm 
mẹ nguồn gốc G cho tỷ lệ các gia đình thả nuôi thành công thấp nhất (9 gia đình). Điều này có  
thể  giải thích là do tôm  gia hóa  ở  các cơ  sở  sản xuất khác nhau được nuôi trong điều kiện 

nhân tạo với các chỉ  tiêu nghiêm ngặt về  điều kiện sống tại cơ  sở sản xuất đó. Do đó dòng  
tôm này có tính thích nghi hẹp. Khi được nuôi trong điều kiện môi trường nhân tạo tại  địa 
điểm khác thì khả năng thích nghi và do đó sức sống của dòng tôm này giảm hẳn, tôm cái  gia 
hóa thành thục sinh dục không tốt nên kết quả tất yếu là tỷ lệ thả nuôi thành công của các gia 
đình có tôm mẹ nguồn gốc gia hóa đạt thấp. Tôm mẹ thuộc hai dòng tôm tự nhiên nhập ngoại  
T và A cho tỷ lệ gia đình nuôi thả thành công khá cao. Những nhận định này rất có ý nghĩa về 
mặt thực tiễn chọn giống trong việc lựa chọn các dòng tôm phục vụ cho mục đích ghép phối  
để sản xuất thành công các thế hệ tôm lai. 
Một kết quả  khác bổ  trợ  cho việc đánh giá các dòng tôm bố  mẹ  có nguồn gốc khác nhau 
dùng làm vật liệu ban đầu đó là đánh giá tỷ lệ góp vật liệu di truyền theo dòng  ở thế hệ Go. 
Kết quả  khi so sánh chung giữa các dòng tôm về  tỷ  lệ  tôm bố  mẹ  tham gia tạo vật liệu cho  
thế  hệ  Go  cho thấy có sự  cân bằng tương đối, nhưng trong đó tỷ  lệ  đóng góp   vật liệu di 
truyền của nhóm tôm Nội địa vẫn cao nhất và thấp nhất là nhóm Gia hóa. Khi so sánh giữa  
tôm đực và tôm cái trong cùng một dòng hoặc so sánh cùng một giới tính giữa các dòng khác  
nhau về tỷ lệ góp vật liệu di truyền tạo thế hệ Go thì có sự chênh lệch, trong đó tôm cái G vẫn 
chiếm tỷ lệ thấp nhất. Điều này góp phần minh chứng thêm vai trò của yếu tố khả năng thích 
nghi trong thực tiễn chọn giống.             
Những nhận định trên đây có ý nghĩa khoa học và thực tiễn vì tôm sú N là tôm tự nhiên của 
Việt Nam được thu từ các vùng biển Đà Nẵng, Phú Yên… (vùng biển Nam Trung Bộ). Đây là  
nguồn tôm có thể cung cấp chủ động trong nước. Kết quả đánh giá đa hình di truyền AFLP đã 
cho thấy quần đàn tôm sú ở vùng này có sự đa hình di truyền rõ nét. Nghiên cứu của Nguyễn  
Thị Thảo et al. (2004) với chỉ thị microsatellite cũng khẳng định điều này. Kết quả nghiên cứu 
này là dẫn liệu quan trọng bước đầu định hướng cho việc lựa chọn dòng tôm bố  mẹ  từ  các 
quần đàn bản địa có tính đa hình di truyền cao. Đây sẽ là nguồn vật liệu đáng quan tâm trong 
các chương trình chọn giống tôm sú vì có tiềm năng hội tụ  được cả   ưu điểm về  khả  năng 
thích nghi tốt với điều kiện sống bản địa và tính đa dạng di truyền, cho phép khai thác hiệu 
quả ưu thế lai.    
4.4. Ứng dụng kỹ thuật GBS để sàng lọc các đa hình nucleotide đơn (SNP) liên quan đến 
tính trạng tăng trưởng ở tôm sú 
4.4.1. Đánh giá thư viện, giải trình tự, kết nối các đoạn trình tự và thiết lập hệ gen  tham  

chiếu tạm thời  
Công nghệ  giải trình tự  gen thế  hệ  mới có thể  phân tích được hàng triệu đoạn trình tự 
(read) với giá thành thấp nhưng hạn chế  đi kèm là kích thước các đoạn trình tự  thường rất  


21
ngắn (DW & Mockler, 2012). Vì vậy, các thuật toán lắp ráp đối với các loài không có hệ gen  
tham chiếu đã được phát triển để lắp ráp và phân tích cơ sở dữ liệu được tạo ra từ các thiết bị 
giải trình tự gen thế hệ mới. Hiện nay chưa có phương pháp chuẩn và phổ  biến để  đánh giá  
chất lượng các phần mềm lắp ráp (Nguyễn Giang Thu  et al., 2015; Narzisi & Mishra, 2011). 
Lựa chọn phần mềm kết nối phù hợp cho kết quả  kết nối tin cậy là điểm then chốt trong  
phân tích hệ  gen của các loài chưa có hệ  gen tham chiếu. Phần mềm kết nối tối  ưu là phần  
mềm sử  dụng gần như  hoàn toàn các đoạn trình tự  để  kết nối thành các contig (Zhou et al., 
2012; Nguyễn Minh Thành  et al., 2015).  Trong khi một số  phần mềm như  CLC Genomic  
Workbench v.6.0.4 (Nguyễn Minh Thành et al., 2015), Velvet/Oases (Robertson et al., 2010) hay 
Trinity (Grabherr et al., 2011) phù hợp cho kết nối các đoạn trình tự  được giải mã từ  thiết bị 
Ion Torrent thì phần mềm PEAR được sử dụng trong nghiên cứu này đã được đánh giá là công 
cụ  mới có khả  năng kết nối với độ  chính xác cao các dữ  liệu được giải trình tự  từ  thiết bị 
Illumina (Zhang et al., 2014). 
Đối với công nghệ  giải trình tự  của Illumina, kích thước các đoạn đọc trình tự  phù hợp 
thường có độ dài < 150 bp (nếu đọc hai chiều, paired­end) hoặc < 300 bp (nếu đọc một chiều,  
single­end). Vì hệ gen được cắt ngẫu nhiên nên trong nghiên cứu này, thư viện giải trình tự có  
kích thước trung bình 208 bp được xem là phù hợp để  giải trình tự  hai chiều trên thiết bị 
Illumina NextSeq500. Kích thước này ngắn hơn so với kích thước trung bình của thư  viện 
trong nghiên cứu của Hampton et al. (2011) (trung bình là 335 bp) khi sử dụng thiết bị Genome 
Analyzer FLX   để  đánh giá thư  viện và công nghệ  giải trình tự  Roche  GS GLX Titanium 
Sequencing với PicoTiterPlate Kits.     
Tôm sú Penaeus monodon có 44 nhiễm sắc thể. Kích thước hệ  gen tôm sú có dung lượng  
khá lớn, khoảng 2.17×109 bp (You et al., 2010). Với kích thước hệ gen như vậy thì tùy thuộc  
vào mục tiêu nghiên cứu, đồng thời theo khuyến nghị của Illumina ( ), 

độ sâu giải trình tự phù hợp đã được chọn là 50x để thu được dung lượng dữ liệu giải trình tự 
khoảng 100 Gb. Điều này có nghĩa là số lần đọc đối với mỗi vị  trí nucleotide trong giải trình  
tự  là khoảng 50 lần. Vì hệ  gen tôm sú chưa được giải trình tự  toàn bộ  nên việc chọn độ  sâu 
giải trình tự  50x nhằm tăng độ  chính xác cho các kết quả  đọc. Hầu hết các công nghệ  giải  
trình tự NGS đều bắt đầu bằng việc cắt nhỏ hệ gen thành các phân đoạn ngắn một cách ngẫu  
nhiên, các phân đoạn DNA này được giải trình tự  và sau đó được kết nối lại với nhau bằng  
các công cụ  phần mềm. Vì sự  phân đoạn là ngẫu nhiên nên sự  kết nối càng thành công khi  
mức độ  bao phủ  giữa các đoạn trình tự  càng lớn. Do đó trong nghiên cứu này, mặc dù dung  
lượng dữ liệu giải trình tự thu được lên đến gần 100 GB (vì có rất nhiều tập dữ liệu đọc trình 
tự được tạo ra từ tập hợp các mẫu phân tích) nhưng kết quả giải trình tự  thu được số lượng  
đoạn trình tự (tiền xử lý) chỉ là 145.836.644.              
Từ  102.505.713 đoạn trình tự sau tinh sạch, kết quả   kết nối thu được 510.076 contig. Kết 
quả  này là do GBS chỉ  giải mã một phần hệ  gen  ở  các vùng ngẫu nhiên sau khi cắt bằng  
enzyme chứ không giải mã toàn bộ. Sau khi giải trình tự và sử dụng phần mềm để kết nối thì  
tất cả các đoạn trình tự không đáp ứng được độ sâu bao phủ đều bị loại bỏ, đồng thời cũng có  
một tỷ  lệ  nhất định các đoạn read không được sử  dụng để  kết nối do những hạn chế  nhất  
định của phần mềm kết nối. Mặc dù phần mềm kết nối được sử  dụng là phù hợp nhưng 
không phải tối  ưu để có thể sử dụng hết 100% các đoạn read cho lắp ráp contig. Do đó, mặc  


22
dù số lượng đoạn trình tự thu được sau giải mã rất lớn nhưng số lượng contig thu được không  
nhiều. Nhận định này cũng phù hợp với kết quả nghiên cứu của  Baranski et al. (2014) trên tôm 
sú Penaeus monodon  Ấn Độ  sử dụng công nghệ  giải trình tự  Illumina RNA­seq: từ  196 triệu 
đoạn trình tự  sau khi kết nối đã thu được 136.223 contig; hay nghiên cứu của Hampton et al. 
(2011) trên hệ gen loài Ictidomys tridecemlineatus (một loài gậm nhấm thuộc họ Sóc) sử dụng 
công  nghệ  giải  trình  tự   Roche  454:  từ  3.125.337  đoạn  trình  tự  sau  khi  kết nối thu   được 
140.703 contig, có 619.767 read không được sử dụng để kết nối (chiếm tỷ lệ khoảng 19,8%).  
Kích thước trung bình của contig trong nghiên cứu của   Baranski  et al.  (2014)   là 446 bp, 
trong đó contig ngắn nhất có kích thước 100 bp. Kết quả  này cho thấy có sự  phù hợp nhất  

định so với kết quả  nghiên cứu của luận án với dải phân bố  kích thước của contig sau khi 
chọn lọc là từ 70 bp đến > 450 bp.       
Về sự phân bố contig theo kích thước: các contig có độ dài trong khoảng 70 ­ 150 bp chiếm 
tỷ lệ cao nhất; thấp nhất là các contig kích thước > 450. Kết quả này được lý giải là do chất 
lượng giải trình tự  của thiết bị  Illumina NextSeq500 tạo ra các đoạn đọc (reads) kích thước 
ngắn (tương  ứng với các phân đoạn DNA được cắt ngẫu nhiên thành rất nhiều đoạn nhỏ); 
chất lượng đọc không đồng đều ở tất cả các vị trí gắn DNA trên giếng gắn mẫu (Flow cell). 
Do đó khi kết nối để tạo contig với độ sâu bao phủ đáp ứng cho kết nối chính xác nhằm hạn  
chế sai số do lỗi kết nối thì số lượng các contig thu được có kích thước ngắn chiếm tỷ lệ lớn.  
Trong nghiên cứu của Baranski et al. (2014) cũng cho thấy kích thước trung bình của các read 
trước khi xử lý là 73 bp, sau khi xử lý còn lại 67 b  Theo nhận định của Nguyễn Minh Thành et  
al. (2015), tiêu chí số  lượng lớn contig không phải là tiêu chí tối  ưu để  lựa chọn phần mềm 
kết nối phù hợp. Trong khi đó, tiêu chí chiều dài trung bình của các contig là một trong những  
tiêu chí chuẩn  cho việc  đánh giá  và lựa chọn  phần mềm kết nối (Liu   et al., 2013; Nguyễn 
Minh Thành et al., 2015). 
Cho đến nay, các nghiên cứu về tôm sú nói chung và genome tôm sú nói riêng trên thế giới  
phần lớn tập trung vào các lĩnh vực nghiên cứu đa hình di truyền, xây dựng các nhóm gen liên 
kết, chọn giống, bệnh học tôm, nghiên cứu hệ  gen phiên mã...; rất ít các công bố  về  genome  
và thiết lập hệ gen tôm sú giả định. Một số công bố  về  gen chủ yếu là nghiên cứu gen chức 
năng ở tôm sú và các đối tượng tôm khác như: gen CHH ở tôm tôm càng xanh Macrobrachium 
rosenbergii  (Nguyễn Minh Thành  et al.,  2011), gen kinase 1  ở  Penaeus monodon  (Qiu  et al.,  
2018), các gen liên quan đến bệnh tôm... Do đó, việc giải trình tự được một phần genome tôm 
sú và thiết lập được trình tự  genome tôm sú giả  định trong nghiên cứu này sẽ  là cơ  sở  khoa  
học hữu ích cho các nghiên cứu tiếp theo.   
4.4.2. Sàng lọc SNP và chú giải gen chức năng 
Tổng số SNP xác định được trong nghiên cứu này nhiều hơn so với một số nghiên cứu của  
các tác giả  khác trên các đối tượng tôm như  nghiên cứu của Kumar (2014) trên tôm sú   P.  
monodon  (422 SNP), nghiên cứu của Du  et al.  (2010) trên tôm thẻ  chân trắng  Litopenaeus 
vannamei (1344 SNP); tuy nhiên ít hơn so với nghiên cứu của Nguyễn Minh Thành et al. (2015) 
trên đối tượng cá tra (21.302 SNP). Trong nghiên cứu của Baranski et al. (2014) trên tôm sú P. 

monodon  Ấn Độ sử dụng công nghệ giải trình tự  Illumina RNA­seq: 473.620 SNP giả định đã 
được xác định. Sự khác nhau đáng kể về số lượng SNP sàng lọc được ở các nghiên cứu khác  
nhau trên các đối tượng tôm khác nhau do nhiều nguyên nhân gây nên. Tuy nhiên nếu loại trừ 


×