HỌC VIỆN NƠNG NGHIỆP VIỆT NAM
KHOA CƠNG NGHỆ SINH HỌC
KHĨA LUẬN TỐT NGHIỆP
ĐỀ TÀI:
PHÂN TÍCH HỆ GENOME CHỦNG GIỐNG
Bacillus pseudomycoides DSM 12442
Hà Nội - 2022
HỌC VIỆN NƠNG NGHIỆP VIỆT NAM
KHOA CƠNG NGHỆ SINH HỌC
KHĨA LUẬN TỐT NGHIỆP
ĐỀ TÀI:
PHÂN TÍCH HỆ GENOME CHỦNG GIỐNG
Bacillus pseudomycoides DSM 12442
Người thực hiện
: Nguyễn Thị Minh Thu
Khóa
: 63
Nghành
: Cơng nghệ sinh học
Giáo viên hướng dẫn : TS. Đinh Trường Sơn
Hà Nội - 2022
LỜI CAM KẾT
Em cam đoan rằng tồn bộ q trình nghiên cứu đề tài: “Phân tích hệ
genome chủng Bacillus pseudomycoides DSM 12442” đều do chính em thực
hiện dưới sự hướng dẫn khoa học của Tiến sĩ. Đinh Trường Sơn.
Em xin cam đoan rằng tất cả các nội dung nghiên cứu, kết quả và thông
tin trong luận văn của em là hồn tồn trung thực và khơng cơng bố trong bất kì
một tài liệu nào khác.
Hà Nội, ngày 10 tháng 07 năm 2022
Sinh viên
Nguyễn Thị Minh Thu
i
LỜI CẢM ƠN
Trước hết, em xin bày tỏ lòng biết ơn sâu sắc tới Tiến sĩ. Đinh Trường
Sơn, người đã hỗ trợ em hoàn thành luận văn bằng sự kiên nhẫn, nhiệt tình và
kiến thức của mình. Hơn nữa, sự hướng dẫn của thầy đã giúp đỡ em trong thời
gian viết luận văn này.
Em xin gửi lời cảm ơn tới tất cả các thầy cô trong Khoa Công nghệ Sinh
học, đặc biệt là Bộ môn Công nghệ Sinh học Thực vật đã cung cấp những kiến
thức khoa học cũng như kỹ thuật hữu ích cho em. Đây là một trong những điều
quan trọng nhất giúp em thực hiện thành công khóa luận của mình.
Em cảm ơn những người bạn trong phịng thí nghiệm của em vì sự đóng
góp ý nghĩa của họ. Em sẽ luôn ghi nhớ khoảng thời gian chúng em làm việc
cùng nhau.
Cuối cùng nhưng không kém phần quan trọng, em xin gửi lời cảm ơn sâu
sắc nhất đến gia đình, đặc biệt là mẹ của em, những người đã yêu thương, quan
tâm em, tin tưởng và tạo điều kiện học tập tốt nhất cho em.
Hà Nội, ngày 10 tháng 07 năm 2022
Sinh viên
Nguyễn Thị Minh Thu
ii
MỤC LỤC
LỜI CAM KẾT ...................................................................................................... i
LỜI CẢM ƠN ....................................................................................................... ii
MỤC LỤC ............................................................................................................ iii
DANH MỤC CÁC BẢNG BIỂU ......................................................................... v
DANH MỤC CÁC HÌNH .................................................................................... vi
CHỮ VIẾT TẮT VÀ GIẢI THÍCH THUẬT NGỮ .......................................... viii
TÓM TẮT ............................................................................................................ ix
MỞ ĐẦU ..............................................................................................................1
Chương 1 TỔNG QUAN TÀI LIỆU ................................................................. 3
1.1.
Giới thiệu .................................................................................................. 3
1.2.
Về ứng dụng tin sinh học ......................................................................... 4
1.2.1. Tin sinh học và tác động của nó đối với hệ gen ....................................... 4
1.2.2. Một số ứng dụng của tin sinh học ............................................................ 5
1.3.
Giới thiệu về Bacillus ............................................................................... 6
1.3.1. Phân loại học ............................................................................................ 7
1.3.2. Đặc điểm của Bacillus .............................................................................. 7
1.4.
Khai thác bộ genomecủa Bacillus ............................................................ 9
1.4.1. Khai thác bộ gene ..................................................................................... 9
1.4.2. Vai trò của tin sinh học trong việc khám phá sản phẩm tự nhiên
bằng cách khai thác bộ gene..................................................................... 9
1.5.
Giải trình tự gen ..................................................................................... 11
1.5.1. Mục đích và các phương pháp giải trình tự gen..................................... 11
1.5.2. Ứng dụng ................................................................................................ 13
1.6.
Chất chuyển hóa thứ cấp của Bacillus ................................................... 15
1.7.
Giới thiệu về bacillibactin ...................................................................... 16
Chương 2. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU .................... 17
2.1.
Vật liệu và thiết bị nghiên cứu ............................................................... 17
iii
2.1.1. Vật liệu ................................................................................................... 17
2.1.2. Đặc điểm bộ genome chung Bacillus pseudomycoides DSM 12442..... 17
2.2.
Thiết bị nghiên cứu ................................................................................ 20
2.3.
Nội dung nghiên cứu và phương pháp nghiên cứu ................................ 20
2.3.1. Nội dung nghiên cứu .............................................................................. 21
2.3.2. Phương pháp nghiên cứu ........................................................................ 21
Chương 3. KẾT QUẢ VÀ THẢO LUẬN....................................................... 29
3.1.
Phát sinh lồi của Bacillus pseudomycoides DSM 12442 ..................... 29
3.2.
Dự đốn trình tự các gen có trong Bacillus pseudomycoides DSM
12442 ...................................................................................................... 30
3.3.
Chú thích bộ gene, phân tích chức năng của Bacillus
pseudomycoides DSM 12442 với công cụ BLAST2GO ....................... 31
3.4.
Các cụm gene sinh tổng hợp cho các chất chuyển hóa thứ cấp của
Bacillus pseudomycoides DSM 12442 ................................................... 45
3.5.
Con đường sinh tổng hợp bacillibactin ở Bacillus pseudomycoides
DSM 12442 ............................................................................................ 49
KẾT LUẬN VÀ ĐỀ XUẤT .............................................................................. 53
TÀI LIỆU THAM KHẢO ................................................................................ 54
PHỤ LỤC ........................................................................................................... 58
iv
DANH MỤC CÁC BẢNG BIỂU
Bảng 2.1.
Đặc điểm bộ genomeBacillus pseudomycoides DSM 12442
của do NCBI và EZBioCloud cung cấp ........................................ 18
Bảng 2.2.
Danh sách 10 chủng Bacillus sử dụng........................................... 23
Bảng 3.1.
Cung cấp tổng quan về các đặc điểm bộ genomecủa chủng
DSM 12442 và các một số chủng Bacillus phục vụ nghiên
cứu phát sinh loài. ......................................................................... 29
Bảng 3.2.
Phân bố loài của của Bacillus pseudomycoides DSM 12442 ........ 34
Bảng 3.3.
Phân bố loài Top- Hit của Bacillus pseudomycoides DSM 12442 ...... 36
Bảng 3.4.
Mức phân bố GO cho Bacillus pseudomycoides DSM 12442 ...... 39
Bảng 3.5.
Danh mục GO sau khi phân tích với Blast2GO ............................ 40
Bảng 3.6.
Danh sách Các vùng gen sinh tổng hợp (BGC) của chủng
Bacillus pseudomycoides DSM 12442 được dự đoán bởi
antiSMASH 6.1 ............................................................................. 46
v
DANH MỤC CÁC HÌNH
Hình 2. 1.
Trình tự hệ gene của Bacillus pseudomycoides DSM 12442
truy xuất từ NCBI ........................................................................... 17
Hình 2.2.
Đặc điểm bộ genomecủa Bacillus pseudomycoides DSM
12442 được cung cấp bởi EZBioCloud .......................................... 18
Hình 2.3.
Đặc điểm bộ genomecủa Bacillus pseudomycoides DSM
12442 được cung cấp bởi ARTS .................................................... 19
Hình 2.4.
Bản đồ trịn của Bacillus pseudomycoides DSM 12442 ................ 19
Hình 2.5.
Nội dung và phương pháp nghiên cứu chính sử dụng trong
khố luận......................................................................................... 20
Hình 2.6.
Trang chủ The Type (Strain) Geneome Server (TYGS) ................ 22
Hình 2.9.
Biểu diễn giản đồ của ứng dụng BLAST2GO ............................... 24
Hình 2.7.
Giao diện của cơng cụ antiSMASH .............................................. 26
Hình 2.8
Giao diện tại trang chủ của ARTS.................................................. 27
Hình 3.1.
Mối quan hệ của Bacillus pseudomycoides DSM 12442 với 10
loài Bacillus liên quan .................................................................... 30
Hình 3.2.
Minh hoa một gene của Bacillus pseudomycoides DSM 12442
được dự đốn bởi GeneMark .......................................................... 31
Hình 3.3.
Tổng quan về kết quả chú thích chức năng Blast2GO của
Bacillus pseudomycoides DSM 12442 ........................................... 31
Hình 3.4.
Thống kê về kích thước và số trình tự của Bacillus
pseudomycoides DSM 12442 ......................................................... 32
Hình 3.5.
Biểu đồ phân bố lồi của của Bacillus pseudomycoides DSM
12442 .............................................................................................. 33
Hình 3.6.
Biểu đồ phân bố loài Top- Hit của Bacillus pseudomycoides
DSM 12442..................................................................................... 35
Hình 3.7.
Biểu đồ kết quả chạy InterProScan với các trình tự của
Bacillus pseudomycoides DSM 12442 .......................................... 37
vi
Hình 3.8.
Biểu đồ mức phân bố GO cho Bacillus pseudomycoides DSM
12442 .............................................................................................. 38
Hình 3.9.
Kết quả phân tích GO nhóm “Q trình sinh học” trong
Bacillus pseudomycoides DSM 12442 ........................................... 41
Hình 3.10. Kết quả phân tích GO nhóm “Chức năng phân tử” trong
Bacillus pseudomycoides DSM 12442 ........................................... 43
Hình 3.11. Kết quả phân tích GO nhóm “Thành phần tế bào” trong
Bacillus pseudomycoides DSM 12442 ........................................... 44
Hình 3.12. Các vùng gen sinh tổng hợp (BGC) của chủng Bacillus
pseudomycoides DSM 12442 được dự đoán bởi antiSMASH 6.1 .... 45
Hình 3.13. Cluster 2 trong antiSMASH ........................................................... 49
Hình 3.14. Cụm gene sinh tổng hợp bacillibactin từ Bacillus subtilis
subsp. subtilis str. 168..................................................................... 50
Hình 3.15. Lộ trình trao đổi chất để sinh tổng hợp bacillibactin, và tổ
chức các cụm gene liên quan đến sinh tổng hợp, vận chuyển
và hấp thu bacillibactin ................................................................... 51
Hình 3.16. Kết quả Local BLAST về trình tự tương đồng của gen sinh
tổng hợp bacillibactin ở chủng Bacillus pseudomycoides DSM
12442 .............................................................................................. 51
vii
CHỮ VIẾT TẮT VÀ GIẢI THÍCH THUẬT NGỮ
antiSMASH
Antibiotics & Secondary Metabolite Analysis Shell
(Cơng cụ phân tích các vùng gen sinh tổng hợp các hợp chất thứ
cấp và kháng sinh)
ARTS
Antibiotic Resistant Target Seeker
(cơng cụ tìm kiếm gen kháng kháng sinh)
BGCs
Biosynthetic gene clusters
(vùng gen sinh tổng hợp một chất/nhóm chất)
BLAST
Basic Local Alignment Search Tool
(Cơng cụ tìm kiếm các trình tự tương đồng)
Local BLAST Sử dụng công cụ BLAST với cơ sở dữ liệu trên máy tính (khơng
làm BLAST online)
CAZyme
Carbohydrate active enzyme
(enzyme thuỷ phân carbohydrate)
COGs
Clusters of Orthologous Groups
(nhóm các vùng tương đồng)
GBDP
Genome BLAST Distance Phylogeny
(cây phát sinh chủng loại dựa trên so sánh bộ genome hoặc một
phần của bộ genome)
GO
Gene Ontology
(Bản thể luận gen: là một hệ thống thống nhất việc diễn tả các
thuộc tính gen và sản phẩm của gen đó trên tất cả các loài.
KEGG
Kyoto Encyclopedia of Gene and Genomes
(Bách khoa toàn thư Kyoto về Genes và Genomes)
NRPSs
Non-ribosomal peptide synthetases
(Peptide được sinh tổng hợp không phụ thuộc vào ribosome)
PKSs
Polyketide synthases
(Enzyme sinh tổng hợp polyketides)
TYGS
The Type (Strain) Genome Server
(Server về hệ genome của sinh vật tiền nhân)
SMS
single molecule sequencing
(Kỹ thuật giải trình tự với 1 phân tử DNA)
viii
TÓM TẮT
Vi khuẩn Bacillus được biết tới với rất nhiều vai trò quan trọng trong
nhiều lĩnh vực của cuộc sống như: là nguồn lợi khuẩn quan trọng đối với cơ thể,
xử lý ao nuôi thủy sản,… Trong nghiên cứu này, phương pháp tiếp cận dựa trên
bộ genomeBacillus pseudomycoides DSM 12442 được sử dụng để kiểm tra khả
năng sinh tổng hợp các hợp chất tiềm năng. Phân tích bộ genomecủa chủng này
cho thấy có 15 cụm gene sinh tổng hợp giả định (BGC: Biosynthetic gene
clusters) cho các chất chuyển hóa thứ cấp, cho thấy sự tương đồng với các cụm
gene đối với các hợp chất kháng khuẩn, kháng nấm, kháng vi rút, ức chế
enzym,... Sự đa dạng về cấu trúc của các chất chuyển hóa thứ cấp được dự đốn
đối với Bacillus pseudomycoides DSM 12442 bao gồm: Peptide được sinh tổng
hợp không phụ thuộc vào ribosome (NPR), RiPP, betalactone; terpene,
lanthipeptide lớp 2; lassopeptide… Các nghiên cứu về một số cụm này dẫn đến
việc xác định được các hợp chất mới và các hợp chất đã biết trước đây nhưng
không đặc trưng ở lồi Bacillus. Trình tự BGC của chủng Bacillus
pseudomycoides DSM 12442 có mức độ tương đồng thấp với các BGC đã biết
cho thấy tính mới có thể có ở chủng này. Khố luận cũng phân tích cụm gene
sinh tổng hợp bacillibtin diệt côn trùng gây hại bằng việc thu nhận sắt trong tế
bào máu của chúng. Nghiên cứu này cho thấy sức mạnh của phân tích bộ
genomeđể có được cái nhìn sâu sắc về sự tiến hóa của vi sinh vật mang lại rất
nhiều lợi ích thiết thực.
ix
MỞ ĐẦU
Bacillus được biết đến là thành viên lớn nhất cung cấp dồi dào các chất
kháng sinh với ứng dụng rộng rãi trong y học, môi trường, công nghiệp và nơng
nghiệp. Chính vì vậy, có rất nhiều nghiên cứu được thực hiện nhằm khám phá
các đặc điểm sinh học, hoá sinh cũng nhưng cơ chế phân tử trong đó có kỹ thuật
giải trình tự hệ gen nhằm giải thích cũng như khám phá tiềm năng to lớn của
chúng.
Bộ gen của chủng trực khuẩn Bacillus pseudomycoides DSM 12442 đã
được công bố với những thơng tin tổng qt như: kích thước 5.782.514 bp, hàm
lượng G+C trung bình là 35,2%, có 5.731 gen và 5.465 gen mã hóa protein, 4
rRNA và 86 tRNA. Tuy vậy, những phân tích chi tiết về hệ gen của chủng trực
khuẩn Bacillus pseudomycoides DSM 12442 vẫn chưa được thực hiện. Chính vì
vậy, rất cần thiết phải tiến hành phân tích hệ gen của chủng này để tìm được
những tiềm năng ứng dụng.
Đối với phân tích trình tự hệ gen, nhiều phần mềm, công cụ đã được phát
triển để thúc đẩy, rút ngắn thời gian phân tích. Tin sinh học kết hợp nhiều lĩnh
vực khác nhau như toán học, cơng nghệ thơng tin và sinh học có thể được ứng
dụng để xác định, phân tích các thơng tin thiết yếu của toàn bộ bộ gen cũng như
tiềm năng sản xuất các hợp chất có hoạt tính sinh học q như kháng sinh,
phòng chống ung thư, hợp chất kháng sâu bệnh hại. Xuất phát từ mong muốn
khám phá tiềm năng của hệ gen chủng trực khuẩn Bacillus pseudomycoides
DSM 12442, em tiến hành đề tài “Phân tích hệ genome chủng Bacillus
pseudomycoides DSM 12442".
Mục đích và u cầu
Mục đích
- Phân tích tồn bộ bộ genomecủa vi khuẩn Bacillus pseudomycoides
DSM 12442 và xác định được ít nhất một con đường sinh tổng hợp của một hợp
chất có hoạt tính sinh học tiềm năng trong bộ gene.
1
Yêu cầu
- Xác định các đặc điểm chung hệ gene.
- Phân tích cụm gene sinh tổng hợp cho một số hợp chất thứ cấp của
chủng Bacillus pseudomycoides DSM 12442.
- Phân tích Gene Ontology: Q trình sinh học (Biological process),
Chức năng phân tử (Molecular function), Thành phần tế bào (Cellular
component)
- Dự đoán các chức năng của Bacillus pseudomycoides DSM 12442 dựa
trên trình tự DNA.
- Phân tích con đường của chất chuyển hóa thứ cấp để tạo ra bacillibactin
của Bacillus pseudomycoides DSM 12442.
2
Chương 1 TỔNG QUAN TÀI LIỆU
1.1. Giới thiệu
Chi Bacillus là một tập hợp lớn các vi khuẩn Gram dương hoặc Gram
biến đổi dạng bào tử, hiếu khí hoặc kỵ khí đã trải qua quá trình phân loại đáng
kể sau những tiến bộ trong kỹ thuật sinh học phân tử. Do có nhiều đặc điểm sinh
lý và khả năng tạo ra vơ số enzym, chất kháng sinh và chất chuyển hóa, các lồi
Bacillus được sử dụng trong nhiều quy trình y tế, dược phẩm, nơng nghiệp và
cơng nghiệp. Các lồi khác nhau tạo ra nhiều chất dinh dưỡng khác nhau như
vitamin (ví dụ: riboflavin, cobalamin và inositol) và carotenoid và đã được sử
dụng để tổng hợp một số chất có lợi cho sức khỏe của con người. Ngoài ra, bào
tử Bacillus có lịch sử tiêu thụ lâu đời và sử dụng an toàn như chế phẩm sinh học,
các vi sinh vật sống khi được sử dụng với lượng vừa đủ sẽ mang lại lợi ích về
sức khỏe cho vật chủ.
Do những ý nghĩa thực tế to lớn đó mà các nghiên cứu về tiềm năng và
phát hiện các cụm gene mới để sinh tổng hợp sản phẩm tự nhiên của chi vi
khuẩn này đang rất được chú trọng. Sự phát triển của cơng nghệ giải trình tự bộ
genomeđã được sử dụng để tìm kiếm các chất chuyển hóa mới cũng như các
kháng sinh mới. Các hợp chất hoạt tính sinh học này được tổng hợp bởi các cụm
gene sinh tổng hợp (BGC: Biosynthetic gene clusters) bao gồm các gene khu trú
gần nhau trong bộ genomevi khuẩn (Naughton và cộng sự, 2017). Dựa trên các
sản phẩm của chúng, BGC nói chung được phân loại là Peptide được sinh tổng
hợp không phụ thuộc vào ribosome (NRPS), polyketide synthase (PKS), peptit
được sửa đổi sau dịch mã (RiPP) và những saccharide, terpenoit, lanthipeptit và
những chất khác (Malik và cộng sự, 2020).
Vi khuẩn Bacillus pseudomycoides DSM 12442 là một trực khuẩn tiềm
năng, được phân lập từ vùng đất ở Ghana. Toàn bộ bộ genomecủa Bacillus
pseudomycoides DSM 12442 đã được cơng bố. Tuy nhiên, phân tích điều tra chi
tiết về chủng này chưa bao giờ được thực hiện đã thúc đẩy em theo đuổi luận án
3
“Phân tích dựa trên bộ genomecho tiềm năng hoạt tính sinh học của Bacillus
pseudomycoides DSM 12442 ”.
1.2. Về ứng dụng tin sinh học
Tin sinh học là một lĩnh vực nghiên cứu liên ngành ở khoa học sinh học
và khoa học tính tốn. Mặc dù thuật ngữ ‘‘Tin sinh học’’ khơng thực sự được
xác định rõ ràng, chúng ta có thể nói rằng lĩnh vực khoa học này liên quan đến
việc quản lý tính tốn của tất cả các loại thơng tin sinh học phân tử. Hầu hết các
công việc tin sinh học đang được thực hiện liên quan đến phân tích dữ liệu sinh
học hoặc tổ chức thơng tin sinh học. Tin sinh học sử dụng các công nghệ của các
ngành toán học ứng dụng, tin học, thống kê, khoa học máy tính, trí tuệ nhân tạo,
hóa học và hóa sinh (biochemistry) để giải quyết các vấn đề sinh học.
1.2.1. Tin sinh học và tác động của nó đối với hệ gen
Một số thành tựu quan trọng của bộ gen được giải trình tự bằng tin sinh học:
•Năm 1995, một sơ đồ mới để xác định trình tự ngẫu nhiên của bộ gen
hoàn chỉnh đã được áp dụng để giải trình tự bộ gen của Haemophilus influenzae.
Sự kiện này được đánh dấu là toàn bộ bộ gen đầu tiên của sinh vật được giải
trình tự.
•Tiếp theo là trình tự và chú thích của bộ gen sinh vật nhân thực đầu tiên,
Saccharomyces cerevisiae (một loại nấm men), sau đó là của các loài nhân thực
khác như Caenorhabtidis elegans (một loài sâu), Drosophila melanogaster (ruồi
giấm) và Arabdopsis thaliana (cỏ mù tạt).
• Bộ gen người ban đầu được giải trình tự từ năm 1990 đến năm 2003 và
kể từ đó đã được tải lên trực tuyến và được chú thích rộng rãi
Khối lượng và độ phức tạp của dữ liệu được tạo ra sẽ phải mất nhiều năm
để biên dịch thủ công. Tuy nhiên, với sự ra đời của tin sinh học, các nhà khoa
học có khả năng thực hiện các q trình biên dịch và chú thích một cách nhanh
chóng và chính xác hơn.
4
1.2.2. Một số ứng dụng của tin sinh học
• Căn chỉnh trình tự
Có thể sử dụng cơng cụ tin sinh để so sánh trình tự của các gen tương
đồng. Từ đó, chúng ta có thể xác định mối liên hệ tiến hóa giữa các sinh vật vì
mức độ giống nhau về trình tự của chúng. Việc xác định mức độ giống nhau
giữa hai hoặc nhiều chuỗi có thể giúp chúng ta xác định mức độ liên quan của
chúng. Hai thuật toán thường dùng để căn chỉnh các chuỗi là thuật toán Smith –
Waterman (căn chỉnh cục bộ) và thuật toán Needleman– Wunsch (căn chỉnh
tồn cục).
• Xác định các đột biến
Tin sinh học rất quan trọng trong việc nghiên cứu các đột biến de novo.
Một ví dụ về phương pháp được sử dụng để xác định những đột biến này là giải
trình tự ngun mẫu. Giải trình tự exome tồn bộ được sử dụng để chỉ trình tự
các vùng mã hóa protein của DNA (exomes), chỉ chiếm 1% của bộ gen, do đó
làm cho nó dễ dàng hơn nhiều so với giải trình tự bộ gen.
Tuy nhiên, số lượng lớn dữ liệu được tạo ra nhờ đó ứng dụng tin sinh học
trở nên quan trọng đối với việc quản lý dữ liệu, căn chỉnh trình tự và phân tích.
• Nghiên cứu tiến hóa
Bằng cách nghiên cứu những thay đổi trong DNA bên trong các sinh vật
và so sánh chúng với các loài khác, những thay đổi di truyền liên quan đến q
trình tiến hóa có thể được phân loại. Tiến hóa là q trình bao gồm những thay
đổi nhỏ, tích lũy trong DNA mà cuối cùng dẫn đến sự hình thành các loài mới.
Tin sinh học đã hỗ trợ nghiên cứu trong q trình tiến hóa bằng cách cho
phép so sánh trình tự DNA, chia sẻ dữ liệu, dự đốn sự tiến hóa trong tương lai
và phân loại các q trình tiến hóa phức tạp.
Khi tập hợp lại với nhau, dữ liệu có thể được sử dụng để tạo ra cây phát
sinh lồi có thể theo dõi một số lồi về tổ tiên ban đầu của chúng.(Hannah
Simmons ,2021)
5
1.3. Giới thiệu về Bacillus
Về mặt phát sinh loài, vi khuẩn thuộc giống Bacillus thuộc lớp I của
ngành Firmicutes tức là trực khuẩn. Các thành viên của chi Bacillus là vi khuẩn
Gram dương, hiếu khí và hình thành nội bào tử được đặc trưng bởi hình thái tế
bào hình que, sản xuất catalase với hàm lượng G + C của các loài Bacillus đã
biết nằm trong khoảng từ 32 đến 69% và sự phân bố khắp nơi.
Ferdinand Cohn vào năm 1872 lần đầu tiên mô tả chi Bacillus và đưa vào
nó ba lồi, đó chính là Bacillus subtilis, Bacillus anthracis và Bacillus ulna. Đến
nay, chi Bacillus có 226 lồi có bộ genomeđã được giải trình tự, do đó thể hiện
nó là một trong những chi vi khuẩn được nghiên cứu và khám phá nhiều nhất.
Loài Bacillus lớn nhất được biết đến, B. megaterium, có chiều dài khoảng 1,5
μm (micromet; 1 μm = 10−6 m).
Ngày nay người ta đã biết rằng tất cả các lồi Bacillus đều có thể hình
thành bào tử tiềm sinh trong điều kiện môi trường bất lợi. Những nội bào tử này
có thể tồn tại trong thời gian dài. Nội bào tử có khả năng chịu nhiệt, hóa chất và
ánh sáng mặt trời và phân bố rộng rãi trong tự nhiên, chủ yếu trong đất và chúng
còn có thể xâm nhập vào các hạt bụi.
Một số loại vi khuẩn Bacillus có hại cho con người, thực vật hoặc các
sinh vật khác. Ví dụ, B. cereus đơi khi gây hư hỏng thực phẩm đóng hộp và ngộ
độc thực phẩm trong thời gian ngắn. B. subtilis là yếu tố gây ô nhiễm phổ biến
trong các môi trường nuôi cấy trong phịng thí nghiệm và thường được tìm thấy
trên da người. Hầu hết các chủng Bacillus không gây bệnh cho người nhưng đối
với các chủng sinh sống trong đất, chúng có thể lây nhiễm sang người một cách
tình cờ. Một ngoại lệ đáng chú ý là B. anthracis, gây bệnh than ở người và vật
nuôi. B. thuringiensis tạo ra độc tố (Bt toxin) gây bệnh cho côn trùng. Thuốc
kháng sinh hữu ích về mặt y tế được sản xuất bởi B. subtilis (bacitracin). Ngoài
ra, các chủng vi khuẩn B. amyloliquefaciens, xuất hiện cùng với một số loài thực
vật, được biết là tổng hợp một số chất kháng sinh khác nhau, bao gồm
bacillaene, macrolactin và difficidin. Những chất này dùng để bảo vệ cây ký chủ
6
khỏi bị nhiễm nấm hoặc vi khuẩn khác và đã được nghiên cứu về tính hữu dụng
của chúng như là tác nhân phịng trừ sâu bệnh sinh học.
Chính vì vậy các lồi Bacillus được sử dụng trong nhiều quy trình y tế,
dược phẩm, nông nghiệp và công nghiệp tận dụng các đặc điểm sinh lý đa dạng
và khả năng tạo ra nhiều loại enzyme, kháng sinh và các chất chuyển hóa khác.
1.3.1. Phân loại học
Phương pháp tiếp cận phát sinh loài đối với phân loại Bacillus phần lớn
đã được thực hiện bằng cách phân tích các phân tử rRNA 16S bằng giải trình tự
oligonucleotide. Kỹ thuật này cũng cho thấy các mối quan hệ phát sinh loài.
Đáng ngạc nhiên là các loài Bacillus cho thấy mối quan hệ họ hàng với một số
lồi khơng định hình nhất định, bao gồm Enterococcus, LactoBacillus và
Streptococcus ở cấp độ Bộ, và Listeria và Staphylococcus ở cấp độ Họ. Mặt
khác, một số thành viên cũ của chi Bacillus đã được tập hợp lại thành các Họ
mới, bao gồm Acyclobacillaceae , Họ Paenibacillaceae và Planococcaceae , nay
ngang hàng với Bacillaceae.
Phân loại khoa học của Bacillus:
Giới: Vi khuẩn
Ngành: Firmicutes
Lớp: Bacilli
Bộ: Bacillales
Họ: Bacillaceae
Chi: Bacillus
Chủng: Bacillus pseudomycoides DSM 12442
1.3.2. Đặc điểm của Bacillus
❖ Môi trường sống của Bacillus
Bacillus được tìm thấy có thể sinh sống trong các loại môi trường rất đa
dạng như đất và đất sét, đá, bụi, môi trường nước từ nước ngọt đến nước mặn,
thảm thực vật, thức ăn và đường tiêu hóa của các lồi cơn trùng và động vật
khác nhau (Nicholson và cộng sự , 2002). Khả năng tồn tại và phát triển trong
7
các hệ sinh thái khác nhau như vậy dựa trên việc sản xuất các nội bào tử mạnh
mẽ, sự đa dạng về đặc tính sinh lý và các yêu cầu tăng trưởng của chúng. Các
lồi Bacillus khơng đồng nhất về mặt kiểu hình và kiểu gene (Priest, 1993 ;
Slepecky & Hemphill, 2006), và do đó, chúng thể hiện các đặc tính sinh lý khá
đa dạng như khả năng phân hủy nhiều cơ chất khác nhau có nguồn gốc từ thực
vật và động vật, bao gồm cellulose, tinh bột, protein , thạch, hydrocacbon và cả
nhiên liệu sinh học (Lutz và cộng sự , 2006). Hơn nữa, một số Bacillus là chất
nitrat hóa dị dưỡng, chất khử nitơ, chất cố định nitơ, chất kết tủa sắt, chất oxy
hóa selen, chất oxy hóa và chất khử mangan, chemolithotrophs, ưa axit, ưa kiềm,
psychrophiles, ưa nhiệt và những loại khác (Priest, 1993 ; Slepecky & Hemphill,
2006). Sự đa dạng về đặc tính sinh lý này, được phản ánh bởi sự đa dạng đáng
kể của Bacillus do đó đã cho phép những vi khuẩn này xâm nhập vào nhiều môi
trường sống khác nhau. Khả năng đa dạng hóa sinh thái khổng lồ này được thúc
đẩy bởi sự sản sinh các bào tử, được đặc trưng bởi khả năng kháng thuốc và khả
năng ngủ đông đáng kể của chúng.
❖ Vòng đời của Bacillus
Chu kỳ sống của Bacillus được đặc trưng bởi hai giai đoạn bao gồm phân
chia tế bào sinh dưỡng và phát triển bào tử, hay được gọi là chu kỳ bào tử. Tế
bào sinh dưỡng có dạng hình que (dài 2–5 µm và rộng khoảng 1,0 µm) và phân
chia thành hai tế bào con đồng nhất bằng cách hình thành vách ngăn, phân chia
bắt đầu từ giữa dọc theo màng sinh chất. Mặt khác, bào tử liên quan đến sự phân
chia tế bào không đối xứng và được đặc trưng bởi bảy giai đoạn bao gồm (giai
đoạn I) hình thành sợi trục, (giai đoạn II) hình thành vách ngăn tiền bào tử, (giai
đoạn III) sự kết dính, sự xuất hiện lần đầu tiên của các tinh thể parasporal và
hình thành tiền bào tử, (giai đoạn IV đến VI) sự hình thành khoang ngồi, thành
tế bào nguyên thủy, vỏ ngoài và lớp áo bào tử kèm theo sự biến đổi của nucleoid
bào tử cuối cùng là (giai đoạn VII) trưởng thành bào tử và ly giải bào tử.
8
1.4. Khai thác bộ genomecủa Bacillus
1.4.1. Khai thác bộ gene
Khai thác bộ genomelà một phương pháp đầy hứa hẹn đối với việc phát
hiện các hợp chất tự nhiên và xem xét các cụm tổng hợp cluster vì lượng dữ liệu
phong phú sẽ có từ thơng tin phân tích sắp xếp bộ gene. Sử dụng các kỹ thuật tin
sinh học và các biến thể trong hạn chế nuôi cấy, Scherlach và Hertweck
(Scherlach và Hertweck, 2006) đã phát hiện ra các chất chuyển hóa mới
aspoquinolones A – D. Tin sinh học cũng đã mở rộng tầm nhìn để cho phép ước
tính chính xác các nhân tố chính trong các con đường liên quan đến NRPS hoặc
PKS cũng như xem xét chất nền mục tiêu và sở hữu hóa lý của sản phẩm kết
thúc (Brakhage và Schroeckh, 2011). Phương pháp tiếp cận dị ứng gene kết hợp
kiểm tra định dạng sinh học về sự sắp xếp bộ genomevà phân đoạn theo hướng
đồng vị đã được sử dụng để xác định các sản phẩm cuối có thể có của các cụm
gene cluster. Zerikly và Challis (Zerikly và Challis, 2009) đã đề xuất một
phương pháp hồn ngun trong ống nghiệm để ước tính chất nền trong các con
đường tổng hợp khó hiểu bằng cách ủ chất xúc tác sinh tổng hợp tái tổ hợp từ
các cụm gene với chất nền đã được báo trước để nhận ra các sản phẩm protein.
Những cách tiếp cận này ít liên quan đến việc xử lý di truyền hơn (Deepika và
cộng sự, 2016). Ngoài ra, Với sự phát triển nhanh chóng của cơng nghệ giải
trình tự DNA và việc giảm chi phí giải trình tự, một số lượng lớn trình tự bộ gen
vi sinh vật đã được xác định, điều này làm cho việc khai thác bộ gen trở thành
một chiến lược chính xác và hiệu quả để tìm ra các chất chuyển hóa mới (van
Dijk EL và cộng sự, 2014).
1.4.2. Vai trò của tin sinh học trong việc khám phá sản phẩm tự nhiên bằng
cách khai thác bộ gene
Khai thác bộ genome hồn tồn phụ thuộc vào cơng nghệ máy tính và các
cơng cụ tin sinh học. Cho đến nay, một lượng lớn dữ liệu, được thể hiện bằng
trình tự DNA và các chú thích của chúng, đã được lưu trữ trong các cơ sở dữ
liệu có thể truy cập công khai. Việc lưu trữ và xử lý các tài nguyên ngày càng
9
mở rộng này phụ thuộc vào sự phát triển không ngừng của máy tính và mạng kết
nối chúng với nhau. Thật vậy, bộ genomehoàn chỉnh của một prokaryote đơn lẻ
được mơ tả bằng một trình tự duy nhất của bốn nucleotide (A, T, C và G) được
tạo thành từ tối thiểu khoảng 500 000 bp (đối với sinh vật cộng sinh) lên đến
hơn 10 000 000 bp (đối với vi sinh vật hoại sinh). Khi tất cả các CDS trong trình
tự gene đã được xác định, chúng có thể được so sánh với các protein mã hóa
CDS có chức năng đã biết trong cơ sở dữ liệu cơng khai. Vì trình tự của nhiều
CDS mã hóa các enzym đặc trưng tham gia vào quá trình sinh tổng hợp sản
phẩm tự nhiên được lưu trữ trong các cơ sở dữ liệu này, nên tương đối đơn giản
để xác định phần lớn các cụm gene sinh tổng hợp sản phẩm tự nhiên giả định
trong trình tự bộ genomevi sinh vật bằng cách so sánh trình tự như vậy. Cả dữ
liệu bộ genomethơ và có chú thích, cũng như các cơng cụ tin sinh học, để so
sánh trình tự đều có sẵn miễn phí thơng qua World Wide Web. Giờ đây, điều kiện
tiên quyết xuất bản bắt buộc của hầu hết các tạp chí khoa học là trình tự dữ liệu từ bất
kỳ nghiên cứu nào liên quan đến trình tự DNA mới được lưu trữ trong cơ sở dữ liệu
có thể truy cập công khai như GeneBank ( Các công
cụ tin sinh học sẵn có bao gồm các chương trình ClustalX ( />giúp sắp xếp nhiều chuỗi DNA hoặc protein với nhau; và cơng cụ tìm kiếm và
căn chỉnh cục bộ cơ bản BLAST ( tìm các vùng
có sự tương đồng cục bộ giữa trình tự DNA và protein. Các cơng cụ này cho
phép phân tích so sánh, khơng chỉ tạo điều kiện suy luận về mối quan hệ chức
năng giữa gene và protein mà cịn làm cơ sở cho dự đốn về tính đặc hiệu của cơ
chất, tính đặc hiệu nổi, và các đặc tính xúc tác khác của các enzym sinh tổng
hợp.
Vơ số các hợp chất kháng khuẩn đã được tìm thấy được sản xuất bởi
nhiều chủng Bacillus. Trước đây, các hợp chất này phải được xác định bằng
cách sàng lọc chuyên sâu hoạt động kháng khuẩn chống lại các mục tiêu thích
hợp và sau đó được tinh chế bằng các phương pháp khó khăn trước khi đánh giá
việc sử dụng tiềm năng của chúng là hợp chất kháng khuẩn hoặc kháng nấm.
10
Ngày nay, các cụm gene mã hóa cho vi khuẩn được sản xuất ribosome, NRP và
PKS có thể dễ dàng được xác định trong các trình tự bộ genomebằng các công
cụ khai thác bộ genomekhông chỉ bổ sung thêm những điều cịn thiếu mà cịn dự
đốn được nhưng ý tưởng mới. Đáng chú ý, các công cụ bộ genomenhư Bagel3
và Antismash kết hợp với các tìm kiếm Blast cụ thể, giúp việc xác định các hợp
chất mới dễ dàng hơn nhiều. Mặc dù một số cụm gene mới của thuốc chống vi
trùng giả định đã được tìm thấy, nhưng chúng vẫn chưa bị ảnh hưởng và các
chức năng của chúng vẫn được nghiên cứu. Phân loại mở rộng các hợp chất
kháng khuẩn chứng minh rằng các trực khuẩn cung cấp một nguồn thuốc kháng
khuẩn mới lạ mà giờ đây có thể dễ dàng khai thác bằng thực nghiệm, vì nhiều
cụm gene mới đã được xác định.
1.5. Giải trình tự gen
Giải trình tự ADN là quá trình xác định trình tự các bazo nucleotide (As,
Ts, Cs và Gs) trong một đoạn phân tử ADN, Khởi đầu với sự phát hiện ra cấu
trúc phân tử ADN, những bước tiến dài đã đạt được trong hiểu biết về tính đa
dạng và phức tạp của phân tử ADN. Một loạt đổi mới về chất cũng như máy
móc thiết bị đã khởi đầu cho dự án Hệ gen người. Ngày nay, giải trình tự ADN
đã trở nên tồn diện, nhanh chóng và chính xác hơn nhiều.
1.5.1. Mục đích và các phương pháp giải trình tự gen
❖ Mục đích
• Trong nghiên cứu cơ bản, giải trình tự có thể hỗ trợ xây dựng bản đồ
nhiễm sắc thể, thu được thông tin về cấu trúc, chức năng, hoạt động của các
đoạn ADN; định danh lồi …
• Trong khoa học y tế, giải trình tự DNA có thể được sử dụng để xác định
các gen chịu trách nhiệm cho các rối loạn di truyền. Khi có đủ hiểu biết về cấu
trúc, chức năng của các đoạn ADN, chúng ta có thể dự đốn nguy cơ phát sinh
các hội chứng, bệnh di truyền ở một người hay định hướng phương pháp điều trị
bằng việc giải trình tự hệ gen người đó.
11
• Trong khoa học pháp y, ADN được xem như dấu vân tay phân tử; nó
được sử dụng để xác minh huyết thống, điều tra tội phạm và nhận dạng cá nhân.
• Trong các ngành nơng nghiệp, việc xác định các lồi GMO có thể được
thực hiện với sự trợ giúp của các phương pháp giải trình tự ADN. Bất kỳ biến
thể nhỏ nào trong bộ gen thực vật đều có thể được phát hiện với sự trợ giúp của
trình tự DNA.
❖ Các phương pháp giải trình tự gen phổ biến hiện nay
• Giải trình tự gen bằng phương pháp Hóa học (phương pháp Maxam –
Gilbert)
Đây là phương pháp được sử dụng chủ yếu để giải trình tự của một đoạn
gen. Phương pháp hóa học này được thực hiện trên nguyên tắc chọn một đoạn
gen, sau đó thực hiện những phương pháp và chất xúc tác hóa học để biến đổi
base của các nucleotide.
Các Nucleotide này sau khi được biến đổi sẽ được tách riêng ra khỏi mạch
của DNA. Cuối cùng người ta sẽ áp dụng phương pháp điện di mẫu DNA này
theo phương pháp hóa học để đưa ra trình tự gen chính xác. Đây là phương pháp
giải trình tự DNA khá phức tạp và đòi hỏi cần áp dụng nhiều hóa chất và các bước
thực hiện theo quy trình nghiêm ngặt để có thể cho ra kết quả chính xác nhất.
• Giải trình tự gen bằng phương pháp Enzyme (phương pháp Sanger)
Phương pháp giải trình tự gen này được thực hiện một cách đơn giản hơn
so với phương pháp hóa học. Chỉ cần chèn đoạn gen cần xác định vào vị trí khi
đã xác định rõ sau đó nhân bản các vector thành nhiều bản sao và tách để chúng
trở thành những vector tự do.
Sau đó sử dụng các ống phản ứng gen với các nucleotide và thực hiện
điện di để xác định được trình tự của DNA. Từ kết quả của phản ứng và quá
trình điện di có thể đọc được trình tự gen một cách chính xác. Đây là phương
pháp được sử dụng để giải trình tự DNA nhiều nhất hiện nay
12
Cả hai phương pháp này đã đánh dấu bước ngoặt lớn trong lịch sử phát
triển của bộ môn sinh học hiện đại. Hiện nay, có rất nhiều máy giải trình tự động
đều dựa trên nguyên tắc chính là phương pháp giải trình tự gen của Sanger.
1.5.2. Ứng dụng
❖ Phát hiện các đột biến DNA trong ung thư
Ung thư là một bệnh gây ra bởi những đột biến DNA dẫn tới sự tăng sinh
tế bào một cách bất thường, cơ thể khơng thể kiểm sốt được. Giải trình tự gen
giúp phát hiện các đột biến có liên quan đến ung thư, từ đó cho phép đánh giá
nguy cơ ung thư hoặc làm tăng hiệu quả của điều trị đối với ung thư.
❖ Chẩn đốn bệnh não và thần kinh
Thối hóa thần kinh là một bệnh lý được đặc trưng bởi sự rối loạn chức
năng và sự chết của các tế bào của hệ thần kinh. Điều này dẫn đến sự suy giảm
chức năng vận động và mất trí nhớ. Bệnh thối hóa thần kinh bao gồm bệnh
prion, parkinson, huntington, teo cơ lateral sclerosis và các loại bệnh mất trí
nhớ. Trong đó, bệnh Alzheimer là phổ biến nhất, một số đột biến gen được xác
nhận có liên quan đến và nhiều kiểu gen đang được nghiên cứu giúp chẩn đoán
và phát triển các loại thuốc có hiệu quả.
Hiện nay một số đột biến DNA khác có liên quan đến bệnh lý thần kinh
cũng được phát hiện. Ví dụ như các đột biến gen IDH1 và IDH2 có thể được
phát hiện ở bệnh nhân mắc bệnh như u thần kinh đệm hoặc bệnh bạch cầu tủy
bào cấp.
❖ Xác định type và các allel kháng nguyên bạch cầu người có liên quan
đến bệnh
Hệ thống kháng nguyên bạch cầu người là tên vị trí của các gen mã hóa
cho phức hợp hịa hợp mơ chủ yếu ở người. Hệ thống này gồm vài trăm gen nằm
ở nhiễm sắc thể số 6, mã hóa cho nhiều protein quan trọng của hệ thống miễn
dịch. Hệ thống kháng nguyên xác định các tế bào của một cá thể, phân biệt với
các cá thể khác có hệ thống kháng nguyên bạch cầu khác.
13
Hai nhóm kháng ngun bạch cầu chính là kháng ngun loại I và loại II,
có vai trị miễn dịch khác nhau. Hệ thống kháng nguyên bạch cầu loại I có trên
bề mặt của hầu hết các tế bào có nhân của cơ thể, chúng gắn với các peptide
được cắt ra từ các kháng nguyên được tạo ra trong tế bào, các kháng nguyên này
có thể là các protein của cơ thể hoặc của virus hay vi khuẩn nội bào. Hệ thống
kháng nguyên bạch cầu loại II chỉ có trên một số loại tế bào của hệ miễn dịch
như các tế bào trình diện kháng nguyên hoặc các lympho B đã hoạt hóa. Các tế
bào này thực bào các kháng nguyên biến chúng thành các đoạn peptide trước khi
gắn với kháng nguyên bạch cầu loại II, rồi thể hiện trên màng tế bào.
❖ Chẩn đoán di truyền
Các rối loạn di truyền thường khá hiếm gặp. Một số rối loạn di truyền có
thể hoặc khơng thể được truyền từ cha mẹ. Bên cạnh đó, các rối loạn khác hầu
như ln gây nên bởi các đột biến mới hoặc do những thay đổi của DNA.
Hiện nay giải trình tự gen cho phép phát hiện nhiều bệnh di truyền, có thể
phát hiện các đột biến điểm của DNA ty thể trong các bệnh di truyền như: bệnh
não cơ ty thể với sự nhiễm acid lactic, bệnh thần kinh quang di truyền leber, yếu
cơ thần kinh, động kinh rung giật cơ với các sợi đỏ, mất điều hịa và viêm võng
mạc sắc tố.
❖ Chẩn đốn nhiễm virus, nấm, vi khuẩn
Giải trình tự gen có thể giúp phát hiện để chẩn đoán nhiễm các loại virus như:
•Virus: phát hiện các đột biến kháng thuốc của virus viêm gan B, xác định
genotype virus viêm gan C, xác định type HIV, nhiễm cúm A, AH5, nhiễm
HPV, SARS, nhiễm Chlamydia trachomatis, thủy đậu, HSV, CMV,...
•Vi khuẩn: phát hiện nhiễm vi khuẩn helicobacter pylori, ký sinh trùng sốt
rét, sự kháng thuốc của vi khuẩn lao.
•Nấm: phát hiện nhiễm các loại nấm C. albicans, C. tropicalis, C.
glabrata,...
Tóm lại, ứng dụng của giải trình tự gen được sử dụng phổ biến rộng rãi,
và đem lại nhiều ưu điểm vượt trội trong lĩnh vực y học lâm sàng. Từ đó, giúp
14