Tải bản đầy đủ (.pdf) (50 trang)

Xây dựng PROBE để khai thác và chọn gen mã hóa XYLAN 1 4 BETA XYLOSIDASE từ dữ liệu giải trình tự DNA METAGENOME

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.27 MB, 50 trang )

VIỆN ĐẠI HỌC MỞ HÀ NỘI
KHOA CÔNG NGHỆ SINH HỌC

KHÓA LUẬN TỐT NGHIỆP
ĐỀ TÀI:
XÂY DỰNG PROBE ĐỂ KHAI THÁC VÀ CHỌN GEN MÃ
HÓA XYLAN 1-4 BETA XYLOSIDASE TỪ DỮ LIỆU GIẢI
TRÌNH TỰ DNA METAGENOME

Giáo viên hướng dẫn
Sinh viên thực hiện
Lớp

Hà Nội - 2017

:TS.Nguyễn Thị Trung
:Vũ Trường Đức
:1302 – K20


VIỆN ĐẠI HỌC MỞ HÀ NỘI
KHOA CÔNG NGHỆ SINH HỌC

KHÓA LUẬN TỐT NGHIỆP

ĐỀ TÀI:
XÂY DỰNG PROBE ĐỂ KHAI THÁC VÀ CHỌN GEN
MÃ HÓA XYLAN 1-4 BETA XYLOSIDASE TỪ DỮ LIỆU
GIẢI TRÌNH TỰ DNA METAGENOME

Giáo viên hướng dẫn



:TS. Nguyễn Thị Trung

Sinh viên thực hiện

:Vũ Trường Đức

Lớp

:13.02 - K20

Hà Nội - 2017


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

LỜI CẢM ƠN
Em xin bày tỏ lòng biết ơn chân thành tới giảng viên hướng dẫn - TS.
Nguyễn Thị Trung - người đã định hướng nghiên cứu, tận tình giúp đỡ em
trong quá trình thực hiện đề tài.
Em xin bày tỏ lòng biết ơn chân thành tới GS.TS Trương Nam Hải, TS.
Đỗ Thị Huyền - Trưởng phòng Kỹ thuật di truyền, Th.S Lê Ngọc Giang nghiên cứu sinh phòng kĩ thuật di truyền, cùng toàn thể các cô (chú), anh (chị)
kỹ thuật viên Phòng kỹ thuật di truyền đã tận tình giúp đỡ, tạo mọi điều kiện
tốt nhất để giúp em hoàn thành đề tài này.
Em cũng xin gửi lời cảm ơn chân thành tới các thầy (cô) giáo khoa
Công Nghệ Sinh Học, trường Viện Đại Học Mở Hà Nội đã truyền đạt cho em
những kiến thức quý báu trong thơi gian học tập vừa qua.
Trong quá trình nghiên cứu đề tài, do thời gian thực tập có hạn, kiến thức

của em còn hạn chế nên báo cáo của em không tránh khỏi những thiếu sót
nhất định. Em rất mong nhận được sự đóng góp ý kiến của giảng viên hướng
dẫn – TS. Nguyễn Thị Trung, các thầy (cô) giáo khoa Công Nghệ Sinh Học
trường Viện Đại học Mở Hà Nội và các cô chú, anh chị kỹ thuật viên phòng
kỹ thuật di truyền để bài viết của em được hoàn thiện hơn.
Em xin chân thành cảm ơn !
Hà Nội, ngày 09 tháng 05 năm 2017
Sinh viên

Vũ Trường Đức

Vũ Trường Đức – 1302.K20

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

MỤC LỤC
DANH MỤC CÁC CHỮ VIẾT TẮT ................................................................ I
DANH MỤC CÁC BẢNG............................................................................... II
DANH MỤC CÁC HÌNH ............................................................................... III
LỜI MỞ ĐẦU ................................................................................................... 1
PHẦN 1: TỔNG QUAN .................................................................................. 3
1.1 Khái quát về xylan 1-4 beta xylosidase .................................................. 3
1.1.1 Định nghĩa ........................................................................................ 3
1.1.2 Phân loại ........................................................................................... 3
1.1.3 Hoạt tính của xylan 1-4 beta xylosidase .......................................... 4

1.1.4 Cấu trúc của xylan 1-4 beta xylosidase............................................ 4
1.1.4.1 Cấu trúc bậc I của xylan 1-4 beta xylosidase............................ 4
1.1.4.2 Cấu trúc bậc II của xylan 1-4 beta xylosidase .......................... 4
1.1.4.3 Cấu trúc bậc 3 của xylan 1-4 beta xylosidase ........................... 5
1.1.4.4 Cấu trúc bậc IV của xylan 1-4 beta xylosidase ......................... 7
1.2 Khái quát về các enzyme hoạt hóa carbohydrate (CAZy) ...................... 8
1.2.1 Khái niệm các enzyme hoạt hóa carbohydrate (CAZy) ................... 8
1.2.2 Lịch sử phát triển của các enzyme hoạt hóa carbohydrate .............. 8
1.3 Khai thác cơ sở dữ liệu các gen .............................................................. 9
1.3.1 Khai thác dữ liệu từ Ngân hàng Gen quốc tế ................................... 9
1.3.1.1 Khái niệm về cơ sở dữ liệu các gen .......................................... 9
1.3.1.2 Phương pháp tìm kiếm thông tin về các gen............................. 9
Vũ Trường Đức – 1302.K20

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

1.3.1.3 Một số phần mềm hỗ trợ tìm kiếm thông tin về các gen .......... 9
1.3.2 Sử dụng Probe ................................................................................ 10
1.3.2.1 Khái niệm Probe...................................................................... 10
1.3.2.2 Cấu trúc của probe .................................................................. 11
1.3.2.3 Phương pháp xây dựng probe ................................................. 11
1.4 Cơ sở dữ liệu DNA metagenome của vi sinh ruột mối ......................... 12
PHẦN II: VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU........................ 13
2.1 Vật liệu nghiên cứu ............................................................................... 13
2.1.1 Đối tượng nghiên cứu .................................................................... 13

2.1.2 Thiết bị nghiên cứu ........................................................................ 13
2.2 Phương pháp nghiên cứu....................................................................... 13
2.2.1 Xác định các họ GH có chứa enzyme xylan 1-4 beta xylosidase
theo CAZy ............................................................................................... 13
2.2.2 Tìm kiếm các trình tự axit amin của enzyme xylan 1-4 beta
xylosidase đã được xác định đặc tính ..................................................... 14
2.2.3 Xác định mức độ tương đồng của các trình tự bằng ClustalW PBIL ........................................................................................................ 15
2.2.4 Xây dựng probe và giá trị tham chiếu ............................................ 16
2.2.5 Khai thác trình tự mã hóa xylan 1-4 beta xylosidase từ dữ liệu
DNA metagenome của vi sinh vật trong ruột mối .................................. 17
PHẦN III: KẾT QUẢ VÀ THẢO LUẬN ...................................................... 18
3.1 Các họ GH có chứa enzyme xylan 1-4 beta xylosidase theo CAZy ..... 18

Vũ Trường Đức – 1302.K20

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

3.1.1 Số lượng họ GH có chứa enzyme xylan 1-4 beta xylosidase theo
CAZy ....................................................................................................... 18
3.1.2 Cấu trúc đặc trưng của một số họ GH có chứa enzyme xylan 1-4
beta xylosidase theo CAZy ..................................................................... 19
3.2 Trình tự axit amin của enzyme xylan 1-4 beta xylosidase đã được xác
định đặc tính ................................................................................................ 20
3.3 Mức độ tương đồng của các trình tự axit amin ..................................... 26
3.4 Xây dựng probe và giá trị tham chiếu ................................................... 27

3.5 Khai thác trình tự mã hóa cho enzyme xylan 1-4 beta xylosidase bằng
probe từ dữ liệu DNA metagenome của vi sinh vật trong ruột mối ........... 29
3.6 Khảo sát cấu trúc bậc 3 của các trình tự axit amin của enzym xylan 14 beta xylosidase được khai thác bằng probe.............................................. 32
PHẦN IV: KẾT LUẬN VÀ KIẾN NGHỊ ...................................................... 38
4.1 Kết luận ................................................................................................ 38
4.2 Kiến nghị ............................................................................................... 38
TÀI LIỆU THAM KHẢO ............................................................................... 39

Vũ Trường Đức – 1302.K20

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

BẢNG KÝ HIỆU VÀ CHỮ VIẾT TẮT
Chữ viết tắt
BLAST

Chú thích
Basic Local Alignment Search Tool

CAZy

Carbohydrate-Active enZymes

DNA


Deoxyribonucleic acid

EC

Enzym classes

GH

Glycoside Hydrolases

NCBI

National Center for Biotechnology Information

RNA

Ribonucleic acid

Vũ Trường Đức – 1302.K20

I

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

DANH MỤC CÁC BẢNG


Bảng 3.1 Các họ GH chứa enzyme xylan 1-4 beta xylosidase theo
CAZy.
Bảng 3.2 Tổng hợp dữ liệu đã được nghiên cứu chi tiết về xylan 1-4
beta xylosidase.
Bảng 3.4 So sánh tương đồng giữa probe với các trình tự thuộc
GH43.
Bảng 3.5.1 So sánh số lượng trình tự khai thác bằng probe với dự
đoán của BGI.
Bảng 3.5.2 So sánh số lượng trình tự khai thác bằng probe với dự
đoán của BGI.
Bảng 3.6 Ước đoán cấu trúc bậc ba của các trình tự bằng Swiss Prot.

Vũ Trường Đức – 1302.K20

II

18

20

28

29

31

33

Khóa luận tốt nghiệp



VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

DANH MỤC CÁC HÌNH

Hình 1.1 Cấu trúc bậc 2 của enzyme β-xylosidase tách từ
Thermoanaerobacterium saccharolyticum JW/SL-YS485 có khối

5

lượng 73 kDa.
Hình 1.2 Cấu trúc bậc 3 của beta-1,4-xylanases from Chaetomium

7

thermophilum.
Hình 1.3 Cấu trúc bậc 4 của enzyme β-xylosidase tách từ

8

Thermoanaerobacterium saccharolyticum JW/SL-YS485.
Hình 3.3 Kết quả so sánh sự tương đồng các trình tự axit amin của

26

xylan 1-4 beta xylosidase thuộc họ GH43.
Hình 3.4 Trình tự probe cho enzyme xylan 1-4 beta xylosidase thuộc


27

họ GH43.
Hình 3.5 Kết quả dự đoán tương đồng đặc hiệu trình tự và các gốc

32

hoạt động của các trình tự được lựa chọn bằng probe GH43.
Hình 3.6 Cấu trúc bậc ba của các xylan beta xylosidase khuôn
(template) 2exk.1.A (A), 1yrz.1.A (B), 1yi7.1.A (C), 3c7g.1.A (D) họ

37

GH43 tương đồng với các trình tự được khai thác bằng probe sử dụng
Swiss prot.

Vũ Trường Đức – 1302.K20

III

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

LỜI MỞ ĐẦU
Mối Coptotermes gestroi thuộc mối bậc thấp trong họ Rhinotermitidae

rất phổ biến ở Việt Nam cũng như một số quốc gia trên thế giới. Có ít nhất 16
họ GH của vi sinh vật cộng sinh trong ruột sau bao gồm: GH2, 3, 5, 7, 10, 11,
16, 20, 26, 30, 42, 45, 47, 53, 77, 92. Ứng dụng kỹ thuật metagenomics theo
hướng phân tích dữ liệu thu được từ việc giải toàn bộ trình tự metagenome,
Do và đồng tác giả đã khai thác được 125.431 khung đọc mở (ORF) với tổng
chiều dài lên tới 78.271.365 bp của hệ vi khuẩn sống tự do trong ruột mối,
trong đó ước đoán gồm rất nhiều trình tự mã hóa cho enzyme xylan 1-4 beta
xylosidase hay gọi tắt là enzyme beta xylosidase. Phương pháp dự đoán gen
từ dữ liệu khổng lồ DNA metagenome của vi sinh vật trong ruột mối bước
đầu đã sử dụng các phần mềm tin sinh học, thường dựa trên số liệu các trình
tự tương đồng với các loài đã được công bố trong ngân hàng gen.
Việc lựa chọn các trình tự gen mong muốn được thực hiện bằng nhiều
phần mềm dự đoán cấu trúc và chức năng của protein. Đầu tiên là việc sử
dụng công cụ BLASTP để xác định chức năng bằng cách so sánh độ tương
đồng và mức độ bao phủ của trình tự đã ước đoán chức năng ban đầu từ DNA
metagenome, với các trình tự có trên ngân hàng gen của NCBI. Kết quả
BLASTP giúp cho việc ước đoán rất nhiều các thông số của enzyme như vị trí
các vùng bảo tồn, họ enzyme, nguồn vi sinh vật chứa enzyme, …. Trước khi
đưa vào thực nghiệm, các gen này tiếp tục sử dụng phần mềm dự đoán về tính
chất như khả năng chịu kiềm/axit, chịu nhiệt ,… của enzyme. Mặc dù dữ liệu
trình tự axit amin/nucleotit của NCBI vô cùng lớn, nhưng có rất nhiều trình tự
nucleotit mã hóa cho enzyme xylan 1-4 beta xylosidase chưa được nghiên cứu
tính chất, mà chỉ dựa trên sự so sánh tương đồng đối với trình tự có sẵn trong
NCBI. Do đó số liệu dự đoán của BLAST và các phần mềm khác sử dụng
những dữ liệu của NCBI chưa được nghiên cứu chi tiết sẽ trở nên kém tin cậy
Vũ Trường Đức – 1302.K20

1

Khóa luận tốt nghiệp



VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

khi đưa vào thực nghiệm. Đây là một trong những khó khăn trong việc lựa
chọn gen từ số liệu DNA metagenome của ruột mối nếu chỉ sử dụng các công
cụ trên. Do đó việc tìm kiếm phương pháp để có thể khai thác, lựa chọn được
gen mã hóa xylan 1-4 beta xylosidase từ dữ liệu này và có thể thực nghiệm
hiệu quả là rất cần thiết.
 Mục tiêu nghiên cứu
Đưa ra được phương pháp để xây dựng probe cho enzyme xylan 1-4
beta xylosidase.

Vũ Trường Đức – 1302.K20

2

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

PHẦN I: TỔNG QUAN
1.1 Khái quát về xylan 1-4 beta xylosidase
1.1.1 Định nghĩa
Xylan 1,4-beta-xylosidase (EC 3.2.1.37, xylobiase, beta-xylosidase,

exo-1,4-beta-xylosidase, beta-D-xylopyranosidase, exo-1,4-xylosidase, exo1,4- beta-D-xylosidase, 1,4-beta-D-xylan xylohydrolase) là một enzyme xúc
tác cho phản ứng hóa học.
Thủy phân (1-> 4) -beta-D-xylan, để loại bỏ dư lượng D-xylose tiếp
từ-giảm không trạm cuối enzym này cũng thủy phân xylulose.
1.1.2 Phân loại
Xylan 1,4-beta-xylosidase thuộc nhóm enzyme glycoside hydrolase
(EC 3.2.1.x). Đây là một nhóm enzyme lớn, có khả năng thủy phân liên kết
glycoside giữa cacbonhydrat và các thành phần khác. Dựa trên cơ chất đặc
hiệu, cơ chế phản ứng và trình tự amino axit, đến nay đã có 135 họ glycoside
hydrolase được phân loại. 14 bộ gồm các họ enzyme tương đồng cũng đã
được thống kê.
Xylan 1,4-beta-xylosidase, từ các nguồn đã được tìm thấy hiện nay,
được sắp xếp vào các họ glycoside hydrolase 1, 3, 30, 39, 43, 51, 52, 54, 116
và 120. Tuy nhiên, vẫn còn nhiều loại xylosidases chưa được phân loại rõ, bởi
chúng không có đặc tính rõ ràng hoặc mang đặc tính của nhiều họ.
Xylan 1,4-beta-xylosidase ở các họ GH 1, 39, 52, 116, 120 đều có
nguồn gốc vi khuẩn, và ở họ GH 51, 54 đều có nguồn gốc nấm. Các họ còn lại
chứa β-xylosidase có nguồn gốc hỗn hợp.

Vũ Trường Đức – 1302.K20

3

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC


1.1.3 Hoạt tính của xylan 1-4 beta xylosidase
Xylan 1,4-beta-xylosidase, là một enzyme có khả năng xúc tác phản
ứng cắt ở đầu không khử của chuỗi polyme (reducing end exo-acting). Hoạt
tính chủ yếu của chúng là loại bỏ các gốc khử D-xylose khỏi đầu không khử
(non-reducing end) của (1,4)-β-D-xylan oligosaccharide, nhờ đó (1,4)-β-Dxylan oligosaccharide được thủy phân thành các tiểu phần β-Dxylanpyranose. Ngoài ra, β-xylosidase còn có khả năng thủy phân xylobiose.
Một số hoạt tính exoglycosidase khác của enzyme này cũng đã được tìm thấy
ở gan cừu.
1.1.4 Cấu trúc của xylan 1-4 beta xylosidase
Về bản chất xylan 1-4 beta xylosidase là một phân tử protein. Xét về
mặt cấu trúc và các dạng tồn tại trong không gian người ta phân biệt 4 loại
cấu trúc:
1.1.4.1 Cấu trúc bậc I của xylan 1-4 beta xylosidase
Cấu trúc bậc I của protein là thành phần và trình tự sắp xếp của các gốc
axit amin trong mạch polypeptide. Hiện nay, cấu trúc bậc I của nhiều protein
đã được thiết lập. Đa số các protein có số gốc axit amin giữa 100 và 500,
nhưng cũng có nhiều protein có số lượng gốc axit amin lớn hơn nhiều.
1.1.4.2 Cấu trúc bậc II của xylan 1-4 beta xylosidase
Cấu trúc bậc II của phân tử protein biểu thị sự xoắn của chuỗi
polypeptide, là tương tác không gian giữa các gốc axit amin ở gần nhau trong
mạch polypeptide. Nói cách khác, cấu trúc bậc II là dạng không gian cục bộ
của từng phần trong mạch polypeptide. Cấu trúc này được làm bền nhờ các
liên kết hydro được tạo thành giữa liên kết peptide ở kề gần nhau, cách nhau

Vũ Trường Đức – 1302.K20

4

Khóa luận tốt nghiệp



VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

những khoảng xác định. Theo Pauling và Cori (1951) cấu trúc bậc II của
protein bao gồm 2 kiểu chính là xoắn α và phiến gấp nếp β [12].
Một khung đọc mở có chứa 1.914 bp của

xylC tách từ

Thermoanaerobacterium saccharolyticum JW/SL-YS485 mã hóa enzyme βxylosidase có khối lượng 73 kDa. Cấu trúc bậc 2 của enzyme này được minh
họa ở Hình 1.1. [16]

Hình 1.1 Cấu trúc bậc 2 của enzyme β-xylosidase tách từ
Thermoanaerobacterium saccharolyticum JW/SL-YS485 có khối lượng 73
kDa. a. cấu trúc dự đoán sử dụng trình tự gốc; b. cấu trúc dự đoán sử dụng
trình tự đã được biến đổi.
1.1.4.3 Cấu trúc bậc 3 của xylan 1-4 beta xylosidase
Cấu trúc bậc III là tương tác không gian giữa các gốc axit amin ở xa
nhau trong mạch polypeptide, là dạng cuộn lại trong không gian của toàn
mạch polypeptide (hình dạng chung của chuỗi polypeptide). Trong thực tế,
Vũ Trường Đức – 1302.K20

5

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI


KHOA CÔNG NGHỆ SINH HỌC

nhiều protein có cấu trúc bậc III dạng hình cầu. Nguyên nhân làm cho các
phân tử protein có thể cuộn lại thành hình cầu là do sự tương tác của các
nhóm bên (gốc R) của axit amin. Do sự tương tác này mà cấu trúc bậc II đều
đặn bị biến dạng, dẫn đến hình thành cấu trúc bậc III. Như vậy, ở cấu trúc bậc
III, chuỗi polypeptide có những vùng có cấu trúc bậc II xác định, có những
vùng có cấu trúc gấp nếp β và những vùng xoắn ngẫu nhiên làm cho phân tử
cuộn lại có dạng hình cầu. Myoglobin là một protein có cấu trúc bậc III được
Kendrew xác định bằng phương pháp chụp nhiễu xạ tia X.
Đặc điểm quan trọng trong cấu trúc bậc III là sự hình thành những vùng
kỵ nước do các gốc bên không phân cực của các axit amin hợp thành. Nhiều
nghiên cứu đã chứng minh rằng, cấu trúc bậc III được giữ vững và ổn định
chủ yếu do sự tương tác kỵ nước và liên kết hydro.
Ngoài ra, người ta cũng tìm thấy liên kết disulfur (-S-S) ở một số
protein có cấu trúc bậc III, song sự hình thành cầu disunfua không phải là lực
chủ đạo làm cho mạch polypeptide cuộn lại, mà nó được hình thành ngẫu
nhiên khi các nhóm –SH của các gốc axit amin trong chuỗi polypeptide đã
cuộn lại nằm kề nhau.
Cầu disunfua đóng vai trò giữ vững và ổn định cấu trúc bậc III. Phần
lớn các protein hình cầu có cấu trúc bậc III, có các gốc axit amin kỵ nước
quay vào trong, còn các gốc axit amin ưa nước phân bố trên bề mặt.
Ví dụ về cấu trúc bậc III của beta-1,4-xylanases from Chaetomium
thermophilum trình bày ở Hình 1.2. [4].

Vũ Trường Đức – 1302.K20

6

Khóa luận tốt nghiệp



VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

Hình 1.2 Cấu trúc bậc 3 của beta-1,4-xylanases
from Chaetomium thermophilum
1.1.4.4 Cấu trúc bậc IV của xylan 1-4 beta xylosidase
Cấu trúc bậc IV biểu thị sự kết hợp của các chuỗi có cấu trúc bậc III
trong phân tử protein. Hay nói cách khác, những phân tử protein có cấu trúc
từ 2 hay nhiều chuỗi protein hình cầu, tương tác với nhau trong không gian
tạo nên cấu trúc bậc IV. Mỗi một chuỗi polypeptide đó được gọi là một tiểu
đơn vị (subunit), chúng gắn với nhau nhờ các liên kết hydro, tương tác
VanderWaals giữa các nhóm phân bố trên bề mặt của các tiểu đơn vị để làm
bền cấu trúc bậc IV.
Ví dụ về cấu trúc bậc 4 của phân tử enzyme β-xylosidase tách từ
Thermoanaerobacterium saccharolyticum JW/SL-YS485 (Hình 1.3) [16].

Vũ Trường Đức – 1302.K20

7

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC


Hình 1.3 Cấu trúc bậc 4 của enzyme β-xylosidase tách từ
Thermoanaerobacterium saccharolyticum JW/SL-YS485
1.2 Khái quát về các enzyme hoạt hóa carbohydrate (CAZy)
1.2.1 Khái niệm các enzyme hoạt hóa carbohydrate (CAZy)
Các enzyme hoạt hóa carbohydrate - CAZy (Carbohydrate-Active
enzymes) là một hệ thống phân loại chứa cơ sở dữ liệu về enzyme tham gia
vào quá trình tổng hợp, trao đổi và vận chuyển carbohydrate.
1.2.2 Lịch sử phát triển của các enzyme hoạt hóa carbohydrate
Các enzyme hoạt hóa carbohydrate bao gồm các enzyme kiến tạo và
phân hủy phức hợp carbohydrate và phức hợp liên kết glyco. Tính đến năm
2008, các enzyme hoạt hóa carbohydrate đã được tập hợp trong cở sở dữ liệu
tại trang thông tin điện tử là 113 glycoside hydrolase, 91
glycosyltransferase, 19 polysaccharide lyase, 15 carbohydrate esterase và 52
họ liên quan đến carbohydrate. Những họ enzyme này được tạo ra dựa trên
các đặc tính của protein thu được từ thực nghiệm, các trình tự gen mã hóa và
Vũ Trường Đức – 1302.K20

8

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

trình tự protein được công bố trên mạng. từ các cơ sở dữ liệu công cộng có sự
tương đồng đáng kể. Các thông tin sinh hóa protein liên tục được cập nhật
dựa trên các tài liệu sẵn có và thông tin về cấu trúc. Hơn 6400 protein đã có
mã số EC và 700 protein đã biết cấu trúc vùng bám của enzyme PDB (Protein

domain binding) [1].
Dữ liệu về CAZy liên tục được cập nhật, cho đến nay đã có dữ liệu của
GenBank về chuỗi thông tin của gần 340.000 enzyme [13]. CAZy xác định
các họ thủy phân các liên kết glycoside (Glycosyl Hydrolases: GH) có liên
quan tiến hóa được giới thiệu bởi Henrissat năm 1991 và 1997 [5], [6]. Đến
năm 2015, CAZy chứa 135 họ GH với các đặc điểm nhận biết khác nhau.
1.3 Khai thác cơ sở dữ liệu các gen
1.3.1 Khai thác dữ liệu từ Ngân hàng Gen quốc tế
1.3.1.1 Khái niệm về cơ sở dữ liệu các gen
Cơ sở dữ liệu là một hệ thống các thông tin có cấu trúc được lưu trữ
trên các thiết bị lưu trữ thông tin thứ cấp (như băng từ, đĩa từ ...) để có thể
thỏa mãn yêu cầu khai thác thông tin đồng thời của nhiều người sử dụng hay
nhiều chương trình ứng dụng với nhiều mục đích khác nhau.
1.3.1.2 Phương pháp tìm kiếm thông tin về các gen
Hai nguồn thông tin chính để tìm kiếm trình tự axit amin của enzyme
này là CAZy và NCBI.
1.3.1.3 Một số phần mềm hỗ trợ tìm kiếm thông tin về các gen
Cơ sở dữ liệu về CAZy lưu trữ tại được sắp xếp
thành các họ enzyme thủy phân liên quan đến cấu trúc và các cấu trúc modul
liên kết carbohydrate có khả năng phân hủy, biến đổi hoặc hình thành liên kết.
Các dữ liệu, thông tin liên quan đến enzyme liên tục được cập nhật vào cơ sở
Vũ Trường Đức – 1302.K20

9

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI


KHOA CÔNG NGHỆ SINH HỌC

dữ liệu.
Khi phân chia thành các họ enzyme dựa trên phân tích trình tự axit
amin, dữ liệu CAZy tiếp tục được khẳng định là một nguồn tài nguyên vô giá
giống như một công cụ nghiên cứu. Do đó ngày càng tăng số lượng thông tin
hệ gen liên quan đến trao đổi carbohydrate. Không đáng ngạc nhiên khi danh
pháp CAZy đã đạt được sự chấp nhận nhanh chóng của cộng đồng nghiên cứu
và đã trở thành một tiêu chuẩn khi mô tả các enzyme carbohydrate.
Cơ sở dữ liệu CAZy được tổ chức thành các họ enzyme hoạt tính
carbohydrate, gồm: glycoside hydrolases (GHs), glycosyltransferases (GTs),
polysaccharide lyases (PLs), carbohydrate esterases (CEs), các modul liên kết
carbohydrate (CBMs). Một số họ tiếp tục được phân chia thành các phân họ,
ví dụ như glycoside hydrolase họ 13 (GH13).
Clustal là một loạt chương trình ứng dụng các chương trình máy tính sử
dụng trong tin sinh để so sánh nhiều trình tự [2]. Clustal là phần mềm đầu tiên
để sắp xếp sự phân hóa dựa trên cây phát sinh loài [8]. ClustalV viết lại trên
cơ sở Clustal bao gồm tổ chức lại cây phát sinh chủng loài trên kết quả so
sánh trình tự nhận được [7]. ClusstalW là giao diện theo dòng lệnh [11].
ClustalX là phiên bản có tính năng đồ họa [15].
1.3.2 Sử dụng Probe

1.3.2.1 Khái niệm Probe
Probe (còn có tên gọi khác là đoạn dò) là một sợi axit nucleic (hoặc axit
ribonucleic) có trình tự xác định và được đánh dấu bằng các phương pháp
khác nhau dùng để nhận diện các đoạn axit nucleic khác có trình tự bổ sung
với nó. Quá trình này dựa trên nguyên tắc biến tính và hồi tính của phân tử
DNA, được gọi là lai phân tử DNA. Các phương pháp cổ điển có sử dụng
probe là Northern Blot (nhận diện bản RNA phiên mã), Southern Blot (nhận
diện các phiên bản của gene). Công nghệ DNA chip and cDNA micro-arrays

Vũ Trường Đức – 1302.K20

10

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

được thiết kế cùng trên nguyên tắc sử dụng các probe của các phương pháp lai
phân tử nhưng cho phép nghiên cứu đồng loạt hàng nghìn gen khác nhau.
1.3.2.2 Cấu trúc của probe
Probe là một sợi đơn oligonucleotit, thông thường có chiều dài từ 30
đến 100 nucleotit, nên có khả năng tạo liên kết hydro với những đoạn DNA
có trình tự bổ sung với probe.
Tính đặc trưng của probe phụ thuộc vào trình tự nucleotit của nó, thông
thường được kiểm tra bằng cách BLAST trình tự này trên ngân hàng gene.
Nhiệt độ biến tính (Tm) của probe phụ thuộc số lượng và thành phần purin và
pyrimidine của probe từ đó quyết định nhiệt độ lai thích hợp trong các thí
nghiệm lai phân tử.
1.3.2.3 Phương pháp xây dựng probe
Probe có thể được thiết kế dựa trên những trình tự có sẵn tuỳ vào mục
đích của từng thí nghiệm và các thông tin đã có: Dựa trên trình tự DNA hệ
gen của đối tượng nghiên cứu để nhận diện các bản sao của gene hoặc sản
phẩm RNA của gen; Dựa trên trình tự DNA hệ gen của các sinh vật có quan
hệ gần gũi với đối tượng nghiên cứu nhằm tìm kiếm gen chức năng được bảo
tồn qua tiến hoá; Dựa trên trình tự axit amin của protein là sản phẩm của
gene. Từ đó tìm kiếm trình tự trọn vẹn của gene mã hoá cho protein đó trên

toàn bộ hệ gee [10].
Trong quá trình thiết kế cần bảo đảm 1) tính đặc trưng của probe, 2)
không có hiện tượng lai chéo các probe hoặc tạo cấu trúc không gian nội tại
trong probe, 3) giá trị nhiệt biến tính (Tm) phải phù hợp khi thực hiện phép lai
nhiều probe một lúc [14].

Vũ Trường Đức – 1302.K20

11

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

1.4 Cơ sở dữ liệu DNA metagenome của vi sinh ruột mối
Bộ cơ sở dữ liệu thu được từ nghiên cứu ứng dụng kỹ thuật
metagenomics theo hướng phân tích dữ liệu thu được từ việc giải toàn bộ
trình tự metagenome. Do và đồng tác giả đã khai thác được 125.431 khung
đọc mở (ORF) với tổng chiều dài lên tới 78.271.365 bp của hệ vi khuẩn sống
tự do trong ruột mối, trong đó ước đoán gồm rất nhiều trình tự mã hóa cho
enzyme xylan 1-4 beta xylosidase hay gọi tắt là enzyme beta xylosidase [3].
Bộ cơ sở dữ liệu này được sử dụng để khai thác các trình tự mã hóa cho các
enzyme mong muốn.

Vũ Trường Đức – 1302.K20

12


Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

PHẦN II: VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Vật liệu nghiên cứu
2.1.1 Đối tượng nghiên cứu
Dữ liệu metgenome DNA gồm 125.431 khung đọc mở (ORF) của vi
sinh vật cộng sinh trong ruột mối C. gestroi, được giải trình tự bằng hệ thống
giải trình tự HiSeq Illuminia (BGI, Hồng Kông) và được chú giải chức năng
dựa trên KEGG [3].
2.1.2 Thiết bị nghiên cứu
Máy tính cá nhân hoặc máy tính để bàn có cài bộ dữ liệu metagenome
DNA của vi khuẩn cộng sinh trong ruột mối được kết nối với mạng internet.
2.2 Phương pháp nghiên cứu
2.2.1 Xác định các họ GH có chứa enzyme xylan 1-4 beta xylosidase theo
CAZy
Nguyên tắc:
CAZy là một hệ thống phân loại chứa cơ sở dữ liệu về enzyme tham
gia vào quá trình tổng hợp, trao đổi và vận chuyển carbohydrate được lưu trữ
tại trang thông tin điện tử . CAZy cung cấp số liệu trực
tuyến và cập nhật liên tục các dữ liệu của GenBank về chuỗi thông tin của gần
340.000 enzyme [1], [13]. Đến năm 2015, CAZy chứa 135 họ GH với các đặc
điểm nhận biết khác nhau.
Cách tiến hành:
- Tìm kiếm mã số quốc tế của enzyme xylan 1-4 beta xylosidase:

+ Truy cập internet;
Vũ Trường Đức – 1302.K20

13

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

+ Nhập tên enzyme xylan 1-4 beta xylosidase và mã số quốc tế;
+ Bấm enter.
+ Cửa sổ kết quả hiện ra chứa mã số enzyme, bắt đầu bằng EC.
- Sử dụng dữ liệu phân loại của CAZy để xác định có bao nhiêu họ GH
chứa enzyme xylan 1-4 beta xylosidase:
+ Truy cập trang CAZy ();
+ Chọn Enzym classes;
+ Chọn Glycoside Hydrolases để tìm các họ GH có chứa enzyme xylan
1-4 beta xylosidase
+ Bấm vào từng họ GH để tìm enzyme xylan 1-4 beta xylosidase
+ Thống kê kết quả vào một bảng kết quả.
+ Tìm hiểu về cấu trúc không gian: Lựa chọn từng họ GH có chứa
enzyme xylan 1-4 beta xylosidase để tìm kiếm các trình tự axit amin của
enzyme xylan 1-4 beta xylosidase đã được xác định đặc tính.
- Tổng hợp kết quả thành bảng phân loại danh sách các họ GH chứa
enzyme này để tìm hiểu các thông tin sâu hơn.
2.2.2 Tìm kiếm các trình tự axit amin của enzyme xylan 1-4 beta
xylosidase đã được xác định đặc tính

Nguyên tắc:
Dựa trên các thông tin phân loại của xylan 1-4 beta xylosidase trong
các họ GH từ CAZy, chúng tôi tiếp tục tiến hành tìm kiếm các nghiên cứu
trên thế giới đã công bố về trình tự axit amin và các đặc tính như khả năng
chịu nhiệt, chịu kiềm/axit, cấu trúc không gian, trung tâm hoạt động xylan 1-4
beta xylosidase.
Vũ Trường Đức – 1302.K20

14

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

Cách tiến hành:
+ Truy cập trang CAZy ();
+ Chọn protein có mã số EC. 3.2.1.37
+ Cửa sổ danh sách các protein xuất hiện cùng mã số GenBank;
+ Chọn mã số GenBank tương ứng, bấm enter.
+ Chọn mã bài báo trong PUBMED, bấm enter để truy cập bài báo và
đọc thông tin về protein.
+ Nếu protein trong bài có các thông tin hữu ích thì quay trở lại trang
GenBank để copy trình tự axit amin.
+ Các trình tự được ghi chú mã số, tên của chúng. Các trình tự được
trình bày trong file word.
2.2.3 Xác định mức độ tương đồng của các trình tự bằng ClustalW PBIL
Nguyên tắc:

ClustalW - PBIL là phần mềm cho phép so sánh nhiều trình tự nucleotit
hoặc axit amin và đưa ra bức tranh tổng thể và tính toán các điểm tương đồng
giữa các trình tự khác nhau. Kết quả so sánh của phần mềm này sẽ cho ra một
trình tự được cho là bảo tồn cao nhất (Ký hiệu Prim.cons), đồng thời cũng sử
dụng màu sắc đặc trưng chỉ ra các vị trí mà axit amin giống nhau hoàn toàn
hoặc một phần giữa các trình tự để người dùng dễ dàng quan sát và phân tích.
Sau khi nhập dữ liệu ClustalW-PBIL sẽ tính toán và trả kết quả sau vài phút
tùy vào số lượng trình tự cần so sánh. Tất cả trình tự axit amin thu thập được
của enzyme xylan 1-4 beta xylosidase sẽ so sánh với nhau cho từng họ GH
bằng ClustalW - PBIL.

Vũ Trường Đức – 1302.K20

15

Khóa luận tốt nghiệp


VIỆN ĐẠI HỌC MỞ HÀ NỘI

KHOA CÔNG NGHỆ SINH HỌC

Cách tiến hành:
+ Đặt tên cho các trình tự;
+ Loại bỏ các chữ số, ký tự space;
+ Truy cập trang Web: />+ Chọn ClustalW - PBIL, enter.
+ Copy toàn bộ các trình tự và dán vào ô cửa sổ, bấm submit.
+ Ghi nhận kết quả so sánh các trình tự.
2.2.4 Xây dựng probe và giá trị tham chiếu
Nguyên tắc:

Phân tích kết quả của ClustalW - PBIL, giúp cho việc xây dựng các
probe cho từng nhóm GH. Dựa trên kết quả của Prim.cons các vị trí giống
nhau hoặc tương đối giống nhau sẽ ưu tiên lựa chọn để làm probe và các trình
tự khác nhau quá nhiều sẽ được loại bỏ. Probe này sẽ được so sánh lại với các
trình tự đã nghiên cứu để xác định giá trị tham chiếu về mức độ bao phủ và
tương đồng của probe với trình tự đã sử dụng bằng BLASTP. Trên cơ sở giá
trị tham chiếu của probe để lựa chọn các gen mã hóa cho xylan 1-4 beta
xylosidase từ số liệu DNA metagenome của vi sinh vật trong ruột mối.
Cách tiến hành:
- Rà soát và ưu tiên lựa chọn các các vị trí giống nhau hoặc tương đối
giống nhau dựa vào kết quả so sánh các trình tự axit amin bằng ClustalW PBIL, và kết quả của Prim.cons.
- Loại bỏ các trình tự khác nhau quá nhiều.
- Trình tự giống nhau hoặc tương đối giống nhau giữa các trình tự có
được từ sự so sánh được gọi là probe.

Vũ Trường Đức – 1302.K20

16

Khóa luận tốt nghiệp


×