Tải bản đầy đủ (.doc) (180 trang)

Nghiên cứu đánh giá sự đa dạng và vai trò của một số module trong cấu trúc enzyme thủy phân cellulose từ khu hệ vi sinh vật trong dạ cỏ của dê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.06 MB, 180 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------

Nguyễn Khánh Hoàng Việt

NGHIÊN CỨU ĐÁNH GIÁ SỰ ĐA DẠNG VÀ VAI TRÒ CỦA
MỘT SỐ MODULE TRONG CẤU TRÚC ENZYME THỦY PHÂN
CELLULOSE TỪ KHU HỆ VI SINH VẬT TRONG DẠ CỎ CỦA DÊ

LUẬN ÁN TIẾN SĨ SINH HỌC

Hà Nội – 2020


BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------

Nguyễn Khánh Hoàng Việt

NGHIÊN CỨU ĐÁNH GIÁ SỰ ĐA DẠNG VÀ VAI TRÒ CỦA
MỘT SỐ MODULE TRONG CẤU TRÚC ENZYME THỦY PHÂN


CELLULOSE TỪ KHU HỆ VI SINH VẬT TRONG DẠ CỎ CỦA DÊ

Chuyên ngành: Công nghệ sinh học
Mã số: 9.42.02.01

LUẬN ÁN TIẾN SĨ SINH HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. GS. TS. Trương Nam Hải
2. PGS. TS. Đỗ Thị Huyền

Hà Nội – 2020


i

LỜI CAM ĐOAN
Luận án này là công trình nghiên cứu được thực hiện chủ yếu bởi cá nhân tôi
dưới sự hướng dẫn khoa học của GS. TS. Trƣơng Nam Hải và PGS. TS. Đỗ Thị
Huyền. Phần lớn kết quả nghiên cứu đã được đăng tải trên các bài báo khoa học,
một phần khác chưa được công bố. Các số liệu và kết quả nghiên cứu được trình
bày trong luận văn này hoàn toàn trung thực.
Tôi xin hoàn toàn chịu trách nhiệm về lời cam đoan này.
Nghiên cứu sinh

Nguyễn Khánh Hoàng Việt


ii


LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc tới GS. TS. Trƣơng Nam Hải, nguyên
Viện trưởng Viện Công nghệ sinh học và PGS. TS. Đỗ Thị Huyền, trưởng phòng
Kỹ thuật di truyền, Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ
Việt Nam đã định hướng nghiên cứu, hướng dẫn, chỉ bảo tận tình và tạo mọi điều
kiện cho tôi hoàn thành luận án này.
Tôi xin bày tỏ lòng cảm ơn sâu sắc tới các cán bộ, thầy cô tại Học viện Khoa
học và Công nghệ, và Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công
nghệ Việt Nam đã giảng dạy và chỉ bảo cho tôi kiến thức chuyên môn và các kỹ
năng cần thiết, cũng như tạo mọi điều kiện thuận lợi cho tôi trong quá trình học tập
và làm thủ tục bảo vệ luận án.
Tôi xin chân thành cảm ơn tập thể Phòng Kỹ thuật di truyền, Viện Công nghệ
sinh học - nơi tôi thực hiện luận án này - đã giúp đỡ, chỉ bảo tận tình cũng như chia
sẻ những kinh nghiệm chuyên môn quý báu.
Để hoàn thành luận án này, tôi xin gửi lời cảm ơn tới thủ trưởng và các đồng
chí tại nơi tôi công tác là Viện Công nghệ mới, Viện Khoa học và Công nghệ quân
sự đã luôn động viên, khuyến khích, hỗ trợ về mọi mặt cho tôi trong suốt thời gian
học tập và nghiên cứu luận án.
Tôi xin cảm ơn sự hỗ trợ kinh phí từ Đề tài độc lập cấp Nhà nước (Mã số:
ĐTĐLCN.15/14) và Đề tài thuộc hướng KH&CN ưu tiên cấp Viện Hàn lâm KHCNVN (Mã số: VAST02.05/18-19) do PGS. TS. Đỗ Thị Huyền làm chủ nhiệm.
Cuối cùng, tôi xin gửi lời cảm ơn tới gia đình, bạn bè và những người thân đã
luôn bên cạnh động viên, giúp đỡ, chia sẻ những khó khăn và tạo điều kiện tốt nhất
cho tôi học tập, nghiên cứu và hoàn thiện luận án của mình.
Hà Nội, ngày

tháng

năm 2020

Nghiên cứu sinh

Nguyễn Khánh Hoàng Việt


iii

MỤC LỤC
LỜI CAM ĐOAN.....................................................................................................i
LỜI CẢM ƠN.......................................................................................................... ii
MỤC LỤC..............................................................................................................iii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT…………….…………….….vii
DANH MỤC CÁC BẢNG…………………………………………………………..……….ix
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ……...………………………………………… xx
MỞ ĐẦU.................................................................................................................. 1
CHƢƠNG 1. TỔNG QUAN..................................................................................5
1.1. Tổng quan về cellulose.....................................................................................5
1.1.1. Thành phần và cấu trúc của cellulose.......................................................5
1.1.2. Vai trò của sinh khối cellulose trong nền kinh tế sinh học........................8
1.2. Cellulase.......................................................................................................... 10
1.2.1. Khái quát chung về celllulase................................................................. 10
1.2.2. Nguồn gốc của cellulase......................................................................... 12
1.2.3. Cấu trúc của cellulase............................................................................. 14
1.2.4. Cellulosome............................................................................................ 20
1.2.5. Cơ chế thủy phân cellulose..................................................................... 21
1.2.6. Ứng dụng của cellulase........................................................................... 23
1.3. Ứng dụng của Metagenomics trong khai thác gen....................................... 25
1.3.1. Khái quát về Metagenomics.................................................................... 25
1.3.2. Các phương pháp tiếp cận gen mới bằng kỹ thuật Metagenomics..........28
1.3.2.1. Metagenomics dựa vào chức năng................................................... 28
1.3.2.2. Metagenomics dựa vào giải trình tự DNA đa hệ gen........................29
1.3.3. Ứng dụng của Metagenomics trong khai thác gen.................................. 30

1.3.3.1. Khai thác gen mới ứng dụng trong công nghiệp...............................30
1.3.3.2. Khai thác gen mới mã hóa cho cellulase.......................................... 31
1.3.3.3. Sàng lọc gen mã hóa cellulase từ dạ cỏ dê....................................... 32
CHƢƠNG 2. ĐỐI TƢỢNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU................35
2.1. Đối tƣợng, vật liệu hóa chất và thiết bị máy móc........................................ 35
2.1.1. Đối tượng và vật liệu nghiên cứu............................................................ 35
2.1.2. Hóa chất và thiết bị máy móc.................................................................. 35


iv

2.1.2.1. Hoá chất và môi trường.................................................................... 35
2.1.2.2. Máy móc và thiết bị.......................................................................... 37
2.2. Phƣơng pháp nghiên cứu............................................................................... 38
2.2.1. Các phương pháp sinh học phân tử, vi sinh vật......................................38
2.2.1.1. Biến nạp DNA plasmid vào vi khuẩn E. coli..................................... 38
2.2.1.2. Tách chiết DNA plasmid từ tế bào vi khuẩn E. coli..........................38
2.2.1.3. Cắt và ghép nối gen.......................................................................... 38
2.2.1.4. Điện di trên gel agarose................................................................... 39
2.2.1.5. Tinh chế DNA từ gel agarose............................................................ 40
2.2.1.6. Tối ưu mã và tổng hợp gen mã hóa enzyme thủy phân cellulose......40
2.2.1.7. Thiết kế vector biểu hiện................................................................... 40
2.2.2. Các phương pháp hóa sinh protein......................................................... 43
2.2.2.1. Biểu hiện protein tái tổ hợp trong E. coli.........................................43
2.2.2.2. Điện di protein trên gel polyacrylamide........................................... 43
2.2.2.3. Tinh chế protein bằng sắc kí ái lực his-tag....................................... 44
2.2.2.4. Xác định độ sạch của enzyme bằng Quantity One............................45
2.2.2.5. Định lượng protein bằng phương pháp Bradford.............................45
2.2.2.6. Xác định hoạt tính endoglucanase.................................................... 46
2.2.2.7. Đánh giá ảnh hưởng của SFn3 và SXFn3 đến CMC và giấy lọc......48

2.2.2.8. Ảnh hưởng của nhiệt độ, pH, ion kim loại, hóa chất lên enzyme......50
2.2.2.9. Xác định độ bền nhiệt của enzyme.................................................... 51
2.2.2.10. Xác định thông số động học của enzyme........................................51
2.2.3. Các phương pháp tin sinh học................................................................ 43
2.2.3.1. Phương pháp nghiên cứu Pfam của các trình tự..............................52
2.2.3.2. Nghiên cứu vùng bảo thủ và cấu trúc bậc ba của các trình tự.........52
2.2.3.3. Dự đoán khả năng chịu kiềm/acid.................................................... 53
2.2.3.4. Dự đoán khả năng chịu nhiệt của enzyme........................................54
2.2.4. Xử lý số liệu............................................................................................ 54
CHƢƠNG 3. KẾT QUẢ VÀ THẢO LUẬN....................................................... 55
3.1. Đánh giá sự đa dạng GH và cấu trúc module của cellulase......................... 55
3.1.1. Đánh giá sự đa dạng và cấu trúc các họ GH cellulase...........................55
3.1.2. Đánh giá đa dạng cấu trúc cellulase hoàn thiện có cấu trúc module......57
3.1.3. Đánh giá đa dạng nguồn gốc các ORF mã hóa cellulase.......................61
3.1.4. Đánh giá mức độ tương đồng của các trình tự axit amin suy diễn..........64


v

3.1.5. Ước đoán một số tính chất vật lý của enzyme suy diễn từ trình tự..........65
3.2. Nghiên cứu lựa chọn các trình tự có cấu trúc module điển hình................68
3.2.1. Khảo sát cấu trúc bậc 3 của trình tự chứa module FN3.........................68
3.2.2. Khảo sát giá trị pI, pH của trình tự chứa module FN3...........................70
3.3. Tách dòng gen XFn3Egc................................................................................ 72
3.3.1. Phân tích tối ưu mã bộ ba của trình tự XFn3Egc.................................... 72
3.3.2. Tạo vector biểu hiện pETSUMO mang các gen...................................... 74
3.3.3. Chọn dòng các plasmid pETSUMO mang gen........................................ 74
3.3.3.1. Chọn dòng vector pETSUMO-Fn3................................................... 75
3.3.3.2. Chọn dòng vector pETSUMO-Egc................................................... 76
3.3.3.3. Chọn dòng vector pETSUMO-Fn3Egc............................................. 76

3.3.3.4. Chọn dòng vector pETSUMO-XFn3Egc........................................... 77
3.3.3.5. Chọn dòng vector pETSUMO-XFn3................................................. 78
3.4. Biểu hiện các gen trong tế bào E. coli............................................................ 79
3.4.1. Khảo sát điều kiện biểu hiện các gen...................................................... 79
3.4.2. Kiểm tra protein tái tổ hợp được biểu hiện ở pha tan.............................81
3.4.3. Kiểm tra hoạt tính endoglucanase.......................................................... 82
3.5. Tinh chế protein tái tổ hợp và xác định hoạt tính........................................85
3.5.1. Tinh chế protein tái tổ hợp...................................................................... 85
3.5.1.1. Tinh chế protein SFn3....................................................................... 85
3.5.1.2. Tinh chế protein SFn3Egc................................................................ 86
3.5.1.3. Tinh chế protein SXFn3Egc.............................................................. 87
3.5.1.4. Tinh chế protein SXFn3.................................................................... 89
3.5.2. Đánh giá hoạt tính của các protein sau tinh chế..................................... 90
3.5.2.1. Đánh giá hoạt tính riêng rẽ của các protein trên cơ chất CMC.......90
3.5.2.2. Đánh giá SFn3, SXFn3 làm tăng hoạt tính của enzyme trên CMC...91
3.5.2.3. Đánh giá SFn3, SXFn3 làm tăng hoạt tính enzyme trên giấy lọc.....92
3.5.3. Đánh giá khả năng Fn3 làm tăng ái lực của enzyme với cơ chất............94
3.5.3.1. Trên cơ chất CMC............................................................................ 95
3.5.3.2. Trên cơ chất giấy lọc........................................................................ 97
3.5.3.3. Đánh giá khả năng nới lỏng cấu trúc tinh thể trên bề mặt giấy lọc .. 98

3.5.4. Ảnh hưởng của nhiệt độ, pH lên sự hấp phụ SFn3, SXFn3 với cơ chất 99
3.5.4.1. Ảnh hưởng của pH lên sự hấp phụ của SFn3, SXFn3 với cơ chất....99
3.5.4.2. Ảnh hưởng của nhiệt độ đến sự hấp phụ SFn3, SXFn3 với cơ chất
100


vi

3.6. Đánh giá một số tính chất của enzyme có cấu trúc hoàn thiện.................101

3.6.1. Ảnh hưởng của pH đến hoạt tính của SXFn3Egc..................................101
3.6.2. Ảnh hưởng của nhiệt độ đến hoạt tính của SXFn3Egc..........................103
3.6.3. Đánh giá độ bền nhiệt của SXFn3Egc..................................................104
3.6.4. Ảnh hưởng của ion kim loại, hóa chất đến hoạt tính của SXFn3Egc .. 105
3.6.5. Đặc điểm động học của XFn3Egc.........................................................108
KẾT LUẬN..........................................................................................................110
DANH MỤC CÔNG TRÌNH LIÊN QUAN ĐẾN LUẬN ÁN ……….…………. 112
TÀI LIỆU THAM KHẢO...................................................................................113
PHỤ LỤC.............................................................................................................136


vii

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Tên viết tắt
Tên tiếng Anh
Bacterial
artificial
BAC
chromosome
BG
Beta-glucosidase
Basic Local
Alignment
BLAST
Search Tool
bp
CBH
CBD
CBM

CD
CE

Nghĩa tiếng Việt
Nhiễm sắc thể nhân tạo của vi
khuẩn
Beta-glucosidase
Công cụ so sánh mức độ tương
đồng về trình tự nucleotit/axit
amin trực tuyến của NCBI
Cặp base
Cellobiohydrolase
binding Vùng liên kết với carbohydrate

Base pair
Cellobiohydrolase
Carbohydrate
domain
Cellulose binding module
Catalytic domain
Carbohydrate esterase

Vùng liên kết với cellulose
Vùng xúc tác
Carbohydrate esterase
DNA được tổng hợp từ khuôn
cDNA
Complementary DNA
mRNA nhờ enzyme phiên mã
ngược reverse transcriptase

CMC
Carboxymethyl cellulose
Carboxymethyl cellulose
Cơ sở dữ liệu protein của sinh vật
nhân sơ và nhân chuẩn đơn bào/cơ
Clusters of
Orthologous sở dữ liệu từ 7 hệ gen sinh vật
COG/KOG Groups/euKaryotic
nhân chuẩn (3 loài động vật, 1 loài
Orthologous Groups
thực vật, Arabidopsis thaliana, 2
loài nấm và các ký sinh trùng nội
bào)
CSDL
Cơ sở dữ liệu
DNA
Deoxyribonucleic acid
Axit deoxyribonucleic
DNS/DNSA 3,5-Dinitrosalicylic acid
Axit 3,5-dinitrosalicylic
dNTP
2’-deoxyribonucleoside
5’- 2’-deoxyribonucleoside
5’triphosphate
triphosphate
EDTA
Ethylene diamine tetraacetic
Axit ethylene diamine tetraacetic
acid
EG

Endoglucanase
Endoglucanase
Evolutionary genealogy of Cơ sở dữ liệu chứa các nhóm
genes:
Non-supervised orthologous (các gen trong
các
eggNOG
Orthologous Groups
loài khác nhau được tiến hóa từ
một tổ tiên chung)
Fn3
Fibronectin type III module
Module FN3
9
GB
Gigabyte
Gigabyte (10 byte)
His (H)
Histidine
Axit amin histidin
HPLC
High performance liquid
Sắc ký lỏng hiệu năng cao
chromatography
HTS
High throughput sequencing
Giải trình tự thông lượng cao
Ig
Immunoglobulin module
Module Ig



viii

Tên viết tắt
IPTG
Kb
kDa
KEGG
Km
LB
LBA
MB
MEGAN
NCBI
NGS
NR
OD
ORF
PCR
PE
PFAM
pH
pNPG
pNPX
RDP
RNA
SDS
SDS-PAGE
TEMED

Vmax
VSSA
w/v

Tên tiếng Anh
Isopropy-β-D
thiogalactosidase
Kilobase
Kilodalton
Kyoto Encyclopedia
Genes and Genomes

Nghĩa tiếng Việt
Isopropy-β-D-thiogalactosidase

Kilobase (1000 cặp bazơ)
Đơn vị đo trọng lượng của protein
of Cơ sở dữ liệu về bộ gen, con
đường sinh học, bệnh tật và các
chất hóa học
Michaelis constant
Nồng độ cơ chất để tốc độ phản
ứng đạt ½ tốc độ tối đa
Luria-Betani
Môi trường nuôi cấy LB
Môi trường nuôi cấy LB bổ sung
Luria-Betani ampicillin
ampicillin
6
Megabyte

Megabyte (10 byte)
Phần mềm phân tích tối ưu các
MEtaGeneomic ANalyser
trình tự đa hệ gen
National
Center
for Trung tâm quốc gia về thông tin
Biotechnology Information
công nghệ sinh học
Next-generation sequencing
Đọc trình tự thế hệ mới
Cơ sở dữ liệu chứa các trình tự
Non-redundant
hoàn toàn giống nhau đã được hợp
nhất từ ngân hàng gen
Optimal density
Mật độ quang học
Open reading frame
Khung đọc mở
Polymarase chain reaction
Phản ứng chuỗi trùng hợp
Read (đoạn trình tự ADN ngắn
riêng rẽ) có cả hai đầu tương đồng
Pair-end
với contig (đoạn trình tự ADN
thường được gộp từ các read)
Protein families
Các họ protein
+
Hydrogen power

Chỉ số đo nồng độ ion H , ion OH
trong dung dịch
p-nitrophenol-β-glucoside
p-nitrophenol-β-glucoside
4-nitrophenyl
β-D- 4-nitrophenyl β-D-xylopyranoside
xylopyranoside
Cơ sở dữ liệu trình tự rARN tiểu
Ribosomal Database Project
đơn vị nhỏ của vi khuẩn và vi
khuẩn cổ
Ribonucleic acid
Axit ribonucleic
Sodium dodecyl sulphate
Sodium dodecyl sulphate
SDS-polyacrylamide
gel Điện di trên gel polyacrylamide
electrophoresis
biến tính
Tetramethylethylenediamine
Tetramethylethylenediamine
Maximum velocity
Vận tốc tối đa
Vietnam
Sugar
and Hiệp hội Mía đường Việt Nam
Sugarcane Association
Weight/volume
Khối lượng/thể tích



ix

DANH MỤC BẢNG
Bảng 1.1. Tỷ lệ cellulose trong một số nguồn lignocellulose phổ biến
Bảng 1.2. Một số vi sinh vật thủy phân cellulose được xác định từ dạ cỏ

11
14

Bảng 1.3. Một số ứng dụng của cellulase

23

Bảng 2.1. Các cặp mồi dùng để thiết kế tách dòng gen bằng PCR

35

Bảng 2.2. Thành phần phản ứng cắt thu vector pET22b-SUMO và gen

39

XFn3Egc
Bảng 2.3. Vị trí các gen và phương pháp thu nhận gen để tách dòng

41

Bảng 2.4. Thành phần phản ứng và chương trình PCR khuếch đại các gen

41


Bảng 2.5. Thành phần gel polylacrylamide biến tính và không biến tính

44

Bảng 3.1. Tổng hợp các trình tự được chú giải mã hóa cho các enzyme thủy

56

phân cellulose bởi dữ liệu COG và KEGG
Bảng 3.2. Kết quả so sánh trình tự tương đồng của vùng X trên trình tự

70

Bảng 3.3. Ước đoán một số tính chất của trình tự 13359

71

Bảng 3.4. Tổng hợp đặc điểm của các gen tách dòng và ước đoán đặc điểm

79

của protein do các gen mã hóa


x

DANH MỤC HÌNH
Hình 1.1. Thành tế bào ở thực vật với thành phần chính là lignocellulose bao
gồm cellulose, hemicellulose và lignin liên kết chặt chẽ với nhau


5

Hình 1.2. Cấu trúc phân tử và sự liên kết giữa các sợi cellulose

6

Hình 1.3. Sự liên kết của các sợi cellulose

7

Hình 1.4. Lượng nhiên liệu được yêu cầu sản xuất từ nguồn nguyên liệu tái

10

tạo từ năm 2008 đến năm 2022 tại Mỹ
Hình 1.5. Cấu trúc Cellulase Cel7A từ Trichoderma reesei

15

Hình 1.6. Cấu trúc module của một số cellulase từ Thermobifida fusca

16

Hình 1.7. Cấu trúc tinh thể beta-glucanase từ loài A. aculeatus có chứa FN3

17

Hình 1.8


19

Cấu trúc tinh thể của cellulase BlCel5B của Bacillus licheniformis

Hình 1.9. Một mô hình cấu trúc cellulosome tham gia thủy phân cellulose

21

Hình 1.10. Cơ chế phân hủy/khử polimer hóa cellulose bằng cellulase

23

Hình 2.1. Các bước chính được thực hiện trong công trình nghiên cứu

38

Hình 2.2. Các gen XFn3, Fn3Egc, Fn3, Egc được thiết kế để tách dòng và

41

biểu hiện riêng rẽ từ gen có cấu trúc module XFn3Egc
Hình 2.3. Sơ đồ qui trình đưa các gen Fn3, Egc, Fn3Egc, XFn3Egc, XFn3 vào

42

vector biểu hiện pETSUMO
Hình 2.4. Đường chuẩn thể hiện sự phụ thuộc OD595 vào hàm lượng BSA

46


Hình 2.5. Đường chuẩn glucose biểu thị sự phụ thuộc OD540 vào glucose
Hình 2.6. Sự phụ thuộc tốc độ vào nồng độ cơ chất theo Lineweaver-Burk

47

Hình 3.1. Cấu trúc của 148 trình tự hoàn thiện có chứa module FN3 hoặc Ig

60

Hình 3.2. Phân tích cấu trúc của vi khuẩn dạ cỏ dê chứa các gen phân giải

62

52

cellulose
Hình 3.3. Các loài vi khuẩn phổ biến nhất mang gen cellulase được khai thác

63

từ dữ liệu đa hệ gen dạ cỏ dê Việt Nam
Hình 3.4. Độ tương đồng của 243 trình tự có chứa cấu trúc module FN3 và Ig

64

dựa trên cơ sở dữ liệu CAZy
Hình 3.5. Độ tương đồng của 243 trình tự có chứa cấu trúc module FN3 và Ig

65


dựa trên cơ sở dữ liệu CAZy
Hình 3.6. Đặc điểm suy diễn về khả năng bền nhiệt (a), khoảng pH hoạt động

66


xi

(b) và giá trị pI của các trình tự có cấu trúc module (c)
Hình 3.7. Kết quả khảo sát vùng bảo thủ trên các trình tự bằng SwissProt

69

Hình 3.8. Kết quả khảo sát vùng bảo thủ trên các trình tự bằng Phyre2

70

Hình 3.9. Khả năng sử dụng các mã bộ ba trên gen (A) và mức độ phù hợp mã 72
bộ ba (B) của gen mã hóa XFn3Egc
Hình 3.10. Trình tự gen XFn3Egc và trình tự acid amin của nó sau khi được tối

73

ưu các mã bộ ba để biểu hiện trên chủng E. coli
Hình 3.11. Điện di đồ kiểm tra gen Fn3, Egc, Fn3Egc, XFn3 XFn3Egc và

74

vector
Hình 3.12. Điện di đồ kiểm tra các dòng plasmid pETSUMO- fn3 (A) và sản


75

phẩm cắt kiểm tra plasmid pETSUMO-Fn3 (B)
Hình 3.13. Điện di đồ kiểm tra các dòng plasmid pETSUMO- Egc (A) và sản

76

phẩm cắt kiểm tra plasmid pETSUMO-Egc (B)
Hình 3.14. Điện di đồ kiểm tra các dòng plasmid pETSUMO- Fn3Egc (A) và

77

sản phẩm cắt kiểm tra plasmid pETSUMO-Fn3Egc (B)
Hình 3.15. Điện di đồ kiểm tra các dòng plasmid pETSUMO- XFn3Egc (A) và

78

sản phẩm cắt kiểm tra plasmid pETSUMO-XFn3Egc (B)
Hình 3.16. Điện di đồ kiểm tra các dòng plasmid pETSUMO- XFn3 (A) và sản

78

phẩm cắt plasmid pETSUMO-XFn3 (B)
Hình 3.17. Điện di đồ kiểm tra protein SFn3, SEgc, SFn3Egc, SXFn3,

81

SXFn3Egc của các dòng E. coli tái tổ hợp tương ứng
Hình 3.18. Điện di đồ SFn3, SEgc, SFn3Egc, SXFn3Egc, SXFn3 được biểu


82

hiện trong E. coli BL21
Hình 3.19. Thử hoạt tính SFn3, SFn3Egc, SXFn3Egc, SXFn3 được biểu hiện

84

Hình 3.20. Điện di đồ kiểm tra sản phẩm các phân đoạn tinh chế enzyme SFn3

86

bằng cột sắc ký ái lực His-tag trên gel polyacrylamide 12,6%
Hình 3.21. Kiểm tra độ sạch của SFn3 tái tổ hợp bằng phần mềm Quantity One

86

Hình 3.22. Điện di đồ kiểm tra sản phẩm trong các phân đoạn tinh chế enzyme

87

SFn3Egc bằng cột sắc ký ái lực His-tag
Hình 3.23. Kiểm tra độ sạch SFn3Egc tái tổ hợp bằng phần mềm Quantity One

87

Hình 3.24. Điện di đồ kiểm tra sản phẩm trong các phân đoạn tinh chế
SXFn3Egc bằng cột sắc ký ái lực His-tag trên gel polyacrylamide

88



xii

12,6% có SDS
Hình 3.25. Kiểm tra độ sạch SXFn3Egc tái tổ hợp bằng Quantity One

88

Hình 3.26. Điện di đồ kiểm tra sản phẩm trong các phân đoạn tinh chế enzyme
SXFn3 bằng cột sắc ký ái lực His-tag trên gel polyacrylamide

89

12,6%
Hình 3.27. Kiểm tra độ sạch của SXFn3 tái tổ hợp bằng Quantity One

89

Hình 3.28. Thử hoạt tính các protein SFn3, SFn3Egc, SXFn3Egc, SXFn3 sau

90

tinh chế trên đĩa thạch CMC-agar
Hình 3.29. Kiểm tra hoạt tính riêng rẽ và phối trộn của các protein sau tinh chế

92

trên cơ chất CMC
Hình 3.30. Kiểm tra hoạt tính riêng rẽ và phối trộn của các protein sau tinh chế


93

trên cơ chất giấy lọc
Hình 3.31. Đánh giá vai trò của SFn3 và SXFn3 khi hấp phụ trên cơ chất CMC

95

đến hoạt tính của các protein SFn3Egc, SXFn3Egc
Hình 3.32. Kiểm tra khả năng SFn3, SXFn3 làm tăng ái lực của enzyme với cơ

96

chất CMC
Hình 3.33. Đánh giá vai trò của SFn3 và SXFn3 khi hấp phụ trên cơ chất giấy

98

lọc đến hoạt tính của các protein SFn3Egc, SXFn3Egc
Hình 3.34. Ảnh SEM cấu trúc và bề mặt các sợi cellulose của giấy lọc

99

Hình 3.35. Ảnh hưởng của pH lên sự hấp phụ của SFn3 và SXFn3 với giấy lọc 100
Hình 3.36. Ảnh hưởng của nhiệt độ lên sự hấp phụ của SFn3, SXFn3 với giấy lọc 101
Hình 3.37. Ảnh hưởng của pH đến hoạt tính của SXFn3Egc

102

Hình 3.38. Ảnh hưởng của nhiệt độ đến hoạt tính của SXFn3Egc


103

o

o

o

Hình 3.39. Hoạt tính còn lại của SXFn3Egc khi được ủ ở 30 C, 40 C, 50 C,

105

o

60 C trong thời gian từ 30 phút đến 90 phút
Hình 3.40. Ảnh hưởng của một số ion kim loại lên hoạt tính của SXFn3Egc
Hình 3.41. Ảnh hưởng của nồng độ ion Mn

2+

đến hoạt tính tương đối của

106
107

endoglucanase SXFn3Egc trên cơ chất CMC
Hình 3.42. Ảnh hưởng của một số hóa chất lên hoạt tính của enzyme

108


Hình 3.43. Động học enzyme tái tổ hợp SXFn3Egc trên nguồn cơ chất CMC

109


1

MỞ ĐẦU
Vi sinh vật nói chung và vi khuẩn nói riêng có ý nghĩa thực tiễn vô cùng to
lớn đối với loài người thông qua các ứng dụng trong nhiều lĩnh vực như là y học,
nông nghiệp, công nghiệp, xử lý ô nhiễm môi trường. Do đó, các nghiên cứu về sự
đa dạng các trình tự từ vi sinh vật nhằm phát hiện những gen mới để khai thác và
ứng dụng chúng vào phục vụ cuộc sống luôn là chủ đề quan trọng được các nhà sinh
học đặc biệt quan tâm. Mặc dù vậy, các phát hiện gần đây cho thấy phần lớn
(khoảng 99%) các loài vi sinh vật trong môi trường là chưa nuôi cấy được. Do vậy,
nghiên cứu dựa vào phương pháp nuôi cấy thông thường sẽ không thể khai thác
được toàn bộ nguồn gen có tiềm năng của vi sinh vật. Trong giai đoạn gần đây,
thông qua kỹ thuật Metagenomics giải trình tự toàn bộ hệ gen của tất cả các vi sinh
vật được thu nhận trực tiếp từ mẫu môi trường, các gen từ vi sinh vật, kể cả vi sinh
vật không nuôi cấy đã được nghiên cứu, đánh giá một cách tổng thể.
Tại nước ta, cùng với sự phát triển của ngành nông nghiệp với qui mô sản
xuất ngày càng lớn và tập trung như hiện nay, các phụ phẩm nông nghiệp mà trong
đó nguồn sinh khối lignocellulose chiếm phần lớn đang chủ yếu bị đốt bỏ gây lãng
phí và ảnh hưởng xấu đến môi trường. Trong khi đó, nhân loại đang phải đối mặt
với tình trạng suy kiệt nguồn nguyên liệu hóa thạch cũng như hệ quả nghiêm trọng
của việc tích tụ khí thải nhà kính. Việc nghiên cứu sử dụng nguồn năng lượng
carbonhydrate từ nguyên liệu có khả năng tái tạo với trữ lượng khổng lồ như
lignocellulose là hết sức cấp thiết để tạo ra các sản phẩm thay thế các nhiên liệu
được sản xuất từ nguyên liệu hóa thạch.

Lignocellulose nói chung hay cellulose nói riêng là sinh khối có cấu trúc
vững chắc, được chuyển hóa theo nhiều bước để tạo thành sản phẩm cuối cùng mà
trong đó giai đoạn đường hóa đóng vai trò then chốt. Trong quá trình này, cellulase
được xác định là nhân tố chính quyết định tới hiệu suất chuyển hóa và giá thành của
sản phẩm. Do vậy, trong những năm gần đây trên thế giới có rất nhiều công trình
nghiên cứu tìm kiếm nguồn cellulase mới có hoạt tính cao, có ái lực mạnh với cơ
chất để chuyển hóa hiệu quả cellulose. Khác với enzyme khác, phần lớn các
cellulase có cấu trúc module, có nghĩa là ngoài vùng có chức năng xúc tác, enzyme
còn chứa thêm một số module khác có cấu trúc độc lập và ít được nghiên cứu, điển


2

hình như module FN3, Ig, CBM. Hiện nay trên thế giới, nghiên cứu về vai trò của
các module chưa biết chức năng đến hoạt tính xúc tác của cellulase chưa được công
bố nhiều. Nhiều giả thiết cho rằng, chúng không chỉ tồn tại như một vùng nối liên
kết các vùng hoạt tính mà chúng còn thể hiện nhiều chức năng sinh học quan trọng
khác như ổn định cấu trúc, làm tăng ái lực của enzyme với cơ chất. Vì vậy, nghiên
cứu làm rõ vai trò sinh học của các module này trong cấu trúc của cellulase là hết
sức có ý nghĩa cho việc lựa chọn hoặc thiết kế các enzyme để nâng cao hiệu quả
thủy phân nguồn sinh khối cellulose.
Từ năm 2014 đến năm 2017, bằng nguồn kinh phí của Đề tài độc lập cấp Nhà
nước (Mã số: ĐTĐLCN.15/14), phòng Kỹ thuật di truyền (Viện CNSH, Viện
HLKH&CNVN) đã giải mã DNA đa hệ gen của hệ vi khuẩn trong dạ cỏ dê chăn thả
tự nhiên trên núi tại tỉnh Ninh Bình và Thanh Hóa. Kết quả, từ 8,6 Gb dữ liệu trình
tự, đề tài đã khai thác được 816 trình tự mã hóa cho cellulase. Trong nghiên cứu
này, chúng tôi hướng tới việc đánh giá đa dạng các trình tự cellulase có cấu trúc
module, tìm ra cấu trúc module đặc thù mới cho nghiên cứu vai trò của module đến
hoạt tính của enzyme. Do đó, chúng tôi đã thực hiện Luận án: “Nghiên cứu đánh
giá sự đa dạng và vai trò của một số module trong cấu trúc enzyme thủy phân

cellulose từ khu hệ vi sinh vật trong trong dạ cỏ của dê”.
● Mục tiêu nghiên cứu:
- Nghiên cứu đánh giá đa dạng cellulase và cellulase có cấu trúc module từ
khu hệ vi khuẩn trong dạ cỏ dê bằng kỹ thuật Metagenomics;
- Nghiên cứu vai trò của module chưa rõ chức năng (FN3 hoặc Ig) lên hoạt
tính của cellulase.
● Nội dung nghiên cứu:
Để đạt được mục tiêu của đề tài, chúng tôi đã thực hiện các nội dung nghiên
cứu chính sau:
1. Phân tích, đánh giá đa dạng họ GH, nguồn gốc cellulase và các cellulase
có cấu trúc module được mã hóa từ các khung đọc mở trong dữ liệu giải trình tự
DNA đa hệ gen của vi sinh vật dạ cỏ dê tại Việt Nam.


3

2. Phân tích lựa chọn trình tự có cấu trúc module điển hình cho nghiên cứu
biểu hiện, xác định vai trò của vùng chưa biết chức năng.
3. Nghiên cứu biểu hiện, tinh chế enzyme từ trình tự được lựa chọn
(SXFn3Egc) và các gen chứa module của nó (Fn3, XFn3, Egc, Fn3Egc) dưới dạng
dung hợp với SUMO.
4. Nghiên cứu vai trò của module chưa biết chức năng đến khả năng phân
giải cellulose của enzyme.
5. Nghiên cứu, đánh giá một số tính chất của enzyme tái tổ hợp được biểu
hiện từ trình tự được lựa chọn có cấu trúc module.
● Những đóng góp mới của Luận án:
1. Từ 816 ORF mã hóa cellulase của vi khuẩn dạ cỏ dê Việt Nam, 243 ORF
mã hóa cellulase được xác định có cấu trúc chứa module chưa rõ chức năng là FN3
hoặc Ig. Trong số các cellulase hoàn thiện chứa module FN3, 99,2% FN3 đi kèm
với module xúc tác betaglucosidase GH3 và chỉ có một FN3 đi kèm với module xúc

tác endoglucanase GH5. Toàn bộ module Ig đều đi kèm với module xúc tác
endoglucanase GH9. Cấu trúc mã hóa endoglucanase GH5 chứa module FN3 là cấu
trúc mới ít được phát hiện và nghiên cứu.
2. Đã tổng hợp và biểu hiện trình tự mã hóa endoglucanase GH5 (XFn3Egc)
và các cấu trúc chứa module khác nhau (Fn3, XFn3, Fn3Egc, Egc) trong E. coli để
nghiên cứu vai trò của FN3 trong cấu trúc của enzyme. Module FN3 được xác định
có khả năng làm tăng tính tan và ổn định cấu trúc vùng xúc tác, nới lỏng các cấu
trúc tinh thể trên bề mặt giấy lọc, giúp enzyme tiếp cận cơ chất tốt hơn. Module
FN3 còn làm tăng ái lực của enzyme lên cơ chất tan là CMC.
o

3. SXFn3Egc hoạt động tối ưu ở 40 C, pH 4. Enzyme ổn định và bền ở nhiệt
o

độ dưới 60 C trong 90 phút. Km đạt 1,26 mg/ml và Vmax đạt 148,12 µmol/min/ml.
Hoạt tính enzyme tăng 2 lần khi sử dụng 40 mM Mn
2+

2+

2+

+

2+

2+

2+


2+

và giảm khi bổ sung các ion

3+

kim loại (Ca , Mg , Ni , K , Co , Cu , Zn , Fe ), và 6 loại hóa chất (SDS,
urea, 2-mercaptoethanol, EDTA, tween 80, triton X-100).
● Ý nghĩa khoa học và thực tiễn của Luận án:
*

Ý nghĩa khoa học:


4

Luận án đã khai thác và nghiên cứu cấu trúc của endoglucanase GH5 chứa
module FN3 là cấu trúc mới, ít được nghiên cứu và công bố trên thế giới. Module
FN3 trong cấu trúc này được chứng minh có khả năng ổn định cấu trúc vùng xúc
tác, nới lỏng các cấu trúc tinh thể trên bề mặt giấy lọc, giúp enzyme tiếp cận cơ chất
tốt hơn. Module FN3 còn làm tăng ái lực của enzyme với cơ chất tan là CMC.
* Ý nghĩa thực tiễn:
Xác định được vai trò của module FN3 trong cấu trúc endoglucanase GH5 là
cơ sở để thiết kế các enzyme chứa các module bổ sung hoặc enzyme cocktail phù
hợp có khả năng phân giải cellulose hiệu quả, ứng dụng trong sản xuất các nhiên
liệu sinh học thế hệ mới và xử lý ô nhiễm môi trường.


5


CHƢƠNG 1. TỔNG QUAN
1.1. Tổng quan về cellulose
1.1.1. Thành phần và cấu trúc của cellulose
Cellulose cùng với hemicellulose và lignin là 3 thành phần chính cấu thành
nên sinh khối lignocellulose (Hình 1.1). Đây là thành phần cấu tạo chủ yếu của
thành tế bào thực vật thân gỗ và các thực vật khác như cỏ, lúa, ngô… Các thành
phần của lignocellulose trong các loài thực vật khác nhau thường có tỷ lệ khác nhau
nhưng cellulose thường chiếm tỷ lệ cao nhất (38-50%) so với hemicellulose (2332%) và lignin (15-25%) [1], [2]. Đặc biệt, cellulose chiếm tỷ lệ khá cao ở một số
nguyên liệu như giấy thải từ bột giấy hoá học (60-70%), giấy (85-99%), sợi cotton
(95-97%) [3]. Ở thực vật, cellulose được tạo thành nhờ quá trình quang hợp và
thường phân bố ít ở lá so với ở thân cây [4]. Cellulose là thành phần có vai trò quan
trọng để giữ cho cấu trúc của thành tế bào thực vật ổn định [5]. Bên cạnh đó,
cellulose cũng được tổng hợp bởi một số vi khuẩn và động vật nguyên sinh có vai
trò chủ yếu để tạo màng bảo vệ tế bào. Cellulose từ vi khuẩn được xác định có cấu
trúc siêu mịn, độ tinh khiết và khả năng phân hủy sinh học cao hơn so với cellulose
từ nguồn thực vật [6].

Cellulose
Thành tế
bào thực vật

VI SỢI

Thực vật

Liên kết hydro

Tế bào thực vật

Hình 1.1. Thành tế bào ở thực vật với thành phần chính là lignocellulose bao gồm

cellulose, hemicellulose và lignin liên kết chặt chẽ với nhau [7]


6

Cellulose và hemicellulose là các đại phân tử mạch thẳng cấu tạo từ các gốc
đường khác nhau, còn lignin là một polymer dạng vòng được tổng hợp từ tiền
phenylpropanoid. Các thành phần này liên kết với nhau chủ yếu bằng các liên kết
hydro để tạo cấu trúc khối vững chắc là lignocellulose [8]. Cellulose có công thức
cấu tạo là (C6H10O5)n hay được viết dưới dạng [C6H7O2(OH)3]n (do mỗi mắt xích
của cellulose có chứa 3 nhóm –OH). Khối lượng phân tử của cellulose rất lớn
(khoảng 1.000.000 – 2.400.000 đvC), tùy thuộc vào giá trị n. Giá trị n thể hiện số
lượng các đơn phân và phụ thuộc vào loại nguyên liệu cellulose. Thông thường, mỗi
chuỗi cellulose ở thành tế bào thực vật nói chung có khoảng 5.000-7.000 đơn phân.
Ví dụ, trong gỗ có khoảng 10.000 đơn phân và trong bông có khoảng 15.000 đơn
phân. Do đó, khối lượng phân tử trung bình của cellulose ở bông có thể lên tới
khoảng 2.400.000 đvC [9]. Các đơn phân β-D-glucose liên kết với nhau bằng liên
kết β-1,4-glucoside tạo thành một chuỗi thẳng. Nhóm hydroxyl của chuỗi này tạo
liên kết hydro với phân tử oxy của chuỗi bên cạnh (liên kết hydro liên phân tử) hoặc
trên cùng chuỗi (liên kết hydro nội phân tử) hình thành cấu trúc tinh thể chắc chắn,
khó bị phân hủy [10], [11], [12] (Hình 1.2).

Hình 1.2. Cấu trúc hóa học và sự liên kết giữa các phân tử cellulose [12]
Từ năm 1913, Nishikawa và Ono đã phát hiện ra cấu trúc và sự sắp xếp của
các sợi cellulose dựa trên phương pháp nhiễu xạ tia X [13]. Phát hiện cho thấy
cellulose riêng lẻ có xu hướng tự sắp xếp theo cách có tổ chức cao dẫn đến trạng


7


thái kết tinh. Dựa trên phát hiện này, các nhà khoa học đã xây dựng mô hình
Fringed fibrillar. Trong mô hình này, các sợi cellulose liên kết với nhau tạo thành 2
vùng có cấu trúc khác nhau là vùng kết tinh và vùng vô định hình (Hình 1.3). Tại
vùng kết tinh, cellulose rất bền dưới tác động của điều kiện ngoại cảnh, không bị tấn
công bởi enzyme và hóa chất. Các mạch cellulose liên kết với nhau nhờ lực Van der
Waals và liên kết hydro (do nhóm hydroxyl thứ nhất của mạch này nối với với nhóm
hydroxyl ở mạch khác). Trong vùng vô định hình, các mạch cellulose liên kết với
nhau nhờ lực Van der Waals có lực liên kết không mạnh nên dễ bị tác động bởi các
yếu tố bên ngoài [14]. Ngoài ra, vùng vô định hình dễ bị tấn công bởi các tác nhân
thủy phân hơn vùng kết tinh do tại vùng này không tạo được liên kết hydro và sự
thay đổi góc của các liên kết cộng hóa trị (β-glycoside) làm giảm độ bền nhiệt động
của liên kết [14].
Vùng kết tinh

Không gian giữa
các sợi cellulose

Vùng vô định hình

Hình 1.3. Sự liên kết của các sợi cellulose tạo thành các vùng vô định hình và vùng
kết tinh [13]
Tính chất hóa học và khả năng phản ứng của cellulose được xác định bởi sự
có mặt của ba nhóm hydroxyl (OH) trong các đơn phân glucose (gồm một nhóm
chính và hai nhóm thứ cấp). Các nhóm hydroxyl đóng một vai trò quan trọng cho sự
hòa tan của cellulose [13]. Cellulose không hòa tan trong nước và các dung môi hữu
cơ do các nhóm -OH tạo ra liên kết hydro nội phân tử và giữa các phân tử cellulose
kề nhau làm cho cấu trúc của cellulose rất bền vững. Để phá hủy cellulose, các liên
kết hydro cần được phá vỡ đầu tiên [15]. Khi thủy phân cellulose bằng H 2SO4 đặc,
cellulose sẽ chuyển thành glucose; khi thủy phân cellulose với axit loãng, cellulose
sẽ tạo thành các cellobiose là một disaccharide bao gồm hai phân tử β-glucose liên

kết với nhau bởi liên kết β-1,4-glucoside [16].


8

Nhờ có các liên kết hydro và lực Van der Waals, các chuỗi cellulose liên kết
với nhau tạo thành bó vi sợi có cấu trúc vững chắc [17]. Người và hầu hết các loài
động vật không tiêu hóa được cellulose nhưng nhiều loài động vật ăn cỏ như động
vật nhai lại (trâu, bò, dê…) có khả năng tạo ra các cellulase để tiêu hóa nguồn thức
ăn này. Cellulase còn được sản xuất bởi một số động vật như loài mối (động vật
nguyên sinh) hoặc nấm đất. Do đó, chỉ những loài này mới có thể sử dụng cellulose
như là nguồn cung cấp năng lượng. Cellulose cũng được xác định có vai trò điều
hòa sự tiêu hóa thức ăn trong hệ tiêu hóa của đa số các loài động vật [10].
1.1.2. Vai trò của sinh khối cellulose trong nền kinh tế sinh học
Cellulose được xem như nguồn nguyên liệu vô tận cho nhiều ứng dụng trong
công nghiệp thực phẩm, y tế và sản xuất các nhiên liệu, vật liệu mới [18]. Từ thế kỷ
thứ 19, công nghệ sinh học đã được ứng dụng để sản xuất nhiên liệu sinh học. Sau
đó, nhiên liệu sinh học dần bị thay thế bởi nguồn nhiên liệu sẵn có như dầu thô, than
đá để phục vụ cho nhiều ngành công nghiệp hiện đại [19]. Tuy nhiên, nguyên liệu
hóa thạch là nguồn không tái tạo, gây phát sinh khí thải nhà kính, làm biến đổi khí
hậu [20], [21]. Do đó, nền công nghiệp dựa vào nhiên liệu từ nguồn sinh khối phổ
biến như cellulose hay lignocellulose là xu hướng phát triển bền vững cả về mặt
kinh tế và môi trường [22].
Sinh khối lignocellulose được tạo ra thông qua quá trình quang hợp được coi
là nguồn carbon hữu cơ bền vững duy nhất trên trái đất dùng cho sản xuất nhiên liệu
sinh học và hóa chất tinh khiết [23], [24]. Nguồn sinh khối tự nhiên này có trữ
lượng rất lớn, có mặt ở hầu hết các phế phụ phẩm nông, lâm, công nghiệp (rơm rạ,
bã mía, mùn gỗ, vỏ trấu...), có ưu điểm như giảm lượng khí thải CO2, có khả năng
tái tạo và phân hủy sinh học cao [25], [26]. Trong đó, sinh khối cellulose là nguồn
nguyên liệu phong phú, chiếm tỷ lệ lớn nhất trong các nguồn nguyên liệu giàu

lignocellulose trong tự nhiên [27], [28], [29]. Khoảng một nửa số carbon hữu cơ
trong sinh quyển hiện diện dưới dạng cellulose, do đó việc nghiên cứu chuyển đổi
cellulose thành nhiên liệu hay hóa chất có giá trị trở nên rất quan trọng [27], [28],
[23].

Ở nhiều nước trên thế giới trong đó có Việt Nam, chỉ một phần phế phụ phẩm

nông nghiệp được dùng để sản xuất phân bón, giá thể trồng nấm, trồng rau sạch,


9

dùng cho đun nấu hoặc ép bánh than hay dùng trong chăn nuôi, còn lại phần rất lớn
nguồn sinh khối từ đồng ruộng đang bị vứt bỏ hoặc đốt gây lãng phí và ô nhiễm môi
trường. Theo Hiệp hội Mía đường Việt Nam (VSSA), mỗi năm các nhà máy sản
xuất đường ép trên 15 triệu tấn mía và phát sinh ra 4,5 triệu tấn bã mía (cellulose
chiếm khoảng 40-55% trong bã mía sấy khô). Trong đó, bã mía phần lớn được mang
đốt. Theo ước tính nếu đốt 1 tấn bã mía khô sẽ thải ra 36,32 kg khí CO, 4,54 kg
hydrocarbon và 3,18 kg bụi tro. Các khí thải này là nguyên nhân gây hiệu ứng nhà
kính và ô nhiễm môi trường [30], [31]. Như vậy, nhiên liệu sinh học được sản xuất
từ các nguồn nguyên liệu trong nước như sinh khối cellulose sẽ giúp tăng cường an
ninh năng lượng, mang lại lợi ích môi trường và giúp phát triển kinh tế trong nhiều
lĩnh vực, đặc biệt là nông nghiệp.
Sinh khối cellulose được xác định có thể sử dụng để sản xuất nhanh chóng
các nhiên liệu sinh học với chi phí thấp hơn so với các nguồn sinh khối khác trong
nông nghiệp như tinh bột ngô, đậu nành, đường mía, và rẻ hơn đáng kể so với dầu
thô [32]. Nguồn nhiên liệu từ sinh khối cellulose được xác định có khả năng làm
giảm lượng khí thải nhà kính cao nhất tới 60%. Hiện nay, sinh khối cellulose đã
được nghiên cứu chuyển hóa thành nhiều sản phẩm có giá trị như nhiên liệu sinh
học dạng lỏng (ethanol, butanol), dạng khí (hydro) và các hóa chất tinh khiết,...

[33], [34], [35], [36]. Sản xuất nhiên liệu sinh học dạng lỏng trên thế giới được dự
báo từ nay tới năm 2030 sẽ tăng từ 1,9 triệu thùng lên 5,9 triệu thùng mỗi ngày [37].
Mỹ dự kiến sẽ sản xuất nhiên liệu sinh học với lượng khoảng 136 tỷ lít vào năm
2022 và ưu tiên tăng dần nhiên liệu có nguồn gốc từ sinh khối cellulose (61 triệu lít)
so với nhiên liệu được sản xuất từ nguyên liệu thông thường như từ nguồn tinh bột
và nguồn sinh khối khác [38], [39] (Hình 1.4). Phòng Năng lượng (Department of
Energy (DOE)) và Phòng Nông nghiệp (Department of Agriculture (USDA)) của
Mỹ đã được giao kế hoạch đưa vào sử dụng 5% năng lượng nhiệt, điện, 20% nhiên
liệu lỏng cho giao thông và 25% nguyên liệu, hóa chất có nguồn gốc từ sinh khối
vào năm 2022 [40].


10

Hình 1.4. Lượng nhiên liệu được yêu cầu sản xuất từ nguồn sinh khối cellulose tăng
dần trong giai đoạn từ năm 2008 đến năm 2022 tại Mỹ [39]
Mặc dù sinh khối cellulose từ thực vật là nguồn tài nguyên sinh học tự nhiên
rất dồi dào nhưng do cấu trúc của thành tế bào thực vật với thành phần chính là
lignocellulose hoạt động như một hàng rào bảo vệ tự nhiên, cực kỳ khó phân hủy
nên thách thức quan trọng là cách chuyển đổi nguồn nguyên liệu này thành các sản
phẩm có giá trị [41]. Để sử dụng một cách hiệu quả nguồn sinh khối chứa cellulose,
nhiều enzyme đã và đang được nghiên cứu để thủy phân cellulose thay cho việc sử
dụng hóa chất như các axit mạnh. Phương pháp thủy phân nguồn sinh khối cellulose
bằng enzyme có lợi thế như chi phí thiết bị thấp hơn, không gây ô nhiễm môi
trường, năng suất tạo ra glucose cao hơn mà không làm giảm sản phẩm đường hoặc
các sản phẩm phụ [42]. Nhiều loại enzyme phân giải cellulose đã được xác định có
nguồn gốc đa dạng, với nhiều dạng cấu trúc và cơ chế phân cắt khác nhau [43].
1.2. Cellulase
1.2.1. Khái quát chung về celllulase
Cellulase (EC 3.2.1.4) là một trong ba nhóm enzyme chính bên cạnh

hemicellulase và ligninase tham gia thủy phân sinh khối lignocellulose. Trong các
nhóm enzyme này, cellulase là nhóm enzyme quan trọng nhất vì chúng có khả năng
cắt mối liên kết β-1,4-glycoside trong phân tử cellulose tạo thành các sản phẩm
cello-oligosaccharide, cellobiose và glucose-đường chứa nhiều năng lượng và được
sử dụng hiệu quả nhất cho việc lên men chuyển hóa thành sản phẩm có giá trị như


11

các loại nhiên liệu sinh học dạng lỏng [44], [45]. Dựa trên sự tương đồng của trình
tự axit amin, thành phần cấu tạo và cấu trúc vùng xúc tác, cellulase được xếp vào
nhóm glycoside hydrolase (GH) là enzyme xúc tác cho phản ứng thủy phân các liên
kết glycoside có trong các đường phức. Vùng xúc tác của các enzyme thuộc nhóm
GH có thể tạo cấu trúc thuộc một trong 3 dạng theo vị trí hoạt động là dạng túi
(pocket), dạng đường hầm (tunnel) và dạng rãnh/khe (cleft) [46]. Cấu trúc không
gian vùng xúc tác của cellulase thường có dạng rãnh ở endoglucanase và dạng
đường hầm ở exoglucanase [44]. Các enzyme thuộc nhóm GH được phân loại và có
sẵn trên cơ sở dữ liệu CAZy (Carbohydrate-Active Enzymes) [47]. Tính đến tháng 6
năm 2019, các enzyme này được nhóm vào 165 họ [48], [49]. Trong đó, các
cellulase như endoglucanase (EC 3.2.1.4), β-glucosidase (EC 3.2.1.21), αglucosidase (EC 3.2.1.20), glucan 1,4-α-glucosidase đã được phát hiện tới 30 họ GH
khác nhau. Dựa vào kiểu xúc tác, cellulase của vi khuẩn được chia thành 7 loại
chính (Bảng 1.1).
Bảng 1.1. Các nhóm cellulase thuộc các họ GH khác nhau của vi khuẩn [49], [50]
Tên enzyme
Endo-β-1,4-D-

Số E.C

glucanase (Endo -1,4 E.C. 3.2.1.4
β-D-glucanglucanohydrolase)

Exoglucanase

Họ GH
5, 6, 7,
8, 10,
12, 44,
51, 61,
74
5, 6, 7,

(cellobiohydrolase) E.C.3.2.1.91 9, 10, 48
Exoglucanase
(Cellodextrinase) E.C. 3.2.1.74
β-glucosidase

E.C.3.2.1.21

Cellobiose
E.C.2.4.1.49
phosphorylase
1,4-β-D-oligoglucanorthophosphate
E.C.2.4.1.20
α-D-glucosyltransferase
Cellobiose 2E.C.5.1.3.11
epimerase

-

Hoạt tính
Phân cắt ngẫu nhiên các vị trí bên

trong chuỗi polysaccharide hay
cellulose
thành
các
oligo
saccharide ngắn có đầu chuỗi mới.
Thủy phân endo-β-1,4-D-glucan
Thủy phân β-1,4-D-glucoside của
cellulose, cellotetraose giải phóng
cellobiose từ đầu không khử

Loại bỏ cellobiose từ cellooligo
saccharide hoặc nitrophenyl-β-Dcellobioside

1,3,9
94
-

-

Thủy phâncellodextrinvà
cellobiose thành D-glucose từ đầu
không khử
Xúc tác sự phân cắt cellobiose tạo
thành glucose khi có mặt H3PO4
Xúc tác phản ứng phân cắt
cellodextrin từ cellotriose đến
cellohexose
Xúc tác phản ứng chuyển hóa
cellobiose

thành
4-O-β-Dglucosylmannose


×