Tải bản đầy đủ (.pdf) (27 trang)

tóm tắt luận án tiến sĩ Nghiên cứu sàng lọc gene mã hoá enzyme tham gia thủy phân cellulose từ khu hệ vi sinh vật trong ruột mối bằng kỹ thuật Metagenomics

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.38 MB, 27 trang )

1

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN




Nguyễn Thị Thảo



NGHIÊN CỨU SÀNG LỌC GENE MÃ HÓA ENZYME THAM GIA THỦY PHÂN
CELLULOSE TỪ KHU HỆ VI SINH VẬT TRONG RUỘT MỐI BẰNG KỸ THUẬT
METAGENOMICS



Chuyên ngành: Di truyền học
Mã số: 62420121



TÓM TẮT DỰ THẢO LUẬN ÁN TIẾN SĨ SINH HỌC




Hà Nội - 2014
2


Công trình đƣợc hoàn thành tại:
Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Trƣờng Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội


Ngƣời hƣớng dẫn khoa học: 1. GS. TS. Trƣơng Nam Hải
2. TS. Đỗ Thị Huyền

Phản biện:
1.

2.

3.

Dự thảo luận án sẽ đƣợc bảo vệ trƣớc Hội đồng cấp Đại học Quốc gia chấm
luận án tiến sĩ họp tại Trƣờng Đại học Khoa học Tự nhiên
vào hồi giờ ngày tháng năm



Có thể tìm hiểu luận án tại:
- Thƣ viện Quốc gia Hà Nội
- Trung tâm thông tin – Thƣ viện, Đại học quốc gia Hà Nội
3
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Cellulase là nhóm enzyme đƣợc sử dụng phổ biến trong các ngành công nghiệp nhƣ
chế biến thực phẩm, chế biến thức ăn, sản xuất giấy, sản xuất rƣợu, sản xuất bia, công nghệ
dệt…. Đặc biệt, cellulase đang đƣợc quan tâm nghiên cứu ứng dụng trong sản xuất nhiên

liệu sinh học nhƣ cồn sinh học từ nguồn phế phẩm lignocellulose dồi dào thay thế cho
nguồn nhiên liệu hóa thạch đang trên đà cạn kiệt. Trong vòng 25 năm qua, sản lƣợng cồn
sinh học đã tăng trƣởng và đạt mức nhảy vọt kể từ năm 2000. Cồn sinh học có thể đƣợc
dùng nhƣ nguồn nhiên liệu độc lập cho các loại xe có động cơ chuyên biệt hoặc làm phụ gia
nhiên liệu cho loại xe có động cơ truyền thống với tỉ lệ lên đến 30%. Ở nƣớc ta, ƣớc tính hàng
năm, nguồn nguyên liệu lignocellulose từ phế phẩm nông nghiệp nhƣ rơm, rạ, lá mía và bã
cây mía bỏ phí lên đến 50 triệu tấn. Các biện pháp xử lý nguồn phế phẩm này chủ yếu là
đốt đã gây ra những ảnh hƣởng tiêu cực đến môi trƣờng sống và sức khoẻ con ngƣời. Việc
tận dụng đƣợc nguồn nguyên vật liệu lignocellulose phế phẩm này vào sản xuất cồn sinh
học sẽ đem đến nhiều lợi ích to lớn cho môi trƣờng cũng nhƣ cho nền kinh tế của nƣớc ta.
Việc sử dụng cellulase thay thế các hoá chất truyền thống nhƣ acid, kiềm và nhiệt
độ cao vào trong quá trình sản xuất của các ngành công nghiệp đã giải quyết đƣợc nhiều
vấn đề nhƣ hạn chế ô nhiễm môi trƣờng và bảo vệ đƣợc sức khoẻ ngƣời lao động cũng nhƣ
tăng hiệu quả sản xuất. Tuy nhiên, vấn đề đặt ra là cần thiết phải có đƣợc nguồn cellulase
hoạt động ở điều kiện pH và nhiệt độ thích hợp cho các quá trình sản xuất đó. Hơn nữa,
việc sản xuất cồn sinh học đang gặp một số khó khăn trong việc giảm chi phí sản xuất đặc
biệt là nguồn cellulase để phân cắt cellulose thành glucose hiệu quả. Do đó, vấn đề quan
trọng nhất là tìm ra đƣợc nguồn cellulase mới phù hợp với điều kiện sản xuất của các
ngành công nghiệp liên quan, phát triển các phức hợp cellulase hiệu quả và ổn định để
khắc phục khó khăn trong quá trình sản xuất.
Metagenomics là kỹ thuật cho phép thu nhận trực tiếp DNA đa hệ gene của toàn bộ
các vi sinh vật trong môi trƣờng sống nhất định. Chính vì lợi thế là thu nhận và phân tích
đƣợc tất cả hệ gene của vi sinh vật phong phú và đa dạng, đặc biết là 99% vi sinh vật
không nuôi cấy đƣợc mà Metagenomics trở thành công cụ giúp các nhà nghiên cứu khai
thác nguồn gene mới hiệu quả nhất. Thực tế đã chứng minh, sau 20 năm phát triển, đặc biệt
là khoảng 5 năm gần đây, khi kỹ thuật giải mã gene thế hệ mới đƣợc áp dụng,
Metagenomics đã đƣợc sử dụng rất hiệu quả để tìm hiểu sự đa dạng vi sinh vật cũng nhƣ
4
khai thác các gene mới từ nhiều môi trƣờng sống khác nhau nhƣ nƣớc, đất, các đƣờng tiêu
hóa, phế thải, …

Mối đóng một vai trò quan trọng đối với hệ sinh thái bởi khả năng phân hủy sinh
khối lignocellulose và góp phần vào chu trình carbon. Khả năng phân hủy hiệu quả
lignocellulose của mối là kết quả hoạt động tổng hợp của các enzyme cellulase và
hemicellulase đƣợc tiết ra từ bản thân mối và từ vi sinh vật sống cộng sinh trong ruột mối.
Trong đó, hệ vi sinh vật cộng sinh trong ruột mối đóng vai trò quan trọng trong việc tiêu
hóa hiệu quả nguồn thức ăn lignocellulose của mối. Vì vậy, ruột mối là một nguồn gene
cellulase phong phú cần đƣợc khai thác nhằm tìm ra các enzyme mới liên quan đến sự
phân hủy cellulose.
Ở Việt Nam cho đến nay đã tìm thấy hơn 100 loài mối khác nhau. Tuy nhiên, hệ vi
sinh vật của các loài mối ở Việt Nam vẫn chƣa đƣợc nghiên cứu vì thế toàn bộ hệ enzyme
thủy phân lignocellulose có nguồn gốc từ vi sinh vật cộng sinh trong ruột mối cũng chƣa
đƣợc điều tra và khảo sát. Với đặc điểm đặc trƣng của quần xã vi sinh vật sống cộng sinh
trong ruột mối và vai trò của chúng giúp vật chủ phân hủy thức ăn, quần xã vi sinh vật ở
mối bậc thấp đƣợc xem là nguồn khai thác gene cellulase mới lý tƣởng sử dụng trong quá
trình thủy phân cellusose. Do đó, để nghiên cứu hệ vi sinh vật ruột mối và khai thác gene
mới mã hóa cellulase từ hệ vi sinh vật tƣơng ứng sống cộng sinh trong ruột hiệu quả,
chúng tôi đã tiến hành đề tài “Nghiên cứu sàng lọc gene mã hoá enzyme tham gia thủy
phân cellulose từ khu hệ vi sinh vật trong ruột mối bằng kỹ thuật Metagenomics”.
2. Mục tiêu của đề tài
1. Đánh giá đƣợc sự đa dạng vi sinh vật ruột mối và đa dạng gene mã hoá cellulase
của chúng.
2. Phân lập, tách dòng và biểu hiện đƣợc một gene mã hoá cellulase từ DNA đa gene
vi sinh vật ruột mối.
3. Xác định đƣợc ảnh hƣởng của một số điều kiện đến hoạt động của protein do gene
tách dòng đƣợc mã hoá.
3. Đối tƣợng và phạm vi nghiên cứu
Nghiên cứu đƣợc tiến hành trên đối tƣợng là vi sinh vật ruột mối thợ Coptotermes
thu thập ở miền Bắc Việt Nam.
4. Nội dung nghiên cứu
1. Xác định đối tƣợng để tách lấy DNA đa hệ gen của vi sinh vật và định danh đối

tƣợng.
5
2. Xây dựng phƣơng pháp để tách chiết và tinh sạch DNA đa hệ gene.
3. Giải trình tự và xử lý trình tự DNA đa hệ gene.
4. Dự đoán gene theo hai khía cạnh là đa dạng vi sinh vật và đa dạng gene từ bộ
dữ liệu trình tự DNA đa hệ gene.
5. Chọn một trình tự gene để thiết mồi, phân lập, tách dòng và biểu hiện.
6. Xác định đặc điểm của sản phẩm biểu hiện gene phân lập đƣợc.
1. Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học
1. Đã định loại đƣợc một loài mối bậc thấp Coptotermes gestroi thu thập ở sáu địa
điểm tại Hà Nội và Hƣng Yên bằng phƣơng pháp phân tử.
2. Đã đánh giá đƣợc sự đa dạng vi sinh vật và đa đạng gene cellulase của vi khuẩn
sống trong ruột mối C. gestroi.
Ý nghĩa thực tiễn
3. Đã phân lập, tách dòng và biểu hiện đƣợc một gene mã hoá endoglucanase. Đây
là enzyme đƣợc ứng dụng rộng rãi trong nhiều ngành công nghiệp.
4. Đóng góp mới của đề tài
1. Đây là nghiên cứu đầu tiên về sự đa dạng vi sinh vật ruột mối bậc thấp C.
gestroi cũng nhƣ đa dạng gen cellulase của chúng.
2. Trình tự của gen đã phân lập, tách dòng và biểu hiện đƣợc có độ sai khác so với
trình tự gene tƣơng ứng của các cơ sở dữ liệu.
5. Bố cục của luận án
Luận án gồm 151 trang bao gồm: phần mở đầu 3 trang; chƣơng 1: tổng quan tài liệu 37
trang; chƣơng 2: đối tƣợng và phƣơng pháp nghiên cứu 22 trang; chƣơng 3: kết quả và
thảo luận 58 trang; kết luận và kiến nghị 2 trang. Các công trình khoa học của tác giả 1
trang. Tài liệu tham khảo 19 trang. Trong luận án có 19 bảng và 62 hình.
Chƣơng 1. TỔNG QUAN TÀI LIỆU
1.1. GIỚI THIỆU CHUNG VỀ LIGNOCELLULOSE
Nêu đại cƣơng về đặc điểm cấu trúc chung của ba thành phần chính cấu tạo nên

lignocellulose là cellulose, hemicellulose và lignin.
1.2. GIỚI THIỆU CHUNG VỀ CELLULASE
Nêu tổng quan về cơ chế hoạt động của cellulase và sự thủy phân cellulose. Cấu
trúc của cellulase.
6
1.3. CELLULASE CỦA VI KHUẨN
Nêu tổng quan về các họ cellulase, đặc biệt các loài vi khuẩn và vi khuẩn cổ tạo ra
cellulase. Đồng thời đặc điểm về nhiệt độ, pH và kích thƣớc cellulase của các vi khuẩn
đƣợc đƣa ra cụ thể. Ngoài ra, phần này còn nêu một số ứng dụng nổi bật của cellulase.
1.4. MỐI VÀ HỆ VI SINH VẬT RUỘT MỐI LIÊN QUAN ĐẾN SỰ THỦY PHÂN
LIGNOCELLULOSE
Sơ lƣợc về mối và đa dạng mối ở Việt Nam. Nêu tổng quan hệ vi sinh vật trong
ruột mối bậc thấp và sự tiêu hóa lignocellulose của mối. Khái quát tính hình nghiên cứu
gene mã hóa cellulase của sinh vật trong đƣờng ruột mối bậc thấp
1.5. KHÁI QUÁT CHUNG VỀ METAGENOMICS
Nếu khái quát: phƣơng pháp tiếp cận tìm gene mới bằng Metagenomics, các nghiên
cứu phân lập gene từ thƣ viện DNA đa hệ gene và hơn phƣơng pháp khai thác và phân lập
gene từ dữ liệu trình tự DNA đa hệ gene. Nêu rõ phƣơng pháp giải trình tự của một số hệ
thống máy thế hệ mới. Đặc biệt, đƣa ra các nghiên cứu ứng dụng của Metagenomics trong
khai thác gene mới và đánh giá sự đa dạng vi sinh vật. Ngoài ra tiềm năng ứng dụng của
Metagenomics cũng đƣợc đề cập.
Chƣơng 2. ĐỐI TƢỢNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU
2.1. ĐỐI TƢỢNG, VẬT LIỆU, HÓA CHẤT VÀ THIỆT BỊ MÁY MÓC
Trong nghiên cứu này, chúng tôi đã sử dụng đối tượng là vi sinh vật ruột mối thuộc
chi Coptotermes do Viện Sinh thái và Bảo vệ công trình cung cấp; các chủng vi sinh vật
dùng làm thể nhận trong thí nghiệm tách dòng gene và làm thể nhận biểu hiện gene;
plasmid sử dụng để tách dòng và biểu hiện gene; các cặp mồi PCR.
Các loại hóa chất sử dụng trong nghiên cứu đều đƣợc đặt mua từ các công ty đạt
tiêu chuẩn quốc tế nhƣ Bio-Lab (Mỹ), Fermentas (Mỹ), Sigma (Mỹ), Merck (Đức).
2.2. PHƢƠNG PHÁP NGHIÊN CỨU

2.2.1. Các phƣơng pháp vi sinh
2.2.2. Các phƣơng pháp sinh học phân tử
2.2.2.1. Tách chiết DNA tổng số của mối
2.2.2.2. Phƣơng pháp thu nhận vi sinh vật ruột mối và tách chiết DNA đa hệ gene của chúng
2.2.2.3. Tinh sạch DNA đa hệ gene bằng phƣơng pháp máng đơn (troughing)
2.2.2.4. Giải trình tự DNA đa hệ gene hiệu năng cao bằng máy giải trình tự thế hệ mới
HiSeq2000 của Illumina

7
2.2.2.5. Phƣơng pháp biến nạp bằng sốc nhiệt DNA plasmid vào vi khuẩn E. coli
2.2.2.6. Phƣơng pháp tách chiết DNA plasmid từ tế bào vi khuẩn E. coli
2.2.2.7. Phƣơng pháp cắt và ghép nối gene
2.2.2.8. Phƣơng pháp tinh sạch DNA từ gel agarose bằng QIAquick Gel Extraction kit
2.2.2.9. Kỹ thuật PCR
2.2.2.10. Thiết kế vector biểu hiện pET22b(+) mang gene egc
2.2.2.11. Điện di DNA trên gel agarose
2.2.2.12. Phƣơng pháp biểu hiện gene
2.2.2.13. Điện di biến tính protein trên gel polyacrylamide-SDS
2.2.2.14. Điện di protein trên gel polyacrylamide không SDS
2.2.3. Các phƣơng pháp hóa sinh protein
2.2.3.1. Phƣơng pháp tinh sạch protein bằng sắc kí ái lực his-tag
2.2.3.2. Định lƣợng protein bằng phƣơng pháp Bradford
2.2.3.3. Định lƣợng đƣờng khử bằng phƣơng pháp DNS
2.2.3.4. Phƣơng pháp xác định hoạt tính endoglucanase
2.2.3.5. Phƣơng pháp xác định hoạt tính β-glucosidase và β-xylosidase
2.2.3.6. Xác định ảnh hƣởng của nhiệt độ, pH, các ion kim loại và một số hóa chất lên hoạt
tính endoglucanase
2.2.3.7. Xác định độ bền của enzyme
2.2.4. Các phƣơng pháp tin sinh học và xử lý số liệu bằng phần mềm sinh học
2.2.4.1. Phân tích trình tự DNA đa hệ gene vi sinh vật ruột mối

2.2.4.2. So sánh trình tự ORF của dữ liệu DNA đa hệ gene với CSDL của NCBI
2.2.4.3. Thiết kế mồi bằng phần mềm FastPCR
2.2.4.4. Kiểm tra vị trí của các enzyme hạn chế trên gene quan tâm bằng phần mềm trực
tuyến RestrictionMapper
2.2.4.5. Chuyển mã trình tự DNA sang trình tự amino acid bằng chƣơng trình dịch mã
ExPASy
2.2.4.6. Xây dựng cây chủng loài của loài mối nghiên cứu với các loài mối khác bằng phần
mềm Genedoc và MEGA5
2.2.4.7. Dự đoán cấu trúc của EGC bằng phần mềm Phyre2
2.2.4.8. Xác định độ tinh sạch của protein EGC tinh sạch đƣợc bằng phần mềm Quantity One
Chƣơng 3. KẾT QUẢ VÀ THẢO LUẬN
3.1. THU THẬP MỐI
3.1.1. Thu thập mối
Từ tháng 4 đến tháng 6 năm 2012, sáu tổ mối đƣợc thu thập ở sáu địa điểm khác
nhau. Các tổ mối thu đƣợc ghi rõ địa điểm, sắp xếp vào các hộp đựng mẫu. Năm địa điểm
8
thu đƣợc mối tại Hà Nội là Văn Quán, Hà Đông; Tản Lĩnh, Ba Vì; Bùi Xƣờng Trạch,
Đống Đa; Thái Hà, Đống Đa; Võng Thị, Tây Hồ và một địa điểm tại tỉnh Văn Lâm, Hƣng
Yên. Trong tổ thu đƣợc có hai đẳng cấp là mối lính và mối thợ. Mối lính thực hiện chức
năng bảo vệ. Còn mối thợ thực hiện chức năng tìm kiếm và dự trữ thức ăn. Chính vì mối
thợ có vai trò then chốt trong tìm kiếm và tiêu hoá thức ăn, dó đó chúng là đối tƣợng quan
trọng đƣợc lựa chọn để tách lấy vi sinh vật đƣờng ruột.
Mối của sáu tổ đều ăn gỗ và có hình dạng bên ngoài giống nhau. Dựa vào hình thái,
rất ngẫu nhiên, cả sáu mẫu mối đƣợc các nhà nghiên cứu thuộc Viện Sinh thái và Bảo vệ
công trình đã định loại ở bậc giống đều là Coptotermes.
3.1.2. Kết quả định loài mối nghiên cứu bằng phƣơng pháp phân tử
3.1.2.1. Tách DNA tổng số của mối
Để xác định loài mối bằng phƣơng pháp phân tử, trƣớc hết, chúng tôi tiến hành tách
chiết DNA tổng số của mối. DNA tổng số mối của cả sáu mẫu thu thập ở sáu địa điểm tách
chiết đƣợc đều nguyên vẹn và có kích thƣớc lớn hơn 10 kb. Mẫu DNA này sẽ đƣợc sử

dụng trực tiếp làm khuôn để khuếch đại đoạn gene ARN ribosome16S (rARN 16S) ti thể.
3.1.2.2. PCR khuếch đại đoạn DNA của gene ARN ribosome 16S ti thể mối



Hình 3.1. Điện di đồ hỗn hợp sản phẩm PCR khuếch đại các đoạn gene mã hóa rARN 16S ti
thể mối bằng hai cặp mồi LR-J-13007, LR-N-13398 và FST-F, FST-R từ khuôn DNA tổng số của
mối Coptotermes trên gel agarose 1,7%. ĐC M: Thang chuẩn 100 bp (Fermentas); các ĐC TH, VT,
BXT, VL, VQ và TL tương ứng là sản phẩm PCR từ khuôn là DNA hệ gene mối thu thập ở Thái
Hà, Võng Thị, Bùi Xương Trạch, Văn Lâm, Văn Quán và Tản Lĩnh.
Hai cặp mồi gồm cặp thứ nhất là LR-J-13007, LR-N-13398 và cặp thứ hai là FST-
F, FST-R đƣợc sử dụng để khuếch đại hai đoạn DNA của gene mã hóa RNA ribosome ti
thể mối. Kết quả là ở 54
o
C, cặp mồi thứ nhất đã khuếch đại hiệu quả đoạn DNA duy nhất
đậm nét, kích thƣớc lớn hơn 400 bp và bé hơn 500 bp từ DNA tổng số của cả sáu mẫu mối.
bp TH VT BXT VL M VQ TL
400
100
Sản phẩm PCR của cặp mồi thứ nhất
Sản phẩm PCR của cặp mồi thứ hai
1000
500
9
Tuy nhiên, chỉ ở 57
o
C, cặp mồi thứ hai mới khuếch đại đƣợc một băng DNA duy nhất kích
thƣớc lớn hơn 100 bp từ hai mẫu khuôn DNA tổng số thu thập ở Văn Quán và Tản Lĩnh,
còn bốn mẫu DNA còn lại không có đoạn DNA nào đƣợc khuếch đại (Hình 3.1). Tất cả
các đoạn DNA khuếch đại đƣợc đều đƣợc đọc và phân tích trình tự nucleotide.

3.1.2.3. Phân tích sản phẩm PCR
Phân tích trình tự nucleotide đoạn DNA được khuếch đại bằng cặp mồi thứ nhất
Trình tự nucleotide của sáu đoạn DNA khuếch đại bằng cặp mồi thứ nhất đƣợc sắp
xếp và so sánh với nhau đã thể hiện rằng tất cả các trình tự đều tƣơng đồng với nhau trong
vùng 430 bp và không có sự khác nhau giữa ba mẫu mối thu thập ở Võng Thị, Văn Lâm và
Bùi Xƣơng Trạch. Tuy nhiên, giữa hai mẫu mối Văn Quán và Thái Hà khác với các nhóm
khác từ 0,5-0,9%; mẫu mối Tản Lĩnh khác với các mẫu mối khác từ 0,5-1,5% (Bảng 3.1).
Đồng thời, mức độ tƣơng đồng trình tự nucleotide của sáu đoạn DNA trên cũng đƣợc so
sánh với các trình tự tƣơng ứng của NCBI bằng BlastN. Kết quả cho thấy có sự giống nhau
rất cao (97-99%) giữa sáu trình tự nghiên cứu với các trình tự tƣơng ứng của C. gestroi
(Bảng 3.2). Để xác định rõ hơn mỗi quan hệ giữa mối Coptotermes nghiên cứu và các loài
thuộc giống này, cây phát sinh loài đƣợc thiết lập bằng phần mềm MEGA5 (Hình 3.2) dựa
vào trình tự vùng 430 bp cùng với 21 trình tự (giống từ 92-99%) của gene tƣơng ứng mã
hoá rARN 16S của các loài mối thuộc giống Coptotermes. Kết quả cho thấy tất cả sáu mẫu
mối thu tại sáu địa điểm nằm hoàn toàn trong nhánh tiến hóa của C. gestroi.
Phân tích trình tự nucelotide đoạn DNA được khuếch đại bằng cặp mồi thứ hai
Hai trình tự nghiên cứu chỉ khác nhau 1 nucleotide duy nhất. Kết quả so sánh mức
giống nhau của hai trình tự nghiên cứu với các trình tự tƣơng ứng của NCBI bằng Blastn
cho thấy, mức giống nhau thể hiện cao nhất (99-100%) đối với các trình tự của
Coptotermes gestroi. (Bảng 3.3). Đồng thời, các trình tự tƣơng ứng trên ngân hàng gene có
mức giống nhau từ 95-100 % so với hai trình tự nghiên cứu và xây dựng cây phát sinh loài
bằng phần mềm MEGA5 thể hiện mỗi quan hệ giữa hai mẫu mối nghiên cứu và các loài
mối thuộc giống Coptotermes. Giống với kết quả phân tích trình tự đoạn 430 bp, cây phát
sinh loài cũng cho thấy hai mẫu mối nghiên cứu nằm hoàn toàn trong nhánh tiến hóa của
C. gestroi.
Nhƣ vậy, những kết quả phân tích trên đã chứng minh đầy đủ và chắc chắn rằng, ở
mức độ phân tử, sáu mẫu mối nghiên cứu thu thập ở sáu địa điểm đều thuộc loài
Coptotermes gestroi.
10


Hình 3.2. Cây phát sinh loài giữa loài mối nghiên cứu và 21 loài khác được xây dựng dựa
trên các trình tự có mức độ giống cao nhất với đoạn DNA kích thước 430 bp được khuếch lại bằng
cặp mồi LR-J-13007 và LR-N-13398.
Bảng 3.1. Tỷ lệ giống nhau và khác nhau về trình tự nucleotide giữa các vùng 430 bp gene
rARN ti thể mối Coptotermes thu thập từ 6 địa điểm.


Tỷ lệ giống nhau (%)
BXT
VQ
VL
TL
TH
VT
BXT

99,1
100
99,5
99,5
100
VQ
4

99,1
98,5
99,5
99,1
VL
0

4

99,5
99,5
100
TL
2
6
2

99,1
99,5
TH
2
2
2
4

99,5
VT
0
4
0
2
2


Số nucleotide khác nhau

CTanLinhVN

CVongThiVN
CHungYenVN
CBuiXuongTrachVN
CgestEF092285SG
CgestDQ004478SG
CgestDQ004480SG
CgestDQ915942SG
CThaiHaVN
CVanQuanVN
CgestDQ004481MY
CgestDQ004487AU
CgestEF156760US
CgestAY558905AG
CgestAY558906TC
CcarvAY558909MY
CkalsAY683211MY
ClactAY558912AU
CformAB626146JP
CformU17778US
CformAB626145JP
CformAY558911CN
CformDQ007344US
CformGU075666CN
CinteAY558904TG
CcrasAY558901BZ
CvastAY558898US
97
65
31
54

100
68
44
43
55
68
70
92
67
39
61
64
62
40
0.005
C. formosanus
C. gestroi
C. carvinatus
C. kalshoveni
C. lacteus
C. intermedius
C. crassus

C. vastator
11

BXT: Bùi Xương Trạch; VQ: Văn Quán; VL: Văn Lâm; TL: Tản Lĩnh; TH: Thái Hà; VT: Võng Thị
Bảng 3.2: Mức độ giống nhau vùng trình tự 430 bp gene rARN 16S của sáu mẫu mối
Coptotermes với trình tự tương ứng của cơ sở dữ liệu NCBI.


Loài
Mã số gene
Địa điểm
Mức độ giống nhau (%)
BXT
VL
TL
TH
VQ
VT
C. formosanus
AB626145
Nhật Bản
93
93
93
94
93
93
C. formosanus
AY558911
Trung Quốc
94
94
93
94
94
94
C. formosanus
U17778

Hoa Kỳ
93
93
93
93
93
93
C. gestroi CgA2
DQ004487
Australia
98
98
97
98
97
98
C. gestroi
AY558905
Đảo Antigua và
Barbuda
99
99
98
99
98
99
C. gestroi
AY558906
Quần đảo Turk và
Caico

98
98
98
98
98
98
C. gestroi CgS3
DQ004478
Singapore
99
99
99
99
99
99
C. gestroi CgF2
EF156760
Hoa Kỳ
98
98
98
98
98
98
C. kalshoveni
AY683211
Malaysia
95
95
94

95
94
95
C. lacteus
AY558912
Australia
93
93
92
93
93
93
C. vastator
AY558898
Hoa Kỳ
93
93
92
93
93
92

(BXT: Bùi Xương Trạch; VQ: Văn Quán; VL: Văn Lâm; TL: Tản Lĩnh; TH: Thái Hà; VT: Võng Thị).
3.2. TÁCH CHIẾT VÀ TINH SẠCH DNA ĐA HỆ GENE VI SINH VẬT SỐNG TRONG RUỘT MỐI
Toàn bộ ruột mối thợ gồm ruột trƣớc, ruột giữa và ruột sau đều đƣợc tách lấy. Sau
đó, DNA đa hệ gene của hệ vi sinh vật ruột mối đƣợc tách lấy và tinh sạch. Kết quả cho
thấy sản phẩm tinh chế chỉ còn một băng DNA đa hệ gene duy nhất đậm nét có kích thƣớc
lơn hơn 10 kb (Hình 3.3).



Để có đủ lƣợng DNA cần thiết cho việc nghiên cứu, chúng tôi đã tách chiết DNA đa
hệ gene vi sinh vật từ khoảng 1.000.000 ruột mối thợ Coptotermes gestroi của sáu mẫu
mối thu thập ở sáu địa điểm và thu đƣợc gần 11 µg DNA đa hệ gene sạch có nồng độ 114
ng/µl và OD
260/280
đạt 1,83. Trong đó, 8,5 µg DNA đa hệ gene đƣợc đọc trình tự.
M 1 kb
10
DNA đa hệ gen
Hình 3.3. Điện di đồ DNA đa hệ gene của hệ vi
sinh vật ruột mối Coptotermes gestroi trên gel agarose
0,8%. ĐC M: Thang chuẩn 1 kb (Fermentas); ĐC 1:
DNA đa hệ gene được tinh chế bằng phương pháp
Máng đơn.
12
3.3. ĐỌC VÀ PHÂN TÍCH TRÌNH TỰ DNA ĐA HỆ GENE VI SINH VẬT RUỘT MỐI Coptotermes
3.3.1. Tập hợp trình tự và xác định gene
Trình tự DNA đa hệ gene vi sinh vật ruột mối C. gestroi đƣợc đọc bằng máy giải trình tự
HiSeq 2000 của Illumina. Dữ liệu gồm các read tốt có tổng kích thƣớc là 5,4 Gb. Những read
tốt này đƣợc sử dụng để tập hợp thành các contig có kích thƣớc dài hơn bằng phần mềm
SOAPdenovo. Với k = 41, phần mềm đã lắp ráp tất cả các read thành các contig tối ƣu nhất
gồm số lƣợng contig nhiều nhất 79.262 contig có tổng chiều dài dài nhất khoảng 90,1 Mb,
kích thƣớc contig dài nhất là 183.853 bp và kích thƣớc contig ngắn nhất là 500 bp. Từ
79.262 contig, phần mềm MetaGeneAnnotator đã dự đoán đƣợc 125.431 ORF.
3.3.2. Đa dạng vi sinh vật ruột mối C. gestroi
Trên cơ sở bộ dữ liệu trình tự DNA đa hệ gene, mức độ đa dạng vi sinh vật ruột
mối C. gestroi đƣợc đánh giá dựa theo hai cách:
Thứ nhất, các read chất lƣợng cao đƣợc so sánh với các trình tự của CSDL. Trong số
đó, 34,07% các read giống với gene vi khuẩn, 0,032% giống với gene của nấm, 3,79% giống
với gene vi sinh vật đƣờng ruột ngƣời và 0,189% giống với trình tự của RDP. Tổng số read

có trình tự giống với CSDL là 206.742.13. Trong đó, tổng số read có trình tự giống với
CSDL của vi khuẩn là 186.147.74. Do đó, nếu chỉ xét riêng các read có trình tự tƣơng đồng
với các CSDL thì số read của vi khuẩn chiếm 90% và chỉ một tỷ lệ nhỏ (< 1%) là của nấm.
Thứ hai, tất cả các ORF đƣợc phần mềm MEGAN (MEtaGeneomic ANalyser)
phân tích dựa vào CSDL NR. Kết quả cho thấy 80% ORF thuộc vi khuẩn, 0,42% thuộc vi
khuẩn cổ, 0,58% thuộc eukaryote, một tỷ lệ nhỏ thuộc vi rút (0,20%) và còn lại 18,79% là
các ORF không dự đoán đƣợc. Từ dữ liệu, tổng số 1.460 loài vi sinh vật đƣợc xác định có
mặt trong ruột mối C. gestroi, trong đó, vi khuẩn có độ đa dạng cao nhất, với 1.368 loài
(chiếm tới 93,7% tổng số loài đƣợc dự đoán) (Bảng 3.3) thuộc 628 chi, 217 họ, 97 bộ, 41
lớp và 22 ngành.
Bảng 3.3. Đa dạng vi sinh vật ruột mối C. gestroi được dự đoán bằng MEGAN dựa vào
CSDL NR (non-redundant database) của NCBI.


Ngành
Lớp
Bộ
Họ
Chi
Loài
Số gene
Tỷ lệ (%)
Vi khuẩn
22
41
97
217
628
1368
100340

80
Vi khuẩn cổ
4
10
15
21
47
61
533
0,42
Eukaryota
20
14
25
33
43
24
731
0,58
Vi rút
-
-
1
11
13
7
249
0,2
Không dự
đoán được







23570
18,79
Tổng số
46
65
138
282
731
1460
125423
100

13
Trong số 22 ngành vi khuẩn đƣợc dự đoán có 7 ngành chiếm ƣu thế nhất gồm
Firmicutes, Proteobacteria, Spirochaetes, Bacteroidetes, Synergistetes, Planctomycetes và
Actinobacteria. Số ORF của các loài thuộc các ngành này chiếm đến 57,72% (Bảng 3.4)
tổng số ORF vi khuẩn dự đoán đƣợc
Bảng 3.4. Đa dạng loài 7 ngành vi khuẩn chiếm ưu thể nhất sống trong ruột mối C. gestroi
Ngành
Lớp
Bộ
Họ
Chi
Loài

Tỷ lệ có mặt (%)
Firmicutes
4
8
40
126
429
22,48
Proteobacteria
6
41
84
260
490
17,84
Spirochaetes
1
1
3
8
34
17,4
Bacteroidetes
4
5
13
67
159
11,6
Synergistetes

1
1
1
9
11
4,27
Planctomycetes
2
3
3
9
10
1,14
Actinobacteria
1
5
37
72
135
0,48

Ở bậc phân loại bộ, trong số 97 bộ vi khuẩn dự đoán đƣợc có 12 bộ chiếm ƣu thế
nhất thể hiện ở hình (Hình 3.5). Trong đó, chỉ có bộ Pseudomonades không thuộc 7 ngành
chiếm ƣu thể, còn lại đều thuộc 7 ngành chiếm ƣu thế trên.

Hình 3.4. Bảy ngành vi khuẩn chiếm ưu thế nhất có mặt trong ruột mối C.gestroi nghiên cứu
Trong đó, Clostridiales, Actinobacteria, Bacillales, Enterobacteriales, Bacillales,
Pseudomonades và Bacteroidales là những bộ có các loài phổ biến có khả năng phân huỷ
cellulose, nhƣ Ruminococcus albus (62 ORF), Ruminococcus flavefaciens (40 ORF),
Acetivibrio cellulolyticus (85 ORF), Pseudomonas fluorescens (1258 ORF).

Xét bậc phân loại chi, Treponema là chi thuộc bộ Spirochaetales chiếm ƣu thế nhất
(chiếm đến 91,2% bộ, 15% tổng số vi khuẩn xác định đƣợc). Chi chiếm ƣu thế thứ hai là
Lactococcus (thuộc bộ Lactobacillales) chiếm 7,8%, tiếp đến là Pseudomonas (thuộc bộ
Pseudomonades) chiếm 4,6% tổng số vi khuẩn có mặt trong mẫu ruột mối thu thập đƣợc.
22.48
17.84
17.4
11.6
4.27
1.14
0.48
0
5
10
15
20
25
Tỷ lệ (%)
Ngành vi khuẩn
14
Ngoài ra còn có năm chi cũng chiếm ƣu thế là Pseudomonas (5823 ORF), Enterobacter
(3412 ORF), Dysgonomonas (2984 ORF), Clostridium (2968 ORF) và Bacteroides (2414
ORF). Những trình tự của tám chi ƣu thế nhất này chiếm đến 51,36% so với tổng tất cả các
chi dự đoán đƣợc. Trong đó, Clostridium và Bacteroides là hai chi có rất nhiều loài phổ
biến có khả năng phân hủy cellulose. Trong dữ liệu cũng chỉ ra nhiều loài thuộc hai bộ có
khả năng phân huỷ cellulose nhƣ C. acetobutylicum (32 ORF), C. cellulolyticum (40 ORF),
C. cellulovorans (46 ORF), C. papyrosolvens (53 ORF), B.cellulosilyticus (156 ORF).


Hình 3.5. Mười hai bộ vi khuẩn chiếm ưu thế nhất trong ruột mối Coptotermes gestroi. ORF

được chú thích dựa vào CSDL NR.
3.4. GENE MÃ HOÁ ENZYME THUỶ PHÂN CELLULOSE CỦA VI SINH VẬT RUỘT MỐI
Coptotermes gestroi
3.4.1. Chú thích chức năng của DNA đa hệ gene
Toàn bộ các trình tự amino acid tƣơng ứng của 125.431 ORF trong dữ liệu DNA đa
hệ gene vi sinh vật ruột mối C. gestroi đƣợc chú thích bằng Blastp dựa vào CSDL
eggNOG, COG và KEGG. Các ORF này đƣợc chú thích chức năng sâu hơn dựa trên
CSDL COG và KEGG. Dựa vào COG, 7.428 ORF đƣợc chú thích liên quan đến quá trình
chuyển hóa carbohydrate gồm 210 nhóm COG. Trong đó, 518 ORF thuộc các nhóm
COG1472, COG2723, COG1904, COG3459, COG1486, COG1363, COG2730,
COG2273, COG3405 liên quan trực tiếp đến sự phân hủy cellulose. Dựa vào KEGG, kết
quả chú thích cũng thể hiện các ORF liên quan đến các con đƣờng chuyển hóa
carbohydrate chiếm tỷ lệ cao 12,28% (12.763/103.918 ORF) và cao hơn rất nhiều so với
kết quả dự đoán dựa vào CSDL KOG. Trong đó, 587 ORF mã hóa enzyme phân hủy
lignocellulose gồm 316 ORF cellulase, 259 ORF hemicellulase và 12 ORF còn lại mã hóa
pectatelyase và pectinesterase .

21825
13063
11995
9951
8438
5861
3685
2009
1740
1629
1470
410
0

5000
10000
15000
20000
25000
Số lượng ORF
Bộ vi khuẩn
15
3.4.2. Gene mã hóa enzyme phân hủy cellulose
Toàn bộ 316 ORF đƣợc chú thích (dựa vào CSDL KEGG) thuộc 11 họ GH khác
nhau liên quan trực tiếp đến sự thủy phân cellulose thể hiện tám chức năng 6-phospho-β-
glucosidase, licheninase, glucan endo-1,3-β-D-glucosidase, endoglucanase, cellulose 1,4-
β-cellobiosidase, glucan 1,3- β-glucosidase và cellobiose phosphorylase (Bảng 3.5).
Bảng 3.5. Các ORF mã hóa cellulase của vi sinh vật sống trong ruột C. gestroi.

STT
Mã EC
Enzyme
ORF hoàn
thiện
ORF thiếu
đầu 5’
ORF thiếu
đầu 3’
ORRF thiếu
cả 2 đầu
Tổng số
1
3.2.1.86
6-phospho-β-

glucosidase
19
20
15
6
60
2
3.2.1.21
β-glucosidase
29
40
55
87
211
3
2.4.1.20
cellobiose
phosphorylase

1
1
2
4
4
3.2.1.91
cellulose 1,4-β-
cellobiosidase

1


3
4
5
3.2.1.4
endoglucanase
5
8
6
12
31
6
3.2.1.58
glucan 1,3-β-
glucosidase
2

1

3
7
3.2.1.39
glucan endo-1,3-β-D-
glucosidase
1


1
8
3.2.1.73
licheninase

0
0
2
0
2

Tổng số

55
71
80
110
316

3.4.3. Lựa chọn ORF cellulase để biểu hiện
Trong số 316 ORF đƣợc chú thích mã hóa các enzyme tham gia thủy phân cellulose
có 55 ORF hoàn thiện, 71 ORF thiếu đầu 5’, 80 ORF thiếu đầu 3’ và 110 ORF thiếu cả hai
đầu 5’ và 3’ (Bảng 3.5). 55 ORF hoàn thiện gồm 19 ORF mã hóa 6-phospho-β-
glucosidase, 29 ORF mã hóa β-glucosidase, 5 ORF mã hóa endoglucanase và 2 ORF mã
hóa glucan 1,3-β-glucosidase. Đặc biệt, endoglucanase có rất nhiều ứng dụng trong công
nghiệp. Do vậy, trong nghiên cứu này, 5 ORF hoàn thiện đƣợc chú thích chức năng
endoglucanase là những trình tự chúng tôi đặc biệt quan tâm.
Từ tỷ lệ tƣơng đồng và giống của trình tự nucleotide và trình tự amino acid của 5
ORF, bƣớc đầu ORF GL0130684 đƣợc lựa chọn. Để chắc chắn về dự đoán ORF
GL0130684 mã hoá endoglucanase, chúng tôi đã xây dựng cây phân loại để xem xét mỗi
quan hệ của trình tự amino acid ORF GL0130684 với các trình tự amino acid tƣơng ứng
của NCBI. Kết quả cho thấy, trình tự amino acid của GL0130684 thể hiện hoạt tính
16
endoglucanase rõ ràng (Hình 3.6) và thống nhất khi so sánh với các cơ sở dữ liệu COG,
pfarm, PRK thông qua Blastp của NCBI. Hơn nữa, phần mềm Phyre 2 đã đƣa ra cấu trúc

3D và chức năng endoglucanase của trình tự amino acid của ORF GL0130684. Với những
đặc điểm đã phân tích cho thấy ORF GL0130684 đƣợc dự đoán đúng chức năng
endoglucanase với tỷ lệ cao, do đó ORF GL0130684 đƣợc lựa chọn để phân lập, tách dòng
và biểu hiện. Chúng tôi kí hiệu ORF GL0130684 là gen egc.

Hình 3.6. Phân tích cây phát sinh loài giữa EGC và các endogucanase dựa trên sự tương
đồng về trịnh tự amino acid. 0,05 là chỉ số thể hiện sự khác nhau giữa 2 nhóm là 5 nucleotide/100
amino acid; các con số trên các nhánh là chỉ số Bootstrap. Tên các loài trên cây gồm: tên loài và
mã số gene.
3.5. TÁCH DÒNG GENE egc
3.5.1. Trình tự ORF GL0130684
Gene egc chúng tôi lựa chọn có chiều dài 1107 bp. Phân tích đặc điểm của trình tự
amino acid bằng chƣơng trình Expasy trực tuyến cho thấy, trình tự amino acid của gene egc
chứa một đoạn tín hiệu tiết dài 22 amino acid (từ amino acid đầu tiên cho đến amino acid thứ
22), tƣơng ứng với độ dài trình tự nucleotide là 66 bp (từ đầu gene cho đến bp thứ 66).
3.5.2. Khuếch đại gene egc
Để khuếch đại đƣợc gene egc từ khuôn DNA đa hệ gene vi sinh vật sống trong ruột
mối với xác suất cao nhất, hai mồi xuôi GL0130684f
1
, GL0130684f
2
và một mồi ngƣợc
GL0130684r đã đƣợc sử dụng. Trong đó, mồi xuôi GL0130684f
1
khuếch đại gene egc từ
đầu gen (cả trình tự mã hoá tín hiệu tiết) và mồi xuôi GL0130684f
2
khuếch đại gene egc từ
vị trí ngay sau trình tự mã hoá tín hiệu tiết (không mang trình tự mã hoá tín hiệu tiết).
Escherichia-coli-endoglucanase-(WP001592871)

Escherichia-coli-endoglucanase-(WP021532881)
Escherichia-coli-endoglucanase-(WP021527136)
Enterobacteriaceae-endoglucanase-III-(WP001295222)
Enterobacteriaceae-endoglucanase-III-(WP000783609)
Citrobacter-farmeri-endoglucanase-(GAL50460)
Citrobacter-koseri-endoglucanase-III-(WP012135658)
Salmonella-enterica-endoglucanase-(WP 024145245)
Salmonella-entericagi-endoglucanase-(WP024147272)
Enterobacteriaceae-bacterium-FGI57-endoglucanaseY-(WP015962575)
EGC-GL0130684
Enterobacter-lignolyticus-endoglucanase-III-(WP 013364269)
Yokenella-regensburgei-endoglucanase-III-(WP006817672)
Yokenella-regensburgei-ATCC49455-endoglucanase-(KFD24598)
100
100
66
96
65
100
40
94
100
41
61
0.05
17
Trong khi khuếch đại gene egc, Vent DNA polymerase đã đƣợc sử dụng. Cả ba mồi đều
đƣợc bổ sung vào cùng một phản ứng PCR.
Một đoạn DNA kích thƣớc lớn hơn 1 kb đƣợc khuếch đại (Hình 3.7) tƣơng đƣơng
với kích thƣớc của gene egc mong muốn. Tuy nhiên, đoạn DNA khuếch đại đƣợc với số

lƣợng ít (băng DNA không rõ ràng), do đó, để thuận tiện cho việc tách dòng, sản phẩm
khuếch đại có đoạn DNA mong muốn đƣợc sử dụng làm khuôn để khuếch đại đoạn DNA
đó lên với số lƣợng lớn hơn. Kết quả đúng nhƣ dƣ đoán, lƣợng DNA mong muốn đƣợc
khuếch đại lên với số lƣợng lớn hơn (Hình 3.10). Đoạn DNA đƣợc thu hồi bằng bộ kit tinh
chế DNA QIAQuick gel extraction để ghép nối vào vector tách dòng.

Hình 3.7. Điện di đồ sản phẩm khuếch đại gene egc trên gel agarose 0,8%. ĐC (-): đối
chứng âm; ĐC 1: sản phẩm PCR lần thứ nhất từ khuôn DNA đa hệ gene vi sinh vật trong ruột mối;
ĐC 2: sản phẩm PCR lần thứ hai từ khuôn là sản phẩm PCR lần thứ nhất; ĐC M; thang chuẩn
DNA 1 kb (Fermentas).
3.5.3. Ghép nối sản phẩm khuếch đại gene egc vào vector tách dòng pJET1.2 blunt
Trong nghiên cứu này, vector pJET1.2/blunt đƣợc sử dụng để tách dòng gene egc.
Tỷ lệ sản phẩm PCR và vector pJET1 trong phản ứng ghép nối gene là 3:1. Hỗn hợp
phản ứng đƣợc ủ ở nhiệt độ thích hợp. Sản phẩm của phản ứng ghép nối sẽ đƣợc biến
nạp vào tế bào E. coli DH10b bằng phƣơng pháp sốc nhiệt để chọn dòng mang plasmid
mong muốn.
3.5.4. Biến nạp sản phẩm ghép nối vào tế bào E. coli DH10b
Plasmid tái tổ hợp pJET-egc đƣợc biến nạp vào tế bào vi khuẩn E. coli DH10b
bằng phƣơng pháp sốc nhiệt.
Các dòng tế bào biến nạp đƣợc nuôi cấy trên môi trƣờng LBA ở 37
o
C và lắc qua
đêm để tế bào sinh trƣởng và tổng hợp số lƣợng lớn. Những khuẩn lạc mọc trên đĩa môi
trƣờng LBA chính là các dòng tế bào E. coli DH10b mang plasmid tái tổ hợp pJET-egc.
Bốn dòng khuẩn lạc của sản phẩm biến nạp đƣợc lựa chọn tách chiết DNA plasmid đều chứa
kb 1 M (-) M (-) 2
10
1,0
Sản phẩm PCR
1,5

18
plasmid có kích thƣớc đồng nhất và lớn hơn kích thƣớc của dòng pJET1.2/blunt chỉ mang
một đoạn DNA ngắn không đáng kế.
3.5.5. Cắt kiểm tra plasmid tái tổ hợp bằng enzyme hạn chế


A B
Hình 3.8. A. Vị trí cắt của các enzyme cắt kiểm tra plasmid tái tổ hợp trên gene egc và trên
vector pJET1.2/blunt. B. Điện di đồ sản phẩm cắt plasmid tái tổ bằng sáu enzyme hạn chế HindIII,
SbalI, XhoI, SalI, BglII và EcoRV. Các ĐC HindIII, XbaI, XhoI, SalI, BglII và EcoRV tương ứng là
sản phẩm cắt plasmid bằng enzyme HindIII, XbaI, XhoI, SalI, BglII và EcoRV.
Sáu enzyme hạn chế gồm BglII, SalI, EcoRV, XhoI, XbaI và HindIII đƣợc sử dụng
để cắt kiểm tra các plasmid tái tổ hợp. BglII, XhoI, XbaI và HindIII cắt plasmid tái tổ hợp
trên vector pJET1.2/blunt và không cắt trên gene egc. Kết quả cắt kiểm tra plasmid tái tổ
hợp đúng nhƣ tính toán lý thuyết (Hình 3.8). Nhƣ vậy, dòng plasmid chúng tôi lựa chọn cắt
kiểm tra chính là pJET-egc mong muốn.
3.5.6. Phân tích trình tự gene egc phân lập đƣợc từ DNA đa hệ gene vi sinh vật ruột mối
Trình tự nucleotide của gene egc phân lập đƣợc từ DNA đa hệ gene vi sinh vật mối
chỉ khác với trình tự của ORF GL013068 một nucelotide ở vi trí 588/1104 Điều ngẫu nhiên
là nucleotide sai khác này lại không làm thay đổi amino acid tƣơng ứng. Nghĩa là trình tự
amino acid của đoạn DNA phân lập đƣợc và của ORF GL013068 giống hệt nhau. Gene egc
này phân lập đƣợc có cả trình tự mã hoá tín hiệu tiết nên đƣợc đặt tên là gene wegc để
phân biệt với gene egc không có tính hiệu tiết. Nhƣ vậy, plasmid tái tổ hợp chúng tôi có
đƣợc là pJET-wegc. Điều đó chứng tỏ, trong ba mồi sử dụng để khuếch đại gene egc thì
cặp mồi GL0130684f
1
và GL0130684r đã khuếch đại đƣợc wegc. Trình tự tín hiệu tiết
trong gene wegc sẽ đƣợc thay thế bằng trình tự tín hiệu tiết của protein pelB có trong
vector biểu hiện pET22b
+

, do đó, trình tự tín hiệu tiết cần phải loại bỏ khỏi gene wegc. Để
loại bỏ trình tự tín hiệu tiết này khỏi gene wegc, chúng tôi sử dụng cặp mồi GL0130684f
2
M HindIII XbaI XhoI SalI BglII EcoRV kb
2,5
4,5
1
Sản phẩm
cắt
Sản phẩm
cắt
pJETwegc
4,2 Kb
Bla (Ap
R
)

P
lacUV5
Eco47
R

Rep(pMB1)

wegc
SalI
511

EcoRV
858


2782

16

HindIII,
624

BglII 384,

XhoI
352
511

XbaI
377

BglII
340

511

19
và GL0130684r để khuếch đại đúng đoạn DNA đích không có trình tự tín hiệu tiết từ
khuôn plasmid tái tổ hợp pJET-wegc.
3.5.7. Khuếch đại gene egc không chứa tín hiệu tiết từ khuôn pJET-wegc
Ở nhiệt độ bắt cặp giữa mồi và khuôn là 50
o
C, trong 30 chu kỳ PCR, cặp mồi đặc
hiệu GL0130684f

2
và GL0130684r đã khuếch đại hiệu quả gene egc không mang tín hiệu
tiết có kích thƣớc bé hơn wegc từ khuôn pJET-wegc (Hình 3.9). Gene egc này sẽ đƣợc tinh
chế bằng bộ kit QIAQuick gel và ghép nối vào vector biểu hiện pET22b(+).



3.5.8. Thiết kế vector biểu hiện gene egc
3.5.8.1. Ghép nối gene egc vào vector biểu hiện
Trong nghiên cứu này, vector pET22b(+) đƣợc sử dụng để biểu hiện gene egc.
pET22b(+) là vector phù hợp cho biểu hiện protein tái tổ hợp trong vật chủ E. coli. Cả
gene egc và vector pET22b(+) đều đƣợc xử lý bằng cặp enzyme hạn chế XhoI và NcoI.
Sản phẩm cắt là gene egc kích thƣớc 1041 bp và pET22b(+) dạng thẳng kích thƣớc 5431
bp đều có hai đầu dính tƣơng ứng giống nhau. Đặc điểm này giúp cho quá trình ghép nối
chúng với nhau hiệu quả cao. Sản phẩm ghép nối pET22-egc sẽ đƣợc biến nạp vào tế bào
E.coli DH10B bằng sốc nhiệt để chọn dòng mong muốn.
3.5.8.2. Cắt kiểm tra plasmid tái tổ hợp pET22-egc
Plasmid tái tổ hợp pET22-egc chỉ có một trình tự cắt duy nhất của XhoI và của
NcoI ở hai đầu của gene egc. Khi sử dụng cặp enzyme này để cắt kiểm tra pET22-egc sẽ
tạo ra hai đoạn DNA, đoạn thứ nhất chính là gene egc kích thƣớc 1041 bp và đoạn thứ
hai chính là vector pET22b(+) kích thƣớc 5431 bp. Kết quả cắt kiểm tra bốn dòng
plasmid đều tạo ra hai đoạn DNA có kích đúng bằng kích thƣớc của gene egc và
pET22b(+) (Hình 3.10). Nhƣ vậy, gene egc đã đƣợc ghép nối vào vector biểu hiện
Kb 1 2 M

10
egc
wegc
1,5
1,0

Hình 3.9. Điện di đồ sản phẩm PCR
khuếch đại gene egc từ khuôn là gene wegc trên
gel agarose 0, 8%. ĐC 1: gene wegc; ĐC 2: gene
egc được khuếch đại từ gene wegc; ĐC M: thang
chuẩn DNA 1 kb (Fermentas).
20
pET22b(+) đúng nhƣ thiết kế. Plasmid pET22-egc sẽ đƣợc biến nạp vào tế bào biểu hiện
E. coli BL21(DE3) bằng sốc nhiệt để biểu hiện gene egc.







3.6. BIỂU HIỆN GENE egc TRONG VI KHUẨN E. coli BL21(DE3)
3.6.1. Chọn dòng biểu hiện gene egc trong tế bào E. coli BL21(DE3)


A B
Hình 3.11. Điện di đồ protein tổng số từ sản phẩm biểu hiện gene egc trong chủng E. coli
BL21(DE3), môi trường LBA ở 37
o
C sau 4 tiếng cảm ứng 0,5 mM IPTG ở ba dòng tế bào khác
nhau trên gel polyacrylamide 12,6% có SDS. Tế bào sau khi biểu hiện đều cô đặc đến OD
600
= 10.
ĐC (-): đối chứng âm, protein tổng số của dòng tế bào biểu hiện chỉ mang vector pET22b(+) không
mang gene egc; ĐC 1-3: protein tổng số của 3 dòng tế bào biểu hiện mang pET22-egc; ĐC TS:
protein tổng số biểu hiện trong tế bào mang pET22-egc; ĐC T: protein ở dạng không tan biểu hiện

trong tế bào mang pET22-egc; ĐC KT: protein ở dạng tan biểu hiện trong tế bào mang pET22-egc;
ĐC M: thang chuẩn protein unstained (Thermo scientific).
Kết quả cho thấy gene egc đã đƣợc tổng hợp thành protein EGC có kích thƣớc bé
hơn 40 kda (Hình 3.11) tƣơng đƣơng với kích thƣớc tính toán lý thuyết ở cả ba dòng tế
bào, đồng thời, ở dòng đối chứng âm không có băng protein này. Nhƣ vậy, gene egc trong
vector pET22b(+) đã đƣợc biểu hiện thành protein EGC trong tế bào E. coli BL21(DE3).
M (-) 1 2 3 kda
116
14,4
45
EGC
35
M TS T KT kda
116
14,4
45
EGC
35
kb 1 2 3 M 4

10
egc
pET22b(+
)
6,0
5,0
1,0
10
Hình 3.10. sản phẩm cắt các dòng
pET22-egc bằng cặp enzyme hạn chế XhoI và

NcoI trên gel agarose 0,8%. ĐC p
1-4
: 4 dòng
plasmid pET22-egc; ĐC 1-4: sản phẩm cắt 4
dòng plasmid pET22-egc bằng XhoI và NxoI;
ĐC M: thang chuẩn DNA 1 kb (Fermentas); ĐC
pET: vector pET22b(+).
21
Kết quả kiểm tra khả năng tan của EGC cho thấy rằng, toàn bộ protein EGC đƣợc
biểu hiện đều ở dạng không tan là dạng không mong muốn (Hình 3.12). Nhƣ vậy, điều
kiện biểu hiện gene egc cần phải thay đổi để tế bào tổng hợp đƣợc protein EGC ở dạng tan.
3.6.2. Ảnh hƣởng của nhiệt độ đến sự biểu hiện gene egc trong tế bào E. coli
BL21(DE3)




Hình 3.12. Điện di đồ protein EGC biểu hiện trong chủng E. coli BL21(DE3) sau 4 tiếng cảm
ứng 0,5 mM IPTG ở 20
o
C, 25
o
C, 30
o
C và 37
o
C trên gel polyacrylamide 12,6% có SDS.
Trong nghiên cứu này, để biểu hiện đƣợc protein mong muốn ở dạng tan, chúng tôi
đã tiến hành nuôi tế bào ở 37
o

C đến OD
600
đạt 0,6-0,8 thì cảm ứng IPTG đến nồng độ cuối
cùng là 0,5 mM trong bốn tiếng ở bốn nhiệt độ là 20
o
C, 25
o
C, 30
o
C và 37
o
C. Ở 20
o
C và
25
o
C, protein đích đƣợc tạo thành có cả dạng tan và dạng không tan, trong đó lƣợng
protein dạng tan ở 20
o
C khá nhiều và nhiều hơn ở 25
o
C (Hình 3.12). Ở nhiệt độ 30
o
C và
37
o
C, protein tạo thành đều ở dạng không tan. Nhƣ vậy, 20
o
C là nhiệt độ đƣợc lựa chọn để
biểu hiện gene egc thành protein dùng cho các thí nghiệm tiếp theo.

3.6.3. Ảnh hƣởng của nồng độ IPTG đến hiệu quả cảm ứng
Tế bào đƣợc nuôi ở 37
o
C cho đến khi OD
600
đạt 0,8 đƣợc chia thành 10 phần bằng
nhau và bổ sung IPTG theo dải nồng độ trên. Tất cả các mẫu đƣợc nuôi cảm ứng ở 20
o
C
trong thời gian 4 tiếng. Kết quả cho thấy nồng độ IPTG càng tăng từ 0,0 đến 2,0 thì lƣợng
tế bào biểu hiện thu đƣợc càng thấp. Sự tăng nồng độ IPTG cảm ứng từ 0,0 đến 0,1 mM
làm tăng sự tạo thành protein EGC tổng số, nhƣng sự tăng này không thể hiện rõ ràng từ
nồng độ 0,1 đến 1 mM, thậm chí giảm mạnh ở nồng độ 2 mM (Hình 3.13A). Tỷ lệ thuận
với kết quả protein EGC tổng số, lƣợng protein EGC dạng tan cũng tăng dần khi nồng độ
IPTG cảm ứng tăng từ 0,02 đến 0,1 mM, nhƣng sự tăng không thể hiện rõ ràng từ nồng độ
0,1-1mM và giảm mạnh ở nồng độ 0,02. Vậy, để đƣợc lƣợng protein EGC nhiều nhất cũng
nhƣ tỷ lệ protein dạng tan cao nhất thì nồng độ IPTG cảm ứng thích hợp nhất là 0,1 mM.
Kda (-) M TS T KT TS T KT TS T KT TS T KT
EGC
20
o
C
25
o
C
30
o
C
37
o

C
116
45
35
22



Hình 3.13. Điện di đồ protein EGC biểu hiện ở 20
o
C trong tế bào E. coli BL21(DE3) cảm ứng
10 nồng độ IPTG khác nhau trên gel polyacrylamide 12,6% có SDS. A: protein tổng số. B: protein
dạng tan. Các ĐC từ 0,0 – 2 tương ứng là protein biểu hiện khi tế bào được cảm ứng nồng độ
IPTG từ 0,0-2 mM; ĐC M: thang chuẩn protein unstain (Thermo scientific).
3.6.4. Điện di protein trên gel polyacrylamide và kiểm tra hoạt tính endoglucanase
của EGC


A. Nhuộm comassie B. Ép gel và kiểm tra hoạt tính
Hình 3.14. Điện di đồ protein EGC biểu hiện ở 20
o
C trong tế bào E. coli BL21(DE3) trên gel
polyacrylamide 9% không có SDS. (A). Gel nhuộm bằng thuốc nhuộm comassie. (B). Gel được ép
trên môi trường cơ chất 0,1% CMC và kiểm tra hoạt tính. ĐC (-): đối chứng âm; ĐC EGC: protein
tổng số, biểu hiện ở 20
o
C trong tế bào mang pET22-egc; ĐC M: thang chuẩn protein pageruler
prestained (Fermentas).
Để kiểm tra hoạt tính của endoglucanase của protein EGC, chúng tôi đã tiến hành
điện di protein EGC trên gel polyacrylamide không biến tính và ép gel mang protein trên

môi trƣờng 0,5% có cơ chất đặc hiệu (CMC). Kết quả đúng nhƣ chú thích chức năng của
gene egc, băng protein EGC đậm có kích thƣớc bé hơn 40 kdal (Hình 3.14A) đã phân huỷ
CMC tại vị trí mà băng này tiếp xúc với thạch 0,5% CMC khi ép gel (Hình 3.14B). Điều
11
6

A
Kda 0,0 0,02 0,05 M 0,1 0,2 0,3 0,4 0,5 1,0 2,0
45
35

B

Kda 0,0 0,02 0,05 0,1 M 0,2 0,3 0,4 0,5 1,0 2,0

EGC
M (-) EGC
Vùng hoạt tính
Kda M (-) EGC
170
EGC
70
55
40
23
đó chứng tỏ, protein EGC đƣợc biểu hiện có hoạt tính endoglucanase. Vậy, bằng phƣơng
pháp ép gel định tính, chúng tôi khẳng định protein EGC có hoạt tính endoglucanase.
3.6.5. Tinh chế protein EGC bằng cột sắc kí ái lực His-tag







Hình 3.15. Điện di đồ kiểm tra sản phẩm tinh chế enzyme EGC bằng cột sắc kí ái lực His-
tag trên gel polyacrylamide 12,6% có SDS. ĐC 1: protein tổng số biểu hiện từ tế bào mang gene
egc; ĐC 2: protein đi qua cột khi đưa mẫu lên giá thể; ĐC 3: protein bị đẩy ra khỏi giá thể bằng
đệm rửa; các ĐC F
1-8
: 8 phân đoạn thu protein EGC bám trên giá thể cột sắc kí ái lực His-tag; ĐC
M: thang chuẩn protein unstained (Thermo Scientific).
Kết quả này thể hiện ở Hình 3.16 cho thấy protein thu đƣợc ở 8 phân đoạn đều có
kích thƣớc bằng nhau và đúng bằng kích thƣớc của protein EGC. Trong đó, protein đƣợc
tập trung chủ yếu ở phân đoạn 5 và 6, đặc biệt là phân đoạn 5. .
3.6.6. Hoạ tính riêng của EGC
Bằng phƣơng pháp định lƣợng protein Bradford, khối lƣợng protein EGC/ml đƣợc
xác định. Qua đó, hoạt tính riêng của EGC ở mỗi mg protein cũng đƣợc xác định. Ở điều
kiện 37
o
C và pH 7 hoạt tính của EGC là 1,055 U/mg.
3.6.7. Ảnh hƣởng của nhiệt độ đến hoạt tính endoglucanase của EGC


Hình 3.16. Ảnh hưởng của nhiệt độ đến hoạt tính của endoglucanase của EGC.
72.90
82.78
100.00
90.46
69.33
57.31

0
20
40
60
80
100
120
30 35 40 45 50 55
Hoạt tính EGC (%)
Nhiệt độ (oC)
kda 1 2 3 M F
1
F
2
F
3
F
4
F
5
F
6
F
7
F
8

116
EGC
45

35
24
Dải nhiệt độ từ 30 đến 55
o
C đƣợc lựa chọn. Hoạt tính endoglucanase tăng dần từ 30
đến 40
o
C, nhƣng giảm dần khi nhiệt độ tăng từ 40 đến 45
o
C và giảm mạnh ở nhiệt độ 55
o
C
(Hình 3.16). Nhƣ vậy, nhiệt độ thích hợp nhất cho hoạt động của EGC là 40
o
C.
3.6.8. Ảnh hƣởng của pH đến hoạt tính của EGC
Trong nghiên cứu này, chúng tối đã lựa chọn dải pH gồm 12 giá trị khác nhau từ
2,5 đến 8,0 để tìm điều kiện pH tối ƣu cho EGC hoạt động. Kết quả cho thấy enzyme có
hoạt tính cao nhất ở pH 5,5 đến 6,0. Ở pH từ 2,5 đến 4,5, hoạt tính của EGC rất thấp và
không ổn định. Ở pH từ 6,5 đến 8,0, mặc dù hoạt tính của EGC cao hơn và ổn định hơn so
với khoảng pH 2,5 đến 4,5 nhƣng hoạt tính giảm dần theo sự tăng dần của pH (Hình 3.17).


Hình 3.17. Ảnh hưởng của pH đến hoạt tính của EGC ở 40
o
C.
3.6.9. Ảnh hƣởng của một số ion kim loại và hoá chất lên hoạt tính của EGC
Chín ion kim loại (K
+
, Mn

2+
, Cu
2+
, Ca
2+
, Ni
2+
, Mg
2+
, Zn
2+
, Co
2+
, Fe
3+
) và sáu hoá
chất thƣờng sử dụng trong phòng thí nghiệm (EDTA, SDS, Urea, tween 80, triton X-100
và 2-mercaptoethanol) nồng độ 10 mM đƣợc chúng tôi lựa chọn để đánh giá ảnh hƣởng
của chúng đến hoạt tính của EGC. Tất cả đƣợc tiến hành ở điều kiện hoạt động tối ƣu của
EGC (40
o
C và pH 5,5). Hình 3.18 cho thấy, các ion kim loại gồm Mn
2+
, Ca
2+
, Mg
2+

Fe
3+

ức chế hoạt tính của EGC, đặc biệt Mn
2+
và Fe
3+
làm hoạt tính giảm xuống còn 21%
và 40%, còn Cu
2+
và Ni
2+
ảnh hƣởng không đáng kể đến hoạt tính của EGC, hoạt tính EGC
vẫn đạt 94 và 95%. Tuy nhiên, ion K
+
, Zn
2+
và Co
2+
lại làm tăng hoạt tính EGC, đặc biệt,
Co
2+
làm tăng hoạt tính lên đến 257%.

34.5
42.0
39.4
34.9
35.4
68.0
100.0
97.0
80.6

81.1
70.0
59.8
0
20
40
60
80
100
120
2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0
Hoạt tính EGC (%)
pH
25


Hình 3.18. Ảnh hưởng của một số ion kim loại và hoá chất đến hoạt tính của EGC.

3.6.10. Động học của EGC
Thông số động học đƣợc xác định từ đồ thị Lineweaver-Burke. Kết quả cho thấy,
phƣơng trình phụ thuộc giữa tốc độ phản ứng với nồng độ cơ chất đã tuân theo hàm
y=ax+b với độ tin cậy cao R
2
= 0,99 (Hình 3.19). Dựa trên phƣơng trình, Km và Vmax của
endoglucanase đã đƣợc tính tƣơng ứng là 16,14 mg/ml và 2,28 mol/phút. Do đó, hoạt tính
endoglucanase của EGC đạt đƣợc là 11,774 U/mg.

Hình 3.19. Sự phụ thuộc của tốc độ phản ứng của enzyme vào nồng độ cơ chất CMC theo
Linewever-Burk.
21

40
56
64
65
84
94
95
96
100
100
107
109
109
111
257
0
50
100
150
200
250
300
Hoat tính EGC (%)
Nhân tố
y = 7.072x + 0.438
R² = 0.990
0.0
0.5
1.0
1.5

2.0
2.5
3.0
3.5
4.0
4.5
-0.1 0.0 0.1 0.2 0.3 0.4 0.5
1/V (1/mM glucose/phút)
1/[CMC] (mg/ml)
Sự phụ thuộc của tốc độ phản ứng vào nồng
độ cơ chất theo Linewever-Burk

×