Tải bản đầy đủ (.pdf) (88 trang)

Tách dòng và biểu hiện gen mã hóa cytochrome p450 từ DNA metagenome suối nước nóng bình châu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.58 MB, 88 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN VĂN TỤNG

TÁCH DÒNG VÀ BIỂU HIỆN GEN MÃ HÓA
CYTOCHROME P450 TỪ DNA METAGENOME
SUỐI NƢỚC NÓNG BÌNH CHÂU

LUẬN VĂN THẠC SĨ CÔNG NGHỆ NANO SINH HỌC

HÀ NỘI - 2017


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN VĂN TỤNG

TÁCH DÒNG VÀ BIỂU HIỆN GEN MÃ HÓA
CYTOCHROME P450 TỪ DNA METAGENOME
SUỐI NƢỚC NÓNG BÌNH CHÂU

Chuyên ngành: Công nghệ nano sinh học
Mã số: Chuyên ngành đào tạo thí điểm

LUẬN VĂN THẠC SĨ CÔNG NGHỆ NANO SINH HỌC

NGƢỜI HƢỚNG DẪN KHOA HỌC: TS. Nguyễn Kim Thoa
TS. Hà Thị Quyến


HÀ NỘI - 2017


LỜI CẢM ƠN
Trước tiên, em xin chân thành cảm ơn TS. Nguyễn Kim Thoa, TS. Hà Thị
Quyến, đã tận tình chỉ bảo, truyền đạt cho em nhiều kiến thức quý báu trong quá trình
học tập cũng như đã trực tiếp hướng dẫn, động viên em trong suốt quá trình làm thực
nghiệm.
Em xin chân thành cảm ơn tới các thầy cô trong Bộ môn công nghệ nano sinh
học, khoa Vật lý kỹ thuật và công nghệ nano Trường đại học Công nghệ - Đại học
Quốc gia Hà Nội đã cung cấp cho em những kiến thức cần thiết và tạo điều kiện để em
hoàn thành luận văn này.
Cuối cùng, em xin cảm ơn các cán bộ nghiên cứu phòng Công nghệ Vật liệu sinh
học, Viện Công nghệ Sinh học, Viện Hàn lâmkhoa học và công nghệ Việt Nam đã
giúp đỡ em trong quá trình học tập, nghiên cứu tại phòng.
Hà Nội, tháng 9 năm 2017
Nguyễn Văn Tụng


LỜI CAM ĐOAN
Luận văn thạc sĩ này là do tôi thực hiện dưới sự hướng dẫn, chỉ bảo của TS
Nguyễn Kim Thoa và TS Hà Thị Quyến. Tôi xin cam đoan trong luận văn này không
sao chép các tài liệu, công trình nghiên cứu của người khác mà không chỉ rõ trong tài
liệu tham khảo. Nếu sai tôi xin hoàn toàn chịu trách nhiệm trước nhà trường.
Người cam đoan

Nguyễn Văn Tụng


MỤC LỤC

MỞ ĐẦU .........................................................................................................................1
CHƢƠNG 1: TỔNG QUAN .........................................................................................2
1.1. Hệ enzyme cytochrome P450 .................................................................................2
1.1.1. Hệ enzyme cytochrome P450 ở vi sinh vật ......................................................3
1.1.2. Hệ thống truyền điện tử của P450 ...................................................................5
1.1.3. Hệ enzyme cytochrome P450 bền nhiệt ở vi sinh vật ......................................6
1.1.4. Ứng dụng của cytochrome P450 ......................................................................7
1.2. Kỹ thuật metagenomic trong quá trình khai thác các gen mới........................10
1.3. Khai thác DNA metagenome bằng công cụ tin sinh ..........................................11
CHƢƠNG 2: VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU ...........................14
2.1. Vật liệu ...................................................................................................................14
2.1.1. Vật liệu ................................................................................................................14
2.1.2. Vi sinh vật ...........................................................................................................14
2.1.3. Vector ..................................................................................................................14
2.1.4. Mồi sử dụng ........................................................................................................14
2.1.5. Các môi trường sử dụng .....................................................................................14
2.2. Phƣơng pháp nghiên cứu .....................................................................................15
2.2.1. Các phương pháp sinh học phân tử ..............................................................15
2.2.1.1. Tách chiết DNA metagenome ..................................................................15
2.2.1.2. Giải trình tự DNA metagenome suối nước nóng Bình Châu ...................16
2.2.1.3. Thiết kế mồi ..............................................................................................16
2.2.1.4. Khuếch đại gen P450-T2 ..........................................................................16
2.2.1.5. Chuẩn bị tế bào Escherichia coli khả biến xung điện...............................17
2.2.1.6. Tạo vector biểu hiện pET17b gắn đoạn gen P450-T2 (pET17b-T2) .......17
2.2.1.7. Biến nạp vào E. coli bằng phương pháp xung điện ..................................18
2.2.1.8. Chọn lọc dòng E. coli mang vector pET17b-T2 ......................................18
2.2.1.9. Biểu hiện gen P450-T2 .............................................................................18


2.2.2. Các phương pháp hóa sinh ............................................................................19

2.2.2.1. Tinh sạch protein P450-T2 tái tổ hợp .......................................................19
2.2.2.2. Điện di SDS-PAGE ..................................................................................19
2.2.2.3. Xác định phổ hấp thụ phân tử UV-Vis và phương pháp xác định nồng độ
cytochrome P450 ...................................................................................................20
2.2.2.4. Xác định pH tối ưu và nhiệt độ tối ưu của P450-T2 tái tổ hợp ................21
2.2.2.5. Xác định độ bền nhiệt của P450-T2 tái tổ hợp .........................................21
2.2.2.6. Xác định các redox partner trong hệ thống truyền điện tử của P450-T2 .22
2.2.2.7. Xác định các phổ cơ chất tiềm năng của P450-T2 ...................................22
2.2.3. Các phương pháp tin sinh học .......................................................................22
CHƢƠNG 3: KẾT QUẢ VÀ THẢO LUẬN .............................................................24
3.1. Tách chiết DNA metagenome từ mẫu suối nƣớc nóng Bình Châu ..................24
3.2. Giải trình tự DNA metagenome bằng thiết bị HiSeq Illumina ........................25
3.3. Xây dựng cơ sở dữ liệu metagenome suối nƣớc nóng Bình Châu các gen mã
hóa cytochrome P450 bằng các công cụ tin sinh học................................................25
3.3.1. Giải trình tự và tiền xử lý dữ liệu ..................................................................25
3.3.2. Lắp ráp de novo metagenome ........................................................................26
3.3.3. Dự đoán gen và xây dựng cơ sở dữ liệu metagenome suối nước nóng Bình
Châu cụm gen mã hoá cytochrome P450 ................................................................27
3.3.4. Dự đoán nhiệt độ nóng chảy (Tm) của các P450 tiềm năng trong cơ sở dữ
liệu metagenome suối nước nóng Bình Châu .........................................................29
3.4. Tách dòng và biểu hiện gen mã hóa cytochrome P450 từ DNA metagenome
suối nƣớcnóng Bình Châu. ..........................................................................................30
3.4.1. Phân lập gen mã hóa cytochrome P450 ........................................................30
3.4.2. Lựa chọn ORF hoàn chỉnh mã hóa cytochrome P450 .................................31
3.4.3. Phân tích trình tự gen mã hoá cytochrome P450 tổng hợp nhân tạo (P450T2)..............................................................................................................................31
3.4.4. Thiết kế hệ vector biểu hiện gen mã hóa P450-T2........................................34
3.4.5. Biểu hiện gen mã hóa P450-T2 .....................................................................34
3.5. Tinh sạch P450-T2 tái tổ hợp ..............................................................................36



3.6. Xác định một số tính chất của P450-T2 ..............................................................37
3.6.1. Ảnh hưởng của nhiệt độ, pH lên hoạt tính của enzyme tái tổ hợp ..............37
3.6.2. Độ bền nhiệt và nhiệt độ biến tính toàn phần (Tm) của P450-T2 ...............38
3.7. Redox partner thích hợp trong chuỗi truyền điện tử của P450-T2 .................40
3.8. Phổ cơ chất tiềm năng của P450-T2 ....................................................................41
KẾT LUẬN ..................................................................................................................43
TÀI LIỆU THAM KHẢO...........................................................................................44
PHỤ LỤC .....................................................................................................................51


DANH MỤC KÍ HIỆU VÀ VIẾT TẮT
APS

Ammonium Persulfate

CD

Circular Dichroism(Quang phổ lưỡng sắc tròn)

CYP

Cytochrome P450

DTE

Dithioerythritol

FDA

Flavin adenine dinucleotide


FMN

Flavin mononucleotide

LDL

Low-density lipoprotein(Lipoprotein tỉ trọng
thấp)

NADH

Nicotinamide adenine dinucleotide

ORF
PMSF
SDS-PAGE

Open reading frame
Phenylmethylsulfonyl fluoride
Sodium dodecyl sulfate polyacrylamide gel
electrophoresis(Điện di trên gel Polyacrylamide)


DANH MỤC BẢNG
Bảng 3.1: Kết quả lắp ráp de novo metagenome suối
nước nóng Bình Châu

26


Bảng 3.2: Cơ sở dữ liệu metagenome suối nước
nóng Bình Châu cụm gen mã hóa cytochrome P450.

28

Bảng 3.3: Sàng lọc cơ chất của P450-T2 dựa trên sự
thay đổi UV-Vis từ trạng thái LS sang trạng thái HS.

42


DANH MỤC HÌNH
Hình 1.1: Hình 1.1: Sơ đồ một số hệ thống truyền
điện tử điển hình của các nhóm P450

6

Hình 1.2: Quy trình xây dựng và phân tích hệ gen từ
dữ liệu giải trình tự

13

Hình 2.1: Quy trình lắp ráp và xử lý số liệu

23

Hình 3.1: Vị trí các điểm sôi của suối nước nóng Bình
Châu được lựa chọn để lấy mẫu

24


Hình 3.2: DNA metagenome của mẫu nước suối nước
nóng Bình Châu

25

Hình 3. 3: Thành phần các đoạn đọc thô trong mẫu
đọc trình tự DNA metagenome của suối nước nóng
Bình Châu

25

Hình 3.4: Chất lượng dữ liệu sau khi tiền xử lý bằng
Trimmomatic

26

Hình 3.5: Phân bố độ dài contig sau khi lắp ráp bằng
phần mềm SOAPdenovo2

27

Hình 3.6: Phân bố độ dài các gen được dự đoán từ cơ
sở dữ liệu DNA metagenome suối nước nóng Bình
Châu

27

Hình 3.7: Số lượng các cytochrome P450 trong cơ sở
dữ liệu metagenome suối nước nóng Bình Châu


29

Hình 3.8: Phân bố Tm của các cytochrome P450 tiềm
năng được mã hoá bởi 38 ORF hoàn chỉnh từ cơ sở
dữ liệu metagenome suối nước nóng Bình Châu

30

Hình 3.9: Cây phả hệ giữa cytochrome P450 mã hóa
bởi gen phân lập từ DNA metagenome suối nước
nóng Bình Châu và một số cytochrome P450 khác

32


Hình 3.10: Kết quả so sánh trình tự axit amin của
P450-T2 và một số cytochrome P450 khác.

33

Hình 3.11: Điện di đồ sản phẩm khuếch đại gen mã
hoá P450-T2

34

Hình 3.12: Nồng độ P450-T2 tái tổ hợp trong E. coli
BL21(DE3) và JM109(DE3). Mô hình biểu hiện được
thực hiện trong bình tam giác nhẵn có thể tích 250 mL
chứa 50 mL môi trường TB.


35

Hình 3.13: Màu sắc tế bào E. coli C43(DE3) tái tổ
hợp mang vector pET17b-T2 (A) và hiệu suất biểu
hiện P450-T2 của hai hệ thống bình tam giác và
chủng E. coli khác nhau.

36

Hình 3.14A: Điện di đồ SDS-PAGE của dịch enzyme
P450-T2 thô (1) và dịch enzyme tinh sạch (2)

37

Hình 3.14B: Phổ đặc trưng của cytochrome P450 của
enzyme tái tổ hợp P450-T2 khi bị khử bởi Nadithionite và bão hoá trong CO.

37

Hình 3.15: Ảnh hưởng của pH lên hoạt tính của P450T2

37

Hình 3.16: Ảnh hưởng của nhiệt độ lên hoạt tính
P450-T2

38

Hình 3.17: Đường cong biểu diễn các giá trị hấp thụ ở

bước sóng 211 nm của P450-T2 khi thay đổi nhiệt độ
từ 30-90oC.

39

Hình 3.18: Đường cong biểu diễn biến thiên hoạt tính
P450-T2 ở 40 và 50oC theo thời gian

40

Hình 3.19: Sàng lọc các hệ redox partner thích hợp
cho P450-T2

41


1
MỞ ĐẦU
Cytochrome P450 (P450) là họ enzyme phân bố rộng rãi và đa dạng nhất nhất,
đóng vai trò quan trọng trong rất nhiều con đường chuyển hóa vật chất trong cơ thể
cũng như trong tự nhiên. P450 có mặt ở hầu hết các giới trong hệ thống sinh vật học,
rất đa dạng về cấu trúc và chức năng, thậm chí các P450 của một loài cũng có thể có
cấu trúc, chức năng và tính chất khác nhau, đặc biệt là tính đặc hiệu cơ chất. Chính vì
vậy P450 được ứng dụng rộng rãi nhất trong tất cả lĩnh vực nông nghiệp, công nghiệp,
môi trường, y dược…
Để đáp ứng được yêu cầu của các quy trình sản xuất một số các sản phẩm sinh
học ở quy mô công nghiệp như thực hiện phản ứng ở nhiệt độ cao, trong sự có mặt của
một số loại dung môi đòi hỏi các enzyme tham gia vào các quy trình này phải có tính
chất đặc biệt như bền nhiệt, chịu dung môi, chịu áp… Vì vậy, việc tìm kiếm các P450
bền nhiệt mới từ tự nhiên hoặc gây đột biến định hướng để nâng cao tính bền nhiệt của

các P450 đã được đặc biệt quan tâm nghiên cứu.
Các enzyme bền nhiệt thường được thu nhận từ các vùng địa nhiệt như suối
nước nóng, miệng núi lửa, giàn khoan dầu khí… Một trong những lợi thế của Việt
Nam là có một mạng lưới hơn ba trăm suối nước nóng vô cùng phong phú, trải dài từ
Bắc tới Nam. Tuy nhiên, các nghiên cứu đánh giá về khu hệ vi sinh vật ưa nhiệt ở các
suối nước nóng để có thể thấy được tiềm năng và vai trò của chúng đối với hệ sinh thái
và con người còn hạn chế. Cho đến nay, những nghiên cứu về vi sinh vật ưa nhiệt và
hệ enzyme của chúng đã được nghiên cứu tại Việt Nam, chủ yếu tập trung vào nhóm
vi sinh vật phân lập được cũng như hệ enzyme thủy phân của chúng như amylase,
protease, cellulase… Mặt khác, suối nước nóng thường có số lượng vi sinh vật rất
thấp, chỉ 0,1% tổng số vi sinh vật có thể phân lập được trực tiếp bằng phương pháp
truyền thống. Kỹ thuật metagenomic ra đời cho phép các nhà nghiên cứu tiếp cận sâu
hơn với hệ gen của vi sinh vật không thông qua nuôi cấy. Trong những năm gần đây
đã có rất nhiều công bố khai thác những gen mới, protein/enzyme mới của vi sinh vật
nhờ kỹ thuật này. Chính vì vậy, trong nghiên cứu này chúng tôi đặt mục tiêu tìm kiếm
gen mới mã hóa cho cytochrome P450 từ suối nước nóng Bình Châu – một trong
những suối nước nóng có nhiệt độ nóng nhất tại Việt Nam với hy vọng sẽ tìm thấy
P450 bền nhiệt mới bằng kỹ thuật không nuôi cấy. Để thực hiện được mục tiêu này,
chúng tôi đã thực hiện những nội dung nghiên cứu như sau:
- Thu nhận, tách chiết DNA metagenome suối nước nóng Bình Châu, giải
trình tự và xây dựng cơ sở dữ liệu về nhóm gen mã hóa cho P450.
- Biểu hiện gen mã hóa P450 mới, tinh sạch và nghiên cứu một số tính chất
của P450 tái tổ hợp.
- Nghiên cứu hệ thống truyền điện tử và xác định phổ cơ chất tiềm năng của
enzyme thu được.


2
Chƣơng 1: TỔNG QUAN
1.1. Hệ enzyme cytochrome P450

Cytochrome P450 (viết tắt là CYP hoặc P450) là các protein enzyme có chứa
phân tử sắt, đã được phát hiện và nghiên cứu trên 55 năm nay. Có thể nói, P450 là họ
enzyme phân bố rộng rãi nhất, đa dạng nhất và có mặt trong tất cả các giới trong hệ
thống sinh vật học, từ vi sinh vật đến thực vật, động vật và con người [1]. Sở dĩ nhóm
enzyme có tên gọi cytochrome P450 vì chúng có phổ hấp thụ cực đại ở bước sóng 450
nm khi bão hòa trong khí CO. Các P450 là các monooxygenase bên ngoài, do đó,
chúng cần một chất cho điện tử để khởi động quá trình oxi hóa và hydroxyl hóa cơ
chất (Bernhardt, 2006) như sơ đồ phản ứng sau:
RH + O2 + NAD(P)H + H+ROH + H2O + NAD(P)+
Số lượng các gen mã hóa cho các P450 ở tất cả các loài trong hệ thống sinh vật
học hiện nay là khoảng hơn 37.000 trình tự được công bố trên Ngân hàng gen và số
lượng này tiếp tục được tăng lên khi các nhóm nghiên cứu tìm ra được các gen P450
mới ở các loài sinh vật khác nhau. Năm 2009, Nelson và cộng sự [2] đã tổng kết có
khoảng 3282 gen P450 của động vật, 1015 gen P450 của vi khuẩn, 22 gen P450 của cổ
khuẩn và 2 gen P450 từ virus thì hiện nay đã có 30171 gen P450 của động vật, 7606
gen P450 của vi khuẩn, 70 gen P450 của cổ khuẩn và 14 gen P450 của virus.
Mặc dù có rất nhiều ứng dụng trong các lĩnh vực khác nhau nhưng cytochrome
P450 có một vài hạn chế như độ ổn định kém, hoạt tính thấp [3], [4]. Việc tìm ra
cytochrome P450 bền nhiệt có thể cải thiện độ ổn định của enzyme này [5]. Sự phân
bố rộng rãi của chúng trong tự nhiên là tiềm năng lớn cho việc khám phá và khai thác
cytochrome P450 bền nhiệt từ các chủng vi sinh vật chịu nhiệt [6], [7]. Lý do số lượng
các P450 mới tiếp tục tăng lên nhanh chóng, thu hút sự tập trung nghiên cứu của các
nhà khoa học là do nhóm enzyme này có khả năng ứng dụng rất rộng rãi trong các
ngành công nghiệp, môi trường, y học, dược học, nông nghiệp khi chúng tham gia vào
hơn 20 loại phản ứng xúc tác khác nhau bao gồm hydroxyl hóa các hợp chất
hydrocarbon, các hợp chất vòng thơm, các hợp chất nitơ, dealkyl hóa các hợp chất
nitơ, các hợp chất oxy, các hợp chất lưu huỳnh, epoxide hóa các hợp chất alkene, các
hợp chất arene, oxy hóa các hợp chất nitơ, các hợp chất lưu huỳnh, các hợp chất
alkyne, deamine oxy hóa, oxy hóa khử các hợp chất halogen, oxy hóa các hợp chất
alcohol và aldehyde, dehydro hóa, dehydrate hóa, khử các hợp chất N-oxide, khử các

hợp chất epoxide, khử NO, phân nhánh hóa và oxi hóa mối liên kết C-C… Tương ứng
với sự đa dạng về chức năng xúc tác của các P450 là sự đa dạng về cơ chất của chúng,
bao gồm các axit béo, các steroid, các prostaglandin cũng như các hợp chất khác như
thuốc, thuốc mê, các dung môi hữu cơ, ethanol, các hydrocarbon alkylaryl, các chất trừ
sâu và các chất gây ung thư [8].


3
1.1.1. Hệ enzyme cytochrome P450 ở vi sinh vật
Với các đặc trưng như tốc độ phản ứng nhanh hơn so với các P450 khác, có khả
năng hòa tan nên các enzyme P450 của vi khuẩn thu hút sự quan tâm nghiên cứu của
các nhóm nhà khoa học vì có thể dựa vào hệ enzyme P450 của vi khuẩn để phát triển
các mô hình chuyển hóa sinh học trong tự nhiên. Cũng giống như các P450 của các
giới sinh vật khác, P450 của vi sinh vật đóng vai trò quan trọng trong việc chuyển hóa
các cơ chất khác nhau như để sinh tổng hợp các hợp chất có hoạt tính sinh học ứng
dụng trong tái tạo môi trường, dược phẩm và nông nghiệp [9]. Chính vì vậy, số lượng
các P450 của vi sinh vật ngày càng tăng cao với khoảng hơn 1000 tên chú thích. Trong
số các P450 của vi sinh vật thì P450cam (CYP101) từ loài Pseudomonas putida và
P450BM3 (CYP102) từ loài B. megaterium được nghiên cứu đầy đủ nhất. P450cam
xúc tác cho quá trình hydroxyl hóa từ (+)-camphor thành 5-exo-hydroxy camphor với
sự tham gia của 2 enzyme trong chuỗi truyền điện tử là putidaredoxin reductase và
putidaredoxin [10] trong khi P450BM3 có một chuỗi polypeptide đơn chứa đồng thời
nhân sắt và enzyme khử (reductase) xúc tác quá trình hydroxyl hóa axit béo ω-2.
Các xạ khuẩn thường mang các gen P450 thuộc CYPome (cytochrome P450
complement) tham gia vào các quá trình sinh tổng hợp các hợp chất có hoạt tính sinh
học tự nhiên ứng dụng trong y dược (các loài thuộc giống Streptomyces) như các hợp
chất kháng sinh (erythromycin, vancomycin), các hợp chất kháng nấm (nystantin,
amphotericin), hay hợp chất có tác dụng diệt sâu, côn trùng (avermectin). Các loài xạ
khuẩn khác nhau có số lượng gen mã hóa cho các P450 khác nhau. Ví dụ các loài
myxobacteria tham gia vào quá trình chuyển hóa lipid, ứng dụng trong quá trình sản

xuất các loại thuốc chống ung thư như epothilone có số lượng các gen P450 lớn và đa
dạng [11] trong khi loài xạ khuẩn Bifidobacterium longum chỉ có duy nhất một gen mã
hóa cho một P450 mà hiện nay chưa rõ chức năng [12]
Sự đa dạng của các P450 từ vi sinh vật trong quá trình tái tạo môi trường là rất
có ý nghĩa. Bên cạnh sự tham gia của loài nấm trắng P. chrysosporium, một số P450
của các sinh vật hoại sinh như Aspergillus oryzae, S. coelicolor hay Mycobacterium
smegmatis cũng tham gia vào quá trình này [13], [14]. Malandain và cộng sự đã chứng
minh được khả năng phân hủy các chất phụ gia dầu mỏ như methyl tert-butyl ether,
ethyl tert-butyl ether và tert-amyl butyl ether là do CYP249 từ các chủng thuộc giống
Rhodococcus và Gordonia[15]. Một trong những vai trò quan trọng nữa của các P450
từ vi sinh vật là tham gia vào chu trình chuyển hóa nitơ. CYP55, một loại enzyme của
nấm Fusarium oxysporum tham gia tích cực vào quá trình phản nitrite/nitrate hóa, do
đó nấm mốc được ghi nhận là một trong những nhân tố tích cực tham gia vào quá trình
phản nitrite/nitrate hóa ở các vùng đồng cỏ, đất bán khô cằn hoặc đất rừng làm tăng độ
màu mỡ của đất. Gần đây, Pedrini và cộng sự [16] cho rằng các enzyme P450 của một
số chủng nấm như Beauveria bassiana tham gia quá trình tổng hợp các hợp chất phân
giải lớp biểu bì của côn trùng. Lớp biểu bì này là hỗn hợp của các hợp chất lipid bao


4
gồm các alkane chuỗi dài, alkene, các ester sáp và các axit béo [16]. Tuy nhiên, bên
cạnh những ưu điểm của hệ P450 từ vi sinh vật là xúc tác tổng hợp nên những hợp
chất có hoạt tính sinh học có lợi cho con người, những enzyme này cũng tham gia vào
quá trình tổng hợp nên các độc tố. Ví dụ CYP619 từ chủng nấm A. clavatus xúc tác
quá trình tổng hợp patulin, là một loại độc tố vi nấm. Patulin thường có trong táo bị
thối rữa, và trong quá trình chế biến các sản phẩm từ táo, hàm lượng patulin được coi
là thước đo để đánh giá chất lượng táo nguyên liệu. Patulin có khả năng kháng khuẩn
nhưng cũng có độc tính gen, do đó có thể gây ung thư [17]. Trong một ví dụ khác,
Healy và cộng sự phát hiện ra quá trình sinh tổng hợp thaxtomin, một loại độc tố thực
vật gây bệnh đóng vảy ở khoai tây, có sự tham gia của P450 từ chủng S. acidiscabies

trong giai đoạn hydroxyl hóa chuỗi dipeptide vòng thơm [18].
Việc nghiên cứu cấu trúc và chức năng của P450 từ vi sinh vật là cần thiết, tuy
nhiên để có thể ứng dụng được hệ enzyme này trong công nghiệp hay trong tái tạo sinh
học thì cần phải sử dụng hệ thống chuyển hóa bằng tế bào (whole cell
biotransformation). Một số các chủng nấm mốc như Penicillium citrinum, S.
carbophilus được sử dung để tổng hợp nên các hợp chất như mevastatin và hydroxyl
hóa tiền chất này để tổng hợp nên. Rất nhiều loài Candida spp có mang gen CYP52
nhưng không phải CYP52 nào cũng xúc tác sinh tổng hợp axit dicarboxylic. Hiệu suất
quá trình tổng hợp axit ,ω-dicarboxylic của chủng C. tropicalis ATCC 20336 được
nâng cao khi khóa con đường oxi hóa ở vị trí -. Ưu điểm của quá trình chuyển hóa
bằng tế bào là tận dụng luôn chất cho điện tử từ hệ thống tế bào để khởi động hoạt tính
xúc tác của P450 trong khi nếu sử dụng hệ thống chuyển hóa in vitro bên ngoài thì sẽ
phải bổ sung yếu tố này, do đó làm tăng giá thành chuyển hóa cũng như làm thay đổi
tính đặc hiệu cơ chất, tính đặc hiệu ví trí hydroxyl hóa sản phẩm. Hiện nay các kỹ
thuật gen và protein được ứng dụng để nâng cao hiệu suất xúc tác của toàn bộ hệ thống
tế bào cũng như enzyme. CYP101 và CYP102 là hai trong những P450 đầu tiên được
nghiên cứu gây đột biến để nâng cao hiệu suất xúc tác của enzyme.
Mặc dù số lượng các P450 của vi sinh vật không ngừng tăng lên, tuy nhiên các
nhà khoa học dự đoán rằng rất nhiều P450 từ vi sinh vật vẫn đang tồn tại trong tự
nhiên và chưa được khai thác, đặc biệt ở những vùng có hệ sinh thái môi trường cực trị
mà không thể thu nhận các vi sinh vật hoặc enzyme bằng cách nuôi cấy thông thường.
Những vùng sinh thái này là những nguồn gen từ tự nhiên để các nhà nghiên cứu tìm
kiếm và khai thác các enzyme có tính chất mới hoặc xúc tác các quá trình chuyển hóa
mới. Viện Công nghệ sinh học biển Nhật Bản đã phát triển phương pháp “cassette
PCR” để sàng lọc trình tự các gen mã hóa cho các hợp chất sinh học đích. Phương
pháp này cho phép thu nhận các đoạn DNA đích từ metagenome của môi trường và
thiết kế các tổ hợp gen mã hóa cho protein đánh dấu để sàng lọc hoạt tính. Kubota và
cộng sự [19] đã áp dụng phương pháp này để thu nhận 16 gen CYP153A mới từ nhiều
nguồn môi trường khác nhau như vùng đất nhiễm dầu, nước ngầm và chủng



5
Alcanivorax borkumesis SK2. Các gen CYP153A mới xúc tác quá trình hydroxyl hóa
không chỉ với cơ chất n-alkane mà còn với các cơ chất khác như cyclohexane, 1octene, n-butylbenzene. Việc tìm ra các P450 từ những loài mới hoặc có tính chất mới
tiếp tục thu hút sự nghiên cứu khai thác của các nhà khoa học thông qua các DNA
metagenome. Các P450 có tính chất tự xúc tác như P450BM3 là một trong những đối
tượng được ưu tiên tìm kiếm bởi những ưu điểm vượt trội của chúng không cần bổ
sung các enzyme trong chuỗi truyền điện tử khi tham gia chuyển hóa cơ chất. Việc
định hướng khai thác các gen mã hóa cho các P450 mới ở các vùng sinh thái khác
nhau thông qua các DNA metagenome là cần thiết và cần tiếp tục có những nghiên
cứu sâu hơn để đưa được các P450 có khả năng ứng dụng cao vào các quy trình sản
xuất ở quy mô công nghiệp.
1.1.2. Hệ thống truyền điện tử của P450
Vì các P450 là các monooxygenase bên ngoài, do vậy chúng cần chất cho điện
tử để khởi động chuỗi truyền điện tử và chuyển hóa cơ chất. Năm 2007, Hannemann
và cộng sự đã chia hệ thống truyền điện tử của họ enzyme này thành 10 nhóm
(Hannemann et al., 2007), trong đó có 4 nhóm chính dựa trên cấu tạo và chức năng
của các yếu tố trong chuỗi truyền điện tử. Nhóm I bao gồm hầu hết các hệ thống P450
của vi khuẩn và P450 ti thể của một số eukaryote. Hệ thống này bao gồm 3 protein
riêng rẽ: FAD chứa protein đóng vai trò khử (reductase) truyền điện tử từ NADH hoặc
NADPH đến ferredoxin, rồi từ ferredoxin truyền đến P450 để chuyển hóa cơ chất. Cả
3 protein đều là dạng hòa tan ở hệ thống P450 của vi khuẩn (Hình 1A). Ở hệ thống
P450 ti thể, chỉ có ferredoxin là protein hòa tan trong mạng lưới ti thể trong khi
reductase và P450 là các protein liên kết màng và protein thuộc màng trong của ti thể
(Hình 1B) (Bernhardt, 1996 and 2006, Gunsalus and Sligar, 1978, Lambeth, 1991,
Hannemann et al., 2007).
Các P450 có hệ thống truyền điện tử thuộc nhóm II đại diện cho các P450 thuộc
nhóm eukaryote. Nhóm P450 này được ghi nhận có khả năng xúc tác đa dạng cho các
loại phản ứng khác nhau. Hệ thống monooxygenase của nhóm này được tìm thấy ở
mạng lưới nội chất (ER) của tế bào eukaryote bao gồm hai protein liên kết màng: P450

và reductase phụ thuộc NADPH (Hình 1C). Reductase chứa cả nhóm FAD và FMN,
đóng vai trò truyền điện tử từ NADPH tới một trong các isozyme của P450
(Hanukoglu, 1996).


6
A

B

C

D

Hình 1.1: Sơ đồ một số hệ thống truyền điện tử điển hình của các nhóm P450.
A) Hệ thống P450 của vi khuẩn (Nhóm Ia); B) Hệ thống P450 ty thể (Nhóm Ib); C) Hệ
thống P450 tế bào (Nhóm II); D) Hệ thống tự xúc tác CYP102A1 (Nhóm VIII)
(Bernhardt, 2006; Hannemann et al., 2007).
1.1.3. Hệ enzyme cytochrome P450 bền nhiệt ở vi sinh vật
Một trong số các tiêu chí đối với các enzyme triển khai ở quy mô công nghiệp
là tính bền, trong đó có tính bền nhiệt. Tuy nhiên, sự không ổn định của các P450
trong các điều kiện sản xuất công nghiệp ở nhiệt độ cao, xúc tác trong sự có mặt của
dung môi đã hạn chế những ứng dụng của hệ enzyme này ở quy mô sản xuất lớn [20].
Chính vì vậy, việc tìm kiếm các P450 bền nhiệt từ tự nhiên hoặc gây đột biến định
hướng để nâng cao tính bền nhiệt của các P450 đã biết đã được quan tâm nghiên cứu.
Các P450 bền nhiệt có thể được ứng dụng trong các quy trình sản xuất các hợp chất
hữu cơ có giá trị. Syed và cộng sự cho rằng độ bền nhiệt của enzyme cũng sẽ ảnh
hưởng làm tăng độ bền của protein trong điều kiện pH cực trị hoặc có mặt của dung
môi [21]. Hơn nữa, sử dụng các P450 bền nhiệt còn có lợi thế trong việc xây dựng hệ
thống chuyển hóa bằng 2 pha lỏng. Các cơ chất của P450 bền nhiệt (thường là các hợp

chất hữu cơ trong tự nhiên) có thể tương tác với các enzyme trong pha dung môi để
chuyển hóa thành các sản phẩm khuếch tán sang pha nước. Các sản phẩm này thường
là các hợp chất hữu cơ ưa nhiệt trong tự nhiên [22].
P450 bền nhiệt đầu tiên (CYP119) được phát hiện ở loài cổ khuẩn Sulfolobus
solfataricus[23]. Những nghiên cứu ban đầu về tính chất của enzyme này cho thấy
nhiệt độ biến tính toàn phần của nó xấp xỉ 90oC, cao hơn so với các loại P450 ưa ấm
khác đã được công bố. CYP119 có khả năng xúc tác phản ứng epoxide hóa styrene và
cis-stilbene cũng như hydroxyl hóa các axit béo [24], [25, p. 119]. Để giải thích cho
tính chất bền nhiệt của CYP119 ở mức độ phân tử, một số nghiên cứu đã xây dựng cấu
trúc 3D của enzyme này và dựa đoán rằng sự gia tăng một số lượng lớn các tương tác
giữa các axit amin vòng thơm và các cầu liên kết muối là nguyên nhân dẫn đến độ bền


7
nhiệt của protein. Tuy nhiên việc dự đoán chi tiết về các tương tác trong phân tử
enzyme chỉ dựa vào cấu trúc 3D của nó gặp rất nhiều khó khăn và thường không chính
xác vì độ tương đồng giữa các P450 là rất thấp. Năm 2000, Yano và cộng sự đã kết
tinh được protein CYP119 và xác định được cấu trúc tinh thể của enzyme này bằng
phương pháp tia X. So sánh cấu trúc của CYP119 và năm cấu trúc của P450 ưa ấm
khác cho thấy độ bền nhiệt của CYP119 là chủ yếu là do sự gia tăng một số lượng lớn
các tương tác giữa các axit amin vòng thơm và các cầu liên kết muối. Kết luận này
cũng tương tự như dự đoán của nhóm McLean và nhóm Chang khi xây dựng cấu trúc
3D của protein [26]. Sau đó, Maves và Sligar tiếp tục nghiên cứu tạo ra thư viện các
thể đột biến ngẫu nhiên CYP119 và sàng lọc các thể đột biến có độ bền nhiệt thấp hơn
CYP119 nguyên bản. Từ đặc điểm phân tử của các thể đột biến và enzyme nguyên
bản, nhóm nghiên cứu thấy rằng độ bền nhiệt của CYP119 chủ yếu do các tương tác
tĩnh điện bao gồm các tương tác giữa các cầu muối, tương tác giữa các ion mang điện
tích kết hợp với các yếu tố ảnh hưởng khác như sự gia tăng một số lượng lớn tương tác
giữa các axit amin vòng thơm dẫn đến tăng thể tích các chuỗi bên của các axit amin kỵ
nước [27].

Cho đến nay, chỉ có 5 enzyme P450 bền nhiệt thu nhận từ các chủng cổ khuẩn
phân lập được ngoài tự nhiên bao gồm CYP119A1, CYP119A2, CYP175A1,
CYP231A2 và CYP154H1 được công bố [28]. Ngoài CYP119 từ S. solfataricus,
CYP175A1 từ Thermus thermophilus HB27 là enzyme P450 bền nhiệt thứ hai được
phát hiện và ghi nhận là P450 đầu tiên có khả năng hydroxyl hóa -carotene [29].
Nhiệt độ biến tính toàn phần của CYP175A1 là 88oC trong khi nhiệt độ biến tính toàn
phần của các P450 ưa ấm chỉ dao động từ 47-61oC. Nghiên cứu cấu trúc tinh thể của
enzyme này cho thấy mặc dù mức độ tương đồng của enzyme này với các P450 khác
rất thấp nhưng vẫn tồn tại các vùng bảo thủ. Cấu trúc CYP175A1 thiếu hẳn một mạng
lưới cấu trúc vòng thơm lớn như ở cấu trúc của CYP119. Ngoài ra, thể tích thực của
protein CYP119 nhỏ hơn so với các P450 ưa ấm khác, các vòng (loop) và các vùng nối
giữa các tiểu phẩn enzyme ngắn hơn. Các yếu tố này có thể là nguyên nhân dẫn đến
tính bền nhiệt của CYP175A1.
Từ những kết quả nghiên cứu trên Thế giới có thể thấy rằng số lượng các P450
bền nhiệt từ các nhóm vi sinh vật vẫn còn khá hạn chế mặc dù có tiềm năng ứng dụng
trong công nghiệp rất lớn. Chính vì thế việc tìm kiếm, khai thác để thu nhận, nghiên
cứu cấu trúc, tính chất và ứng dụng các P450 bền nhiệt mới từ tự nhiên là cần thiết và
có ý nghĩa.
1.1.4. Ứng dụng của cytochrome P450
Các P450 có thể tham gia xúc tác rất nhiều loại phản ứng sinh hóa khác nhau,
do đó ứng dụng của họ enzyme này rất rộng rãi. Một trong những ứng dụng thành
công nhất của họ enzyme P450 ở quy mô công nghiệp là quá trình tổng hợp


8
pravastatin của công ty Daiichi-Sankyo Co. Ltd (Nhật Bản). Pravastatin là loại thuốc
chống tăng lipid máu thuộc nhóm chất ức chế HMG - CoA reductase, có tác dụng ức
chế tổng hợp cholesterol, làm giảm cholesterol trong gan, kích thích tổng hợp thụ thể
lipoprotein tỷ trọng thấp (LDL), và làm tăng vận chuyển LDL từ máu, do đó làm giảm
hàm lượng cholesterol trong huyết tương. Hiện nay loại thuốc này được sử dụng để

điều trị mỡ máu cho hàng triệu bệnh nhân ở hơn 100 quốc gia. Quá trình tổng hợp
pravastin từ compactin bằng cách hydroxyl hóa ở vị trí 6 được xúc tác bởi enzyme
CYP105A3 (P450sca-2) của chủng Streptomyces carbophilus[30]
Quá trình gắn nhóm hydroxyl vào cơ chất của họ enzyme P450 thường dẫn đến
việc thay đổi tính chất của cơ chất như thay đổi tính hòa tan, tính đặc hiệu và độc tính.
Do vậy họ enzyme này thường được sử dụng để tổng hợp các hợp chất hữu cơ khó thu
nhận bằng con đường hóa học hoặc để phân giải các chất hữu cơ khó phân hủy ngoài
môi trường ô nhiễm. Một ví dụ khác về sự ứng dụng của enzyme CYP trong công
nghiệp là quá trình chuyển hóa vitamin D3 thành 1α,25-dihydroxyvitamin D3
(1α,25(OH)2D3) nhờ sự xúc tác của một số loại P450. (1α,25(OH)2D3) được sử dụng
trong điều trị các bệnh cường giáp, bệnh xốp xương, suy thận mãn. Nếu sản phẩm này
được tổng hợp bằng con đường hóa học thì phải tiến hành qua khoảng 20 bước để thu
nhận (1α,25(OH)2D3), hơn nữa hiệu suất của quá trình lại rất thấp. Chính vì vậy vậy
việc tìm cách sinh tổng hợp đơn giản –chỉ qua một bước xúc tác đã thu hút được sự
quan tâm nghiên cứu của các nhà khoa học. Sasaki và cộng sự đã thiết lập hệ thống
chuyển hóa 25- và 1-hydroxyvitamin D3 thành 1α,25(OH)2D3 nhờ chủng
Streptomyces sp [31], chuyển hóa vitamin D3 thành 1α,25(OH)2D3 từ 25(OH)D3 nhờ
xúc tác của enzyme vitamin 25-hydroxylase của chủng Amycolata sp [32] hay của
chủng A.autotrophica, sau này được phân loại lại là chủng Pseudonocardia
autotrophica[33]. Gần đây, P450VD25 (CYP105A2) tái tổ hợp ở tế bào S. lividans,
CYP105A1 từ chủng S. griseolus[34, p. 450] và CYP107 [35] được ghi nhận có hoạt
tính 25-hydroxylase và hiện nay đang được sử dụng để sản xuất 1α,25(OH)2D3 ở quy
mô công nghiệp sau khi gây đột biến để nâng cao hoạt tính xúc tác.
Steroid, các dẫn xuất steroid là các sản phẩm có ý nghĩa trong dược phẩm cũng
được quan tâm nghiên cứu. Hiện nay quá trình sản xuất các steroid công nghiệp được
phối hợp giữa con đường tổng hợp hóa học và chuyển hóa sinh học nhờ các enzyme
trong họ P450 xúc tác. Ví dụ cortisol hiện nay được tổng hợp từ 11-deoxycortisol nhờ
xúc tác hydroxyl hóa của P450lun ở vị trí 11β-. Công ty Schering AG (CHLB Đức)
hiện nay là một trong những công ty lớn nhất sản xuất steroid cortisol từ những tế bào
cố định hệ sợi chủng Curvularia lunata mang gen P450lun với năng suất khoảng 100

tấn/năm. Ngoài ra, một loạt các P450 trong cơ thể người cũng đóng vai trò xúc tác
trong con đường chuyển hóa steroid, từ cholesterol thành cortisol như CYP11A1,
CYP17A1, CYP21A2 (hoặc CYP21B2) và CYP11B1 [36]. Năm 2012, Nguyen và
cộng sự đã biểu hiện thành công thể đột biến CYP106A2 từ chủng B.


9
megateriumATCC 13368 để sản xuất dẫn xuất 11-hydroxyprogesterone có tác dụng
điều trị các rối loạn nội tiết tố nữ hoặc sử dụng trong thuốc tránh thai, hoặc kết hợp
điều trị bệnh vảy nến… [37].
Bên cạnh các hợp chất steroid, các P450 của vi khuẩn cũng được sử dụng để
xúc tác quá trình tổng hợp các hợp chất như axit epoxyeicosatrienoic, leukotoxin B và
các epoxide eicosanoid khác [38]. Một số kháng sinh như tetracenomycin hay
erythromycin được tổng hợp cũng có sự tham gia xúc tác của P450eryF (CYP107).
Tương tự như vậy, Jennewein và cộng sự đã chứng minh được một số P450 của thực
vật tham gia vào quá trình sinh tổng hợp các taxol – hợp chất chống ung thư hiện nay
đang được sử dụng trong các phác đồ hóa trị liệu [39]. Tuy nhiên việc nghiên cứu quá
trình sinh tổng hợp cũng như tách chiết các hợp chất có khả năng chống ung thư từ vi
sinh vật các sản phẩm tự nhiên cũng gặp nhiều thách thức, do đó các sản phẩm này
hiện nay chủ yếu được thu nhận bằng con đường bán tổng hợp hóa học.
Các hợp chất terpene oxy hóa được ứng dụng rộng rãi trong công nghiệp thực
phẩm (tạo hương vị thực phẩm) hoặc mỹ phẩm (nước hoa) cũng thu hút sự nghiên cứu
của các nhóm. Các enzyme xúc tác quá trình hydroxyl hóa ở các vị trí carbon khác
nhau của các hợp chất terpene chủ yếu thuộc họ P450. Việc tổng hợp các hợp chất này
bằng con đường hóa học rất khó khăn do sự tương đồng cao về mặt điện tích trong cấu
trúc bậc 1 và bậc 2 của các nhóm allyl và thường dẫn đến các sản phẩm epoxide phụ.
Bên cạnh những ứng dụng của họ P450 trong các con đường chuyển hóa sinh
học, nhóm enzyme này còn được ứng dụng rộng rãi trong việc làm nguyên liệu để sản
xuất biosensor. Năm 2003, Joseph và cộng sự đã phát triển biosensor có gắn enzyme
CYP3A4 lên điện cực âm trong khi gắn các thành phần khác trong chuỗi truyền điện

tử của nó lên điện cực dương để tìm kiếm và sàng lọc một số loại thuốc là cơ chất đặc
hiệu của CYP3A4 [40]. Sau đó, năm 2009, Mie và cộng sự đã phát triển phương pháp
xác định nồng độ thuốc trong huyết tương bằng biosensor có gắn enzyme P450. Thông
thường, các xét nghiệm về nồng độ thuốc trong huyết tương được tiến hành bằng các
kỹ thuật hiện đại như GC-MS hoặc LC-MS có chi phí cao và mất nhiều thời gian. Do
vậy, việc xác định bằng biosensor có nhiều ưu điểm hơn ở chỗ phương pháp này cho
phép xác định nồng độ thuốc trong thời gian ngắn ở mức chi phí thấp (do phương pháp
không đòi hỏi phải có enzyme tinh khiết và việc chuẩn bị các điện cực rất đơn giản,
thuận tiện). Phương pháp biosensor cũng có thể mở rộng phạm vi áp dụng để xác định
khả năng chuyển hóa các hợp chất trong tế bào do xúc tác của họ P450 như
cholesterone, 25-hydroxyvitamin D3 và các axit béo.
Một trong những ứng dụng quan trọng nhất của họ P450 là tái tạo các môi
trường bị ô nhiễm. Không khí, nước và đất chủ yếu bị ô nhiễm bởi các hợp chất như
các hydrocarbon đa vòng thơm (PAH), polychlorinated dibenzo-p-dioxin (PCDD) và
polychlorinated biphenyl (PCB) [41], [42]. Hiện nay, các enzyme như angular


10
dioxygenase, P450, lignin peroxidase, và dehalogenase được sử dụng để chuyển hóa
các hợp chất dioxin hoặc các ứng dụng khác như phân giải các hợp chất lignin ứng
dụng trong chuyển hóa sinh khối. Các P450 của động vật như CYP1A1, CYP1A2, và
CYP1B1 được chứng minh có khả năng phân giải các hợp chất PAH [43]–[45]. Hơn
thế nữa, các chủng tái tổ hợp như Saccharomyces cerevisiae, Basidiomycetes,
Dehalococcoides và các chủng Rhodococcus sp biểu hiện các thể đột biến của gen
CYPA1 còn có khả năng phân giải cả các hợp chất. Tuy nhiên, đối với các hợp chất
PCB, hiện nay chỉ có gen CYP2B11 của chó được ghi nhận có khả năng phân giải các
hợp chất này. Chủng nấm trắng Phanerochaete chrysosporium được chứng minh có
khả năng phân giải các hợp chất DD, 2,7-DCDD, và 2,3,7,8-TCDD. Phân tích cơ sở
dữ liệu về hệ gen của P. chrysosporium cho thấy có tất cả 148 gen P450 và có lẽ chính
vì vậy các P450 của chủng nấm này có khả năng phân giải các hợp chất PCDD.

Trong nông nghiệp, việc sử dụng các thuốc diệt cỏ và thuốc trừ sâu là cần thiết
để nâng cao năng suất cây trồng. Tuy nhiên, việc lạm dụng các loại thuốc này dẫn đến
những tồn dư của chúng trong đất, nước ngầm và không khí, do đó gây những bất lợi
tiềm tàng cho chính cây trồng và vật nuôi, môi trường, và sức khỏe con người. Một số
P450 của vi khuẩn và thực vật có khả năng chuyển hóa các loại thuốc này từ dạng độc
thành dạng không độc như CYP73A1, CYP76B1 từ cây cúc vu (Helianthus tuberosus
L), CYP71A11 từ cây thuốc lá và CYP71A10 từ đậu tương [46]. Quá trình tẩy các
chất độc trong môi trường ô nhiễm có thể được tiến hành bằng cách cố định các
enzyme CYP lên các bề mặt đất, nước. Gần đây, các nhóm nghiên cứu về công nghệ tế
bào thực vật cũng đã chuyển một số gen P450 như CYP1A1, CYP2B6, CYP2C9,
CYP2C19 vào một số loại cây để tái tạo môi trường ô nhiễm chất diệt cỏ, thuốc trừ sâu
bằng thực vật (phytoremediation). Ví dụ như cây lúa chuyển gen CYP2C9-57R2 có
khả năng kháng hợp chất sulfonylureas, trong khi cây lúa chuyển gen CYP2C19-12R1
không chỉ kháng lại sulfonylureas mà còn kháng được một số chất diệt cỏ như
atrazine, norflurazon và metolachlor [47]. Rylott và cộng sự đã biểu hiện gen P450
xp1A có khả năng phân giải cyclotrimethylenetrinitramine (RDX) ở Arabidopsis
thaliana. Cây chuyển gen này có khả năng mọc được trên môi trường nhiễm RDX, tạo
ra các rễ và chồi non to hơn so với các cây tự nhiên [48]
1.2. Kỹ thuật metagenomictrong quá trình khai thác các gen mới
Kỹ thuật metagenomic được sử dụng lần đầu tiên bởi Jo Handelsman và cộng
sự [49]. Metagenomic đươ ̣c đinh
̣ nghiã là mô ̣t ứng du ̣ng của kỹ thuâ ̣t di truyề n hiê ̣n đa ̣i
để nghiên cứu một hệ sinh thái vi sinh vật trực tiếp từ môi trường sống mà không cần
phân lâ ̣p riêng rẽ các chủng như các kỹ thuâ ̣t truyề n thố ng , là phương pháp phân tích
hệ gen của một quần xã vi sinh vật. Cũng giống như kỹ th uâ ̣t DGGE , metagenomic
đươ ̣c áp du ̣ng để tìm những nguồ n di truyề n phong phú , là cơ sở để phát hiện ra các
gen mới , enzyme hoă ̣c các sản phẩ m mới trong tự nhiên . Ngoài ra , nó cũng được sử
dụng để đánh giá những tác động của ô nhiễm lên các hê ̣ sinh thái hay làm sa ̣ch các



11
chấ t đô ̣c ha ̣i tồ n đo ̣ng ở môi trường . Mô ̣t khi lơ ̣i nhuâ ̣n từ viê ̣c tổ ng hơ ̣p ra các enzyme
xúc tác vẫn tiếp tục tăng thì ảnh hưởng của metagenomic lên sự phát triển của các
ngành sinh ho ̣c, nông ho ̣c, hóa học, dươ ̣c ho ̣c là rấ t lớn.
Hầu hết sản phẩm sinh học tự nhiên được thu từ các chủng vi sinh vật có thể
phân lập và nuôi cấy được trong phòng thí nghiệm. Mặc dù số lượng vi sinh vật có thể
phân lập được ngày càng tăng do sự xuất hiện những kỹ thuật nuôi cấy mới [50] nhưng
số lượng những loài này vẫn là rất nhỏ so với ước tính. Kết quả phong phú thu được từ
việc nghiên cứu các vi sinh vật không nuôi cấy được bằng kỹ thuật metagenomic có
tiềm năng to lớn trong sự phát triển các chất xúc tác sinh học mới [51]. Dellagnezze và
cộng sự đã thu nhận được một số dòng gen từ DNA metagenome giàn khoan dầu khí
để đánh giá khả năng phân hủy một số hợp chất dầu mỏ như các n-alkane (từ C14 đến
C33), isoprenoid (phytane và pristine) cũng như phân hủy các hợp chất vòng thơm
phenanthrene và methylphenanthrenes của chúng. Kết quả cho thấy tiềm năng sử dụng
các dòng gen này để phân hủy một số hợp chất dầu mỏ, làm sạch môi trường biển tại
khu vực giàn khoan [52].
Kỹ thuật metagenomic nghiên cứu metagenome quần xã sinh vật thông qua ba
bước chính, bao gồm: (i) tách chiết nucleic acid từ mẫu thu thập; (ii) thiết lập thư viện
metagenome hoặc giải trình tự DNA metagenome sử dụng thiết bị giải trình tự thế hệ
mới; (iii) phân tích, sàng lọc gen bằng các kỹ thuật tin sinh học hoặc phân lập gen dựa
vào số liệu giải trình tự, qua đó tạo tiền đề cho việc tách dòng và biểu hiện gen [53].
Metagenomics tạo ra dữ liệu khổng lồ của metagenome đang mở ra rất nhiều hướng
khai thác trong cả nghiên cứu cơ bản và nghiên cứu ứng dụng. Các bộ dữ liệu
metagenome chỉ có thể được phân tích hiệu quả khi sử dụng các công cụ tin sinh học.
1.3. Khai thác DNA metagenome bằng công cụ tin sinh
Tin sinh học là một lĩnh vực khoa học sử dụng các công nghệ của ngành toán
học ứng dụng, tin học, thống kê, khoa học máy tính và toán sinh học để giải quyết các
vấn đề sinh học. Trong những năm gần đây, thiết bị giải trình tự thế hệ mới (NGS)
cùng với sự phát triển của phương pháp metagenomic đã cách mạng hóa lĩnh vực
nghiên cứu hệ sinh thái vi sinh vật. Lượng dữ liệu metagenomic được tạo ra ngày càng

lớn kéo theo sự ra đời của những công cụ tin sinh học cho phép xử lý dữ liệu loại này
[54]. Tương ứng với từng công nghệ đọc trình tự là các phương pháp xử lý dữ liệu do
công nghệ đó tạo ra [55] như loại bỏ dữ liệu chất lượng kém trước khi phân tích, loại
bỏ nhiễu trong quá trình giải trình tự. Các bài toán đặc trưng của tin sinh học trong xử
lý dữ liệu metagenomic bao gồm xác định mức độ đa dạng sinh học, lắp ráp những
trình tự DNA chất lượng cao từ những đoạn DNA ngắn, dự đoán và chú giải gen trong
dữ liệu tổng thể.
Trong kỹ thuật giải trình tự thế hệ mới, DNA được cắt ra nhiều đoạn nhỏ. Do
đó, bước đầu tiên khi tiến hành phân tích là lắp ráp dữ liệu nhằm tại tạo lại hệ gen ban


12
đầu của vi sinh vật [56]. Quá trình và thuật toán lắp ráp phụ thuộc nhiều vào loại thiết
bị giải trình tự. Các phương pháp giải trình tự hiện nay tạo ra lượng dữ liệu lớn hơn
nhưng độ dài đoạn đọc ngắn hơn và tỉ lệ lỗi cũng cao hơn phương pháp Sanger truyền
thống [57] điều này gây ra nhiều khó khăn trong quá trình lắp ráp. Để khắc phục
những khó khăn này, hầu hết các thuật toán lắp ráp hiện này đều dựa trên đồ thị De
Bruijin [58].
Bước khởi đầu trong việc định danh loài hoặc một cá thể là việc giải trình tự,
lắp ráp hệ gen và phân tích của có thể đó. Hệ thống giải trình tự thế hệ mới đang có
mặt trên thị trường, tất cả đều thể hiện một vài đặc tính quan trọng khiến chúng khác
biệt đối với các hệ thống giải trình tự thế hệ cũ. Máy giải trình tự thế hệ mới tạo ra các
đoạn trình tự đọc ngắn thông qua các phản ứng tổng hợp song song và tạo ra một
lượng lớn dữ liệu trong mỗi thí nghiệm, bên cạnh đó còn giảm đáng kể chi phí giải
trình tự. Tuy nhiên, các đoạn đọc do các hệ thống này tạo ra ngắn hơn rất nhiều so với
hệ máy đầu tiên, nên cần độ bao phủ cao hơn để thỏa mãn tiêu chí xác định bằng sự
chồng lặp. Tất nhiên sự bao phủ cao sẽ dẫn đến lượng dữ liệu lớn hơn, sự phức tạp
theo đó cũng tăng lên. Thuật toán lắp ráp de novo và các ứng dụng của nó đang được
xây dựng để đáp ứng các thách thức tồn tại đối với dữ liệu giải trình tự mới. Rất nhiều
thuật toán lắp ráp de novo đã được thực thi, mỗi loại có những tiên đề, điểm mạnh yếu

riêng. Mỗi chương trình lắp ráp mang tính chất đặc thù riêng, tuy nhiên chúng đều có
cơ sở chung và tất cả đều giải quyết sự phức tạp của dữ liệu giải trình tự thế hệ mới.


13
Dữ liệu thô
Tiền xử lý
Dữ liệu tinh sạch
Lắp ráp
Contigs
Dự đoán gene
Genes

Phân loài sinh thái

Chú giải chức năng

Hình 1.2: Quy trình xây dựng và phân tích hệ gen từ dữ liệu giải trình tự
Giải trình tự gen thế hệ mới tạo ra một lượng dữ liệu khổng lồ, gia tăng sự phức
tạp trong việc tính toán lắp ráp theo dung lượng dữ liệu. Nhiều chương trình lắp ráp
quản lý lượng lớn dữ liệu dưới dạng K-mer. K-mer là một tập hợp các base với độ dài
là K với K là số dương bất kỳ. Thay vì tìm kiếm các đoạn trùng, các công cụ lắp ráp
tìm kiếm các đoạn đọc có chung K-mer, bởi việc tìm K-mer chung sẽ dễ dàng hơn việc
tìm các đoạn lặp. Thuật toán tìm K-mer có độ phức tạp cao hơn thuật toán tìm đoạn
trùng lặp tuy nhiên thuật toán này lại có độ nhạy cao hơn.


14
Chƣơng 2: VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU
2.1. Vật liệu

2.1.1. Vật liệu
- Mẫu nước thu từ suối nước nóng Bình Châu.
2.1.2. Vi sinh vật
- Chủng Escherichia coli TOP10F‟ (sử dụng trong thí nghiệm nhân dòng gen)
- Chủng Escherichia coli C43(DE3) (sử dụng trong thí nghiệm biểu hiện gen)
- Chủng Escherichia coli BL21(DE3) (sử dụng trong thí nghiệm biểu hiện gen).
- Chủng Escherichia coli JM109(DE3) (sử dụng trong thí nghiệm biểu hiện
gen).
2.1.3. Vector
- Vector pUC19 gắn gen tổng hợp nhân tạo trình tự đoạn ORF denovo_35152
(ký hiệu là P450-T2) (Phù Sa Biochem Ltd.)
- Vector pET17b (Novagen, USA).
2.1.4. Mồi sử dụng
- 35152f: gatcCATatgggccttggcagcttcca
- 35152f: gatcAAGCTTAGTGGTGATGGTGATGATGctgggccttgagctgcagca
Cặp mồi được đặt tại Phù sa Biochem Ltd. (Việt Nam)
2.1.5. Các môi trường sử dụng
Môi trường LB (g/L):
Peptone

5

Cao nấm men

5

NaCl

3


Môi trường TB (g/L)
Bacto Tryptone

12

Cao nấm men

5

Glycerin

4 ml

H2 O

900 mL

Sau khi khử trùng, bổ sung 100 ml:
K2HPO4

0,72 M

KH2PO4

0,17 M


×