Tải bản đầy đủ (.pdf) (76 trang)

Nghiên cứu sự đa dạng về trình tự ADN giống gen mã hóa enzym giới hạn giống haui ở các chủng loài microcystis aeruginosa

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.29 MB, 76 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------

NGUYỄN THỊ MAI PHƢƠNG

NGHIÊN CỨU SỰ ĐA DẠNG VỀ TRÌNH TỰ ADN GIỐNG GEN
MÃ HÓA ENZYM GIỚI HẠN GIỐNG HAUI Ở CÁC
CHỦNG LOÀI MICROCYSTIS AERUGINOSA

LUẬN VĂN THẠC SĨ KHOA HỌC
Chuyên ngành: Công nghệ Sinh học

NGƢỜI HƢỚNG DẪN HOA HỌC :
1. PGS.TS TRẦN LIÊN HÀ
2. TS. LÊ THỊ KIM TUYẾN

Hà Nội-2016


MỤC LỤC
LỜI CẢM ƠN ............................................................................................................. ii
LỜI CAM ĐOAN ....................................................................................................... iv
DANH MỤC CHỮ VIẾT TẮT ................................................................................... v
DANH MỤC HÌNH VẼ ............................................................................................. vi
DANH MỤC BẢNG ................................................................................................ viii
MỞ ĐẦU ..................................................................................................................... 1
CHƢƠNG I: TỔNG QUAN TÀI LIỆU ........................................................................ 3
1.1 Enzym giới hạn....................................................................................................... 3
1.1.1 Định nghĩa ................................................................................................ 3
1.1.2 Lịch sử của enzym giới hạn ...................................................................... 4


1.1.3 Phân loại enzym giới hạn .......................................................................... 5
1.2 Enzym giới hạn-sửa Ďổi .......................................................................................... 6
1.3 Họ HauI.................................................................................................................. 7
1.3.1 Giới thiệu về HauI .................................................................................... 7
1.3.2 Khám phá in silico về các gen thuộc họ HauI............................................ 8
1.3.3 Giới thiệu về gen ORF8180 ................................................................... 11
1.3.4 Giới thiệu về vùng TRD ......................................................................... 13
1.4 Microcystis aeruginosa ......................................................................................... 15
1.4.1 Sinh thái .................................................................................................... 16
1.4.2 Các loại Ďộc tố........................................................................................... 16
1.4.3 Tầm quan trọng sinh thái ........................................................................... 17
1.4.4 Đa dạng di truyền của quần thể.................................................................. 17
1.5 Phƣơng pháp phân tích sự Ďa dạng gen RFLP ....................................................... 18
CHƢƠNG 2: VẬT LIỆU VÀ PHƢƠNG PHÁP ......................................................... 23
2.1 Vật liệu ................................................................................................................. 23
2.1.1 Nguyên liệu ............................................................................................... 23
2.2.2 Hóa chất và môi trƣờng ............................................................................. 23
2.2.3 Thiết bị..................................................................................................... 24
2.2 Phƣơng pháp......................................................................................................... 24
2.2.1 Chọn lọc in silico gen thuộc họ HauI......................................................... 24

i


2.2.2 Tách chiết ADN tổng số ............................................................................ 25
2.2.3 Khuyếch Ďại gen ORF8180 ....................................................................... 26
2.2.4 Tách sản phẩm PCR lần 1 trên gel agarose và thực hiện PCR lần 2 ........... 27
2.2.5 Tách dòng gen ORF8180 ........................................................................... 28
2.2.6 Biến nạp ADN tái tổ hợp vào E. coli ......................................................... 28
2.2.7 Kiểm tra E. coli tái tổ hợp bằng PCR ........................................................ 29

2.2.8 Tách plasmid dùng Qiagen miniprep kit. ................................................... 30
2.2.9 Khuyếch Ďại Ďoạn trình tự mã cho vùng TRD của gen ORF8180 .............. 30
2.2.10 Phân tích sự Ďa dạng trình tự Ďoạn mã cho vùng TRD bằng
phƣơng pháp RFLP ............................................................................................ 31
CHƢƠNG 3: KẾT QUẢ VÀ BÀN LUẬN ................................................................. 32
3.1 Chọn lọc in silico gen thuộc họ HauI .................................................................... 32
3.2 Tách chiết ADN tổng số ....................................................................................... 33
3.2.1 Tách chiết ADN tổng số bằng phenol ...................................................... 33
3.2.2 Tách chiết ADN tổng số bằng kit Dneasy ................................................ 35
3.3 Khuyếch Ďại gen ORF8180 ................................................................................... 36
3.3.1 Thiết kế mồi Ďể khuyếch Ďại gen ORF8180............................................ 36
3.3.2 Kết quả khuyếch Ďại gen ORF8180 bằng PCR ....................................... 37
3.4 Tách sản phẩm PCR lần 1 trên gel agarose và thực hiện PCR lần 2....................... 39
3.5 Tách dòng gen ORF8180 ...................................................................................... 39
3.6 Khuyếch Ďại Ďoạn trình tự mã cho vùng TRD của gen ORF8180 .......................... 41
3.7 Phân tích sự Ďa dạng trình tự Ďoạn mã cho vùng TRD của gen ORF8180
bằng RFLP ................................................................................................................. 42
3.7.1 Phân tích Ďoạn trình tự mã cho vùng TRD với enzym AluI..................... 43
3.7.2 Phân tích Ďoạn trình tự mã cho vùng TRD với enzym Hpy188I .............. 44
3.7.3 Phân tích Ďoạn trình tự mã cho vùng TRD với enzym HpyCh4III .......... 45
KẾT LUẬN VÀ KIẾN NGHỊ .................................................................................... 49
TÀI LIỆU THAM KHẢO .......................................................................................... 50
PHỤ LỤC.................................................................................................................. 56

ii


LỜI CẢM ƠN
Để hoàn thành khóa luận này, tôi xin gửi lời cảm ơn chân thành tới:
PGS.TS Trần Liên Hà, giảng viên chính bộ môn Vi sinh – Hóa sinh Sinh học phân tử, Viện Công nghệ Sinh học và Công nghệ Thực phẩm, cô

đã động viên khuyến khích, chỉ bảo tận tình và đã cho tôi những điều kiện
tốt nhất để học tập, nghiên cứu và hoàn thành luận văn này.
TS. Lê Thị Kim Tuyến, phòng Thí nghiệm Sinh học, giảng viên bộ
môn y tế công cộng, Trường Đại học Thăng Long, cô đã chỉ bảo tận tình,
hướng dẫn và chia sẻ tôi những kiến thức, phương pháp nghiên cứu khoa
học vô cùng quý giá trong suốt thời gian học tập, nghiên cứu và hoàn
thành luận văn này.
Tôi cũng bày tỏ lòng biết ơn đối với Viện Đào tạo sau đại học-Viện
Công nghệ Sinh học và Công nghệ Thực phẩm- Đại học Bách Khoa Hà
Nội đã tạo điều kiện thuận lợi cho tôi trong quá trình học tập giúp tôi
hoàn thành khóa học và luận văn này.
Cuối cùng, tôi cũng xin cảm ơn gia đình và bạn bè đã tạo điều kiện,
động viên, khích lệ và giúp đỡ tôi cả về vật chất lẫn tinh thần, là chỗ dựa
vững chắc để tôi vượt qua mọi khó khăn, không ngừng phấn đấu trong
suốt quá trình học tập.
Tôi xin chân thành cảm ơn!
Hà Nội, ngày tháng năm 2016
Nguyễn Thị Mai Phƣơng

iii


LỜI CAM ĐOAN
Tôi xin cam Ďoan Ďây là nghiên cứu của tôi. Các số liệu trong luận văn
này là do tôi thu thập và thực hiện trong quá trình nghiên cứu một cách khoa
học và chính xác.
Kết quả luận văn chƣa Ďƣợc Ďăng tải trên bất kỳ một tạp chí hay công
trình khoa học nào.
Tác giả


Nguyễn Thị Mai Phương

iv


DANH MỤC CHỮ VIẾT TẮT
ADN: Acid Deoxyribonucleic
AdoMet: S-adenosyl-L-methionine
Amp : Ampicillin
ATP: Adenosine Triphosphate
bp: base pair (Ďôi bazơ)
Chl : Chloramphenicol
EDTA: Ethylene Diamine Tetracetic Acid
IPTG: Isopropyl β-D-1-thiogalactopyranoside
LB: Luria Broth
PCR: Polymerase Chain Reaction
RFLP: Restriction Fragment Length Polymorphism (sự Ďa hình chiều dài các
Ďoạn cắt giới hạn)
RM: Restriction-Modification (giới hạn-sửa Ďổi)
RE: Restriction Enzym (enzym giới hạn)
SNP: Single Nucleotide Polymorphism (Ďa hình nucleotide Ďơn)
TRD: Target Recognition Domain (vùng nhận ra trình tự Ďặc hiệu)

v


DANH MỤC HÌNH VẼ
Hình 1.1: Cấu trúc enzym giới hạn ...................................................................... 3
Hình 1.2: Trình tự axit amin của HauI lấy từ GenBank ..................................... 11
Hình 1.3: Trình tự ADN của ORF8180 lấy từ GenBank .................................... 12

Hình 1.4: Trình tự axit amin của ORF8180 lấy từ GenBank .............................. 13
Hình 3.1: Motif của vùng cắt ADN của họ HauI .............................................. 32
Hình 3.2: Motif của vùng bám AdoMet của họ HauI ......................................... 33
Hình 3.3: Motif của vùng methyl hóa của họ HauI ............................................ 33
Hình 3.4: Ảnh Ďiện di ADN tổng số của 4 mẫu TL, TC, S3, S4 ......................... 34
Hình 3.5: Ảnh Ďiện di ADN tổng số của 4 mẫu ST, BK, CD, ML ...................... 35
Hình 3.6: Vị trí thiết kế cặp mồi LF và LR Ďể khuyếch Ďại gen ORF8180 ......... 36
Hình 3.7: Ảnh Ďiện di sản phẩm PCR gen ORF8180 với
cặp mồi LF và LR .............................................................................. 38
Hình 3.8: Ảnh Ďiện di sản phẩm PCR lần hai gen ORF8180 với
cặp mồi LF và LR .............................................................................. 39
Hình 3.9: Ảnh Ďiện di sản phẩm PCR Ďoạn trình tự mã cho vùng TRD của gen
ORF8180 ............................................................................................. 41
Hình 3.10: Ảnh Ďiện di sản phẩm cắt Ďoạn trình tự mã cho vùng TRD
của gen ORF8180 ............................................................................. 42
Hình 3.11: Ảnh Ďiện di sản phẩm cắt Ďoạn trình tự mã cho vùng TRD
bằng enzym giới hạn AluI ................................................................. 43
Hình 3.12: Ảnh Ďiện di sản phẩm cắt Ďoạn trình tự mã cho vùng TRD
bằng enzym giới hạn Hpy188I........................................................... 44
Hình 3.13: Ảnh Ďiện di sản phẩm cắt Ďoạn trình tự mã cho vùng TRD
bằng enzym giới hạn HpyCH4III ...................................................... 45
Phụ lục hình 1: Kết quả so sánh trình tự vùng TRD của TC với gen chuẩn ........ 56
Phụ lục hình 2: Kết quả so sánh trình tự vùng TRD của TL với gen chuẩn ........ 57
Phụ lục hình 3: Kết quả so sánh trình tự vùng TRD của S3 với BK ................... 58

vi


Phụ lục hình 4: Kết quả so sánh trình tự vùng TRD của S3 với gen chuẩn ......... 59
Phụ lục hình 5: Kết quả so sánh trình tự vùng TRD của S4 với gen chuẩn ......... 60

Phụ lục hình 6: Kết quả so sánh trình tự vùng TRD của các gen ML2, ML6,
ML7,

ML_R6 với nhau ............................................ 61

Phụ lục hình 7: Kết quả so sánh trình tự vùng TRD của ML2 với gen chuẩn ..... 62
Phụ lục hình 8: Kết quả so sánh trình tự vùng TRD của ML1 với ML3 ............. 62
Phụ lục hình 9: Kết quả so sánh trình tự vùng TRD của ML1với gen chuẩn ...... 63
Phụ lục hình 10: Kết quả so sánh trình tự vùng TRD của CD với gen chuẩn ...... 64
Phụ lục hình 11: Kết quả so sánh trình tự vùng TRD của ST với gen chuẩn....... 65
Phụ lục hình 12: Kết quả sắp chuối trình tự axit amin vùng TRD của 14 gen
với gen chuẩn bằng phần mềm PROMALS3D ......................... 67

vii


DANH MỤC BẢNG
Bảng 3.1: Danh sách các gen phân lập Ďƣợc ............................................................... 40
Bảng 3.2: Kích thƣớc các Ďoạn ADN sau khi cắt vùng TRD của gen ORF8180
bằng 3 enzym giới hạn ................................................................................. 42
Bảng 3.3: So sánh kết quả phân tích RFLP của 14 gen với gen chuẩn ......................... 46
Bảng 3.4: Chiều dài ƣớc tính các Ďoạn cắt giới hạn vùng TRD của 14 gen với
3 enzym HpyCH4III, AluI, Hpy188I ............................................................ 47
Phụ lục bảng 1: Kết quả so sánh trình tự vùng TRD của 14 gen so với gen
chuẩn ............................................................................................................ 66

viii


MỞ ĐẦU

Enzym giới hạn là một công cụ quan trọng trong kĩ thuật gen và công
nghệ ADN tái tổ hợp, giúp các thao tác trên ADN trở nên dễ dàng hơn. Sự tìm
ra enzym giới hạn giúp khám phá kho tàng tri thức khổng lồ về cấu trúc và cơ
chế hoạt Ďộng của các gen trong prokaryote và eukaryote.
Nhờ có enzym giới hạn, công nghệ gen Ďã Ďạt Ďƣợc những thành tựu
mang tính quyết Ďịnh, mở ra nhiều hƣớng nghiên cứu mới trong lĩnh vực công
nghệ sinh học. Đó là nghiên cứu sản xuất protein tái tổ hợp, sản xuất các chế
phẩm y-sinh học hữu ích (từ các tế bào vi khuẩn, nấm men), tạo ra các giống
sinh vật mới. Từ Ďó giải quyết kịp thời những vấn Ďề thực tiễn Ďặt ra trong
công nghệ thực phẩm, trong y học, trong công tác chọn tạo giống, xử lý môi
trƣờng, khai thác kim loại và dầu mỏ.
Cách Ďây khá lâu, cấu trúc phân tử enzym giới hạn loại II Ďã Ďƣợc mô
tả. Cũng nhƣ với các protein-enzym khác, ngƣời ta không phát hiện có sự
giống nhau giữa các enzym giới hạn mặc dù có chung chức năng sinh hóa hay
chức năng tế bào. Gần Ďây, nhóm nghiên cứu của Morgan Ďã tìm ra hai họ
enzym MmeI và HauI có Ďộ giống nhau về trình tự axit amin lên tới 40% [34].
Hai họ này có Ďặc Ďiểm mang cả hai chức năng giới hạn và sửa Ďổi trên cùng
một phân tử.
Microcystis aeruginosa là một loại vi tảo mọc rất nhiều trên tầng nƣớc
mặt của các ao và hồ tù Ďọng. Sự bùng nổ của vi tảo này làm ô nhiễm môi
trƣờng và gây chết các loài thủy sinh bởi Ďộc tố nó tiết ra. Loài này Ďã Ďƣợc
giải trình tự ADN và tìm thấy gen ORF8180 mã hóa cho enzym giới hạn giả
Ďịnh thuộc họ HauI.
Phân tích các mẫu Microcystis aeruginosa lấy trong thiên nhiên Ďể thấy
Ďƣợc sự Ďa dạng trên gen giống enzym giới hạn sẽ Ďem lại nhiều hiểu biết mới
cho lĩnh vực nghiên cứu khoa học cơ bản và ngành dịch tễ học trong phát hiện

1



các loại vi khuẩn lam có trong mẫu nƣớc sinh Ďộc tố gây bệnh cho con ngƣời
cũng nhƣ các loài Ďộng vật khác.
Tóm lại, việc nghiên cứu sàng lọc enzym giới hạn không chỉ có ý nghĩa
khoa học mà còn có giá trị kinh tế xã hội. Xuất phát từ những lý do trên tôi
quyết Ďịnh chọn Ďề tài “Nghiên cứu sự đa dạng về trình tự ADN giống gen
mã hóa enzym giới hạn giống HauI ở các chủng loài Microcystis
aeruginosa.”
Mục tiêu của Ďề tài:
-

Phát hiện sự có mặt của các gen giống HauI trong các mẫu tự nhiên
khác nhau chứa Microcystis aeruginosa

-

Nghiên cứu sự Ďa dạng trình tự các gen giống HauI

2


CHƢƠNG I: TỔNG QUAN TÀI LIỆU
1.1 Enzym giới hạn
1.1.1 Định nghĩa
Enzym giới hạn (RE) là một enzym phân cắt ADN khi nhận ra các trình
tự nucleotide Ďặc hiệu. Enzym giới hạn tồn tại trong vi khuẩn và là yếu tố di
truyền bảo thủ của vi khuẩn [38]. Hiện nay, có hơn 5000 enzym giới hạn Ďã
Ďƣợc xác Ďịnh và gần 300 enzym Ďã Ďƣợc thƣơng mại hóa [46]. Nhiều kỹ thuật
sinh học phân tử và kĩ thuật di truyền hiện nay Ďều dựa vào các enzym giới
hạn. Chức năng của enzym là phân huỷ liên kết phosphodieste của bộ
khung ADN mạch Ďôi mà không gây tổn hại Ďến các bazơ. Các liên kết hóa

học sau khi bị cắt có thể Ďƣợc nối lại với nhau bằng enzym nối ligase. Do Ďó,
việc cắt nối ADN tại ví trí mong muốn là hoàn toàn có thể. Các Ďoạn cắt giới
hạn của một nhiễm sắc thể hay giữa các gen khác nhau sẽ nối lại Ďƣợc với
nhau chỉ cần có trình tự Ďầu dính bổ sung.

Hình 1.1: Cấu trúc enzym giới hạn

3


1.1.2 Lịch sử của enzym giới hạn
Hiện tƣợng giới hạn trong vi khuẩn Ďƣợc phát hiện lần Ďầu tiên bởi
Luria và Human vào năm 1952 [26]. Họ Ďã quan sát thấy khả năng tái sinh của
phage bị ức chế trong vi khuẩn, do vậy giúp tế bào vi khuẩn chống lại sự xâm
nhiễm.
Phage xâm nhiễm vào vi khuẩn Ďể tổng hợp ra axit nucleic và protein
cho riêng mình. Khi số lƣợng phage Ďạt Ďến hàng triệu bản sao, chúng sẽ phá
vỡ tế bào chủ và giải phóng ra ngoài. Các vi khuẩn mà không có hàng rào bảo
vệ Ďặc hiệu sẽ bị giết chết. Còn trong trƣờng hợp vi khuẩn có các hàng rào Ďặc
biệt bảo vệ thì tế bào sẽ vẫn nguyên vẹn trƣớc sự tấn công của phage.
Năm 1953, thí nghiệm của Bertani và cộng sự Ďã chứng minh rằng thực
khuẩn thể chỉ phát triển tốt trong một chủng Escherichia coli nhất Ďịnh [3], có
nghĩa là khi một thực khuẩn thể Ďã mọc trên một chủng vi khuẩn nhất Ďịnh thì
khả năng phát triển trên chủng vi khuẩn khác sẽ bị ức chế. Ví dụ λ phage chỉ
phát triển tốt trong chủng E. coli C, nhƣng khi kí sinh ở chủng khác nhƣ E.
coli K, số lƣợng bản sao lại giảm Ďáng kể. Nguyên nhân của hiện tƣợng này là
do tế bào vi khuẩn E. coli C không có hệ thống bảo vệ nên bị giết chết còn tế
bào vi khuẩn E. coli K có hệ thống bảo vệ nên Ďã sống sót. Các tế bào chủ nhƣ
E. coli K Ďƣợc gọi là tế bào chủ giới hạn và có khả năng làm giảm các hoạt
Ďộng sinh học của thực khuẩn thể λ.

Năm 1960, Arber và Meselson Ďã chứng minh hệ thống bảo vệ này là
các enzym giới hạn trong vi khuẩn. Các enzym này có vai trò nhƣ chiếc kéo
sinh học cắt vụn trình tự ADN phage khi chúng xâm nhập vào tế bào vật chủ
[12, 21, 31]. Kết quả là vật chất di truyền của phage sẽ bị phá hủy và chúng
không còn khả năng nhân lên trong tế bào nữa.
Enzym giới hạn hoạt Ďộng dự trên nguyên tắc là nhận ra các trình tự
Ďặc hiệu trên ADN. Các trình tự này tồn tại cả trong phage và trong vi khuẩn.
Các phage vốn không có cơ chế nào Ďể phòng vệ nên bị enzym giới hạn phân
cắt. Trong khi Ďó vi khuẩn luôn có các enzym sửa Ďổi Ďi kèm. Cơ chế sửa Ďổi

4


của enzym rất Ďơn giản, Ďó là gắn thêm một nhóm CH3 vào bazơ nitơ trong
trình tự Ďặc hiệu, lập tức enzym giới hạn sẽ bỏ qua vị trí Ďó. Chính vì vậy,
ADN vật chủ luôn miễn dịch với chính enzym giới hạn của nó.
Năm 1971, Nathans và Danna Ďã phát hiện ra các enzym giới hạn có
thể cắt ADN virus khỉ 40 (SV40) thành nhiều Ďoạn nhỏ với kích thƣớc dài
ngắn khác nhau và xem Ďƣợc khi chạy Ďiện di trên gel polyacrylamide [8]. Các
hình vạch này là Ďặc trƣng riêng của ADN virus khỉ 40. Do Ďó, các enzym giới
hạn Ďƣợc sử dụng Ďể lập bản Ďồ gen [25, 45].
Năm 1978, giải Nobel về Sinh lý học và Y học Ďã Ďƣợc trao cho Arber,
Nathans và Smith vì Ďã phát hiện và biểu hiện thành công hoạt tính của enzym
giới hạn, giúp việc thao tác trên ADN trở nên dễ dàng hơn. Cho Ďến nay kĩ
thuật tái tổ hợp ADN Ďã rất phát triển, thu Ďƣợc nhiều kết quả có ứng dụng
trong thực tiễn, ví dụ sản xuất insulin tái tổ hợp ở quy mô lớn Ďể Ďiều trị cho
những ngƣời mắc bệnh tiểu Ďƣờng [26, 54].
1.1.3 Phân loại enzym giới hạn
Cho Ďến nay có rất nhiều enzym giới hạn khác nhau Ďƣợc tìm thấy
trong vi khuẩn. Các enzym giới hạn này Ďƣợc phân loại dựa trên các tiểu Ďơn

vị cấu tạo nên enzym, các thành phần tham gia xúc tác Ďặc Ďiểm trình tự nhận
ra và vị trí cắt xung quanh trình tự nhận [4, 6, 50, 55, 58], bao gồm 4 loại
chính sau:
Enzym giới hạn loại I là những enzym có phân tử lƣợng khoảng
300.000 Da, Ďƣợc phát hiện lần Ďầu tiên bởi Arber và Meselson khi cắt xa vị
trí nhận biết từ 1.000 Ďến 5.000 nucleotide [37, 45], có sự tham gia xúc tác của
Mg2+, SAM, ATP.
Enzym giới hạn loại II là những enzym có phân tử lƣợng thấp hơn loại
I, khoảng 20.000 Ďến 100.000 Da. Loại II Ďƣợc phát hiện lần Ďầu tiên bởi
Smith khi cắt tại vị trí nhận biết [17, 51]. Vị trí nhận biết của loại II thƣờng là
các trình tự Ďối xứng xuôi ngƣợc dài từ 4-8 nucleotide [7]. Enzym loại này xúc

5


tác không cần năng lƣợng ATP, chỉ cần Mg2+ làm cofactor [43, 5]. Tuy nhiên,
mới Ďây enzym loại II còn Ďƣợc biết Ďến với nhiều Ďặc Ďiểm mới. Ví dụ
enzym loại IIG (MmeI, HauI) [44], gồm 850-1250 axit amin, là các enzym
mang hai chức năng giới hạn-sửa Ďổi trên cùng một phân tử, trong khi hầu hết
các enzym loại II Ďƣợc biết Ďến trƣớc Ďây Ďều có hai chức năng tách rời. Các
enzym này luôn có chung vùng nhận ra trình tự Ďặc hiệu TRD (Target
Recognition Domain) [15]. Kể cả khi vùng nhận ra trình tự Ďích Ďó thay Ďổi,
chúng sẽ vẫn phối hợp hoạt Ďộng Ďể bảo vệ vật chủ vi khuẩn. Loại IIG hiện
nay Ďƣợc chia thành nhiều dƣới nhóm dựa theo trình tự nhận biết liên tục (ví
dụ, AcuI: CTGAAG) hoặc trình tự nhận biết không liên tục (ví dụ, BcgI:
(CGANNNNNNTGC với N là 1 trong 4 loại nucleotide), chỉ cắt một bên phía
ngoài vị trí nhận biết hay cắt cả hai phía và giải phóng một Ďoạn nhỏ chứa
trình tự nhận biết.
Enzym giới hạn loại III gồm những enzym nhận ra một trình tự từ 5-7
bp bất Ďối xứng và cắt xa trình tự Ďó 20-30 bp [9]. Loại III cần có sự tham gia

xúc tác của AdoMet và ATP nhƣ các Ďồng yếu tố [30].
Enzym giới hạn loại IV là những enzym chỉ cắt ADN có trạng thái
methyl hóa.
Trong 4 loại RE nói trên chỉ có RE loại II Ďƣợc ứng dụng nhiều nhất.
1.2 Enzym giới hạn-sửa đổi
Hệ thống giới hạn – sửa Ďổi RM (Restriction Modification) gồm các
enzym mang cả hai chức năng giới hạn và sửa Ďổi trên cùng một phân tử
protein, là một tiến hóa trong cơ chế bảo vệ của vi khuẩn chống lại sự xâm
nhập của ADN lạ. Với các hệ thống R-M cổ Ďiển, chức năng cắt và sửa Ďổi
Ďƣợc mang trên 2 protein khác nhau, tức là mỗi protein phải có vùng TRD
(Target Recognition Domain) nhận ra trình tự nucleotide Ďặc hiệu riêng. Dẫn
tới, khi xảy ra Ďột biến trên vùng TRD của endonuclease làm thay Ďổi trình tự
nhận biết, methyltransferase cũng phải có cùng thay Ďổi với endonuclease Ďể
bảo vệ ADN vật chủ. Nhƣng xác suất Ďể methyltransferase có cùng thay Ďổi

6


gần nhƣ bằng không, các trình tự không Ďƣợc sửa Ďổi, ADN bị cắt nhỏ, gây
chết tế bào chủ. Trong khi Ďó, các enzym RM chỉ có một vùng chung TRD thì
khi Ďột biến xảy ra trong vùng TRD làm trình tự nhận biết của cả
endonuclease và methyltransferase cùng thay Ďổi. Lúc Ďó, chức năng giới hạn
và sửa Ďổi sẽ tiếp tục phối hợp với nhau cùng làm việc trên một trình tự chung
mới, kết quả là ADN genom của tế bào chủ vẫn Ďƣợc bảo vệ.
1.3 Họ HauI
1.3.1 Giới thiệu về HauI
HauI là một enzym giới hạn loại IIG, thuộc hệ thống RM khi mang hai
chức năng giới hạn và sửa Ďổi trên cùng một phân tử, có nguồn gốc từ vi
khuẩn Herpetosiphon aurantiacus DSM 785. HauI Ďƣợc biết Ďến với khả năng
nhận ra trình tự Ďặc hiệu không Ďối xứng gồm 7 nucleotide 5'-GGCCAAG-3'

và cắt xa trình tự nhận biết Ďó 10/8 bp. Gen mã hóa cho enzym có kích thƣớc
lên tới 3.075 bp, tƣơng ứng với 1.024 axit amin. Mã số truy cập của enzym
trên GenBank là ABX04580.
Trƣớc Ďây, HauI chỉ là một enzym giả Ďịnh Ďƣợc tìm thấy trên
REBASE [46] với tên gọi là HauORF1937P, trong Ďó, REBASE là cơ sở dữ
liệu toàn diện về hệ thống các enzym giới hạn-sửa Ďổi. Sau Ďó, HauORF1937P
Ďã Ďƣợc tách dòng và biểu hiện hoạt tính trong E. coli.
Điều này chứng tỏ rằng từ một trình tự sẵn có trên GenBank, ta hoàn
toàn có thể biểu hiện ra một enzym giới hạn có hoạt tính. Không những
vậy, sàng lọc ảo trên máy tính có tính ƣu việt hơn so với sàng lọc vi khuẩn
trong tự nhiên sản xuất enzym giới hạn nhƣ phƣơng pháp truyền thống
trƣớc Ďây. Sàng lọc ảo giúp tách dòng và biểu hiện gen trở nên dễ dàng
hơn, giúp lựa chọn các gen có nhiều Ďặc tính tốt, chỉ cần ngƣời nghiên cứu
biết cách sử dụng máy tính.

7


1.3.2 Khám phá in silico về các gen thuộc họ HauI
1.3.2.1 In silico
In silico là thuật ngữ Ďể chỉ sự mô phỏng trên máy tính hoặc thông qua
mô phỏng máy tính Ďể thiết kế các phân tử protein-enzym mới.
Kể từ khi các trình tự Ďầu tiên của protein insulin Ďƣợc mô tả bởi
Sanger vào năm 1951, các nhà sinh học Ďã cố gắng sử dụng kiến thức này Ďể
tìm hiểu các chức năng phân tử [47, 48]. Theo Levitt, các kết quả phân tích
trình tự xuất hiện lần Ďầu tiên trong khoảng thời gian từ 1969-1977 [23], bởi
trong năm 1969, trình tự chuỗi tARN vận chuyển lần Ďầu tiên Ďƣợc sử dụng Ďể
tìm ra tƣơng tác giữa axit amin và nucleotide [22]. Đến năm 1970, Needleman
và Wunsch Ďã tìm ra các thuật toán máy tính Ďầu tiên cho việc sắp chuỗi các
trình tự [39].

Ngày nay, in silico Ďã trở thành bộ phận không thể thiếu của công nghệ
sinh học hiện Ďại. Nghiên cứu in silico cho phép sử dụng các phần mềm tin
sinh học Ďể khai thác các dữ liệu về trình tự genom vi khuẩn, thông tin mà
Ďƣợc cập nhật liên tục trên NCBI. Các trình tự gen sau khi Ďƣợc bổ sung vào
ngân hàng dữ liệu GenBank sẽ Ďƣợc so sánh với các trình tự enzym khác Ďể
phát hiện mối quan hệ tiến hóa giữa các loài sinh vật. Từ Ďó, các Ďặc Ďiểm
chung về cấu trúc, chức năng trong của các chuỗi ADN, RNA, peptide và các
cơ chế tƣơng tác ADN-protein trong tế bào vi khuẩn dần Ďƣợc hé lộ. Nhờ vậy
việc dự Ďoán chức năng của một gen dựa vào những Ďặc Ďiểm Ďã tìm ra trở
nên Ďơn giản [36].
Thực hiện nghiên cứu in silico này có tính chất Ďích xác, rút ngắn thời
gian nghiên cứu khi bỏ qua bƣớc phân lập nhƣ trong nghiên cứu in vivo
(nghiên cứu các chủng sống).
Ngày nay, có rất nhiều kỹ thuật và công cụ có thể so sánh nhiều trình tự
(sequence alignment) cùng lúc và phân tích sự giống nhau của các trình tự Ďó
[57]. Phân tích trình tự trong sinh học phân tử bao gồm những nội dung cơ bản
sau:

8


1. So sánh các trình tự Ďể tìm ra sự giống nhau.
2. Xác Ďịnh các vùng chức năng bên trong các trình tự nhƣ các vùng
hoạt tính, vùng thay Ďổi hậu dịch mã, vùng gen cấu trúc, vùng khung Ďọc mở
và các vùng intron và exon.
3. Xác Ďịnh sự khác biệt trong trình tự, tìm ra sự Ďa hình của một trình
tự nucleotide (SNP), giúp phân biệt gen Ďó với các gen khác.
4. Phát hiện sự tiến hóa và sự Ďa dạng di truyền, xác Ďịnh loài sinh vật
dựa vào cấu trúc phân tử.
5. Xác Ďịnh cấu trúc phân tử từ trình tự

Trong hóa học có các kỹ thuật Ďể phân tích trình tự của một polymer
hình thành từ những monome nào. Trong di truyền và sinh học phân tử cũng
có kĩ thuật tƣơng tự Ďƣợc gọi Ďơn giản là "giải trình tự".
 Các giai Ďoạn trong nghiên cứu in silico
a. Sắp xếp các trình tự
Mối quan hệ giữa những chuỗi gen thƣờng Ďƣợc phát hiện bằng cách
sắp chuỗi các trình tự gen Ďó lại với nhau. Hai cách so sánh thƣờng sử dụng là
so sánh hai trình tự và so sánh nhiều trình tự cùng lúc. Các công cụ phổ biến
cho sự sắp chuỗi bao gồm: BLAST (so sánh cặp), ClustalW, PROBCONS,
MUSCLE, MAFFT, và T-Coffee (so sánh nhiều trình tự).
b. Tìm ra gen giả Ďịnh
Nhìn chung dự Ďoán các gen của vi khuẩn thƣờng Ďơn giản và chính
xác hơn so với dự Ďoán các gen ở sinh vật nhân chuẩn vì có các vùng
intron/exon phức tạp.
1.3.2.2 Khám phá in silico về các gen thuộc họ HauI
Cơ sở của việc tìm kiếm in silico các enzym trong họ HauI là phải có
sự tƣơng Ďồng về trình tự axit amin. Nếu trình tự các gen quá Ďa dạng thì sẽ
không có họ enzym giới hạn nào tìm Ďƣợc.

9


Trƣớc Ďây, hệ thống enzym giới hạn loại II cổ Ďiển có trình tự rất Ďa
dạng. Hệ thống này gồm một enzym giới hạn và một enzym
methyltransferase. Hai gen mã hóa cho hai enzym này nằm sát nhau trên chuỗi
ADN vi khuẩn. Hai enzym này xúc tác phản ứng trên cùng một trình tự
nucleotide Ďặc hiệu. Những trình tự axit amin ngắn xuất hiện trên tất cả các
enzym methyltransferase Ďánh dấu cho khả năng sửa Ďổi ADN Ďã Ďƣợc tìm ra.
Các trình tự này Ďƣợc gọi là các motif. Tuy nhiên, các motif Ďánh dấu cho khả
năng cắt của enzym giới hạn chƣa Ďƣợc tìm thấy. Bởi vậy, Ďể phát hiện in

silico một enzym giới hạn cổ Ďiển, ta chỉ có cách là xác Ďịnh sự tồn tại của gen
mã cho methyltransferase Ďi cùng với nó.
Thời gian gần Ďây, với sự phát triển nhanh chóng của tin sinh học Ďã
cho phép dự Ďoán chức năng của enzym giới hạn dựa vào cấu trúc không gian
ba chiều của nó, từ Ďó có thể tìm thêm nhiều enzym giới hạn trong vi khuẩn
[18, 40]. Họ enzym giới hạn loại II Ďầu tiên Ďƣợc tìm kiếm in silico với Ďộ
tƣơng Ďồng về trình tự của các enzym trong họ lên tới 60% là họ MmeI. Họ
này thuộc hệ thống RM, mang cả hai chức năng giới hạn và sửa Ďổi trên cùng
một phân tử với khả năng nhận ra trình tự ADN của các enzym trong họ rất
khác nhau [35].
Cho Ďến nay, họ HauI cũng Ďƣợc tìm in silico bằng cách so sánh trình
tự HauI với các trình tự sẵn có trên GenBank nhờ phần mềm BLAST [1]. Tuy
các gen trong họ có nguồn gốc từ nhiều chủng vi khuẩn khác nhau nhƣng Ďộ
tƣơng Ďồng về trình tự của các gen này khá cao, lên tới 40%. Khi tiến hành
phân tích các vùng chức năng của họ HauI bằng phần mềm PROMALS3D
[42] thì thấy các motif Ďánh dấu cho khả năng cắt và sửa Ďổi ADN trong họ.
Các motif này xuất hiện ở gần Ďầu N gồm motif cắt nằm gần Ďầu N. Trong khi
vùng TRD nhận ra trình tự Ďặc hiệu thì nằm gần Ďầu C [28].

10


1 MLSIKPNHKA VREYYASLRS LAEARAQHEG AVAPAFAALL RACASQMGWT LVEQYSIRLK
61 KSSIRADGAL LDSFTLIRGV WEAKDSNDDL ATEVRKKFAA GYPAENILFQ APQRIILWQN
121 QRQVLDVDIS QPDALIDALL LFFNYQPPQY LQWDHAVVEF RERVPELAQG VLRLIEREIS
181 EKNQRFITAL ERFMALVREA INPNISVSAV EEMLIQHLLT ERIFRKVFNN PDFVNRNVIA
241 REIETVIQAL TSRSFNRNDF LRELDRFYGA IESTAATIEN FSHKQDFLNT VYENFFQGFS
301 IKVADTHGIV YTPQPIVDFM VRSVEELLRR EFNTSLGNAG VHVLDPFVGT GNFLLRVMHE
361 IPRSKLRQKY AEELHCNEVM LLPYYIASMN IEHLYYELTN SYQEFNGICL VDTFELAQVG
421 AGQQLGLFVP ENTERVLKQQ QQDIFVIIGN PPYNARQVNE NDNNKNRKYE IIDQRVAMTY

481 SRDSQQTNKN ALNDPYVKSF RWAADRIIRN GDEGIVALVT NNSFIDDLSF DGMRKHLAQD
541 FDAIYVLDLG GNVRKNPKLS GTTHNVFGIQ VGVSIIFLIK KRGSTKASDA KIWYARAGEM
601 WKKQEKFNLL NQAETIDKIE WQEILPDKKH TWLTDGLEND FDNFIPLGTK EAKKGFGQAI
661 FTQFTNGVKS NRDAWVWNFD SDTLSNNIKT TIDYYNDHVS RWQRLVTKQE IDSFISTDDK
721 KISWSGDLKS NIQRGRYIQY DANKVIDGIY RPYTKQKIYF ERLLNERVYL IPSLFPTASE
781 NRVICVVNEA QIPFSAQITN VIPCLHYGGR QTQCFPYYVY DDDGSNQREN ISDWALEHFR
841 SQLGEPSIEK WDIFYYVYGL LHSPHYRERY AANLRRELPR IPIVALADFQ ALAQAGRELA
901 ELHINYESQP EYNLQWLENR DEPLNWRVES MKLSKDRTTL RYNNFLSLAG IPAAAFEYKL
961 GNRSALDWVI DQYRVSTDAR SGITNDPNRH DDPEYIVRLI GKIITISLKT VEIVTRIGDV
1021 ALTP

Hình 1.2: Trình tự axit amin của HauI lấy từ GenBank
Trên hình 1.2, các trình tự axit amin Ďƣợc bôi vàng là các motif của họ
HauI gồm: motif D72-E82XK84: Ďánh dấu chức năng cắt nội mạch phụ thuộc
ion kim loại Mg2+ [19], motif I: L344DPFVGTGNF Ďánh dấu chức năng bám
AdoMet, motif X: G309IVYTP và motif IV: G449NPPY [28] Ďánh dấu chức
năng sửa Ďổi. Các motif này có thể có thay Ďổi Ďôi chút giữa các enzym trong
họ HauI nhƣng riêng motif Ďánh dấu cho chức năng sửa Ďổi thì rất bảo tồn.
Bởi vậy mà motif IV là motif dễ nhận biết nhất. Trên hình còn thấy các trình
tự Ďƣợc gạch là trình tự vùng TRD nhận ra trình tự Ďặc hiệu.
1.3.3 Giới thiệu về gen ORF8180
Trong danh sách các gen thuộc họ HauI, có một gen mã hóa cho một
enzym sửa Ďổi, có tên gọi là ORF8180. Gen này thuộc vi khuẩn Microcystis
aeruginosa NIES 843, có kích thƣớc phân tử là 2.997 bp, mã cho một protein
gồm 998 axit amin. Mã số enzym trên GenBank là BAG00640. Tên gọi của
gen trên REBASE là RM.Mae843ORF8180P.

11



1
61
121
181
241
301
361
421
481
541
601
661
721
781
841
901
961
1021
1081
1141
1201
1261
1321
1381
1441
1501
1561
1621
1681
1741

1801
1861
1921
1981
2041
2101
2161
2221
2281
2341
2401
2461
2521
2581
2641
2701
2761
2821
2881
2941

ATGTCTAGAT
GGCAGTCGCA
AAGGCGCGGG
GTCTATCCTG
AAGGATCAAT
AATGACAATA
AGACTGCGCG
AATTATGTAC
TTACCAACAA

AATTTTGTGA
ATTAGTCTGG
ATCAATATTT
GGAGTGATTG
CGTTATTATG
AAGTTTCTCA
CGGTTGGGAA
TATTTAGTTC
CCGGCGACGG
TTACGGTACA
ATCGCTAATT
GAGCATATCT
TTGTTTGCTA
TCTGTAATTA
AAAAATCGGA
ACAGCGCAGA
AGGTTAGGTG
ACATTTGACG
TTAGGTGGTA
ATTCAGACGG
CGAATTTTAT
TCATCGACAA
TGGATTGAAC
AAACTGCTCA
TCTACGAATA
CAATATTTTA
AAATGGAGTT
AGATTCGTAA
TTTTTTTCAG
TCAAATCAAG

ACTAACAAGA
TATGAAAAAG
AACCATTACA
CTCCACTACC
CTTCCCTTTT
CATATCAACT
CTCAAACCCA
GTCACTTTCC
GCCTTAGAAT
GAAAGATTTA
CGAGTCTGTA

TATTAATCAG
AGGAAACTTC
ATTTTTTGTT
ACGGGACGGT
ACGATAATTT
TTTTATTTGA
TCTCCATGCG
GTCCGGAGGT
TTTTAGAAGC
CAGCGCGGGA
AAGATGTGCG
TTAATGAGTC
AAACTTTCTT
CGGTAATTCG
AGGCGATTTA
TTGTCTATAC
ACAAGCATTT
GGACAGGAAC

AGTATAAGCA
TGAATATTGA
GTTTTGTGGA
TGTCGGTGGA
TTGGGAATCC
AGTATCCTGC
AGACAAAGCT
AAAATGGTAT
GTTTTAGAAA
ATGTCAGGAA
GGGTGGCGAT
ATACTCGCCG
AACTTAATCA
AATCAGATAA
AAAATAAAAC
GAGATGAATG
TTTCTATCTA
CTTCTTTAAT
TTTCTCTTAT
ATCGACTTAC
TCATAATGTT
TATTTTGTTT
AAGGAAACCG
ACGATAAAAA
CGGAATATCG
ACGATAACTT
ATGAAACCGT
AAACTAAACT
TACAAGATAT
GGATTTTAGA

ATAATTATCG
CTGTCAGCGT

CCAGTATCAG
GATTAGAGTC
AATTCCGGAG
AAAGGATGCT
AGACGAAGAA
AGATTCCCAG
CGATGATGAG
TGAGGATTTT
GTTGCGGGAT
CAATTTTTTA
AGAGATGATT
TCAGTTTCAC
TACTGGTAAT
GCGGACAGCG
TGAGAATTTT
ACCCAATGAA
TAGGAAGTTG
TTTTATAACG
TGAGATGCAC
GTTCACCTAC
TACCCTGGAC
GAATACCCAA
TCCTTATAAT
TATTGATAAG
ATATGATATG
AATAGCTTTT
AGTAGTAGAG

AAATCCTAAA
TAGTTTGATA
TCCTGAATTG
GCTTGATTTT
TGATTTTAAT
TGACATTCAA
GGTCTTTGAA
TAATAAATCG
ATCCAAATTT
TTATAGACCA
CTCAAATCAT
TTCAGGAGTT
AGATACACTT
TATCGACAAT
CCTCACCAAA
CAGTAAATAT
CTCTCAATGG
CGCACCCTAC
AAAAGCTGAC
TCCCAAAATT
TCAATATAAG
CTTCGCCGAT
CGAAACCATG

GCGGAAGTTG
GCTTTTCAGA
TTGGATTATC
TTGCGGTTAG
ATTGAGAAAA
ACGGCGGTTT

GCTTTGGATG
CGAGAGGCAA
TTAATTGCGT
GAGATTTGTC
ATTCAGCACA
CGGGAAAATA
ACCAAGCGCA
GCGAATATTT
TATAAAGCAT
ATTGTCCGTT
TTGGCGGATC
GAGTTAATTG
TGTAACGAGG
AAGCAGAAGA
CATGCTGCTT
CGCATTCAAA
GCTAATCAGC
CGCATTAAGG
TATTCTCGCT
ATTACTAACT
AATGAGTTTA
CTTTCAGGGA
GTGAAGCGAG
GATACAGCAT
GAGCATATCA
GACTTGATAC
GCATTATTTG
GACGATGAGC
ATTGAGTGTA
AAGAACAAAG

TATATTACCA
TATCAAGTAT
GGCTCTTCAA
GAAAAAACTC
ATCACCGATT
CTCGACATCT
GAATTAAACC
GTAGAATGGG
CCACTAACCC
CGAGAAAAAA
GCTTGGGAAT
GAAAAGAAAC
TATAAAGAAA
AAAATAATAG

AGAAGATTGT
ATTTGTTAAA
GCACTAAGTC
ATTGGGGATA
AGTTGGCGAA
TAATTCAAGG
GGATTATTAA
TTGATAGTTT
TGCAGTCGGA
GCAAGTCAAT
TCCTGACAGA
ATATCGCCAG
ATACTTTAGG
ATAACCACCA
ACAATCCGAA

TTATGATTGA
CAGGAGTAGA
AGTATTTACC
TGGCAATTCT
TGGGTGAGTA
TTCATCTCAA
ATCAAAATGA
AAAATGAGAA
ATACTTACAT
TCTTTCGTTG
CTTCTTTTAT
GTGAAATTTA
CAACTCATAA
AAAGTAATAA
CGCAAAAATT
TCCCAGATAA
CTGTAGTTGA
AATTTTTCTC
AATTATTGTC
ATCACATAAA
AAAAATCAGA
AGTATTACTA
TTGGCAATGA
AACCAAATTC
AATGTCTCCC
GGGGATTGCA
TCCACTACAC
TTAAGCGAGA
GAAGCAAACT
GCATTGATAC

ATTCTATCAA
ATAAACTCGG
CCAAAGATCA
CAGTAATTGA
AAGCGATGAG

Hình 1.3: Trình tự ADN của ORF8180 lấy từ GenBank

12

CCAATATGGC
TGACTATTGC
GGGAAAAGTT
TTGGGAAAGT
AGGCTATCCT
AGGAGAGGAA
TGCTTTTATT
TAAGGAAGAT
GACGAATCGT
CAATCCAGAA
GGATATTTTT
GGAATTACAG
GACTATTGAA
CGAGAAGCAG
AGCGGCGGAC
AAGTGTCGAT
AATTTTAGAT
GAAGGATAAG
GCCTTATTAT
TGAAGAGTTT

GCAGATGGAT
CCGCAATATT
TGACAATAAT
CGAAGAGAGT
GGCTACAGAT
CGATGCGAGG
TATCATTGAT
TGTTTTCGGT
TCTTCCTTGT
AGAGTTTTTG
AAAACATAAC
CAAAAATACT
TCTAGGTGTT
CAAAAAGATG
TTATTCGATA
GTATTTCCCA
TTCTAATAAA
ATTAATTAAT
TGTGTTAGTA
CCTCTACTAC
ACAATTCCAA
TTATGCAGTC
ATTTCCCCGA
AATGGAATTA
TAATAATAAT
CCTCGATGAT
TAATCGTTCG
AACCATCGCC
CTTATTACAA
ACATTAA



1
61
121
181
241
301
361
421
481
541
601
661
721
781
841
901
961

MSRLLISQYQ
VYPDGTVKDA
RLRVSMRDDE
NFVTARDNFL
GVIETFFTGN
RLGIVYTPNE
LRYKYKHEMH
LFAMSVENTQ
TAQKTKLYDM
LGGNVRKNPK

SSTKLNQLDF
STNRDEWVFE
RFVISLIYRP
TNKIFCLDTL
LHYPEYRSKY
LKPKTKLKAD
ERFNNYRFAD

AEVEKIVQYG
LRLDWGYWES
ALDGIINAFI
EICRKSINPE
TKRNTLGTIE
IVRFMIESVD
CNEVAILPYY
RIQNQNDRNI
YSRFFRWATD
LSGTTHNVFG
EHIIPDKKHN
DDEQLLSKKM
YITKYYYSNK
EKTQCLPLYY
ELNLKREFPR
REKNSINLDD
YKETVIDLLQ

GSRKETSIRV
KDQYDNLDEE
NYVRPEVEDF
ISLEDVREMI

RYYAVIRRTA
YLVHKHFRKL
IANLNIEFTY
SVIIGNPPYN
RLGENGIIAF
IQTGVAISLI
WIEQSDNDFN
QYFISIYNKS
FFSDRLTSNH
YEKEGNRIDN
LPFYDNFSQW
VTFLQDIPKI
RVCTVSVETM

AFQNLLNDYC
IEKKLAKGYP
REAIDSFKED
IQHILTEDIF
ANIYNHHEKQ
LADPGVEILD
KQKMGEYEEF
ANQQNENDNN
ITNSSFIDAR
VKRESNNLPC
DLIPVVDKNT
IECNHINYSI
YQVFGNELIN
ITDWGLQQFQ
VEWGSKLMEL
AWEYKLGNRS

KIIEAMRH

KARDFLLIPE
NDNILFEDSQ
LPTILEALRD
INIFNESQFH
KFLKAIYENF
PATGTGTFIT
EHICFVDTLD
KNRKYPAIDK
TFDGFRKVVE
RILYTRRPEL
KLLKNKTDIQ
KWSSSLISKF
SNQVIMFSGV
NHYNDKNLTK
HINYETVAPY
ALEWILDQYK

LDYRTKSGKV
TAVLIQGGEE
LIALQSETNR
RENNIARELQ
YKAYNPKAAD
ELIEYLPKDK
HAAFHLKQMD
RIKDTYIEES
NEFSEIYIID
DTASQKLEFL
ALFEFFSLGV

KNKEKSEYFP
GSSKPNSVLV
LDIFHYTYAV
PLTRIDTNNN
EKKPKDQTIA

Hình 1.4: Trình tự axit amin của ORF8180 lấy từ GenBank
Trên hình 1.3, ta thấy trình tự ADN của ORF8180 có codon ATG mã
cho axit amin mở Ďầu là methionine ở Ďầu gen. Cuối gen có codon TAA mã
cho axit amin kết thúc.
Trên hình 1.4, ta thấy các motif Ďặc trƣng Ďánh dấu cho hoạt tính
endonuclease và adenine specific ADN methyltransferase (vùng trình tự bôi
vàng). Vùng trình tự Ďƣợc gạch chân là vùng TRD nhận ra trình tự Ďặc hiệu.
1.3.4 Vùng TRD
1. Giới thiệu vùng TRD
Vùng TRD (Target Recognition Domain) là vùng nhận ra trình tự Ďặc
hiệu của enzym giới hạn, Ďƣợc tìm thấy lần Ďầu tiên ở các enzym giới hạn loại
I, gồm 150 axit amin [53].
Năm 2007, vùng TRD của enzym loại II Ďƣợc tìm ra khi tiến hành tráo
Ďổi các vùng Ďƣợc dự Ďoán là mã cho vùng TRD của 3 enzym khác nhau [15].
Kết quả cho thấy các enzym mới Ďƣợc tạo ra có Ďặc hiệu không giống với bất
kì enzym nào từng mô tả trƣớc Ďây. Điều này chứng tỏ vùng Ďƣợc dự Ďoán
Ďúng là vùng nhận ra trình tự Ďặc hiệu.

13


Việc tìm ra vùng TRD của enzym giới hạn loại II có ý nghĩa rất lớn
trong nghiên cứu sinh học phân tử cũng nhƣ kĩ thuật di truyền khi tạo ra các
Ďặc hiệu mới theo ý muốn.

2. Đa dạng trình tự vùng TRD
Năm 2009, Morgan và cộng sự Ďã tìm ra sự Ďa dạng trong trình tự vùng
TRD của họ MmeI. Họ này có trình tự axit amin vùng cắt và sửa Ďổi rất bảo
tồn, trong khi trình tự vùng TRD gồm 200 axit amin nằm cuối gen, tính từ axit
amin 621 Ďến axit amin 820, rất hay thay Ďổi [35]. Sau Ďó, nhóm nghiên cứu
cũng Ďã xác Ďịnh và biểu hiện Ďƣợc 20 enzym trong họ với tống số 19 Ďặc hiệu
khác nhau. Các Ďặc hiệu này không giống với bất cứ Ďặc hiệu nào của các
enzym giới hạn-sửa Ďổi Ďã mô tả trƣớc Ďây. Điều này chứng tỏ sự Ďa dạng về
trình tự vùng TRD Ďã tạo ra sự Ďa dạng về Ďặc hiệu của các enzym trong họ.
Đồng thời cũng chỉ ra sự tiến hóa của các enzym giới hạn-sửa Ďổi loại II trong
vi khuẩn.
Cũng trong năm 2009, Morgan và Luyten tiếp tục tìm ra quy luật tƣơng
tác giữa acid amin trong vùng nhận ra trình tự Ďặc hiệu TRD của họ MmeI với
ba vị trí trong trình tự ADN Ďích [34]. Để tìm ra quy luật này, nhóm tác giả Ďã
Ďổi vị trí axit amin Ďƣợc dự Ďoán là nhận ra base nitơ này cho axit amin Ďƣợc
dự Ďoán là nhận ra base nitơ khác. Kết quả thu Ďƣợc là tạo ra enzym mới có
trình tự nhận phù hợp với dự Ďoán từ trƣớc và có hoạt tính tƣơng tự nhƣ các
enzym phân lập trong tự nhiên. Điều này chứng tỏ một vài thay Ďổi nhỏ về axit
amin quan trọng trong vùng nhận ra vị trí Ďích TRD Ďã làm thay Ďổi khả năng
nhận ra ADN của enzym trong họ. Từ Ďó gợi ra hƣớng nghiên cứu mới trong
thiết kế nhiều enzym giới hạn-sửa Ďổi loại II có Ďặc hiệu nhƣ mong muốn.
Họ HauI cũng có Ďặc Ďiểm giống MmeI khi có 306 axit amin trong
trình tự vùng TRD rất hay thay Ďổi, trong khi các trình tự còn lại rất bảo tồn.
Nguyên nhân dẫn Ďến sự phong phú các trình tự gen giới hạn này là do sự
chuyển gen ngang giữa các loài sinh vật khác nhau sống trong cùng một hệ
sinh thái, giúp vi khuẩn thích nghi với môi trƣờng sống có nhiều phage [13,

14



14]. Nhƣ vậy, tiềm năng nhận biết nhiều trình tự Ďặc hiệu khác nhau trong họ
HauI cũng rất cao.
Tiến hành sàng lọc gen ORF8180 thuộc họ HauI từ các mẫu thiên nhiên
chứa nhiều Microcystis aeruginosa sẽ cho phép phát hiện nhiều gen có trình tự
tƣơng tự với ORF8180. Tiếp tục phân tích những thay Ďổi trong vùng nhận ra
trình tự Ďặc hiệu TRD của các gen tƣơng tự ORF8180 này sẽ thấy Ďƣợc tiềm
năng nhận biết nhiều trình tự ADN khác nhau ngay trong một trình tự giả
Ďịnh.
Xác Ďịnh Ďặc hiệu cụ thể của từng gen sẽ Ďem lại những hiểu biết về
tƣơng tác giữa axit amin và nucleotide trong trình tự nhận, gợi ý thiết kế nhiều
enzym loại II với Ďặc hiệu mới (nhƣ Ďã tìm ở họ MmeI) [33, 34].
1.4 Microcystis aeruginosa
Microcystis aeruginosa (M. aeruginosa) là các vi khuẩn lam (blue
green algae), thuộc họ Cyanobacterium, mọc phổ biến tại các ao hồ tù Ďọng
chƣa Ďƣợc xử lí và gây hiện tƣợng nƣớc nở hoa. Đặc Ďiểm của M. aeruginosa
là có chứa diệp lục, hay nổi lên trên mặt nƣớc Ďể thu nhận năng lƣợng ánh
sáng mặt trời phục vụ cho quang hợp. M. aeruginosa phát triển rất mạnh ở các
quốc gia có Ďiều kiện khí hậu nóng ẩm quanh năm với số giờ chiếu sáng trong
ngày nhiều. Bởi vậy, các ao hồ ở Việt Nam rất dễ bắt gặp sự bùng nổ của các
vi khuẩn lam này. Ở nhiều quốc gia khác nhƣ Nga, Hy Lạp, Brazil, Nhật Bản,
Cộng Hòa Séc, Phần Lan, M. aeruginosa cũng mọc rất phổ biến.
Trong y tế công cộng, việc phát hiện sự có mặt của vi khuẩn lam trong
mẫu nƣớc là rất quan trọng bởi Ďộc tố microcystin mà M. aeruginosa sinh ra
có thể gây hại cho con ngƣời và Ďộng vật uống phải nguồn nƣớc Ďó. Nhiều
nghiên cứu trong nƣớc và trên thế giới Ďã tìm ra cấu trúc genome của các
chủng M. aeruginosa khác nhau trong tự nhiên [56]. Cho Ďến nay, các số liệu
Ďó vẫn không ngừng tăng lên.

15



1.4.1 Sinh thái
Trong môi trƣờng sống, M. aeruginosa là các tế bào dạng hạt (hình
cầu), liên kết chặt chẽ với nhau tạo thành các Ďám tế bào có hình dạng không
Ďều nhau, Ďƣờng kính từ 3,5-6,5µm và thƣờng tạo lỗ rời rạc [11].
Trong các sinh vật nhân sơ, M. aeruginosa là loài duy nhất thực hiện
quang hợp và có khả năng lây lan rộng rãi nhất. Chỉ cần gặp Ďiều kiện môi
trƣờng thuận lợi nhƣ nhiệt Ďộ thích hợp, môi trƣờng giàu dinh dƣỡng, M.
aeruginosa sẽ phát triển bùng nổ, còn gọi là hiện tƣợng nƣớc nở hoa. Nhiệt Ďộ
tối ƣu cho sự phát triển của M. aeruginosa là 32°C. Khi tăng nhiệt Ďộ lên trên
38°C hoặc giảm nhiệt xuống thấp hơn 15°C, tế bào sẽ ngừng tăng trƣởng và
lƣợng Ďộc tố cũng giảm Ďi [11].
1.4.2 Các loại độc tố
M. aeruginosa có khả năng sinh tổng hợp hai loại Ďộc tố là Ďộc tố gan
(microcystins) và Ďộc tố thần kinh (lipopolysaccharides - LPSs) [29]. Lƣợng
Ďộc tố sinh ra nhiều nhất ở Ďiều kiện nhiệt Ďộ môi trƣờng thấp khoảng 20°C.
Độc tố gan Ďầu tiên Ďƣợc phát hiện trong M. aeruginosa là nhóm
heptapeptides. Các heptapeptides này khi vào trong cơ thể bằng Ďƣờng uống
sẽ liên kết chặt chẽ với các protein phosphatase trong tế bào Ďộng vật có vú và
gây Ďộc tế bào [10].
Ở các nƣớc Địa Trung Hải nhƣ Hy Lạp, tỷ lệ M. aeruginosa nở hoa
thƣờng diễn ra trong thời gian dài. Ngƣời dân sống trong các khu vực Ďó
thƣờng mắc các bệnh về viêm gan và viêm dạ dày ruột với nồng Ďộ các enzym
trong huyết tƣơng cao do uống phải nguồn nƣớc có chứa Ďộc tố
microcystins. Không những vậy, microcystins còn gây ra các vấn Ďề nghiêm
trọng về sức khỏe hoặc thậm chí gây tử vong ở ngƣời và Ďộng vật. Do những
ảnh hƣởng này, Tổ chức Y tế Thế giới Ďã thiết lập chỉ tiêu về nồng Ďộ cho
phép của microcystins là 0,04 g/kg trọng lƣợng cơ thể [52].

16



×