Tải bản đầy đủ (.pdf) (228 trang)

Nghiên cứu sự sắp xếp các DNA oligomer trên nhiễm sắc thể vi khuẩn và nấm men

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (11.49 MB, 228 trang )

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA

PHAN THỊ HUYỀN

NGHIÊN CỨU SỰ SẮP XẾP CỦA CÁC DNA OLIGOMER
TRÊN NHIỄM SẮC THỂ VI KHUẨN VÀ NẤM MEN

LUẬN ÁN TIẾN SĨ KỸ THUẬT

TP. HỒ CHÍ MINH NĂM 2015


ĐẠI HỌC QUỐC GIA TP. HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA

PHAN THỊ HUYỀN

NGHIÊN CỨU SỰ SẮP XẾP CỦA CÁC DNA OLIGOMER
TRÊN NHIỄM SẮC THỂ VI KHUẨN VÀ NẤM MEN

TRƯỜNG ĐẠI HỌC BÁCH KHOA

Chuyên ngành:
Mã số chuyên ngành:

Công nghệ Sinh học
62428005

Phản biện độc lập 1: GS.TS. Trần Linh Thước
Phản biện độc lập 2: PGS.TS. Trần Liên Hà



Phản biện 1: GS.TS. Nguyễn Thị Lang
Phản biện 2: PGS.TS. Trần Văn Lăng
Phản biện 3: PGS.TS. Lê Thị Thủy Tiên

NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS. Nguyễn Đức Lượng


LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả. Các kết quả
nghiên cứu và các kết luận trong luận án này là trung thực, và không sao chép từ bất
kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu
(nếu có) đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định.

Tác giả luận án

Chữ ký
Phan Thị Huyền

i


TÓM TẮT LUẬN ÁN
Nhằm mục tiêu đạt được những kiến thức sâu về sự phân bố của các nucleotide trong
phân tử DNA nhiễm sắc thể của vi khuẩn và nấm men, đồng thời để thiết lập được một
phương pháp phân loại các vi khuẩn có mối quan hệ tiến hóa gần ở cấp độ dưới giống,
luận án này đã thực hiện hai nội dung nghiên cứu chính sau:
Nội dung 1: Nghiên cứu sự sắp xếp của các oligomer trong phân tử DNA nhiễm sắc
thể của vi khuẩn và nấm men. Những tìm hiểu bước đầu về sự sắp xếp của các

oligomer trong phân tử DNA nhiễm sắc thể bao gồm việc khảo sát mối quan hệ giữa
kích thước oligomer và tính đối xứng của phân tử DNA nhiễm sắc thể, xem xét tính
bất đối xứng monomer cục bộ của các đoạn DNA trong nhiễm sắc thể, đồng thời xác
định sự có mặt của các oligomer dọc theo chiều dài một sợi đơn của phân tử DNA
nhiễm sắc thể. Các kết quả cho thấy rằng kích thước oligomer càng lớn thì mức độ đối
xứng của phân tử DNA nhiễm sắc thể giảm, và rằng trong khi phân tử DNA nhiễm sắc
thể mang tính đối xứng ở mức độ nhiễm sắc thể thì các vùng cục bộ của phân tử DNA
nhiễm sắc thể biểu hiện tính bất đối xứng. Ở mức độ nhiễm sắc thể, sự phân bố của các
oligomer và các oligomer bổ sung đảo ngược (BSĐN) tương ứng của chúng trong các
trình tự mang thông tin mã hóa protein đóng góp tương đương với sự phân bố của
chúng trong các trình tự không mã hóa protein vào tính đối xứng của phân tử DNA
nhiễm sắc thể. Trong các trình tự mang thông tin mã hóa protein, các trimer mã hóa
codon được phân bố theo qui tắc tương đương về tần suất xuất hiện của chúng trên cơ
sở vị trí của các nucleotide của codon và do đó định dạng sự sử dụng codon, góp phần
tạo nên tính đối xứng của phân tử DNA nhiễm sắc thể. Các kết quả khám phá sâu hơn
cho thấy sự phân bố của các trimer mã hóa codon trong các trình tự sense của phân tử
DNA nhiễm sắc thể có một mối quan hệ mật thiết với sự phân bố của chúng trong các
trình tự antisense của phân tử. Sự phân bố của các trimer mã hóa codon trong các trình
tự sense và antisense dọc theo chiều dài phân tử DNA nhiễm sắc thể vi khuẩn trên cơ
sở mối quan hệ này định hình rất rõ hai replichore. Mật độ phân bố của các trimer mã
hóa codon trong các trình tự sense và antisense trên hai replichore của các phân tử
DNA nhiễm sắc thể vi khuẩn cho thấy các trimer mã hóa codon và các trimer BSĐN
tương ứng của chúng trên cơ sở mối quan hệ này được phân bố cân đối trong các trình

ii


tự sense và antisense của hai replichore, do đó góp phần tạo nên tính đối xứng của
phân tử DNA nhiễm sắc thể. Trong các trình tự không mã hóa protein, sự phân bố của
các trimer không giống như trong các trình tự mang thông tin mã hóa protein.

Nội dung 2: Ứng dụng sự phân bố của các trimer trong bộ gene để phân loại các vi
khuẩn có mối quan hệ tiến hóa gần. Trên cơ sở tính đặc trưng loài của sự sử dụng
codon định dạng bởi sự sắp xếp của các trimer trong các trình tự mang thông tin mã
hóa protein ở mức độ nhiễm sắc thể, tính đặc trưng loài của mật độ phân bố của các
trimer trong bộ gene được xác định và được ứng dụng để phân loại các vi khuẩn trong
các họ Enterobacteriaceae, Burkholderiaceae và Pseudomonadaceae. Kết quả của nội
dung nghiên cứu này cho thấy mật độ phân bố của các trimer trong bộ gene có thể
được sử dụng để phân loại các vi khuẩn ở cấp độ dưới giống.

iii


ABSTRACT
Aims to get deep knowledge about the distribution of nucleotides in the chromosomes
of bacteria and yeast, and to establish a method for classifying the closely related
bacteria below genus level, this thesis has made two main research contents, as
follows:
Content 1: Study on the oligomer arrangement in the bacterial and yeast chromosomes.
Initial study includes the investigation on the relationship between the oligomer size
and the chromosomal strand symmetry, the consideration of the monomer asymmetry
of local sequences in the chromosome, and the determination of the presence of
individual oligomers along the length of the single strand of chromosomal DNA
molecules. The results showed that the larger the oligomer size, the less symmetric the
chromosomes were, and that while the whole chromosome was symmetric, the local
sequences of the chromosomes were asymmetric. At the chromosomal level, the
distribution of oligomers and their respective reverse complements in the sequences
that carried the information to encode proteins and that in the protein non-coding
sequences contributed equivalently to the chromosomal strand symmetry. In the
sequences carrying information for encoding the proteins, the trimers were distributed
according to a rule that exhibited the equivalence in their frequencies on the basis of

the position of the nucleotides in a codon and thus shaping the codon usage,
contributing to the chromosomal strand symmetry. Deeper investigation results
showed that the distribution of the codon encoding trimers in the sense sequences of
each chromosome had a very close relationship with that in the antisense sequences.
The distribution of codon encoding trimers in the sense and antisense sequences along
the length of the bacterial chromosomes on the basis of this relationship clearly shaped
two replichores. Densities of codon encoding trimers in the sense and antisense
sequences on the replichores of the bacterial chromosome showed that the codon
encoding trimers and their respective reverse complements on the basis of this
relationship were distributed in the sense and antisense sequences to balance the two
replichores, thus contributing to the bacterial chromosomal strand symmetry. In the

iv


protein non-coding sequences, the distribution of trimers was different in comparison
with that in the sequences that carried the information for encoding the proteins.
Content 2: Based on the species-specificity of the codon usage shaped by the trimer
arrangement in the sequences that carried the information for encoding the proteins at
the chromosomal level, the species-specificity of the trimer densities in genomes was
determined and was applied in the classification of closely related bacteria belonging
to the Enterobacteriaceae, Burkholderiaceae and Pseudomonadaceae families. The
results of this research content showed that the trimer densities in genomes could be
used to classify the bacteria below genus level.

v


LỜI CÁM ƠN


Lời đầu tiên, tôi xin được bày tỏ lòng biết ơn sâu sắc đến Thầy PGS.TS. Nguyễn Đức
Lượng đã tận tình hướng dẫn và giúp đỡ, và lời cảm ơn chân thành xin được gửi đến
tập thể Bộ Môn Công Nghệ Sinh Học đã tạo điều kiện thuận lợi cho tôi được thực hiện
và hoàn thành luận án.
Xin được bày tỏ lòng biết ơn đến Ban Giám Hiệu Trường Đại Học Bách Khoa
TPHCM, Phòng Đào Tạo Sau Đại Học, Ban Chủ Nhiệm và Văn Phòng Khoa Kỹ
Thuật Hóa Học đã giúp đỡ và tạo điều kiện cho tôi hoàn thành luận án này.
Xin cảm ơn các Quí Thầy, Cô trong Hội đồng đánh giá các chuyên đề Tiến sĩ, các Quí
Thầy, Cô trong Hội đồng đánh giá luận án ở cấp Bộ Môn, cấp Khoa và cấp Trường đã
đóng góp những ý kiến quí báu cho tôi thực hiện và hoàn chỉnh luận án.
Xin cảm ơn các Quí Thầy, Cô, anh, chị, em trong Khoa Kỹ Thuật Hóa Học đã động
viên và khích lệ, cảm ơn bạn bè đã cổ vũ và động viên tôi những lúc khó khăn trong
quá trình thực hiện luận án này.
Cuối cùng, con xin cảm ơn Mẹ và gia đình đã luôn sát cánh bên con, cho con động lực
để cố gắng.
Nghiên cứu sinh
Phan Thị Huyền

vi


MỤC LỤC

DANH MỤC HÌNH ........................................................................................................x
DANH MỤC BẢNG....................................................................................................xiv
DANH MỤC HÌNH PHỤ .............................................................................................xv
DANH MỤC BẢNG PHỤ..........................................................................................xvii
CÁC TỪ VIẾT TẮT ..................................................................................................xviii
CHƯƠNG 1


MỞ ĐẦU..............................................................................................1

1.1

LÝ DO CHỌN ĐỀ TÀI .....................................................................................1

1.2

MỤC ĐÍCH NGHIÊN CỨU .............................................................................2

1.3

ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU...................................................2

1.4

TÍNH CẤP THIẾT CỦA ĐỀ TÀI NGHIÊN CỨU ...........................................3

1.5

Ý NGHĨA KHOA HỌC CỦA ĐỀ TÀI NGHIÊN CỨU ...................................4

1.6

Ý NGHĨA THỰC TIỄN CỦA ĐỀ TÀI NGHIÊN CỨU ...................................4

1.7

TÍNH MỚI CỦA ĐỀ TÀI NGHIÊN CỨU........................................................4


CHƯƠNG 2

TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU.......................................6

2.1

DNA...................................................................................................................6

2.2

DNA OLIGOMER.............................................................................................7

2.3

CẤU TRÚC DNA NHIỄM SẮC THỂ ..............................................................8

2.3.1

Nhiễm sắc thể tế bào sinh vật prokaryote ...................................................8

2.3.2

Nhiễm sắc thể tế bào sinh vật eukaryote.....................................................9

2.4

SỰ SAO CHÉP DNA NHIỄM SẮC THỂ ......................................................11

2.4.1


Sự sao chép DNA nhiễm sắc thể trong tế bào vi khuẩn............................11

2.4.2

Sự sao chép DNA nhiễm sắc thể trong tế bào eukaryote..........................13

2.5

TÍNH BẤT ĐỐI XỨNG VÀ ĐỐI XỨNG CỦA DNA NHIỄM SẮC THỂ....14

2.5.1

Các định luật của Erwin Chargaff.............................................................14

2.5.2

Các phương pháp xác định tính bất đối xứng và đối xứng của DNA .......14

2.5.3 Sự tuân thủ của DNA nhiễm sắc thể theo các định luật của Erwin
Chargaff.................................................................................................................17
2.6 TRÌNH TỰ NUCLEOTIDE TRONG PHÂN TỬ DNA NHIỄM SẮC THỂ
VÀ CÁC MỐI LIÊN QUAN ....................................................................................21

vii


2.6.1 Sự phân bố của các nucleotide trong phân tử DNA nhiễm sắc thể và vị trí
điểm khởi đầu sao chép .........................................................................................21
2.6.2


Hai mạch sao chép DNA và các bộ máy sao chép....................................24

2.6.3 Sự thay đổi trình tự nucleotide nhiễm sắc thể bằng phương pháp tái tổ hợp
sử dụng trình tự oligonucleotide sợi đơn và hiệu suất tái tổ hợp ..........................25
2.6.4

Sự thay đổi trình tự nucleotide nhiễm sắc thể và các mối liên quan.........26

2.6.5

Codon, sự sử dụng codon và mức độ biểu hiện gene................................27

2.7

PHÂN LOẠI CÁC VI KHUẨN CÓ MỐI QUAN HỆ TIẾN HÓA GẦN ......29

2.7.1

Phân loại nhờ các đặc điểm sinh, lý, hóa ..................................................29

2.7.2

Phân loại nhờ các trình tự 16S rDNA ......................................................30

2.7.3

Phân loại nhờ các trình tự bộ gene............................................................33

2.7.4


Phân loại nhờ các dấu hiệu bộ gene ..........................................................35

2.7.5

Phân loại nhờ tín hiệu tuần hoàn nucleotide .............................................37

CHƯƠNG 3
3.1

MỤC TIÊU VÀ NHIỆM VỤ NGHIÊN CỨU ...................................39

MỤC TIÊU NGHIÊN CỨU ............................................................................39

3.1.1

Mục tiêu lý thuyết .....................................................................................39

3.1.2

Mục tiêu ứng dụng ....................................................................................39

3.2

NHIỆM VỤ NGHIÊN CỨU............................................................................39

CHƯƠNG 4

NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU..........40

4.1


NGUYÊN VẬT LIỆU .....................................................................................40

4.2

PHƯƠNG PHÁP NGHIÊN CỨU ...................................................................40

4.2.1

Xác định nucleotide skew .........................................................................41

4.2.2 Xác định tần suất xuất hiện của các oligomer trong một trình tự nucleotide
sợi đơn ...................................................................................................................41
4.2.3 Xác định tần suất xuất hiện của các trimer trong các trình tự mang thông
tin mã hóa protein của phân tử DNA nhiễm sắc thể theo vị trí các nucleotide của
codon ...................................................................................................................42
4.2.4

Xác định sự sử dụng codon.......................................................................43

4.2.5 Xác định mối quan hệ tiến hóa giữa các vi khuẩn dựa trên trình tự 16S
rDNA ...................................................................................................................44
4.2.6

Xác định mật độ phân bố của các trimer trong một trình tự DNA sợi đơn...
...................................................................................................................44

viii



4.2.7 Xác định mối quan hệ tiến hóa giữa các vi khuẩn dựa trên mật độ phân bố
của các trimer trong phân tử DNA nhiễm sắc thể .................................................45
4.2.8 So sánh mức độ bất đối xứng trimer của các trình tự mang thông tin mã
hóa protein của phân tử DNA nhiễm sắc thể trên cơ sở tần suất xuất hiện của các
trimer mã hóa codon..............................................................................................45
4.2.9

Phương pháp Trimer-walk ........................................................................48

CHƯƠNG 5

KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN ....................................49

5.1 NGHIÊN CỨU SỰ SẮP XẾP CỦA CÁC OLIGOMER TRONG PHÂN TỬ
DNA NHIỄM SẮC THỂ...........................................................................................49
5.1.1 Bước đầu tìm hiểu sự phân bố của các nucleotide trong phân tử DNA
nhiễm sắc thể .........................................................................................................49
5.1.2 Nghiên cứu sự sắp xếp của các nucleotide trong các trình tự mang thông
tin mã hóa protein của phân tử DNA nhiễm sắc thể .............................................67
5.1.3 Nghiên cứu sâu về sự phân bố của các trimer mã hóa codon trong các
trình tự sense và antisense của phân tử DNA nhiễm sắc thể.................................76
5.1.4 Nghiên cứu sự phân bố của các trimer trong các trình tự không mã hóa
protein của phân tử DNA nhiễm sắc thể ...............................................................98
5.2 ỨNG DỤNG SỰ PHÂN BỐ CỦA CÁC TRIMER TRONG BỘ GENE ĐỂ
PHÂN LOẠI CÁC VI KHUẨN CÓ MỐI QUAN HỆ TIẾN HÓA GẦN ..............109
5.2.1 Tính đặc trưng loài của mật độ phân bố của các trimer trong phân tử DNA
nhiễm sắc thể .......................................................................................................110
5.2.2 Ứng dụng mật độ phân bố của các trimer trong bộ gene để phân loại các
vi khuẩn có mối quan hệ tiến hóa gần .................................................................111
CHƯƠNG 6


KẾT LUẬN VÀ KIẾN NGHỊ..........................................................121

6.1

KẾT LUẬN ...................................................................................................121

6.2

KIẾN NGHỊ...................................................................................................121

CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ .........................................................................123
TÀI LIỆU THAM KHẢO...........................................................................................124
PHỤ LỤC ....................................................................................................................137

ix


DANH MỤC HÌNH
Hình 2.1 Thành phần hóa học của DNA .........................................................................7
Hình 2.2 Các liên kết hydrogen giữa các nucleotide bổ sung trong phân tử DNA. ........7
Hình 2.3 Ảnh chụp nhiễm sắc thể của tế bào vi khuẩn E. coli........................................9
Hình 2.4 Cấu trúc nhiễm sắc thể của tế bào sinh vật eukaryote....................................10
Hình 2.5 Bộ máy sao chép DNA của vi khuẩn E. coli ..................................................12
Hình 2.6 Enzyme replicase của vi khuẩn E. coli là một protein dimer bất đối xứng....12
Hình 2.7 Tính bất đối xứng monomer cục bộ của phân tử DNA nhiễm sắc thể của một
số vi khuẩn. ...................................................................................................................18
Hình 2.8 DNA-walk trên các đoạn ở hai đầu của 16 phân tử DNA nhiễm sắc thể tế bào
nấm men. .......................................................................................................................19
Hình 2.9 Tần suất xuất hiện của các oligomer trên hai sợi bổ sung của phân tử DNA

nhiễm sắc thể người số 22 .............................................................................................20
Hình 2.10 Các ví dụ minh họa sự phân bố không cân đối của một số oligomer ở hai
phía của điểm khởi đầu sao chép của bốn bộ gene vi khuẩn.........................................22
Hình 2.11 Xác định vị trí điểm khởi đầu sao chép nhờ tần suất xuất hiện của các
oligomer trong bộ gene của hai vi khuẩn cổ .................................................................24
Hình 2.12 Minh họa một cây phát sinh loài. .................................................................31
Hình 4.1 Minh họa hai sợi DNA bổ sung của một phân tử DNA nhiễm sắc thể. .........40
Hình 4.2 Cách xác định tần suất xuất hiện của các trimer dọc theo chiều dài một trình
tự nucleotide sợi đơn. ....................................................................................................41
Hình 4.3 Minh họa vị trí của các trimer trong các trình tự mang thông tin mã hóa
protein của phân tử DNA nhiễm sắc thể theo vị trí của các nucleotide của codon. ......43
Hình 5.1 Tần suất xuất hiện của các monomer và oligomer trên hai sợi bổ sung của
phân tử DNA nhiễm sắc thể. .........................................................................................51
Hình 5.2 Minh họa sự hiện diện của một trimer và trimer BSĐN của nó trong một trình
tự nucleotide sợi đơn.. ...................................................................................................52
Hình 5.3 GC skew trong phân tử DNA nhiễm sắc thể B. cereus ATCC 10987. ..........53
Hình 5.4 AT skew trong phân tử DNA nhiễm sắc thể B. cereus ATCC 10987............53
Hình 5.5 GC skew trong phân tử DNA nhiễm sắc thể số 4 của S. cerevisiae...............54
Hình 5.6 AT skew trong phân tử DNA nhiễm sắc thể số 4 của S. cerevisiae ...............54
Hình 5.7 Các đồ thị biểu diễn sự phân bố của 6 cặp dimer/dimer BSĐN dọc theo chiều
dài sợi Watson của phân tử DNA nhiễm sắc thể B. cereus ATCC 10987 ....................56
Hình 5.8 Các đồ thị biểu diễn sự phân bố của các cặp AAA/TTT, AAC/GTT,
AAT/ATT và ACA/TGT dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể B. cereus ATCC 10987. ..........................................................................................57
Hình 5.9 Các đồ thị biểu diễn sự phân bố của các cặp AAAA/TTTT, AAAC/GTTT,
AAAG/CTTT và AAAT/ATTT dọc theo chiều dài sợi Watson của phân tử DNA
nhiễm sắc thể B. cereus ATCC 10987 ..........................................................................58
x



Hình 5.10 Các đồ thị biểu diễn sự phân bố của 6 cặp dimer/dimer BSĐN dọc theo
chiều dài sợi Watson của phân tử DNA nhiễm sắc thể số 4 của S. cerevisiae..............59
Hình 5.11 Các đồ thị biểu diễn sự phân bố của các cặp AAA/TTT, AAC/GTT,
AAT/ATT và ACA/TGT dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể số 4 của S. cerevisiae...............................................................................................60
Hình 5.12 Các đồ thị biểu diễn sự phân bố của các cặp AAAA/TTTT, AAAC/GTTT,
AAAG/CTTT và AAAT/ATTT dọc theo chiều dài sợi Watson của phân tử DNA
nhiễm sắc thể số 4 của S. cerevisiae..............................................................................61
Hình 5.13 Tần suất xuất hiện của các dimer trong tất cả các trình tự mang thông tin mã
hóa protein của phân tử DNA nhiễm sắc thể.................................................................63
Hình 5.14 Tần suất xuất hiện của các dimer trong tất cả các trình tự không mã hóa
protein của phân tử DNA nhiễm sắc thể .......................................................................63
Hình 5.15 Tần suất xuất hiện của các trimer trong tất cả các trình tự mang thông tin mã
hóa protein của phân tử DNA nhiễm sắc thể.................................................................64
Hình 5.16 Tần suất xuất hiện của các trimer trong tất cả các trình tự không mã hóa
protein của phân tử DNA nhiễm sắc thể .......................................................................64
Hình 5.17 Tần suất xuất hiện của các tetramer trong tất cả các trình tự mang thông tin
mã hóa protein của phân tử DNA nhiễm sắc thể...........................................................65
Hình 5.18 Tần suất xuất hiện của các tetramer trong tất cả các trình tự không mã hóa
protein của phân tử DNA nhiễm sắc thể .......................................................................66
Hình 5.19 Tần suất xuất hiện của các cặp trimer mã hóa codon trong tất cả các trình tự
mang thông tin mã hóa protein của phân tử DNA nhiễm sắc thể .................................69
Hình 5.20 Tần suất xuất hiện của các trimer theo vị trí của các nucleotide của codon
trong tất cả các trình tự mang thông tin mã hóa protein của phân tử DNA nhiễm sắc
thể ..................................................................................................................................70
Hình 5.21 Tần suất xuất hiện của các trimer theo vị trí của các nucleotide của codon
trong tất cả các trình tự sense và trong tất cả các trình tự antisense của phân tử DNA
nhiễm sắc thể .................................................................................................................72
Hình 5.22 So sánh mức độ bất đối xứng của 5601 trình tự sense và antisense trong
phân tử DNA nhiễm sắc thể vi khuẩn B. cereus ATCC 10987.....................................78

Hình 5.23 So sánh mức độ bất đối xứng của 726 trình tự sense và antisense trong phân
tử DNA nhiễm sắc thể số 4 của S. cerevisiae................................................................79
Hình 5.24 So sánh các dãy giá trị bi(T/T BSĐN) trung bình của các nhóm I và II của các
phân tử DNA nhiễm sắc thể của các vi khuẩn khác nhau .............................................85
Hình 5.25 So sánh các dãy giá trị bi(T/T BSĐN) trung bình của các nhóm I và II của 16
phân tử DNA nhiễm sắc thể của S. cerevisiae ..............................................................86
Hình 5.26 Sự phân bố của các trimer mã hóa codon trong các nhóm trình tự I và II
trong Hình 5.22 .............................................................................................................87
Hình 5.27 Sự phân bố của các trimer mã hóa codon trong các nhóm trình tự I và II
trong Hình 5.23 .............................................................................................................88

xi


Hình 5.28 Đường cong tích lũy các giá trị gán bi(T/T BSĐN) trung bình trên các trình tự
sense và antisense của phân tử DNA nhiễm sắc thể B. cereus ATCC 10987. ..............90
Hình 5.29 Đường cong tích lũy các giá trị gán bi(T/T BSĐN) trung bình trên các trình tự
sense và antisense của phân tử DNA nhiễm sắc thể số 4 của S. cerevisiae ..................91
Hình 5.30 Hai replichore của phân tử DNA nhiễm sắc thể vi khuẩn............................93
Hình 5.31 Mật độ phân bố của các trimer mã hóa codon trong các trình tự sense và
antisense trên hai replichore của phân tử DNA nhiễm sắc thể B. cereus ATCC 10987.
.......................................................................................................................................95
Hình 5.32 Hệ số tương quan Pearson của các dãy giá trị bi(T/T BSĐN) của các trình tự
mang thông tin mã hóa protein và không mã hóa protein với dãy giá trị bi(T/T BSĐN) của
tất cả các trình tự mRNA của B. cereus ATCC 10987................................................100
Hình 5.33 Hệ số tương quan Pearson của các dãy giá trị bi(T/T BSĐN) của các trình tự
mang thông tin mã hóa protein và không mã hóa protein với dãy giá trị bi(T/T BSĐN) của
tất cả các trình tự mRNA của nhiễm sắc thể số 4 của S. cerevisiae............................101
Hình 5.34 So sánh các dãy giá trị bi(T/T BSĐN) giữa các trình tự mang thông tin mã hóa
protein và giữa các trình tự không mã hóa protein của phân tử DNA nhiễm sắc thể B.

cereus ATCC 10987....................................................................................................102
Hình 5.35 So sánh các dãy giá trị bi(T/T BSĐN) giữa các trình tự mang thông tin mã hóa
protein và giữa các trình tự không mã hóa protein của phân tử DNA nhiễm sắc thể số 4
của S. cerevisiae. .........................................................................................................103
Hình 5.36 Đồ thị biểu diễn sự phân bố của các trimer dọc theo các trình tự không mã
hóa protein của phân tử DNA nhiễm sắc thể B. cereus ATCC 10987 ........................104
Hình 5.37 Đồ thị biểu diễn sự phân bố của các trimer BSĐN dọc theo các trình tự
không mã hóa protein của phân tử DNA nhiễm sắc thể B. cereus ATCC 10987. ......105
Hình 5.38 Đồ thị biểu diễn sự phân bố của các trimer dọc theo các trình tự không mã
hóa protein của phân tử DNA nhiễm sắc thể số 4 của S. cerevisiae ...........................106
Hình 5.39 Đồ thị biểu diễn sự phân bố của các trimer BSĐN dọc theo các trình tự
không mã hóa protein của phân tử DNA nhiễm sắc thể số 4 của S. cerevisiae ..........107
Hình 5.40 Mật độ phân bố của các trimer trong các trình tự mang thông tin mã hóa
protein và không mã hóa protein của phân tử DNA nhiễm sắc thể.............................108
Hình 5.41 Tần suất xuất hiện của các trimer trong phân tử DNA nhiễm sắc thể của các
vi khuẩn khác nhau......................................................................................................110
Hình 5.42 Mật độ phân bố của các trimer trong các phân tử DNA nhiễm sắc thể của
các vi khuẩn.................................................................................................................111
Hình 5.43 Phân loại Enterobacteria trên cơ sở các trình tự 16S rDNA......................114
Hình 5.44 Phân loại Enterobacteria trên cơ sở mật độ phân bố của các trimer trong bộ
gene .............................................................................................................................115
Hình 5.45 Phân loại Burkholderia trên cơ sở các trình tự 16S rDNA ........................116
Hình 5.46 Phân loại Burkholderia trên cơ sở mật độ phân bố của các trimer trong bộ
gene .............................................................................................................................117

xii


Hình 5.47 Phân loại Pseudomonas trên cơ sở các trình tự 16S rDNA........................118
Hình 5.48 Phân loại Pseudomonas trên cơ sở mật độ phân bố của các trimer trong bộ

gene .............................................................................................................................119

xiii


DANH MỤC BẢNG

Bảng 2.1 Sự sử dụng codon ở vi khuẩn và người. ........................................................28
Bảng 4.1 Minh họa cách sắp các giá trị b(T/T BSĐN) của các cặp T/TBSĐN trong các trình
tự sense hoặc antisense Sj của phân tử DNA nhiễm sắc thể..........................................47
Bảng 5.1 Sự sử dụng codon ở B. cereus ATCC 10987 .................................................74
Bảng 5.2 Sự sử dụng codon ở S. cerevisiae ..................................................................75
Bảng 5.3 Các giá trị bi(T/T BSĐN) trung bình của mỗi nhóm trình tự trong Hình 5.22 .....82
Bảng 5.4 Các giá trị bi(T/T BSĐN) trung bình của mỗi nhóm trình tự trong Hình 5.23 .....83

xiv


DANH MỤC HÌNH PHỤ

Hình phụ 1 Tính bất đối xứng monomer cục bộ của các phân tử DNA nhiễm sắc thể S.
cerevisiae.....................................................................................................................144
Hình phụ 2 Các đồ thị biểu diễn sự phân bố của các cặp ACC/GGT, ACG/CGT,
ACT/AGT và AGA/TCT dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể B. cereus ATCC 10987 .........................................................................................146
Hình phụ 3 Các đồ thị biểu diễn sự phân bố của các cặp AGC/GCT, AGG/CCT,
ATA/TAT và ATC/GAT dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể B. cereus ATCC 10987 .........................................................................................146
Hình phụ 4 Các đồ thị biểu diễn sự phân bố của các cặp ATG/CAT, CAA/TTG,
CAC/GTG và CAG/CTG dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc

thể B. cereus ATCC 10987 .........................................................................................147
Hình phụ 5 Các đồ thị biểu diễn sự phân bố của các cặp CCA/TGG, CCC/GGG,
CCG/CGG và CGA/TCG dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể B. cereus ATCC 10987 .........................................................................................147
Hình phụ 6 Các đồ thị biểu diễn sự phân bố của các cặp CGC/GCG, CTA/TAG,
CTC/GAG và CTT/AAG dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể B. cereus ATCC 10987 .........................................................................................148
Hình phụ 7 Các đồ thị biểu diễn sự phân bố của các cặp GAA/TTC, GAC/GTC,
GCA/TGC và GCC/GGC dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể B. cereus ATCC 10987 .........................................................................................148
Hình phụ 8 Các đồ thị biểu diễn sự phân bố của các cặp GGA/TCC, GTA/TAC,
TAA/TTA và TCA/TGA dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể B. cereus ATCC 10987 .........................................................................................149
Hình phụ 9 Các đồ thị biểu diễn sự phân bố của các cặp AAA/TTT, AAC/GTT,
AAT/ATT và ACA/TGT dọc theo chiều dài sợi Watson của đoạn có vị trí từ 1000 đến
521000 của phân tử DNA nhiễm sắc thể B. cereus ATCC 10987 ..............................149
Hình phụ 10 Các đồ thị biểu diễn sự phân bố của các cặp AAA/TTT, AAC/GTT,
AAT/ATT và ACA/TGT dọc theo chiều dài sợi Watson của đoạn có vị trí từ 1000 đến
53000 của phân tử DNA nhiễm sắc thể B. cereus ATCC 10987 ...............................150
Hình phụ 11 Các đồ thị biểu diễn sự phân bố của các cặp ACC/GGT, ACG/CGT,
ACT/AGT và AGA/TCT dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể số 4 của S. cerevisiae.............................................................................................151
Hình phụ 12 Các đồ thị biểu diễn sự phân bố của các cặp AGC/GCT, AGG/CCT,
ATA/TAT và ATC/GAT dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể số 4 của S. cerevisia ..............................................................................................151

xv


Hình phụ 13 Các đồ thị biểu diễn sự phân bố của các cặp ATG/CAT, CAA/TTG,

CAC/GTG và CAG/CTG dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể số 4 của S. cerevisiae.............................................................................................152
Hình phụ 14 Các đồ thị biểu diễn sự phân bố của các cặp CCA/TGG, CCC/GGG,
CCG/CGG và CGA/TCG dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể số 4 của S. cerevisiae.............................................................................................152
Hình phụ 15 Các đồ thị biểu diễn sự phân bố của các cặp CGC/GCG, CTA/TAG,
CTC/GAG và CTT/AAG dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể số 4 của S. cerevisiae.............................................................................................153
Hình phụ 16 Các đồ thị biểu diễn sự phân bố của các cặp GAA/TTC, GAC/GTC,
GCA/TGC và GCC/GGC dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể số 4 của S. cerevisiae.............................................................................................153
Hình phụ 17 Các đồ thị biểu diễn sự phân bố của các cặp GGA/TCC, GTA/TAC,
TAA/TTA và TCA/TGA dọc theo chiều dài sợi Watson của phân tử DNA nhiễm sắc
thể số 4 của S. cerevisiae.............................................................................................154
Hình phụ 18 Các đồ thị biểu diễn sự phân bố của cặp AAA/TTT và cặp ACC/GGT
dọc theo chiều dài sợi Watson của các phân tử DNA nhiễm sắc thể số 1, 2, 3 và 4 của
S. cerevisiae.................................................................................................................156
Hình phụ 19 Các đồ thị biểu diễn sự phân bố của cặp AAA/TTT dọc theo chiều dài sợi
Watson của các phân tử DNA nhiễm sắc thể số 5, 6, 7 và 8 của S. cerevisiae ...........156
Hình phụ 20 Các đồ thị biểu diễn sự phân bố của cặp AAA/TTT dọc theo chiều dài sợi
Watson của các phân tử DNA nhiễm sắc thể số 9, 10, 11 và 12 của S. cerevisiae. ....157
Hình phụ 21 Các đồ thị biểu diễn sự phân bố của cặp AAA/TTT dọc theo chiều dài sợi
Watson của các phân tử DNA nhiễm sắc thể số 13, 14, 15 và 16 của S. cerevisiae ...157
Hình phụ 22 Các đồ thị biểu diễn sự phân bố của các cặp AAA/TTT, AAC/GTT,
AAT/ATT và ACA/TGT dọc theo chiều dài sợi Watson của đoạn có vị trí từ 1 đến
150000 của phân tử DNA nhiễm sắc thể số 4 của S. cerevisiae .................................158
Hình phụ 23 Các đồ thị biểu diễn sự phân bố của các cặp AAA/TTT, AAC/GTT,
AAT/ATT và ACA/TGT dọc theo chiều dài sợi Watson của đoạn có vị trí từ 1 đến
15000 của phân tử DNA nhiễm sắc thể số 4 của S. cerevisiae ...................................159
Hình phụ 24 Tần suất xuất hiện của các trimer theo vị trí của các nucleotide của codon

trong tất cả các trình tự sense và antisense của các phân tử DNA nhiễm sắc thể B. lata
383 ...............................................................................................................................160
Hình phụ 25 Đường cong tích lũy các giá trị gán bi(T/T BSĐN) trung bình trên các trình tự
mang thông tin mã hóa protein của phân tử DNA nhiễm sắc thể các vi khuẩn. .........202
Hình phụ 26 Đường cong tích lũy các giá trị gán bi(T/T BSĐN) trung bình trên các trình tự
mang thông tin mã hóa protein của các phân tử DNA nhiễm sắc thể S. cerevisiae....204
Hình phụ 27 Mật độ phân bố của các trimer mã hóa codon trong các trình tự sense và
antisense trên hai replichore của các phân tử DNA nhiễm sắc thể B. lata 383...........206
Hình phụ 28 Sự chồng khít lên nhau của các kết quả trong Hình 5.38 và Hình 5.39. 208

xvi


DANH MỤC BẢNG PHỤ
Bảng phụ 1 Số lượng các nucleotide trong phân tử DNA nhiễm sắc thể B. cereus
ATCC 10987 ...............................................................................................................137
Bảng phụ 2 16 dimer và dimer BSĐN tương ứng.......................................................138
Bảng phụ 3 64 trimer và trimer BSĐN tương ứng ......................................................138
Bảng phụ 4 256 tetramer và tetramer BSĐN tương ứng.............................................138
Bảng phụ 5 1024 pentamer và pentamer BSĐN tương ứng........................................139
Bảng phụ 6 Các điểm khởi đầu sao chép đã được xác minh trong nhiễm sắc thể số 4
của S. cerevisiae ..........................................................................................................155
Bảng phụ 7 4096 hexamer được sắp theo trật tự alphabet ..........................................161
Bảng phụ 8 Vị trí của 2790 trình tự sense và antisense (nhóm I) trong phân tử DNA
nhiễm sắc thể B. cereus ATCC 10987 ........................................................................168
Bảng phụ 9 Vị trí của 2811 trình tự sense và antisense (nhóm II) trong phân tử DNA
nhiễm sắc thể B. cereus ATCC 10987 ........................................................................178
Bảng phụ 10 Vị trí của 363 trình tự sense và antisense (nhóm I) trong phân tử DNA
nhiễm sắc thể số 4 của S. cerevisiae............................................................................187
Bảng phụ 11 Vị trí của 363 trình tự sense và antisense (nhóm II) trong phân tử DNA

nhiễm sắc thể số 4 của S. cerevisiae............................................................................189
Bảng phụ 12 Kết quả phân nhóm khi so sánh các dãy giá trị bi(T/T BSĐN) của các trình tự
sense và antisense trong các nhiễm sắc thể vi khuẩn ..................................................190
Bảng phụ 13 Kết quả phân nhóm khi so sánh các dãy giá trị bi(T/T BSĐN) của các trình tự
sense và antisense trong các nhiễm sắc thể của S. cerevisiae .....................................191
Bảng phụ 14 Thành phần trimer mã hóa codon trong các nhóm a và b của 16 phân tử
DNA nhiễm sắc thể của S. cerevisiae trong nghiên cứu ở Mục 5.1.3.1 và Mục 5.1.3.2.2
.....................................................................................................................................193
Bảng phụ 15 Các giá trị bi(T/T BSĐN) trung bình của các nhóm I ở Hình 5.24...............194
Bảng phụ 16 Các giá trị bi(T/T BSĐN) trung bình của các nhóm II ở Hình 5.24 .............196
Bảng phụ 17 Các giá trị bi(T/T BSĐN) trung bình của các nhóm I ở Hình 5.25...............198
Bảng phụ 18 Các giá trị bi(T/T BSĐN) trung bình của các nhóm II ở Hình 5.25 .............200
Bảng phụ 19 bi(T/T BSĐN) trung bình của các nhóm (I) và (II) trong Hình 5.35. ...........207

xvii


CÁC TỪ VIẾT TẮT
DNA

Deoxyribonucleic acid

A

Adenine

C

Cytosine


G

Guanine

T

Thymine

NST

Nhiễm sắc thể

bp

Base pair

kbp

Kilobase pair

Mb

Megabase

kDa

Kilodalton

BSĐN


Bổ sung đảo ngược

Sợi T

Sợi đơn DNA làm khuôn cho quá trình phiên mã

Sợi NT

Sợi đơn DNA bổ sung với sợi làm khuôn cho quá trình phiên mã

rDNA

ribosomal DNA

rRNA

ribosomal RNA

mRNA

RNA thông tin

tRNA

RNA vận chuyển

NCBI

National Center for Biotechnology Information


xviii


CHƯƠNG 1

MỞ ĐẦU

1.1 LÝ DO CHỌN ĐỀ TÀI
Cùng với sự tiến bộ của tin học trong sinh học cũng như của các kỹ thuật thao tác
trong sinh học phân tử, các trình tự hoàn chỉnh của bộ gene (genome) đã và đang trở
thành nguồn thông tin quí giá hỗ trợ cho việc tìm hiểu cấu trúc bộ gene và các quá
trình sinh học xảy ra trong tế bào sinh vật. Các mối liên hệ giữa cấu trúc bộ gene và
các quá trình sinh học xảy ra trong tế bào có thể được xác định thông qua việc thay đổi
hoặc xóa bỏ các trình tự nucleotide trong bộ gene. Tuy nhiên, các kỹ thuật cao trong
sinh học phân tử chưa đủ để việc thay đổi hoặc xóa bỏ các trình tự nucleotide trong bộ
gene luôn được thành công. Các nghiên cứu gần đây của một số nhà khoa học trên thế
giới trong việc tìm hiểu, thay đổi và tạo mới các trình tự bộ gene đã tiết lộ sự liên quan
của sự sắp xếp của các nucleotide trong bộ gene đến một số các quá trình sinh học xảy
ra trong tế bào [1], [2], [3], [4], [5], [6], [7]. Các kết quả nghiên cứu này cho thấy
những quá trình sinh học đó tác động lên sự thành công của các thí nghiệm tìm hiểu,
thay đổi và tạo mới các trình tự bộ gene. Mặc dù các sinh vật khác nhau có các bộ
gene với các trình tự nucleotide khác nhau, các nghiên cứu vào những năm 2001 [8] và
2002 [9] cho thấy các phân tử DNA nhiễm sắc thể của các bộ gene đều có chung một
đặc điểm, đó là tính đối xứng. Không như tính đối xứng trên cơ sở khoảng cách của
hai vật thể nào đó thường được đề cập trong hình học, tính đối xứng của phân tử DNA
nhiễm sắc thể sinh vật là đặc điểm dựa trên sự phân bố của các nucleotide trong phân
tử DNA nhiễm sắc thể. Rõ ràng, các phân tử DNA nhiễm sắc thể tuy không giống
nhau về trình tự nucleotide nhưng lại giống nhau về đặc tính đối xứng, có nghĩa là các
nucleotide phải được sắp xếp theo một qui tắc nào đó để phân tử DNA nhiễm sắc thể
trở nên đối xứng. Tuy nhiên, vẫn chưa có một qui tắc nào về sự sắp xếp của các

nucleotide trong phân tử DNA nhiễm sắc thể được công bố cho đến nay.
Mặt khác, nhờ sự phát triển vượt trội của kỹ thuật xác định trình tự DNA, số lượng các
vi sinh vật với trình tự bộ gene được xác định hoàn chỉnh tăng lên đáng kể [10]. Sự
góp mặt của các trình tự bộ gene hoàn chỉnh của các vi sinh vật đã mở ra một hướng
1


mới cho việc nhận biết các loài, mặc dù hiện nay việc phân loại các vi sinh vật một
cách nhanh chóng về cơ bản dựa trên mức độ đồng dạng của các trình tự 16S rDNA –
là các trình tự mang thông tin mã hóa cho thành phần 16S rRNA của bộ máy tổng hợp
protein ribosome. Tuy nhiên, các trình tự 16S rDNA gần đây được phát hiện là không
đủ đặc trưng để luôn được sử dụng với vai trò này, đặc biệt là trong phân loại các vi
sinh vật ở cấp độ dưới giống (genus), khi mà các loài trong cùng một giống hoặc các
chủng (strain) trong cùng một loài (species) không giống nhau về khả năng gây bệnh
cho người, thực vật và động vật và do đó cần được phân biệt [11], [12], [13], [14],
[15], [16]. Các trình tự nucleotide của tổng thể bộ gene có tính đặc trưng loài, nhưng
việc so sánh các trình tự này để xây dựng mối quan hệ tiến hóa của các loài là một vấn
đề không đơn giản. Việc đi tìm một công cụ để phân loại các sinh vật nhờ các trình tự
nucleotide hoàn chỉnh của các bộ gene đã cho ra đời các phương pháp phân loại mới
dựa trên các dấu hiệu bộ gene (genomic signature) – là những dấu hiệu được phát hiện
trên cơ sở tần suất xuất hiện của các oligomer trong các trình tự nucleotide nhiễm sắc
thể. Tuy nhiên, các phương pháp phân loại sinh vật dựa trên các dấu hiệu bộ gene cho
đến nay nói chung phức tạp trong phương thức và trong thuật toán sử dụng. Chúng
chưa được sử dụng một cách chính thống do không thể phân biệt được một số các vi
sinh vật và không đủ đặc trưng để phân biệt một số vi khuẩn ở cấp độ dưới giống [17],
[18], [19], [20], [21], [22], [23].
1.2 MỤC ĐÍCH NGHIÊN CỨU
Đề tài nghiên cứu sự sắp xếp của các oligomer trong các phân tử DNA nhiễm sắc thể
của các vi sinh vật nhằm hai mục đích sau:
i)


Tìm hiểu sâu hơn kiến thức hiện tại về sự phân bố của các nucleotide trong
các phân tử DNA nhiễm sắc thể của vi khuẩn và nấm men.

ii)

Đưa ra được một phương pháp phân loại các vi khuẩn có mối quan hệ tiến
hóa gần ở cấp độ dưới giống.

1.3 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Đối tượng nghiên cứu của đề tài là các trình tự bộ gene đã được xác định hoàn chỉnh
và được lưu ở ngân hàng National Center for Biotechnology Information (NCBI) [10].
2


Do qui tắc sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể lần đầu tiên
được khởi xướng và nghiên cứu bởi luận án này, phạm vi nghiên cứu của đề tài chỉ
được giới hạn cho các trình tự bộ gene hoàn chỉnh của vi khuẩn và nấm men
Saccharomyces cerevisiae.
1.4 TÍNH CẤP THIẾT CỦA ĐỀ TÀI NGHIÊN CỨU
Trong công nghiệp công nghệ sinh học, việc tạo ra được những chủng, loài vi sinh vật
với bộ gene cho những sản phẩm mong muốn là thực sự cần thiết. Tuy nhiên, sự thành
công trong việc tạo ra được những vi sinh vật này hiện tại phụ thuộc quá nhiều vào
những hiểu biết của con người về các trình tự bộ gene và những quá trình sinh học liên
quan đến trật tự sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể [1], [2],
[3], [4], [5], [6], [7]. Như đã đề cập trong Mục 1.1, các trình tự nucleotide hoàn chỉnh
của các phân tử DNA nhiễm sắc thể của các cá thể vi sinh vật khác nhau thì không
giống nhau nhưng đều có tính đối xứng. Tuy vậy, các nucleotide được sắp xếp như thế
nào để các phân tử DNA nhiễm sắc thể trở nên đối xứng thì chưa được biết đến. Cho
nên, việc xác định được qui tắc sắp xếp của các nucleotide trong phân tử DNA nhiễm

sắc thể sẽ là cơ sở để định hướng và thực hiện hiệu quả công việc tạo ra những vi sinh
vật mong muốn. Vì thế, nghiên cứu sự sắp xếp của các oligomer trong các phân tử
DNA nhiễm sắc thể vi khuẩn và nấm men là một đề tài quan trọng và có ý nghĩa cấp
thiết trong công nghệ gene.
Mặt khác, như đã được đề cập ở Mục 1.1, các trình tự 16S rDNA hiện nay đang được
sử dụng một cách rộng rãi để nhận biết nhanh các vi khuẩn, nhưng do tính đặc trưng
loài không cao của các trình tự này, một số vi khuẩn, nhất là các loài trong cùng một
giống hoặc các chủng trong cùng một loài có các khả năng gây bệnh khác nhau cho
người, động vật và thực vật không thể được phân biệt [13], [14], [15], [16]. Khó khăn
này cho đến nay vẫn chưa được giải quyết mặc dù các giải pháp phân biệt các vi khuẩn
này đã được nỗ lực nghiên cứu bởi nhiều nhà khoa học trên thế giới [18], [19], [20],
[21], [22]. Vì vậy, việc xây dựng được một phương pháp phân loại có khả năng phân
biệt các vi khuẩn như thế thực sự mang tính cấp thiết.

3


1.5 Ý NGHĨA KHOA HỌC CỦA ĐỀ TÀI NGHIÊN CỨU
Đề tài này tìm hiểu qui tắc sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc
thể vi khuẩn và nấm men, nhằm cung cấp sâu hơn kiến thức hiện tại về sự phân bố của
các nucleotide trong phân tử DNA nhiễm sắc thể tế bào vi sinh vật. Đồng thời, đề tài
này xây dựng phương pháp phân loại các vi khuẩn có mối quan hệ tiến hóa gần ở cấp
độ dưới giống mà trong đó có một số vi khuẩn không thể được phân loại bởi các
phương pháp đã biết.
1.6 Ý NGHĨA THỰC TIỄN CỦA ĐỀ TÀI NGHIÊN CỨU
Việc khám phá ra qui tắc sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể
có thể giúp con người can thiệp có định hướng vào việc thay đổi có hiệu quả các trình
tự nucleotide trên nhiễm sắc thể bằng các kỹ thuật biến đổi DNA để phục vụ lợi ích
của con người.
Việc xây dựng được một phương pháp phân loại các vi khuẩn ở cấp độ dưới giống giải

quyết được khó khăn hiện tại trong việc phân biệt các vi khuẩn có mối quan hệ tiến
hóa gần, đặc biệt là các loài trong cùng một giống hoặc các chủng trong cùng một loài
nhưng khác nhau về khả năng gây bệnh cho người, động vật và thực vật.
1.7 TÍNH MỚI CỦA ĐỀ TÀI NGHIÊN CỨU
Nội dung nghiên cứu của đề tài luận án có những tính mới sau đây:
i) Đây là công trình đầu tiên nghiên cứu và xác định được qui tắc sắp xếp của
các trimer và trimer bổ sung đảo ngược (BSĐN) trong các trình tự mang
thông tin mã hóa protein của phân tử DNA nhiễm sắc thể.
ii) Luận án sử dụng khái niệm mới về bất đối xứng trimer để nghiên cứu sự phân
bố của các trimer trong các trình tự DNA của nhiễm sắc thể.
iii) Luận án đưa ra khái niệm mật độ phân bố của các trimer trong một trình tự
DNA, cũng là một khái niệm mới. Với khái niệm này, luận án chứng minh
các nucleotide được sắp xếp có qui tắc trong phân tử DNA nhiễm sắc thể vi
khuẩn để góp phần tạo nên tính đối xứng của phân tử DNA nhiễm sắc thể
4


cũng như trình bày khả năng ứng dụng các trình tự bộ gene trong phân loại
các vi khuẩn có mối quan hệ tiến hóa gần ở cấp độ dưới giống.

5


×