Tải bản đầy đủ (.docx) (269 trang)

Nghiên cứu sự sắp xếp của các DNA oligomer trên nhiễm sắc thể vi khuẩn và nấm men

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (8.21 MB, 269 trang )

MỤC LỤC

DANH MỤC HÌNH

1


DANH MỤC BẢNG

DANH MỤC HÌNH PHỤ

2


DANH MỤC BẢNG PHỤ

CÁC TỪ VIẾT TẮT
DNA

Deoxyribonucleic acid

A

Adenine

C

Cytosine

G


Guanine

T

Thymine

NST

Nhiễm sắc thể

bp

Base pair

kbp

Kilobase pair

Mb

Megabase

kDa

Kilodalton

BSĐN

Bổ sung đảo ngược


Sợi T

Sợi đơn DNA làm khuôn cho quá trình phiên mã

Sợi NT

Sợi đơn DNA bổ sung với sợi làm khuôn cho quá trình phiên mã

rDNA ribosomal DNA
rRNA ribosomal RNA
mRNA

RNA thông tin

tRNA RNA vận chuyển
NCBI National Center for Biotechnology Information

3


CHƯƠNG 1

MỞ ĐẦU

1.1 LÝ DO CHỌN ĐỀ TÀI
Cùng với sự tiến bộ của tin học trong sinh học cũng như của các kỹ thuật thao tác trong sinh học phân
tử, các trình tự hoàn chỉnh của bộ gene (genome) đã và đang trở thành nguồn thông tin quí giá hỗ trợ
cho việc tìm hiểu cấu trúc bộ gene và các quá trình sinh học xảy ra trong tế bào sinh vật. Các mối liên
hệ giữa cấu trúc bộ gene và các quá trình sinh học xảy ra trong tế bào có thể được xác định thông qua
việc thay đổi hoặc xóa bỏ các trình tự nucleotide trong bộ gene. Tuy nhiên, các kỹ thuật cao trong sinh

học phân tử chưa đủ để việc thay đổi hoặc xóa bỏ các trình tự nucleotide trong bộ gene luôn được
thành công. Các nghiên cứu gần đây của một số nhà khoa học trên thế giới trong việc tìm hiểu, thay
đổi và tạo mới các trình tự bộ gene đã tiết lộ sự liên quan của sự sắp xếp của các nucleotide trong bộ
gene đến một số các quá trình sinh học xảy ra trong tế bào [1], [2], [3], [4], [5], [6], [7]. Các kết quả
nghiên cứu này cho thấy những quá trình sinh học đó tác động lên sự thành công của các thí nghiệm
tìm hiểu, thay đổi và tạo mới các trình tự bộ gene. Mặc dù các sinh vật khác nhau có các bộ gene với
các trình tự nucleotide khác nhau, các nghiên cứu vào những năm 2001 [8] và 2002 [9] cho thấy các
phân tử DNA nhiễm sắc thể của các bộ gene đều có chung một đặc điểm, đó là tính đối xứng. Không
như tính đối xứng trên cơ sở khoảng cách của hai vật thể nào đó thường được đề cập trong hình học,
tính đối xứng của phân tử DNA nhiễm sắc thể sinh vật là đặc điểm dựa trên sự phân bố của các
nucleotide trong phân tử DNA nhiễm sắc thể. Rõ ràng, các phân tử DNA nhiễm sắc thể tuy không
giống nhau về trình tự nucleotide nhưng lại giống nhau về đặc tính đối xứng, có nghĩa là các
nucleotide phải được sắp xếp theo một qui tắc nào đó để phân tử DNA nhiễm sắc thể trở nên đối xứng.
Tuy nhiên, vẫn chưa có một qui tắc nào về sự sắp xếp của các nucleotide trong phân tử DNA nhiễm
sắc thể được công bố cho đến nay.
Mặt khác, nhờ sự phát triển vượt trội của kỹ thuật xác định trình tự DNA, số lượng các vi sinh vật với
trình tự bộ gene được xác định hoàn chỉnh tăng lên đáng kể [10]. Sự góp mặt của các trình tự bộ gene
hoàn chỉnh của các vi sinh vật đã mở ra một hướng mới cho việc nhận biết các loài, mặc dù hiện nay
việc phân loại các vi sinh vật một cách nhanh chóng về cơ bản dựa trên mức độ đồng dạng của các
trình tự 16S rDNA – là các trình tự mang thông tin mã hóa cho thành phần 16S rRNA của bộ máy
tổng hợp protein ribosome. Tuy nhiên, các trình tự 16S rDNA gần đây được phát hiện là không đủ đặc
trưng để luôn được sử dụng với vai trò này, đặc biệt là trong phân loại các vi sinh vật ở cấp độ dưới
giống (genus), khi mà các loài trong cùng một giống hoặc các chủng (strain) trong cùng một loài
(species) không giống nhau về khả năng gây bệnh cho người, thực vật và động vật và do đó cần được
phân biệt [11], [12], [13], [14], [15], [16]. Các trình tự nucleotide của tổng thể bộ gene có tính đặc
trưng loài, nhưng việc so sánh các trình tự này để xây dựng mối quan hệ tiến hóa của các loài là một
vấn đề không đơn giản. Việc đi tìm một công cụ để phân loại các sinh vật nhờ các trình tự nucleotide
hoàn chỉnh của các bộ gene đã cho ra đời các phương pháp phân loại mới dựa trên các dấu hiệu bộ
gene (genomic signature) – là những dấu hiệu được phát hiện trên cơ sở tần suất xuất hiện của các
oligomer trong các trình tự nucleotide nhiễm sắc thể. Tuy nhiên, các phương pháp phân loại sinh vật

dựa trên các dấu hiệu bộ gene cho đến nay nói chung phức tạp trong phương thức và trong thuật toán
sử dụng. Chúng chưa được sử dụng một cách chính thống do không thể phân biệt được một số các vi
sinh vật và không đủ đặc trưng để phân biệt một số vi khuẩn ở cấp độ dưới giống [17], [18], [19], [20],
[21], [22], [23].

4


1.2 MỤC ĐÍCH NGHIÊN CỨU
Đề tài nghiên cứu sự sắp xếp của các oligomer trong các phân tử DNA nhiễm sắc thể của các vi sinh
vật nhằm hai mục đích sau:
i)

Tìm hiểu sâu hơn kiến thức hiện tại về sự phân bố của các nucleotide trong các phân tử
DNA nhiễm sắc thể của vi khuẩn và nấm men.

ii)

Đưa ra được một phương pháp phân loại các vi khuẩn có mối quan hệ tiến hóa gần ở cấp
độ dưới giống.

1.3 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Đối tượng nghiên cứu của đề tài là các trình tự bộ gene đã được xác định hoàn chỉnh và được lưu ở
ngân hàng National Center for Biotechnology Information (NCBI) [10]. Do qui tắc sắp xếp của các
nucleotide trong phân tử DNA nhiễm sắc thể lần đầu tiên được khởi xướng và nghiên cứu bởi luận án
này, phạm vi nghiên cứu của đề tài chỉ được giới hạn cho các trình tự bộ gene hoàn chỉnh của vi khuẩn
và nấm men Saccharomyces cerevisiae.

1.4 TÍNH CẤP THIẾT CỦA ĐỀ TÀI NGHIÊN CỨU
Trong công nghiệp công nghệ sinh học, việc tạo ra được những chủng, loài vi sinh vật với bộ gene cho

những sản phẩm mong muốn là thực sự cần thiết. Tuy nhiên, sự thành công trong việc tạo ra được
những vi sinh vật này hiện tại phụ thuộc quá nhiều vào những hiểu biết của con người về các trình tự
bộ gene và những quá trình sinh học liên quan đến trật tự sắp xếp của các nucleotide trong phân tử
DNA nhiễm sắc thể [1], [2], [3], [4], [5], [6], [7]. Như đã đề cập trong Mục 1.1, các trình tự nucleotide
hoàn chỉnh của các phân tử DNA nhiễm sắc thể của các cá thể vi sinh vật khác nhau thì không giống
nhau nhưng đều có tính đối xứng. Tuy vậy, các nucleotide được sắp xếp như thế nào để các phân tử
DNA nhiễm sắc thể trở nên đối xứng thì chưa được biết đến. Cho nên, việc xác định được qui tắc sắp
xếp của các nucleotide trong phân tử DNA nhiễm sắc thể sẽ là cơ sở để định hướng và thực hiện hiệu
quả công việc tạo ra những vi sinh vật mong muốn. Vì thế, nghiên cứu sự sắp xếp của các oligomer
trong các phân tử DNA nhiễm sắc thể vi khuẩn và nấm men là một đề tài quan trọng và có ý nghĩa cấp
thiết trong công nghệ gene.
Mặt khác, như đã được đề cập ở Mục 1.1, các trình tự 16S rDNA hiện nay đang được sử dụng một
cách rộng rãi để nhận biết nhanh các vi khuẩn, nhưng do tính đặc trưng loài không cao của các trình tự
này, một số vi khuẩn, nhất là các loài trong cùng một giống hoặc các chủng trong cùng một loài có các
khả năng gây bệnh khác nhau cho người, động vật và thực vật không thể được phân biệt [13], [14],
[15], [16]. Khó khăn này cho đến nay vẫn chưa được giải quyết mặc dù các giải pháp phân biệt các vi
khuẩn này đã được nỗ lực nghiên cứu bởi nhiều nhà khoa học trên thế giới [18], [19], [20], [21], [22].
Vì vậy, việc xây dựng được một phương pháp phân loại có khả năng phân biệt các vi khuẩn như thế
thực sự mang tính cấp thiết.

1.5 Ý NGHĨA KHOA HỌC CỦA ĐỀ TÀI NGHIÊN CỨU
Đề tài này tìm hiểu qui tắc sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể vi khuẩn và
nấm men, nhằm cung cấp sâu hơn kiến thức hiện tại về sự phân bố của các nucleotide trong phân tử
DNA nhiễm sắc thể tế bào vi sinh vật. Đồng thời, đề tài này xây dựng phương pháp phân loại các vi
khuẩn có mối quan hệ tiến hóa gần ở cấp độ dưới giống mà trong đó có một số vi khuẩn không thể
được phân loại bởi các phương pháp đã biết.

5



1.6 Ý NGHĨA THỰC TIỄN CỦA ĐỀ TÀI NGHIÊN CỨU
Việc khám phá ra qui tắc sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể có thể giúp con
người can thiệp có định hướng vào việc thay đổi có hiệu quả các trình tự nucleotide trên nhiễm sắc thể
bằng các kỹ thuật biến đổi DNA để phục vụ lợi ích của con người.
Việc xây dựng được một phương pháp phân loại các vi khuẩn ở cấp độ dưới giống giải quyết được
khó khăn hiện tại trong việc phân biệt các vi khuẩn có mối quan hệ tiến hóa gần, đặc biệt là các loài
trong cùng một giống hoặc các chủng trong cùng một loài nhưng khác nhau về khả năng gây bệnh cho
người, động vật và thực vật.

1.7 TÍNH MỚI CỦA ĐỀ TÀI NGHIÊN CỨU
Nội dung nghiên cứu của đề tài luận án có những tính mới sau đây:
i)

Đây là công trình đầu tiên nghiên cứu và xác định được qui tắc sắp xếp của các trimer và
trimer bổ sung đảo ngược (BSĐN) trong các trình tự mang thông tin mã hóa protein của
phân tử DNA nhiễm sắc thể.

ii) Luận án sử dụng khái niệm mới về bất đối xứng trimer để nghiên cứu sự phân bố của các
trimer trong các trình tự DNA của nhiễm sắc thể.
iii) Luận án đưa ra khái niệm mật độ phân bố của các trimer trong một trình tự DNA, cũng là
một khái niệm mới. Với khái niệm này, luận án chứng minh các nucleotide được sắp xếp có
qui tắc trong phân tử DNA nhiễm sắc thể vi khuẩn để góp phần tạo nên tính đối xứng của
phân tử DNA nhiễm sắc thể cũng như trình bày khả năng ứng dụng các trình tự bộ gene
trong phân loại các vi khuẩn có mối quan hệ tiến hóa gần ở cấp độ dưới giống.

6


CHƯƠNG 2


TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU

2.1 DNA
Vào năm 1919, Levene khám phá ra rằng phân tử DNA (deoxyribonucleic acid) là một phân tử chứa
các nucleotide. Mỗi nucleotide gồm có một nitrogen base và một đường deoxyribose nối với nhau
thông qua nhóm phosphate [24]. Các nucleotide này có thể là adenine (A), thymine (T), cytosine (C)
hoặc guanine (G). Chúng khác nhau ở cấu trúc nitrogen base (Hình 2.1) [25]. Năm 1951, Erwin
Chargaff phát hiện được rằng trong DNA, số lượng A xấp xỉ bằng số lượng T cũng như số lượng C
xấp xỉ bằng số lượng G [26]. Phát hiện này của Erwin Chargaff đã trở thành tiền đề cho Watson và
Crick xây dựng nên mô hình xoắn kép nucleotide của phân tử DNA vào năm 1953 [ 27]. Theo Watson
và Crick, phân tử DNA gồm có hai sợi đơn polynucleotide, mỗi sợi được cấu tạo từ các nucleotide A,
C, G và T. Các nucleotide này được nối với nhau thông qua các liên kết phosphodiester, trong đó một
nhóm phosphate được nối với hai nhóm đường (deoxyribose) của hai nucleotide. Như thế ở một đầu
của sợi đơn polynucleotide có nhóm phosphate gắn vào nguyên tử carbon số 5 và đầu kia có nhóm
hydroxyl gắn vào nguyên tử carbon số 3 của đường deoxyribose. Các đầu này lần lượt được gọi là đầu
5’ và đầu 3’. Hai sợi đơn polynucleotide này kết hợp đối song (tức là các sợi với chiều 5’ → 3’ theo
hướng đối nhau) nhờ các liên kết hydrogen giữa các nucleotide bổ sung, tức là giữa A và T, C và G, G
và C và T và A, tạo nên phân tử sợi đôi DNA (Hình 2.2) [28]. Vì vậy, một trong hai sợi này vẫn
thường được gọi là sợi bổ sung của sợi còn lại. Trong một số trường hợp, hai sợi này còn được gọi là
sợi Watson và sợi Crick [9], [29].

7


Hình 2.1 Thành phần hóa học của DNA. Cấu trúc hóa học của chuỗi
polynucleotide (a), nucleotide (b) và các nitrogen base (c) được trình bày theo thứ
tự từ trái qua phải. Đường pentose không có nhóm hydroxyl ở nguyên tử carbon
số 2 nên được gọi là đường deoxyribose [25].

Hình 2.2 Các liên kết hydrogen giữa các nucleotide bổ sung trong phân tử DNA.


2.2 DNA OLIGOMER
Trong các phân tử DNA nhiễm sắc thể với trình tự nucleotide đã được xác định hoàn chỉnh, các
nucleotide A, C, G và T được sắp xếp theo qui tắc nào cho đến nay vẫn chưa được biết đến. Nếu cho

8


rằng A, C, G và T là những chữ cái thì các từ được tạo thành từ những chữ cái này được gọi là các
oligonucleotide, hay còn gọi là các oligomer. Monomer là từ được tạo thành từ A, C, G hoặc T. Dimer,
trimer, tetramer, pentamer, hexamer… là những từ được tạo ra từ 2, 3, 4, 5, 6… chữ cái trong bảng
chữ cái chỉ gồm bốn chữ cái A, C, G và T. Cũng như các monomer, các oligomer trong phân tử DNA
nhiễm sắc thể kết hợp với nhau như thế nào vẫn đang còn là một bí ẩn.

2.3 CẤU TRÚC DNA NHIỄM SẮC THỂ
Trong các tế bào sinh vật prokaryote và eukaryote, kích thước của phân tử DNA nhiễm sắc thể có thể
từ khoảng vài trăm ngàn cho đến hàng triệu cặp nucleotide bổ sung (base pair, viết tắt là bp). Các
nucleotide của phân tử DNA nhiễm sắc thể kết hợp với các protein khác nhau để tạo nên một nhiễm
sắc thể hoàn chỉnh. Phân tử DNA nhiễm sắc thể có thể có dạng vòng hoặc dạng thẳng. Ở dạng thẳng,
hai chuỗi polynucleotide đối song của phân tử DNA nhiễm sắc thể có nucleotide ở vị trí đầu tiên và
nucleotide ở vị trí cuối cùng tách rời nhau chứ không nối với nhau như ở phân tử DNA nhiễm sắc thể
dạng vòng.

2.3.1 Nhiễm sắc thể tế bào sinh vật prokaryote
Các tế bào sinh vật prokaryote, gồm vi khuẩn và archaea (vi khuẩn cổ), không có nhân, thường mang
các nhiễm sắc thể dạng vòng, trong đó hai sợi đơn polynucleotide có dạng vòng và kết hợp với nhau
thông qua các liên kết hydrogen. Trong tế bào chất của tế bào vi khuẩn, DNA nhiễm sắc thể liên kết
với các protein giống protein histone của tế bào sinh vật eukaryote (Mục 2.3.2), tạo thành những cấu
trúc hạt cơ bản. Các hạt này lại tiếp tục liên kết với nhau làm hình thành cấu trúc xoắn ở các cấp độ
khác nhau của cấu trúc nucleoid tùy thuộc vào điều kiện dinh dưỡng bên trong tế bào [30]. Hình 2.3

cho thấy hình ảnh của một nhiễm sắc thể vi khuẩn hoàn chỉnh được phân lập khỏi tế bào và quan sát
dưới kính hiển vi [31].

Hình 2.3 Ảnh chụp nhiễm sắc thể của tế bào vi khuẩn E. coli. Nhiễm sắc thể được
tách khỏi tế bào và được chụp dưới kính hiển vi điện tử với độ phóng đại 12000
lần. Thanh đo: 500 nm [31].
9


Hầu hết các bộ gene của các tế bào sinh vật prokaryote đều chỉ gồm một phân tử DNA nhiễm sắc thể
dạng vòng. Rất ít loài chứa các phân tử DNA nhiễm sắc thể dạng thẳng, chẳng hạn như loài
Agrobacterium tumefaciens có một phân tử DNA nhiễm sắc thể dạng vòng và một dạng thẳng. Một số
loài có nhiều hơn một phân tử DNA nhiễm sắc thể dạng vòng, chẳng hạn như các loài của giống
Burkholderia, giống Vibrio... Kích thước của các phân tử DNA nhiễm sắc thể của cùng một bộ gene
không giống nhau. Cũng như vậy, kích thước của các phân tử DNA nhiễm sắc thể của các loài khác
nhau cũng khác nhau [10].

2.3.2 Nhiễm sắc thể tế bào sinh vật eukaryote
Khác với của các tế bào sinh vật prokaryote, các phân tử DNA nhiễm sắc thể của các tế bào sinh vật
eukaryote có dạng thẳng (Hình 2.4).
Một nghiên cứu về cấu trúc tinh thể của nucleosome trong nhân của tế bào người cho thấy các
nucleosome được tạo thành do các đoạn DNA nhiễm sắc thể với chiều dài 146 bp quấn quanh các
protein histone H2A, H2B, H3 và H4 [32]. Các nucleosome này được nối với nhau nhờ các đoạn DNA
nhiễm sắc thể liên kết với protein histone H1. Các cấu trúc nucleosome lại kết hợp với nhau làm hình
thành các sợi xoắn vào nhau và tạo thành các cấp độ cấu trúc khác nhau của chromatin. Trong quá
trình sinh trưởng, các tế bào của sinh vật phát triển theo chu kỳ. Trong mỗi chu kỳ, mỗi tế bào trải qua
các giai đoạn chuẩn bị cho quá trình phân chia tế bào nhằm tạo ra tế bào mới, trong đó có giai đoạn
sao chép DNA nhiễm sắc thể để tạo thành hai nhiễm sắc thể “chị-em” giống nhau từ một nhiễm sắc
thể ban đầu. Vào thời kỳ sau quá trình sao chép DNA nhiễm sắc thể và trước giai đoạn phân chia tế
bào, chromatin của hai nhiễm sắc thể “chị-em” ở dạng nén chặt, nối với nhau qua tâm động

(centromere) tạo nên hình chữ X (Hình 2.4). Hai nhiễm sắc thể này được phân bố vào hai tế bào mới
sau quá trình phân chia tế bào chất, các thành phần chứa trong tế bào chất và màng sinh chất.
Tùy theo loài, bộ gene của các sinh vật eukaryote có số lượng phân tử DNA nhiễm sắc thể khác nhau.
Kích thước của các nhiễm sắc thể trong mỗi bộ gene cũng không giống nhau [10].

10


Hình 2.4 Cấu trúc nhiễm sắc thể của tế bào sinh vật eukaryote. Hai chromatid là
hai nhiễm sắc thể “chị-em” gắn với nhau ở tâm động. Nucleosome là cấu trúc
được tạo thành do sự tương tác giữa các protein histone và DNA sợi đôi. Các
hình màu đen-trắng là hình ảnh của DNA nhiễm sắc thể dưới kính hiển điện tử vi
truyền suốt [25].
2.4 SỰ SAO CHÉP DNA NHIỄM SẮC THỂ
2.4.1 Sự sao chép DNA nhiễm sắc thể trong tế bào vi khuẩn
Ở hầu hết các tế bào vi khuẩn, các phân tử DNA nhiễm sắc thể ở dạng vòng, thường có một điểm khởi
đầu sao chép và một điểm kết thúc sao chép, phân chia phân tử DNA nhiễm sắc thể vi khuẩn thành hai
nửa để sao chép gọi là hai replichore [33]. Do đó bộ máy sao chép DNA (DNA replicase) chuyển động
theo một hướng nhất định trên phân tử DNA nhiễm sắc thể và sao chép cùng lúc cả hai sợi
polynucleotide của DNA nhưng đảm bảo được sự tổng hợp của DNA xảy ra theo hướng từ 5’ đến 3’
(5’ → 3’) (Hình 2.5). Để đạt được điều này, trên mỗi replichore, bộ máy sao chép DNA đã tổng hợp
một mạch DNA một cách liên tục (mạch trước, hay còn gọi là leading strand), còn sự tổng hợp mạch
DNA kia thì không liên tục (mạch sau, hay còn gọi là lagging strand) [34]. Replicase của vi khuẩn
Escherichia coli là enzyme DNA polymerase III (Pol III), một dimer – được tạo thành từ 10 tiểu đơn
vị protein (Hình 2.6) [35], [36], [37], [38] – gắn vào hai sợi polynucleotide được tách ra và bắt đầu lắp
các nucleotide bổ sung với các nucleotide trên các sợi đơn DNA này theo hướng từ 5’ → 3’, bằng cách
gắn các nucleotide vào đầu 3’OH của mỗi sợi polynucleotide DNA đang được tổng hợp.
Trong Hình 2.6, các tiểu đơn vị α, ε, θ tạo nên phần chính (core) của Pol III, có chức năng xúc tác

11



phản ứng tổng hợp DNA (α có hoạt tính polymerase; ε có hoạt tính exonuclease theo chiều 3’ → 5’;
chức năng của θ đến nay chưa được rõ). Tiểu đơn vị β được gọi là “sliding clamp”, làm nhiệm vụ buộc
core polymerase vào khuôn DNA. Các tiểu đơn vị γ, δ, δ’, χ, ψ tạo thành phức hợp γ (γ complex, hay
còn gọi là clamp loader) làm nhiệm vụ chuyển “sliding clamp” lên sợi khuôn DNA. Sự kết hợp của βclamp làm tăng tốc độ sao chép và khả năng sao chép (processivity, tức là số lượng nucleotide được
đưa vào mạch đang sao chép trong mỗi lần bám vào khuôn của polymerase) của Pol III [39].
Các sợi DNA mới luôn được tổng hợp theo hướng 5’ → 3’ nên một nửa của Pol III chịu trách nhiệm
tổng hợp mạch trước theo chiều hướng vào chẻ ba sao chép, còn nửa kia chịu trách nhiệm tổng hợp
mạch sau theo chiều hướng ra xa chẻ ba sao chép (Hình 2.5).

Hình 2.5 Bộ máy sao chép DNA của vi khuẩn E. coli [34].

12


Hình 2.6 Enzyme replicase của vi khuẩn E. coli là một protein dimer bất đối
xứng. Các con số trong ngoặc đơn dưới các ký hiệu τ, β, α, ε, θ, γ, δ, δ’, χ, ψ là
khối lượng (kDa) của các tiểu đơn vị protein tương ứng. Các tiểu đơn vị là dimer
có số 2 đứng phía sau các ký hiệu tương ứng. “Core” nghĩa là thành phần chính
[35], [36], [37], [38].
2.4.2 Sự sao chép DNA nhiễm sắc thể trong tế bào eukaryote
Các phân tử DNA nhiễm sắc thể dạng thẳng của các tế bào eukaryote có rất nhiều trình tự khởi đầu
sao chép. Sự sao chép DNA của các nhiễm sắc thể này cũng được tiến hành theo hai hướng xuất phát
từ mỗi trình tự khởi đầu sao chép. Phần lớn các trình tự khởi đầu sao chép ở tế bào nấm men đã được
nhận biết. Người ta đã báo cáo rằng có khoảng 500 vị trí khởi đầu sao chép trên bộ gene với kích
thước khoảng 1,4 x 107 bp của các nấm men sinh sản kiểu nảy chồi hoặc phân đôi [40], [41], [42],
[43], [44], [45].
So với ở tế bào vi khuẩn, sự sao chép DNA ở tế bào nấm men phức tạp hơn nhiều, mặc dù có nhiều
điểm giống nhau. Các enzyme replicase ở tế bào nấm men gồm có polymerase α, polymerase δ và

polymerase ε [46]. Polymerase α mang hoạt tính primase, có nhiệm vụ tham gia tổng hợp RNA primer
cho cả mạch trước và mạch sau, đồng thời kéo dài các RNA primer bằng cách tổng hợp các đoạn ngắn
DNA khởi đầu. Theo [46], khi có khoảng 20 nucleotide, polymerase α bị thay thế bởi polymerase ε
trên mạch trước và δ trên mạch sau. Các polymerase δ và ε có hoạt tính 3’ → 5’ exonuclease nhưng
không có hoạt tính primase. Cho đến nay, tương tác giữa DNA và các yếu tố sao chép ở tế bào
eukaryote được tìm hiểu khá nhiều và chi tiết bởi nhiều nghiên cứu khác nhau [ 47], [48], [49], [50],
[51], [52], [53], [54]. Mặc dù vậy, vẫn còn nhiều tranh cãi về vai trò cụ thể của các polymerase δ và ε.
Một số nghiên cứu cho thấy polymerase ε tham gia trực tiếp vào việc sao chép DNA tại vị trí khởi đầu
trong giai đoạn thiết lập chẻ ba sao chép, có liên hệ mật thiết với chẻ ba sao chép trong suốt quá trình
chẻ ba sao chép di chuyển, và có vai trò độc lập so với enzyme polymerase δ [55], [56], [57], [58],
[59], [60]. Mặt khác, đã có bằng chứng xác thực cho thấy polymerase ε làm nhiệm vụ tổng hợp mạch
trước [61], nhưng một nghiên cứu khác lại cho rằng polymerase δ có thể làm nhiệm vụ sao chép mạch
trước trong trường hợp polymerase ε vì một lý do nào đó mà bị mất chức năng [62]. Polymerase ε
được chứng minh là cần thiết cho việc sao chép hiệu quả và chính xác DNA [ 63], [64], tuy rằng khả
năng sao chép của hai enzyme này là tương đương [65]. Ở nấm men S. cerevisiae, khả năng sao chép
của polymerase δ tăng lên nhờ PCNA [66].

13


2.5 TÍNH BẤT ĐỐI XỨNG VÀ ĐỐI XỨNG CỦA DNA NHIỄM SẮC THỂ
2.5.1 Các định luật của Erwin Chargaff
2.5.1.1 Định luật Erwin Chargaff thứ nhất
Từ các thí nghiệm phân tích định lượng thành phần của DNA bằng sắc ký giấy, Erwin Chargaff kết
luận rằng trong một sợi đôi DNA, số lượng A luôn luôn xấp xỉ với số lượng T, còn số lượng C luôn
luôn xấp xỉ với số lượng G [26]. Đây là định luật Chargaff thứ nhất. Mô hình DNA xoắn kép của
Wason-Crick và thực tế cũng đã chứng minh rằng trong một sợi đôi DNA, số lượng A luôn luôn bằng
với số lượng T, còn số lượng C luôn luôn bằng với số lượng G [27].

2.5.1.2 Định luật Erwin Chargaff thứ hai

Sự áp dụng của định luật Chargaff thứ nhất vào sợi đơn DNA được gọi là định luật Chargaff thứ hai
[67], [68], [69]. Định luật Chargaff thứ hai đúng nếu trong một sợi đơn DNA, số lượng A xấp xỉ bằng
số lượng T và số lượng C xấp xỉ bằng số lượng G, khi đó sợi DNA được cho là đối xứng. Nếu định
luật Chargaff thứ hai không đúng, sợi DNA đang xét được cho là bất đối xứng.
Đối với oligomer, định luật Chargaff thứ hai đúng nếu số lượng các oligomer trong một sợi đơn DNA
xấp xỉ bằng số lượng các oligomer bổ sung đảo ngược (BSĐN) tương ứng của chúng trong sợi đó, tức
là sợi DNA đối xứng. Trái lại, nếu trong sợi này mà số lượng các oligomer khác so với số lượng các
oligomer BSĐN tương ứng của chúng thì sợi DNA bất đối xứng [9].

2.5.2 Các phương pháp xác định tính bất đối xứng và đối xứng của DNA
2.5.2.1 Phương pháp tính nucleotide skew
Phương pháp này được sử dụng để xác định mức độ bất đối xứng DNA dựa vào sự khác nhau về tần
suất xuất hiện của các nucleotide [70], [71], [72], [73], [74]. Công thức tính như sau:
AT-skew = (nA-nT)/(nA+nT)
GC-skew = (nG-nC)/(nG+nC)
Trong đó, nA, nC, nG và nT tương ứng là tần suất xuất hiện của các nucleotide A, C, G và T trong một
trình tự nucleotide sợi đơn. Với một trình tự nucleotide mã hóa cho protein, có thể tính mức độ bất đối
xứng của nó dựa vào tần suất xuất hiện của các nucleotide này ở các vị trí 1, 2 hay 3 của codon (xem
khái niệm về codon ở Mục 2.6.5.1). Chẳng hạn, mức độ bất đối xứng tạo nên bởi các nucleotide G và
C ở các vị trí thứ ba của codon sẽ được tính như sau:
G3C3-skew = (nG3-nC3)/(nG3+nC3)
Trong đó, nG3 là tần suất xuất hiện của G và nC3 là tần suất xuất hiện của C ở vị trí thứ ba của codon.
Có thể quan sát sự thay đổi về tính bất đối xứng của các đoạn DNA cục bộ của một đoạn DNA dài,
bằng cách lập đường cong tích lũy của mức độ bất đối xứng của các đoạn DNA cục bộ thuộc đoạn
DNA dài này dọc theo chiều dài của nó. Phương pháp tính nucleotide skew đơn giản, được sử dụng
nhiều để xác định mức độ bất đối xứng monomer và vị trí điểm khởi đầu sao chép của DNA nhiễm sắc
thể các vi khuẩn [70], [71], [72], [73], [74], nhưng không giúp được nhiều trong việc tìm hiểu trật tự
sắp xếp của các nucleotide trong phân tử DNA nhiễm sắc thể.

14



2.5.2.2 Phương pháp tính oligomer skew
Tương tự như với nucleotide skew, oligomer skew được định nghĩa là độ lệch giữa tần suất xuất hiện
của oligomer và của oligomer BSĐN của nó. Lopez và cộng sự [75] đã tính oligomer skew như sau:
Oligomer skew = (mN – nNt)/(mN + nNt)
trong đó, m và n tương ứng là tần suất xuất hiện của oligomer (N) và oligomer BSĐN của nó (N t).
Lopez và cộng sự tìm thấy rằng việc sử dụng tetramer skew để nhận diện điểm khởi đầu sao chép
chính xác hơn là sử dụng GC skew.

2.5.2.3 Phương pháp DNA-walk
Cũng tương tự như phương pháp tính nucleotide skew, có thể sử dụng phương pháp AT-walk hoặc
GC-walk để xác định mức độ bất đối xứng của một đoạn DNA. Đồng thời, có thể quan sát sự thay đổi
về mức độ bất đối xứng trong đoạn DNA bằng cách lập đường cong tích lũy của AT- hoặc GC-walk.
Với AT-walk, giá trị của nucleotide A mỗi lần xuất hiện là 1 và T là -1, còn giá trị của các nucleotide
C và G là 0; với GC-walk, giá trị của nucleotide G mỗi lần xuất hiện là 1 và nucleotide C là -1, còn giá
trị của các nucleotide A và T là 0 [76]. Giống như phương pháp tính nucleotide skew, việc sử dụng
phương pháp này cũng không cho biết nhiều hơn về trật tự sắp xếp của các nucleotide trong phân tử
DNA nhiễm sắc thể.

2.5.2.4 Phương pháp Baisnée
Áp dụng định luật Chargaff thứ hai cho các oligomer, Baisnée và cộng sự [9] đã xác định tần suất xuất
hiện của các oligomer trong một trình tự nucleotide sợi đơn và đã tính mức độ bất đối xứng oligomer
của sợi DNA này bằng công thức sau:

Trong đó, S1 có giá trị từ 0 (tức là hoàn toàn bất đối xứng) đến 1 (hoàn toàn đối xứng) và được tính
cho các oligomer i có kích thước như nhau, với i = 1, …, 4N, trong đó N là kích thước của oligomer,
tức số lượng nucleotide trong mỗi oligomer. fi và fi’ lần lượt là tần suất xuất hiện của oligomer i và
oligomer BSĐN của oligomer i trong trình tự nucleotide sợi đơn. Theo Baisnée và cộng sự, cũng có
thể xác định mức độ đối xứng của trình tự nucleotide sợi đơn bằng hệ số tương quan Pearson (Pearson

correlation coefficient) SC giữa các tần suất xuất hiện của các oligomer i (dãy giá trị X) và các tần suất
xuất hiện của các oligomer BSĐN tương ứng của các oligomer i (dãy giá trị Y) trong trình tự, với i = 1,
…, 4N và N là kích thước của oligomer:

Trong đó, fi và fi’ là các giá trị tần suất xuất hiện của các oligomer i trong hai dãy giá trị X và Y tương
ứng; và là các giá trị trung bình của các fi và fi’ tương ứng trong các dãy giá trị X và Y.
Hàm số CORREL() có thể được tìm thấy trong Microsoft Excel. SC biểu thị mức độ tương đồng giữa

15


hai dãy giá trị biểu diễn tần suất xuất hiện của các oligomer và oligomer BSĐN tương ứng của chúng
trong trình tự DNA sợi đơn. Tương tự S1, sợi DNA được coi là đối xứng khi SC có giá trị xấp xỉ bằng
1.
So với phương pháp tính nucleotide skew, phương pháp này ưu việt hơn hẳn vì cho thấy được cả mức
độ khác nhau về số lượng giữa các oligomer và các oligomer BSĐN tương ứng của chúng trong một
sợi đơn DNA.

2.5.3 Sự tuân thủ của DNA nhiễm sắc thể theo các định luật của Erwin Chargaff
2.5.3.1 Tính bất đối xứng
Thành phần nucleotide trong các bộ gene của các sinh vật khác nhau được nghiên cứu mạnh kể từ khi
xuất hiện các trình tự bộ gene hoàn chỉnh. Tính bất đối xứng monomer được tìm thấy trong các đoạn
cục bộ của phân tử DNA nhiễm sắc thể các tế bào vi khuẩn [70], [71], [72], [73], [74], [77]. Trong
Hình 2.7, có thể thấy rằng các đoạn DNA ngắn có mức độ bất đối xứng monomer cao hơn các đoạn
DNA dài hơn [73].
Ở tế bào nấm men, bằng cách cắt các trình tự ngắn hơn 6 kbp ở hai đầu mút của tất cả 16 phân tử
DNA nhiễm sắc thể rồi nối lại với nhau, các trình tự cách xa hai đầu mút của phân tử 12 kbp cũng
được cắt ra và nối tương tự, sau đó thực hiện phương pháp DNA-walk trên các trình tự này, Gierlik và
cộng sự [76] cho rằng chỉ có các trình tự ở hai đầu mút phân tử DNA nhiễm sắc thể mới bất đối xứng,
còn các trình tự cách xa hai đầu mút 12 kbp thì không (Hình 2.8).

Tính bất đối xứng monomer cũng được nghiên cứu rộng rãi trên các đối tượng eukaryote khác [78],
[79], [80], [81], [82]. Các nghiên cứu này cho thấy tính bất đối xứng monomer cục bộ có liên quan đến
các quá trình sao chép và phiên mã.

16


Hình 2.7 Tính bất đối xứng monomer cục bộ của phân tử DNA nhiễm sắc thể của
một số vi khuẩn. Đường liền nét biểu diễn CG-skew của các đoạn 50 kbp, trong
khi đường đứt nét biểu diễn CG-skew của các đoạn 10 kbp [73]. Trục nằm ngang
biểu diễn chiều dài phân tử DNA nhiễm sắc thể (Mb, megabase). Mũi tên chỉ vị trí
khởi đầu sao chép.

17


Hình 2.8 DNA-walk trên các đoạn ở hai đầu của 16 phân tử DNA nhiễm sắc thể tế
bào nấm men. (a) Các trình tự ngắn hơn 6 kbp của các đầu mút của phân tử DNA
nhiễm sắc thể sau khi đã cắt đi phần telomere. (b) Các trình tự ngắn hơn 6 kbp
cách các đầu mút của phân tử DNA nhiễm sắc thể 12 kbp. Đường màu đen: ATwalk, đường màu xám: GC-walk [76].
2.5.3.2 Tính đối xứng
Định luật Chargaff thứ nhất luôn luôn đúng cho mọi sợi đôi DNA, bao gồm cả các phân tử DNA
nhiễm sắc thể. Định luật Chargaff thứ hai cũng đúng cho cả các sợi đơn của phân tử DNA nhiễm sắc
thể của các tế bào sinh vật prokaryote và eukaryote, nghĩa là các nhiễm sắc thể đối xứng [ 8], [9]. Hình
2.9 cho thấy tính đối xứng của phân tử DNA nhiễm sắc thể số 22 của tế bào người [9]. Các tác giả của
Hình 2.9 lưu ý rằng tần suất xuất hiện của một oligomer trên sợi Watson theo chiều 5’ → 3’ gần như
tương đương với tần suất xuất hiện của nó trên sợi Crick theo chiều 5’ → 3’.

18



Hình 2.9 Tần suất xuất hiện của các oligomer trên hai sợi bổ sung của phân tử
DNA nhiễm sắc thể người số 22. Số lượng oligomer với kích thước N là 4 N. Tần
suất xuất hiện của các oligomer được xác định theo cách chồng các oligomer lên
nhau với sai khác một nucleotide theo hướng 5’ → 3’ [9].
Mặc dù vậy, vì sao các phân tử DNA nhiễm sắc thể đối xứng cho đến nay vẫn chưa
được rõ. Về mặt cơ chế, có một số nghiên cứu giả thiết rằng đảo đoạn và chuyển vị
đảo ngược bên trong nhiễm sắc thể đã tạo ra tính đối xứng này [83], [84], [85]. Trên
thực tế, đảo đoạn in vivo bên trong mỗi replichore của vi khuẩn có thể làm phá vỡ sự
phân bố của nucleoid trong tế bào, ảnh hưởng nghiêm trọng đến các quá trình tiến đến
sự phân bào [5], [86]. Tuy nhiên, đảo đoạn xảy ra quanh vùng tiếp giáp của hai
replichore của vi khuẩn với các điểm cuối của đoạn DNA bị đảo có khoảng cách như
nhau đối với điểm khởi đầu sao chép lại là một hiện tượng phổ biến trong tự nhiên
[87], [88]. Trong khi đó, các nghiên cứu in vivo khác lại tiết lộ rằng tính đối xứng của
các phân tử DNA nhiễm sắc thể vi khuẩn, hay nói một cách tương đương, như đã đề
cập ở Mục 1.1, là sự sắp xếp vốn có của các nucleotide trong các phân tử DNA nhiễm
sắc thể vi khuẩn, có liên quan đến tốc độ sao chép và sự ổn định của phân tử DNA
nhiễm sắc thể [3], [4], [7]. Như vậy, đảo đoạn có thể là cơ chế nhằm duy trì đặc tính
đối xứng vốn có của các phân tử DNA nhiễm sắc thể chứ không phải để tạo ra đặc tính
này.
19


2.6 TRÌNH TỰ NUCLEOTIDE TRONG PHÂN TỬ DNA NHIỄM SẮC THỂ
VÀ CÁC MỐI LIÊN QUAN
2.6.1 Sự phân bố của các nucleotide trong phân tử DNA nhiễm sắc thể và vị trí
điểm khởi đầu sao chép
Các nghiên cứu trước đây cho thấy rằng sự phân bố của các nucleotide trong phân tử DNA nhiễm sắc
thể tế bào sinh vật prokaryote không phải là ngẫu nhiên, mặc dù trật tự sắp xếp của chúng trong phân
tử DNA nhiễm sắc thể như thế nào vẫn chưa được rõ. Nucleotide skew có thể được sử dụng để nhận

biết vị trí điểm khởi đầu sao chép ở một số nhiễm sắc thể vi khuẩn [73]. Sự phân bố của các oligomer
trong phân tử DNA nhiễm sắc thể không được công bố nhiều. Nếu N là kích thước của oligomer, trong
đó N có thể là 1, 2, 3, 4… tương ứng với tên gọi monomer, dimer, trimer, tetramer … thì số lượng của
các oligomer này là 4N, do đó khi kích thước oligomer càng lớn, nghiên cứu sẽ càng trở nên phức tạp
vì số lượng oligomer tăng lên. Có lẽ vì thế mà chỉ có sự phân bố của vài oligomer trong phân tử DNA
nhiễm sắc thể đã được nghiên cứu mà thôi. Salzberg và cộng sự [89] tìm thấy rằng các oligomer phân
bố không cân đối ở hai phía của điểm khởi đầu sao chép của một số vi khuẩn ( Hình 2.10). Lopez và
cộng sự [75] đã sử dụng oligomer skew để xác định vị trí khởi đầu sao chép ở vi khuẩn cổ. Nhóm tác
giả của nghiên cứu này tìm thấy rằng sử dụng tetramer skew để nhận diện vị trí khởi đầu sao chép
chính xác hơn là sử dụng GC skew (Hình 2.11). Nhóm nghiên cứu của Lopez cho rằng kết

quả này là do khi xảy ra sự sắp xếp lại DNA trong bộ gene, oligomer skew có khuynh
hướng được phục hồi nhanh hơn GC skew, bởi vì GC skew được hình thành có lẽ là
do đột biến xảy ra chậm và không đều một cách tự nhiên trên mạch trước và mạch sau.
Lý giải này có vẻ mang tính cảm tính hơn là tính xác thực của GC skew, bởi vì nguyên nhân vì
sao có GC skew và oligomer skew cho đến nay vẫn chưa được biết đến. Worning và cộng sự [90] cũng
sử dụng tần suất xuất hiện của các oligomer có kích thước đến 8 nucleotide để xác định vị trí khởi đầu
sao chép trong các phân tử DNA nhiễm sắc thể dạng vòng.

Đối chiếu với phần trình bày ở Mục 2.4.1, trong quá trình sao chép DNA nhiễm sắc
thể vi khuẩn, hai bộ máy sao chép chuyển động theo hai hướng rời xa điểm khởi đầu
sao chép. Ở mỗi hướng, bộ máy sao chép tổng hợp cả mạch trước và mạch sau. Như
vậy, sự phân bố khác nhau của các nucleotide ở hai phía của vị trí khởi đầu sao chép
trong phân tử DNA nhiễm sắc thể tế bào vi khuẩn cũng chính là sự khác nhau về sự
phân bố của chúng trên hai sợi làm khuôn sao chép ở mạch trước và mạch sau. Lobry
và Sueoka [74] cũng cho thấy các vị trí thứ ba của codon trên mạch trước tương đối
giàu G hơn C và giàu T hơn A so với trên mạch sau.

20



Hình 2.10 Các ví dụ minh họa sự phân bố không cân đối của một số oligomer ở
hai phía của điểm khởi đầu sao chép của bốn bộ gene vi khuẩn. Các vị trí của
TTTGTTTT trong bộ gene của Borellia burgdorferi, của TGTGTGTG trong bộ
gene của Treponema pallidum, của GAGCAGGG trong bộ gene của E. coli và của
TGAAGAGG trong bộ gene của Bacillus subtilis. Các đoạn thẳng đứng phía trên
đường trung tâm nằm ngang chỉ vị trí của oligomer trong một sợi DNA, phía dưới
chỉ vị trí của oligomer trong sợi bổ sung. ‘Ori’ chỉ vị trí điểm khởi đầu sao chép
[89].
Rocha [91] nhận định rằng tần suất xuất hiện của các oligomer trong mạch trước và
mạch sau khác nhau là do nhiều yếu tố khác nhau tạo thành, chẳng hạn như sự khác
nhau về sự phân bố của các nucleotide ở trong phân tử DNA nhiễm sắc thể, các tín
hiệu sao chép, hoặc sự phân bố không cân xứng của các gene và các tín hiệu điều hòa
tương ứng trên hai mạch sao chép; sự khác nhau về tần suất xuất hiện của các
21


oligomer này là kết quả của các sự khác nhau có quan hệ với các tín hiệu liên quan đến
các quá trình sinh học khác nhau trong tế bào, chẳng hạn như các chuỗi trình tự T
thường xuất hiện khi có mặt của các yếu tố kết thúc không phụ thuộc vào yếu tố Rho,
một protein ở tế bào prokaryote có liên quan đến sự kết thúc phiên mã, thường xuất
hiện trên mạch trước; một ví dụ khác là các trình tự Chi, các trình tự này tăng cường
quá trình tái tổ hợp DNA theo con đường RecBCD ở vi khuẩn E. coli, cũng xuất hiện
trên mạch trước nhiều hơn trên mạch sau, nhưng các trình tự Chi lại giàu GT và chứa
các trimer tương ứng với các codon được sử dụng thường xuyên.
Vì thế vẫn đang tồn tại nhiều nghi vấn xung quanh vấn đề ý nghĩa sinh học của sự
khác nhau về tần suất xuất hiện của các trình tự oligomer ở hai phía của điểm khởi đầu
sao chép.

22



Hình 2.11 Xác định vị trí điểm khởi đầu sao chép nhờ tần suất xuất hiện của các
oligomer trong bộ gene của hai vi khuẩn cổ. Trục tung biểu diễn giá trị skew tích
lũy. Trục hoành biểu diễn chiều dài phân tử DNA nhiễm sắc thể. Dấu mũi tên biểu
diễn vị trí của đoạn DNA mã hóa cho protein gắn đặc hiệu vào trình tự khởi đầu
sao chép, Cdc6 hoặc ORC [75].
2.6.2 Hai mạch sao chép DNA và các bộ máy sao chép
DNA polymerase của vi khuẩn về mặt cấu trúc, như trình bày ở Mục 2.4.1, là một protein dimer bất
đối xứng [35], [36], [37], [92]. Đơn vị thứ nhất của dimer gồm có các tiểu đơn vị α, β, θ, ε và τ. Đơn vị
thứ hai gồm α, β, θ, ε, γ, δ, δ’, χ và ψ. Các tiểu đơn vị α, ε và θ trong mỗi đơn vị kết hợp với nhau tạo
nên thành phần chính “core” có khả năng xúc tác phản ứng tổng hợp DNA. Trong quá trình sao chép,
“core” của đơn vị thứ nhất chịu trách nhiệm tổng hợp mạch trước còn “core” của đơn vị thứ hai chịu
trách nhiệm tổng hợp mạch sau. Tiểu đơn vị β chịu trách nhiệm xúc tiến và giúp đỡ thành phần chính
“core” bám vào sợi khuôn DNA, trong khi các tiểu đơn vị δ và δ’ tương ứng được cho là có tương tác
đặc hiệu với τ và γ. τ hoạt động như một sợi dây buộc vào “core” xúc tác tổng hợp mạch sau và giúp
phản ứng tổng hợp DNA bởi “core” này được tiếp tục khi quá trình tổng hợp bị một số DNA oligomer
cản trở. χ và ψ là các thành phần đặc trưng tham gia quá trình tổng hợp mạch sau.

23


Ở tế bào eukaryote, như trình bày ở Mục 2.4.2, mạch trước và mạch sau cũng được tổng hợp nhờ sự
tham gia của các DNA polymerase khác nhau.
Rõ ràng, bộ máy tổng hợp mạch trước không giống với bộ máy tổng hợp mạch sau. Các nucleotide
trong phân tử DNA nhiễm sắc thể hẳn phải được sắp xếp sao cho tương thích với cấu trúc của các bộ
máy sao chép.

2.6.3 Sự thay đổi trình tự nucleotide nhiễm sắc thể bằng phương pháp tái tổ hợp
sử dụng trình tự oligonucleotide sợi đơn và hiệu suất tái tổ hợp

Bằng cách sử dụng phương pháp tái tổ hợp các trình tự oligonucleotide sợi đơn vào trình tự DNA
nhiễm sắc thể, một số nghiên cứu đã thành công trong việc thay đổi các trình tự nucleotide nhiễm sắc
thể [1], [2]. Phương pháp này cho hiệu suất tái tổ hợp cao hơn nhiều so với phương pháp tái tổ hợp
DNA đồng dạng [93] vì chỉ cần sử dụng trình tự oligonucleotide sợi đơn cỡ vài chục bp thay vì hàng
nghìn bp nucleotide đồng dạng, đồng thời có thể sử dụng được cho cả tế bào prokaryote và eukaryote
[1], [2], [94], [95], [96], [97]. Để thay đổi trình tự nucleotide nhiễm sắc thể, trình tự oligonucleotide
sợi đơn phải được thiết kế để có thể tái tổ hợp được vào một trong hai trình tự sợi đơn của nhiễm sắc
thể, hoặc là sợi làm khuôn cho quá trình phiên mã (sợi T) hoặc là sợi bổ sung với sợi làm khuôn cho
quá trình phiên mã (sợi NT), nhờ λ-Red Beta protein trong quá trình sao chép DNA. Tuy nhiên, các
nghiên cứu này cho thấy rằng hiệu suất tái tổ hợp của trình tự oligonucleotide sợi đơn vào sợi T và sợi
NT không giống nhau, thậm chí sản phẩm của quá trình tái tổ hợp có thể không được tạo thành. Ellis
và cộng sự [1] cho rằng sự khác nhau này là do có sự khác nhau về hướng sao chép. Ngoài ra, Li và
cộng sự [2] còn cho rằng sự khác nhau này là do sự khác nhau về trình tự oligonucleotide sợi đơn.
Huen và cộng sự cũng cho rằng việc thay đổi trình tự nucleotide nhiễm sắc thể nhờ trình tự
oligonucleotide sợi đơn có liên quan đến quá trình sao chép DNA [98]. Theo Liu và cộng sự [99], hiệu
suất tái tổ hợp còn bị ảnh hưởng bởi sự hiện diện của RNA polymerase trên sợi T. Do đó, một khi sự
sắp xếp của các nucleotide trong trình tự DNA nhiễm sắc thể còn chưa được tường tận thì việc chọn
lựa một trong hai sợi đơn DNA nhiễm sắc thể và việc thiết kế trình tự oligonucleotide sẽ vẫn còn khó
khăn cho các thí nghiệm thay đổi trình tự DNA nhiễm sắc thể bằng phương pháp tái tổ hợp sử dụng
các trình tự oligonucleotide sợi đơn.

2.6.4 Sự thay đổi trình tự nucleotide nhiễm sắc thể và các mối liên quan
Sự đảo đoạn trong phân tử DNA nhiễm sắc thể tế bào vi khuẩn E. coli và ảnh hưởng của việc đảo đoạn
được nghiên cứu từ năm 1998 [100] và kéo dài cho đến những năm gần đây. Nghiên cứu của Esnault
và cộng sự [5] cho thấy việc đảo đoạn DNA bên trong mỗi replichore phá vỡ sự phân bố của nucleoid
trong tế bào và các giai đoạn sớm của sự phân chia tế bào. Việc đảo đoạn không đối xứng – là đảo
đoạn xảy ra quanh vùng tiếp giáp của hai replichore (xung quanh điểm khởi đầu hoặc kết thúc sao
chép) và các điểm cuối của đoạn DNA bị đảo có khoảng cách khác nhau đáng kể đối với điểm khởi
đầu sao chép, do đó kích thước của mỗi replichore thay đổi đáng kể so với ban đầu – cũng đã làm ảnh
hưởng nghiêm trọng đến các quá trình tiến đến sự phân bào, dẫn đến tế bào không thể phân chia hoặc

sự phân chia không hoàn chỉnh tạo ra các tế bào với các tình trạng nucleoid khác nhau [5], [86]. Đảo
đoạn ở các thí nghiệm này đã hoán đổi hai sợi bổ sung của các đoạn DNA bị đảo trên các mạch sao
chép (tức mạch trước và mạch sau), vì thế trình tự DNA trên hai mạch sao chép bị thay đổi. Theo
nhóm nghiên cứu của Spiesser [101], tốc độ sao chép phụ thuộc vào trình tự DNA nhiễm sắc thể. Theo
đó, tốc độ sao chép của các đoạn DNA sau khi bị đảo bị thay đổi. Ở vi khuẩn Bacillus subtilis, việc
thay đổi vị trí của điểm khởi đầu sao chép hoặc đảo đoạn bên trong replichore cũng làm cho tốc độ sao
chép DNA bị giảm đi đáng kể [4], [102]. Trình tự vốn có của các nucleotide trong phân tử DNA
nhiễm sắc thể vì thế đóng vai trò quan trọng trong quá trình sao chép và sự tạo thành tế bào mới. Tuy

24


nhiên, Darling và cộng sự [88] nhận thấy rằng đảo đoạn đối xứng – tức đảo đoạn xảy ra quanh vùng
tiếp giáp của hai replichore và các điểm cuối của đoạn DNA bị đảo có khoảng cách như nhau đối với
điểm khởi đầu sao chép, do đó kích thước của mỗi replichore là không thay đổi đáng kể so với ban đầu
– là một hiện tượng phổ biến ở vi khuẩn Yersinia. Một nghiên cứu khác thực hiện thống kê trên các bộ
gene của vi khuẩn Salmonella được nuôi cấy cho thấy rằng các bộ gene với hai replichore có kích
thước bằng nhau có thể được ưu tiên chọn lọc [87].
Trong quá trình tiến hóa, nhiễm sắc thể của tế bào sinh vật có thể bị mất gene hoặc thêm gene, theo
sau đó có thể là các quá trình tái sắp xếp các trình tự DNA nhiễm sắc thể. Các quá trình tái sắp xếp này
có thể bị điều tiết, bởi vì thành phần nucleotide trên hai sợi làm khuôn của mỗi replichore không giống
nhau, như trình bày ở Mục 2.6.1, nhưng toàn bộ phân tử DNA nhiễm sắc thể thì đối xứng [8], [9]. Trên
thực tế, thực nghiệm cho thấy rằng không phải lúc nào sự thêm gene vào nhiễm sắc thể cũng thành
công. Thí nghiệm của Itaya và cộng sự [3] đã thất bại khi đưa phân tử DNA nhiễm sắc thể vi khuẩn
Synechocystis sp. PCC6803 vào nhiễm sắc thể vi khuẩn B. subtilis bằng cách chèn toàn bộ DNA
nhiễm sắc thể của Synechocystis vào một điểm trên phân tử DNA nhiễm sắc thể Bacillus. Thí nghiệm
chỉ thành công khi phân tử DNA nhiễm sắc thể tạo thành đối xứng qua các điểm khởi đầu và kết thúc
sao chép của phân tử DNA nhiễm sắc thể vi khuẩn B. subtilis. Tương tự, nhiễm sắc thể của E. coli và
Haemophilus influenzae cũng đã được kết hợp làm một, tuy tồn tại khó khăn trong việc chuyển gene,
sao chép DNA, tương tác qua lại trong điều hòa gene và sự tương thích giữa các sản phẩm của gene

của hai vi khuẩn [6]. Vi khuẩn nhân tạo cũng có thể được tạo thành nhờ việc tạo ra phân tử DNA
nhiễm sắc thể nhân tạo. Tuy nhiên, phân tử DNA nhiễm sắc thể nhân tạo chỉ có thể được tạo thành khi
trình tự nucleotide nhiễm sắc thể của nó tương tự như trình tự nucleotide của nhiễm sắc thể của tế bào
vi khuẩn tự nhiên [7].

2.6.5 Codon, sự sử dụng codon và mức độ biểu hiện gene
2.6.5.1 Codon
Codon là một bộ gồm ba nucleotide trên trình tự RNA thông tin (mRNA) có chức năng mã hóa cho
một amino acid trong quá trình dịch mã. Có tất cả 64 codon khác nhau, trừ ba codon có chức năng làm
tín hiệu dừng quá trình dịch mã, đó là TAA, TAG và TGA. Những codon này còn được gọi là stop
codon. 61 codon còn lại mã hóa cho chỉ 20 amino acid. Như thế, có amino acid được mã hóa bởi chỉ
một codon, chẳng hạn như methionine được mã hóa bởi codon ATG, và có amino acid được mã hóa
bởi nhiều codon, chẳng hạn như glycine được mã hóa bởi GGT, GGC, GGA hoặc GGG. Trừ các
codon mang tín hiệu dừng dịch mã, một codon mã hóa cho methionine và một cho tryptophan, mỗi
một codon trong 59 codon còn lại đều có codon đồng nghĩa với nó (synonymous codon).

2.6.5.2 Sự sử dụng codon
Thông thường, sự sử dụng codon của một cá thể sinh vật được định nghĩa là tần suất xuất hiện trung
bình của các codon riêng biệt trên 1000 codon tổng số tính cho toàn bộ gene của cá thể sinh vật đó
[103]. Sự sử dụng codon của một sinh vật cho biết mức độ sử dụng các codon của sinh vật này trong
toàn thể bộ gene. Trong mối liên quan với các amino acid, mức độ sử dụng từng codon được định
nghĩa là phần của mỗi codon đồng nghĩa mã hóa cho một amino acid trong một bộ gene. Bảng 2.1
trình bày sự sử dụng codon ở vi khuẩn E. coli và người Homo sapiens [104].

25


×