Tải bản đầy đủ (.pdf) (73 trang)

Luận văn nghiên cứu phát triển hệ vector SFV (semliki forest virut) nhằm nhân dòng và biểu hiện gen mã thụ thể neurokinin 1 phục vụ các nghiên cứu dược lý và phát triển thuốc ở việt nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.56 MB, 73 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
---------------------

Phạm Thị Hồng Nhung

NGHIÊN CỨU PHÁT TRIỂN HỆ VECTOR SFV (SEMLIKI
FOREST VIRUT) NHẰM NHÂN DÒNG VÀ BIỂU HIỆN GEN MÃ
THỤ THỂ NEUROKININ 1 PHỤC VỤ CÁC NGHIÊN CỨU DƯỢC
LÝ VÀ PHÁT TRIỂN THUỐC Ở VIỆT NAM

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội – 2012


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
---------------------

Phạm Thị Hồng Nhung

NGHIÊN CỨU PHÁT TRIỂN HỆ VECTOR SFV (SEMLIKI
FOREST VIRUT) NHẰM NHÂN DÒNG VÀ BIỂU HIỆN GEN MÃ
THỤ THỂ NEUROKININ 1 PHỤC VỤ CÁC NGHIÊN CỨU DƯỢC
LÝ VÀ PHÁT TRIỂN THUỐC Ở VIỆT NAM

Chuyên ngành: Di truyền học

Mã số: 604270


LUẬN VĂN THẠC SĨ KHOA HỌC

Người hướng dẫn khoa học: PGS.TS. Đinh Đoàn Long

Hà Nội – 2012


MỤC LỤC
MỞ ĐẦU ........................................................................................................... 1
Chương 1. TỔNG QUAN TÀI LIỆU
1.1 CÔNG NGHỆ SINH HỌC PHÂN TỬ TRONG BIỂU HIỆN THỤ
THỂ KẾT CẶP G-PROTEIN (GPCR) .......................................................... 3
1.1.1 Thụ thể kết cặp G-protein và vai trò trong nghiên cứu dược phẩm ............ 3
1.1.2 Các hệ thống vector ................................................................................... 4
1.1.3 Các hệ thống biểu hiện thụ thể kết cặp G-protein ....................................... 9
1.2 HỆ THỐNG VECTOR SFV (SEMLIKI FOREST VIRUT) .................. 13
1.2.1 Virut Semliki Forest (SFV) ...................................................................... 13
1.2.2 Hệ vector SFV (Semliki Forest virut) cơ bản ........................................... 14
1.2.3 Tiềm năng ứng dụng khác của hệ vector SFV .......................................... 17
1.2.4 Các yếu tố cần được cải tiến trong hệ vector SFV .................................... 19
Chương 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. VẬT LIỆU NGHIÊN CỨU .................................................................... 23
2.2. PHƯƠNG PHÁP NGHIÊN CỨU .......................................................... 27
2.2.1 Chuẩn bị tế bào khả biến và biến nạp................................................. 28
2.2.2 Phương pháp tách chiết plasmit. ........................................................ 29
2.2.3 Duy trì, bảo quản mẫu sinh phẩm trong quá trình phân lập và nhân
dòng ........................................................................................................... 29
2.2.4 Thiết kế mồi. ..................................................................................... 30
2.2.5 Khuếch đại gen nhờ phản ứng PCR (polymerase chain reaction) ....... 31
2.2.6 Cắt ADN sử dụng enzym giới hạn và chống tự nối/đóng vòng. ......... 31

2.2.7 Tạo các đoạn ADN sợi đôi và các linker từ các đoạn oligonucleotit... 32
2.2.8 Phản ứng nối các đoạn ADN ............................................................. 33
2.2.9 Sàng lọc khuẩn lạc............................................................................. 34
Chương 3. KẾT QUẢ VÀ THẢO LUẬN
3.1 Chuẩn bị tế bào khả biến và biến nạp ................................................... 35
3.2 Cải tiến vector pSFV ............................................................................ 37


3.3 Tạo ADN tái tổ hợp chứa gen NK1 trong hệ vector SFV cơ bản........... 43
3.4 Tạo ADN tái tổ hợp chứa gen NK1 trong hệ vector SFV cải tiến.......... 46
3.5. Sàng lọc chủng vi khuẩn mang gen mã hóa NK1. ................................ 50
KẾT LUẬN VÀ KIẾN NGHỊ
Kết luận .......................................................................................................... 52
Kiến nghị ........................................................................................................ 52
TÀI LIỆU THAM KHẢO
Tài liệu tiếng Việt .......................................................................................... 53
Tài liệu tiếng Anh .......................................................................................... 53
Tài liệu tiếng web............................................................................................ 57
PHỤ LỤC


DANH MỤC CÁC HÌNH

Hình 1. Bốn họ thụ thể chính .............................................................................. 3
Hình 2. Quy trình và thời gian yêu cầu để sản xuất GPCR tái tổ hợp trong các
hệ thống biểu hiện khác nhau.............................................................................. 9
Hình 3. Hệ gen SFV tự nhiên............................................................................ 13
Hình 4. Cấu trúc vector pSFV cơ bản ............................................................... 15
Hình 5. Cấu trúc vector pHelper ....................................................................... 15
Hình 6. Mô hình hoạt động của hệ vector SFV ................................................. 16

Hình 7. Cấu trúc của vector pJET1.2 ................................................................ 23
Hình 8. Vị trí các mồi trên cADN mã cho thụ thể NK1..................................... 25
Hình 9. Trình tự vị trí nhân dòng đa điểm của đoạn O-M7 ............................... 25
Hình 10. Sơ đồ nghiên cứu tạo hệ vector cải biến pSFV-M7, pSFV-M8 ........... 27
Hình 11. Sơ đồ nghiên cứu thu khuẩn lạc có cADN mã NK1 chèn trong
vector pSFV cải tiến ......................................................................................... 27
Hình 12. Sơ đồ nghiên cứu thu khuẩn lạc có cADN mã NK1 chèn trong
vector pSFV cơ bản .......................................................................................... 28
Hình 13. Đường cong sinh trưởng của E.coli DH5α ......................................... 35
Hình 14. Ảnh điện di sản phẩm PCR đoạn gen mã vỏ capsit của SFV .............. 38
Hình 15. Một phần kết quả giải trình tự phản ứng PCR khuếch đại đoạn gen
mã vỏ capsit của SFV ....................................................................................... 39
Hình 16. Vị trí của đoạn chèn thứ 2 trong pHelper............................................ 39
Hình 17. Ảnh điện di đoạn chèn 2 trên gel agarrose 1%. ................................... 40
Hình 18. Ảnh điện di sản phẩm colony PCR kiểm tra khuẩn lạc mang vùng
cải biến ............................................................................................................. 41
Hình 19. Kết quả giải trình đoạn cải tiến trong vector pSFV-M7 ...................... 42
Hình 20. Kết quả giải trình đoạn cải tiến trong vector pSFV-M8 ...................... 43
Hình 21. Ảnh điện di sản phẩm PCR cADN mã gen NK1 dùng Pfu DNA
polymerase ....................................................................................................... 43
Hình 22. Ảnh điện di sản phẩm cắt pSFV đã mở vòng bằng SmaI .................... 45
Hình 23. Ảnh điện di sản phẩm cắt thu cADN mã cho NK1 từ pJET1.2 ........... 46


Hình 24. Ảnh điện di cADN mã cho NK1 (XhoI/Klenow/ XbaI) sau khi tinh
sạch .................................................................................................................. 47
Hình 25. Ảnh điện di mở vòng pSFV-M7 và pSFV-M8.................................... 48
Hình 26. Ảnh điện di sản phẩm clonyPCR kiểm tra khuẩn lạc mang đoạn
chèn NK1. ........................................................................................................ 50
Hình 27. Tối ưu nhiệt độ gắn mồi cho cặp mồi 808/809 ................................... 51



DANH MỤC CÁC BẢNG
Bảng 1. Một số promoter được bổ sung vào các vectơ biểu hiện ......................... 6
Bảng 2. Trình tự, kích thước một số đuôi ái lực .................................................. 8
Bảng 3. Các vị trí cắt của một số protease phổ biến ............................................ 8
Bảng 4. Trình tự các mồi sử dụng trong nghiên cứu.......................................... 24
Bảng 5. Trình tự các oligonucleotit sử dụng trong nghiên cứu .......................... 24
Bảng 6. Phản ứng cắt với enzym giới hạn ......................................................... 31
Bảng 7. Điều kiện của phản ứng dephosphoryl hóa đầu 5’ADN ..................... ..32
Bảng 8. Thành phần của phản ứng nối ADN và vector đầu bằng ...................... 33
Bảng 9. Thành phần của phản ứng nối ADN và vector đầu dính ....................... 33
Bảng 10. Điều kiện của phản ứng nối linker ..................................................... 34
Bảng 11. Tần số biến nạp của một số lô tế bào khả biến ................................... 36
Bảng 12. Thành phần và điều kiện của phản ứng PCR khuếch đại đoạn gen
mã vỏ capsit của SFV ....................................................................................... 38
Bảng 13. Thành phần và điều kiện phản ứng cắt thu đoạn chèn 2 ..................... 40
Bảng 14. Thành phần và điều kiện phản ứng PCR sàng lọc khuẩn lạc chứa
vector cải tiến pSFV-M7, pSFV-M8 ................................................................. 41
Bảng 15. Quy trình cho phản ứng nhân dòng đoạn cADN mã hóa cho thụ thể
NK1 ................................................................................................................. 44
Bảng 16. Thành phần và điều kiện của phản ứng cắt pSFV bằng SmaI ............. 44
Bảng 17. Thành phần và điều kiện của phản ứng cắt pSFV đã mở vòng bằng
XhoI ................................................................................................................. 45
Bảng 18. Thành phần và điều kiện của phản ứng chống tự đóng vòng của
pSFV ................................................................................................................ 46
Bảng 19. Quy trình thu đoạn chèn cADN NK1 có 1 đầu bằng/ 1 đầu dính ........ 47
Bảng 20. Quy trình mở vòng pSFV cải biến và kiểm tra hiệu suất mở vòng .... 48
Bảng 21. Quy trình tạo 1 đầu bằng-1 đầu dính cho pSFV cải biến .................... 49
Bảng 22. Thành phần và điều kiện của phản ứng colony PCR để xác định

khuẩn lạc tái tổ hợp pSFV-NK1........................................................................ 50


BẢNG CÁC KÝ HIỆU VÀ TỪ VIẾT TẮT

ADN

Axit deoxyribonucleic

bp

Base pair (Cặp bazơ nitơ)

dNTP

Deoxyribonucleotide triphosphate

E. coli

Escherichia coli

EDTA

Ethylene Diamine Tetraacetic Acid (Axit ethylene diamine
tetraacetic)

GPCR

Thụ thể kết cặp G- protein


kb

kilobase (= 1000 bp)

LB

Lubertani Broth

NK1

Neurokinin-1

Nu

Nucleotit

OD

Optical density (Mật độ quang học)

PCR

Polymerase Chain Reaction (Phản ứng chuỗi polymerase)

ARN

Axit ribonucleic

SFV


Semliki Forest Virut

SOC

Super Optimal broth with Catabolite repression

TAE

Đệm Tris/Axit acetic/EDTA

BẢNG VIẾT TẮT CÁC AXIT AMIN
Ala (A): alanin

Leu (L): leucin

Arg (R): arginin

Lys (K): lysin

Asn (N): asparagin

Met (M): methionin

Asp (D): axit aspartic

Phe (F): phenylalanin

Cys (C): cystein

Pro (P): prolin


Gln (Q): glutamin

Ser (S): serin

Glu (E): axit glutamic

Thr (T): threonin

Gly (G): glycin

Try (W): trytophan

His (H): histidin

Tyr (Y): tyrosin

Ile (I): isoleucin

Val (V): valin



Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học

MỞ ĐẦU
Mặc dù là một ngành mới ra đời nhưng những thành tựu mà công nghệ
sinh học phân tử (molecular biotechnology) đã mang lại là rất lớn. Những bước

phát triển nhanh chóng của công nghệ sinh học phân tử trong các lĩnh vực như
điều chế dược liệu, tạo ra kháng thể đơn dòng, sản xuất vacxin, thành công trong
giải trình tự hệ gen người... đã góp phần đắc lực giúp con người trong công cuộc
đấu tranh chống bệnh tật và không ngừng cải thiện, nâng cao chất lượng cuộc
sống.
Ngày nay, biểu hiện protein tái tổ hợp là một phần quan trọng của công
nghệ sinh học phân tử với nhiều ứng dụng rộng rãi trong lĩnh vực y dược. Biểu
hiện được protein quan tâm trên tế bào động vật và người có thể giúp thiết lập
những mô hình điều trị bệnh bằng liệu pháp gen, bao gồm cả điều trị ung thư.
Biểu hiện protein tái tổ hợp đặc biệt là các protein thụ thể kết cặp G-protein (Gprotein coupled receptor, viết tắt là GPCR) phục vụ hữu ích cho các nghiên cứu
phát triển thuốc, tìm hiểu cấu trúc và chức năng sinh học của các thụ thể, qua đó
làm sáng tỏ các con đường truyền tin nội bào. Các protein thụ thể kết cặp Gprotein liên quan trực tiếp đến sự phát sinh nhiều bệnh lý ở người, là “đích” có
vai trò quan trọng bậc nhất trong các chương trình sàng lọc các dược chất mới .
Các nhà khoa học luôn mong muốn xây dựng được các hệ thống biểu hiện
GPCR chủ động ở mức độ cao để dùng cho các nghiên cứu dược lý học phân tử,
các thí nghiệm sàng lọc để phát hiện các dược chất mới và phát triển dược phẩm.
Trên thế giới, một số hệ thống biểu hiện GPCR tiềm năng đã được thiết
lập và thử nghiệm, chẳng hạn như hệ thống dịch mã phi tế bào, các hệ thống
biểu hiện ở tế bào nhân sơ (E.coli và Halobacterium salinarum) và nhân chuẩn
(nấm men, côn trùng và động vật có vú). Một số GPCR đã được biểu hiện thành
công trên các hệ thống này ở mức độ cao từ 1 đến 10 mg/l môi trường nuôi cấy
[19]. Trong các hệ thống biểu hiện trên, hệ thống sử dụng hệ vector Semliki
Forest Virut (SFV) được ghi nhận là một trong những hệ thống có nhiều đặc
điểm ưu việt và giàu tiềm năng ứng dụng [34]. Tuy vậy, hiện nay SFV không
1


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học


được thương mại hóa rộng rãi do sự độc quyền sử dụng tại một số phòng thí
nghiệm của các hãng dược phẩm (như Roche, Novartis).
Với tiềm năng ứng dụng lớn trong lĩnh vực sinh – y – dược và hệ vector
SFV cơ bản được tặng từ GS. Kenneth Lundstrom (hãng dược phẩm Roche,
Thụy Sĩ) và nguồn cADN mã hóa cho thụ thể kết cặp G-protein neurokinin 1
(NK1) của người Việt Nam đã được phân lập và nhân dòng thành công từ đề tài
ĐT-PTNTĐ.2011-G/04, chúng tôi đề xuất và thực hiện đề tài: “Nghiên cứu
phát triển hệ vector SFV (Semliki Forest Virut) nhằm nhân dòng và biểu hiện
gen mã hóa thụ thể Neurokinin-1 phục vụ các nghiên cứu dược lý và phát
triển thuốc ở Việt Nam” với mục tiêu lâu dài là xây đựng được hệ thống biểu
hiện các protein GPCR có thể được dùng như một công cụ công nghệ sinh học
hiệu quả trong các nghiên cứu về sinh học thụ thể ở người Việt Nam sau này,
đồng thời phục vụ cho các nghiên cứu dược lý học, sàng lọc và phát triển dược
phẩm ở cấp độ phân tử và tế bào.

2


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học

Chương 1. TỔNG QUAN TÀI LIỆU
1.1 CÔNG NGHỆ SINH HỌC PHÂN TỬ TRONG BIỂU HIỆN THỤ THỂ
KẾT CẶP G-PROTEIN (GPCR)
1.1.1 Thụ thể kết cặp G-protein và vai trò trong nghiên cứu dược phẩm
Thụ thể là một lớp lớn các protein có chức năng tiếp nhận các tín hiệu
ngoại bào, truyền hóa và thúc đẩy quá trình truyền tin nội bào dẫn đến đáp ứng
tế bào giúp cơ thể đáp ứng kịp thời với sự thay đổi của môi trường. Để thực hiện

được chức năng đó, thụ thể có đặc tính liên kết đặc hiệu với một hoặc một số
phân tử tín hiệu đặc thù được gọi là phối tử (ligand) và phức hệ “ligand – thụ
thể” sẽ khởi đầu một quá trình truyền tin nội bào và gây nên đáp ứng tế bào [3].
Có 4 họ thụ thể chính (Hình 1), trong đó thụ thể kết cặp G-protein (viết
tắt là GPCR) là họ protein lớn và đa dạng nhất ở người [33]. Thụ thể kết cặp Gprotein là nhóm thụ thể xuyên màng sinh chất và hoạt động nhờ sự kết cặp với
một loại protein hoạt động bởi liên kết với GTP (tức là G-protein). GPCR dẫn
truyền tín hiệu cho nhiều dạng phối tử, bao gồm các hóc môn, peptit thần kinh,
các chemokine…Trong cơ thể, các GPCR được biểu hiện trên hầu hết các kiểu
tế bào và ước tính có đến 1000 GPCR khác nhau ở người [52].

Hình 1. Bốn họ thụ thể chính (nguồn: Gunnar Schulte, 2008 [18])
Sự thay đổi về mật độ cũng như trạng thái hoạt hóa của các GPCR là
nguyên nhân trực tiếp gây nên nhiều bệnh cấp tính và mãn tính như tiểu đường,
các bệnh tim, trầm cảm, viêm nhiễm và ung thư [31]. Các GPCR là đích tác
động chính của hơn 50% các loại dược phẩm đang được sử dụng trong điều trị.

3


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học

Riêng năm 2001, nhóm thuốc này đem đến doanh thu trên 30 tỷ USD và ước
tính con số hiện nay còn cao hơn [25].
Mặc dù GPCR có ý nghĩa thực tiễn to lớn song có hai trở ngại lớn khi sử
dụng các GPCR tự nhiên (native) trong các nghiên cứu dược lý học phân tử và
sàng lọc thuốc. Thứ nhất là các GPCR tự nhiên thường chỉ được biểu hiện ở mức
độ rất thấp (khoảng vài fmol/mg protein màng tế bào) nên thường không sẵn có
để dùng cho các thí nghiệm sàng lọc. Thứ hai là trong các mô hình thử nghiệm ở

các động vật thí nghiệm, các GPCR thường đồng thời tồn tại ở nhiều dạng phụ
(subtype) khác nhau hoặc các dạng biến thể (variants/polymorphic alleles) khác
nhau, dẫn đến có thể có những nhận định nhầm về khả năng tương tác của các
“thuốc thử” (test compound) với các thụ thể đích nếu đối tượng thí nghiệm lấy
mẫu ngẫu nhiên không đại diện cho nhóm phổ biến nhất (các alen kiểu dại). Có
thể nhận thấy những khó khăn trên có thể được khắc phục bằng việc ứng dụng
các kỹ thuật di truyền nhằm biểu hiện các GPCR tái tổ hợp của người. Các
GPCR tái tổ hợp được biểu hiện ở mức độ cao sẽ cung cấp nguồn nguyên liệu
cho các thí nghiệm xác định hoạt tính liên kết với phối tử cũng như chức năng
liên kết của các G-protein. Chính bởi vậy, xây dựng các hệ thống biểu hiện
GPCR nhanh và hiệu quả là một hướng nghiên cứu có ý nghĩa quan trọng và
mang lại nhiều lợi ích thiết thực trong sàng lọc và nghiên cứu phát triển dược
phẩm.
1.1.2 Các hệ thống vector
Ý tưởng về vector mang gen ngoại lai bắt nguồn từ các plasmit vi khuẩn.
Vector là phân tử ADN có khả năng tự tái bản, tồn tại độc lập trong tế bào chủ
và mang các gen cần chuyển. Sau khi vector ngoại lai được đưa vào tế bào chủ,
chúng sử dụng bộ máy sao chép của tế bào chủ để nhân bản đến số lượng cần
thiết và biểu hiện các gen chúng mang [1].
Đến nay, đã có hơn 2600 vector được chia làm 3 nhóm chính là plasmit
(nguồn gốc từ vi khuẩn), phagơ (nguồn gốc từ virut) và nhiễm sắc thể nhân tạo
[46]. Chuyển gen vào các tế bào động vật có thể tiến hành bằng cách gây nhiễm
các phagơ mang gen tái tổ hợp quan tâm hoặc chuyển gen trực tiếp thông qua
plasmit. Có rất nhiều vector biểu hiện trên động vật có vú có nguồn gốc từ virut
4


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học


được dùng trong sản xuất protein, liệu pháp gen và phát triển vacxin mới (Phụ
lục-1).
Hiệu quả biểu hiện gen đặc biệt là trong các tế bào động vật có vú không
đơn thuần thể hiện ở tốc độ sản xuất protein mà còn phụ thuộc vào nhiều yếu tố
như các nhân tố kiểm soát phiên mã và dịch mã, quá trình biên tập và sự ổn định
của ARN, số lượng bản sao của gen ngoại lai, khả năng gây độc của các protein
tái tổ hợp với tế bào cũng như các đặc tính di truyền của tế bào chủ.
Giá trị của vector ở chỗ nó được thiết kế sao cho thuận tiện với mục đích
sử dụng. Không có hệ vector nào toàn năng cho chuyển gen và biểu hiện mà cần
có sự chọn lựa tùy theo mục đích và kích thước của đoạn gen được tạo dòng
[66]. Các vector liên tục được cải tiến thuận lợi cho việc chuyển gen, sản xuất và
thu hồi protein ngoại lại một cách hiệu quả. Dưới đây tóm lược một số xu hướng
cải tiến vector phổ biến và ý nghĩa của chúng.
1.1.2.1 Tạo các vector ADN từ hệ gen virut có bản chất ARN
Nhiều virut có hệ gen ARN có tiềm năng phát triển thành các vector biểu
hiện mạnh. Các phiên bản vector ADN của virut ARN được thiết lập là một
bước cải tiến lớn đem lại các hệ thống biểu hiện mạnh hơn (đặc biệt ở tế bào
động vật có vú), dễ dàng thao tác với các enzym và thuận lợi cho quá trình chèn
các đoạn ADN ngoại lai đồng thời hạn chế được các bước xử lý trong điều kiện
chuyên biệt dành cho ARN và dịch mã ARN có mũ đầu 5’ trong ống nghiệm [6].
Nhiều nghiên cứu xây dựng vector ADN dựa trên hệ vector ARN gốc đã được
tiến hành, chẳng hạn như các hệ vector ADN có nguồn gốc từ ARN hệ gen của
virut Sindbis [54].
1.1.2.2 Thêm hoặc cải tiến các vùng điều khiển
Những hiểu biết ngày càng sâu sắc về các trình tự mã cho các tín hiệu
điều khiển quá trình phiên mã, biên tập mARN và dịch mã có thể thêm vào
vector giúp chúng ta chủ động điểu khiển hiệu suất biểu hiện theo ý muốn.
Trình tự Kozak GCC(A/G) CCATGG ở động vật có xương sống hoặc
trình tự tương đương CAAAACATG ở côn trùng bất cứ khi nào xuất hiện đều

làm tăng hiệu suất dịch mã ARN [1]. Ngoài ra, đoạn trình tự này còn khuyến
5


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học

khích loại bỏ các vùng có thể ức chế dịch mã nằm ngược dòng ATG hay vùng
cấu trúc thứ cấp ở đầu 5’ không mã hóa [15].
Lựa chọn các trình tự tăng cường hay các promoter mạnh có hiệu suất
phiên mã cao để thêm hoặc thay thế cho promoter gốc của vector sẽ giúp tắng
cường mức độ biểu hiện protein. Bảng 1 trình bày một số promoter có thể thêm
vào vector biểu hiện trên động vật có vú.
Bảng 1. Một số promoter được bổ sung vào các vector biểu hiện
(nguồn: Gerstein, 2001 [15])
Promoter
Hệ vector gốc
Độ mạnh*
EF-1α
Nhân tố kéo dài 1α ở người
40-160
CMV
Cytomegalovirut
4
RSV
Virut LTR rous sarcoma
2
SV40 muộn
Gen muộn của virut simian 40

1.1
SV40 sớm
Gen sớm của virut simian 40
1
* Promoter SV40 sớm được coi là có độ mạnh là 1để so sánh với các promoter khác.

Nhiều tín hiệu kết thúc phiên mã của sinh vật nhân sơ đã được nghiên
cứu và được sử dụng rộng rãi trong các vector biểu hiện . Ở sinh vật nhân chuẩn,
trình tự ATCAAA(A/T)TAGGAAGA đã được xác định là vùng kết thúc phiên
mã của chín gen được nghiên cứu [36].
Đuôi polyadenin – polyA (50-250 phân tử adenyl nối tiếp nhau) thêm sau
mARN có vai trò quan trọng giúp ổn định và dịch chuyển ARN từ nhân ra tế bào
chất để dịch mã. Mặc dù trình tự polyA cách xa điểm khởi đầu dịch mã nhưng
nó có tác dụng tăng cường sự tái hoạt động của ribosom nên trực tiếp làm tăng
cường hiệu suất dịch mã [1]. Có một số tín hiệu polyadenin hóa hiệu quả đã
được sử dụng trong vector biểu hiện của động vật có vú có nguồn gốc từ gen mã
cho hoóc môn tăng trưởng của bò, β- globin chuột, đơn vị phiên mã sớm của
SV40 và gen mã cho thymidine kinase của Herpes simplex.
Các mã kết thúc (TAG, TAA, TGA) cũng có thể xem xét để thêm vào sau
vùng nhân dòng đa điểm nhằm tăng cường sự kết thúc dịch mã trong trường hợp
các đoạn cài mã gen ngoại lai thiếu các mã này hoặc để tăng hiệu quả hoạt động
của các yếu tố kết thúc dịch mã (RF) [1].
6


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học

1.1.2.3 Mở rộng và đa dạng hóa các vùng nhân dòng đa điểm

Các phiên bản vector đầu tiên dựa trên trình tự nguyên gốc của plasmit
hoặc phage có vùng nhân dòng đa điểm (multiple cloning site-MCS) rất hạn chế.
Các vị trí nhân dòng đa điểm là nơi mà các enzym giới hạn nhận biết để cắt rời
làm chỗ lắp ráp đoạn gen ngoại lai vào. Các trình tự này thường nằm xa điểm
khởi đầu tái bản để tránh bị cắt nhầm. Để thuận lợi cho quá trình nhân dòng gen
ngoại lai, các vector gốc thường được bổ sung thêm các đoạn nối (linker) mang
vị trí nhân dòng đa điểm mới. Các vị trí nhân dòng đa điểm mới phải đảm bảo
không có trong trình tự gốc của vector, ưu tiên cho các enzym giới hạn tạo được
đầu tương thích với nhiều enzym giới hạn khác [2].
1.1.2.4 Thêm các vùng gen giúp sàng lọc thể tái tổ hợp
Các gen kháng kháng sinh giúp chọn lọc các dòng tế bào chứa vector tái
tổ hợp thường được thêm vào hầu hết các vector. Các gen kháng kháng sinh hay
được sử dụng là gen mã họ kháng sinh penicillin (bao gồm ampicillin) tác động
ức chế hình thành thành tế bào vi khuẩn hoặc kanamycin, tetracyclin và
chloramphenicol ức chế sự sinh trưởng vi khuẩn thông qua ức chế sinh tổng hợp
protein vi khuẩn.
Các gen báo cáo (reporter genes) giúp xác định plasmit có chứa đoạn
chèn gen ngoại lai mong muốn cũng có thể được cài vào vector. Gen lacZ là một
gen báo cáo điển hình, mã hóa cho β-galactosidase có khả năng cắt galactose. Vị
trí nhân dòng đa điểm nằm trong gen LacZ và nếu đoạn chèn được cài thành
công vào vector sẽ làm bất hoạt β-galactosidase. Chính vì vậy, tế bào chứa vetor
có đoạn chèn quan tâm có thể được xác định bằng phương pháp chọn khuẩn lạc
xanh/trắng trên môi trường chứa X-gal [2].
1.1.2.5 Thêm các đoạn epitop và các vị trí cắt của protease
Trong vài năm gần đây, một số epitop peptit và protein rất nhỏ còn được
gọi là các đuôi ái lực (affinity-tag) được gắn vào protein tái tổ hợp để tăng
cường sản xuất các protein này [22]. Các đuôi ái lực này có đặc điểm chung là:
không gây đáp ứng miễn dịch; tinh sạch một bước bằng cột lọc có chất gắn thích
hợp; có ảnh hưởng tối thiểu lên cấu trúc và hoạt động sinh học của protein tái tổ


7


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học

hợp mà nó gắn vào; có thể loại bỏ dễ dàng và đặc hiệu để sản xuất các protein
dạng nguyên gốc; phân tích protein tái tổ hợp đơn giản và chính xác trong quá
trình tinh sạch; áp dụng được cho một số loại protein khác nhau. Mỗi loại đuôi ái
lực được tinh sạch với một loại đệm đặc hiệu và trong một số trường hợp các
đoạn peptit này có thể không cần loại bỏ khỏi protein đích. Các đoạn peptit nhỏ
được sử dụng nhiều nhất hiện nay là poly-Arg-tag, FLAG-tag, poly-His-tag, cmyc-tag, S-tag và Strep II-tag. Trình tự của một số đuôi ái lực phổ biến được
trình bày trong Bảng 2.
Bảng 2. Trình tự, kích thước một số đuôi ái lực
Đuôi ái lực

Poly-Arg
Poly-His
FLAG
Strep II
c-myc
S
HAT
3x FLAG
Glutathione
S-transferase

Số
axit

amin
5–6
2–10
8
8
11
15
19
22
211

Trình tự

RRRRR
HHHHHH
DYKDDDDK
WSHPQFEK
EQKLISEEDL
KETAAAKFERQHMDS
KDHLIHNVHKEFHAHAHNK
DYKDHDGDYKDHDIDYKDDD
DK
Protein

Kích
thước
(kDa)
0.80
0.84
1.01

1.06
1.20
1.75
2.31
2.73
26.00

Các trình tự mã hóa cho vị trí cắt của protease cũng thường được thêm
vào sau trình tự của các đuôi ái lực để loại bỏ các đuôi ái lực này và thu hồi dạng
protein tái tổ hợp nguyên bản. Các vị trí cắt của một số protease được trình bày
trong Bảng 3. Các vị trí cắt của protease được lựa chọn sao cho không có vị trí
tương tự trong protein tái tổ hợp được quan tâm.
Bảng 3. Các vị trí cắt của một số protease phổ biến
Protease
Factor Xa
Enterokinase
Thrombin
PreScission

Trình tự nhận biết
IEGR/
DDDDK/
VPR/GS
LEVLFQ/GR

8

Tài liệu tham khảo
[42]
[40]

[8]
[9]


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học

1.1.3 Các hệ thống biểu hiện thụ thể kết cặp G-protein
Biểu hiện protein tái tổ hợp đã trở thành công cụ chủ chốt trong nghiên
cứu cơ bản và ứng dụng trong vòng 20 năm trở lại đây. Mặc dù có nhiều hệ
thống biểu hiện đã được phát triển khá tốt cho các protein hòa tan trong tế bào
nhân sơ và nhân thật, thì đến nay biểu hiện hiệu suất cao và chủ động các protein
xuyên màng tế bào vẫn là một thách thức lớn. Khả năng biểu hiện GPCR mức
độ thấp có liên quan chủ yếu tới cấu trúc và hình dạng của các loại protein này.
Các GPCR với 7 vùng xuyên màng được tạo ra ở mức độ thấp do yêu cầu cuộn
gập, vận chuyển và khả năng gây độc tính đối với tế bào.

Hình 2. Quy trình và thời gian yêu cầu để sản xuất GPCR tái tổ hợp trong các hệ
thống biểu hiện khác nhau (nguồn: Nambi, 2003 [43])
Trong phần này, các tính chất cũng như những thành tựu của các hệ thống
biểu hiện bao gồm hệ thống dịch mã phi tế bào, các vector nhân sơ và nhân
chuẩn sử dụng cho việc biểu hiện mạnh các GPCR tái tổ hợp sẽ được trình bày
tóm lược (xem thêm Hình 2). Đa phần trong số chúng đã được sử dụng cho việc

9


Luận văn tốt nghiệp-2012


Phạm Thị Hồng Nhung–K19 Di truyền học

biểu hiện GPCR tuy nhiên các nghiên cứu cũng chỉ ra rằng: không có một hệ
thống nào là toàn năng cho việc biểu hiện mức độ cao tất cả các loại GPCR.
1.1.3.1 Hệ thống dịch mã phi tế bào
Hệ thống dịch mã phi tế bào được xây dựng từ dịch thủy phân E.coli hoặc
dịch thủy phân tế bào mầm lúa mì. Hệ thống chứa các nhân tố tham gia phản
ứng phiên mã và dịch mã đồng thời được cung cấp thêm liên tục các nucleotit,
các axit amin và các hợp chất thiết yếu khác [37].
Hệ thống biểu hiện phi tế bào áp dụng để dịch mã nhanh các sản phẩm
PCR mã cho các protein hòa tan đơn giản với lượng lớn cỡ hàng chục milligram
một cách nhanh chóng (khoảng 4 ngày). Tuy nhiên, hệ thống dịch mã phi tế bào
vẫn tồn tại nhiều hạn chế như chi phí cao, quy trình kỹ thuật phức tạp. Sự biểu
hiện của các protein xuyên màng lớn, đặc biệt là các GPCR chưa từng thành
công bằng sử dụng hệ thống này [26].
1.1.3.2 Biểu hiện ở tế bào nhân sơ
Ưu điểm của biểu hiện trên các tế bào nhân sơ là chi phí rẻ, đơn giản,
nhanh (khoảng 11 ngày) và dễ mở rộng quy mô sản xuất các protein tái tổ hợp.
Tuy nhiên, hệ biểu hiện này có nhược điểm cơ bản là không có cơ chế biến đổi
sau dịch mã nên các protein phức tạp và lớn, như GPCR, thường được biểu hiện
ở dạng không có hoạt tính đầy đủ do không được cuộn gập chính xác hoặc được
biến đổi sau dịch mã như dạng tự nhiên [43].
Tuy vậy, đến nay một số GPCR đơn giản đã được biểu hiện bởi hệ thống
này nhằm nghiên cứu cấu trúc. E.coli, Halobacterium salinarum, Lactococcus
lactis là những chủng vi khuẩn được dùng làm tế bào chủ biểu hiện phổ biến hơn
cả. 11 GPCR gắn đuôi His ở đầu C đã được biểu hiện trên E.coli với hiệu suất
biểu hiện khác nhau từ 0.1 đến 10% tổng số protein tế bào [24]. Thụ thể
muscaricnic M1 và serotonin 5-HT2C đã được tiến hành biểu hiện trên
H.salinarum [53]. L. lactis là một vi khuẩn Gram dương thường được sử dụng
để biểu hiện các protein màng nhằm xác định dạng prokaryote nguyên gốc [28].


10


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học

1.1.3.3 Biểu hiện ở nấm men
Ưu điểm của biểu hiện protein tái tổ hợp ở tế bào nấm men là dễ nuôi
cấy, thu được sinh khối lớn và có hệ thống biến đổi sau dịch mã gần tương đồng
với tế bào động vật. Thụ thể dopamine D1A ở người đã được biểu hiện thành
công ở Saccharomyces cerevisiae và được thu hồi nhờ đuôi His6 [4]. Nấm
Schizosaccharomyces pombe sở hữu hệ thống truyền tín hiệu giống động vật có
vú và có thể glycosyl hóa, thụ thể dopamine D2 ở người đã được biểu hiện trên
màng nấm S. pombe với lượng cao gấp ba lần so với biểu hiện trên S.cerevisiae
[44]. Nấm Pichia pastoris được đánh giá là chủng nấm biểu hiện gen tốt nhất
bởi khả năng biến đổi sau dịch mã bao gồm glycosyl hóa, tạo các liên kết disulfit
và phân cắt protein [7]. Khoảng 100 GPCR trong chương trình nghiên cứu hệ
gen cấu trúc của MePNet đã được biểu hiện thành công với hiệu suất 95% ở các
tế bào P.pastoris.
Mặc dù vậy, thành tế bào nấm dày thường được coi là một trong những
trở ngại cho hiệu suất tinh sạch và thu hồi protein tái tổ hợp. Bên cạnh đó, quy
trình sản xuất GPCR ở nấm men cũng thường tốn nhiều thời gian (khoảng 18
ngày).
1.1.3.4 Biểu hiện ở các tế bào côn trùng
Ưu điểm lớn nhất của biểu hiện ở các tế bào côn trùng là tế bào côn trùng
sở hữu một lượng lớn các quy trình cải biến giống với động vật có vú. Thêm
nữa, các tế bào côn trùng được nuôi cấy trong môi trường bán tổng hợp nên dễ
dàng mở rộng quy mô sản xuất protein mặc dù chi phí cao hơn so với nuôi cấy

nấm men và vi khuẩn.
Hệ thống vector baculovirut lây nhiễm trên tế bào côn trùng được đánh
giá là một trong những hệ thống biểu hiện GPCR hiệu quả nhất [35]. Virut thuộc
nhóm này được sử dụng phổ biến hơn cả là virut Autograha californica nuclear
polyhedrosis (AcMNPV). AcMNPV có thể lây nhiễm các dòng tế bào côn trùng
như Sf9 và Sf21 và nhân lên trong chúng. Nhờ promoter của baculovirut hoạt
động mạnh, các gen ngoại lai được biểu hiện mạnh và có thể được tích lũy với
11


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học

lượng lớn trong giai đoạn muộn của pha đóng gói hạt virut mới (thường kéo dài
khoảng 2 giờ). Thời gian của một quy trình sản xuất protein GPCR tái tổ hợp kể
tử khi bắt đầu phân lập gen đích vào khoảng 21 ngày [23]. Hệ thống vector
baculovirut đến nay đã được sử dụng thành công trong sản xuất nhiều thụ thể
GPCR, như các thụ thể adrenegic, opioid, histamine, serotonine … nhưng chủ
yếu phục vụ cho các nghiên cứu về cấu trúc và chức năng của các thụ thể. Các
protein xuyên màng được biểu hiện bởi hệ thống biểu hiện baculovirut thường
có hiệu suất thu protein vào khoảng 18 đến 71 pmol/mg protein, nghĩa là tăng
hàng nghìn lần so với mức biểu hiện trong tự nhiên [38].
Tuy nhiên, sự khác biệt chính giữa tế bào động vật có vú và côn trùng
luôn tồn tại, ví dụ như quá trình N-glycosyl hóa ở tế bào côn trùng đơn giản hơn
và chứa nhiều manose hơn tế bào động vật có vú [21].
1.1.3.5 Biểu hiện trên tế bào động vật có vú
Vật chủ tối ưu biểu hiện các gen mã cho GPCR của động vật có vú hiển
nhiên chính là các tế bào động vật có vú với đầy đủ các cơ chế biến đổi, vận
chuyển cũng như sự có mặt của G-protein. Các vector virut nhiễm trên tế bào

động vật có vú có thể cải thiện mức độ biểu hiện một cách hiệu quả nhờ có khả
năng di chuyển từ tế bào chủ này sang tế bào chủ khác và có các promoter rất
mạnh, những promoter này được đánh giá là “đỉnh cao” của biểu hiện gen.
Gần như phần lớn các protein màng được sản xuất một lượng lớn trong
môi trường nuôi cấy huyền phù dựa trên hệ thống biểu hiện của Semiliki Forest
virut (SFV). Đây là một loại alpha virut có hệ gen ARN mạch đơn. Hiệu quả
biểu hiện các protein xuyên màng của người bởi hệ thống SFV trong một số
trường hợp tỏ ra hiệu quả hơn so với hệ thống biểu hiện baculovirut, có lẽ nhờ
khả năng biến đổi protein sau dịch mã ở các dòng tế bào động vật có vú, như
CHO, HEK hay U20S. Các vector SFV đến nay đã được ứng dụng biểu hiện cho
hơn 100 GPCR và mức độ biểu hiện trong phần lớn trường hợp là rất cao khi đo
bằng phối tử đánh dấu và Western blot [32]. Tuy vậy, so với hệ thống biểu hiện
của baculovirut, hệ thống biểu hiện của SFV có giá thành cao hơn và vẫn luôn
cần sự quan tâm đáng kể về khía cạnh an toàn sinh học khi thao tác.
12


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học

1.2 HỆ THỐNG VECTOR SFV (SEMLIKI FOREST VIRUT)
1.2.1 Virut Semliki Forest (SFV)
SFV là virut có hệ gen ARN (+) thuộc họ Togaviridae, chi Alpha virut.
Nó được phân lập lần đầu tiên từ muỗi ở Uganda năm 1944 [49]. Đây là một
virut có cấu trúc tương đối đơn giản. Hệ gen SFV dài 11442 nucleotit (không
tính mũ 5’ và đuôi poly A) với 2 khung đọc mở mã cho 2 chuỗi polyprotein
(xem Hình 3). SFV có 4 protein phi cấu trúc (non-structural proteins, viết tắt là
nsPs) từ nsP1 đến nsP4 cấu thành nên enzym ARN replicase, còn lại là các
protein cấu trúc vỏ capsit (protein C) và vỏ ngoài (protein E1, E2, E3). Một

protein nhỏ 6 kD được mã hóa trong vùng gen cấu trúc không được dùng để cấu
thành virut mới. Các protein cấu trúc được mã hóa bởi đoạn ARN được ký hiệu
là 26S, trong khi các protein phi cấu trúc được dịch mã từ ARN 42S của hệ gen.
Cả protein cấu trúc và phi cấu trúc được tạo thành từ sự phân tách 2 chuỗi
polyprotein nhờ cơ chể cắt sau dịch mã [50].

Hình 3. Hệ gen SFV tự nhiên (nguồn: Lundstrom K., 2003 [32])
Trong chi Alpha virut, SFV được coi là hệ thống biểu hiện gen tốt bởi
vòng đời virut ngắn, phổ vật chủ rộng, có khả năng tự nhân hệ gen của bản thân
và chỉ cần bộ máy dịch mã của vật chủ để tái tạo [14].
Trong chu trình nhân lên (tái bản) thông thường, SFV lây nhiễm vào tế
bào chủ và khởi đầu quá trình nhân lên bằng cách dịch mã ở 2/3 đầu 5’ của đoạn
ARN(+). Đoạn polyprotein được dịch mã sẽ phân cắt thành 4 protein phi cấu
trúc hình thành nên enzym ARN replicase. Phức hệ ARN replicase có đích là
trình tự đầu 3’ của ARN (+), chúng tổng hợp lên sợi ARN (-) có chiều dài đầy
đủ từ sợi ARN (+). Protein cấu trúc cần cho lắp ráp virut trưởng thành được mã

13


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học

hóa bởi 1/3 đoạn gen còn lại của hệ gen virut, vùng này được sao chép bằng
enzym SFV replicase và dịch mã cho ra protein vỏ. Protein vỏ capsit nhận tín
hiệu đóng gói nằm ở vùng mã hóa cho nsP2 và cùng với sợi ARN có chiều dài
đầy đủ tạo nên nucleocapsit [13]. Cấu trúc này dung hợp và mọc chồi từ màng tế
bào để tạo thành dạng virut trưởng thành có khả năng lây nhiễm.
SFV không gây bệnh truyền nhiễm ở người, mặc dù có một báo cáo về

một đợt bùng phát sốt nhẹ trong binh lính Pháp ở Cộng hòa Trung Phi được giả
thiết là do SFV [39]. Nhìn chung, SFV được coi là ít nguy hiểm cho nhân viên
phòng thí nghiệm hơn các togavirut khác. Vì những lí do này, SFV được phân
loại là virut an toàn sinh học độ 3 ở Mỹ, nhưng có một số khuyến cáo rằng mọi
hoạt động vẫn nên được tiến hành ở độ 2 (U. S. HHS Publication no. (CDC) 938395, 1993). Ở Liên Minh Châu Âu, SFV được xếp là virut an toàn sinh học độ
2 (E. C. Council Directive 93/88/EEC, 1993). Các vector biểu hiện SFV không
mang các gen cấu trúc được xếp vào an toàn sinh học độ 2 ở cả Mỹ và Châu Âu
[11].
1.2.2 Hệ vector SFV (Semliki Forest virut) cơ bản
Hệ vector SFV cơ bản chúng tôi được tặng bởi GS. Kenneth H.
Lundstrom, Roche AG (Basel, Thụy Sĩ) gồm vector nhân dòng các gen quan tâm
pSFV dài 11489 bp và vector biểu hiện các protein cấu trúc pHelper dài 8650
bp. Hai vector này có bản chất là ADN, cấu trúc cụ thể của chúng được nêu ở
dưới đây.
1.2.2.1 Cấu trúc của pSFV cơ bản
pSFV chứa trình tự mã hóa cho phức hệ replicase gồm 4 protein phi cấu
trúc (kí hiệu từ nsP1đến nsP4) dài 7381 Nu (nsP1: 86-1096 (737 axit amin),
nsP2: 1697-4090 (798 axit amin), nsP3: 4091-5536 (482 axit amin), nsP4: 55377378 (614 axit amin). Theo sau là vùng nhân dòng đa điểm và đoạn gen mã hóa
cho protein cấu trúc đã bị xóa đi phần lớn (∆sP). Vùng nhân dòng đa điểm của
pSFV rất hạn chế nhưng có thể cải tiến thêm các vị trí nhận biết cho các enzym
mới bằng cách thêm những đoạn oligonucleotit thích hợp. Ngoài ra, pSFV được
cải tiến với promoter mạnh CMV, 3 mã kết thúc nằm liên tiếp nhau sau vị trí
nhân dòng đa điểm, đuôi polyadenyl và tín hiệu kết thúc phiên mã của virut
SV40.
14


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học


Hình 4. Cấu trúc vector pSFV cơ bản
1.2.2.2 Cấu trúc của pHelper
Vùng gen mã hóa cho protein phi cấu trúc của vector pHelper bị xóa bỏ
phần lớn, chỉ giữ lại nguyên vẹn vùng gen mã hóa cho các protein cấu trúc (sPs)
tham gia vào việc đóng gói virut. pHelper có các promoter CMV/T7, promoter
subgenomic, đuôi polyadenyl đảm bảo cho quá trình phiên mã các gen cấu trúc
invivo có thể diễn ra.

Hình 5. Cấu trúc vector pHelper

15


Luận văn tốt nghiệp-2012

Phạm Thị Hồng Nhung–K19 Di truyền học

Sự đồng biến nạp các ARN từ vector pSFV và vector helper theo tỉ lệ mol
1:1 vào cùng một dòng tế bào tạo ra sự đóng gói invivo của ARN tái tổ hợp hình
thành nên các hạt virut SFV (Hình 6).

Hình 6. Mô hình hoạt động của hệ vector SFV
Nhìn chung, hệ SFV cơ bản được thiết kế có những ưu điểm sau:
-

2 plasmit riêng biệt của virut đều biến nạp nhanh và đơn giản, thu hoạch
virut trưởng thành sau 1-2 ngày, không yêu cầu tái tổ hợp.

-


Dải vật chủ lây nhiễm rộng, cho phép chọn được các dạng biến đổi sau
dịch mã phù hợp.

16


×