TCNCYH phụ bản 32 (6) - 2004
Giới thiệu kỹ thuật giải trình tự gen
và Real - Time PCR
Lê Văn Phủng*
Trờng Đại học Y Hà Nội
1. Kỹ thuật giải trình tự gen
Giải trình tự gen là tìm ra trình tự sắp xếp của
các nucleotides trên đoạn gen đợc quan tâm
nhằm phát hiện sự đột biến gen hoặc để thiết kế
gen mồi (primer) và các vector tách dòng
(cloning) nhằm tạo ra các protein tái tổ hợp có giá
trị cao trong Y học (vaccine, thuốc chữa bệnh,
các sinh phẩm phục vụ chẩn đoán bệnh hoặc
nghiên cứu khoa học).
Kỹ thuật giải trình tự gen đợc công bố năm
1975 bởi Sanger (nguyên lý enzym) và Maxam -
Gilbert năm 1977 (nguyên lý phân giải hoá học).
Hiện nay, các kỹ thuật này đã đợc cải tiến rất
nhiều nhờ những tiến bộ mới về khoa học và công
nghệ (Hoá học, Vật lý, Điện tử và Công nghệ
thông tin), làm cho hiệu suất của việc giải trình tự
gen ngày một cao; ngời ta có thể giải một trình
tự dài hàng nghìn cặp base chỉ trong vòng vài
tiếng đồng hồ, điều mà trớc đây phải làm hàng
tuần.
Có nhiều kỹ thuật giải trình tự gen, sau đây
xin giới thiệu một kỹ thuật hiện nay đang đợc áp
dụng phổ biến thông qua một ví dụ cụ thể, giải
mã gen FliC.
Gen FliC là gen mã hoá cho kháng nguyên
lông (protein) pha I của vi khuẩn Salmonella. Các
Salmonella có lông thì đều có kháng nguyên này,
nhng tính đặc hiệu thì khác nhau ở mỗi loài. Sự
khác nhau này là do mã hoá khác nhau (trình tự
các nucleotides khác nhau) ở gen FliC quy định.
Chính vì vậy, giải đợc trình tự gen FliC sẽ cho
phép thiết kế đợc các gen mồi đặc hiệu cho từng
loài Salmonella nhằm phát triển các kỹ thuật sinh
học phân tử (chẳng hạn PCR) để chẩn đoán đặc
hiệu cho từng loài hoặc phục vụ cho các nghiên
cứu tìm kiếm vaccine có độ đặc hiệu và công hiệu
cao.
Để giải trình tự đợc gen FliC, bớc đầu tiên
là phải thiết kế cặp mồi đặc hiệu. Cặp mồi này đã
đợc thiết kế tại Labo trung tâm Y Sinh học, đợc
đặt tên là FliC_b_seqF (aag cgg cta ttt cgc cgc c
= 19 nucleotides) và FliC_b_SeqR (cgt gtc ggt
gaa tca atc gc = 20 nucleotides). Các trình tự này
đã đợc gửi đi tổng hợp thành các olignucleotide
tại Công ty Invitrogen (Hồng Kông). Để thiết kế
đợc các cặp mồi này, các thông tin về gen FliC
phải đợc thu thập tr
ớc trên các ngân hàng dữ
liệu gen (GenBank hoặc EMBL chẳng hạn).
Bớc thứ hai là tách chiết ADN từ các chủng
Salmonella, các ADN này sẽ dùng làm khuôn
trong phản ứng PCR ở bớc tiếp theo. Quá trình
tách chiết này không khó, các Labo sinh học
phân tử đều có thờng quy này.
Bớc thứ ba là chạy PCR lần 1 với cặp mồi và
ADN khuôn nói trên. Điều kiện tối u cho phản
ứng PCR này phải dò tìm, nếu máy PCR có
chơng trình Gradient thì việc tìm kiếm các điều
kiện nhiệt độ tối u sẽ thuận lợi hơn nhiều.
Bớc thứ t là tinh sạch sản phẩm của phản
ứng PCR nói trên. Có thể dùng phơng pháp tách
băng ADN đặc hiệu ngay trên thạch điện di (rẻ
tiền) hoặc dùng KIT thơng mại (đắt hơn).
Bớc thứ năm là chạy PCR lần hai. Khác với
PCR lần 1, lần này trong hỗn hợp phản ứng,
ngời ta cho thêm dideoxynucleoside
triphosphate (hai vị trí, trong đó có vị trí 3,
không có nhóm OH - ) có gắn chất màu huúnh
quang. Hiện nay, kỹ thuật đã cho phép gắn các
chất màu huúnh quang khác nhau trên 4 loại
nucleotide này, vì vậy, chỉ cần làm một phản ứng
PCR trong một ống duy nhất chung cho cả 4 loại
nucleotide (A, C, G và T); so với trớc đây phải
làm 4 phản ứng riêng rẽ ở 4 ống.
26
* PGS. TS. Trởng Labo trung tâm, Phó chủ nhiệm Bộ môn Vi sinh vật - Trờng Đại học Y Hà Nội.
TCNCYH phụ bản 32 (6) - 2004
Bớc thứ sáu là làm tinh sạch sản phẩm
(ADN) của phản ứng PCR 2 và làm biến tính
chúng để tạo ra ADN sợi đơn duỗi thẳng.
Bớc thứ bảy là đa ADN đã đợc xử lý vào
máy giải trình tự gen để đọc tự động trình tự các
nucleotide trên FliC. Có thể chỉ đọc một sợi hoặc
đọc đồng thời cả hai sợi để tăng độ chính xác của
các trình tự đợc đọc ra.
Kết quả của quá trình giải trình tự gen FliC
đợc lu trong máy dới hai dạng (hình ảnh và
chữ). Kết quả này đã đợc so sánh với các dữ liệu
cùng loại có trong ngân hàng gen (GenBank,
www. ncbi. nlm. nih. gov) và đã đợc đăng ký và
công bố chính thức với số truy cập là AY657000
và AY657001. Sau đây xin giới thiệu gen FliC
của Salmonella paratyphi B (Hình 1).
Hình 1. Gen FliC - b của Salmonella paratyphi B trên GenBank (http: //www. ncbi. nlm. nih. gov)
27
TCNCYH phụ bản 32 (6) - 2004
Các gen FliC của 5 Salmonella khác nhau đã đợc giải trình tự và so sánh với nhau để tìm ra vùng đặc trng
cho mỗi loài, trong đó FliC - a là gen FliC của Salmonella paratyphi A, FliC - b là của Salmonella paratyphi B,
FliC - c là của Salmonella paratyphi C, FliC - d là của Salmonella typhi và FliC - i là của Salmonella
typhimurium; dấu * là biểu diễn các vị trí giống nhau và dấu . là biểu hiện các vị trí khác nhau.
FliC - a 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60
FliC - b 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60
FliC - c 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60
FliC - d 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60
FliC - i 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60
************************************************************
FliC - a 61: TCCCAGTCCGCTCTGGGCACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGC 120
FliC - b 61: TCCCAGTCCGCTCTGGGCACCGCTATCGAGCGTCTGTCTTCTGGTCTGCGTATCAACAGC 120
FliC - c 61: TCCCAGTCTGCTCTGGGTACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGC 120
FliC - d 61: TCCCAGTCCGCACTGGGCACTGCTATCGAGCGTTTGTCTTCCGGTCTGCGTATCAACAGC 120
FliC - i 61: TCCCAGTCCGCTCTGGGCACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGC 120
********.**.*****.**.************.*******.******************
FliC - a 121: GCGAAAGACGATGCGGCAGGTCAGGCAATTGCTAACCGTTTCACCGCGAACATCAAAGGT 180
FliC - b 121: GCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTTACCGCGAACATCAAAGGT 180
FliC - c 121: GCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTCACCGCGAACATCAAAGGT 180
FliC - d 121: GCGAAAGACGATGCGGCAGGACAGGCGATTGCTAACCGTTTTACCGCGAACATCAAAGGT 180
FliC - i 121: GCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTTACCGCGAACATCAAAGGT 180
********************.*****.**************.******************
FliC - a 181: CTGACTCAGGCTTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGC 240
FliC - b 181: CTGACTCAGGCTTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGC 240
FliC - c 181: CTGACTCAGGCTTCCCGTAACGCTAACGACGGTATTTCTATTGCGCAGACCACTGAAGGC 240
FliC - d 181: CTGACTCAGGCTTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGC 240
FliC - i 181: CTGACTCAGGCTTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGC 240
***********************************.**.*********************
FliC - a 241: GCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCT 300
FliC - b 241: GCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCT 300
FliC - c 241: GCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCT 300
FliC - d 241: GCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCG 300
FliC - i 241: GCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCT 300
***********************************************************.
FliC - a 301: AACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTG 360
FliC - b 301: AACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTG 360
FliC - c 301: AACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGTCTG 360
FliC - d 301: AATGGTACTAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTG 360
FliC - i 301: AACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTG 360
** *.**.***********************************************.***
28
TCNCYH phô b¶n 32 (6) - 2004
FliC - a 361: AACGAAATCGACCGTGTATCCGGTCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420
FliC - b 361: AACGAAATCGACCGTGTATCCGGCCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420
FliC - c 361: AACGAAATCGACCGTGTATCCGGTCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420
FliC - d 361: AACGAAATCGACCGTGTATCCGGCCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420
FliC - i 361: AACGAAATCGACCGTGTATCCGGCCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420
***********************.************************************
FliC - a 421: GACAACACCCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACCATTGATATCGATCTG 480
FliC - b 421: GACAACACCCTGACCATCCAGGTTGGCGCGAACGACGGTGAAACTATCGATATCGATCTG 480
FliC - c 421: GACAACACTCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACTATCGATATCGATCTG 480
FliC - d 421: GACAACACCCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACTATCGATATTGATTTA 480
FliC - i 421: GACAACACCCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACTATCGATATCGATCTG 480
********.*****************.**.**************.**.*****.***.*.
FliC - a 481: AAACAGATCAACTCTCAGACCCTGGGTCTGGATACGCTGAATGTGCAGAAAAAATATGAT 540
FliC - b 481: AAGCAGATCAACTCTCAGACCCTGGGTCTGGATACTTTAAGTGTACAGGATGCCTATACG 540
FliC - c 481: AAGCAGATCAACTCTCAGACCCTGGGCCTAGATACGCTGAATGTGCAGAAAAAATATGAT 540
FliC - d 481: AAAGAAATCAGCTCTAAAACACTGGGACTTGATAAGCTTAATGTCCAAGATGCCTACACC 540
FliC - i 481: AAGCAGATCAACTCTCAGACCCTGGGTCTGGATACGCTGAATGTGCAACAAAAATATAAG 540
** *.****.****.*.**.*****.**.**** *.*.***.**. * **
FliC - a 541: GTGAAGAGCGAAGCGGTCACGCCTTC - GGCTA - - CATTAAGCACTACTGCACTTGATGGT 597
FliC - b 541: CCAAAAGGTACCGCTGTTACCAGAGA - TGTTA - - CCACCTATAAAAATGGTGGTACTACT 597
FliC - c 541: GTGAGCGATACTGCTGTAGCTGCTTC - - - CTATTCCGACTCGAAACAGAATATTGCTGTT 597
FliC - d 541: CCGAAAGAAACTGCTGTAACCGTTGA - TAAAA - - CTACCTATAAAAATGGTACAGATCCT 597
FliC - i 541: GTCAGCGATACGGCTGCAACTGTTACAGGATATGCCGATACTACGATTGCTTTAGACAAT 600
* **.* * * * * *
FliC - a 598: GCTGGCCTCAAAACCGGAACCGGTTCTACAACTGATACTGGTTCAATTAAGGATGGTAAG 657
FliC - b 598: CTTACAGCACCTAACGCAGCAGCAATTGATACCGCTTTAGGTACGACTGGTGCGGCGGGT 657
FliC - c 598: CCTGA - - - TAAAACAGCTATTACTGCAAAAATTGGTGCAGCAACCAGTGGTGGTGCTGGT 654
FliC - d 598: ATTACAGCCCAGAGCAATACTGATATCCAAACTGCAATTGGCGGTGGTGCAACGGGGGTT 657
FliC - i 601: AGTACTTTTAAAGCCTCGGCTACTGGTCTTGGTGGTACTGACCAGAAAATTGATGGCGAT 660
* * * *
FliC - a 658: GTTTACTATAACAGCACCTCTAAA - - - - - - AATTATTATGTTGAAGTAGAATTTACCGAT 711
FliC - b 658: ACTGCGGCTG - - - TGAAATTTAAAGACGGTAACTACTTCGTTGAGGTGACCGGTACAACT 714
FliC - c 655: ATAAAAGCAGATATTAGCTTTAAAGATGGCAAGTATTACGCGACTGTCAGTGGATACGAT 714
FliC - d 658: ACTGGGGCTGATATCAAATTTAAAGATGGTCAATACTATTTAGATGTTAAAGGCGGTGCT 717
FliC - i 661: TTAAAATTTGATGATACGACTGGA - - - - - - AAATATTACGCCAAAGTTACCGTTACGGGG 714
* * * * **.* **
29
TCNCYH phô b¶n 32 (6) - 2004
FliC - a 712: GCGACCGATC - - - AAACCAACGAAGGCGGATTCTATAAAGTTAATGTTGCTGATGATGGT 768
FliC - b 715: AAAGATGGTCTGTATGAAGCGACAGTTGATGCAGCTG - - - - GCGCGGTGACAATGA - - CC 768
FliC - c 715: GATGCCGCAG - - - ATACAGATAAAAATGGAACCTATGAAGTCACTGTTGCCGCAGA - - - T 768
FliC - d 718: TCTGCTGGTGTTTATAAAGCCACTTATGATGAAACTACAAAGAAAGTTAATATTGATACG 777
FliC - i 715: GGAACTGGTA - - - AAGATGGCTATTATGAAGTTTCCGTTGATAAGACGAACGGTGA - GGT 770
* * * ** .
FliC - a 769: GCAGTCACAATGAC - - T - GCGGCTACCAC - CAAAGAGGCT - ACAAC - TCCTACAGGTATT 822
FliC - b 769: GCAAATAAAGCAACAGT - - - AACTGGGGCTAGT - - - - - - - - - - - - - - - - - - - - - ACAGTT 804
FliC - c 769: ACAGGAGCAGTTACTTTTGCGACTACACC - AACAGTGGTTGACTTA - - CCAACTGATGCA 825
FliC - d 778: ACTGATAAAACTCCGTTGGCAACTGCGGAAGCTACAGCTATTCGGGGAACGGCCACTATA 837
FliC - i 771: G - ACTCTTGCTGGCGGT - GCGACTTCCCCGCTTACAGGTGGACTACCTGCGACAGCAACT 828
* * **
FliC - a 823: ACTGAAGTTACTCAAGTCCAAA - - - AACCTGTGGCTGCTC - - - CAGCTGCTAT - - - - CCA 872
FliC - b 805: ACTGAAAACCAAATTGTAGACGCTGTTACACCGACGCCAGTTGATACAGTCGCAGCAGCT 864
FliC - c 826: AAAGCAGTTTCAAAAGTTCAAC - - - AGAATGATACTGAAATAGCAGCAACAAATGCGAAA 882
FliC - d 838: ACCCACAACCAAATTGCTGAAG - - - TAACAAAAGAGGGTGTTGATACGACCACAGTTGCG 894
FliC - i 829: GAGGATGTGAAAAATGTACAAG - - - TTGCAAATGCTGATTTGACAGAGGCTAA - - - - - - A 879
* *
FliC - a 873: GGCTCAGTTGACTGCTGCCCATGTGACCGGCGCTGATACTG - - - - - - CTGAAATGGTTAA 926
FliC - b 865: ACTGCA - TTGACCAATGCAGGTGTGACAGGTGC - GACAGGTA - - ATACCAGCTTGGTTAA 920
FliC - c 883: GCTGCA - TTAAAAGCTGCAGGAGTTGCAGATGCAGAAGCTGATACAGCTACTTTAGTGAA 941
FliC - d 895: GCTCAA - CTTGCTGCAGCAGGGGTTACTGGCGCCGATAAGGACAATACTAGCCTTGTAAA 953
FliC - i 880: GCCGCA - TTGACAGCAGCAGGTGTTACCGGCACAGCATCTG - - - - - - TTG - - - - - - TTAA 926
*.* ** ** * * * * *.**
FliC - a 927: GATGTCTTATACGGATAAAAACGGTAAGACTATTGATGGCGGTTTCGGTGTTAAAGTTGG 986
FliC - b 921: AATGTCATTTGAAGATAAAAATGGCAAAGTTACTGATGCGGGTTACGCGCTTAAAGTTGG 980
FliC - c 942: AATGTCTTATACAGATAATAATGGCAAAGTTATTGATGGTGGGTTCGCATTTAAGACCTC 1001
FliC - d 954: ACTATCGTTTGAGGATAAAAACGGTAAGGTTATTGATGGTGGCTATGCAGTGAAAATGGG 1013
FliC - i 927: GATGTCTTATACTGATAATAACGGTAAAACTATTGATGGTGGTTTAGCAGTTAAGGTAGG 986
*.**.*.* *****.**.**.** **.***** **.* * *.**
FliC - a 987: GGCTGATATTTATGCTGCAACAAAAAAT - - - AAAGATGGATCGTTCAGCATTAACACCAC 1043
FliC - b 981: AAATGATTATTATGCCGCTGATTACGATGAAAAAACTGGTGAGATAAAAGCTAAAACTGT 1040
FliC - c 1002: CGGTGGTTATTATGCAGCATCTGTTGAT - - - AAATCTGGCGCAGCTAGCTTGAAAGTTAC 1058
FliC - d 1014: CGACGATTTCTATGCCGCTACATATGATGAGAAAACAGGTGCAATTACTGCTAAAACCAC 1073
FliC - i 987: CGATGATTACTATTCTGCAACTCAAAAT - - - AAAGATGGTTCCATAAGTATTAATACTAC 1043
*.* ***.* ** ** *** ** * **
30
TCNCYH phô b¶n 32 (6) - 2004
FliC - a 1044: TGAATATACCGATA - - AAGAC - GGCAACACTAAAACTGCACTAAACCAACTGGGTGGCGC 1100
FliC - b 1041: AAATTATACTGACG - - - CTACTGGTGCGACAAAAACCGGTGCTGTGAAATTTGGCGGTGC 1097
FliC - c 1059: TAGCTACGTTGACGCTACCACTGGTACCGAAAAAACTGCTGCGAATAAATTAGGTGGCGC 1118
FliC - d 1074: TACTTATACAGATG - - - GTACTGGCGTTGCTCAAACTGGAGCTGTGAAATTTGGTGGCGC 1130
FliC - i 1044: GAAATACACTGCAG - - ATGAC - GGTACATCCAAAACTGCACTAAACAAACTGGGTGGCGC 1100
** * **.** ****.* **.* **.**.**
FliC - a 1101: AGACGGTAAAACTGAAGTTGTTTCTA - - - TCGACGGTAAAACCTACAATGCCAGCAAAGC 1157
FliC - b 1098: GAATGGTAAAACTGAAGTTGTGACCACCGTTGATGGTAATACTTATCAGGCTAGTGATGT 1157
FliC - c 1119: AGACGGTAAAACCGAAGTTGTTACTA - - - TCGACGGTAAAACCTACAATGCCAGCAAAGC 1175
FliC - d 1131: AAATGGTAAATCTGAAGTTGTTACTGCTACCGATGGTAAGACTTACTTAGCAAGCGACCT 1190
FliC - i 1101: AGACGGCAAAACCGAAGTTGTTTCTA - - - TTGGTGGTAAAACTTACGCTGCAAGTAAAGC 1157
*.**.***.*.******** * * *****.**.** ** ** *
FliC - a 1158: CGCTGGTCACAACTTTAAAGCACAGCCAGAGCTGGCTGAAGCGGCTGCTGCAACCACCGA 1217
FliC - b 1158: AAAAGGGCATAATTTCCAGAGTGGTGGCGCTTTAAGCGAGGCTGTAACCACTAAAACTGA 1217
FliC - c 1176: CGCTGGGCACAACTTCAAAGCACAGCCAGAGCTGGCGGAAGCGGCTGCTACAACCACTGA 1235
FliC - d 1191: TGACAAACATAACTTCAGAACAGGCGGTGAGCTTAAAGAGGTTAATACAGATAAGACTGA 1250
FliC - i 1158: CGAAGGTCACAACTTTAAAGCACAGCCTGATCTGGCGGAAGCGGCTGCTACAACCACCGA 1217
**.**.** * * **.* * * **.**
FliC - a 1218: AAACCCGCTGGCTAAAATTGATGCCGCGCTGGCGCAGGTTGATGCGCTGCGTTCTGACTT 1277
FliC - b 1218: AAACCCGCTGGCTAAAATTGATGCCGCGCTGGCGCAAGTTGATGCGCTGCGTTCTGACTT 1277
FliC - c 1236: AAACCCGCTGCAGAAAATTGATGCTGCTTTGGCGCAGGTGGATGCGCTGCGTTCTGACCT 1295
FliC - d 1251: AAACCCACTGCAGAAAATTGATGCTGCCTTGGCACAGGTTGATACACTTCGTTCTGACCT 1310
FliC - i 1218: AAACCCGCTGCAGAAAATTGATGCTGCTTTGGCACAGGTTGACACGTTACGTTCTGACCT 1277
******.*** ***********.**.****.**.**.** * *.*********.*
FliC - a 1278: GGGTGCGGTTCAGAACCGTTTCAACTCCGCTATCACCAACCTGGGCAATACCGTAAATAA 1337
FliC - b 1278: GGGTGCGGTTCAGAACCGTTTCAACTCCGCTATCACCAACCTGGGCAATACCGTAAACAA 1337
FliC - c 1296: GGGTGCGGTTCAGAACCGTTTCAACTCCGCTATCACCAACCTGGGCAATACCGTAAATAA 1355
FliC - d 1311: GGGTGCGGTTCAGAACCGTTTCAACTCCGCTATCACCAACCTGGGCAATACCGTAAATAA 1370
FliC - i 1278: GGGTGCGGTACAGAACCGTTTCAACTCCGCTATTACCAACCTGGGCAACACCGTAAACAA 1337
*********.***********************.**************.********.**
FliC - a 1338: CCTGTCTTCTGCCCGTAGCCGTATCGAAGATTCCGACTACGCGACCGAAGTTTCCAACAT 1397
FliC - b 1338: CCTGTCTGAAGCCCGTAGCCGTATCGAAGATTCCGACTACGCGACCGAAGTCTCCAACAT 1397
FliC - c 1356: CCTGTCTTCTGCCCGTAGCCGTATCGAAGATTCCGACTACGCGACCGAAGTTTCCAACAT 1415
FliC - d 1371: CCTGTCTTCTGCCCGTAGCCGTATCGAAGATTCCGACTACGCAACCGAAGTCTCCAACAT 1430
FliC - i 1338: CCTGACTTCTGCCCGTAGCCGTATCGAAGATTCCGACTACGCGACCGAAGTTTCCAACAT 1397
****.** ********************************.********.********
31
TCNCYH phụ bản 32 (6) - 2004
FliC - a 1398: GTCTCGCGCGCAGATCCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGGT 1457
FliC - b 1398: GTCCCGCGCGCAGATTCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGGT 1457
FliC - c 1416: GTCTCGCGCGCAGATTCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGG - 1474
FliC - d 1431: GTCTCGCGCGCAGATTCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGGT 1490
FliC - i 1398: GTCTCGCGCGCAGATTCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGGT 1457
***.***********.*******************************************.
FliC - a 1458: TCCGCAAAACGTCCTCTCTTTACTGCGTTAA 1488
FliC - b 1458: TCCGCAAAACGTCCTCTCTTTACTGCGTTAA 1488
FliC - c 1474: - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 1474
FliC - d 1491: TCCGCAAAACGTCCTCTCTTTACTGCGTTAA 1521
FliC - i 1458: TCCGCAAAACGTCCTCTCTTTACTGCGTTAA 1488
2. Kỹ thuật Real - Time PCR
Trong nhiều trờng hợp, ngời ta cần biết số lợng acid nucleic trong mẫu nghiên cứu để phục vụ cho
điều trị hoặc tìm hiểu cơ chế của một quá trình nào đó. Ví dụ nh, để áp dụng phơng pháp điều trị viêm
gan B thích hợp, ngời ta cần biết số lợng các hạt virus (copy numbers) trong 1 ml máu bệnh nhân. Các
nhu cầu loại này đợc giải quyết nhờ kỹ thuật Real - Time PCR hay còn gọi là là kỹ thuật PCR định
lợng.
Real - Time PCR đợc thực hiện dựa trên khái niệm giá trị C
t
(C
t
value). Ct là số chu kỳ nhỏ nhất
trong phản ứng PCR mà ở đó có sự nhân lên của ADN khuôn (Hình 2).
Hình 2: Sơ đồ biểu diễn giá trị Ct
(ở đây, Ct = 17,5)
32
TCNCYH phụ bản 32 (6) - 2004
Để có thể định lợng đợc, phải lập đờng chuẩn với các giá trị đã biết của các nồng độ ADN khác
nhau (Hình 3):
5
4
2
3
1
Hình 3. Đờng chuẩn với 5 nồng độ ADN khác nhau
Căn cứ vào giá trị Ct, ngời ta sẽ tính đợc số lợng ADN mẫu (copy numbers) đã đa vào phản ứng.
Bảng 1 là một ví dụ kết quả Real - Time PCR của một số mẫu trong số 110 mẫu huyết thanh bệnh nhân
đã đợc xét nghiệm chẩn đoán HBV, trong đó 75% số mẫu dơng tính với số lợng copies virus HBV
khác nhau. Giá trị Ct càng bé thì số copies number càng lớn và ngợc lại:
Bảng 1: Kết quả xét nghiệm HBV (*, E = exponent value; ví dụ E+11 = 10
11
)
Ký hiệu mẫu Giá trị Ct Copies/ml
83 2,0 7,8E+11*
35 8,2 3,7E+11
13 16,1 7,5E+09
10 17,9 2,8E+09
14 17,4 2,4E+09
6 18,4 7,6E+08
41 20,4 2,7E+08
66 Không xác định 0
68 Không xác định 0
110 Không xác định 0
33
TCNCYH phô b¶n 32 (6) - 2004
Summary
Introduction of sequencing and Real - Time PCR techniques
DNA sequencing was first introduced in 1975 by Sanger. The sequencing technique was started with the
related information on the interested gene in internet. The following steps consisted of:
- Design specific primers
- Extract and purify DNA templates
- Conduct first PCR (PCR - 1) with the specific primers and template
- Purify the DNA product from PCR - 1
- Conduct second PCR (PCR - 2) with the addition of dideoxynucleosides triphosphate and only one
primer (not pair of the primers)
- Purify the PCR - 2 product and denature the DNA to get single - stranded DNA
- Read sequences with ABI 3100 avant sequencer
- Processing the collected data and publish
Real - Time PCR was a quantitative PCR. The principle of the PCR was based on the threshold value (Ct).
The Ct value was minimum number of the cycles of a PCR at which the double - stranded DNA was first
synthetized. Thus, the smaller Ct value we got, the greater DNA template present at the beginning of the
reaction and vise versa.
The basic differentiation in Real - Time PCR compared to the normal one was known standards (the DNA
template with the defined concentration). The standards were run paralell with the samples. The results of
Real - Time PCR will then show exactly the copy numbers of templates in the original samples.
34