Tải bản đầy đủ (.pdf) (30 trang)

Đánh giá bộ kit ForenSeq trên hệ thống MiSeq FGx ứng dụng trong định danh cá thể người Việt Nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (717.17 KB, 30 trang )

Header Page 1 of 126.

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
----------------

Nguyễn Thị Hồng Nhung

ĐÁNH GIÁ BỘ KIT FORENSEQ TRÊN HỆ THỐNG
MiSeq FGx ỨNG DỤNG TRONG ĐỊNH DANH CÁ THỂ
NGƢỜI VIỆT NAM

dẫNLUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội - 2016

Footer Page 1 of 126.


Header Page 2 of 126.

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
----------------

Nguyễn Thị Hồng Nhung

ĐÁNH GIÁ BỘ KIT FORENSEQ TRÊN HỆ THỐNG
MiSeq FGx ỨNG DỤNG TRONG ĐỊNH DANH CÁ THỂ
NGƢỜI VIỆT NAM


Chuyên ngành : Di truyền học
Mã số: 60420121

dẫNLUẬN VĂN THẠC SĨ KHOA HỌC

Cán bộ hƣớng dẫn: TS. Nguyễn Văn Sáng
dẫn:
TS. Võhị Thươn Lan

Hà Nội - 2016

Footer Page 2 of 126.


Header Page 3 of 126.

Lời cảm ơn

Để thực hiện thành công khóa luận tốt nghiệp này, em xin gửi lời cảm ơn sâu
sắc đến Đại tá Hà Quốc Khanh nguyên Viện phó Viện Khoa học Hình sự cùng với
thầy Nguyễn Văn Sáng, người đã hướng dẫn, chỉ bảo tận tình trong suốt thời gian
em thực hiện đề tài.
Em xin gửi lời cảm ơn đến Thạc sĩ – Trung tá Trịnh Tuấn Toàn và Thạc sĩ
Nguyễn Quang Vinh, và các cán bộ giám định viên tại Phòng giám định Sinh học
Pháp lý, các nhân viên tại công ty Cổ phần và dịch vụ phân tích di truyền GENTIS,
các nhân viên tại công ty Cổ phẩn Khoa học Vật tư BIOMEDIC đã cung cấp các
mẫu hiện trường, mẫu trong quần thể người Việt và những thông tin cần thiết tạo
điều kiện thuận lợi cho em thực hiện tốt đề tài.
Trong thời gian hoàn thành khóa luận, em đã nhận được sự quan tâm, giúp
đỡ và động viên của Đại tá Hà Quốc Khanh và các anh chị cùng các bạn trong

Phòng Kỹ thuật Ứng dụng, thuộc công ty BIOMEDIC. Em xin chân thành cảm ơn!
Cuối cùng em xin gửi lòng biết ơn tới gia đình, bạn bè thân thiết đã động
viên, bên cạnh em trong thời gian em thực hiện khóa luận này.

Hà Nội, ngày 20 tháng 12 năm 2016
Sinh viên

Nguyễn Thị Hồng Nhung

Footer Page 3 of 126.


Header Page 4 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

KÝ HIỆU VÀ CHỮ CÁI VIẾT TẮT
bp

:

base pair

Cluster

:

Cụm khuếch đại của ADN khuôn được gắn trên bề mặt flowcell.

Mỗi cụm được khuếch đại từ một sợi ADN khuôn ban đầu cho
đến khi có khoảng 1000 bản sao. Mỗi cluster sẽ tạo ra một trình
tự đọc duy nhất.

CODIS

:

Combined DNA Index System

cs.

:

cộng sự

DNA

:

Deoxyribonucleic acid

H2O

:

Nước

kb


:

kilobase = 1000 bp

Index

:

Là trình tự ADN tag được gắn vào các trình tự đích, cho phép
kết hợp nhiều mẫu trong một bể thư viện và phân tách dữ liệu
sau khi đã hoàn thành lần chạy

NGS

:

Next – Generation Sequencing

PCR

:

Polymerase Chain Reaction

STR

:

Short Tandem Repeats


SNP

:

Single Nucleotide Polymorphism

SBS

:

Sequencing by Synthesis

stutter

:

Hiện tượng polymerase bị trượt có thể xuất hiện trong quá trình
khuếch đại các trình tự lặp lại, quy trình chuẩn bị thư viện, tạo
cluster. Có thể tạo ra các đoạn ADN đích có kích thước bé đi
hoặc là lớn hơn kích thước trình tự đích

RFLP

Footer Page 4 of 126.

:

Restriction Fragment Length Polymorphism



Header Page 5 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH
DANH MỤC CÁC BẢNG
Trang

Bảng 1.1:

Các bộ kit STRs thương mại phổ biến trên thị trường

6

Bảng 1.2:

So sánh chỉ thị STRs và SNPs

8

Bảng 3.1:

Số alen quan sát được trên STR và SNP trong dải pha loãng của
đối chứng dương 2800M

28

Bảng 3.2:

Kết quả thí nghiệm trên bộ kit Identifiler Plus


29

Bảng 3.3:

Kết quả thí nghiệm trên bộ kit ForenSeq

30

Bảng 3.4:

Nồng độ mẫu đo bằng phương pháp qPCR

32

Bảng 3.5:

Độ độ bao phủ của từng alen trong từng locus khác nhau

38

Bảng 3.6:

Bảng khảo sát tần số SNPs trong quần thể người Việt Nam

38

Bảng 3.7:

Tần suất xuất hiện các alen trên 5 locus mới của hệ ForenSeq


40

Bảng 3.8:

Số lượng kiểu gen quan sát được ở locus D4S2408

41

Bảng 3.9:

Số lượng kiểu gen quan sát được ở locus D6S1043

42

Bảng 3.10:

Số lượng kiểu gen quan sát được ở locus D9S1122

43

Bảng 3.11:

Số lượng kiểu gen quan sát được ở locus D17S1301

44

Bảng 3.12:

Số lượng kiểu gen quan sát được ở locus D20S482


44

Footer Page 5 of 126.


Header Page 6 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH
DANH MỤC CÁC HÌNH
Trang

Hình 1.1:

Hệ thống CODIS 13 STR loci và vị trí trên nhiễm sắc thể

6

Hình 1.2:

Hình ảnh máy điện di mao quản 3130xl với 16 mao quản

11

Hình 1.3:

Quy trình giải trình tự thế hệ mới của Illumina


16

Hình 1.4:

Bộ kit chuẩn bị thư viện ForenSeqTM DNA Signature Prep

17

Hình 2.1:

Khái quát về bộ kit ForenSeqTM DNA Signature Prep

23

Hình 3.1:

Số lượng của các đoạn đọc trong đại diện mẫu từ dải pha loãng
của 2800M

28

Hình 3.2:

Phân biệt hiện tượng isometric alen

31

Hình 3.3:

Kết quả mẫu chất lượng kém bằng hai phương pháp


33

Hình 3.4:

Hồ sơ ADN của hai mẫu cho nhận ngẫu nhiên 15/16 locus

34

Hình 3.5:

Hồ sơ ADN của hai mẫu A và B khi thực hiện bằng bộ ForenSeq

35

Hình 3.6:

Hiện tượng isometric alen ở alen 29 locus D21S11 của hai mẫu A
và B

36

Hình 3.7:

Phân biệt alen cùng kích thước nhưng khác trình tự trong mẫu lẫn

37

Footer Page 6 of 126.



Header Page 7 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH
MỤC LỤC

Mở đầu ......................................................................................................................... 1
Chƣơng 1: TỔNG QUAN TÀI LIỆU ........................................................................ 3
1.1 Lịch sử nghiên cứu chỉ thị ADN ứng dụng trong khoa học hình sự ................ 3
1.2 Chỉ thị ADN sử dụng trong khoa học hình sự ................................................... 4
1.2.1

STR – Short Tandem Repeats ................................................................... 4

1.2.2

SNP – Single Nucleotide Polymorphism ................................................... 7

1.3 Các phƣơng pháp phân tích sử dụng chỉ thị ADN ............................................ 9
1.3.1

Đa hình chiều dài các đoạn cắt giới hạn (RFLP – Retriction Fragment

Length Polymorphism) ........................................................................................... 9
1.3.2

Phương pháp PCR các chỉ thị STRs ......................................................... 10


1.3.3

Điện di và phát hiện STRs ......................................................................... 10

1.3.4

Giải trình tự thế hệ mới – Next Generation Sequencing (NGS) ................ 11

1.4 Hệ thống giải trình tự thế hệ mới của ILLUMINA – MiSeq FGx .................... 14
1.4.1

Công nghệ giải trình tự của Illumina ........................................................ 14

1.4.2

Giải pháp NGS cho linh vực hình sự của Illumina ................................... 16

1.4.3

Tình hình thực tế ở Việt Nam ................................................................... 17

Chƣơng 2: NGUYÊN LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU ...................... 19
2.1 Nguyên liệu, hóa chất và thiết bị ......................................................................... 19
2.1.1

Đối tượng nghiên cứu ................................................................................ 19

2.1.2

Hóa chất .................................................................................................... 19


2.1.3

Dụng cụ thí nghiệm .................................................................................. 19

2.2 Phƣơng pháp nghiên cứu...................................................................................... 19

Footer Page 7 of 126.


Header Page 8 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

2.2.1

Tách chiết mẫu ADN bằng chelex ............................................................ 20

2.2.2

Tách chiết mẫu ADN bằng giấy FTA ........................................................ 20

2.2.3

Tinh sạch mẫu ADN................................................................................... 21

2.2.4


Định lượng nồng độ ADN sau khi tách chiết ............................................ 21

2.2.5

Chuẩn bị thư viện mẫu ADN cho giải trình tự thế hệ mới ........................ 22

2.2.6

Phương pháp giải trình tự thế hệ mới MiSeq FGx .................................... 24

2.2.7

Xử lý thống kê số liệu và tính tần suất của các locus gen ......................... 24

2.3 Sơ đồ nghiên cứu ................................................................................................... 26
Chƣơng 3: KẾT QUẢ VÀ THẢO LUẬN ................................................................. 27
3.1 Thông tin các lần chạy máy MiSeq FGx ............................................................. 27
3.2 Đánh giá độ nhạy .................................................................................................. 27
3.3 Đánh giá độ tƣơng đồng ....................................................................................... 29
3.4 Đánh giá độ phân giải .......................................................................................... 31
3.5 Trƣờng hợp các mẫu có chất lƣợng kém ............................................................ 32
3.6 Trƣờng hợp các mẫu cho nhận ngẫu nhiên trong quần thể ............................. 33
3.7 Trƣờng hợp mẫu lẫn ............................................................................................. 36
3.8 Khảo sát tần suất iSNPs trong quần thể ngƣời Việt Nam (Kinh) .................... 38
3.9 Khảo sát tần suất 5 locus STR mới trong bộ ForenSeq trong quần thể
ngƣời Việt Nam (Kinh)......................................................................................... 40
3.9.1

Locus D4S2408 ................................................................................................ 41


3.9.2

Locus D6S1043 ................................................................................................ 42

3.9.3

Locus D9S1122 ................................................................................................ 43

3.9.4

Locus D17S1301 .............................................................................................. 44

Footer Page 8 of 126.


Header Page 9 of 126.

Luận văn cao học - 2016
3.9.5

Nguyễn Thị Hồng Nhung – K23CH

Locus D20S482 ................................................................................................ 44

KẾT LUẬN VÀ KIẾN NGHỊ .................................................................................... 45
Tài liệu tham khảo ...................................................................................................... 48

Footer Page 9 of 126.



Header Page 10 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

Mở đầu
Từ khi Ray White lần đầu tiên mô tả chỉ thị ADN (DNA marker) dựa trên
phương pháp đa hình chiều dài đoạn cắt giới hạn (Restriction Fragment Length
Polymorphisms – RFLP) vào năm 1980 thì một loạt các chỉ thị ADN đã được
nghiên cứu và ứng dụng trong di truyền học động vật nói chung và di truyền người
nói riêng. Đến năm 1984, Alec J. Jeffreys đã nghiên cứu và phát hiện ra chỉ thị
minisatellite khi ông nhận thấy tính đa hình của các đoạn gen mã hóa cho
myoglobin ở người. Ông phát hiện ra rằng ở những cá thể khác nhau thì số lượng
những đoạn lặp khác nhau hay còn được gọi là số lượng đa hình của những đoạn lặp
(Variable Number of Tandem Repeat – VNTR). Từ đó, ông và những cộng sự trong
phòng thí nghiệm đã liệt kê những ứng dụng của chỉ thị minisatellite. Và một trong
những ứng dụng quan trọng của chị thị này được Jeffreys nghiên cứu là sử dụng
trong giám định ADN hình sự (DNA Forensic) để phân biệt giữa người này và
người khác.
Trong khoảng hơn 15 năm phát triển, những ứng dụng của các chỉ thị phân
tử trong lĩnh vực hình sự đã có những tiến bộ vượt bậc và đạt được nhiều thành tựu
mới. Các quy trình được xây dựng, hoàn thiện và được phổ biến sử dụng trong phân
tích các mẫu sinh học hình sự. Theo ông Bruce Budowle – Cục điều tra Liên bang
Mỹ, không có bất cứ lĩnh vực nào được hưởng lợi ích nhiều từ những công cụ sinh
học phân tử hơn là trong khoa học hình sự. Với công nghệ ADN, các nhà khoa học
có thể loại bỏ những đối tượng tình nghi sai với mẫu thu nhận được, từ đó khoanh
vùng, định hướng điều tra. Những chứng cứ phạm tội là những bằng chứng mạnh
mẽ để kết luận tội phạm.
Công nghệ giải trình tự bằng phương pháp điện di mao quản là tiêu chuẩn

vàng để thực hiện các phân tích ADN hình sự. Tuy nhiên, công nghệ này còn bị giới
hạn với những khó khăn đặc thù về những mẫu án hình sự như là hàm lượng mẫu ít,
độ đứt gãy cao, nhiều tạp chất, thậm chí là lẫn từ nhiều nguồn khác nhau,… Hệ
thống giải trình tự thế hệ mới (Next Generation Sequencing – NGS) của Illumina –

1
Footer Page 10 of 126.


Header Page 11 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

hệ thống MiSeq FGx mới được đưa ra thị trường vào đầu năm 2015 đang được
nhiều phòng thí nghiệm cũng như nhiều đơn vị có uy tín trong lĩnh vực hình sự
đánh giá là phương pháp của tương lai cũng như là giải pháp hoàn thiện nhất, đồng
bộ nhất cho những phân tích trong hình sự.
Trung tâm Sinh học Pháp lý, Viện Khoa học Hình sự là đơn vị đầu tiên mua
và cũng là một trong những đơn vị đầu tiên ứng dụng hệ thống giải trình tự thế hệ
mới – MiSeq® FGx trên thế giới. Vì vậy, chúng tôi thực hiện đề tài: “Đánh giá bộ
kit ForenSeq trên hệ thống MiSeq FGx ứng dụng trong định danh cá thể ngƣời
Việt Nam”. Trước đây, chưa có một nghiên cứu nào đánh giá khả năng ứng dụng
hệ thống MiSeq® FGx trong phân tích ADN hình sự với đối tượng là người Việt
Nam, do vậy đề tài của chúng tôi thực hiện là một trong những đề tài đầu tiên đánh
giá thử nghiệm bộ kit cũng như hệ thống giải trình tự thế hệ mới trên mẫu người
Việt Nam. Mục tiêu của đề tài nghiên cứu này gồm có hai mục tiêu chính: Đầu tiên,
so sánh và đánh giá bộ kit ForenSeqTM DNA Signature Prep trên hệ thống giải trình
tự thế hệ mới MiSeq® FGx với bộ AmpFℓSTR® Identifiler® Plus PCR

Amplification Kit trên hệ thống điện di mao quản. Thứ hai là khảo sát và xây dựng
tần số của 5 locus STR là D4S2408, D6S1043, D9S1122, D17S1301, D20S482 và
94 SNP mang thông tin nhận dạng ứng dụng trong định danh cá thể người Việt
Nam. Đề tài được thực hiện tại Trung tâm giám định Sinh học Pháp lý, Viện Khoa
học Hình sự, với sự cộng tác của Công ty BIOMEDIC, Công ty GENTIS và Viện
Công nghệ Sinh học

2
Footer Page 11 of 126.


Header Page 12 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH
Chƣơng 1 - TỔNG QUAN TÀI LIỆU

1.1 Lịch sử nghiên cứu chỉ thị ADN ứng dụng trong khoa học hình sự
Người đặt nền móng cho ứng dụng những chỉ thị ADN trong lĩnh vực hình
sự là Alec J. Jeffreys. Khi Jeffreys nghiên cứu gen mã hóa cho myoglobin ở người
thì ông cũng phát hiện được một đoạn minisatellite ADN ngắn song song lặp đi lặp
lại [21]. Những đoạn ADN ngắn này có sự biến đổi giữa những cá thể khác nhau.
Ngay sau khi Jeffreys và cộng sự công bố những kết quả nghiên cứu của mình, đã
có nhiều nghi vấn xuất hiện xung quanh việc sử dụng chỉ thị minisatellite để giải
quyết những khó khăn tranh chấp đến có liên quan đến các vấn đề hình sự. Đến năm
1986 thì những dấu vân ADN (DNA Fingerprint) đã thực sự được sử dụng trong
những giám định của khoa học hình sự bằng phương pháp lai đầu dò với việc kết
hợp nhiều minisatellite [21]. Thuật ngữ “DNA fingerprint” ra đời do các chỉ thị
ADN có giá trị phân biệt cá thể như dấu vân tay. Chính vì vậy, ngay từ khi ra đời,

các chỉ thị ADN đã được áp dụng và phục vụ cho công tác điều tra tội phạm và tư
pháp nên thuật ngữ “Forensic DNA” đã tồn tại và được sử dụng rộng rãi cho đến
ngày nay.
Đến những năm 1983, Karry Mullis đã phát minh ra kỹ thuật phản ứng chuỗi
trùng hợp (PCR – polymerase Chain Reaction). Cùng với những thử nghiệm thành
công của Jeffreys trên chỉ thị đoạn lặp ngắn nối tiếp (STR – Short Tandem
Repeats), việc ứng dụng phương pháp PCR trong phân tích ADN hình sự đã cho
thấy những ưu điểm rõ rệt như là độ nhạy cao hơn, có thể kết hợp thực hiện đồng
thời nhiều locus gen khác nhau, cách thức tiến hành đơn giản, nhanh chóng hơn, có
thể phân tích được những mẫu có chất lượng kém, bị đứt gãy nhiều [21]. Đến năm
1988, cục điều tra liên bang Mỹ - FBI bắt đầu ứng dụng dấu vết ADN trong điều tra
những vụ án. Tháng 11 năm 1988, trung tâm Bandury của phòng thí nghiệm Cold
Spring Harbor được đặt là nơi để mọi người tìm đến nếu có quan tâm đến những
ứng dụng trong hình sự của dấu vân ADN. Đến năm 1993, bộ kit STR đầu tiên được
ứng dụng. Sau đó, lần lượt các đơn vị lớn như là Cảnh sát Hoàng gia Anh xây dựng

3
Footer Page 12 of 126.


Header Page 13 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

cơ sở dữ liệu tội phạm (năm 1995) [14] và cục điều tra liên bang Mỹ xây dựng cơ
sở dữ liệu gen tội phạm bằng hệ thống CODIS với 13 locus.
Những ứng dụng của phân tích chỉ thị ADN trong khoa học hình sự tập trung
vào xác định kiểu ADN của cá thể; xác định mối quan hệ huyết thống cha – con, mẹ

- con, anh – em trai, chị - em gái, bà nội – cháu gái, ông nội – cháu trai, …; xác định
nạn nhân trong những vụ tìm người mất tích do thảm họa hoặc chiến tranh; xây
dụng cơ sở dữ liệu tàng thư tội phạm quốc gia; thẻ ADN cá nhân, …
1.2 Chỉ thị ADN sử dụng trong khoa học hình sự
Để thực hiện được mục đích phân biệt cá thể, điều quan trọng là các chỉ thị
ADN phải có tính đa hình cao hoặc có thể kết hợp số lượng lớn với những chỉ thị ít
đa hình để có khả năng phân biệt giữa các mẫu [5]. Tính đa hình của các chỉ thị
ADN được thể hiện ở hai dạng là tính đa hình trong trình tự và tính đa hình trong độ
dài [5]. Trong phân tích ADN hình sự, có hai chỉ thị ADN truyền thống được
nghiên cứu và được ứng dụng trong giám định ADN hình sự để phân biệt giữa
người này với người khác. Đó là chỉ thị những trình tự ngắn lặp đi lặp lại nối tiếp
nhau (STR – Short Tandem Repeats) và chỉ thị đa hình đơn nucleotide (SNP –
Single Nucleotide Polymorphism) [5].
1.2.1 STRs – Short Tandem Repeats
STR là các đoạn ngắn có tính lặp lại nối tiếp nhau trong trình tự (thường là 2
– 6 nucleotide). Trong hình sự, các nhà nghiên cứu thường chọn những STR có đơn
vị lặp là 4 nucleotide để sử dụng trong phân tích. Số lần lặp lại của các đơn vị có thể
rất khác nhau giữa những cá thể khác nhau. Thậm chí là có sự khác nhau trong trình
tự của chính các alen có số đơn vị lặp giống nhau. Chính tính đa hình trong độ dài
và trình tự của STRs tạo nên hiệu quả trong mục đích nhận dạng người, định danh
cá thể trong các vụ việc mang tính hình sự [5].
STRs là công cụ được ứng dụng trong phân tích ADN hình sự từ những năm
1991. Tính đa hình của STRs không chỉ thể hiện ở số lượng các đơn vị lặp lại mà

4
Footer Page 13 of 126.


Header Page 14 of 126.


Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

còn thể hiện trong trình tự của chúng. STRs thường được chia làm một số loại dựa
trên phương thức lặp lại của các tiểu đơn vị [5]
-

STRs lặp lại đơn giản gồm những đơn vị có trình tự và chiều dài giống
hệt nhau. Trình tự của STRs gồm hai hay nhiều hơn các đơn vị lặp lại liên
tiếp nhau.

-

STRs lặp lại phức tạp gồm một vài trình tự lặp lại có sự khác nhau về độ
dài và trình tự

Một số yếu tố được đề ra khi lựa chọn những locus khác nhau:
-

Có mức độ đa hình cao trong một locus, có khả năng phân biệt cao với tỉ
lệ di hợp tử quan sát được là 70%

-

Có tỉ lệ đột biến thấp, chiều dài của alen phải ở trong kích thước 90 – 500
bp để đảm bảo có khả năng phân tích những mẫu đứt gãy.

-


Các locus được chọn phải nằm trên những nhiễm sắc thể riêng nhau (hoặc
có vị trí các khá xa nhau) để đảm bảo các locus liên kết cùng nhau là
không được chọn

-

Có tính ổn định và độ lặp lại khi thực hiện thí nghiệm

-

Dễ dàng giải thích kết quả, tức là chọn những locus ít có hiện tượng
stutter (Hiện tượng polymerase bị trượt có thể xuất hiện trong quá trình
khuếch đại các trình tự lặp lại, quy trình chuẩn bị thư viện, tạo cluster. Có
thể tạo ra các đoạn ADN đích có kích thước bé đi hoặc là lớn hơn kích
thước trình tự đích)

Bộ kit STRs đầu tiên được ứng dụng trong hình sự là bộ kit có 4 locus
“quadruplex” và được mở rộng sử dụng cho xét xử tại tòa án. Lúc đấy, khả năng
cho nhận là khá cao theo tiêu chuẩn hiện đại, chỉ khoảng 10-4. Năm 1996, hệ thống
kết hợp gồm có 6 locus với locus Amelogenin kiểm tra trên nhiễm sắc thể giới tính
Y được giới thiệu [4]. Đến năm 1998, hệ thống CODIS – Combined ADN Index
System là chương trình được FBI hỗ trợ để xây dựng cơ sở dữ liệu tội phạm cũng
như phần mềm để có thể thực hiện được để phân tích ADN. Hệ thống CODIS gồm

5
Footer Page 14 of 126.


Header Page 15 of 126.


Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

một hệ gồm 13 locus nằm trên các nhiễm sắc thể khác nhau, ngoài ra còn được bổ
sung thêm locus Amelogenin cho nhiễm sắc thể giới tính.

Hình 1.1. Hệ thống CODIS 13 STR loci và vị trí trên nhiễm sắc thể
Bên cạnh đó, nguồn cơ sở dữ liệu có tính đa dạng dựa trên việc lựa chọn
phân tích các STR khác nhau tùy thuộc vào từng khu vực địa lí như là nguồn dữ liệu
của Châu Âu hoặc là các loci mở rộng hơn của U.S. Từ năm 2000, cả hai hãng lớn
Promega và Applied Biosystems đều xây dựng bộ kit thương mại có kết hợp 16 loci
trong cùng một phản ứng PCR; với cốt lõi vẫn là các locus có trong hệ 13 CODIS,
Amelogenin và thêm 2 STRs nữa. Hiện nay, trên thị trường có rất nhiều bộ kit của
nhiều hãng khác nhau như là QIAGEN, Promega, Applied Biosystems, … đưa ra
thị trường những bộ kit tách biệt STRs nằm trên nhiễm sắc thể thường và STRs nằm
trên nhiễm sắc thể giới tính [5].
Bảng 1.1. Các bộ kit STRs thương mại phổ biến trên thị trường

Hãng
Applied

Nhiễm sắc thể thƣờng
AmpFLSTR®

Nhiễm sắc thể Y
AmpFLSTR®

Biosystems Identifiler® Plus PCR Yfiler®
Amplification

locus)

Kit

(16 Amplification
(16 locus)

6
Footer Page 15 of 126.

PCR
Kit

Nhiễm sắc thể X


Header Page 16 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

AmpFLSTR®
Identifiler® Direct PCR
Amplification

Kit

(16


locus)
GlobalFiler STR kit (24
locus)
Promega

PowerPlex 16 (16 locus) PowerPlex 23 (23
Power Plex Fusion (24 locus)
locus)

Qiagen

Investigator HDPlex Kit

Investigator

(12 locus)

Argus – X Kit
(12 locus)

1.2.2 SNP – Single Nucleotide Polymorphism
Một biến đổi trong trình tự giữa những cá thể tại một điểm cụ thể trong hệ
gen thường được gọi là tính đa hình đơn nucleotide hay còn gọi là SNP (Single
Nucleotide Polymorphism) [5]. SNP rất phong phú trong hệ gen của người cũng
như được sử dụng để nghiên cứu mối tương quan với các bệnh di truyền. Hàng triệu
SNP tồn tại trong các cá thể riêng biệt. Do vậy SNP có thể được sử dụng để giúp
phân biệt giữa những cá thể [5, 6].
Có nhiều nghiên cứu đã chỉ ra SNP là chỉ thị phân tử đầy tiềm năng. SNP có
đủ khả năng để thay thế STRs và sẽ được ứng dụng trong tương lai [6]. Những
SNPs có một số ưu điểm vượt trội hơn so với STRs. Đầu tiên và quan trọng nhất là

sản phẩm PCR của các SNPs có kích thước bé hơn 100bp. Điều này có nghĩa là chỉ
thị SNPs có khả năng khôi phục lại thông tin ADN từ những mẫu bị đứt gãy mạnh
tốt hơn so với STRs (các amplicon có kích thước từ 300bp – 400bp) [6]. Thứ hai là
theo nguyên tắc có thể kết hợp nhiều SNPs hơn so với STRs do không bị giới hạn
bởi phương pháp phát hiện. Thứ ba là xử lý mẫu và phân tích dữ liệu có thể được tự

7
Footer Page 16 of 126.


Header Page 17 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

động hóa hoàn toàn. Thứ tư là không có hiện tượng stutter, do vậy có thể đơn giản
hóa và dễ dàng giải thích được kết quả gọi tên alen. Cuối cùng, khả năng dự đoán
nguồn gốc chủng tộc và những đặc điểm kiểu hình có thể thực hiện với sự lựa chọn
cẩn thận các SNPs ancestry và SNPs phenotype [5,6].
Bảng 1.2. So sánh chỉ thị STRs và SNPs [5]
Đặc điểm

Tần số xuất hiện

STRs – Short Tandem

SNPs – Single Nucleotide

Repeats


Polymorphism

1 trên mỗi 15kb

1 trên mỗi 1kb

trong hệ gen
Khả năng cung Cao

Thấp, chỉ khoảng 20% - 30% thông

cấp thông tin

tin như STRs

Tỉ lệ đột biến

1/ 1000

1/ 100000000

2, 3, 4 thậm chí là 5 Thường là chỉ thị bi-allelic với 6 khả

Loại chỉ thị

nucleotide lặp lại với nhiều năng: A/G, A/C, A/T, G/C, G/T,

Số lượng alen
Phương


alen

C/T

Thường là từ 5 – 20

Phổ biến là 2

pháp Điện di gel hoặc điện di mao Phân tích trình tự, lai microchip

phát hiện

quản

Kích thước đoạn

Thường là < 100bp

75 – 400bp

amplicon
Khả

năng

dự Giới hạn

Một vài SNPs có liên kết với nguồn


đoán nguồn gốc

gốc chủng tộc

chủng tộc

8
Footer Page 17 of 126.


Header Page 18 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

Thông tin kiểu Không

Có thể dự đoán những đặc điểm

hình

kiểu hình như màu mắt, màu tóc, …

Lợi

thế

chính Nhiều alen cho phép tăng tỉ lệ Sản phẩm PCR có kích thước nhỏ


trong ứng dụng thành công hơn trong việc hơn cho phép tăng tỉ lệ thành công
khoa hoc hình sự

phát hiện những mẫu lẫn

với những mẫu đứt gãy
Tỉ lệ đột biến thấp có thể hỗ trợ
trong phân tích quan hệ huyết thống
dễ dàng hơn
Có khả năng dự đoán kiểu hình

Giới hạn trong Giải thích dữ liệu phải tính Yêu cầu cần kết hợp nhiều locus.
ứng dụng hình sự những yếu tố nhiễu như hiện Gặp khó khăn trong giải quyết mẫu
tượng stutter, hiện tượng lẫn.
nhiễu màu thuốc nhuộm, alen
giả hình kiếm, …
Cả hai chỉ thị phân tử là STRs và SNPs đều có những ưu điểm và nhược
điểm nhất định trong phân tích ADN hình sự. Theo nghiên cứu của các nhà khoa
học, nếu phân tích 50 SNP thì độ tin cậy đạt tương đương với hệ thống CODIS.
Hiện nay, một số phòng thí nghiệm phân tích ADN trên thế giới đã ứng dụng SNP
trong giải quyết các vụ việc nhằm xác định quan hệ huyết thống trực hệ.
1.3 Các phƣơng pháp phân tích sử dụng chỉ thị ADN
1.3.1 Đa hình chiều dài các đoạn cắt giới hạn (RFLP – Restriction Fragment
Length Polymorphism)
Phương pháp đầu tiên phân tích ADN đã được sử dụng để nhận dạng người
chính là phương pháp RFLP. Trong phương pháp này, hệ gen sẽ được cắt ngẫu
nhiên bằng các enzyme cắt giới hạn tại vị trí đặc hiệu đã biết trước trình tự. Kỹ
thuật này nhận biết sự khác nhau giữa người này với người khác thông qua độ dài

9

Footer Page 18 of 126.


Header Page 19 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

đoạn ADN sau khi nó được điện di để phân tách dựa vào kích thước. Sự xuất hiện
hay vắng mặt của các vị trí đặc hiệu trên mẫu ADN sẽ tạo ra sản phẩm có kích
thước khác nhau. Sau đó, sản phẩm ADN được phân tách trên gel và phát hiện bằng
cách lai với một đầu dò là trình tự bổ sung với ADN mẫu.
RFLP không được sử dụng lâu trong hình sự nhận dạng ADN người và
nhanh chóng bị thay thế bởi phương pháp khác sử dụng kỹ thuật PCR. Nguyên nhân
là do các phương pháp dựa vào PCR giúp làm tăng số lượng bản copy trong một
lượng mẫu tương đối nhỏ, có thể giúp phân tích mẫu bị đứt gãy. Ngược lại, phương
pháp RFLP yêu cầu một lượng lớn mẫu tốt, không bị đứt gãy [12].
1.3.2 Phương pháp PCR các chỉ thị STRs
Chỉ thị STRs có tính đa hình rất cao. Trong quần thể người có một số lượng
lớn tính đa hình dựa vào độ dài của chỉ thị STRs. Sự khác biệt giữa người này và
người khác chính là số lần lặp lại của các đơn vị trong trình tự. Mỗi cá thể bình
thường sẽ có 2 alen trên một cặp nhiễm sắc thể được sử dụng để xác định các mối
quan hệ trực hệ (bố - con, mẹ - con). Nhiễm sắc thể Y cũng có STRs. Các Y – STRs
chỉ xuất hiện ở nam giới được ứng dụng để xác định quan hệ huyết thống theo dòng
nội [5]. Ngoài ra, trên nhiễm sắc thể X cũng có các STR và cũng được ứng dụng để
phân tích một số mối quan hệ huyết thống có liên quan đến nhiễm sắc thể X [5].
Mồi cho phản ứng PCR của các STRs được thiết kế bổ sung với trình tự nằm
ở vùng biên (flanking regions) của trình tự lặp lại. Phương pháp hiện nay sử dụng
để phân tích ADN hình sự, một trong hai mồi được gắn màu huỳnh quang. Các alen

khác nhau của các locus khác nhau phải được phân biệt bằng màu sắc khác nhau khi
kết hợp nhiều locus trong một phản ứng PCR. Như vậy việc gắn huỳnh quang để
ngăn chặn những alen của các locus khác nhau bị trùng kích thước lên nhau [12].
1.3.3 Điện di và phát hiện STRs
Điện di trên gel đã từng được sử dụng để phân tách các đoạn ADN trong sử
dụng phương pháp RFLP và phân tích STRs trước khi những hệ thống điện di mao
quản trở nên có sẵn. Sử dụng kết quả điện di mao quản giúp phân tích nhanh và
chính xác hơn. Hiện nay, công nghệ điện di mao quản đang được coi là “tiêu chuẩn

10
Footer Page 19 of 126.


Header Page 20 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

vàng” trong phân tích giám định hình sự [20]. Hầu hết những hệ thống điện di mao
quản đều được sản xuất bởi công ty Applied Biosystems. Điện di mao quản sử dụng
một mao quản dài và hẹp có chứa polymer đặc biệt cho phép phân tách các đoạn
ADN khác nhau theo kích thước. Sản phẩm PCR được bổ sung vào ống mao quản.
Trong suốt quá trình điện di, những đoạn có kích thước nhỏ sẽ chạy nhanh hơn
những đoạn lớn. Trong quá trình phân tách, các đoạn sản phẩm PCR sẽ được chiếu
chùm tia laser cho phép phát hiện những màu huỳnh quang khác nhau được gắn ở
mồi để phát ra ánh sáng có bước sóng riêng. Hệ thống sẽ phát hiện các bước sóng
và cho phép so sánh với hệ thống thang chuẩn được điện di song song với mẫu. Từ
đó, một loạt các đỉnh được dựng lên và thể hiện mối quan hệ giữa tín hiệu huỳnh
quang được gắn vào mỗi đoạn STR với một thuốc nhuộm đặc biệt so với thời gian

di chuyển của nó. Hệ thống phần mềm của máy tính sẽ xử lí thông tin cũng như
cung cấp kích thước của các alen khác nhau trong quá trình điện di và kiểu gen của
chúng (số lần đơn vị lặp lại) [12].

Hình 1.2. Hình ảnh máy điện di mao quản 3130xl với 16 mao quản

1.3.4 Giải trình tự thế hệ mới – Next Generation Sequencing (NGS)
1.3.4.1Tổng quan về NGS

11
Footer Page 20 of 126.


Header Page 21 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

Công nghệ giải trình tự thế hệ mới với những đặc điểm như là hiệu suất cao,
giảm chi phí đã phát triển nhanh chóng trong những năm gần đây và trở thành một
công cụ phân tích quan trọng cho nhiều nhà di truyền học. Hàng triệu hoặc hàng tỉ
phân tử ADN có thể được giải trình tự đồng thời. Do đó, hiệu suất của quá trình giải
trình tự được tăng lên một cách đáng kể và giảm thiểu việc phải tách dòng trình tự
đích giống như phương pháp Sanger trước đó [20].
Năm 2005, Roche giới thiệu hệ thống giải trình tự hệ genome 454 – là hệ
thống giải trình tự dữ liệu đầu ra lớn theo phương pháp pyrosequencing đầu tiên
trên thế giới. Hệ thống này có thể tạo ra 200 000 đoạn đọc có độ dài khoảng 110bp
[13]. Năm 2007, Applied Biosystems (ABI) giới thiệu hệ thống giải trình tự thế hệ
thứ hai SOLiD dựa trên công nghệ nối các đoạn oligonucleotide. Hệ thống SOLiD

sử dụng việc nhân bản cầu pha cứng (solid – phase bridge amplification), trong đó
các đoạn tiếp hợp đầu 5’ và 3’ được gắn vào mỗi đầu của khuôn ADN. Cũng trong
thời gian đó, Illumina cho ra mắt hệ thống giải trình tự Solexa. Hệ thống này đơn
giản hóa phương pháp xây dựng thư viện và đảo đầu bằng phương pháp huỳnh
quang dẫn dến việc tạo ra các đoạn đọc có độ dài 35bp [3]. Năm 2010, một hệ thống
giải trình tự nhanh hơn, chi phí thấp hơn dựa trên công nghệ bán dẫn Ion Torrent
được giới thiệu. Đây là hệ thống duy nhất xác định trình tự không dựa vào tín hiệu
huỳnh quang mà dựa vào việc đo sự thay đổi pH do việc giải phóng ra ion H+ khi
gắn nucleotide bằng công nghệ bán dẫn [16].
Tất cả những phương pháp giải trình tự mới đã dẫn tới ba cải tiến đáng kể so
với công nghệ truyền thống [20]
-

Đầu tiên là các công nghệ này không yêu cầu tách dòng các đoạn ADN,
mà thay vào đó cần chuẩn bị của các thư viện NGS theo từng mục đích

-

Thứ hai là thay vì hàng trăm phản ứng giải trình tự thì những công nghệ
mới có thể thực hiện được hàng triệu phản ứng đồng thời.

-

Thứ ba, trình tự được xuất ra trực tiếp mà không cần phải điện di. Số lần
đọc của NGS là vô cùng lớn, cho phép quá trình giải trình tự toàn bộ hệ

12
Footer Page 21 of 126.



Header Page 22 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

gen trong thời gian ngắn và được ứng dụng rộng rãi trong nhiều lĩnh vực
khoa học và đời sống
Tuy nhiên, nhược điểm của các hệ thống giải trình tự mới này là độ dài đoạn
đọc tương đối ngắn, dẫn đến những khó khăn trong việc cắt nối các trình tự, lắp ráp,
chú thích và phân tích tin sinh học [20].
1.3.4.2Triển vọng ứng dụng của công nghệ NGS trong phân tích ADN hình sự
So với các lĩnh vực nghiên cứu khác, phân tích ADN trong hình sự phải đối
mặt với nhiều thách thức như là lượng mẫu ít, số bản sao thấp, nhiều chất ức chế,
mẫu đứt gãy mạnh và bị nhiễm giữa nhiều nguồn mẫu khác nhau, phải có độ chính
xác cao cũng như phải cân nhắc vấn đề thời gian và chi phí [20].
Hiện nay, công nghệ chính được sử dụng trong phân tích hình sự là PCR kết
hợp với điện di mao quản dựa trên phương pháp phân tích các đoạn ADN và phát
hiện sự khác nhau về độ dài của các chỉ thị STR. Đây đang được coi là tiêu chuẩn
vàng của phân tích với những ưu điểm của công nghệ này là:
-

Thời gian thực hiện từ khâu tách chiết mẫu tới khi phân tích được kết quả
tương đối ngắn.

-

Quy trình thực hiện đơn giản, có khả năng linh động trong việc lựa chọn
các bộ kit khác nhau tùy theo mối quan hệ muốn phân tích


Tuy nhiên, công nghệ này vẫn còn tồn tại nhiều hạn chế nhất định trong quá
trình PCR cũng như giới hạn trong việc phát hiện do còn tồn tại các yếu tố nhiễu
làm ảnh hưởng tới quá trình đọc kết quả [5, 12, 20].
-

Đòi hỏi kỹ thuật viên có kinh nghiệm và trình độ tốt để nhận định kết quả
trong các trường hợp nhiễu như nhận định alen thật, alen giả, alen hiếm,
mẫu lẫn từ nhiều nguồn...

-

Trong trường hợp các mẫu hiện trường thường là các mẫu có chất lượng
kém, bị đứt gãy mạnh thì độ phân giải của hệ thống là không được cao.

13
Footer Page 22 of 126.


Header Page 23 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

Thường không đủ số locus => các giám định viên phải thực hiện lại nhiều
lần mới thu được kết quả để đối chiếu và so sánh.
-

Các yếu tố nhiễu phát sinh trong quá trình PCR như hiện tượng stutter,
phát sinh trong quá trình điện di mao quản như là hiện tượng lẫn màu, các

băng không đặc hiệu, tín hiệu nền cao, các hiện tượng alen hiếm cũng
không được gọi một cách tự động.

Từ những khó khăn còn tồn đọng trong hệ thống giải trình tự thế hệ cũ, các
nhà khoa học hình sự đã nghiên cứu và khám phá ra những lợi thế của hệ thống giải
trình tự thế hệ mới. Đồng thời các nhà nghiên cứu cũng nhận định hệ thống giải
trình tự mới là giải pháp đầy hứa hẹn cho giám định ADN khoa học hình sự trong
tương lai [17].
1.4 Hệ thống giải trình tự thế hệ mới của Illumina - MiSeq FGx.
1.4.1 Công nghệ giải trình tự của Illumina [22]
Hệ thống máy giải trình tự của Illumina sử dụng công nghệ giải trình tự theo
phương pháp tổng hợp (Sequencing by Synthesis) kết hợp với việc sử dụng các
nucleotide có gắn tín hiệu huỳnh quang và khóa dừng thuận nghịch để đọc và nhận
biết trình tự một cách trực tiếp.
Nguyên tắc của công nghệ giải trình tự của Illumina cũng giống với giải trình
tự bằng điện di mao quản. ADN polymerase xúc tác cho quá trình ghép các
deoxyribonucleotide triphosphates được gắn huỳnh quang vào mạch khuôn ADN
trong suốt các chu kì tổng hợp. Trong suốt mỗi chu kì, tại nucleotit có sự kết hợp sẽ
được phát hiện bằng các bức xạ huỳnh quang. Đặc điểm khác nhau ở đây chính là
thay vào việc chỉ giải trình tự trên một sợi ADN, công nghệ giải trình tự thế hệ mới
cho phép giải trình tự đồng thời nhiều gen cùng một lúc. Công nghệ giải trình tự
bằng phương pháp tổng hợp (SBS) sẽ đưa ra kết quả có sự chính xác cao, tăng tỉ lệ
đọc được của các đoạn ADN. Quy trình giải trình tự thế hệ mới gồm có 4 bước
chính:
 Chuẩn bị thư viện (Library Preparation)

14
Footer Page 23 of 126.



Header Page 24 of 126.

Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

Bao gồm việc chuẩn bị thực hiện theo quy trình của bộ kit ForenSeq DNA
Signature Prep. Mẫu sẽ được khuếch đại những đoạn ADN đặc hiệu và gắn thêm
các adapter riêng biệt để có thể phân biệt giữa các mẫu với nhau. Cuối cùng, các
mẫu sẽ được trộn lại chung và đưa vào máy giải trình tự.
 Tạo Cluster
Thư viện sau khi được chuẩn bị sẽ được máy đưa tự động lên flow cell – nơi có
các đoạn nhỏ oligo nucleotit đã được gắn lên trên bề mặt có sự tương thích với các
adapter. Mỗi đoạn sẽ khuếch đại riêng biệt và tách thành từng nhóm cluster thông
qua phản ứng khuếch đại đường cầu. Sau quá trình tạo ra các cluster thì mạch
khuôn đã sẵn sàng cho việc giải trình tự
 Giải trình tự
Giải trình tự bằng công nghệ tổng hợp. Kết quả có độ chính xác đến từng base.
 Phân tích kết quả
Hệ thống có server đi kèm sử dụng phần mềm riêng biệt để phân biệt và so sánh
các mẫu với nhau.

Chuẩn bị
thư viện

15
Footer Page 24 of 126.


Header Page 25 of 126.


Luận văn cao học - 2016

Nguyễn Thị Hồng Nhung – K23CH

Tạo
Cluster

Giải trình
tự

Hình 1.3. Quy trình giải trình tự thế hệ mới của Illumina
1.4.2 Giải pháp NGS cho lĩnh vực hình sự của Illumina [23]
Hệ thống MiSeq FGx là hệ thống được hãng Illumina giới thiệu sử dụng
riêng cho hình sự. Hệ thống được ra mắt vào tháng 1 năm 2015 và đã được đứng
thứ hai trên top 10 danh sách các sản phẩm khoa học đổi mới cho năm 2015.
Hệ thống MiSeq FGx đang được đánh giá là một giải pháp hoàn chỉnh cho
lĩnh vực hình sự. Với những đặc điểm như:
-

Chỉ sử dụng một bộ kit duy nhất hoàn thiện phân tích được cả 2 chỉ thị
ADN trong hình sự là STRs và SNPs.

-

Tổng số dấu chuẩn trong bộ kit chuẩn bị thư viện là 233. Từ đó cung cấp
được lượng thông tin lớn mang độ tin cậy và chính xác cao

-


Kết hợp đồng thời các STR trên nhiễm sắc thể thường (28 locus), nhiễm
sắc thể giới tính Y (24 locus) và nhiễm sắc thể giới tính X (7 locus). Bên

16
Footer Page 25 of 126.


×