Tải bản đầy đủ (.pdf) (99 trang)

Nghiên Ứu Tần Suất Alen 2 Lous Đa Hình Str Ở Quần Thể Người Kinh Việt Nam.pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.44 MB, 99 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

LUẬN VĂN THẠC SĨ
Nghiên cu tần suất alen 21 locus đa hình STR
ở quần thể người Kinh Việt Nam

ĐỖ THỊ XAO MAI
Ngành: Công nghệ sinh học

Giảng viên hướng dẫn: PGS. TS Trương Quc Phong
TS Nguyn Văn Li
Viện:

Công nghệ sinh học và Công nghệ thực phẩm

HÀ NỘI, 2020

Tai ngay!!! Ban co the xoa dong chu nay!!! 17061132205011000000


TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

LUẬN VĂN THẠC SĨ
Nghiên cu tần suất alen 21 locus đa hình STR
ở quần thể người Kinh Việt Nam

ĐỖ THỊ XAO MAI
Ngành: Công nghệ sinh học

Giảng viên hướng dẫn: PGS. TS Trương Quc Phong
TS. Nguyn Văn Li


Viện:

Chữ ký của GVHD

Công nghệ sinh học và Công nghệ thực phẩm

HÀ NỘI, 2020


CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc

BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ

Họ và tên tác giả luận văn: Đỗ Thị Xao Mai

Đề tài luận văn: Nghiên cu tần suất alen 21 locus đa hình STR ở quần
thể người Kinh Việt Nam
Chuyên ngành: Công nghệ sinh học
Mã số SV: CA180119
Tác giả, Người hướng dẫn khoa học và Hội đồng chấm luận văn xác nhận
tác giả đã sửa chữa, bổ sung luận văn theo biên bản họp Hội đồng ngày
30/10/2020 với các nội dung sau:
- Chỉnh sửa các lỗi chính tả, thiếu chữ viết tắt
- Trình bày cho rõ ràng.
- Viết lại tài liệu tham khảo theo tiêu chuẩn.
- Chỉnh sửa b cục, nội dung luận văn cho hp lý.
Ngày tháng
Giáo viên hướng dẫn


CHỦ TỊCH HỘI ĐỒNG

năm 2020

Tác giả luận văn


LỜI CAM ĐOAN
Tôi xin cam đoan những nội dung viết trong luận văn là do sự tìm
tịi, học hỏi và nghiên cu của bản thân với sự hướng dẫn tận tình của
PGS. TS. Trương Quc Phong và TS Nguyn Văn Li.
Mọi kết quả nghiên cu cũng như ý tưởng của các tác giả khác (nếu
có) đều đưc trích dẫn cụ thể. Đề tài luận văn này cho đến nay chưa đưc
bảo vệ tại bất kỳ một hội đồng bảo vệ luận văn thạc sĩ nào và cũng chưa
đưc công b trên bất kỳ phương tiện nào. Tôi xin chịu trách nhiệm về
những lời cam đoan trên.

Hà Nội, ngày tháng năm 2020
HỌC VIÊN

Đ Th Xao Mai


LỜI CẢM ƠN
Với tấm lng knh trọng và sự biết ơn chân thành nhất, em xin cảm ơn
PGS. TS Trương Quc Phong và TS Nguyn Văn Li đã tận tình hướng dẫn em
trong q trình nghiên cu để em hồn thành luận văn này.
Em xin chân thành cảm ơn Lãnh đạo, Chỉ huy Viện Pháp y Quân đội đã
tin tưởng giao đề tài và quan tâm, tạo điều kiện gip đ em trong q trình cơng
tác, học tập và nghiên cu đề tài.

Cui cng em xin cảm ơn tâp thể cán bộ, nhân viên Khoa Xt nghiệm Viện Pháp y Quân đội đã tạo điều kiện thuận li cho em trong sut q trình học
tập và hồn thành luận văn.
Hà Nội, tháng 10 năm 2020
Học viên

Đ Th Xao Mai


MỤC LỤC

MỤC LỤC

.................................................................................................................. i

ĐẶT V Ấ N Đ Ề ................................................................................................................ 1
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .................................................................. 4
1.1 Tổng quan về tần suất alen. .................................................................................... 4
1.1.1 Tần suất alen là gì. .................................................................................. 4
1.1.2 Tầm quan trọng củ a việc nghiên cứu tần suất alen............................. 5
1.2 Tổng quan về STR, Alen, locus gen. .................................................................... 6
1.2.1 STR ( Short tandem repeat) là gì. ......................................................... 6
1.2.2 Alen là gì. ................................................................................................. 8
1.2.3 Locus là gì................................................................................................ 8
1.3 Tình hình nghiên cứu trong và ngồi nước. .........................................................9
1.3.1 Tình hình nghiên cứu trong nước. ........................................................ 9
1.3.2 Tình hình nghiên cứu trên thế giới. ....................................................10
CHƯƠNG 2. VẬ T LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU ....................12
2.1 Vật liệu nghiên cứu. ..............................................................................................12
2.1.1 Đối tượng n ghiên cứu...........................................................................12
2.1.2 Hóa chất, thiết bị sử dụng trong nghiên cứu. ....................................12

2.1.3 Đặc điểm của bộ kit GlobalFiler™ PCR Amplification Kit ...........14
2.2 Phương pháp nghiên cứu ......................................................................................20
2.2.1 Phương pháp thu mẫu: .........................................................................20
2.2.2 Phương pháp phân tích mẫu. ...............................................................21
2.2.3 Phân tích xử lí số liệu và tính tốn tần suất alen...............................29
CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU VÀ TH ẢO LUẬ N ...........................34
3.1 Kết quả phân tích mẫu. .........................................................................................34
3.2 Kết quả phân tích thống kê...................................................................................37
3.2.1 Kết quả tính tần số alen của 21 locus. ................................................37
3.2.2 Xác định và liệt kê các alen có tần số thấp........................................41
3.2.3 Kết quả tính tốn tần số dị hợp tử quan sát và tần số dị hợp tử lý
thuyết.

...............................................................................................................42
i


3.2.4 Kết quả tính tốn và so sá nh các chỉ số pháp y. ............................... 43
3.2.5 Giá trị tổ hợp của các chỉ số pháp y................................................... 47
3.3 So sánh tần suất các alen của quần thể nghiên cứu với mộ t số nghiên cứu
khác
.............................................................................................................. 47
3.3.1 Tần số alen của locus D3S1358 ......................................................... 47
3.3.2 Tần số alen của locus vWA ................................................................ 48
3.3.3 Tần số alen của locus D16S539 ......................................................... 49
3.3.4 Tần số alen của locus CSF1PO .......................................................... 50
3.3.5 Tần số alen của locus TPOX .............................................................. 51
3.3.6 Tần số alen của locus D8S1179 ......................................................... 52
3.3.7 Tần số alen của locus D21S11............................................................ 53
3.3.8 Tần số alen của locus D18S51............................................................ 55

3.3.9 Tần số alen của locus D2S441............................................................ 56
3.3.10 Tần số alen của locus D19S433 ....................................................... 57
3.3.11 Tần số alen của locus TH01 ............................................................. 58
3.3.12 Tần số alen của locus FGA ............................................................... 59
3.3.13 Tần số alen của locus D22S1045 ..................................................... 61
3.3.14 Tần số alen của locus D5S818 ......................................................... 62
3.3.15 Tần số alen của locus D13S317 ....................................................... 63
3.3.16 Tần số alen của locus D7S820 ......................................................... 64
3.3.17 Tần số alen của locus SE33 .............................................................. 65
3.3.18 Tần số alen của locus D10S1248 ..................................................... 67
3.3.19 Tần số alen của locus D1S1656. ...................................................... 68
3.3.20 Tần số alen của locus D12S391 ....................................................... 69
3.3.21 Tần số alen của locus D2S1338 ....................................................... 71
CHƯƠNG 4. KẾT LU ẬN VÀ KI ẾN NGHỊ ........................................................ 72
TÀI LIỆU THAM KHẢO ........................................................................................ 74
PHỤ LỤC .................................................................................................................... 77

ii


DANH MỤC HÌNH VẼ
Hình 1.1 Locus TH01 của 01 cá thể............................................................................. 7
Hình 1.2 Các locus trên một nhiễm s ắc thể. ............................................................... 8
Hình 1.3 Vị trí của 13 Locus trong CoDis trên NST ................................................. 9
Hình 3.1 Kiểu gen trên 24 locus của mẫu HT105.19_2 ..........................................35
Hình 3.2 Biểu đồ cột theo giá trị chỉ số PM của từng locus ...................................45
Hình 3.3 Biểu đồ cột theo giá trị chỉ số PD của từng locus....................................45
Hình 3.4 Biểu đồ cột theo giá trị chỉ số PE của từng locus ....................................46

iii



DANH MỤC BẢNG BI ỂU
Bảng 2.1 Các locus và alen của bộ kit GlobalFiler™ ......................................... 17
Bảng 3.1 Kiểu gen của mẫu HT105.19_2 trên 24 locus ......................................... 36
Bảng 3.2 Tần suấ t alen 21 Locus STR trong quầ n thể người Kinh Việt Nam...... 38
Bảng 3.3 Các alen có tần số thấp trong quần thể nghiên cứu ............................... 41
Bảng 3.4 Tần số dị hợp tử quan sát (OH) và tần số dị hợp tử lý thuyết(EH) ...... 42
Bảng 3.5 Kết quả tính tốn các chỉ số Pháp y ......................................................... 43
Bảng 3.6 Tần số alen của locus D3S1358 ................................................................ 48
Bảng 3.7 Tần số alen của locus vWA ........................................................................ 49
Bảng 3.8 Tần số alen của locus D16S539 ................................................................ 50
Bảng 3.9 Tần số alen của locus CSF1PO................................................................. 51
Bảng 3.10 Tần số alen của locus TPOX ................................................................... 52
Bảng 3.11 Tần số alen của locus D8S1179 .............................................................. 53
Bảng 3.12 Tần số alen của locus D21S11 ................................................................ 54
Bảng 3.13 Tần số alen của locus D18S51 ................................................................ 55
Bảng 3.14 Tần số alen của locus D2S441 ................................................................ 56
Bảng 3.15 Tần số alen của locus D19S433 .............................................................. 57
Bảng 3.16 Tần số alen của locus TH01 .................................................................... 59
Bảng 3.17 Tần số alen của locus FGA...................................................................... 60
Bảng 3.18 Tần số alen của locus D22S1045............................................................ 62
Bảng 3.19 Tần số alen của locus D5S818 ................................................................ 63
Bảng 3.20 Tần số alen của locus D13S317 .............................................................. 64
Bảng 3.21 Tần số alen của locus D7S820 ................................................................ 65
Bảng 3.22 Tần số alen của locus SE33..................................................................... 66
Bảng 3.23 Tần số alen của locus D10S1248............................................................ 68
Bảng 3.24 Tần số alen của locus D1S1656 .............................................................. 69
Bảng 3.25 Tần số alen của locus D12S391 .............................................................. 70
Bảng 3.26 Tần số alen của locus D2S1338 .............................................................. 71


iv


DANH MỤC VIẾT TẮT
Chữ viế t tắt

Nội dung

ADN

Deoxyribonucleic acid

FTA

Giấy thu mẫu máu

NST

nhiễm sắc thể

STR

Short tandem repeat

PCR

Polymerase chain reaction

PM


Match probability

PD

Power of discrimination

PE

Power of Exclusion

FBI

Federal Bureau of Investigation

EH

Expected Heterozygosity

OH

Observed Heterozygosity

CPM

Combinded Match probability

CPE

Combinded Power of Exclusion


CPD

Combinded Power of discrimination

PBS

Phosphate - Buffered Saline

SDS

Sodium dodecyl sulfate

DDT

Dithiothreitol

v



ĐẶT VẤN ĐỀ
Năm 2020 sắp qua và chúng ta đã được chứng kiến sự phát triển vượt bậ c
của khoa học công nghệ. Mặc dù sự phát triển này đem lại r ất nhiều lợi ích cho
lồi người, tuy nhiên sự phát triển quá nhanh cũng đem lại nhiều vấn đề khiến
chúng ta phải lo lắng.
Mỗi năm trên thế giới có hàng ngàn vụ thả m họa thiên tai, hàng triệu vụ án
mạng, mất tích, khủng bố quy mơ rộ ng. Trong bất kỳ một trường hợp nào, ở bất cứ
quốc gia nào thì việc xác định rõ tung tích nạn nhân là vấn đề đầu tiên đặt ra cần
giải quyết. Khoa học hiện đại với công nghệ ADN làm mũi nh ọn đã tiến tới kh ả

năng nhận biết truy nguyên đến mức độ cá thể bằng chính những thơng tin được
mã hóa trong hệ gen của mỗi người. Trong những năm gần đây, thế giới đã chứng
kiến những vụ th ảm họa lớn xảy ra như vụ khủng bố vào tịa tháp đơi ở Trung tâm
thương mại th ế giới tại New York ngày 11 tháng 9, vụ th ảm họa sóng thần ở khu
vực Đơng Nam Á, những vụ tai nạ n máy bay, những vụ đánh bom liều chế t cướp
đi sinh mạng củ a hàng trăm người… Trong rất nhiề u trường hợp ADN được coi
như là dấu vết và bằng chứng đưa đến những kế t luận cuố i cùng.
Việc ứng dụng kỹ thu ật phân tích ADN đã giúp ích rất nhiều cho việc điề u
tra phá án, đồng thời cho phép truy nguyên cá thể với độ chính xác cao hơn hẳn
các phương pháp nhận dạng truyền thống. Dấu vết sinh phẩm thu được ở hiện
trường củ a các vụ án thường là rất ít ho ặc bị phân hủy nghiêm trọng nhưng thơng
qua phân tích ADN có thể cho chúng ta những chứng cứ quan trọng giúp truy
nguyên thủ phạm của vụ án hoặc truy tìm tung tích nạn nhân một cách chính xác
[1].
Một marker chỉ thị, hay một locus ADN nhân mang tính khoa học được sử
dụng (được coi là đặc trưng cá thể ) nếu nó có nhiều alen khác nhau trong qu ần thể
(nhiều hơn 5 alen) và kiểu gen dị hợp của các cá thể trong quần thể lớn hơn 70%
[1] [2]. Do đó, càng nhiều vị trí ADN (locus ADN) được phân tích để tìm đ ặc
trưng ADN, thì khả năng xác định mẫu sinh học nào đó của mộ t người càng cao.
Vì thế, việc xác định đặc trưng cá thể về phương diện ADN giữa mẫu sinh phẩm

1


thu được và mẫu sinh phẩm đ ối ch ứng của một cá th ể nghi ngờ hoặc với ngân hàng
dữ liệu ADN (nếu có) là cực kỳ quan trọng.
Hiện nay, trên thế giới công tác giám định pháp y, đặc biệt là trong khoa
học hình sự chủ yếu sử d ụng các marker STR (Short Tandem Repeat), đây là các
đoạn ADN có c ấu trúc lặp lại từ 2-6 bp, có tính bảo thủ cao, được di truy ền qua
các thế hệ và mang tính đặc trưng cá thể. Mộ t locus STR được sử dụ ng cho mục

đích nhận dạng và xác định cá thể phải có tính đa hình và mức độ d ị hợp tử cao, có
kích thước ngắn từ 100-500bp và phải có tính di truy ền độc lập [2]. Trên th ực tế,
tần suất xuất hiện các Alen của locus STR trong quần thể ở các nước khác nhau,
các tộc người khác nhau cũng có sự khác biệt. Có những Alen chỉ thấy xuất hiện ở
tộ c người này nhưng lại không thấy xuất hiện ở tộc người khác hoặc rất hiếm gặp
[3]. Vì thế, việc nghiên cứu tần suất alen của các tộc người khác nhau có ý nghĩa
quan trọng trong việc đánh giá và áp dụng có hiệu quả thơng qua phân tích các
locus STR, giúp truy nguyên cá thể một cách nhanh chóng, chính xác [4].
Ở Việt Nam, việc nghiên cứu ứng dụng kỹ thu ật phân tích STR trong nhận
dạng cá thể người cũng đã được phát triển mạnh mẽ từ những năm 2000 đến nay,
hầu hết c ác phò ng thí nghiệm đ ều đang sử dụ ng các bộ kit marker STR để xác định
quan hệ huyết thố ng, nhậ n dạng người. Trước đây tại các phò ng thí nghiệm ở Việt
Nam thường chỉ sử dụng bộ kit nhân gen 16 locus thì bây giờ khoa học công nghệ
phát triển đã cho ra các bộ kit nhân gen 24 locus, cho độ nhậy và độ chính xá c cao
hơn.
Tại Khoa xét nghiệm - Viện Phá p Y Quân đội, hi ện đang sử dụ ng bộ kit
nhân gen Global filer 24 locus. Hàng năm chúng tôi tiếp nhận và giải quyết hàng
trăm vụ án: cướp của, giết người, hiếp dâm, nhậ n dạng các nạn nhân của các vụ
thảm họa như: vụ rơi máy bay Mi 171, vụ rơi máy bay CaSa..... Hầ u hết dấu vết
trong các vụ án cướp củ a, giết người, hi ếp dâm thường rất nghèo nà n, nhiều mẫu
bị phân hủy khơng có khả năng phân tích đủ 24 locus trong nhận dạng. Do đó để
đánh giá độ chính xác hay mức đ ộ tin c ậy của xét nghiệm này cần có các thống kê
cụ thể về tần suất alen, tần suất d ị hợp tử của từng locus STR đối v ới người Việt
Nam. Từ đó tính tốn khả năng phân biệt c ủa từng locus, độ chính xác cũng như
độ tin c ậy của phép phân tích trong từng trường hợp cụ thể.

2


Mặt kh ác hiện nay ở Việt Nam chỉ có b ảng tần suất alen của 15 locus hệ

Identifiler, powerplex 16..., tần suất alen của hệ Power plex Fusion System. Cho
đến nay, chưa có một nghiên cứu nào được cơng bố về khảo sát sự phân bố tần
suất các alen của các locus gen hệ Globalfiler (gồm 24 locus gen) trong quần thể
người Kinh. Theo Tổng điều tra dân số và nhà ở năm 2019, người Kinh ở Vi ệt
Nam có dân số 82.085.826 người, chiếm 85.3% dân số cả nước, cư trú tại tất c ả
63 tỉnh, thành phố. Các tỉnh, thành phố có số lượng người Kinh lớn nhất là: Thành
phố Hồ Chí Minh, Hà Nội, Thanh Hóa, Nghệ An , Đồng Nai, An Giang [5]..... đây
là những điểm nóng về tình hình an ninh và trật tự xã hộ i, số v ụ án trong cộng
đồng người Kinh có diễn biến phức tạp với xu hướng ngày càng gia tăng. Các vụ
án về nhận dạng, truy nguyên cá thể trên quần thể người Kinh cũng phổ biến nhất.
Xuất p há t từ những yêu cầu thực tiễn chúng tôi đ ã chọn đề tài nghiên cứu:
" Nghiên cứu tầ n suấ t alen 21 locus đa hình STR ở quần thể người Kinh Việt
Nam"; v ới các mục tiêu sau:
1. Xây dựng bộ số liệu tần suấ t alen củ a 21 locus đa hình STR c ủa quần thể
người Kinh Việ t Nam.
2. Đánh giá các chỉ số thống kê đặc trưng của tần suất alen, chỉ số đa dạng
di truyền quần thể.
3. So sánh đối chiếu với tần suất tương ứng ở một số nước trong khu vực và
trên thế giới. Đánh giá khả năng phân biệt củ a chúng trong nhận dạng cá thể .

3


CHƯƠNG 1. TỔNG QUAN TÀI LIỆU
1.1 Tng quan về tần suất alen.
1.1.1

Tần suất alen là gì.

Tần su ất alen được hiểu là tỉ lệ xuất hiện của một alen nào đó trong quần thể

ở một locus gen trên nhiễm sắc thể [6]. Tần suất alen được tính bằng số lần alen
được quan sát thấy trong quần thể trên tổng số alen của locus cụ thể nào đó trong
quần th ể. Tần suất alen có thể được th ể hiện dưới d ạng số thậ p phân, phần trăm
hoặc phân số. Trong một quần th ể tần su ất alen ph ản ánh sự đa dạng di truyền.
Hiện nay, trong phân tích ADN có đến hàng chục locus gen được chế tạo và
sử dụng ở dạng bộ Kit thương phẩm bán trên thị trường thế giới; các locus gen này
nằm trên các nhiễm s ắc thể khác nhau từ cặp số 1 đến cặp số 23. Các nhà nghiên
cứu ADN thường sử dụng những locus gen khác nhau trên những nhiễm sắc thể
khác nhau để bảo đảm tính phân ly độc lập và tính đa hình cao. Các hãng s ả n xu ấ t
trên thế giới ngày nay thường cho ra đời các bộ Kit phân tích ADN bao gồm nhiều
gen khác nhau; phổ biến là Kit của hãng Appliedbiosystem: Profiler plus 10 gen,
Codis 13 gen, Identifiler GlobalFiler 24 gen và có thể mở rộng thêm số locus gen
nhiều hơn nữa. Thêm vào đó trong mỗi locus gen lại có nhiều alen khác nhau (alen
là những trạng thái biểu hiện khác nhau của một gen chiếm một vị trí xác định trên
nhiễm sắc thể). Do vậy sẽ có rất nhiều đặc điểm khác nhau được phân tích.
Để xác định được tần suất alen các nhà nghiên cứu về ADN đã phải nghiên
cứu, khảo sát và công bố kế t quả v ề một gen hoặc nhiều gen thuộc một s ố tộ c
người nh ất định trên thế giới trong đó có cả tần suất c ủa các alen. Sở dĩ phải như
vậy là để xác định tính đa hình của gen đó, sự khác biệ t giữa tộc người này với t ộ c
người khác; gen có bị đột biến hay không, tỷ lệ đột biến cao hay thấp…Để từ đó
quyết định có nên sử dụ ng gen đó hay không. Muốn xác định được tần suất alen
cần phải thu thập được mẫu, mẫu này là của những người đã biết chính xác về
nguồn gốc (tộc người, khơng có quan hệ họ hàng huyết thống với những mẫu khác,
ở nhiều vùng địa lý khác nhau trong mỗ i qu ốc gia). Số lượng các mẫ u cần phân
tích ph ải đủ lớn để b ảo đảm được độ tin c ậy cao, có nghĩa là kết quả phân tích
thống kê tần số alen và kiểu gen phải phù hợp giữa mẫu nghiên cứu và quần thể lý
thuyết, và sử dụng tiêu chuẩn Khi bình phương (Chi square) để thẩm định. Chỉ khi

4



nào đạt được tiêu chuẩn này thì tầ n suất alen đó mới có giá trị [7]. Khi có được số
liệu tần suất alen của các gen thì tần suất này được sử dụng để xác định độ tin cậy
trong truy nguyên cá thể và xác định quan hệ huyết thống. Hiện nay chỉ duy nhất
bộ kit Globalfiler 24 locus gen của hãng Appliedbiosystem là được Viện Pháp y
Quân độ i xác định tần suất và áp dụ ng cho hệ gen người Việt để giám định ADN
truy nguyên cá thể hay xác định huyế t thống.
1.1.2 Tầm quan trọng của việ c nghiên cứu tần suất alen.
Một bảng gồm các giá trị tương đối của các alen của từng locus trong một
quần thể cụ thể được gọi là một cơ sở dữ liệu tần suấ t STR.[8]
Các cơ sở dữ liệu tần suất STR của mộ t quầ n thể người được xây dựng cho
việc đánh giá và phân tích. Dựa trên các cơ sở dữ liệu có thể truy xuất từ mộ t bộ
hồ sơ ADN của một người nào đó về thơng tin nguồn gốc, chủng tộc của người
này. Một cơ sở dữ liệu phả i được xây dựng trên một kích thước mẫu đủ lớn nhằm
đảm b ảo giảm sai s ố do kích thước mẫu. Mụ c đích lớn nhất c ủa việc xây dựng cơ
sở dữ liệu nhằm tạo dựng bộ thông tin di truyền của một qu ần th ể về các alen phổ
biến trong quần thể đó [9], [10].
Mỗi cá thể người có cấu trúc di truyền riêng khơng ai giống ai, trừ những
trường hợp sinh ra cùng một trứng. Nế u xét rộng trong cả một qu ần th ể thì một s ố
đặc điểm di truyền - ADN ở các cá thể khác nhau vẫn có thể giố ng nhau [11]. Mặt
khác mỗi một qu ần th ể người khác nhau cũng có những đặ c điểm di truyền đặc
trưng thể hiện bằng sự phân bố tầ n suất alen trong mỗi qu ần thể [12], [13]. Do vậy,
trong giám định ADN các nhà khoa học hình sự ngồi lựa chọn, nghiên cứu những
locus có tính đa alen cao thì cần khảo sát tần su ất phân bố các alen trong qu ần thể
của từng locus để sử d ụng trong tính tốn và kết luận giám định. Quần thể được
nghiên cứu khảo sát phải đạ t được các yêu cầu trong thống kê, di truyền như: các
mẫu dùng trong nghiên cứu phải đảm b ảotính ngẫu nhiên, khơng có quan hệ huyết
thống trong 3 đời [14], [15].
Để có được tần su ất c ủa mỗi alen, trước hết ph ải tìm được số lần xuất hiện
của mỗi alen trong quần thể nghiên cứu sau đó tính tầ n suất lý thuy ết củ a alen đó

theo định luật di truyề n quần th ể [16]. Khi có được tần suất thực tế và tần suất lý
thuyết của mỗi alen, chúng ta tiến hành kiểm đ ịnh xem tần suất alen có được chấ p

5


nhận với mức xác suất đã ch ọn. Giám định gen (ADN) đòi hỏi cơ sở khoa họ c
vững chắc để tính tốn xác suất một người ngẫu nhiên trong quần thể là người có
cấu trúc di truyền đặc trưng trùng lặp với ADN trong các mẫu vậ t, d ấu vết thu thập
trong q trình điều tra.
Nếu khơng có tần suất alen thì khơng tính tốn được tần suất xuấ t hiện của
một kiểu gen nào đó trong mộ t quầ n thể nhất định, đó cũng là cơ sở khoa học để so
sánh độ tin cậ y trong trường h ợp phân tích được nhiều locus gen hoặc ít locus gen
hơn [16], [17].
1.2 Tng quan về STR, Alen, locus gen.
1.2.1 STR ( Short tandem repeat) là gì.
STR là đoạn trình tự đa hình nằm trong vùng khơng mã hóa, có cấu trúc gồm
các đoạn lặp lại c ủa mộ t trình tự nucleotit có đ ộ dài khoảng 2 – 6 bp, chiếm
khoảng 3% hệ gen người. Do nằm ngồi vùng mã hóa, các STR rất đa dạng giữa
người với người v ề độ dài có th ể lên đế n hàng nghìn base, trình tự đoạ n lặp mà
không ảnh hưởng đến hoạt đ ộng sinh học của tế bào. Các đo ạn lặp lại này nằm rải
rác ở khắp nơi trong hệ gen của người. Từ những năm 1990 đế n nay đã có hàng
chục nghìn STR trên các nhiễm sắc thể (NST) được phát hiện [18], [19].
Các cấu trúc STR đều mang tính bảo thủ cao, được di truy ền qua các th ế hệ
và mang tính đặc trưng cho cá thể. Các gen này thường có tính đa hình cao, ít đột
biến, tương đố i bền vững và cho phép đồ ng th ời thực hiện được phả n ứng nhân
gen của nhiều gen khác nhau [1], [2], [3], [4]. Dựa trên tính đa hình của các cấu
trúc STR về chiều dài: Một s ố gốc nucleotid được lặp đi lặp lại nhiều lần trên
chiều dài của đoạn ADN.
Ví dụ: tại locus TH01 của một cá th ể, các alen phân biệt nhau bằng số

đoạn lặp AATG.
Alen thứ nhất: AATG AATG AATG AATG AATG AATG -> có 6 đoạn
lặp AATG.
Alen thứ hai: AATG AATG AATG AATG AATG AATG AATG
AATG AATG -> có 9 đoạn lặp AATG
Locus TH01 này là dị hợp tử v ới các alen là: 6 - 9.

6


Hình 1.1 Locus TH01 của 01 cá thể

Ngoại trừ trường hợp song sinh cùng trứng, số lượng lặp lại c ủa các STR là
độc nhấ t cho từng cá thể, được di truyề n từ b ố mẹ sang con cái và phân biệt các cá
thể khơng có quan hệ huyết thống trực hệ. Vì vậy các cá thể khác nhau sẽ có số
lượng lặp lại củ a các STR khá c nhau. Bộ chỉ th ị gồm nhiều các STR nằm trên các
nhiễm sắc thể khác nhau cho phép phân biệt các cá thể riêng biệt, ngay cả với
những cá thể có quan hệ họ hàng gần gũi. Đố i với nghiên cứu di truyền quần thể,
cơ sở di truyề n của nghiên cứu dựa trên hai định luật căn bản củ a di truy ền học
Mendel đó là định luật di truy ền phân ly độc lập và định luật di truy ền phân ly. Do
đó, các chỉ số về di truy ền liên kế t cân bằng và cân bằng Hardy-Weinberg được
kiểm đ ịnh đồng thời các phép tính thống kê được sử dụ ng nhằm tăng tính chính
xác, giảm sai số trong phân tích [18], [19].
Trong giám định Pháp y, xác định danh tính có thể được hiểu là sự so sánh
hồ sơ ADN của mộ t người nào đó, lấy từ các mẫu dấu vết sinh h ọc vương lại như
vết máu, đầu lọc thuốc lá, b àn chải đánh răng, lơng, tóc, .... hoặc từ các dấu vế t của
một vụ án hiếp dâm như: dịch âm đạo, bao cao su, dịch trên quần lót, băng vệ
sinh.....với mộ t người khác có mối liên quan, hoặc nghi can giả định nhằm xác
định danh tính hoặc lo ại trừ khả năng.
Từ nghiên cứu của Gill và CS (1996), Carracedo và Lareu (1998) [4] Tiêu

chuẩn của các locus STR sử dụng trong nhận dạng cá thể gồm:
 Có tính bề n vững cao (tần suất đột biến th ấp)
 Locus STR phải có tính đa hình, khả năng phân biệ t cao (thường lớn hơn
0,9) và các dạng dị hợp tử quan sát được lớn hơn 70%. Điều này giúp các nhà phân

7


tích chỉ sử dụng một số locus tối thiểu đã đạt được sự phân biệt cá thể một cách tốt
nhất
 Nằm trên vùng nhiễm sắc thể riêng biệt và không lựa chọn những vị trí
liên kết gần
 Dễ dàng nhân bội bằng phản ứng PCR
 Đặc tính Stutter thấp
 Chiều dài đoạ n (locus) ADN được nhân bội trong khoảng 90 – 500bp,
với kích thước đoạ n ADN ngắn phù hợp cho việc phân tích những mẫu dấ u vết bị
suy thối thường gặp trong lĩnh vực hình sự.
1.2.2 Alen là gì.
Alen là các trạng thái khác nhau của cùng một gen. Mỗi cá th ể đều có hai
alen cho mỗi một locus, trong đó một alen di truy ền từ b ố, mộ t alen di truy ền từ
mẹ. Nếu hai alen của một locus hoàn toàn giống nhau thì được gọi là đồng hợp tử,
cịn khác nhau được gọ i là dị hợp tử [20].
1.2.3

Locus là gì.

Locus: là v ị tr í cụ thể c ủa một gen nào đó trên nhiễm sắc thể mang ADN
chứa gen đó. Nói cá ch khác locus là vị trí vật lý của gen trên phân tử ADN, giống
như một địa chỉ, mộ t nhà trên đường phố [20], [21].


Hình 1.2 Các locus trên một nhiễm sắc thể.

Năm 1997, Cụ c điều tra Liên bang của Mỹ (FBI) công bố lựa chọn 13 locus
STR để tạo thành cơ sở dữ liệu quốc gia Hoa Kỳ, gồm: D5S818, D7S820,
D8S1179, D13S317, D16S539, D18S51, D21S11, FGA, TH01, TPOX, vWA [38].
Vào đầu năm 2015, FBI thông báo dự án nghiên cứu bổ sung thêm 7 locus vào hệ
Codis, có hiệu lực từ ngày 1 tháng 1 năm 2017 gồm: D1S1656, D2S441,
D2S1338, D10S1248, D12S391, D19S433, D22S1045. Đây đều là các locus trong
hệ Global filer.

8


Hình 1.3 Vị trí của 13 Locus trong CoDis trên NST

1.3 Tình hình nghiên cứu trong và ngồi nước.
1.3.1 Tình hình nghiên cứu trong nước.
Giám định ADN trong Pháp y ở Việt Nam bắt đầu phát triển mạnh

mẽ từ

những năm 2000. Đầu tiên được triể n khai tại Viện Khoa học hình sự Bộ Cơng An.
Ban đầu chỉ là các bộ kit 10 locus, 13 locus, và gần đây



16

locus,


24

locus.
Sau đó công tác giám định ADN được nhiều cơ quan, viện nghiên

cứu,

công ty thương mại tham gia như: Viện Pháp y Qn đội - Bộ Qu ốc phị ng, Viện
cơng nghệ sinh học - Việ n Hàn Lâm Khoa học Việt Nam,

Công

ty

Gentis,

công ty CGAT.....
Năm 2000, đề tài c ấp Bộ nghiên cứu khảo sát và xây dựng tần suất của
các gen trong hệ Nineplex (10 locusgen, trong đó có 1 locus gen xác định
tính) được triể n khai vào năm 2002 đã được nghiệm thu đưa vào
cơ sở tính tốn kết quả giám định ADN [11] tại Viện Khoa

giới

sử d ụng làm

Học Hình Sự.

Năm 2006, Viện Phá p y Quân Đội được trang bị và triển khai sử dụng kit
phân tích ADN hệ powerplex 16 (gồm 15 locus gen và 1 locus gen xác định giới

tính) để tăng hiệ u quả phân tích gen (ADN) phục vụ cho cơng tác điều tra, phá án,
tìm kiếm nạn nhân trong các vụ việc cũng như trong các vụ giám định ngoài tố
tụng...

9



×