Tải bản đầy đủ (.pdf) (80 trang)

Khảo sát tần suất các alen trong các locus gen (ADN) hệ Identifiler của dân tộc H’Mông phục vụ cho công tác giám định gen ở Việt Nam (LV thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (998.71 KB, 80 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT

NGUYỄN NHƢ GIANG

KHẢO SÁT TẦN SUẤT CÁC ALEN TRONG CÁC
LOCUS GEN (ADN) HỆ IDENTIFILER CỦA
DÂN TỘC H’MÔNG PHỤC VỤ CÔNG TÁC
GIÁM ĐỊNH GEN Ở VIỆT NAM

LUẬN VĂN THẠC SỸ SINH HỌC

HÀ NỘI - NĂM 2014

Số hóa bởi trung tâm Học liệu– ĐHTN




BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT

LUẬN VĂN THẠC SỸ SINH HỌC



Đề tài:
KHẢO SÁT TẦN SUẤT CÁC ALEN TRONG CÁC
LOCUS GEN (ADN) HỆ IDENTIFILER CỦA
DÂN TỘC H’MÔNG PHỤC VỤ CÔNG TÁC
GIÁM ĐỊNH GEN Ở VIỆT NAM

Học viên

: Nguyễn Nhƣ Giang

Chuyên ngành

: Hóa Sinh

Mã số

: 60 42 01 14

Ngƣời hƣớng dẫn

: PGS. TS Nguyễn Văn Hà

NĂM 2014

Số hóa bởi trung tâm Học liệu– ĐHTN





LỜI CẢM ƠN
Lời đầu tiên, tôi xin được gửi lời cảm ơn tới các Thầy, cô đã giảng dạy tại
Viện sinh thái và tài nguyên sinh vật - Viện hàn lâm khoa học và công nghệ Việt
Nam đã truyền đạt cho tôi những kiến thức cơ bản và chuyên sâu về lĩnh vực
Công nghệ sinh học, làm tiền đề cho tôi hoàn thành Luận văn tốt nghiệp.
Tôi cũng xin được bày tỏ lòng biết ơn sâu sắc tới PGS. TS Nguyễn Văn Hà
- Phó giám đốc Trung tâm giám định sinh học pháp lý - Viện Khoa học hình sự
đã tận tình hướng dẫn trong thời gian tôi thực hiện luận văn này.
Tôi xin cảm ơn Lãnh đạo Viện khoa học hình sự, Lãnh đạo Trung tâm giám
định sinh học pháp lý, toàn bộ tập thể cán bộ Trung tâm đã tạo mọi điều kiện
giúp đỡ tôi.
Cuối cùng, tôi xin cảm ơn gia đình đã luôn tạo điều kiện tốt nhất cho tôi
trong suốt quá trình học cũng như hoàn thành luận văn tốt nghiệp.
Hà Nội, ngày 10 tháng 12 năm 2014
Học viên

Nguyễn Nhƣ Giang

Số hóa bởi trung tâm Học liệu– ĐHTN




CÁC KÍ HIỆU VIẾT TẮT
ADN

Axit Deoxyribonucleic

STR


Short Tandem Repeats

PCR

Polymerase chain Reaction

D8

D8S1179

D21

D21S11

D7

D7S820

CSF

CSF1PO

D3

D3 S1358

THO1

HUMTHO1


D13

D13S317

D16

D16S539

D2

D2 S1338

D19

D19S433

D18

D18S51

D5

D5 S818

χ²

Khi bình phương thành phần thí nghiệm

χα


Khi bình phương tiêu chuẩn

Số hóa bởi trung tâm Học liệu– ĐHTN




MỤC LỤC
MỞ ĐẦU .......................................................................................................... 1
CHƢƠNG 1. TỔNG QUAN TÀI LIỆU ........................................................ 5
1. Tình hình nghiên cứu trong và ngoài nước về khảo sát tần suất các
alen của các locus gen sử dụng trong giám định ADN. ................................. 5
1.1. Tình hình nghiên cứu trên thế giới..................................................... 5
1.2. Tình hình nghiên cứu tại Việt nam .................................................... 5
2. Giám định gen (ADN) ....................................................................................... 6
2.1. Cơ sở khoa học của giám định gen .................................................... 6
2.1.1. Cấu trúc, chức năng của phân tử ADN ........................................... 6
2.1.2. Cơ chế phân ly độc lập và tổ hợp tự do trong sinh sản hữu tính .... 7
2.2. Lịch sử phát triển giám định ADN ................................................... 8
2.3. Khái niệm giám định gen (ADN)..................................................... 10
2.4. Khái niệm về locus và alen .............................................................. 12
2.5. Các tiêu chuẩn cho locus STR dùng trong giám định ADN ............ 13
2.6. Ý nghĩa của cơ sở dữ liệu tần suất alen của các locus STR............ 14
CHƢƠNG 2. NỘI DUNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU ............ 16
1. Nội dung nghiên cứu:....................................................................................... 16
2. Phương pháp nghiên cứu: ............................................................................... 16
2.1. Thu mẫu: ......................................................................................... 16
2.2. Hóa chất, thiết bị và dụng cụ: .......................................................... 17
2.2.1. Hóa chất và thiết bị cho tách chiết ADN ...................................... 17
2.2.2. Hóa chất và thiết bị cho định lượng ADN .................................... 18

2.2.3. Hóa chất và thiết bị cho nhân bội và điện di ................................. 18
2.3. Phân tích mẫu ................................................................................................. 18
2.3.1. Tách chiết mẫu bằng chelex ......................................................... 18
2.3.2. Định lượng ADN bằng Realtime PCR......................................... 19
2.3.3. Nhân bội ADN (PCR) .................................................................. 20
2.3.4. Điện di trên máy điện di mao dẫn (Capillary Electrophoresis- CE)
................................................................................................................. 22
Số hóa bởi trung tâm Học liệu– ĐHTN




2.4. Xử lý thống kê số liệu và tính tần suất các locus gen .......................... 25
2.4.1. Cơ sở lý thuyết .............................................................................. 25
2.4.2. Phương pháp xử lý thống kê ........................................................ 25
2.4.3. Các bước tính toán thống kê và kiểm định tiến hành trên phần
mềm Excel:.............................................................................................. 26
CHƢƠNG 3. KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN ....................... 27
1. Kết quả ................................................................................................................. 27
1.1. Thu mẫu ........................................................................................... 27
1.2. Phân tích mẫu thu được kiểu gen theo yêu cầu và lập được bảng
kiểu gen của 120 cá thể. (Xem bảng 3 - phụ lục) .......................................... 27
1.3. Xử lý số liệu thống kê (Xem bảng 3.1 đến 3.15); tính được bảng tần
suất của các mẫu nghiên cứu (Xem bảng 3.16 đến 3.30); và so sánh với
một số quần thể người Việt và người nước ngoài (Xem bảng 3.31 đến
3.45). ......................................................................................................................... 27
1.3.1. Xử lý số liệu thống kê ................................................................... 27
1.3.2. Bảng tần suất của các mẫu nghiên cứu ......................................... 49
Bảng kết quả và thảo luận cơ sở dữ liệu tần suất phân bố các alen của 15
locus gen (gồm bảng 3.16 đến bảng 3.30) .............................................. 49

1.3.3. Kết quả so sánh tần suất alen của người H’Mông với một số người
tộc người (xem Bảng từ 3.31 đến 3.45) và biện luận : ........................... 56
2. Bàn luận ............................................................................................................. 68
KẾT LUẬN VÀ KIẾN NGHỊ ...................................................................... 69
1. Kết luận ............................................................................................................... 69
2. Kiến nghị ............................................................................................................. 70
TÀI LIỆU THAM KHẢO
PHỤ LỤC
ỨNG DỤNG ĐỀ TÀI

Số hóa bởi trung tâm Học liệu– ĐHTN




DANH MỤC CÁC HÌNH, BẢNG BIỂU
Hình 1. Cấu trúc ADN trong nhân tế bào (trang 7)
Hình 2. Các locus gen hệ Identifiler (trang 24)
Bảng 2.1. Thành phần phản ứng Realtime PCR (trang 20)
Bảng 2.2. Chu trình nhiệt của phản ứng PCR trên máy realtime 7500 (trang 20)
Bảng 2.3. Thành phần của phản ứng PCR (trang 22)
Bảng 2.4. Chu trình nhiệt trên máy PCR 9700 (trang 22)
Bảng 2.5. Thành phần của hỗn hợp điện di (trang 24)
Bảng 3.1 đến 3.15. Xử lý số liệu thống kê (trang 27 đến trang 46)
Bảng 3.16 đến 3.30 Bảng tần suất alen của 120 mẫu nghiên cứu (trang 49 đến trang 55)
Bảng 3.31 đến 3.45. So sánh tần suất alen với một số quần thể (trang 56 đến trang 67)
Bảng 1: Danh sách người H’ Mông được thu mẫu (Phần phụ lục)
Bảng 2: Kết quả định lượng 120 mẫu ADN của 120 cá thể người H’Mông (Phần
phụ lục)
Bảng 3: Kết quả kiểu gen 120 cá thể người H’ Mông (kí hiệu HM1 đến HM120)

(Phần phụ lục)

Số hóa bởi trung tâm Học liệu– ĐHTN




MỞ ĐẦU
Cơ sở khoa học, thực tiễn và tính cấp thiết của việc nghiên cứu đề tài:
Người đầu tiên đặt nền móng cho ngành di truyền học là Mendel. Ông
là người đầu tiên phát hiện ra các quy luật di truyền. Mendel đã gọi những đặc
điểm được truyền từ thế hệ này qua thế hệ khác là “nhân tố di truyền”, mà sau
này được gọi là gen.
Trong nhân tế bào, các nhiễm sắc thể sắp xếp thành 23 cặp, trong đó 22
cặp nhiễm sắc thể thường và 1 cặp nhiễm sắc thể giới tính. Các cặp nhiễm sắc
thể này quy định các tính trạng khác nhau của cơ thể, được bảo tồn duy trì
trong thế hệ và được di truyền từ thế hệ này sang thế hệ khác. Con cái được
thừa hưởng các đặc tính di truyền thông qua 23 nhiễm sắc thể từ tinh trùng
của bố và 23 nhiễm sắc thể từ tế bào trứng của mẹ. Xét nghiệm truy nguyên
cá thể người cũng như xác định huyết thống trực hệ cha - con, mẹ - con chủ
yếu được thực hiện bằng cách sử dụng các marker ADN nằm trên các NST
trong nhân tế bào. Ngoài ra phân tích các marker trên nhiễm sắc thể Y còn có
thể xác định quan hệ huyết thống theo dòng cha.
ADN thường được coi là vật liệu di truyền ở cấp độ phân tử tham gia
quyết định các tính trạng. Trong quá trình sinh sản, phân tử ADN được nhân
đôi và truyền cho thế hệ sau. Năm 1953, Watson và Crick đã xây dựng mô
hình cấu trúc không gian của phân tử ADN. Theo hai ông, ADN có cấu trúc
từ hai sợi xoắn kép có phân tử lượng rất lớn, mỗi sợi ADN là một chuỗi xoắn
nucleotid gồm 4 loại bazơ nitơ: Adenin (A), Guanin (G), Cytosin (C) và
Thymin (T) sắp xếp kế tiếp nhau, xoắn đều quanh một trục theo chiều từ trái

sang phải như một thang dây xoắn, mà 2 tay thang là các phân tử đường
(C5H10O4) và axit phôtphoric sắp xếp xen kẽ nhau, còn mỗi bậc thang là một
cặp bazơ nitric đứng đối diện và liên kết với nhau bằng các liên kết hiđrô theo
nguyên tắc bổ sung, nghĩa là một bazơ lớn (A hoặc G) được bù bằng một
1


bazơ bé (T hoặc C) hay ngược lại. Do đặc điểm cấu trúc, Adenin chỉ liên kết
với Thymin bằng 2 liên kết hiđrô và Guanin chỉ liên kết với Cytosin bằng 3
liên kết hiđrô. Do các cặp nuclêôtit liên kết với nhau theo nguyên tắc bổ sung,
chiều rộng của chuỗi xoắn kép bằng 20Å , khoảng cách giữa các bậc thang
trên chuỗi xoắn bằng 3,4Å, phân tử ADN xoắn theo chu kỳ xoắn, mỗi chu kỳ
xoắn có 10 cặp nucleotit có chiều cao 34Å.
Nghiên cứu và ứng dụng công nghệ ADN vào công tác đấu tranh
phòng chống tội phạm là một mũi nhọn đã được thực hiện ở nhiều quốc gia từ
những năm 80 của thế kỷ XX. Cùng với sự tiến bộ của khoa học công nghệ,
giám định ADN ngày càng phát triển, hoàn thiện cả về công nghệ, phương
pháp và khả năng đáp ứng nhu cầu chung của pháp luật và của cả xã hội. Kết
luận của giám định ADN mang tính quyết định đối với các vụ việc mang tính
hình sự, dân sự như truy nguyên cá thể, xác định quan hệ huyết thống, xác
định tung tích nạn nhân trong các vụ thảm họa, chiến tranh… là rất cần thiết
và cấp bách. Tuy nhiên, để bảo đảm tính khoa học và tính pháp lý thì các
phòng thí nghiệm giám định ADN cần phải có tần suất các alen của các locus
gen để sử dụng khi dùng phân tích, kết luận giám định ADN cho mỗi một
quần thể người (dân tộc). Việc nghiên cứu, khảo sát tần suất alen của các
locus gen dùng trong giám định ADN của các dân tộc trên thế giới đã được
tiến hành ở mức cơ bản. Tuy nhiên tùy thuộc vào số dân tộc ở mỗi quốc gia
cũng như phụ thuộc vào năng lực giám định ADN của mỗi nước, các công bố
về tần suất alen của các locus gen dùng trong giám định ADN ở mỗi nước
khác nhau đối với mỗi dân tộc khác nhau là khác nhau.

Trong các điều kiện cần phải có khi kết luận giám định ADN thì có một
điều kiện bắt buộc đó là phải có cơ sở dữ liệu tần suất alen của các locus gen
dùng cho giám định gen đối mỗi quần thể người (dân tộc) cụ thể. Hiện nay,
trên thế giới, các đơn vị giám định ADN đang sử dụng phổ biến các bộ Kit
với 16 locus gen như bộ kit Identifiler, Identifiler Plus và Identifiler Direct
2


(hãng AB, Mỹ) hoặc bộ kit Powerplex (hãng Promega, Mỹ)… để tính toán tần
suất xuất hiện của các alen. Trên cơ sở đó tính toán xác suất trùng nhau giữa
các mẫu khi phải truy nguyên đồng nhất hoặc xác suất quan hệ huyết thống
giữa các mẫu khi phải xác định quan hệ huyết thống trong giám định ADN.
Ở Việt Nam hiện nay, Viện Khoa học hình sự và đa số các cơ quan, tổ
chức giám định đang sử dụng các bộ kit Identifiler, Identifiler Plus, và
Identifiler Direct cho giám định ADN. Năm 2011, bảng tần suất các alen của
các locus gen của hệ Identifiler trong quần thể người Việt (Kinh) được công
bố trên tạp chí ForensicAsia. Cho đến nay, chưa có một nghiên cứu nào được
công bố về khảo sát sự phân bố tần suất các alen của các locus gen hệ
Identifiler (gồm 15 gen) trong quần thể người H’Mông. Với dân số khoảng
80.000 người (đứng thứ 8 trong tổng số 54 các dân tộc Việt Nam), dân tộc
H’Mông phân bố khắp trên các tỉnh miền núi phía Bắc Việt Nam: Quảng
Ninh, Lạng Sơn, Bắc Cạn, Cao Bằng, Hà Giang, Tuyên Quang, Yên Bái, Lào
Cai, Lai Châu, Điện Biên, Sơn La, Hoà Bình, Thanh Hoá, Nghệ An và số ít ở
Phú Thọ, cũng như các tỉnh Tây Nguyên, đây là những điểm nóng về tình
hình an ninh và trật tự xã hội, số vụ án trong cộng đồng người H’Mông có
diễn biến phức tạp với xu hướng ngày càng gia tăng. Vì vậy, việc tiến hành
triển khai đề tài nghiên cứu: “Khảo sát tần suất các alen trong các locus gen
(ADN) hệ Identifiler của dân tộc H’Mông phục vụ cho công tác giám định
gen ở Việt Nam” là một yêu cầu cấp thiết.
Mục đích của đề tài :

1. Khảo sát tần suất các alen trong các locus gen (ADN) hệ Identifiler
của dân tộc H’Mông phục vụ công tác giám định gen ở Việt Nam.
2. Trên cơ sở đó, tính tần suất xuất hiện của mỗi alen trong từng locus
của dân tộc H’Mông, làm cơ sở khoa học để phân tích, đánh giá và
đưa ra kết luận giám định truy nguyên huyết thống hoặc truy nguyên
cá thể.
3


Nội dung của đề tài, các vấn đề cần giải quyết
Đề tài sẽ bao gồm một số nội dung chính với các vấn đề cần giải quyết sau:
- Thu thập 120 mẫu tế bào niêm mạc miệng của cá thể người H’Mông
không có quan hệ họ hàng ở các tỉnh khác nhau (có thông tin cá
nhân).
- Tách chiết ADN bằng phương pháp tách chiết vô cơ, sử dụng chelex
100 (hãng Bio - Rad, Mỹ).
- Định lượng ADN bằng phương pháp Real-time PCR sử dụng bộ Kit
Quantifiler® Human DNA Quantification (hãng ABI, Mỹ).
- Nhân bội ADN trên máy tạo chu trình nhiệt ABI – 9700 bằng bộ Kit
Identifiler (hãng ABI, Mỹ).
- Điện di và phân tích kết quả trên máy Phân tích gen ABI – 3130 với
phần mềm GeneMapper ID của hàng ABI (Mỹ).
- Phân tích kiểu gen (ADN) của các locus gen hệ Identifiler (15 locus
gen) của 120 cá thể người H’Mông. Từ cơ sở đó, tính tần suất xuất
hiện của mỗi alen của từng locus trong quần thể, kiểm định tính
chính xác của số lượng mẫu trong khảo sát với độ tin cậy p = 0,05.
Kết quả là bảng tần suất các alen của các locus gen hệ Identifiler
quần thể người H’Mông làm cơ sở khoa học để các cơ quan giám
định, các cơ quan tố tụng hình sự, dân sự sử dụng phân tích và đưa
ra kết luận trong giám định gen.

Đề tài này khi được hoàn thành sẽ đáp ứng yêu cầu của giám định
gen ở Việt Nam nói chung và đóng góp vào nhiệm vụ giám định ADN
cho các lực lượng thực thi pháp luật trên toàn cầu, nhất là trong bối
cảnh toàn cầu hóa giữa cảnh sát các nước thông qua Interpol.

4


CHƢƠNG 1. TỔNG QUAN TÀI LIỆU
1. Tình hình nghiên cứu trong và ngoài nƣớc về khảo sát tần suất các
alen của các locus gen sử dụng trong giám định ADN.
1.1. Tình hình nghiên cứu trên thế giới
Trên thế giới, ở các nước có phòng giám định gen đều đã nghiên cứu,
khảo sát và công bố kết quả của mình về sự phân bố tần suất các alen của các
gen hình sự. Ví dụ như tập đoàn Applied Biosystem (Mỹ) khảo sát 15 gen của
người Mỹ - Phi, người Mỹ - Tây Ban Nha ... Kết quả khảo sát 15 gen của
người Malaixia, Philipin, Hàn quốc, Guatemala, Sudan, Thái lan, Vênêzuela,
Bănglađet, Inđônêsia... đã được công bố. Đây là những số liệu rất có giá trị
không chỉ đối với lĩnh vực giám định gen của các nước đó mà còn có giá trị
về mặt khoa học đối với các giám định viên và các nhà khoa học nghiên cứu
về gen sử dụng trong giám định ADN trên thế giới [15, 26, 27].
Trong giám định ADN, bên cạnh việc sử dụng rộng rãi bộ kít của hãng
Applied Biosystem, bộ kít của hãng Promega cũng được nhiều nơi sử dụng
[14]. Ví dụ tại Mỹ, mỗi bang có từ 1 đến nhiều phòng thí nghiệm giám định
ADN và có thể dùng kit hệ Identifiler hoặc kit PowerPlex. Để thống nhất trên
toàn nước Mỹ, cảnh sát liên bang Mỹ (FBI) hiện dùng cơ sở dữ liệu tần suất
của 13 locus gen (trùng nhau trong hệ Identifiler và hệ PowerPlex) trong phần
mềm CODIS (Combined DNA index system) - một phần mềm nổi tiếng để
truy xuất, tìm kiếm, so sánh dữ liệu trong giám định ADN. Phần mềm này
đang được triển khai ở 49 quốc gia và vùng lãnh thổ trên thế giới.

1.2. Tình hình nghiên cứu tại Việt nam
Giám định gen ở Việt Nam bắt đầu triển khai chính thức từ tháng 4 năm
1999 tại Viện Khoa học hình sự, toàn bộ quy trình giám định gen được
chuyển giao từ Viện Khoa học hình sự - Bang Victoria giám định viên được đào tạo cơ bản tại

5

c cùng đội ngũ

c. Năm 2000, đề tài cấp Bộ nghiên


cứu khảo sát và xây dựng tần suất của các gen trong hệ Nineplex (10 locus
gen, trong đó có 1 locus gen xác định giới tính) được triển khai và năm 2002
đã được nghiệm thu đưa vào sử dụng làm cơ sở tính toán kết quả giám định
ADN [4] tại Viện Khoa học hình sự.
Năm 2006, Viện Khoa học hình sự - Bộ Công an được trang bị và triển
khai sử dụng kit phân tích ADN hệ Identifiler (gồm 15 locus gen và 1 locus
gen xác định giới tính) để tăng hiệu quả phân tích gen (ADN) phục vụ cho
công tác điều tra, phá án, tìm kiếm nạn nhân trong các vụ việc cũng như trong
các vụ giám định ngoài tố tụng .... Do tần suất xuất hiện của mỗi alen của các
locus gen trong hệ Identifiler ở mỗi quần thể dân tộc khác nhau là có sự phân
bố alen khác nhau. Yêu cầu cấp thiết đặt ra là phải xây dựng được tần suất
phân bố các alen của các locus gen hệ Identifiler trong quần thể của mỗi dân
tộc sinh sống trên lãnh thổ Việt Nam [28, 29].
Đến năm 2011, một đề tài cấp bộ do Viện Khoa học hình sự chủ trì đã
hoàn thành việc khảo sát tần suất alen các locus gen hệ Identifiler trong quần
thể người Việt (Kinh) với 170 cá thể.
Ở Việt Nam, cho đến nay chưa có một nghiên cứu hoàn chỉnh nào được
công bố về khảo sát sự phân bố tần suất các alen của các locus gen hệ

Identifiler trong quần thể người H’Mông được công bố.
2. Giám định gen (ADN)
2.1. Cơ sở khoa học của giám định gen
2.1.1. Cấu trúc, chức năng của phân tử ADN
Năm 1953, hai nhà nghiên cứu khoa học James D.Watson (Mỹ) và
Francis H.C Crick (Anh) đã công bố mô hình cấu trúc chuỗi xoắn kép phân tử
ADN. Đây là dấu mốc chính thức đánh dấu sự ra đời của Sinh học phân tử.
Các nhà khoa học đã phát hiện ra bản chất di truyền nằm trên cấu trúc
nhiễm sắc thể. Nhiễm sắc thể được cấu trúc từ phân tử ADN kết hợp với các
6


protein kiềm (histon). Phân tử ADN là một chuỗi xoắn kép gồm hai mạch
đơn, mỗi mạch đơn là một chuỗi nucleotide. Mỗi nucleotide gồm nhóm
phosphate, đường deoxyribose và một trong bốn base (adenine, cytosine,
guanine và thymine). Hai mạch đơn kết hợp với nhau nhờ các liên kết hydro
hình thành giữa các base bổ xung nằm trên hai mạch: base adenine (A) liên
kết với base thymine (T) bằng hai liên kết hydro (A=T); base cytosine (C) liên
kết với base guanine (G) bằng ba liên kềt hydro (CG). Mỗi mạch đơn là một
trình tự có định hướng với một đầu là đầu 5'phosphate tự do và một đầu là
3'hydroxyl tự do (hướng quy ước là 5’3'). Hướng của hai mạch đơn trong
chuỗi xoắn kép ngược nhau và là hai mạch đối song song.

Hình 1. Cấu trúc ADN
2.1.2. Cơ chế phân ly độc lập và tổ hợp tự do trong sinh sản hữu tính
Năm 1956, Joe Hin Tjio và Albert Levan đã xác định chính xác ở
người, trong nhân tế bào thể (tế bào lưỡng bội) có 46 nhiễm sắc thể (NST)
được xếp thành 23 cặp đồng dạng: 22 cặp nhiễm sắc thể thường và một cặp

7



nhiễm sắc thể giới tính. Riêng tế bào trứng và tế bào tinh trùng chỉ có 23
nhiễm sắc thể (tế bào đơn bội). Thế hệ con cái nhận từ mẹ 23 nhiễm sắc thể
thông qua tế bào trứng và 23 nhiễm sắc thể từ cha thông qua tế bào tinh trùng.
Bộ nhiễm sắc thể được bảo tồn và truyền từ thế hệ này sang thế hệ khác và
mang tính đặc trưng cho loài người [19, 20,]. Theo định luật 1 và 2 của
Mendel, các nhiễm sắc thể phân ly độc lập, tổ hợp tự do đã góp phần tạo ra sự
đa dạng của các cá thể của mỗi loài thông qua sinh sản hữu tính. Đó là cơ sở
khoa học góp phần tạo nên sự khác biệt của mỗi cá thể trong quần thể, điều
mà chúng ta sử dụng để truy nguyên cá thể, xác định quan hệ huyết thống …
trong giám định gen.
2.2. Lịch sử phát triển giám định ADN
Năm 1985, Alec Jeffreys và các cộng sự ở trường đại học Leicester nước
Anh khi nghiên cứu các đoạn ADN mã hóa cho myoglobin trong máu người
đã phát hiện ra trình tự của các bazơnitơ được lặp lại một số lần với chiều dài
đoạn lặp từ 10 - 15 bp (base pair) hoặc vài chục bp, các đoạn lặp này được gọi
là tiểu vệ tinh (minisatellite) hay VNTR (Variable Number of Tandem
Repeats). Điều đáng chú ý là số lần lặp lại các đoạn lặp này ở các cá thể khác
nhau thì khác nhau. Alec Jeffreys coi đây là đặc điểm rất quan trọng để phân
biệt sự khác nhau giữa các cá thể và có thể sử dụng để truy nguyên cá thể.
Cũng vào thời điểm năm 1985, tác giả Karry Mullis và cộng sự đã công
bố kết quả thử nghiệm thành công phản ứng chuỗi nhân gen PCR (Polymerase
Chain Reaction). Thành công này là một chìa khóa để mở ra tất cả những
hướng nghiên cứu trong sinh học phân tử [13, 16].
Năm 1991, một phương pháp mới trong giám định ADN được giới
thiệu, đó là phương pháp phân tích sử dụng các đoạn lặp lại ngắn STR (Short
Tandem Repeats), các STR có đoạn lặp từ 2 - 6 bp.

8



Các cấu trúc STR đều mang tính bảo thủ cao, được di truyền qua các thế
hệ và mang tính đặc trưng cho cá thể. Các gen này thường có tính đa hình
cao, ít đột biến, tương đối bền vững và cho phép đồng thời thực hiện được
phản ứng nhân gen của nhiều gen khác nhau.
Dựa trên tính đa hình của các cấu trúc STR về chiều dài: Một số gốc
nucleotid được lặp đi lặp lại nhiều lần trên chiều dài của đoạn ADN.
Ví dụ: tại locus D7S820 của một cá thể, các alen phân biệt nhau bằng
số đoạn lặp GATA.
GATA GATA... ............GATA  có 8 đoạn lặp

Alen thứ nhất:
GATA
Alen thứ hai:

GATA GATA GATA... GATA 12 đoạn lặp GATA

Locus D7S820 này là dị hợp tử với các alen là: 8 - 12.
Các locus STR có ưu điểm hơn các locus VNTR vì chúng bền vững
hơn (ít bị đột biến và đứt gãy), có khả năng nhân tổ hợp được nhiều gen trong
cùng một phản ứng PCR và những mẫu đem phân tích ít nhiều có biến tính
vẫn có thể cho kết quả.
Tháng 10 năm 1990, tại Mỹ, Dự án hệ gen người (Human Genome
Project-HGP) chính thức khởi động. Đến ngày 12 tháng 02 năm 2001, HGP
và Celera đã công bố trình tự đầy đủ của hệ gen người. Đây là một sự kiện
trọng đại trong sự phát triển của sinh học phân tử nói chung và trong việc
nghiên cứu gen người nói riêng. Theo công bố này, số lượng gen trong bộ gen
người có khoảng 35000 gen, trong đó có hàng chục gen được nghiên cứu ứng
dụng để sử dụng xác định huyết thống và truy nguyên cá thể [19].

Đến những năm cuối thế kỷ 20, các nhà khoa học hình sự mới ứng
dụng công nghệ gen (DNA Technology) vào trong đấu tranh với tội phạm,
xác định huyết thống và định danh cá thể. Giám định gen (ADN) là một trong

9


những phương pháp khoa học có độ chính xác rất cao, giúp cơ quan pháp luật
xác định chính xác tội phạm, truy tìm tung tích nạn nhân cũng như xác định
quan hệ huyết thống [23, 24].
2.3. Khái niệm giám định gen (ADN)
Trong giám định kỹ thuật hình sự có nhiều phương pháp để truy
nguyên cá thể người và giám định ADN hiện nay là một trong những phương
pháp đắc lực nhất để giúp các nhà điều tra hình sự xác định chính xác tội
phạm, truy tìm tung tích nạn nhân cũng như xác định quan hệ huyết thống
[13]. Từ năm 1987 đến nay, phương pháp giám định ADN từ các mẫu vật có
nguồn gốc cơ thể người được phát triển mạnh mẽ do tính chính xác, khả năng
truy nguyên cao và đa dạng về loại mẫu vật. Tính ưu việt của giám định gen
là truy nguyên được cá thể người, xác định quan hệ huyết thống cha - con mẹ, xác định danh tính hài cốt... Ban đầu, giám định gen được gọi là giám
định vân tay di truyền (DNA - "fingerprinting"), về sau để tránh sự hiểu lầm
giữa giám định đường vân và giám định gen, Uỷ ban nghiên cứu quốc gia Mỹ
(NRC) đề nghị đổi là truy nguyên ADN (DNA - profiling) [14, 20].
Giám định gen (ADN) là nghiên cứu, phân tích ADN từ các dấu vết,
vật chứng có nguồn gốc cơ thể người bằng kỹ thuật gen.Thông qua phân tích
ADN để xác định truy nguyên, nhận dạng cá thể người hoặc xác định quan hệ
huyết thống [19]. Trong đó, giám định gen trong nhân tế bào trên các nhiễm
sắc thể thường là phổ biến để tính toán truy nguyên cá thể hoặc xác định quan
hệ huyết thống. Giám định gen trên nhiễm sắc thể giới tính được quan tâm
nhiều ở các locus trên nhiễm sắc thể Y nhằm truy nguyên theo dòng cha.
Giám định gen ti thể để xác định quan hệ huyết thống theo dòng mẹ, đây là

loại giám định truy nguyên theo nhóm …
Số lượng locus gen được sử dụng phân tích càng nhiều thì khi tính toán
xác suất xuất hiện để truy nguyên hoặc tính quan hệ huyết thống cho kết quả

10


có độ tin cậy càng cao. Theo tập đoàn Perkin-Elmer (Mỹ), khi phân tích tổ
hợp 9 locus gen hệ Profiler Plus thì khả năng trùng hợp ngẫu nhiên tổ hợp các
kiểu gen là vô cùng nhỏ, vì tần suất xuất hiện của chúng là khoảng 1/72 tỉ
[29].
Trong vài năm trở lại đây, trên thế giới cũng như ở Viện Khoa học hình
sự đã đưa vào sử dụng bộ kit Identifiler phân tích 16 locus gen bằng máy giải
trình tự gen ABI 3130 Genetic Analyzer [6, 15].
Đây là bộ kit phức hợp dùng nhân bội, phân tích đồng thời 16 locus
STR. Đặc điểm của các locus gen STR trong bộ kit này:
- Locus gen D8S1179 nằm trên nhiễm sắc thể số 8, dài 128 - 168 cặp
bazơ, có 12 alen
- Locus gen D21S11 nằm trên nhiễm sắc thể số 21, dài 189 - 243 cặp
bazơ, có 35 alen
- Locus gen D7S820 nằm trên nhánh dài nhiễm sắc thể số 7, dài 258 294 cặp bazơ, có 11 alen
- Locus CSF1PO nằm trên nhánh dài nhiễm sắc thể số 5, dài 284 - 312
cặp bazơ, có 8 alen
- Locus gen D3S1358 nằm trên nhánh ngắn nhiễm sắc thể số 3, dài 114
- 142 cặp bazơ, có 12 alen
- Locus HUMTH01 nằm ở intron 1 của gen tyrosine hydroxylase
người, trên nhánh ngắn nhiễm sắc thể số 11, dài 168 - 192 cặp bazơ, có 7 alen
- Locus gen D13S317 nằm trên nhánh dài nhiễm sắc thể số 13, dài 206
- 234 cặp bazơ, có 9 alen
- Locus gen D16S539 nằm trên nhiễm sắc thể số 16, dài 245-269 cặp

bazơ, có 7 alen

11


- Locus gen D2S1338 nằm trên nhiễm sắc thể số 2
- Locus gen D19S433 nằm trên nhiễm sắc thể số 19
- Locus gen vWA nằm trên nhánh ngắn nhiễm sắc thể số 12, dài 157 197 cặp bazơ, có 13 alen
- Locus TPOX: Nằm ở intron 10 của gen thyroid peroxidase người, trên
nhánh ngắn nhiễm sắc thể số 2, dài 221 - 241 cặp bazơ, có 6 alen
- Locus gen D18S51 nằm trên nhánh dài nhiễm sắc thể số 18, dài 273 341cặp bazơ, có 25 alen
- Locus D5S818 (D5) nằm trên nhánh dài nhiễm sắc thể số 5, dài 135 171cặp bazơ, có 10 alen
Theo các nhà khoa học hình sự, khi phân tích bằng bộ kit Identifiler thì
độ tin cậy đạt là: 1/ 4,62 x 1019, có nghĩa là trong số 4,62 x 1019 người thì mới
có một người trùng ngẫu nhiên với tổ hợp kiểu gen trên [15, 20].
Cùng với sự phát triển của công nghệ tự động hóa, các công đoạn giám
định ADN đã được tự động bằng các robot chuyên dụng, có khả năng phân
tích tới hàng trăm mẫu mỗi ngày trên 1 hệ thống. Về cơ bản, các hệ thống
phân tích tự động để xây dựng tàng thư ADN vẫn đang phân tích mẫu bằng
cách sử dụng các bộ kit có tổ hợp 13 locus (hệ CODIS) hoặc 16 locus hệ
Identifiler … dùng lưu trữ, tìm kiếm tội phạm và quản lý các đối tượng có
nguy cơ phạm pháp cao.
2.4. Khái niệm về locus và alen
Locus: là một đoạn ADN trên nhiễm sắc thể, dành cho một gen nhất
định [19]. Trong giám định ADN thì locus còn có thể là những đoạn ADN
không mã hóa [19].
Alen là các trạng thái khác nhau của cùng một gen. Mỗi cá thể đều có
hai alen cho mỗi một locus, trong đó một alen di truyền từ bố, một alen di

12



truyền từ mẹ. Nếu hai alen của một locus hoàn toàn giống nhau thì được gọi
là đồng hợp tử, còn khác nhau được gọi là dị hợp tử [14, 19].
2.5. Các tiêu chuẩn cho locus STR dùng trong giám định ADN
Giám định ADN hiện nay sử dụng các locus STR là chủ yếu. Phương
pháp giám định gen có độ tin cậy rất cao bởi các locus STR có tính đa alen
(tính đa hình) rất cao, mỗi alen chỉ xuất hiện trong quần thể với tần số rất thấp
[14, 24]. Locus STR ngắn nên có thể đồng thời phân tích được ba hoặc nhiều
STR hơn trong cùng một thời điểm. Việc phân tích đa hệ rất có giá trị vì
chúng có kết quả phân biệt lớn và thành công ngay cả một số trường hợp mẫu
lẫn hoặc đã bị phân hủy phần nào [13].
Một locus STR được sử dụng cho mục đích nhận dạng và xác định cá
thể phải đảm bảo các thông số sau:
- Có tính bền vững cao (tần suất đột biến thấp)
- Locus STR phải có tính đa hình và mức độ dị hợp tử cao. Điều này
giúp các nhà phân tích chỉ sử dụng một số locus tối thiểu đã đạt được sự phân
biệt cá thể một cách tốt nhất.
- Các locus STR có độ dài ngắn, trung bình từ 100 - 400 bp so với các
đoạn đa hình ngẫu nhiên khác. Các đoạn ADN ngắn có độ bền vững cao, ít bị
đứt gãy dưới tác động của điều kiện ngoại cảnh. Do vậy, khi tiến hành PCR
sẽ thu được hiệu quả tốt hơn các đoạn ADN dài.
- Các locus chứa đoạn STR phải đảm bảo yếu tố di truyền độc lập, do
vậy nên lựa chọn tổ hợp các locus nằm trên các nhiễm sắc thể khác nhau là rất
quan trọng. Các STR thông thường có rất nhiều alen, độ dài của các alen
thông thường khác nhau số đoạn lặp. Do vậy, việc sử dụng các STR có chiều
dài dưới 400 base để dễ dàng phân tích là một yêu cầu cần thiết trong quá
trình lựa chọn.

13



Nhiều đoạn đa hình có trình tự lặp lại chứa các đơn vị lặp lại từ 4
nucleotide đã được nghiên cứu và đáp ứng được yêu cầu của quy trình phân
tích cá thể người. Các đoạn này có đặc tính như sau:
- Có tính đa hình và mức độ dị hợp tử cao (>70%).
- Dễ dàng phối hợp thành bộ phức khi thực hiện PCR.
- Sản phẩm PCR ổn định, ít xảy ra trường hợp khi PCR đoạn lặp bị
thiếu.
2.6. Ý nghĩa của cơ sở dữ liệu tần suất alen của các locus STR
Mỗi cá thể người có cấu trúc di truyền riêng không ai giống ai, trừ
những trường hợp sinh ra cùng một trứng [4]. Nếu xét rộng trong cả một quần
thể thì một số đặc điểm di truyền (ADN) ở các cá thể khác nhau vẫn có thể
giống nhau (trùng lặp). Mặt khác mỗi một quần thể người (tộc người) khác
nhau cũng có những đặc điểm di truyền đặc trưng thể hiện bằng sự phân bố
tần suất alen trong mỗi quần thể [22, 29]. Do vậy, trong giám định ADN các
nhà khoa học hình sự ngoài lựa chọn, nghiên cứu những locus (vị trí trên
nhiễm sắc thể) có tính đa alen (đa hình) cao thì cần khảo sát tần suất phân bố
các alen trong quần thể của từng locus để sử dụng trong tính toán và kết luận
giám định. Quần thể được nghiên cứu khảo sát phải đạt được các yêu cầu
trong thống kê, di truyền như: các mẫu dùng trong nghiên cứu phải đảm bảo
tính ngẫu nhiên, không có quan hệ huyết thống trong 3 đời [17, 28].
Để có được tần suất của mỗi alen, trước hết phải tìm được số lần xuất
hiện của mỗi alen trong quần thể nghiên cứu sau đó tính tần suất lý thuyết của
alen đó theo định luật di truyền quần thể [29]. Khi có được tần suất thực tế và
tần suất lý thuyết của mỗi alen, chúng ta tiến hành kiểm định xem tần suất
alen có được chấp nhận với mức xác suất đã chọn.

14



Giám định gen (ADN) đòi hỏi cơ sở khoa học vững chắc để tính toán
xác suất một người ngẫu nhiên trong quần thể là người có cấu trúc di truyền
đặc trưng trùng lặp với ADN trong các mẫu vật (thu thập được trong quá trình
điều tra, phá án) [7, 21, 23]. Nếu không có tần suất alen thì không tính toán
được tần suất xuất hiện của một kiểu gen nào đó trong một quần thể nhất định
[7, 29].
Trong trường hợp cần xác định huyết thống, để kết luận một người có
phải là cha đẻ hoặc mẹ đẻ của người con không, phải dựa vào khả năng cho
nhận của các alen và phải căn cứ vào tần suất alen để tính ra chỉ số quan hệ
huyết thống (Paternity Index - PI). Từ đó tính độ tin cậy đạt được. Mặt khác,
đó cũng là cơ sở khoa học để so sánh độ tin cậy trong trường hợp phân tích
được nhiều locus gen hoặc ít locus gen hơn [7, 21, 24].
Như vậy Chương I đã trình bày tình hình nghiên cứu, giám định ADN
trong, ngoài nước và tại Viện Khoa học hình sự. Cơ sở khoa học, khái niệm
giám định ADN và các phương pháp giám định ADN. Giám định ADN hiện
nay sử dụng các locus STR là chủ yếu, có độ tin cậy rất cao, mỗi alen chỉ
xuất hiện trong quần thể với tần số rất thấp [14, 24]. Việc xác định tần suất
các alen trong giám định ADN là cần thiết, là cơ sở khoa học để cơ quan
giám định sử dụng để phân tích và đưa ra kết luận trong giám định gen. Hiện
nay đã có một số công trình nghiên cứu tần suất các alen hệ Identifiler của
quần thể một số dân tộc tại Việt Nam song chưa có công trình nào nghiên
cứu tần suất các alen hệ Identifiler của quần thể người H’Mông nên việc lựa
chọn đề tài nghiên cứu tần suất các alen trong các locus gen hệ Identifiler
với quần thể người dân tộc H’Mông là cần thiết và có ý nghĩa cao cả về khoa
học và thực tiễn.

15



CHƢƠNG 2. NỘI DUNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU
1. Nội dung nghiên cứu:
- Thu 120 mẫu tế bào của 120 cá thể người H’Mông.
- Phân tích mẫu bao gồm các bước tách chiết ADN, định lượng ADN,
nhân bội ADN, điện di trên máy điện di mao dẫn, kết quả lập được bảng kiểu
gen của các mẫu nghiên cứu.
- Xử lý số liệu thống kê, kiểm định tần suất kiểu gen giữa kết quả thực
tế và tính toán lý thuyết với độ tin cậy p = 0,05. Tính toán và đưa ra bảng tần
suất các alen của các locus gen hệ Identifiler cho 120 cá thể người H’Mông.
2. Phƣơng pháp nghiên cứu:
2.1. Thu mẫu:
Mục tiêu nhằm thu đủ số lượng mẫu 120 của 120 cá thể người H’Mông
đã được phê duyệt. Các mẫu không có quan hệ họ hàng huyết thống (trong
vòng 3 đời).
Cách thu: Thu mẫu tế bào trực tiếp của những người cho mẫu bằng tăm
bông vô trùng, lấy ngẫu nhiên (120 mẫu tế bào của 120 cá thể người H’Mông
được thu bằng cách này). (Xem phụ lục bảng 1. Thu thập mẫu)
- Mẫu thu đảm bảo chất lượng, không bị lẫn, nhiễm, phơi khô tự nhiên,
đóng gói riêng rẽ, ghi ký hiệu cho mẫu từ HM1 đến HM120.
Sau khi thu mẫu chúng tôi tiến hành xử lí và phân tích theo sơ đồ
nghiên cứu tổng quát dưới đây:

16


Tách chiết ADN bằng phương pháp vô cơ

Định lượng ADN bằng phương pháp
Realtime PCR


Nhân bội ADN (PCR) bằng Kit
Identifiler

Điện di ADN trên máy AB 3130

Phân tích kết quả trên phần mềm
Genmapper ID 3.2

2.2. Hóa chất, thiết bị và dụng cụ:
2.2.1. Hóa chất và thiết bị cho tách chiết ADN
STT
1
2
3
4
5
6

Tên hoá chất, thiết bị
Dung dịch Chelex 100, tỷ lệ 5%
Block nhiệt khô cho ống 1,5ml (1000C) kèm nhiệt kế
Máy li tâm ống 1,5ml 14.000v/p
Tủ an toàn sinh học
Ống tách chiết 1,5ml
Các đầu típ 10 µl, 200 µl và 1000 µl cùng pipet tương ứng

17


2.2.2. Hóa chất và thiết bị cho định lƣợng ADN

STT Tên hoá chất thiết bị
1
Kit Human DNA quantification (Quantifiler- hãng Applied
biosystems)
2
Optical plate 96 well
3
Optical seal
4
Máy Realtime PCR 7500 (Applied biosystems)
5
Các loại đầu típ 10 µl, 200 µl và 1000 µl cùng pipet tương ứng
2.2.3. Hóa chất và thiết bị cho nhân bội và điện di
STT
Tên hoá chất thiết bị
1
Máy giải trình tự Applied biosystems
2

Máy PCR 9700 96 well Applied biosystems

3

Kit Identifiler của hãng Applied biosystems

4
5
6
7
8

9
10
11
12

POP 4 (ABI)
Liz 500 Gene scan
HIDI formamide
Buffer 10X for AB - 3130
Capilary 3130 (36cm x 50µl)
Optical plate 96 well
Septa
Ống PCR (0,25 ml) và điện di (0,5 ml)
Các loại đầu típ 10 µl, 200 µl và 1000 µl cùng pipet tương ứng.

2.3. Phân tích mẫu
2.3.1. Tách chiết mẫu bằng chelex
Chelex là một loại nhựa tạo phức có ái lực cao đối với các ion kim loại
đa hoá trị. Nó là hợp chất trùng ngưng styrene divinylbenzene có chứa các
cặp ion imminodiaxetat hoạt động là nhóm tạo phức. Sự có mặt của chelex ở
nhiệt độ 1000C sẽ ngăn cản sự biến tính của ADN vì nó gắn được với các ion
18


×