Tải bản đầy đủ (.pdf) (51 trang)

Nghiên cứu xây dựng phương pháp xác định mối quan hệ huyết thống

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.44 MB, 51 trang )


1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ



LƢU THỊ QUỲNH HOA



NGHIÊN CỨU XÂY DỰNG PHƢƠNG PHÁP XÁC
ĐỊNH MỐI QUAN HỆ HUYẾT THỐNG








LUẬN VĂN THẠC SĨ













HÀ NỘI - 2011

2


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ



LƢU THỊ QUỲNH HOA






NGHIÊN CỨU XÂY DỰNG PHƢƠNG PHÁP
XÁC ĐỊNH MỐI QUAN HỆ HUYẾT THỐNG


Ngành: Công nghệ thông tin
Chuyên ngành: Công nghệ phần mềm
Mã số: 60 48 10


LUẬN VĂN THẠC SĨ




NGƢỜI HƢỚNG DẪN KHOA HỌC: Tiến sĩ KIỀU VĂN HƢNG









HÀ NỘI - 2011

5
MỤC LỤC
BẢNG KÍ HIỆU CÁC CHỮ VIẾT TẮT 6
DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ 7
MỞ ĐẦU 8
CHƢƠNG 1. GIỚI THIỆU VỀ DI TRUYỀN HỌC 10
1.1. Giới thiệu 10
1.2. Công nghệ phân tích DNA 11
1.3. Trạng thái cân bằng Hardy–Weinberg 12
1.4. Tỷ lệ khả năng(Likelihood ratio) 12
1.5. Hệ số liên quan 13
CHƢƠNG 2. PHƢƠNG PHÁP XÁC ĐỊNH CÁC MỐI QUAN HỆ HUYẾT THỐNG
15
2.1. Xác định tỷ lệ khả năng của mối quan hệ cha mẹ-con cái 15
2.1.1. Chỉ số quan hệ cha con 15

2.1.2. Chỉ số cha con trong trong trƣờng hợp có ngƣời mẹ 15
2.1.3. Chỉ số cha con trong trƣờng hợp không có ngƣời mẹ 19
2.1.4. Xác định cả cha và mẹ 21
2.1.5. Xác suất loại trừ 25
2.1.6. Đột biến 26
2.2. Xác định tỷ lệ khả năng của mối quan hệ họ hàng của hai người 27
2.3. Phương pháp tính xác suất các mối quan hệ huyết thống 31
2.4. Xác định tỷ lệ khả năng của mối quan hệ họ hàng của ba người 32
2.4.1. Xác suất xảy ra các kiểu gen giữa ba ngƣời 32
2.4.2. Xác định tỷ lệ khả năng cho mối quan hệ 3 ngƣời 41
CHƢƠNG 3. CHƢƠNG TRÌNH KIỂM THỬ MỐI QUAN HỆ HUYẾT THỐNG 43
3.1. Giới thiệu chương trình kiểm thử 43
3.2. Kết quả 44
3.2.1. Phân tích mối quan hệ cha con 44
3.2.2. Phân tích mối quan hệ cha con trƣờng hợp đột biến 47
3.2.3. Phân tích mối quan hệ họ hàng 47
3.3. Đánh giá 49
3.3.1. Xác suất để một ngƣời ngẫu nhiên có một kiểu gen cho trƣớc 49
3.3.2. Các yếu tố ảnh hƣởng đến xác suất của mối quan hệ huyết thống 50
CHƢƠNG 4. KẾT LUẬN 52
TÀI LIỆU THAM KHẢO 53




6
BẢNG KÍ HIỆU CÁC CHỮ VIẾT TẮT
Kí hiệu
Định nghĩa
AABB (American Association of Blood

Banks)
Hiệp hội các ngân hàng máu
AM (Alleged mother)
Ngƣời mẹ bị cáo buộc
AMPI (Average mutation paternity index)
Chỉ số mối quan hệ cha con đột biến trung
bình
AF (Alleged father)
Ngƣời cha bị cáo buộc
C (Child)
Đứa trẻ
DNA (Deoxyribonucleic acid)
Axít deoxyribonucleic
LR (Likelihood ratio)
Tỉ lệ khả năng
M (Mother)
Ngƣời mẹ sinh học của đứa trẻ
PI (Paternity index)
Chỉ số mối quan hệ cha con
PE (Probability of exclusion)
Xác suất loại trừ
STR(short tandem repeat)
Lặp lại những đoạn ngắn song song

7
DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ
1. Bảng biểu
Bảng 1.1: Hệ số liên quan cho các mối quan hệ huyết thống 14
Bảng 2.1: Chỉ số mối quan hệ cha con (PI) cho mọi kiểu gen trong trƣờng hợp có kiểu
gen của ngƣời mẹ 16

Bảng 2.2: Chỉ số mối quan hệ cha con (PI) cho mọi kiểu gen trong trƣờng hợp không có kiểu
gen của ngƣời mẹ 20
Bảng 2.3: Tỉ lệ khả năng (LR) để xác định cả cha và mẹ 22
Bảng 2.4: Xác suất để một ngƣời đàn ông ngẫu nhiên bị loại trừ khỏi mối quan hệ cha
con khi có kiểu gen của ngƣời mẹ M, và đứa trẻ C 24
Bảng 2.5: Xác suất để một ngƣời đàn ông ngẫu nhiên bị loại trừ khỏi mối quan hệ cha
con khi chỉ có kiểu gen của đứa trẻ C 26
Bảng 2.6: Tỉ lệ khả năng về hai giả thuyết cạnh tranh H
p
: (Y, Z) ~ (k
0
, 2k
1
, k
2
) với H
d
:
(Y, Z) ~ (1, 0, 0) 29
Bảng 2.7: Xác suất để kiểu gen kết hợp P(X, Y, Z) cho tất cả các trƣờng hợp của X, Y,
Z. Trong đó, X và Z có mối quan hệ tƣơng ứng là mẹ, bố của Y ; X và Z không có mối
quan hệ gì, và hệ số liên quan giữa X, Y là (k
0
XY
, 2k
1
XY
, 0), hệ số liên quan giữa Y,Z là
(k
0

YZ
, 2k
1
YZ
, 0) 33
Bảng 3.1: Xác suất của mối quan hệ cha con 45
Bảng 3.2: Xác suất của mối quan hệ anh em cùng cả cha mẹ 46
Bảng 3.3: Xác suất của mối quan hệ anh em cùng cha hoặc mẹ 46
Bảng 3.4: Xác suất của mối quan hệ anh em họ 47
Bảng 3.5: Xác suất của mối quan hệ cha con khi có đột biến 47
Bảng 3.6: Xác suất của mối quan hệ anh em cùng cả cha mẹ 48
Bảng 3.7: Xác suất của mối quan hệ anh em cùng cha hoặc mẹ 49
Bảng 3.8: Xác suất của mối quan hệ anh em họ 49


2. Hình vẽ
Hình 1.1: Hồ sơ cá nhân STR của một mẫu DNA 11
Hình 1.2: Kiểu gen của anh em cùng cha mẹ 14
Hình 3.1: Kiến trúc tổng thể của chƣơng trình 43
Hình 3.2: Danh sách các locus 44




8
MỞ ĐẦU
Từ cuối thế kỉ 21, nền khoa học kĩ thuật thế giới đã phát triển vƣợt bậc, đặc biệt
là hai lĩnh vực công nghệ thông tin và công nghệ sinh học. Công nghệ thông tin đã
thúc đẩy sự phát triển của hầu hết các lĩnh vực khoa học kĩ thuật, kể cả công nghệ sinh
học và phát sinh chuyên ngành mới có tên gọi là tin sinh học. Tin sinh học là một lĩnh

vực khoa học sử dụng các công nghệ của các ngành toán học ứng dụng, tin học, thống
kê và khoa học máy tính để giải quyết các vấn đề sinh học. Vấn đề quan tâm lớn nhất
đối với tin sinh học chính là việc sử dụng, phân tích các dữ liệu gen thu nhận đƣợc từ
các kĩ thuật sinh học nhƣ thế nào cho hiệu quả. Vì số lƣợng gen thu nhận đƣợc ngày
càng lớn, và số lƣợng gen này vẫn đang tiếp tục tăng. Với một khối lƣợng thông tin
lớn nhƣ vậy, thì phƣơng pháp thống kê, xác suất là phƣơng pháp rất phổ biến để đánh
giá, và đƣa ra những thông tin hữu ích, cần thiết.
Khoa học pháp y và pháp luật là một trong những khoa học sử dụng các ứng
dụng tin sinh học. Trong khoa học pháp y và pháp luật, thống kê đóng một vai trò
quan trọng. Thống kê là cơ sở khoa học đối với các dữ liệu biến đổi và không chắc
chắn. Trong khoa học pháp y, dữ liệu đƣợc thu thập từ hiện trƣờng vụ án hoặc từ
những nơi khác, sau đó thống kê đƣợc sử dụng để phân tích những dữ liệu này. Các
nhà khoa học giải thích các kết quả thống kê, sau đó cung cấp cho các khách hàng,
luật sƣ, bồi thẩm đoàn, thẩm phán… Sử dụng số liệu thống kê trong Deoxyribonucleic
acid (DNA) pháp y đã đạt đƣợc nhiều kết quả phân tích mong muốn [2].
Nhận dạng con ngƣời là vấn đề chính trong khoa học pháp y và pháp luật. Hồ
sơ DNA đã trở thành một trong những kỹ thuật phổ biến đƣợc sử dụng để nhận dạng
con ngƣời kể từ khi đƣợc giới thiệu bởi Jeffreys AJ, Wilson V và Thein SL vào năm
1985 [2]. Đây là một trong những công cụ quan trọng nhất trong khoa học pháp y.
DNA có thể đƣợc tìm thấy trong máu, tóc/chân tóc, xƣơng, tinh dịch và chất lỏng cơ
thể nhƣ nƣớc bọt và mồ hôi. Không có hai ngƣời, ngoại trừ cho cặp song sinh giống
hệt nhau, có cùng một trình tự DNA.
Mặc dù di truyền học pháp y là một qui tắc trong thế kỷ trƣớc (đƣợc phát hiện
bởi Karl Landsteiner có thể đƣợc coi là sự ra đời của lĩnh vực này). Tuy nhiên kĩ thuật
sử dụng hồ sơ DNA để phân tích pháp y đƣợc phát triển bởi Alec Jeffreys và đồng
nghiệp, 20 năm trƣớc đây, đã có một tác động to lớn về di truyền học pháp y. Số
lƣợng công việc trong lĩnh vực này đã tăng lên đáng kể từ năm 1985 cùng với việc gia
tăng các bài báo xuất bản trong lĩnh vực này. Những tiến bộ quan trọng trong sinh học
phân tử và công nghệ máy tính cho phép các mẫu DNA đƣợc lấy từ số lƣợng nhỏ hơn
của vật liệu sinh học. Các mẫu đƣợc phân tích để ứng dụng trong lĩnh vực điều tra

hình sự, hoặc xây dựng và quản lý phù hợp cơ sở dữ liệu DNA đang mở rộng ra ngoài

9
lĩnh vực điều tra hình sự, nhƣ lĩnh vực xác định mối quan hệ huyết thống [2]. Di
truyền học pháp y hiện nay là một lĩnh vực phát triển, đã và đang tạo ra các nội dung
có chất lƣợng cao hỗ trợ cho tạp chí chuyên dụng. Phạm vi của các tạp chí này bao
gồm hầu hết các chủ đề di truyền học pháp y nhƣ: phƣơng pháp thống kê sinh học
trong di truyền học pháp y, đánh giá các bằng chứng DNA trong các vấn đề pháp lý
(chẳng hạn nhƣ quan hệ cha con, công việc xác định tội phạm.
Bài toán xác định danh tính của một mẫu DNA thu đƣợc tại một hiện trƣờng tội
phạm, cũng nhƣ xác định các mối quan hệ huyết thống dựa trên xét nghiệm DNA
không phải là một bài toán mới. Tuy nhiên, vấn đề xác định tội phạm dựa trên mẫu
DNA ở Việt Nam lại rất ít đƣợc áp dụng, cũng nhƣ việc đƣa ra các kết luận đánh giá
mối quan hệ huyết thống của con ngƣời chƣa đƣợc nghiên cứu nhiều. Trên thế giới,
xác định danh tính của dấu vết để lại hiện trƣờng nhƣ xác định danh tính tội phạm
thông qua việc xét nghiệm DNA đƣợc sử dụng khá rộng rãi. Việc cần thiết phải có
một phƣơng pháp, công cụ để đánh giá mối quan hệ họ hàng, xác định danh tính tội
phạm áp dụng cho ngƣời Việt Nam đã định hƣớng cho chúng tôi nghiên cứu phát triển
luận văn về vấn đề này.
Nội dung của luận văn gồm có 4 chƣơng. Phần cơ sở lý thuyết của luận văn
nằm trong hai chƣơng Chƣơng 1 và Chƣơng 2. Chƣơng 1 sẽ giới thiệu về các nguyên
lý di truyền, giới thiệu về trạng thái cân bằng Cân bằng Hardy–Weinberg, là trạng thái
đƣợc áp dụng xuyên suốt luận văn. Chƣơng 2 trình bày một cách tổng quan rõ ràng về
phƣơng pháp thống kê, xác suất trong di truyền học, từ đó đƣa ra những bằng chứng
có giá trị cao trong việc đánh giá các mối quan hệ huyết thống của con ngƣời. Chƣơng
2 cũng trình bày phƣơng pháp xác định mối quan hệ huyết thống giữa hai ngƣời, và ba
ngƣời. Chƣơng 3 luận văn sẽ tập trung vào chƣơng trình kiểm thử những phƣơng pháp
phân tích ở chƣơng 2, và đƣa ra các đánh giá. Chƣơng trình kiểm thử dựa trên một số
mẫu DNA thật, đồng thời cũng chỉ ra rằng phƣơng pháp phân tích xác định mối quan
hệ huyết thống đƣợc đề ra có ý nghĩa lớn trong thực tiễn. Cuối cùng là chƣơng 4, kết

luận và những phƣơng hƣớng phát triển trong tƣơng lai.


10
CHƢƠNG 1. GIỚI THIỆU VỀ DI TRUYỀN HỌC
1.1. Giới thiệu
Trong sinh vật bậc cao, vật liệu di truyền đƣợc tổ chức thành các cấu trúc đƣợc
gọi là nhiễm sắc thể. Con ngƣời có 46 nhiễm sắc thể (23 cặp). Một nhiễm sắc thể là
một sợi DNA rất mỏng, bao quanh bởi các vật liệu khác, chủ yếu là protein. DNA có
cấu trúc là hai sợi xoắn quanh nhau nhƣ một cái thang dây xoắn. Các đơn vị hóa chất
cơ bản của DNA là nucleotide, bao gồm các base. Có bốn loại base: A, G, T và C.
Tổng số DNA trong một hệ gen di truyển là khoảng 3 tỷ cặp nucleotide. Gen là một
đoạn DNA khác nhau, từ vài nghìn đến hơn một trăm ngàn cặp nucleotide. Các vị trí
cụ thể của một gen trên nhiễm sắc thể đƣợc gọi là locus.
Các trạng thái biểu hiện của một gen đƣợc gọi là alen. Nếu các alen cũng có
mặt trong cả hai nhiễm sắc thể của một cặp, thì đƣợc gọi là đồng hợp tử, nếu hai alen
khác nhau, đƣợc gọi là dị hợp tử. Trong phân tích pháp y, các kiểu gen cho các nhóm
locus phân tích đƣợc gọi là hồ sơ DNA. Hồ sơ DNA chính là danh sách một số locus
có chứa các kiểu gen đã xác định của một ngƣời.
Không có hai ngƣời, ngoại trừ cho cặp song sinh giống hệt nhau, có cùng một
trình tự DNA. Gen là một đoạn DNA mang một chức năng nhất định trong quá trình
truyền thông tin di truyền. Hiện các nhà khoa học ƣớc tính rằng cơ thể con ngƣời hàm
chứa khoảng 20.000 đến 25.000 gen. Để xác định đƣợc trình tự DNA của một ngƣời
là điều không thể làm đƣợc, vì số lƣợng gen của một ngƣời là quá lớn, việc phân tích
một số lƣợng lớn nhƣ thế rất tốn kém, và không thể làm đƣợc. Bài toán đặt ra ở đây là
làm thế nào để từ một dấu vết (vết máu, hoặc những dấu vết có thể phân tích DNA) để
xác định đƣợc danh tính của một ngƣời có dấu vết đó. Thông qua việc phân tích một
số gen nhất định từ dấu vết, và bằng phƣơng pháp xác suất sẽ chứng minh dấu vết
đƣợc tìm thấy là của ai. Phƣơng pháp thống kê, đánh giá, phân tích xác suất của hồ sơ
DNA chính là phƣơng pháp thích hợp nhất, và có ý nghĩa lớn không chỉ trong lĩnh vực

tìm kiếm tội phạm (thông qua dấu vết để lại), mà còn đƣa ra một bằng chứng rất mạnh
để xác định các mối quan hệ huyết thống của con ngƣời. Dựa vào các hồ sơ DNA
này, chúng tôi muốn đánh giá xác suất để tìm kiếm hai ngƣời có cùng một hồ sơ DNA
trong dân số, để đƣa ra bằng chứng có trọng số cao trong pháp y [5].
Trong thực tế, đã có nhiều báo cáo về di truyền học sử dụng một số loại thống
kê. Có nhiều số liệu thống kê đơn giản nhƣ tỷ lệ phần trăm, trung bình và độ lệch tiêu
chuẩn có ý nghĩa, tuy nhiên việc phân tích thống kê tiên tiến hơn là rất cần thiết. FSI
(Forensic Science International) năm 2006 cho thấy các loại kỹ thuật tiên tiến đƣợc sử
dụng. Shepard và Herrera (2006) đã nghiên cứu các tần số alen tại 15 locus STR từ

11
150 ngƣời không liên quan từ dân số Iran. Các biện pháp thống kê nhƣ các chỉ số đa
dạng gen, khả năng phân biệt, khả năng loại trừ và các kiểm thử cho cân bằng Hardy-
Weinberg,… đã đƣợc xây dựng [2]. Phƣơng pháp nghiên cứu các tần số alen là một
phƣơng pháp rất có ý nghĩa. Luận văn đã sử dụng phƣơng pháp đánh giá xác suất của
mối quan hệ huyết thống dựa trên các tần số alen. Phƣơng pháp xác định mối quan hệ
huyết thống sẽ đƣợc thảo luận kĩ trong chƣơng 2.
1.2. Công nghệ phân tích DNA
Hiện nay kỹ thuật phổ biến nhất đƣợc sử dụng trong hồ sơ DNA là kỹ thuật
phân tích PCR/STR (Polymerase chain reaction/Short Tandem Repeat) [1]. Kỹ thuật
đã dùng phản ứng chuỗi enzyme đa phân để 'khuếch đại' các đoạn gen ngắn có độ lặp
ngắn theo thứ tự (Short Tandem Repeat, STR). Ở đây polymesase tức là một loại
enzyme có thể cho phản ứng tạo ra nhiều bản copy của một đoạn DNA nào đó; phản
ứng chuỗi tức là một phản ứng diễn ra liên tục. Nhƣ vậy bằng kỹ thuật PCR có thể
trong một thời gian ngắn tạo ra hàng triệu triệu đến hàng tỷ bản copy của một STR.
Kỹ thuật này còn đƣợc gọi là kỹ thuật "khuếch đại DNA".

Hình 1.1: Hồ sơ cá nhân STR của một mẫu DNA
Hình 1.1 cho thấy hồ sơ cá nhân STR của một mẫu DNA từ một hiện trƣờng tội
phạm thu đƣợc bằng máy ABI và phần mềm. Chỉ có ba locus NST thƣờng của bảng

điều khiển màu vàng đƣợc hiển thị để minh hoạ. Bảng điều khiển phía trên tƣơng ứng
với các thang allen tiêu chuẩn tại một locus. Từ con số này, chúng tôi nhận thấy rằng
kiểu gen ba locus tƣơng ứng là 7 / 11 tại locus D5S818 (nhiễm sắc thể 5), 12/13 tại
D13S317 (nhiễm sắc thể 13) và 11/12 tại D7S820 (nhiễm sắc thể 7). Locus STR đƣợc
sử dụng thƣờng có dƣới 10 đến trên 20 alen, đƣa ra một số lƣợng lớn các kiểu gen có

12
thể xảy ra tại mỗi locus. Giả sử, nếu một locus có 8 alen khác nhau, thì sẽ có 8*9/2 =
36 kiểu gen có thể ở locus đó [2].
1.3. Trạng thái cân bằng Hardy–Weinberg
Một trong những yếu tố chính để đánh giá xác suất trong pháp y DNA chính là
đánh giá xác suất của các hồ sơ DNA. Những đánh giá này đƣợc đặt trong tình huống
dân số là ở trạng thái cân bằng Hardy – Weinberg [2]. Trong di truyền học, định luật
Hardy, Weinberg do ông Hardy(Anh) và Weinberg(Đức) nghiên cứu một cách độc lập
nhau, nhƣng cho kết quả giống nhau. Và định luật này đƣợc phát biểu nhƣ sau: “Trong
những điều kiện nhất định, tần số tƣơng đối của các alen và thành phần kiểu gen của
quần thể ngẫu phối đƣợc duy trì ổn định qua các thế hệ”.
Giả sử tại một locus độc lập có k alen: A
1
, A
2
, … A
k
và tần số alen tƣơng ứng
là p
1
, p
2
, … p
k

. Đặt A
i
A
j
là một kiểu gen (với i, j = 1, …k).
Khi đó nếu quần thể là cân bằng Hardy–Weinberg, thì ta có xác suất để xuất
hiện kiểu gen đƣợc đánh giá là:

1.4. Tỷ lệ khả năng(Likelihood ratio)
Hãy xem xét một trung tâm hiến máu trong đó mỗi trung tâm đều có một thử
nghiệm sàng lọc máu cho một loại bệnh đặc biệt. Giả sử một ngƣời đã có các kiểm tra
và kết quả là dƣơng tính. Trong tình huống này, hai mệnh đề hoặc giải thích có thể
đƣợc xem xét:
H
0
: ngƣời mang căn bệnh này;
H
1
: ngƣời không mang căn bệnh này.
Những mệnh đề này là đối ngƣợc nhau hoặc loại trừ lẫn nhau với. Chúng đƣợc
gọi là giả thuyết thay thế trong thống kê [2].
Khuôn khổ thử nghiệm giả thuyết thống kê phù hợp rất tốt trong môi trƣờng
pháp lý, trong đó hai mệnh đề loại trừ nhau cũng đƣợc xem xét. Giả sử rằng có một vụ
giết ngƣời, và một vết máu từ thủ phạm đã đƣợc tìm thấy tại hiện trƣờng tội phạm, tội
phạm nghi ngờ sau đó đã bị bắt và đƣợc xét nghiệm, nhóm máu của hắn phù hợp với
nhóm máu tìm thấy tại hiện trƣờng tội phạm. Hai mệnh đề cạnh tranh đƣợc xem xét:
H
p
: vết máu đến từ tội phạm nghi ngờ;
H

d
: vết máu không đến từ tội phạm nghi ngờ.

13
Khi đánh giá trọng lƣợng của các bằng chứng, ngƣời ta đã đƣa ra khái niệm tỉ
lệ khả năng LR là tỷ lệ giữa xác suất của bằng chứng dƣới giả thuyết H
p
, so với xác
suất của bằng chứng dƣới giả thuyết H
d
. Trong trƣờng hợp này, tỷ lệ khả năng (LR)
thƣờng đƣợc sử dụng:








Bằng chứng, chính là kiểu gen có đƣợc từ vết máu để lại hiện trƣờng, và kiểu
gen của tội phạm nghi ngờ. Tỷ lệ khả năng là một công cụ chính để đánh giá trọng số
của các bằng chứng trong DNA pháp y [1]-[2]-[5]. Tỷ lệ khả năng LR chính là khái
niệm đƣợc sử dụng xuyên suốt luận văn để đƣa ra xác suất đánh giá xác định danh
tính một ngƣời, và đánh giá mối quan hệ huyết thống giữa hai ngƣời.
1.5. Hệ số liên quan
Giả sử mẫu DNA của dấu vết ở hiện trƣờng là C = A
i
A
j

. Một tội phạm nghi
ngờ bị bắt, và có kiểu gen tƣơng ứng là S = A
i
A
j
. Điều này có thể thấy rằng phải có
một mối liên quan nào đó giữa dấu vết và tên tội phạm bị nghi ngờ [5].
Với hai ngƣời X, Y, định nghĩa hệ số liên quan là (k
0
, 2k
1
,k
2
) [4] trong đó:
k
0
= P (cả hai alen của X và Y không có cùng huyết thống): xác suất mà cả hai
alen của X, và Y đều không thuộc cùng một huyết thống.
2k
1
= P (một trong hai alen của X và Y có cùng huyết thống, alen còn lại thì
không): xác suất mà một alen của X thuộc cùng huyết thống với alen của Y, alen còn
lại thì không.
k
2
= P (cả hai alen của X và Y có cùng huyết thống): xác suất để cả hai alen của
X và Y đều thuộc cùng một huyết thống.
Giả sử, xét cho trƣờng hợp tại cùng một locus, X có kiểu gen là X = A
i
A

j
, và Y
có kiểu gen là Y = A
i
A
j
. Khi đó, theo luật tổng xác suất ta có:



































Xét mối quan hệ anh em cùng cả cha, mẹ. Giả sử tại cùng một locus, A có kiểu
gen là 12, tức là có 2 alen 1 và 2. Tƣơng tự B cũng có kiểu gen là 34. Khi đó theo lý
thuyết cho nhận trong mối quan hệ cha con, thì C, D phải nhận một alen từ A, và một
alen từ B [4].


14


Hình 1.2: Kiểu gen của anh em cùng cha mẹ
Hình (b) là kết quả của tất cả các trƣờng hợp có thể xảy ra khi kết hợp kiểu gen
của A, B để cho kiểu gen của C, D. Nhƣ vậy có 16 cách truyền alen cho 2 ngƣời con,
trong đó có 4 cặp chung cả 2 alen, 8 cặp chung 1 alen, và 4 cặp không chung alen nào,
do đó hệ số (k0, 2k1, k2) = (0.25, 0.5, 0.25). Bảng 1.1 sẽ đƣa ra hệ số liên quan cho
một số mối quan hệ huyết thống.
Bảng 1.1: Hệ số liên quan cho các mối quan hệ huyết thống
Mối quan hệ
k
0


2k
1

k
2

Cha mẹ - Con cái
0
1
0
Anh em cùng cả cha, mẹ
1/4
1/2
1/4
Anh em cùng cha, hoặc cùng mẹ
1/2
1/2
0
Ông bà - Cháu
1/2
1/2
0
Chú - cháu
1/2
1/2
0
Anh em họ thứ nhất
1/2
1/2

0
Anh em họ thứ hai
15/16
1/16
0





15
CHƢƠNG 2. PHƢƠNG PHÁP XÁC ĐỊNH CÁC MỐI QUAN
HỆ HUYẾT THỐNG
2.1. Xác định tỷ lệ khả năng của mối quan hệ cha mẹ-con cái
2.1.1. Chỉ số quan hệ cha con
Vấn đề bộ ba tiêu chuẩn (cha, mẹ, con) thƣờng gặp trong thử nghiệm quan hệ
cha con. Các hồ sơ DNA của ngƣời mẹ, con và bị cáo thu đƣợc. Ngƣời mẹ và ngƣời
cha bị cáo buộc là ngƣời cha sinh học của đứa trẻ đƣợc coi nhƣ không liên quan đến
nhau. Ngƣời mẹ và ngƣời cha sinh học thuộc về cùng một dân tộc. Dân số ở trong
trạng thái cân bằng Hardy-Weinberg (HWE). Hơn nữa, chúng tôi cũng giả định không
có đột biến xảy ra. Hai giả thuyết cạnh tranh cho các vấn đề bộ ba tiêu chuẩn đƣợc đƣa
ra nhƣ sau:
H
p
: ngƣời cha bị cáo buộc là ngƣời cha thật.
H
d
: ngƣời cha thật là một ngƣời ngẫu nhiên không liên quan.
Khi đó tỉ lệ khả năng (LR) thƣờng đƣợc gọi là chỉ số quan hệ cha con. Kí hiệu
là PI (Paternity Index) [2].

2.1.2. Chỉ số cha con trong trong trƣờng hợp có ngƣời mẹ
Đặt kiểu gen của ngƣời mẹ, đứa trẻ và ngƣời cha bị cáo buộc là M, C, AF. Bằng
chứng DNA ở đây chính là các kiểu gen M, C, AF. Tỉ lệ khả năng (LR) thƣờng đƣợc
gọi là chỉ số quan hệ cha con PI, và đƣợc đánh giá nhƣ sau:
















































Mặt khác chúng ta nhận thấy rằng, xác suất của kiểu gen của ngƣời mẹ và
ngƣời cha bị cáo buộc không phụ thuộc vào ngƣời cha bị cáo buộc có là cha thật hay
không, hay chính là 2 giả thuyết H
d
, H
p
. Nhƣ vậy P(M,AF|H
p
), P(M,AF|H

d
) là nhƣ
nhau [2]. Khi đó:








Vì giả thuyết H
d
là trái ngƣợc với H
p
chính là ngƣời cha bị cáo buộc không phải
là cha thật của đứa trẻ. Do đó xác suất P(C|M,AF,H
d
) ~ P(C|M,H
d
) [2]. Nghĩa là:

16









Chúng ta sẽ xem xét từng trƣờng hợp cụ thể của các kiểu gen của bộ ba(đứa trẻ,
ngƣời mẹ, và ngƣời cha bị cáo buộc). Bảng 2.1 cho chúng ta thấy đƣợc các trƣờng hợp
xảy ra của các kiểu gen.
Bảng 2.1: Chỉ số mối quan hệ cha con (PI) cho mọi kiểu gen trong trƣờng
hợp có kiểu gen của ngƣời mẹ
Trƣờng hợp
C
M
AF
PI
1
A
i
A
i

A
i
A
i

A
i
A
i

1/p
i


2
A
i
A
j

1/(2p
i
)
3
A
i
A
j

A
i
A
i

1/p
i

4
A
i
A
j

1/(2p

i
)
5
A
i
A
k

1/(2p
i
)
6
A
i
A
j

A
i
A
i

A
i
A
j

1/(2p
j
)

7
A
j
A
j

1/p
j

8
A
j
A
k

1/(2p
j
)
9
A
i
A
j

A
i
A
i

1/(p

i
+ p
j
)
10
A
i
A
j

1/(p
i
+ p
j
)
11
A
i
A
k

1/[2(p
i
+ p
j
)]
12
A
i
A

k

A
i
A
j

1/(2p
j
)
13
A
j
A
j

1/p
j

14
A
j
A
k

1/(2p
j
)
15
A

j
A
l

1/(2p
j
)
Trƣờng hợp 1: C = A
i
A
i
, M = A
i
A
i
, AF = A
i
A
i
. Trong trƣờng hợp này, theo
công thức 1, tử số của (1) là: xác suất để đứa trẻ có kiểu gen A
i
A
i
dƣới giả thuyết Hp
(tức là ngƣời cha bị cáo buộc là cha thật của đứa trẻ) khi biết kiểu gen của ngƣời mẹ là
M = A
i
A
i

. Đứa trẻ có 1 cơ hội nhận 1 alen A
i
từ ngƣời mẹ, và có 1 cơ hội nhận alen A
i

còn lại từ ngƣời cha bị cáo buộc. Và mẫu số của (1) là xác suất để đứa trẻ có kiểu gen
A
i
A
i
dƣới giả thuyết H
d
(tức ngƣời cha đẻ của đứa trẻ là một ngƣời ngẫu nhiên) khi
biết kiểu gen của ngƣời mẹ là M = A
i
A
i
. Tại mẫu số, thì đứa trẻ vẫn có 1 cơ hội nhận 1
alen A
i
từ ngƣời mẹ, alen A
i
còn lại đƣợc nhận từ một ngƣời ngẫu nhiên và chính bằng
xác suất để một ngƣời bất kỳ có alen A
i
hay chính là p
i
(chính là tần số xuất hiện alen
A
i

). Nhƣ vậy công thức (1) lúc này sẽ là: PI = (1 x 1)/(1xp
i
) = 1/p
i
.
Trƣờng hợp 2: C = A
i
A
i
, M = A
i
A
i
, AF = A
i
A
j
. Trong trƣờng hợp này, đứa trẻ
vẫn có 1 cơ hội nhận alen A
i
từ ngƣời mẹ, và vì AF = A
i
A
j
, nên đứa trẻ chỉ có ½ cơ hội

17
nhận kiểu gen A
i
còn lại từ AF. Nhƣ vậy, công thức (1) lúc này sẽ là: PI = (1 x

1/2)/(1xp
i
) = 1/2p
i
.
Trƣờng hợp 3 : C = A
i
A
i
, M = A
i
A
j
, AF = A
i
A
i
. Trƣờng hợp này, tử số, đứa trẻ
có ½ cơ hội nhận alen A
i
từ ngƣời mẹ, và có 1 cơ hội nhận alen A
i
còn lại từ ngƣời cha
bị cáo buộc. Khi đó PI = (1x1/2)/(p
i
/2) = 1/p
i
.
Trƣờng hợp 4 : C = A
i

A
i
, M = A
i
A
j
, AF = A
i
A
j
. Trƣờng hợp này, tử số, đứa trẻ
có ½ cơ hội nhận alen A
i
từ ngƣời mẹ, và có 1/2 cơ hội nhận alen A
i
còn lại từ ngƣời
cha bị cáo buộc. Khi đó PI = (1/2x1/2)/(p
i
/2) = 1/2p
i
.
Trƣờng hợp 5 : C = A
i
A
i
, M = A
i
A
j
, AF = A

i
A
k
. Trƣờng hợp này, tử số, đứa
trẻ có ½ cơ hội nhận alen A
i
từ ngƣời mẹ, và có 1/2 cơ hội nhận alen A
i
còn lại từ
ngƣời cha bị cáo buộc. Khi đó PI = (1/2x1/2)/(p
i
/2) = 1/2p
i
.
Trƣờng hợp 6 : C = A
i
A
j
, M = A
i
A
i
, AF = A
i
A
j
. Trƣờng hợp này, tử số, đứa trẻ
có 1 cơ hội nhận alen A
i
từ ngƣời mẹ, và có 1/2 cơ hội nhận alen còn lại A

j
từ ngƣời
cha bị cáo buộc. Mẫu số, đứa trẻ vẫn có 1 cơ hội nhận alen A
i
từ ngƣời mẹ, và alen còn
lại A
j
đƣợc nhận từ một ngƣời ngẫu nhiên, và bằng xác suất của p
j
(xác suất để một
ngƣời bất kì có alen A
j
). Khi đó PI = (1/2)/(p
j
) = 1/2p
j
.
Trƣờng hợp 7 : C = A
i
A
j
, M = A
i
A
i
, AF = A
j
A
j
. Trƣờng hợp này, tử số, đứa trẻ

có 1 cơ hội nhận alen A
i
từ ngƣời mẹ, và có 1 cơ hội nhận alen còn lại A
j
từ ngƣời cha
bị cáo buộc. Mẫu số, đứa trẻ vẫn có 1 cơ hội nhận alen A
i
từ ngƣời mẹ, và alen còn lại
A
j
đƣợc nhận từ một ngƣời ngẫu nhiên, và bằng xác suất của p
j
(xác suất để một ngƣời
bất kì có alen A
j
). Khi đó PI = (1)/(p
j
) = 1/p
j
.
Trƣờng hợp 8 : C = A
i
A
j
, M = A
i
A
i
, AF = A
j

A
k
. Trƣờng hợp này, tử số, đứa
trẻ có 1 cơ hội nhận alen A
i
từ ngƣời mẹ, và có 1/2 cơ hội nhận alen còn lại A
j
từ
ngƣời cha bị cáo buộc. Mẫu số, đứa trẻ vẫn có 1 cơ hội nhận alen A
i
từ ngƣời mẹ, và
alen còn lại A
j
đƣợc nhận từ một ngƣời ngẫu nhiên, và bằng xác suất của p
j
(xác suất
để một ngƣời bất kì có alen A
j
). Khi đó PI = (1/2)/(p
j
) = 1/2p
j
.
Trƣờng hợp 9 : C = A
i
A
j
, M = A
i
A

j
, AF = A
i
A
i
. Trƣờng hợp này, tử số, đứa trẻ
có 1/2 cơ hội nhận alen A
i
từ ngƣời mẹ, và có 1 cơ hội nhận alen còn lại A
j
từ ngƣời
cha bị cáo buộc. Mẫu số, đứa trẻ vẫn có 1/2 cơ hội nhận alen A
i
từ ngƣời mẹ, và alen
còn lại A
j
đƣợc nhận từ một ngƣời ngẫu nhiên, và bằng xác suất của p
j
(xác suất để
một ngƣời bất kì có alen A
j
), hoặc là 1/2 cơ hội nhận alen A
j
từ ngƣời mẹ, và alen còn
lại A
i
đƣợc nhận từ một ngƣời ngẫu nhiên và bằng xác suất p
i
. Khi đó:Tử số của (1) =
1/2; Mẫu số của (1) = (1/2) x p

j
+ (1/2) x p
i
. Nhƣ vậy PI = 1/(p
i
+p
j
).
Trƣờng hợp 10 : C = A
i
A
j
, M = A
i
A
j
, AF = A
i
A
j
. Trƣờng hợp này, tử số, đứa
trẻ có ½ cơ hội nhận alen Ai từ ngƣời mẹ, và có ½ cơ hội nhận alen còn lại A
j
từ ngƣời

18
cha bị cáo buộc, hoặc ngƣợc lại ½ cơ hội nhận alen A
j
từ mẹ, và ½ cơ hội nhận alen A
i


từ ngƣời cha bị cáo buộc. Mẫu số, giống nhƣ trƣờng hợp 8. Khi đó:
Tử số của (1) = (1/2)x(1/2) + (1/2)x(1/2) = 1/2;
Mẫu số của (1) = (1/2) x p
j
+ (1/2) x p
i
.
Nhƣ vậy PI = 1/(p
i
+p
j
)
Trƣờng hợp 11 : C = A
i
A
j
, M = A
i
A
j
, AF = A
i
A
k
. Trƣờng hợp này, tử số, đứa
trẻ có ½ cơ hội nhận alen A
j
từ ngƣời mẹ, và có ½ cơ hội nhận alen còn lại A
i

từ ngƣời
cha bị cáo buộc. Mẫu số, giống nhƣ trƣờng hợp 8. Khi đó:
Tử số của (1) = (1/2)x(1/2) = 1/4;
Mẫu số của (1) = (1/2) x p
j
+ (1/2) x p
i
.
Nhƣ vậy PI = 1/[2(p
i
+p
j
)]
Trƣờng hợp 12 : C = A
i
A
j
, M = A
i
A
k
, AF = A
i
A
j
. Trƣờng hợp này, tử số, đứa
trẻ có ½ cơ hội nhận alen A
i
từ ngƣời mẹ, và có ½ cơ hội nhận alen còn lại A
j

từ ngƣời
cha bị cáo buộc. Mẫu số, đứa trẻ có ½ cơ hội nhận alen A
i
từ ngƣời mẹ, và p
j
cơ hội
nhận alen A
j
. Khi đó:
Tử số của (1) = (1/2)x(1/2) = 1/4;
Mẫu số của (1) = (1/2) x p
j
;
Nhƣ vậy PI = 1/(2p
j
)
Trƣờng hợp 13 : C = A
i
A
j
, M = A
i
A
k
, AF = A
j
A
j
. Trƣờng hợp này, tử số, đứa
trẻ có ½ cơ hội nhận alen A

i
từ ngƣời mẹ, và có 1 cơ hội nhận alen còn lại A
j
từ ngƣời
cha bị cáo buộc. Mẫu số, đứa trẻ có ½ cơ hội nhận alen A
i
từ ngƣời mẹ, và p
j
cơ hội
nhận alen A
j
. Khi đó:
Tử số của (1) = (1/2) = 1/2;
Mẫu số của (1) = (1/2) x p
j
;
Nhƣ vậy PI = 1/(p
j
)
Trƣờng hợp 14 : C = A
i
A
j
, M = A
i
A
k
, AF = A
j
A

k
. Trƣờng hợp này, tử số, đứa
trẻ có ½ cơ hội nhận alen A
i
từ ngƣời mẹ, và có ½ cơ hội nhận alen còn lại A
j
từ ngƣời
cha bị cáo buộc. Mẫu số, đứa trẻ có ½ cơ hội nhận alen A
i
từ ngƣời mẹ, và p
j
cơ hội
nhận alen A
j
. Khi đó:
Tử số của (1) = (1/2)x(1/2) = 1/4;
Mẫu số của (1) = (1/2) x p
j
;

19
Nhƣ vậy PI = 1/(2p
j
).
Trƣờng hợp 15 : C = A
i
A
j
, M = A
i

A
k
, AF = A
j
A
l
. Trƣờng hợp này, tử số, đứa
trẻ có ½ cơ hội nhận alen A
i
từ ngƣời mẹ, và có ½ cơ hội nhận alen còn lại A
j
từ ngƣời
cha bị cáo buộc. Mẫu số, đứa trẻ có ½ cơ hội nhận alen A
i
từ ngƣời mẹ, và p
j
cơ hội
nhận alen A
j
. Khi đó:
Tử số của (1) = (1/2)x(1/2) = 1/4;
Mẫu số của (1) = (1/2) x p
j
;
Nhƣ vậy PI = 1/(2p
j
).
2.1.3. Chỉ số cha con trong trƣờng hợp không có ngƣời mẹ
Khi không có kiểu gen của ngƣời mẹ, chúng ta vẫn có hai giả thuyết:
- H

p
: ngƣời cha bị cáo buộc là ngƣời cha thật.
- H
d
: ngƣời cha thật là một ngƣời ngẫu nhiên không liên quan.
Khi đó, chỉ số quan hệ cha con là:
































































Vì xác suất kiểu gen của ngƣời cha bị cáo buộc là cha của đứa trẻ không phụ
thuộc vào hai giả thuyết ngƣời cha bị cáo buộc là cha đẻ hay không là cha đẻ của đứa
trẻ. Do đó P(AF|H
p
) ~P(AF|H
d
). Vì xác suất kiểu gen của đứa trẻ dƣới điều kiện là con
của một ngƣời ngẫu nhiên sẽ không phụ thuộc vào kiểu gen của ngƣời cha bị cáo buộc,
tức là P(C|AF, H
d
) ~P(C|H
d
) [2]. Bảng 2.2 liệt kê các kiểu gen có thể của ngƣời con và
ngƣời cha bị cáo buộc trong trƣờng hợp không có kiểu gen của ngƣời mẹ.
Trƣờng hợp 1: Kiểu gen C = A
i
A
i
, AF = A
i
A
i

. Khi đó công thức (2) đƣợc viết lại là:




















Tử số: đứa trẻ có một cơ hội nhận alen A
i
từ ngƣời cha bị cáo buộc, alen A
i
còn
lại đƣợc nhận từ một ngƣời ngẫu nhiên nên xác xuất là p
i
.


20
Mẫu số: đứa trẻ có p
i
cơ hội để nhận một alen A
i
, xác suất để đứa trẻ nhận đƣợc
kiểu gen A
i
A
i
là p
i
*p
i
.
Khi đó PI = p
i
/(p
i
*p
i
) = 1/p
i
.
Bảng 2.2: Chỉ số mối quan hệ cha con (PI) cho mọi kiểu gen trong trƣờng
hợp không có kiểu gen của ngƣời mẹ
Trƣờng hợp
C
AF
PI

1
A
i
A
i

A
i
A
i

1/p
i

2
A
i
A
i

A
i
A
j

1/(2p
i
)
3
A

i
A
j

A
i
A
i

1/(2p
i
)
4
A
i
A
j

A
i
A
j

(p
i
+p
j
)/(2p
i
p

j
)
5
A
i
A
j

A
i
A
k

1/(4p
i
)
Trƣờng hợp 2: Kiểu gen C = A
i
A
i
, AF = A
i
A
j
. Khi đó công thức (2) đƣợc viết lại là:





















Tử số: đứa trẻ có ½ cơ hội nhận alen A
i
từ ngƣời cha bị cáo buộc, alen A
i
còn
lại đƣợc nhận từ một ngƣời ngẫu nhiên nên xác xuất là p
i
.
Mẫu số: đứa trẻ có p
i
cơ hội để nhận một alen A
i
, xác suất để đứa trẻ nhận đƣợc
kiểu gen A
i

A
i
là p
i
*p
i
.
Khi đó PI = p
i
/[2(p
i
*p
i
)] = 1/(2p
i
)
Trƣờng hợp 3: Kiểu gen C = A
i
A
j
, AF = A
i
A
i
. Khi đó công thức (2) đƣợc viết lại là:





















Tử số: đứa trẻ có 1 cơ hội nhận alen A
i
từ ngƣời cha bị cáo buộc, alen A
j
còn
lại đƣợc nhận từ một ngƣời ngẫu nhiên nên xác xuất là p
j
.
Mẫu số: xác suất để đứa trẻ nhận đƣợc kiểu gen A
i
A
j
từ một ngƣời ngẫu nhiên
là 2p
i

p
j
.
Khi đó PI = p
j
/[2(p
i
p
j
)] = 1/(2p
i
).
Trƣờng hợp 4: Kiểu gen C = A
i
A
j
, AF = A
i
A
j
. Khi đó công thức (2) đƣợc viết lại là:






















21
Tử số: đứa trẻ có ½ cơ hội nhận alen A
i
từ ngƣời cha bị cáo buộc, alen A
j
còn
lại đƣợc nhận từ một ngƣời ngẫu nhiên nên xác xuất là p
j
hoặc ngƣợc lại đứa trẻ có ½
cơ hội nhận alen A
j
từ ngƣời cha bị cáo buộc và xác suất nhận alen A
i
còn lại là p
i
.
Nhƣ vậy xác suất để đứa trẻ có kiểu gen A
i

A
j
từ ngƣời cha bị cáo buộc là (½ p
i
+ ½ p
j
).
Mẫu số: xác suất để đứa trẻ nhận đƣợc kiểu gen A
i
A
j
từ một ngƣời ngẫu nhiên
là 2p
i
p
j
.
Khi đó PI = (p
i
+p
j
)/[4(p
i
p
j
)]
Trƣờng hợp 5: Kiểu gen C = A
i
A
j

, AF = A
i
A
k
. Khi đó công thức (2) đƣợc viết lại là:




















Tử số: đứa trẻ có ½ cơ hội nhận alen A
i
từ ngƣời cha bị cáo buộc, và xác suất
nhận alen còn lại A
j

là p
j
. Nên xác suất để đứa trẻ nhận kiểu gen A
i
A
j
từ kiểu gen của
ngƣời cha bị cáo buộc là 1/(2p
j
).
Mẫu số: xác suất để đứa trẻ nhận đƣợc kiểu gen A
i
A
j
từ một ngƣời ngẫu nhiên
là 2p
i
p
j
.
Khi đó PI = p
j
/[2(p
i
p
j
)] = 1/(4p
i
).
2.1.4. Xác định cả cha và mẹ

Trong một số trƣờng hợp, ví dụ nhƣ một đứa trẻ bị bắt cóc, hoặc bị lạc từ bé,
sau khi tìm đƣợc mối liên hệ với bố mẹ của chúng, cần phải xác định xem cha mẹ đang
bị cáo buộc là cha mẹ của đứa trẻ có thật sự là cha mẹ đẻ của đứa trẻ hay không [2].
Chúng ta sẽ đƣa ra hai giả thuyết:
H
p
: cha mẹ bị cáo buộc là cha mẹ đẻ của đứa trẻ.
H
d
: cha mẹ thật của đứa trẻ là một cặp ngẫu nhiên.
Đặt kiểu gen AF, AM tƣơng ứng là kiểu gen của ngƣời cha bị cáo buộc, và
ngƣời mẹ bị cáo buộc [2]. Khi đó chúng ta có:















































Vì xác suất để có kiểu gen của 2 ngƣời bị cáo buộc là cha mẹ đẻ của đứa trẻ
không phụ thuộc vào hai giả thuyết H

p
, H
d
, nên P(AM, AF|H
p
) ~ P(AM, AF|H
d
) [2].

22
Mặt khác, xác suất để đứa trẻ có kiểu gen C với điều kiện H
d
sẽ không phụ
thuộc vào điều kiện AM, AF, nên P(C|AM, AF, H
d
) ~ P(C|H
d
) [2]. Nhƣ vậy, tỉ lệ khả
năng trong trƣờng hợp này sẽ là:

















Chúng ta có các trƣờng hợp kiểu gen có thể xảy ra cho bộ ba bố mẹ con cái
trong bảng 2.3.
Bảng 2.3: Tỉ lệ khả năng (LR) để xác định cả cha và mẹ
Trƣờng hợp
C
AM
AF
LR
1
A
i
A
i

A
i
A
i

A
i
A
i

1/p

i

2
A
i
A
j

1/(2p
i
)
3
A
i
A
j

A
i
A
i

1/p
i

4
A
i
A
j


1/(2p
i
)
5
A
i
A
k

1/(2p
i
)
6
A
i
A
j

A
i
A
i

A
i
A
j

1/(2p

j
)
7
A
j
A
j

1/p
j

8
A
j
A
k

1/(2p
j
)
9
A
i
A
j

A
i
A
i


1/(p
i
+ p
j
)
10
A
i
A
j

1/(p
i
+ p
j
)
11
A
i
A
k

1/[2(p
i
+ p
j
)]
12
A

i
A
k

A
i
A
j

1/(2p
j
)
13
A
j
A
j

1/p
j

14
A
j
A
k

1/(2p
j
)

15
A
j
A
l

1/(2p
j
)
Trƣờng hợp 1, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
i
, AM = A
i
A
i
, AF = A
i
A
i
.
Theo (3), tử số : C có 1 cơ hội nhận alen A
i
từ AM, và có 1 cơ hội nhận alen A
i

còn lại từ AF. Mẫu số, xác suất để C có kiểu gen A
i

A
i
là p
i
p
i
= p
i
2
.
Nhƣ vậy, LR = 1/ p
i
2
.
Trƣờng hợp 2, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
i
, AM = A
i
A
i
, AF = A
i
A
j
.
Theo (3), tử số : C có 1 cơ hội nhận alen A
i

từ AM, và có ½ cơ hội nhận alen A
i

còn lại từ AF. Mẫu số, xác suất để C có kiểu gen A
i
A
i
là p
i
p
i
= p
i
2
.
Nhƣ vậy, LR = 1/(2p
i
2
).

23
Trƣờng hợp 3, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
i
, AM = A
i
A
j

, AF = A
i
A
i
.
Theo (3), tử số : C có ½ cơ hội nhận alen A
i
từ AM, và có 1 cơ hội nhận alen A
i

còn lại từ AF. Mẫu số, xác suất để C có kiểu gen A
i
A
i
là p
i
p
i
= p
i
2
.
Nhƣ vậy, LR = 1/(2p
i
2
).
Trƣờng hợp 4, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A

i
, AM = A
i
A
j
, AF = A
i
A
j
.
Theo (3), tử số : C có ½ cơ hội nhận alen A
i
từ AM, và có ½ cơ hội nhận alen
A
i
còn lại từ AF. Mẫu số, xác suất để C có kiểu gen A
i
A
i
là p
i
p
i
= p
i
2
.
Nhƣ vậy, LR = 1/(4 p
i
2

).
Trƣờng hợp 5, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
i
, AM = A
i
A
j
, AF = A
i
A
k
.
Theo (3), tử số : C có ½ cơ hội nhận alen A
i
từ AM, và có ½ cơ hội nhận alen
A
i
còn lại từ AF. Mẫu số, xác suất để C có kiểu gen A
i
A
i
là p
i
p
i
= p
i

2
.
Nhƣ vậy, LR = 1/(4 p
i
2
).
Trƣờng hợp 6, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
j
, AM = A
i
A
i
, AF = A
i
A
j
.
Theo (3), tử số : C có 1 cơ hội nhận alen A
i
từ AM, và có ½ cơ hội nhận alen A
j

còn lại từ AF. Mẫu số, xác suất để C có kiểu gen A
i
A
j
là 2p

i
p
j
.
Nhƣ vậy, LR = 1/(4p
i
p
j
).
Trƣờng hợp 7, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
j
, AM = A
i
A
i
, AF = A
i
A
j
.
Theo (3), tử số : C có 1 cơ hội nhận alen A
i
từ AM, và có 1 cơ hội nhận alen A
j

còn lại từ AF. Mẫu số, xác suất để C có kiểu gen A
i

A
j
là 2p
i
p
j
.
Nhƣ vậy, LR = 1/(2p
i
p
j
).
Trƣờng hợp 8, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
j
, AM = A
i
A
i
, AF = A
j
A
k
.
Theo (3), tử số : C có 1 cơ hội nhận alen A
i
từ AM, và có ½ cơ hội nhận alen A
j


còn lại từ AF. Mẫu số, xác suất để C có kiểu gen A
i
A
j
là 2p
i
p
j
.
Nhƣ vậy, LR = 1/(4p
i
p
j
).
Trƣờng hợp 9, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
j
, AM = A
i
A
j
, AF = A
i
A
i
.


24
Theo (3), tử số : C có 1 cơ hội nhận alen A
i
từ AF, và có ½ cơ hội nhận alen A
j

còn lại từ AM. Mẫu số, xác suất để C có kiểu gen A
i
A
j
là 2p
i
p
j
.
Nhƣ vậy, LR = 1/(4p
i
p
j
).
Trƣờng hợp 10, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
j
, AM = A
i
A
j
, AF = A

i
A
j
.
Theo (3), tử số : C có ½ cơ hội nhận alen A
i
từ AM, và có ½ cơ hội nhận alen
A
j
còn lại từ AF hoặc ngƣợc lại, C có ½ cơ hội nhận alen A
i
từ AF, và có ½ cơ hội
nhận alen A
j
còn lại từ AM. Nhƣ vậy, tử số là : (1/2 x 1/2 + 1/2 x 1/2) = 1/2. Mẫu số,
xác suất để C có kiểu gen A
i
A
j
là 2p
i
p
j
.
Nhƣ vậy, LR = 1/(4p
i
p
j
).
Trƣờng hợp 11, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc

tƣơng ứng là: C = A
i
A
j
, AM = A
i
A
j
, AF = A
i
A
k
.
Theo (3), tử số : C có ½ cơ hội nhận alen A
i
từ AF, và có ½ cơ hội nhận alen A
j

còn lại từ AM. Mẫu số, xác suất để C có kiểu gen A
i
A
j
là 2p
i
p
j
.
Nhƣ vậy, LR = 1/(8p
i
p

j
).
Trƣờng hợp 12, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
j
, AM = A
i
A
k
, AF = A
i
A
j
.
Theo (3), tử số : C có ½ cơ hội nhận alen A
i
từ AM, và có ½ cơ hội nhận alen
A
j
còn lại từ AF. Mẫu số, xác suất để C có kiểu gen A
i
A
j
là 2p
i
p
j
.

Nhƣ vậy, LR = 1/(8p
i
p
j
).
Trƣờng hợp 13, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
j
, AM = A
i
A
k
, AF = A
j
A
j
.
Theo (3), tử số : C có ½ cơ hội nhận alen A
i
từ AM, và có 1 cơ hội nhận alen A
j

còn lại từ AF. Mẫu số, xác suất để C có kiểu gen A
i
A
j
là 2p
i

p
j
.
Nhƣ vậy, LR = 1/(4p
i
p
j
).
Trƣờng hợp 14, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
j
, AM = A
i
A
k
, AF = A
j
A
k
.
Theo (3), tử số : C có ½ cơ hội nhận alen A
i
từ AM, và có ½ cơ hội nhận alen
A
j
còn lại từ AF. Mẫu số, xác suất để C có kiểu gen A
i
A

j
là 2p
i
p
j
.
Nhƣ vậy, LR = 1/(8p
i
p
j
).
Trƣờng hợp 15, kiểu gen của đứa trẻ, ngƣời mẹ bị cáo buộc, ngƣời cha bị cáo buộc
tƣơng ứng là: C = A
i
A
j
, AM = A
i
A
k
, AF = A
j
A
l
.

25
Theo (3), tử số : C có ½ cơ hội nhận alen A
i
từ AM, và có ½ cơ hội nhận alen

A
j
còn lại từ AF. Mẫu số, xác suất để C có kiểu gen A
i
A
j
là 2p
i
p
j
.
Nhƣ vậy, LR = 1/(8p
i
p
j
).
2.1.5. Xác suất loại trừ
Bên cạnh xác suất của mối quan hệ cha con thì xác xuất loại trừ một ngƣời đàn
ông ngẫu nhiên từ quan hệ cha con cũng khá quan trọng. Xác suất loại trừ này đƣợc sử
dụng trong một vài ứng dụng khoa học và phòng nghiên cứu chỉ số cha con. Giả sử
chúng ta có kiểu gen của đứa trẻ, và ngƣời mẹ tƣơng ứng là C và M, xác suất loại trừ
(kí hiệu là EP) tại một kiểu gen cụ thể là tỉ lệ để một ngƣời đàn ông ngẫu nhiên có thể
bị loại trừ là cha của đứa trẻ. Không giống nhƣ chỉ số cha con, xác suất loại trừ có thể
đƣợc tính toán trƣớc khi thu thập kiểu gen của ngƣời cha bị cáo buộc, và nó đƣa ra tỉ lệ
của một ngƣời đàn ông ngẫu nhiên trong dân số bị loại trừ khỏi mối quan hệ là cha của
đứa trẻ [2].
Giả sử ngƣời mẹ và đứa trẻ có kiểu gen là M = A
i
A
j

, và C = A
i
A
k
tại một locus
cụ thể l. Một ngƣời đàn ông không có alen A
k
tại locus l sẽ bị loại trừ khỏi mối quan
hệ là cha của đứa trẻ. Vì thế, xác suất loại trừ trong trƣờng hợp này sẽ là (1 – p
k
)
2
. Khi
đó xác suất để 1 ngƣời đàn ông không bị loại trừ khỏi mối quan hệ cha con) chính là:
1 - EP
l
(tại locus l) [2]. Nhƣ vậy xác suất loại trừ trên toàn bộ k locus (đặt là overal
EP) đƣợc đánh giá là:


  





Bảng 2.4 chứa tất cả các trƣờng hợp có thể của kiểu gen của đứa trẻ và ngƣời mẹ, để
tính xác suất loại trừ một ngƣời đàn ông ngẫu nhiên ra khỏi mối quan hệ cha con.
Bảng 2.4: Xác suất để một ngƣời đàn ông ngẫu nhiên bị loại trừ khỏi mối
quan hệ cha con khi có kiểu gen của ngƣời mẹ M, và đứa trẻ C

M
C
EP
l

A
i
A
i

A
i
A
i

(1 – p
i
)
2

A
i
A
i

A
i
A
j


(1 – p
j
)
2

A
i
A
j

A
i
A
i

(1 – p
i
)
2

A
i
A
j

A
i
A
j


(1 – p
i
– p
j
)
2

A
i
A
j

A
i
A
k

(1 – p
k
)
2


Trong trƣờng hợp không có kiểu gen của ngƣời mẹ, khi đó chỉ có kiểu gen của
đứa trẻ, và có 2 trƣờng hợp: C = A
i
A
i
, hoặc C = A
i

A
j
. Chúng ta cũng có đƣợc xác suất
loại trừ một ngƣời đàn ông ngẫu nhiên là cha của đứa trẻ tại một locus cụ thể đƣợc tính
nhƣ bảng bên dƣới.

26
Một độ đo tổng quát thƣờng đƣợc sử dụng trong xác suất loại trừ chính là sức
mạnh của loại trừ (power of exclustion – PE). Khái niệm EP đƣợc sử dụng để tính xác
suất loại trừ tƣơng ứng tại một trƣờng hợp quan hệ cha con cụ thể, còn PE đƣợc sử
dụng tƣơng ứng với tất cả các khả năng đƣợc tổ hợp của mối quan hệ cha con [2].
Bảng 2.5: Xác suất để một ngƣời đàn ông ngẫu nhiên bị loại trừ khỏi mối
quan hệ cha con khi chỉ có kiểu gen của đứa trẻ C
C
EP
l

A
i
A
i

(1 – p
i
)
2

A
i
A

j

(1 – p
i
– p
j
)
2


Giả sử tại một locus với n alen A
1
, A
2
,…, A
n
tƣơng ứng có các tần số là p
1
, p
2
,
…p
n
. Giả sử kiểu gen của ngƣời mẹ và đứa trẻ là M = A
i
A
j
, C = A
i
A

k
, khi đó bất kì
một ngƣời đàn ông không có alen A
k
sẽ bị loại trừ khỏi mối quan hệ cha con, và đƣợc
đánh giá nhƣ sau:
IPE = P(một ngƣời đàn ông không là cha đứa trẻ|M=A
i
A
j
, C=A
i
A
k
) = (1 – p
k
)
2

Mặt khác ta có:
P(M=A
i
A
j
, C=A
i
A
k
) = 2p
i

p
j
(p
k
/2) = p
i
p
j
p
k

Xác suất PE thu đƣợc chính bằng tổng các xác suất IPE của tất cả các kiểu gen
kết hợp mẹ con [2], và đƣợc tính nhƣ sau:
















Và, kết quả là:





  

 



  





 







 


  

 











Trong trƣờng hợp không có mẹ [2], thì xác suất loại trừ đƣợc tính là:








  





 






  

 










2.1.6. Đột biến
Tỷ lệ đột biến cao của locus là không thể bỏ qua. Đột biến có thể xảy ra trong
trƣờng hợp xét nghiệm huyết thống cha con, mà các kiểu gen của ngƣời cha bị cáo
buộc phù hợp với đứa trẻ ở tất cả các locus, ngoại trừ một hoặc hai locus [3].

27
Theo AABB (Hiệp hội các ngân hàng máu), nếu kiểm thử mối quan hệ cha
con có từ hai hoặc nhiều locus trở lên không đƣợc mép với nhau thì trƣờng hợp này
không có mối quan hệ cha con. Chỉ số đột biến trung bình trong quan hệ cha
con (AMPI) đƣợc sử dụng tại các locus mà kiểu gen không mép với nhau [2].
Hãy xem xét trƣờng hợp kiểm thử có các kiểu gen của đứa trẻ, ngƣời mẹ và
ngƣời cha bị cáo buộc là cha thật của đứa trẻ. Chúng ta có 2 giả thuyết:
H
p
: ngƣời cha bị cáo buộc là cha thật của đứa trẻ.
H

d
: ngƣời cha thật của đứa trẻ là một ngƣời đàn ông ngẫu nhiên không liên
quan.
Giả định tại một locus trong bộ kiểm thử kiểu gen của ngƣời cha bị cáo buộc có
kiểu gen không mép với nhau, và tại locus này có kiểu gen của đứa trẻ và ngƣời mẹ
thật. Lúc này chúng ta sẽ sử dụng chỉ số AMPI [2], tỉ lệ khả năng tại locus có kiểu gen
không mép này sẽ đƣợc tính toán nhƣ sau:
P(C,M, kiểu gen của đứa trẻ và ngƣời cha bị cáo buộc|

)
P(C,M, kiểu gen của đứa trẻ và ngƣời cha bị cáo buộc|

)
















Tử số: kiểu gen của ngƣời cha bị cáo buộc (là ngƣời cha thật của đứa trẻ dƣới

giả thuyết H
d
) có kiểu gen không mép với kiểu gen của ngƣời con vì đột biến, vì thế
xác suất trong trƣờng hợp này đƣợc tính bằng tỉ lệ đột biến trung bình µ.
Mẫu số: kiểu gen của ngƣời cha bị cáo buộc dƣới giả thuyết Hd, không là cha
thật, đƣợc tính bằng xác suất loại trừ một ngƣời đàn ông ngẫu nhiên từ mối quan hệ
cha con. Vì thế, ta có công thức tính tỉ lệ khả năng tại locus có kiểu gen không mép
nhau:




LR lúc này còn đƣợc gọi là chỉ số cha con đột biến trung bình (AMPI).
2.2. Xác định tỷ lệ khả năng của mối quan hệ họ hàng của hai
người
Trong phần trƣớc chúng tôi đã thảo luận về phƣơng pháp xác định chỉ số PI của
mối quan hệ cha con, đó là: kiểm thử mối quan hệ cha con trong trƣờng hợp có ngƣời
mẹ, không có ngƣời mẹ, hoặc xác định cả bố mẹ. Trong phần này, chúng tôi sẽ thảo

×