Tải bản đầy đủ (.pdf) (116 trang)

GIÁO TRÌNH DI TRUYỀN SỐ LƯỢNG pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.57 MB, 116 trang )

ĐẠI HỌC NÔNG LÂM
THÀNH PHỐ HỐ CHÍ MINH













GIÁO TRÌNH
DI TRUYỀN SỐ LƯỢNG
(CHƯƠNG TRÌNH CAO HỌC)



BÙI CHÍ BỬU, NGUYỄN THỊ LANG



















2003
DI TRUYỀN SỐ LƯỢNG

MỞ ĐẦU

Sự phát triển của khoa học di truyền bắt đầu từ những khám phá lại công trình của
Mendel vào những năm 1900. Tuy nhiên lúc bấy giờ cũng có những nghiên cứu di truyền
khác hoạt động rất tích cực: những nghiên cứu nầy đã góp phần vào sự phát triển ngành di
truyền học. Đầu tiên là Francis Galton, ông cho xuất bản một công trình khái quát về phương
pháp những phát hiện về "Tính di truyền tự nhiên" vào năm 1889. Sau đó Karl Pearson và các
học trò của ông đã tiếp tục công trình nầy. Nhờ công trình của họ, ngành toán thống kê được
áp dụng vào trong sinh học, điều nầy được xem như là một sự kiện vĩ đại đánh dấu một bước
phát triển vô cùng có ý nghĩa về sự trưởng thành của ngành sinh học số lượng (di truyền số
lượng).
Sự thành công không trọn vẹn của công trình nầy trong vài trường hợp đã thừa nhận
mục tiêu mà sự quan hệ giữa bố mẹ và con cái về tính di truyền khá rõ ràng. Chính Mendel tự
thấy sự thất bại của mình do các thí nghiệm không xác định đưọc số lượng mô hình khác nhau
của những con lai, hoặc không sắp xếp được những mô hình theo các thế hệ phân ly của nó,
hoặc khẳng định một cách chắc chắn các quan hệ có tính thống kê. Trong khi công trình của
Galton có thể được xem như khắc phục được những vấn đề thuộc về thống kê, bản chất của
những vật liệu mà ông chọn lựa giúp ông thành công trong việc xác định số lượng mô hình

con lai, và các thế hệ phân ly của nó. Việc áp dụng của ông về các số liệu trên con người của
một số gia đình và tổ tiên có quan hệ huyết thống cho thấy hết sức khó khăn, nhưng điều phải
lựa chọn là những là những tính trạng đo lường được (tính trạng số lượng) như kích thước của
một người cho phép ông xây dựng một quan điểm về các định luật di truyền. Những tính trạng
nầy cho thấy có những biến thiên liên tục (continuous gradations) biểu thị trong một quãng
khá rộng, ở giữa nó tập hợp một biểu thị chung nhất của gia đình hay quần thể, và tần suất của
nó cao nhất so với hai cực biên. Sự phân bố tần suất của các biến số, đôi khi có dạng của phân
bố chuẩn (normal), nhưng trong vài trường hợp khác nó có dạng phân bố không đối xứng
(asymmetrical). Tỷ lệ phân ly Mendel trong trong tính chất không liên tục về mặt kiến trúc di
truyền và sự truyền tín hiệu tùy thuộc vào việc sử dụng những tính trạng di truyền mà cá thể
trong con lai thể hiện tính trạng đó thuộc vào nhóm rất hiếm, vì nó không do sự biến thiên liên
tục mà ra. Thực vậy Mendel đã phủ nhận loại biến dị như thế trong các vật liệu của ông với
lý do: đó chỉ là một ảnh hưởng có tính chất bất thường (distracting influences) trong phân
tích.
Sự biến thiên liên tục nầy không thể dự kiến một cách hoàn toàn. Chính Darwin đã
nhấn mạnh đến tầm quan trọng của các giai đoạn tích lũy rất nhỏ trong quá trình tiến hóa, đặc
biệt là đối với con người, có rất nhiều liên tục biến dị đã tồn tại. Do đó, tính chất toán sinh học
trong khảo cứu càng ngày càng bức thiết hơn đối với các nhà di truyền, Galton và Pearson đã
chứng minh biến dị như vậy là một phần của di truyền học. Ngay cả lúc bấy giờ, họ vẫn chưa
thành công trong việc giải thích cách truyền lại tính trạng như thế nào. Cả hai phương pháp
của Galton và Mendel đều chưa mang lai một kết quả rõ ràng. Sự hiểu biết về các biến dị liên
tục phải chờ một sự phối hợp kết quả của hai phương pháp di truyền học và toán sinh học,
cái nầy bổ sung cái kia. Di truyền Mendel cho chúng ta những nguyên tắc phân tích có cơ sở,
toán sinh học cho chúng ta cách xử lý biến dị liên tục, cách biểu hiện nó trong mô hình để
phân tích có hiệu quả.
Tuy nhiên việc phối hợp hai phương pháp nầy phải kéo dài mãi đến khi công trình của
Mendel được mọi người tái phát hiện. Bấy giờ, vấn đề trở nên nghiêm trọng hơn với nhiều ý
kiến khác nhau về biến dị liên tục và biến dị không liên tục trong quá trình tiến hóa. Nhiều
cuộc bút chiến đã xảy ra giữa đôi bên. Cùng lúc ấy, mọi nổ lực nhằm hòa giải hai quan điểm
đều tỏ ra kính trọng đối với cả hai nhóm. Sự bất đồng cơ bản xuất phát từ sự biểu hiện chưa

biết về nội dung căn bản của Mendel đối với việc khẳng định ảnh hưởng cả kiểu gen và kiểu
hình. Các nhà toán sinh học dường như chỉ quan tâm đến biến dị liên tục của tế bào soma như
là điểm đặc sắc của sự biến dị di truyền liên tục. Các nhà thuộc trường phái Mendel xem xét
sự biến dị di truyền không liên tục như một tính chất không tương hợp (incompatible) với bất
cứ cái gì, ngoại trừ sự biến dị không liên tục của tế bào soma. Thật vậy, de Vries đã lấy sự
liên tục của biến dị trong kiểu hình làm chỉ tiêu khẳng định sự không di truyền (non-
heritability).
Như vậy có hai giai đoạn xảy ra trước khi kết hợp hai phương pháp di truyền học và
toàn học xích lại với nhau. Vào năm 1909, Johansen xuất bản quyển Elemente der exakten
Erblichkeitslehre. Trong đó ông mô tả các thí nghiệm trên cây đậu và ông đã đề ra lý thuyết
chọn dòng thuần. Đặc biệt là ông đã nhận thấy các tính trạng di truyền và không di truyền đều
đáp ứng với sự biến dị ở trọng lượng hạt mà ông rất quan tâm. Sự tương quan giữa kiểu gen
và kiểu hình trở nên rõ ràng hơn. Ảnh hưởng của sự không liên tục của kiểu gen có thể ít hơn
và sự biến dị không liên tục của kiểu hình do ảnh hưởng ngoại cảnh xảy ra nhiều hơn.
Cũng trong năm 1909, Nilsson - Ehle đã thực hiện một công trình khác. Các yếu tố di
truyền có những hoạt động rất giống nhau trong thí nghiệm đối với lúa mì và kiều mạch. Thí
dụ có ba yếu tố ảnh hưởng đến sự biến đổi màu hạt đỏ trở thành trắng và ngược lại. Một trong
ba yếu tố khi phân ly đơn độc đều cho tỉ lệ 3 đỏ : 1 trắng ở F
2
. Hai trong ba yếu tố, khi phân ly
sẽ cho tỉ lệ 15 đỏ : 1 trắng, và khi cả ba phối hợp với nhau, sự phân ly sẽ có tỉ lệ 63 đỏ : 1
trắng. Cây có hạt đỏ trong thệ F
2
có thể cho biết cấu trúc di truyền khac nhau, bằng cách trồng
thế hệ F
3
. Một vài cây hạt đỏ cho tỷ lệ 3 đỏ : 1 trắng, số khác cho tỷ lệ 15 đỏ : 1 trắng, và 63
đỏ : 1 trắng, còn lại chỉ có hạt đỏ hoàn toàn. Như vậy không có sự khác biệt dự đoán về màu
sắc giữa những (cây có hạt màu đỏ đối với yếu tố khác nhau. Chắc chắn có vài khác biệt nào
đó trong tính trạng màu đỏ, nhưng nó xuất hiện với nhiều yếu tố hơn là yếu tố được biết. Mức

độ thứ nhất giữa tính trạng màu đỏ xảy ra đồng thời với ba kiểu gen Aabbcc, aaBbcc và
aabbCc. Mức độü thứ hai là 6 kiểu gen AAbbcc, aaBBcc, aabbCC, AaBbcc, AabbCc, và
aaBbCc. Cứ như thế tiếp tục. Các yếu tố khác nhau có thể có những hoạt động giống nhau và
những hoạt ấy tích lũy lại thành số lượng.
Các yếu tố giống nhau của hoạt động cá thể nhỏ hơn có thể là biến dị số lượng liên tục
trong khi phân ly. Mỗi yếu tố này vẫn được di truyền theo luật Mendel và sự thay đổi của nó
sẽ không liên tục (discontinuous) hoặc sẽ thay đối chất lượng (qualitative). Với hàng loạt các
yếu tố như vậy, và có sự hoạt động tích luỹ như nhau, sẽ có các lượng đổi (dosages) khác
nhau trong đó cái trung bình là cái phổ biến nhất. Qua phân số biểu hiện kiểu hình đối với số
lượng yếu tố (factor dosage), biến dị trở nên có tính trạng số lượng (quantitative), theo đường
biểu diễn tần suất của Galton và nó trở nên liên tục (continuous). Sự liên tục sẽ hoàn toàn do
ảnh hưởng của các đặc tính không di truyền, những đặc tính nầy sẽ tạo ra các mức độ về kiểu
hình (phenotype range) của sự trùng lắp những kiểu gen khác nhau.
Mười năm sau đó, giả thuyết đa yếu tố này được áp dụng trong sinh vật do East và
cộng tác viên của ông. Họ cho rằng di truyền của một số tính trạng có biến số liên tục trong
thuốc lá và bắp có thể được tính toán (East 1915, Emerson và East 1913). Còn Fisher thực
hiện sự tổng hợp của toán sinh học và di truyền. Ông chứng minh rằng: kết quả của toán sinh
học, phần nào đó có quan hệ khi xem xét mối liên hệ bà con họ hàng của loài người, là quan
điểm rất mới mẽ (Fisher 1918). Từ số liệu của các nhà toán sinh học ông có thể chứng minh
tính chất trội (dominance) của đa yếu tố.
Tóm lại:
Di truyền số lượng có thể được hiểu: tính trạng di truyền của những khác biệt giữa các
cá thể với nhau ở mức độü số lượng hơn là chất lượng. Theo Darwin, đây là sự khác biệt giữa
các cá thể trong chọn lọc tự nhiện đã xảy ra và tích tụ dần trong quá trình tiến hóa. Sự khác
biệt về chất lượng, phân chia những cá thể bằng những dạng hình khác nhau, bới mức độ ít
hoặc không có kiểu liên kết do các dạng trung gian. Tỉ lệ Mendel chỉ được xem xét khi có sự
khác biệt một gen ở một locus đơn độc.
Sự khác biệt về số lượng tùy thuộc vào số gen mà ảnh hưởng của nó trong mối quan
hệ với biên dị gây nên từ các lý do khác. Sự khác biệt về số lượng bị ảnh hưởng bởi sự khác
biệt gen ở nhiều loci, đặc biệt ảnh hưởng của môi trường có tác động mạnh mẽ. Do đó các

gen riêng biệt không thể đưọc xác định bằng sự phân ly của nó, phương pháp phân tích của
Mendel không áp dụng được trong trường hợp nầy.
Việc triển khai di truyền Mendel vào di truyền số lượng có thể thực hiện được qua hai
bước:
- Đưa các khái niệm mới có quan hệ đến độ phong phú di truyền của quần thể.
- Đưa các khái niệm về các tính trạng di truyền đo đếm được (the inheritance of
measurements).
Trong thí nghiệm di truyền số lượng, có ba định luật:
1. Nghiên cứu về quần thể: cho phép xác định mức độ phong phú của các gen phối hợp ra sự
biến đổi sô úlượng.
2. Lai phân tích: cho phép chúng ta thử nghiệm giá trị của lý thuyết.
3. Một vài kết quả về qui trình chọn giống: nhiều cái không thể dự đoán bằng lý thuyết, mà
phải bằng kết quả của sự chọn lọc trong thí nghiệm.

Chương 1

KIẾN TRÚC DI TRUYỀN
CỦA MỘT QUẦN THỂ

Di truyền quần thể (population genetics) có thể được xem là nền tảng của di truyền số
lượng (quantitative genetics), bởi vì những nguyên tắc có tính chất toán học, tính chất lý
thuyết của nó
I-1.
QUẦN THỂ GIAO PHỐI NGẪU NHIÊN
Trong di truyền Mendel, lai tạo giữa cây hoa tím và cây hoa trắng nhằm khảo sát tỉ lệ
phân ly của con lai từ hạt. Trái lại trong di truyền quần thể, nó đề cập đến hàng loạt phân tích
thống kê của luật Mendel trong từng nhóm gia đình hoặc từng nhóm cá thể: nó nghiên cứu
hiện tượng di truyền ở mức độ quần thể.
Cơ sở di truyền đã được giả định bởi Mendel. Các nhà di truyền quần thể khảo sát các
cây hoa tím và hoa trắng trong một vùng đã được xác định. Khảo sát tần suất của các loại hình

khác nhau của những cặp lai trong một quần thể, và tỷ lệ của các loại cây khác nhau từ một
thế hệ so với thế hệ sau trong từng trường hợp khác nhau.
Đời sống của một cá thể bị hạn chế bởi độ dài thời gian, và sự biểu hiện có tính di
truyền của quần thể ấy được cố định trong suốt cuộc đời, làm che khuất các đột biến gen. Trái
lại một quần thể trong thực tế là bất tử, có thể ở qui mô lớn hoặc nhỏ, có thể được phân bố
trên một vùng rộng hoặc hẹp, và có thể thay đổi thành phần di truyền từ thế hệ này sang thế
hệ khác một cách đột ngột hoặc từ từ.
Nghiên cứu di truyền quần thể xem như phải nghiên cứu sự tiến hóa có tính chất hữu
cơ (organic evolution), trên cơ sở di truyền, nhưng nó là một tiến trình của sự thay đổi có tính
chất tích luỹ những tính trạng di truyền của một loài sinh vật. Trong khi nghiên cứu các kết
quả của di truyền Mendel của một quần thể liên tục chắc chắn sẽ nẩy sinh các định luật hoặc
qui luật mới, chúng ta sẽ phải làm cho nó trở nên vững chắc và phát triển.

I-1-1. Tần suất gen
Giả định có hai len (A, a) ở một locus nào đó.
Có N cá thể lưỡng bội (dipliod) với gía trị D là dominant (trội) (AA)., H là dị hợp từ
(Aa), và R là recessive (lặn) (aa). Như vậy D + H + R = N
Mặc dù có 3 loại hình cá thể của nhóm, nhưng chỉ có 2 loại gen: A và a. Do đó N cá
thể nầy có 2N gen cùng phối hợp với nhau.
Vì mỗi AA cá thể có 2 gen A và mỗi Aa cá thể có 1 gen A, cho nên tổng số gen A
trong nhóm sẽ là:
p = (2D + H) / 2N = (D + 1/2H) / N
Tỉ lệ nầy được gọi là tần suất gen (gene frequency) của A trong nhóm
Tương tự như vậy tần suất gen a trong nhóm sẽ là:
q = (H + 2R) / 2N = (1/2H + R) / N
Sao cho p + q = 1
Thí dụ trong một nhóm có 40 cá thể: 2, 12, 26
p = (2 + 6) / 40 = 0.20
q = (6 + 26) / 40 = 0.80
Thông thường 3 kiểu gen có những tỉ lệ được biết trước, đặc biệt trong các nhóm lớn.

Kế đến chúng ta xem như D + H + R = 1
p = D + 1/2H
q = 1/2H + R
Trở lại thí dụ quần thể ban đầu là 2, 12, 26 sẽ có dạng 0.05, 0.30, 0.65 (2/40, 12/40,
26/40) trong đó p = 0.05 + 0.15 = 0.20
q = 0.15 + 0.65 = 0.80
Kết quả giống như cách tính trước đó

I-1-2. Giao phối ngẫu nhiên (Random mating)

Bảng 1: Tần suất giao phối ngẫu nhiên

Bố
Mẹ
AA Aa aa
AA D D
2
DH DR
Aa H HD H
2
HR
aa R RD RD R
2

Các loại giao phối có trong bảng 1 với tần suất cụ thể.
Tuy nhiên chúng ta chỉ nên nhấn mạnh tần suất có tính chất lý thuyết nầy sẽ thực sự
xảy ra chỉ trong trường hợp các quần thể rất lớn.
Thuật ngữ PANMIXIA được dùng đồng nghĩa với giao phối ngẫu nhiên và quần thể
như vậy được gọi là panmictic.


I-1-3. Định luật Hardy - Weinberg

Trong một quần thể lớn giao phối ngẫu nhiên
D = p
2
, H = 2pq, R = q
2

Quần thể (p
2
, 2pq, q
2
) được xem như ở trạng thái cân bằng (equilibrium) trong hệ
thống giao phối ngẫu nhiên.
Thuật ngữ “equilibrium” có nghĩa là: không có sự thay đổi trong tỉ lệ kiểu gen của
quần thể từ thế hệ nầy sang thế hệ khác. Điều này cũng có nghĩa là không có sự thay đổi về
tần suất gen.
Có nhiều cách thể hiện của các điều kiện cân bằng cá thể xảy ra. Điều kiện đặc biệt
trong giao phối ngẫu nhiên trong định luật Hardy - Weinberg đã khám phá vào năm 1908 do
công trình của hai ông Hardy và Weinberg thực hiện và công bố cùng một năm. Định luật này
rất quan trọng về cơ bản trong di truyền quần thể.
Điều kiện đặt ra là: - Giao phối ngẫu nhiên
- Quần thể lớn
Tần suất của các loại hình giao phối khác nhau trong quần thể được ghi nhận trong
bảng 1: p
2
= D, q
2
= R, và 2pq = H.
Nếu có lai đảo thì trong 9 loại giao phối cũng chỉ có 6 loại hình được ghi nhận. Tần

suất của mỗi loại giao phối và tỉ lệ con lai tương ứng được trình bày ở bảng 2, trong đó thế hệ
con lai vẫn giữ nguyên ( p
2
, 2pq, q
2
).

Bảng 2: Giao phối trong quần thể con lai panmictic và ổn định

Tần suất giao phối Con lai
Loại giao phối
AA Aa aa
AA x AA p
4
P
4

AA x Aa 4p
3
q 2p
3
q 2p
3
q
Aa x Aa 4p
2
q
2
P
2

q
2
2p
2
q
2
p
2
q
2
AA x aa 2p
2
q
2
2p
2
q
2

Aa x aa 4pq
3
2pq
3
2pq
3

aa x aa q
4
q
4


Cộng 1.00 P
2
2pq q
2

Thí dụ: cộng thử p
4
+ 2p
3
q + p
2
q
2
= p
4
+ 2p
3
(1-p) + p
2
(1-p)
2

= p
2


I-1-4. Thiết lập sự cân bằng (ổn định)
Tính chất quan trọng thứ hai về lý thuyết nói về quần thể giao phối ngẫu nhiên là tính
cân bằng xảy ra sau một thế hệ giao phối ngẫu nhiên, không cần biết đến yếu tố khởi đầu của

quần thể. Ký hiệu cho lý thuyết nầy là:
(D, H, R) ∏ ( p
2
, 2pq, q
2
).
Thí dụ quần thể khởi đầu là
(0.10, 0.20, 0.70) trong đó p = 0.20 và q = 0.80 sẽ trở thành
(0.40, 0.32, 0.64) trong quần thể kế tiếp
[p
2
] [2pq] [q
2
]
Sau đó tỉ lệ nầy sẽ được duy trì trong các thế hệ tiếp theo

Bảng 3: Thiết lập sự cân bằng trong giao phối ngẫu nhiên

Tần suất giao phối Con lai
Loại giao phối
AA Aa aa
AA x AA D
2
D
2

AA x Aa 2DH DH DH
Aa x Aa H
2
1/4H

2
1/2H
2
1/4H
2
AA x aa 2DR

2DR


Aa x aa 2HR HR HR
aa x aa R
2
R
2
Cộng 1.00 (D + 1/2H)
2
2(D+ 1/2H)(1/2H+R) (1/2H+R)
2

P
2
2pq q
2


I-1-5. Sự đồng nhất ngẫu nhiên giao tử:

Kết quả chung của giao phối ngẫu nhiên giữa các thế hệ và sự đồng nhất một cách
ngẫu nhiên (random union) sau đó của các giao tử được sản sinh do giao phối, kết quả nầy

tương đương với sự đồng nhất ngẫu nhiên của tất cả giao tử (gamete) được sản sinh do quần
thể
Định luật nầy được mô hình hóa như sau
Giao tử đực
AA Aa aa
D H R

A

p q
AA D A p p
2
pq
Giao tử cái Aa H
aa R a q pq q
2






Đây là nguyên tắc thiết lập nên những kết quả của 2 sections trong cùng một thời gian
bất cứ quần thể (D.H.R) nào cũng sẽ trở thành (p
2
, 2pq, q
2
) trong thế hệ tiếp theo với sự giao
phối ngẫu nhiên và rồi trạng thái nầy luôn ổn định sau đó.


1-2. SỰ PHỐI HỢP BỐ MẸ CÓ TÍNH LẶN

Sự phối hợp bố mẹ có tính lặn có thể được xem xét trong thí dụ sau đây

Phối hợp của bố mẹ Cộng
Tỉ lệ
Aa x Aa Aa x aa aa x aa
Trong tất cả cặp lai p
2
q
2
2pq
3
q
4
q
2

Trong cặp lai sản xuất con lai aa p
2
2pq q
2
1.00

Thí dụ bố mẹ của những cá thể có gen lặn aa
Nó có thể là một trong những trường hợp sau đây: Aa x Aa, Aa x aa hoặc aa x
aa.
Xem lại cột cuối cùng của bảng 2 cho thấy 3 cặp lai nầy có những tần suất như trên
Hàng cuối cùng (bảng) cho thấy một tỉ lệ giống nhau về kiểu gen trong quần thể
Kết luận: Khi các cá thể có gen lặn aa rất hiếm trong quần thể nói chung, xu thế chính

của nó sẽ là con lai của cặp lai Aa x Aa
Thí dụ tính bạch tạng của loài người là một gen lặn, người ta ghi nhận rằng có 1 người
bạch tạng / 20.000 người (q
2
= 0.00005) ở các nước Châu Âu. Như vậy tần suất của gen lặn
bạch tạng (albinism) ước khoảng q = 1/140 = 0.007. Tỉ lệ dị hợp tử trong quần thể 2pq = 1/70.
Trong tất cả các cá thể albino (0.993)
3
= 98.60 phần trăm sẽ là con lai của Aa x Aa trong đó
cả bố lẫn mẹ đều là người bình thường.

Một vài tính chất của quần thể cân bằng:

[1] Trong một quần thể lưỡng bội tỉ lệ của dị hợp tử là H = 2pq, giá trị của nó chưa
bao giờ vượt quá 0.50
dH d
= 2q (1 - q) = 2 - 4q = 0
dq dq
a

DxRH 2=
2=
DxR
H

Chúng ta thấy rằng giá trị tối đa của H là 0.50 khi q = p = 1/2
H có thể lớn hơn D hoặc R: nhưng không bao giờ lớn hơn D + R. Nếu tần suất của
một gen lớn hơn gâõp đôi tần suất gen khác, thì tỉ lệ dị hợp tử là trung bình cộng giữa 2 giá trị
của đồng hợp tử. Thí dụ p > 2q có nnghĩa là p > 2/3 chúng ta có p
2

> 2pq > q
2
[2] Tỉ lệ dị hợp tử là hai lần căn số của D x R








Như vậy 4DR = H
2

Quần thể (D, H, R) có thể được trình bày bằng mô hình một tam giác đều XYZ. Từ
điểm P ở trong tam giác, kẻ những đường thẳng góc với 3 cạnh mà độ dài tượng trưng cho giá
trị D.H.R.
Khoảng cách từ P đến XZ là H
Khoảng cách từ P đến YZ là D
Khoảng cách từ P đến XY là R
4DR = H
2

Các điểm của quần thể cân bằng sẽ di động trên một parabol 4DR - H
2
= 0
XQ : QZ = R + 1/2H:D - 1/2H = q:p

Y


P=0.7 P D=0.1





X q Q p Z


I-3. ỨNG DỤNG VÀ PHÁT TRIỂN ĐỊNH LUẬT CÂN BẰNG

I-3-1. KHÔNG CÓ TÍNH TRỘI
Chúng ta dùng thí dụ đơn giản về ba kiểu gen: Gọi a, b, c là số quan sát các kiểu gen
A
1
A
1
, A
1
A
2
, A
2
A
2
theo thứ tự trong một ngẫu nhiên G = a + b + c cá thể.
Có một cân bằng trong mẫu ngẫu nhiên của 2G gen, mà
2a + b được quan, sát biểu thị là A
1


b + 2c được quan, sát biểu thị là A
2

Ước đoán tỉ lệ gen A
1
và A
2
sẽ được ghi nhận như sau
p = (2a + b) / 2G [1]
q = (b + 2c) / 2G
Phương sai mẫu V(p) = V(q) = pq / 2G [1V]
Để xác định con số quan sát được của 3 kiểu gen trên cơ sở định luật Hardy -
Weinberg. Chúng ta có thể sử dụng phép thử χ
2
, trong đó giá trị dự đoán là: a' = Gp
2
, b' =
2Gpq, c' = Cq
2

(a - a') (b - b') (c - c')
χ
2
= + + [2]
a' b' c'
Với một độ tự do (df)
Hợp tử A
1
A
1

có thể dược xem như là một thuộc tính tạo sự thuận lợi để hai giao tử
đực và giao tử cái hợp nhất mang gen A
1

H=0.2


A
1
A
2

A
1
a 1/2b a + 1/2b
A
2
1/2b c 1/2b + c
a + 1/2b 1/2b + c G


(ac - 1/4b
2
)
2
G (4ac -b
2
)
2
G

χ
2
= = [2']
(a + 1/2b)
2
(1/2b + c)
2
(2a + b)
2
(b + 2c)
2


[2] và[2'] trong phép thử Chi bình phương đều cho kết quả như nhau
Thí dụ Rife (1938) và Haldane (1936) đã khảo sát nhóm máu của hơn 1000 người
Trung Quốc ở Hồng Kông với kết quả như sau:

Nhóm máu Số người
M MN N
Cộng
Quan sát 342.0 500.0 187.0 1029
Dự đoán 340.6 502.8 185.6 1029
p = 0.5753 q = 0.4247
χ
2
= 0.032 (P = 0.85)
Như vậy một hiện tượng sinh học đã được chứng minh bằng định luật toán học. Thí dụ
này đơn giản, đủ để chứng minh tính chất quan trọng của phương pháp phân tích các số liệu di
truyền.




I-3-2. CÔNG THỨC CHÍNH XÁC ĐỐI VỚI CÁC MẪU NHỎ
Qui mô có hiệu quả của nột mẫu nào đó đều liên quan ít nhiều đến tần suất gen, chúng
ta cần có một mẫu rất lớn để có thể bao gồm được cá thể aa. Mẫu có qui mô trung bình có thể
không bao gồm được cá thể aa.

Phương pháp này mô tả việc lấy giá trị a' = Gp
2
có thể chỉ được sử dụng trong mẫu lớn
hoặc trong trường hợp tần suất gen trung bình. Nó không thể được sử dụng nếu tần suất gen
nhỏ đến mức Gp
2
< 1 hoặc nếu trong trường hợp q < 1
Levene (1949) đã phát triển một mô thức để tính số kiểu gen trong trường hợp mẫu
nhỏ.
Chúng ta viết lại g
1
=2a + b, g
2
=b + 2c trong đó g
1
+ g
2
= 2G.
Số cá thể dự đoán của những kiểu gen trong điều kiện nầy là g
1
(A
1
gen) và g

2
(A
2
gen):
g
1
(g
1
-1) g
1
g
2
g
2
(g
2
-1)
. . [3]
2(2G - 1) 2G - 1 2(2G - 1)

Nếu có một gen A
1
trong mẫu (g
1
=1), công thức (3) sẽ cho biết số cá thể dự đoán của A
1
A
1

cá thể là zero, thực tế là đúng như vậy.

a' = Gp
2
= 1029 (p
2
) = 340,6

b' = 2Gpq = 2.(1029). p.q = 502.8
c' = Gq
2
= 185.6

Số cá thể dự đoán của các đồng hợp tử trong công thức (3) luôn nhỏ hơn phương pháp
tính a' = Gp
2
, nhưng hiệu số nầy rất nhỏ trong trương hợp mẫu lớn với tần suất gen trung bình.
Trong thí dụ trước, phần phân tích nhóm máu M, MN, N, ở Hồng kông:
g
1
= 1134, g
2
= 874 và 2G = 2058.
Số cá thể dự đoán của M, MN,và N cá thể sẽ là
340.46, 508.07 và 135.46
Với sự khác biệt so với kết quả trước đó không lớn lắm.
Công thức Levene có thể được phát triển trong trường hợp muliple alleles và đặc biệt
nó rất ích khi chúng ta muốn tìm hiểu tổng số của các dạng đồng hợp tử.
I-3-3. CÓ TÍNH TRỘI: TỈ SỐ SNYDER
Khi chỉ có hai kiểu hình khác nhau, trội và lặn ước đoán tần suất gen của một mẫu của
quần thể giao phối ngẫu nhiên rất đơn giản. Gọi D và R là số mẫu quan sát tính trội và tính lặn
trong mẫu có G cá thể ngẫu nhiên (D + R = G). Sau đó ước đoán tần suất gen lặn

q
2
= R/G q = (R/G)
1/2
[4]
V(q
2
) = {q
2
(1 -q
2
)}/ G V(q) = (1-q
2
) / 4G
[4V]
Chú ý [4] chỉ có thực sự khi quần thể lớn, giao phối ngẫu nhiên, mặt khác tỉ số trội R/G sẽ
không dự đoán được giá trị q
2
.
Điều nầy khác với [1], giao phối có thể ngẫu nhiên hay không ngẫu nhiên.
Nếu có tính trội xảy ra, phải xét giả thuyết về một tính trạng nào đó được điều khiển
bởi một cặp gen “autosomal” thường cần đến số liệu của hai thế hệ. Khi có tính trội chúng ta
sẽ có 3 kiểu giao phối khác nhau. Trở lại bảng 2, ba kiểu giao phối đầu tiên là tính trội x tính
trội, trong khi kiểu thứ tư, thứ năm là tính trội x tính lặn. Hai cột biểu thị con lai chứa AA và
Aa cũng có thể được kết hợp cho ra các tỉ sồ của tính trội. Trong gia đình tính trội x tính trội,
tỉ lệ con lai trội đối với lặn là (1 + 2q) : q
2
. Trong gia đình tính trội x tính lặn, tỉ lệ nầy là 1 :
q. Tỉ lệ con lai có tính lặn của từng gia đình nầy là: (theo thứ tự)
S

2
= q
2
/ (1 + q)
2
S
1
= q / (1 + q) [5]
Tỉ số nầy được gọi là tỉ số Snyder (1932)
Bảng 4: Loại giao phối và tần suất giao phối trong quần thể panmictic khi có tính trội
xảy ra

Loại giao phối Tần suất giao phối Con lai
Trội Lặn
Trội x Trội (1-q
2
)
2
= p
2
(1 + q)
2
p
2
(1 + 2q) p
2
q
2

Trội x Lặn 2q

2
(1- q
2
) = 2pq
2
(1 + q) 2pq
2
2pq
3
Lặn x Lặn (q
2
)
2
= q
4
0 q
4
Cộng 1.00 p
2
+ 2pq q
2


S cộng với một số kèm theo, số nầy biểu thị số bố mẹ có tính trội trong gia đình. Công
thức [5] là trung bình của nhiều tỉ lệ Mendel khác nhau. Thí dụ S
2
có các alen lặn do tỉ lệ phân
ly 1 : 0 và 3 : 1, nhưng mỗi tỉ lệ đều có tần suất giao phối tương ứng.
Tần suất giao phối là phương trình của tần suất gen.
Rõ ràng là S

2
<1/4 và S
1
<1/2, bởi vì chỉ có một phần của gia đình Trội x Trội sẽ cho
1/4 con lai lặn.
Tỉ lệ S
2
và S
1
thay đổi tùy theo tính trạng trong cùng một quần thể, thay đổi từ quần
thể nầy sang quần thể khác đối với cùng một tính trạng, ngược lại với tỉ lệ phân ly Mendel (là
hằng số cho tất cả các tính trạng và cho tất cả các quần thể).
Snyder (1947) gọi S
2
và S
1
là tỉ số quần thể ("population ratios").
Một giá trị q được xác định (dự đoán từ mẫu). Tỉ lệ lý thuyết của con lai recessive từ
hai loại gia đình khác nhau có thể được tính toán và so sánh với giá trị quan sát để trắc
nghiệm giả thuyết một cặp gen autosomal với tính trội thực sự

Từ [4V] ta có V(q) = (1 - q
2
) / 4G
dS
2
/dq = 2q / (1 + q)
3
và dS
1

/dq = 1 / (1 + q)
2

dS
2
2

(1 -q
2
)
V(S
2
) = V(q) = [5V]
dq G(1 + q)
6

dS
1

2
1 -q
2

V(S
1
) = V(q) =
dq 4G(1 + q)
4



Áp dụng phương pháp Snyder, phân tích khả năng di truyền tính nếm
phenylthiocarbamide (PTC) của con ngước với 1600 bố mẹ.

Bảng 5: Di truyền khả năng tính nếm PTC ở người (Snyder 1932)

Số và loại giao phối Số con lai
Taster Nontaster Cộng
425 (Taster x Taster) 929 130 1059
289 (Taster x Nontaster) 483 278 761
86 (Nontaster x Nontaster) (5)* 218 218
800 families 1412 626 2038
*
có thể do con nuôi, con ngoài giả thú, hoặc sai số do chuẩn đoán không đưa vào phân tích
800 gia đình, 2038 đứa trẻ, với hơn 1600 bố mẹ và ít hơn 3638 có thể độc lập.
Có 2(86) + 289 bố mẹ recessive và 626 trẻ con recessive.
q
2
= 1087 / 3638 = 0.2988
Thay vào [5] ta có S2 = 0.125 , S1 = 0.353
Trong khi ở số liệu quan sát
130 278
= 0.123 , = 0.365 1087 = 2(86) + 289 + 626
1059 761
Kết quả rất gần với giá trị dự đoán.
I-3-4. CÁC PHỐI HỢP GIỮA MẸ VÀ CON
Có 4 loại quan hệ: cha - con trai, cha - con gái, mẹ - con trai, mẹ - con gái, với thuật
ngữ thường dùng là quan hệ giữa bố mẹ và con cái (parent - offspring: PO). Tuy nhiên ở đây
chúng ta sử dụng thuật ngữ "mother - child" (MC) bởi vì hầu hết các số liệu của loại nầy đều
là mối quan hệ giữa mẹ và con








Bảng 6: Tần suất của MC combinations

Bảng 7: Tần suất của MC combinations
trong quần thể giao phối ngẫu nhiên


với tính trội
Mẹ Con Mẹ Con
AA Aa aa Cộng A- aa Cộng
AA p
2
p
2
q p
2
A- p(1 + pq) pq
2
p
2
+ 2pq
Aa p
2
q pq pq
2

2pq aa pq
2
q
3
q
2

Aa p q
2
q
3
q
2



Cộng q
2
2pq q
2
1.00 Cộng p
2
+ 2pq q
2
1.00

Khi A trội đối với a, sẽ có 4 phối hợp có tính chất kiểu hình MC. Tần suất của nó có
trong bảng 7, bao gồm phần tế bào không thể phân chia được ở bảng 6
I-3-5. ƯỚC ĐOÁN TẦN SUẤT GEN TỪ SỐ LIỆU MC
Bảng 8: Số liệu quan sát các nhóm máu MC combinations


Con Tổng số (mẹ)
Mẹ
M MN N
M a1 a2 a1 + a2
MN a3 a4 a5 a3 + a4 + a5
N a6 a7 a 6 + a 7
Tổng số (con) a1 + a3 a2 + a4 + a6 a5 + a7
Thí dụ: xem xét nhóm máu M-N ở người, a là số mẫu quan sát của từng cặp MC và Σ
a = G (tổng số cặp MC) bao 2G cá thể với 4G gen. Chúng ta có thể ước đoán tần suất gen trên
cơ sở G mothers hoặc trên cơ sở G children, nhưng tiến trình nầy sẽ loại bỏ càc tính hiệu có từ
G cá thể khác. Chúng ta có thể xem xét tần suất gen từ giá trị tổng số cận biên (pooled
marginal totals) của mẹ và con, áp dụng phương pháp [1]. Cách tính nầy có khó khăn là 2G cá
thể không độc lập, vì vậy chúng ta không có 4G gen độc lập trong mẫu, phương sai dự đoán
sẽ không phải là pq/4G như công thức [1V]. Vì mỗi đứa trẻ phải chia một gen với mẹ của nó,
nên chỉ có 3 gen độc lập trên từng cặp MC (cho dù tạm thời 4 gen đều có mặt).
Phương pháp tốt nhất để dự đoán tần suất gen từ MC pairs là tối đa hóa số cá thể phối
hợp a1, a2, a7, với xác suất tương ứng theo bảng 6
L = a1 logp
3
+ ( 2 + a3) logp
2
q + a4 logpq + (a5 + a6) logpq
2
+ a7 logq
3

Vì logp
2
q = 2 logp + logq

L = B logp + C logq
Trong đó B = 3a1 + 2 (a2 + a3) + a4 + (a5 + a6)
Và C = (a2 + a3) + a4 + 2 (a5 + a6) + 3a7
Ghi chú B + C bao gồm 3 của mỗi nhóm a, trừ a4
B + C =
3C - a4. Đặt dL/ dp = 0 giải ra p chúng ta được:
B 3a1 + 2(a2 + a3) + a4 + (a5 + a6)
p = = [6]
B + C 3G - a4
V(p) = pq / (B + C) = pq / (3G - a4) [6V]
Mỗi phối hợp mẹ máu M và con máu M có 3 gen M độc lập, dó là 3 a1.
Đối với mẹ máu M, con máu MN thì gen M của con chắc chắn được truyền từ mẹ nó,
nhưng gen N là một yếu tố độc lập. Như vậy có 2 gen M, không có trong 3 gen độc lập, đó là
2 a2, và cứ thế tiếp tục. Chú ý phối hợp mẹ MN con MN phải được đề cập cho dù phải có 2
gen độc lập, bởi vì trong phối hợp nầy chúng ta không có cách nói khác: M gen hoặc N gen
của con xuất phát từ mẹ của nó.
Vì một cặp MN-MN có giá trị 2 gen độc lập và tần suất của nó trong quần thể giao
phối ngẫu nhiên là pq, tất cả các cặp có 3 gen độc lập, cho nên giá trị trung bình của một cặp
MC là:
2 x pq + 3x (1 - pq) = 3 = pq genes [7]
Giá trị tối đa của pq là 1/4, nên giá trị tối thiểu từng cặp MC là 3.00 - 0.25 = 2.75 số
gen độc lập. Trong trường hợp nhóm máu M-N giá trị p và q gần bằng 1/2, phối hợp MN-MN
biến động nhiều hơn so với các phối hợp khác trong quần thể, do đó làm thấp đi giá trị trung
bình trên từng cặp MC gần với giá trị tối thiểu. Nếu cả p và q đều nhỏ, giá trị trung bình trên
cặp bố mẹ - con sẽ rất gần với 3 gen độc lập. Nói cách khác, một bố mẹ và một con gần bằng
với 1.5 các cá thể độc lập.

Bài tập

1. Ước đoán thành phần của thế hệ kế tiếp trong điều kiện giao phối ngẫu nhiên của quần thể

khởi thủy như sau 0,16 : 0,48 : 0,36
2. Tìm tần suất phân bố của 3 kiểu gen trong thế hệ tiếp theo với giá trị ban đầu như sau
(trong đó, các cá thể giao phối ngẫu nhiên)
(0,25 : 0,10 : 0,65) ; (0,30 : 0 : 0,70) ; (0 : 0,60 : 0,40)
3. Kiểm soát những quần thể sau đây có phân bố cân bằng (equilibrium) và tính tỉ lệ cân bằng
xem xét kết qủa đạt được có đúng hay không
(0,50 : 0 : 0,50) ; (25 : 10 : 1) ; (0,36 : 0,15 : 0,49) ; (1 : 1: 1/4)
(0,09 : 0,10 : 0,81) ; (0,45 : 0,45 : 0,10) ; (0,5625 : 0,3750 : 0,0625)
4. Xác định tỉ lệ phân bố của quần thể với 5% alen lặn trong dị hợp tử
Trả lời: 2 (1 - [0,05]
1/2
).(0,05)
1/2
= 34,7%
5. Wiener (1950) đã báo cáo rằng tần suất của phối hợp mẹ-con trong trường hợp nhóm máu
M-N như sau

Con
Mẹ
M MN N
Tổng
M
MN
N
93
69
0
74
151
59

0
60
50
167
280
109
Tổng 162 284 110 556

Hãy ước đoán tần suất gen và sai số chuẩn
6. Nếu kết qủa là 5% dominants trong quần thể, thì phần trăm của dị hợp tử là bao nhiêu?

Trả lời: H= 2 ( 1 - 0,95
1/2
) (0,95
1/2
) = 4,936%
Tần suất của AA = ( 1 - 0,95
1/2
) = 0,02532
2
= 0,064%

Người ta thấy rằng: ưu thế chính của dominants là dị hợp tử, do đó, Aa x aa sẽ tiến dần đến
AA x aa

Chương 2

PHÂN TÍCH TÍNH ĐA DẠNG VỀ DI TRUYỀN

Phương pháp đo lường khoảng cách của các nhóm trên cơ sở nhiều tính trạng khác

nhau được đề xuất (Mahalanobis 1928).

Phương pháp nầy còn được gọi là hiệu số "bình phương" (D
2
- Mahalonobis).
Các bước phân tích bao gồm:
(i) Thu thập số liệu
(ii) Trắc nghiệm mức độ ý nghĩa
(iii) Chuyển đổi các giá trị
(iv) Tính hiệu số D
2

(v) Trắc nghiệm mức độ ý nghĩa của D
2
với phép thử Chi bình phương
(vi) Mức độ đóng góp của các tính trạng vào sự phân nhóm.
(vii) Xếp nhóm các cluster di truyền:

- Phương pháp Tocher
- Canonical graph.

Chương trình phân tích đã có trong cá mô hình thống kê sinh học
Trước tiên, chúng ta thiết lập một ma trận có chứa các giá trị phương sai (variance) và
hợp sai (covariance) giữa các tính trạng có quan hệ với nhau, để tìm ra các phương trình biến
đổi của các biến số có tương quan.
Kế đến tính D
2
từng cặp giá trị và phân nhóm di truyền. Tính khoảng cách di truyền
trong từng nhóm và giữa các nhóm.
Các genotypes ở cùng một nhóm ít khác biệt hơn kiểu gen ở nhóm khác. Hệ số D ở

trong nhóm nhỏ hơn rất nhiều so với hệ số D giữa các nhóm.
Có ba đặc điểm quan trọng trong khi chọn lựa các genotypes là:
- Chọn nhóm có genotype làm bố mẹ.
- Chọn các genotypes ở trong nhóm có khoảng cách di tryuền với các
nhóm khác càng xa càng tốt.
- Chú ý các tính trạng có mức độ đóng góp cao nhất về độ khác biệt về di truyền.
Phải tiếp tục thực thiện việc lai thử nghiệm, mới có kết luận cụ thể về ưu thế lai giữa
hai nhóm có khoảng cách xa, cũng như sự phân ly của các dòng con lai.

2-1. PHƯƠNG SAI & HỢP SAI (variance, covariance)
(Σx)
2

Σx
2
-
n
Var x = (phương sai)
n - 1

Σxy - (ΣxΣy) / n
Cov xy = (hợp sai)
n –1
Phương pháp metroglyph và tính chỉ số điểm đánh giá đã được Anderson đề nghị từ năm
1957. Sau đó, rất nhiều tác giả khác đã phát triển phương pháp này như Ramanujam và
Kumar (1964), Mukherjee và ctv.(1971), Venketrao và ctv. (1973)

2-2. HIỆU SỐ D
2


pD
2
= b
1
d
1
+ b
2
d
2
+ b
3
d
3
+ + bpdp
pD
2
= Wij (mean xi
1
- mean xi
2
) (mean xj
1
- mean xj
2
)
Trong đó Wij là ma trận của các giá trị phương sai và hợp sai của những tính trạng mục tiêu
được sử dụng để phân tích mức độ đa dạng di truyền
Các bước tính toán được tiến hành theo trình tự sau
1. Phân tích ANOVA và ANCOVA của các tính trạng mục tiêu

2. Tìm phương sai kiểu gen và phương sai kiểu hình, hợp sai kiểu gen và hợp sai kiểu
hình
3. Sắp xếp ma trận của các giá trị phương sai và hợp sai tương ứng theo cột và hàng của
ma trận [G] kiểu gen và [P] kiểu hình. Trong trường hợp chung, chúng ta có thể chỉ
cần sử dụng ma trận [G]. Trường hợp bố trí thí nghiệm không có lập lại, phương sai và
hợp sai được tính theo một dãy số, không có bảng ANOVA và ANCOVA, chúng ta
chỉ có một matrix duy nhất.
4. Giải ma trận theo cách trình bày kiểu “pivotal” (kiểu rễ đuôi chuột). Vế bên trái của hệ
thống phương trình là ma trận của các giá trị phương sai, hợp sai. Bên phải là ma trận
đơn vị tương ứng. Thí dụ nếu chúng ta phân tích trên 4 tính trạng mục tiêu, ma trận
đơn vị sẽ là
1 0 0 0 (1)
0 1 0 0 (2)
0 0 1 0 (3)
0 0 0 1 (4)

5. Chuyển đổi giá trị của các biến số. Thí dụ chúng ta có 4 tính trạng mục tiêu, giá trị
chuyển đổi sẽ được tính theo công thức như sau:
X
1

Y
1
=

2
X
1
)
1/2


trong đó σ
2
X
1
là phương sai của tính trạng 1
aX
1
+ X
2

Y
2
=
(A)
1/2

trong đó a là hệ số kết qủa cột 1 của hệ phương trình (2) trong ma trận đơn vị khi tính tóan.
A là hệ số kết qủa của số đầu tiên bên vế trái khi tính toán, tương ứng với hệ phương trình (2)
bX
1
+ cX
2
+ X
3

Y
3
=
(B)

1/2

trong đó b là hệ số kết qủa của cột 1, c của cột 2 trong hệ phương trình (3), trong ma trận đơn
vị khi tính toán, và B là hệ số kết qủa của số đầu tiên bên vế trái của hệ phương trình (3)
eX
1
+ fX
2
+ gX
3
+ X
4

Y
4
=
(C)
1/2

trong đó e là hệ số kết qủa của cột 1, f của cột 2, g của cột 3 trong hệ phương trình (4), trong
ma trận đơn vị khi tính toán, và C là hệ số kết qủa của số đầu tiên bên vế trái của hệ phương
trình (4)
Như vậy chúng ta sẽ có hệ phương trình chuyển đổi giá trị với các giá trị lệ thuộc lẫn
nhau
6. Lập bảng giá trị mới rồi tính hiệu số bình phương
Var 1

Cova1.2 Cova1.3 Cova1.4

Var 2 Cova2.3 Cova2.4

Var 3 Cova3.4
Var 4
Quần thể Y
1
Y
2
Y
3
Y
4

1
2
D (1-2) hiệu số giữa 1 và 2
D
2
(1-2) hiệu số bình phương giữa 1 và 2 = Σdi
2

Tương tự, chúng ta tính hiệu số bình phương của từng cặp genotypes trong phân tích
đa dạng di truyền của quần thể. Thí dụ:
D
2
(1-3), D
2
(1-4), D
2
(1-5), D
2
(1-n)

D
2
(2-3), D
2
(2-4) , D
2
(2-n)

D
2
(10-11) , D
2
(10-n)

D
2
([n-1]-n)

2-3. XẾP NHÓM KIỂU GEN VÀO NHỮNG CLUSTER DI TRUYỀN KHÁC NHAU
Căn cứ vào giá trị D
2
, người ta tiến hành xếp nhóm theo trình tự như sau:

Phương pháp Tocher:
Xếp nhóm giống theo những cluster khác nhau căn cứ vào giá trị D
2
nhỏ nhất ở hàng
đầu tiên của tất cả các cột (biểu thị từng giống so với giống còn lại) và mức độ sai biệt có ý
nghĩa với giá trị D
2

lớn nhất ở hàng đầu tiên. Chú ý, những giá trị D
2
ở mỗi cột được xếp theo
thứ tự từ thấp đến cao.

Phương pháp Canonical:
Tính toán giá trị tổng bình phương (sum of square), giá trị SS và tổng của các tích
(sum of products), giá trị SP, đối với tất cả giá trị Y (gía trị chuyển đổi). Hình thành ma trận
chứa các giá trị SS và giá trị SP. Đặt tên ma trận này là [A]. Tính [A]
p
, trong đó p là số tính
trạng mục tiêu được sử dụng để phân nhóm. Thí dụ với 4 tính trạng ta sẽ có [A]
4
.
Sau cùng,
chúng ta phải tính giá trị Z.

2-4. NGHIÊN CỨU CHUYÊN ĐỀ
“Phân tích độ khác biệt di truyền của các giống lúa nướcsâu được sử dụng làm vật liệu lai “
(Bùi chí Bửu 1987)
Phân tích độ khác biệt hay độ phong phú về di truyền (divergence analysis) được áp
dụng để phân lập các kiểu gen khác nhau, phục vụ cho việc lai tạo giống có hiệu quả mong
muốn.
Áp dụng phép thử D
2
của Mahalonobis để xếp nhóm các vật liệu khởi đầu theo những
tính trạng di truyền số lượng.

2-4-1. Giống được sử dụng làm vật liệu gồm có:


1) Ba bông 2) Ba thiệt 3) Chùm ruột
4) Cù là 5) Chệt cụt 6) Lem lùn
7) Lúa phi 8) Nàng tây đùm 9) Nàng keo
10) Tất nợ 11) Trắng chùm 12) Trắng lùn
13) Trắng phước 14) Trắng tép 15) Nàng tây lớn
2-4-2. Tính trạng mục tiêu: Chiều cao cây, số bông/m
2
và ngày trổ bông có hệ số di truyền rất
cao, theo thứ tự (bảng 1)
Năng suất có hệ số di truyền thấp, ảnh hưởng ngoại cảnh có tác động khá lớn, phương
sai do môi trường (0.27) lớn hơn do kiểu gen.
2-4-3. Phân tích sự đóng góp của các tính trạng có ảnh hưởng đối với độ khác biệt về di
truyền cho thấy: hiệu số khác biệt cao nhất xuất hiện ở tính trạng số bông/m
2
và chiều cao
cây. Tỉ lệ đóng góp của mỗi yếu tố nầy là 38.09%. Ngày trổ bông có tỷ lệ thấp hơn (18.09%)
và năng suất lúa mùa có ảnh hưởng thấp nhất (5.63%). Do đó, đối với lúa nước sâu, lúa nổi,
yếu tố chiều cao cây và số bông/m
2
trong điều kiện ngập sâu có vai trò quan trọng về di
truyền.
5-4. Áp dụng phương pháp xếp nhóm của Tocher và phương pháp phân tích Mahalomobis-
D
2
, có 4 nhóm khác nhau về di truyền là:

Nhóm I Nhóm II Nhóm III Nhóm IV
Ba bông Lem lùn Ba thiệt Cù là
Chệt cụt Lúa phi Chùm ruột
Nàng tây đùm Trắng chùm

Nàng keo Trắng lùn
Tất nợ Trắng tép
Nàng tây lớn Trắng phước
2-4-4. Khoảng cách di truyền giữa nhóm và trong nhóm được trình bày ở hinh 12, bảng 20.
Khoảng cách I và III, II và IV, III và IV khá lớn.
Các genotypes ở trong cùng một nhóm ít khác biệt hơn ở kiểu gen ở nhóm khác. Hệ số
D trong nhóm nhỏ hơn rất nhiều so với hệ số D giữa các nhóm.
Người ta thường đề cập đến 3 đặc điểm quan trọng trong khi chọn lựa các genotype là
(Singh và Chaudhary 1985):
Bảng 1: Phương sai và hệ số di truyền của các tính trạng.

Ngày trổ bông Cao cây Bông/m
2
Năng suất
2
g
σ

276.95 643.39 518.31 0.22
2
e
σ

45.45 36.78 50.06 0.27
2
p
σ

322.40 680.17 638.37 0.49
h

2
0.8590 0.9459 0.9216 0.4489
2
g
σ
= phương sai do kiểu gen
2
e
σ
= phương sai do môi trường
2
p
σ
= phương sai do kiểu hình
h
2
= hệ số di truyền

Bảng 2: Giá trị khoảng cách di truyền "D" trong nhóm và giữa các nhóm.

Nhóm I II II IV
I 4.21 7.12 9.14 7.23
II 2.95 9.00 12.58
III 0.13 14.91
IV 0.00























Hình 2-1: Khoảng cách di truyền giữa các nhóm
IV

III

I
II

- Chọn nhóm genotype được dùng làm bố mẹ
- Chọn các genotype ở trong nhóm có khoảng cách di truyền với nhóm khác càng xa
càng tốt.
- Chú ý tính trạng có mức độ đóng góp cao nhất về độ khác biệt di truyền (ở đây số
bông/m

2
và chiều cao cây có ảnh hưởng mạnh mẽ nhất).
Khoảng cách di truyền giữa nhóm III và IV lớn nhất cho thấy sự khác biệt tối đa về di
truyền. Trong trường hợp như vậy, kết quả lai tạo sẽ thành công để có những phân ly mạnh
mẽ ở các dòng con lai, rất có lợi cho nhà chọn giống để khai thác các biến dị này.
Tuy nhiên các tính trạng quan trọng khác như kháng sâu bệnh, phẩm chất hạt cần
được lưu ý khi chọn vật liệu làm bố mẹ.
Bước kế tiếp nên chọn 1 giống từ mỗi nhóm, tiến hành lai vòng (diallel cross) và phân
tích khả năng phối hợp, kết quả đạt được sẽ cao hơn (Singh và Chaudhary 1985).
Kết quả phân tích độ khác biệt về di truyền cho thấy: phần lớn các giống được xếp
cùng một nhóm có xuất xứ về địa lý giống nhau. Thí dụ như nhóm I tập hợp các giống lúa nổi
ở vùng 5, trừ hai giống Nàng keo và Tất nợ. Nhóm II tập hợp các giống ở vùng 4. Nhóm III
tập hợp các giống ở vùng 2. Nhóm IV là giống mùa sớm Cù là.
Phương pháp phân tích này chỉ là bước đầu tiên để phân lập các kiểu gen khác nhau.
Phải tiếp tục thực hiện việc lai thử nghiệm, mới có kết luận cụ thể về ưu thế lai giữa hai nhóm
có khoảng cách xa, cũng như sự phân ly mạnh mẽ ở các dòng con lai.

2-5. PHÂN TÍCH NHÓM TRÊN CƠ SỞ ĐIỆN DI VÀ BIỂU HIỆN ĐA HÌNH
Với sự phát triển của sinh học phân tử, người ta có xu hướng phân nhóm đa dạng di
truyền ở mức độ phân tử. Như vậy, sự chính xác sẽ cao hơn rất nhiều so với phương pháp
truyền thống dựa trên tính trạng hình thái học.
Người ta khai thác những khả năng phân tích rất nhanh nhạy của máy tính (computer)
với nhiều phần mềm chuyên dùng, trong đó NTSYS là phần mềm tương đối khá phổ biến.
Theo nội dung này, chúng ta cho điểm 1 khi có băng thể hiện, và điểm 0 khi băng không thể
hiện trong điện di.

2-5-1. Phân tích ma trận tương đồng, ma trận khoảng cách
(similarity / distance matrix)
Các giá trị tương đồng và khoảng cách là những giá trị ước đoán về mặt số lượng
nhằm mô tả sự gần gủi và khoảng cách di truyền giữa hai cặp đơn vị mục triêu. Giá trị tương

đồng biến thiên từ 0 đến 1. Khoảng cách giảm khi giá trị tương đồng tăng. Khoảng cách
(distances) còn được dùng với thuật ngữ “dissimilarities”
Sokal và Sneath (1963) mô tả nhiều cách tính toán khoảng cách và mức độ giống nhau
giữa hai đơn vị mục tiêu. Khi giá trị ở dạng nhị phân (binary), nghĩa là 1 (có) và 0 (không có),
chúng ta đưa chúng về bảng hai chiều như sau



Isolate j m = a + d
u = b + c
n = m + u

Trong đó, m là số dữ liệu tương ứng, u là số dữ liệu không tương ứng, u là tổng số
băng ghi nhận được


a b

c d



Isolate i
1 0

1

0

Chỉ số tương ứng giản đơn (simple matching coefficient)

m
S
SM
=
n
Ở đây, người ta gọi “negative matches” khi nào cả hai “isolates” i và j đều không thể
hiện băng, không đếm được

Chỉ số Jaccard (Jaccard’s coefficient)
Khi đo mức độ giống nhau không có tình trạng “negative matches”, người ta áp dụng
công thức sau đây để có chỉ số Jaccard
a
S
j
=
a + u

Chỉ số Dice (Dice’s coefficient)
Một chỉ số khác mô tả mức độ giống nhau bao gồm trường hợp có “negative
matches”, đó là chỉ số Dice
2a
S
b
=
2a + u
Khi đề cập đến thành phần các băng thể hiện trong điện di, chỉ số Dice có thể được
viết lại thành công thức như sau

2a
S

b
=
n
i
+ n
j

Trong đó, n
i
là số băng của “isolate i”, và n
j
là số băng của “isolate j”

Giá trị khoảng cách

Giá trị khoảng cách là độ lệch của những chỉ số biểu thị mức độ giống nhau. Chỉ số
tương đồng S (similarity) biến thiến từ 0 đến 1 có thể được chuyển đổi thành giá trị d
(distance) theo công thức
d = 1 - S
Chúng ta có thể tính toán bằng tay để chuyển đổi chỉ số Dice thành chỉ số khoảng
cách, nhưng với phần mềm chuyên dùng NTSYS, chúng ta sẽ dễ dàng hơn rất nhiều để có kết
qủa với nhiều cặp đơn vị mục tiêu.

2-5-2. Cách tính bằng tay

Đếm số băng của isolate 1 và isolate 2 với ký hiệu n
1
và n
2
, theo thứ tự

Đếm số băng trùng nhau của isolate 1 và isolate 2, ký hiệu là a
12

Tính chỉ số Dice theo công thức

2 a
12

S
b
=
n
1
+ n
2



Chuyển đổi thành giá trị khoảng cách bằng cách lấy 1 trừ đi S
D


d
D
= 1 -S
D

Lập lại qui trình nói trên với những cặp isolate còn lại, thí dụ 1 và 3, 1 và 4, 2 và 3, 2 và 4,
v.v


2-5-3. Xếp nhóm bằng phương pháp UPGMA

Phân tích nhóm (cluster analysis) thực sự là phương pháp sắp xếp các giống thành
những cụm nhóm khác nhau trên cơ sở mức độ giống nhau theo qui ước (người ta còn gọi với
thuật ngữ agglomerative clustering). Nó được thực hiện theo qui trình tiêu chuẩn, nên người
ta còn gọi đó là “greedy algorithm”. Qui trình theo cácbướctiến hành như sau:

• Tìm các cặp (i, j) có giá trị khoảng cách nhỏ nhất (hoặc giống nhau nhất)
• Nhập các cặp này lại thành một nhóm (cluster)
• Tạo ra nhóm lớn hơn tương ứng với nhóm mới sao cho các cặp (i, j) mới tương thích
với giá trị mức độ giống nhau
• Lập lại qui trình
Một trong những phương pháp đơn giản nhất là phương pháp tính khoảng cách trung
bình với giá trị số đại số UPGMA (được viết tắt từ chữ unweighted pair-group method with
arithmetic mean)

Cách tính bằng tay

• Tìm giá trị khoảng cách nhỏ nhất trong ma trận khoảng cách
• Xếp nhóm 2 isolate này lại với nhau, theo giá trị khoảng cách cụ thể, ghi giữa hai điểm
• Xây dựng ma trận khoảng cách mới phối hợp giữa hai isolate gần nhất trong một
nhóm riêng. Khoảng cách giữa hai nhóm mới này và một isolate khác sẽ được ghi
nhận với giá trị khoảng cách trung bình của isolate mới với những isolate trong cluster
• Lập lại qui trình cho đến hết

Thí dụ: ma trận khoảng cách có 5 isolate
Isolate 1 2 3 4
2 d
12


3 d
13
d
23

4 d
14
d
24
d
34

5 d
15
d
25
d
35
d
45


Trong đó, d
ij
là khoảng cách giữa isolate i và isolate j
Thí dụ khoảng khoảng giữa isolate 3 và 4 (d
34
) là ngắn nhất. Hai isolate này được xếp vào một
nhóm với khoảng cách điểm nhánh là (d
34

/2)

d
34
/ 2


d
34
/ 2


Ma trận khoảng cách mới trên cơ sở nhóm (3, 4) và những isolate khác

Isolate 1 2 (3, 4)
2 d
12

(3, 4) d
1(3,4)
d
2(3, 4)

5 d
15
d
25
d
5(3, 4)


3

4
d
13
+ d
14

d
1(3,4)
=
2

d
23
+ d
34

d
2(3,4)
=
2

d
35
+ d
45

d
5(3,4)

=
2

Trong ma trận mới, tìm giá trị khoảng cách nhỏ nhất. Thí dụ ở đây là d
12
, như vậy có nhóm (1,
2) được hình thành

d
12
/ 2



d
12
/ 2
Như vậy, có thêm một ma trận khoảng cách mới

Isolate (1, 2) (3, 4)
(3, 4) d
(12)(34)

5 d
(12)5
d
(34)5


d

5(12)
được tính toán giống như trên, trong khi đó d
(12)(34)
được

tính toán bằng cách lấy trung
bình của d
1(34)
và d
2(34)
:
d
1(34)
+ d
2(34)

d
(12)(34)
=
2
Trong khi đọc giá trị khoảng cách của ma trận mới, thí dụ chúng ta ghi nhận d
(12)(34)

khoảng cách ngắn nhất. Điều này có nghĩa là hai nhóm (1, 2) và (3, 4) nằm cùng trong nhóm
((1, 2), (3, 4)) với khoảng cách :
d
(12)(34)

2









d
(12)(34)
/ 2
Ma trận mới được tính toán bằng cách lấy trung bình của d
5(12)
và d
5(34)
.

Isolate ((1, 2), (3, 4))
5 d
5((1, 2), (3, 4))


Giá trị khoảng cách
d
5((1, 2), (3, 4))
= [ d
5(12)
+ d
5(34)
] / 2
1


2
d
12
/ 2


d
12
/ 2

d
34
/ 2


d
34
/ 2
1

2
3

4

Cuối cùng, chúng ta có giản đồ phân 5 nhóm như sau











d
5((1, 2), (3, 4))
/ 2

Biến thiên trong quần thể có thể được định tính bằng hiện tượng dị hợp hoặc hiện
tượng đa dạng di truyền, trong đó đa dạng di truyền tưong thích với quần thể cận giao hơn.
Phương sai của những tính trạng đo đếm được trên cơ sở trung bình giữa các loci, cần phân ra
ở các mức độ khácnhau về sự biến thiên tại những loci này, và chúng cũng cần được kết hợp
theo mức độ biến dị ở những loci khác nhau (Weir 1996)

2-5-4. Phân tích thông qua chương trình NTSYS-pc trên computer
NTSYS-pc là chương trình phần mềm do Rohlf (1992) thiết kế dùng để tìm kiếm và
thành lập kiến trúc những dữ liệu có nhiều biến. NTSYS có thể được thao tác với nhiều loại
hình phân tích một cách linh động
Tạo file NTSYS
Nhằm tạo ra thao tác trong phân tích nhóm với dữ liệu thu thập từ kết qủa đếm băng
điện di, người ta phải tạo ra file NTSYS ở dạng các ma trận. Một ma trận chứa 4 loại hình của
những “records”. Những câu lệnh và các dòng đánh dấu có tính chất chọn lựa tùy thích
Matrix parameter line
Ma trận chứa thông số được viết theo hàng, hàng này chứa 4-5 số (2 trong chúng là
một “suffix L”). Dãy số được cách nhau một khoảng trống
Số hạng đầu tiên là một mã số của ma trận theo cách biểu hiện như sau:
1 = ma trận có dạng chữ nhật

2 = ma trận vuông số liệu không đối xứng
3 = ma trận vuông số liệu đối xứng
5 = ma trận có dạng cây, số liệu không đối xứng
6 = ma trận có dạng cây, số liệu đối xứng
Số hạng thứ hai và thứ ba là những số của hàng và cột trong ma trận
Số hạng thứ tư là 0 nếu chúng không có “số liệu thiếu” trong ma trận
Nếu có số liệu thiếu, số hạng thứ tư sẽ là 1
Số hạng thứ năm rất cần thiết. Nó cung cấp giá trị của số liệu thiếu

Đánh dấu hàng và cột
Chữ L được đặt sau những số của hàng hoặc cột. Thông thường ký hiệu hàng được ưu
tiên trước và cột được ký hiệu sau. Ký hiệu cột phải được bắt đầu từ một hàng mới. Ký hiệu
đánh dấu bảo gồm một dãy chữ số (có thể hơn 8 chữ số hoặc digits nhưng không được chừa
khoảng trống)




1


2
3

4

5
Matrix data lines
Thành phần của ma trận sẽ được viết vào thành hàng tương ứng với một hoặc nhiều
hàng của đầu số liệu vào, sao cho ma trận luôn luôn ở trạng thái “rowwise”. Ma trận vuông

được nhập số liệu thành hàng, bắt đầu từ cột 1

Chạy chương trình NTSYS




Đánh chữ ntsys, rồi ấn phím Enter ở DOS prompt. Màn hình NTSYS hiện ra. Ấn
phím làm rõ màn hình và khởi động ở ô “main program”
Ấn “Page Down” để ô cửa sổ biểu thị nhiều chương trình chọn lựa tiếp theo. Chúng ta
có thể trở lại trang chủ bằng cách sử dụng lệnh “Page Up”





×