Tải bản đầy đủ (.pdf) (79 trang)

Phân tích đa dạng di truyền một số gen thuộc họ cytochrome p450 của người kinh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.48 MB, 79 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
---------------------------

Trần Văn Hiệp

PHÂN TÍCH ĐA DẠNG DI TRUYỀN MỘT SỐ GEN
THUỘC HỌ CYTOCHROME P450 CỦA NGƢỜI KINH

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội – 2020


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
---------------------------

Trần Văn Hiệp

PHÂN TÍCH ĐA DẠNG DI TRUYỀN MỘT SỐ GEN
THUỘC HỌ CYTOCHROME P450 CỦA NGƢỜI KINH
Chuyên ngành:
Mã số:

Sinh học thực nghiệm
8420101.14

LUẬN VĂN THẠC SĨ KHOA HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:


TS. Hoàng Thị Điệp
PGS.TS. Hoàng Thị Mỹ Nhung

Hà Nội - 2020


LỜI CẢM ƠN
Tôi xin cảm ơn Bộ môn Sinh học Tế bào, Khoa Sinh học và Trường Đại học
Khoa học Tự nhiên đã hoàn tất cả thủ tục và thành lập Hội đồng đánh giá luận văn
tốt nghiệp.
Tôi xin cảm ơn TS. Hoàng Thị Điệp và PGS.TS Hoàng Thị Mỹ Nhung đã
hướng dẫn luận văn, trong đó đặc biệt cảm ơn TS. Hồng Thị Điệp đã nhiệt tình chỉ
dạy và dẫn dắt tơi trong suốt q trình hồn tất đề tài. Cảm ơn PGS.TS. Lê Sỹ Vinh
tuy không tham gia trực tiếp vào quá trình hướng dẫn luận văn nhưng vẫn ln theo
sát đề tài nghiên cứu.
Ngồi ra, tơi xin gửi lời cảm ơn chân thành tới các thầy cô khác trong Khoa
Sinh học, dù không chịu trách nhiệm hướng dẫn tơi nhưng vẫn ln nhiệt tình giải
đáp các vướng mắc về kiến thức và phương pháp, và cũng tạo điều kiện tốt nhất cho
tôi cũng như các học viên cao học khác trong quá trình học tập và nghiên cứu.


MỤC LỤC
MỞ ĐẦU .................................................................................................................... 5
Chƣơng 1 - TỔNG QUAN ........................................................................................ 7
1.1. Chuyển hóa thuốc và tin sinh học .................................................................. 7
1.1.1. Sự chuyển hóa và đáp ứng thuốc ................................................................ 7
1.1.2. Họ enzym Cytochrome P450 (CYP) ......................................................... 11
1.1.3. Ứng dụng của tin sinh học trong nghiên cứu chuyển hóa thuốc .............. 16
1.2. Gen chuyển hóa thuốc trong quần thể ngƣời Kinh Việt Nam .................. 21
1.2.1. Quần thể người Kinh Việt Nam ................................................................ 21

1.2.2. Tính cấp thiết trong nghiên cứu gen chuyển hóa thuốc trong quần thể KHV ... 22
1.3. Giới thiệu về nghiên cứu CYP trong quần thể ngƣời Kinh Việt Nam ..... 23
1.3.1. Mục đích của nghiên cứu.......................................................................... 23
1.3.2. Nội dung của nghiên cứu .......................................................................... 23
Chƣơng 2 - PHƢƠNG PHÁP ................................................................................. 33
2.1. Xây dựng dữ liệu mẫu .................................................................................. 33
2.2. Tính tần số của từng alen và kiểm tra Cân bằng Hardy-Weinberg ........ 33
2.3. Phân tích thành phần chính ........................................................................ 34
2.4. Bản đồ nhiệt và cây phân cấp...................................................................... 37
2.5. Tính khoảng cách di truyền ........................................................................ 37
2.6. Kiểm định hậu kiểm χ 2 với hiệu chỉnh Bonferroni cho từng cặp alen ... 38
2.7. Tính tần số của các kiểu hình chuyển hóa thuốc ....................................... 38
Chƣơng 3 - KẾT QUẢ ............................................................................................ 40
3.1. Tần số của các alen ....................................................................................... 40
3.2. Phân tích thành phần chính ........................................................................ 42
3.3. Bản đồ nhiệt .................................................................................................. 47
3.4. Khoảng cách di truyền ................................................................................. 50
3.5. Kiểm định hậu kiểm với hiệu chỉnh Bonferroni........................................ 53
3.6. Tần số của các kiểu hình chuyển hóa thuốc ............................................... 56
1


Chƣơng 4 - THẢO LUẬN....................................................................................... 59
KẾT LUẬN .............................................................................................................. 67
KIẾN NGHỊ .............................................................................................................. 68
TÀI LIỆU THAM KHẢO ...................................................................................... 69
PHỤ LỤC ................................................................................................................. 75

2



DANH MỤC CÁC BẢNG BIỂU VÀ HÌNH VẼ
Bảng 1.1: Kích thước và vị trí của một số gen CYPs của con người ....................... 13
Bảng 1.2: Các nhóm thuốc được nghiên cứu khả năng chuyển hóa trong quần thể
KHV .......................................................................................................................... 32
Bảng 2.1: Kích thước của các quần thể trong nghiên cứu ........................................ 33
Bảng 2.3: Bảng xác định kiểu hình chuyển hóa theo chỉ số hoạt tính ...................... 39
Bảng 3.1: Phân bố của các alen có tần số lớn hơn 1% trong quần thể KHV ............ 40
Bảng 3.2: Xác suất các gen tuân theo định luật Hardy-Weinberg ............................ 41
Bảng 3.3: Khoảng cách di truyền giữa KHV và 6 quần thể còn lại. ......................... 51
Bảng 3.4: Kết quả phân tích thống kê cho từng alen phổ biến của KHV giữa KHV
và các quần thể còn lại. ............................................................................................. 53
Bảng 3.5: Phân bố (%) kiểu hình chuyển hóa thuốc của quần thể KHV .................. 56
Bảng 3.6: Tóm tắt ảnh hưởng của CYP tới một số loại thuốc phổ biến ................... 57
Hình 1.1: Nồng độ thuốc trong huyết tương sau khi uống 0.5–350 mg BI 409306 . 10
Hình 1.2: Cấu trúc của một library trong Giải trình tự hai đầu................................. 18
Hình 3.1: Kết quả PCA giữa 7 quần thể trên các gen. .............................................. 46
Hình 3.2: Bản đồ nhiệt và cây phân cấp theo tần số của các alen trong 7 quần thể. 49
Hình 3.3. Cây phân cấp dựa trên các thang đo khoảng cách .................................... 53
Hình 3.4: Phân bố của các kiểu chuyển hóa trong quần thể KHV theo từng gen..... 57
Hình 4.1: Cấu trúc của enzym CYP2D6 và hai vị trí 34 Proline (màu hồng, khung
đỏ) và 486 Serine (màu vàng khung đen) ................................................................. 60
Hình 4.2. Cấu trúc mô phỏng của CYP2D6 (theo Fukuyoshi 2016 [15]) ................ 62

3


BẢNG KÝ HIỆU CÁC CHỮ VIẾT TẮT
Ký hiệu


Viết tắt của

Nghĩa tiếng Việt

ADHD

Attention deficit hyperactivity disorder

Rối loạn tăng động giảm chú ý

ARV

Antiretroviral

Vi rút phiên mã ngược

CYP

Cytochrome P450

DNA

Deoxyribonucleic acid

A xít deoxyribonucleic (ADN)

EM

Extensive metabolizer


Kiểu hình chuyển hóa phổ biến

IM

Intermediate metabolizer

Kiểu hình chuyển hóa trung
bình

mRNA

Messenger Ribonucleic acid

ARN thơng tin

N/A

Not available

Kiểu hình khơng xác định

NSAID

Nonsteroid antiinflamatory drug

Thuốc kháng viêm không chứa
steroid

PCR


Polymerase Chain Reaction

Phản ứng chuỗi polymerase

PM

Poor metabolizer

Kiểu hình chuyển hóa kém

RM

Rapid metabolizer

Kiểu hình chuyển hóa nhanh

4


MỞ ĐẦU
Điều trị bệnh là nhu cầu tất yếu của mỗi cá nhân. Do mức sống của con
người ngày càng cải thiện, tuổi thọ của con người càng tăng lên, và nhu cầu y tế của
con người cũng tăng theo. Nhu cầu đó chính là động lực để các nghiên cứu trong
điều trị bệnh, đặc biệt là thuốc, luôn phát triển không ngừng. Tuy nhiên, các nghiên
cứu về thuốc lại gặp trở ngại: khả năng đáp ứng thuốc của từng người lại không
giống nhau.
Hiệu quả của thuốc, cũng như tác dụng phụ của thuốc phụ thuốc vào hai quá
trình: dược lực học và dược động học, trong đó dược động học lại phụ thuộc mật
thiết vào hệ enzym chuyển hóa thuốc của từng cơ thể [34,37]. Cytochrome P450
(CYPs) là họ enzym tham gia vào việc chuyển hóa thuốc đa số các nhóm thuốc ở

người [40]. Vì vậy, các gen CYPs đóng vai trị rất quan trọng các nghiên cứu về gen
chuyển hóa thuốc nói riêng, và về dược học nói chung.
Các nghiên cứu về gen chuyển hóa thuốc trên tồn thể giới đã được phát
triển tử lâu. Chúng hệ thống thành các cơ sở dữ liệu lớn, chẳng hạn PharmVar cung
cấp dữ liệu về các biến dị di truyển của các gen chuyển hóa thuốc, KEGG Pathway
tạo ra các sơ đồ chuyển hóa thuốc, hay PharmGKB cung cấp dữ liệu về ảnh hưởng
của gen và biến dị của chúng tới liều dùng [58]. Rất nhiều nhóm thuốc cũng được
thiết kế và xây dựng chỉ định thuốc dựa trên các nghiên cứu về gen chuyển hóa, đặc
biệt là CYPs. Ví dụ: CYP3A5 trên người châu Âu hầu như khơng có chức năng, vì
đa số người gốc Âu có kiểu gen đồng hợp của alen CYP3A5*3 [47]. Vì vậy, thuốc
tacrolimus được thiết kế với liều tiêu chuẩn tương ứng với người có kiểu gen như
trên, thay vì tương ứng với người mang CYP3A5 có chức năng bình thường. Khơng
chỉ ảnh hưởng của CYPs tới thuốc, mà sự phân bố của gen này trên các quần thể
khác nhau cũng được công bố. Những điểm tương đồng, và đặc thù của các gen
CYPs trên từng quần thể dần được bộ lộ, hỗ trợ nhiều hơn cho sự phát triển của
thuốc.
Ở Việt Nam, các nghiên cứu về CYPs chưa thực sự nhận được sự quan tâm
tương ứng với giá trị mà chúng mang lại. Đã có những nghiên cứu bước đầu về

5


CYPs với số mẫu nhỏ, đơn lẻ cho một vài gen và sử dụng phương pháp truyền thống
(giải trình tự có sử dụng PCR) của các tác giả Việt Nam (GS. TS. Nông Văn Hải
[45,56]) hay tác giả quốc tế (Lee.S.S. [60]). Tuy nhiên, vẫn chưa có các nghiên cứu
cho nhiều gen CYPs, với số mẫu đủ lớn để đại diện cho quần thể, và sử dụng
phương pháp giải trình tự thế hệ mới.
Do tầm quan trọng và tính đa hình cao, nghiên cứu về CYPs trong từng quần
thể, đặc biệt là người Việt, rất cần thiết. Nghiên cứu đã chọn và phân tích 6 gen
CYPs: CYP2B6, CYP2C9, CYP2C19, CYP2D6, CYP3A5, và CYP4F2 trong quần

thể người Kinh Việt Nam (KHV). Đây là các gen ảnh hưởng tới rất nhiều nhóm
thuốc khác nhau [58], đồng thời được dự đốn có tính đa hình cao trên quần thể
người Việt.

6


Chƣơng 1 - TỔNG QUAN
1.1. Chuyển hóa thuốc và tin sinh học
1.1.1. Sự chuyển hóa và đáp ứng thuốc
1.1.1.1. Dược động học và sự chuyển hóa thuốc
Theo Lees P. và cộng sự [34], khi thuốc được hấp thụ vào cơ thể, có hai q
trình đồng thời diễn ra, đó là dược lực học và dược động học.
Dược lực học (pharmacodynamics, PD) mô tả tác động của thuốc với cơ thể.
Quá trình này điển hình với từng loại thuốc khác nhau, và tác động tới cơ thể ở cấp
độ sinh học phân tử - tế bào. Thuốc thường có một trong hai cách tác động: mơ
phỏng hoặc ức chế q trình nội sinh của cơ thể; hoặc ức chế hay tiêu diệt mầm
bệnh từ bên ngồi.
Trái với dược lực học mơ tả ảnh hưởng của thuốc tới cơ thể, dược động học
(pharmacokinetics, PK) mô tả ảnh hưởng của cơ thể tới thuốc [34]. Đây là hai quá
trình tương tác qua lại lẫn nhau, cùng ảnh hưởng tới liều lượng, lợi ích và tác dụng
phụ của thuốc nên thường được nghiên cứu chung với mơ hình PK/PD.
Dược động học mơ tả sự biến đổi của thuốc trong cơ thể sinh vật, từ lúc được
hấp thu tới lúc được loại bỏ hoàn toàn khỏi cơ thể. Hay nói cách khác, dược động
học nghiên cứu tác động của cơ thể đối với thuốc.
Dược động học mô tả mối liên hệ giữa liều lượng và nồng độ thuốc ở đích
tác động, chẳng hạn như thụ thể của thuốc, và sự biến thiến của nồng độ thuốc theo
thời gian. Trong cơ thể, nồng độ thuốc sẽ thay đổi khác nhau tùy thuộc vào các quá
trình, thường được phân chia thành mơ hình ADME, trong đó:
Absorption (hấp thụ) là quá trình thuốc được cơ thể hấp thu, rồi sau đó đi vào

hệ tuần hồn. Tùy vào liều lượng thuốc và bản chất của thuốc mà con đường hấp
thu của thuốc sẽ khác nhau.
Distribution (phân bố) là quá trình thuốc được phân tán trong cơ thể, trong
đó thuốc được khuếch tán vào các mô và dịch trong cơ thể.

7


Metabolism (chuyển hóa) là q trình thuốc được phân giải. Cơ thể có thể
nhận diện thuốc là một phân tử ngoại lai, vì vậy sẽ có những enzym đảm nhiệm vai
trò phân giải thuốc thành các hợp chất thứ cấp. Đây là q trình khơng có tính đảo
ngược, và thường làm mất dần đi hiệu quả của thuốc. Tuy nhiên, một số ít loại
thuốc phải được cơ thể chuyển hóa mới có tác dụng.
Excretion (bài tiết) là q trình thuốc được bài tiết ra khỏi cơ thể. Quá trình
này được đảm nhiệm chủ yếu bởi thận, cơ quan bài tiết chính của cơ thể. Ngồi ra,
các cơ quan bài tiết khác cũng có thể tham gia vào sự bài tiết của thuốc, chẳng hạn
như qua da.
Quá trình hấp thụ phụ thuộc chủ yếu vào bản chất của thuốc, còn sự phân bố
và bài tiết thuốc phụ thuộc vào chức năng sinh lí chung của cơ thể (tuần hồn và bài
tiết). Ba quá trình này tương đối giống nhau ở một cơ thể bình thường với chức
năng sinh lí ổn định. Cịn q trình chuyển hóa thuốc lại phụ thuộc vào hệ enzym
trong cơ thể, chủ yếu là ở gan [41]. Mà mỗi người lại sở hữu một hệ enzym khác
nhau, phụ thuộc chủ yếu vào hệ gen của chính họ. Hệ gen người có tính đa dạng
cao, vì thế trong dược động học, q trình chuyển hóa thuốc là q trình khác biệt
nhiều nhất giữa các cá thể, và cũng cần được nghiên cứu nhiều nhất. Hệ enzym
chuyển hóa thuốc chính của người là CYPs, được mơ tả ở phần 1.1.2.
Dược động học có vai trị quan trọng trong điều trị cũng như điều chế. Trong
điều trị, dược động học là cơ sở quyết định thuốc điều trị cho bệnh nhân, cũng như
liều lượng thuốc cần thiết. Còn trong điều chế, dược phẩm có thể được cải tiến, thay
đổi dạng bào chế để có các thơng số dược động học mong muốn.

1.1.1.2. Tốc độ chuyển hóa dẫn tới đáp ứng thuốc, liều lượng và tác dụng phụ của thuốc
Theo Whirl-Carillo M. [58] ,tốc độ chuyển hóa của thuốc phụ thuộc vào hoạt
tính của các enzym tham gia phân giải phân tử thuốc đó. Mỗi cơ thể có từng tốc độ
chuyển hóa ứng với từng loại thuốc khác nhau, thường được phân chia theo tốc độ
từ nhanh tới chậm như sau:
-

RM (rapid metabolizer, chuyển hóa nhanh)

-

EM (extensive metabolizer, chuyển hóa phổ biến)

8


-

IM (intermediate metabolizer, chuyển hóa trung bình)

-

PM (poor metabolizer, chuyển hóa kém)

Trong đó, EM là kiểu hình với enzym chuyển hóa có chức năng bình thường,
tương ứng với một người mang 2 alen có chức năng bình thường (tương đương với
kiểu gen *1/*1), và thường là kiểu hình ―phổ biến‖ của quần thể. Ngồi ra, cịn có
URM (ultra-rapid metabolizer, chuyển hóa siêu nhanh) có thể xếp chung vào RM,
và nhóm hồn tồn khơng chuyển hóa có thể xếp chung vào PM. Đồng thời, một số
cơ sở phân loại có dùng khái niệm ―normal metabolizer‖ (chuyển hóa bình thường)

thay cho EM [58]. Tuy nhiên, ta cần nhìn nhận rằng: EM là nhóm người có tốc độ
chuyển hóa phổ biến nhất, chiếm đa số, vì vậy hầu hết các loại thuốc có liều lượng
mặc định dựa trên nhóm EM. Vì thế, có thể hiểu nhóm EM là nhóm có khả năng
cũng như tốc độ chuyển hóa ―bình thường‖. Mặc dù vậy, nhóm EM lại khơng có
đáp ứng tốt với một số loại thuốc, chẳng hạn như nhóm EM của enzym CYP3A5
chuyển hóa tacrolimus nhanh hơn so với mặc định (do quần thể người châu Âu phổ
biến kiểu hình chuyển hóa kém nên tacrolimus có liều mặc định theo PM [6]).
Trong những trường hợp này, khái niệm ―chuyển hóa bình thường‖ sẽ khơng đồng
nhất với ―chuyển hóa phổ biến‖. Đồng thời, cách dịch EM là ―chuyển hóa bình
thường‖ khơng rõ ràng, và cũng khơng thể hiện đúng ý nghĩa của EM, Đó là lí do thuật
ngữ ―extensive metabolizer‖ xuất hiện phổ biến trong các nghiên cứu gần đây về gen
chuyển hóa thuốc thay cho ―normal metabolizer‖. Nghiên cứu sử dụng thuật ngữ
―extensive metabolizer‖ và cách phân loại tương ứng của Whirl-Carrillo M. [58].
EM được xem như là tiêu chuẩn để đánh giá tốc độ chuyển hóa. RM (chuyển
hóa nhanh) hay PM (kém chuyển hóa) phản ảnh tốc độ nhanh hay chậm khi được so
sánh với EM. Kiểu hình chuyển hóa có tính đặc thù cho từng gen và từng nhóm
thuốc, cách xác định kiểu hình chuyển hóa được trình bày trong mục 2.7. Chỉ định
thuốc, đặc biệt là liều lượng thuốc, nên được thay đổi dựa trên tốc độ chuyển hóa
của từng người bệnh.
Ví dụ: một bệnh nhân A là EM với loại thuốc X, tức tốc độ chuyển hóa thuốc
X của anh ta là tốc độ phổ biến, giống với đa số những người khác. Giả sử 3 quá
trình dược động học cịn lại của anh ta cũng bình thường, thì nồng độ đỉnh và nồng

9


độ đáy của thuốc trong huyết tương anh ta sẽ đạt mức tối ưu mà nhà sản xuất thuốc
đề ra. Như vậy, sử dụng liều mặc định sẽ cho hiệu quả điều trị cao nhất.
Ta tiếp tục giả định bệnh nhân B và bệnh nhân C cũng không mắc bệnh lý
nào liên quan đến dược động học của thuốc như bệnh về gan hay thận. Với bệnh

nhân B là PM của loại thuốc X, do phân giải thuốc chậm, nồng độ đáy thuốc trong
huyết tương của bệnh nhân B cao hơn hẳn bệnh nhân A. Khi ấy, bệnh nhân B có thể
đối mặt với tác dụng phụ của thuốc X nếu dùng liều mặc định. Vì vậy, liều lượng
thuốc của bệnh nhân B cần được giảm xuống để có nồng độ thuốc trong huyết
tương ở mức mong muốn. Trường hợp tệ hơn, khi khơng tìm được liều lượng điều
chỉnh ở mức phù hợp, anh ta cần phải chuyển sang loại thuốc Y nào đó có cơ chế
chuyển hóa khác thuốc X.
Bệnh nhân C là RM của loại thuốc X. Ngược với bệnh nhân B, tốc độ
chuyển hóa của bệnh nhân C cao hơn bình thường, nên thuốc sẽ được phân giải
nhanh, nồng độ đáy của thuốc sẽ thấp hơn mức của anh A. Dĩ nhiên, anh C sẽ
khơng có nguy cơ cao chịu tác dụng phụ của thuốc như anh B, nhưng anh C có
nguy cơ khơng đáp ứng với thuốc. Vì vậy, anh C có thể cần tăng liều lượng của
thuốc, để nồng độ thuốc trong máu ngang bằng với anh A. Nếu anh C chuyển hóa
thuốc quá nhanh và không thể tăng liều lên quá cao (để tránh nồng độ đỉnh quá lớn),
bệnh nhân C nên được chuyển sang dùng một liệu pháp thay thế.

Hình 1.1: Nồng độ thuốc trong huyết tương sau khi uống 0.5–350 mg BI 409306
(Theo de Moirais S.M. [40])
10


Hình 1.1 là ví dụ về đường cong nồng độ thuốc của PM và EM. Đường màu
xanh lam, điểm tròn tương ứng với EM (của enzym CYP2C19), còn đường màu
cam, điểm trịn có gạch chân ứng với PM. Các bệnh nhân trong 2 nhóm này sử dụng
cùng loại thuốc BI 409306, cùng một lượng thuốc: viên nén 100 mg [40]. Có thể
nhìn thấy, tuy nồng độ đỉnh của EM và PM không khác nhau đáng kể, nồng độ
thuốc trong huyết tương của PM luôn cao hơn EM, và cuối cùng thời gian tồn tại
cũng như nồng độ đáy của thuốc với PM cao hơn hẳn. Liều lượng thuốc của PM cần
phải được giảm xuống. Đường màu cam còn lại, thấp hơn là nồng độ thuốc trong
huyết tương của PM nhưng với liều lượng chỉ còn 10 mg. Ta thấy nồng độ thuốc

này tương đồng với EM, liều lượng 100 mg, với hiệu quả điều trị tối ưu.
Qua hai ví dụ trên, ta có thể thấy rằng: tốc độ chuyển hóa thuốc ảnh hưởng
mật thiết tới liều lượng khuyên dùng. Tốc độ chuyển hóa cao cần liều lớn hơn mặc
định, và ngược lại, tốc độ chuyển hóa thấp cần giảm liều lượng thuốc xuống, để
tăng hiệu quả điều trị và giảm thiểu tác dụng phụ.
1.1.2. Họ enzym Cytochrome P450 (CYP)
1.1.2.1. Định nghĩa và phân loại
Theo nghiên cứu của Nelson D.R. [44], cytochromes P450 (CYPs) là siêu họ
enzym chứa vòng hem (C34H32N4O4Fe) đóng vai trị là đồng yếu tố. Cấu trúc của
CYPs xuất hiện trong tất cả các sinh giới, nhưng không phải lồi nào cũng có CYPs,
chẳng hạn như Escherichia coli. Có hơn 50.000 loại protein CYP khác nhau đã
được con người biết đến, một số cịn được tìm thấy trên cả virus.
Danh pháp của họ enzym này, cũng như các enzym tương ứng, đều được quy
ước chính thức với tên gốc là CYP. Tuy nhiên, các enzym hay gen CYPs được phân
chia dựa trên sự tương đồng về trình tự, chứ khơng dựa trên sự tương đồng về mặt
tính chất hay chức năng của các enzym. Sau tên gốc CYP, có một chữ số đại diện
cho nhóm phân loại, một chữ cái đại diện cho phân nhóm, và cuối cùng là một chữ
số riêng cho từng gen. Ví dụ: CYP2B6 là enzym thuộc nhóm 2, phân nhóm B và là
enzym thứ 6 [17].

11


Trong hệ gen người, có tới 18 nhóm CYP, chia thành 41 phân nhóm và chứa
tổng cộng 57 gen. Tuy nhiên, trong đó chỉ có 3 họ CYP2, CYP3 và CYP4 là chiếm
đa số các gen [41].
1.1.2.2. Vai trò của CYP
Giống như một số cytochrome khác, cytochrome P450 có tham gia vào chuỗi
truyền điện tử. Kí hiệu P450 mang ý nghĩa 450 nm là bước sóng cytochrome này
hấp thụ tốt nhất. Tuy nhiên, vai trị chính của CYPs khơng nằm ở chuỗi truyền điện

tử như một số cytochrome khác [17].
CYP là một siêu họ enzyms có vai trị quan trọng trong q trình chuyển hóa
các chất nội sinh và ngoại sinh của người. Ở người, CYPs là một protein màng, nằm
ở ti thể hoặc lưới nội chất ở tế bào. Vịng hem của CYP đóng vai trị là
monooxygenaza, và cũng là cấu trúc điển hình của hemoglobin. Với đồng yếu tố là
oxygenaza, CYPs có khả năng oxy hóa steroids, axit béo cũng như các chất ngoại
sinh (xenobiotics). Các steroids nội sinh quan trọng mà CYPs có khả năng phân hủy
là hoocmon sinh dục và cholesterol. Bên cạnh các chất nội sinh, thuốc chính là điển
hình của các chất ngoại sinh mà CYPs có khả năng phân giải [17].
CYPs tham gia khoảng 75% các con đường chuyển hóa thuốc [17]. Tuy
nhiên, đối với chuyển hóa thuốc, CYPs chỉ thể hiện qua một số ít enzym. Ngồi ra,
tính đa hình của các enzym và gen này không giống nhau. Các CYPs quan trọng và
đa hình cao trong các nghiên cứu trên người có thể kể tới CYP2B6, CYP2C9,
CYP2C19, CYP2D6, CYP3A5 và CYP4F2 [17].
Kích thước và vị trí của các gen trên được mơ tả ở Bảng 1.1 (theo Ensembl
[24]), trong đó các thơng tin đều được tính theo alen kiểu dại (wild allelles, *1).
Điều thú vị là mặc dù 6 gen trên có vị trí và kích thước DNA cũng như mRNA khác
nhau rất nhiều, enzyme của chúng đều có chiều dài khoảng 500 bps (và kích thước
khoảng 56-57 kDa).

12


Bảng 1.1: Kích thước và vị trí của một số gen CYPs của con người
Kích thước

Vị trí

Gen


Đơn vị

Gen

mRNA

Protein

kbps

bps

axit amin

Nhiễm sắc thể

Đầu
5'
Mbp

CYP2B6

47.12

3071

491

19 40.99


CYP2C9

71.43

2561

490

10 94.93

CYP2C19

112.87

4131

490

10 94.76

CYP2D6

24.38

1588

497

22 42.13


CYP3A5

51.8

1720

502

7 99.65

CYP4F2

40.05

2361

520

19 15.88

1.1.2.3. CYP2B6
CYP2B6 tuy chỉ chiếm tới 2-10% tổng lượng CYPs trong gan, nhưng chịu
trách nhiệm chuyển hóa 8 trong số 200 loại thuốc quan trọng nhất của người [57].
CYP2B6 trong cơ thể có thể được tăng cường biểu hiện lên nhiều lần với sự xuất
hiện của nhiều loại thuốc, hoặc các chất ngoại sinh khác [12]. CYP2B6 có biểu hiện
khác nhau ở các cá thể, có thể chênh lệch nhau từ 20-250 lần, tùy thuộc vào yếu tố
di truyền cũng như tác nhân điều hòa phiên mã [12,31,32]. Các biến dị di truyền của
CYP2B6 ảnh hưởng tới nhiều loại thuốc khác nhau, nhưng nổi bật nhất là thuốc
chống virus phiên mã ngược (antiretroviral drug) (ví dụ: efavirenz, emtricitabine,
nevirapine, tenofovir disoproxil…) [58]. Bên cạnh nhóm thuốc trên, một số loại

thuốc khác cũng bị ảnh hưởng bởi CYP2B6, chẳng hạn như các loại thuốc hướng
thần, chống đơng máu hay thuốc phụ khoa (ví dụ: bupropion, prasugrel,
ospemifene) [58].
1.1.2.4. CYP2C9
CYP2C9 là một enzym CYP có khả năng chuyển hóa thuốc ở pha 1 [52].
CYP2C9 có vai trị quan trọng trong việc oxy hóa các hợp chất ngoại sinh cũng như
nội sinh. Vì vậy, dễ hiểu khi CYP2C9 biểu hiện chủ yếu ở gan, với mức độ biểu
13


hiện cao thứ 2 trong số tất cả các enzym CYP [52]. Enzym này được ước tính tham
gia q trình chuyển hóa của 15-20% tất các các loại thuốc cần được chuyển hóa tại
pha 1 [3]. Các loại thuốc chịu ảnh hưởng bởi kiểu hình của CYP2C9 chủ yếu là
nhóm thuốc kháng viêm không chứa steroid (nonsteroidal anti-inflammatory drugs NSAID) và thuốc giảm đau [58]. Vì viêm là phản ứng của hệ thống miễn dịch bẩm
sinh, và đau cũng là một biểu hiện của viêm; nên đa số các loại thuốc kháng viêm
khơng chứa NSAID cũng có một số tác dụng khác như thuốc giảm đau, hạ sốt, tiêu
biểu là aspirin [58]. Ngồi aspirin ra cịn có celecoxib, meloxicam, piroxicam cũng
là NSAID chịu ảnh hưởng bởi CYP2C9 [58]. Có một điều thú vị, khác với các
enzym khác, CYP2C9 có đầy đủ hoạt tính ở trẻ nhỏ, nên liều lượng thuốc của người
lớn tương đồng với của trẻ nhỏ và trẻ vị thành niên, nếu tính theo tỉ trọng khối
lượng [53].
1.1.2.5. CYP2C19
Theo các nghiên về CYP2C19 [25,35,39,61], cũng giống như CYP2C9,
CYP2C19 tham gia phân giải cả các chất nội sinh, điển hình là lipid, và các chất
ngoại sinh như thuốc. CYP2C19 khác với các CYP2C khác ở hoạt tính
epoxygenaza: enzym này có thể biến các đoạn nối đơi ở axit béo khơng no thành
epoxide. CYP2C19 cũng đóng góp vào sự chuyển hóa của nhiều nhóm thuốc: chống
trầm cảm 3 vịng (tricyclic antidepressants), benzodiazepines, mephenytoin, ức chế
bơm proton (proton pump inhibitors), thuốc kháng tiểu cầu clopidogrel, và thuốc ức
chế tái hấp thu chọn lọc serotonin (selective serotonin reuptake inhibitor). Trong đó,

thuốc chống trầm cảm 3 vịng (ví dụ: amitriptyline) và ức chế tái hấp thu chọn lọc
serotonin (ví dụ: citalopram) là hai nhóm thuốc quan trọng và chịu ảnh hưởng rõ rệt
của CYP2C19. Lưu ý là amitriptyline còn chịu ảnh hưởng bởi CYP2D6; đây là ví
dụ điển hình của việc một loại thuốc có thể chịu ảnh hưởng bởi nhiều enzym
chuyển hóa khác nhau). CYP2C19 cũng có sự đa dạng cao về kiểu gen và kiểu hình
giữa các quần thể người. Vì vậy các test CYP2C19 đã được áp dụng lâm sàng trong
điều trị ở một số nước.

14


1.1.2.6. CYP2D6
Theo Ingelman-Sundberg M. và Whirl-Carillo M. [26,58], CYP2D6 được
biểu hiện chủ yếu tại tế bào gan. Mặc dù chỉ chiếm khoảng 3% lượng CYP trong
gan, enzym này tham gia tới 25% con đường chuyển hóa của tất cả các loại thuốc
thơng dụng. Tuy là một enzym có khả năng chuyển hóa nhiều nhóm thuốc,
CYP2D6 lại là enzym CYP duy nhất không thể được cảm ứng (non-inducible) một
cách tự nhiên, tuy nhiên có thể cảm ứng bằng corticosteroids hoặc một số tác nhân
ngoại sinh (xenobiotics). CYP2D6 cũng được xem là một trong những gen có tính
đa hình rất cao với hơn 100 biến dị di truyền đã được ghi nhận và xác định được
hoạt tính. Bên cạnh đó cịn có một số biến dị đã được phân loại, nhưng lại chưa biết
biểu hiện ở kiểu hình. Đặc biệt hơn nữa, CYP2D6 còn là CYPs trong hệ gen người
tồn tại nhiều bản copy. Các bản copy này có đầy đủ chức năng và có tính cộng dồn,
vì thế kiểu nhiều hơn hai alen CYP2D6 có hoạt tính thơng thường tương ứng kiểu
hình là RM hoặc Ultra-RM. Đa số các chỉ định lâm sàng liên quan đến CYP2D6
thường là các loại thuốc hướng thần, điển hình là thuốc chống trầm cảm, rối loạn
thần kinh, rối loạn ám ảnh cưỡng chế (obsessive-compulsive disorder – OCD), rối
loạn tăng động giảm chú ý (attention-deficit hyperactivity disorder – ADHD) và cả
thuốc giảm đau. Ngoài ra, hai nhóm thuốc quan trọng cũng chịu ảnh hưởng bởi
enzym CYP2D6 là thuốc chống rối loạn nhịp tim (antiarrythmic) và thuốc điều trị

cao huyết áp dạng beta blocker. Trong rất nhiều các loại thuốc được CYP2D6
chuyển hóa, hai nhóm thuốc có chỉ định thuốc liên quan trực tiếp đến biến dị của
gen CYP2D6 là thuốc chống trầm cảm 3 vịng (ví dụ: amitriptyline) và thuốc điều trị
ADHD (atomoxetine).
1.1.2.7. CYP3A5
CYP3A5 là gen mã hóa cho enzym chịu trách nhiệm chuyển hóa tới hơn 35%
các loại thuốc được kê đơn trên toàn thế giới [58]. Gen này có sự phân bố đa dạng
giữa các quần thể người. Trái với đa số các gen CYP, CYP3A5 có alen CYP3A5*3
phổ biến trên nhiều quần thể lại là alen khơng có chức năng. Ngược lại alen có chức
năng chuyển hóa thuốc bình thường là CYP3A5*1 lại không phải là alen phổ biến

15


nhất trong nhiều quần thể đã biết. Enzym CYP3A5 không được biểu hiện trên đa số
người châu Âu, theo như kết quả phân tích tính đa hình trong di truyền vào năm
2001 cho thấy quần thể này phổ biến kiểu gen đồng hợp alen CYP3A5*1. Ngược lại,
có tới 70% người châu Phi mang kiểu gen đồng hợp hoặc dị hợp của alen
CYP3A5*3 [30,51]. Các biến dị của CYP3A5 đóng góp một lượng lớn chú thích
lâm sàng (clinical annotation) với rất nhiều loại thuốc khác nhau: thuốc ức chế miễn
dịch, giảm đau, thuốc điều trị ung thư, kháng virus, điều trị động kinh, điều trị bệnh
xuất huyết dưới màng nhện (subarachnoid hemorrhage),… Trong các loại thuốc kể
trên, nhóm thuốc quan trọng và liên quan mật thiết đến CYP3A5 có thể kể đến
thuốc ức chế miễn dịch, điển hình là tacrolimus, dùng cho các bệnh nhân ghép tạng
để tránh việc đào thải các mô hay cơ quan được cấy ghép [58].
1.1.2.8. CYP4F2
Theo Cha P.C., Johnson J.R. và Whirl-Carillo M. [11,27,58], CYP4F2, hay
còn được biến đến với tên Leukotriene-B4 omega-hydroxylaza 1, là một thành viên
của họ CYP tham gia vào quá trình chuyển hóa thuốc và một số loại lipid. CYP4F2
xuất hiện trên lưới nội chất của tế bào. Giống như tên thay thế, enzym này có khả

năng phân giải Leukotriene B4, một chất điều hòa phản ứng viêm của cơ thể. Các
loại lipid CYP4F2 chuyển hóa chủ yếu thuộc nhóm axit arachidonic. Hoạt tính
omega-hydroxylaza này cịn có khả năng phân giải các axit béo chuỗi rất dài, oxy
hóa vị trí omega của chuỗi phytyl trong các tocopherol (các dạng của vitamin E),
Ngoài ra, hoạt tính này cũng giúp hydroxyl hóa và bất hoạt phylloquinone (vitamin
K1) và menaquinone (MK-4, một dạng của vitamin K2), hai chất này đóng vai trị
đồng yếu tố trong q trình đơng máu. Đặc biệt hơn, CYP4F2 cũng có tương tác với
một loạt thuốc chống đông máu phổ biển hiện nay (warfarin, acenocoumarol,
phenprocoumon…). Bên cạnh đó, CYP4F2 cũng có ảnh hưởng tới một số loại thuốc
trị các bệnh tim mạch khác, như anthracyclines, aspirine hay clopidogrel [58].
1.1.3. Ứng dụng của tin sinh học trong nghiên cứu chuyển hóa thuốc
1.1.3.1. Giải trình tự tồn bộ hệ gen người

16


Giải trình tự thế hệ mới (Next-Generation Sequencing) và giải trình tự tồn
bộ hệ gen (whole genome sequencing) đã mở ra một kỉ nguyên mới trong di truyền
học cũng như tin sinh học. Giải trình tự thế hệ mới cung cấp góc nhìn chuẩn xác
nhất về hệ gen người ở góc độ phân tử một cách thuận tiện và nhanh chóng. Đồng
thời phương pháp này giúp cho việc so sánh trình tự DNA một cách đơn giản, đồng
thời giúp hiểu thêm về các chỉ thị sinh học và các gen chuyển hóa thuốc
(pharmacogenes).
Hệ gen người có kích thước lớn khoảng 3 tỉ cặp nucleotides, nhưng có thể
được giải trình tự một cách tương đối đơn giản. Một trong số các phương pháp tiên
tiến nhất là phương pháp đọc hai đầu (paired-end read), mơ tả ở Hình 1.2. Theo
Casey R. và Lê Sỹ Vinh [10,33], DNA tổng số được bẻ gãy bằng phương pháp vật
lý thành các mảnh có kích thước phù hợp (gọi là insert size), chẳng hạn như 350
bps. DNA dùng để giải trình tự thường là DNA trực tiếp tách từ hệ gen của tế bào,
không trải qua bước khuếch đại bằng PCR để giảm thiểu sai sót gây ra trong quá

trình khuếch đại. Tuy nhiên, với trường hợp mẫu q ít, PCR vẫn có thể được sử
dụng để đảm bảo mật độ DNA trong môi trường đệm đủ cao cho bước đọc mẫu.
Môi trường đệm thường là các kit có sẵn để tăng hiệu quả chuyển hóa các đoạn
DNA thành các cấu trúc sẵn sàng cho việc đọc (gọi là libraries). Để bảo vệ DNA và
sẵn sàng cho bước cắt, các libraries này được gắn thêm 2 adapters (là cấu trúc
oligonucleotit có trình tự đã biết, được gắn ở hai đầu DNA). Library sẽ được cắt
theo hai hướng ngược nhau từ 2 đầu 5’, tạo thành 2 đầu đọc (reads): đầu xi và
đầu ngược. Tổng kích thước của 2 đầu đọc sẽ ngắn hơn 1 library một chút, và sẽ
chừa ra ở giữa một đoạn ở giữa có kích thước bé hơn, gọi là ―khoảng giữa‖ (inner
distance). Chẳng hạn, nếu libraries dài 350 bps thì đầu đọc dài 150 bps, còn
―khoảng giữa‖ chỉ còn là đoạn 50 bps. Sau đó, các đầu đọc sẽ được đem giải trình
tự, rồi ghép nối với nhau bằng phần mềm.
Hệ thống dữ liệu bản đồ gen GRCh38 (Genome Reference Consortium –
human) được dùng để tham chiếu để ghép các đoạn DNA bằng cơng cụ ghép
Burrows‐ Wheeler. Sau đó, bước ghép nối có thể được kiểm tra lại bằng phương

17


pháp Sanger. Một số lượng lớn vị trí trên hệ gen sẽ được chỉ định để kiểm tra, và
mồi sẽ được thiết kế tự động bằng phần mềm (ví dụ Primer3plus). Phản ứng PCR
được thực hiện để khuếch đại các trình tự ở vị trí kiểm tra, rồi đọc bằng Sanger xem
việc ghép nối và sắp xếp có đúng hay khơng [33].

Hình 1.2: Cấu trúc của một library trong Giải trình tự hai đầu.
(Theo Casey R. [10])
1.1.3.2. Dữ liệu về hệ gen và gen chuyển hóa thuốc
Giải trình tự thế hệ mới đã tạo ra các kho tàng dữ liệu lớn về hệ gen người.
Dự án giải trình tự 1000 hệ gen người (1000 Genomes Project) tính tới thời điểm
này đã có 4973 mẫu hệ gen [8] đại diện cho các chủng tộc, quốc gia và vùng lãnh

thổ. Các công trình nghiên cứu khác có thể tải dữ liệu gốc (chia theo từng Nhiễm
sắc thể) để nghiên cứu theo mục đích riêng. Khó khăn duy nhất là tệp tin dữ liệu
quá lớn (khoảng 30 GB với mỗi tệp tin), không thể xử lý bằng máy tính cá nhân
thơng dụng, có thể được khắc phục bằng máy tính hiệu năng cao.
Bên cạnh cơ sở dữ liệu giải trình tự đã được công bố, để tăng độ phong phú
trong dữ liệu, cũng như độ chính xác khi phân tích các biến dị di truyền có tần số
thấp, các nhóm nghiên cứu có thể tự giải trình tự và bổ sung dữ liệu vào nghiên cứu
của họ. Ưu điểm rất lớn của giải trình tự là cho ra thơng tin dưới dạng dữ liệu số,
thay vì lưu trữ trong các vectơ sinh học theo như cách truyền thống. Nhờ đó, các
nhóm nghiên cứu có thể cơng bố và chia sẻ dữ liệu cho nhau một cách dễ dàng và
thuận tiện. Đồng thời, khi cần lặp lại các nghiên cứu trên cùng một đối tượng, hoặc

18


nghiên cứu trên các khía cạnh khác nhau, dữ liệu hồn tồn có thể tái sử dụng. Đó là
một sự tiện lợi cũng như tiết kiệm thời gian và kinh tế so với sinh học phân tử
truyền thống khi không phải lặp lại từ bước tách DNA từ mẫu. Và đó cũng là động
lực khuyến khích các nghiên cứu trong mảng tin sinh học sau này.
Bên cạnh dữ liệu về hệ gen người, cịn có các dữ liệu về ngân hàng gen,
SNPs (single nucleotide polymorphisms – các vị trí nucleotide đa hình) và các con
đường tín hiệu của chúng, đặc thù cho một số mục đích nhất định. Hapmap là một
cơ sở dữ liệu lớn về haplotype của các gen trong hệ gen người, với 269 hệ gen từ 4
quần thể khác nhau [4]. Công cụ cùng tên cũng cho phép các nghiên cứu tìm kiếm
các gen và biến dị di truyền có ảnh hưởng tới sức khỏe và bệnh tật. Hapmap có
cơng lớn nhất trong việc thu hẹp lượng SNPs cần nghiên cứu trong hệ gen người (từ
10 triệu xuống còn khoảng 0.5 triệu) [4]. Liên quan đến gen chuyển hóa thuốc, có
một cơ sở dữ liệu lớn là PharmGKB [58]. Cơ sở dữ liệu này chứa một hệ thống
thơng tin lớn về các gen chuyển hóa thuốc, bao gồm tương tác giữa các gen và
thuốc; đặc biệt các alen của gen chuyển hóa thuốc và ảnh hướng của chúng tới chỉ

định thuốc. Cơ sở dữ liệu này là đối tác của Clinical Pharmacogenetics
Implementation Consortium (CPIC®), PharmVar, Pharmacogenomics Research
Network (PGRN) và Pharmacogenomics Clinical Annotation Tool (PharmCAT) là
các hệ thống nghiên cứu về biến dị di truyền, biểu hiện và chỉ định thuốc của các
gen chuyển hóa thuốc.
Ngồi ra, Ensemblr [24], NIH và SNPedia [9] cũng là chứa các cơ sở dữ liệu
mở về các SNPs được công bố trong các gen, cung cấp cái nhìn tồn diện hơn về
các SNPs nói chung khi đặt chúng trong cấu trúc của một gen hay cả một genome.
Để nghiên cứu thêm về enzyme được mã hóa từ gen, các cơ sở dữ liệu trên có liên
kết với dữ liệu Uniprot [13].
1.1.3.3. Một số kiểu biến dị di truyền điển hình trên gen chuyển hóa thuốc được
phát hiện thơng qua giải trình tự
Tin sinh nói chung và giải trình tự tồn bộ hệ gen nói riêng giúp phát hiện ra
các SNP, và các indel (insertion-deletion) là các đoạn nucleotide ngắn được chèn

19


thêm hoặc cắt đi. Giống như trên các quần thể khác, hệ gen của quần thể người Việt
Nam có số lượng SNPs nhiều hơn indel rõ rệt (lần lượt là 0.66 triệu và 0.05 triệu
[33]). Vì vậy, SNP trên gen chuyển hóa thuốc dự đốn sẽ phổ biến hơn indel trên
quần thể người Việt.
Nhiều kiểu biến dị di truyền trên gen chuyển hóa thuốc và ảnh hướng của
chúng tới hoạt tính của enzym đã được cơng bố. Các indel có tác động chung tới hệ
gen, đó là làm dịch khung (frameshift), khiến cho các codon ở sau vị trí indel bị
lệch đi và làm thay đổi tồn bộ protein phía sau. Một số ít trường hợp, indel chèn
thêm một số nucleotide chia hết cho 3, khiến cho khung không bị dịch đi mà chỉ
chèn thêm một số codon, trường hợp này gọi là inframe insertion. Rs72549356 là
một ví dụ tiêu biểu, đột biến này chèn thêm 1 hoặc 2 đoạn 5’-GGGGCGAAA-3’
vào gen CYP2D6, tạo ra alen CYP2D6*30. Chưa rõ ảnh hưởng của đột biến này lên

khả năng phân giải thuốc của enzym tương ứng [58].
SNP có hai kiểu tác động tới enzym được mã hóa. Nếu SNP xuất hiện trên
exon, nó có thể đổi codon đang mã hóa cho axit amin này thành codon mã hóa axit
amin khác. Nếu axit amin đó nằm trong vùng phản ứng của enzym, nơi enzym tiếp
xúc với cơ chất thì hoạt tính của enzym bị giảm đi rất nhiều. Tương tự với trường
hợp axit amin tham gia vào cấu trúc bậc 3 của tế bào. Điển hình là CYP2D6*62
chứa SNP rs730882251, SNP biến axit amin 441 R>C. Arginine là axit amin chứa
NH3- ở gốc hydrocarbon bị biến thành Cysteine, chứa gốc -SH. Sự xuất hiện của
Cysteine làm thay đổi cầu disulfide khiến cấu trúc của enzym bị thay đổi theo, tạo
ra enzym mất hoàn tồn hoạt tính [58]. Nhưng nếu axit amin đó nằm ngồi vùng
phản ứng, và cũng khơng tham gia vào cấu trúc bậc 3 của protein thì SNP đó khơng
ảnh hưởng tới hoạt tính của enzym. SNP xuất hiện ở intron có thể khơng ảnh hưởng
tới protein, hoặc làm ảnh hưởng tới cả mRNA và enzym được dịch mã. Chẳng hạn,
CYP2D6*4 chứa rs3892097 xảy ra trên vùng nhận diện exon ở trên intron, làm biến
đổi nucleotide 1847 G>A (tính từ điểm khởi đầu dịch mã ATG), khiến cho mRNA
không xảy ra q trình cắt intron tại vị trí đó, hiện tượng này gọi là splicing defect. Kéo
theo đó, enzym CYP2D6 bị mất hoàn toàn chức năng do cấu trúc bị thay đổi [58].

20


1.1.3.4. Xử lí dữ liệu và thống kê
Bên cạnh việc cung cấp một lượng dữ liệu rất lớn, tin sinh học cịn cung cấp
cái phương pháp xử lí dữ liệu cũng như xử lí thống kê. Dữ liệu thơ về trình tự di
truyền có thể được phân tích nhằm làm nổi bật thông tin chứa trong chúng, cùng với
ý nghĩa sinh học cũng như ý nghĩa thực tiễn ẩn chứa sâu bên trong. Các phương
pháp thống kê giúp giảm thiểu những sai lầm trong tính tốn, gia tăng độ tin cậy
trong nghiên cứu. Các cơng cụ xử lí cịn hỗ trợ đồ họa, giúp minh họa thông tin thu
được một cách trực quan và khoa học. Các phương pháp sử dụng trong nghiên cứu
sẽ được giới thiệu ở mục 1.3.2.

1.2. Gen chuyển hóa thuốc trong quần thể ngƣời Kinh Việt Nam:
1.2.1. Quần thể người Kinh Việt Nam
Việt Nam là đất nước có dân số đứng thứ 14 thế giới với 95 triệu người, tính
tới 2019. Quần thể người Kinh Việt Nam (được kí hiệu là KHV) là dân tộc chính
của Việt Nam, chiếm hơn 86% dân số, và cũng được xem là một quần thể lớn của
của châu Á. Quần thể này phân bố khắp lãnh thổ Việt Nam, nhưng tập trung chủ
yếu ở các vùng đồng bằng ở phía Đông, đặc biệt là các thành phố lớn như thủ đơ Hà
Nội và thành phố Hồ Chí Minh. Đa số các cơng trình nghiên cứu về di truyền học
của người Việt Nam đều được chọn mẫu ở hai thành phố kể trên. Kết quả phân tích
dữ liệu về di truyền học của KHV cho thấy quần thể này có sự đa dạng di truyền rất
lớn với khoảng 24.81 triệu biến dị, trong đó có 0.71 triệu biến dị mới. Đặc biệt,
trong số các biến dị kể trên có 107 biến dị có tần số trên 1% được coi là các biến dị
gây bệnh [33].
Hiện nay, cơ sở dữ liệu lớn nhất về hệ gen của người Việt Nam là VinGen
Data Portal [55]. Hệ thống dữ liệu bao gồm 504 hệ gen đã được giải trình tự, với
hơn 60 nghìn gen và 27 triệu biến dị di truyền, tính tới cuối năm 2020. Thông tin về
các gen và các biến dị di truyền đã phát hiện có thể được tìm kiếm trên cổng thông
tin của cơ sở dữ liệu. Tuy nhiên, các tệp dữ liệu gốc về ―sequencing reads‖ (đầu đọc
giải trình tự), SNPs, ―copy number variant‖ (biến dị số bản copy của gen) và nhiều
dữ liệu khác vẫn chưa được truy cập tự do. Đồng thời, thông tin về các alen, các kết

21


quả phân tích cũng như các sơ đồ đường dẫn (pipeline) vẫn chưa được hồn thiện và
cập nhật.
1.2.2. Tính cấp thiết trong nghiên cứu gen chuyển hóa thuốc trong quần thể KHV
Theo nghiên cứu của Angelio A. và cộng sự [5], dân số Việt Nam đang tăng
dần, với tốc độ tăng trưởng trung bình 1.1% mỗi năm trong giai đoạn 2000-2015,
nhưng đất nước đang đứng trước nguy cơ bị già hóa dân số. Tỉ lệ người trên 60 tuổi

tăng từ 7.1% lên tới 10.2% từ năm 1989 tới năm 2014. Chi phí và nhu cầu cho y tế
ngày một tăng lên, từ 5% GDP vào những năm 1990s tăng lên 7% GDP vào năm
2014. Tỉ lệ này cao hơn đa số các nước đang phát triển ở châu Á. Chỉ tính riêng
dược phẩm, tổng doanh thu đã lên tới hơn 5,9 tỉ USD. Các con số trên cho thấy nhu
cầu về y tế nói chung và dược phẩm nói riêng ở Việt Nam là rất lớn, và đang tăng
lên từng ngày.
Thêm một vấn đề nữa, có tới khoảng 90% nguyên liệu để điều chế, và 60%
dược phẩm được nhập khẩu từ nước ngoài [5]. Do các nghiên cứu lâm sàng của
từng loại thuốc thường chỉ được nghiên cứu trên một nhóm quần thể nhất định, nên
khi nhập về Việt Nam chỉ định thuốc có thể sẽ khơng phù hợp do hệ enzym chuyển
hóa thuốc có thể có sự khác biệt. Ví dụ, thành phố Hồ Chí Minh đã ghi nhận một số
ca ngộ độc thần kinh tủy sống do ảnh hưởng của enzym CYP2B6 tới thuốc
efavirenz (EFV) [46]. Vì vậy, các nghiên cứu về gen chuyển hóa thuốc trên quần
thể người Việt rất cần thiết để hiểu hơn về dược động học của thuốc, giúp nâng cao
hiệu quả điều trị, đồng thời làm giảm tác dụng phụ nguy hiểm của thuốc. Bên cạnh đó,
hiểu biết về dược động học cịn giúp cải tiến quá trình sản xuất các loại dược phẩm
trong nước, gián tiếp giúp cho nền công nghiệp dược của Việt Nam phần nào cạnh
tranh được với với các ngành công nghiệp lớn lân cận như Trung Quốc hay Ấn Độ.
Tuy nhiên, do các thành tựu về Tin sinh học, đặc biệt là về giải trình tự thế
hệ mới xuất hiện không lâu, nên việc nghiên cứu các gen chuyển hóa thuốc của
người Việt Nam chưa được cập nhật và chú trọng. Hiện nay, mới có những nghiên
cứu đầu tiên về một vài gen đơn lẻ, (chẳng hạn CYP2D6) với số lượng mẫu không
đủ lớn để đại diện cho cả quần thể. [45] Vì vậy, những nghiên cứu rộng hơn về cả

22


×