Tải bản đầy đủ (.pdf) (93 trang)

Xây dựng quy trình phát hiện các đột biến gen liên quan đến bệnh khiếm thính di truyền bằng kỹ thuật giải trình tự dna thế hệ mới

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.34 MB, 93 trang )

ĐẠI HỌC QUỐC GIA TP. HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM

NGUYỄN THỊ DIỆU ÁI

XÂY DỰNG QUY TRÌNH PHÁT HIỆN CÁC ĐỘT BIẾN GEN
LIÊN QUAN ĐẾN BỆNH KHIẾM THÍNH DI TRUYỀN BẰNG
KỸ THUẬT GIẢI TRÌNH TỰ DNA THẾ HỆ MỚI

Chuyên ngành: Công nghệ Sinh học
Mã số: 60 42 02 01

LUẬN VĂN THẠC SĨ

Tp. Hồ Chí Minh, tháng 1 năm 2019


i

CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI
TRƯỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG – TP. HCM

Cán bộ hướng dẫn khoa học : PGS.TS. Hồ Huỳnh Thùy Dương

Cán bộ chấm nhận xét 1 : ...................................................................................
TS. Nguyễn Hoàng Chương

Cán bộ chấm nhận xét 2 : ...................................................................................
TS. Hoàng Anh Hoàng

Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp. HCM


ngày 11 . . tháng 01 . năm 2019
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
1.

CHỦ TỊCH: PGS.TS. NGUYỄN TIẾN THẮNG

2.

PHẢN BIỆN 1: TS. NGUYỄN HOÀNG CHƯƠNG

3.

PHẢN BIỆN 2: TS. HOÀNG ANH HOÀNG

4.

ỦY VIÊN: PGS. TS. LÊ PHI NGA

5.

THƯ KÝ: TS. PHAN THỊ HUYỀN

Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên
ngành sau khi luận văn đã được sửa chữa (nếu có).
CHỦ TỊCH HỘI ĐỒNG

TRƯỞNG KHOA KỸ THUẬT HĨA HỌC

PGS. TS. NGUYỄN TIẾN THẮNG


GS.TS. Phan Thanh Sơn Nam


ii

ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc

NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: Nguyễn Thị Diệu Ái
MSHV: 1670542
Ngày, tháng, năm sinh: 16/08/1993
Nơi sinh: Cà Mau
Chuyên ngành: Công nghệ sinh học
Mã số: 60420201
I. TÊN ĐỀ TÀI: Xây dựng quy trình phát hiện các đột biến gen liên quan đến bệnh
khiếm thính di truyền bằng kỹ thuật giải trình tự DNA thế hệ mới
II. NHIỆM VỤ VÀ NỘI DUNG:
Xây dựng quy trình phát hiện các đột biến gen liên quan đến bệnh khiếm thính di truyền
bằng kỹ thuật giải trình tự DNA thế hệ mới với các nội dung chính sau:
1. Thiết lập quy trình giải trình tự DNA thế hệ mới phát hiện đột biến gây bệnh
khiếm thính trên 7 gen GJB2, GJB3, GJB6, KCNQ4, MYO7A, MYO15A và SLC26A4
2. Xác định các thông số kỹ thuật đánh giá chất lượng dữ liệu giải trình tự
3. Phân tích kết quả quy trình phát hiện biến thể trên mẫu chuẩn dương, mẫu
chuẩn âm và mẫu âm tính với bệnh khiếm thính
III. NGÀY GIAO NHIỆM VỤ: 13/08/2018
IV. NGÀY HOÀN THÀNH NHIỆM VỤ: 02/12/2018

V. CÁN BỘ HƯỚNG DẪN: PGS. TS. Hồ Huỳnh Thùy Dương

CÁN BỘ HƯỚNG DẪN

Tp. HCM, ngày . . . . tháng .. . . năm 20....
CHỦ NHIỆM BỘ MÔN ĐÀO TẠO

PGS. TS. Hồ Huỳnh Thùy Dương

PGS. TS. Lê Thị Thủy Tiên

TRƯỞNG KHOA KỸ THUẬT HÓA HỌC

GS.TS. Phan Thanh Sơn Nam


iii

LỜI CÁM ƠN
Để thực hiện và hoàn thành đề tài luận văn này, tôi xin gửi lời cám ơn chân
thành đến:
Ban Giám hiệu trường Đại học Bách Khoa, Ban chủ nhiệm Khoa Kỹ Thuật
Hóa Học, Bộ mơn Cơng nghệ Sinh học cùng tất cả thầy cô đã giảng dạy những kiến
thức q báu cho tơi trong suốt q trình học tập tại trường.
Ban Giám Đốc Công ty TNHH Công nghệ Sinh học Khoa Thương đã đồng ý
cho tôi thực hiện đề tài tại công ty.
PGS.TS. Hồ Huỳnh Thùy Dương, Bộ môn Di truyền – Đại học Khoa Học Tự
Nhiên TP. HCM, người hướng dẫn khoa học cho tôi trong quá trình hồn thành luận
văn.
Các anh, chị phịng nghiên cứu và các đồng nghiệp tại công ty TNHH CNSH

Khoa Thương đã tạo điều kiện và hỗ trợ tôi trong suốt quá trình thực hiện luận văn.

Tp Hồ Chí Minh, ngày 01 tháng 12 năm 2018


iv

TĨM TẮT
Khiếm thính là khuyết tật giác quan phổ biến nhất ở người với tỷ lệ từ một đến
bốn trên 1000 trẻ sinh ra. Khoảng 50 – 70% trường hợp khiếm thính bẩm sinh là do
đột biến gen. Nhằm phát hiện đột biến gây bệnh và cung cấp thông tin đánh giá lâm
sàng cho người bị nghe khó và mất thính, chúng tơi xây dựng quy trình giải trình tự
DNA thế hệ mới phát hiện các đột biến trên 7 gen phổ biến gây bệnh khiếm thính.
Đề tài đã nhân bản thành cơng các exon mã hóa và vùng intron +/- 15 bp kế cận của
7 gen GJB2, GJB3, GJB6, KCNQ4, MYO7A, MYO15A và SLC26A4 bằng longrange PCR. Kết quả giải trình tự NGS thành cơng với mật độ cluster 219 k/mm2,
Q30 đạt 89.9%, passing filter đạt 89% và thu được chất lượng dữ liệu tốt.
Đề tài thực hiện quy trình trên các mẫu chuẩn dương, mẫu chuẩn âm và mẫu
máu người khơng mắc bệnh khiếm thính. Kết quả cho thấy quy trình đã phát hiện
được đột biến gây bệnh c.35delG và c.101T>C trên gen GJB2, đúng với đột biến
tồn tại trên mẫu chuẩn dương và khơng tìm thấy đột biến gây bệnh trên mẫu chuẩn
âm và mẫu bình thường. Đồng thời chúng tơi cũng giải được trình tự các gen mục
tiêu với độ phủ cao trên 100X và độ chính xác 99.9%. Kết quả này cho phép phát
hiện đúng trình tự gen quy định chức năng nghe từ đó phát hiện được các biến thể
gây bệnh. Nghiên cứu này là tiền đề cho sự phát triển quy trình xét nghiệm di truyền
phát hiện đột biến gây bệnh khiếm thính.


v

ABSTRACTS

Hearing loss is the most common sensory impairment in humans, with a
prevalence of one to four in 1,000 newborns. Approximately 50% to 70% of
congenital hearing loss cases are attributable to genetic causes. Establishing a
genetic diagnosis of hereditary hearing loss is a critical component of the clinical
evaluation of deaf and hard-of-hearing persons and their families. In this study, a
targeted DNA next-generation sequencing (NGS) gene panel for hearing loss was
developed including 7 genes which have a well-established causal role in hearing
loss. Targeted regions including coding exon and +/- 15 base pairs of adjacent
intronic sequence from GJB2, GJB3, GJB6, KCNQ4, MYO7A, MYO15A and
SLC26A4 genes were successfully amplified by long-range PCR. The sequencing
run clustered at 219 k/mm2 and resulted in 89.9% of reads exceeded Q30, 89% of
the original reads passing filter and generated high-quality DNA sequence data.
The developed testing procedures were performed on four samples normal for
hearing loss and two reference samples including one positive and one negative for
mutation. The two mutations c.35delG and c.101T>C on GJB2 gene were identified
which were exactly two previously identified mutations. Good quality sequence
data with 99.9% accuracy and min coverage on target region greater than 100X
were also obtained. These results indicated that generated data were reliable for
variant calling. This study established an initial step for developing a molecular
diagnostic for hereditary hearing loss.


vi

LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi, các số liệu và kết
quả nghiên cứu trong luận văn là trung thực, nếu có gì sai sót tơi xin hồn tồn chịu
trách nhiệm.
Tp. Hồ Chí Minh, ngày 25 tháng 11 năm 2018


Nguyễn Thị Diệu Ái


vii

MỤC LỤC
TÓM TẮT ..................................................................................................................iv
ABSTRACTS ..............................................................................................................v
LỜI CAM ĐOAN ......................................................................................................vi
MỤC LỤC ................................................................................................................ vii
DANH SÁCH CÁC TỪ VIẾT TẮT ..........................................................................ix
DANH MỤC CÁC BẢNG..........................................................................................x
DANH MỤC CÁC HÌNH ..........................................................................................xi
MỞ ĐẦU .....................................................................................................................1
1. Tính cấp thiết của đề tài ......................................................................................1
2. Mục tiêu nghiên cứu ............................................................................................2
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .....................................................................3
1.1. Khiếm thính di truyền và các gen liên quan .....................................................3
1.2. Chương trình tầm sốt và xét nghiệm chẩn đốn khiếm thính .........................7
1.3. Giải trình tự thế hệ mới trong xét nghiệm di truyền ........................................9
1.4. Giá trị và hạn chế của xét nghiệm di truyền khiếm thính ..............................14
1.5. Tình hình nghiên cứu trong và ngồi nước ....................................................17
CHƯƠNG 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU ............................19
2.1. Địa điểm và thời gian nghiên cứu ..................................................................19
2.2. Vật liệu – hóa chất ..........................................................................................19
2.2.1. Mẫu thực nghiệm .....................................................................................19
2.2.2. Hóa chất-vật tư tiêu hao ...........................................................................19
2.2.3. Thiết bị - dụng cụ .....................................................................................20
2.3. Sơ đồ nghiên cứu tổng quát ............................................................................21
2.4. Bố trí thí nghiệm.............................................................................................22

2.4.1. Thiết lập quy trình giải trình tự NGS.......................................................22
2.4.2. Xác định các thông số kỹ thuật đánh giá chất lượng dữ liệu giải trình tự ...
.............................................................................................................25
2.4.3. Phân tích kết quả quy trình phát hiện biến thể trên mẫu chuẩn và mẫu âm
tính
.............................................................................................................27


viii

2.5. Phương pháp nghiên cứu ................................................................................27
2.5.1. Thiết kế hệ mồi dùng cho phản ứng long-range PCR .............................27
2.5.2. Tách chiết gDNA .....................................................................................27
2.5.3. Long-range PCR ......................................................................................30
2.5.4. Chuẩn bị thư viện cho giải trình tự thế hệ mới ........................................31
2.5.5. Giải trình tự DNA thế hệ mới ..................................................................34
2.5.6. Phân tích dữ liệu ......................................................................................35
2.5.7. Giải trình tự Sanger .................................................................................35
2.5.8. Xử lý số liệu .............................................................................................36
CHƯƠNG 3. KẾT QUẢ - BIỆN LUẬN ..................................................................37
3.1. Kết quả thiết lập quy trình giải trình tự NGS .................................................37
3.1.1. Kết quả thiết kế hệ mồi long-range .........................................................37
3.1.2. Kết quả tối ưu các phản ứng long-range PCR .........................................39
3.1.3. Chuẩn bị thư viện giải trình tự DNA .......................................................46
3.1.4. Giải trình tự DNA thế hệ mới ..................................................................48
3.2. Kết quả xác định các thông số kỹ thuật đánh giá chất lượng dữ liệu giải trình
tự
.....................................................................................................................50
3.3. Kết quả phân tích quy trình phát hiện biến thể trên mẫu chuẩn và mẫu âm
tính .....................................................................................................................54

CHƯƠNG 4. KẾT LUẬN VÀ ĐỀ NGHỊ .................................................................62
4.1. Kết luận ..........................................................................................................62
4.2. Đề nghị ...........................................................................................................62
TÀI LIỆU THAM KHẢO .........................................................................................63
PHỤ LỤC .................................................................................................................... a


ix

DANH SÁCH CÁC TỪ VIẾT TẮT
(-): Âm tính
(+): Dương tính
BLAST: Basic Local Alighnment Search Tool
bp: base pair
DNA: Deoxyribonucleic acid
dNTP: Deoxynucleoside triphosphate
HL: Hearing loss
KT: Khiếm thính
LINE: Long interspersed nuclear element
NCBI: National Center for Biotechnology Information
PCR: Polymerase Chain Reaction
SINE: Short interspersed nuclear element
TE: Dung dịch gồm Tris và EDTA
Tm: Melting temperature
U: unit
WES: Whole exome sequencing
WGS: Whole genome sequencing
WHO: World Health Organization
XNDT: Xét nghiệm di truyền



x

DANH MỤC CÁC BẢNG
Bảng 2.1. Thông số đánh giá hiệu quả chuẩn bị thư viện .........................................24
Bảng 2.2. Thông số đánh giá kết quả chất lượng chạy máy giải trình tự .................24
Bảng 2.3. Thơng số đánh giá chất lượng giải trình tự ...............................................25
Bảng 2.4. Điểm chất lượng và độ chính xác của base đọc được ..............................26
Bảng 2.5. Thành phần phản ứng long-range PCR ....................................................30
Bảng 3.1. Các thông số kỹ thuật của 25 cặp mồi thiết kế .........................................37
Bảng 3.2. Thông tin kỹ thuật 28 cặp primer lựa chọn cho xét nghiệm KT di truyền
...................................................................................................................................44
Bảng 3.3. Nồng độ và kích thước trung bình của thư viện trước khi biến tính ........48
Bảng 3.4. Thơng số kỹ thuật giải trình tự DNA trên hệ thống MiniSeq ...................49
Bảng 3.5. Các thông số thống kê chất lượng dữ liệu giải trình tự ............................50
Bảng 3.6. Thơng số kiểm sốt chất lượng cho quy trình phát hiện đột biến gây bệnh
KT bằng giải trình tự NGS ........................................................................................54
Bảng 3.7. Kết quả tìm biến thể của mẫu chuẩn dương – NA23853 .........................56
Bảng 3.8. Kết quả tìm biến thể của mẫu chuẩn âm – NA12878 ...............................57
Bảng 3.9. Kết quả tìm biến thể của mẫu âm – HL001 ..............................................58
Bảng 3.10. Thông số kỹ thuật kiểm sốt quy trình của mẫu âm tính........................59
Bảng 3.11. Kết quả tìm biến thể của mẫu âm – HL002 ............................................60
Bảng 3.12. Kết quả tìm biến thể của mẫu âm – HL003 ............................................60
Bảng 3.13. Kết quả tìm biến thể của mẫu âm – HL004 ............................................61


xi

DANH MỤC CÁC HÌNH
Hình 1.1.Tần suất các ngun nhân gây bệnh khiếm thính ........................................5

Hình 1.2. Hướng dẫn chẩn đốn ngun nhân và đánh giá lâm sàng khiếm thính của
ACMG .........................................................................................................................9
Hình 1.3. Quy trình chuẩn bị thư viện cho giải trình tự NGS ...................................12
Hình 1.4. Tiến trình giải trình theo nguyên lý tổng hợp trên máy Illumina .............13
Hình 2.1. Độ phủ dọc và độ phủ ngang ....................................................................26
Hình 3.1. Kết quả kiểm tra hoạt động mồi ở 64oC ....................................................41
Hình 3.2. Kết quả khảo sát nhiệt độ lai 58 - 68oC.....................................................41
Hình 3.3. Các trình tự lặp trên 3 vùng gen KCNQ4, MYO15A, MYO7A ..................43
Hình 3.4. Kết quả điện di sản phẩm cắt ....................................................................46
Hình 3.5. Kết quả kiểm tra kích thước thư viện mẫu NA23853 bằng BioAnalyzer
2100 ...........................................................................................................................47
Hình 3.6. Kết quả kiểm tra kích thước thư viện mẫu NA12878 bằng BioAnalyzer
2100 ...........................................................................................................................47
Hình 3.7. Kết quả kiểm tra kích thước thư viện mẫu HL001 bằng BioAnalyzer 2100
...................................................................................................................................48
Hình 3.8. Tỷ lệ phần trăm read được sắp xếp gióng cột và khơng được sắp xếp
gióng cột lên trình tự tham chiếu ..............................................................................51
Hình 3.9. Điểm chất lượng của từng vị trí giải trình tự ............................................52
Hình 3.10. Kích thước đoạn Insert (Insert Size) .......................................................53


Trang 1

MỞ ĐẦU
1. Tính cấp thiết của đề tài
Khiếm thính (KT) là một trong những khiếm khuyết phổ biến trong quần thể
người, tỷ lệ mắc bệnh vào khoảng 1 trên 1000 ca mới sinh và khoảng 50% ở người
trên 80 tuổi. Theo thống kê của Tổ chức Y tế Thế giới (World Health Organization WHO), năm 2018 ước tính có 466 triệu người mất thính lực, chiếm trên 5% dân số
thế giới [1]. Nguyên nhân gây ra bệnh KT khá phức tạp bao gồm các yếu tố do gen,
do môi trường như mắc bệnh truyền nhiễm, tiếp xúc với chất gây độc lên thính giác,

tiếng ồn hoặc do tuổi tác. Trong các yếu tố trên, yếu tố di truyền đóng vai trị quan
trọng trong sự hình thành bệnh, chiếm khoảng 50 – 70% các trường hợp bị bệnh
bẩm sinh và được xem là có liên quan đến việc thúc đẩy tiến trình bệnh ở người cao
tuổi [2]. Trong các trường hợp khiếm thính di truyền, tỷ lệ các ca khiếm thính
khơng hội chứng (nonsyndromic hearing loss-NSHL) là 70%, 30% cịn lại là các ca
khiếm thính có hội chứng, thường gặp đi kèm với các hội chứng như Usher,
Pendred, Jervell và Lange-Nielsen. Hiện nay, đã có trên 150 gen được cơng bố là có
liên quan đến bệnh KT di truyền. Đa số đột biến trên các gen liên quan quy định
tính trạng dị hợp tử, do đơn gen quy định, tần suất khác nhau tùy theo quần thể. KT
gây ảnh hưởng lớn đến sức khỏe, tâm lý cũng như sự phát triển thể chất và hoạt
động của người bệnh. Do đó việc tầm sốt sớm để có phương pháp điều trị thích
hợp và kiểm tra thân nhân nhằm theo dõi, phát hiện các trường hợp mắc bệnh tiếp
theo là vấn đề cần thiết. Đồng thời, dữ liệu thu nhận được từ người bệnh sẽ góp
phần làm rõ các vấn đề dịch tễ học phân tử của bệnh KT ở Việt Nam.
Những thông tin về gen và cơ chế phân tử của bệnh do di truyền đã có những
bước tiến vược bậc kể từ khi kỹ thuật giải trình tự thế hệ mới (Next generation
sequencing – NGS) được phát minh. Với dữ liệu đầu ra cao nhờ chiến lược làm giàu
bằng phương pháp capture (capture enrichment) và giải đồng thời và lượng lớn các
đoạn ngắn trình tự (massively parallel), NGS có thể giải 1 GB bp trong vòng 0,5
ngày trong khi Sanger phải mất 500 ngày cho khối lượng tương tự. Chi phí cũng

Luận văn Thạc sĩ

Nguyễn Thị Diệu Ái


Trang 2

giảm xuống đáng kể, thấp hơn đến 100 lần. Do vậy, NGS được đánh giá là kỹ thuật
có thời gian xét nghiệm nhanh, có thể áp dụng phân tích lượng lớn thông tin gen; là

công nghệ hữu dụng và thích hợp cho nghiên cứu, xét nghiệm chẩn đốn các bệnh
di truyền dị hợp và có nhiều gen liên quan như khiếm thính di truyền. Xuất phát từ
những thực tế trên, đề tài “Xây dựng quy trình phát hiện các đột biến gen liên quan
đến bệnh khiếm thính di truyền bằng kỹ thuật giải trình tự DNA thế hệ mới” được
thực hiện nhằm bước đầu cung cấp những nền tảng cơ bản cho việc xây dựng quy
trình xét nghiệm chẩn đốn bệnh khiếm thính di truyền ở Việt Nam.
2. Mục tiêu nghiên cứu
Xây dựng thành cơng quy trình phát hiện các đột biến trên 7 gen GJB2, GJB3,
GJB6, KCNQ4, MYO7A, MYO15A và SLC26A4 gây bệnh KT di truyền bằng kỹ
thuật giải trình tự DNA thế hệ mới.

Luận văn Thạc sĩ

Nguyễn Thị Diệu Ái


Trang 3

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU
1.1. Khiếm thính di truyền và các gen liên quan
Khiếm thính hay suy giảm thính lực (KT) là tình trạng bị suy giảm một phần
hoặc mất hẳn toàn bộ khả năng nghe và là một trong bốn dạng khiếm khuyết phổ
biến trong quần thể người được. Tỷ lệ mắc bệnh ở trẻ sơ sinh vào khoảng 1 trên
1000 ca và khoảng 50% ở người trên 80 tuổi. Theo thống kê của tổ chức y tế thế
giới (World Health Organization - WHO), năm 2018 ước tính có 466 triệu người
mất thính lực, chiếm trên 5% dân số thế giới [1]. Khiếm thính có thể do nguyên
nhân di truyền hoặc do ảnh hưởng của các yếu tố môi trường như biến chứng khi
sinh, mắc bệnh truyền nhiễm, phơi nhiễm với âm thanh tần số lớn, sử dụng sai liều
lượng một số loại thuốc hoặc mẹ sử dụng thuốc có ảnh hưởng đến thính giác trong
q trình mang thai. Trong các nguyên nhân trên, yếu tố di truyền hay đột biến gen

đóng vai trị quan trọng trong sự hình thành bệnh, chiếm khoảng 50 – 70% các
trường hợp bị bệnh khiếm thính bẩm sinh và được báo cáo là có liên quan đến việc
thúc đẩy tiến trình bệnh ở người cao tuổi [2].
Khiếm thính di truyền thường được phân loại như là KT có hội chứng hoặc
KT khơng có hội chứng dựa trên sự hiện diện hoặc thiếu vắng các khiếm khuyết đi
kèm trên các hệ cơ quan khác. Khiếm thính là một trong những rối loạn với nguyên
nhân phức tạp nhất khi có đến trên 400 hội chứng liên quan [3]. Khiếm thính có hội
chứng thường chiếm dưới 30% các trường hợp khiếm thính di truyền với phổ các
hội chứng thường gặp là Pendred (cống tiền đình mở rộng, các vấn đề về tuyến
giáp), Usher (viêm võng mạc sắc tố), Waardenburg (bất thường sắc tố), và
Branchio-oto-renal (dị dạng tai và thận). Trong khi đó, khiếm thính không hội
chứng chiếm khoảng 70% các trường hợp và thường là dạng khiếm thính thần kinh
giác quan (Sensoneural HL), dạng KT do khiếm khuyết ở tai trong, tổn thương ở ốc
tai hoặc ở đường dẫn truyền thần kinh lên hệ thống thần kinh trung ương. Các dạng
khiếm thính dẫn truyền (Conductive HL) do khiếm khuyết ở tai ngoài hay tai giữa
ngăn chặn sự dẫn truyền hợp lý của âm thanh và dạng khiếm thính hỗn hợp giữa hai

Luận văn Thạc sĩ

Nguyễn Thị Diệu Ái


Trang 4

loại trên (Mixed HL), hoặc khiếm thính do thần kinh thính giác (Neural HL) có xảy
ra nhưng chiếm tỷ lệ thấp trong khiếm thính di truyền khơng hội chứng.
Đột biến gây khiếm thính di truyền gồm các dạng: đột biến lặn trên nhiễm sắc
thể thường chiếm gần 80%, đột biến trội trên nhiễm sắc thể thường chiếm gần 20%,
các dạng đột biến di truyền liên kết trên NST giới tính X và đột biến trên gen ty thể
là các đột biến hiếm chiếm tỷ lệ < 1% (Hình 1.1). Hiện nay đã có trên 150 gen được

cơng bố có liên quan đến bệnh KT di truyền. Các gen này mã hóa nhiều loại protein
liên quan đến sự phát triển và chức năng của hệ thống thính giác như nhân tố phiên
mã, protein cấu trúc, protein liên kết khe (gap-junction protein) và các kênh ion [4].
Trong đó, đột biến trên gen GJB2 có tần suất gây bệnh lớn nhất. Tiếp theo đó là các
gen như SLC26A4, GJB6, MYO7A, MYO15A, CDH23, TMC1, KCNQ4. Tuy nhiên
tần suất gây bệnh của các gen này rất khác nhau tùy theo sắc tộc. Trong sắc tộc
người Hán, đột biến bi-allelic GJB2 được báo cáo trong 19,1% bệnh nhân bị bệnh
điếc khơng hội chứng, sau đó là đột biến bi-allelic trên gen SLC26A4 với tỷ lệ
12,1% [5]. Một nghiên cứu sử dụng kỹ thuật giải trình tự thế hệ mới (Nextgeneration sequencing- NGS) trên 63 gen mục tiêu cho 1120 bệnh nhân người Nhật
cho kết quả đột biến có tần suất cao nhất là GJB2:c.235delC, được tìm thấy trong
166 allele từ 1120 bệnh nhân. Đột biến SLC26A4:c.2168A>G (p.H723R) là đột biến
phổ biến thứ hai với 53 allele được tìm thấy [6]. Gen KCNQ4, quy định protein
kênh điện thế màng tế bào K+, giữ vai trò quan trọng trong chu trình tái phục hồi
ion K+ ở tai trong và là gen phổ biến nhất quy định khiếm thính di truyền dạng trội
trên NST thường. Một nghiên cứu cho thấy đột biến trên gen này chiếm 6.6%
(19/287 gia đình) các trường hợp khiếm thính [7].

Luận văn Thạc sĩ

Nguyễn Thị Diệu Ái


Trang 5

Hình 1.1.Tần suất các nguyên nhân gây bệnh khiếm thính

Phổ các gen quy định khiếm thính di truyền rất đa dạng và đơi khi có sự trùng
lặp giữa dạng có hội chứng với khơng hội chứng, giữa dạng di truyền trội với lặn
trên NST thường. Trên 50% trường hợp KT theo kiểu di truyền lặn trên NST
thường liên quan đến gen GJB2 (Gap junction protein beta 2 hay connexin 26). Tuy

nhiên, đột biến trên gen này cũng gây các dạng khiếm thính di truyền theo kiểu trội
[3]. Gen GJB2 nằm trên nhánh dài nhiễm sắc thể 13 (13q12), có kích thước khoảng
7 kb và gồm 2 exon. Gen này mã hóa cho protein connexin 26 (Cx26), có vai trị
chủ chốt trong sự hình thành và hoạt động của ốc tai, một bộ phận quan trọng của
tai. Các đột biến trên gen GJB2 thường gây KT thần kinh giác quan bẩm sinh,
khơng tiến triển và quy định mức khiếm thính từ nhẹ đến nặng. Tuy nhiên, dạng KT
tiến triển và có tuổi phát bệnh trễ cũng được mơ tả ở các đột biến khơng thay đổi
kích thước protein [8]. Do tần suất đột biến gây bệnh cao, GJB2 đã được dùng trong
xét nghiệm chẩn đoán và là gen quan trọng đầu tiên cho chẩn đốn ngun nhân gây
khiếm thính di truyền. Xét nghiệm trên gen GJB2 có thể giải thích 50-80% các
trường hợp điếc di truyền lặn và 10-37% các trường hợp điếc không rõ nguyên nhân
[9].
Hai gen GJB3 (Gap junction protein beta 3) và GJB6 (Gap junction protein
beta 6) mã hóa protein connexin 31 và protein connexin 30 cũng đóng vai trị quan
trọng trong hoạt động của ốc tai. Protein của hai gen này phối hợp với các protein
thuộc họ connexin khác tạo thành kênh dẫn vận chuyển chất dinh dưỡng, các ion
Luận văn Thạc sĩ

Nguyễn Thị Diệu Ái


Trang 6

giữa các tế bào kế cận nhau [10]. Đột biến trên gen GJB3 thường quy định KT di
truyền lặn, liên quan đến độ tuổi, có khuynh hướng xuất hiện ở nam giới nhiều hơn
nữ giới và gây bệnh điếc thần kinh giác quan [11]. KT không hội chứng cũng xảy ra
khi có dạng đột biến phức hợp giữa một đột biến trên gen GJB2 và một đột biến
khác trên GJB6 xảy ra ở nhiều quần thể nhưng nhiều nhất là ở Hoa Kỳ [12].
Một họ protein khác đóng góp vai trị quan trọng hệ thống thính giác là
myosin. Myosin - là phân tử protein motor giữ vai trò quan trọng trong sự co cơ và

vận động, các protein này bám vào sợi actin và sử dụng hoạt động của enzyme
ATPase để tạo năng lượng cần thiết cho vận động. Myosin được mã hố bởi nhiều
gen khác nhau trong đó hai gen mã hố protein myosin chính yếu trong hệ thống
thính giác là MYO7A và MYO15A. Gen MYO7A ở người gồm 49 exons và được
biểu hiện ở võng mạc, phổi, tinh hồn, thận và lơng ốc tai (tế bào lơng giữ vai trò
chuyển đổi tất cả rung động âm thanh từ tai giữa truyền vào thành các tín hiệu điện
đi dọc theo các dây thần kinh thính giác lên tới não để được xử lý). Đột biến trên
MYO7A quy định các dạng khiếm thính bao gồm: KT khơng hội chứng, di truyền
lặn hoặc trên NST thường và hội chứng Usher. Đột biến trên MYO7A gây các dạng
Usher type 1B và type 2 có thể dẫn đến khiếm thính dạng nặng và sâu. Tuy hội
chứng Usher gây khiếm thính nhưng hội chứng này thường biểu hiện trễ nên khó
nhận biết và khó phát hiện được bởi các phương pháp sàng lọc khiếm thính sơ sinh
thơng thường [13]. Gen MYO15A gồm 66 exon, mã hóa một dạng protein myosin.
Đột biến trên gen này liên quan đến bệnh khiếm thính thần kinh giác quan không
hội chứng, gây điếc bẩm sinh. Sàng lọc đột biến trên MYO15A trong một thời gian
dài có bước tiến triển rất chậm mặc dù nó được dự đốn là nhân tố quan trọng gây
KT. Nguyên nhân là do gen này có nhiều exon với chiều dài lên đến 71kb. Các tiến
bộ gần đây của kỹ thuật NGS đã giúp phát hiện nhiều đột biến mới trên gen này
cũng như khẳng định tính gây bệnh của nó. Bằng kỹ thuật NGS và kết hợp xác nhận
lại bằng kỹ thuật giải trình tự Sanger, một nghiên cứu trên 1120 bệnh nhân người
Nhật đã phát hiện các đột biến trên gen MYO15A. Các bệnh nhân có đột biến gen
MYO15A đã được phân tích chi tiết đặc điểm lâm sàng, cho kết luận đây là gen điển

Luận văn Thạc sĩ

Nguyễn Thị Diệu Ái


Trang 7


hình gây bệnh KT khơng hội chứng, với tuổi phát bệnh từ 0 - 14. Bốn trẻ em bị
khiếm thính bẩm sinh có đột biến dị hợp tử kép mang hai đột biến khác nhau được
cấy ốc tai điện tử đã cho kết quả khả quan, cải thiện được khả năng phân biệt ngôn
ngữ. Kết quả nghiên cứu cho thấy cấy ốc tai điện tử là hữu ích cho bệnh nhân có đột
biến KT trên gen MYO15A [14].
Các kết quả nghiên cứu trên đã phát hiện các đột biến gây bệnh KT trên các
gen liên quan đến chức năng và cấu tạo hệ thống thính lực có tần suất gây bệnh cao
và khẳng định tiềm năng của xét nghiệm di truyền (XNDT), đặc biệt là kỹ thuật
NGS trong việc xác định nguyên nhân gây bệnh khiếm thính di truyền.
1.2. Chương trình tầm sốt và xét nghiệm chẩn đốn khiếm thính
Hiện nay, chương trình tầm sốt khiếm thính cho trẻ sơ sinh đã trở thành tiêu
chuẩn y tế và là chương trình quốc gia ở nhiều nước trên thế giới như Mỹ, New
Zealand, Singapore, Trung Quốc. Ở Việt Nam, năm 2007 chương trình tầm sốt
khiếm thính tại Bệnh viện Phụ sản Quốc tế Sài gòn trên 1412 trẻ sơ sinh bằng kỹ
thuật đo âm ốc tai OAE và đo điện thính giác thân não ABR cho kết quả 0,21% trẻ
bị khiếm thính. Điều tra tầm sốt ở bệnh viện Hùng Vương năm 2005 có tỷ lệ 0,2%
trẻ khiếm thính và 0,4% trẻ có nguy cơ cao [15]. Chương trình sàng lọc khiếm thính
cho trẻ sơ sinh chủ yếu dựa trên nghiệm pháp đo âm ốc tai (OAE) vì đây là phương
pháp có giá trị để đánh giá chức năng của ốc tai, dễ thực hiện, không tốn kém,
không gây đau cho trẻ và cho kết quả trong thời gian ngắn. Trẻ sau khi sinh được
kiểm tra âm ốc tai OAE hai lần nếu báo thất bại thì tiếp tục theo dõi bằng máy điện
thính giác thân não ABR (auditory brainstem response). Hai nghiệm pháp này là
tiêu chuẩn vàng xác định bệnh lý khiếm thính. Tuy nhiên, phương pháp sàng lọc
này cũng bỏ sót một số trường hợp như trẻ bị khiếm thính thần kinh thính giác
(neural HL) do tổn thương sau ốc tai hoặc kết quả sai lệch do ảnh hưởng của tiếng
động gây nhiễu, tai trẻ chưa làm sạch nước ối. Đối với trẻ nhỏ, xét nghiệm khiếm
thính có thể qua các xét nghiệm hành vi khi phản ứng lại với âm thanh và các
nghiệm pháp đo âm khách quan khác [16]. Do khiếm thính có thể tiến triển theo

Luận văn Thạc sĩ


Nguyễn Thị Diệu Ái


Trang 8

thời gian, các chương trình sàng lọc khiếm thính sơ sinh có thể bỏ qua các trẻ bị
khiếm thính tiến triển. Vì vậy, sàng lọc lặp lại tại các giai đoạn hợp lý được khuyến
cáo cho trẻ có nguy cơ.
Các liệu pháp điều trị khiếm thính hiện nay đều dựa trên nguyên nhân gây
bệnh và dạng khiếm thính mắc phải vì một khi ngun nhân gây khiếm thính được
xác nhận, nó có thể đưa đến các quyết định điều trị và hướng dẫn phòng ngừa hoặc
tư vấn di truyền. Các trường hợp khiếm thính do tổn thương ống tai hay mất chức
năng tai giữa do các vấn đề khi sinh có thể điều trị bằng phẫu thuật. Các liệu pháp
thuốc kháng sinh có thể giúp ích trong các trường hợp khiếm thính do nhiễm trùng.
Trong khi đó, bệnh nhân khiếm thính mang đột biến GJB2 có khả năng hồi phục
thính giác tốt sau khi được cấy điện cực ốc tai [17] Tuy nhiên các phương pháp
sàng lọc và chẩn đốn hiện nay lại bị hạn chế trong việc tìm kiếm căn nguyên gây
bệnh. Sự hiểu biết ngày càng cải thiện về cơ chế sinh lý bệnh học và phân tử của
bệnh khiếm thính và những tiến bộ gần đây của XNDT sẽ thúc đẩy sự phát triển của
các phương pháp điều trị và chiến lược sàng lọc mới [18]. Bên cạnh các kỹ thuật
chẩn đốn khiếm thính như đo âm ốc tai, điện áp thân não, chẩn đốn hình ảnh,
Hiệp hội Di truyền học Y khoa Hoa Kỳ (American College of Medical Genetics and
Genomics, ACMG) đã đưa ra hướng dẫn XNDT khiếm thính nhằm hỗ trợ xác định
nguyên nhân gây bệnh (Hình 1.2).

Luận văn Thạc sĩ

Nguyễn Thị Diệu Ái



Trang 9

Hình 1.2. Hướng dẫn chẩn đốn ngun nhân và đánh giá lâm sàng khiếm thính của
ACMG

1.3. Giải trình tự thế hệ mới trong xét nghiệm di truyền
Giải trình tự thế hệ mới (next-generation sequencing, NGS) là thuật ngữ mô
tả phương thức giải trình tự đồng thời và lượng lớn các đoạn ngắn nucleotide
(massively parallel sequencing). Kỹ thuật NGS được giới thiệu lần đầu tiên vào
năm 2005, dựa trên phương pháp giải trình tự pyrosequencing bởi 454 Life Science
(Roche) [19]. Đến nay NGS đã phát triển trên các nền tảng khác nhau như 454
sequencing, Illumina, SoliD, PacBio sử dụng các nguyên lý khác nhau với những
đặc điểm đặc trưng của quy trình chuẩn bị thư viện DNA, phương thức giải trình tự
và phân tích kết quả. Nền tảng 454 sequencing dựa theo nguyên lý pyrosequencing,
là kỹ thuật giải trình tự dựa vào quá trình tổng hợp mạch DNA, khi một nucleotide
được gắn vào mạch đang phát triển thì một nhóm pyrophosphate được giải phóng,

Luận văn Thạc sĩ

Nguyễn Thị Diệu Ái


Trang 10

nhóm pyrophosphate này tham gia vào phản ứng hóa học để tạo ra tín hiệu ánh sáng
đèn flash và được đo bởi một detector quang học. SoliD là một nền tảng phổ biến
khác sử dụng nguyên lý nối ligase (sequencing by ligation). Nền tảng này sử dụng
các đoạn mẫu dị gồm 8 nucleotied trong đó có 2 nucleotide ở đầu 3’ được đánh dấu
theo kiểu bổ sung với nhau để khóa đi phát huỳnh quang phía 5’. Sau khi phản

ứng nối diễn ra, đuôi phát huỳnh quang được giải phóng bởi phản ứng cắt 3
nucleotide cuối tạo ra một màu nhận biết theo bảng mã màu được thiết lập từ đầu.
Phản ứng cứ thế lặp lại với các đoạn bắt cặp khác cho đến hết chiều dài của đoạn
DNA với mồi đầu tiên chiều dài n. Sau đó bắt đầu chu trình mới lần lượt với các
mồi trên nhưng có chiều dài là n-1, n-2, n-3, n-4 tức là tồn bộ q trình giải trình tự
ta sử dụng tất cả là 5 mồi: n, n-1, n-2, n-3, n-4. PacBio là nền tảng sử dụng cơng
nghệ giải trình tự DNA đơn phân tử theo thời gian thực (Single molecule real-time
sequencing, SMRT). SMRT “quan sát” quá trình tổng hợp một chuỗi DNA mới của
DNA polymerase, xác định chính xác nucleotide nào trong 4 loại nu đang được gắn
vào mạch, và như thế khi đoạn DNA được sao chép xong thì máy cũng xác định
xong trình tự đoạn DNA đó. Đó là lý do tại sao nó có tên gọi giải trình tự DNA đơn
phân tử theo thời gian thực. Nanopore sequencing là phương thức giải trình tự mới
nhất hiện nay dựa trên sự dịch chuyển của DNA qua lỗ sinh học (pore), một hệ
thống gồm α-hemolysin gắn với một exonuclease trên bề mặt ngồi và cảm biến
cyclodextrin bên mặt trong, trình tự DNA được đọc dựa trên sự thay đổi dòng điện
hoặc tính hiệu quang học khi DNA dịch chuyển qua pore bị exonuclease cắt đứt
thành các nu riêng rẻ [20].
Mặc dù sự phát triển của kỹ thuật NGS đã mang đến những công nghệ mới,
Illumina hiện vẫn dẫn đầu trong cơng nghệ NGS hiện nay do có kết quả đầu ra cao
nhất, chi phí trên mỗi base thấp nhất và tương thích với hầu hết mọi ứng dụng [21].
Illumina giải trình tự dựa trên phương thức tổng hợp (sequencing by synthesis). Mỗi
thế hệ máy khác nhau sử dụng các chiến lược giải trình tự khác nhau. Với hệ máy
MiniSeq được sử dụng trong đề tài, DNA sẽ được giải trình tự 2 mạch ngược và
xuôi (kỹ thuật paired-end). DNA sẽ phải trải qua quá trình chuẩn bị thư viện, đây là

Luận văn Thạc sĩ

Nguyễn Thị Diệu Ái



Trang 11

quá trình xử lý và làm giàu DNA mục tiêu để chuẩn bị cho quá trình giải trình tự
trên máy MiniSeq. Ở quy trình này, DNA mục tiêu được cắt ngẫu nhiên thành các
đoạn dài ngắn khác nhau, sau đó đoạn DNA được xử lý để gắn adapter ở 2 đầu 5’ và
3’. Sản phẩm sau đó được tinh sạch và làm giàu bằng PCR, quá trình làm giàu sẽ
đồng thời gắn barcode, trình tự primer P7 (i7) ở đầu 3’ và trình tự primer P5 (i5) ở
đầu 5’ (Hình 1.3). Barcode (Index) là trình tự gồm 8 nucleotide dùng để phân biệt
các mẫu khác nhau, primer i5 và i7 sẽ dùng cho giải trình tự 2 mạch.

Luận văn Thạc sĩ

Nguyễn Thị Diệu Ái


Trang 12

Hình 1.3. Quy trình chuẩn bị thư viện cho giải trình tự NGS

Ở giai đoạn giải trình tự, máy sẽ thực hiện tiến trình tạo các cluster dựa trên
nguyên lý của PCR. Với tiến trình này, những chu kỳ lặp lại sẽ tạo ra hàng triệu
cluster, mỗi cluster chứa hàng nghìn bản sao của một đoạn DNA trên một đơn vị có
đường kính 1 µm. Tiến trình giải trình tự được bắt đầu sau đó dựa trên nguyên lý
tổng hợp 4 loại deoxyribonucleotide triphosphates (A, C, G, T) gắn màu huỳnh
quang vào mạch khuôn nhờ enzyme xúc tác DNA polymerase. Tại mỗi chu kỳ, tín
Luận văn Thạc sĩ

Nguyễn Thị Diệu Ái



Trang 13

hiệu huỳnh quang phát ra khi có một nucleotide gắn vào đầu 3’OH của chuỗi
nucleotide đang được tổng hợp được máy chụp ảnh và ghi nhận lại kết quả (Hình
1.4). Mỗi đoạn trình tự nucleotide được giải tạo ra một chuỗi ký tự 150 bp gọi là
một read. Kỹ thuật giải trình tự pair-end sẽ đọc trình tự mạch xi trước tạo thành
các read đầu tiên, sau đó sẽ đọc trình tự mạch ngược để tạo read thứ hai. Các read sẽ
được sắp xếp gióng cột trên trình tự gen tham chiếu chuẩn để gọi biến thể nhờ vào
các cơng cụ tin sinh học.

Hình 1.4. Tiến trình giải trình theo nguyên lý tổng hợp trên máy Illumina

Với dữ liệu đầu ra cao nhờ chiến lược giải đồng thời lượng lớn trình tự, giải
trình tự NGS có thể giải 1 GB bp trong vòng 0,5 ngày trong khi Sanger phải mất
Luận văn Thạc sĩ

Nguyễn Thị Diệu Ái


×