VIỆN CÔNG NGHỆ SINH HỌC
BÁO CÁO TỔNG KẾT ĐỀ TÀI
XÂY DỰNG NGÂN HÀNG DỮ LIỆU HỆ PROTEIN
HUYẾT THANH NGƯỜI VIỆT NAM ĐỂ ĐỐI PHÓ CHẨN ĐOÁN
BỆNH ĐÁI THÁO ĐƯỜNG TYPE 2 VÀ UNG THƯ
CNĐT: PHAN VĂN CHI
8315
HÀ NỘI – 2011
1
BÁO CÁO TỔNG KẾT ĐỀ TÀI
MỞ ĐẦU
Hiện nay, các nghiên cứu về y sinh học hiện đại, triển khai các kỹ thuật proteomics trong
tìm kiếm các biomarker có khả năng ứng dụng trong việc phát hiện, chẩn đoán và điều trị
các bệnh nan y đang là mối quan tâm của các nhà khoa học trên thế giới và Việt Nam.
Biomarker không đòi hỏi các bước nghiên cứu nhiều thử thách như trong truy tìm gen liên
quan đến bệnh lý, hay như việc tạo những sản phẩm protein trị liệu, vaccine thường đòi h
ỏi
kỹ thuật cao, công phu và tốn kém. Trang bị chính của nghiên cứu biomarker là các thiết bị
phân tách, làm sạch và nhận dạng, xác định các protein/proteome (hệ máy khối phổ phân
giải cao cộng với khả năng sử dụng những chương trình điện toán về proteomics) hiện đã
được thiết lập ở một số cơ sở nghiên cứu. Hơn nữa, chúng ta có những lợi điểm không chỉ
về số lượ
ng mẫu phẩm dồi dào của các loại bệnh, mà còn dồi dào các dữ kiện lâm sàng
trong việc đánh giá khả năng ứng dụng các biomarker trong trị liệu. Đây là những yếu tố
cần thiết cho thống kê để thu đựơc những biomarker có độ chính xác cao qua việc xác định
cũng như loại trừ các protein trong nhóm biomarker. Điểm đặc biệt nữa là giá trị đặc thù của
biomarker có thể có liên quan đến “dấu ấn” sinh học của ch
ủng tộc. Các dấu ấn này cũng sẽ
là chủ đề quan trọng cho những nghiên cứu y học từ nguyên nhân bệnh lý cho đến tác động
môi trường, cũng như dược học trong việc tìm kiếm hay thẩm định tính trị liệu của các dược
phẩm ở Việt Nam. Với những kỹ thuật và các kết quả bước đầu thu nhận được trong thời
gian vừa qua của các cán bộ Viện Công nghệ sinh họ
c, Viện Khoa học và Công nghệ Việt
Nam trong nghiên cứu hệ protein huyết thanh người Việt Nam bằng các kĩ thuật proteomics
có thể được coi là tiền đề cho các nghiên cứu tiếp theo về mối quan hệ giữa các marker
protein liên kết với một số bệnh lý trong chẩn đoán lâm sàng. Đó cũng chính là mục đích
của các nghiên cứu về hệ protein người nói chung và hệ protein huyết thanh người nói riêng,
là tìm hiểu bức tranh tổng thể của các protein được biể
u hiện, có thêm hiểu biết về các biến
đổi của hệ protein trong các trạng thái bệnh lý và khả năng khai thác, sử dụng những thay
đổi này như các công cụ chẩn đoán hoặc điều trị các bệnh cho con người. Trên cơ sở những
trang thiết bị khá đồng bộ và hiện đại về proteomics được đầu tư theo Dự án “Phòng thí
nghiệm Trọng điểm Công nghệ Gen” tại Viện Công nghệ Sinh học, Vi
ện KH&CN Việt
Nam và những kết quả nghiên cứu bước đầu về xác lập các phương pháp phân tích
protein/proteome, tìm kiếm các chỉ thị protein trong huyết thanh người trong thời gian qua,
chúng tôi đã được phê duyệt đề tài “Xây dựng ngân hàng dữ liệu hệ protein huyết thanh
người Việt Nam để phối hợp chẩn đoán bệnh đái tháo đường type 2 và leukemia” giai
đoạn 2008-2010 với mục đích nghiên cứu có hệ thống hệ protein huyết thanh người Việ
t
Nam ở trạng thái bình thường và các trạng thái bệnh ĐTĐT2, leukemia, tìm những protein
có biến đổi đặc trưng cho các trạng thái bệnh có thể phát triển thành các chỉ thị chẩn đoán
bệnh.
2
Mục tiêu của đề tài
9 Phân tích, xây dựng ngân hàng dữ liệu hệ protein huyết thanh người Việt Nam bình
thường và một số trạng thái bệnh lý (đái tháo đường type 2, leukemia, ) bằng các
kỹ thuật proteomics và bioinformatics;
9 Nhận dạng và xác định các ứng viên chỉ thị protein có biến đổi về cấu trúc và chức
năng liên quan đến sự phát sinh và phát triển của bệnh đái tháo đường type 2 và
leukemia ở Việt Nam;
9 Nghiên cứu khả năng ứng dụng các chỉ th
ị protein trong phối hợp chẩn đoán bệnh
đái tháo đường type 2 và leukemia.
Nội dung chính của đề tài
9 Phân tích, xây dựng ngân hàng dữ liệu hệ protein huyết thanh người Việt Nam bình
thường và một số trạng thái bệnh lý (đái tháo đường type 2 và leukemia…) bằng các
kỹ thuật proteomics và bioinformatics
9 Phân tích, nhận dạng và xác định các ứng viên chỉ thị protein (protein markers
candidates) đối với bệnh đái tháo đường type 2 và leukemia
9 Thử nghiệm ứng dụng các ứng viên chỉ thị protein trong chẩn đoán
3
PHẦN I. TỔNG QUAN TÀI LIỆU
Tại sao phải nghiên cứu hệ protein (proteome)?
Thách thức chính hiện nay đối với những nhà sinh vật học là sử dụng sự phong phú về
thông tin di truyền sẵn có từ chương trình xác định trình tự gen không phải chỉ để giải mã
trình tự các acid amin của những protein được mã hóa mà còn là xác định những chức năng
của chúng. Có rất nhiều nhân tố có ảnh hưởng đến gen, sự biểu hiện của protein và cả trực
tiếp đến protein. Vì thông tin giữa gen và protein là hai chiều, kiểu hình (phenotype) của t
ế
bào bị ảnh hưởng bởi những tương tác giữa các quá trình chuyển hoá được điều chỉnh một
cách thống nhất bên trong tế bào. Protein là đầu ra về chức năng của tế bào và do đó có thể
cho biết những thông tin thích đáng nhất, đặc biệt khi giải thích về sự biểu hiện của chúng
có tính đến động học trong ngữ cảnh của các quá trình hóa sinh đặc biệt. Sự biểu hiện hoặ
c
chức năng của protein được điều hoà ở tại nhiều thời điểm, từ phiên mã đến dịch mã và sau
dịch mã. Các quá trình này, nói chung đều không thể dự đoán được từ kết quả phân tích
trình tự gen. Sau dịch mã, đa phần các phân tử protein lại bị biến đổi hoá học bởi các tương
tác protein-protein hay các phản ứng với các nhóm carbohydrate, phosphate Chính những
biến đổi này (post-translational modifications, PTMs) đóng vai trò chủ yếu trong kích hoạt
chức n
ăng của nhiều protein chứ không phải được mã hoá trực tiếp từ gen. Kết quả là từ một
gen ban đầu ta có thể tìm thấy sự đa dạng về biểu hiện, cấu trúc và chức năng của rất nhiều
loại protein khác nhau. Ở các cơ thể khác nhau, mức độ đa dạng này cũng khác nhau.
Những nghiên cứu sơ bộ cho thấy, từ một gen có thể phát sinh từ một tới hai protein trong
vi khuẩ
n, ba trong nấm men, và tới hơn sáu ở người (Wilkins MR et al, 1996; Banks RE et
al, 2000; Tyers M and Mann M, 2003). Trên cơ sở số gen đã phát hiện và các khả năng biến
đổi sau dịch mã, người ta cũng đã ước tính trong cơ thể người có tới một triệu protein cần
được nghiên cứu (Banks RE et al, 2000; Jensen ON, 2004). Từ sự phân tích trên ta có thể
thấy, mặc dù proteome là bổ trợ của genome, đây vẫn là hai khái niệm khác nhau cả về
không gian và thời gian. Khi trình tự của gen không thể cho biế
t các thông tin về các biến
đổi sau phiên mã có ảnh hưởng và quyết định đến chức năng và hoạt tính của protein thì
mức độ biểu hiện gen không thể phản ánh đúng về số lượng protein có hoạt tính trong tế
bào. Thực ra cũng chỉ có khoảng 2% số bệnh tật đã biết được xác định là do có các sai lệch
về trình tự gen, hay còn được coi là monogenic (Strohman R, 1994); 98 % số bệnh còn lại
cần được làm sáng tỏ ở mức tương tác gi
ữa các protein, hay còn gọi là mạng protein
(protein network) (Ideker T et al, 2008 ). Bài toán đặc biệt quan trọng này của proteomics sẽ
bao gồm cả việc xác định các PTMs và vai trò của chúng trong các quá trình điều hoà và t-
ương tác protein-protein. Nghiên cứu về proteome chính là nghiên cứu trực tiếp về chức
năng của genome, và do đó có thể trả lời được các câu hỏi sau: (i) phần nào của genome đư-
ợc biểu hiện; (ii) ở đâu, khi nào và có bao nhiêu sản phẩm được biểu hiện; (iii) các sản
phẩm protein bị biế
n đổi như thế nào và (iv) các sản phẩm có những tương tác gì và kết quả
của những tương tác này là gì. Bộ gen là tập hợp các thông tin mã hoá và chỉ dẫn cho quá
trình tạo ra các protein, còn proteome thì phức tạp hơn nhiều. Dựa trên sự phân loại các
vùng (domain) có liên quan đến các chức năng của các protein, Venter và các cộng sự
4
(Venter JC et al, 2001) đã tiến hành dự đoán và phân chia tỷ lệ của các sản phẩm protein có
thể có từ hệ gen người (Nanni L et al, 2010).
Cho đến nay chưa có thể xác định chính xác liệu có bao nhiêu loại protein có thể có trong
mỗi tế bào người. Những công bố gần đây nhất cho thấy, đã có thể xác định và chú giải cho
21 037 trình tự protein từ bộ gen người (Imanishi T et al, 2004). Cùng với sự phát triển của
các kỹ thuật proteomics, ngày càng có thêm nhiề
u các loại protein được nhận dạng và xác
định, bổ trợ cho các trình tự đã công bố của bộ gen. Ví dụ, trong huyết thanh người, nếu như
năm 2002 chỉ mới phát hiện được 490 loại protein khác nhau (Adkins JN et al, 2002) thì
những công bố năm 2004 cho thấy con số này đã là 1.444 (Chan KH et al, 2004) và gần đây
nhất, năm 2005, theo kết quả xác định và so sánh của 35 phòng thí nghiệm trong dự án
proteome huyết tương người của HUPO, con số này đã có thể là 3.020 (Omenn GS
et al,
2005).
Lượng thông tin phong phú do các nghiên cứu về proteome đem lại hoàn toàn bổ trợ cho
những thông tin di truyền từ những nghiên cứu về genome. Proteomics sẽ là cơ sở cho sự
phát triển của genomics chức năng. Sự phối hợp giữa genomics, proteomics và
bioinformatics sẽ đóng vai trò chủ đạo trong những nghiên cứu về sinh-y học, là nền tảng
cho sự phát triển các sản phẩm chẩn đoán và chữa bệnh trong tương lai. Chỉ ngoại trừ
một
số bệnh di truyền, mà gen đóng vai trò quan trọng trong chẩn đoán, phần lớn các bệnh mãn
tính như ung thư, tim mạch, đái tháo đường đều liên quan đến mức độ biểu hiện, hoạt
động và tương tác giữa các protein (Kristine AP et al, 2009). Như vậy, dấu ấn sinh học
(biomarker) hay còn được gọi là “chữ ký” (signature) trong các trường hợp này chính là
những chỉ thị protein, những phân tử không chỉ mang bí ẩn về các quá trình bệnh lý, mà còn
có thể mang tính đặ
c thù, liên quan tới nhiều yếu tố, bao gồm cả vấn đề chủng tộc và sinh
thái. Việc truy tìm các chữ ký sinh học này sẽ giúp đạt được những kết quả có tầm ứng dụng
hữu hiệu và lớn lao trong y học. Nghiên cứu biomarkers sẽ giúp tạo được những mô hình
phân tử về bệnh lý có khả năng khảo sát được bằng những thí nghiệm cụ thể, qua đó có thể
xác định được vai trò của gen và s
ản phẩm của nó cho chẩn đoán và trị liệu. Theo xu hướng
phát triển của các bộ môn Genomics, Proteomics và Bioinformatics, hiện đã có một mạng
lưới liên kết các phòng thí nghiệm nhằm tiến đến tạo dựng một kho dữ liệu (consortium) các
biomarker cho các bệnh lý và các đề tài sinh học khác
( />).
Trên cơ sở đánh giá tình hình nghiên cứu, phân tích những công trình nghiên cứu có liên
quan có thể thấy, proteomics thật sự đã làm thay đổi rất nhiều trong sinh học và các ngành
liên quan. Nhờ có các khái niệm mớ
i về proteomics, sự sống của các phiên bản genome tĩnh
lặng đã thật sự trở thành những proteome năng động. Việc nghiên cứu proteome-tập hợp các
protein được biểu hiện bổ trợ của hệ gen và cũng là của một mô hay một kiểu tế bào, sẽ giúp
thu được những thông tin bổ sung hữu ích cho những kiến thức mới hỗ trợ cho những
nghiên cứu chẩn đoán và lâm sàng. Đây cũng chính là cách ti
ếp cận để tìm kiếm các
biomarkers, “chữ ký” hay còn được coi là một nhóm gene hay protein của một hiện
tượng/dữ kiện sinh học. Biomarker đã là một trong những nghiên cứu trọng yếu của sinh
5
học hiện đại trong những năm qua, và đã có những kết quả cho thấy tầm quan trọng và
tương quan lớn lao của biomarker trong rất nhiều ngành của bộ môn Sinh-Y- Dược học. Từ
các công trình nghiên cứu biomarker ở nhiều trung tâm nghiên cứu, đã có những thành quả
hứa hẹn những ứng dụng rất tốt đẹp của biomarker cho việc chẩn đoán bệnh và trị liệụ. Việc
ứng dụng biomarker để
hoàn chỉnh hoặc thay thế các thử nghiệm thường quy sẽ chỉ còn là
vấn đề thời gian. Những biomarker này nhằm giúp tiên đoán sớm và chính xác các trường
hợp bệnh lý từ ung thư đến tim mạch, đái tháo đường…; biomarker còn có giá trị tiên đoán
hiệu ứng của thuốc để giúp các chuyên gia y tế lấy quyết định đúng đắn nhất cho việc điều
trị bệnh nhân. Đi xa hơn nữa, biomarker có tiềm năng trong
ứng dụng liệu pháp trị liệu cá
nhân (personalized medicine).
Như đã nêu trên, nền tảng của nghiên cứu biomarker dựa trên các protein, vì thế vai trò của
nghiên cứu proteomics là thiết yếu. Tuy nhiên, số lượng lớn lao (dự đoán khoảng có từ
300.000 đến 500.000 protein), và đặc biệt là bản chất phức tạp của protein là một trở ngại
lớn cho các nghiên cứu biomarker. Theo các tài liệu nghiên cứu, hiện đã có khoảng gần
1500 ứng viên proteins được coi là có liên quan đến ung thư và đươ
ng nhiên là việc tiêu
chuẩn hóa các protein này là cần thiết để chọn lọc những protein thực sự có gía trị ứng
dụng. Hơn nữa, thực tế đòi hỏi phải có những thử nghiệm lâm sàng chi tiết và cũng có thể
dài hạn, trước khi triển khai các biomarker thành sản phẩm có giá trị trong cộng đồng xã hội
(Polanski M, Anderson NL, 2006; Austin MJF, Babiss L, 2006).
Huyết thanh là một hệ protein đặc biệt trong chẩn đoán bệnh, cách tiếp cận
Sự hấp dẫn của huyết thanh đối với việc chẩn đoán bệnh được quyết định bởi hai đặc
trưng: (i) mẫu có thể lấy dễ dàng và an toàn, (ii) mẫu không chỉ phản ánh toàn diện
phenotype người, mà còn cho biết trạng thái của cơ thể ở tại một thời điểm đặc biệt nào. Có
thể phân các protein trong huyết thanh thành các nhóm: (1) Các protein được tiết ra từ các
mô. Đó là các protein phần lớn đượ
c tiết ra từ gan, ruột và có khối lượng phân tử lớn hơn 45
kDa, lớn hơn kích thước các phân tử có thể lọc qua thận. Chính vì vậy, chúng có thể kéo dài
thời gian lưu hành trong huyết thanh; (2) Các globulin miễn dịch. Đó là các kháng thể hoạt
động chủ yếu trong huyết tương, đại diện cho một lớp protein phức tạp nhất. Đã có những
ước tính cho rằng phải có tới hàng triệu trình tự của các kháng thể khác nhau lưu hành trong
h
ệ tuần hoàn của một người trưởng thành (Anderson NL, & Anderson NG, 2002); (3) Liên
kết thụ cảm “khoảng cách xa”. Trong nhóm protein này gồm các peptide ”cổ điển” và
những protein hormone (ví dụ như insulin, erythropoietin ; (4) Liên kết thụ cảm “địa phư-
ơng”. Loại này bao gồm các cytokine và những tác nhân điều hòa ở khoảng cách ngắn. Đây
thường là các peptide có trọng lượng phân tử nhỏ, dễ dàng bị lọc qua thận. Bởi vậy, chúng
chỉ lưu hành trong thời gian ngắ
n ở huyết tương và có vẻ như được thiết kế để làm trung
gian cho tương tác giữa các tế bào, sau đó được hoà loãng vào trong huyết tương; (5) Các
“hành khách” tạm thời. Đó là những protein không phải hormone, tạm thời lưu thông trong
huyết tương trên đường chuyển động tới vị trí hoạt động của chúng. Ví dụ, các protein từ
lysosome được tiết ra và sau đó qua một hệ thụ cảm (receptor) được tập hợp trong những
th
ể tiêu bào; (6) Các sản phẩm phát sinh từ các mô. Đó là những protein hoạt động bình
6
thường ở các tế bào/mô, nhưng có thể được giải phóng vào huyết tương sau khi các tế bào bị
chết hoặc bị tổn thương. Các protein này bao gồm nhiều loại marker quan trọng như
troponin, creatine kinase, hoặc myoglobin (đang được sử dụng trong chẩn đoán bệnh nhồi
máu cơ tim); (7) Các protein tiết ra do bị lỗi. Những protein này được giải phóng từ những
khối u hoặc mô bị bệnh. Đó có thể là những marker ung th
ư mà cũng có thể là những
protein bình thường, được các tế bào khối u biểu hiện, tiết ra, hoặc được giải phóng vào
trong huyết tương; (8) Các protein ngoại lai. Đó là những protein của những cơ thể lây
nhiễm (vi sinh vật) hoặc các ký sinh được giải phóng và lưu hành trong hệ tuần hoàn. Sự
hiện diện của những lớp protein kể trên cho thấy sự đa dạng rất đáng ngạc nhiên của hệ
proteome huyế
t thanh. Câu hỏi là: có bao nhiêu protein có mặt trong huyết thanh? Nếu tính
rằng mỗi loại protein huyết thanh lại có chừng 10 đến 20 dạng glycosyl hoá với khoảng 5
kích thước khác nhau, thì tổng số sẽ phải có ít nhất khoảng 50 000 dạng phân tử protein
khác nhau. Ngoài ra, phải kể đến một nhóm khá lớn các protein được hình thành và tiết từ
các mô trên cơ sở số gen đã được xác định trong bộ gen người (25 000 – 30 000) và số sản
phẩm protein có thể được phát sinh từ mỗi gen (khoảng 10 protein/gen). Như
vậy, về mặt
nguyên lý, huyết thanh là một proteome khá toàn diện và cũng là phiên bản lớn nhất. Sử
dụng huyết thanh trong chẩn đoán bệnh là một cách tiếp cận hiển nhiên, được tiến hành
thành công trong mấy thập niên qua (Burtis CA & Ashwood ER, 1999; Lembo AJ et al,
2009; Magni F et al, 2010). Tuy nhiên, tiềm năng của cách tiếp cận ”trực tiếp” này không
phải lúc nào cũng dễ được xác định. Thách thức lớn nhất trong nghiên cứu proteome huyết
thanh người không chỉ ở số l
ượng quá lớn các protein (>10 000 loại) có mặt trong đó, mà
còn là tỷ lệ về hàm lượng quá chênh lệch của chúng (10
12
). Chỉ một nhóm nhỏ các protein
như albumin, alpha2-macroglobulin, transferin và immunoglobulin đã chiếm tới hơn 80 %
lượng protein tổng số của huyết thanh gây trở ngại cho việc ứng dụng kỹ thuật 2-DE truyền
thống (Tirumalai RS et al., 2003; Zhang R et al, 2004, Sarker M, Hanumanthu G & Pandey
A, 2007). Để có thể tiến hành những phân tích hữu hiệu, thông thường những protein có
nồng độ quá cao thường phải được loại bỏ, nhưng khi thực hiện kỹ thuật này hàng loạt các
protein quan trọng có nồng
độ thấp (ví dụ, cytokine) cũng có thể bị loại mất theo. Những
công bố gần đây đã cho thấy, số lượng các protein phân tích được bằng phương pháp khối
phổ cũng phụ thuộc rất nhiều vào các kỹ thuật xử lý và tách chiết ban đầu đối với các mẫu
huyết thanh (Anderson NL & Anderson NG, 2002; Adkins JN et al, 2002; Celis JE et al,
2004; Tirumalai RS et al, 2003; Diamandis EP, 2007). Cũng vì các lý do kể trên, việc chọn
và kết hợp sử dụng hợp lý các ph
ương pháp, đặc biệt là các phương pháp có độ nhạy và
chính xác cao như sắc ký lỏng đa chiều (MDLC) và điện di trên gel kết hợp với các hệ khối
phổ liên tiếp (MALDI và ESI-MS/MS) có độ nhạy và phân giải cao, có thể tự động phân
tách, nhận diện và xác định tổng thể, bao gồm cả những protein/peptide ở nồng độ thấp
(fmol) dựa trên các Ngân hàng dữ liệu Gen và Protein NCBInr và MSDB là hết sức quan
trọng trong phân tích và tìm kiếm các marker chẩn đoán trong huyết thanh. M
ột điểm đáng
chú ý là khi nghiên cứu hệ protein huyết thanh bằng hệ LC-MS/MS cho thấy khả năng phân
tích và nhận diện khá toàn diện không chỉ về thành phần, mà còn những biến đổi có thể về
cấu trúc và tương tác của nhiều loại protein. Cũng chính vì vậy, những nghiên cứu với các
cách tiếp cận tương tự có thể giúp tìm kiếm những protein marker đích thực cho việc giải
7
thích các cơ chế bệnh sinh, chẩn đoán và đánh giá tác động của thuốc. Sử dụng cách tiếp
cận và các phương pháp như mô tả trên sẽ cho phép thấy được bức tranh về tương tác
của cả tập hợp các chỉ thị protein có nguồn gốc từ các các mô khác nhau, có liên quan
đến quá trình phát sinh và phát triển của bệnh lý, đề xuất phương pháp chẩn đoán đúng,
loại trừ những sai sót do chỉ dựa trên những chỉ
thị đơn lẻ (Diamandis EP, 2004; Hortin
GL et al, 2006; Horin GL, 2007). Đây cũng là một trong những nội dung và mục đích
nghiên cứu chính của Dự án Proteome Huyết tương Người (Human Plasma Proteome
Project) hiện được coi là một trong những dự án quan trọng nhất của Tổ chức Nghiên cứu
Proteome Người (Human Proteome Organization, HUPO, ; và Asia
and Oceania Human Proteome Organization, AOHUPO, ) với sự
tham gia của hàng chục phòng thí nghiệm proteomics hàng đầu trên thế giới. Cũng cần phải
nói thêm, mặc dù HUPO mới chỉ hoạt đông từ 2001, như
ng đã đạt được nhiều thành tựu
trong phối hợp giữa các thành phần nhà nước và tư nhân, đã nỗ lực tạo dựng sự hợp tác có
hiệu quả của một thế hệ mới các nhà khoa học nghiên cứu proteomics, xây dựng nền tảng
vững chắc về proteomics, mang lại trật tự mới trong nghiên cứu hệ protein trong tế bào, thúc
đẩy những nghiên cứu và sự phát triển của liên ngành Sinh-Y-Dược học. Nế
u các hội nghị
quốc tế HUPO thường niên lần 1-3 (Versailles 2002, Montreal 2003, Bejing 2004) chỉ chủ
yếu giới thiệu các kết quả về giải mã hệ gen, thì hội nghị HUPO lần 4 (Munich 2005) đã tập
trung chủ yếu vào chức năng của hệ gen (From Defining the Proteome to Understanding
Function), còn tiêu đề của hội nghị HUPO lần 5 (California 2006) đã là áp dụng những
nghiên cứu từ phòng thí nghiệm phục vụ người bệnh (Translating Proteomics from Bench to
Bedside), và từ hội nghị HUPO lần 6 (Seoul 2007) là phát triển công ngh
ệ và ứng dụng các
biomarkers (Proteomics: from Technology Development to Biomarkers Applications).
Nghiên cứu proteomics đối với đái tháo đường type 2
Mặc dù, cơ chế phân tử của sự phát triển bệnh đái tháo đường (ĐTĐ) và các biến chứng của
chúng đã được nghiên cứu nhiều, những hiểu biết để phát hiện giai đoạn sớm của ĐTĐ còn
hạn chế. Việc triển khai các kỹ thuật sinh học phân tử đã mở ra một hướng mới để tìm hiểu
quá trình phát triển bệnh cũng như
chẩn đoán bệnh ở giai đoạn sớm. Bằng cách sử dụng các
kỹ thuật genomic các nhà khoa học đã tìm ra một số gen được coi lá có liên quan đến bệnh
ĐTĐ type 2 như: PPARγ (Peroxisome Proliferator Activated Receptorγ) (Yael R et al,
2010), IRS-1 (insulin receptor substrate 1) (Bishop JR et al, 2010), KCJN11 (potassium
inward rectifier 6.2) (
Winkler M et al, 2009), SLC2A1 (glucose transporter 1), PPARGC-1
(PPARγ -coactivator-1) (Joly E et al, 2009) và CAPN10 (calpain 10), TCFL2 (transcription
factor 7-like 2) (Chauhan G et al, 2010; Dennis T et al, 2010). Năm 2005, một tổ chức
nghiên cứu ĐTĐ ở Madras khi nghiên cứu đa hình gen k121Q nhận thấy chúng có vai trò
quan trọng với sự phát triển của bệnh ĐTĐ type 2 ở các tộc người châu Âu và Á (Abate N
et al, 2005). Mohan và cộng sự khi nghiên cứu trên nhóm người Ấn Độ và Châu Âu cũng đã
tìm thấy sự liên quan của đa hình alen A Thr394Thr (G-A) ở gen PCG-1 với ĐTĐ type 2
(Vimaleswaran KS et al
, 2005). Ngoài ra, khi nghiên cứu mức độ biểu hiện của các gen ở
các bệnh nhân ĐTĐ type 2, Rao cùng cộng sự đã chỉ ra gen PBCs biểu hiện tăng trong máu
của các bệnh nhân này, đồng thời ông cũng cho thấy mức độ biểu hiện gen lipoprotein
8
lipase (LPL) và Apolipoprotein C – III (APOC III) có sự khác nhau ở những người bị ĐTĐ
type 2 và hội chứng tăng lipid (Rao PV et al, 2005). Những nghiên cứu này mở ra triển
vọng cho các nhà khoa học trong việc kiểm tra cơ chế gây bệnh và khả năng chỉ thị của các
gen này trong việc chẩn đoán bệnh ĐTĐ type 2.
Với sự phát triển của các kỹ thuật proteomic, những biểu hiện của ĐTĐ type 2 cũng được
nghiên cứu ở mức độ protein (Hongfang L et al, 2010). Ngay từ năm 1996, Rema cùng cộng
sự cho thấy mức độ biểu hiện của haptoglobulin huyết thanh tăng lên ở các bệnh nhân ĐTĐ
type 2 so với mẫu đối chứng (Rema M, Mohan V, Snehalatha C, 1996). Năm 2004, Zhang
và cộng sự bằng cách sử dụng 2DE kết hợp khối phổ đã chỉ ra mức độ biểu hiện của các
protein như haptoglobulin, complement component 3, complement component 4, alpha2-HS
glycoprotein, Alpha-1B-glycoprotein, Alpha-1-antichymotrypsin, Apolipoprotein-AI,
Apolipoprotein B100, Factor H, Pro-platelet basic protein, Serine (hoặc cysteine) proteinase
Inhibitor clade A, Serine (hoặc cysteine) proteinase Inhibitor clade C, Vitronectin precursor,
Fibronectin, C1 inhibitor, Alpha-2 macroglobulin có sự
thay đổi ở bệnh nhân ĐTĐ type 2
(Zhang R et al, 2004). Khi nghiên cứu hệ protein của nước tiểu bằng cách sử dụng các
phương pháp proteomic, Jain và cs đã tìm thấy sự biểu hiện đặc biệt của 4 protein, chỉ thị
của ĐTĐ type 2: zinc alpha-2 glycoprotein, alpha-1 acid glycoprotein, alpha-1
microglobulin và IgG (Jain S et al, 2005) và năm 2009, Jiang H cùng cộng sự đã chứng
minh rằng protein E-cadherin trong nước tiểu cũng được coi là chỉ thị cho ĐTĐT2 (Jiang H
et al, 2009). Nghiên cứu gần đây nhấ
t của một nhóm các nhà khoa học người Ấn Độ trên hệ
proteome nước tiểu cho thấy khi so sánh mức độ biểu hiện của protein nước tiểu ở các bệnh
nhân ĐTĐ bệnh thận so với ĐTĐ không mắc bênh thận bằng 2 DE đã chỉ ra 7 protein có
mức độ biểu hiện tăng lên hơn 1,5 lần ở:
1B
-Glycoprotein tăng 7 lần, zinc-
2
-glycoprotein
(5.9 lần),
2
-HS-glycoprotein
(4.7 lần), vitamin D–binding protein (VDBP) (4.8 lần),
calgranulin B (3.9 lần),
1
-antitrypsin (A1AT) (2.9 lần), và hemopexin (2.4 lần ). Đặc biệt
so sánh với các mẫu đối chứng người ta còn nhận thấy VDBP
tăng 11.1 lần, zinc-
2
-
glycoprotein
(6.0 lần),
2
-HS-glycoprotein precursor (2.3 lần), và A1AT
(2.2 lần). Và 4
protein có mức độ biểu hiện giảm dưới 1.5 lần ở các bệnh nhân ĐTĐ bệnh thận so với ĐTĐ
không mắc bệnh thận là Transthyretin giảm 4.3 lần, apolipoprotein (apo) A-I
(3.2 lần),
1
-
microglobulin/bikunin precursor (AMBP) (1.61 lần),
và plasma retinol-binding protein (1.52
lần). So sánh với các mẫu đối chứng thì mức độ giảm của các protein này càng rõ rệt hơn:
AMBP giảm 5.06 lần, retinol-binding
protein (2.56 lần) và apoA-I (2.53 lần) (Rao PV et al,
2007).
Xinghai Li cùng cộng sự cũng đã chỉ ra rằng Atk có chức năng như một phần của con
đường tín hiệu insulin ức chế trực tiếp PGC-1γ (peroxisome proliferator activated receptor-
coactivator) trong các tế bào gan. Con đường này có thể điều khiển sự tiết lipid ở ĐTĐ type
2 như ức chế PGC-1γ gây ra Akt dẫn đến hạn chế sự oxi hóa axit béo ở gan. Đẩy mạnh tác
động của PGC-1γ trong các tế bào gan kháng insulin có thể chống lại s
ự không cân bằng
lipid quan sát thấy ở ĐTĐ type 2 (Xinghai Li, 2007). Bên cạnh đó, khi nghiên cứu các tế
bào thần kinh Huang CJ cùng cộng sự đã khẳng định rằng protein Calcium-activated
calpain-2 có liên quan đến sự phá hủy tế bào beta của bệnh nhân ĐTĐ2 (Huang CJ et al,
2010). Như vậy, việc sử dụng các kỹ thuật proteomic trong nghiên cứu hệ protein nói chung
9
của các bệnh nhân ĐTĐ type 2 mở ra cơ hội mới trong việc tìm kiếm các biomarker phục vụ
chẩn đoán sớm bệnh.
Ở Việt Nam, do tỷ lệ ngày một gia tăng cũng như các nguyên nhân và biến tính phức tạp
của bệnh ĐTĐ type 2, nhiều nghiên cứu về dịch tễ, các phương pháp điều trị và dự phòng đã
được tiến hành và tổng kết (Tạ Văn Bình và cs, 2006). V
ề mặt chẩn đoán, chủ yếu tập trung
vào các xét nghiệm đường huyết thanh nhanh, xét nghiệm dung nạp đường qua đường
miệng, xét nghiệm đường huyết thanh ngẫu nhiên, xét nghiệm đường máu lúc đói hoặc tầm
soát máu bằng chích đầu ngón tay. Như vậy, bệnh thường chỉ được phát hiện khi nồng độ
đường trong máu đã tăng cao (Nguyễn Khoa Diệu Vân và cs, 2005; Tạ Văn Bình, 2006).
Cũng đã có một số nghiên cứu về
quan hệ giữa nồng độ của CPR (C reactive protein) – một
protein miễn dịch với BMI (body mass index) một chỉ số ở các bệnh nhân ĐTĐ type 2
(Hoàng Đăng Mịch, 2006), hay giá trị của HBA
1C
huyết thanh trong chẩn đoán ĐTĐ
(Nguyễn Thị Phương Mai và cs, 2006).
Nghiên cứu proteomics đối với leukemia
Leukemia là một dạng ung thư của cơ quan tạo ra các huyết cầu như tủy xương và hệ thống
bạch huyết (lymph system). Trong leukemia các bạch cầu được sản xuất một cách nhanh
chóng rối loạn tạo ra các bạch cầu bất thường không hoạt động được và các bạch cầu ung
thư này dần dần xâm lấn đến các hồng cầu và tiểu cầu, ngăn chặn sản xuất và phá hủy các tế
bào này. Nói chung, leukemia chia làm 2 d
ạng cấp tính và mãn tính. Leukemia cấp tính có
triệu chứng sớm, tiến triển nhanh, nếu không chẩn đoán và điều trị sớm sẽ đưa đến tử vong
nhanh và có nhiều subtyp khác nhau. Leukemia loại mãn tính có tiến triển chậm, thường
không có hay có ít triệu chứng trong nhiều năm. Những nghiên cứu proteomics đối với
leukemia không chỉ làm sáng tỏ về phân loại leukemia, mà còn góp phần xác định các
kháng nguyên ung thư, chẩn đoán sớm và đánh giá quá trình điều trị bệnh (Cui JW
et al,
2004; Cui JW et al, 2005).
Trong năm năm gần đây, cùng với sự hoàn thiện việc đọc trình tự hệ gen (genome) người là
sự phát triển mạnh mẽ các phương pháp, kỹ thuật nhằm xác định chức năng của các gen và
mối liên quan giữa chúng. Đã có những nghiên cứu chỉ ra sự chuyển đoạn của các nhiễm
sắc thể, các kiểu gen đặc biệt, các đột biến liên quan mật thiết với b
ệnh ung thư bạch cầu.
Kết quả của những thay đổi trên được phát hiện thấy cả ở mức độ biểu hiện mRNA, mức độ
biểu hiện protein nhờ các phương pháp chính như RT-PCR, DNA microarray, các kỹ
thuật/cách tiếp cận nghiên cứu proteomics như điện di 2 chiều, điện di 2 chiều nhuộm huỳnh
quang (2D-DIGE), khối phổ (MALDI/SELDI-MS/MS), sắc ký lỏng khối phổ (LC-MS/MS).
Các gen mã hóa cho CREB (cAMP response element binding protein), PRAME
(preferentially expressed antigen in melanoma), FLT3 (Fetal Liver Tyrosine Kinase 3),
p14
ARF
và p16
INK4a
, MTHFR là một vài trong số rất nhiều gen đã được phát hiện có mức độ
biểu hiện mRNA bất thường liên quan tới bệnh bạch cầu. Mặt khác, chúng cũng được xem
như đích đến của các loại thuốc dùng điều trị bệnh. Mã hóa cho protein bám nhân tố đáp
ứng cAMP, CREB điều khiển các gen chịu trách nhiệm cho các quá trình tăng số
lượng/trưởng, biệt hóa và sự sống sót của tế bào (Sakamoto KM, Frank DA, 2009). CREB
10
được phát hiện biểu hiện thừa cả ở mức độ phiên mã mRNA và protein trong tủy xương ở
hầu hết những bệnh nhân bị ung thư bạch cầu cấp tính và được xem là có vai trò rõ ràng như
một chỉ thị theo dõi diễn biến bệnh ung thư bạch huyết (AML) (Cheng JC et al, 2007).
PRAME (preferentially expressed antigen in melanoma) một loại kháng nguyên được nhận
thấy có sự biểu hiện hiện quá mức (overexpression) ở 52.9% bệnh nhi tuổi bị mắ
c bệnh ung
thư bạch cầu/máu ác tính (Spanaki AC et al, 2007; Nicolas T et al, 2008). Tysosine kinase 3
kiểu FMS/một tysosine kinase xuyên màng (FLT3) được biểu hiện ở hầu hết các trẻ bị
leukemia ác tính và được xem như một đích tiêu biểu trong điều trị bệnh leukemia ác tính
(Kappelmayer JM, Udvardy et al, 2007; Stubbs MC and Amstrong SA, 2007). MTHFR
(Methylenetetrahydrofolate reductase) là một enzyme liên quan trong sự trao đổi chất folate
và methyl hóa DNA (DNA methylation). Người ta đã chứng minh rằng biến thể đồng hợp tử
MTHFR 1298CC liên quan chặt chẽ tới việc làm tăng nguy cơ mắc b
ệnh CML, và kiểu gen
MTHFR 677CC và 1298CC có ảnh hưởng tới nguy cơ mắc bệnh CML và AML (Moon,
Kim et al. 2007). Sự biểu hiện các gen ức chế bệnh ung thư p14
ARF
và p16
INK4a
đã được
nghiên cứu ở 109 bệnh nhân nhiễm bệnh CML. Kết quả cho thấy, mức độ biểu hiện mRNA
của chúng rất thấp ở các bệnh nhân trong giai đoạn mạn tính và mức độ mRNA này đã tăng
cao rõ rệt ở các bệnh nhân CML được điều trị với interferon-alpha (IFN-α) (Cividin MO et
al, 2006).
Mức độ biểu hiện quá mức của một số protein lai (kết quả của sự
chuyển đoạn nhiễm sắc
thể) cũng như một số protein của tế bào tiền thân đã được công bố là ảnh hưởng rõ rệt tới sự
biểu hiện của toàn bộ protein trong tế bào đó. Sự chuyển đoạn nhiễm sắc thể t(15;17) tạo
nên một protein lai (fusion protein) PML-RARα (Promyelocytic leukemia - retinoic acid
receptor-α) (Grignani FV et al, 1999; Choughule A et al, 2009). Protein này là dấu hiệu
phân tử của bệnh ung thư bạch cầ
u bạch huyết (Acute promyelocytic leukemia) đồng thời
đóng vai trò quan trọng trong quá trình phát sinh bệnh ung thư bạch cầu do làm hỏng chức
năng bình thường của cả hai con đường (pathways) PML và RARα (Kakizuka AW et al
1991; Melnick A et al, 1999). Những nghiên cứu in vivo ở chuột chuyển gen và in vitro ở
các tế bào máu chứng minh ảnh hưởng của protein lai PML-RARα tới kiểu hình bệnh bạch
cầu do ức chế sự biệt hóa và kích thích sự sống sót của các tế bào tiền thân tạ
o máu (Wang
ZG et al, 1998; Zhong SP et al, 2000). Ảnh hưởng trực tiếp của sự biểu hiện protein lai
PML-RARα lên toàn bộ mức độ biểu hiện các protein của dòng tế bào ung thư bạch huyết
U937/ PML-RARα đã được Zada và cs. phân tích dựa trên các phương pháp điện di hai
chiều và khối phổ (MALDI TOF TOF) (Zada AAP et al, 2006). Kết quả cho thấy, trong số
224 protein được nhận diện nhờ khối phổ có tới 47 protein bị thay đổi mức độ biể
u hiện do
ảnh hưởng của protein lai PML-RARα. Một trong số 47 protein đó là oncoprotein 18
(OP18). Bằng phương pháp điện di hai chiều, các tác giả đã nhận thấy một isoform của
OP18 đã biểu hiện tăng lên trong khi isoform còn lại biểu hiện giảm xuống dưới tác động
của protein lai PML-RARα. Bên cạnh đó, mức độ biểu hiện cao hơn của protein OP18 trong
các tế bào biểu hiện PML-RARα được phát hiện là có liên quan tới mức
độ biểu hiện
mRNA cao hơn ở các tế bào từ những bệnh nhân ung thư bạch cầu huyết (APL). Nhóm
nghiên cứu cũng chứng minh sự giảm mức phosphoryl hóa tại gốc amino acid Ser63 của
11
protein OP18 dưới ảnh hưởng của protein lai PML-RARα ảnh hưởng tới chu kỳ tế bào ở các
tế bào của người ung thư bạch cầu APL: làm kết thúc quá trình phân bào của các tế bào
blast (loại tế bào non không biệt hóa hoặc rất ít biệt hóa).
Ở một nghiên cứu khác trên các tế bào ung thư bạch cầu cấp tính AML và ALL có sự
chuyển đoạn nhiễm sắc thể t(4;11), Yocom và cs. đã nhận thấy sự biểu hiệ
n tăng lên của 11
protein khi so sánh với dòng tế bào đối chứng CD34
+
và sự biểu hiện quá mức của các
protein PGK1 (Phosphoglycerate kinase 1), HSP90 (heat shock protein 90 alpha) và nm23
(nucleoside diphosphate kinase) cũng đã được nhận diện (Yocum AK et al, 2006). Đã có
661 protein được nhận diện nhờ phương pháp đánh dấu đồng vị các amino acid (L-leucine -
98% của
13
C
6,
98% của
15
N
2
và L-Lysine: 2HCl – 98%
13
C
6
, 98%
15
N
2
) trong nuôi cấy tế
bào động vật, kết hợp với phương pháp khối phổ lặp lại (MS/MS) nối trực tiếp với sắc ký
lỏng hai chiều (2DLC- MS/MS). 518 protein trong số ấy được phát hiện có sự thay đổi về
mức độ biểu hiện. Trong số này có 6 protein có vai trò trong quá trình apoptosis và 2 protein
có vai trò trong sự biệt hóa tế bào đã tăng về lượng ở những tế bào được xử lý với thuốc 17-
AAG (17-Allylamino-17-Demthoxygeldanamycin) so sánh với nhóm đối ch
ứng (cơ chế tác
động của 17-AAG là cạnh tranh với ATP trong cấu trúc 3 chiều chỉ được nhận thấy trong tế
bào ung thư, qua đó làm giảm sự bảo vệ của các protein “khách” gây ung thư). Nghiên cứu
cũng gợi ý rằng HSP90 như là đích tiêu biểu được ức chế bởi các thuốc, còn nm23 như là
một chỉ thị sinh học cho quá trình đánh giá hiệu quả điều trị. Một nghiên cứu khác sử dụng
phương pháp điện di hai chiều kết hợp với kỹ thuật khối phổ MALDI-TOF MS cũng thông
báo rằng sự biểu hiện quá mức của PLCβ
1
(inositide-specific phospholipase C, đồng dạng
chính định vị trong nhân) đã dẫn tới hiện tượng điều chỉnh xuống mức độ biểu hiện của
protein SRp20 (một protein định vị trong nhân tế bào, là thành viên của một họ các protein
điều chỉnh việc gắn nối mRNA (splicing) giàu acid amine serine-arginine) (Bavelloni A et
al, 2006).
Bên cạnh việc nghiên cứu sự biểu hiện toàn bộ các protein trong các tế bào ung thư bạch
cầu dưới ảnh hưởng của sự
biểu hiện quá mức một protein nào đó hoặc bởi sự xuất hiện một
protein lai mới, nhiều nghiên cứu đã tập trung khai thác mức độ biểu hiện của các protein
trong huyết thanh/huyết tương (plasma/serum) của những người mắc bệnh ung thư bạch
cầu. Protein FLT3 và sự phosphoryl hóa của nó trong các mẫu plasma thu thập từ 85 bệnh
nhân mắc bệnh ung thư bạch cầu AML và 5 bệnh nhân mang bệnh ALL đã được
đánh giá.
Không có sự khác biệt đáng kể nào về mức độ của các protein FLT3 có mặt trong huyết
thanh những người bị bệnh bạch cầu khác nhau (AML và ALL). Tuy nhiên các bệnh nhân
AML có tỉ lệ FLT3 phosphoryl hóa/FLT3 cao hơn mội cách có ý nghĩa với độ tin cậy lên tới
98%. Protein FLT3 phosphoryl hóa được phát hiện thấy cao hơn một cách đáng kể trong
plasma của những người bệnh mang các đột biến của FLT3 với mức độ tin cậy là 99.98%.
Nhìn chung không có mối liên quan giữa sự
sống của bệnh nhân và mức độ protein FLT3
hoặc dạng phosphoryl hóa của nó trong huyết thanh. Tuy nhiên, trong số các bệnh nhân
không có các đột biến của FLT3, những bệnh nhân nào có mức độ phosphoryl hóa của
FLT3 cao hơn thì có thời gian thuyên giảm bệnh ngắn hơn đáng kể (với độ tin cậy 96%)
(Ravandi F et al, 2007).
12
Trong một nghiên cứu khác, 38 mẫu huyết thanh của các bệnh nhân mắc bệnh ung thư bạch
cầu ác tính (34 ALL và 4 AML) đã được thu thập để theo dõi đánh giá mức độ biểu hiện của
protein thymidine kinase (TK) trong thời gian mới chẩn đoán và trong quá trình điều trị
bệnh. Protein TK tham gia trong quá trình tổng hợp acid nucleic và do vậy nó được xem
như một chỉ thị tăng trưởng ung thư quan trọng. Kết quả thu được cho thấy, mức độ TK
trong serum tại thời điểm chẩn đoán khá cao (78-5826U/I, giá trị trung bình 403 U/I, mức
bình thường nhỏ hơn 8 U/I), và trong quá trình điều trị, bệnh thuyên giảm thì mức độ TK
trong huyết thanh trở nên thấp hơn nhiều (5-80 U/I, giá trị trung bình 31 U/l). Nghiên cứu
cũng công bố mức độ TK huyết thanh tăng lên ở các trường hợp tái phát bệnh ung thư bạch
cầu ác tính (10-800 U/l). Những kết quả của nghiên cứu này gợi ý rằng mức độ TK huyết
thanh trong quá trình điều trị bệnh ung thư bạch cầu có thể là chỉ thị hữu dụng để nhận diện
giai đoạn sớm của việc tái phát bệnh (Votava T, 2007).
Bệnh leukemia đã được chú ý nghiên cứu từ nhiều năm nay ở Việt Nam và được coi là bệnh
lý ác tính của tổ chức tạo máu phát triển theo xu hướng không kiểm soát được của từng
dòng tế bào bạch cầu. Bệnh được đặc tr
ưng bởi sự có mặt của các tế bào blast bất thường
chủ yếu trong tủy xương và sự sản sinh các dòng tế bào máu bình thường bị hư hại. Triệu
chứng lâm sàng của thể điển hình có 5 hội chứng: thiếu máu, xuất huyết, nhiễm khuẩn, u,
loét và hoại tử (Nguyễn Anh Trí, 1995; Đỗ Trung Phấn, 2003). Hiện nay việc chẩn đoán
bệnh chủ yếu dựa vào lâm sàng và xét nghiệm. Các xét nghiệm hiện nay đ
ang được dùng
bao gồm: huyết đồ, tủy đồ, hình thái và hóa tế bào, xác định các marker miễn dịch đặc hiệu
(immunophenotyping), di truyền học (bao gồm xét nghiệm nhiễm sắc thể và xét nghiệm
gen) (
Thái Quí, 1997). Dòng tế bào ác tính thuộc loại tế bào dòng tuỷ hay dòng tế bào
lympho, leukemia được chia thành leukemia cấp dòng tủy (Acute Myeloid Leukemia -
AML) và leukemia cấp dòng lympho (Acute Lymphoblastic Leukemia - ALL) chủ yếu theo
phân loại của nhóm FAB (French-American-British Group, Bennett JM et al, 1976)
và gần
đây là của WHO
(Bennett JM, 2000). Tùy theo đặc điểm hình thái và hóa tế bào, việc phân
loại leukemia cấp dòng tủy và leukemia cấp dòng lympho dựa trên xét nghiệm các marker
miễn dịch trên bề mặt tế bào bằng kỹ thuật flowcytometry (Szczepanski T et al 2003;
Ottensmeier C, 2001) cũng đã được các tác giả tiến hành nghiên cứu (Đỗ Trung Phấn, 2003;
Nguyễn Triệu Vân và cs, 2004).
Cơ sở thực hiện đề tài
Ở Việt Nam, những nghiên cứu proteomics mới chỉ bắt đầu được triển khai từ khi các
Phòng Thí nghiệm Trọng điểm về Sinh học Phân tử, Công nghệ Gene và Protein, được thiết
lập trong giai đoạn 2001-2005. Trong số các Phòng thí nghiệm trên phải kể đến: (i) Phòng
Thí nghiệm Trọng điểm Công nghệ Gen tại Viện Công nghệ Sinh học thuộc Viện Khoa học
và Công nghệ Việt Nam; (ii) Phòng Thí nghiệm Trọng điểm về Protein và Enzyme thuộ
c
Trường Đại học Quốc gia Hà Nội; (iii) Trung tâm Nghiên cứu Ứng dụng Y-Dược học, Học
Viện Quân Y, Bộ Quốc phòng; (iv) các Phòng Thí nghiệm về Hoá sinh và Sinh học phân tử
có liên quan khác tại các Trường Đại học, Viện Nghiên cứu, Bệnh viện Trung ương thuộc
Bộ Y tế, Bộ Giáo dục và Đào tạo, Bộ Quốc phòng… Các nghiên cứu chủ yếu dựa trên các
kỹ thuật tinh chế hoặc phân tách các protein bằng điện di mộ
t hoặc hai chiều (1-DE/2-DE)
13
sau đó xác định các protein/enzyme bằng các kỹ thuật hoá sinh hoặc miễn dịch, thông qua
các đặc tính sinh học (hoạt tính, đặc tính kháng nguyên/kháng thể ) và gần đây là MALDI-
TOF MS và MS/MS. Tại Viện Công nghệ Sinh học thuộc Viện KHCNVN, ngoài các kỹ
thuật phân tách protein truyền thống như sắc ký, điện di một (1-DE), hai chiều (2-DE) (bao
gồm cả điện di đẳng điện điều chế, preparative electrofocusing), một hệ thống proteomic
workflow mới bao gồm hệ
sắc kí lỏng nano đa chiều (nanoLC Packing, Dionex, Netherland)
kết nối trực tuyến với hệ thống khối phổ QSTAR
®
XL MS/MS sử dụng nguồn ion hóa
NanoSpray™ (MDS SCIEX/Applied Biosystems) đã được thiết lập cho phép tự động phân
tích và nhận dạng không chỉ những protein riêng lẻ, mà còn cả các hệ protein (proteome)
phức tạp. Với hệ thống được thiết lập như trên có thể tiến hành: (i) nhận dạng và xác định
nhanh, chính xác các protein/peptide qua phổ TOF MS hoặc TOF MS/MS; (ii) nghiên cứu
hệ protein (proteome) phức tạp từ virus, vi khuẩn đến các mẫu tế bào động/thực vật, người
(huyết thanh, dịch não t
ủy ) nhằm tìm kiếm, xác định các protein marker có khả năng liên
quan đến các dạng ung thư, bệnh tim mạch, chuyển hóa, thần kinh và lây nhiễm phục vụ cho
các công tác kiểm định, chẩn đoán và theo dõi diễn biến của bệnh lý (Phan Văn Chi và cs,
2005; Phan Văn Chi, 2006). Bằng kết hợp các phương pháp phân tách protein theo điểm
đẳng điện (electrofocusing), điện di hai chiều, sắc ký ái lực trên cơ sở con A, và đặc biệt là
sắc ký lỏng nano đa chiều kế
t nối trực tuyến với hệ khối phổ liên tiếp (nanoLC-MS/MS), đã
có thể nhận dạng và xác định được đến hàng ngàn loại protein khác nhau từ hệ protein của
huyết thanh người, góp phần đánh giá mức biểu hiện của hệ protein nói chung và tìm kiếm
các protein marker cho các trạng thái bệnh lý. Trong số các protein huyết thanh đã được xác
định, các tác giả đã phát hiện được protein MLL-AF4, một bằng chứng phân tử của sự
chuyển vị nhi
ễm sắc thể giữa tổ hợp gen leukemia (MLL) trên nhiễm sắc thể số 11 (vị trí
11q23) và gen AF4(FEL) trên nhiễm sắc thể số 4 (vị trí 4q21) (Vu MT et al, 2004). Một số
protein bệnh và các protein đột biến như apolipoprotein AI (peptide đột biến), protein bệnh
chuỗi nặng Ig MU (BOT), mạch 2 H của Ig gamma, peptide đột biến (BUR), protein bệnh
chuỗi nặng (HDC), AIM/CD69 (Activation Inducing Molecular), neurofibromatosis-2,
kinase phụ thuộc cyclin, các loại protein Bence-Jones… cũng đã được phát hiện có liên
quan đến các loại bệnh về máu, các tổn thươ
ng hệ thống miễn dịch và các bệnh thần kinh,
đái tháo đường type 2 (Nguyen NL et al, 2004; Vu MT et al, 2005; Phan VC et al, 2005; Vũ
Minh Thiết và cs, 2006; Đặng Thành Nam & Phan Văn Chi, 2006; Trần Thế Thành et al,
2007; Nguyễn Thị Minh Phương et al, 2007; ). Tuy nhiên trên đây cũng mới chỉ là những
kỹ thuật được xác lập với những dẫn liệu khảo sát ban đầu theo hướng nghiên cứu hệ
protein (proteome) huyết thanh người Việt Nam của nhóm nghiên cứu Proteomics, Phòng
Thí nghiệm Trọng đ
iểm Công nghệ Gen (PTNTĐCNG). Các kết quả trên chủ yếu được thực
hiện trong khuôn khổ Dự án xây dựng PTNTĐCNG (Viện CNSH chủ trì) và hỗ trợ một
phần của các đề tài: (i) Thiết lập và ứng dụng kỹ thuật kết nối sắc ký lỏng nano đa chiều với
hệ khối phổ liên tục nhằm nhận dạng và xác định các protein và proteome, chủ nhiệm Phan
Văn Chi (Đại học Công ngh
ệ, ĐHQG Hà Nội, 2006); (ii) Xác định các biomarker trong
huyết thanh người bằng kỹ thuật proteomics, chủ nhiệm Phan Văn Chi (Quỹ nghiên cứu
Việt Nam-Thụy điển, 2006-2007); (iii) Nghiên cứu hệ protein huyết thanh người bằng các
kỹ thuật proteomics, chủ nhiệm Phan Văn Chi (Đề tài NCCB 2006-2008). Để có thể có
14
những ứng dụng thật sự của các kỹ thuật proteomics, đặc biệt trong chẩn đoán sớm cần thiết
phải có những nghiên cứu sâu rộng hơn trên nền hệ protein tổng thể không chỉ của người
bình thường, mà còn của người bệnh, nhằm tìm ra sự khác biệt về mức độ biểu hiện, mối
liên quan giữa sự biến đổi về cấu trúc về chứ
c năng, không chỉ một vài protein riêng biệt,
mà trong mối tương tác chung, từ đó xác định các protein markers cũng như các kỹ thuật áp
dụng chúng.
Trên cơ sở những trang thiết bị khá đồng bộ và hiện đại về proteomics được đầu tư theo Dự
án “Phòng thí nghiệm Trọng điểm Công nghệ Gen” tại Viện Công nghệ Sinh học, Viện
KH&CN Việt Nam và những kết quả nghiên cứu bước đầu về xác lập các phươ
ng pháp
phân tích protein/proteome, tìm kiếm các chỉ thị protein trong huyết thanh người trong thời
gian qua, đề tài “Xây dựng ngân hàng dữ liệu hệ protein huyết thanh người Việt Nam
để phối hợp chẩn đoán bệnh đái tháo đường type 2 và leukemia” giai đoạn 2008-2010
đã được phê duyệt. Mục đích của đề tài là nghiên cứu một cách có hệ thống hệ protein huyết
thanh người Việt Nam ở trạng thái bình thường và các trạng thái bệnh ĐTĐT2 và leukemia,
tìm kiếm nh
ững protein có biến đổi đặc trưng cho các trạng thái bệnh có khả năng phát triển
thành các chỉ thị chẩn đoán.
15
PHẦN II. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
1. Thu thập, lựa chọn mẫu máu người bình thường và máu người bệnh từ
những người
tình nguyện tại Bệnh Viện Nội tiết Trung ương, Bệnh viện K, Bệnh viện Bạch Mai (Bộ
Y tế), Học viện Quân Y (Bộ Quốc phòng). Các mẫu được lựa chọn theo các tiêu chuẩn
chặt chẽ về lâm sàng và có hồ sơ bệnh án rõ ràng. Tất cả các mẫu huyết thanh đều được
chuẩn bị theo cùng một phương pháp. Các mẫu huyết thanh được chia nhỏ và bảo quản
ở -20°C và -80°C trong Ngân hàng các m
ẫu máu/Huyết thanh của đề tài
2. Xử lý mẫu huyết thanh người:
2.1. Dịch huyết thanh được loại bớt albumin (HSA) và γ-Immuglobulin (IgG) bằng
Aurum serum protein mini KIT (Bio-Rad, USA). Loại Kit này gồm có cột MicroSpin
là hỗn hợp của Affi-Gel Blue và Affi-Gel protein A. Hai thành phần này được gắn lên
chất giá resin cho phép loại đồng thời HSA và IgG trong huyết thanh. 60 µl huyết thanh
được pha loãng trong 180 µl đệm gắn của Kit Aurum. Dung dịch được đưa lên cột
MicroSpin sau khi đã cố định chất giá, hỗn hợp protein huyết thanh không bám cột được
thu l
ại bằng ly tâm và thu hồi HSA và IgG bám trên cột bằng đệm thôi Laemmli. Sau đó
kiểm tra trên SDS-PAGE 12.6%.
2.2. Thu nhận các protein bền nhiệt từ protein huyết thanh
Các protein bền nhiệt từ hệ protein huyết thanh được thu nhận theo phương pháp của
Goufman và cộng sự, 2006.
Một thể tích (1V) huyết thanh tổng số được trộn đều với 1V đệm ETP (20 mM EDTA
pH 8.1, 0.2 M Tris-HCl pH 8.9, 7% (w/v) PEG 6000). Hỗn hợp được ủ 10 phút ở 98
o
C,
10 phút tiếp theo ở nhiệt độ phòng, sau đó được ly tâm tách pha ở điều kiện 12000
vòng/phút trong 15 phút. Phần dịch nổi chứa các protein huyết thanh bền nhiệt được thu
nhận và sử dụng cho các thí nghiệm tiếp theo.
Kết tủa protein bằng acetone lạnh
Protein bền nhiệt thu nhận được theo phương pháp trình bày ở phần trên được hòa tan
trong đệm ETP có nồng độ Tris khá cao (~ 200mM), điều này có thể làm ảnh hưởng đến
việc nghiên cứu hệ
protein này. Để loại bỏ Tris, chúng tôi sử dụng phương pháp kết tủa
protein trong đệm chứa Tris bằng dung môi acetone lạnh (-20
o
C) với nồng độ 80%.
Hỗn hợp protein và acetone được tủa qua đêm ở -20
0
C, sau đó ly tâm lạnh (4
0
C) thu tủa
với tốc độ 12000 vòng/phút trong 30 phút. Đổ phần dịch phía trên và làm khô protein ở
nhiệt độ phòng và hòa lại trong đệm mẫu SDS theo Laemmli.
2.2.Phân tách glycoprotein sử dụng cột ái lực đa lectin: Mẫu huyết thanh được pha loãng
bằng dung dịch đệm cân bằng cột và đưa vào cột ái lực đa lectin ConA. Sau khi rửa hết
các protein không bám vào cột, các protein đã được gắn vào cột được thôi ra bằng dung
16
dịch thôi tương ứng với mỗi loại lectin đặc hiệu. Các mẫu được giữ ở -70°C cho đến khi
sử dụng.
Quá trình thu nhận glycoprotein được mô tả cụ thể như sau:
Sắc ký ái lực
ConA serpharose (được mua từ hãng Amersham), là Concanavalin A liên kết với
serpharose 4B bằng phương pháp sử dụng cyanogens bromide. Concanavalin A là một
loại lectin liên kết với các phân tử chứa gốc α-D-mannopyranosyl, α-D-glucopyranosyl.
ConA kết hợp với sepharose ứng dụ
ng để tinh sạch các loại glycoprotein,
polysaccharide, glycolipid, các liên kết enzyme kháng thể, IgM, các glycoprotein ở bề
mặt tế bào.
ConA được hòa vào trong đệm cân bằng (Tris-HCl 20mM NaCl 0.5M, pH 7.4) và nhồi
lên cột có đường kính 1cm, thể tích gel nhồi trên cột được tính toán phù hợp theo hướng
dẫn của nhà sản xuất. Rửa cột với 10 lần thể tích đệm cân bằng trước khi đưa mẫu huyết
thanh lên cột.
300 µl huyết thanh nguyên (tương đương khoảng 20 mg protein) thanh được hòa trong
10 lần thể tích đệm cân bằng lectin conA
và được đưa lên cột sắc ký với tốc độ dòng
chảy ra cột là 0,1ml/phút. Sau 15 phút, phần không bám cột được rửa bằng 8ml đệm cân
bằng và được thu lại thành các phân đoạn 1,5ml. Các glycoprotein bám trên cột sắc ký
conA được thôi ra bằng 8 ml dung dịch đường (0.5 mM methyl-α-D-glucopyranosyl).
Nồng độ glycoprotein bám cột được xác định bằng phương pháp Bradford. Sau đó, các
dung dịch thôi ra được cô đặc, loại đường và muối bằng phương pháp tủa với acetone
lạnh theo tỷ
lệ protein:acetone là 1:4 về thể tích và được giữ ở -25
0
C.
3. Xác định hàm lượng protein: Hàm lượng protein của mỗi mẫu được xác định theo
phương pháp Bradford với thuốc nhuộm protein của hãng Bio-Rad (Bio-Rad
Laboratories, Hercules, USA) sử dụng albumin huyết thanh bò (BSA – Bovine Serum
Albumin) làm protein chuẩn.
4. Điện di hai chiều 2-DE: các protein được phân tách theo điểm đẳng điện và trọng lượng
phân tử được tiến hành bằng việc sử dụng các strip IPG trong buồng điện di PROTEAN
IEF. SDS-PAGE và các hóa chất, thuốc nhuộm được mua từ hãng Bio-Rad
(Bio-Rad
Laboratories, Hercules, USA) hoặc Amersham Bioscience (Amersham Bioscience Ltd,
USA).
Phân tách protein theo điểm đẳng điện pI – điện di chiều một
Protein được hòa trong 125 µl đệm (chứa 8M ure, 2% CHAPS, 50 mM DTT, 0,2% (w/v)
Bio-Lyte 3/10 ampholyte và 0.001% Bromophenol Blue). Hỗn hợp mẫu được để thấm
vào thanh gel dài 7cm, hoặc 11cm, chứa dải pH từ 4 đến 7 (do hãng Bio-Rad, Mỹ cung
cấp) trong thời gian từ 12 giờ đến 16 giờ. Sau đó, các protein trên thanh gel được phân
tách theo điểm đẳng điện trên hệ PROTEAN IEF (Bio-Rad) theo chương trình được
trình bày trong Bảng 1.
17
Bảng 1. Chương trình chạy điện di chiều thư nhất trên hệ PROTEAN IEF (Bio-Rad)
Loại thanh gel
Hiệu điện thế đầu
(V)
Hiệu điện thế cuối
(V)
Volt-HOUR
Thanh gel có độ dài 7cm 0 8000 10000
Thanh gel có độ dài 11cm 0 8000 30000
Cân bằng gel
Sau quá trình điện di đẳng điện, protein trên gel được khử bằng dung dịch chứa 6 M
urea, 20% glycerol 2% SDS, 37,5 mM Tris-HCl pH 8.8, 2% DTT w/v và alkyl hóa bằng
dung dịch chứa 6 M urea, 2% SDS 37.5 mM Tris-HCl pH 8.8, glycerol 20% and 40 mM
IAA.
Phân tách protein theo trọng lượng phân tử - điện di chiều hai
Các protein trong thanh gel sau khi được phân tách theo điểm đẳng điện và được cân
bằng theo các dung dịch trên sẽ tiếp tục được phân tách trên gel polyarcrylamid 12.6%
theo kích thước phân tử của chúng với hiệu điện thế không đổi 200 V. Bản gel 2DE
được nhu
ộm bằng thuốc nhuộm Coomassie Brilliant Blue R-250.
5. Thủy phân trypsin: (1) Các mẫu huyết thanh đã được xử lí loại albumin, globulin hoặc
các phân đoạn protein thu được từ cột sắc kí được làm khô bởi li tâm chân không, tiếp
đó được hòa vào 50mM NH
4
HCO
3
. Các mẫu được khử bằng 10 mM Dithiothreitol
(DTT), alkyl hóa bằng 5 mM
Iodoacetamide (IAA), sau đó thủy phân bằng trypsin (loại
sử dụng cho đọc trình tự, Sigma-Aldrich) trong 12 giờ ở 37°C. Phản ứng thủy phân
được dừng lại bởi acid formic với nồng độ cuối cùng là 0.1%; (2) Các vệt protein được
cắt ra từ bản gel polyacrylamide sau khi nhuộm bằng Coomassie hoặc bạc được rửa, làm
khô và hòa lại bằng đệm để thủy phân bằng trypsin. Sau khi thủy phân, các peptide được
chiết ra khỏi gel và phân tích trên hệ thống khối phổ.
6.
Sắc kí lỏng nano đa chiều(MDNanoLC): Dung dịch sau khi thủy phân được hoà vào
0.1% acid formic và phân tích trên hệ NanoLC để phân tách theo chiều thứ nhất trên cột
sắc kí (LC Parking, Dionex) bằng các chất trao đổi cation mạnh (SCX). Sắc kí chiều thứ
hai được thực hiện trên cột ngược pha C18 (GraceVydac, Hesperia, CA) với pha động
chứa 0.1% acid formic trong nước (A) và 0.1% acid formic trong 85% acetonitrile (B).
Các peptide được thôi ra với gradient tuyến tính từ 5% đến 100% dung dịch B với tốc độ
dòng là 0.2 µl/phút.
Đối với hỗn hợp peptide tạo ra do thủy phân các đ
iểm protein trên gel 2DE hệ nanoLC 1
chiều (qua cột ngược pha RP C18) được sử dụng vì hỗn hợp peptide đơn giản, do đó quá
trình chạy chỉ gồm một phân đoạn (không có các phân đoạn muối) trong 90 phút. Các
thông số của hệ thống sắc ký lỏng 1D nanoLC được tổng kết trong Bảng 2.
Đối với hỗn hợp peptide phức tạp tạo ra do thủy phân protein trong dung dịch cho phân
tích tổng thể, chúng tôi tiến hành chạy qua 2 chiều (qua cột trao đổ
i ion SCX và cột
18
ngược pha RP C18) với 16 phân đoạn, 90 phút/mỗi phân đoạn. Các thông số của hệ
thống sắc ký lỏng 2D nanoLC được tổng kết trong Bảng 3.
Bảng 2. Các thông số của hệ thống 1D NanoLC
Sắc ký lỏng nano
UltiMate™ / FAMOS/ Switchos™
(LC Packings/Dionex)
Cột ngược pha
300µl x 5 mm C18 PepMap100, LC Parking, Nertherland)
Cột C18
75µl ID. x 15 cm, Grace Vydac, Hesperia, CA, USA
Tốc độ dòng 200 nl/phút
Tốc độ dòng Switchos
30 µl /phút
Thể tích mẫu
20 µl (mẫu và muối)
Các loại đệm
A: 0,1% FA
B: 85% ACN trong 0,1% FA
Thời gian
90 phút, phút 10 bắt đầu tạo gradient với nồng độ đệm B tăng từ 0-
100% trong 65 phút.
Bảng 3. Các thông số của hệ thống 2D NanoLC
Các bộ phận chính UltiMate/ FAMOS/ Switchos (LC Packings/Dionex)
Cột trao đổi ion SCX BioX-SCX 5 µm, 500 m ID. x 15 mm, LC Packing
Cột ngược pha RP C18
C18 PepMap100, 5 m, 100 A
o
, 300 m x 15 mm, LC Parking, Hà
Lan)
Cột phân tách C18,
15cm
75 µm ID. x 15 cm, 300 A
o
, Grace Vydac, Hesperia, CA, Mỹ
Tốc độ dòng Ultimate 0,2 µl/phút
Tốc độ dòng Switchos 0,03 ml /phút
Thể tích mẫu 20 µl
Các bước thôi mẫu
(Cho phân tích 2 chiều)
Muối Amoniaxetat : 5mM, 10 mM, 20 mM, 30 mM, 40mM, 50mM,
75mM, 100 mM, 150mM, 200 mM, 300mM, 400 mM, 500mM,
750mM, 1M, H
2
O
Các loại đệm (pha linh
động)
A: 0,1% FA
B: 85% ACN trong 0,1% FA
19
Thời gian mỗi phân
đoạn
90 phút. Phút thứ 10 bắt đầu tạo gradient với nồng độ đệm B tăng từ
0-100% trong 70 phút.
7. Phân tích khối phổ: Máy khối phổ QSTAR
®
XL được vận hành ở chế độ IDA
(Information Dependent Acquisition) để thực hiện việc chuyển từ quét phổ TOF MS
đơn đối với các ion nằm trong dải khối (TOF mass) từ 400 đến 1200 sang khối phổ liên
tiếp trên 3 ion phân tử có mật độ cao nhất và lớn hơn 15 được xác định tự động nhờ
phần mềm BioAnalyst QS v1.4 (AppliedBiosystems). Sai số về khối (mass tolerance)
được đặt ở mức 100 ppm, thời gian không thực hiện lại MS/MS đối vớ
i một mảnh là 90
giây và làm MS/MS đối với ion nằm trong khoảng (±) 3 đơn vị cửa sổ khối (amu
window) của mỗi ion. Hiệu điện thế được đặt để ion hóa mẫu trong dung dịch đi ra từ
đầu Fused Silica PicoTip là 2200V.
Hệ thống sắc ký sử dụng trong phương pháp sắc ký lỏng hai chiều kết hợp khối phổ là
hệ thống nanoLC (Dionex, Netherland) gồm 3 thiết bị trung tâm là thiết bị đưa mẫu t
ự
động Famos, điều khiển hệ thống van Swichos và hệ thống bơm tạo gradient UltiMate.
Các thiết bị này được kết nối với nhau qua các hệ thống ống (Hình 17), đồng thời được
điều khiểu bằng phần mềm Chromeleon v6.5 (Dionex).
Hình 1. Sơ đồ cấu trúc của hệ thống sắc ký lỏng hai chiều nanoLC(Dionex).
Hỗn hợp peptide thu được sau khi thuỷ phân bằng trypsin sẽ được chạy qua sắc ký lỏng
nano LC hai chiều. Đầu tiên hỗn hợp peptide được phân tích chiều một trên cột sắc ký
trao đổi cation mạnh, các peptide trong hỗn hợp sẽ được phân tách thành 16 phân đoạn
nhờ vào lực ion muối tăng dần dần từ 0-2M, mỗi phân đoạn thu được lại tiếp tục được
phân tách chiều hai trên cột sắc ký ngược pha (RP) C18(75 µm id.x15 cm). Trước khi
đi
vào cột cột RP-C18 các phân đoạn peptide phải được cô đặc và loại muối trên cột TRAP.
Trên cột RP-C18 các phân đoạn peptide này được phân tích bằng pha linh động A (0.1%
formic acid) và B (85% acetonitrile và 0.1% formic acid). Mẫu đi ra khỏi cột được đưa
trực tiếp vào nguồn nanoESI bằng kim phun (Fused Sillica picoTip) với tốc độ dòng thấp
20
(100-200nl/phút) gắn ở cuối cột ngược pha C18 và đi vào bộ phận phân tích khối. Trong
nguồn nanoESI dưới tác dụng một điện áp cao khoảng 2300V dòng dung môi và peptide
được phun thành những giọt nhỏ tích điện (charge droplet), cùng với sự hỗ trợ của màn
khí nitrogen (curtain gas) các ion peptide sẽ tách khỏi các phân tử dung môi và đi vào bộ
phận phân tích khối của máy khối phổ QSTAR
®
XL sau đó sẽ được phân tích và nhận
dạng bằng phần mềm Mascot v1.8. Chiến lược phân tích protein huyết thanh bằng
2DLC-MS/MS được thực hiện như sau: Đầu tiên nhờ thiết bị đưa mẫu tự động Famos
hỗn hợp peptide được đưa qua cột trao đổi ion mạnh SCX, peptide trong hỗn hợp sẽ bị
hấp phụ lên cột qua liên kết ion. Các peptide không hấp phụ sẽ được bơm trên Switchos
đẩy qua cột RP để loại mu
ối, sau đó sẽ được phân tách trên cột C18 trên UltiMate trước
khi đi vào phân tích khối phổ trên hệ thống QSTAR
®
XL. Ngay khi đi ra khỏi cột các
peptide được đưa trực tiếp vào nguồn ion hóa ESI nhờ đầu đưa mẫu Fused Sillica Tip
gắn ở cuối cột. Trong nguồn ESI dịch peptide cùng dung môi được phun thành các giọt
nhỏ tích điện (charge doplet), với sự hỗ trợ của màn khí nitrogen các ion peptide tách
khỏi thành phần dung môi và đi vào bộ phận phân tích khối của máy khối phổ
QSTAR
®
XL. Máy sẽ thu tín hiệu khi hệ thống sắc ký bắt đầu đẩy mẫu vào cột SCX.
Phần mềm BioAnalyst QS v1.4 ghi phổ ion tổng (TIC) theo thời gian, quét phổ TOF MS
đồng thời nhận biết ba ion phân tử tích điện +2, +3 hoặc +4 có mật độ cao nhất (lớn hơn
15) và tự động chuyển sang chế độ phân mảnh đồng thời ghi phổ MS/MS của ba ion này,
sau đó lại chuyển về trạng thái quét phổ TOF MS.
Quá trình này sẽ được lặp
đi lặp lại cho đến khi chương trình sắc ký kết thúc và bằng
phương pháp này qua mỗi lần phân tích chúng ta có thể nhận dạng được hàng trăm đến
hàng ngàn peptide khác nhau. Các peptide hấp phụ trên cột SCX sẽ được thôi ra bằng 16
phân đoạn muối CH
3
COONH
4
, mỗi một phân đoạn lại tiếp tục được loại muối trên cột
RP và phân tách trên cột C18 và đi vào phân tích khối phổ như các bước thực hiện ở
trên. Do vậy chúng ta sẽ thu được phổ TOF MS và MS/MS của tất cả các peptide trong
hỗn hợp.Hình 18 là phổ khối LC-MS/MS thu được ở phân đoạn muối 0mM và hình B là
kết quả quét phổ TOF MS tại phút 36.77. Tại thời điểm này phần mềm BioAnalyst QS
v1.4 nhận biế
t và xác định được ba ion đa điện tính (tích điện +2, +3 hoặc +4) có mật độ
cao nhất có m/z là 515.9, 400.2 và 773.3amu. Ngay sau đó phần mềm này sẽ điều khiểu
hệ thống QSTAR
XL chuyển sang chế độ MS/MS để phân mảnh lần lượt ba ion này với
thời gian được cài đặt là 3 giây với mỗi ion. Phổ MS/MS của mỗi mỗi mảnh thu được
tương ứng với hình C, D và E. Vì quá trình ghi phổ ion tổng số gần như đồng thời với
quá trình sắc ký nên phổ ion tổng số cũng cho biết kết quả phân tách của các peptide qua
hệ thống nanoLC, từ các phổ ion tổng số thu được cho thấy các peptide đã
được phân
tách rất tốt điều này cho thấy việc chọn hệ dung môi cũng như chương trình chạy sắc ký
là hợp lý, đồng thời cũng cho thấy các peptide bắt đầu được thôi ra từ phút thứ 32 và kết
thúc ở phút thứ 65 khi nồng độ ACN đạt khoảng 60%.
8. Tin sinh học (Phân tích dữ liệu): Phổ khối CID thu được từ nanoLC-MS/MS được
phân tích bằng phần mềm Mascot v1.8. Đây là phần mềm có khả
năng phân tích dữ liệu
21
phổ MS/MS để nhận dạng protein dựa trên thuật toán Mowse (Boutilier et al., 2004)
được phát triển bởi Matrix Science (London, UK). Ngân hàng dữ liệu được dùng để tìm
kiếm trong Mascot là NCBInr, một ngân hàng dữ liệu các protein không đồng nhất và
toàn diện với khoảng trên 7 triệu trình tự khác nhau được cài đặt trên một máy tính HP
Proliant Server (s/n:2UA5100LXZ). Các thông số tìm kiếm bằng Mascot như sau:
enzyme thủy phân trypsin, sai số khối lượng peptide là ± 0,5 Da, sai số khối của các
mảnh ion trong phổ MS/MS là ± 0,3 Da. Sửa đổi cố đị
nh là carbamidomethyl (C). Trạng
thái điện tích của ion phân tử được chọn là +2 (double charge) và +3 (triple charge).
Mức độ chính xác được đặt mặc định là 99,5%. Với các thông số như trên thì kết quả sẽ
cho các protein có tổng điểm số trên 31. Việc phân tích dữ liệu phổ giới hạn trong Ngân
hàng Dữ liệu Protein của Homo sapiens của toàn bộ Ngân hàng Dữ liệu NCBInr.
9. Xây dựng ngân hàng dữ liệu hệ protein huyết thanh người: sử dụ
ng hệ quản trị ngân
hàng dữ liệu Microsoft Access và các phầm mềm chuyên dụng có liên quan. Các protein
được tìm kiếm theo các thông tin (vị trí, chức năng, khả năng liên quan đến bệnh, các
biến đổi sau dịch mã) từ cơ sở dữ liệu UniProt ( />) và sử dụng các
công cụ tin sinh chuyên dụng (ID Mapping, />; NetNGlyc
1.0 Server, />) cũng như các phần mềm xử lý,
phân tích số liệu thống kê (Microsoft Excel).
22
PHẦN III. KẾT QUẢ NGHIÊN CỨU
Theo Thuyết minh/Hợp đồng thì đề tài cần thực hiện 3 nội dung chính sau:
(1)
Nội dung 1: Phân tích, xây dựng CSDL hệ protein huyết thanh người Việt Nam bình
thường và một số trạng thái bệnh lý (ĐTĐT2 và leukemia) bằng các kỹ thuật proteomics.
(2)
Nội dung 2: Nhận dạng và xác định các ứng viên chỉ thị protein (protein markers);
(3)
Nội dung 3: Thử nghiệm ứng dụng các chỉ thị protein;
Trong báo cáo này chúng tôi sẽ trình bày các kết quả nghiên cứu theo thứ tự nội dung đã
đăng kí.
1. NỘI DUNG 1 - Phân tích, xây dựng cơ sở dữ liệu hệ protein huyết
thanh người Việt Nam bình thường và một số trạng thái bệnh lý (đái tháo
đường type 2 và leukemia) bằng các kỹ thuật proteomics
Trong phần Nội dung 1 gồm 4 phần chính sau:
(1) Lựa chọn đối tượng nghiên cứu: gồm các mẫu người bình thường, các mẫu bệnh ĐTĐT2
và các mẫu leukemia.
(2) Tối ưu hóa các phương pháp xử lí, phân tách và phân tích mẫu bao gồm: (i) Xử lí các
mẫu huyết thanh; (ii) Phân tích các protein huyết thanh bằng điện di 2DE; (iii) Nhận diện
protein bằng hệ thống sắc ký lỏng nano đa chiều kết nối khối phổ.
(3) Phân tích các protein có biểu hiệ
n thay đổi (tăng, giảm hoặc biến mất) giữa mẫu protein
bền nhiệt, glycoprotein người bình thường và các trạng thái bệnh lý (ĐTĐT2, leukemia) ở
các thể/giai đoạn bệnh trên hình ảnh điện di 2DE kết hợp nhận dạng các protein có biến đổi
bằng phương pháp khối phổ.
(4) Xây dựng cơ sở dữ liệu các hệ protein trong huyết thanh người bình thường và bệnh lý
(ĐTĐT2, leukemia).
Minh họ
a quy trình thí nghiệm trong quá trình thực hiện đề tài được trình bày trong sơ đồ
Hình 2.
23
Hình 2. Sơ đồ quy trình thí nghiệm thực hiện đề tài
1.1. Lựa chọn đối tượng nghiên cứu
Phần tuyển chọn và thu thập đối tượng nghiên cứu bao gồm: (1) Mẫu máu/huyết thanh
người bình thường (100 mẫu); (2) Mẫu máu/huyết thanh người bệnh ĐTĐT2 (100 mẫu) và
(3) Mẫu máu/huyết thanh người bệnh leukemia (100 mẫu). Sau đây là những kết quả thu
thập các mẫu nghiên cứu.
1.1.1. Thu thập các mẫu máu người bình thường
Để có thể tìm hiểu những biến đổi về các peptide/ protein trong huyết thanh người bệnh
ĐTĐT2 và leukemia thì các mẫu người bình thường là một phần không thể thiếu. Chúng
được xem như các mẫu đối chứng để đối chiếu với những mẫu bệnh. Các số liệu nhận được
là cơ sở để xây dựng dữ liệu về hệ protein huyết thanh người Việt Nam bình thường, góp
phần nghiên cứu nhữ
ng thông số của người Việt Nam bình thường và nguồn để tra cứu các
24
biến đổi về protein huyết thanh trong các trạng thái bệnh lí. Mẫu người bình thường cần
phải đáp ứng đầy đủ các điều kiện được xây dựng phù hợp với yêu cầu nghiên cứu của đề
tài với số lượng là 100 mẫu. Đây là nội dung rất quan trọng quyết định đến các kết quả nhận
được của đề tài. Do đó việc lấy mẫu máu/huyết thanh ng
ười bình thường phải rất thận trọng
trong vấn đề lựa chọn đối tượng cung cấp mẫu và bảo quản mẫu phục vụ nghiên cứu.
Đối tượng lấy mẫu: là những người bình thường, có độ tuổi từ 16 đến 50, là những cán bộ,
thanh niên, học sinh đang làm việc, học tập tại Viện Công nghệ sinh học và Trường PTTH
Dân tộc Nội trú tỉnh Quảng Ninh. Các đối tượ
ng được lựa chọn thông qua phỏng vấn và xét
nghiệm các chỉ số hóa sinh huyết học cơ bản cũng như về chiều cao, cân nặng, huyết áp ).
Mẫu người bình thường phục vụ cho đề tài phải đảm bảo một số yêu cầu sau:
(i) Là người khỏe mạnh, các chỉ số sinh hóa máu đều ở mức bình thường (đường
huyết, các chỉ số về cholesterol, HDLC và LDLC, triglyceride );
(ii) Gia đình ngườ
i đó có tiền sử ba đời (cả bên nội và bên ngoại bao gồm ông bà,
cha mẹ, anh chị em ruột của đối tượng cung cấp mẫu) không mắc các bệnh ung
thư, đái tháo đường type 2 và các bệnh di truyền khác);
(iii) Tự nguyện cung cấp mẫu máu/huyết thanh cho đề tài phục vụ nghiên cứu.
Từ những yêu cầu đó, Phiếu khai lấy mẫu đã được xây dựng cho yêu cầu lấy mẫu máu
người bình th
ường (Phụ lục 1). Mỗi đối tượng cung cấp mẫu đều có một phiếu khai. Mẫu
được đánh số thứ tự từ 1-100. Các phiếu khai lấy mẫu được lưu giữ trong hồ sơ gốc của đề
tài.
Phương pháp lấy mẫu
Người cung cấp mẫu nhịn ăn từ sau bữa tối hôm trước cho đến sáng hôm sau (khoảng 14-16
giờ) để lấy mẫu. Máu được lấ
y từ ven bằng siranh vô trùng, mỗi người được lấy khoảng 5
ml máu rồi chia vào các eppendorf 1.5 ml. Mẫu được để yên tĩnh tại nhiệt độ phòng trong
khoảng từ 2-3 giờ rồi tiến hành li tâm tách huyết thanh ở 5000 vòng/15 phút. Huyết thanh
(không lẫn hồng cầu) được tách ra và cho vào các eppendorf vô trùng, chia nhỏ để đủ dùng
cho các thí nghiệm và bảo quản ở -80°C cho đến khi sử dụng và đưa xét nghiệm các chỉ tiêu
sinh hóa máu.
Kết quả lấy mẫu
Danh sách 100 mẫu ngườ
i bình thường được để trong Phụ lục 2. 30 mẫu được lựa chọn
(Bảng 4) để tiến hành phân tích (gồm 16 nữ và 14 nam) hệ protein huyết thanh.
Bảng 4. Danh sách mẫu thường được lựa chọn nghiên cứu (n=30)
STT Ký hiệu
mẫu
Tên người cung cấp mẫu tình
nguyện
Giới tính
1 BT01 Trần Thị Minh N Nữ
2 BT05 Nguyễn Tiến D Nam