Tải bản đầy đủ (.docx) (35 trang)

Đồ án công nghệ ( Khoa Hóa) ĐHBK Đà Nẵng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.24 MB, 35 trang )

Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Mục lục
DANH SÁCH CÁC BẢNG, HÌNH VẼ.........................................................................1
MỞ ĐẦU......................................................................................................................2
Chương 1: TỔNG QUAN TÀI LIỆU............................................................................3
1.1. Covid-19.............................................................................................................3
1.1.1. Nguồn gốc, sự phát hiện...............................................................................3
1.1.2. Đặc điểm cấu tạo..........................................................................................3
1.1.3. Đặc điểm dịch tể..........................................................................................4
1.1.4. Thống kê số liệu về Covid-19......................................................................4
1.2. Sự thay đổi sau dịch mã....................................................................................6
1.2.1 Định nghĩa dịch mã.......................................................................................6
1.2.3 Vai trò của protein.........................................................................................7
1.2.4 Điều khiển sau dịch mã.................................................................................8
1.2.5 Các cách nghiên cứu về sự thay đổi sau dịch mã........................................11
1.2.6 Các công cụ tin sinh học trong nghiên cứu thay đổi sau dịch mã................11
1.2.7 Ý nghĩa của việc nghiên cứu thay đổi sau dịch mã.....................................12
CHƯƠNG 2: ỨNG DỤNG TIN SINH HỌC TÌM KIẾM THAY ĐỔI SAU DỊCH MÃ
..................................................................................................................................... 13
2.1 Vật liệu..............................................................................................................13
2.1.1 Trình tự protein...........................................................................................13
2.1.2 Công cụ.......................................................................................................13
2.2 Phương pháp tìm kiếm.......................................................................................13
2.2.1 Phương pháp tìm kiếm Fatty Acylation.......................................................13
2.2.2 Phương pháp tìm kiếm Phosphorylation.....................................................21
2.2.2 Phương pháp tìm kiếm Glycosylation.........................................................26
KẾT LUẬN.................................................................................................................27
TÀI LIỆU THAM KHẢO...........................................................................................28



Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
0


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

DANH SÁCH CÁC BẢNG, HÌNH VẼ
Hình 1.1 Các triệu chứng của 2019 – nCoV.
Hình 1.2 Biểu đồ thể hiện tổng số ca nhiễm, số ca khỏi bệnh và đang điều trị.
Hình 1.3 10 quốc gia và vùng lãnh thổ ghi nhận nhiều trường hợp nhiễm bệnh nhất
hiện nay.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
1


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

MỞ ĐẦU

Protein là thành phần thiết yếu của cơ thể sinh vật, tham gia

vào mọi quá trinh bên trong tế bào. Tuy nhiên vai trò của protein
chưa thực sự thể hiện sau quá trinh dịch mã. Các thay đổi sau dịch
mã của protein đóng vai trò quan trọng trong việc xác định chức
năng cụ thể cho từng loại protein khác nhau. Nghiên cứu sau dịch
mã hiện nay chủ yếu tập trung bằng các công cụ tin sinh học. Tin
sinh học cung cấp các công cụ cho phép phân tích, tìm kiểm các
thay đổi sau dịch mã của protein một cách hiệu quả, nhanh chóng,
đặc biệt với các protein mới và khó tiếp cận như các protein của
covid 19. Hiện nay chúng ta đang phải hết minh nổ lực chống lại đại
dịch toàn cầu do virus Covid-19 gây ra. Vì vậy, việc xác định thay đổi
protein sau dịch mã của virus Covid-19 đóng vai trò quan trọng
nghiên cứu cách thức hoạt động và điều trị các bệnh do virus này
gây ra.
Trong tập đồ án này, tôi sẽ trình bày tổng quan về tình hình
dịch bệnh do covid gây, ra, các vần đề lí thuyết về biến đổi sau dich
mã. Đồng thời, kết quả tìm kiếm các thay đổi sau dich mã của
protein từ covid bằng công cụ tin sinh học cũng được thể hiện.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
2


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Chương 1: TỔNG QUAN TÀI LIỆU


1.1. Covid-19.
1.1.1. Nguồn gốc, sự phát hiện.
Dịch bệnh do virus Covid-19 gây ra bắt đầu xuất hiện từ cuối tháng 12 năm
2019, được ghi nhận đầu tiên ở thành phố Vũ Hán, thuộc tỉnh Hồ Bắc, miền nam
Trung Quốc. Nguyên nhân ban đầu được cho là do giết hại các loài đông vật hoang dã,
mà cụ thể là dơ tại chợ hải sản Hoa Nam. Tuy nhiên, đến hiện nay nguồn gốc của loại
virus này vẫn đang gây tranh cãi.
Virus Covid-19 là chủng thứ bảy trong họ Coronavirus, được biết đến chủ yếu
gây ra các bệnh ở động vật, nhưng đã tiến hóa và lây nhiễm sang người. [1]
1.1.2. Đặc điểm cấu tạo.
Coronavirus là một nhóm gồm các loại virus thuộc phân họ Coronavirinae
trong họ Coronaviridae, theo bộ Nidovirales. Coronavirus gây bệnh ở các loài động
vật có vú, bao gồm cả con người và chim.
Phân họ Coronavirus được phân loại thành bốn chi: Alpha, Beta, Gamma và
Delta Coronavirus. Nhìn chung, Alphacoronaviruses và Betacoronaviruses có thể lây
nhiễm cho động vật có vú trong khi đó Gammacoronaviruses và Deltacoronaviruses
lây nhiễm cho chim, nhưng một số trong chúng cũng có thể lây nhiễm ở động vật có
vú.
Các Coronavirus là các RNA virus có kích thước trung binh, có tên bắt nguồn
từ hình dạng giống như vương miện đặc trưng của chúng (Corona trong tiếng La tinh
nghĩa là vương miện). Những virus này có bộ gen lớn nhất được biết đến trong họ
RNA virus, với chiều dài từ 27 đến 32kb. Bộ gen cấu trúc gồm 4 hoặc 5 loại protein
cấu trúc: S, M, N, HE, E.
- Protein spike (S) tạo thành các gai đặc trưng trong “vương miện”
coronavirus. Nó bị glycosyl hóa mạnh, có thể tạo thành một homotrimer, và là receptor
giúp gắn và hợp nhất với màng tế bào vật chủ. Các thành phần của protein S là kháng
nguyên chính kích thích kháng thể trung hòa, cũng như là mục tiêu quan trọng của tế
bào lympho gây độc tế bào.
- Protein M đóng vai trò quan trọng trong sự lắp ráp virus.
- Protein nucleocapsid (N) liên kết với bộ gen RNA để tạo thành

nucleocapsid. Nó có thể tham gia vào quá trình điều hòa tổng hợp RNA của virus và
có thể tương tác với protein M trong quá trình nảy chồi của virus.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
3


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

- Protein nucleocapsid (N) liên kết với bộ gen RNA để tạo thành
nucleocapsid. Nó có thể tham gia vào quá trình điều hòa tổng hợp RNA của virus và
có thể tương tác với protein M trong quá trình nảy chồi của virus.
- Protein E: Chức năng của nó không được biết đến, mặc dù, trong SARSCoV, protein E cùng với M và N là cần thiết để lắp ráp và giải phóng virus.
1.1.3. Đặc điểm dịch tể.
Người bị nhiễm bệnh do virus Covid-19 gây ra thường có các biểu hiện: sốt,
mệt mỏi, ho khan, khó thở, suy hô hấp và có thể dẫn đến tử vong. Trong thời gian
nhiễm bệnh, lượng bạch cầu trong máu giảm. Thời gian ủ bệnh có thể kéo dài từ 2 đến
14 ngày trước khi biểu hiện ra các triệu chứng cụ thể. thông qua tiếp xúc trực tiếp với
giọt bắn ra từ đường hô hấp người bị nhiễm bệnh hoặc gián tiếp qua tiếp xúc với các
chất tiết của người bệnh qua đồ vật, môi trường xung quanh. Miễn dịch phát triển ngay
sau khi bị nhiễm trùng nhưng dần dần mất đi theo thời gian. Tái nhiễm là phổ biến, có
lẽ là do sự tạo thành đáp ứng miễn dịch yếu, cũng có thể là do biến đổi kháng nguyên
trong loài.
Những đánh giá ban đầu của tạp chí Bloomberg NY ngày
22/1/2020 cho thấy đa số các bệnh nhân nhiễm SARS-CoV-2 tử vong
là nam giới và tuổi trung bình của nhóm bệnh nhân tử vong là 72

tuổi, trong số này có đến 83% bệnh nhân tử vong là trên 65 tuổi.
Trong số những bệnh nhân tử vong có tới 50% bệnh nhân mắc các
bệnh mạn tính kèm theo. Như vậy, dựa vào các thống kê có được,
chúng ta có thể nói là những người lớn tuổi, có bệnh mạn tính, hệ
miễn dịch yếu ... là những người có nguy cơ tử vong cao nhất vì bệnh
Covid-19. [2]
Hình 1.1 Các triệu chứng của 2019 n-CoV.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
4


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

1.1.4. Thống kê số liệu về Covid-19.
Ca nhiễm Covid-19 đầu tiên ở Việt Nam được ghi nhận vào ngày 23 tháng 1
năm 2020. Tính đến thời điểm hiện tại, ngày 20 tháng 4 năm 2020 Việt Nam đã ghi
nhận 268 ca nhiễm, trong đó đã điều trị khỏi bệnh 214 người, và chưa ghi nhận trường
hợp tử vong nào [1]. Trong đó 29 tỉnh thành ở Việt Nam đã có ca nhiễm.
Hình 1.2 Biểu đồ thể hiện tổng số ca nhiễm, số ca khỏi bệnh và đang điều trị.

Từ ca nhiễm đầu tiên ở thành phố Vũ Hán, tỉnh Hồ Nam, Trung Quốc, số ca
nhiễm Covid-19 tăng không kiểm soát, tinh đến nay đã ghi nhận 2.402.076 ca nhiễm
bệnh, trong đó có 623.911 ca đã điều trị thành công, tuy nhiên có đến 165.106 người tử
vong trong đại dịch này. Có 228 quốc gia và vùng lãnh thổ đã xác nhận có ca nhiễm
bệnh.


Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
5


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
6


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Hình 1.3 10 quốc gia và vùng lãnh thổ ghi nhận nhiều trường hợp nhiễm bệnh nhất
hiện nay.
Xác nhận

Tử vong

Hồi
phục


2.402.0
76

165.1
06

623.9
11

Hoa Kỳ

764.177

40.591

70.172

Tây Ban Nha

198.674

21.238

77.357

Ý

178.972

23.660


47.055

Đức

145.184

4.586

83.438

vương quốc Anh

120.067

16.060

0

Pháp

112.606

19.718

36.578

Thổ Nhĩ Kỳ

86.306


2.107

11.976

82.747

4.632

77.084

Iran

82.211

5.118

57.023

Nga

42.853

361

3.291

Brasil

38.654


2.462

14.026

Địa điểm
Tổng quốc
gia và vùng
thổ

lãnh

Trung Quốc đại
lục

Khẳng định rằng đại dịch Covid-19 hiện đang ảnh hưởng rất lớn và gây thiệt
hại trên phạm vi toàn cầu. Không những ảnh hưởng nghiêm trọng đến y tế, giao dục
mỗi quốc gia, khu vực mà còn gây ra những thiệt hại lớn về kinh tế, chinh trị, và nạn
phân biệt chủng tộc được đẩy lên cao.
1.2. Sự thay đổi sau dịch mã.
1.2.1 Định nghĩa dịch mã.
Thông tin di truyền được dịch thành các trinh tự các amino acid có bản chất hóa
học và kiểu liên kết khác nhau.
Các sản phẩm phiên mã được dịch mã ở các mức độ khác nhau.
Sản phẩm dịch mã có cấu trúc và chức năng đa dạng.
Protein không bên vững và bị phá hủy sau một thời gian nhất định.
Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
7



Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Hệ thống thông tin sử dụng rất nhiều protein post-translational modification để
chuyển thông tin trong suốt lộ trình tín hiệu. Cơ chế cơ bản là khi chất kích thích hoạt
hóa thành phần A, thành phần A này sau đó sẽ hoạt động trên thành phần B để tạo ra
sự biến đổi cấu trúc trong suốt sự điều chỉnh. Sự điều chỉnh này thực hiện chức năng
truyền tin của nó và thông thường rất chuyên biệt do vậy nó trực tiếp thay đổi cấu trúc
các tiểu phân amino acid trên protein bằng các cách sau đây:
1.2.2 Cấu trúc không gian protein.
Chuỗi polypeptide sau khi dịch mã tiếp tục biến đổi theo nhiều con đường để
hình thành nên hình dạng 3D và ở kết quả của giai đoạn cuộn gập protein (protein
folding) thành những cấu trúc 3 chiều xác định lên chức năng của nó. Cấu trúc protein
được phân chia thành 4 cấp:
- Cấu trúc sơ cấp hay cấu trúc bậc 1: Là trình tự sắp xếp các gốc axit amino
trong chuỗi polypeptide. Cấu trúc này được giữ vững nhờ liên kết peptide (liên kết
cộng hóa trị). Một protein là polyamide (poliamit).
- Cấu trúc bậc 2: Là tương tác không gian giữa các gốc axit amino ở gần nhau
trong chuỗi polypeptide. Cấu trúc được bền vững chủ yếu nhờ liên kết hiđrô hình
thành giữa các liên kết peptide ở kề gần nhau, cách nhau những khoảng xác định. Cấu
trúc bậc 2 của phân tử protein là xoắn α (α-helix), phiến gấp nếp β (β-sheet) và các
vùng chuyển hướng. Bởi vì cấu trúc bậc 2 mang tính cục bộ, nhiều vùng với các cấu
trúc bậc 2 khác nhau có thể tồn tại trong cùng một phân tử protein.
- Cấu trúc bậc 3: hình dạng tổng thể của một phân tử protein đơn nhất; hay mối
quan hệ không gian giữa các cấu trúc bậc 2 với nhau. Nói chung cấu trúc bậc 3 được
giữ ổn định bởi các tương tác phi cục bộ, phần lớn bởi sự hình thành một lõi kị nước
(hydrophobic core), và ngoài ra giữ bởi các cầu muối (salt bridge), liên kết hiđrô, liên

kết disulfide, và thậm chí là các chỉnh sửa sau dịch mã (post-translational
modification). Thuật ngữ "cấu trúc bậc 3" thường được sử dụng mang nội dung đồng
nghĩa với thuật ngữ uốn gấp. Cấu trúc bậc 3 kiểm soát chức năng cơ bản của protein.
- Cấu trúc bậc 4: cấu trúc hình thành bởi một số phân tử protein liên kết với
nhau (chuỗi polypeptide), mà hay gặp thuật ngữ tiểu đơn vị protein trong trường hợp
này, mà chức năng của cấu trúc bậc 4 hoạt động như một phức hợp protein.
1.2.3 Vai trò của protein.
- Protein là thành phần thiết yếu của cơ thể sinh vật và tham gia vào mọi quá
trình bên trong tế bào. Nhiều protein là những enzyme làm chất xúc tác cho các phản
ứng hóa sinh và cần thiết cho trao đổi chất.
- Protein cũng có chức năng làm cấu trúc hoặc vận động, như actin và myosin ở
cơ và protein trong bộ khung tế bào, tạo nên hệ thống các khung đỡ giúp duy trì hình
dáng nhất định của tế bào.
- Các protein khác tham gia vào tín hiệu tế bào, đáp ứng miễn dịch, kết dính tế
bào, và chu kỳ tế bào, điều hòa các hoat động sinh lý. Hormone insulin và glucagon do
Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
8


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

tế bào đảo tụy (beta cell) thuộc tuyến tụy tiết ra có tác dụng điều hòa hàm lượng đường
glucose trong máu động vật có xương sống.
- Ngoài ra còn tham gia vào quá trinh vận chuyển các chất. Ví dụ như huyết sắc
tố hemoglobin có chứa trong hồng cầu động vật có xương sống có vai trò vận chuyển
oxy từ phổi đi theo máu nuôi các tế bào.

- Bảo vệ cơ thể chống bệnh tật.
- Dự trữ chất dinh dưỡng.
- Ở động vật, protein cần thiết phải có trong bữa ăn để cung cấp các axit amin
thiết yếu mà không thể tổng hợp. Quá trình tiêu hóa làm gãy các protein để sử dụng
trong trao đổi chất.
1.2.4 Điều khiển sau dịch mã.
Chuỗi peptide được giải phóng bởi ribosome không phải là phân tử protein có
chức năng sinh học, cần phải qua quá trình xử lý mới mang hoạt tính sinh học. Sửa
chữa chuỗi peptide bao gồm hình thành cấu trúc cao cấp, kết hợp với các tiểu đơn vị,
sửa đổi giá trị chung.
Protein sau quá trình sinh tổng hợp có nhiều dạng, trong đó dạng chính là dạng
cắt và sửa chữa hóa học. Yếu tố ảnh hưởng đến dịch mã protein tạo thành một khâu
trong biểu hiện gen
1, Sửa đổi hóa học dư lượng axit amin trong chuỗi peptide
Hệ thống thông tin sử dụng rất nhiều protein post-translational modification để
chuyển thông tin trong suốt lộ trình tín hiệu. Cơ chế cơ bản là khi chất kích thích hoạt
hóa thành phần A, thành phần A này sau đó sẽ hoạt động trên thành phần B để tạo ra
sự biến đổi cấu trúc trong suốt sự điều chỉnh. Sự điều chỉnh này thực hiện chức năng
truyền tin của nó và thông thường rất chuyên biệt do vậy nó trực tiếp thay đổi cấu trúc
các tiểu phân amino acid trên protein bằng các cách sau đây:
-

Phosphoryl hóa protein:

Protein kinase và phosphatase biến đổi hoạt tính của protein bằng cách gắn
hoặc loại bỏ góc phosphate. Tế bào biểu hiện một lượng khổng lồ các protein kinase
đáp ứng cho các thành phần tín hiệu như là một cơ chế truyền tin chính. Trong một vài
trường hợp, các kinase có thể phosphoryl hóa lẫn nhau để tạo ra một dòng thác tín
hiệu. Ví dụ kinh điển cho trường hợp này là lộ trình tín hiệu MAPK. Các kinase được
chia thành hai nhóm chính phụ thuộc vào tiểu phân amino acid nó phosphoryl hóa gồm

có: Tyrosine kinase và serine/threonine kinase. Những kinase này có nhiều hình dạng
khác nhau và đều là một thành phần chức năng không thể thiếu của các thụ thể trên
màng tế bào. Ngoài ra, các kinase không phụ thuộc thụ thể cũng có tác dụng trong
nhiều vùng khác nhau của tế bào.
Các kinase này có thể trở thành yếu tố khởi phát cho một lộ trình tín hiệu của
các thụ thể tyrosine kinase và serine/threonine kinase.
Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
9


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Phần lớn các kinase không liên quan đến thụ thể nhưng hoạt động trong tế bào
như một phần của dòng thác tín hiệu nội bào. Họ Src, Lck, Lyn, Fyn và Syk là những
kinase không liên quan đến thụ thể là thành phần quan trọng trong các lộ trình tín hiệu
của tế bào T và dưỡng bào. Họ Tec tyrosine kinase cũng đóng vai trò quan trọng trong
sự truyền tin sớm của lymphocyte.
Hầu hết các lộ trình tín hiệu sử dụng non-receptor serine/threonine protein
kinase như một vài chặn trong suốt quá trình truyền tin.
-

Acetyl hóa:
Chủ yếu diễn ra ở amino ß của lysine α trêm đầu cuối N.

Quá trình này đóng một vai trò quan trọng trong hiện tượng tái cấu trúc
chromatin và liên quan đến sự hoạt hóa quá trình phiên mã. Histone acetyltransferase

(HATs) có chức năng acetyl hóa histone để tháo xoắn chromatin, làm cho nó dễ dàng
tiếp cận với nhiều yếu tố phiên mã và do vậy hoạt hóa quá trình này. Hoạt động của
myocyte enhancer factor-2 (MEF2) là một ví dụ điển hình cho quá trình acetyl hóa và
phản ứng khử acetyl hóa được thực hiện bởi histone deacetylase (HDACs) và sirtuins.
-

Methyl hóa:
Diễn ra ở guanidino amino α, amino ß và arginine, cacboxyl α của đoạn cuối C
và cacboxyl của chuỗi Side.
Chức năng của protein có thể thay đổi bởi sự methyl hóa arginine hay lysine bởi
enzyme protein arginine methyltransferase (PRMTs) và Smyd-2. Các phản ứng methyl
hóa này sẽ bị đảo ngược bởi các enzyme demethylase như histone lysine-specific
demethylase (LSD1) có chức năng loại nhóm methyl khỏi p53.
– Ubiquitination: diễn ra ở amino α và amino ß.
– Chuyển nhóm amino: chủ yếu diễn ra ở amino α ở đoạn cuối N.
– Poly ADP glycosyl: chủ yếu diễn ra guanidino của arginine.
– Glycosyl hóa: Sự glycosyl hóa protein ở vị trí N là quá trình biến đổi sau dịch
mã được bảo tồn ở nấm men và các eukaryote khác. Sự glycosyl hóa ở vị trí O là việc
tạo liên kết cộng hóa trị giữa một monosaccharide với axit amin Ser hay Thr. Quá trình
sửa đổi giá trị chung ở mỗi loài có thể sử dụng men khác nhau. Sửa đổi giá trị chung
của mỗi loài đều có chức năng sinh lý quan trọng.[3]
2, Loại bỏ Met hoặc fMet ở đầu N chuỗi peptide
Trong sinh vật nhân sơ, axit amin thứ nhất của quá trình sinh tổng hợp protein
là formylmethionine, sinh vật nhân thực là methionine. Đầu N của protein trưởng
thành phần lớn là methionine, cần phải loại bỏ 1 hoặc nhiều hơn số axit amin ở đầu N.
Formyl trong axit amin này có thể được loại bỏ bằng men enzyme. Trong nhiều trường
hợp, sau khi đầu N của chuỗi peptide di chuyển ra ngoài ribosome, lập tức tiến hành
enzyme hóa. Loại bỏ methionine của đầu N cũng có thể xảy ra trong quá trình khởi
đầu sinh tổng hợp, nhưng quá trình này lại bị ảnh hưởng bởi nếp gấp của chuỗi peptide
Sinh viên thực hiện: Văn Thị Tú


Hướng dẫn: TS. Tạ Ngọc Ly
10


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

3, Loại bỏ peptide tín hiệu
Protein ngoài tác dụng di chuyển tự do trong tế bào chất ra, một phần còn tiết ra
bên ngoài tế bào và định vị tại hệ thống màng. Tế bào sinh vật nhân thực khá phức tạp,
protein không chỉ quyết định chủng loại của màng tế bào.
Trong protein màng tế bào của phần lớn các loại vi khuẩn, đầu N đều có peptide
tín hiệu dài khoảng 15-30 axitamin. Nửa trên của peptide tín hiệu chứa nhiều arginine
và lysine, có điện tích dương; nửa dưới chủ yếu là axit amin kỵ nước, có khoảng 15-20
axit amin. Đoạn axit amin này có thể hình thành cấu trúc xoắn anpha,trình tự của
peptide tín hiệu khẩn cấp cũng có thể hình thành cấu trúc xoắn anpha. Hai đầu xoắn
anpha hình thành cấu trúc hình kẹp dạng song song ngược chiều, có thể đi vào tầng
lipid kép một cách dễ dàng. Chuỗi peptide tổng hợp có thể xuyên qua màng. Nếu là
protein màng trong, sẽ có 1 hoặc nhiều đoạn kết hợp với nhau tại nội mạc. Khi phần
giữa hai đầu anpha có kết cấu kẹp đến được bề mặt ngoài của nội mạc, peptidase tín
hiệu nằm tại bề mặt ngoài nội mạc sẽ tách khỏi peptide tín hiệu.
Protein được tổng hợp trong tế bào sinh vật nhân thực làm thế nào để đến được
các vị trí được quyết định bởi tín hiệu vận chuyển của protein. Nếu không có tín hiệu
vận chuyển, protein sẽ được giữ lại tế bào. Định vị tế bào khác nhau cần tín hiệu vận
chuyển khác nhau. Protein bề mặt tế bào, protein bài tiết, protein hòa tan có peptide tín
hiệu giống như sinh vật nhân sơ, nằm ở đầu N, dài khoảng 15-30 axit amin, phần lớn
là axit amin kỵ nước. giáp đầu N có vài arginine và lysine mang điện tích dương.
Peptide tín hiệu của sinh vật nhân thực cũng có thể hình thành cấu trúc kẹp xoắn

anpha. Hạt nhận biết peptide tín hiệu (SRP) có thể kết hợp với protein trên lưới nội
chất thô, đưa chuỗi peptide mới tổng hợp vào lưới nội chất thô, cuối cùng bài tiết vào
màng protein. Protein tổng hợp sau đó sẽ đi vào golgi và tiến hành sửa đổi tại đây, cố
định tại màng hoặc hình thành các túi bài tiết bài tiết ra ngoài tế bào.
4, Gập chuỗi peptide
Gập chuỗi peptide bắt đầu khi tổng hợp chuỗi peptide chưa kết thúc. Ribosome
có thể chứa chuỗi peptide dài 30-40 axit amin, ngay sau khi chuỗi peptide xuất hiện tại
ribosome, quá trình gập chuỗi peptide bắt đầu. sự hình thành cấu trúc tam cấp gần như
kết thúc cùng với quá trình tổng hợp chuỗi peptide, gập protein bắt đầu tại đầu N.
5, Loại bỏ đoạn peptide không cần thiết trong phân tử tiền chất.
Trong phân tử tiền chất của protein, có một số không cần thiết, không tồn tại
trong phân tử trưởng thành. Việc loại bỏ chuỗi peptide hoàn thành dưới tác dụng của
men thủy phân protein đặc tính. Nhiều hormon peptide và tiền chất men đều phải qua
quá trình này.
6, Sự hình thành liên kết disulfide
Trong phân tử mRNA không có mã cystine, có không ít phân tử protein có chứa
liên kết disulfide cystine, thậm chí có nhiều liên kết. Liên kết disulfide là gen chức
năng của protein, được hình thành thông qua axit sulfuric, có những liên kết được hình
thành trước khi đoạn peptide bị loại bỏ.
Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
11


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

7, Sửa đổi đầu N và đầu C của chuỗi polypeptide

Ở một số trường hợp, một đầu hoặc hai đầu polypeptide tổng hợp tiến hành sữa
chữa lại axit amin. Còn phát hiện có thể di chuyển dư lượng axit amin đến đầu N của
protein trưởng thành bằng tRNA hoạt hóa.
Ở sinh vật nhân thực, đầu N của phần lớn protein trong tế bào bị acetyl hóa. Acetyl
hóa dưới tác dụng của acetyl biến thành chất xúc tác, men này có tính lựa chọn đối với
axit amin đầu N. Đầu C của phần lớn polypeptide bị amin hoá, đặc biệt là kích thích tố
polypeptide. Amin hoá có thể bảo vệ polypeptide không bị thủy phân exonuclease.
Ngoài ra, đầu N còn có sự sửa đổi của Glucosamine và nhóm lipid.[4]
1.2.5 Các cách nghiên cứu về sự thay đổi sau dịch mã
Các phương pháp thường gặp để nghiên cứu cấu trúc và chức năng của protein
bao gồm kỹ thuật hóa mô miễn dịch (immunohistochemistry), gây đột biến định hướng
điểm (site-directed mutagenesis), tinh thể học tia X, cộng hưởng từ hạt nhân và khối
phổ kế.
1, Tinh thể học tia X:
Cách thông thường để xác định hình dáng một vật là trực tiếp nhìn vào nó. Với
các vật rất nhỏ như các phân tử, để xác định cấu trúc liên kết giữa các nguyên tử tạo
nên phân tử đó, ta cần dùng kinh hiển vi để phóng đại chúng lên hàng ngàn tỉ lần. Với
khả năng hiện có, kinh hiển vi điện tử (electron microscopes) cũng chỉ có thể phóng
đại lên vài tỉ lần. Lí do là do giới hạn nhiễu xạ (diffraction limit): để có thể nhìn thấy
một vật hoặc phân biệt được 2 vật điểm thì kích thước tối thiểu của vật hoặc khoảng
cách tối thiểu giữa hai vật điểm lớn hơn ½ lần bước sóng đang sử dụng.
Bước sóng của ánh sáng chỉ vào khoảng vài trăm nanometers còn các nguyên tử
thì có khoảng cách chỉ ở đơn vị hay bước sóng cần thiết để nhìn thấy các nguyên tử là
bước sóng của tia X. Nhưng ta không thể tạo kinh hiển vi tia X. Vì vậy đòi hỏi ta phải
dùng các kĩ thuật mang tính gián tiếp khác. Khi tia X chiếu vào tinh thể sẽ tương tác
với các electron hóa trị của các nguyên tử thành phần được phân bố trong không gian.
Các electron này sẽ tán xạ tia X ra các hướng, tùy vào sự sắp xếp trong không gian của
các nguyên tử. Một màn hình phía sau sẽ lưu lại vị trí tán xạ và cường độ tán xạ của tia
X. Sau khi có dữ liệu này rồi người ta sẽ dùng các công thức tính toán phức tạp để xác
định vị trí các electron bao quanh các nguyên tử và từ đó suy ra vị trí các nguyên tử.

Các mẫu nhiễu xạ thu được sẽ có mối quan hệ với vật phát tán các sóng chiếu tới nó
thông qua một phép toán biến đổi Fourier. Nếu mật độ các electron bao quanh mỗi
nguyên tử là một hàm toán học, thì mẫu nhiễu xạ tia X thu được tương ứng là biến đối
Fourier của hàm đó. Với tính chất có thể biến đổi ngược của phép biến đổi Fourier, ta
có thể dùng máy tính để xây dựng lại hình ảnh mật độ electron dựa vào ảnh mẫu nhiễu
xạ. PDB (Protein Data Bank) lưu trữ cấu trúc protein và các phân tử sinh học khác
miễn phí sử dụng. Để hiển thị cấu trúc 3D của chúng, ta dùng phần mềm RasMol hay
Pymol. Tuy nhiên khi sử dụng phương pháp này thì dễ phá hỏng mẫu phân tử sinh học,
kết quả thu được cần xem xét kĩ [5]
Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
12


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

2, Cộng hưởng từ hạt nhân:

1.2.6 Các công cụ tin sinh học trong nghiên cứu thay đổi sau
dịch mã
Tin sinh học có vai trò rất lớn đối với việc nghiên cứu về cấu trúc không gian
phân tử, sự đa dạng, tiến hóa của sinh vật
Cơ sở dữ liệu dùng để nghiên cứu các biến đổi sau dịch mã: ProteomeScout
Các công cụ tìm kiếm
-

Glycosylation

Fatty acylation
Phosphorylation
Sumoylation [6]

1.2.7 Ý nghĩa của việc nghiên cứu thay đổi sau dịch mã.
Nghiên cứu chức năng và cấu trúc của protein. Xác định chức năng sinh học
của protein trong tế bào sống, sự phát triển binh thường của các tế bào trong cơ thể
sinh vật.
Giải thích được nguyên nhân, cơ chế của các tính trạng binh thường hoặc bệnh
lý để có những chẩn đoán, điều trị chinh xác và hiệu quả hơn.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
13


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

CHƯƠNG 2: ỨNG DỤNG TIN SINH HỌC TÌM KIẾM THAY ĐỔI
SAU DỊCH MÃ
2.1 Vật liệu
2.1.1 Trình tự nucleotide
TTGATGGTCAAGTAGACTTATTTAGAAATGCCCGTAATGGTGTTCTTATTACAGAAGGTAGTGTTAAAGG
TTTACAACCATCTGTAGGTCCCAAACAAGCTAGTCTTAATGGAGTCACATTAATTGGAGAAGCCGTAAAA
ACACAGTTCAATTATTATAAGAAAGTTGATGGTGTTGTCCAACAATTACCTGAAACTTACTTTACTCAGA
GTAGAAATTTACAAGAATTTAAACCCAGGAGTCAAATGGAAATTGATTTCTTAGAATTAGCTATGGATGA
ATTCATTGAACGGTATAAATTAGAAGGCTATGCCTTCGAACATATCGTTTATGGAGATTTTAGTCATAGT

CAGTTAGGTGGTTTACATCTACTGATTGGACTAGCTAAACGTTTTAAGGAATCACCTTTTGAATTAGAAG
ATTTTATTCCTATGGACAGTACAGTTAAAAACTATTTCATAACAGATGCGCAAACAGGTTCATCTAAGTG
TGTGTGTTCTGTTATTGATTTATTACTTGATGATTTTGTTGAAATAATAAAATCCCAAGATTTATCTGTA
GTTTCTAAGGTTGTCAAAGTGACTATTGACTATACAGAAATTTCATTTATGCTTTGGTGTAAAGATGGCC
ATGTAGAAACATTTTACCCAAAATTACAATCTAGTCAAGCGTGGCAACCGGGTGTTGCTATGCCTAATCT
TTACAAAATGCAAAGAATGCTATTAGAAAAGTGTGACCTTCAAAATTATGGTGATAGTGCAACATTACCT
AAAGGCATAATGATGAATGTCGCAAAATATACTCAACTGTGTCAATATTTAAACACATTAACATTAGCTG
TACCCTATAATATGAGAGTTATACATTTTGGTGCTGGTTCTGATAAAGGAGTTGCACCAGGTACAGCTGT
TTTAAGACAGTGGTTGCCTACGGGTACGCTGCTTGTCGATTCAGATCTTAATGACTTTGTCTCTGATGCA
GATTCAACTTTGATTGGTGATTGTGCAACTGTACATACAGCTAATAAATGGGATCTCATTATTAGTGATA
TGTACGACCCTAAGACTAAAAATGTTACAAAAGAAAATGACTCTAAAGAGGGTTTTTTCACTTACATTTG
TGGGTTTATACAACAAAAGCTAGCTCTTGGAGGTTCCGTGGCTATAAAGATAACAGAACATTCTTGGAAT
GCTGATCTTTATAAGCTCATGGGACACTTCGCATGGTGGACAGCCTTTGTTACTAATGTGAATGCGTCAT
CATCTGAAGCATTTTTAATTGGATGTAATTATCTTGGCAAACCACGCGAACAAATAGATGGTTATGTCAT
GCATGCAAATTACATATTTTGGAGGAATACAAATCCAATTCAGTTGTCTTCCTATTCTTTATTTGACATG
AGTAAATTTCCCCTTAAATTAAGGGGTACTGCTGTTATGTCTTTAAAAGAAGGTCAAATCAATGATATGA
TTTTATCTCTTCTTAGTAAAGGTAGACTTATAATTAGAGAAAACAACAGAGTTGTTATTTCTAGTGATGT
TCTTGTTAACAACTAAACGAACAATGTTTGTTTTTCTTGTTTTATTGCCACTAGTCTCTAGTCAGTGTGT
TAATCTTACAACCAGAACTCAATTACCCCCTGCATACACTAATTCTTTCACACGTGGTGTTTATTACCCT
GACAAAGTTTTCAGATCCTCAGTTTTACATTCAACTCAGGACTTGTTCTTACCTTTCTTTTCCAATGTTA
CTTGGTTCCATGCTATACATGTCTCTGGGACCAATGGTACTAAGAGGTTTGATAACCCTGTCCTACCATT
TAATGATGGTGTTTATTTTGCTTCCACTGAGAAGTCTAACATAATAAGAGGCTGGATTTTTGGTACTACT
TTAGATTCGAAGACCCAGTCCCTACTTATTGTTAATAACGCTACTAATGTTGTTATTAAAGTCTGTGAAT
TTCAATTTTGTAATGATCCATTTTTGGGTGTTTATTACCACAAAAACAACAAAAGTTGGATGGAAAGTGA
GTTCAGAGTTTATTCTAGTGCGAATAATTGCACTTTTGAATATGTCTCTCAGCCTTTTCTTATGGACCTT
GAAGGAAAACAGGGTAATTTCAAAAATCTTAGGGAATTTGTGTTTAAGAATATTGATGGTTATTTTAAAA
TATATTCTAAGCACACGCCTATTAATTTAGTGCGTGATCTCCCTCAGGGTTTTTCGGCTTTAGAACCATT
GGTAGATTTGCCAATAGGTATTAACATCACTAGGTTTCAAACTTTACTTGCTTTACATAGAAGTTATTTG
ACTCCTGGTGATTCTTCTTCAGGTTGGACAGCTGGTGCTGCAGCTTATTATGTGGGTTATCTTCAACCTA
GGACTTTTCTATTAAAATATAATGAAAATGGAACCATTACAGATGCTGTAGACTGTGCACTTGACCCTCT

CTCAGAAACAAAGTGTACGTTGAAATCCTTCACTGTAGAAAAAGGAATCTATCAAACTTCTAACTTTAGA
GTCCAACCAACAGAATCTATTGTTAGATTTCCTAATATTACAAACTTGTGCCCTTTTGGTGAAGTTTTTA
ACGCCACCAGATTTGCATCTGTTTATGCTTGGAACAGGAAGAGAATCAGCAACTGTGTTGCTGATTATTC
TGTCCTATATAATTCCGCATCATTTTCCACTTTTAAGTGTTATGGAGTGTCTCCTACTAAATTAAATGAT
CTCTGCTTTACTAATGTCTATGCAGATTCATTTGTAATTAGAGGTGATGAAGTCAGACAAATCGCTCCAG
GGCAAACTGGAAAGATTGCTGATTATAATTATAAATTACCAGATGATTTTACAGGCTGCGTTATAGCTTG
GAATTCTAACAATCTTGATTCTAAGGTTGGTGGTAATTATAATTACCTGTATAGATTGTTTAGGAAGTCT
AATCTCAAACCTTTTGAGAGAGATATTTCAACTGAAATCTATCAGGCCGGTAGCACACCTTGTAATGGTG
TTGAAGGTTTTAATTGTTACTTTCCTTTACAATCATATGGTTTCCAACCCACTAATGGTGTTGGTTACCA
ACCATACAGAGTAGTAGTACTTTCTTTTGAACTTCTACATGCACCAGCAACTGTTTGTGGACCTAAAAAG
TCTACTAATTTGGTTAAAAACAAATGTGTCAATTTCAACTTCAATGGTTTAACAGGCACAGGTGTTCTTA
CTGAGTCTAACAAAAAGTTTCTGCCTTTCCAACAATTTGGCAGAGACATTGCTGACACTACTGATGCTGT
CCGTGATCCACAGACACTTGAGATTCTTGACATTACACCATGTTCTTTTGGTGGTGTCAGTGTTATAACA
CCAGGAACAAATACTTCTAACCAGGTTGCTGTTCTTTATCAGGATGTTAACTGCACAGAAGTCCCTGTTG
CTATTCATGCAGATCAACTTACTCCTACTTGGCGTGTTTATTCTACAGGTTCTAATGTTTTTCAAACACG
TGCAGGCTGTTTAATAGGGGCTGAACATGTCAACAACTCATATGAGTGTGACATACCCATTGGTGCAGGT
ATATGCGCTAGTTATCAGACTCAGACTAATTCTCCTCGGCGGGCACGTAGTGTAGCTAGTCAATCCATCA
Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
14


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.
TTGCCTACACTATGTCACTTGGTGCAGAAAATTCAGTTGCTTACTCTAATAACTCTATTGCCATACCCAC
AAATTTTACTATTAGTGTTACCACAGAAATTCTACCAGTGTCTATGACCAAGACATCAGTAGATTGTACA
ATGTACATTTGTGGTGATTCAACTGAATGCAGCAATCTTTTGTTGCAATATGGCAGTTTTTGTACACAAT
TAAACCGTGCTTTAACTGGAATAGCTGTTGAACAAGACAAAAACACCCAAGAAGTTTTTGCACAAGTCAA

ACAAATTTACAAAACACCACCAATTAAAGATTTTGGTGGTTTTAATTTTTCACAAATATTACCAGATCCA
TCAAAACCAAGCAAGAGGTCATTTATTGAAGATCTACTTTTCAACAAAGTGACACTTGCAGATGCTGGCT
TCATCAAACAATATGGTGATTGCCTTGGTGATATTGCTGCTAGAGACCTCATTTGTGCACAAAAGTTTAA
CGGCCTTACTGTTTTGCCACCTTTGCTCACAGATGAAATGATTGCTCAATACACTTCTGCACTGTTAGCG
GGTACAATCACTTCTGGTTGGACCTTTGGTGCAGGTGCTGCATTACAAATACCATTTGCTATGCAAATGG
CTTATAGGTTTAATGGTATTGGAGTTACACAGAATGTTCTCTATGAGAACCAAAAATTGATTGCCAACCA
ATTTAATAGTGCTATTGGCAAAATTCAAGACTCACTTTCTTCCACAGCAAGTGCACTTGGAAAACTTCAA
GATGTGGTCAACCAAAATGCACAAGCTTTAAACACGCTTGTTAAACAACTTAGCTCCAATTTTGGTGCAA
TTTCAAGTGTTTTAAATGATATCCTTTCACGTCTTGACAAAGTTGAGGCTGAAGTGCAAATTGATAGGTT
GATCACAGGCAGACTTCAAAGTTTGCAGACATATGTGACTCAACAATTAATTAGAGCTGCAGAAATCAGA
GCTTCTGCTAATCTTGCTGCTACTAAAATGTCAGAGTGTGTACTTGGACAATCAAAAAGAGTTGATTTTT
GTGGAAAGGGCTATCATCTTATGTCCTTCCCTCAGTCAGCACCTCATGGTGTAGTCTTCTTGCATGTGAC
TTATGTCCCTGCACAAGAAAAGAACTTCACAACTGCTCCTGCCATTTGTCATGATGGAAAAGCACACTTT
CCTCGTGAAGGTGTCTTTGTTTCAAATGGCACACACTGGTTTGTAACACAAAGGAATTTTTATGAACCAC
AAATCATTACTACAGACAACACATTTGTGTCTGGTAACTGTGATGTTGTAATAGGAATTGTCAACAACAC
AGTTTATGATCCTTTGCAACCTGAATTAGA

2.1.2 Công cụ
LipoP 1.0
Netphos
NetOGly
Cơ sở dữ liệu NCBI
2.2 Phương pháp tìm kiếm
2.2.1 Phương pháp tìm kiếm Fatty Acylation
Sử dụng phần mềm LipoP 1.0 (Center for Biological Sequence Analysis
Technical University of Denmark)
2.2.1.1 Các bước thực hiện
i. Bước 1: Truy cập phần mềm LipoP 1.0
ii. Bước 2: Tải trình tự các nucleotide từ NCBI thành các đoạn ngắn 5000
nucleotide.

iii. Bước 3: Tải trình tự trên vào phần mềm LipoP 1.0 để dự đoán các thay đổi.
2.2.1.2 Kết quả:
Bao gồm 7 cột:
1. Trình tự nucleotide
2. Loại dự đoán. Tốt nhất có nghĩa là thứ hạng có điểm cao nhất, Margin cho sư khác
biệt giữa điểm cao thứ nhất và điểm cao thứ hai, thứ hạng cho điểm của các lớp khác
và đường tín hiệu chứa vị trí phân cắt dự đoán.
3. Loại tính năng
 SpI: peptide tín hiệu (peptidase tín hiệu I)
Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
15


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

 SpII: peptide tín hiệu lipoprotein (tín hiệu peptidase II)
 TMH: chuỗi xoắn xuyên màng n-terminal. Đây thường không phải là một dự
đoán rất đáng tin cậy và nên được kiểm tra. Phần này của mô hình chủ yếu ở đó
để tránh các vòng xoắn tranmembrane bị dự đoán sai là peptide tín hiệu.
 CYT: tế bào chất. Nó thực sự chỉ có nghĩa là tất cả phần còn lại. Điểm số cho
CYT luôn giống nhau.
 CleavI: Các vị trí phân tách cho (tín hiệu peptidase I).
 CleavII: Các vị trí phân cắt cho (tín hiệu peptidase II).
4. Vị trí trong chuỗi. Đối với các dòng có dự đoán lớp, nó luôn luôn là 1. Đối với các
vị trí phân cắt, nó là axit amin cuối cùng của peptide tín hiệu so với vị trí phân tách
được dự đoán.

5. Vị trí như trên cho thấy rằng đối với các vị trí phân cắt, nó là axit amin đầu tiên sau
vị trí phân tách.
6. Điểm. Đối với loại "Margin", đó là sự khác biệt giữa điểm số tốt nhất và điểm thứ
hai tốt nhất. Nếu không thì điểm log-odds.
7. Đối với các vị trí phân cắt, bối cảnh ± 5 được hiển thị sau dấu # và đối với các vị trí
phân cắt lipoprotein, axit amin trong postition +2 được hiển thị.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
16


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Dự đoán trình tự của nucletide từ 1đến 4999

Dự đoán tốt nhất là vị trí phân cắt giữa acid amin 29-30.
Có 31 vị trí phân cắt. Đa số được phân cắt theo peptidase tín hiệu 2.
Cột thứ 4 và 5 cho biết vị trí cắt giữa 2 acid amin.
Côt thứ 6 cho biết điểm, tức độ chính xác của dự đoán.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
17



Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
18


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Dự đoán trình tự của nucletide từ 2 đến 4999

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
19


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
20



Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Dự đoán trình tự của nucletide từ 10000 đến 14999.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
21


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Dự đoán trình tự của nucletide từ 15000 đến 19999.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
22


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.


Dự đoán trình tự nucleotide từ 20000 đến 24999.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
23


Tìm hiểu về thay đổi sau dịch mã của protein và các ứng dụng phần mềm tin sinh học để
tìm
kiếm các thay đổi này trong protein của virus covid-19.

Dự đoán trình tự nucleotide từ 25000 đến 29999.

Sinh viên thực hiện: Văn Thị Tú

Hướng dẫn: TS. Tạ Ngọc Ly
24


×