Tải bản đầy đủ (.ppt) (39 trang)

Tài liệu TIN SINH HỌC - CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.71 MB, 39 trang )

Người hướng dẫn: TS.VÕ VĂN TOÀN
Người thực hiện: TRẦN THỊ PHƯƠNG
ANH
Lớp: Sinh học thực nghiệm khóa 15
1. CƠ SỞ DỮ LIỆU SINH HỌC
CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC
1.1. Khái quát chung về cơ sở dữ liệu sinh học
Cơ sở dữ liệu sinh học (CSDL) trong chương này chủ
yếu đề cập đến các thông tin về trình tự Axit nucleic
(ADN, ARN), trình tự axit amin của các phân tử Protein,
thông tin về cấu trúc và giải phẫu của một số Genom, mô
hình cấu trúc không gian của các đại phân tử.
CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC
1.1. Khái quát chung về cơ sở dữ liệu sinh học

1.2. Cơ sở dữ liệu về các trình tự

1. CƠ SỞ DỮ LIỆU SINH HỌC
Năm cơ sở dữ liệu trình tự chính trên mạng Internet cung
cấp thông tin về trình tự Nucleotide và Protein:
-
The EMBL Nucleotide Sequence Database
-
The GenBank sequence database
-
The DNA Data Bank of Japan (DDBJ)
-
The Swiss-Prot
-
Protein Information Resource (PIR)
1.2. Cơ sở dữ liệu về các trình tự



Năm cơ sở dữ liệu trình tự chính trên mạng Internet cung
cấp thông tin về trình tự nucleotide và protein:
1.2. Cơ sở dữ liệu về các trình tự

a.EMBL Cơ sở dữ liệu trình tự nucleotide (còn được gọi
là ngân hàng EMBL) cấu thành tài nguyên trình tự
nucleotide chính của châu Âu.
CSDL của EMBL/EBI
Năm cơ sở dữ liệu trình tự chính trên mạng Internet cung
cấp thông tin về trình tự nucleotide và protein:
1.2. Cơ sở dữ liệu về các trình tự

a. EMBL Cơ sở dữ liệu trình tự nucleotide (còn được gọi
là ngân hàng EMBL) cấu thành tài nguyên trình tự
nucleotide chính của châu Âu.
b. GenBank là một phần của chương trình hợp tác quốc tế
về cơ sở dữ liệu trình tự nucleotide, bao gồm ngân hàng dữ
liệu ADN của Nhật Bản (DDBJ), Phòng thí nghiệm Sinh học
phân tử châu Âu (EMBL), và GenBank tại NCBI.
b. GenBank là một phần của chương trình hợp tác quốc tế
về cơ sở dữ liệu trình tự nucleotide, bao gồm ngân hàng dữ
liệu ADN của Nhật Bản (DDBJ), Phòng thí nghiệm Sinh học
phân tử châu Âu (EMBL), và GenBank tại NCBI.
GenBank là một bộ sưu tập của tất cả các trình tự DNA
được công khai. Trong GenBank các cá nhân, các nhà khoa
học từ khắp nơi trên thế giới, cũng như từ các trung tâm lớn
tham gia vào dự án nghiên cứu bộ gen con người. Số lượng
các trình tự DNA được lưu trữ trong cơ sở dữ liệu GenBank,
từ tất cả các sinh vật, gần đây đã đạt đến số lượng khổng lồ

và tiếp tục phát triển với một tốc độ nhanh chóng.
Năm cơ sở dữ liệu trình tự chính trên mạng Internet cung
cấp thông tin về trình tự nucleotide và protein:
1.2. Cơ sở dữ liệu về các trình tự

a. EMBL
b. GenBank
c. DDBJ
Ngân hàng dữ liệu DNA của Nhật Bản là ngân hàng dữ
liệu về các trình tự nucleotide duy nhất ở châu Á, đó là nơi
chính thức thu thập trình tự nucleotide được tìm ra bởi các
nhà nghiên cứu .Cơ sở dữ liệu này trao đổi các dữ liệu thu
thập với Cơ sở dữ liệu EMBL viện tin sinh học châu âu
và GenBank / NCBI trên cơ sở hàng ngày, ba cơ sở dữ liệu
chia sẻ dữ liệu hầu như tất cả dữ liệu tại bất kỳ thời gian nào.
CSDL của DDBJ
Năm cơ sở dữ liệu trình tự chính trên mạng Internet cung
cấp thông tin về trình tự nucleotide và protein:
1.2. Cơ sở dữ liệu về các trình tự

a. EMBL
b. GenBank
c. DDBJ
d. Swiss-Prot là một cơ sở dữ liệu protein. Cơ sở dữ liệu
này cố gắng để cung cấp những thông tin ở mức độ cao bao
gồm: các mô tả về chức năng của các protein và cấu trúc của
nó, sự cải biến sau phiên mã, các dạng biến đổi và những
thông tin khác.
Năm cơ sở dữ liệu trình tự chính trên mạng Internet cung
cấp thông tin về trình tự nucleotide và protein:

1.2. Cơ sở dữ liệu về các trình tự

a. EMBL
b. GenBank
c. DDBJ
d. Swiss-Prot
e. The Protein Information Resource (PIR) được tích hợp
tài nguyên sinh học công cộng để hỗ trợ nghiên cứu di
truyền, protein và nghiên cứu khoa học.
Hiện nay, PIR cung cấp các nguồn lực hàng đầu thế giới
để hỗ trợ các dữ liệu protein và di truyền.
CSDL của PIR
CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC
1.1. Khái quát chung về cơ sở dữ liệu sinh học

1.2. Cơ sở dữ liệu về các trình tự

Trong thập niên 70, các phương pháp cô lập trình tự ADN đã
được thành lập và ý tưởng về lập bản đồ toàn bộ bộ gen được hình
thành. Một số loài sinh vật (virút, E.coli, nấm men, ruồi giấm) đã
nhanh chóng được nghiên cứu. Một danh sách cập nhật của tất cả
các trình tự bộ gen hoàn toàn có sẵn tại

Thông tin về bộ gen của một số loài (con người, cây Arabidopsis,
Saccharomyces cerevisiae) được cung cấp bởi MIPS
( ) The Munich Information Center Protein
Sequences.
1. CƠ SỞ DỮ LIỆU SINH HỌC
CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC
1.1. Khái quát chung về cơ sở dữ liệu sinh học


1.2. Cơ sở dữ liệu về các trình tự

NCBI thành lập vào ngày 04 Tháng Mười Một 1988, như
một bộ phận của Thư viện Y khoa Quốc gia (NLM ) tại Viện
Y tế Quốc gia (NIH). NLM đã được lựa chọn do kinh nghiệm
của họ trong việc tạo ra và duy trì cơ sở dữ liệu y sinh học.
NIH là cơ sở nghiên cứu y sinh học lớn nhất trên thế giới.
1. CƠ SỞ DỮ LIỆU SINH HỌC
CSDL của NCBI
CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC
1.1. Khái quát chung về cơ sở dữ liệu sinh học

1.2. Cơ sở dữ liệu về các trình tự

Trình tự DNA
GenBank
/>Cơ sở dữ liệu Nucleotide EMBL
/>DDBJ (ngân hàng dữ liệu DNA Nhật Bản)
/>1. CƠ SỞ DỮ LIỆU SINH HỌC
CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC
1.1. Khái quát chung về cơ sở dữ liệu sinh học

1.2. Cơ sở dữ liệu về các trình tự

Trình tự Protein
UniProt (Universal Resource Protein)

bao gồm SWISS-PROT, TrEMBL, PIR
Cơ sở dữ liệu protein (NCBI)


1. CƠ SỞ DỮ LIỆU SINH HỌC
Trình tự Protein : UniProt (Universal Resource Protein)

CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC
1.1. Khái quát chung về cơ sở dữ liệu sinh học

1.2. Cơ sở dữ liệu về các trình tự

Protein cấu trúc
Ngân hàng dữ liệu protein (PDB)
/>cơ sở dữ liệu Mô hình hóa phân tử (NCBI)
/>1. CƠ SỞ DỮ LIỆU SINH HỌC
Protein cấu trúc: Ngân hàng dữ liệu protein (PDB)
/>PDB là kho lưu trữ duy nhất trên toàn thế giới, thông tin về các cấu
trúc 3D của các phân tử sinh học lớn, bao gồm cả protein và axit
nucleic. Đây là những phân tử của sự sống được tìm thấy trong tất
cả các sinh vật bao gồm vi khuẩn, nấm men, thực vật, ruồi, động vật
khác, và con người. Hiểu biết về hình dạng của một phân tử giúp
chúng ta hiểu nó hoạt động như thế nào. Kiến thức này có thể được
sử dụng để giúp suy ra vai trò của một cấu trúc trong sức khỏe con
người và bệnh tật, và trong thuốc phát triển. PDB miễn phí cho
người sử dụng. Các kho lưu trữ PDB được cập nhật thứ tư mỗi tuần.
Cơ sở dữ liệu di truyền
Toàn bộ hệ gen (NCBI)
(
Toàn bộ hệ gen vi sinh vật (TIGR)
/>hệ gen chưa chỉnh lý (TIGR)

Cơ sở dữ liệu mạch đơn nucleotide


Đột biến gen của con người

Các cơ sở dữ liệu có thể được tìm kiếm có hệ thống, bởi các từ
khoá, hoặc bằng trình tự giống nhau.
1.3. Cơ sở dữ liệu về các tác phẩm và sáng chế

Các trình duyệt Entrez cũng cung cấp khả năng tìm kiếm
MEDLINE (cơ sở dữ liệu về y học)
(
một cơ sở dữ liệu về ấn phẩm sinh học và y tế có thể được
truy cập tại Thư viện Y khoa Quốc gia. Trích dẫn bao gồm cả
thông tin về trình tự protein hoặc nucleotide được liên kết với các
cơ sở dữ liệu tương ứng và các trích dẫn khác có liên quan. Cơ sở
này cho phép tìm thấy một số lượng lớn các trích dẫn mà bạn
quan tâm một khi bạn đã tìm thấy một vài trích dẫn có liên quan,
và làm tăng khả năng tìm kiếm của bạn lên đáng kể.

×