THỰC TẬP BIOINFORMATICS
THỰC TẬP BIOINFORMATICS
ĐẠI CƯƠNG
ĐẠI CƯƠNG
NGÀNH CÔNG NGHỆ SINH HỌC
ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA SINH HỌC
CBGD: Nguyễn Thái Minh Quân
Võ Trí Nam
Bài 1 - CSDL SH và PP khai thác thô
ng tin
Slide 2
NỘI DUNG THỰC TẬP
•
Bài 1: Cơ sở dữ liệu sinh học và phương pháp
khai thác thông tin trên internet
•
Bài 2: Khai thác cơ sở dữ liệu PubMed,
Nucleotide, Protein trong NCBI
•
Bài 3: Thiết kế mồi (primer)
•
Bài 4: So sánh các trình tự sinh học
•
Bài 5: Vẽ cây phát sinh loài
•
Bài 6: Bài tập tổng hợp
Bài 1 - CSDL SH và PP khai thác thô
ng tin
Slide 3
Internet là gì ?
•
Internet là tập hợp các tất cả các máy tính trên thế giới,
mà chúng có thể kết nối với nhau và trao đổi thông tin lẫn
nhau.
•
2004 - 160 triệu máy chủ kết nối giữa 150 nước, trên 55
triệu trang web, trên 600 triệu người truy cập vào Internet
mỗi ngày
Bài 1 - CSDL SH và PP khai thác thô
ng tin
Slide 4
Bioinformatics là gì?
•
Bioinformatics cổ điển: sử dụng máy tính để lưu trữ,
truy vấn, phân tích cấu trúc phân tử sinh học
•
Bioinformatics hiện đại
–
Theo NCBI: Sự kết hợp giữa Công nghệ Sinh học và Công
nghệ thông tin với mục tiêu giúp hiểu biết và khám phá những
nguyên lí trong Sinh học
–
Human Genome Project
–
Genomics, Functional Genomics, Proteomics, Medical
Informatics
Bài 1 - CSDL SH và PP khai thác thô
ng tin
Slide 5
SƠ LƯỢC LỊCH SỬ
•
1960s: CSDL đầu tiên về trình tự protein
•
1960s - 1970s: Phát triển thuật giải để
phân tích dữ liệu
•
1980s: thành lập CSDL GenBank và một
số CSDL khác (EMBL, DDBJ, …)
•
1990s: Sự phát triển chóng mặt của
GenBank và PDB
•
1991: Thuật ngữ Bioinformatics xuất hiện
Bài 1 - CSDL SH và PP khai thác thô
ng tin
Slide 6
Bioinformatics là gì? (tt)
•
Xây dựng các cơ sở dữ liệu
•
Phát triển các thuật giải và các phương pháp
thống kê
•
Sử dụng các công cụ tin sinh học được xây
dựng để phân tích và thông dịch nguồn dữ liệu
sinh học