7/5/2015
Khóa học:
Tin Sinh Học: Lắp ráp, Dự đoán,
Chú giải và Phân tích Hệ gen
Giảng viên:
TS. Nguyễn Cường
TS. Dương Quốc Chính
Trợ giảng:
Nguyễn Văn Lâm
Phạm Quang Huy
Nguyễn Quốc Đại
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
2
HỆ ĐIỀU HÀNH UBUNTU
VÀ TIN SINH HỌC
1
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
3
Giới thiệu về Ubuntu
• Ubuntu là một hệ điều hành máy tính dựa trên Debian
GNU/Linux, một bản phân phối Linux thông dụng.
• Ubuntu là phần mềm mã nguồn mở tự do
• Ubuntu đã cho ra đời nhiều phiên bản khác nhau
• Ubuntu Desktop cho máy tính để bàn
• Ubuntu Netbook Remix cho netbook (đã ngừng phát triển)
• Ubuntu Server cho các máy chủ
• Ubuntu Business Desktop Remix cho các doanh nghiệp
• Ubuntu for Android và Ubuntu for Phones cho các thiết bị
di động
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
4
Tại sao sử dụng Ubuntu trong Tin sinh học
• Hầu hết các phần mềm tin sinh học chỉ phát triển trên
Linux
• Linux có sẵn nhiều công cụ phục vụ cho việc tính toán, xử
lý số liệu nhanh (grep, word count, …)
2
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
5
Cài đặt hệ điều hành Ubuntu Desktop
• Truy cập để tải phần mềm
• Chọn Ubuntu desktop để tải phần cài đặt (định dạng iso)
Phiên bản sử dụng trong khóa học : Ubuntu v14.04.02
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
6
Yêu cầu hệ thống
• 1 GHz x86 processor (Pentium 4 or better)
• 1 gb of system memory (ram)
• 5 gb of disk space (at least 15 gb is recommended)
• Video support capable of 1024×768 resolution
• Audio support
• An Internet connection
3
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
7
Cài đặt hệ điều hành Ubuntu Desktop
Giải nén file iso chạy chương trình wubi
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
8
Cài đặt hệ điều hành Ubuntu Desktop
• Sau khi khởi động, nhấn phím E để vào giao
diện GNU GRUB.
• loop=/ubuntu/disks/root.disk ro rootflag\ rw
• Nhấn F10 để vào Ubuntu
• Vào Terminal , gõ lệnh sudo nautilus.
• Vào Computer, vào thư mục etc/grub.d và
mở file 10_lupin.
4
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
9
Cài đặt hệ điều hành Ubuntu Desktop
• Bạn tìm dòng: linux ${rel_dirname}/${basename}
root=${LINUX_HOST_DEVICE} loop=${loop_file_relative}ro ${args}
• Và sửa lại thành :linux ${rel_dirname}/${basename}
root=${LINUX_HOST_DEVICE} loop=${loop_file_relative}rw ${args}
Cuối cùng, bạn chạy Terminal, gõ lệnh sudo update-grub để hệ
thống cập nhật chỉnh sửa trên
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
10
Cài đặt hệ điều hành Ubuntu Desktop
5
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
11
Giới thiệu máy chủ
Cấu hình máy chủ
Genome
Lobi
Chip
Intel(R) Xeon(R) CPU X5650 @
2.67GHz, 24 processors
Intel(R) Xeon(R) CPU X5650 @
2.67GHz; 24 processors
Ram
198 G
64 G
HDD
6 TB
4 TB
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
12
Giới thiệu máy chủ
• Các học viện mã số từ 01-07 thực hiện trên máy chủ lobi
• Các học viện mã số từ 08-15 thực hiện trên máy chủ genome
• Truy cập máy chủ thông qua terminar trong Ubuntu
Câu lệnh: ssh <địa chỉ máy chủ> -p <địa chỉ cổng>
Địa chỉ công máy chủ genome: 22
Địa chỉ công máy chủ lobi: 2212
6
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
13
Truy cập máy chủ
Địa chỉ máy
chủ
Địa chỉ cổng
• Đối với không cài được song
song hệ điều hành Ubuntu
có thể sử dụng phần mềm
puTTY để truy cập máy chủ.
• Tải phần mềm:
Địa chỉ công máy chủ genome: 22
Địa chỉ công máy chủ lobi: 2212
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
14
Tải dữ liệu từ máy chủ
• Sử dụng phần mềm Filezilla
• Tải phần mềm:
/>• Chạy phần mềm cài đặt vừa tải
• Khởi động chương trình Filezilla
Chọn Quick connect để kết nối máy chủ
sftp:// Địa chỉ máy chủ
Tên tài khoản
Mật khẩu
Địa chỉ cổng
Địa chỉ công máy chủ genome: 22
Địa chỉ công máy chủ lobi: 2212
7
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
15
Tải dữ liệu từ máy chủ
Chọn đường dẫn đến thư mục
lưu trữ trên máy cá nhân
Chọn đường dẫn đến thư mục
chứa file cần tải trên máy chủ
Kích đúp chuột để
thực hiện tải file
Quá trình tải về
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
16
Các câu lệnh làm việc với thư mục
Lệnh
Chức năng
ls
Liệt kê nội dung trong thư mục
ls –a
Liệt kê toàn bộ nội dung trong thư mục (bao gồm cả các file
ẩn)
mkdir <tên thư mục> Tạo thư mục
rm –r <tên thư mục> Xóa thư mục
cd tên thư mục
Chuyển sang thư mục
cd
Chuyển về home
cd ~
Chuyển về home
cd ..
Chuyển về thư mục trước đó
cd ../../
Chuyển về thư mục thứ 2 trước đó
cd ../../../
Chuyển về thư mục thứ 3 trước đó
pwd
Hiển thị đường dẫn đến thư mục hiện hành
8
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
17
Cấu trúc thư mục trong máy chủ
Cấu trúc thư mục trong windows
Cấu trúc thư mục trong máy chủ
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
18
Bài tập 1
• Tạo thư mục mywork
(*tên không chứa các dấu cách, sử dụng ký tự “_” để thay thế*)
• Tạo thư mục con tin_sinh trong mywork
• Tạo thư mục con data trong tin_sinh
• Chuyển dữ liệu vào thư mục data
• Chuyển dữ liệu từ thư mục data sang tin_sinh
• Chuyển dữ liệu vào thư mục data
9
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
19
Một số mẹo nhỏ khi sử dụng
Một số mẹo giúp tránh lỗi khi gõ lệnh
• Copy/paste: Mọi ký tự được chọn khi giữ chuột trái đều được tự
động thực hiện lệnh copy. Lệnh paste được sử dụng bằng cách
nhấn chuột phải.
• Di chuyển các phím lên xuống để tìm những câu lệnh cũ đã nhập
• Sử dụng phím Tab hệ điều hành sẽ đề xuất sau khi gõ một phần
của lệnh
• Sử dụng lệnh history để xem lịch sử các câu lệnh
• Sử dụng lệnh history|grep “x” để tìm kí tự x trong lịch sử câu lệnh
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
20
Các câu lệnh làm việc với file
Tập tin và thư mục
cp file1 file2
Chép file1 sang file 2
cp file1 /thư mục
Chép file 1 sang thư mục
cp –r /thư mục 1 /thư
Chép toàn bộ dữ liệu bên trong thư mục 1 sang thư
mục 2
mục 2
mv file 1 file 2
Di chuyển từ file 1 sang file 2 (đổi tên)
mv thư mục 1 thư mục 2
Di chuyển từ thư mục 1 sang thư mục 2 ( đổi tên)
mv file 1 /thư mục
Di chuyển file 1 sang thư mục
mv file 1 /thư mục/file 2
Di chuyển sang thư mục và đổi tên
rm (-r) file (tên thư mục)
Xóa file hoặc thư mục, nếu thư mục dùng option r
10
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
21
Các câu lệnh làm việc với file
Nội dung các tập tin
cat file 1 file 2 > tên file gộp
Gộp nội dung dữ liệu 2 file
less file
Xem nội dung file sử dụng được phím page down
head -n <tên file >
Hiển thị n dòng đầu file
tail -n <tên file>
Hiện thị n dòng cuối file
vim file
Sử dụng phần mềm vim để sửa nội dung file
grep “chuỗi” file
Hiện thị các dòng có chứa chuỗi trong file
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
22
Một số câu lệnh khác
Một số lệnh khác
>tar xvf archive.tar
Giải nén file định dạng tar
>tar xvfz archive.tar.gz
Giải nén file định dạng tar.gz
>tar jxvf archive.tar.bz2
Giải nén file định dạng tar.bz2
>unzip file
Giải nén file định dạng zip
>sudo command
Thực hiện command với tư cách là người dùng
>command 1| command 2
Chuyển kết quả lệnh 1 để thực hiện lệnh 2
>apt-get (upgrade, install,
Lệnh liên quan đến phần mềm như cập nhật cài đặt hay xóa bỏ
remove..)
>wget link
Tải từ địa chỉ
11
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
23
Cài đặt phần mềm Tin sinh
Danh sách các phần mềm sử dụng
•
•
•
•
•
•
Bowtie2
Samtool
Quast
Velvet
Blast +
Epos
•
•
•
•
•
•
Blast2Go
Maker
Java
Trimmomatic
IGV
Apollo
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
24
Tổng quát
12
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
25
Bowtie2
• Tải phần mềm: />• Sử dụng lệnh wget <link> để tải phần mềm
• Sử dụng lệnh unzip <file> giải nén file vừà tải
• Sử dụng lệnh cd truy cập vào thư mục vừa giải nén
• Sử dụng lệnh make để cài đặt
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
26
Samtool
• Tải phần mềm: />• Giải nén file tải về bằng lệnh
tar xjvf [file.tar.bz2]
• Truy cập thư mục vừa giải nén bằng lệnh
cd samtools-1.2
• Sử dụng lệnh make để cài đặt
13
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
27
Quast
• Cài đặt các phần mềm hỗ trợ cần thiết (Python):
sudo apt-get install python-matplotlib
• Tải phần mềm quast
wget />tar -xzf quast-2.3.tar.gz
cd quast-2.3
• Chạy phần mềm bằng lệnh
python quast.py <tên file>
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
28
Velvet
• Tải phần mềm:
/>
• Giải nén phần mềm bằng
tar zxvf file.tar.gz
• Truy cập vào thư mục phần mềm bằng lệnh cd
• Cài đặt bằng lệnh: make
14
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
29
Blast +
• Tải phần mềm:
/>
• Chọn file đuôi linux.tar.gz
• Giải nén file tải về bằng lệnh
tar -zxvf file.tar.gz
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
30
Epos
• Tải phần mềm:
/>
• Chọn phiên bản dành cho windows
• Giải nén file tải về
15
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
31
Cài đặt phần mềm Maker
• Tải:
/>
Đăng ký email và các thông tin trên trang web để tải
• Giải nén
tar xvf maker-2.3.1.8.tgz
• Cài đặt
• Vào thư mực cài đặt
cd maker/src
• Tạo file cài đặt cho maker dựa trên hiện trạng của máy
perl Buil.PL (chọn N + Enter)
• Cài đặt các thư viện cần thiết cho maker
./Build installdeps
• Cài đặt các phần mềm cần thiết cho maker
./Build installexes
• Cài đặt Maker
./Build install
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
32
Blast2Go
• Đăng ký thông tin trên trang chủ để tải phần mềm:
/>• Chạy file cài đặt
• Chạy phần và sử dụng mã số nhận được trong mail đăng ký trên trang chủ
Blast2Go để khởi động chương trình
16
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
33
Java
• Gỡ bỏ tệp openjdk bằng cách nhập vào câu lệnh sau:
sudo apt-get purge openjdk*
• Cài đặt java:
sudo add-apt-repository ppa:eugenesan/java
sudo apt-get update
sudo apt-get install oracle-java7-installer
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
34
Trimmomatic
• Tải phần mềm:
/>/Trimmomatic/Trimmomatic-0.33.zip
• Giải nén file tải về:
Unzip Trimmomatic-0.33.zip
• Chạy phần mềm bằng câu lệnh:
Java –jar trimmomatic-0.33.jar
17
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
35
IGV
• Đăng ký thông tin để tải phần mềm:
/>
• Vào mục Binary Distribution để tải phần mềm
• Giải nén file tải về
• Chạy phần mềm bằng câu lệnh:
java -Xmx750m -jar igv.jar
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
36
Apollo
• Tải phần mềm: />• Chọn phiên bản dành cho windows có java VM
• Chạy file cài đặt tải về
• Tải file apollo_batch.zip :
/>
• Giải nén Apollo_batch.zip và copy file apollo.bat và thư mục bin trong thư
mục Apollo vừa cài đặt
• Chạy phần mềm bằng file apollo.bat
18
7/5/2015
Tin sinh học: Lắp ráp, dự đoán, chú giải và phân tích hệ gen | Phòng Tin sinh học | www.tinsinhhoc.org
37
Các trang địa chỉ tham khảo
• Google
• />
• />
19