BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC CẦN THƠ
TRẦN DIỄM ÁI
TRẦN DIỄM ÁI
KHẢO SÁT MỐI LIÊN HỆ ĐỊNH LƯỢNG
GIỮA CẤU TRÚC VÀ HOẠT TÍNH CỦA
CÁC DẪN XUẤT N-ACYLPIPERIDINE
LUẬN VĂN THẠC SĨ HÓA HỌC
Chuyên ngành: Hóa lý thuyết và Hóa lý
CẦN THƠ – 01/2010
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC CẦN THƠ
TRẦN DIỄM ÁI
TRẦN DIỄM ÁI
KHẢO SÁT MỐI LIÊN HỆ ĐỊNH LƯỢNG
GIỮA CẤU TRÚC VÀ HOẠT TÍNH CỦA
CÁC DẪN XUẤT N-ACYLPIPERIDINE
LUẬN VĂN THẠC SĨ HÓA HỌC
Chuyên ngành: Hóa lý thuyết và Hóa lý
Mã Số: 60 44 31
Người hướng dẫn khoa học:
PGS.TS BÙI THỌ THANH
CẦN THƠ – 01/2010
Lời cảm ơn
LỜI CẢM ƠN
Cũng nhờ có sự giúp đỡ và động viên của nhiều người mà tôi đã
hoàn thành luận văn thạc sĩ này trong thời gian qua. Tôi xin gởi lời cảm
ơn sâu sắc đến:
− PGS – TS Bùi Thọ Thanh đã dành nhiều thời gian và công sức
hướng dẫn cho tôi trong suốt thời gian nghiên cứu.
− Các thầy cô và các bạn trong Phòng Thí nghiệm Hóa tin – Khoa
Hóa của Trường Đại học Khoa Học Tự Nhiên – ĐHQG TPHCM
đã nhiệt tình giúp đỡ trong quá trình thực hiện luận văn.
− Các thầy cô ở Trường Đại học Cần Thơ và Viện công nghệ hóa
học đã truyền đạt những kiến thức quí báu trong thời gian học tập
− Sở GD & ĐT tỉnh An Giang và Ban chủ nhiệm khoa Khoa học
Trường Đại học Cần Thơ đã tạo điều kiện thuận lợi trong suốt thời
gian học tập.
− Gia đình và bạn bè đã luôn giúp đỡ và động viên tôi trong khoảng
thời gian học tập và làm việc.
− Cuối cùng, xin cảm ơn quí thầy cô trong Hội đồng chấm luận văn
đã góp nhiều ý kiến để tôi hoàn thiện luận văn này hơn.
Một lần nữa xin chân thành cảm ơn!
Cần Thơ, tháng 01 năm 2010
Trần Diễm Ái
-i-
Mục lục
MỤC LỤC
Trang
Danh mục các chữ viết tắt v
Danh mục các bảng vi
Danh mục các hình vii
Danh mục các phụ lục
viii
A – LỜI MỞ ĐẦU 1
B – TỔNG QUAN
Chương 1: TỔNG QUAN VỀ MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA CẤU
TRÚC VÀ HOẠT TÍNH
1.1. HOẠT TÍNH 3
1.1.1. Hoạt tính sinh học 4
1.1.2. Hoạt tính hóa học 4
1.2. CÁC THAM SỐ CẤU TRÚC 4
1.3. CÁC MÔ HÌNH TOÁN HỌC TRONG KHẢO SÁT QSAR 5
Chương 2: CƠ HỌC LƯỢNG TỬ, LÝ THUYẾT VỀ VÂN ĐẠO PHÂN TỬ
2.1. PHƯƠNG TRÌNH SÓNG SCHRÖDINGER, PHÉP GẦN ĐÚNG
BORN – OPPENHEIMER 9
2.2. CÁC PHƯƠNG PHÁP BÁN KINH NGHIỆM 11
2.2.1. Giới thiệu 11
2.2.2. Phương pháp PM3 13
Chương 3: PHƯƠNG PHÁP XỬ LÝ SỐ LIỆU
3.1. PHƯƠNG PHÁP HỒI QUI ĐA BIẾN TUYẾN TÍNH 15
3.1.1. Tương quan và hồi qui 15
3.1.2. Phân tích hồi qui đa biến tuyến tính 18
Mục lục
3.1.2.1. Các thủ tục chọn biến 19
3.1.2.2. Đánh giá mô hình 20
3.2. PHƯƠNG PHÁP MẠNG NƠRON NHÂN TẠO 21
3.2.1. Nơron sinh học và nơron nhân tạo 22
3.2.1.1. Nơron sinh học 22
3.2.1.2. Nơron nhân tạo 23
3.2.2. Cấu trúc mạng nơron đa lớp 23
3.2.3. Luyện mạng: kỹ thuật lan truyền ngược 25
3.2.4. Ngừng tiến trình luyện 26
3.2.5. Các yếu tố ảnh hưởng đến tính tổng quát hóa của mạng 27
Chương 4: CHẤT ĐUỔI MUỖI VÀ N-ACYLPIPERIDINE
4.1. BỆNH DO MUỖI GÂY RA VÀ CÁC HÓA CHẤT ĐUỖI MUỖI. .29
4.2. N-ACYLPIPERIDINE – CHẤT ĐUỔI MUỖI MỚI 33
C – PHƯƠNG PHÁP
Chương 5: PHẦN MỀM SỬ DỤNG VÀ CÁC BƯỚC THỰC HIỆN
5.1. PHẦN MỀM 36
5.1.1. Hyperchem 8.03 36
5.1.2. Stagraphics Centurion XV 36
5.1.3. NeuroSolution 5.07 36
5.1.4. Microsoft Excel 36
5.2. CÁC BƯỚC THỰC HIỆN 37
5.2.1. Tính toán hóa lượng tử 37
5.2.2. Phân tích hồi qui đa biến tuyến tính 37
5.2.3. Tính toán mạng nơron 38
D – KẾT QUẢ VÀ BÀN LUẬN
Chương 6: KHẢO SÁT MỐI QUAN HỆ GIỮA CẤU TRÚC VÀ HOẠT TÍNH
CỦA CÁC DẪN XUẤT N-ACYLPIPERIDINE
Mục lục
6.1. DỮ LIỆU 41
6.2. KẾT QUẢ VÀ BÀN LUẬN 43
6.2.1. Phương pháp hồi qui đa biến tuyến tính 43
6.2.1.1. Tính toán với hoạt tính PT 25 44
6.2.1.2. Tính toán với hoạt tính PT 2.5 46
6.2.2. Phương pháp mạng nơron 48
6.3. ĐÁNH GIÁ MỨC ĐỘ TÁC ĐỘNG CỦA CÁC THAM SỐ CẤU
TRÚC LÊN HOẠT TÍNH 54
E – KẾT LUẬN 59
TÀI LIỆU THAM KHẢO
PHỤ LỤC
Mục lục
DANH MỤC CÁC CHỮ VIẾT TẮT
AM1
: Austin Model 1
ANN : Artificial Neural Network
HF : Hartree-Fock
MLR : Multiple Linear Regression
MNDO : Modified Neglect of Diatomic Overlap
MO : Molecular Orbital
MSE : Mean Square Error
PM3 : Parametric Method 3
PT : Protection Time
QSAR : Quantitative Structure-Activity Relationships
USDA : United States Department of Agricuture
US EPA : United States Environmental Protection Agency
VB : Valence Bond
ZDO : Zero Differential Overlap
-v-
DANH MỤC CÁC BẢNG
Trang
Bảng 6.1 – Cấu trúc và hoạt tính của dẫn xuất N-acylpiperidine 41
Bảng 6.2 – Kết quả phân tích hồi qui đa biến tuyến tính với 20 biến độc lập. 43
Bảng 6.3 – Một số mô hình tốt nhất trong 16.278 mô hình khảo sát của PT 2544
Bảng 6.4 – Kết quả phân tích hồi qui cho mô hình 1.6, 1.7, 1.8 45
Bảng 6.5 – Giá trị dự đoán của tập dữ liệu kiểm tra với PT 25 45
Bảng 6.6 – Giá trị dự đoán của 7 bộ dữ liệu còn lại 47
Bảng 6.7 – Kết quả phân tích hồi qui cho mô hình 2.3, 2.4, 2.5 47
Bảng 6.8 – Giá trị dự đoán cho tập kiểm tra với PT 2.5 47
Bảng 6.9 – Hệ số R
2
, Q
2
và R
2
test
ứng với số nơ ron trên lớp ẩn 48
Bảng 6.10 – Giá trị dự đoán của 7 bộ dữ liệu còn lại 49
Bảng 6.11 – Kết quả tính và dự đoán hoạt tính theo mô hình (9 – 8 – 2) 51
Bảng 6.12 – Kết quả dự đoán hoạt tính cho tập dữ liệu mới 52
Bảng 6.13 – Bảng so sánh kết quả các mô hình tốt nhất của 2 phương pháp 53
Bảng 6.14 – Giá trị trọng số và độ nhạy của các biến độc lập 55
-vi-
DANH MỤC CÁC HÌNH
Trang
Hình 1 – Mô hình chung dùng trong khảo sát QSAR 8
Hình 3.1 – Biểu đồ các mối liên hệ thường gặp của x và y 16
Hình 3.2 – Cấu tạo một nơron sinh học 22
Hình 3.3 – Cấu tạo một nơron nhân tạo 23
Hình 3.4 – Sơ đồ cấu tạo mạng nơron nhân tạo có 3 lớp 24
Hình 3.5 – Sơ đồ kỹ thuật lan truyền ngược 26
Hình 4 – Thí nghiệm hoạt tính sinh học 34
Hình 5.1 – Các loại hàm truyền trong NeuroBuilder 39
Hình 5.2 – Bảng NeuralBuilder Supervised Learning 39
Hình 6.1 – Đồ thị giá trị dự đoán cho bộ dữ liệu kiểm tra với PT 25 46
Hình 6.2 – Đồ thị giá trị dự đoán cho bộ dữ liệu kiểm tra với PT 2.5 47
Hình 6.3 – Đồ thị R
2
, Q
2
và R
2
test
ứng với số nơron trên lớp ẩn ở 2 nồng độ. 49
Hình 6.4 – Đồ thị R
2
, Q
2
và R
2
test
ứng với số nơron trên lớp ẩn ở 2 nồng độ. 50
Hình 6.5 – Đồ thị giá trị tính toán và dự đoán theo hoạt tính thực nghiệm
của hai nồng độ 52
Hình 6.6 – Đồ thị giá trị dự đoán và thực nghiệm của tập dữ liệu kiểm tra
ở hai nồng độ 54
Hình 6.7 – Biểu đồ giá trị trọng số 55
Hình 6.8 – Biểu đồ độ nhạy của hai hoạt tính 56
Hình 6.9 – Đồ thị biểu diễn giá trị của 9 tham số cấu trúc và hai hoạt tính 57
-vii-
DANH MỤC CÁC PHỤ LỤC
Phụ lục 1 – Cấu trúc dẫn xuất N-acylpiperidine và hoạt tính.
Phụ lục 2 – Bảng số liệu các tham số cấu trúc và hoạt tính của dẫn xuất
N-acylpiperidine.
Phụ lục 3 – Kết quả phân tích hồi qui cho 20 biến độc lập.
Phụ lục 4 – Ma trận hệ số tương quan Pearson của các tham số cấu trúc và
hoạt tính.
Phụ lục 5 – Ma trận hệ số tương quan Speaman của các tham số cấu trúc và
hoạt tính.
Phụ lục 6 – Biểu đồ phân tích độ nhạy của hoạt tính theo từng tham số cấu trúc.
Phụ lục 7 – Dữ liệu bộ trọng số.
-viii-
A. MỞ ĐẦU
Lời mở đầu
LỜI MỞ ĐẦU
Trong xã hội và trong tự nhiên nói chung hoặc trong nghiên cứu khoa
học nói riêng, các nghiên cứu thống kê giúp tìm ra các mối quan hệ giữa các
hiện tượng và đặc tính để có thể tiên đoán đúng các hiện tượng sẽ xảy ra khi
biết được một số dấu hiệu nào đó, người ta thường gặp khó khăn với các mô
hình thống kê cổ điển. Nhưng hiện nay, nhờ sự phát triển vượt bậc của cả công
nghệ máy tính và trí tuệ con người, nên chúng ta có một công cụ hết sức mạnh
mẽ trong tay là trí tuệ nhân tạo. Công cụ này giải quyết phần lớn các khó khăn
gặp phải trước đây khi thống kê, tiên đoán chính xác các hiện tượng phức tạp
với lượng thông tin ít ỏi, đặc biệt là khi ta kết hợp giữa các công cụ khác nhau
của trí tuệ nhân tạo với nhau và cả các phương pháp cổ điển nữa. Ứng dụng
của trí tuệ nhân tạo rất nhiều trong các lĩnh vực như nhận biết tiếng nói, nhận
biết chữ viết, nhận biết hình ảnh, phân tích địa chấn, phân tích điện tâm đồ,
chẩn đoán bệnh, phân tích thị trường chứng khoán, thương mại
Còn trong hoá học, người ta cũng cần dự đoán trong rất nhiều trường
hợp như tìm hoá chất có hoạt tính mong muốn, dự đoán hướng phản ứng, xác
định hướng phản ứng của các phản ứng cạnh tranh và còn nhiều mục đích
khác nữa. Các công cụ nói trên có nhiều ứng dụng vào các nghiên cứu, nhất là
nghiên cứu mối quan hệ định lượng giữa giữa hoạt tính và cấu trúc. Ngoài ra
cũng phải kết hợp thêm các công cụ của hoá học khác nữa để thực hiện các
nghiên cứu.
Một sự hiểu biết đúng đắn về độc tính của một hoá chất mang một ý
nghĩa đóng góp rất lớn đối với cuộc sống của nhân loại như làm giảm bệnh tật
và tỉ lệ tử vong.…Tuy nhiên để đạt được điều đó lại là một quá trình rất phức
tạp và khó khăn liên quan đến nhiều kỹ thuật khoa học để có được nhiều loại
thông tin cần thiết. Đặc biệt, với sự phát triển công nghệ máy tính ngày càng
cao và càng rẻ việc nghiên cứu thuốc bằng phương pháp mô phỏng phân tử kết
hợp với các phương pháp thống kê ngày càng được quan tâm và phát triển.
Trong luận văn này đã dùng phương pháp tính toán Hoá lượng tử kết
Trang 1
Lời mở đầu
hợp với phương pháp thống kê kinh điển và mạng nơron nhân tạo để nghiên
cứu khảo sát mối liên hệ định lượng giữa hoạt tính và cấu trúc của các chất
dẫn xuất N-acylpiperidine.
Tên đề tài:
"KHẢO SÁT MỐI LIÊN HỆ ĐỊNH LƯỢNG GIỮA CẤU TRÚC VÀ
HOẠT TÍNH CỦA CÁC HỢP CHẤT N-ACYLPIPERIDINE".
Mục đích đề tài:
− Sử dụng chương trình Hóa lượng tử thích hợp để tính toán tham số
cấu trúc của các chất dẫn xuất N-acylpiperidine. Các số liệu này kết hợp với
dữ liệu về thời gian đuổi muỗi của các hợp chất N-acylpiperidine tạo thành bộ
dữ liệu cấu trúc – hoạt tính sử dụng cho việc nghiên cứu QSAR.
− Dùng phương pháp tính toán thống kê kinh điển (phương pháp hồi
qui đa biến tuyến tính) và phương pháp sinh – tin hiện đại (mạng nơron nhân
tạo) để tìm mô hình QSAR có tính tổng quát hóa cao.
− Từ các kết quả nhận được trong luận văn và các kết quả nghiên cứu
QSAR tương tự, rút ra nhận xét về phương pháp luận nghiên cứu QSAR.
Đề tài gồm những phần chính sau:
A. Lời mở đầu
B. Tổng quan
C. Phương pháp
D. Kết quả và bàn luận
E. Kết luận
Trang 2
B. TỔNG QUAN
Chương 1
Chương 1
TỔNG QUAN VỀ MỐI QUAN HỆ ĐỊNH
LƯỢNG GIỮA CẤU TRÚC VÀ HOẠT TÍNH
Mối liên hệ định lượng giữa cấu trúc và hoạt tính của các hoá chất được
viết tắt là QSAR (Quantitative Structure – Activity Relationships). QSAR
thường được nghiên cứu trên một họ hợp chất, giống nhau ở khung cơ bản
nhưng khác nhau ở các nhóm thế trên khung chính và được căn cứ vào giả
định rằng có mối tương quan cơ sở giữa cấu trúc phân tử và hoạt tính sinh học.
Trong giả định này, QSAR cố gắng thiết lập mối tương quan giữa những tính
chất riêng của cấu trúc phân tử với hoạt tính thực nghiệm của nó.
Có hai mục đích chính cho sự phát triển QSAR:
− Xây dựng mô hình QSAR để dự đoán hoạt tính của những phân tử
chưa từng được kiểm tra.
− Mô hình QSAR có vai trò như một công cụ cung cấp thông tin bằng
việc chọn ra một bộ tham số mô tả liên quan đến hoạt tính được đo để có thể
hiểu được cơ chế của hoạt tính cho trước. Điều này có thể giúp thiết kế ra
phân tử mới vừa có hoạt tính theo mong muốn hơn vừa tiết giảm được thời
gian, công sức, tiền của.
Dạng phương trình toán học phổ biến của QSAR là:
A (Activity) = f (tính chất hóa lý hoặc cấu trúc riêng của phân tử)
Đối với một mô hình QSAR có giá trị và đáng tin cậy thì hoạt tính của
chúng phải được vạch ra bởi các cơ chế chung. Chất lượng của mô hình
QSAR hoàn toàn phụ thuộc vào chất lượng của bộ dữ liệu sử dụng để xây
dựng mô hình, vì vậy việc chọn ra bộ dữ liệu các tham số cấu trúc có liên quan
đến hoạt tính thực nghiệm là quan trọng.
Một vài loại hoạt tính và các tham số cấu trúc thường được nghiên cứu
trong QSAR được giới thiệu dưới đây.
Trang 3
Chương 1
1.1. HOẠT TÍNH
[3], [11], [31]
Hoạt tính được nghiên cứu trong QSAR có thể là hoạt tính hoá học hay
hoạt tính sinh học được quan sát từ thực nghiệm dưới các hình thức khác nhau.
1 1.1. Hoạt tính sinh học
− MIC (Minimum Inhibitory Concentration): nồng độ ức chế tối thiểu,
hay nồng độ kiềm khuẩn tối thiểu (dùng trong vi sinh).
− MBC (Minimum Bactericidal Concentration): nồng độ diệt khuẩn
tối thiểu.
− IC50 (Inhibitory Concentration): nồng độ ức chế 50% đối tượng thử,
hay còn gọi là hằng số Michaelis – Menten.
− EC50 (Effective Concentration): nồng độ 50% tác dụng tối đa.
− ED50 (Effective Dose): liều tác dụng tối đa trên 50% đối tượng thử.
− SD50 (Supression Dose): liều tiêu diệt 50% đối tượng thử.
− LD50 (Lethal Dose): liều gây chết 50% thú thử.
− TI (Therapeutic Index) = LD50/ED50: chỉ số trị liệu (TI càng lớn độ
an toàn sử dụng càng cao)…
Các hoạt tính sinh học có thể được quan sát từ thực nghiệm với nhiều
hình thức sau:
− In vitro: quan sát hoạt tính trong ống nghiệm hay hộp petri có nuôi
cấy vi sinh vật (vi khuẩn, vi nấm) hay các bộ phận sinh vật (cơ quan, mô, tế
bào…) được phân lập.
− In vivo: quan sát hoạt tính trên cơ thể sinh vật (chuột, thỏ, khỉ, người).
− In situ: quan sát hoạt tính tại chỗ.
1 1.2. Hoạt tính hoá học
− k: hằng số tốc độ phản ứng của các hoá chất trong một loại phản ứng.
− K: hằng số phân ly của các axit (tính axit).
− Độ chọn lọc.
− Tính thân hạch, thân điện tử…
Các hoạt tính hoá học được quan sát bằng thực nghiệm hoá học.
Trang 4
Chương 1
1.2. CÁC THAM SỐ CẤU TRÚC
[11], [16], [25], [29]
Một vấn đề chung trong QSAR là cách mô tả phân tử và tính chất của
các chất. Và các đại lượng được dùng để mô tả những nét cấu trúc phân tử là
một phần không thể thiếu trong nghiên cứu QSAR, còn được gọi là tham số
cấu trúc.
Đến nay đã có hàng ngàn tham số khác nhau được ứng dụng trong các
lĩnh vực nghiên cứu các mô hình liên quan định lượng giữa cấu trúc với tác
dụng. Các tham số cấu trúc của hoá chất có thể thu được bằng thực nghiệm
hay tính toán bằng lý thuyết bởi các phần mềm tính toán như ADAPT,
CODESSA, DRAGON, HYPERCHEM, MOE,… Các tham số thông dụng có
thể kể đến như tham số điện tử, các tham số lập thể, các tham số hoá lí,…
− Các tham số điện tử (electronic parameters): hằng số Hammett (σ,
σ+, σ-,…), moment lưỡng cực, độ phân cực phân tử, điện tích nguyên tử (q+,
q-), mật độ điện tử, thế tĩnh điện phân tử và trường tĩnh điện phân tử, năng
lượng các vân đạo biên (E
HOMO
và E
LUMO
),…
− Các tham số lập thể (steric parameters): hằng số lập thể Tafl (Es), thể
tích phân tử (V), diện tích bề mặt phân tử (S), chỉ số khúc xạ (MR), tham số
STERIMOL, độ dài liên kết, góc xoắn…
− Các tham số hoá lí (physicochemical parameters): hệ số phân bố giữa
octanol và nước của hoá chất (P) , hằng số kỵ nước Π…
1.3. CÁC MÔ HÌNH TOÁN HỌC TRONG KHẢO SÁT QSAR
[ 5], [ 9], [ 21], [ 24], [25]
Vào năm 1868, Crum-Brown và Fraser đã nhận xét rằng tác dụng sinh
học là hàm số của cấu trúc hóa học:
)(Cf=Φ
(1.1)
Đến năm 1893, Richet đã cho rằng sự khác nhau về tác dụng sinh học
là do sự thay đổi về tính chất hóa học hay lí hóa.
)( Cf ∆=∆Φ
(1.2)
Đây là hai tư tưởng làm nền tảng cho việc thiết lập các mô hình liên
quan cấu trúc – tác dụng định lượng sau này.
Năm 1935, một phát minh quan trọng của Hammett có thể xem là
Trang 5
Chương 1
phương trình đầu tiên biểu diễn mối quan hệ giữa hoạt tính và cấu trúc:
ρσ
=
0
log
K
K
(1.3)
Với K, K
o
là hằng số axit. σ là hằng số Hammett, là một thông số hoá lí
đặc trưng cho khả năng rút hoặc đẩy điện tử của nhóm thế.
Đối với axit benzoic, phương trình Hammett có dạng như sau:
∑
−=
σ
2.4
a
pK
(1.4)
Như ta đã biết dựa vào phương trình Hammett ta có thể dự đoán K
a
của
các dẫn xuất của axit benzoic khi ta biết hằng số σ của các nhóm thế. Tương
tự, Hammett còn có các phương trình dành cho các phản ứng của các dẫn xuất
benzen:
ρσ
=
0
log
k
k
(1.5)
Trị số ρ tìm được có thể góp phần quan trọng cho việc đề nghị cơ chế
cho phản ứng đang khảo sát.
Mô hình Hansch
QSAR thực sự bắt đầu được nghiên cứu bởi Corwin Hansch và các
đồng sự từ những năm 60 của thế kỷ XX. Trong mô hình QSAR của mình,
Hansch thường dùng các hằng số thực nghiệm như: E
s
, σ, Π, logP… làm các
tham số cấu trúc.
Một số phương trình ông thu được như sau:
21
log)/1log( kPkC +=
(1.6)
43
2
21
)(loglog)/1log( kkPkPkC +++=
σ
(1.7)
43
2
21
)/1log( kkkkC ++Π+Π=
σ
(1.8)
Trong đó C là nồng độ mol của hoá chất, ở nồng độ này hoá chất có
một tác dụng cụ thể nào đó, chẳng hạn nồng độ cần thiết của hoá chất để có
tác dụng ức chế 50% độc chất.
Trong các mô hình Hansch, ông ta thường dùng phương pháp hồi qui
tuyến tính (1.6) hoặc hồi qui đa thức (1.7, 1.8) để phân tích, xử lý dữ liệu.
Trang 6
Chương 1
Mô hình Free – Wilson
Mô hình QSAR Free – Wilson được Fujita và Ban cải tiến lại có dạng
tổng quát sau:
µ
+=
∑
ij
aC)/1log(
(1.9)
Trong đó
ij
a
: sự cộng hợp của các nhóm thế x
i
tại vị trí j trên phân tử.
µ
: vai trò của khung chính.
Thực tế thì mô hình Hansch và mô hình Free-Wilson có liên quan với
nhau, vì thế một số tác giả đã thành lập mô hình kết hợp Free-Wilson &
Hansch, cả hai dạng tuyến tính lẫn phi tuyến:
∑∑
++Φ= kabC
ijj
)/1log(
(1.10)
∑∑∑
++Φ+Φ= kabbC
ijjjj
2
)/1log(
(1.11)
Trong đó:
ijji
ba Φ=
∑
là tham số nhóm thế.
j
Φ
là tham số hóa lí j của các nhóm thế x
i.
j
b
và k là các hệ số hồi qui.
Vì hầu như chỉ dùng phương pháp hồi qui tuyến tính hay hồi qui đa
thức bậc 2, 3 để xử lý và phân tích dữ liệu nên các mô hình Hansch và Free –
Wilson đã gặp phải các khó khăn nhất định. Chúng chỉ khảo sát QSAR thành
công trên một số ít hợp chất. Nguyên nhân chủ yếu là do mối quan hệ giữa
hoạt tính và cấu trúc thường không phải là tuyến tính mà rất phức tạp. Hơn
nữa các tham số cấu trúc phải được xác định bằng thực nghiệm, đây là khó
khăn lớn vì nó gây tốn kém thời gian và kinh phí mà lại hạn chế các thông tin
thật sự có ảnh hưởng đến hoạt tính của hoá chất… Vì vậy, việc tìm thêm các
tham số mới về cấu trúc, giảm thời gian và chi phí nghiên cứu, cộng với dùng
phương pháp xử lý số liệu mới có khả năng mô tả đúng mối quan hệ phức tạp
của các tham số cấu trúc và hoạt tính là điều rất cần thiết.
Hiện nay, các kỹ thuật máy tính phát triển cực kỳ nhanh chóng và nó đã
có những đóng góp quan trọng trong các lĩnh vực nghiên cứu khoa học như
khoa học vũ trụ, sinh học, toán học, lý học, hoá học… Trong hoá học, đã có
nhiều chương trình máy tính có thể thiết kế cấu trúc không gian của phân tử
Trang 7
Chương 1
hoá chất; chúng kết hợp với hoá lượng tử có thể tối ưu hoá hình dạng của hoá
chất và cung cấp cho chúng ta rất nhiều tham số cấu trúc liên quan đến hoạt
tính. Chúng ta đã có các phần mềm tin học ứng dụng trong hoá học hiện nay
như: HyperChem, Gaussian, CS ChemOffice, Mopac …
Ngoài ra, về mặt xử lý số liệu, chúng ta không còn đơn thuần dùng các
phương pháp xử lý thống kê cổ điển để phân tích số liệu mà có các lý thuyết
mới có thể áp dụng vào việc xử lý số liệu, tín hiệu… và ta có thể dùng vào
khảo sát QSAR. Các lý thuyết mới có thể dùng trong các trường hợp mối quan
hệ QSAR phức tạp như: Mạng nơron nhân tạo (ANN – Artificial Neural
Network), Logic mờ (FL – Fuzzy Logic), Thuật giải di truyền (GA – Genetic
Algorithm)…
Việc sử dụng các phương pháp xử lý số liệu mới này đồng thời kết hợp
với dùng các thông số tính toán tỏ ra khá thành công trong việc mô tả các
QSAR. Hiện nay, đã có rất nhiều nhóm nghiên cứu QSAR trên thế giới. Họ
nghiên cứu rất nhiều hợp chất khác nhau và ứng dụng các phương pháp thống
kê mới vào khảo sát QSAR.
Hình 1 – Mô hình chung dùng trong khảo sát QSAR
Trang 8
Chuẩn bị bộ dữ liệu hoạt tính
Xây dựng mô hình phân tử, dùng hoá lượng tử tối ưu hoá hình dạng
Từ mô hình tối ưu, tính các tham số hoá lý đặc trưng cho cấu trúc
Phân tích dữ liệu, tìm mô hình QSAR phù hợp nhất
Dự đoán hoạt tính của hợp chất mới
Chương 2
Chương 2
CƠ HỌC LƯỢNG TỬ,
LÝ THUYẾT VỀ VÂN ĐẠO PHÂN TỬ
2.1. PHƯƠNG TRÌNH SÓNG SCHRÖDINGER, PHÉP GẦN ĐÚNG
BORN – OPPENHEIMER
[9], [11]
Cho đến nay, chỉ có cơ học lượng tử mới có thể mô tả được sự phân bố
của điện tử một cách đầy đủ. Vì vậy, để xác định tính chất vật lý của phân tử
(hình dạng cấu trúc bền nhất, mật độ điện tích, chiều dài liên kết…) người ta
cố gắng giải phương trình sóng Schrödinger:
HΨ = EΨ (2.1)
Trong đó: E : năng lượng tổng cộng của hệ thống.
Ψ : phương trình sóng tổng cộng đã được chuẩn hoá.
H : toán tử Hamilton tổng cộng.
Toán tử Hamilton tổng cộng (H) tương ứng với năng lượng tổng cộng
của phân tử bao gồm các động năng (T) và thế năng (V) của tất cả các hạt (các
hạt nhân và các điện tử):
H
total
= T + V (2.2)
Phép gần đúng Born-Oppenheimer
Phép gần đúng này dựa trên cơ sở: khối lượng của hạt nhân lớn hơn
khối lượng điện tử nhiều lần nên vận tốc của hạt nhân phải nhỏ hơn vận tốc
của điện tử. Vì thế phương trình Schrödinger được chia thành hai phần:
− Phần một bao gồm toán tử Hamilton điện tử đối với hạt nhân cố
định (H
e
).
− Phần hai bao gồm toán tử động năng hạt nhân trong đó năng lượng
từ hàm sóng điện tử đóng vai trò thế năng (T
n
).
H
total
= H
e
+T
n
(2.3)
H
e
= T
e
+ V
ne
+ V
ee
+ V
nn
(2.4)
Trang 9
Chương 2
Trong đó:
∑
∇−=
A
A
A
n
M
T
2
2
1
: Toán tử động năng hạt nhân.
∑
∇−=
N
i
ie
T
2
2
1
: Toán tử động năng điện tử.
∑∑
−
−=
N
i A
iA
A
ne
rR
Z
V
||
: Toán tử hút điện tử - hạt nhân.
∑∑
>
−
=
N
i
N
ij
ji
ee
rr
V
||
1
: Toán tử đẩy điện tử - điện tử.
∑∑
>
−
=
A AB
BA
BA
nn
RR
ZZ
V
||
: Toán tử đẩy hạt nhân – hạt nhân.
Với:
∂
∂
+
∂
∂
+
∂
∂
=∇
2
2
2
2
2
2
2
A
AAA
zyx
A, B: hạt nhân Z
A
: điện tích hạt nhân A
i, j : các electron R
A
: vector chỉ vị trí hạt nhân A
M
A
: Khối lượng hạt nhân A r
i
: vector chỉ vị trí electron i
Các toán tử có thể được tập hợp lại theo chỉ số điện tử.
∑
−
−∇−=
A
iA
A
ii
rR
Z
h
||2
1
2
(2.5)
||
1
ji
ij
rr
g
−
=
(2.6)
∑ ∑∑
= = >
++=
N
i
N
i
N
ij
nnijie
VghH
1 1
(2.7)
Toán tử một điện tử h
i
mô tả sự di chuyển của điện tử i trong trường
của tất cả các hạt nhân, và g
ij
là toán tử hai điện tử cho bởi lực đẩy điện tử –
điện tử. Chú ý rằng điểm zero năng lượng tương ứng với các hạt tử được để
yên (T
e
= 0) và được dời đi vô tận khỏi nhau (V
ne
= V
ee
= V
nn
=0).
Theo phép gần đúng này, hàm sóng điện tử chỉ phụ thuộc vào vị trí của
hạt nhân, không phụ thuộc vào động lượng của hạt nhân; và các hạt nhân di
chuyển trên các mặt đẳng thế (Potential Energy Surfaces – PES), là nghiệm
của các phương trình Schrödinger điện tử. Do vậy khi ta giải được phương
trình Schrödinger điện tử thì ta có thể dùng PES để giải phương trình
Schrödinger đối với hạt nhân.
Trang 10
Chương 2
Việc xây dựng hàm sóng nhiều điện tử dựa trên tính gần đúng là các hạt
ở trạng thái riêng rẽ. Trong vân đạo spin một điện tử gồm hai phần: vân đạo
không gian và hàm spin. Phương trình Hartree – Fock (HF) được viết như sau:
∑
=
N
j
jijii
F
φλφ
(2.8)
Toán tử Hamilton được viết lại dưới dạng tổng của những toán tử một
điện tử F (toán tử Fock) như sau:
)KJ2(HFH
jj
jii
core
ii
−+==
∑∑∑∑
<
(2.9)
J
i
và K
j
là toán tử Coulomb và toán tử trao đổi.
2.2. CÁC PHƯƠNG PHÁP BÁN KINH NGHIỆM
[7], [10], [11]
2.2.1. Giới thiệu
Đòi hỏi của việc thực hiện chuỗi tính HF thường là các hàm mũ 4. Điều
này phát sinh bởi số các tích phân hai điện tử cần thiết cho việc xây dựng ma
trận Fock. Phương pháp bán thực nghiệm giảm đòi hỏi của việc tính toán bằng
cách giảm số tích phân hai điện tử. Điều này chỉ là một tác động giới hạn bộ
cơ sở rộng, và phương pháp ab initio sẽ vẫn đòi hỏi một nỗ lực tính toán lớn
hơn phương pháp bán thực nghiệm.
Bước đầu tiên trong việc giảm khó khăn tính toán là xem như chỉ có
các điện tử hoá trị hiện diện. Tâm điện tử được giải thích bằng cách giảm điện
tích hạt nhân hoặc các hàm đưa vào mô hình lực đẩy hoá hợp do các hạt nhân
và các tâm điện tử. Hơn nữa, chỉ có bộ cơ sở nhỏ nhất được dùng đối với các
điện tử hoá trị. Vì thế hydro chỉ có một hàm cơ sở, toàn bộ các nguyên tử
trong hàng thứ hai và thứ ba của hệ thống tuần hoàn có bốn hàm cơ sở (một s
và ba p). Cho đến bây giờ, phần lớn các phương pháp chỉ dùng các hàm s và p,
và các hàm cơ sở là các vân đạo kiểu Slater ngĩa là các hàm mũ.
Giả định trung tâm của các phương pháp bán thực nghiệm là phép gần
đúng ZDO (Zero Differential Overlap). Phương pháp này bỏ qua tất cả các
tích của hàm cơ sở phụ thuộc vào cùng toạ độ điện tử khi định vị trên các
nguyên tử khác. Ký hiệu vân đạo nguyên tử trên tâm A là µ
A
, phép gần đúng
Trang 11