ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA HOÁ HỌC
BÀI TIỂU LUẬN
THIẾT KẾ PHÂN TỬ
Giảng viên hướng dẫn : PGS.TS. NGUYỄN ĐÌNH THÀNH
Học viên : Trần Thanh Hà
Lớp : Cao học Hóa Hữu cơ K21
Hà Nội-08/2012
MỤC LỤC
MỞ ĐẦU
2
Trong một vài năm trở lại đây, ngành hóa tin học ngày càng thu hút được
sự chú ý với nhiều nhà hóa học bởi đây là một hướng đi mới và có tiềm năng
phát triển lớn. Có nhà khoa học đã nói rằng: “Trong tương lai, các nhà hóa học
sẽ vào phòng máy tính trước khi đi vào phòng thí nghiệm”. Câu nói đó khẳng
định tầm quan trọng và dự đoán một sự phát triển mới mạnh mẽ của ngành hóa
tin học.
Trong hóa tin học, lĩnh vực thiết kế phân tử với sự trợ giúp của máy tính là
sự kết hợp các hiểu biết về của Hóa lượng tử, Cơ học phân tử, và Động học phân
tử để nghiên cứu về mô hình phân tử các hợp chất hữu cơ mới nhằm dự đoán các
tính chất hóa lý hay hoạt tính sinh học mong muốn. Nhiều hợp chất có tác dụng
sinh học đã được dự đoán bằng mô hình mối tương quan định lượng cấu trúc –
tác dụng (QSAR) và đã được tổng hợp thành công trong thực tế tuy nhiên việc
nghiên cứu mối tương quan định lượng cấu trúc – tác dụng và mối tương quan
định lượng cấu trúc – tính chất đòi hỏi phải có cả kiến thức, kinh nghiệm chuyên
môn và cả kiến thức về tin học.
Để phục vụ cho sự mô tả mối quan hệ định lượng giữa cấu trúc – tính chất
và cấu trúc hoạt tính của các hợp chất hữu cơ, người ta dựa vào các tham số cấu
trúc như các thông số cấu tạo, thông số hình học, thông số tĩnh điện, thông số
liên quan đến MO, thông số hóa lượng tử, thông số nhiệt động học… Và do vậy,
tập hợp số thông số đưa ra này là rất lớn. Các thông số này hoặc có liên quan đến
sự sắp xếp tương hỗ giữa các nguyên tử trong phân tử hoặc liên quan đến các
yếu tố electron hay không gian, hoặc các tính chất nhiệt động học của phân tử
hợp chất hữu cơ.
Ví dụ: với thông số momen lưỡng cực cho thông tin quan trọng về bản
chất và đặc điểm của dạng tương tác hóa học khác thường như liên kết hidro và
đặc tính phân cực hoặc không phân cực của phân tử.
Với thông số năng lượng obitan HUMO và LUMO. HUMO là năng lượng
obitan phân tử bị chiếm cao nhất (Highest Occupied Molecular Orbital Energy)
nhận được từ tính toán obitan phân tử và có liên quan đến thế ion hóa của phân
tử và khả năng phản ứng của nó như là một nucleophin. LUMO là năng lượng
3
obitan phân tử trống thấp nhất (Lowest Unoccupied Molecular Orbital Energy)
nhận được từ các tính toán obitan phân tử và biểu thị ái lực electron của phân tử
hay khả năng phản ứng của nó như là một electrophin….
Vào những năm 1950, Hansh đã đưa ra thông số kị nước và sử dụng phép
phân tích hồi quy để đưa ra tương quan hoạt tính sinh học với các tính chất của
phân tử. Từ đó phương pháp Hansh được các nhà khoa học phát triển với các
phương pháp thống kê tinh vi hơn nhằm phát triển mối tương quan giữa một tính
chất hay dạng hoạt tính nào đó của một tập hợp phân tử về tính chất của các
nhóm thế riêng biệt.
Trong bài tập này đã sử dụng chương trình hyperchem và chương trình
tính toán thống kê trên excel để xử lý mối quan hệ giữa các thông số không gian
và thông số hóa lý với nồng độ cần thiết gây nên tốc độ của sự đáp ứng sinh học.
Và dựa vào các giá trị như phương sai, hệ số tương quan… để đánh giá và đưa ra
phương trình Hansh mô tả tốt nhất và phù hợp với các giá trị thực nghiệm. Để từ
đó ta có thể giải thích các số liệu thực nghiệm.
I. CƠ SỞ LÝ THUYẾT
4
Để đưa ra công thức liên hệ log(1/C) với các thông số hoá-lý. Nhà nghiên
cứu Hansch đã dựa vào giả thiết như sau: nếu phản ứng sinh học đang khảo sát
BR của cơ thể hay hệ mô phỏng đến một chất nào đó là hệ quả của các quá trình
hoá lý liên tiếp xảy ra với sự tham gia của chất theo thời gian t, bắt đầu từ thời
điểm tác dụng của chất và kết quả cuối cùng của nó, thì ta có thể liên hệ được
với sự tham gia của tốc độ kiểm soát được của quá trình. Khi chất với nồng độ
ban đầu gây nên phản ứng sinh học chuẩn C
0
được đưa vào hệ sinh học, thì tồn
tại xác suất N nào đó sao cho ở lượng CN thì chất đi đến được vị trí mà ở đó xảy
ra phản ứng qua thời gian ∆t dẫn tới [BR] (ở đây [BR] là số đo định lượng hiệu
quả sinh học được biểu diễn theo đơn vị tương ứng). Trong trường hợp này, tốc
độ của quá trình có thể được biểu diễn ở dạng sau :
d[BR]/dt = A*C*K
x.
Trong đó: A là hệ số tỷ lệ, liên quan với phản ứng sinh học với tốc độ giai
đoạn kiểm soát được.
K
x
: hằng số tốc độ hay cân bằng của giai đoạn này.
Sử dụng mô hình Hansch để khảo sát và phần mềm hoá học Hyperchem,
Ecxel xác định được các thông số như, LUMO, HOMO, δ, α, logP, q
x,
V, S.
Qua các thông số này chúng ta xây dựng được phương trình liên quan giữa các
yếu tố đến khả năng tạo gây độc tính của hợp chất Phenol thế.
5
II. THIẾT KẾ PHÂN TỬ VÀ TÍNH TOÁN HỒI QUY.
2.1. Thiết kế phân tử:
Phân tử được khảo sát là phenol thế và độc tính của các phenol thế đối với nấm
Candida Albicans như sau:
R Log 1/C R Log 1/C
H 3,37 4-OH 2,92
4-Me 3,39 2,3-C
4
H
4
3,97
2,4-Me
2
3,42 3-Cl 3,95
4-Cl 3,95 2,4-Cl
2
4,48
Sử dụng chương trình Hyperchem để xây dựng 8 phân tử trên. Đồng thời để có
được các thông số hóa lý cũng như các thông số không gian nhận được từ
chương trình này thì tiến hành tối ưu hóa các phân tử trên bằng phương pháp
AM1 để nhận được các giá trị dùng cho tính toán.
Trong đó:
Log P: Hệ số phân bố
π: Thông số ưa dầu
б : hằng số thế Hammett.
μ (D): momen lưỡng cực của phân tử.
V(A
03
), S(A
02
): tương ứng là thể tích và diện tích của phân tử.
α: là độ khả phân cực của phân tử.
q
N
:là điện tích trên nguyên tử N.
q
C-NH
: điện tích của C trong vòng benzen liên kết với nhóm NH
q
C(thế R-2)
:điện tích của nguyên tử C-2 của vòng benzen chứa nhóm thế R
q
C(thế R-3)
:điện tích của nguyên tử C-3 của vòng benzen chứa nhóm thế R
q
C(thế R-4)
:điện tích của nguyên tử C-4 của vòng benzen chứa nhóm thế R
q
O
: điện tích trên nguyên tử Oxi
q
C(thế OH):
điện tích trên nguyên tử C của vòng benzen liên kết với nhóm OH
6
q
C(thế CH3)
: điện tích trên nguyên tử C của vòng benzen liên kết với nhóm CH
3
q
C(thế CH2)
: điện tích trên nguyên tử C của vòng benzen liên kết với nhóm CH
2
q
CH3
: điện tích trên nguyên tử C của nhóm CH
3
q
CH2
: điện tích trên nguyên tử C của nhóm CH
2
E
H
: là năng lượng hydrat.
E
HUMO
: năng lượng obital phân tử bị chiếm cao nhất.
E
LUMO
: năng lượng obital phân tử không bị chiếm thấp nhất.
Các thông số nhận được từ việc tối ưu hóa các phân tử trong chương trình
Hyperchem được đưa ra ở bảng sau:
Bảng 1: Các thông số hóa lý và các thông số không gian.
R H 4-Me 2,4-
Me
2
4-Cl 4-OH
2,3-
C
4
H
4
3-Cl 2,4-Cl
2
Log P 0.43 0.58 0.74 0.21 -0.60 0.31 0.21 -0.02
π
0.00 0.15 0.31 -0.22 -1.03 -0.12 -0.22 -0.45
б 0.00 -0.17 -0.12 0.23 -0.37 1.27 0.37 0.28
μ (D) 2.588 2.535 2.424 3.536 2.726 3.149 3.470 3.643
V(A
03
) 701.64 752.82 797.36 746.71 720.69 867.79 744.90 781.22
S(A
02
) 438.67 463.85 484.56 460.0
8
445.80 537.14 462.55 480.01
α 25.75 27.59 29.42 27.68 26.39 31.93 27.68 29.61
q
N
-0.272 -0.266 -0.266 -0.268 -0.261 -0.294 -0.271 -0.270
q
C-NH
0.044 0.034 0.032 0.044 0.007 0.130 0.052 0.056
q
C(thế R-2)
-0.169 -0.161 -0.116 -0.178 -0.148 -0.200 -0.181 -0.112
q
C(thế R-3)
-0.103 -0.105 -0.104 -0.096 -0.175 -0.097 -0.034 -0.092
q
C(thế R-4)
-0.165 -0.104 -0.102 -0.096 0.032 -0.098 -0.158 -0.092
q
C(thế OH)
0.060 0.060 0.059 0.061 0.060 0.055 0.061 0.061
q
O(trong OH)
-0.254 -0.254 -0.254 -0.254 -0.253 -0.257 -0.254 -0.254
q
C(thế CH3)
-0.093 -0.093 -0.093 -0.092 -0.093 -0.098 -0.092 -0.091
q
CH3
-0.176 -0.176 -0.175 -0.176 -0.176 -0.175 -0.176 -0.177
q
C(thế CH2)
-0.124 -0.124 -0.124 -0.126 -0.125 -0.105 -0.126 -0.128
q
CH2
-0.010 -0.013 -0.012 -0.011 -0.015 0.006 -0.009 -0.006
E
H
-8.46 -7.28 -6.06 -8.18 -15.41 -8.57 -8.06 -7.57
7
E
HUMO
-8.574 -8.289 -8.230 -8.498 -8.265 -7.977 -8.819 -8.778
E
LUMO
0.445 0.457 0.473 0.357 0.435 -0.017 0.365 0.259
lg(1/C) 3.370 3.390 3.420 3.950 2.920 3.970 3.950 4.480
2.2. Tính toán theo mô hình Hansch
Đầu tiên ta tìm phương trình hồi quy đa biến biểu diễn sự phụ thuộc của
các điện tích vào log(1\C) dùng phần mềm Excel để loại bỏ các ảnh hưởng và
đưa ra phương trình hồi quy phù hợp. Tất cả được đưa ra trong bảng sau:
Bảng 2: Mối liên hệ giữa nồng độ và điện tích.
Phương trình hansch r r
2
S
log(1/C) = -2.2493 -21.8840.q
N
0.4415 0.1949 0.4769
log(1/C) = 3.2864 + 7.9165. q
C-NH
0.5749 0.3305 0.4349
log(1/C) = -39.8757 - 171.3157. q
O
0.4055 0.1644 0.4858
log(1/C) = 3.3523 + 5.5156. q
C(thế OH)
0.0223 0.0005 0.5314
log(1/C) = 3.6526 -0.1806. q
C(thế R-2)
0.0114 0.0001 0.5315
log(1/C) = 4.5437 + 8.5608 . q
C(thế R-3)
0.6612 0.4373 0.3987
log(1/C) = 3.3452 - 3.4333. q
C(thế R-4)
0.4176 0.1743 0.4829
log(1/C) = 5.7661 + 22.3886. q
C(thế CH3)
0.0955 0.0091 0.5291
log(1/C) = 4.0615 + 43.4641. q
CH2
0.5777 0.3337 0.4338
log(1/C) = -43.4991-268.2608. q
CH3
0.3493 0.1220 0.4980
log(1/C) = 4.3311+ 5.2945. q
C(thế CH2)
0.0785 0.0061 0.5299
Thông qua bảng trên ta thấy điện tích của C tại nhóm methylen (CH
2
), C
của vòng benzen liên kết với -NH và của C thế ở vị trí 3 vòng benzen là có ảnh
8
hưởng đến hoạt tính sinh học nhất vì phương trình Hansch đưa ra có hệ số tương
quan là cao nhất và phương sai là nhỏ nhất. Như vậy ta đã loại bỏ các điện tích
không ảnh hưởng đến log(1/C) và do đó sẽ sử dụng hai giá trị này để tính toán
các bước tiếp theo.
Mặt khác tất cả các giá trị còn lại cũng được tính toán tương tự như trên và
được đưa ra trong bảng sau:
Bảng 3: Mối tương quan giữa các thông số điện tích trên nguyên tử C, thông
số hóa lý; thông số không gian và nồng độ.
Phương trình Hansch r r
2
S
log(1/C) = 3.7058+ 0.1245. π 0.1039 0.0108 0.5286
log(1/C) = 3.5649 + 0.6245. б 0.6406 0.4104 0.4081
log(1/C) = 1.1686+ 0.8350. μ 0.8450 0.7141 0.2842
log(1/C) = 0.3830 + 0.0043. V 0.4537 0.2058 0.4736
log(1/C) = 0.1671 + 0.0074. S 0.4635 0.2148 0.4710
log(1/C) = -0.3416 + 0.1423. α 0.5739 0.3294 0.4352
log(1/C) = 4.4855+ 0.0924. E
H
0.5316 0.2826 0.4502
log(1/C) = 4.2970 - 1.7760. E
LUMO
0.5882 0.3460 0.4298
log(1/C) = -2.6619 - 0.7525 . E
HUMO
0.4440 0.1971 0.4762
Thông qua bảng 3 ta thấy giá trị μ, б có ảnh hưởng lớn đến log(1/C) vì các
giá trị về hệ số hồi quy lớn và phương sai của chúng nhỏ; các giá trị α, E
H,
E
LUMO
9
ảnh hưởng ít hơn. Như vậy: μ, б, α, E
H,
E
LUMO,
điện tích của C tại nhóm
methylen (q
CH2
), C của vòng benzen liên kết với -NH (q
C-NH
) và của C thế ở vị
trí 3 vòng benzen (q
C(thế R-3)
) có ảnh hưởng lớn đến log(1/C) trong các thông số
được đưa ra ở Bảng 1. Vậy từ các thông số này ta lập ma trận hệ số tương quan
của chúng( sử dụng chương trình excel để tính toán). Ma trận được đưa ra trong
bảng sau:
Bảng 4: Ma trận hệ số tương quan:
μ б α q
CH2
q
C-NH
q
C(thế R-3)
E
LUMO
E
H
μ 1
б 0.5130 1
α 0.2923 0.7649 1
q
CH2
0.3823 0.9655 0.8057 1
q
C-NH
0.3658 0.9788 0.7844 0.9852 1
qC
(thế R-3)
0.4922 0.4585 0.2418 0.3145 0.3985 1
E
LUMO
-0.5019 -0.9444 -0.7991 -0.9630 -0.9336 -0.1964 1
E
H
0.0896 0.2761 0.3915 0.2371 0.3280 0.7154 -0.0644 1
Thông qua bảng 4 ta thấy phương sai có nghĩa tồn tại giữa б và q
CH2;
б và
q
C-NH
;
б và E
LUMO
; q
CH2
và q
C-NH
; q
CH2
và E
LUMO
; q
C-NH
và E
LUMO
Dựa vào ma trận các hệ số tương quan ta xây dựng mối quan hệ giữa
chúng. Các phương trình hồi quy đa biến được xây dựng giữa các thông số đã
chỉ ra. Điều đó được tóm tắt trong bảng sau:
Bảng 5: Mối quan hệ đa biến giữa các thông số với hoạt tính
Phương trình Hansch
r r
2
S
log(1/C) = 3.0612 + 1.1933. б - 45.4561.q
CH2
0.6597 0.4352 0.2092
log(1/C) = 3.3243+ 0.3058. б + 3.9866.q
C-NH
0.8653 0.7487 0.2918
10
log(1/C) = 3.3754 + 0.7677. б + 0.4695. E
LUMO
0.6427 0.4131 0.4461
log(1/C) = 3.8000 + 28.9484. q
CH2
+ 2.6965. q
C-NH
0.5786 0.3348 0.4748
log(1/C) = 4.2431 - 11.6087. q
CH2
- 1.3274. E
LUMO
0.5897 0.0868 0.4702
log(1/C) = 3.9637+ 2.7577. q
C-NH
-1.2114. E
LUMO
0.5926 0.3511 0.4690
l log(1/C) = 1.1162+ 2.2502.б + 5.9245. q
C-NH
+ 1.7367. E
LUMO
- 125.4722. q
CH2
0.9955 0.9910 0.0712
log (1/C) = 1.4474 + 0.1804 π + 2.1107.б + 5.9212. q
C-NH
+
0.3435. E
LUMO
-149.8933. q
CH2
0.9992 0.9984 0.0360
Như vậy thông qua bảng 5 ta thấy phương trình được lựa chọn là:
log (1/C) = 1.4474 + 0.1804 π + 2.1107.б + 5.9212. q
C-NH
+ 0.3435. E
LUMO
-149.8933. q
CH2
Như vậy qua các bảng đã đưa ra từ bảng 1 đến bảng 5 và tổng kết lại thì
hoạt tính sinh học được mô tả tốt bởi phương trình :
log (1/C) = 1.4474 + 0.1804 π + 2.1107.б + 5.9212. q
C-NH
+ 0.3435. E
LUMO
-149.8933. q
CH2
11
III.BIỆN LUẬN
Trong phương trình:
log(1/C) = 1.1162+ 2.2502.б + 5.9245. q
C-NH
+ 1.7367. E
LUMO
- 125.4722. q
CH2
(1)
ta thấy tất cả các thông số q
C-NH
; E
LUMO
; б
làm tăng hoạt tính của chất khảo sát.
Trong đó điện tích trên nguyên tử cacbon của nhóm methylen q
CH2
làm giảm hoạt
tính của chất khảo sát tức là có ảnh hưởng âm đến hoạt tính ức chế sự phát triển
của nấm Candida Albicans.
Tuy nhiên trong bảng 5 lại khảo sát thêm mối quan hệ giữa thông số ưa
dầu π và các thông số trong phương trình (1) và ta lại thấy phương trình đưa ra
có hệ số tương quan cao hơn và phương sai nhỏ hơn. Do đó, hoạt tính sinh học
được mô tả tốt nhất bởi phương trình:
log (1/C) = 1.4474 + 0.1804 π + 2.1107.б + 5.9212. q
C-NH
+ 0.3435. E
LUMO
-149.8933. q
CH2
(2)
Phương trình (1) và (2) là hoàn toàn thống nhất với nhau vì hằng số б có
liên quan chặt chẽ đến sự thay thế các nhóm thế trong vòng benzene để làm tăng
điện tích của các nguyên tố, mặt khác từ phương trình (2) ta thấy hằng số б
Hammett, thông số ưa dầu π làm tăng hoạt tính sinh học điều đó cho ta thấy rằng
những nhóm thế có kích thước lớn và có hiệu ứng hút electron mạnh thì làm tăng
hoạt tính sinh học của chất khảo sát. Sự phù hợp này cũng được chứng minh bởi
các thông số thực nghiệm bởi các nhóm thế R có hiệu ứng làm giảm mật độ
electron (các nhóm hút electron Cl, 2,3- C
4
H
4
, ) lại làm tăng hoạt tính kháng
nấm của chất khảo sát. Ngược lại ( các nhóm đẩy electron OH, Me, ) đều làm
giảm hoạt tính kháng nấm này.
Như vậy hoạt tính kháng nấm của các chất khảo sát được mô tả tốt nhất
bằng phương trình Hansch dạng
12
log (1/C) = 1.4474 + 0.1804 π + 2.1107.б + 5.9212. q
C-NH
+ 0.3435. E
LUMO
-149.8933. q
CH2
13