Tải bản đầy đủ (.pdf) (54 trang)

Xây dựng mô hình học máy cho thế năng tương tác trong alpha fe

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.93 MB, 54 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

----------------

CẤN THỊ LAN HƢƠNG

XÂY DỰNG MƠ HÌNH HỌC MÁY CHO THẾ

NĂNG TƢƠNG TÁC GIỮA CÁC NGUYÊN TỬ
TRONG ALPHA Fe

nguye

LUẬN VĂN THẠC SỸ KHOA HỌC

Hà Nội - 2020


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

----------------

CẤN THỊ LAN HƢƠNG

XÂY DỰNG MƠ HÌNH HỌC MÁY CHO THẾ
NĂNG TƢƠNG TÁC GIỮA CÁC NGUYÊN TỬ

TRONG ALPHA Fe
Chuyên ngành: Vật lý chất rắn


Mã số: 8440130.02
LUẬN VĂN THẠC SỸ KHOA HỌC
nguye

Ngƣời hƣớng dẫn khoa học: TS. NGUYỄN TIẾN CƢỜNG

Hà Nội - 2020


MỤC LỤC

MỞ ĐẦU ......................................................................................................1
CHƢƠNG I: TỔNG QUAN .......................................................................3
1.1. Kim loại chuyển tiếp ..........................................................................3
1.1.1. Định nghĩa ...................................................................................3
1.1.2. Cấu hình điện tử ..........................................................................3
1.1.3. Tính chất hóa học ........................................................................4
1.1.4. Tính chất vật lý ............................................................................5
1.2. Sắt .......................................................................................................7
1.2.1. Khái quát chung ..........................................................................7
1.2.2. Các tính chất của sắt ...................................................................7
1.2.3. Các dạng thù hình .......................................................................8
1.3. Alpha sắt.............................................................................................9
CHƢƠNG II: MƠ HÌNH VÀ PHƢƠNG PHÁP TÍNH TỐN ............11
2.1. Machine Learning ............................................................................11
2.1.1. Giới thiệu chung ........................................................................11
2.1.2. Mơ hình học máy Neural Network ............................................14
2.2. Phương pháp tính tốn .....................................................................18
2.2.1. Mơ hình hóa thế năng tương tác hóa học giữa các nguyên tử .18
2.2.2. Mơ hình hóa thế năng tương tác từ giữa các nguyên tử ...........19

2.3. Lý thuyết phiếm hàm mật độ ...........................................................20
2.3.1. Mật độ electron .........................................................................20
2.3.2. Mơ hình Thomas – Fermi ..........................................................21
2.3.3. Lý thuyết của Hohenberg – Kohn .............................................21
2.3.4. Phương trình Kohn –Sham........................................................22


2.4. Quantum ESPRESSO ......................................................................23
CHƢƠNG III: KẾT QUẢ VÀ THẢO LUẬN ........................................25
3.1. Chuẩn bị dữ liệu ...............................................................................25
3.1.1. Tối ưu hóa năng lượng cutoff....................................................25
3.1.2. Tối ưu lưới chia k-grid ..............................................................26
3.1.3. Giới hạn moment từ cục bộ .......................................................26
3.2. Một số phương pháp ước tính tham số ............................................28
3.2.1. Phương pháp Linear Regression ..............................................28
3.2.2. Phương pháp Ridge Regression ................................................28
3.2.3. Phương pháp LASSO ................................................................29
3.3. Mơ hình học máy cho thế năng tương tác giữa các nguyên tử trong
alpha Fe ...................................................................................................30
3.3.1. Mơ hình học máy cho thế năng tương tác hóa học ...................30
3.3.2. Mơ hình học máy cho thế năng tương tác cho trạng thái có từ
tính .......................................................................................................36
TÀI LIỆU THAM KHẢO ........................................................................44


DANH MỤC BẢNG BIỂU

Bảng 3.1. Sai số của mơ hình sử dụng phương pháp Linear Regression
Bảng 3.2. Sai số của mơ hình sử dụng phương pháp LASSO
Bảng 3.3: Sai số của mơ hình sử dụng phương pháp Ridge Regression

Bảng 3.4: Sai số của mơ hình sử dụng phương pháp Linear Regression
Bảng 3.5: Sai số của mơ hình sử dụng phương pháp LASSO
Bảng 3.6: Sai số của mơ hình sử dụng phương pháp Ridge Regression


DANH MỤC HÌNH VẼ

Hình 1.1. Dạng thù hình -Fe và -Fe
Hình 2.1: Mơ hình mối liên hệ giữa AI, ML và DL
Hình 2.2. Các bước xây dựng mơ hình học máy
Hình 2.3: Cấu trúc của một Neural Network chuyển tiếp
Hình 2.4. Cấu trúc của một neural network thế năng đa chiều
Hình 3.1: Đồ thị sự phụ thuộc của tổng năng lượng vào hằng số mạng tại các giá
trị năng lượng cutoff khác nhau
Hình 3.2: Đồ thị sự phụ thuộc của tổng năng lượng vào lưới chia k-grid
Hình 3.3: Cấu hình spin (a) trạng thái sắt từ và (b) trạng thái phản sắt từ
Hình 3.4: Giới hạn moment từ cục bộ cho mơ hình cấu trúc tinh thể sắt từ
Hình 3.5: Giới hạn moment từ cục bộ cho mơ hình cấu trúc tinh thể phản sắt từ
Hình 3.6. Biểu đồ biểu diễn sự phân bố năng lượng được tính tốn bằng phương
pháp DFT
Hình 3.7a. Đồ thị so sánh năng lượng cho bộ dữ liệu huấn luyện sử dụng
phương pháp hồi quy Linear Regression.
Hình 3.7b. Đồ thị so sánh năng lượng cho bộ dữ liệu huấn luyện sử dụng phương
pháp hồi quy LASSO.
Hình 3.7c. Đồ thị so sánh năng lượng cho bộ dữ liệu huấn luyện sử dụng
phương pháp Ridge Regression.
Hình 3.8a. Đồ thị so sánh năng lượng cho bộ dữ liệu kiểm tra sử dụng phương
pháp hồi quy Linear Regression
Hình 3.8b. Đồ thị so sánh năng lượng cho bộ dữ liệu kiểm tra sử dụng phương
pháp hồi quy LASSO



Hình 3.8c. Đồ thị so sánh năng lượng cho bộ dữ liệu kiểm tra sử dụng phương
pháp Ridge Regression
Hình 3.9. Biểu đồ biểu diễn sự phân bố năng lượng được tính tốn bằng phương
pháp DFT
Hình 3.10a. Đồ thị so sánh năng lượng cho bộ dữ liệu huấn luyện sử dụng
phương pháp Liner Regression
Hình 3.10b. Đồ thị so sánh năng lượng cho bộ dữ liệu huấn luyện sử dụng
phương pháp LASSO
Hình 3.10c. Đồ thị so sánh năng lượng cho bộ dữ liệu huấn luyện sử dụng
phương pháp Ridge Regression
3.11a. Đồ thị so sánh năng lượng cho bộ dữ liệu kiểm tra sử dụng phương pháp
Linear Regression
Hình 3.11b. Đồ thị so sánh năng lượng cho bộ dữ liệu kiểm tra sử dụng phương
pháp LASSO
Hình 3.11c. Đồ thị so sánh năng lượng cho bộ dữ liệu kiểm tra sử dụng phương
pháp Ridge Regression


DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT

DFT:

Density functional theory

GGA:

Generalize gradient approximation


LDA:

Local density approximation

LSDA:

Local spin density approximation

PBE:

Perdew, Burke and Ernzerhof

PES:

Potential Energy Surface

NN:

Neural Network

DL:

Deep Learning

LASSO:

Least Absolute Skrinkage and Selection Operator


MỞ ĐẦU

Tính tốn năng lượng và lực của một hệ vật liệu đóng vai trị quan trọng
trong việc xác định cấu trúc và các tính chất của hệ vật liệu đó. Việc mơ hình hóa
đúng về lực và năng lượng sẽ giúp ích chúng ta trong việc tính tốn, mơ phỏng
và thiết kế vật liệu mới. Năng lượng và lực của một hệ vật liệu có thể nhận được
bằng cách thực hiện tính tốn cấu trúc điện tử dựa trên lý thuyết phiếm hàm mật
độ (DFT) [1-3]. Hiện nay, các tính tốn DFT được coi là một trong các cách thức
tính tốn chuẩn mực, đáng tin cậy và thường được dùng làm tham chiếu cho các
tính tốn khác. Tuy nhiên tính tốn DFT cho các hệ vật liệu lớn gồm nhiều
ngun tử địi hỏi hiệu năng máy tính cao và thời gian tính tốn kéo dài.
Ngồi ra, năng lượng của các hệ vật liệu lớn cũng có thể được tính gần
đúng bằng các cách thức khác cần ít tài nguyên máy tính và thời gian tính tốn
hơn. Thơng thường, bề mặt thế năng (PES) của hệ được xây dựng dưới dạng
tổng từ các đóng góp của các số hạng thấp chiều đơn giản (các yếu tố cấu trúc)
biểu thị các liên kết: cộng hóa trị (covalent bonds), liên kết góc (bond angles) và
góc nhị diện (dihedral angles) [4]. Các phương pháp này tỏ ra hiệu quả và được
áp dụng rộng rãi để mô phỏng các hệ sinh học lớn (large biosystem). Nhưng
chúng khó có thể mơ tả các phản ứng hóa học (chemical reactions) liên quan đến
sự hình thành hoặc sự phân ly của các liên kết cộng hóa trị.
Trong những năm gần đây, các phương pháp thay thế, có thể “học” PES
từ một tập hợp các cấu trúc vật liệu và năng lượng DFT tương ứng (đã tính từ
trước), đã và đang được phát triển [5-11]. Các phương pháp này sử dụng
Machine Learning (học máy) với các thuật toán có thể “học” được mối quan hệ
giữa cấu trúc và năng lượng của các hệ vật liệu. Thơng thường thì để xây dựng
một mơ hình học máy, tổng năng lượng của hệ vật liệu được phân tách thành
tổng của các năng lượng riêng của các nguyên tử cấu thành, tương tác với mơi
trường hóa học (chemical envirement) xung quanh với một bán kính giới hạn
(cutoff) xác định.

1



Mơ hình học máy để tính tốn và dự đốn năng lượng và lực trong hệ vật
liệu tinh thể không từ tính như silic đã được nhóm nghiên cứu của chúng tôi xây
dựng thành công [12]. Tuy nhiên, các mô hình này chưa đề cập đến năng lượng
trong trạng thái từ (có kể đến tương tác spin) cho các hệ vật liệu có từ tính. Do
đó, trong luận văn này chúng tơi đề xuất mơ hình học máy để sử dụng cho các hệ
vật liệu có từ tính được cấu tạo từ các kim loại chuyển tiếp, điểm hình là hệ
alpha Fe, nhằm mục đích ứng dụng để thiết kế các cấu trúc vật liệu từ mới.
Mục tiêu của luận văn: (1) Xây dựng các mơ hình học máy để tính tốn
năng lượng tương tác trong các hệ vật liệu alpha Fe, khi ở các trạng thái khơng từ
tính và có từ tính, một cách nhanh chóng và cần ít hiệu năng máy tính; (2) Lựa
chọn mơ hình học máy cho kết quả tính tốn năng lượng chính xác nhất.
Bố cục của luận văn: Ngoài phần mở đầu, kết luận, tài liệu tham khảo,
luận văn gồm 3 chương:
-

Chƣơng 1: Tổng quan.
Trình bày một cách tổng quan về kim loại chuyển tiếp, sắt và alpha sắt.

-

Chƣơng 2: Mơ hình và phƣơng pháp tính tốn
Giới thiệu về các mơ hình học máy (machine learning), các phương pháp

tính tốn trong mơ hình, cơ sở của lý thuyết phiếm hàm mật độ (DFT) và gói
phần mềm quantum ESPRESSO.
-

Chƣơng 3: Kết quả và thảo luận
Trình bày các kết quả thu được và thảo luận: Từ bước chuẩn bị dữ liệu,


các phương pháp hồi quy để ước tính tham số (Linear, Rigde và LASSO), đến
kết quả tính tốn năng lượng của hệ alpha Fe, ở các trạng thái khơng từ tính và
có từ tính, với các mơ hình học máy sử dụng 3 phương pháp hồi quy nêu trên.
Cuối cùng, các chỉ số thống kê được đưa ra để đánh giá sai số của các mô hình
học máy, từ đó lựa chọn mơ hình học máy cho kết quả tính tốn năng lượng
chính xác nhất.

2


CHƢƠNG I: TỔNG QUAN
1.1. Kim loại chuyển tiếp
1.1.1. Định nghĩa
Trong hóa học, thuật ngữ kim loại chuyển tiếp (hay nguyên tố chuyển
tiếp) có thể có ba cách định nghĩa:
Định nghĩa của IUPAC định nghĩa kim loại chuyển tiếp là "nguyên tố mà
nguyên tử của nó có lớp vỏ phụ d được lấp đầy một phần, hoặc có thể làm phát
sinh các cation có lớp vỏ phụ d khơng hồn tồn" [13].
Theo cách định nghĩa khác, nhiều nhà khoa học mô tả "kim loại chuyển
tiếp" là bất kỳ nguyên tố nào trong khối d của bảng tuần hồn, bao gồm các
nhóm từ 3 đến 12 trong bảng tuần hoàn. Trong thực tế, dãy lantan và actini khối f
cũng được coi là kim loại chuyển tiếp và được gọi là "kim loại chuyển tiếp bên
trong" [14-15].
Theo Cotton và Wilkinson mở rộng định nghĩa ngắn gọn của IUPAC bằng
cách chỉ định những nguyên tố thuộc nhóm d như các nguyên tố thuộc nhóm 4
đến 11, thêm Scandi và ytri thuộc nhóm 3, chúng có vỏ phụ d được lấp đầy một
phần ở trạng thái kim loại. Tuy nhiên, Lantan và actini trong nhóm 3 được phân
loại lần lượt là Lantan và actini [16].
Các nguyên tố chuyển tiếp được công nhận rõ ràng nhất là các nguyên tố

từ nhóm 4 đến nhóm 11 dựa vào các tính chất hóa học điển hình của chúng.
1.1.2. Cấu hình điện tử
Cấu hình điện tử chung của nguyên tố nhóm d là (n-1)d1-10ns0-2. Thơng
thường thì các quỹ đạo lớp trong được điền đầy trước các quỹ đạo lớp ngoài. Các
quỹ đạo s của những nguyên tố thuộc về khối quỹ đạo d lại có trạng thái năng
lượng thấp hơn là các lớp d. Vì nguyên tử bao giờ cũng có khuynh hướng đi đến
trạng thái có năng lượng thấp nhất nên các quỹ đạo s được điền đầy trước nên
cấu trúc điện tử điển hình của các nguyên tử kim loại chuyển tiếp sau đó được
viết là ns2(n-1)dm. Tuy nhiên, quy tắc này chỉ mang tính chất gần đúng - nó chỉ

3


áp dụng cho một số phần tử chuyển tiếp và chỉ áp dụng ở các trạng thái cơ bản
trung tính.
Trong bảng tuần hồn, các kim loại chuyển tiếp có mặt trong tám nhóm,
từ nhóm 4 đến 11, có thể bao gồm thêm một số nguyên tố trong nhóm 3 hoặc 12.
Các ngun tố trong nhóm 3 có cấu hình ns2 (n - 1) d1. Chuỗi chuyển tiếp đầu
tiên có ở chu kỳ thứ 4, và bắt đầu sau Ca (Z = 20) của nhóm 2 có cấu hình [Ar]
4s2, hoặc scandium (Sc), nguyên tố đầu tiên của nhóm 3 với số nguyên tử Z = 21
và cấu hình [Ar] 4s2 3d1. Khi chúng ta di chuyển từ trái sang phải, các electron
được thêm vào cùng một lớp vỏ con d cho đến khi nó được lấp đầy. Tuy nhiên
vẫn có các trường hợp ngoại lệ là crôm và đồng, chỉ có 1 điện tử ở quỹ đạo ngồi
cùng, ngun nhân là do điện tử đẩy nhau, chia các điện tử ra trong quỹ đạo s và
quỹ đạo d để dẫn đến trạng thái năng lượng thấp hơn là điền 2 điện tử vào quỹ
đạo ngoài cùng ở các nguyên tử này. Vì các electron được thêm vào lấp đầy các
obitan (n-1)d, nên tính chất của các phần tử khối d hồn tồn khác với các thuộc
tính của các phần tử khối s và p trong đó sự lấp đầy xảy ra ở các obitan s hoặc p
của vỏ hóa trị [16].
Các obitan (n-1)d trong các kim loại chuyển tiếp là rất quan trọng vì

chúng ảnh hưởng đến các tính chất như đặc tính từ, trạng thái oxy hóa thay đổi,
sự hình thành các hợp chất màu, v.v. . Các obitan hóa trị s(ns) và p(np) có rất ít
đóng góp về mặt này vì chúng hầu như khơng thay đổi trong di chuyển từ trái
sang phải trong một chuỗi chuyển tiếp. Ở các kim loại chuyển tiếp, có sự giống
nhau theo chiều ngang về tính chất của các nguyên tố trong một chu kỳ so với
các chu kỳ mà các obitan d không tham gia. Điều này là do trong một chuỗi
chuyển tiếp, cấu hình điện tử vỏ hóa trị của các ngun tố khơng thay đổi [18].
1.1.3. Tính chất hóa học
Có một số thuộc tính được chia sẻ bởi các phần tử chuyển tiếp mà khơng
được tìm thấy trong các phần tử khác, là kết quả của lớp vỏ d được lấp đầy một
phần.Cũng như những tính chất khác của kim loại chuyển tiếp, các tính chất này
là do khả năng của các điện tử trong quỹ đạo d không có vị trí xác định trong

4


mạng của kim loại. Các tính chất này của kim loại chuyển tiếp càng rõ khi càng
có nhiều điện tử được chia sẻ giữa các hạt nhân.
* Kim loại chuyển tiếp có 4 tính chất hóa học cơ bản
-

Tạo hợp chất có màu
Vì cấu trúc của chúng nên các kim loại chuyển tiếp tạo thành nhiều ion

và phức chất có màu khác nhau. Màu cũng thay đổi ngay tại cùng một ngun tố,
ví dụ MnO4- (Mn trong mức ơxi hóa +7) là một hợp chất có màu tím, Mn2+ thì lại
có màu hồng nhạt [19].
-

Các kim loại chuyển tiếp có thể có nhiều trạng thái ơxi hóa khác nhau

Một đặc điểm của các kim loại chuyển tiếp là chúng thể hiện hai hoặc nhiều

trạng thái oxy hóa. Trong các nguyên tố chuyển tiếp, các electron hóa trị nằm ở
các phân lớp ns và (n-1)d có năng lượng xấp xỉ nhau nên chúng có thể sử dụng
các electron này khi tham gia liên kết để tạo gia nhiều trạng thái oxi hóa khác
nhau [20].
-

Kim loại chuyển tiếp là các chất xúc tác tốt
Đơn chất cũng như hợp chất của kim loại chuyển tiếp thường có hoạt tính

xúc tác. Chúng có khả năng tạo thành những hợp chất trung gian với các chất
phản ứng làm giảm năng lượng hoạt hóa của phản ứng nên phản ứng xảy ra với
tốc độ nhanh hơn. Kim loại chuyển tiếp cũng có thể đóng vai trị là chất hấp phụ
bề mặt (thường là xúc tác dị thể) do có diện tích bề mặt lớn.
-

Tạo phức chất
Các kim loại chuyển tiếp có khả năng tạo phức chất bền do chúng có các

onitan trống có thể tham gia tạo liên kết phối trí với các phối tử để tạo phức chất.
1.1.4. Tính chất vật lý
Các kim loại chuyển tiếp có xu hướng cứng và chúng có tỷ trọng tương đối
cao khi so sánh với các nguyên tố khác. Nhiệt độ sơi và nhiệt độ nóng chảy của
các ngun tố này cao là do sự tham gia của các electron d phân vùng trong liên

5


kết kim loại. Liên kết kim loại này của các electron d bị phân chia cũng làm cho

các nguyên tố chuyển tiếp trở thành chất dẫn điện tốt.
Ngoài ra các liên kết kim loại bởi các điện tử d bị phân chia, dẫn đến sự liên
kết tăng lên theo số lượng các điện tử dùng chung cũng gây ra cho kim loại
chuyển tiếp có mật độ nguyên tử và nhiệt độ sơi cao.
Một tính chất vật lý quan trọng của các kim loại chuyển tiếp là tính chất từ.
Tính chất từ gây ra do electron là một hạt mang điện (tích điện âm) quay xung
quanh hạt nhân và quay trên trục của chính nó. Từ trường được tạo ra do chuyển
động quỹ đạo và spin của electron. Sự quay của một electron trong một quỹ đạo
rất giống với sự chuyển động của dịng điện trong một mạch kín. Do đó, một
điện tử chưa ghép đôi được coi như một nam châm vi mơ có mơmen từ xác định.
Một chất có chứa một electron chưa ghép đôi khi đặt trong từ trường sẽ tương tác
với từ trường. Do đó, một lực hút được tác dụng và tính chất thuận từ được thể
hiện. Số lượng các electron chưa ghép đôi xác định độ lớn của mômen từ. Số
lượng các điện tử chưa ghép đơi cao dẫn đến mơmen từ lớn hình thành tính thuận
từ của chất. Tính chất thuận từ chỉ thể hiện khi chất chứa một hoặc nhiều
electron chưa ghép đôi. Khi một chất nhận được một mômen từ vĩnh cửu, nó
được gọi là sắt từ và hiện tượng này được gọi là chất sắt từ. Mặt khác, chúng ta
cũng có những chất bị từ trường đẩy lùi và được gọi là chất nghịch từ. Một chất
thể hiện tính nghịch từ khi nó chỉ chứa các electron ghép đơi. Hầu hết các phần
tử chuyển tiếp thể hiện tính thuận từ. Các electron chưa ghép đôi trong obitan (n1) d chịu trách nhiệm về các tính chất từ. Tính chất thuận từ của các kim loại
chuyển tiếp tăng lên khi di chuyển từ trái sang phải khi số lượng điện tử chưa
ghép đôi tăng từ một lên năm. Các phần tử ở giữa được tìm thấy có đặc tính
thuận từ cực đại. Tính chất từ giảm khi số electron chưa ghép đơi giảm [24].
Không chỉ gồm các chất thuận từ mà trong nhóm các kim loại chuyển tiếp
cịn chứa các chất sắt từ quan trọng như sắt, coban, niken… Các chất sắt từ có
mơmen spin của các ngun tử liên kết với nhau mạnh đến mức chúng có thể
định hướng song song được với nhau (trong các domain) kể cả khi không có từ

6



trường ngoài. Dưới tác dụng của từ trường ngoài các mômen spin quay một cách
dễ dàng theo hướng từ trường ngồi để đạt trạng thái bão hịa, do đó độ cảm từ
lớn. Tuy nhiên, hiện tượng từ hóa như vậy chỉ xảy ra trong trường hợp từ hóa lần
đầu tiên. Các chất sắt từ có đặc điểm chung là từ độ của nó thay đổi bất thuận
nghịch khi từ trường biến đổi. Sự thay đổi khác nhau đó gọi là hiện tượng từ trễ.
Hiện tượng từ trễ có ý nghĩa quan trọng trong nghiên cứu nam châm vĩnh cửu
Vật liệu sắt từ được chia làm vật liệu từ mềm, vật liệu từ cứng, vật liệu ghi từ.
Các vật liệu từ mềm được sử dụng làm lõi biến thế, mô tơ, máy phát, đầu ghi từ.
Vật liệu từ cứng chủ yếu dùng để chế tạo nam châm vĩnh cửu dùng trong các loa
điện động, mô tơ,…Vật liệu ghi từ được dùng để ghi thơng tin [25]. Các kim loại
chuyển tiếp có nhiều ứng dụng quan trọng trong thực tế, trong đó sắt là một kim
loại điển hình và được nghiên cứu sử dụng khá rộng rãi hiện nay.
1.2. Sắt
1.2.1. Khái quát chung
Sắt, kí hiệu: Fe, là một nguyên tố trong bảng tuần hồn ngun tố hóa học có
số ngun tử bằng 26, phân nhóm VIIIB, chu kỳ 4. Sắt là một nguyên tố có nhiều
trên Trái Đất, cấu thành nên lớp vỏ ngoài và trong lõi của Trái Đất. Sắt chiếm
khoảng 5% khối lượng vỏ Trái Đất, phần lớn được tìm thấy trong các dạng oxit
sắt khác nhau như: hematit, magnetit, taconit [26].
Trong khi sắt là nguyên tố phong phú nhất trên Trái đất, phần lớn lượng sắt
này tập trung ở lõi Trái đất. Phần sắt trong vỏ Trái đất chỉ chiếm khoảng 5% khối
lượng chung của lớp vỏ và do đó chỉ là nguyên tố phong phú thứ tư trong lớp đó
(sau oxy, silic và nhơm).
1.2.2. Các tính chất của sắt
* Tính chất hóa học
Giống như các ngun tố nhóm 8 khác, sắt tồn tại trong các trạng thái oxy
hóa, -2 đến +7, dù vậy +2 và +3 là phổ biến nhất. Sắt nguyên tố chỉ tồn tại trong
các môi trường thiên thạch và mơi trường oxy hóa thấp. Sắt nguyên chất các màu


7


ánh kim xám nhẹ nhưng dễ dàng phản ứng với oxy và nước trong khơng khí tạo
ra các oxit sắt có màu đỏ thường được gọi là rỉ sét.
* Tính chất vật lý
Sắt có màu trắng hơi xám, dẻo, dễ rèn, dễ dát mỏng, kéo sợi; dẫn điện và dẫn
nhiệt kém đồng và nhơm.
Sắt là chất sắt từ nên có các đặc tính của chất sắt từ như:
 Các chất sắt từ đều bị từ trường hút mạnh
 Thể hiện từ tính vĩnh cửu ngay cả khi khơng có từ trường
 Các chất sắt từ chuyển sang thuận từ khi nung ở nhiệt độ cao.
1.2.3. Các dạng thù hình
Sắt có ít nhất 4 dạng thì hình gồm:

; ở áp suất rất cao xuất hiện

một vài bằng chứng gây tranh cãi cho thấy sự tồn tại của pha ổn định

ở áp suất

và nhiệt độ rất cao [28].
Khi sắt nóng chảy nguội đi, nó kết tinh ở nhiệt độ 1539oC ở dạng thù hình
, dạng thù hình này có cấu trúc tinh thể lập phương tâm khối (bcc). Khi sắt
nóng chảy nguội đến nhiệt độ 1390oC cấu trúc của nó chuyển sang dạng lập
phương tâm mặt (fcc), dạng cấu trúc nay gọi là sắt

hay austenit. Ở nhiệt độ

910oC, cấu trúc tinh thể trở lại dạng lập phương tâm khối và được gọi là


sắt

hay ferrit, khi xuống đến nhiệt độ 771oC (điểm Curie, TC) sắt α chuyển từ thuận
từ sang sắt từ: spin của hai electron chưa ghép đôi trong mỗi nguyên tử thường
thẳng hàng với spin của các điện tử lân cận của nó, tạo ra một từ trường tổng thể.
Điều này xảy ra do các obitan của hai electron đó (dz2 và dx2 – y2) không hướng
về các nguyên tử lân cận trong mạng tinh thể, và do đó khơng tham gia vào liên
kết kim loại. Trong trường hợp khơng có từ trường bên ngoài, các nguyên tử bị
phân chia một cách tự nhiên thành các domain, có chiều ngang khoảng 10
micromet [29]. Khi qua nhiệt độ Curie sẽ khơng có sự thay đổi về cấu trúc tinh
thể, nhưng có sự thay đổi về cấu trúc domain; ở đây mỗi domain chứa các
nguyên tử sắt với các spin electron cụ thể. Ở sắt chưa bị từ hóa, tất cả các spin

8


electron của các nguyên tử bên trong một domain có cùng hướng; các domain kề
bên chỉ các hướng khác nhau và do đó triệt tiêu nhau.
Đối với sắt bị từ hóa, các spin electron của tất cả các domain đều được
xếp cùng hướng, vì vậy các hiệu ứng từ của các domain lân cận tăng cường lẫn
nhau. Hiệu ứng này được khai thác trong các thiết bị cần tạo kênh từ trường,
chẳng hạn như máy biến điện, đầu ghi từ và động cơ điện. Các tạp chất, khuyết
tật mạng tinh thể, hoặc hạt và ranh giới hạt có thể giữ các domain ở vị trí mới, do
đó hiệu ứng vẫn tồn tại ngay cả sau khi loại bỏ trường bên ngồi - do đó biến vật
thể sắt thành nam châm (vĩnh cửu). Hiện tượng tương tự cũng xảy ra với một số
hợp chất sắt, chẳng hạn như sắt và magie khống, oxit sắt từ Fe3O4 (mặc dù cơ
chế quy mơ ngun tử, tính sắt từ, có phần khác nhau). Những mảnh nam châm
với từ tính vĩnh cửu tự nhiên (đá nam châm) đã cung cấp những chiếc la bàn sớm
nhất để điều hướng. Các hạt magnetit được sử dụng rộng rãi trong các phương

tiện ghi từ tính như bộ nhớ lõi, băng từ, đĩa mềm và đĩa, cho đến khi chúng được
thay thế bằng vật liệu dựa trên Coban.
Ở áp suất trên 10 GPa và nhiệt độ hàng trăm K hoặc thấp hơn, sắt
chuyển thành cấu trúc sáu phương kết chặt (hcp), hay cịn gọi là sắt . Pha



nhiệt độ cao hơn cũng biến đổi thành sắt , nhưng ở áp suất cao hơn. Pha , nếu
có tồn tại, có thể ở áp suất ít nhất 50 GPa và nhiệt độ ít nhất 1500K. Nó được cho
là có cấu trúc trục thoi hoặc hcp kép [28].
1.3. Alpha sắt
Alpha Sắt ( - Fe) hay ferrit, là một dạng thù hình của sắt có cấu trúc lập
phương tâm khối (bcc). Nó là cấu trúc tinh thể tạo ra cho thép và gang các tính
chất từ của chúng và là điển hình ho vật liệu sắt từ. Nó có độ bền khoảng 280
N/mm2 và độ cứng khoảng 80 Brinell [30].
Khi ở dưới nhiệt độ 910oC dạng thì hình lập phương tâm khối của sắt
nguyên chất- sắt alpha là ổn định. Trên nhiệt độ này sắt chuyển sang dạng thù
hình có cấu trúc lập phương tâm diện (austnit hay sắt gamma). Ở nhiệt độ trên
1390oC cho tới điểm nóng chảy ở nhiệt độ 1539oC sắt trở lại dạng thù hình lập

9


phương tâm khối nhưng lúc này được gọi là delta ferrit hay sắt delta. Khi ferrit ở
trên nhiệt độ Curie ở 771oC, khi đó sắt chuyển từ chất sắt từ sang thuận từ; trước
đây trạng thái nay được gọi là beta ferrit hay sắt beta. Tuy nhiên, thuật ngữ này
không còn được sử dụng nữa do về mặt tinh thể học thì nó là đồng nhất với sắt
alpha, và phạm vi pha của nó là tiếp giáp với alpha sắt.

Hình 1.1: Dạng thù hình -Fe và -Fe

Chỉ một lượng rất nhỏ cacbon có thể hịa tan trong ferrit; độ hịa tan tối đa
khoảng 0,02% trọng lượng ở 723oC và chỉ 0,001% cacbon ở 0oC và sắt delta là
0,09-1% ở nhiệt độ 1420oC. Điều này xảy ra do cacbon hòa tan sắt theo kiểu xen
kẽ với các nguyên tử cacbon có đường kính lớn hơn khoảng gần 2 lần đường
kính các khe hở, vì thế mỗi nguyên tử cacbon được bao quanh bởi một trường
biến dạng cụ bộ mạnh. Do đó, etanpi của hỗn hợp là dương (không thuận lợi),
nhưng sự góp phần của entropi vào năng lượng tự do của dung dịch làm ổn định
cấu trúc hàm lượng cacbon thấp.
Sắt alpha là dạng thù hình của sắt ổn định trong các điều kiện tiêu chuẩn,
có thể chịu áp suất tới khoảng 15 GPa trước khi biến thành dạng thù hình ở áp
suất cao hơn là - Fe (sắt epsilon), là dạng kết tinh trong cấu trúc lục phương
(hcp) [31].

10


CHƢƠNG II: MƠ HÌNH VÀ PHƢƠNG PHÁP TÍNH TỐN

2.1. Machine Learning
2.1.1. Giới thiệu chung
Những năm gần đây, AI - Artificial Intelligence (Trí tuệ nhân tạo) và hẹp
hơn là ML - Machine Learning (Học máy) phát triển mạnh mẽ theo xu thế của
cách mạng công nghiệp 4.0. AI đang len lỏi vào nhiều lĩnh vực trong đời sống
mà có thể chúng ta không nhận ra. Xe tự vận hành của Google và Tesla, hệ thống
tự tag khuôn mặt trong ảnh của Facebook, trợ lý ảo Siri của Apple, hệ thống gợi
ý sản phẩm của Amazon, hệ thống gợi ý phim của Netflix, máy chơi cờ vây
AlphaGo của Google DeepMind,… là một vài ví dụ trong rất nhiều ứng dụng
của AI. Thực tế thì ML chỉ là một “tập con” của AI. Hình 2.1 minh họa cho mối
liên hệ giữa AI, ML và DL - Deep Learning (học sâu).


Hình 2.1: Mơ hình mối liên hệ giữa AI, ML và DL [5]
Một cách khái quát, ML là một lĩnh vực của Khoa học máy tính, nó có
khả năng tự học hỏi dựa trên dữ liệu đưa vào. Nói cách khác học máy địi hỏi dữ
liệu huấn luyện (training data) và các thuật toán để học từ dữ liệu đó. ML cho
phép một máy tính đưa ra dự đốn về dữ liệu mới mà nó chưa từng thấy trước đó
(unseen data) dựa trên các mẫu dữ liệu mà nó đã “học” (training data).

11


ML hiện nay được áp dụng khá rộng rãi trong nhiều lĩnh vực bao
gồm truy tìm dữ liệu, chẩn đốn y khoa, phát hiện thẻ tín dụng giả, phân tích thị
trường chứng khoán, phân loại các chuỗi DNA, nhận dạng tiếng nói và chữ
viết, dịch tự động, chơi trị chơi và cử động rô-bốt (robot locomotion). Trong
nhiều trường hợp, để giải quyết bài tốn cần có kiến thức của các chun gia
nhưng nhân lực khơng đủ. Một số bài tốn cần đưa ra quyết định nhanh chóng
dựa trên xử lý dữ liệu khổng lồ (ví dụ trong mua bán chứng khoán phải đưa ra
quyết định trong vài giây). Dữ liệu trong các bài toán như vậy cần đến sự hỗ trợ
của máy tính, trong đó rất nhiều dữ liệu cần đến sự xử lý của ML. ML nghiên
cứu cách thức để mơ hình hóa bài tốn cho phép máy tính tự động hiểu, xử lý và
học từ dữ liệu để thực thi nhiệm vụ được giao cũng như cách đánh giá giúp tăng
tính hiệu quả. Tom Mitchell, giáo sư nổi tiếng của Đại học Carnegie Mellon
University - CMU, đã đưa ra định nghĩa cụ thể cho ML như sau: "Machine
learning là một chương trình máy tính học cách thực thi một lớp nhiệm vụ thơng
qua huấn luyện, qua q trình huấn luyện giúp hình thành và cải thiện hiệu quả
thực thi" [6]
Về tốn học, ML có liên quan lớn đến thống kê, cả ML và thống kê đều
được dùng để nghiên cứu và phân tích dữ liệu. Nhưng ML khác với thống kê là
nó tập trung vào sự phức tạp của các giải thuật trong việc thực thi tính tốn.
Nhiều bài toán suy luận được xếp vào loại bài toán lý thuyết phức tạp, vì thế một

phần của ML là nghiên cứu sự phát triển các giải thuật suy luận xấp xỉ.
Biểu diễn (representation) là một trong những vấn đề quan trọng của ML.
Biểu diễn ở đây có thể hiểu làm sao ghi mã (encode) những thông tin của thế
giới thật giúp ML hiểu và thực thi nhiệm vụ một cách hiệu quả và đầy đủ nhất có
thể. Thơng tin ở đây bao hàm cả thông tin về dữ liệu đầu vào, đầu ra hay các
trạng thái của hệ thống, cũng như cách đánh giá hiệu quả của chương trình.
Thơng thường, trong ML người ta hay xây dựng các mô hình sử dụng
những biến ngẫu nhiên cho việc biểu diễn dữ liệu và trạng thái của hệ thống. Mối
tương quan giữa các biến ngẫu nhiên này có thể sử dụng ví dụ như mơ hình xác

12


suất dạng đồ thị để miêu tả. Mặt khác, để đo hiệu quả có thể dùng các hàm mất
mát (loss function). Một trong những trọng tâm khác của ML là đạt được tính
phổ qt (generalization), nói cách khác là tính chất của chương trình mà có thể
làm việc tốt với dữ liệu nó chưa gặp bao giờ (unseen data). Nếu một chương
trình chỉ hiệu quả với dữ liệu đã gặp nó sẽ khơng mang lại nhiều lợi ích. [6]
Mục tiêu của một mơ hình học máy là giúp cho chương trình máy tính có
thể tiếp cận hành động như con người và không cần nhiều sự trợ giúp từ con
người. Để đạt được điều đó các nhà khoa học đã nghiên cứu ra nhiều cách tiếp
cận khác nhau như: Clustering, Reinforcement learning, Bayesian networks,…
và Deep Learning (DL) là một trong những cách tiếp cận đó.
DL là các mơ hình tốn học mô phỏng lại hoạt động của bộ não người với
nhiều lớp Neural. Các mơ hình DL hướng tới việc có thể xử lý dữ liệu theo cách
tương tự như một bộ não con người. Nhưng để nó có thể làm được điều đó chúng
ta cần huấn luyện (training) cho các mơ hình DL này theo những bước cần thiết.
Ví dụ để huấn luyện nó có thể nhận biết một con mèo ta cần thực hiện các bước:



Cung cấp cho máy rất nhiều ảnh về mèo.



Thuật toán sẽ kiểm tra ảnh để xem các đặc điểm, chi tiết chung giữa các bức
ảnh.



Mỗi bức ảnh sẽ được giải mã chi tiết dưới nhiều cấp độ, từ các hình dạng
lớn chung đến các ơ nhỏ và nhỏ hơn nữa. Nếu một hình dạng hoặc các
đường được lặp lại nhiều lần, thuật toán sẽ gắn nhãn nó như là một đặc tính
quan trọng.



Sau khi phân tích đủ hình ảnh cần thiết, thuật tốn giờ đây sẽ biết được các
mẫu nào cung cấp bằng chứng rõ ràng nhất về mèo và tất cả những gì con
người phải làm chỉ là cung cấp các dữ liệu thơ.[4]
DL có thể tự huấn luyện chính nó từ những dữ liệu đưa vào. Nhờ tính

năng này, DL cho phép ứng dụng vào giải quyết nhiều vấn đề thực tế của máy
tính đồng thời mở rộng sang nhiều lĩnh vực tổng thể của AI. Như vậy, DL có thể

13


làm cho các loại máy móc có thể thực hiện được gần hoặc giống với cách làm
việc của con người để trợ giúp chúng ta.


Hình 2.2. Các bước xây dựng mơ hình học máy [31]
2.1.2. Mơ hình học máy Neural Network
Mơ hình học máy neural network (hay một mơ hình học máy Deep
Learning) được sử dụng trong nhiều lĩnh vực khác nhau, đặc biệt là trong các
ngành khoa học.
Hiện nay, phương pháp tính tốn theo ngun lý ban đầu (ab initio) như
động học phân tử (MD) hay phiếm hàm mật độ (DFT) đã trở thành các cách tiếp
cận tiêu chuẩn để nghiên cứu tính tốn các q trình hóa học. Bằng các phương
pháp này, năng lượng và lực được tính toán dựa trên cấu trúc điện tử, quan trọng
nhất là hàm mật độ electron. Mặc dù chúng ta đã có các máy tính hiệu năng cao
và có thể triển khai hiệu quả nhiều tính tốn, vẫn cịn một số lượng lớn các vấn
đề mà ab initio không thể thực hiện được do địi hỏi nhiều tài ngun máy tính
và thời gian tính tốn kéo dài (chi phí tính tốn cao). Để giải quyết vấn đề này,
nhiều phương pháp tiếp cận đơn giản, thuần túy tốn học có chi phí thấp hơn
đang được nghiên cứu và phát triển trong đó có mơ hình Neural Network (NN).
Người ta thấy rằng, về ngun tắc NN có thể phù hợp với bất kỳ giá trị hàm thực
nào với độ chính xác dự kiến. Một thập kỷ gần đây, NN đã được áp dụng để xây
dựng bề mặt năng lượng (PES). Khi được xây dựng thành cơng, NN có thể dự
đốn năng lượng và lực nhanh hơn nhiều so với tính tốn cấu trúc điện tử, và do
đó cho phép thực hiện các mơ phỏng động lực học phân tử với các hệ lớn. Với

14


các hệ lớn, tọa độ Descartes không phải là một lựa chọn tốt để biểu diễn các vị trí
nguyên tử, và cần phải chuyển đổi sang các hàm đối xứng
Cấu trúc của một NN nhỏ được thể hiện dưới dạng giản đồ trong hình 2.3.
Nó bao gồm một số nút, hoặc nơ-ron được sắp xếp thành từng lớp. Nút ở lớp đầu
ra cung cấp giá trị hàm của NN, năng lượng E. Năng lượng là hàm của các vị trí
nguyên tử, được cung cấp cho NN dưới dạng một số tọa độ thích hợp G = {Gi}

trong các nút của lớp đầu vào. Có một nút đầu vào cho mỗi bậc tự do, ví dụ Hình
2.3 biểu diễn một bề mặt năng lượng bốn chiều. Ở giữa lớp đầu vào và lớp đầu ra
có một hoặc nhiều lớp ẩn. Các nút trong các lớp ẩn khơng có ý nghĩa vật lý,
nhưng xác định dạng hàm của NN. Càng nhiều nút được sử dụng, NN tạo ra càng
linh hoạt. Mỗi nút trong mỗi lớp được kết nối với các nút ở lớp trước và lớp sau
bằng các tham số trọng số, tham số khớp của NN. Cụ thể, chúng tôi sử dụng ký
hiệu trọng số aikjl để kết nối nút i trong lớp j với nút k trong lớp l. Lớp đầu vào
tương ứng với lớp 0. Ngoài ra, ngoại trừ lớp đầu vào, mỗi nút i trong lớp j được
kết nối với một nút dự kiến bởi trọng số dự kiến bij (khơng được hiển thị). Nút dự
kiến ln có giá trị là một và trọng số dự kiến có thể được sử dụng như một phần
bù có thể điều chỉnh để dịch chuyển đầu vào của các nút. Giá trị yij của nút i
trong lớp j sau đó được tính là:

Hàm

.

(1)

được gọi là hàm kích hoạt NN. Đây là một hàm phi tuyến cung

cấp khả năng phù hợp với các hàm tùy ý. Nếu khơng có hàm kích hoạt, năng
lượng sẽ đơn giản giảm xuống một tổ hợp tuyến tính của các tọa độ

15


lớp đầu vào

lớp ẩn 1


lớp ẩn 2

lớp đầu ra

Hình 2.3: Cấu trúc của một Neural Network chuyển tiếp [20]
NN chuyển tiếp tiêu chuẩn như đã thảo luận ở trên là các cơng cụ hữu ích
để biểu diễn các PES thấp chiều. Tuy nhiên, có một số vấn đề với cấu trúc bề
mặt năng lượng cho các hệ thống có hàng nghìn bậc tự do. Thứ nhất, vì mỗi bậc
tự do được biểu diễn bằng một nút đầu vào, kích thước của NN tăng lên đáng kể
làm cho phương pháp kém hiệu quả hơn. Thứ hai, số lượng nút đầu vào không
thể thay đổi khi thế năng NN đã được trang bị. Do đó, về ngun tắc đối với mỗi
kích thước hệ thống sẽ phải xây dựng một thế năng riêng biệt. Điều này là không
khả thi. Với hệ lớn nhiều hạt, vấn đề có thể giải quyết bởi thay thế năng lượng
cần tính bằng tổng các năng lượng nguyên tử Ei. Ei phụ thuộc vào mơi trường
hóa học (chemical environments) của ngun tử, nó được xác định bởi vị trí của
tất cả các lân cận bên trong một hình cầu có bán kính cắt (cutoff radius). Hàm
liên hệ giữa vị trí và năng lượng của các nguyên tử được xây dựng bởi một NN.
Nó được đào tạo gán năng lượng riêng lẻ cho các nguyên tử bằng cách “học”
năng lượng bề mặt cơ sở trên tập hợp các năng lượng tham chiếu. Các năng
lượng tham chiếu là có sẵn trong tính tốn cấu trúc điện tử (được thực hiện bởi
các tính tốn DFT).

16


Hàm đối xứng

NN
nguyên tử


Năng lượng
nguyên tử

Hình 2.4. Cấu trúc của một neural network thế năng đa chiều[20]
Trong hình 2.4, mỗi dòng đại diện cho một nguyên tử với tọa độ
Descartes Ri. Đầu tiên, các tọa độ được chuyển đổi thành một tập hợp các giá trị
hàm đối xứng Gi cũng phụ thuộc vào tọa độ Descartes của tất cả các nguyên tử
trong môi trường địa phương. Các giá trị hàm đối xứng biểu thị các vectơ đầu
vào cho các NN nguyên tử mang lại sự đóng góp năng lượng nguyên tử Ei. Tổng
năng lượng E là tổng của tất cả Ei được xây dựng để tái tạo tổng năng lượng
chính xác theo phương trình:


(2)

Ban đầu, tọa độ Descartes của tất cả các nguyên tử được chuyển đổi thành
một số tọa độ đầu vào phù hợp cho các NN. Các tọa độ này được gọi là các hàm
đối xứng. Các hàm này là các hàm nhiều thành phần tùy thuộc vào tất cả các
nguyên tử trong môi trường cục bộ.Với mỗi nguyên tử, sẽ thu được một tập hợp
các giá trị hàm đối xứng, đó là đầu vào cho NN nguyên tử của nó. Điều này
mang lại năng lượng đóng góp của nguyên tử, và tất cả các đóng góp cuối cùng
được thêm vào để có được tổng năng lượng của hệ thống.[10] Đối với một
nguyên tố hóa học nhất định, các cấu trúc và tham số trọng lượng của NN
nguyên tử là giống hệt nhau. Nếu một nguyên tử được thêm vào, NN nguyên tử
khác với cấu trúc và trọng lượng của yếu tố tương ứng được thêm vào tổng năng
lượng. Nếu một nguyên tử bị loại bỏ, NN nguyên tử của nó sẽ bị xóa. Các tập
hợp các giá trị hàm đối xứng cho hai nguyên tử giống nhau phải giống hệt nhau,

17



×