TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
-------------
BÁO CÁO BTL THUỘC HỌC PHẦN: TÍNH TỐN HIỆU NĂNG CAO
Tìm hiểu vai trị và tầm quan trọng của HPC với AI
GVHD: TS.HÀ MẠNH ĐÀO
Sinh viên: Nguyễn Trọng Trường
Phạm Tiến Cơng
Phạm Việt Hưng
Lớp: 20231IT6069001
Khóa: K16
Hà Nội – Năm 2023
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
-------------
BÁO CÁO BTL THUỘC HỌC PHẦN: TÍNH TỐN HIỆU NĂNG CAO
Tìm hiểu vai trị và tầm quan trọng của HPC với AI
GVHD: TS.HÀ MẠNH ĐÀO
Sinh viên: Nguyễn Trọng Trường
Phạm Tiến Cơng
Phạm Việt Hưng
Lớp: 20231IT6069001
Khóa: K16
Hà Nội – Năm 2023
4
Mục Lục
Lời nói đầu.......................................................................................................................................4
PHẦN 1: MỞ ĐẦU..........................................................................................................................5
1.1. Tên đề tài...............................................................................................................................5
1.2. Lý do chọn đề tài..................................................................................................................5
1.3. Nội dung nghiên cứu............................................................................................................5
1.3.1. Kiến thức........................................................................................................................5
1.3.2. Kỹ năng..........................................................................................................................6
PHẦN 2: KẾT QUẢ NGHIÊN CỨU.............................................................................................6
2.1. Tổng quan về HPC...............................................................................................................6
2.1.1. HPC là gì?......................................................................................................................6
2.1.2. Các bài tốn phổ biến có sử dụng HPC........................................................................8
2.2. HPC với AI..........................................................................................................................13
2.2.1. Sự phổ biến của HPC..................................................................................................13
2.2.2. Vai trò và tầm quan trọng của HPC với AI...............................................................13
2.2.3. Một số ví dụ..................................................................................................................15
PHẦN 3: KẾT LUẬN VÀ BÀI HỌC KINH NGHIỆM..............................................................21
3.1. Kiến thức tích lũy được......................................................................................................21
3.2. Những thuận lợi và khó khan khi làm hồn thiện bài tập lớn........................................21
TÀI LIỆU THAM KHẢO.............................................................................................................22
5
Lời nói đầu
Trong suốt nhiều thập kỉ qua, những tiến bộ về Khoa học và Công nghệ
đã mang đến những thay đổi lớn trên nhiều lĩnh vực và đóng góp một tầm ảnh
hưởng vô cùng quan trọng tới mọi mặt đời sống của con người. Một trong
những tiến bộ đó có thể nói tới đó là việc các thiết bị phần cứng ngày nay
đang trở nên hoàn hảo và đáp ứng được khả năng tính tốn mạnh mẽ trước
những u cầu phức tạp mà con người đề ra. Tính tốn hiệu năng cao (High
Performance Computing - HPC) trên cơ sở các hệ thống siêu máy tính là một
trong những thành phần cốt lõi trong sự phát triển đó và nó đã đánh dấu cho
sự thay đổi trong bước chuyển hóa về nghiên cứu dựa trên những cơng cụ tính
tốn lớn.
Ngồi ra, AI đang ngày càng đóng vai trị quan trọng đi đầu trong
nghiên cứu và khám phá khoa học, điều này đang thúc đẩy sự hội tụ của HPC
và AI. Trong hai năm qua, sự kết hợp giữa AI và HPC đã tạo ra những đột
phá sẽ không thể thực hiện được chỉ bằng cách sử dụng điện toán tăng tốc.
Sau khi được học và tích lũy được những kiến thức của mơn Tính tốn
hiệu năng ca, Nhóm chúng xem sẽ tìm hiểu và phân tích tầm quan trọng và
vai trò của HPC với AI. Do còn thiếu kinh nghiệm và kĩ năng nên bản báo cáo
không tránh khỏi sai sót, rất mong sự đóng góp từ thầy cơ để bản báo cáo của
chúng em hồn thiện hơn.
Nhân đây, nhóm em cũng xin cảm ơn thầy Hà Mạnh Đào, đã hướng
dẫn, cung cấp kiến thức và kĩ năng cho nhóm chúng em hoàn thành bản báo
cáo.
6
PHẦN 1: MỞ ĐẦU
1.1. Tên đề tài
Tầm quan trọng và vai trò của HPC với AI.
1.2. Lý do chọn đề tài
Trong một nghiên cứu về “Sự hội tụ của trí tuệ nhân tạo và điện toán
hiệu năng cao trên cơ sở hạ tầng mạng được hỗ trợ bởi NSF”
(Journalofbigdata, 2020) cho thấy xu hướng tích hợp HPC vào trong các cơng
nghệ AI. Các ứng dụng AI mang tính đổi mới đã hỗ trợ các giải pháp chuyển
đổi cho những thách thức về dữ liệu lớn, thúc đẩy các ngành công nghiệp,
cơng nghệ có trị giá hàng tỷ đơ la và đóng vai trị ngày càng tăng trong việc
định hình các mơ hình xã hội lồi người. Khi AI tiếp tục phát triển thành một
mơ hình tính tốn có độ chính xác về mặt thống kê và toán học, rõ ràng là các
mơ hình tính tốn chỉ sử dụng một GPU để đào tạo, xác thực và kiểm thử
khơng cịn đủ đáp ứng cho những thách thức lớn về tính tốn do các cơ sở
khoa học tạo ra dữ liệu với tốc độ và khối lượng vượt xa khả năng tính toán
của các nền tảng cơ sở hạ tầng mạng hiện có. Nhận thức này đã thúc đẩy sự
kết hợp giữa HPC và AI để giảm thời gian tính tốn và cho phép nghiên cứu
có hệ thống về các kiến trúc domain-inspired AI và data-driven AI. Ở Việt
Nam, việc tích hợp HPC và AI còn khá hạn chế do các vấn đề liên quan đến
nhận thức, công nghệ. Trong bài báo cáo này, chúng tôi sẽ đưa ra những dẫn
chứng từ những nghiên cứu khoa học thực nghiệm để chứng minh vai trò và
tầm quan trọng của HPC với AI.
1.3. Nội dung nghiên cứu
1.3.1. Kiến thức
Tính tốn hiệu năng cao (HPC) có tác động đáng kể đối với nhiều lĩnh
vực khoa học chịu ảnh hưởng của tính tốn, như hóa học, vật lý hạt nhân,
khoa học vũ trụ, đặc biệt là trong các dự án trí tuệ nhân tạo có u cầu tính
tốn phức tạp. Tính tốn hiệu năng cao đóng vai trò quan trọng trong việc giải
7
quyết nhiều vấn đề toán học, giúp dự đoán kết quả thử nghiệm trước, từ đó rút
ngắn thời gian thử nghiệm. Nhiều bài tốn u cầu mơi trường tính tốn lưới
vàng, đặt ra sự cần thiết của tính tốn hiệu năng cao trong nhiều lĩnh vực khoa
học và công nghệ.
Mở đầu sẽ bắt đầu với tổng quan về Tính tốn hiệu năng cao, tiếp theo
là phân tích ảnh hưởng của HPC đối với trí tuệ nhân tạo và các bài tốn địi
hỏi xử lý, bộ nhớ, và xử lý dữ liệu phức tạp. Đặc biệt, bài viết cũng trình bày
một số kết quả thực nghiệm của Tính tốn hiệu năng cao trong việc phát triển
mơ hình trí tuệ nhân tạo.
1.3.2. Kỹ năng
Các kĩ năng cần trang bị để hoàn thiện bài báo cáo của các thành viên
trong nhóm:
- Kỹ năng làm việc nhóm
- Kỹ năng tìm kiếm tài liệu
- Kỹ năng năng viết tài liệu kỹ thuật
8
PHẦN 2: KẾT QUẢ NGHIÊN CỨU
2.1. Tổng quan về HPC
2.1.1. HPC là gì?
Khái niệm: Điện tốn hiệu năng cao (HPC) là việc sử dụng siêu máy tính
và kỹ thuật xử lý song song để giải quyết các vấn đề tính tốn phức tạp. Cơng
nghệ HPC tập trung vào phát triển các thuật toán và hệ thống xử lý song song
bằng cách kết hợp cả kỹ thuật quản trị và tính tốn song song.
Hình 2.1 Mơ hình kiến trúc HPC
Các thành phần chính và các kiến trúc của hệ thống HPC:
9
Hình 2.2 Các thành phần chính của hệ thống HPC
Thành phần tính tốn: Như tên cho thấy, thành phần tính toán tập trung
vào việc xử lý dữ liệu, thực thi phần mềm hoặc thuật toán và giải quyết vấn
đề. Một cụm máy tính (và tất cả các bộ xử lý, mạch chuyên dụng và bộ nhớ
cục bộ được yêu cầu trong đó) thực hiện các tính tốn sẽ nằm dưới chiếc ơ
"máy tính".
Thành phần mạng: Kiến trúc HPC thành cơng phải có mạng nhanh và
đáng tin cậy, cho dù để nhập dữ liệu ngoài, di chuyển dữ liệu giữa các tài
nguyên máy tính hoặc truyền dữ liệu đến hoặc từ tài nguyên lưu trữ.
Thành phần lưu trữ: Lưu trữ đám mây, với khối lượng lớn và tốc độ truy
cập và truy xuất cao, là một phần không thể thiếu đối với sự thành công của
hệ thống HPC. Trong khi lưu trữ ngoài truyền thống là thành phần chậm nhất
của hệ thống máy tính, lưu trữ trong hệ thống HPC sẽ hoạt động tương đối
nhanh để đáp ứng nhu cầu của khối lượng công việc HPC.
Các kiến trúc của hệ thống HPC là:
- Paralell computing
- Cluster computing
- Quantum computing
10
- Grid computing
- HPC on Cloud
2.1.2. Các bài toán phổ biến có sử dụng HPC
2.1.2.1. Các bài tốn nặng về xử lý (compute intensive)
Trước hết xem xét các bài toán đòi hỏi nhiều về xử lý. Mục tiêu là phân
phối cơng việc cho một bài tốn duy nhất cho nhiều CPU để giảm thiểu thời
gian xử lý. Để thực hiện điều này, cần triển khai song song các bước của bài
toán. Mỗi process hoặc thread xử lý một phần của công việc và thực hiện
chúng đồng thời. Việc trao đổi dữ liệu giữa các CPU thường cần sự nhanh
chóng, yêu cầu phần cứng chuyên dụng cho giao tiếp. Các ví dụ về loại bài
tốn này bao gồm phân tích dữ liệu liên quan đến mơ hình hóa trong tài chính,
quản lý rủi ro, hay chăm sóc sức khỏe. Đây thường là mảng lớn nhất trong các
vấn đề của High-Performance Computing (HPC) và là lĩnh vực truyền thống
của HPC.
Khi cố gắng giải quyết các vấn đề nặng về xử lý, chúng ta có thể nghĩ
rằng việc thêm nhiều CPU sẽ giảm thời gian thực hiện. Tuy nhiên, điều này
không luôn đúng. Đa phần các mã nguồn song song thường đạt đến giới hạn
về tỷ lệ mở rộng (scaling-limit). Nguyên nhân là do hệ thống trở nên quá tải
bởi việc quản lý quá nhiều bản sao và còn do các hạn chế cơ bản khác.
Điều này được tóm tắt trong luật định Amdahl. Trong kiến trúc máy
tính, định luật Amdahl là một công thức giúp tăng tốc độ lý thuyết về độ trễ
của việc thực hiện một nhiệm vụ với khối lượng cơng việc cố định có thể
được dự kiến của một hệ thống có tài nguyên được cải thiện. Nó được đặt
theo tên của nhà khoa học máy tính Gene Amdahl, và được trình bày tại sự
kiện AFIPS Spring Joint Computer Conference năm 1967.
Định luật Amdahl, thường được sử dụng trong điện toán song song để dự
đoán sự tăng tốc lý thuyết khi sử dụng nhiều bộ xử lý. Ví dụ: nếu một chương
trình cần 20 giờ sử dụng lõi xử lý đơn và một phần cụ thể của chương trình
11
mất một giờ để thực thi thì khơng thể song song, trong khi 19 giờ (p = 0,95)
thời gian thực hiện có thể được song song bất kể có bao nhiêu bộ xử lý được
dành cho việc thực thi song song chương trình này, thời gian thực hiện tối
thiểu khơng thể ít hơn một giờ quan trọng đó. Do đó, việc tăng tốc lý thuyết bị
giới hạn tối đa 20 lần (1 / (1 – p) = 20). Vì lý do này, xử lý song song với
nhiều bộ xử lý chỉ hữu ích cho các chương trình có bản chất song song tự
nhiên.
Định luật Amdahl có thể được xây dựng theo cách sau, trong đó:
- S[latency] là sự tăng tốc lý thuyết của việc thực hiện toàn bộ nhiệm
vụ.
- s là sự tăng tốc của một phần của nhiệm vụ được hưởng lợi từ tài
nguyên hệ thống được cải thiện.
- p là tỷ lệ thời gian thực hiện mà phần được hưởng lợi từ các tài
nguyên được cải thiện ban đầu bị chiếm dụng.
Hiện nay có nhiều thư viện giúp hỗ trợ song song hóa bài tốn. Ví dụ
OpenMP hoặc Open MPI chúng ta nên cố gắng tối ưu hóa hiệu suất trên một
CPU, sau đó làm cho p càng lớn càng tốt khi chuyển sang thư viện này.
2.1.2.2. Các bài toán nặng về bộ nhớ (memory intensive)
Các vấn đề phức tạp về bộ nhớ đòi hỏi sự chú ý đặc biệt khi xây dựng
hệ thống, vì chúng thường yêu cầu không gian bộ nhớ lớn hơn là sự tăng
cường về CPU. Việc lập trình và chuyển mã trở nên dễ dàng hơn do bộ nhớ
được quản lý một cách liền lạc, tạo ra hình ảnh đồng nhất của hệ thống. Tuy
nhiên, thách thức lớn xuất phát khi cần tối ưu hóa hệ thống với thời gian kéo
dài, khi tính đồng đều của các thành phần gặp khó khăn.
Trong mơi trường truyền thống của các trung tâm dữ liệu, việc không
thay đổi máy chủ sau mỗi ba năm là điều phổ biến. Tuy nếu muốn mở rộng
cluster và duy trì hiệu suất đồng đều, việc sử dụng bộ nhớ không đồng nhất có
12
thể tạo ra độ trễ thực tế. Hơn nữa, cần phải xem xét kết nối giữa CPU và bộ
nhớ để đảm bảo hiệu suất tối ưu.
Hiện nay, nhiều trong những lo ngại này đã được giảm bớt nhờ vào sự
phổ biến của các máy chủ tiêu chuẩn. Việc có thể yêu cầu hàng nghìn instance
với cấu hình và phần cứng giống nhau từ các dịch vụ như Amazon Web
Services giúp giải quyết nhiều vấn đề phức tạp về quản lý tài ngun và đồng
nhất hóa hiệu suất.
2.1.2.3. Các bài tốn nặng về dữ liệu (data intensive)
Bài toán này khả năng bài tốn phổ biến nhất ngày nay và có lẽ là loại
có nhiều buzzword nhất. Được gọi là các bài toán Big Data. Bài toán dữ liệu
lớn (Big Data) là loại bài tốn phù hợp cho các gói phần mềm như Hadoop
hay MapReduce, yêu cầu khả năng xử lí dữ liệu với thông lượng cao. Chúng
ta sử dụng công nghệ để phân tán hoặc chia nhỏ dữ liệu trên nhiều CPU để
giảm thiểu thời gian xử lí. Tương tự, việc này có thể được áp dụng trên từng
data segment, tuy không luôn luôn quan tâm đến điều này.Bản chất của việc
giải quyết bài toán này liên quan đến vấn đề di chuyển và trao đổi thông tin
giữa các ổ đĩa trong máy tính hơn là vấn đề kết nối mạng. Các bài toán Big
Data hiện được áp dụng rộng rãi trong lĩnh vực khoa học sinh học (genomics),
nghiên cứu và có khả năng ứng dụng rộng trong các ứng dụngthương mại, đặc
biệt trong việc thu thập và xử lí thơng tin người sử dụng xung quanh internet.
2.1.2.4. Các bài toán cần đến thông lượng cao (throughput intensive)
Công việc xử lý hàng loạt được xem là một bài toán nặng về thơng
lượng cao, trong đó các hoạt động gần như khơng đáng kể được thực hiện
song song và có ít hoặc khơng có giao tiếp giữa các CPU. Trong bài tốn này,
chúng ta tập trung vào việc tăng thông lượng trong một khoảng thời gian nhất
định hơn là hiệu năng xử lý cho bất kỳ công việc nào.
Để giảm thời gian thực hiện tổng thể, chúng ta phân phối các công việc
độc lập trên nhiều CPU. Tuy nhiên, để đạt được điều này, các công việc cần
13
được chia thành các phần độc lập một cách tự nhiên và có rất ít hoặc khơng có
giao tiếp giữa CPU-CPU. Các công việc này cũng cần được thực hiện trong
các process hoặc thread riêng biệt trên một CPU để có thể thực hiện đồng
thời.
Bài tốn nặng về xử lý có thể được chia thành các bài tốn nặng về
thơng lượng cao. Tuy nhiên, không nhất thiết rằng các bài tốn thơng lượng
cao sẽ u cầu nhiều về CPU. Vì vậy, để tối ưu hóa q trình xử lý và tăng
thơng lượng, chúng ta cần phân tích và áp dụng phương pháp phù hợp cho
từng loại bài toán khác nhau.
2.2. HPC với AI
2.2.1. Sự phổ biến của HPC
Tăng cường nhu cầu về tính tốn trong lĩnh vực khoa học cơng nghệ đã
dần trở thành một thách thức đối với phương pháp xử lý tuần tự trên các bộ
xử lý hiện tại, khiến cho sự chuyển đổi sang xử lý song song trở thành chìa
khóa quan trọng để đối mặt với thách thức này. Do đó, những nghiên cứu
trong lĩnh vực tính tốn hiệu năng cao (High Performance Computing) hình
thành trở nên rất cần thiết. Kết quả là các hệ máy tính mạnh ra đời. Điển hình
là các hệ máy tính mạnh giá thành hạ, phát triển dựa trên việc liên kết các
máy tính cá nhân/máy trạm thơng qua đường truyền mạng tốc độ cao đã phát
triển mạnh trong thập kỷ qua. Hiện nay, cơng nghệ tính tốn lưới cho phép tận
dụng các tài nguyên sẵn có để xây dựng một mạng lưới tính tốn rất mạnh.
Trong thời đại hiện đại, Trí tuệ Nhân tạo (AI) nhanh chóng trở thành xu
hướng và động lực chính của nhiều lĩnh vực. Nó đã được tích hợp vào đa
dạng các ứng dụng doanh nghiệp đang phát triển, và chúng ta tương tác với
nó hàng ngày trong cuộc sống. Khi chúng ta tiến bộ đến cấp độ exascale, tài
ngun Tính tốn Hiệu năng Cao (HPC) trở thành một nhiệm vụ quan trọng
không chỉ trong các lĩnh vực khoa học và công nghệ truyền thống mà còn mở
rộng ra khắp các lĩnh vực kinh tế và xã hội. Các nền tảng và giải pháp HPC
hội tụ sẽ cung cấp những khả năng cần thiết, mở ra nhiều cơ hội hơn bao giờ
14
hết cho các nhà nghiên cứu, giúp họ vượt qua những thách thức và khám phá
các doanh nghiệp khó khăn nhất, từ đó cung cấp các sản phẩm và dịch vụ
sáng tạo sâu sắc. Mặc dù có nhiều cơng việc phải thực hiện, tuy nhiên, tầm
nhìn là rõ ràng và phần thưởng có thể đạt được sẽ rất lớn.
2.2.2. Vai trò và tầm quan trọng của HPC với AI
Đã lâu nay, điện tốn hiệu năng cao (HPC) đóng vai trị quan trọng
trong việc quản lý khối lượng công việc lớn, từ mơ phỏng đến phân tích quy
mơ lớn, nhằm thúc đẩy tiến bộ trong lĩnh vực khoa học, sáng tạo sản phẩm, và
tăng cường khả năng cạnh tranh giữa các quốc gia. Với sự gia tăng về quy mơ
của trí tuệ nhân tạo (AI), mở rộng cơ sở hạ tầng điện toán hiệu năng cao là
bước quan trọng để đối mặt với những thách thức đặt ra bởi các quy trình
cơng việc này. Sự kết hợp này đang mở rộng phạm vi ứng dụng của HPC và
làm cho cơ sở hạ tầng HPC trở nên quan trọng hơn bao giờ hết.
Tầm quan trọng của HPC và sự hội tụ của khối lượng công việc này
được phản ánh trong dự báo tăng trưởng của AI. Dự kiến thị trường HPC tổng
thể sẽ duy trì mức tăng trưởng tích lũy hàng năm 7% (CAGR) đến năm 2021.
Trong khi đó, phân khúc AI-HPC dự kiến sẽ có mức tăng trưởng ấn tượng với
30% CAGR trong cùng khoảng thời gian. Phân khúc HPC dành cho học sâu /
Deep Learning còn tăng nhanh hơn, với 81% CAGR. Những số liệu phân tích
của Intel cịn cho thấy chu kỳ tính tốn AI sẽ tăng lên đến 12 lần vào năm
2022.
Mơ phỏng tăng tốc.
Q trình xây dựng mơ hình Trí tuệ Nhân tạo (AI), đặc biệt là trong
giai đoạn đào tạo, đang trở thành một hoạt động chi phối bởi cơng nghệ điện
tốn. May mắn thay, tối ưu hóa tốc độ tính tốn hiện tại đang mang lại hiệu
suất đáng kể trong quá trình này.
Trong thời gian hai năm qua, sự kết hợp giữa Trí tuệ Nhân tạo (AI) và
Điện toán Hiệu năng Cao (HPC) đã tạo ra những tiến bộ không thể đạt được
15
nếu chỉ dựa vào điện tốn tăng tốc. Ví dụ, vào năm 2020, một nhóm nghiên
cứu từ Hoa Kỳ và Trung Quốc đã kết hợp mơ hình máy học "DeepMD-kit"
với công cụ mô phỏng động lực học phân tử LAMMPS để đồng thời mơ
phỏng 100 triệu ngun tử. Mơ hình học máy tính tốn các lực tương tác,
đồng thời thúc đẩy động lực học của hệ thống nhanh hơn 1.000 lần so với các
phương pháp tiêu chuẩn, cho phép mô phỏng hệ thống với kích thước lớn hơn
đáng kể.
Huerta và đồng đội đã xây dựng và đào tạo một mô hình AI để mơ tả
tín hiệu phát ra từ cặp lỗ đen xoay quanh quỹ đạo, gây ra sự biến dạng khôngthời gian. Việc tạo dữ liệu đào tạo này u cầu một mơ hình mơ phỏng vật lý
thiên văn lớn và được thu nhỏ trên một hệ thống HPC đặc biệt lớn, giảm đáng
kể thời gian để tạo dữ liệu và đào tạo mơ hình từ 24 ngày xuống còn 1,2 giờ.
Mặc dù hầu hết các phương pháp tập trung vào tăng tốc của một mô
phỏng đơn lẻ, sự tổng hợp này mang lại dịch vụ người dùng hiệu quả hơn, với
kết quả nhanh hơn và thông lượng tổng thể cao hơn cho mơi trường HPC.
HPC có thể được áp dụng trong AI theo nhiều cách, từ việc tăng tốc các mô
phỏng riêng lẻ đến việc giảm thiểu số lượng mô phỏng. Sự hiệu quả trở thành
trọng tâm khi người sử dụng HPC đối mặt với thách thức tối ưu hóa nhiều
tham số, đặc biệt khi họ cần đánh giá giữa các bộ tham số để tối ưu hóa giá trị
trong một khơng gian thiết kế có thể thực hiện được. Thực tế, những vấn đề
như "thiết kế thử nghiệm" (DOE) được đưa ra, trong đó thử nghiệm tương
đương với mô phỏng. DOE rất phổ biến trong HPC thương mại, nơi mô
phỏng được sử dụng như một công cụ quan trọng trong thiết kế sản phẩm.
2.2.3. Một vài ứng dụng và kết quả thực nghiệm của HPC trong AI
2.2.3.1 Công nghệ lái xe tự động
Lái xe tự động là trường hợp sử dụng AI được biết đến rõ nhất và hầu
hết chúng ta có thể liên quan đến.HPC khơng chỉ cung cấp khả năng xử lý
16
nhanh chóng, mà cịn cho phép hệ thống lái xe tự động thực hiện các tính tốn
phức tạp đồng thời từ nhiều nguồn dữ liệu. Điều này bao gồm việc phân tích
khơng chỉ hình ảnh và dữ liệu radar, mà cịn thơng tin từ các cảm biến khác
như lidar và ultrasonic. HPC giúp tối ưu hóa quyết định lái xe dựa trên sự kết
hợp chặt chẽ của các thông tin này, tăng cường khả năng dự đoán và phản ứng
của xe trong thời gian thực.
Ngồi ra, sự tích hợp của HPC với AI trong hệ thống lái xe tự động có
thể cải thiện khả năng học máy (machine learning) của xe. Hệ thống có thể
liên tục cập nhật mơ hình dự đoán dựa trên dữ liệu mới, từ trải nghiệm lái xe
và thông tin mới từ môi trường, tạo ra một hệ thống ngày càng thông minh và
linh hoạt.
Đồng thời, khả năng tính tốn cao của HPC cũng mở ra cửa cho các
ứng dụng mở rộng, như tương tác giữa các xe tự động để cải thiện hiệu suất
giao thông hoặc thậm chí là kết nối với hệ thống giao thông thông minh. Tất
cả những yếu tố này cùng nhau tạo nên một hệ thống lái xe tự động ngày càng
thơng minh, an tồn và tích hợp với mơi trường đơ thị ngày càng phức tạp.
2.2.3.2 Tìm hiểu bộ gen virus
Trong nghiên cứu về gen virus Covid-19, sự kết hợp giữa HighPerformance Computing (HPC) và Trí tuệ Nhân tạo (AI) đã đóng một vai trị
quan trọng trong việc phân tích và đánh giá dữ liệu genơm của virus. Một ví
dụ cụ thể là sử dụng HPC để thực hiện phân tích genơm hàng loạt từ các mẫu
virus Covid-19 thu thập trên khắp thế giới.
HPC có thể được sử dụng để tăng tốc q trình so sánh genơm, xác
định biến thể gen và phân loại chúng dựa trên đặc điểm genetict. Các giảng
viên nghiên cứu cũng có thể sử dụng mơ hình máy học (machine learning)
17
được đào tạo trên dữ liệu genơm để dự đốn sự biến đổi của virus và tiên
đoán mức độ nguy hiểm.
Qua đó, sự kết hợp giữa HPC và AI khơng chỉ giúp tạo ra một cơ sở dữ
liệu genôm rộng lớn mà còn cung cấp hiểu biết sâu rộng về đặc tính genetict
và tiềm ẩn của virus. Điều này có thể hỗ trợ các nhóm nghiên cứu y tế trong
việc phát hiện và theo dõi các biến thể mới của virus, từ đó cung cấp thơng tin
quan trọng để phát triển các chiến lược kiểm sốt và phịng ngừa.
2.2.3.3 Giám sát thời tiết mặt trời của NASA
Vào năm 2019, NASA đã tận dụng khả năng tính tốn hiệu suất cao để
theo dõi mức độ mạnh mẽ của bức xạ tia cực tím từ mặt trời, gây ra hiện
tượng lóa sáng. Điều này không chỉ quan trọng để đảm bảo an tồn cho các
chiến dịch vũ trụ, mà cịn để hiểu rõ hơn về cách thời tiết mặt trời ảnh hưởng
đến hệ thống truyền tải trên trái đất.
NASA đã sử dụng thiết bị không gian chuyên dụng, EVE MEGS-A, để
theo dõi các biến động trên mặt trời. Tuy nhiên, để đảm bảo tính liên tục và
độ chính xác, họ đã phát triển một mơ hình học sâu mới thơng qua sự hợp tác
với Phịng thí nghiệm Phát triển Biên giới. Mơ hình mạng nơ-ron sâu này
khơng chỉ có khả năng mơ phỏng các thay đổi trong thời tiết mặt trời một
cách đáng tin cậy mà còn hỗ trợ quyết định nhanh chóng và linh hoạt.
Ứng dụng này khơng chỉ mang lại đột phá trong lĩnh vực nghiên cứu
khoa học mà còn ảnh hưởng trực tiếp đến cuộc sống hàng ngày, hỗ trợ phi
hành gia và cơ quan quản lý trong việc đưa ra những quyết định tức thì trước
các tình huống không mong muốn.
18
2.2.3.4 Tăng tốc Đào tạo Mơ hình Học Máy trong Dự báo Thị trường Tài
chính
Một ví dụ rõ ràng về High-Performance Computing (HPC) hỗ trợ trí tuệ
nhân tạo là trong lĩnh vực dự báo thị trường tài chính. Các mơ hình học máy
được sử dụng để dự đốn xu hướng thị trường và đưa ra quyết định giao dịch.
Sử dụng HPC giúp tăng tốc q trình đào tạo mơ hình trên lượng lớn dữ liệu
lịch sử và dữ liệu thị trường hiện tại.
HPC (High Performance Computing) là công nghệ cung cấp khả năng
xử lý song song và tính tốn nhanh chóng, giúp mơ phỏng và điều chỉnh các
mơ hình dự đoán dựa trên các thay đổi thị trường. Với HPC, việc tính tốn và
phân tích dữ liệu được thực hiện một cách nhanh chóng và hiệu quả hơn bao
giờ hết.
Sử dụng HPC để phân tích thị trường có rất nhiều lợi ích. Đầu tiên,
việc sử dụng cơng nghệ này giúp cải thiện độ chính xác của các mơ hình dự
đốn. Nhờ vào khả năng xử lý hàng loạt thông tin trong khoảng thời gian
ngắn, HPC cho phép nhà đầu tư và quỹ đầu tư có được cái nhìn tổng quan về
tình hình thị trường, từ đó đưa ra quyết định thông minh và linh hoạt.
Thứ hai, HPC cũng giúp cho việc thí nghiệm và triển khai các chiến
lược giao dịch mới trở nên thuận tiện hơn. Với công nghệ này, nhà đầu tư có
thể kiểm tra hiệu quả của chiến lược mới một cách nhanh chóng và chính xác.
Việc này giúp cho nhà đầu tư kiểm soát được rủi ro và tối ưu hóa lợi nhuận
trong mơi trường thị trường động.
Tóm lại, sử dụng HPC để phân tích thị trường là một xu hướng không
thể bỏ qua trong ngành tài chính hiện nay. Cơng nghệ này mang lại rất nhiều
lợi ích cho nhà đầu tư và quỹ đầu tư, từ việc cải thiện độ chính xác của các
mơ hình dự đoán cho tới việc triển khai các chiến lược giao dịch mới.
19
2.2.3.5 Bài tốn tối ưu hóa siêu tham số của mơ hình data-driven AI.
Trong một nghiên cứu về “Ứng dụng HPC nâng cao khả năng tính tốn
cho bài tốn tối ưu hóa siêu tham số của mơ hình data-driven AI” (Eric Wulff
et al 2023 J. Phys.: Conf. Ser. 2438 012092). Các tài nguyên HPC sử dụng
trong các siêu máy tính được ứng dụng để tăng tốc độ thực hiện thuật tốn tìm
siêu tham số cho một mơ hình AI.
Giai đoạn đầu tiên được thực hiện trên siêu máy tính JUWELS Booster
tại trung tâm siêu máy tính Julich, Đức. Mỗi nút trên JUWELS Booster có hai
CPU là AMD EPYC Rome 7402 với 48 lõi tốc độ 2,8 GHz và bốn GPU là
NVIDIA A100-SXM4-4. Giai đoạn thứ hai được thực hiện trên siêu máy tính
CoreSite tại Viện Flatiron ở New York, Hoa Kỳ với độ phức tạp của thuật
toán cao hơn. CoreSite sử dụng 12 nút tính tốn, mỗi nút được trang bị CPU
là 64-core Intel Icelake Platinum 8358 CPU với nhân tốc độ 2,6 GHz và bốn
GPU là NVIDIA A100-SXM4-40GB.
Sau cả hai giai đoạn, giai đoạn thứ nhất cần 19,574 core-hours để hoàn
thành, giai đoạn thứ hai cần 56,730 core-hours. Theo tình tốn, nếu chỉ dùng
một GPU đề hồn thành cơng việc như thơng thường thì sẽ mất khoảng gần 6
tháng để hồn thành các thuật tốn, trong khi sử dụng các siêu máy tính với
kỹ thuật HPC thì chỉ mất gần 83 giờ để hoàn thành.
2.2.3.6. Trong vật lý thiên văn học
Với việc tích hợp HPC vào các mơ hình AI, ngành vật lí thiên văn đã
nhanh chóng đạt được những kết quả tích cực. Đặc biệtt là những chương
trình nghiên cứu về vật lí plasma, vật lí thiên văn sóng hấp dẫn, vật lí năng
lượng cao, khoa học vật liệu. Những thành tựu này có chung một điểm chung,
đó là các thuật toán được phát triển để tăng tốc q trình đào tạo các mơ hình
AI trên nền tảng HPC có thành phần thử nghiệm mạnh mẽ.
20
Hình 2.5 Huấn luyện mơ hình ImageNet ResNet-50 (Gọi tắt là ResNet, lần
đầu tiên được giới thiệu vào năm 2015 để tự động phân loại hình ảnh) bằng
cách mở rộng quy mô đào tạo ResNet-50 sử dụng bộ dữ liệu ImageNet. Giai
đoạn huấn luyện rút ngắn chỉ còn hơn 1 giờ, đạt độ chính xác 93%, sử dụng
tồn bộ cụm siêu máy tính HAL.
Hình 2.6 Phần mềm ứng dụng trong vật lý thiên văn sóng hấp dẫn AI-GW với
siêu máy tính HAL để huấn luyện của mơ hình học sâu, dùng để suy ra tốc độ
quay của hai lỗ đen va chạm, được giảm từ 1 tháng—sử dụng một GPU V100
—xuống cịn 12,4 giờ khi sử dụng tồn bộ GPU của siêu máy tính HAL