TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG TP.HCM
KHOA: HỆ THỐNG THÔNG TIN VÀ VIẾN THÁM
BÁO CÁO ĐỒ ÁN MÔN HỌC
Trí Tuệ Nhân Tạo
Đề Tài: SỬ DỤNG MƠ HÌNH HỌC SÂU (DEEP LEARNING) VỚI MẠNG
NEURAL CONVOLUTIONAL (CNN) ĐỂ PHÂN LOẠI ẢNH CHÓ VÀ MÈO
Giảng viên hướng dẫn:
Sinh viên thực hiện:
ThS. Phạm Minh Khan
Hà Quốc Bảo
0950080081
Huỳnh Tấn Đạt
0950080091
Lớp:
THMT
Khóa:
09
Tp. Hồ Chí Minh, tháng 11 năm 2023
1
TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG TP.HCM
KHOA: HỆ THỐNG THÔNG TIN VÀ VIẾN THÁM
BÁO CÁO ĐỒ ÁN MÔN HỌC
Trí Tuệ Nhân Tạo
Đề Tài: SỬ DỤNG MƠ HÌNH HỌC SÂU (DEEP LEARNING) VỚI MẠNG
NEURAL CONVOLUTIONAL (CNN) ĐỂ PHÂN LOẠI ẢNH CHÓ VÀ MÈO
Giảng viên hướng dẫn:
Sinh viên thực hiện:
ThS. Phạm Minh Khan
Hà Quốc Bảo
0950080081
Huỳnh Tấn Đạt
0950080091
Lớp:
THMT
Khóa:
09
Tp. Hồ Chí Minh, tháng 3 năm 2023
2
LỜI CẢM ƠN
Trong suốt quá trình học tập và tương tác cùng cô em nhận ra rằng môn học không
chỉ là học lý thuyết sách vở mà còn được thực hành. Ngoài ra, chúng em cần phải rèn
luyện kỹ năng tự học. Từ đó chúng em nhận thấy, việc cọ sát thực tế là vơ cùng quan
trọng – nó giúp sinh viên xây dựng nền tảng lý thuyết được học ở trường vững chắc hơn,
và cũng để có được nền móng cơ bản để đi vào thực tế.
Để hồn thành bài báo cáo kết thúc học phần này lời đầu tiên nhóm em xin bày tỏ
lịng biết ơn sâu sắc đến Thầy Phạm Minh Khan đã tận tình hướng dẫn cũng như nhận
xét, góp ý trong suốt q trình học lý thuyết và thực hành cùng cơ để có bài báo cáo kết
thúc học phần được hoàn chỉnh nhất. Tuy có những lúc bản thân từng thành viên trong
nhóm có sự nhút nhát khi nghe cô gọi tên lên bảng làm bài hay trả lời những câu hỏi khó
nhưng qua đó để nhận thấy rằng cơ rất tận tâm tận lực với các sinh viên của mìn. Qua
những buổi học cô đều truyền đạt bài học và kiến thức để chúng em dễ dàng tiếp thu
được. Từ đó chúng em rất biết ơn cơ vì những gì cơ đã làm cho sinh viên nói chung và
bản thân nhóm em nói riêng
Tiếp theo chúng em xin chân thành gửi lời cảm ơn đến Ban giám hiệu trường Đại
học Tài nguyên và môi trường, quý thầy cô khoa Hệ thống thông tin và viễn thám đã tận
tâm giảng dạy và truyền đạt những kiến thức, kinh nghiệm q báu cho nhóm. Khơng chỉ
truyền đạt kiến thức, kinh nghiệm mà Ban giám hiệu nhà trường đã cố gắng hỗ trợ thiết bị
và cơ sở vật chất để chúng em được học tập tốt hơn
Với điều kiện thời gian cũng như kiến thức còn hạn chế của một sinh viên nên bài
báo cáo này khơng thể tránh khỏi những thiếu sót. Chúng em rất mong nhận được sự chỉ
bảo, đóng góp ý kiến của q thầy cơ để chúng em có điều kiện bổ sung, nâng cao tinh
thần học tập, ý thức và phục vụ tốt hơn cho công tác thực tế sau này. Chúng em xin chân
thành cảm ơn!
1
NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG
DẪN
……………………………………………………………………………………….......
……………………………………………………………………………………….......
……………………………………………………………………………………….......
……………………………………………………………………………………….......
……………………………………………………………………………………….......
……………………………………………………………………………………….......
……………………………………………………………………………………….......
……………………………………………………………………………………….......
……………………………………………………………………………………….......
……………………………………………………………………………………….......
Kết luận:
Tp. Hồ Chí Minh, ngày… tháng… năm 2023
GIẢNG VIÊN HƯỚNG DẪN
(Ký tên)
2
Ths.Phạm Minh Khan
3
MỤC LỤC
LỜI CẢM ƠN ...................................................................................................................... 1
NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN ............................................................. 2
MỤC LỤC ........................................................................................................................... 4
MỞ ĐẦU ......................................................................................................................... 6
1.Đặt vấn đề ................................................................................................................. 6
2. Mục tiêu và phạm vi nghiên cứu ............................................................................. 6
CHƯƠNG I: TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU ........................................... 8
1.
Giới thiệu về mơ hình học sâu (deep learning) .................................................. 8
a)
Tổng quan mơ hình học sâu (deep learning) ................................................... 8
b)
Ưu nhược điểm ................................................................................................ 8
c)
Mơ hình thường được áp dụng những bài toán nào ........................................ 8
2.
Giới thiệu về mạng neural convolutional (cnn) .................................................. 9
a)
Tổng quan về neural convolutional (cnn) ....................................................... 9
CHƯƠNG II: DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU ............................... 11
1.
Phương pháp nghiên cứu .................................................................................. 11
2.
Bộ dữ liệu ......................................................................................................... 12
3.
Demo thực nghiệm trên colab .......................................................................... 12
CHƯƠNG III: DEMO WEB ....................................................................................... 15
1.
Khái quát ........................................................................................................... 15
Tổng toàn bộ file bao gồm : .......................................................................................... 15
Các bước thực hiện ........................................................................................... 15
2.
a)
App.py ........................................................................................................... 15
b)
App.js ............................................................................................................ 16
c)
Html,css ......................................................................................................... 17
3.
Kết quả .............................................................................................................. 17
a)
Giao diện chính ............................................................................................. 17
b)
Hiển thị và kết quả ........................................................................................ 18
4
CHƯƠNG IV: KẾT LUẬN ........................................................................................ 19
1.
Thảo luận vấn đề đặt ra..................................................................................... 19
2.
Kết luận ............................................................................................................. 20
3.
Ứng dụng .......................................................................................................... 20
TÀI LIỆU THAM KHẢO ............................................................................................ 22
5
MỞ ĐẦU
1.Đặt vấn đề
Bước vào thế kỷ 21, khái niệm về trí tuệ nhân tạo khơng chỉ là một chủ đề nổi cộm trong
cộng đồng khoa học kỹ thuật, mà cịn là một xu hướng nổi bật trong nền cơng nghiệp, xã
hội và văn hóa. Trí tuệ nhân tạo đã thay đổi cách chúng ta tưởng về công việc, giáo dục, y
tế và thậm chí cả quan hệ giữa con người và công nghệ. Tuy nhiên, điều quan trọng
không chỉ là tiềm năng vĩ đại mà AI mang lại mà còn là những thách thức đạo đức, an
ninh, và tác động xã hội mà việc triển khai AI có thể mang đến.
Trí tuệ nhân tạo (AI) đang nổi lên với tốc độ nhanh chóng và có tiềm năng thay đổi toàn
diện cách chúng ta sống và làm việc. Tuy nhiên, cùng với sự phát triển đáng kinh ngạc
này là những thách thức và tranh cãi liên quan đến việc sử dụng, ứng dụng và tiềm ẩn rủi
ro của trí tuệ nhân tạo.
Song nhận thấy tình hình đó chúng em đã nghiên cứu và thực hiện một đề tài nho nhỏ này
để có thể áp dụng sử dụng trí tuệ nhân tạo vào công việc đời sống hằng ngày. Ở đề tài
này chúng em đã áp dụng mơ hình học sâu để có thể train dữ liệu và cho nó phân biệt
giữa hình ảnh của 2 lồi vật “chó” và “mèo” song nếu có thể tiến triển tốt hơn thì khi ta
đưa vào camera nhờ đó có thể nhận ra được 2 loài khác nhau này.
2. Mục tiêu và phạm vi nghiên cứu
Xây dựng một hệ thống nhận dạng hình ảnh cho chó và mèo sử dụng trí tuệ nhân tạo:
Tạo và huấn luyện một mơ hình trí tuệ nhân tạo có khả năng phân loại hình ảnh
giữa chó và mèo với độ chính xác cao.
Sử dụng Python và các thư viện Machine Learning như TensorFlow hoặc Keras để
xây dựng mơ hình.
Thu thập và chuẩn bị dữ liệu:
Thu thập tập dữ liệu lớn gồm 4000 hình ảnh chó và 4000 hình ảnh mèo từ nguồn
đáng tin cậy hoặc cơ sở dữ liệu hình ảnh phong phú.
6
Tiền xử lý dữ liệu để chuẩn hóa kích thước, định dạng và đảm bảo tính đồng nhất
của hình ảnh.
Huấn luyện và đánh giá mơ hình:
Sử dụng dữ liệu huấn luyện để huấn luyện mơ hình và dữ liệu kiểm tra để đánh giá
hiệu suất của mơ hình.
Đánh giá độ chính xác, độ nhạy và độ cụ thể của mơ hình nhằm đảm bảo khả năng
phân loại chó và mèo một cách chính xác.
Tối ưu và Cải thiện mơ hình:
Tiến hành điều chỉnh siêu tham số và thử nghiệm với các kỹ thuật khác nhau để
cải thiện độ chính xác và hiệu suất của mơ hình.
Tạo tài liệu và báo cáo kết quả:
Tạo một tài liệu hoặc báo cáo mơ tả q trình, kết quả và hạn chế của mơ hình,
cung cấp một cái nhìn tồn diện về việc sử dụng trí tuệ nhân tạo trong việc phân
loại hình ảnh giữa chó và mèo.
Mục tiêu chính của nghiên cứu là xây dựng một mơ hình có khả năng phân loại hình ảnh
chó và mèo một cách chính xác, từ đó cung cấp một cơ sở để hiểu và áp dụng trí tuệ nhân
tạo trong việc nhận dạng hình ảnh động vật.
7
CHƯƠNG I: TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU
1. Giới thiệu về mơ hình học sâu (deep learning)
a) Tổng quan mơ hình học sâu (deep learning)
Mơ hình học sâu (deep learning) là một lĩnh vực trong lĩnh vực trí tuệ nhân tạo (AI) tập
trung vào việc xây dựng và huấn luyện các mạng neural sâu có khả năng tự học và hiểu
dữ liệu. Mơ hình học sâu cố gắng mơ phỏng cách thức hoạt động của não người bằng
cách sử dụng các lớp ẩn (hidden layers) để trích xuất đặc trưng và xử lý thông tin.
(Wikimedia Foundation, 2023)
b) Ưu nhược điểm
Ưu điểm:
Khả năng học và hiểu các mẫu phức tạp từ dữ liệu không cần sự can thiệp thủ
công.
Có khả năng tự động rút trích và tạo ra các đặc trưng cấp cao từ dữ liệu đầu vào.
Hiệu suất tăng cường theo qui mô, tức là hiệu suất của mơ hình tăng khi kích
thước dữ liệu và độ phức tạp của mơ hình tăng lên.
Nhược điểm:
u cầu lượng dữ liệu huấn luyện lớn để đạt được hiệu suất tốt.
Đòi hỏi phần cứng mạnh mẽ và tài ngun tính tốn để huấn luyện và triển khai
mơ hình học sâu.
Thường khó hiểu và khó giải thích q trình ra quyết định của mơ hình.
c) Mơ hình thường được áp dụng những bài toán nào
Nhận dạng và phân loại hình ảnh: như nhận dạng khn mặt, phân loại đối tượng
trong ảnh, phát hiện vật thể.
Xử lý ngôn ngữ tự nhiên: như dịch máy, tổng hợp giọng nói, phân loại văn bản.
8
Xử lý âm thanh: như nhận dạng giọng nói, phân tích tín hiệu âm thanh.
Xử lý dữ liệu chuỗi: như dự báo chuỗi thời gian, phân tích ngơn ngữ tự nhiên.
2. Giới thiệu về mạng neural convolutional (cnn)
a) Tổng quan về neural convolutional (cnn)
Mạng neural convolutionaxl (CNN) là một loại mạng neural sử dụng các lớp tích chập
(convolutional layers) để trích xuất đặc trưng từ dữ liệu đầu vào. CNN được thiết kế đặc
biệt để xử lý và phân tích dữ liệu có cấu trúc lưới như hình ảnh và âm thanh. Các lớp tích
chập trong CNN giúp tự động học các bộ lọc (filter) để tìm ra các đặc trưng cục bộ trong
dữ liệu.
a) Ưu nhược điểm
Ưu điểm:
Hiệu quả trong việc xử lý và trích xuất đặc trưng từ dữ liệu có cấu trúc lưới, như
hình ảnh.
Giảm số lượng tham số cần huấn luyện so với mạng neural truyền thống- Có khả
năng chia sẻ trọng số (weight sharing) và sử dụng các bộ lọc nhỏ di chuyển trên
toàn bộ dữ liệu đầu vào, giúp giảm độ phức tạp và tăng tính tổng qt của mơ
hình.
Có khả năng tự động học các đặc trưng cấp cao từ dữ liệu thô thông qua các lớp
kết nối đầy đủ (fully connected layers).
Nhược điểm:
CNN không phù hợp cho các loại dữ liệu khơng có cấu trúc lưới như dữ liệu
chuỗi.
Đòi hỏi lượng dữ liệu huấn luyện đủ lớn để đạt được hiệu suất tốt.
Cần có phần cứng mạnh mẽ và tài ngun tính tốn để huấn luyện và triển khai mơ
hình CNN.
b) Ứng dụng
9
Mạng neural convolutional (CNN) đã được áp dụng rộng rãi trong nhiều lĩnh vực, bao
gồm:
Nhận dạng hình ảnh: CNN được sử dụng để nhận dạng và phân loại đối tượng
trong hình ảnh, như nhận dạng khn mặt, phân loại loại cây cảnh, nhận dạng biển
báo giao thông, v.v.
Xử lý ảnh y tế: CNN có thể được sử dụng để phân loại và xử lý ảnh y tế, như phát
hiện ung thư từ hình ảnh chụp X-quang, phân loại bệnh từ hình ảnh siêu âm, v.v.
Tự lái xe: CNN được sử dụng trong các hệ thống tự lái xe để nhận dạng và phân
loại các vật thể trên đường, như ô tô, người đi bộ, biển báo giao thơng, v.v.
Xử lý ngơn ngữ tự nhiên: CNN có thể được sử dụng để phân loại văn bản, như
phân loại tin tức, phân loại cảm xúc trong văn bản, v.v.
10
CHƯƠNG II: DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
1. Phương pháp nghiên cứu
Để phân loại ảnh chó và mèo, mơ hình học sâu với mạng neural convolutional (CNN) đã
được sử dụng rộng rãi và mang lại những kết quả ấn tượng. Phương pháp này kết hợp khả
năng học tự động của mơ hình học sâu và khả năng trích xuất đặc trưng cục bộ từ mạng
neural convolutional.
Quy trình sử dụng mơ hình học sâu với mạng neural convolutional để phân loại ảnh chó
và mèo thường bao gồm các bước sau:
1) Chuẩn bị dữ liệu: Thu thập và xây dựng tập dữ liệu chứa ảnh chó và mèo. Tập dữ
liệu này nên được chia thành tập huấn luyện (training set), tập kiểm tra (test set) và
tập xác thực (validation set).
2) Tiền xử lý dữ liệu: Dữ liệu ảnh thường cần được tiền xử lý trước khi đưa vào mơ
hình. Điều này bao gồm thay đổi kích thước ảnh, chuẩn hóa các giá trị pixel, và
thực hiện các phép biến đổi như xoay, phóng to, thu nhỏ để tăng tính tổng qt của
mơ hình.
3) Xây dựng mơ hình CNN: Thiết kế một mạng neural convolutional phù hợp cho bài
toán phân loại ảnh chó và mèo. Mơ hình thường bao gồm các lớp tích chập
(convolutional layers) để trích xuất đặc trưng từ ảnh và các lớp kết nối đầy đủ
(fully connected layers) để phân loại.
4) Huấn luyện mơ hình: Đưa dữ liệu huấn luyện vào mơ hình và điều chỉnh trọng số
của mạng neural để mơ hình học cách phân loại chó và mèo. Q trình này thường
được thực hiện thơng qua việc tối ưu hóa một hàm mất mát (loss function) và sử
dụng các thuật toán như lan truyền ngược (backpropagation) và gradient descent.
5) Đánh giá mơ hình: Sử dụng tập kiểm tra hoặc tập xác thực để đánh giá hiệu suất
của mơ hình. Các độ đo như độ chính xác (accuracy), độ phủ (recall), độ chính xác
dương tính (precision) thường được sử dụng để đánh giá mơ hình.
11
6) Tinh chỉnh và cải thiện: Dựa trên kết quả đánh giá, tiến hành tinh chỉnh mơ hình,
bao gồm việc thay đổi kiến trúc mạng, thay đổi siêu tham số (hyperparameters),
hoặc tăng cường dữ liệu để cải thiện hiệu suất của mơ hình.
7) Phương pháp sử dụng mơ hình học sâu với mạng neural convolutional (CNN) đã
chứng minh được hiệu quả trong việc phân loại ảnh chó và mèo. Điều quan trọng
là có sự chuẩn bị dữ liệu cẩn thận, xây dựng một mơ hình CNN phù hợp và tinh
chỉnh mơ hình để đạt được kết quả tốt nhất.
2. Bộ dữ liệu
Nguồn : />Chúng ta có thể lấy dữ liệu từ nhiều nguồn khác nhau, có thể tự thu thập hình ảnh ,..
nhưng ở đây để tiết kiệm thời gian và tránh tình trạng trùng lặp thì chúng em đã tải trực
tiếp bộ dữ liệu này từ trang kaggle.
Bộ dữ liệu gồm :
o 4000 tấm ảnh khác nhau về loài chó
o 4000 tấm ảnh khác nhau về lồi mèo
o 1000 tấm ảnh thử về lồi chó
o 1000 tấm ảnh thử về lồi mèo
3. Demo thực nghiệm trên colab
Cơng cụ sử dụng : Google colab
Phần mềm google Colab
12
Colaboratory hay còn gọi là Google Colab, là một sản phẩm từ Google Research,
nó cho phép thực thi Python trên nền tảng đám mây, đặc biệt phù hợp với Data
analysis, machine learning và giáo dục
Colab không yêu cầu cài đặt hay cấu hình máy tính, mọi thứ có thể chạy thơng qua
trình duyệt, bạn có thể sử dụng tài ngun máy tính từ CPU tốc độ cao và cả
GPU,TPU đều được cung cấp cho bạn
Sử dụng Google Colab có lợi ích ưu việt như: sẵn sáng chạy Python ở bất kì thiết
bị nào có kết nối Internet mà khơng cần cài đặt, chia sẻ và làm việc nhóm dễ dàng,
sử dụng miễn phí GPU cho các dự án về AI.
***Google Colab cung cấp một số tính năng có thể kể đến như:
Người dùng có thể tạo mục lục dựa trên các heading viết bằng ngơn ngữ
markdown qua đó bạn sẽ dễ dàng cấu trúc Notebook và làm việc của mình.
Bạn cũng có thể thu gọn các phần nội dung khi soạn thảo một cách thuận
tiện nhất.
Có thể thêm hình ảnh, biểu mẫu dễ dàng với markdown giúp bạn trình bày
báo cáo hoặc làm dashboard cực tiện lợi. Thậm chí người dùng cũng có thể
ẩn các dịng code để trơng Notebook gọn gàng hơn với tính năng biểu mẫu.
Kết nối dễ dàng với Google Drive hay là Google Sheets để bắt tay vào phân
tích dữ liệu “trên mây” hồn tồn.
Chạy Python trên Cloud hay Local Runtime cũng đều cho trải nghiệm tốt,
người dùng vẫn tận dụng được tính năng tuyệt vời của Google Colab khi
chạy với Python trên Local Runtime. Trong khi đó vẫn khơng bị Google tự
động xóa dữ liệu khi kết thúc phiên làm việc như khi chạy trên Cloud.
Tự động lưu lịch sử chỉnh sửa thành các phiên bản mới giúp bạn dễ dàng
khôi phục lại phiên bản gần nhất mỗi khi xảy ra lỗi.
13
Cho phép tìm kiếm và chèn các đoạn dữ liệu được soạn thảo sẵn trong các
Template vào Notebook. Tính năng này được đánh giá khá cao bởi bạn
không cần phải mở thêm nhiều file lưu trữ để tìm lại các đoạn code mẫu
mình đã biết khi cần.
Tạo dashboard viết bằng Python và có thể chia sẻ với team dễ dàng nếu cần
tương tự như Google Data Studio nhưng nó lại linh hoạt và mạnh mẽ hơn rất
nhiều.
Sơ lược : Bằng việc tải bộ dữ liệu về máy chúng em đã upload nó lên Driver và thực hiện
việc kết nối colab đến bộ dữ liệu và bắt đầu demo.
Link shared : />
14
CHƯƠNG III:
DEMO WEB
1. Khái quát
Tổng toàn bộ file bao gồm :
o Index.html
o Style.css
o App.py
o App.js
o ai_cats_and_dogs.py
o dogs-cats-model.pkl
o dogs-cats-model2.ht
Chúng em sử dụng python để bắt đầu chạy demo.
2. Các bước thực hiện
Sử dụng IDE : visutal studio code
Tải các thư viện cần thiết và các tiện ích thích hợp
Lần lượt tạo các file app.py, app.js, index.html, style.css
a) App.py
Trong app.py em là là một ứng dụng web sử dụng Flask framework để triển khai một mơ
hình mạng nơ-ron tích chập (CNN) để dự đốn hình ảnh là chó hay mèo. Hãy xem qua
từng phần:
-
Đầu tiên, các thư viện cần thiết được import, bao gồm Flask để xây dựng ứng
dụng web, render_template để hiển thị giao diện người dùng, request để xử lý u
cầu và image từ tensorflow.keras.preprocessing để xử lý hình ảnh.
-
Mơ hình CNN được tải lên từ tệp 'dogs-cats-model2.h5' bằng cách sử dụng pickle.
-
Flask được khởi tạo và ứng dụng được tạo ra.
-
Route gốc ('/') được xác định để hiển thị trang chủ của ứng dụng web với giao diện
index.html và dự đoán ban đầu được đặt là -1.
15
-
Route '/predict' được xác định để xử lý yêu cầu dự đoán. Khi nhận yêu cầu POST,
ứng dụng sẽ nhận hình ảnh từ u cầu, lưu nó vào đường dẫn ảnh và gọi hàm
test_image để dự đốn. Sau đó, giao diện index.html được hiển thị với dự đoán và
đường dẫn ảnh.
-
Hàm test_image nhận đường dẫn của hình ảnh, tiền xử lý hình ảnh và sử dụng mơ
hình để dự đốn xem hình ảnh là chó hay mèo. Kết quả dự đoán được trả về.
Cuối cùng, ứng dụng web được chạy trên cổng debug=True để cho phép chế độ gỡ lỗi
trong quá trình phát triển.
b) App.js
Đoạn mã JavaScript này lắng nghe sự kiện khi người dùng chọn một tệp ảnh từ phần tử
có id 'fileInput'. Dưới đây là mơ tả chi tiết:
-
Khi sự kiện 'change' xảy ra trên phần tử 'fileInput' (khi người dùng chọn tệp ảnh),
đoạn mã sẽ được thực thi.
-
Đối tượng File đầu tiên trong fileList của sự kiện được lấy ra và gán cho biến 'file'.
-
Một đối tượng FileReader được tạo ra để đọc nội dung của tệp ảnh.
-
Sự kiện 'onload' được gắn vào đối tượng FileReader để xử lý khi tệp ảnh đã được
đọc thành công.
-
Một đối tượng Image mới được tạo ra và đường dẫn ảnh được gán bằng kết quả
đọc FileReader.
-
Khi ảnh đã được tải thành công, sự kiện 'onload' được gắn vào ảnh để gọi hàm
'detectImage' với đối số là ảnh đã tải.
-
Hàm 'detectImage' nhận đối tượng ảnh và thực hiện các bước sau:
a. Tạo một đối tượng FormData để gửi ảnh dưới dạng multipart/form-data.
b. Gửi yêu cầu POST đến endpoint '/detect' để xử lý nhận diện ảnh. Ảnh được gửi
dưới
dạng
FormData.
c. Khi nhận được phản hồi từ endpoint, phản hồi được chuyển đổi thành đối tượng
JSON.
d. Kết quả nhận diện được xử lý và hiển thị trong phần tử có id 'result-container'.
-
Trong phần xử lý lỗi, thông báo lỗi được hiển thị trong console.
16
c) Html,css
Sau cùng là tạo trang html hiển thị giao diện người dùng, để những người không chuyên
sâu vào vấn đề này có thể dễ tiếp cận và sử dụng. Việc Xây dựng giao diện người dùng
(GUI - Graphical User Interface) có ảnh hưởng rất lớn đến trải nghiệm và sự thành công
của một ứng dụng. Giao diện người dùng đóng vai trị quan trọng trong việc tạo ra trải
nghiệm tốt cho người dùng. Một giao diện thân thiện, dễ sử dụng và hấp dẫn giúp người
dùng tương tác dễ dàng với ứng dụng, hiểu rõ các chức năng và thao tác cần thực hiện, từ
đó nâng cao sự hài lịng và trải nghiệm tích cực của người dùng, quyết định cách người
dùng tương tác với ứng dụng. Việc thiết kế các phần tử tương互 hoạt động như nút, biểu
mẫu, menu, hộp thoại, và các phần điều hướng khác có ảnh hưởng trực tiếp đến khả năng
tương tác và thao tác của người dùng trên ứng dụng…
3. Kết quả
a) Giao diện chính
17
b) Hiển thị và kết quả
Khi ta ấn vào “chọn tệp” sẽ hiển thị phần chọn ảnh để nhận diện
=>> Khi đã chọn ảnh xong ấn “open” và Nhấp “In kết quả” là mơ hình sẽ tự động chạy
và hiển thị kết quả.
18
CHƯƠNG IV:
KẾT LUẬN
1. Thảo luận vấn đề đặt ra
Trí tuệ nhân tạo (AI) đã trở thành một trong những lĩnh vực cơng nghệ phát triển nhanh
nhất và có tiềm năng thay đổi đáng kể cách chúng ta sống và làm việc. Tuy nhiên, sự phát
triển đáng kinh ngạc này cũng đi đôi với những thách thức và tranh cãi liên quan đến việc
sử dụng, ứng dụng và tiềm ẩn rủi ro của trí tuệ nhân tạo.
Một trong những thách thức lớn là đảm bảo rằng trí tuệ nhân tạo được sử dụng một cách
đạo đức và có lợi cho con người. Có mối quan ngại về việc AI có thể thay thế công việc
của con người, gây ra sự thay đổi đáng kể trong thị trường lao động và tạo ra sự bất bình
đẳng xã hội. Ngồi ra, việc AI có thể tạo ra quyết định tự động mà khơng có sự can thiệp
của con người có thể dẫn đến việc áp đặt quyền lực và gây ra những hệ quả khơng mong
muốn.
Một vấn đề khác liên quan đến trí tuệ nhân tạo là bảo đảm an toàn và độ tin cậy của hệ
thống AI. Khi sử dụng AI trong các lĩnh vực như xe tự lái, y tế hoặc qn sự, sự khơng
chính xác hoặc lỗi trong hệ thống AI có thể có hậu quả nghiêm trọng và đe dọa đến tính
mạng và an tồn của con người. Việc đảm bảo rằng các hệ thống AI được đào tạo và triển
khai một cách an toàn và đáng tin cậy là một thách thức lớn đối với cả nhà nghiên cứu và
các nhà quản lý.
Cũng có những tranh cãi liên quan đến việc sở hữu và quyền riêng tư trong việc sử dụng
trí tuệ nhân tạo. Sự phát triển của AI đã tạo ra khối lượng lớn dữ liệu được thu thập và
phân tích, từ đó đặt ra câu hỏi về quyền riêng tư và bảo vệ dữ liệu cá nhân. Ngồi ra, việc
sở hữu và kiểm sốt các cơng nghệ AI có thể gây ra một khoảng cách kỹ thuật và kinh tế
giữa các quốc gia và tạo ra mối đe dọa về an ninh quốc gia.
Để đối phó với những thách thức và tranh cãi này, cần có sự hợp tác giữa các nhà nghiên
cứu, các nhà quản lý, và các nhà lập pháp để thiết lập các quy định và chuẩn mực rõ ràng
cho việc sử dụng và phát triển trí tuệ nhân tạo. Đồng thời, cần tăng cường nghiên cứu và
19
đào tạo trong lĩnh vực này để đảm bảo an tồn, đạo đức và đáng tin cậy của trí tuệ nhân
tạo.
2. Kết luận
Dựa trên những nghiên cứu và ứng dụng trong lĩnh vực này, có thể kết luận rằng sử dụng
mơ hình học sâu với mạng neural convolutional là một phương pháp hiệu quả để phân
loại ảnh chó và mèo. Mơ hình CNN có khả năng tự động học và trích xuất đặc trưng từ
ảnh, cho phép nó nhận biết và phân loại các đặc điểm đặc trưng của chó và mèo. Qua q
trình huấn luyện và tinh chỉnh, mơ hình có thể đạt được độ chính xác cao trong việc phân
loại các loại ảnh này.
3. Ứng dụng
Ứng dụng phân loại ảnh chó và mèo thơng qua mơ hình học sâu với mạng neural
convolutional (CNN) có thể được áp dụng vào các cơng nghệ và có những tác dụng sau:
Hệ thống nhận dạng đối tượng tự động: Mơ hình CNN có thể được sử dụng để
phân loại và nhận dạng các đối tượng khác nhau trong ảnh, không chỉ giới hạn ở
chó và mèo. Điều này có thể được áp dụng trong các hệ thống an ninh dựa trên
camera giám sát để phát hiện và nhận dạng các đối tượng nghi ngờ, hoặc trong các
ứng dụng nhận dạng khuôn mặt hoặc nhận dạng biển số xe.
Xử lý ảnh và dịch vụ lưu trữ trực tuyến: Phân loại ảnh chó và mèo có thể được sử
dụng trong các dịch vụ lưu trữ trực tuyến như Google Photos hoặc Facebook để tự
động gán nhãn cho ảnh và tạo các album dựa trên nội dung của chúng. Điều này
giúp người dùng dễ dàng tìm kiếm và sắp xếp ảnh theo chủ đề hoặc đối tượng.
Phân loại và phân tích dữ liệu y tế: Cơng nghệ phân loại ảnh chó và mèo có thể
được áp dụng trong lĩnh vực y tế để phân loại và phân tích các hình ảnh y tế. Ví
dụ, mơ hình CNN có thể được sử dụng để phân loại các ảnh chụp X-quang, MRI
hoặc CT scan để hỗ trợ trong chẩn đốn và phát hiện bất thường trong hình ảnh y
tế.
Tự động hóa cơng việc: Phân loại ảnh chó và mèo có thể được áp dụng trong các
quy trình tự động hóa cơng việc. Ví dụ, trong lĩnh vực sản xuất, mơ hình CNN có
20
thể được sử dụng để phân loại các sản phẩm hoặc kiểm tra chất lượng tự động dựa
trên hình ảnh. Điều này giúp tăng năng suất và độ chính xác trong quá trình sản
xuất
21
TÀI LIỆU THAM KHẢO
Kaggle. (2017, 01 03). Retrieved from Dogs & Cats Images:
/>PhamHe. (2021, 11 6). Youtube. Retrieved from hướng dẫn: phân biệt chó với mèo:
/>VTV24. (2023, 07 20). Youtube. Retrieved from Trí tuệ nhân tạo là bạn hay thù? |
VTV24: />Wikimedia Foundation, I. m. (2023, 11 20). Wikipedia. Retrieved from Bách Khoa toàn
thư: />%E1%BA%A1o
22