Tải bản đầy đủ (.pdf) (94 trang)

Đánh giá xu hướng giá bất động sản dựa trên tiếp cận máy học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.01 MB, 94 trang )

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA CÔNG NGHỆ PHẦN MỀM

NGUYỄN NGỌC NHẬT MINH
TRẦN DUY MINH

KHÓA LUẬN TỐT NGHIỆP
ĐÁNH GIÁ XU HƯỚNG GIÁ BẤT ĐỘNG SẢN DỰA TRÊN TIẾP CẬN MÁY
HỌC
A MACHINE LEARNING APPROACH TO PREDICT OF REAL ESTATE
PRICES

KỸ SƯ/ CỬ NHÂN NGÀNH KỸ THUẬT PHẦN MỀM

TP. HỒ CHÍ MINH, 2021


ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA CÔNG NGHỆ PHẦN MỀM

NGUYỄN NGỌC NHẬT MINH – 16520742
TRẦN DUY MINH - 16520752

KHÓA LUẬN TỐT NGHIỆP
ĐÁNH GIÁ XU HƯỚNG GIÁ BẤT ĐỘNG SẢN DỰA TRÊN TIẾP CẬN MÁY
HỌC
A MACHINE LEARNING APPROACH TO PREDICT OF REAL ESTATE
PRICES


KỸ SƯ/ CỬ NHÂNNGÀNH KỸ THUẬT PHẦN MỀM

GIẢNG VIÊN HƯỚNG DẪN
TS. DƯƠNG MINH ĐỨC

TP. HỒ CHÍ MINH, 2021


THƠNG TIN HỘI ĐỒNG CHẤM KHĨA LUẬN TỐT NGHIỆP

Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số
…………………… ngày ………………….. của Hiệu trưởng Trường Đại học Công
nghệ Thông tin.
1.
2.
3.
4.

................................................. – Chủ tịch
................................................. – Thư ký
................................................. – Ủy viên
................................................. – Ủy viên


ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc Lập - Tự Do - Hạnh Phúc


CÔNG NGHỆ THÔNG TIN
TP. HCM, ngày…..tháng…..năm……..

NHẬN XÉT KHĨA LUẬN TỐT NGHIỆP
(CỦA CÁN BỘ HƯỚNG DẪN)

Tên khóa luận:
ĐÁNH GIÁ XU HƯỚNG GIÁ BẤT ĐỘNG SẢN DỰA TRÊN TIẾP CẬN MÁY HỌC

Cán bộ hướng dẫn:

Nhóm SV thực hiện:
Nguyễn Ngọc Nhật Minh

16520742

Trần Duy Minh

16520752

TS. Dương Minh Đức

Đánh giá Khóa luận
1. Về cuốn báo cáo:
Số trang

________

Số chương


________

Số bảng số liệu

________

Số hình vẽ

________

Số tài liệu tham khảo

________

Sản phẩm

________


Một số nhận xét về hình thức cuốn báo cáo:
<nhận xét về định dạng, cách thức viết báo cáo, phân bố nội dung, chương mục có hợp lý khơng..>

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................
2. Về nội dung nghiên cứu:
chế>


...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................
3. Về chương trình ứng dụng:
<nhận xét về việc xây dựng ứng dụng demo, nhận xét ưu điểm và hạn chế>

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................


4. Về thái độ làm việc của sinh viên:
<nhận xét về thái độ, ưu khuyết điểm của từng sinh viên tham gia>


...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

Đánh giá chung:Khóa luận đạt/khơng đạt u cầu của một khóa luận tốt nghiệp kỹ sư/ cử nhân, xếp l
Giỏi/ Khá/ Trung bình
Điểm từng sinh viên:
Nguyễn Ngọc Nhật Minh :………../10
Trần Duy Minh :………../10

Người nhận xét
(Ký tên và ghi rõ họ tên)

TS.Dương Minh Đức


ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc Lập - Tự Do - Hạnh Phúc


CÔNG NGHỆ THÔNG TIN
TP. HCM, ngày…..tháng…..năm……..

NHẬN XÉT KHĨA LUẬN TỐT NGHIỆP
(CỦA CÁN BỘ PHẢN BIỆN)

Tên khóa luận:
ĐÁNH GIÁ XU HƯỚNG GIÁ BẤT ĐỘNG SẢN DỰA TRÊN TIẾP CẬN MÁY HỌC

Cán bộ hướng dẫn:

Nhóm SV thực hiện:
Nguyễn Ngọc Nhật Minh

16520742

Trần Duy Minh

16520752

TS. Dương Minh Đức

Đánh giá Khóa luận
1. Về cuốn báo cáo:
Số trang

_______

Số chương


_______

Số bảng số liệu

_______

Số hình vẽ

_______

Số tài liệu tham khảo

_______

Sản phẩm

_______


Một số nhận xét về hình thức cuốn báo cáo:
<nhận xét về định dạng, cách thức viết báo cáo, phân bố nội dung, chương mục có hợp lý khơng..>

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................
2. Về nội dung nghiên cứu:

điểm và hạn chế>

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................
3. Về chương trình ứng dụng:
<nhận xét về việc xây dựng ứng dụng demo, nhận xét ưu điểm và hạn chế>

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................


4. Về thái độ làm việc của sinh viên:

<nhận xét về thái độ, ưu khuyết điểm của từng sinh viên tham gia>

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

...................................................................................................................................................................

Đánh giá chung:Khóa luận đạt/khơng đạt u cầu của một khóa luận tốt nghiệp kỹ sư/ cử nhân, xếp l
Giỏi/ Khá/ Trung bình
Điểm từng sinh viên:
Nguyễn Ngọc Nhật Minh:………../10
Trần Duy Minh :………../10

Người nhận xét
(Ký tên và ghi rõ họ tên)


LỜI CẢM ƠN
Lời đầu tiên, xin trân trọng cảm ơn Thầy đã hướng dẫn nhóm là TS. Dương Minh
Đức, thầy đã tận tình hướng dẫn nhóm trong q trình học tập cũng như trong việc
hoàn thành luận văn.
Xin chân thành cảm ơn các Thầy, Cô thuộc khoa Công nghệ phần mềm trường Đại
Học Công Nghệ Thông Tin – Đại học Quốc Gia Tp.HCM đã tận tình giảng dạy cho

tơi trong thời gian học tập.
Xin cảm ơn thầy cô đã đọc luận văn và cho tôi những nhận xét quý báu, chỉnh sửa
những sai sót của tơi trong bản thảo luận văn.
Do giới hạn kiến thức và khả năng lý luận của bản thân cịn nhiều thiếu sót và hạn
chế, kính mong sự chỉ dẫn và đóng góp của các Thầy, Cơ để bài luận văn của tơi được
hồn thiện hơn. Xin chân thành cảm ơn!


ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ
MINH
TRƯỜNG ĐẠI HỌC
CƠNG NGHỆ THƠNG TIN

CỘNG HỊA XÃ HỘI CHỦ NGHĨA
VIỆT NAM
Độc Lập - Tự Do - Hạnh Phúc

ĐỀ CƯƠNG CHI TIẾT

TÊN ĐỀ TÀI: Đánh giá xu hướng giá bất động sản dựa trên tiếp cận máy học
(A machine learning approach to predict of real estate prices)
Cán bộ hướng dẫn: TS.Dương Minh Đức
Thời gian thực hiện: Từ ngày 01/03/2021 đến ngày 20/06/2021
Sinh viên thực hiện:
Nguyễn Ngọc Nhật Minh - 16520742
Trần Duy Minh - 16520752
Nội dung đề tài:(Mô tả chi tiết mục tiêu, phạm vi, đối tượng, phương pháp thực
hiện, kết quả mong đợi của đề tài)
1. Mục tiêu
Bất động sản là một lĩnh vực rất phổ biến hiện này, và máy học là phương

pháp có tiềm năng dự đốn, phân tích rất lớn. Vì vậy, khóa luận này đề xuất
sử dụng phương pháp tiếp cận máy học để đánh giá xu hướng của thị trường
bất động sản.
2.
Phạm vi
1. Phạm vi nghiên cứu
o Một số thuật tốn tối ưu cho việc phân tích và train dữ liệu
o Các công nghệ liên quan đến học máy và dữ liệu lớn , các
mơ hình giúp ích cho khóa luận
2. Phạm vi thực hiện
o Tensorflow, Keras
o Thu thập dữ liệu và so sánh các mơ hình được thiết kế bằng
phương pháp học máy
o Một số thuật toán tối ưu dữ liệu đầu vào và ra
o Xây dựng ứng dụng di động
3.
Đối tượng
 Dữ liệu bất động sản được cung cấp bởi các nguồn tin cậy
 Một số dữ liệu liên quan và đặc trưng của bất động sản
4.
Phương pháp thực hiện


Lên kế hoạch và thực hiện dưới sự hướng dẫn và tư vấn của
giảng viên hướng dẫn.
 Nghiên cứu các thuật toán từ các nguồn tài liệu học thuật
trên internet
 Nghiên cứu các bài báo học thuật về vấn đề liên quan
Kết quả mong đợi của đề tài
 Hiểu và nắm rõ các công nghệ sử dụng trong dự án

 Nắm vững, tối ưu được các thuật toán sử dụng trong đề tài
 Ứng dụng cho mơ hình dự đốn
 Áp dụng những kiến thức đã học vào dự án và thực tế


5.

Kế hoạch thực hiện:(Mô tả kế hoạch làm việc và phân công công việc cho từng
sinh viên tham gia)
1. Giai đoạn 1(1/3/2021 – 12/3/2021):
 Cài đặt môi trường, mơ hình và một số thuật tốn liên quan
đến dự án
 Tìm hiểu về cơng cụ, cài đặt và chạy thực nghiệm một vài
mơ hình
 So sánh số liệu, tính tốn chỉ số liên quan, đưa ra mơ hình
và cách thức phù hợp với đề tài
 Nghiên cứu tài liệu được giảng viên hướng dẫn đưa ra
2.
Giai đoạn 2(13/3/2021 – 28/3/2021)_:
 Cài đặt thực nghiệm với bộ dữ liệu thực
 So sánh kết quả các lần chạy
 Đưa ra kết quả và báo cáo, tính tốn các chỉ số giữa bộ dữ
liệu nhận được
3.
Giai đoạn 3(29/3/2021 – 11/4/2021) :


Đặt ra các giả thuyết có thể có kết quả tốt hơn cho mơ hình
cũng như thuật tốn
 Đưa ra kế hoạch để thực hiện việc cải tiến mơ hình hoặc là

thuật toán.
 Trao đổi, xin ý kiến tư vấn của giảng viên hướng dẫn về cách
thức ,đánh giá việc cái tiến thuật toán
Giai đoạn 4(12/4/2021 – 16/5/2021) :
 Thực hiện kế hoạch cải tiến thuật toán
 Thu thập và đưa ra số liệu về việc cải tiến và so sánh các chỉ
số đó với chỉ số cũ
 Báo cáo chỉ số thực nghiệm với giảng viên hướng dẫn và xin
nhận xét
Giai đoạn 5 (17/5/2021 – 7/6-2021):


4.

5.

Giai đoạn cải tiến thuật toán, đưa ra những chỉ số, chiều của
dữ liệu có thể ảnh hưởng đến kết quả.


Xây dựng ứng dụng để trực quan hóa đề tài
Giai đoạn 6:(8/6/2021 – 21-6/2021)
 Chuẩn bị giao diện, báo cáo, dữ liệu để viết báo cáo


6.

Xác nhận của CBHD

TP. HCM, ngàY 10 tháng 3 năm 2021


(Ký tên và ghi rõ họ tên)

Sinh viên
(Ký tên và ghi rõ họ tên)

TS.Dương Minh Đức

Nguyễn Ngọc Nhật Minh

Trần Duy Minh


MỤC LỤC

CHƯƠNG 1. TỔNG QUAN ĐỀ TÀI ......................................................................3
1.1.

LÝ DO CHỌN ĐỀ TÀI .....................................................................................3

1.2.

MỤC TIÊU VÀ PHẠM VI .................................................................................3

1.2.1. Mục tiêu ...................................................................................................3
1.2.2. Phạm vi thực hiện....................................................................................3
1.3.

CÁC NGHIÊN CỨU LIÊN QUAN ......................................................................3


1.4.

KẾT QUẢ ......................................................................................................4

CHƯƠNG 2. CƠ SỞ LÝ THUYẾT .........................................................................5
2.1.

CÁC KIẾN THỨC NỀN TẢNG ..........................................................................5

2.1.1. Kiến thức nền ..........................................................................................5
2.1.2. Mạng Neural .........................................................................................13
2.1.3. Đào tạo mạng Neurual ..........................................................................15
2.2.

CÁC MƠ HÌNH MÁY HỌC .............................................................................18

2.2.1. Thuật tốn đường trung bình động (Moving Average) .........................18
2.2.2. Thuật toán tiên tri (Prophet) .................................................................20
2.2.3. Thuật toán Long Short Time Memory ...................................................22
CHƯƠNG 3. MƠ HÌNH DỰ ĐỐN XU HƯỚNG BẤT ĐỘNG SẢN DỰA
TRÊN TIẾP CẬN MÁY HỌC ...............................................................................34
3.1.

THỰC NGHIỆM – PHÂN TÍCH VÀ ĐÁNH GIÁ.................................................34

3.1.1. Bộ dữ liệu thực nghiệm .........................................................................34
3.1.2. Xây dựng thuật toán ..............................................................................37
3.1.3. Phương pháp đánh giá ..........................................................................47
3.1.4. Kết quả thực nghiệm .............................................................................51
3.2.


CÔNG NGHỆ TRIỂN KHAI SERVER ...............................................................54

3.2.1. Flask ......................................................................................................54
3.2.2. Restful API ............................................................................................59


3.2.3. Thiết kế API cho dự đốn ......................................................................62
3.3.

TẠO MƠI TRƯỜNG VÀ TRIỂN KHAI SERVER ................................................63

3.3.1. Tải mã nguồn.........................................................................................63
3.3.2. Khởi tạo mơi trường ảo và cài đặt các gói ...........................................63
3.3.3. Định dạng URL của API .......................................................................66
CHƯƠNG 4. TÌM HIỂU CỘNG NGHỆ XÂY DỰNG VÀ TRIỂN KHAI ỨNG
DỤNG ANDROID ...................................................................................................68
4.1.

TÌM HIỂU ANDROID VÀ MỘT SỐ CÔNG NGHỆ LIÊN QUAN ĐỂ XÂY DỰNG ỨNG

DỤNG PHÍA CLIENT .................................................................................................68

4.1.1. Giới thiệu về hệ điều hành Android ......................................................68
4.1.2. Kiến trúc hệ điều hành ..........................................................................68
4.1.3. Ưu điểm, nhược điểm lý do lựa chọn ....................................................69
4.1.4. Cài đặt Android Studio ,Android SDK, máy ảo ....................................70
4.1.5. Thư viện Volley .....................................................................................71
4.1.6. Thư viện MPAndroidChart ...................................................................72
4.2.


XÂY DỰNG TRIỂN KHAI ỨNG DỤNG ...........................................................73

4.2.1. Giới thiệu...............................................................................................73
4.2.2. Màn hình ứng dụng ...............................................................................73
CHƯƠNG 5. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN......................................75
5.1.

KẾT QUẢ ĐẠT ĐƯỢC...................................................................................75

5.2.

HƯỚNG PHÁT TRIỂN ...................................................................................75

TÀI LIỆU THAM KHẢO ......................................................................................76


DANH MỤC HÌNH
Hình 2.1 : Hoạt động của Machine Learning ............................................................12
Hình 2.2 : Mạng noron lặp lại các vịng lặp ..............................................................22
Hình 2.3 : Một mạng noron hồi quy..........................................................................23
Hình 2.4 : Module lặp lại của mạng RNN chuẩn với 1 lớp ......................................25
Hình 2.5 : Module lặp lại trong mạng LSTM chứa 4 lớp tương tác .........................26
Hình 2.6 : Các kí hiệu thường được sử dụng trong một mạng noron .......................26
Hình 2.7 : Trạng thái tế bào ......................................................................................27
Hình 2.8 : Cổng sàng lọc thơng tin của mạng LSTM ...............................................28
Hình 2.9 : Tầng cổng quên của LSTM ......................................................................29
Hình 2.10 : Tầng cổng vào LSTM ............................................................................30
Hình 2.11 : Cập nhật tế báo cũ trong mạng LSTM ...................................................30
Hình 2.12 : Cập nhật tế báo cũ trong mạng LSTM ...................................................31

Hình 2.13 : Cập nhật tế báo cũ trong mạng LSTM ...................................................32
Hình 2.14 : Biến thể khác của mạng LSTM .............................................................33
Hình 2.15 : Mạng LSTM Gated Recurrent Unit .......................................................33
Hình 3.1 : Zillow và trulia .........................................................................................34
Hình 3.2 : Mơ tả dữ liệu thực nghiệm .......................................................................36
Hình 3.3 : Các thư viện Deep Learning phổ biến .....................................................41
Hình 3.4 : Top thư viện Deep Learning năm 2018 ...................................................42
Hình 3.5 : Số lượng Contributors của các thư viện năm 2017 ..................................43
Hình 3.6 : Kết quả thuật tốn đường trung bình động ..............................................51
Hình 3.7 : Kết quả thuật tốn tiên tri .........................................................................52
Hình 3.8 : Kết quả thuật tốn LSTM ........................................................................53
Hình 3.9 : Web Framework phổ biên nhất thế giới theo Khảo sát của Stack
Overflow....................................................................................................................54
Hình 3.10 : Cách Flask Framework hoạt động .........................................................55
Hình 3.11 : Thiết kế Resful API................................................................................59
Hình 3.12 : Cách hoạt động của Restfull API ...........................................................60


DANH MỤC BẢNG


DANH MỤC TỪ VIẾT TẮT


TÓM TẮT KHÓA LUẬN
1. Lý do chọn đề tài
Hiện nay bất động sản là một trong những lĩnh vực thu hút được sự quan tâm
rất lớn của xã hội, không chỉ tại Việt Nam mà còn trên thế giới. Việc phân tích
và dự đốn xu hướng bất động sản là một nhu cầu thiết thực. Trong khi đó
,máy học là phương pháp có tiềm năng dự đốn, phân tích rất lớn. Việc sử

dụng phương pháp học máy để áp dụng vào việc dự đoán thị trường bất động
sản là rất khả thi. Hơn nữa, việc phát triển nhanh của các thiết bị di động thì
việc xây dựng một ứng dụng để tích hợp chức năng dự đốn thị trường bất
động sản là khá thiết thực.
2. Thuật toán, so sánh với NCLQ. Cải tiến cụ thể
-

Các nghiên cứu liên quan bao gồm
o S&P 500 Stock Price Prediction Using Machine Learning and Deep
Learning
o A machine learning approach to big data regression analysis of real
estate prices for inferential and predictive purposes

-

Thuật toán và cải tiến:
Ở khóa luận này nhóm em sử dụng chủ yếu là các thuật toán liên quan

đến chuỗi thời gian như đường trung bình, tiên tri và LSTM thay vì những
thuật toán hồi quy ở nghiên cứu liên quan thứ 2 vì ở nghiên cứu này tác giả
chủ yếu sử dụng các thuật tốn tuyến tính để dự đốn giá nhà từ những căn
nhà khác thay vì xu hướng chung của bất động sản.
Về mặt cải tiến thì chủ yếu được thể hiện ở thuật tốn LSTM về độ
chính xác. Việc thay đổi số neuron và số bước nhớ giúp kết quả có độ chính
xác tốt hơn từ 94% lên 96 %
3. Kết quả đạt được, ý nghĩa thực tiễn
-

Kết quả đạt được:
Triển khai các thuật toán


1


Xây dựng các api cho thuật toán
Xây dựng ứng dụng di động
4. Đóng góp chính
-

Giúp người dùng dễ dàng tiếp cận đến thị trường bất động sản

-

Giúp người dùng có ứng dụng trực quan để đánh giá xu hướng bất động
sản

-

Ứng dụng thuật toán vào thực tế

5. Hạn chế
-

Ứng dụng di động chưa có nhiều chức năng

-

Với điều kiện của Việt Nam thì dữ liệu về bất động sản gần như là khơng
có nên phải sử dụng dữ liệu của Mỹ


-

Dataset không đa dạng

6. Hướng phát triển
-

Xây dựng nhiều chức năng hơn cho ứng dụng di động

-

Phát triển thành app thương mại điện tử cho bất động sản từ đó sử dụng
dữ liệu sẵn có để dự đốn

-

Cải tiến thuật tốn để cho ra kết quả với độ chính xác cao hơn

2


Chương 1.
1.1.
-

TỔNG QUAN ĐỀ TÀI

Lý do chọn đề tài
Hiện nay bất động sản là một trong những lĩnh vực thu hút được sự quan
tâm rất lớn của xã hội, không chỉ tại Việt Nam mà còn trên thế giới. Việc

phân tích và dự đốn xu hướng bất động sản là một nhu cầu thiết thực.
Trong khi đó ,máy học là phương pháp có tiềm năng dự đốn, phân tích rất
lớn. Việc sử dụng phương pháp học máy để áp dụng vào việc dự đoán thị
trường bất động sản là rất khả thi. Hơn nữa, việc phát triển nhanh của các
thiết bị di động thì việc xây dựng một ứng dụng để tích hợp chức năng dự
đốn thị trường bất động sản là khá thiết thực. Đó là lý do chúng tôi thực
hiện đề tài này

1.2.

Mục tiêu và phạm vi

1.2.1. Mục tiêu
-

Bất động sản là một lĩnh vực rất phổ biến hiện này, và máy học là phương
pháp có tiềm năng dự đốn, phân tích rất lớn. Vì vậy, nghiên cứu này đề
xuất sử dụng phương pháp tiếp cận máy học để đánh giá xu hướng của thị
trường bất động sản.

1.2.2. Phạm vi thực hiện
-

Tensorflow, keras

-

Thu thập dữ liệu, chạy thực nghiệm và so sánh kết quả giữa các mơ hình
được thiết kế bằng phương pháp học máy


-

Một số thuật toán tối ưu dữ liệu vào và ra

-

Xây dựng ứng dụng di động

1.3.
-

Các nghiên cứu liên quan
S&P 500 Stock Price Prediction Using Machine Learning and Deep
Learning

3


-

A machine learning approach to big data regression analysis of real estate
prices for inferential and predictive purposes

1.4.

Kết quả

-

Hiểu và nắm rõ các công nghệ sử dụng trong dự án


-

Nắm vững và tối ưu các thuật toán sử dụng trong đề tài

-

Xây dụng ứng dụng cho mơ hình thuật tốn

-

Áp dụng các kiến thức đã học vào thực tế

4


Chương 2.
2.1.

CƠ SỞ LÝ THUYẾT

Các kiến thức nền tảng

2.1.1. Kiến thức nền
2.1.1.1.

AI , Machine learning và Deep Learning

 Trí tuệ nhân tạo (AI): một cỗ máy có thể bắt chước hành vi và tư duy
của con người.

 Học máy (machine learning): Một tính năng của AI, cho phép các
chuyên gia đào tạo cho AI để nó nhận biết các mẫu dữ liệu và dự đoán.
 Học sâu (deep learning): Một kỹ thuật nhỏ của machine learning, cho
phép máy có thể tự đào tạo chính mình.

AI là gì ?
o AI có thể được định nghĩa như một ngành của khoa học máy
tính liên quan đến việc tự động hóa các hành vi thông minh. AI là
một bộ phận của khoa học máy tính và do đó nó phải được đặt trên
những nguyên lý lý thuyết vững chắc, có khả năng ứng dụng được
của lĩnh vực này. Nói nơm na cho dễ hiểu: đó là trí tuệ của máy
móc được tạo ra bởi con người. Trí tuệ này có thể tư duy, suy
nghĩ, học hỏi,... như trí tuệ con người. Xử lý dữ liệu ở mức rộng
lớn hơn, quy mô hơn, hệ thống, khoa học và nhanh hơn so với con
người.
o Tuy nhiên hiện nay, cơng nghệ AI vẫn đang cịn rất nhiều hạn chế.
Đơn cử như Alexa - một quản gia tuyệt vời, một trong những biểu
tượng phổ biến nhất về ứng dụng của trí thơng minh nhân tạo
nhưng vẫn khơng thể vượt qua bài kiểm tra Turing.
o Tóm lại, những gì chúng ta đang thực hiện với AI hiện nay nằm
trong khái niệm “AI hẹp” (Narrow AI). Công nghệ này có khả
năng thực hiện các nhiệm vụ cụ thể một cách tương tự, hoặc tốt

5


hơn con người. Ví dụ về “AI hẹp” trong thực tế như cơng nghệ
phân loại hình ảnh của Pinterest hay nhận diện khuôn mặt để tag
bạn bè trên Facebook.
o Những cơng nghệ này thể hiện một số khía cạnh của trí thơng

minh con người, nhưng làm thế nào để được như vậy? Trí tuệ đó
đến từ đâu? Hãy cùng đến với vòng tròn tiếp theo: học máy
(machine learning).

Machine learning là gì?
o Machine Learning là một thuật ngữ rộng để chỉ hành động bạn dạy
máy tính cải thiện một nhiệm vụ mà nó đang thực hiện. Cụ thể hơn,
machine learning đề cập tới bất kỳ hệ thống mà hiệu suất của máy
tính khi thực hiện một nhiệm vụ sẽ trở nên tốt hơn sau khi hồn
thành nhiệm vụ đó nhiều lần. Hay nói cách khác, khả năng cơ bản
nhất của machine learning là sử dụng thuật tốn để phân tích những
thơng tin có sẵn, học hỏi từ nó rồi đưa ra quyết định hoặc dự đốn
về một thứ gì đó có liên quan. Thay vì tạo ra một phần mềm với
những hành động, hướng dẫn chi tiết để thực hiện một nhiệm vụ cụ
thể, máy tính được “huấn luyện” bằng cách sử dụng lượng dữ liệu
và các thuật toán để học cách thực hiện nhiệm vụ.
o Nếu khơng có machine learning, AI hiện tại sẽ bị hạn chế khá nhiều
bởi nó mang lại cho máy tính sức mạnh để tìm ra mọi thứ mà khơng
được lập trình rõ ràng. Ví dụ về một loại machine learning, giả sử
bạn muốn một chương trình có thể xác định được mèo trong các bức
ảnh:


Đầu tiên, bạn cung cấp cho AI một tập hợp các đặc điểm của
lồi mèo để máy nhận dạng, ví dụ như màu sắc lơng, hình
dáng cơ thể, kích thước…

6





Tiếp theo, bạn cung cấp một số hình ảnh cho AI, trong đó một
số hoặc tất cả các hình ảnh có thể được dán nhãn "mèo" để
máy có thể chọn hiệu quả hơn các chi tiết, đặc điểm có liên
quan đến mèo.



Sau khi máy đã nhận được đủ dữ liệu cần thiết về mèo, nó
phải biết cách tìm một con mèo trong một bức tranh - “Nếu
trong hình ảnh có chứa các chi tiết X, Y, hoặc Z nào đó, thì
95% khả năng đó là một con mèo”.

o Nhìn chung, ứng dụng của machine learning ngày nay là vô cùng
phổ biến và độ hữu ích thì khơng phải bàn cãi nhiều nữa.

Deep learning là gì?
o Có thể nói tính đến nay, AI đã gặt hái được khá nhiều bước tiến
lớn. Hãy suy nghĩ về nó như là một loại machine learning với
"mạng thần kinh - neural networks" sâu có thể xử lý dữ liệu theo
cách tương tự như một bộ não con người có thể thực hiện. Điểm
khác biệt chính ở đây là con người không sẽ phải dạy một chương
trình deep learning biết một con mèo trơng như thế nào, mà chỉ
cần cung cấp cho nó đủ hình ảnh cần thiết về lồi mèo, và nó sẽ tự
mình hình dung, tự học. Các bước cần làm như sau:


Cung cấp cho máy rất nhiều ảnh về mèo.




Thuật toán sẽ kiểm tra ảnh để xem các đặc điểm, chi tiết chung
giữa các bức ảnh.



Mỗi bức ảnh sẽ được giải mã chi tiết dưới nhiều cấp độ, từ các
hình dạng lớn, chung đến các ô nhỏ và nhỏ hơn nữa. Nếu một

7


×