Tải bản đầy đủ (.doc) (73 trang)

Nghiên cứu mô hình học sâu để dự báo khách hàng rời mạng viễn thông ở Tây Ninh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.21 MB, 73 trang )

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
-----------------------------------

NGUYỄN ĐỨC TRUNG

NGHIÊN CỨU MƠ HÌNH HỌC SÂU ĐỂ
DỰ BÁO KHÁCH HÀNG RỜI MẠNG VIỄN THÔNG
Ở TÂY NINH
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)

TP. HỒ CHÍ MINH – NĂM 2023


HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
--------------------------------------

NGUYỄN ĐỨC TRUNG

NGHIÊN CỨU MƠ HÌNH HỌC SÂU ĐỂ
DỰ BÁO KHÁCH HÀNG RỜI MẠNG VIỄN THƠNG
Ở TÂY NINH
Chun ngành: Hệ thống thơng tin
Mã số:
8.48.01.04

ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT

(Theo định hướng ứng dụng)

NGƯỜI HƯỚNG DẪN KHOA HỌC:


TS. HUỲNH TRỌNG THƯA

TP.HỒ CHÍ MINH - NĂM 2023


i

LỜI CAM ĐOAN
Tôi cam đoan rằng đề án tốt nghiệp thạc sĩ: “Nghiên cứu mơ hình học sâu để
dự báo khách hàng rời mạng viễn thông ở Tây Ninh” là cơng trình nghiên cứu của
chính tơi.
Tơi cam đoan các số liệu, kết quả nêu trong đề án là trung thực và chưa từng
được ai công bố trong bất kỳ công trình nào khác.
Khơng có sản phẩm/nghiên cứu nào của người khác được sử dụng trong đề án
này mà không được trích dẫn theo đúng quy định.

TP. Hồ Chí Minh, ngày 12 tháng 10 năm 2023
Học viên thực hiện đề án

Nguyễn Đức Trung


ii

LỜI CẢM ƠN
Trong suốt quá trình học tập và nghiên cứu thực hiện đề án tốt nghiệp thạc sĩ, ngoài
nỗ lực của bản thân, tôi đã nhận được sự hướng dẫn nhiệt tình q báu của q Thầy Cơ,
cùng với sự động viên và ủng hộ của gia đình, bạn bè và đồng nghiệp. Với lịng kính trọng
và biết ơn sâu sắc, tôi xin gửi lời cảm ơn chân thành tới:
Tôi xin chân thành cảm ơn Thầy TS. Huỳnh Trọng Thưa, người thầy kính u đã hết

lịng giúp đỡ, hướng dẫn, động viên, tạo điều kiện cho tôi trong suốt q trình thực hiện và
hồn thành đề án tốt nghiệp thạc sĩ.
Ban Giám Đốc, Phòng đào tạo sau đại học và quý Thầy Cô đã tạo mọi điều kiện
thuận lợi giúp tơi hồn thành đề án.
Tơi xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp trong cơ quan đã động
viên, hỗ trợ tơi trong lúc khó khăn để tơi có thể học tập và hồn thành đề án. Mặc dù đã có
nhiều cố gắng, nỗ lực, nhưng do thời gian và kinh nghiệm nghiên cứu khoa học còn hạn chế
nên khơng thể tránh khỏi những thiếu sót. Tơi rất mong nhận được sự góp ý của q Thầy
Cơ cùng bạn bè đồng nghiệp để kiến thức của tôi ngày một hoàn thiện hơn.
Xin chân thành cảm ơn!

TP. Hồ Chí Minh, ngày 12 tháng 10 năm 2023
Học viên thực hiện đề án

Nguyễn Đức Trung


iii

DANH SÁCH HÌNH VẼ
Hình 0.1: Thị phần th bao dịch vụ truy cập Internet của các doanh nghiệp...................................3
Hình 0.2: Tăng trưởng về lượng người dùng Internet tại Việt Nam................................................ 3
Hình 1.1: Tăng trưởng về lưu lượng truy cập Internet tại Việt Nam 2020-2021............................... 9
Hình 2.1: Mơ hình CNN.......................................................................................................... 14
Hình 3.1: Trích dữ liệu quan sát trong bộ dữ liệu........................................................................ 22
Hình 3.2: Thống kê mô tả các trường dữ liệu biến liên tục...........................................................23
Hình 3.3: Biểu đồ phân bổ tháng sử dụng.................................................................................. 25
Hình 3.4: Loại hình thuê bao.................................................................................................... 26
Hình 3.5: Số lần báo hỏng........................................................................................................27
Hình 3.6: Số lần gọi kiểm tra khơng hài lịng..............................................................................28

Hình 3.7: Đường truyền tích hợp.............................................................................................. 29
Hình 3.8: Khơng phát sinh lưu lượng........................................................................................ 30
Hình 3.9: Thuê bao nợ cước 2 tháng..........................................................................................31
Hình 3.10: Số lần gọi kiểm hài lịng.......................................................................................... 32
Hình 3.11: Cấu trúc mạng CNN............................................................................................... 34
Hình 3.12: Sơ đồ tổng quát mơ hình dự báo............................................................................... 36
Hình 4.1: Code Python Xử lý dữ liệu mơ hình Sequential............................................................40
Hình 4.2: Code Python xây dựng mơ hình Sequential................................................................. 40
Hình 4.3: Mơ hình Sequential thu được..................................................................................... 40
Hình 4.4: Mơ hình Sequential thu được với thơng số các lớp....................................................... 41
Hình 4.5: Code Python Xử lý dữ liệu mơ hình GR & VSN......................................................... 43
Hình 4.6: Code Python mã hóa các đầu vào của mơ hình GR & VSN.......................................... 44
Hình 4.7: Code Python hàm GR............................................................................................... 45
Hình 4.8: Code Python hàm VSN tích hợp GR.......................................................................... 45
Hình 4.9: Code Python cài đặt các biến trong GRN.................................................................... 46
Hình 4.10: Code Python xây dựng mơ hình GR và VSN.............................................................46
Hình 4.11: Code Python chạy huấn luyện với mơ hình GR & VSN............................................. 47
Hình 4.12: Code Python Xây dựng mơ hình Wide & Deep......................................................... 49
Hình 4.13: Cấu trúc mơ hình Wide & Deep [17]........................................................................ 49
Hình 4.14: Code Python Xây dựng mơ hình Deep & Cross.........................................................50


iv

Hình 4.15: Cấu trúc mơ hình Deep & Cross...............................................................................50
Hình 4.16: Biểu đồ so sánh giữa các mơ hình học sâu thử nghiệm................................................51
Hình 4.17: Sơ đồ thiết kế ứng dụng web....................................................................................52
Hình 4.18: Giao diện trang nhập dữ liệu dự đoán một thuê bao.................................................... 53
Hình 4.19: Giao diện trang nhập dữ liệu bằng file excel..............................................................54
Hình 4.20: Giao diện trang kết quả dự đoán từ file nhiều khách hàng............................................54



v

DANH SÁCH BẢNG
Bảng 3.1: Thông tin bộ dữ liệu của bài toán............................................................................... 21
Bảng 4.1 : Tổng hợp đánh giá các mơ hình với bộ dữ liệu........................................................... 51


vi

DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT
VIẾT TẮT

NGHĨA TIẾNG ANH

NGHĨA TIẾNG VIỆT

AI

Artificial Intelligence

Trí tuệ nhân tạo

ANN

Artificial Neural Network

Mạng nơ-ron nhân tạo


CNN

Convolutional Neural Network

Mạng nơ-ron tích chập

FTTH

Fiber To The Home

Cáp quang cho hộ gia đình

ITC

Information & Communications
Technologies

Cơng nghệ thơng tin và truyền
thông

GR

Gated Residual

Phần dư của cổng

GSN

Gated Selection Networks


Mạng lựa chọn có cổng

xDSL

Digital Subcriber Line

Kênh thuê bao số

ML

Machine Learning

Học máy

VSN

Variable Selection Networks

Mạng lựa chọn biến số


vii

MỤC LỤC
LỜI CAM ĐOAN........................................................................................................ i
LỜI CẢM ƠN............................................................................................................. ii
DANH SÁCH HÌNH VẼ............................................................................................ iii
DANH SÁCH BẢNG.................................................................................................. v
DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT................................................... vi
MỤC LỤC............................................................................................................... vii

MỞ ĐẦU................................................................................................................... 1
1.

Tính cấp thiết của đề án..................................................................................... 1

2.

Tổng quan về đề án........................................................................................... 2

3.

Mục tiêu, ý nghĩa khoa học và thực tiễn............................................................... 5

4.

Đối tượng và phạm vi nghiên cứu....................................................................... 6

5.

6.

4.1

Đối tượng nghiên cứu................................................................................. 6

4.2

Phạm vi nghiên cứu................................................................................... 6

Phương pháp nghiên cứu................................................................................... 6

5.1

Phương pháp nghiên cứu lý thuyết............................................................... 6

5.2

Phương pháp nghiên cứu thực nghiệm......................................................... 6

Bố cục đề án..................................................................................................... 7

CHƯƠNG 1: TỔNG QUAN VỀ DỰ BÁO KHÁCH HÀNG RỜI MẠNG CÁP QUANG
................................................................................................................................... 8
1.1. Tổng quan về mạng cáp quang và thuê bao.......................................................... 8
1.1.1. Mạng cáp quang......................................................................................... 8
1.1.2. Cạnh tranh và hiện trạng khách hàng rời mạng............................................... 9
1.2. Bài toán dự báo khách hàng rời mạng cáp quang................................................ 11
CHƯƠNG 2: CÁC MƠ HÌNH HỌC SÂU VÀ CƠNG TRÌNH LIÊN QUAN................13
2.1. Mơ hình học sâu trong bài tốn dự báo............................................................... 13
2.2. Các cơng trình nghiên cứu trong nước............................................................... 15
2.3. Các cơng trình nghiên cứu trên thế giới.............................................................. 16


viii

CHƯƠNG 3: XÂY DỰNG MƠ HÌNH DỰ BÁO........................................................ 21
3.1. Bộ dữ liệu của bài tốn..................................................................................... 21
3.2. Thiết kế mơ hình.............................................................................................. 33
3.2.1. Giới thiệu về mơ hình CNN và Keras Deep Learning................................... 33
3.2.2. Ý tưởng xây dựng mơ hình dự báo khách hàng rời mạng cáp quang...............35
3.3. Phương pháp đánh giá...................................................................................... 37

CHƯƠNG 4: THÍ NGHIỆM VÀ ĐÁNH GIÁ............................................................. 39
4.1. Mơ hình Sequential.......................................................................................... 39
4.1.1. Xử lý dữ liệu............................................................................................ 40
4.1.2. Xây dựng mô hình Sequential.................................................................... 40
4.1.3. Kết quả.................................................................................................... 41
4.2. Mơ hình Gated Residual và Variable Selection Networks.................................... 42
4.2.1. Xử lý dữ liệu............................................................................................ 42
4.2.2. Xây dựng mơ hình.................................................................................... 43
4.2.3. Kết quả.................................................................................................... 47
4.3. Mơ hình Wide, Deep and Cross Network........................................................... 48
4.3.1. Xử lý dữ liệu............................................................................................ 49
4.3.2. Xây dựng mơ hình.................................................................................... 49
4.3.3. Kết quả.................................................................................................... 51
4.4. Kết quả tổng hợp............................................................................................. 51
4.5. Xây dựng ứng dụng dự báo khách hàng rời mạng cáp quang................................ 52
4.5.1. Thiết kế ứng dụng..................................................................................... 52
4.5.2. Giao diện ứng dụng................................................................................... 53
4.5.3. Kết quả áp dụng ứng dụng......................................................................... 54
KẾT LUẬN VÀ KIẾN NGHỊ.................................................................................... 55
1.

Kết quả nghiên cứu của đề án........................................................................... 55

2.

Hạn chế của đề án........................................................................................... 56

3.

Vấn đề kiến nghị và hướng đi tiếp theo của nghiên cứu:...................................... 57


DANH MỤC TÀI LIỆU THAM KHẢO..................................................................... 59


1

MỞ ĐẦU
1. Tính cấp thiết của đề án
Trong dịng chảy liên tục của thời đại, xu thế phát triển của ngành thơng tin và truyền
dữ liệu được dự đốn mỗi lúc một mạnh mẽ và cạnh tranh hơn. Trước tình hình đó, một
quốc gia đang phát triển như Việt Nam có rất nhiều điều kiện thuận lợi để phát triển ngành
này ở tương lai, chính vì vậy việc cạnh tranh và phát triển để chiếm lĩnh thị phần trong ngành
này là không thể tránh khỏi.
Với xu hướng phát triển của ngành thông tin truyền dữ liệu như trên, nên đây là lĩnh
vực rất hấp dẫn cho các doanh nghiệp phát triển, thuận lợi rất nhiều nhưng cũng rất nhiều
thách thức, do các doanh nghiệp cạnh tranh quyết liệt để thu hút khách hàng, giành thị phần.
Nếu không liên tục thay đổi thích ứng với thị trường thì việc bị đào thải là điều tất yếu.
Trong nhóm các doanh nghiệp kinh doanh dịch vụ truyền dữ liệu thông qua mạng
cáp quang, việc duy trì khách hàng và mở rộng thị phần luôn là mục tiêu hàng đầu để đảm
bảo doanh thu, và lợi nhuận cho doanh nghiệp. Việc khách hàng duy trì thời gian sử dụng
dịch vụ phụ thuộc vào rất nhiều yếu tố khách quan và chủ quan. Việc này lâu nay vẫn
thường xun được phân tích dự đốn, tuy nhiên thực hiện bằng các biện pháp thủ công,
truyền thống mất rất nhiều thời gian, và đòi hỏi người phân tích phải có chun mơn tương
đối tốt, nhưng độ chính xác mang lại tương đối khơng cao. Chính vì vậy, việc áp dụng các
mơ hình học sâu để dự đốn xu hướng khách hàng cũng như mong muốn của khách hàng
tiếp tục hay không tiếp tục sử dụng dịch vụ là vô cùng triển vọng, hỗ trợ cho doanh nghiệp
hiểu rõ nhu cầu và lý do tại sao họ rời bỏ mạng của mình, từ đó cải tiến dịch vụ, kỹ thuật,
công nghệ để phục vụ tốt hơn khách hàng, giữ chân khách hàng và mở rộng hơn thị phần
của mình. Với mong muốn dự báo khả năng rời mạng của khách hàng sử dụng dịch vụ
mạng cáp quang, đề án này xin đề xuất tên đề án như sau:

NGHIÊN CỨU MƠ HÌNH HỌC SÂU ĐỂ DỰ BÁO KHÁCH HÀNG RỜI
MẠNG VIỄN THÔNG Ở TÂY NINH.


2

2. Tổng quan về đề án
2.1 Tổng quan về internet và hiện trạng thuê bao rời mạng cáp quang
Vào tháng 1 năm 2023, Việt Nam có tổng cộng 77,93 triệu người dùng Internet, đạt
tỷ lệ sử dụng Internet là 79,1% trên tổng dân số [1]. Theo phân tích của Kepios, số lượng
người dùng Internet tại Việt Nam đã tăng thêm 5,3 triệu (+7,3%) so với năm 2022. Tuy
nhiên, vẫn còn khoảng 20,9% dân số Việt Nam, tức là 20,60 triệu người, không sử dụng
Internet vào đầu năm 2023.
Vào tháng 1 năm 2023, Việt Nam có 70 triệu người dùng mạng xã hội. Theo các tổ
chức GWI và data.ai, sự phổ biến của mạng xã hội ở Việt Nam vẫn đang tiếp tục gia tăng
mà khơng có dấu hiệu chững lại. Tuy nhiên, không phải mỗi tài khoản người dùng mạng xã
hội đều tương ứng với một cá nhân duy nhất. Tại đầu năm 2023, số lượng người dùng mạng
xã hội ở Việt Nam đạt 71,0% tổng dân số, nhưng theo dữ liệu từ các công cụ lập kế hoạch
quảng cáo của các nền tảng mạng xã hội hàng đầu, chỉ có 64,40 triệu người dùng từ 18 tuổi
trở lên.
Tuy nhiên, tỷ lệ này vẫn rất cao, đạt 89,0% tổng dân số từ 18 tuổi trở lên. Nói cách
khác, 89,8% tổng số người dùng Internet của Việt Nam đã sử dụng ít nhất một nền tảng
mạng xã hội vào tháng 1 năm 2023.
Ở Việt Nam hiện nay, có khá nhiều nhà cung cấp dịch vụ mạng cáp quang tốc độ cao
như VNPT, Viettel, FPT, NetNam, v/v. Trong đó, VNPT là một nhà cung cấp dịch vụ
truyền dữ liệu và viễn thông đầu tiên trên thị trường Việt Nam. Chính thức cung cấp dịch vụ
viễn thông công cộng từ cuối năm 1997. Qua quá trình phát triển mạnh mẽ VNPT đã đứng
vững trên thị trường cung cấp dịch vụ internet tốc độ cao. Tuy nhiên tình hình trở nên xấu đi
khi các nhà cung cấp khác ào ạt khuyến mãi và có nhiều đợt đại hạ giá. Kết quả là có nhiều
khách hàng rời mạng chuyển sang sử dụng dịch vụ của nhà cung cấp khác, doanh thu ngày

một giảm, khó thu hồi vốn đầu tư. Theo tính tốn và báo cáo của VNPT [2] năm 2020, để
phát triển được khách hàng, VNPT phải đầu tư gần 3 triệu đồng/ 1 khách hàng bao gồm chi
phí phát triển khách hàng, đầu tư hệ thống và thiết bị đầu cuối. Trong khi đó ARPU là
180.000 đồng và vịng đời trung bình của khách hành là 20 tháng. Như vậy mỗi khách hàng
rời mạng


3

thì chỉ thu về được số vốn ban đầu, khơng có lợi nhuận. Con số thiệt hại sẽ rất lớn khi có
hàng trăm ngàn khách hàng rời mạng mỗi năm.

Hình 0.1: Thị phần thuê bao dịch vụ truy cập Internet của các doanh nghiệp

Hình 0.2: Tăng trưởng về lượng người dùng Internet tại Việt Nam
(Nguồn Vnetwork 6/3/2023)


4

2.2 Tổng quan về dữ liệu khách hàng sử dụng mạng Internet băng rộng cố
định.
Thông tin từ Cục Viễn thông (Bộ Thơng tin và Truyền thơng) [3] cho thấy, tính đến
tháng 10/2021, Việt Nam có hơn 18.8 triệu thuê bao Internet băng rộng cố định. Trong đó,
95,34% là thuê bao cáp quang FTTH. Việt Nam là thị trường có giá cước Internet rẻ nhất thế
giới. Số liệu thống kê năm 2020 cho thấy, Việt Nam đứng thứ 12/211 quốc gia về giá cước
Internet băng rộng cố định.
Theo Trung tâm Internet Việt Nam (VNNIC) thuộc Bộ Thông tin và Truyền thông ,
tính đến tháng 3-2022, cả nước có trên 54 triệu thuê bao FTTH (cáp quang), 3G, 4G hoạt
động trên địa chỉ IPv6 (giao thức liên mạng thế hệ thứ 6), đạt tỷ lệ 50%.

Phát triển hạ tầng số băng thông rộng đến từng người dân và từng gia đình đã được
Bộ TT&TT xác định là một trong những nhiệm vụ trọng tâm phục vụ công cuộc chuyển đổi
số quốc gia. Trước đó, đề cập đến các chỉ tiêu phát triển hạ tầng, lãnh đạo Bộ TT&TT cho
biết: Từ đầu năm 2023, 100% người dân sẽ chuyển sang dùng smartphone và trước năm
2025, cơ bản mỗi hộ có một đường Internet cáp quang siêu băng rộng.
Phát triển hạ tầng số băng thơng rộng đến từng người dân và từng gia đình đã được
Bộ TT&TT xác định là một trong những nhiệm vụ trọng tâm phục vụ công cuộc chuyển đổi
số quốc gia. Trước đó, đề cập đến các chỉ tiêu phát triển hạ tầng, lãnh đạo Bộ TT&TT cho
biết: Từ đầu năm 2023, 100% người dân sẽ chuyển sang dùng smartphone và trước năm
2025, cơ bản mỗi hộ có một đường Internet cáp quang siêu băng rộng. Hệ thống cáp quang
triển khai tới 100% các xã, phường, thị trấn, 91% thôn bản và 100% trường học. Việt Nam
hiện có hơn 94 triệu thuê bao smartphone di động. Số thuê bao băng rộng di động hơn là 82
triệu, chiếm tỷ lệ hơn 74% dân số.
Theo VIA (Verify Information Account), Việt Nam trở thành quốc gia có dân số trực
tuyến lớn nhất tại khu vực ASEAN vào năm 2013, với 16,1 triệu người dùng Internet hàng
tháng [4]. Cũng từ đầu những năm 2010, thị trường trong nước đã được đánh giá cao về tiềm
năng các ngành kinh tế số, chẳng hạn như thương mại điện tử.


5

Đến năm 2020, Việt Nam có khoảng 45.500 doanh nghiệp ICT, đem lại doanh thu
khoảng 126 tỉ USD. Mở Internet vào năm 1997 là chậm so với thế giới, nhưng tăng trưởng
Internet của Việt Nam được nhiều bên đánh giá cao.
"Từ cuối năm 2020 đến tháng 10/2021, lưu lượng Internet tại Việt Nam tiếp tục tăng
hơn 30%. Nhiều hoạt động, đặc biệt là học và họp trực tuyến, được đưa lên môi trường số
tạo lưu lượng truy cập lớn", đại diện nhà mạng VNPT cho biết.
Việt Nam cũng đang nằm trong số các nước triển khai IPv6, giao thức Internet mới
nhất, cao nhất toàn cầu, với tỷ lệ ứng dụng IPv6 nằm trong top 10 thế giới và cao hơn gấp
đôi khu vực ASEAN. Kinh tế số dự kiến sẽ đạt giá trị 49 tỉ USD vào năm 2025, với mức

tăng trưởng hàng năm 31%, với đóng góp chính đến từ thương mại điện tử.

3. Mục tiêu, ý nghĩa khoa học và thực tiễn
Mục tiêu nghiên cứu chính là xây dựng mơ hình học sâu dự đốn khách hàng rời
mạng cáp quang dựa trên tập dữ liệu của khách hàng.
Xuất phát từ mục tiêu chính trên, đề án hướng tới những mục tiêu cụ thể như


6

k

sa
u:

h

ằm xây dựng mơ hình dự đốn trên nền tảng học sâu.


Phân tích sự ảnh hưởng của các yếu tố đó như thế nào đến kết quả khách

á

hàng rời mạng, hay không rời mạng. Xác định đâu là yếu tố quyết định

ê

c


ảnh hưởng nhất đến việc thuê bao rời mạng.

n

h



Lựa chọn thuật tốn và mơ hình học sâu phù hợp với bộ dữ liệu.

h



Thơng qua mơ hình, xác định các yếu tố có ảnh hưởng nhiều nhất đến

c

à



n

u

g

t


t

h

h

u

u

t

t

h

h





p

p
t

v




à

i

p

V

h

N

â

P

n

T

t
í

T

c

â


h

y
N

d

i



n

l

h

i

,



n

u

h

kết quả khách hàng rời mạng, hay tiếp tục sử dụng dịch vụ.



Đánh giá độ chính xác và khả năng áp dụng của mơ hình đề xuất dự
đốn khả năng rời mạng của khách hàng.


7

4. Đối tượng và phạm vi nghiên cứu
4.1 Đối tượng nghiên cứu
Đối tượng nghiên cứu:


Đối tượng nghiên cứu chính là cơ sở dữ liệu khách hàng sử dụng dịch vụ mạng
cáp quang băng rộng cố định rời mạng viễn thông ở VNPT Tây Ninh.



Các đối tượng nghiên cứu khác: mô hình deep learning, các phương pháp
đánh giá tương ứng như học máy để chọn mơ hình phù hợp.

4.2 Phạm vi nghiên cứu
Phạm vi nghiên cứu:


Tập dữ liệu khách hàng sử dụng cáp quang tại VNPT Tây Ninh.



Thu thập được từ 2010 đến 2022.




Nghiên cứu các thuật toán deep learning phù hợp với bộ dữ liệu thu thập
được.

5. Phương pháp nghiên cứu
5.1 Phương pháp nghiên cứu lý thuyết
-

Thu thập và nghiên cứu tài liệu về các nghiên cứu đã thực hiện trên thế giới và Việt
Nam về vấn đề nhận diện và dự báo khách hàng rời mạng cáp quang. Phân tích, lựa
chọn giải pháp và hiện thực thử nghiệm. Đánh giá kết quả và hiệu chỉnh nếu có.

-

Tìm tài liệu, sách liên quan tới học sâu, phân tích dữ liệu như Python NoteBook.

5.2 Phương pháp nghiên cứu thực nghiệm
- Sau khi nghiên cứu lý thuyết, các bài toán, đề xuất mơ hình, xây dựng và phát triển ứng
dụng dựa trên mơ hình đề xuất, cài đặt thử nghiệm chương trình, đánh giá các kết
quả đạt được, công bố kết quả nghiên cứu.


8

6. Bố cục đề án
Bên cạnh phần mở đầu, phần kết luận và phần tài liệu tham khảo, phần nội dung chính của đề
án được chia thành 4 chương chính như sau:
Chương 1: Tổng quan về dự báo khách hàng rời mạng cáp quang

Chương 2: Các cơng trình liên quan
Chương 3: Xây dựng mơ hình dự báo khách hàng rời mạng cáp quang
Chương 4: Thí nghiệm và đánh giá


9

CHƯƠNG 1: TỔNG QUAN VỀ DỰ BÁO KHÁCH HÀNG RỜI
MẠNG CÁP QUANG
1.1. Tổng quan về mạng cáp quang và thuê bao
1.1.1. Mạng cáp quang
Mạng cáp quang là một dịch vụ viễn thơng có tốc độ cao sử dụng cơng nghệ cáp quang để cung cấp kết
nối Internet, truyền hình và dịch vụ điện thoại tới người dùng. Mạng cáp quang sử dụng tia sáng trong sợi quang để
truyền tải dữ liệu với tốc độ cao và khả năng truyền thông lớn hơn so với các công nghệ truyền thông khác như cáp
đồngtrụchoặcDSL.
Mạng cáp quang cung cấp tốc độ Internet đáng kể, cho phép người dùng truy cập nhanh chóng vào các
trang web, xem video trực tuyến chất lượng cao, chơi game trực tuyến mà không gặp trở ngại về tốc độ. Đồng thời,
mạngcáp quangcũnghỗ trợtruyền hìnhkỹthuậtsốvàdịchvụđiệnthoạiqua Internet, manglạitrảinghiệmđa dạng
vàtiệníchchongườisửdụng.
Mộtsốưuđiểmcủamạng cápquangbaogồm:
1. Tốcđộcao:Mạngcápquangcungcấptốcđộtruyềntảidữliệuvượttrộisovớicáccơngnghệkhác.Người
dùng có thể tận hưởng việc tải xuống nhanh chóng, xem video mượt mà và trải nghiệm trực tuyến mà
khôngbịgiớihạnbởitốcđộtruyềnthông.
2. Độổn định:Cơng nghệ cáp quangítbịảnhhưởngbởicác yếutốngoạivinhưthờitiếthaytia sét.Điềunày
đảmbảomạngcápquangcóđộổnđịnhcaohơnvàítgặpsựcốmấtkếtnối.
3. Băng thơng lớn: Mạng cáp quang có khả năng truyền thơng lớn, cho phép nhiều người dùng cùng sử
dụngdịchvụInternet,xemvideovàchơigamemàkhôngbịgiánđoạndotắcnghẽnmạng.
4. Hỗ trợ dịch vụ đa dạng: Thuê bao mạng cáp quang không chỉ cung cấp Internet, mà cịn kết hợp với dịch
vụ truyền hình và điện thoại qua Internet. Người dùng có thể tận hưởng các kênh truyền hình với độ phân
giảivàchấtlượngcao.



10

Trong những năm gần đây, thuê bao mạng cáp quang tại Việt Nam đã có sự phát triển đáng kể. Các nhà
mạng lớn như Viettel, VNPT và FPT Telecom đã đầu tư rất nhiều vào hạ tầng mạng cáp quang và mở rộng mạng
lướiđểcungcấpdịchvụinternetchấtlượngcaochokháchhàng.

Hình1.1:TăngtrưởngvềlưulượngtruycậpInternettạiViệtNam2020-2021
(Ảnh:CụcViễnthơng)

Nhu cầu sử dụng internet của người dân Việt Nam ngày càng tăng cao, đặc biệt là trong bối cảnh dịch
bệnh COVID-19 khi nhiều người phải làm việc và học tập từ xa. Do đó, có thể dự báo rằng sự phát triển của thuê
baomạngcápquangtạiViệtNamsẽtiếptụctăngtrưởngtrongtươnglai.

1.1.2. Cạnh tranh và hiện trạng khách hàng rời mạng
Theo báo cáo của Bộ Thơng tin và Truyền thơng[5], tínhđếncuối năm 2020, ViệtNamđã có hơn 1triệu
km cáp quang được triển khai đến 100% xã, phường trên cả nước, cung cấp Internet cáp quang tới 58,34% hộ gia
đìnhvớitổngsốthuêbaođạtmốchơn15,6triệu.
Hiện nay, thị trường thuê bao mạng cáp quang ở Việt Nam đang có sự cạnh tranh khá gay gắt giữa các
nhà cung cấp dịch vụ. Các công ty viễn thông lớn như Viettel, VNPT, FPT Telecom, Viettel, MobiFone, VNPost,
SCTV,ViettelPostđều



×