Tải bản đầy đủ (.pdf) (6 trang)

Ước lượng băng thông sử dụng mô hình mạng nơ-ron LSTM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.65 MB, 6 trang )

Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)

Ước lượng băng thơng sử dụng mơ hình mạng
nơ-ron LSTM
Vũ Hữu Tiến∗ , Nguyễn Trọng Trung Anh† , Phạm Văn Sự‡ , Thippaphone Sisouvong∗ , Lê Hải Châu†


Khoa Đa phương tiện
Khoa Viễn thông I
‡ Khoa Kỹ thuật điện tử I
Học viện Công nghệ Bưu chính Viễn thơng
Email: {tienvh, anhntt, supv}@ptit.edu.vn, ,


Tóm tắt—Ước lượng băng thông đường truyền là một
vấn đề quan trọng trong truyền phát video. Với mục đích
nâng cao chất lượng trải nghiệm cho người dùng bằng
cách điều chỉnh các thông số kịp thời theo sự biến đổi
của băng thông, nhiều nghiên cứu đã xây dựng những
mơ hình nhằm dự đốn chính xác tốc độ băng thơng tại
một thời điểm nhất định. Trong bài báo này, để đạt được
hiệu quả cao trong việc ước lượng băng thông cho truyền
phát video, ý tưởng sử dụng mơ hình mạng nơ-ron hồi
quy được chúng tơi áp dụng cho bài tốn ước lượng băng
thơng. Trong giải pháp đề xuất của chúng tôi, ưu điểm của
bộ nhớ dài-ngắn hạn với kết nối phản hồi kết hợp cùng
khả năng tối ưu hóa của mạng nơ-ron được tận dụng để
xây dựng mơ hình với nhiều tập dữ liệu khác nhau. Kết
quả của nghiên cứu đưa ra những đánh giá về tính khả
thi của phương pháp đề xuất.
Từ khóa—Ước lượng băng thông, LSTM, Mạng nơ-ron.



I. GIỚI THIỆU
Trong những năm trở lại đây với tốc độ phát triển
nhanh chóng của thiết bị di động như máy tính bảng,
điện thoại, máy tính xách tay, nhu cầu sử dụng dịch vụ
phát trực tuyến video cũng ngày càng trở nên đa dạng.
Dữ liệu cho phát trực tuyến hình ảnh dần trở thành loại
dữ liệu sử dụng nhiều lưu lượng mạng nhất. Các khảo
sát và nghiên cứu gần đây đã chỉ ra rằng phần lớn lưu
lượng dữ liệu dành cho di động đến từ dữ liệu phát trực
tuyến video, và lưu lượng này được dự báo tiếp tục tăng
nhanh trong thập kỷ này [1] [2]. Để cũng cấp chất lượng
đảm bảo cùng trải nghiệm người dùng với khối lượng
dữ liệu video di dộng lớn như vậy, tốc độ bit thích ứng
cho truyền dữ liệu trên một băng thơng có sẵn là cần
thiết [3] [4]. Đối với việc truyền phát video trong đó
cho phép thực hiện liên tục quá trình chuẩn bị và phát
những nội dung đa phương tiện như video, audio, ... đến
người dùng trong khi quá trình truyền phát nội dung đa
phương tiện vẫn đang diễn ra, người dùng có thể khơng

ISBN 978-604-80-5958-3

54

cần phải tải về tồn bộ những nội dung mình muốn xem
trước, thay vào đó, họ có thể tải dần từng phần nén của
file video được chia nhỏ từng phần để sử dụng. Trong
quá trình truyền, những thay đổi của băng thơng sẽ có
ảnh hưởng lớn đối với chất lượng trải nghiệm của người

dùng. Để có thể có các giải pháp tốt cho việc chuẩn bị
và phát những nội dung video đảm bảo chất lượng trải
nghiệm theo yêu cầu của người dùng, nhu cầu đoán biết
được trước những thay đổi, biến động của băng thơng là
rất cần thiết. Do đó, cùng với sự phát triển của các loại
hình dịch vụ hướng video, ước lượng băng thơng đã và
đang là bài tốn quan trọng được quan tâm nghiên cứu
rộng rãi.
Để ước lượng băng thông cho truyền phát video, nhiều
hướng tiếp cận được đề xuất và phát triển hiệu quả để
thích ứng với tình trạng đường truyền khơng ổn định,
đặc biệt là đối với các kết nối không dây hay kết nối
qua môi trường Internet công cộng [5] [6] [7] [8] [9]
[10]. Nghiên cứu trong [5] đưa ra thuật tốn ước lượng
băng thơng dựa trên phân đoạn cuối cùng. Thuật toán
này ước lượng băng thông dựa theo cơ chế đơn giản dựa
trên mối quan hệ giữa băng thông đo được cuối cùng
của mạng với tốc độ bit hiện thời của luồng video như
sau: 1) khi băng thông mạng đo được cuối cùng cao hơn
mức tốc độ bit của luồng hiện tại thì phân đoạn tiếp theo
được tải về sẽ có tốc độ bit tăng lên và ngược lại, 2)
tốc độ bit tải về sẽ giảm xuống nếu băng thơng đo được
đó nhỏ hơn tốc độ bit của luồng hiện tại. Cách tiếp cận
này cho phép xử lý đơn giản, đạt hiệu quả cao và thích
nghi nhanh với sự biến động băng thơng, tuy nhiên, nó
cũng có thể làm cho tốc độ bit mỗi phân đoạn thay đổi
quá nhiều và ảnh hưởng đến chất lượng trải nghiệm của
người dùng. Một hướng khác là ước lượng dựa trên kỹ
thuật làm mịn băng thông [6]. Đặc điểm của thuật toán
này là nội suy nhiều lần và cố gắng để suy ra tốc độ bit

có thể đạt được từ các giá trị băng thông đo được trong


Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)

các lần lặp trước đó. Giải pháp này giúp hạn chế sự thay
đổi nhanh và liên tục của tốc độ bit dự đoán nhưng có
thể gây hiện tượng đóng băng video do việc lưu đệm
giảm mạnh khi băng thông xuống thấp đột ngột. Bên
cạnh đó, cơng nghệ trí tuệ nhân tạo (AI) đang là công
nghệ được quan tâm phát triển và ứng dụng rộng khắp
trong thời gian gần đây [11] [12]. Công nghệ AI cũng
được áp dụng để giải quyết bài toán ước lượng và dự
đốn băng thơng nhờ những ưu điểm vượt trội của nó.
Trong báo cáo [7] [8] [9], các phương pháp tiếp cận dựa
trên thuật toán học máy ước lượng băng thơng nhằm duy
trì video chất lượng cao khơng gián đoạn đã được đưa
ra. Mơ hình QoE cũng được trình bày và so sánh dựa
trên chất lượng trải nghiệm của người sử dụng.
Trong bài báo này, chúng tôi đề xuất sử dụng mơ hình
mạng nơ-ron hồi quy và bộ nhớ dài-ngắn hạn cho thuật
tốn học máy ước lượng băng thơng. Mạng nơ-ron với
ưu điểm về khả năng tổng quát hóa bài tốn song song
với cấu trúc mạng có thể ghi nhớ được dùng để phân
tích khả năng dự đốn dữ liệu chuỗi thời gian ứng với
băng thông hiệu quả. Các thực nghiệm trên bộ dữ liệu
thực tế cũng được triển khai để đánh giá hiệu năng của
giải pháp đề xuất. Ngồi ra, chúng tơi cũng so sánh giải
pháp đề xuất với giải pháp ước lượng băng thông hiệu
quả được áp dụng trong phần mềm chạy video nổi tiếng

ExoPlayer do Google phát triển [13]. Kết quả so sánh
cũng cho thấy tính hiệu quả của giải pháp được đề xuất.
II. GIẢI PHÁP ƯỚC LƯỢNG BĂNG THƠNG SỬ
DỤNG MƠ HÌNH MẠNG NƠ-RON HỒI QUY
Chúng ta xem xét một hệ thống mạng nơ-ron truyền
thẳng minh họa trong Hình 1 [14] [15]. Kiến trúc này
sử dụng một tầng đầu vào, hai tầng ẩn và một tầng đầu
ra. Dữ liệu đầu vào gồm n đặc điểm, mục tiêu đầu ra
được tính tốn dựa trên các thơng số của nút mạng trong
kiến trúc. Trong mạng nơ-ron truyền thẳng, dữ liệu được
truyền qua các tầng và thuật toán học dựa trên những tín
hiệu truyền ngược. Giả sử W định nghĩa ma trận trọng
số của cấu trúc mạng nơ-ron, wij đại diện cho các phần
tử tại nút mạng, giá trị tại trạng thái t + 1 được tối ưu
dựa trên cơng thức:
∂E(t)
(1)
∂wij
, trong đó η là tốc độ và E là hàm tính mất mát
giữa giá trị đầu ra dự đoán và giá trị đầu ra chuẩn từ
tập dữ liệu sử dụng để huấn luyện. Mạng nơ-ron truyền
thẳng có khả năng tổng quát hóa hiệu quả, tuy nhiên
trong xử lý dữ liệu có dạng chuỗi thời gian tuần tự,
thơng tin từ những trạng thái trước đó có thể cung cấp
khả năng ghi nhớ cho cấu trúc mạng nơ-ron. Mô hình
wij (t + 1) = wij (t) − η

ISBN 978-604-80-5958-3

55


Hình 1. Kiến trúc mạng nơ-ron truyền thẳng hai tầng ẩn.

mạng nơ-ron hồi quy được thiết kế tại nút mạng và
được so sánh với cấu trúc trong mạng nơ-ron truyền
thằng minh họa trong Hình 2. Xem xét các vector trạng
thái x(1), x(2), x(3), ..., x(t) của chuỗi dữ liệu đầu vào.
Mạng nơ-ron hồi quy ghi nhớ bằng cách xử lý lần lượt
từng vector x(t) dựa trên tín hiệu từ trạng thái (t − 1)
dể ánh xạ chuỗi đầu ra. Tuy nhiên, khả năng ghi nhớ
trạng thái hạn chế bởi giá trị tín hiệu truyền ngược trong
Cơng thức (1) giảm dần khi các bước thời gian cách xa
nhau. Từ đó giảm tốc độ hội tụ của W.
A. Bộ nhớ dài ngắn hạn (LSTM)
Cấu trúc mạng nơ-ron hồi quy có tác dụng phản ánh
lại tín hiệu tại nút mạng [15]. Tuy nhiên trong bài tốn
ước lượng bằng thơng, khả năng ghi nhớ tại nhiều bước
thời gian có thể được sử dụng để đưa ra một giải pháp
hiệu quả hơn cho quá trình dự đoán. Bộ nhớ dài-ngắn
hạn dựa trên cấu trúc mở rộng của các nút mạng và
được thể hiện trong Hình 3. Cấu trúc bộ nhớ dài-ngắn
hạn dựa trên khả năng ghi nhớ của mạng nơ-ron hồi quy,
bổ sung thêm trạng tại nút mạng và ba cổng: f orget −
gate, input − gate, output − gate. Xuyên suốt quá trình
huấn luyện, trạng thái nút mạng được ghi nhớ qua việc
đánh giá tín hiệu tại f orget − gate, f . Giả sử trạng thái
hiện tại là t, giá trị của f (t) được tính theo cơng thức
sau đây:
f (t) = σ(Wf,x x(t) + Wf,h h(t − 1) + bf )


(2)


Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thơng và Cơng nghệ Thơng tin (REV-ECIT2021)

Hình 2. Mạng truyền thẳng và mạng hồi quy.
Hình 3. Cấu trúc nút mạng LSTM.

, trong đó W biểu diễn ma trận trọng số và b là hệ số
bias. input − gate đưa ra hai giá trị i(t) và c (t) quyết
định thông tin được ghi nhớ trong trạng thái nút mạng.
Công thức được biểu thị như sau:
i(t) = σ(Wi,x x(t) + Wi,h h(t − 1) + bi )

c (t) = tanh(Wc ,x x(t) + Wc ,h h(t − 1) + bc )

(3)

(4)

Giá trị mới của c(t) được cập nhật từ kết quả của
những trạng thái trước đó với phép nhân Hadamard theo
từng phần tử:
c(t) = f (t) · c(t − 1) + i(t) · c (t)

(5)

Giá trị đầu ra y(t) được output − gate xác định dựa
trên giá trị đầu ra của thời điểm (t − 1) và giá trị đầu
vào của thời điểm t qua công thức sau:

y(t) = σ(Wo,x x(t)+Wo,h h(t−1)+bo )·tanh(c(t)) (6)
Cấu trúc nút mạng ghi nhớ trạng thái được thêm vào
mơ hình mạng nơ-ron hồi quy tạo nên khả năng ghi nhớ
dài hạn. Bằng việc lưu giá trị c(t), thông tin từ trạng thái
cách xa thời điểm hiện tại vẫn đưuọc lưu trong mạng.
Đối với dữ liệu chuỗi thời gian của băng thơng, mạng
nơ-ron hồi quy tích hợp bộ nhơ dài-ngắn hạn có thể làm
tăng khả năng ước lượng chính xác và hiệu quả.

ISBN 978-604-80-5958-3

56

B. Định nghĩa bài tốn
Để ước lượng băng thơng sử dụng bộ nhớ dài-ngắn
hạn, bài toán được định nghĩa dưới dạng ước lượng quan
hệ giữa dữ liệu đầu vào x và mục tiêu đầu ra y.
Thuật toán học áp dụng huấn luyện bộ dữ liệu xử lý
mẫu theo chu kì lặp. Mỗi mẫu huấn luyện được biểu
thị bởi (x, y), trong đó x = [x1 , x2 , ..., xn ] ∈ R1×n là
vector dữ liệu vào n-chiều. Ta định nghĩa mục đích huấn
luyện nhằm ước lượng mỗi quan hệ ràng buộc f[.] giữa
dữ liệu vào và dữ liệu ra (x → y) để mục tiêu dự đoán:
yˆ = f [x(t), θ]

(7)

là một ước lượng chính xác của mục tiêu thực tế. Các
tham số của mơ hình được thể hiện bằng vector θ. Sai
số đối với mỗi mẫu t-th được định nghĩa bằng sự khác

nhau giữa mục tiêu dự đoán và mục tiêu thực tế:
e(t) = y(t) − yˆ(t)

(8)

Để có thể xác định được sự thay đổi trong q trình
ước lượng, lõi dự đốn được theo dõi qua mỗi chu kì
lặp. Thuật tốn học tối thiểu hóa lỗi dự đốn để xác
định thơng số của cấu trúc mạng nơ-ron. Lỗi dự đoán
E(t) cho mẫu t-th được tính bằng cơng thức:
E(t) =

e2 (t)

(9)


Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thơng và Cơng nghệ Thơng tin (REV-ECIT2021)

C. Tiêu chí đánh giá ước lượng
Mơ hình LSTM có thể được đánh giá dựa trên một số
các tiêu chí như thời gian huấn luyện, sai số trung bình
và kiến trúc mạng ... Trong bài báo này, với các bài toán
dự đoán giá trị của chuỗi thuộc lớp bài tốn hồi quy thì
thơng số thường được sử dụng để đánh giá độ chính xác
chính là RMSE (căn bậc hai của sai số trung bình bình
phương). RMSE được xác định theo cơng thức như sau:
RM SE =

1

N

N

(y(t) − yˆ(t))2

(10)
Hình 4. Tóm tắt kiến trúc mạng LSTM sử dụng trong mô phỏng đánh
giá.

i=1

III. THỰC NGHIỆM VÀ ĐÁNH GIÁ
A. Tập dữ liệu và thiết lập mô phỏng
Để kiểm định giải pháp ước lượng băng thông sử
dụng mơ hình mạng nơ-ron LSTM đề xuất, trong nghiên
cứu này chúng tơi sử dụng tập dữ liệu nhật trình băng
thơng 4G/LTE của Bỉ [16] [17]. Đây là tập dữ liệu ghi
lại nhật trình băng thơng tải xuống của mạng 4G/LTE
trong đó người dùng sử dụng thiết bị di động di chuyển
trên nhiều cung đường khác nhau và trên nhiều phương
tiện di chuyển khác nhau từ đi bộ đến đi tàu. Dữ liệu
được phân thành các bộ với mỗi bộ dữ liệu của người
dùng trên một cung đường với phương tiện di chuyển
xác định. Mỗi tập dữ liệu này được chia thành hai phần:
75% được sử dụng cho huấn luyện và 25% được sử dụng
cho kiểm tra.
Trong bài báo này, nhóm nghiên cứu sử dụng kiến
trúc mạng gồm hai tầng LSTM. Tầng thứ nhất gồm 32
nút. Tầng thứ hai gồm 10 nút. Tóm lược kiến trúc và

bộ tham số tương ứng được trình bày trong Hình 4. giải
pháp ước lượng băng thơng sử dụng mơ hình mạng nơron LSTM được cài đặt bằng ngôn ngữ Python với thư
viện Pytorch [18]. Quá trình huấn luyện được thực hiện
trên máy tính để bàn (desktop) sử dụng hệ điều hành
Windows 10 với cấu hình có trang bị GPU (ASUS TUF
GTX1660, CUDA: 1408, 1845 MHz, 6GB GDDR5). Với
mỗi tập dữ liệu, việc huấn luyện được tiến hành với 150
epochs và kích thước bó (batch size) bằng 64.
B. Kết quả và thảo luận
Trước hết kết quả được đánh giá thông qua sự biến đổi
của hàm tổn thất (loss) được trình bày trong Hình 5. Đây
là kết quả sử dụng tập dữ liệu nhật trình băng thơng khi
người sử dụng di chuyển trên cung đường bằng phương
tiện xe bt.
Từ Hình 5 ta thấy mơ hình hội tụ khá nhanh, chỉ
khoảng với 20 epochs. Điều này cho thấy thời gian huấn
luyện có thể giảm. Kết quả là giải pháp đề xuất phù hợp
với việc áp dụng cho ứng dụng thời gian thực như trong

ISBN 978-604-80-5958-3

57

Hình 5. Đường cong tổn thất của mạng trong quá trình huấn luyện và
kiểm tra với tập dữ liệu xe buýt.

truyền tải video tốc độ bít thích nghi. Ngồi ra, các kết
quả đạt được cũng thấy việc chọn mơ hình hồn tồn
phù hợp bởi sự hội tụ của đường tổn thất huấn trong
quá trình huấn luyện và quá trình kiểm tra. Sự tiệm cận

của đường tổn thất trong quá trình kiểm tra so với q
trình huấn luyện cũng cho thấy mơ hình đề xuất khơng
bị tình trạng overfitting hoặc underfitting. Xu thế này
cũng đúng với tất cả các tập dữ liệu còn lại, chẳng hạn
với tập dữ liệu nhật trình băng thơng khi người sử dụng
di chuyển trên cung đường bằng phương tiện xe ô tô
như Hình 6.
Chất lượng của giải pháp ước lượng băng thơng sử
dụng mơ hình mạng nơ-ron LSTM được đánh giá thơng
qua sự phù hợp trong dự đốn có thể quan sát được
từ biểu đồ biểu diễn sự thay đổi của băng thơng trong
Hình 7.
Tính chính xác của giải pháp đề xuất cịn được khảo
sát thơng quan đánh giá RMSE như trong Bảng I. Cần
chú ý rằng, đơn vị đánh giá ở đây là sai số băng thông


Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thơng và Cơng nghệ Thơng tin (REV-ECIT2021)

Hình 6. Đường cong tổn thất của mạng trong quá trình huấn luyện và
kiểm tra với tập dữ liệu xe ơ tơ.

Hình 7. So sánh sự biến thiên băng thơng q trình dự đốn và kiểm
tra với tập dữ liệu xe bt.

Hình 8. So sánh sự biến thiên băng thông Giải pháp đề xuất và giải
pháp Đối sánh với dữ liệu xe buýt trên tập test.

thông với giải pháp ước lượng băng thông hiệu quả được
áp dụng thực tế trong phần mềm ExoPlayer do Google

phát triển [13] (đặt tên là giải pháp Đối sánh). Hình 8
minh họa sự thay đổi băng thơng dự đốn của mơ hình
đề xuất so với giải pháp Đối sánh. Các kết quả đạt được
thể hiện trên Hình 8 đã cho thấy băng thơng dự đốn
của giải pháp đề xuất bám sát tốt hơn so với giải pháp
Đối sánh.
Sự cải thiện độ chính xác băng thơng dự đốn của
Giải pháp đề xuất cịn có thể quan sát thơng qua so
sánh RMSE so với giải pháp ước lượng băng thông áp
dụng trong phần mềm ExoPlayer. Chẳng hạn, với tập dữ
liệu test khi người sử dụng phương tiện di chuyển xe
buýt, RMSE của phương pháp đề xuất là 958.75 trong
khi của giải pháp Đối sánh là 1017.62.
IV. KẾT LUẬN

theo Kbps. Chúng ta có thể thấy RMSE của q trình
test cao hơn một chút so với đại lượng đó trong q
trình huấn luyện.
KẾT

QUẢ

Tập dữ liệu
Xe đạp
Xe buýt
Xe ô tô
Đi bộ
Tàu

Bảng I

RMSE CỦA GIẢI PHÁP ĐỀ
RMSE huấn luyện
1247.032
858.75
971.590
1253.389
1183.649

XUẤT

RMSE kiểm tra
1272.886
958.75
1002.532
1282.537
1158.637

Để kiểm chứng, trong nghiên cứu này, chúng tôi cũng
thực hiện tiến hành so sánh độ chính xác dự báo băng

ISBN 978-604-80-5958-3

58

Trong bài báo này, giải pháp ước lượng băng thơng
dựa vào mơ hình mạng nơ-ron LSTM được đề xuất nhằm
đưa ra các dự đốn chính xác sự biến đổi của băng thơng
để cho phép kịp thời điều chỉnh các thông số hệ thống
truyền phát video góp phần nâng cao chất lượng trải
nghiệm cho người dùng. Trong giải pháp đề xuất của

chúng tôi, ý tưởng sử dụng mơ hình mạng nơ-ron hồi
quy được áp dụng cho bài tốn ước lượng băng thơng
nhằm tận dụng ưu điểm của bộ nhớ dài-ngắn hạn với
kết nối phản hồi kết hợp cùng khả năng tối ưu hóa của
mạng nơ-ron để xây dựng mơ hình với nhiều tập dữ liệu
khác nhau. Các thực nghiệm và đánh giá hiệu năng của
giải pháp đề xuất cũng được triển khai trên tập dữ liệu
băng thông mạng thực tế. Đồng thời chúng tôi cũng so
sánh giải pháp đề xuất với giải pháp ước lượng băng


Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)

thông đang được sử dụng phổ biến hiện nay. Các kết
quả đạt được cho thấy hiệu quả của giải pháp đề xuất
và sự cải thiện độ chính xác băng thơng dự đốn so với
giải pháp đối sánh.

[8] H. Mao, R. Netravali, and M. Alizadeh, “Neural adaptive video
streaming with pensieve,” in Proceedings of the Conference
of the ACM Special Interest Group on Data Communication,
ser. SIGCOMM ’17. New York, NY, USA: Association for
Computing Machinery, 2017, p. 197–210. [Online]. Available:
/>[9] M. De Filippo De Grazia, D. Zucchetto, A. Testolin, A. Zanella,
LỜI CẢM ƠN
M. Zorzi, and M. Zorzi, “Qoe multi-stage machine learning
Nghiên cứu này được tài trợ bởi Tập đoàn Naver (Hàn
for dynamic video streaming,” IEEE Transactions on Cognitive
Communications and Networking, vol. 4, no. 1, pp. 146–161,
quốc) trong đề tài mã số 04-PTIT-NAVER.

2018.
[10] A. Biernacki, “Traffic prediction methods for quality improveTÀI LIỆU THAM KHẢO
ment of adaptive video,” Multimedia Systems, vol. 24, p.
[1] V. Cisco, “Cisco visual networking index: Forecast and trends,
531–547, 2018.
2017–2022,” White Paper, February 2019.
[11] I. Sarker, “Deep learning: A comprehensive overview on tech[2] Interdigital, “The sustainable future of video entertainment,”
niques, taxonomy, applications and research directions,” SN
White Paper, November 2020.
COMPUT. SCI., vol. 420, no. 2, 2021.
[3] R. Prasad, C. Dovrolis, M. Murray, and K. Claffy, “Bandwidth
[12] A. Khan, A. Sohail, U. Zahoora, and . A. S. Qureshi, “A survey of
estimation: metrics, measurement techniques, and tools,” IEEE
the recent architectures of deep convolutional neural networks,”
network, vol. 17, no. 6, pp. 27–35, 2003.
Artif. Intell. Rev., vol. 53, p. 5455–5516, 2020.
[4] K. Bouraqia, E. Sabir, M. Sadik, and L. Ladid, “Quality of
[13] Google, “Exoplayer,” Tech. Rep. [Online]. Available:
experience for streaming services: Measurements, challenges and
/>insights,” IEEE Access, vol. 8, pp. 13 341–13 361, 2020.
[14] S. Hochreiter and J. Schmidhuber, “Long Short-Term Memory,”
[5] L. R. Romero, “A dynamic adaptive http streaming video service
Neural Computation, vol. 9, no. 8, pp. 1735–1780, 11 1997.
for google android,” 2011.
[Online]. Available: />[6] S. Gouache, G. Bichot, A. Bsila, and C. Howson, “Distributed
[15] Y. Yu, X. Si, C. Hu, and J. Zhang, “A Review of Recurrent
amp; adaptive http streaming,” in 2011 IEEE International
Neural Networks: LSTM Cells and Network Architectures,”
Conference on Multimedia and Expo, 2011, pp. 1–6.
Neural Computation, vol. 31, no. 7, pp. 1235–1270, 07 2019.

[7] S. K. Khangura, M. Fidler, and B. Rosenhahn, “Machine learning
[Online]. Available: />for measurement-based bandwidth estimation,” Computer
[16] J. van der Hooft, S. Petrangeli, T. Wauters, R. Huysegems, P. R.
Communications, vol. 144, pp. 18–30, 2019. [Online]. Available:
Alface, T. Bostoen, and F. De Turck, “Http/2-based adaptive
/>streaming of hevc video over 4g/lte networks,” IEEE Communications Letters, vol. 20, no. 11, pp. 2177–2180, 2016.
[17] G. University, “4g/lte bandwidth logs.” [Online]. Available:
jvdrhoof/dataset-4g/
[18] Deep Learning With PyTorch. Manning, July 2020.

ISBN 978-604-80-5958-3

59



×