Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (816.16 KB, 29 trang )
<span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">
<b>• Vấn đề: Dự báo nhu cầu hàng tồn kho bánh dùng gradient boosting</b>
<b>• Bộ dữ liệu: Lịch sử bán hàng, danh mục khách hàng, sản phẩm. LSBH có 11 cột và </b>
74,180,464 điểm dữ liệu (doanh số tuần).
<b>• Mơ hình: LGBMRegressor của framework LightGBM với tốc độ học (learning_rate) </b>
0.01, số cây (n_estimators) 3000 và số lá tối đa (num_leaves) 5
<b>• Đánh giá: RMSLE 0.58584 với k-cross validation và k = 3 => Rất tốt</b>
<b>• Nhận xét: Mơ hình có độ chính xác cao hơn các mơ hình máy học truyền thống </b>
khác và có tích hợp lượng hàng trả về vào dự báo nhu cầu. Tuy nhiên, khó có thể thơng hiểu ý nghĩa và bản chất của mơ hình. Điều này có thể dẫn đến các vấn đề khi sử dụng trong mơi trường doanh nghiệp địi hỏi làm rõ bản chất của mơ hình. Mơ hình cũng khơng tính lượng hàng đang vận chuyển hay xuất kho vào nhu cầu do
khơng có dữ liệu.
</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12"><b>• Vấn đề: Dự báo nhu cầu hàng tồn kho thiết bị cắm trại dùng LSTM</b>
<b>• Bộ dữ liệu: Lịch sử bán hàng với 1947 cột (doanh thu ngày) và 30,464 điểm dữ liệu </b>
(sản phẩm)
<b>• Mơ hình: Residual LTSM của framework PyTorch với tốc độ học (learning_rate) 1e-4, </b>
số nơ-ron đầu vào (input_size) 1, số nơ-ron ẩn (hidden_size) 64, số lớp (num_layers) 3.
<b>• Đánh giá: MSE 0.05552 => Khá tốt</b>
<b>• Nhận xét: Mơ hình dự báo khá tốt. Mơ hình nắm bắt được sự phụ thuộc lâu dài và </b>
xử lý tốt dữ liệu tuần tự. Tuy nhiên, nhược điểm của mơ hình là việc đào tạo mơ hình có thể tốn nhiều thời gian, tài ngun tính tốn và yêu cầu lượng lớn dữ liệu huấn luyện. Ngoài ra cịn có nhược điểm khơng tính lượng hàng đang vận chuyển, xuất kho, bị trả về do khơng có dữ liệu.
</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13"><b>• Vấn đề: Dự báo tổng nhu cầu hàng tồn kho thiết bị cắm trại của các cửa hàng </b>
dùng SARIMA. (Bộ dữ liệu như trước)
<b>• Mơ hình: SARIMA của framework Statsmodel với bậc q (tự hồi quy) 2, bậc d (sai </b>
khác) 1, bậc r (trung bình trượt) 2.
<b>• Đánh giá: MAE 551.55 => Khá tốt</b>
<b>• Nhận xét: Mơ hình dự báo khá tốt. Mơ hình có hiệu quả tốt trong việc nắm bắt </b>
các mẫu mùa vụ và xử lý được các dữ liệu không có tính dừng. Tuy nhiên, nhược điểm của mơ hình là sự phức tạp trong việc xác định các tham số cho mơ hình và cần lượng lớn dữ liệu lịch sử để có thể xây dựng mơ hình. Ngồi ra cịn có nhược điểm khơng tính lượng hàng đang vận chuyển, xuất kho, bị trả về do khơng có dữ liệu.
</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14"><b>• Bộ dữ liệu: Dùng bộ dữ liệu thương mại điện tử của công ty OList ở Brazil để xây </b>
các mô hình. OList là cơng ty e-commerce kinh doanh nhiều mặt hàng với nhiều kho đặt tại nhiều thành phố
</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15"><b><small>Tiền xử lý dữ liệu:</small></b>
<small>Ta được bộ dữ liệu các chuỗi thời gian nhu cầu của 20 SKU có nhu cầu cao nhất. Mỗi SKU được xác định bởi mã sản phẩm (product_id) và thành phố (city). Mỗi SKU có một chuỗi thời gian bắt đầu từ 2016-10-01 và kết thúc ở 2018-08-01. Tần số chuỗi thời gian là tháng nên mỗi SKU có 23 điểm thời gian. Tổng cộng ta có 1564 điểm dữ liệu và 4 đặc trưng: </small>
<small>• Mã sản phẩm (product_id)• Thành phố (city)</small>
<small>• Thời điểm (time)</small>
<small>• Lượng nhu cầu (demand)</small>
<small>Nhu cầu của một SKU trong một tháng là số lần nó được đặt trong tất cả các đơn hàng trong tháng đó.</small>
</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16"><b>Tiền xử lý dữ liệu: Chia bộ dữ liệu thành tập huấn luyện và tập kiểm tra như sau:</b>
• Tập huấn luyện: Các điểm dữ liệu với thời điểm từ 2016-10-01 đến 2018-05-01.• Tập kiểm tra: Các điểm dữ liệu với thời điểm từ 2018-06-01 đến 2018-08-01.
</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17"><b>Phân tích dữ liệu</b>
• Nhu cầu của 4 SKU
</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">• Xu hướng có sự tăng manh rồi giảm dần tại tháng 1 năm 2018.
• Thành phần còn lại (resid) khá thấp.
</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">đối của xu hướng và sự không tồn tại của mùa.
</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">• Mơ hình sẽ dự báo lượng nhu cầu cho 3 tháng tương lai dựa vào 3 tháng
quá khứ.
• Bộ dữ liệu được chia thành các cửa sổ với 3 điểm dữ liệu quá khứ và 3 điểm dữ liệu tương lai trước khi đưa vào mơ hình.
</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21"><b>Hồi quy tuyến tính</b>
• Dùng lớp LinearRegressor của thư viện scikit-learn.
• Mã sản phẩm (product_id) và thành phố (city) được mã hóa one-hot.
• Thời gian (time) được chuyển từ dạng yyyy-mm-dd sang dạng ordinal (số ngày tính từ ngày 1 tháng 1 năm 1).
</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22"><b>Hồi quy tuyến tính</b>
• Dùng lớp ARIMA của thư viện statsmodel.
• Mỗi SKU có một mơ hình riêng.
• ARIMA được dùng thay vì SARIMA vì dữ liệu khơng có tính mùa.
• Tham số mơ hình: (p, d, q) = (1, 0, 1)
</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24"><b>Đánh giá và so sánh</b>
• Dùng phương pháp bottom-up để dự báo tổng nhu cầu cho các sản phẩm từ các dự báo nhu cầu theo SKU.
<b><small>Học sâu RNN LSTM</small></b>
</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25"><b>Đánh giá và so sánh</b>
• Dùng phương pháp bottom-up để dự báo tổng nhu cầu cho các vùng địa lý thành phố từ các dự báo nhu cầu
</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26"><b><small>Đánh giá và so sánh</small></b>
<small>• Ta thấy các mơ hình tạm ổn nhưng vẫn cịn nhiều sai sót. </small>
<small>• Phần lớn các SKU khơng có đủ lịch sử nhu cầu để các mơ hình nắm bắt được đủ thơng tin. Ngồi ra, cịn có các yếu tố bên ngồi như thơng tin về các chương trình khuyến mãi, các chỉ số kinh tế, thương hiệu, thông số sản phẩm,… chưa được đưa vào các mơ hình. </small>
<small>• Các siêu tham số của các mơ hình chưa được tối ưu hóa.</small>
<small>• Mơ hình ARIMA cho các dự báo gần giá trị thật nhất trong khi hồi quy tuyến tính và học sâu cho các dự báo sai lệch hơn. </small>
<small>• Độ chính xác thấp hơn của mơ hình hồi quy tuyến tính là do các lượng nhu cầu hiếm khi thay đổi tuyến tính. </small>
</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27"><small>• Khảo sát và đánh giá một số mơ hình dự báo hàng tồn kho có sẵn.</small>
<small>• Thu thập và phân tích một bộ dữ liệu hàng tồn kho của một doanh nghiệp bán lẻ hàng điện tử.</small>
<small>• Xây dựng mơ hình học sâu dùng LSTM, mơ hình ARIMA và mơ hình hồi quy tuyến tính để dự báo hàng tồn kho (theo SKU, sản phẩm, vùng địa lý thành phố) của một doanh nghiệp bán lẻ hàng điện tử.</small>
<small>• Đánh giá, so sánh và nhận xét các mơ hình vừa xây.</small>
</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28"><b>Hướng phát triển</b>
• Cần thu thập thêm nhiều dữ liệu để cải thiện độ chính xác.
• Tối ưu hóa các siêu tham số của các mơ hình để cải thiện độ chính xác.• Khám phá các mơ hình học máy khác.
• Dự báo nhu cầu của các SKU mới dùng nhu cầu các SKU đời cũ tương tự.• Tích hợp các dữ liệu về hàng trả và khuyến mãi vào mơ hình.
• Tích hợp các chỉ số kinh tế như lạm phát, tăng trưởng GDP, giá dầu vào mơ hình.
</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">