Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.91 MB, 31 trang )
<span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">
<small>Được giới thiệu vào năm 2017, dùng chủ yếu ở lĩnh vực xử lý ngôn ngữ tự nhiên (NLP)</small>
</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">Điểm yếu:
• Thời gian và tốc độ train rất chậm, khơng tận dụng được tính tốn song song trên GPU.
• Xử lý khơng tốt với những câu dài do hiện tượng Gradient
Định nghĩa
• LSTM được phát triển để giải quyết vấn đề Gradient Vanishing của RNNs. LSTM cell có thêm một nhánh C cho phép tồn bộ
thơng tin đi qua cell, giúp duy trì thơng tin cho những câu dài.
Điểm yếu:
• Thời gian và tốc độ train rất chậm, khơng tận dụng được tính tốn song song trên GPU.
• Xử lý khơng tốt với những câu dài do hiện tượng Gradient Vanishing/Exploding.
</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8"><small>là một phương pháp biểu diễn các từ bằng vecto theo cách mà các từ tương tự có vecto tương tự. </small>
</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11"><small>Hình 2: Hiệu suất của mơ hình máy biến áp trong q trình dịch thuật so với các mơ hình khác</small>
</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23"><small> Hình 3: Các biến thể của kiến trúc </small>
</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25"><small>Hình 4: Hiệu suất của mơ hình máy biến áp trong nhiệm vụ phân tích cú pháp bằng Tiếng Anh</small>
01. Mơ hình Transformer đã đạt được thành cơng lớn trong việc dịch ngôn ngữ, nhận dạng giọng nói, dịch giọng nói và dự đốn chuỗi thời
gian.
</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29"><small>• Lorem ipsum dolor sit amet, consectetur adipiscing elit. Integer vulputate vel ipsum ac fringilla. Nunc cursus, arcu nec pretium aliquet.</small>
<small>• Lorem ipsum dolor sit amet, consectetur adipiscing elit. Integer vulputate vel ipsum ac fringilla. Nunc cursus, arcu nec pretium aliquet.</small>
<small>03. Trong tài chính, mơ hình Transformer được sử dụng để phân tích dữ liệu chuỗi thời gian</small>
<small>TÍNH LINH HOẠT VÀ TỔNG QUÁT</small>
<small>CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN HIỆU SUẤT</small>
<small>TỐI ƯU HĨA VÀ HUẤN LUYỆNHIỆU SUẤT MƠ HÌNH</small>
<small>Mơ hình có khả năng tổng quát hóa tốt đối với các nhiệm vụ </small>
<small>khác như phân tích cú pháp tiếng Anh</small>
<small>Mơ hình Transformer cho thấy hiệu suất xuất sắc trong nhiệm vụ </small>
<small>dịch máy cho thấy sự vượt trội so với các mơ hình trước đó. </small>
<small>Thơng qua việc sử dụng bộ tối ưu hóa Adam và điều chỉnh tốc độ học, áp dụng các phương pháp chuẩn hóa như dropout và label </small>
<small>smoothing.Số lượng và kích thước của đầu chú </small>
<small>ý, kích thước mơ hình, việc áp dụng các kỹ thuật như dropout và </small>
<small>label smoothing, </small>
</div>