Tải bản đầy đủ (.pdf) (40 trang)

NGHIÊN CỨU - TRAO ĐỔI VỀ VAI TRÒ CỦA LÚA (THÓC) TRONG NỀN KINH TẾ VIỆT NAM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.99 MB, 40 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<b>NGHIÊN CỨU - TRAO ĐỔI</b>

<b><small>Vây</small></b>

VAI TRỊ CỦA LÚA (THĨC) TRONG NỀN KINH TẾ VIỆT NAM

Dương Mạnh Hùng<small>*</small> Bùi Trinh<small>**</small><b> </b>

<b>1. Giới thiệu </b>

Văn hóa của người Việt gắn liền với văn minh lúa nước; dân tộc Việt Nam là một dân tộc nông dân chuyên nghề trồng lúa, có lịch sử hàng nghìn năm chun cần, chăm chỉ cày sâu cuốc bẫm. Người Việt sống bằng cách nương nhờ, tận dụng ưu thế tự nhiên dành cho mình. Mơi trường tự nhiên tươi đẹp, phồn thịnh của một xứ nóng ẩm, mưa nhiều, đậm đặc yếu tố sông nước tự nhiên đã khiến người dân Việt lựa chọn nghề trồng lúa để sinh sống. Biết bao lần dân tộc trải qua phong ba bão táp của thiên tai, địch họa thì cây lúa đều là cứu cánh của dân tộc. Khi xã hội phồn thịnh ảo thì con người thường có thái độ coi thường người nông dân và cây lúa. Trớ trêu là hiện nay trong các báo cáo kinh tế cơ cấu lúa nói riêng và ngành nơng nghiệp nói chung ngày càng thấp trong GDP càng được xem là thành tích. Biết bao cánh đồng lúa phì nhiêu nay đã thành sân golf, thành các khu công nghiệp, khu chế xuất cơ bản làm gia công và các nhà cao tầng. Nghiên cứu này sử dụng bảng cân đối liên ngành nhằm nhìn lại một cách tổng quát vai

<i><small>* </small>Vụ trưởng Vụ Thống kê Nông, Lâm nghiệp và Thủy sản – Tổng cục Thống kê. </i>

<i><small>** </small>Giảng viên Trường Kinh doanh và Cơng nghệ FPT, Đại học FPT</i>

trị của cây lúa trong nền kinh tế Việt Nam; vai trò của một ngành trong nền kinh tế không phải tỷ trọng giá trị tăng thêm của ngành đó trong GDP mà là mức độ lan tỏa của ngành đó đến các ngành khác của nền kinh tế trong mối quan hệ liên ngành.

Vào những năm 1930 của thế kỷ XX, lý thuyết tổng quát của Keynes.J.M đã được đưa ra để giải thích hiện tượng khủng hoảng và suy thoái kinh tế thế giới trong những năm này. Điều đó đã làm thay đổi nhận thức của các nhà kinh tế lúc bấy giờ rằng họ chỉ sử dụng khái niệm thu nhập quốc dân như là thước đo kinh tế duy nhất của một quốc gia (Keynes, 1931). Dựa trên lý thuyết tổng quát của Keynes và lược đồ kinh tế của Francois Quesnay năm 1936, năm 1941 Wassily Leontief đã đưa ra mơ hình Input-Output (I/O). Mơ hình I/O phản ánh bức tranh tồn cảnh về hoạt động sản xuất của nền kinh tế. Nó phản ánh mối quan hệ liên ngành/liên vùng trong sản xuất và sử dụng sản phẩm cho tiêu dùng cuối cùng, tổng vốn hình thành và xuất khẩu hàng hóa và dịch vụ trong toàn bộ nền kinh tế.

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

Từ đó, việc phân tích I/O của nền kinh tế được mở rộng và sử dụng khá linh hoạt như bảng I/O được mở rộng thành ma trận hạch toán xã hội (SAM) của Stone, R. và Brown, A., 1961, 1962, Mơ hình nhân khẩu học kinh tế của Miyazawa, Ken'ichi (1968), Mơ hình I/O liên vùng, liên quốc gia của Isard. Bảng I/O còn được sử dụng khá linh hoạt trong phân tích mối quan hệ liên ngành nhằm phân tích mối quan hệ qua lại của một ngành hoặc nhóm ngành với các ngành còn lại của nền kinh tế. Năm 1971, Miyazawa đã áp dụng bảng I/O để "Phân tích sự phụ thuộc lẫn nhau giữa các ngành dịch vụ và sản xuất hàng hóa".

Rohanabt (2008) chỉ ra rằng mơ hình I/O được sử dụng rộng rãi trong nghiên cứu về chuyển dịch cơ cấu kinh tế vì nó thể hiện tính liên ngành trong nền kinh tế và nó cũng đo lường mối quan hệ giữa cung và cầu. Baumol và Gomory (1994) lập luận rằng phân tích I/O trở nên khơng thể thiếu để xây dựng chính sách hợp lý. Tanaka, 2011 chỉ ra rằng bảng I/O giúp các nhà hoạch định chính sách và các nhà nghiên cứu thấy được công nghệ sản xuất của nền kinh tế thay đổi như thế nào; chất lượng tăng trưởng kinh tế của từng thời kỳ trong việc thúc đẩy phát triển các ngành thông qua liên kết xuôi và liên kết ngược. Henderson và cộng sự (2008) đã có nghiên cứu đánh giá tầm quan trọng của ngành lâm nghiệp đối với nền kinh tế của bang Mississippi.

Gần đây đã có những nghiên cứu liên quan đến vấn đề này như Dương Mạnh Hùng; Bùi Trinh (2019, 2022) về ngành lâm nghiệp và cây lâu năm trong nền kinh tế Việt Nam, Bùi Trinh và cộng sự (2021) nghiên cứu về sử dụng điện trong nền kinh tế Việt Nam thông qua mơ hình. Đầu vào - đầu ra, Lê Trung Hiếu và cộng sự (2022) sử dụng mơ

hình I/O để nghiên cứu ngành nông nghiệp trong nền kinh tế Việt Nam. Trong loại hình phân tích này khơng chỉ tính tốn mối liên hệ xi, ngược mà các mối quan hệ đó cịn được phân tích thành các loại tác động của một nhóm ngành đến các ngành khác như: tác động trực tiếp, tác động gián tiếp, tác động cảm ứng, tác động lan tỏa bởi các ngành công nghiệp khác. Tổng của tất cả các hiệu ứng này là liên kết ngược. Do đó, các nhà nghiên cứu và hoạch định chính sách có thể xác định một cách tương đối sự gia tăng nhu cầu cuối cùng của ngành nào sẽ có tác động tích cực đến chính nó và tồn bộ nền kinh tế.

<b>2. Nguồn dữ liệu </b>

Nghiên cứu này sử dụng bảng I/O năm 2019 do nhóm nghiên cứu của Vụ Thống kê Nông, Lâm nghiệp và Thủy sản - Tổng cục Thống kê cập nhật trên cơ sở bảng I/O quốc gia chính thức năm 2012 và từ số liệu điều tra doanh nghiệp, điều tra mức sống dân cư... Phương pháp RAS với một điểm cố định ngẫu nhiên được sử dụng để cân bằng. Bảng

8 Phân bón, thuốc trừ sâu

9 Cơng nghiệp chế biến, chế tạo khác 10 Khai thác

11 Điện, nước 12 Xây dựng 13 Dịch vụ

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

<b>3. Phương pháp </b>

Nghiên cứu này sử dụng các quan hệ Leontief. Quan hệ cơ bản của bảng I/O cạnh tranh và phi cạnh tranh được thể hiện:

Hoặc

X = (I – A<small>d</small>)<small>-1</small>.Y<small>d</small> (2) Trong đó: (I-A<small>d</small>)<small>-1</small>là ma trận nghịch đảo Leontief, Y<small>d</small> là ma trận cầu cuối cùng trong nước, X là ma trận sản lượng gây ra bởi yếu tố cầu cuối cùng trong nước.

Trong mơ hình I/O như quan hệ (1) và quan hệ (2) cho thấy giá trị sản xuất phụ thuộc vào sử dụng cuối cùng; nhưng trên thực tế một số sản phẩm như thóc cơ bản đi vào tiêu dùng trung gian, chỉ có một phần rất nhỏ đi vào sử dụng cuối cùng. Quan hệ (5) và (6) cho thấy sự phụ thuộc lẫn nhau giữa các ngành trong nền kinh tế.

<b>4. Một số nhận định từ phân tích I/O </b>

Bảng 2 mô tả một số hệ số tổng quát của ngành thóc và các ngành khác còn lại của nền kinh tế dựa trên bảng I/O 2019. Nhìn vào tỷ lệ chi phí trung gian so với giá trị sản xuất cho thấy tỷ lệ này so với các nước trong khu vực là tương đối cao, tỷ lệ này của các nước trong khu vực khoảng từ 35-40%. Tỷ lệ giá trị tăng thêm so với giá trị sản xuất cho thấy làm ra 100 đồng giá trị sản xuất có được 42 đồng giá trị tăng thêm. Tỷ lệ này so với các nước trong khu vực là hơi thấp nhưng so với các ngành khác trong nền kinh tế lại cao hơn khá nhiều (42% so với 29%). Trong khi đó tỷ lệ nhập khẩu trong chi phí trung gian lại thấp hơn các ngành khác trong nền kinh tế (12% so với 18%). Điều này phần nào cho thấy các ngành khác trong nền kinh tế (cơ bản chế biến chế tạo) nặng về sản xuất gia cơng. Số liệu này có vẻ ngược với chính sách coi trọng cơng nghiệp.

Thóc cơ bản là đầu vào cho sản xuất (96,5%) của ngành xay xát, bảng dưới cho thấy chỉ khoảng 3,5% cho tiêu dùng cuối cùng (tự sản tự tiêu), xuất khẩu và tích lũy tài sản lưu động. Thóc là đầu vào cho sản phẩm của ngành xay xát (gạo), ngành này ngoài đáp ứng nhu cầu về lương thực, đầu vào cho sản xuất và mỗi năm xuất khẩu khoảng 3 tỷ đơ la Mỹ.

Tồn nền kinh tế có hệ số co giãn về vốn tính tốn từ bảng I/O là 0,79 và hệ số co giãn về lao động là 0,21 cho thấy nền kinh tế Việt Nam cơ bản là nền kinh tế thâm dụng vốn; một điều như một nghịch lý ngành trồng lúa lại có cấu trúc về hệ số co giãn hợp lý hơn phần còn lại của nền kinh tế (hệ số co giãn của lao động là 0,71 và hệ số co giãn của vốn là 0,29).

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>Bảng 2. Một số hệ số tổng qt (lần) </b>

Nguồn: Tính tốn của nhóm nghiên cứu từ bảng I/O Chỉ số lan tỏa và độ nhậy trong phân tích

I/O hàm ý rằng sự quan trọng tương đối của một ngành (hoặc một nhóm ngành) đối với nề kinh tế; mức lan tỏa bình quân của chỉ số lan tỏa và độ nhậy hàm ý nếu ngành nào có chỉ số này lớn hơn 1 ngành đó lan tỏa đến giá trị sản xuất tốt hơn những ngành có mức lan tỏa bình quân nhỏ hơn 1. Bảng 3 cho thấy ngành thóc có chỉ số lan tỏa bình quân nhỏ hơn 1 nhưng độ nhậy bình quân lớn hơn 1; điều này phần nào cho thấy nhu cầu của sản phẩm thóc đối với nền kinh tế khơng hề nhỏ; xét về độ nhậy trong 13 nhóm ngành được khảo sát trong mơ hình chỉ có 3 nhóm ngành có độ nhậy bình qn lớn hơn 1: Thóc, cơng nghiệp chế biến chế tạo khác và nhóm ngành dịch vụ.

Trong nhiều trường hợp sự lan tỏa đến giá trị sản xuất thông qua liên kết ngược (backward linkage) và liên kết xuôi (forward linkage) khơng có nhiều ý nghĩa, điều cuối cùng mà nền kinh tế cần là giá trị tăng thêm, các nhân tử về giá trị tăng thêm phản ánh mức độ ảnh hưởng của cầu cuối cùng lan tỏa

đến giá trị tăng thêm ra sao. Một điều thú vị là tuy mức độ lan tỏa bình quân của thóc đến giá trị sản xuất thấp hơn mức bình quân của nền kinh tế (nhỏ hơn 1), nhưng mức lan tỏa bình quân đến giá trị tăng thêm của thóc lại lớn hơn mức bình quân (lớn hơn 1). Những nhóm ngành có mức lan tỏa đến giá trị tăng thêm bình quân lớn hơn 1 bao gồm: Thóc, trồng trọt khác, dịch vụ nông nghiệp, lâm nghiệp, xay xát, điện, nước và nhóm ngành dịch vụ. Nhóm ngành cơng nghiệp chế biến chế tạo trừ xay xát và phân bón, thuốc trừ sâu có mức lan tỏa bình quân rất thất, mặc dù mức độ lan tỏa đến giá trị sản xuất cao. Điều này một lần nữa cho thấy công nghiệp chế biến chế tạo của Việt Nam hầu hết là gia cơng, lắp ráp.

Trong phân tích I/O những ngành có chỉ số lan tỏa đến giá trị tăng thêm cao và lan tỏa thấp đến nhập khẩu là những ngành được xem là ngành trọng điểm. Bảng 4 cũng cho thấy thóc là ngành có chỉ số lan tỏa bình quân về giá trị tăng thêm cao (1,15) và mức an tỏa đến nhập khẩu thấp (0,76<1).

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<b>Bảng 3. Chỉ số lan tỏa và độ nhậy (lần) </b>

<b>STT Tên ngành </b> <sub>đến GTSX </sub><sup>Lan tỏa </sup> <sup>Mức lan tỏa đến </sup><sub>GTSX bình quân </sub> Độ nhậy

9 <sup>Công nghiệp chế biến, chế </sup>

Nguồn: Tính tốn của nhóm nghiên cứu từ bảng I/O Giai đoạn 2005 – 2010 nhu cầu cuối

cùng của các sản phẩm nông nghiệp khơng lan tỏa nhiều đến phía cung, hầu hết các tiểu ngành trong nhóm ngành nơng nghiệp và thủy sản đều có chỉ số lan tỏa nhỏ hơn mức bình quân chung của nền kinh tế. Tuy nhiên, đến giai đoạn 2010 - 2015 và đặc biệt là giai đoạn 2015 - 2020 mức độ lan tỏa của các sản phẩm nông nghiệp và thủy sản có mức độ lan tỏa đến giá trị sản xuất và giá trị gia tăng cao.

Một điều thú vị là trong cả giai đoạn 2015 - 2020, hầu hết các nhóm ngành công nghiệp chế biến sản phẩm nông, lâm nghiệp và thủy sản như ngành xay xát và sản xuất bột, sản phẩm chế biến bảo quản thịt và các sản phẩm từ thịt, thủy sản và các sản phẩm

từ thủy sản chế biến, bảo quản, rau quả chế biến đều có chỉ số lan tỏa đến phía cung khá cao. Ngồi ra cịn kích thích những ngành làm đầu vào cho trồng lúa nói riêng và ngành nông, lâm nghiệp và thủy sản như thức ăn gia súc, gia cầm và thuỷ sản, phân bón, thuốc trừ sâu, công nghiệp chế tạo máy, thiết bị nơng nghiệp… sẽ được kích thích mạnh mẽ khi nhóm ngành nơng, lâm nghiệp và thủy sản phát triển.

Tính tốn từ bảng cân đối liên ngành cũng cho thấy cầu đầu tư, cầu tiêu dùng của hộ gia đình và nhu cầu đầu vào sản phẩm của nhóm ngành công nghiệp chế biến nông, lâm nghiệp và thủy sản không chỉ lan tỏa đến giá trị tăng thêm của những ngành này mà còn lan tỏa đến giá trị tăng thêm của nhóm

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

ngành nơng lâm nghiệp và thủy sản cao nhất trong các nhân tố của cầu (bao gồm tiêu dùng cuối cùng, đầu tư và xuất khẩu). Đáng chú ý là xuất khẩu lan tỏa đến giá trị tăng thêm của nhóm ngành này thấp nhất trong các yếu tố của cầu cuối cùng. Điều này hàm ý rằng, các chính sách về quản lý cầu cần hướng tới nhân tố của cầu lan tỏa đến giá trị gia tăng cao nhất. Tiêu dùng sản phẩm nông, lâm nghiệp và thủy sản trong nước lan tỏa đến giá trị sản xuất và giá trị tăng thêm hơn xuất khẩu, nhưng hầu như mọi chính sách đều hướng tới xuất khẩu - phải chăng là nghịch lý?

Từ những kết quả nghiên cứu cho thấy, nhóm ngành cơng nghiệp chế biến sản phẩm nông nghiệp và thủy sản cần được phát triển ở những vùng có nguồn nguyên liệu để làm tăng hàm lượng giá trị tăng thêm trong chuỗi

giá trị của sản phẩm nông nghiệp. Ở đây cũng cần nói thêm rằng, một trong những lý do khiến hàm lượng giá trị tăng thêm trong chuỗi giá trị của các sản phẩm nông nghiệp và thủy sản thấp là do có quá nhiều khâu trung gian trong quản lý, đặc biệt là các hiệp hội. Tiếng là hiệp hội nhưng trong nhiều trường hợp lại mang tính quản lý Nhà nước. Những quyết định của hiệp hội khơng ít lần làm người nông dân điêu đứng.

Nếu đặt nguồn lực vào đúng chỗ và bắt đầu ngay từ bây giờ, Việt Nam hồn tồn có thể vào top 10 thế giới về chế biến nông sản như mong muốn của Chính phủ. Nếu đưa nguồn lực (đặc biệt nguồn lực chính sách) không đúng chỗ, ưu tiên những điểm (ngành, hoặc các yếu tố của cầu) không đáng ưu tiên thì nơng sản Việt Nam ln ln phải giải cứu mỗi khi có biến cố dù lớn hay nhỏ.

<b>Bảng 4. Lan tỏa đến giá trị tăng thêm và nhập khẩu (lần) </b>

STT Tên ngành <sup>Lan tỏa </sup><sub>đến VA </sub> Bình quân <sup>Lan tỏa đến </sup><sub>nhập khẩu </sub> <sub>quân </sub><sup>Bình </sup>

9 <sup>Công nghiệp chế biến, </sup><sub>chế tạo khác </sub> 0,473 0,7666 0,527 1,3768

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

Trong mơ hình I/O sự thay đổi về cầu cuối cùng sẽ kéo theo sự thay đổi của phía cung như giá trị sản xuất và giá trị tăng thêm, nhập khẩu; tuy nhiên mơ hình này có thể mở rộng sản xuất của một ngành có thể dẫn đến sự thay đổi về giá trị sản xuất các ngành khác.

Bảng 5 cho thấy sản xuất lúa lan tỏa mạnh đến giá trị sản xuất và giá trị tăng thêm các ngành như: Dịch vụ nông nghiệp; phân bón, thuốc trừ sâu; công nghiệp chế biến chế tạo khác và nhóm

9 <sup>Cơng nghiệp chế biến, chế </sup> kinh tế thông qua phân tích từ mơ hình I/O.

Hầu như nguồn lực về chính sách dành cho công nghiệp chế biến chế tạo, nhưng trớ trêu là mọi lan tỏa đến giá trị tăng thêm của nhóm ngành này là thấp nếu khơng muốn nói là rất thấp; ngành sản xuất thóc hầu như chỉ có sự ưu ái bằng khẩu hiệu, thậm chí nhiều ý kiến của các chuyên gia cho rằng cơ cấu của thóc nói riêng và ngành nông nghiệp nói chung cần giảm đi?

Tính tốn từ bảng cân đối liên ngành cũng cho thấy cầu đầu tư, cầu tiêu dùng của hộ gia đình và nhu cầu đầu vào sản phẩm của nhóm ngành cơng nghiệp chế biến nông nghiệp, thủy sản không chỉ lan tỏa đến giá trị tăng thêm của những ngành này mà còn lan tỏa đến giá trị tăng thêm của nhóm ngành nông, lâm nghiệp và thủy sản cao nhất trong các nhân tố của cầu (bao gồm tiêu dùng cuối cùng, đầu tư và xuất khẩu). Đáng chú ý là xuất khẩu lan tỏa đến giá trị tăng thêm của nhóm ngành này thấp nhất trong các yếu tố của cầu cuối cùng. Điều này hàm ý rằng, các

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

chính sách về quản lý cầu cần hướng tới nhân tố của cầu lan tỏa đến giá trị tăng thêm cao nhất. Tiêu dùng sản phẩm nông, lâm nghiệp và thủy sản trong nước lan tỏa đến giá trị sản xuất và giá trị tăng thêm hơn xuất khẩu, nhưng hầu như mọi chính sách đều hướng tới xuất khẩu - phải chăng là nghịch lý?

Việt Nam đưa ra quy định mức tối thiểu đất lúa ở các tỉnh để đảm bảo an ninh lương thực ở địa phương, nên chăng cần quy hoạch tổng thể đất nông nghiệp quốc gia, đất lúa thay vì quy định ở mỗi tỉnh phải giữ bao nhiêu diện tích lúa thì quy định quốc gia phải giữ bao nhiêu diện tích và tập trung sản xuất ở một số tỉnh có lợi thế đất phù hợp với cây lúa và quy mơ, cịn các tỉnh khác cho phép chuyển đổi để trồng cây có hiệu quả cao hơn, vì giao thương ngày càng phát triển nên hướng tới việc chuyên canh.

Lan tỏa đến nhập khẩu của các ngành phân bón, thuốc trừ sâu, chăn nuôi, thủy sản cao hơn mức trung bình do thức ăn chăn ni, thủy sản; phân bón, thuốc trừ sâu nhập khẩu nhiều, Việt Nam cũng chưa tự chủ được về đầu vào sản xuất nông nghiệp. Nông nghiệp sạch, hữu cơ không sử dụng chất hóa học vô cùng thấp; việc sử dụng nhiều phân bón và thuốc trừ sâu chưa hiệu quả làm ảnh hưởng tới chất lượng đất nông nghiệp lâu dài.

Nếu đặt nguồn lực vào đúng chỗ và bắt đầu ngay từ bây giờ, Việt Nam hồn tồn có thể vào top 10 thế giới về chế biến nông sản như mong muốn của Chính phủ. Nếu đưa nguồn lực (đặc biệt nguồn lực chính sách) không đúng chỗ, ưu tiên những điểm (ngành, hoặc các yếu tố của cầu) không đáng ưu tiên thì nơng sản Việt Nam ln ln phải giải cứu mỗi khi có biến cố dù lớn hay nhỏ.

<b>Tài liệu tham khảo </b>

1. Baumol, W.J. And R.E. Gomory, 1994. On efficiency and comparative advantage in trade equilibria under scale economies. Working Papers 94-13, C.V. Starr Center for Applied Economics, New York University.

2. Bui Trinh, Pham Le Hoa (2014), “Some Findings of Vietnam’s Economic Situation in the Relationship with China”, American Journal of Economics, 4 (5),

3. Duong Manh Hung, Bui Trinh 2019 “Forestry Sector and Policies on Sustainable Development in Vietnam: Analyze from the Input - Output Model” International Journal of Social and Administrative Sciences, Vol. 4, No. 2, 253-266.

4. Duong Manh Hung, Bui Trinh 2022 “Perennial Plants in Vietnam's Economy” Research in World Economy, Vol. 13, No. 1;19 - 27

5. GSO (2015) “The Vietnam input-output table, 2012” Statistical publisher, Hanoi.

6. Henderson, J.E., I.A. Munn, G. Perez-Verdin and D.L. Grebner, 2008. Forestry in Mississippi: The impact of the forest products industry on the post-Katrina Mississippi economy—an input-output analysis. Forest and Wildlife Research Center, Research Bulletin FO374, Mississippi State University. pp: 31

7. Ho D, B.; Nguyen Phuc, H.; Bui, T; Nguyen, H (2020)“Declining Protection for Vietnamese Agriculture under Trade Liberalization: Evidence from an Input– Output Analysis”. Economies, 8, 43.

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

8. Isard, W. (1951) Interregional and Regional Input-Output Analysis: A Model of a Space-Economy. The MIT Press, Cambridge

9. Isard, W. (1956). Location and Space-Economy. Cambridge, Massachusetts, The M.I.T. Press

10. Keynes, J.M., (1931). Mr. Keynes' theory of money: A rejoinder. The Economic Journal, 41(163): 412-423

11. Miyazawa, Ken'ichi. 1968. "Input-output analysis and interrelational multiplier as amatrix." Hitotsubashi Journal of Economics8, 39-58

12. Richard Stone (1961) “Input-output and National Accounts” Organisation for European Economic Co-operation

13. Miyazawa, Ken' ichi. 1971. "An analysis of the interdependence between service andgoods-producing sectors." Hitotsubashi Journal of Economics 12, I 0-21.

14. Nguyên Sinh Cúc (2009), “Phát triển cây công nghiệp lâu năm ở nước ta: Tạp chí cơng sản

15. Rohanabt, K., 2008. An input-output analysis of sources of growth and key sectors in Malaysia. Modern Applied Science, 2(3): 94-109.Available at:

16. Stone, R. and Brown, A., 1962, A computable model for economic growth, Cambridge, UK: Cambridge Growth Project.

17. Tanaka, F.J., 2011. Applications of leontief's input-output analysis in our

61/874/1/v45n1p29_tanaka.pdf.

18. Trinh Bui; Kobayashi, Kiyoshi; Phong Nguyen Viet (2012) “Vietnam Economic Structure Change Based on Input-Output

Table (2000-2007)” Asian Economic and Financial Review. - Asian Economic and Social Society. - Vol. 2. 1, p. 224-232

19. Trinh, Bui, Phong, Nguyen Viet, and Quoc, Bui. (2018), “The RAS Method with Random Fixed points”. In: Journal of Economics and Business, Vol.1, No.4, 640- 646

20. TRINH, Bui; HOA, Pham Le. Comparing the Economic Structure and Carbon Dioxide Emission between Vietnam and China. VNU Journal of Science: Economics and Business, [S.l.], v. 33, n. 1,

21. Trinh Bui, Thai N.Q (2021) “Power Using, Economic Structure and Sustainable Development in the Vietnamese Economy” ournal of Economics, Finance and Management Studies, olume 4 Issue 11, age No. 2243-2250.

22. Trung Hieu Le, Thai N.Q, Trinh Bui, hau, N.T (2022) “Structure of Agricultural, Forestry and Fishery Sector in the Vietnam Economy: An Input – Output Analysis”, Journal of Accounting, Business and Finance Research, Vol. 14, No. 1, pp. 8-18,

23. W. Leontief (1936) “Quantitative Input and Output Relations in the Economic System of the United States“, Review of Economics and Statistics, vol. 18, n0 3, August 1936, pp. 105-125

24. W. Leontief (1936) “Interrelation of Prices, Output, Savings and Investment: A Study in Empỉical Application of Economic Theory of General Interdependence“, Review of Economics and Statistics, vol. 19, n0 3, August 1936, pp. 109-132

25. W. Leontief (1941) “The Structure of American Economy 1919-1929, Harvard University Press

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

THIẾT LẬP HỆ THỐNG CHỈ SỐ

ĐỂ PHÂN TÍCH ẢNH HƯỞNG CỦA CÁC NHÂN TỐ ĐẾN BIẾN ĐỘNG CHỈ TIÊU GDP TRONG ĐIỀU KIỆN

SỐ LIỆU HIỆN NAY CỦA VIỆT NAM

PGS.TS. Tăng Văn Khiên<sup>* </sup>

Tổng sản phẩm trong nước (viết tắt tiếng anh là GDP) là chỉ tiêu kinh tế tổng hợp, phản ánh tập trung và khái quát nhất về phát triển kinh tế của một quốc gia, là cơ sở để tính toán nhiều chỉ tiêu thống kê quan trọng khác như GDP bình quân đầu người, năng suất lao động, tốc độ tăng năng suất các nhân tố tổng hợp…; và trong nhiều năm nay GDP ở Việt Nam đều có trong hệ thống chỉ tiêu Thống kê quốc gia. Do vậy nhiệm vụ của thống kê là phải thường xuyên đánh giá, đi sâu phân tích ảnh hưởng của các nhân tố đến biến động GDP theo thời gian để có cơ sở đề xuất các giải pháp phù hợp nhằm không ngừng nâng cao tốc độ tăng GDP.

Tùy theo mục đích nghiên cứu và nguồn số liệu khác nhau mà có thể áp dụng các phương pháp khác nhau, theo các mô hình khác nhau để phân tích biến động chỉ tiêu GDP theo các góc độ khác nhau.

Dưới đây ta tiến hành thiết lập hệ thống chỉ số để phân tích ảnh hưởng của các nhân tố: thay đổi tỷ trọng thuế sản phẩm, nâng cao

<i><small>*</small>Hội Thống kê Việt Nam </i>

năng suất lao động (NSLĐ) và thay cơ cấu cũng như số lượng lao động đến biến động chỉ tiêu GDP trong điều kiện số liệu hiện nay của Việt Nam.

<b>1. Thiết lập hệ thống chỉ số phân tích </b>

Khi chỉ tiêu GDP (ký hiệu là Y) và tổng số lao động làm việc tạo ra GDP (ký hiệu là ∑ 𝐿) của toàn nền kinh tế gồm 3 khu vực kinh tế (Nông, Lâm nghiệp Thủy sản - NLNTS, Công nghiệp, Xây dựng – CN XD và Dịch vụ - DV), thì ta sẽ tính được NSLĐ bình qn của 3 khu vực (𝑋̅): 𝑋̅ = Y : ∑ 𝐿, tức là có Y = 𝑋̅. ∑ 𝐿. Theo đó ta thiết lập được hệ thống chỉ số phân tích ảnh hưởng của các nhân tố: nâng cao năng suất lao động nội bộ các khu vực, thay cơ cấu lao động giữa các khu vực và tăng giảm số lượng lao động đến biến động chỉ tiêu GDP như sau:

<i><small>1 </small>Xem hệ thống chỉ số của các chỉ tiêu tổng hợp, trang 594 và 595 Giáo trình lý thuyết thống kê, năm 2012 </i>

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

𝐼<sub>𝑦</sub>= 𝐼<sub>𝑥̅</sub> × 𝐼<sub>𝐿</sub>= 𝐼<sub>𝑥 </sub>× 𝐼𝑘<sub>⁄</sub><sub>𝑐 </sub>× 𝐼<sub>𝐿</sub> Trong đó:

- 0 và 1: Ký hiệu cho thời kỳ gốc so sánh và thời kỳ báo cáo (kỳ nghiên cứu);

<small>𝑐</small>: Chỉ số thay đổi cơ cấu lao động giữa các khu vực kinh tế;

- 𝐼<sub>𝐿</sub>: Chỉ số tăng giảm lao động.

Hệ thống chỉ số trên đây được áp dụng để phân tích biến động chỉ tiêu GDP của Việt Nam trong những năm trước đây khi quy định GDP toàn nền kinh tế và các khu vực kinh tế đều tính cùng có thuế sản phẩm có trừ trợ cấp sản phẩm (từ đây viết chung là có thuế sản phẩm), và lúc đó NSLĐ chung tồn nền kinh tế bằng chính NSLĐ bình quân giữa 3 khu vực kinh tế. Nhưng từ năm 2013 lại đây GDP tồn nền kinh tế vẫn tính có cả thuế sản

phẩm, nhưng GDP của các khu vực kinh tế (NLNTS, CN XD và DV) thì quy định theo cách tính khơng có thuế sản phẩm, do vậy NSLĐ chung toàn nền kinh tế (ký hiệu là W) sẽ có trị số khác với NSLĐ bình qn tính từ NSLĐ các khu vực (𝑋̅), tức là nếu chia NSLĐ chung tồn nền kinh tế cho NSLĐ bình qn giữa các khu vực sẽ được hệ số K và K luôn lớn hơn 1 đơn vị (K = W : 𝑋̅ > 1) và K cũng chính là tỷ lệ giữa GDP chung tồn nền kinh tế có thuế sản phẩm và tổng GDP của các khu vực kinh tế khơng có thuế sản phẩm và lúc này quan hệ của GDP với các chỉ tiêu nhân tố sẽ là: 𝑌 = 𝐾. 𝑋̅. ∑ 𝑇. Theo đó hệ thống chỉ số để phân tích biến động chỉ tiêu GDP sẽ có thêm nhân tố K (Phản ánh thay đổi tỷ trọng thuế của sản phẩm chiếm trong GDP) và công thức đầy đủ

Từ công thức 02, theo nguyên tắc của chỉ số, có thể xây dựng được cơng thức tính tỷ lệ tăng lên của GDP do ảnh hưởng của các nhân tố sau:

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

Tốc độ tăng hay tỷ lệ tăng chung của GDP (𝐼̇<sub>𝑦</sub>): Khi có tỷ lệ tăng GDP do ảnh hưởng của

mỗi nhân tố, sẽ dễ dàng tính được tỷ phần (hay tỷ trọng) đóng góp (tính bằng %) của các nhân tố vào tốc độ tăng GDP nói chung bằng cách chia mỗi tỷ lệ tăng lên đó cho tốc độ tăng GDP nói chung rồi nhân với 100.

<b>2. Ví dụ tính tốn minh họa </b>

Từ số liệu về GDP theo giá so sánh 2010 của tồn nền kinh tế quốc dân có thuế sản phẩm và GDP của các khu vực kinh tế khơng có thuế sản phẩm cùng với số lượng lao động làm việc chia theo các khu vực kinh tế năm 2017 (gọi là năm gốc) và 2018 (gọi là

năm báo cáo) của Việt Nam có trong Niên giám Thống kê năm 2021 của Tổng cục Thống kê, để áp dụng công thức phân tích biến động GDP đề xuất ở trên để phân tích biến động GDP năm 2018 so với năm 2017, ta tiến hành thực hiện các bước tính tốn như sau:

2.1. Tính NSLĐ các khu vực kinh tế

Khi chia GDP mỗi khu vực kinh tế (tính bằng tỷ đồng) cho số lượng lao động của khu vực tạo ra GDP đó (tính bằng nghìn người) sẽ được NSLĐ tương ứng của khu vực (tính bằng triệu đồng/người). Theo đó ta có:

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

a. Khu vực Nông, Lâm nghiệp, Thủy sản (x<small>n</small>):

Năm 2017: x<small>n0</small> = 513874 : 21458,7 = 23,95 (triệu đồng/người) Năm 2018: x<small>n1</small> = 535022 : 20419,8 = 26,20 (triệu đồng/người) b. Khu vực Công nghiệp, Xây dựng (x<small>c</small>):

Năm 2017: x<small>c0</small> = 1482057 : 14104,5 = 105,08 (triệu đồng/người) Năm 2018: x<small>c1</small> = 1615271 : 14785,4 = 109,25 (triệu đồng/người) c. Khu vực Dịch vụ (x<small>d</small>):

Năm 2017: x<small>d0</small> = 1811524 : 18145,4 = 99,84 (triệu đồng/người) Năm 2018: x<small>d1</small> = 1946627 : 19077,3 = 102,04 (triệu đồng/người) 2.2. NSLĐ bình quân giữa 3 khu vực

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

2.4. Tính toán ảnh hưởng của các nhân tố đến tốc độ tăng GDP a. Tốc độ tăng GDP nói chung: Kết quả tính tốn cho thấy năm 2018 so

với năm 2017, GDP của Việt Nam tăng 7,47%; trong đó tỷ trọng thuế sản phẩm chiếm trong GDP đã giảm từ 9,73% năm 2017 xuống 9,62% năm 2018 nên đã làm giảm tốc độ tăng GDP là âm 0,13%, tương ứng với tỷ phần đóng góp làm giảm 1,74% (- 0,13 : 7,47 x 100); NSLĐ nội bộ các khu vực tăng lên và đã làm tăng GDP là 3,92%, tương ứng với tỷ phần đóng góp là 52,48% (3,92 : 7,47 x 100); thay đổi cơ cấu lao động giữa các khu vực làm tăng GDP là 2,61%, tương ứng với tỷ phần đóng góp là 34,94% (2,61 : 7,47 x 100); và tăng số lượng lao động làm việc làm tăng GDP là 1,07%, tương ứng với tỷ phần đóng góp là 14,32% (1,07 : 7,47 x 100). Như vậy trong 4 nhân tố ảnh hưởng đến tốc độ tăng GDP năm 2018 so với năm 2017, thì tăng NSLĐ nội bộ các khu vực kinh tế là ảnh hưởng làm tăng nhiều nhất, sau đến ảnh hưởng làm tăng của thay đổi cơ cấu lao động, và thấp nhất là ảnh hưởng làm tăng

của tăng số lượng lao động. Riêng nhân tố tỷ trọng thuế sản phẩm chiếm trong GDP đã làm giảm tốc độ tăng GDP, tuy nhiên tỷ lệ làm giảm không đáng kể./.

<b>Tài liệu tham khảo </b>

1. Giáo trình lý thuyết thống kê do PGS.TS. Trần Thị Kim Thu làm chủ biên; NXB Đại học Kinh tế quốc dân, Hà Nội năm 2012;

2. Phân tích thống kê - Lý thuyết và ứng dụng do PGS.TS. Tăng Văn Khiên làm chủ biên, NXB Thống kê năm 2015;

3. Tạp chí Con số và Sự kiện của Tổng cục Thống kê kỳ II tháng 4 năm 2019 – “Thiết lập chỉ số phân tích biến động năng suất lao động chung toàn nền kinh tế” của các tác giả: PGS.TS. Tăng Văn Khiên và TS. Đặng Văn Lương (trang 45 và 46);

4. Niên giám thống kê năm 2020 và năm 2021 của Tổng cục Thống kê, Nhà Xuất bản Thống kê năm 2021 và năm 2022.

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

SỬ DỤNG

CÁC MƠ HÌNH TRÍ TUỆ NHÂN TẠO:

<small> </small>TS. Phạm Văn Khánh<small>*</small>, Lê Huy Châu<small>**</small>, Bùi Minh Đức<small>*** </small>

<b>Tóm tắt: </b>

Dự đốn thời gian, vị trí và cường độ của một trận động đất là một công việc đầy thách thức vì một trận động đất khơng hiển thị các mơ hình cụ thể dẫn đến dự đốn khơng chính xác. Các kỹ thuật dựa trên Trí tuệ nhân tạo (AI) nổi tiếng với khả năng tìm ra các mẫu ẩn trong dữ liệu. Trong bài báo này chúng tơi dự đốn những nơi có khả năng xảy ra động đất trên thế giới và những ngày nào trận động đất sẽ xảy ra. Với vị trí địa chất, độ lớn và các yếu tố khác trong tập dữ liệu từ trong 30 ngày qua được cập nhật mỗi phút, chúng tơi dự đốn hoặc dự báo thời gian 14 ngày trong tương lai, những nơi có khả năng xảy ra động đất. Ứng dụng và tác động của dự báo này cải thiện đánh giá nguy cơ động đất có thể cứu mạng người và tiết kiệm hàng tỷ đô la cho cơ sở hạ tầng và

<b>quy hoạch. </b>

<b>Từ khóa: earthquakes, data, decision trees, random forests; động đất, dữ liệu, cây quyết </b>

định, rừng ngẫu nhiên.

<b>1. Mở đầu </b>

Động đất là một thảm họa tự nhiên gây ra bởi sự di chuyển của các mảng kiến tạo của trái đất do việc giải phóng năng lượng bên trong đáng kể của nó. Một trận động đất lớn với cường độ lớn hơn 5 độ richter có thể gây ra số người chết hàng loạt và thiệt hại lớn về cơ sở hạ tầng với chi phí hàng tỷ đơ la. Tuy nhiên, nếu có thể dự đốn được các lần

<i><small>*</small> Viện Toán và các khoa học ứng dụng, Đại học Thăng Long Hà Nội; </i>

<i><small>**</small> Trường THPT Hà Nội Amsterdam; </i>

<i><small>***</small> Trường PTTH Chuyên Khoa học Tự Nhiên, Đại học Khoa học tự nhiên, ĐHQGHN. </i>

xảy ra động đất, thì mức độ tàn phá có thể được giảm thiểu. Một quy trình dự báo động đất hoàn chỉnh cần có ba loại thơng tin: cường độ, vị trí và thời gian xảy ra.

Rất nhiều tiền bạc và cơng trình khoa học đã được dành để dự đoán địa điểm và thời điểm trận động đất lớn tiếp theo sẽ xảy ra. Nhưng không giống như dự báo thời tiết, đã được cải thiện đáng kể với việc sử dụng các vệ tinh tốt hơn và các mơ hình tốn học mạnh mẽ hơn, dự báo động đất đã thất bại do các điều kiện không chắc chắn cao của trái đất và mơi trường xung quanh nó. Hiện

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

nay, với sự trợ giúp của trí tuệ nhân tạo, ngày càng nhiều nhà khoa học cho biết những thay đổi trong cách họ có thể phân tích lượng lớn dữ liệu địa chấn có thể giúp họ hiểu rõ hơn về các trận động đất, dự đoán cách chúng sẽ hành xử và đưa ra các cảnh báo sớm nhanh hơn và chính xác hơn. Điều này giúp đánh giá rủi ro cho nhiều nhà xây dựng và kinh doanh bất động sản đối với quy hoạch cơ sở hạ tầng từ góc độ kinh doanh. Ngồi ra, nhiều mạng sống có thể được cứu thông qua cảnh báo sớm.

<b>2. Nội dung nghiên cứu </b>

<b>2.1. Khái niệm về các thuật toán học máy </b>

2.1.1. Thuật toán cây quyết định (Decision Tree Algorithm)

Một thuật toán Machine Learning thường sẽ có 2 bước:

a. Huấn luyện: Từ dữ liệu thuật toán sẽ học ra model.

b. Dự đoán: Dùng model học được từ bước trên dự đoán các giá trị mới

Cây quyết định là một cây nhị phân. Ở cây quyết định này có 2 kiểu node:

a. Node có điều kiện kiểm tra, gọi là node điều kiện. Các node điều kiện đều có 2 node con (child node) ở dưới.

b. Node lá (leaf node), không có điều kiện mà có kết quả dự đoán. Các node lá khơng có node con.

Trước hết chúng ta tìm hiểu về cơ sở toán học của thuật toán cây quyết định

<b>Định nghĩa Entropy: Cho 1 biến rời rạc x </b>

nhận các giá trị x<small>1</small>, x<small>2</small>, …, x<small>n </small>với xác suất lần

Hàm entropy đạt giá trị nhỏ nhất nếu có một giá trị p<small>i</small> = 1, đạt giá trị lớn nhất nếu tất cả các p<small>i</small> bằng nhau.

<b>Giải thuật ID3: </b>Tổng các trọng số của entropy tại các node lá sau khi xây dựng cây quyết định được coi là hàm mất mát của cây quyết định đó. Các trọng số ở đây tỉ lệ với số điểm dữ liệu được phân vào mỗi node. Cơng việc của giải thuật là tìm các cách phân chia hợp lý (thứ tự chọn thuộc tính hợp lý) sao cho hàm mất mát cuối cùng đạt giá trị càng nhỏ càng tốt. Việc này đạt được bằng cách chọn ra thuộc tính sao cho nếu dùng thuộc tính đó để phân chia, entropy tại mỗi bước giảm đi một lượng lớn nhất.

Xét 1 bài toán với C lớp khác nhau, làm việc với 1 node không lá với các điểm dữ liệu thuộc 1 tập S, |S| = N. Trong N điểm, có N<small>c</small>

điểm thuộc lớp C. Xác suất để 1 điểm dữ liệu rơi vào lớp C được xấp xỉ bằng <small>𝑁</small><sub>𝑐</sub>

Giả sử thuộc tính được chọn là x, các điểm trong S được chia ra thành các node của mỗi node con.

Mục tiêu: chọn x sao cho H(x,S) min

<b>Giải thuật CART: khá tương đồng với </b>

ID3, nhưng sử dụng Gini index làm hàm mục tiêu.

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

Hàm Gini đạt giá trị nhỏ nhất nếu có một giá trị p<small>i</small> = 1, đạt giá trị lớn nhất nếu tất cả

Để tránh trường hợp overfitting (mơ hình chính xác rất cao trên tập training nhưng không chính xác trên tập test), có 1 số phương pháp:

• Điều kiện dừng: coi 1 node là node lá và dừng phân chia khi entropy bằng 0, hay khi số phần tử nhỏ hơn 1 ngưỡng nào đó; hoặc hạn chế chiều sâu của cây.

• Ngồi ra, cịn có 1 số phương pháp cắt tỉa (pruning).

2.1.2. Thuật toán Rừng ngẫu nhiên (Random Forest)

Thuật toán Random Forest là xây dựng ngẫu nhiên tập các cây từ thuật tốn cây quyết định. Sau đó kết quả cuối cùng sẽ được tổng hợp từ những cây này.

Ở bước huấn luyện thì sẽ xây dựng nhiều cây quyết định, các cây quyết định có thể khác nhau. Sau đó ở bước dự đốn, với một dữ liệu mới, thì ở mỗi cây quyết định ta sẽ đi từ trên xuống theo các node điều kiện để được các dự đốn, sau đó kết quả cuối cùng được tổng hợp từ kết quả của các cây quyết định.

<b>Xây dựng thuật tốn Random Forest </b>

• Giả sử bộ dữ liệu của ta có n dữ liệu (sample) và mỗi dữ liệu có d thuộc tính

(feature). Các bước xây dựng thực hiện như sau:

a. Lấy ngẫu nhiên n dữ liệu từ bộ dữ liệu với kĩ thuật Bootstrapping, hay còn gọi là random sampling with replacement. Tức là khi chọn mẫu được 1 dữ liệu thì khơng bỏ dữ liệu đấy ra mà vẫn giữ lại trong tập dữ liệu ban đầu, rồi tiếp tục chọn mẫu cho tới khi mẫu đủ n dữ liệu. Khi dùng kĩ thuật này thì tập n dữ liệu mới của ta có thể có những dữ liệu bị trùng nhau.

b. Sau khi chọn mẫu được n dữ liệu từ bước 1 thì ta chọn ngẫu nhiên ở k thuộc tính (k < n). Giờ ta được bộ dữ liệu mới gồm n dữ liệu và mỗi dữ liệu có k thuộc tính. Sau đó dùng thuật toán cây quyết định để xây dựng cây.

• Do mỗi cây xây dựng theo một cách ngẫu nhiên nên kết quả giữa các cây có thể khác nhau. Mỗi cây được xây dựng dùng thuật toán Decision Tree trên tập dữ liệu khác nhau và dùng tập thuộc tính khác nhau. Sau đó kết quả dự đoán của thuật toán Random Forest sẽ được tổng hợp từ các cây quyết định.

• Khi dùng thuật toán Random Forest, ta cần để ý các thuộc tính như: số lượng cây quyết định sẽ xây dựng, số lượng thuộc tính dùng để xây dựng cây. Ngồi ra, vẫn có các thuộc tính của thuật toán Decision Tree để xây dựng cây như độ sâu tối đa, số phần tử tối thiểu trong 1 node để có thể tách.

2.1.3. Thuật tốn XGBoost:

XGBoost là một thuật toán học máy mới, được thiết kế với tốc độ và hiệu suất cao. XGBoost là viết tắt của eXtreme Gradient

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

Boosting, nó đơn giản là giải thuật các cây quyết định, áp dụng các kỹ thuật để kết hợp các cây, làm mịn mất mát huấn luyện (training loss) và chính quy hóa (regularization<small>1</small>).

<b>2.2. Sử dụng thuật toán máy học để dự báo động đất </b>

Động đất là một thảm họa thiên nhiên gây ra bởi sự chuyển động của các mảng kiến tạo của trái đất do giải phóng năng lượng nội tại đáng kể của nó. Một trận động đất lớn với cường độ lớn hơn 5 độ richter có thể gây tử vong lớn và những thiệt hại về cơ sở hạ tầng khổng lồ trị giá hàng tỷ đô la.

Tuy nhiên, nếu có thể dự đốn được các lần xảy ra động đất, thì mức độ tàn phá có thể được giảm thiểu. Một hồn thành thủ tục dự báo động đất nên có ba các loại thơng tin: độ lớn, vị trí và thời gian của tần suất xảy ra. Kể từ năm 2005, đã có 28.400 lần xuất hiện động đất với cường độ hơn 5 độ richter xung quanh thế giới [1]. Hình 1 trình bày vị trí của các lần xuất hiện từ tháng 1 đến tháng 12 năm 2019 [1]. Quan sát kỹ, nó có thể nhìn thấy một số mơ hình ở các vị trí xảy ra động đất (biểu thị bằng các chấm đỏ trong Hình 1). Loại mơ hình này có thể cung cấp cho các nhà nghiên cứu các khả năng để dự đốn chính xác động đất.

Dự báo động đất có thể được phân loại thành quá trình ngắn hạn và dài hạn. Dự báo ngắn hạn là rất phức tạp vì nó dự báo động đất trong vài ngày hoặc vài tuần trong số các lần xuất hiện của chúng. Do đó, nó phải chính xác và ít cảnh báo sai hơn được đánh giá cao. Nói chung là, các dự đốn ngắn hạn

<i><small>1</small> là q trình thêm thơng tin để giải quyết một bài toán giả định sai hoặc để ngăn chặn sự quá khớp. </i>

được sử dụng để sơ tán một khu vực trước một trận động đất. Mặt khác, các trận động đất dài hạn được dự đoán dựa trên các trận động đất đến định kỳ, mang theo một vài thơng tin. Tuy nhiên, họ có thể giúp thiết lập các tiêu chuẩn cho mã xây dựng và thiết kế thảm họa các kế hoạch ứng phó. Năm 2009, thành phố L’Aquila của Ý đã bị tấn công bởi một trận động đất 5,9 độ richter, cướp đi sinh mạng của 308 công dân. Tuy nhiên, ủy ban dự báo động đất của Ý dự đốn rằng sẽ khơng có thiệt hại, và họ đã không sơ tán khỏi thành phố. Dự đoán bị sai như vậy có thể dẫn đến cuộc thảm sát lớn cướp đi sinh mạng và gây thiệt hại cho rất nhiều cơ sở hạ tầng. Các nhà khoa học liên quan đến vụ việc đó đã bị phạt sáu năm tù [2].

Dựa trên cường độ của giá trị hồn chỉnh, các thơng số động đất cụ thể theo khu vực như thông số giá trị b là tính tốn. Các thuật toán chủ yếu dựa trên máy học (ML) tính tốn các chỉ số địa chấn như giá trị Gutenberg Richter, độ trễ thời gian, năng lượng động đất, cường độ trung bình, v.v. [3]. Thay vào đó, các mơ hình dựa trên học sâu (Deep Learning) có thể tính tốn hàng ngàn tính năng tinh vi của chính họ [4], [5].

Vì các mơ hình dựa trên ML và DL là hướng dữ liệu và chính động đất xảy ra trong một số trường hợp, rất khó để dự đoán chúng dựa trên dữ liệu lịch sử. Một số phương pháp dự đoán các trận động đất lớn bằng cách huấn luyện chúng một cách riêng biệt hoặc thêm vào có trọng lượng đối với họ, nhưng những mơ hình này cần nhiều cải tiến [6].

Hình 1 biểu thị các trận động đất xảy ra trên khắp thế giới từ tháng 1 năm 2019 đến tháng 12 năm 2019 với cường độ lớn hơn hoặc bằng 5 độ richter. Trong 12 tháng,

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

<b>Hình 1. Tổng hợp số trận động đất xảy ra trên toàn thế giới năm 2019 </b>

1637 trận động đất đã xảy ra trên khắp thế giới. Dữ liệu được thu thập từ Cơ quan Khảo sát Địa chất Hoa Kỳ và vẽ biểu đồ bằng phần mềm ArcGIS. Hình vng màu đỏ đại diện cho tâm chấn của trận động đất.

<b>2.3. Dữ liệu cho mô hình dự báo </b>

Chúng tơi lấy dữ liệu trực tuyến từ website: hquakes/feed/v1.0/csv.php trong 30 ngày

qua được cập nhật mỗi phút (Từ ngày 18 tháng 7 năm 2022 đến 17 tháng 8 năm 2022)

Giá trị đầu vào cho mơ hình từ tập dữ liệu có nhiều tính năng quan trọng cần xem xét như thời gian, vĩ độ & kinh độ, độ sâu của trận động đất, cường độ, địa điểm, phần cịn lại là các tính năng khơng hỗ trợ để phân loại.

<b>Hình 2. Các trận động đất xảy ra trên khắp thế giới từ tháng 18 tháng 7 năm 2022 đến 17 tháng 8 năm 2022 </b>

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

Vấn đề được giải quyết ở trên là về phân loại nhị phân, động đất xảy ra = 1 và động đất không xảy ra = 0 và với dự đoán này, chúng tôi cố gắng xác định vị trí các đồng dây tương ứng với dự đoán và hiển thị nó trên ứng dụng web api của google maps. Các số liệu phù hợp hơn cho các vấn đề phân tách nhị phân là ROC (Đặc tính của tốn tử bộ thu), AUC (Khu vực dưới đường cong), Ma trận nhầm lẫn cho Độ chính xác, thu hồi, độ chính xác và độ nhạy. Một điều quan trọng về việc lựa chọn số liệu và mơ hình là chúng ta cần chính xác những gì từ các dự đốn và những gì khơng. Nói một cách chính xác, chúng tôi cần giảm thiểu hoặc nhận ít hơn các dự đốn gọi là âm tính giả (có thể xảy động động đất với khả năng cao nhưng lại

cảnh báo là không xảy ra) vì chúng tơi khơng muốn mơ hình của mình dự đốn là 0 hoặc khơng có trận động đất nào xảy ra tại một địa điểm cụ thể trong khi thực tế nó đã thực sự xảy ra vì điều này nguy hiểm hơn trường hợp dự đốn trong đó dự đốn là true/1 hoặc động đất xảy ra nhưng thực tế thì khơng. Do đó, ngồi điểm số ROC_AUC, tơi cũng đã xem xét chỉ số Recall để đánh giá và lựa chọn mơ hình với điểm số ROC_AUC cao hơn, trong đó Recall = (TP / TP + FN<small>2</small>).

<b>2.4. Kết quả chạy mơ hình dự báo </b>

Chúng tôi xây dựng thêm một số thuộc tính từ các trường dữ liệu để làm xuất hiện tính xu thế và tính chu kì trong dữ liệu động đất. Các thuộc tính mới được thấy trong hình dưới đây:

<b>Hình 3. Tập dữ liệu được dùng để dự báo </b>

Sau khi xử lý trước với việc loại bỏ các giá trị null và kỹ thuật tính năng như đã thảo luận ở trên, chúng tôi đã thực hiện các thuật toán cho bài toán phân loại.

Bộ phân loại Adaboost với công cụ ước tính là Cơng cụ phân loại Quyết định, trình phân loại Adaboost với công cụ ước tính là

RandomForestClassifier và cuối cùng chúng đã sử dụng thuật tốn Xgboost.

Độ chính xác khơng phải là thước đo để sử dụng khi làm việc với một tập dữ liệu khơng cân bằng.

<i><small>2</small> Dương tính đúng (True Positive - TP), Âm tính sai (False Negative - FN) </i>

</div>

×