Ứng dụng mô hình Arima dự báo sản lượng cà phê xuất khẩu của Việt Nam đến năm 2030
TCDN - Nghiên cứu sử dụng số liệu thống kê về sản lượng cà phê xuất khẩu của Việt Nam từ 2000 - 2019 và sử dụng phần mềm SPSS 20.0 để xây dựng mô hình dự báo ARIMA thích hợp cho dự báo sản lượng cà phê xuất khẩu của Việt Nam.
TÓM TẮT:
Nghiên cứu sử dụng số liệu thống kê về sản lượng cà phê xuất khẩu của Việt Nam từ 2000 - 2019 và sử dụng phần mềm SPSS 20.0 để xây dựng mô hình dự báo ARIMA thích hợp cho dự báo sản lượng cà phê xuất khẩu của Việt Nam. Kết quả cho thấy mô ARIMA (2,1,1) là mô hình phù hợp nhất trong ba mô hình thử nghiệm và có thể dùng để dự báo sản lượng cà phê xuất khẩu của Việt Nam. Trên cơ sở đó, tác giả đã tiến hành dự báo sản lượng xuất khẩu cà phê Việt Nam đến năm 2030.
1. Giới thiệu
Cà phê là một trong 10 sản phẩm chủ lực của Việt Nam được xuất khẩu sang 80 quốc gia và vùng lãnh thổ. Năm 2020 do ảnh hưởng của đại dịch Covid-19, nhu cầu cà phê trên thị trường thế giới sụt giảm, xuất khẩu cà phê Việt Nam thêm năm thứ hai mất kim ngạch xuất khẩu vượt 3 tỷ USD. Trong đó, Đức là thị trường tiêu thụ cà phê lớn nhất của Việt Nam chiếm 14,3% trong tổng khối lượng và chiếm 12,8% trong tổng kim ngạch xuất khẩu cà phê của cả nước, đạt 223.581 tấn, tương đương 350,41 triệu USD, giá trung bình 1.567 USD/tấn, giảm trên 4% cả về lượng và kim ngạch, nhưng tăng 0,4% về giá. Thị trường Đông Nam Á đứng thứ 2 về kim ngạch, đạt 160.997 tấn, tương đương 328,36 triệu USD, giảm 9,8% về lượng và giảm 8,6% kim ngạch. Tiếp theo là thị trường Mỹ đạt 142.482 tấn, tương đương 254,89 triệu USD, giảm 2,6% về lượng nhưng tăng 3,2% kim ngạch (Bộ Công thương, 2021).
Liên quan tới lĩnh vực xuất khẩu cà phê, một trong những yếu tố thuận lợi có thể nhìn thấy là đã tận dụng tốt hơn cơ hội từ FTA Việt Nam - EU (EVFTA) để thúc đẩy xuất khẩu. Theo Bộ Nông nghiệp và Phát triển nông thôn (NN&PTNT), việc thực thi Hiệp định EVFTA, EU đã xóa bỏ thuế cho toàn bộ cho các sản phẩm cà phê chưa rang hoặc đã rang (giảm từ 7 - 11% xuống 0%) và các loại cà phê chế biến từ giảm 9 - 12% xuống còn 0% vào thời điểm Hiệp định có hiệu lực. Đồng thời, trong số 39 chỉ dẫn địa lý của Việt Nam được EU cam kết bảo hộ khi EVFTA chính thức đi vào thực thi có chỉ dẫn địa lý về cà phê. Đây là lợi thế cạnh tranh và cơ hội rất lớn cho ngành cà phê Việt Nam tại thị trường EU.
Bên cạnh những thuận lợi, ngành cà phê Việt Nam còn phải đối mặt với rất nhiều khó khăn trên thị trường xuất khẩu do cà phê Việt Nam chịu nhiều biến động của thị trường cà phê thế giới, cơ cấu sản phẩm cà phê có giá trị gia tăng thấp, xuất khẩu cà phê nhân chiếm đại đa số và chế biến sâu chỉ mới đạt 12%, cũng như tình trạng thiếu container để xuất khẩu dẫn đến chi phí vận chuyển nhiều khả năng sẽ còn tăng trong thời gian tới đã ảnh hưởng không nhỏ tới xuất khẩu cà phê hiện tại. Ngoài ra, Việt Nam sẽ tiếp tục phải cạnh tranh với các quốc gia xuất khẩu khác đặc biệt là Brazil - nước sản xuất cà phê lớn nhất thế giới, cũng sẽ gây khó khăn không nhỏ cho xuất khẩu cà phê Việt Nam (Nguyễn Kiều Ly, 2021).
Mặt khác, nguy cơ tác động của biến đổi khí hậu, môi trường, dịch bệnh... trong bối cảnh hiện trên toàn thế giới làm dịch chuyển xu hướng đầu tư của các quốc gia chính là quay lại tập trung đầu tư cho phát triển nông nghiệp trong nước nhằm đảm bảo an ninh lương thực làm cho các mặt hàng nông sản Việt Nam phải cạnh tranh gay gắt trong xuất khẩu. Thêm vào đó, các nước nhập khẩu nông sản lớn của Việt Nam như Mỹ, EU, Trung Quốc, Nhật Bản, Hàn Quốc, Trung Quốc…đều gia tăng bảo hộ hàng hóa nông sản thông qua các tiêu chuẩn về quản lý chất lượng và an toàn vệ sinh thực phẩm, yêu cầu truy xuất nguồn gốc, điều này vừa là thách thức vừa là cơ hội cho sự đổi mới đối với các sản phẩm nông nghiệp của Việt Nam khi vươn ra thế giới, trong đó có sản phẩm cà phê. Chính vì vậy, dự báo sản lượng cà phê sản xuất và xuất khẩu là một trong những việc cần thiết cho phát triển kinh tế hàng hóa, đồng thời dựa vào kết quả dự báo sẽ là cơ sở để hoạch định chính sách đối với sản xuất nông nghiệp nói chung và cà phê nói riêng.
Hiện nay, đã có nhiều nghiên cứu thực nghiệm về dự báo sản lượng cây trồng được tiến hành nhiều nơi trên thế giới (Box and Jenkins, 1970; Sakamoto et al., 2015; Ramakrishna and Vijaya, 2017). Chẳng hạn, việc ứng dụng công nghệ GIS để dự báo năng suất và sản lượng lúa ở đồng bằng Sông Hồng đã được tiến hành (Dương Văn Khảm, 2006; Nguyễn Thị Hà 2008). Tuy nhiên, với công nghệ này cần nhiều số liệu về khí tượng, số liệu về năng suất sản lượng cây trồng qua các năm. Võ Văn Tài (2012) đã sử dụng các mô hình toán học khác nhau của hồi quy và chuỗi thời gian ARIMA để dự báo sản lượng lúa của Việt Nam. Tùy vào số liệu thống kê, các phương pháp dự báo đều có những ưu và nhược điểm. Theo Robert et al, (1979), mô hình ARIMA rất phù hợp đối với những quan hệ tuyến tính giữa dữ liệu hiện tại và dữ liệu quá khứ. Hơn nữa, với số liệu thống kê chi tiết theo từng tháng trong năm thì sẽ mô hình ARIMA sẽ dự báo chính xác hơn (Brockwell et al, 2001). Tương tự, tác giả Huỳnh Tấn Nguyên và Nguyễn Văn Lượng (2017), đã ứng dụng mô hình ARIMA để dự báo chỉ số giá tiêu dùng ở Việt Nam.Xuất phát từ thực tế đó, chúng tôi sử dụng phương pháp Box-Jenkins để xây dựng mô hình ARIMA (Autoregressive Integrated Moving Average) để dự báo sự biến động sản lượng cà phê xuất khẩu của Việt Nam đến năm 2030.
2. Phương pháp nghiên cứu
2.1. Thu thập và xử lý số liệu
Kết hợp cả phương pháp định tính và định lượng, với số liệu sản lượng cà phê xuất khẩu của Việt Nam phục vụ cho xây dựng mô hình được thu thập từ trang thống kê thông tin điện tử của Tổ chức Lương thực và Nông nghiệp Liên Hiệp Quốc (FAOSTAT). Cụ thể, là sản lượng cà phê nhân xuất khẩu của Việt Nam trong 20 năm từ năm 2000 đến năm 2019. Tác giả sử dụng SPSS 20 để chạy mô hình và phân tích dữ liệu.
2.2. Các bước thực hiện
Mô hình ARIMA (Autoregressive Integrated Moving Average) trong phân tích chuỗi thời gian được Box và Jenkins (1970) giới thiệu và được gọi là phương pháp BoxJenkins. Mô hình tự tương quan tích hợp với trung bình trượt ARIMA (p,d,q) có phương trình tổng quát sau:
Nhận dạng mô hình ARIMA (p,d,q) thích hợp là việc tìm các giá trị thích hợp của p, d và q (với d là bậc sai phân của chuỗi dữ liệu thời gian được khảo sát, p là bậc tự hồi quy và q là bậc trung bình trượt). Các giá trị này được xác định dựa vào biểu đồ tự tương quan (ACF) và biểu đồ tự tương quan riêng phần (PACF). Trong đó, việc lựa chọn mô hình AR(p) phụ thuộc vào biểu đồ PACF nếu nó có giá trị cao tại các độ trễ 1, 2,…, p và giảm đột ngột sau đó, đồng thời dạng hàm ACF tắt lịm dần.
Tương tự, việc lựa chọn mô hình MA(q) dựa vào biểu đồ ACF nếu nó có giá trị cao tại các độ trễ 1, 2,…,q và giảm mạnh sau q, đồng thời dạng hàm PACF tắt lịm dần.
Bước 2: Ước lượng các thông số của mô hình ARIMA (p,d,q)
Tiến hành ước lượng các tham số cho các mô hình có khả năng phù hợp đã được nhận dạng. Ở đây, mô hình có khả năng phù hợp đã được nhận dạng. Mô hình có hệ số xác định R2, tiêu chuẩn thông tin BIC (Bayesian Information Criterion) và sai số bình phương trung bình RMSE (Root Mean Square Error) nhỏ nhất được coi là mô hình phù hợp nhất. Bên cạnh đó, để đánh giá độ tin cậy của mô hình dự báo, nghiên cứu sử dụng chỉ số đánh giá độ chính xác của mô hình dự báo MAPE (Mean Absolute Percent Error). MAPE lớn hơn hoặc bằng 50% thì dự báo không chính xác; 20% - 50% là hợp lệ; 10% - 20% là dự báo tốt và dưới 10% là dự báo hoàn hảo.
Bước 3: Kiểm tra mô hình
Mô hình ước lượng sau đó phải được kiểm tra lại để đảm bảo tính đại diện cho chuỗi dữ liệu quan sát. Việc này sẽ được thực hiện trên dãy giá trị sai số của mô hình nhằm xác định xem chúng có phải là sai số ngẫu nhiên trắng (white noise) hay không? Ở đây biểu đồ ACF của phần dư sẽ cho phép kiểm tra tiêu chuẩn này.
Bước 4: Dự báo
Khi mô hình được kiểm chứng phù hợp với dữ liệu, các yếu tố xu thế sẽ đưa trở lại mô hình và thực hiện các dự báo điểm, dự báo khoảng tin cậy. Dựa trên phương trình của mô hình ARIMA ta tiến hành xác định khoảng tin cậy của dự báo.
3. Kết quả nghiên cứu
3.1. Tổng quan về dữ liệu nghiên cứu
Biểu đồ hình 2 cho thấy sự tăng trưởng về sản lượng cà phê xuất khẩu của Việt Nam sang thị trường các nước trên thế giới liên tục qua các năm, cao nhất là năm 2012 với 1.705.033 tấn, với diện tích trồng cà phê năm 2012 đạt 616.000 ha (Bộ nông nghiệp và phát triển nông thôn). Bên cạnh đó, Có thể thấy, từ năm 2011 đến 2019 sản lượng cà phê xuất khẩu của Việt Nam có xu hướng biến động theo đồ thị hàm sin, năm tăng năm giảm. Chuỗi dữ liệu sản lượng cà phê xuất khẩu của Việt Nam có các giá trị Skewness, Kurtosis thấp, chứng tỏ rằng chuỗi biến động không nhiều và có xu hướng lệch trái (bảng 1).
3.2. Mô hình dự báo sản lượng cà phê xuất khẩu
Kiểm tra tính dừng của chuỗi dữ liệu cà phê xuất khẩu
Chuỗi dữ liệu sử dụng trong ARIMA được giả định là chuỗi dừng. Vì vậy, cần phải xem xét chuỗi dữ liệu nghiên cứu có dừng hay chưa. Kiểm tra tính dừng thông qua 2 kiểm định phổ biến: Augmented Dicjkey-Fuller (ADF) và Perron-Phillips (PP) được gọi là kiểm định nghiệm đơn vị (unit root test). Qua đồ thị hình 3 cho thấy đồ thị có chiều hướng đi lên, nghĩa là chuỗi dữ liệu có nghiệm đơn vị, chuỗi không dừng. Vì vậy cần tiến hành sai phân chuỗi dữ liệu.
Lấy sai phân cấp 1 của chuỗi số liệu sản lượng cà phê xuất khẩu ta được chuỗi mới và tiến hành kiểm tra tính dừng của chuỗi này. Chuỗi số liệu sau khi lấy sai phân có đồ thị như hình 4. Sau đó kiểm tra tính dừng thông qua 2 kiểm định là Augmented Dicjkey-Fuller (ADF) và Perron-Phillips (PP) cho chuỗi số sản lượng cà phê, kết quả cho thấy chuỗi sai phân bậc 1 sản lượng cà phê xuất khẩu của Việt Nam là chuỗi dừng. Để xây dựng mô hình ARIMA sử dụng chuỗi dữ liệu 20 quan sát từ 2000 đến năm 2019 được thu thập trên số liệu thống kê của Tổ chức Lương thực và Nông nghiệp Liên Hiệp Quốc (FAOSTAT).
Xây dựng mô hình ARIMA cho sản lượng cà phê xuất khẩu của Việt Nam
Bước 1: Nhận dạng mô hình (xác định các giá trị p, d, q)
Chuỗi dữ liệu dừng ở sai phân bậc 1, ta có d = 1. Các giá trị p, q được xác định dựa vào hệ số tự tương quan (ACF) và hệ số tự tương quan riêng phần (PACF). Theo kết quả hình 5 và 6 cho thấy từ đồ thị ACF chỉ có ba cột cao qua giới hạn nên q = 1, 2 và 3 và đồ thị PACF có một cột cao qua giới hạn nên p = 1.
Đồ thị tự tương quan ACF và tự tương quan riêng phần PACF của chuỗi dữ liệu cà phê xuất khẩu của Việt Nam có dạng:
Bước 2: Ước lượng mô hình
Từ kết quả đồ thị tự tương quan ACF (hình 5) và tự tương quan riêng phần PACF (hình 6) sử dụng hệ số tự tương quan ACF để chọn bậc q cho MA và sử dụng hệ số tương quan riêng phần PACF để chọn bậc p cho AR, ta sẽ xét các mô hình sau: ARIMA (1, 1, 1); ARIMA (2, 1, 1) và ARIMA (3, 1, 1).
Bước 3: Kiểm tra mô hình
Các mô hình đã nhận dạng được kiểm tra lại tính phù hợp dựa trên các thông số kiểm định: hệ số xác định R2, tiêu chuẩn thông tin BIC (Bayesian Information Criterion), sai số bình phương trung bình RMSE và chỉ số đánh giá độ chính xác của mô hình dự báo MAPE (Mean Absolute Percent Error) để dự báo.
Từ kết quả bảng 3 cho thấy mô hình ARIMA (2, 1, 1) là mô hình thõa mãn nhiều nhất các tiêu chuẩn sử dụng và có các ước lượng của tham số có ý nghĩa thống kê (với Sig. < 0,05). Do đó mô hình ARIMA (2, 1, 1) là mô hình thích hợp và có thể dự báo, với chỉ số đánh giá độ chính xác của mô hình dự báo MAPE = 8,465 % < 10% nghĩa là mô hình dự báo hoàn hảo. Những dự báo về sản lượng cà phê xuất khẩu của Việt Nam dựa trên mô hình ARIMA được trình bày ở bước 4.
Bước 4: Dự báo
Bảng 4 trình bày kết quả dự báo sản lượng cà phê xuất khẩu của Việt Nam từ năm 2020 đến năm 2030 với độ tin cậy 95%. Hình 7 dự báo sản lượng cà phê xuất khẩu của Việt Nam phạm vi trong và ngoài mẫu nghiên cứu. Từ bảng 4 và hình 7 cho thấy sản lượng cà phê xuất khẩu của Việt Nam dự báo có xu hướng tăng phù hợp với tình hình các tỉnh có diện tích trồng cà phê trên cả nước, đặc biệt là vùng Tây Nguyên với diện tích chiếm trên 90% tổng diện tích cà phê cả nước đang tái cơ cấu nông nghiệp theo hướng nâng cao giá trị gia tăng, ổn định diện tích sản xuất, tái canh vườn già cỗi và phát triển bền vững ứng dụng công nghệ tăng năng suất cây trồng. Trong đó, công tác giống được chú trọng nhằm thích ứng với sự biến động của khí hậu, mang lại năng suất và hiệu quả bền vững trong sản xuất. Bên cạnh đó, việc thực thi Hiệp định EVFTA sẽ là cơ hội lớn cho xuất khẩu cà phê của Việt Nam vào thị trường các nước EU - nơi chiếm thị phần cà phê nhập khẩu của Việt Nam rất lớn.
Đồng thời, Theo Báo cáo xuất nhập khẩu Việt Nam 2020 của Bộ Công Thuơng, kim ngạch xuất khẩu cà phê của Việt Nam đạt khoảng 2,74 tỷ USD, với lượng xuất khẩu đạt khoảng 1,570 triệu tấn và do ảnh hưởng của đại dịch Covid khiến việc xuất khẩu cà phê gặp nhiều khó khăn nhất là khâu vận chuyển lưu thông. Vì vậy, các doanh nghiệp Việt Nam trong ngành cà phê đã tìm cách tăng tiêu thụ tại thị trường trong nước và coi đây là giải pháp vượt qua lúc gian khó. So với kết quả dự báo từ mô hình ARIMA là 1,696 triệu tấn trong điều kiện bình thường có sự chênh lệch (+126).
Bên cạnh đó, theo Viện Chính sách và Chiến lược phát triển nông nghiệp nông thôn cho biết, xuất khẩu cà phê của Việt Nam trong 10 tháng năm 2021 đạt 1.286 tấn, trị giá 2,45 tỷ USD cộng với nhận định của Hiệp hội Cà phê - Ca cao Việt Nam xuất khẩu cà phê tháng tháng 11 và 12/2021, mỗi tháng sẽ đạt khoảng 130 nghìn tấn. Như vậy, tổng sản lượng xuất khẩu cà phê của Việt Nam ước tình thực tế của năm 2021 khoảng 1,546 triệu tấn giảm khoảng 15% so với niên vụ 2019- 2020 vì do hạn hán đợt tháng 5,6 và mưa lũ tháng 10. Trong khi đó, số liệu dự báo từ mô hình ARIMA là 1,597, chênh lệch: (+0.051). Điều này cho thấy, kết quả dự báo từ mô hình có sự chênh lệch thấp, tương đối gần với dữ liệu thực tế.
4. Kết luận
Ứng dụng mô hình ARIMA dự báo sản lượng cà phê xuất khẩu của Việt Nam đến năm 2030, kết quả cho thấy mô hình ARIMA (2,1,1) là mô hình thõa mãn nhiều nhất các tiêu chuẩn sử dụng và có các ước lượng của tham số có ý nghĩa thống kê (với Sig. < 0,05) và tiêu chuẩn thông tin BIC nhỏ nhất với chỉ số đánh giá độ chính xác của mô hình dự báo MAPE đạt 8,465% < 10%. Mô hình ARIMA (2, 1, 1) là mô hình phù hợp nhất trong ba mô hình thử nghiệm và có thể dùng để dự báo sản lượng cà phê xuất khẩu của Việt Nam sang thị trường các nước trên thế giới trong những năm tới.
Hơn nữa, Chiến lược xuất nhập khẩu hàng hóa thời kỳ 2021-2030 (Bộ công thương, dự thảo lần 3), đối với ngành cà phê: Giai đoạn 2021-2025, tập trung nâng cao giá trị gia tăng cho sản phẩm xuất khẩu thông qua việc nâng cao hàm lượng chế biến, đẩy mạnh đầu tư công nghệ chế biến từ cà phê thô sang cà phê thành phẩm. Tiếp tục đẩy mạnh xuất khẩu sang các thị trường chính như Đức, Hoa Kỳ, Italia, Tây Ban Nha, Nhật Bản. Giai đoạn đến năm 2030, đa dạng hóa mặt hàng cà phê xuất khẩu (cà phê Robusta, Arabica, Excelsa...), chú trọng các sản phẩm cà phê chế biến có giá trị gia tăng cao, xây dựng thương hiệu cà phê xuất khẩu của Việt Nam và giảm xuất khẩu qua trung gian. Tăng cường xuất khẩu sang các thị trường có tiềm năng như Nga, Bỉ, Algeria, Anh, Malaysia, Thái Lan, Pháp, Hàn Quốc, Ấn Độ... và các thị trường đã có FTA, tìm kiếm các thị trường mới và hướng tới mục tiêu xuất khẩu 6 tỷ USD vào năm 2030.
Như vậy, với kết quả từ mô hình ARIMA (2, 1, 1) dự báo về sản lượng xuất khẩu cà phê đến năm 2030, có thể làm tài liệu tham khảo thêm cho các đơn vị quản lý, cách nhà hoạch định chính sách, các doanh nghiệp thực hiện các định hướng, chiến lược cũng như đề xuất các giải pháp, khuyến nghị về phát triển các vùng sản xuất cà phê trên cả nước, đặc biệt là ứng dụng công nghệ cao trong sản xuất góp phần tăng năng suất, phát triển bền vững trong tương lai.
Tuy nhiên, nghiên cứu này còn một số hạn chế đó là chưa so sánh kết quả dự báo với một số mô hình khác như: Mô hình chuỗi thời gian mờ, mô hình dự báo Xám… những hạn chế này sẽ được chúng tôi quan tâm khắc phục trong các nghiên cứu tiếp theo.
TÀI LIỆU THAM KHẢO:
1. Box, G. E. P., & Jenkins, G. (1970). Time Series Analysis, Forecasting and Control. San Francisco: Holden-Day.
2. P. J. Brockwell and R. A. Davis (2001). Introduction to Time Series and Forecasting. 2rd ed., New York: Springer Link, pp. 180-196
3. Ramakrishna, G., Vijaya, K. R. (2017). ARIMA model for forecasting of rice production in India by Sas. International Journal of Applied Mathematics & Statistical Sciences (IJAMSS), 6(4), 67-72.
4. Sakamoto, T., Masayuki Yokozawa, Hitoshi Toritani, Michio Shibayama, Naoki Ishitsuka, Hiroyuki Ohno (2005). A crop phenology detection method using timeseries MODIS data. Remote Sensing of Environment, 96, 366-374.
5. Võ Văn Tài (2012). Dự báo sản lượng lúa Việt Nam bằng các mô hình toán học. Tạp chí Khoa học, Trường Đại học Cần Thơ, 23b, 125-134.
6. Tổ chức Lương thực và Nông nghiệp Liên Hiệp Quốc (FAOSTAT). http://www.fao.org/faostat/en/#data/TCL
7. Nguyễn Thị Hà (2008). Nghiên cứu dự báo năng suất ngô, đậu tương, lạc và xây dựng quy trình giám sát khí tượng nông nghiệp cho 4 cây trồng chính (lúa, ngô, lạc, đậu tương) bằng thông tin mặt đất ở Việt Nam. Báo cáo tổng kết đề tài nghiên cứu khoa học và công nghệ cấp bộ, Viện Khoa học Khí tượng Thủy văn và Môi trường Hà Nội.
ThS. Trần Quốc Hùng - ThS. Bùi Thị Thu Vĩ
Phân hiệu Đại học Đà Nẵng tại Kon Tum
email: [email protected], hotline: 086 508 6899