Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010
ỨNG DỤNG MÔ HÌNH ARIMA Đ D
BÁO VNINDEX
APPLICATION OF ARIMA MODEL TO FORECAST VNINDEX
SVTH: Bùi Quang Trung, Nguyễn Quang Minh Nhi,
Lê Văn Hiếu, Nguyễn Hồ Diệu Uyên
Lớp 33K15, Khoa Tài Chính – Ngân hàng, Tr ờng Đại học Kinh tế
GVHD: TS. Võ Thị Thúy Anh
Khoa Tài Chính – Ngân hàng, Tr ờng Đại học Kinh tế
TÓM TẮT
Thị trường chứng khoán trên thế giới nói chung và ở Việt Nam nói riêng luôn là nơi hấp
dẫn các tổ chức và cá nhân đầu tư bởi mức sinh lợi cao của nó. Tuy nhiên, đây cũng là một hoạt
động tiềm ẩn rất nhiều rủi ro. Vì thế, việc đưa ra dự báo xu hướng biến động của chỉ số giá chứng
khoán để có một sách lược phù hợp cho hoạt đầu tư của cá nhân, tổ chức thu hút rất nhiều sự
quan tâm của các nhà kinh tế lượng tài chính trong và ngoài nước. Đề tài này cung cấp cách thức
xây dựng mô hình ARIMA trong dự báo chỉ số VNIndex trên thị trường chứng khoán Việt Nam.
ABSTRACT
Stock markets around the world in general and in Vietnam in particular are always
attractive to investment institutions and individual investors because of its high level of profitability.
However, it is also an operation with a lot of potential risks. Thus, forecasting the trends of the
stock index to adapt a consistent investment strategy for individuals and organizations attracts the
attention of many financial specialists, both domestic and abroad. This research offers a method to
build the ARIMA model in forecasting the VN-Index on this local stock market.
1. Đặt vấn đ
Ra đời vào đầu năm 2000, thị tr ờng chứng khoán Việt Nam đư trở thành một kênh
đầu t hết sức hấp dẫn đối với các nhà đầu t , từ các tổ chức đầu t chuyên nghiệp cho đến
các nhà đầu t cá nhân nghiệp d nhỏ lẻ. Tuy nhiên, bên cạnh mức sinh lợi cao, đây cũng
là hoạt động luôn tồn tại nhiều rủi ro tiềm ẩn bởi nhà đầu t không phải lúc nào cũng dự
đoán đ ợc chính xác xu h ớng của giá cổ phiếu trong t ơng lai. Do đó, việc dự báo chính
xác sự biến động giá của cổ phiếu để có một sách l ợc nhằm phục vụ cho công việc kinh
doanh của các cá nhân, tổ chức hay hoạch định chiến l ợc của một quốc gia đư thu hút rất
nhiều sự quan tâm của các nhà kinh tế l ợng tài chính trong và ngoài n ớc.
Tại thị tr ờng Việt Nam, sự biến động của chỉ số VnIndex phản ánh rủi ro hệ
thống, vì vậy, việc dự báo đ ợc sự tăng giảm của Vn-Index cũng đồng thời giúp các nhà
đầu t nhận biết chiều h ớng biến động giá của các cổ phiếu trên thị tr ờng này.
Trong khuôn khổ đề tài, chúng tôi đề xuất sử dụng mô hình ARIεA và ph ơng
pháp Box-jenkins để dự báo chỉ số VnIndex trong ngắn hạn căn cứ vào chuỗi dữ liệu quá
khứ. George Box và Gwilym Jenkins (1976) đư nghiên cứu mô hình ARIεA
(Autoregressive Integrated Moving Average - Tự hồi qui tích hợp Trung bình tr ợt), và
tên của họ th ờng đ ợc dùng để gọi tên các quá trình ARIεA tổng quát, áp dụng vào việc
phân tích và dự báo các chuỗi thời gian. Ph ơng pháp Box-Jenkins với bốn b ớc: nhận
dạng mô hình thử nghiệm; ớc l ợng; kiểm định bằng chẩn đoán; và dự báo.
82
Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010
2. Xây d ng mô hình ARIMA cho VnIndex
2.1. Giới thiệu về số liệu
+ Nguồn cập nhật số liệu là trang web cophieu68.com. Đây là trang web chuyên
cung cấp số liệu về thị tr ờng chứng khoán Việt Nam.
+ Số liệu VnIndex đ ợc lấy từ ngày 2/1/2009 tới ngày 30/3/2010. Sở dĩ nhóm thực
hiện quyết định chọn chuỗi thời gian này vì VnIndex trong thời gian này phán ánh t ơng
đối tác động của nền kinh tế vĩ mô lên giá chứng khoán.
2.2. Cơ sở lý luận
Mô hình sử dụng dữ liệu chuỗi thời gian, xem giá trị trong quá khứ của một biến số
cụ thể là một chỉ tiêu tốt phản ánh giá trị trong t ơng lai của nó, cụ thể, cho Yt là giá trị của
biến số tại thời điểm t với Yt = f(Yt-1, Yt-2, ..., Y0, t).
εục đích của phân tích là để thấy rõ một số mối quan hệ giữa các giá trị Yt đ ợc
quan sát đến nay để cho phép chúng ta dự báo giá trị Yt trong t ơng lai. Ph ơng pháp này
đặc biệt hữu ích cho việc dự báo trong ngắn hạn.
εô hình tự hồi quy p - AR(p): trong mô hình tự hồi qui quá trình phụ thuộc vào
tổng trọng số của các giá trị quá khứ và số hạng nhiễu ngẫu nhiên
Yt = φ1Yt-1 + φ2Yt-2 + ...+φpYt-p +Ł +łt
εô hình trung bình tr ợt q – εA(q): trong mô hình trung bình tr ợt, quá trình
đ ợc mô tả hoàn toàn bằng tổng trọng số của các ngẫu nhiên hiện hành có độ trễ:
Yt = μ +łt −θ1łt-1 −θ2łt-2 −...−θqłt-q
εô Hình Hồi Quy Kết Hợp Trung Bình Tr ợt - ARMA(p,q):
Yt = φ1Yt-1 + φ2Yt-2 + ...+φpYt-p +Ł +łt − θ1łt-1 −θ2łt-2 −...−θqłt-q
2.2.1. Xem xỨt tính dừng c a chuỗi quan sát
Điều tr ớc tiên cần phải l u ý là hầu hết các chuỗi thời gian đều không dừng, và
các thành phần AR và εA của mô hình ARIεA chỉ liên quan đến các chuỗi thời gian
dừng. Quy trình ngẫu nhiên của Yt đ ợc xem là dừng nếu trung bình và ph ơng sai của
quá trình không thay đổi theo thời gian và giá đồng ph ơng sai giữa hai thời đoạn chỉ phụ
thuộc vào khoảng cách độ trễ về thời gian giữa các thời đoạn này chứ không phụ thuộc vào
thời điểm thực tế mà đồng ph ơng sai đ ợc tính. Do đó, để nhận diện mô hình ARIεA,
chúng ta phải thực hiện hai b ớc sau:
Có ba cách để nhận biết tính dừng của một chuỗi thời gian là dựa vào trên đồ thị
của chuỗi thời gian, đồ thị của hàm tự t ơng quan mẫu hay kiểm định Dickey – Fuller.
2.2.2. Nhận dạng mô hình
Nhận dạng mô hình ARεA(p,d,q) là tìm các giá trị thích hợp của p, d, q. Với d là
bậc sai phân của chuỗi thời gian đ ợc khảo sát, p là bậc tự hồi qui và q là bậc trung bình
tr ợt.
Việc xác định p và q sẽ phụ thuộc vào các đồ thị SPACF = f(t) và SACF = f(t). Với
SACF là hàm tự t ơng quan mẫu và SPACF là hàm tự t ơng quan mẫu riêng phần
(Sample Partial Autocorrelation):
83
Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010
+ Chọn giá trị của p nếu đồ thị SPACF có giá trị cao tại độ trễ 1, 2, ..., p và giảm
nhiều sau p và dạng hàm SAC giảm dần.
+ Chọn giá trị của q nếu đồ thị SACF có giá trị cao tại độ trễ 1, 2, ..., q và giảm
nhiều sau q và dạng hàm SPAC giảm dần.
2.2.3.
ớc l ợng các tham số c a mô hình
Các hệ số
và của mô hình ARIεA đ ợc xác định bằng ph ơng pháp ớc
l ợng thích hợp cực đại. Sau đó chúng ta kiểm định và bằng thống kê t. ớc l ợng sai
số bình ph ơng trung bình của phần d : S2
2.2.4. Kiểm định mô hình
Sau khi ớc l ợng các tham số của một mô hình ARIεA đ ợc nhận dạng thử,
chúng ta cần phải kiểm định để kiểm nghiệm rằng mô hình là thích hợp. Các cách thức để
thực hiện điều này:
Kiểm tra phần d et có phải là nhiễu trắng không. Nếu et là nhiễu trằng thì chấp
nhận mô hình, trong tr ờng hợp ng ợc lại chúng ta phải tiến hành lại từ đầu. Các kiểm
định có thể sử dụng là kiểm định BP (Box-Priere) hoặc kiểm định δjung-box với trị thống
kê Q, hoặc kiểm định δε.
Nếu tồn tại nhiều hơn một mô hình đúng, mô hình có AIC (Akaike Information
Criterion) nhỏ nhất sẽ đ ợc lựa chọn.
2.2.5. Dự báo bằng mô hình ARIMA
εột trong số các lý do về tính phổ biến của ph ơng pháp lập mô hình ARIεA là
thành công của nó trong dự báo. Trong một số tr ờng hợp dự báo thu đ ợc từ ph ơng pháp
này có tính tin cậy cao hơn so với các dự báo thu đ ợc từ các ph ơng pháp lập mô hình
kinh tế l ợng truyền thống khác, đặc biệt là đối với dự báo ngắn hạn.
Dựa vào mô hình ARIεA ớc l ợng đ ợc, tiến hành xác định giá trị dự báo và
khoảng tin cậy cho dự báo với độ tin cây 95% và k=1.96 nh sau:
+ Dự báo điểm Ŷt
+ Khoảng tin cậy Yˆt
k ( t ) Yˆt
Yˆt
k ( t)
2.2.6. Mô hình ARIMA cho VnIndex
700
.06
600
.04
.02
500
.00
400
-.02
300
-.04
200
-.06
2009M04
2009M07
2009M10
2010M01
2009M04
V N IN D E X
2009M07
2009M10
2010M01
R
Hình 1 – VNIndex
Hình 2 – Tỷ suất sinh lời R
84
Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010
Để xây dựng mô hình ARIεA nhóm chúng tôi đư sử dụng chuỗi dữ liệu gồm 310
quan sát từ ngày 2/1/2009 tới 30/3/2010. Dữ liệu quá khứ đ ợc đặt tên là Vnindex sau đó
đ ợc lấy logarit tự nhiên tr ớc khi lấy sai phân bậc nhất để có đ ợc tỷ suất lợi tức của
VnIndex, ký hiệu là r. Đồ thị Vnindex=f(t) và r=f(t) đ ợc trình bày ở hình 1 và hình 2.
Từ hình 2 và sử dụng kiểm định Dickey – Fuller cho P-value < 0.05 cho thấy chuỗi
R là chuỗi dừng.
Hình 3 – Đồ thị của hàm tự t ơng quan và tự t ơng quan riêng phần của chuỗi R
Để định dạng cho mô hình chúng ta sử dụng đồ thị tự t ơng quan và tự t ơng quan
riêng phần của chuỗi R. Theo đồ thị ở hình 3, tại k=1 SAC và PAC đạt cực đại 0.261 và
sau đó giảm mạnh xuống. Do đó p và q có thể nhận các giá trị là 1. Các mô hình ARIMA
có thể có là ARIεA (0,1,1), ARIεA(1,1,1), ARIεA(1,1,0)
Tr ớc tiên ta dùng kiểm định δB để chọn ra các mô hình có p-value bé hơn 0.05.
Dùng đồ thị SAC để kiểm tra chuỗi et thấy rằng cả 4 chuỗi et của 4 mô hình đề là nhiễu
trắng. Bây giờ cần lựa chọn mô hình tốt nhất để sử dụng cho công tác dự báo, chúng ta sử
dụng tiêu chuẩn kiểm định Chi bình ph ơng 2 (4) và tiêu chuẩn AIC. Theo kết qủa từ
eview cho bởi bảng 1 ta thấy mô hình ARIεA(0,1,1) là mô hình phù hợp với R nhất.
Mô hình
số quan sát
Arima(0,1,1)
476
0.129571
-4.976207
Arima(1,1,1)
476
0.104665
-4.966832
Arima(1,1,0)
476
0.061240
-4.964157
2
AIC
(4)
B ng 1 – Kết quả các thông số kiểm định
Dùng ph ơng pháp bình ph ơng bé nhất để ớc l ợng các tham số của mô hình.
Thực hiện ớc l ợng bằng Eview ta đ ợc mô hình ARIεA(0,1,1) có các hệ số nh sau:
85
Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010
rT = 0.001504 + 0.284364
T 1
2.3. Dự báo VNindex bằng mô hình xây dựng được
Sử dụng mô hình vừa xây dựng để dự báo điểm và khoảng tin cậy cho r tại thời
điểm ngày 31/3/2010 bằng phần mềm Eview với độ tin cậy 95%.
Kết quả thu đ ợc r =-0.1495% và khoảng tin cậy là [-0.444676%;0.145676%].
Trong b ớc đầu xử lý số liệu ta đư chuyển VnIndex thành tỷ suất sinh lời r thông qua việc
lấy logarit tự nhiên tr ớc khi lấy sai phân bậc nhất. Do đó từ kết quả này để quy ng ợc về
Vnindex chúng ta sử dụng công thức: VnIndext = er.VnIndext-1. Từ đó ta có dự báo điểm
và khoản tin cậy cho Vnindex ngày 31/3/2010 với mức tin cậy 95% là là: 499.952;
[498.46;501.43]
Giá trị Vnindex thực ngày 31/3/2010 là 499,2. Giá trị này nằm trong khoảng tin cậy
95% và xấp xỉ giá trị dự báo điểm là 499.952. Sai số dự báo là: 0.1506%.
3. Kết luận
Kết quả dự báo cho thấy giá trị dự báo xấp xỉ với giá trị thực tế và khoản tin cậy
95% cũng chứa giá trị thực tế. Điều này chứng tỏ độ tin cậy của mô hình dự báo là khá
cao. Trong một vài phiên giao dịch do tác động của các yếu tố ngoại lai lớn nh tâm lý nhà
đầu t , tác động của các thị tr ờng chứng khoán khác, thông tin về sự thay đổi chính
sách...sẽ làm cho sai số dự báo tăng cao hơn. Do đó kết quả của mô hình vẫn chỉ mang tính
chất tham khảo nhiều hơn. Tuy nhiên có thể nói mô hình ARIεA là một mô hình tốt để dự
báo trong ngắn hạn.
TÀI LIỆU THAM KH O
[1] John E.Hanke & Dean W.Wichern, (2005), Business Forecasting, 8th Edition, Chapter 9.
[2] Cao Hào Thi và các cộng sự (1998), Bản Dịch Kinh Tế δ ợng Cơ Sở (Basic
Econometrics của Gujarati D.N) Ch ơng trình giảng dạy kinh tế FulBright tại Việt Nam.
[3] Phùng Thanh Bình, H ớng dẫn sử dụng Eview trong phân thích dữ liệu và hồi quy.
[4] Nguyễn Thống (2000), Kinh Tế L ợng
Tp.Hồ Chí εinh, tr.238-278
ng Dụng, Nhà xuất bản Đại Học Quốc Gia
[5] Nguyễn Quang Dong (2006), Kinh Tế L ợng (ch ơng trình nâng cao), Nhà xuất bản
Khoa học và Kỹ thuật, Hà Nội, ch ơng 3-4-5.
86