Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán

Bài báo đề xuất phương pháp kết hợp kỹ thuật hồi quy nhiều biến và kỹ thuật phân tích thành phần chính (PCA) trên

tập các biến dữ liệu giao dịch cố phiếu có tương quan mẫu cao với chỉ số thị trường chứng khoán để xây dựng mô hình dự báo chỉ

số thị trường chứng khoán. Việc thực hành xây dựng mô hình dự báo được thực hiện trên dữ liệu thực theo ngày của sàn giao dịch

chứng khoán thành phố Hồ Chí Minh từ đầu năm 2010 đến nay. Kết quả dự báo bằng mô hình được xây dựng cho thấy triển vọng

tốt của phương pháp được đề xuất trong dự báo chỉ số thị trường chứng khoán cũng như nhiều chỉ số kinh tế - xã hội khác.

Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán trang 1

Trang 1

Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán trang 2

Trang 2

Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán trang 3

Trang 3

Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán trang 4

Trang 4

Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán trang 5

Trang 5

Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán trang 6

Trang 6

Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán trang 7

Trang 7

Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán trang 8

Trang 8

Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán trang 9

Trang 9

pdf 9 trang viethung 9380
Bạn đang xem tài liệu "Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán

Mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán
Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX “Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR'9)”; Cần Thơ, ngày 4-5/8/2016 
DOI: 10.15625/vap.2016.00037 
MÔ HÌNH DỰ BÁO TẦN SUẤT CAO ĐỐI VỚI CHỈ SỐ 
THỊ TRƯỜNG CHỨNG KHOÁN 
Đỗ Văn Thành1 và Nguyễn Minh Hải2 
1
Khoa Công nghệ thông tin, Trường Đại học Nguyễn Tất Thành 
2Khoa cơ bản, Trường Đại học Công nghiệp, Thành phố Hồ Chí Minh 
dvthanh@ntt.edu.vn, nguyenminhhaidhcn@gmail.com. 
TÓM TẮT — Bài báo đề xuất phương pháp kết hợp kỹ thuật hồi quy nhiều biến và kỹ thuật phân tích thành phần chính (PCA) trên 
tập các biến dữ liệu giao dịch cố phiếu có tương quan mẫu cao với chỉ số thị trường chứng khoán để xây dựng mô hình dự báo chỉ 
số thị trường chứng khoán. Việc thực hành xây dựng mô hình dự báo được thực hiện trên dữ liệu thực theo ngày của sàn giao dịch 
chứng khoán thành phố Hồ Chí Minh từ đầu năm 2010 đến nay. Kết quả dự báo bằng mô hình được xây dựng cho thấy triển vọng 
tốt của phương pháp được đề xuất trong dự báo chỉ số thị trường chứng khoán cũng như nhiều chỉ số kinh tế - xã hội khác. 
Từ khóa— Mô hình dự báo, chỉ số thị trường chứng khoán, phân tích thành phần chính, tần suất cao. 
I. GIỚI THIỆU 
Dự báo thị trường chứng khoán là vấn đề luôn được cộng đồng quốc tế quan tâm. Dự báo thị trường chứng 
khoán bao gồm 2 nội dung chính là dự báo chỉ số thị trường chứng khoán (nói gọn là chỉ số thị trường chứng khoán) và 
dự báo giá của các biến dữ liệu giao dịch cổ phiếu trên thị trường [9]. 
Hiện đã có hàng trăm bài báo nghiên cứu đề xuất các cách tiếp cận kỹ thuật dự báo thị trường chứng khoán. Đã 
có một số nghiên cứu điều tra và tổng quan tương đối có hệ thống về các kỹ thuật dự báo thị trưởng chứng khoán [9]. 
Theo đó các cách tiếp cận kỹ thuật dự báo thị trường chứng khoán đã được phân loại và được giới thiệu trong [3, 9]. 
Một số kỹ thuật dự báo thị trường chứng khoán được nghiên cứu nhiều trong vài năm gần đây cũng đã được giới thiệu 
trong [3], trong đó có kỹ thuật phân tích thành phần chính (PCA) [1-2, 5, 7, 10-14]. Những phương pháp kết hợp sử 
dụng kỹ thuật PCA với một hoặc một vài kỹ thuật khai phá dữ liệu khác như phương pháp học máy véc tơ hỗ trợ, giải 
thuật di truyền, mạng nơtron, trong phân tích và dự báo thị trường chứng khoán đang được quan tâm nghiên cứu ứng 
dụng [1, 4, 11-12, 14]. 
PCA là kỹ thuật được sử dụng để làm đơn giản hóa một tập dữ liệu phức tạp thành một tập dữ liệu nhỏ hơn và 
có thể hiểu dễ dàng hơn [6]. PCA khác với các kỹ thuật hồi qui nhiều biến ở chỗ các kỹ thuật hồi qui nhiều biến tập 
trung vào các suy luận thống kê hoặc xây dựng mô hình để giải thích hoặc dự báo mối quan hệ giữa các biến. PCA tóm 
lược các tập dữ liệu lớn và phức tạp bằng cách tạo ra các biến mới là tổ hợp tuyến tính có trọng số của các biến ban 
đầu. Mỗi biến mới được gọi là thành phần chính sẽ không tương quan với các thành phần chính khác. 
Với việc làm giảm số chiều các biến, PCA rất hữu ích trong phân tích thống kê nhiều biến. Các thành phần 
chính là dữ liệu tần suất cao nên mô hình dự báo có các biến giải thích là các thành phần chính được gọi là mô hình dự 
báo tần suất cao [4]. Hầu hết các mô hình dự báo kinh tế được giới thiệu trong [5] là được phát triển ở một số nước có 
trình độ khoa học phát triển trong những năm gần đây đều là những mô hình dự báo được xây dựng bằng phương pháp 
hồi quy nhiều biến trên tập các biến giải thích là các thành phần chính của tập biến gốc và chúng đều là những mô hình 
dự báo tần suất cao [1, 4, 11-12]. 
 Các công trình nghiên cứu trong [5] là những gợi ý quan trọng cho nghiên cứu bài báo này. Mục đích của bài 
báo này là đề xuất phương pháp xây dựng mô hình dự báo chỉ số thị trường chứng khoán bằng sử dụng phương pháp 
hồi qui nhiều biến, ở đó các biến giải thích là các thành phần chính của tập biến dữ liệu ban đầu. Các thành phần chính 
được lựa chọn sao cho nắm bắt được những thay đổi nhiều nhất như có thể của tập dữ liệu gốc. Do các biến mới là các 
thành phần chính nên trong mô hình dự báo sẽ không còn hiện tượng đa cộng tuyến và việc giải thích các yếu tố tác 
động thực sự đến thay đổi của chỉ số thị trường chứng khoán sẽ dễ dàng và chuẩn xác hơn. Nói ngắn gọn bài báo này sẽ 
kết hợp kỹ thuật phân tích hồi qui nhiều biến và kỹ thuật PCA nhiều biến trong việc dự báo chỉ số thị trường chứng 
khoán. Khác với hầu hết các nghiên cứu dự báo về thị trường chứng khoán bằng sử dụng các kỹ thuật khai phá dữ liệu 
trước đây, phương pháp dự báo này sẽ chú trọng đưa ra kết quả dự báo cụ thể chứ không đơn thuần chỉ là dự báo xu thế 
của thị trường. 
Việc thực hành xây dựng mô hình dự báo chỉ số thị trường chứng khoán theo phương pháp được đề xuất sẽ 
được thực hiện trên tập dữ liệu thực của sàn giao dịch chứng khoán Thành phố Hồ Chí Minh. 
Bài báo được cấu trúc thành 5 mục. Mục 2 tiếp theo sẽ giới thiệu một số công trình nghiên cứu liên quan. Mục 3 
sẽ trình bày phương pháp xây dựng mô hình dự báo tần suất cao đối với chỉ số thị trường chứng khoán. Mục 4 sẽ trình 
bày kết quả xây dựng mô hình dự báo chỉ số thị trường chứng khoán theo phương pháp được đề xuất trên tập dữ liệu 
thực tế theo tần suất ngày của sàn giao dịch chứng khoán Thành phố Hồ Chí Minh. Việc đánh giá chất lượng dự báo 
của mô hình cũng được thực hiện trong Mục này và Mục 5, cuối cùng, sẽ trình bày một số kết luận. 
300 MÔ HÌNH DỰ BÁO TẦN SUẤT CAO ĐỐI VỚI CHỈ SỐ THỊ TRƯỜNG CHỨNG KHOÁN 
II. NHỮNG NGHIÊN CỨU LIÊN QUAN 
Trong mục này sẽ tổng quan một số công trình nghiên cứu có sử dụng kỹ thuật PCA trong phân tích và xây 
dựng mô hình dự báo thị trường chứng khoán trong những năm gần đây. 
Wang Yansshan [14] đã sử dụng kết hợp kỹ thuật học máy véc tơ hỗ trợ và kỹ thuật PCA để làm giảm các điểm 
dữ liệu thành hai thành phần và quan sát thấy rằng có thể hình thành một cụm các cổ phiếu cùng thay đổi bằng việc sử 
dụng các thành phần được tạo ra từ PCA khi nghiên cứu dự báo chỉ số giá cổ phiếu tổng hợp KOSPI của Hàn Quốc và 
chỉ số thị trường chứng khoán Hangseng (HS ... g quan mẫu cao với VNINDEX 
Bƣớc 2: Tính toán và lựa chọn thành phần chính đại diện cho tập dữ liệu gốc 
Trước hết xây dựng ma trận tương quan R của 25 biến dữ liệu được nêu trong Bảng 1. Mỗi phần tử của R là hệ 
số tương quan mẫu giữa 2 biến bất kỳ trong 25 biến dữ liệu giao dịch cổ phiếu được chọn. Do đó R là ma trận vuông 
đối xứng cấp 25x25 và RRT là dạng toàn phương xác định dương nên giá trị riêng của ma trận R sẽ là số dương. 
Đồ thị về các giá trị riêng của ma trận R được trình bày trong Hình 2 ở dưới. Theo đó có 5 giá trị riêng có giá trị 
lớn hơn 1, còn lại nhỏ hơn 1. Theo [6], điều đó hàm ý rằng có thể chọn ít nhất 5 thành phần chính để nghiên cứu cấu 
trúc của tập dữ liệu gốc cũng như làm các biến giải thích trong phân tích hồi qui nhiều biến trên tập dữ liệu gốc. 
Hình 2. Đồ thị các giá trị riêng được sắp thứ tự của ma trận tương quan R 
304 MÔ HÌNH DỰ BÁO TẦN SUẤT CAO ĐỐI VỚI CHỈ SỐ THỊ TRƯỜNG CHỨNG KHOÁN 
Phân tích cụ thể và chi tiết hơn về các giá trị riêng ta sẽ thấy, ma trận R có 25 giá trị riêng. Tổng các giá trị riêng 
là 25. Giá trị riêng lớn nhất là 8.9921, giá trị riêng thứ 2 là: 2.0265. Giá trị riêng thứ nhất lớn hơn giá trị riêng thứ 2 là 
6.9656. Tỷ lệ của giá trị riêng thứ nhất trên tổng các giá trị riêng là 0.3597 hàm ý rằng thành phần chính ứng với giá trị 
riêng này phản ánh được 35.97% sự thay đổi của tập dữ liệu gốc. Trong khi đó tỷ lệ giá trị riêng thứ 2 trên tổng các giá 
trị riêng là 0.0811 và thành phần chính ứng với giá trị riêng thứ 2 phản ánh được 8.11% sự thay đổi của tập dữ liệu gốc. 
Tỷ lệ của tổng hai giá trị riêng đầu tiên trên tổng các giá trị riêng (được gọi là giá trị tích lũy) là 11.0187 và tỷ lệ tích 
lũy của nó thể hiện hai thành phần chính đầu tiên phản ánh được bao nhiêu % sự thay đổi của tập dữ liệu gốc. Trong 
trường hợp này là 44.07%. 
Như vậy ta có thể thấy 8 thành phần chính tương ứng với 8 giá trị riêng đầu tiên phản ánh được 70.28% sự thay 
đổi của tập dữ liệu gốc. Một số nhà nghiên cứu khác cho rằng [6] việc lựa chọn số thành phần chính cần sao cho nó 
phản ánh được từ 70% đến 90% những thay đổi của tập dữ liệu gốc. 
Kết hợp hai gợi ý về lựa chọn số thành phần chính thay thế cho tập dữ liệu gốc trong [6], bài báo này đề xuất sử 
dụng 8 thành phần chính làm biến giải thích trong mô hình dự báo chỉ số thị trường chứng khoán VNINDEX. 
Số giá trị riêng: 25. 
Số thứ tự 
Giá trị 
riêng 
Chênh lệch giữa 2 
giá trị riêng 
Tỷ lệ trên tổng 
giá trị riêng 
Giá trị riêng 
tích lũy Tỷ lệ tích lũy 
1 8.992132 6.965577 0.3597 8.992132 0.3597 
2 2.026554 0.488001 0.0811 11.01869 0.4407 
3 1.538553 0.212911 0.0615 12.55724 0.5023 
4 1.325642 0.300307 0.0530 13.88288 0.5553 
5 1.025336 0.027213 0.0410 14.90822 0.5963 
6 0.998123 0.122096 0.0399 15.90634 0.6363 
7 0.876027 0.088688 0.0350 16.78237 0.6713 
8 0.787339 0.098074 0.0315 17.56971 0.7028 
9 0.689266 0.040528 0.0276 18.25897 0.7304 
10 0.648738 0.056668 0.0259 18.90771 0.7563 
11 0.592070 0.021553 0.0237 19.49978 0.7800 
12 0.570516 0.019259 0.0228 20.07030 0.8028 
13 0.551257 0.021945 0.0221 20.62155 0.8249 
14 0.529312 0.075979 0.0212 21.15087 0.8460 
15 0.453333 0.017841 0.0181 21.60420 0.8642 
16 0.435492 0.010644 0.0174 22.03969 0.8816 
17 0.424848 0.024578 0.0170 22.46454 0.8986 
18 0.400270 0.015855 0.0160 22.86481 0.9146 
19 0.384414 0.028449 0.0154 23.24922 0.9300 
20 0.355966 0.032409 0.0142 23.60519 0.9442 
21 0.323556 0.013374 0.0129 23.92874 0.9571 
22 0.310182 0.032247 0.0124 24.23893 0.9696 
23 0.277935 0.024296 0.0111 24.51686 0.9807 
24 0.253640 0.024141 0.0101 24.77050 0.9908 
25 0.229499 --- 0.0092 25.00000 1.0000 
Bảng 2. Các giá trị riêng và mức độ phản ánh sự thay đổi của tập dữ liệu gốc 
Bảng 3 bao gồm 8 véc tơ riêng tương ứng với 8 giá trị riêng đầu tiên. Mỗi véc tơ riêng trở thành trọng số của 
thành phần chính tương ứng. 
Thực hiện chuẩn hóa 25 biến dữ liệu giao dịch cổ phiếu (25 cột trong ma trận A) theo công thức (2) và thực hiện 
tính toán 8 thành phần chính PC1, PC2, , PC8 theo công thức (1) với các véc tơ trọng số được cho tương ứng với các 
thành phần chính (Bảng 3) ta sẽ nhận được 8 thành phần chính đầu tiên. Các thành phần khi đó đã được sắp thứ tự theo 
độ lớn của các giá trị riêng của chúng. 
Mã cổ 
phiếu PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 
DLG 0.23 -0.10 -0.18 -0.06 -0.23 0.30 -0.05 -0.02 
DXG 0.24 -0.04 -0.05 0.10 -0.15 0.09 0.00 0.28 
FLC 0.26 0.05 -0.04 -0.14 -0.03 -0.04 0.07 -0.31 
FPT 0.21 -0.01 0.19 0.32 -0.22 -0.02 0.19 -0.02 
HAG 0.21 0.15 0.22 0.09 0.09 -0.11 -0.33 0.17 
HAR 0.21 0.15 -0.03 -0.30 -0.14 -0.08 -0.47 -0.06 
Đỗ Văn Thành, Nguyễn Minh Hải 305 
Mã cổ 
phiếu PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 
HCM 0.23 0.05 0.11 0.36 0.03 -0.18 0.07 0.08 
HHS 0.18 -0.23 -0.28 0.06 -0.12 0.36 0.11 0.14 
HPG 0.20 -0.02 0.02 0.42 0.12 0.08 -0.11 0.02 
HQC 0.23 0.15 0.15 0.00 -0.30 0.07 -0.15 -0.28 
HT1 0.21 0.12 0.13 0.08 -0.13 -0.11 0.12 -0.53 
HVG 0.24 0.07 0.09 -0.18 0.36 -0.13 0.20 0.15 
IDI 0.23 0.13 0.00 -0.26 0.15 0.20 0.21 0.01 
MHC 0.21 -0.15 -0.06 -0.04 0.15 0.21 0.08 0.06 
PVD 0.24 -0.01 -0.03 -0.02 0.16 -0.01 0.06 0.00 
PXS 0.25 0.10 0.07 -0.17 0.21 -0.07 0.38 -0.06 
TCM 0.24 -0.06 0.11 0.20 -0.03 -0.24 0.11 0.23 
TTF 0.22 -0.07 -0.14 0.14 0.00 0.18 -0.30 0.16 
VHG 0.24 -0.03 -0.08 -0.36 0.17 0.04 -0.17 0.12 
BMC -0.08 0.52 -0.16 0.14 0.04 0.24 0.09 0.11 
CLG -0.04 0.18 0.51 -0.23 -0.25 -0.01 0.01 0.46 
LCM -0.04 0.49 0.17 0.06 0.02 0.43 -0.06 -0.08 
PNJ -0.09 -0.13 0.33 0.17 0.59 0.28 -0.25 -0.17 
VMD -0.09 -0.26 0.40 -0.08 -0.18 0.42 0.27 -0.01 
VPK -0.09 0.40 -0.34 0.11 0.04 0.00 0.19 0.13 
Bảng 3. Các véc tơ riêng tương ứng với 8 giá trị riêng đầu tiên 
Bƣớc 3: Xây dựng mô hình dự báo tần suất cao 
Thực hiện kiểm định Dickey – Fuller tăng cường về nghiệm đơn vị của biến VNINDEX và các thành phần 
chính ta thấy VNINDEX dừng sai phân bậc 1, còn tất các các thành phần chính PC1, PC2,, PC8 đều là chuỗi dừng. 
Do đó ta có thể hồi qui sai phân bậc 1 của VNINDEX theo 8 thành phần chính đầu tiên. 
 Chia tập số gốc thành 2 tập, tập thứ nhất gồm dữ liệu giao dịch từ các ngày 04/1/2010 đến 22/4/2016, tức có 
1567 quan sát, tập thứ 2 gồm dữ liệu giao dịch của các ngày từ 25/4/2016 đến các ngày 05/5/2016, gồm 7 quan sát. 
Thực hiện quá trình lặp phép hồi qui VNINDEX theo các biến PC1, PC2, , PC8 trên tập dữ liệu thứ nhất dựa 
theo công thức (3) bằng cách loại trừ dần các biến mà hệ số ước lượng của nó không có ý nghĩa thông kê, ta nhận được 
phương trình ước lượng sau: 
 Biến phụ thuộc D(VNINDEX) 
 Số quan sát: 1556 (sau khi điều chỉnh) 
Biến Hệ số Sai số chuẩn Mức ý nghĩa 
D(VNINDEX(-1)) 0.270726 0.025290 *** 
D(VNINDEX(-2)) -0.077034 0.026149 *** 
D(VNINDEX(-3)) 0.070167 0.026060 *** 
D(VNINDEX(-4)) -0.073430 0.024966 *** 
PC1(-2) -4.00E-09 2.49E-09 * 
PC2 5.62E-08 1.99E-08 *** 
PC2(-2) -3.79E-08 1.74E-08 ** 
PC3 6.21E-08 1.66E-08 *** 
PC3(-5) -5.22E-08 1.50E-08 *** 
PC6 7.06E-08 1.67E-08 *** 
PC6(-5) -5.10E-08 1.66E-08 *** 
 R
2
 = 0.11; Thống kê Durbin – Watson: 1.99477; 
Bảng 4. Phương trình ước lượng (hay mô hình dự báo) VNINDEX theo các thành phần chính 
Các ký hiệu: *, ** và *** trong Cột 4 (Bảng 4) tương ứng là các mức ý nghĩa thống kê dưới 10%, 5% và 1%. 
306 MÔ HÌNH DỰ BÁO TẦN SUẤT CAO ĐỐI VỚI CHỈ SỐ THỊ TRƯỜNG CHỨNG KHOÁN 
Phương trình ước lượng (hay mô hình dự báo) dưới dạng tường minh có dạng: 
 D(VNINDEX) = 0.271*D(VNINDEX(-1)) - 0.077*D(VNINDEX(-2)) + 0.070*D(VNINDEX(-3)) - 
0.073*D(VNINDEX(-4)) - 3.995*PC1(-2) + 5.625e-08*PC2 - 3.793e-08*PC2(-2) + 6.208e-08*PC3 - 5.218e-
08*PC3(-5) + 7.059e-08*PC6 - 5.101e-08*PC6(-5) 
Thực hiện các kiểm định Ramsey về tính ổn định của mô hình, kiểm định Jarque-Bera về phần dư có phân phối 
chuẩn và có kỳ vọng bằng 0, kiểm định Breusch-Godfrey về không có hiện tượng nội sinh phần dư và phần dư không 
tự tương quan, kiểm định Breusch-Pagan [14] về phương sai phần dư không đổi ta nhận được các kiểm định đều thỏa 
mãn. 
Đánh giá chất lượng dự báo của mô hình bằng cách sử dụng mô hình được xây dựng để dự báo chỉ số 
VNINDEX ở 7 phiên giao dịch tiếp theo. 
Giá trị của chỉ số VNINDEX thực tế và kết quả dự báo chỉ số này bằng sử dụng mô hình dự báo được trình bày 
trong Bảng 5. Phần trăm sai số tuyệt đối nói chung là khá nhỏ dưới 1%, trừ thứ 2 ngày 25/04/2016, phần trăm sai số 
tuyệt đối là trên 1%, nó thể hiện trong những ngày nghỉ cuối tuần có thể đã có những thông tin không tích cực đến thị 
trường chứng khoán và đã tác động xấu tới tâm lý, niềm tin thị trường của các nhà đầu tư. 
Thứ Ngày VNINDEX VNINDEXF % sai số 
Thứ 2 25/04/2016 596.60 586.84 -1.63 
Thứ 3 26/04/2016 594.35 599.70 0.90 
Thứ 4 27/04/2016 596.60 594.02 -0.43 
Thứ 5 28/04/2016 593.65 597.10 0.58 
Thứ 6 29/04/2016 595.45 592.16 -0.55 
Thứ 4 04/05/2016 597.75 597.52 -0.04 
Thứ 5 05/05/2016 602.15 600.47 -0.28 
Bảng 5. So sánh kết quả dự báo bằng mô hình với số liệu thực tế 
V. KẾT LUẬN 
Bài báo này trình bày một cách khá tóm tắt phương pháp xây dựng mô hình dự báo chỉ số thị trường chứng 
khoán bằng kết hợp sử dụng phương pháp hồi qui nhiều biến và kỹ thuật PCA trên tập dữ liệu gốc để tạo ra một số biến 
mới thay thế các biến trong tập dữ liệu này làm biến giải thích trong mô hình hồi qui nhiều biến. 
Thực hành phương pháp trên tập số liệu thực tế của sàn giao dịch chứng khoán Thành phố Hồ Chí Minh cho 
thấy mô hình dự báo có độ chính xác khá cao, mặc dù các thành phần chính được sử dụng trong xây dựng mô hình chỉ 
phản ánh 70,2% sự thay đổi của tập dữ liệu gốc gồm 25 biến dữ liệu giao dịch cổ phiếu có hệ số tương quan mẫu cao 
với chỉ số thị trường chứng khoán của sàn giao dịch. 
Nếu tăng số lượng biến dữ liệu giao dịch cổ phiếu trong tập dữ liệu thay thế tập dữ liệu ban đầu hoặc tăng số 
thành phần chính để nó phản ánh được tỷ lệ % cao hơn sự thay đổi của tập dữ liệu gốc thì chất lượng dự báo bằng sử 
dụng mô hình sẽ được cải thiện hơn. 
Phương pháp dự báo chỉ số thị trường chứng khoán trong bài báo này có thể được ứng dụng để dự báo nhiều 
sự kiện kinh tế - xã hội khác trong đó nhất là dự báo các chỉ tiêu kinh tế vĩ mô. 
TÀI LIỆU THAM KHẢO 
[1] Andrei Roudoi (2009), “Short-term forecasting of key indicators of the German economy”, in The Making of National Economic 
Forecasts, Edited by Lawrence R. Klein, Published by Edward Elgar, Cheltenham, UK • Northampton, MA, USA, pp. 121-148. 
[2] Carol Anne Hargreaves, Chandrika Kadirvel Mani (2015), “The Selection of Winning Stocks Using Principal Component 
Analysis”, American Journal of Marketing Research, Vol. 1, No. 3, 2015, pp. 183-188. 
[3] Đỗ Văn Thành và Nguyễn Minh Hải (2016), “Phân tích và dự báo chỉ số thị trường chứng khoán bằng sử dụng chỉ số báo trước 
“, Báo cáo Hội nghị FAIR, 2015, Cần Thơ, 04/8 – 5/8/2016, 8 trang. 
[4] Lawrence R. Klein (2009), “Background to national economic forecasts and the high-frequency model of the USA”, in The 
Making of National Economic Forecasts, Edited by Lawrence R. Klein, Published by Edward Elgar, Cheltenham, UK • 
Northampton, MA, USA, pp.1-26. 
[5] Lawrence R. Klein, “Background to national economic forecasts and the high-frequency model of the USA”, in The Making of 
National Economic Forecasts, Edited by Lawrence R. Klein, Published by Edward Elgar, Cheltenham, UK • Northampton, MA, 
USA, 2009, 403 pages. 
[6] Lindsay I Smith (2002), A tutorial on Principal Components Analysis. 
[7] Mbeledogu, N. N., Odoh, M., Umeh, M.N. (2012). “Stock feature extraction using Principle Component Analysis”. International 
Conference on Computer Technology and Science. IACSIT Press, Singapore DOI: 10.7763/IPCSIT, 2012, V47, 44. 
[8] Graham E., Granger C.W.J., Timmerman A. (2006), Hanbook of Economic Forecasting, Volume 1, Elsevier BV, 2006, 933 p. 
Đỗ Văn Thành, Nguyễn Minh Hải 307 
[9] Preethi, G. and Santhi, B.: “Stock Market Forecasting Techniques: A Survey”, Journal of theoretical and Applied Information 
technology, Vol 46, No 1, 2012, pp. 24-30. 
[10] Yacine A¨ıt-Sahalia and Dacheng Xiu, “Principal Component Analysis of High Frequency Data”, Working paper, Princeton 
University and University of Chicago, 47 pages, March 2015. 
[11] Yoshihisa Inada (2009), “A high-frequency forecasting model and its application to the Japanese economy”, in The Making of 
National Economic Forecasts, Edited by Lawrence R. Klein, Published by Edward Elgar, Cheltenham, UK • Northampton, MA, 
USA, 172-197. 
[12] Vladimir Eskin and Mikhail Gusev (2009), “High-frequency forecasting model for the Russian economy, in The Making of 
National Economic Forecasts, Edited by Lawrence R. Klein, Published by Edward Elgar, Cheltenham, UK • Northampton, MA, 
USA, pp. 93-120. 
[13] Wang, Z., Sun, Y., Stockli, P. (2014). “Functional Principal Components Analysis of Shanghai Stock Exchange 50 Index”. 
Discrete Dynamics in Nature and Society Volume 2014 (2014), Article ID 365204, 7 pages. 
[14] Wang Yanshan, In-Chan Choi. (2013).” Market Index and stock price direction prediction using Machine Learning Techniques: 
An empirical study on the KOSPI and HSI”. Science Direct, pp. 1-13. 
[15] William H. Greene, “Economic Analysis”, New York University, Seventh Edition, Prentice Hall, 2012. 
[16] www.eviews.com. 
HIGH-FREQUENCY FORECAST MODEL FOR STOCK MARKET INDEX 
Thanh Do Van and Hai Nguyen Minh
ABSTRACT — The paper proposed a methodology of combining techniques of multivariate regression and principal component 
analysis (PCA) on the stocks listed on a stock exchange and had high pattern correlations with the stock market index of this stock 
exchange to build a forecast model of stock market index. The practising to build forecast model of stock market index is 
implemented on real data from early 2010 to the present of Ho Chi Minh City’s Stock Exchange. The forecasted results using the 
built model show good prospects of the proposed methodology for building forecast models of stock market index as well as others 
socio-economic indicators. 

File đính kèm:

  • pdfmo_hinh_du_bao_tan_suat_cao_doi_voi_chi_so_thi_truong_chung.pdf