Tải bản đầy đủ (.pdf) (3 trang)

DSpace at VNU: Sử dụng kỹ thuật tương quan chéo, kỹ thuật phân tích nhân quả dự đoán xu hướng chỉ số chứng khoán dựa trên phân tích tâm trạng từ phương tiện xã hội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (234.25 KB, 3 trang )

Sử dụng kỹ thuật tương quan chéo,
kỹ thuật phân tích nhân quả dự đoán xu hướng
chỉ số chứng khoán dựa trên phân tích tâm trạng
từ phương tiện xã hội
Using cross-correlation techniques, causal analysis techniques to predict stock index trend based on
the sentiment analysis of social media
NXB H. : ĐHCN, 2014 Số trang 41 tr. +

Nguyễn Tiến Tùng
Đại học Công nghệ
Luận văn ThS ngành: Hệ thống thông tin; Mã số: 11021172
Người hướng dẫn: PGS.TS Hà Quang Thụy
Năm bảo vệ: 2014
Keywords: Kỹ thuật tương quan chéo; Kỹ thuật phân tích nhân quả; Chỉ số chứng khoán;
Phân tích tâm trạng
Content
Phương tiện truyền thông xã hội bao gồm các ứng dụng tương tác và các nền tảng để tạo,
chia sẻ và trao đổi các nội dung người dùng tạo ra. Mười năm qua đã mang lại tăng trưởng rất lớn
trong phương tiện truyền thông xã hội, đặc biệt là các dịch vụ mạng xã hội trực tuyến, và nó đang
thay đổi cách chúng ta tổ chức và giao tiếp [YK12]. Nó tập hợp các ý kiến và cảm xúc của các
nhóm đa dạng của người dân với chi phí thấp. Khai thác các thuộc tính và nội dung của các phương
tiện truyền thông xã hội cho chúng ta một cơ hội để khám phá đặc tính cấu trúc xã hội, phân tích
các mẫu hoạt động chất lượng và số lượng, và đôi khi khả năng dự đoán các sự kiện liên quan đến
con người trong tương lai.
Trong thị trường chứng khoán, nghiên cứu dựa trên lý thuyết bước đi ngẫu nhiên và giả
thuyết thị trường hiệu quả (EMH) cho thấy giá cổ phiếu là không thể đoán trước. Nhưng nghiên cứu
gần đây, từ quan điểm của Lý thuyết kinh tế xã hội Tài chính và kinh tế học hành vi, cho rằng giá
cổ phiếu có thể được dự đoán đến mức độ nào đó [YK12]. Số lượng lớn các thông tin đăng trên
bảng thông tin tài chính, chẳng hạn như Yahoo! Tài chính, dự đoán lợi nhuận cổ phiếu tiếp theo.
Mối tương quan giữa chúng là có ý nghĩa thống kê. Mặc dù hiệu quả kinh tế rất nhỏ nhưng số lượng
những bài viết trên là hữu ích để dự đoán sự biến động chứng khoán. Đối với bài viết cụ thể bao


gồm các từ cảm xúc như lo lắng, hy vọng và sợ hãi, tổng số người trong số họ đã tiên đoán chỉ số
chứng khoán, thông tin tâm lý thị trường là có giá trị tiên đoán.
Mục tiêu của luận văn này là khảo sát, tìm hiểu để đề xuất một mô hình dự đoán xu hướng
chỉ số chứng khoán dựa trên phân tích tâm trạng từ dữ liệu máy tìm kiếm, tin tức và Twitter. Để tiếp
cận mục tiêu này, luận văn nghiên cứu và giới thiệu một số phương pháp dự đoán chứng khoán
đang được quan tâm hiện nay. Từ đó, lựa chọn một mô hình phù hợp để dự đoán xu hướng chỉ số
chứng khoán DJIA cho ngày tiếp theo trên miền dữ liệu máy tìm kiếm, tin tức và Twitter.
Nội dung của luận văn được chia thành các chương như sau:
Chương 1:Trình bày về phân tích tâm trạng trên phương tiện truyền thông.
Chương 2: Luận văn giới thiệu một số kỹ thuật dự đoán xu hướng chứng khoán trên miền
dữ liệu Twitter.

1


Chương 3:Luận văn đề xuất mô hình dự đoán xu hướng chỉ số chứng khoán dựa trên phân
tích tâm trạng từ phương tiện xã hội.
Chương 4:Thực nghiệm, kết quả và đánh giá.
Phần kết luận: Tóm lược kết quả đạt được của luận văn và định hướng phát triển tiếp theo.
References
Tiếng Việt:
[T14] Phạm Huyền Trang. Một mô hình sử dụng Twitter và một số phương tiện xã hội khác dự báo
xu hướng chỉ số chứng khoán của APPLE. Luận văn thạc sỹ trường Đại học Công nghệ ĐHQGHN, 2014.
Tiếng Anh:
[VCH12] Tien Thanh Vu, Shu Chang, Quang Thuy Ha and Nigel Collier (2012). An Experiment in
Integrating Sentiment Features for Tech Stock Prediction in Twitter, IEEASMD 2012
[KS12] Akshi Kumar and Teeja Mary Sebastian. Sentiment Analysis on Twitter. IJCSI International
Journal of Computer Science Issues, Vol. 9, Issue 4, No 3, July 2012 .
[AA12] Anshul Mittal, Arpit Goel (2012). Stock Prediction Using Twitter Sentiment Analysis.
Standford University, CS229.

[YK12] Sheng Yu, Subhash Kak (2012). A Survey of Prediction Using Social Media, CoRR
abs/1203.1647: (2012), />[TBP12] Mike Thelwall, Kevan Buckley, and Georgios Paltoglou. Sentiment Strength Detection for
the SocialWeb, JASIST 63(1): 163-173 (2012).
[MCB11] Huina Mao, Scott Counts, Johan Bollen. Predicting Financial Markets: Comparing
Survey, News, Twitter and Search Engine Data.CoRR abs/1112.1051 (2011)
[JYZ11] Long Jiang, Mo Yu, Ming Zhou. Target-dependent Twitter Sentiment Classification,
Association for Computational Linguistics Stroudsburg, PA, USA ©2011
[CL11] Sang Chung & Sandy Liu. Predicting Stock Market Fluctuations from Twitter. 2011, Stat
157, Professor Aldous.
[BMZ11]Johan Bollena,Huina Maoa,Xiaojun Zengb. Twitter mood predicts the stock market,
Journal of Computational Science2 (2011): 1–8
[ZFG11] Xue Zhang, Hauke Fuehres, Peter A. Gloor. Predicting Stock Market Indicators Through
Twitter “I hope it is not as bad as I fear”. Procedia - Social and Behavioral Sciences 26 ( 2011 ): 55
– 62.
[LD11] T. Loughran and B. McDonald. When is a liability not a liability? Textualanalysis,
dictionaries, and 10-ks. Journal of Finance, 66(1):67–97, 2011.
[KXM10] Kunlun Li, Xuerong Luo and Ming Jin (2010). Semi-supervised Learning for SVM-KNN.
Journal of computers, 5(5): 671-678, May 2010
[BF10] Luciano Barbosa and Junlan Feng. 2010. Robust SentimentDetection on Twitter from
Biased and NoisyData. Coling 2010.
[DEG10]Z. Da, J. Engelberand, and P. Gao. The sum of all fears: investor sentiment and asset
prices. 2010.
[GBH09] Alec Go, Richa Bhayani, Lei Huang. 2009. Twitter SentimentClassification using Distant
Supervision.
[SC09] R. Schumaker and H. Chen. Textual analysis of stock market prediction using breaking
financial news: Theazfintext system. ACM Transactionson Information Systems, 27(2), 2009.

2



[CSJ08] M. De Choudhury, H. Sundaram, A. John, and D. D. Seligmann, “Can
blogcommunicationdynamics be correlated with stock market activity?,” HT ’08, 2008, vol. 2, no.
1, p. 55.
[TTM08] P. C. Tetlock, M. Saar-Tsechansky, and S. Macskassy. More than words: Quantifying
language to measure firms’ fundamentals. Journalof Finance, 63:1437–1467, 2008.
[T07] P. C. Tetlock. Giving content to investor sentiment: The role of media in the stock market.
Journal of Finance, 62(3):1139–1168, 2007.
[C03] W. Chan. Stock price reaction to news and to no-news- drift and reversal after headlines.
Journal of Financial Economics, 70:223–236, 2003
[H99] Eui-Hong Han,
Text Categorization Using Weight Adjusted k-Nearest Neighbor
Classification. PhD thesis, University of Minnesota, October 1999.
[J98] T. Joachims, Text categorization with Support Vector Machines: Learningwith many relevant
features. In Machine Learning: ECML-98, Tenth EuropeanConference on Machine Learning, pp.
137-142
[YJ97] Yiming Yang, Jan O.Pedersen (1997). A comparative study on feature selection in text
categorization. In Proceedings of ICML-97, 14th International Conference on Machine Learning
(1997), pp. 412-420.

3



×