论文部分内容阅读
在证券交易中,交易者根据自身拥有的信息做出投资决策,信息是决定收益的关键因素之一。目前我国证券市场中个人投资者占90%以上,但是他们获取信息以及分析信息的能力有限,这使得其在证券市场中明显处于信息劣势地位。本文的研究目的就是为证券市场中的中小投资者提供一个证券资讯信息服务平台,帮助他们获取及时、全面和准确的证券资讯信息,并提供一系列信息分析服务,为其证券投资决策提供信息服务支持。
本论文的主要工作是:
(1)研究股票评论倾向性分类算法。本文对网络评论性文本的倾向性分类研究进行了分析研究,在基于语义分析的SO—PMI(Semantic Orientation from Pointwise MutualInformation)算法的基础上,从特征向量选取、计算公式改进、集合Pws和Nws选择以及分类阈值选定四个方面对其进行了优化改进,提出了一个面向股票评论的SO—PMI改进算法,对股票评论进行倾向性分类,自动将股评分为看多、看平、看空三类。
(2)应用基于DOM(Document Object Model)的Web信息抽取技术。本文对几种流行的Web信息抽取技术的特点和适用范围进行了分析对比,根据系统主要抽取网络中的半结构化数据的特点,应用基于DOM的Web信息抽取技术,实现了对互联网证券资讯的自动抽取。
(3)设计并实现了一个集证券资讯采集、证券资讯处理加工、证券资讯服务三种功能为一体的证券资讯服务系统。系统采用基于J2EE技术的Spring+Hibernate的开源框架开发实现。该系统可以根据用户自定义的需求,从海量的互联网证券资讯中准确获取特定的资讯信息,并可为用户提供股票评论正负面倾向性分析、简报制作等服务。
本文的特色和创新之处在于:对当前主要应用于一般性网络评论(如影评、产品评论等)的SO—PMI算法进行改进,并率先运用于股评分类领域,设计实现了一个包含股票评论正负面倾向性分析功能的证券资讯服务系统。