论文部分内容阅读
中国的证券市场自90年代初创立以来,在国家特定的价格政策和行业准入壁垒的保护之下,证券行业在20世纪90年代无忧无虑地享受着股民保证金利差和交易手续费所带来的丰厚收入,没有人意识到作为一个真正的企业应该怎样提升服务质量,充分满足急需的个性化信息服务,许多证券公司把对市场的研究、对信息的增值服务看成了可有可无的事,把别人的信息拿来不经过任何的筛选和加工就提供给自己的客户。
中国的证券业经过十年的快速发展后,步入了一个相对低迷的时期,激烈的市场竞争再加上近五年来的持续熊市,使得证券全行业出现了持续数年的亏损,它们的生存空间受到了严峻的挑战,客户的争夺、市场占有率的竞争日趋残酷,如何在严峻的竞争环境面前立于不败之地,如何能够尽快实现以客户为中心的管理理念,更全面更高效的满足客户的需求,进行集中有效的管理监控,提供及时、准确的证券交易情况分析和走势预测,如何应对证券业的这种现状现状:报表、报告满天飞,不知哪个没水分?数据、数字遍地有,不知哪个是真的?客户、业务到处是,不知哪个最该抓;考核、决策天天搞,不知哪个有准头?如何对这笔数据财富进行科学有效的分析并从中提取出有价值的信息更好的服务于客户,如何真正把握每个客户的需求,提供个性化的信息服务和操作建议,真正站在客户的角度帮助他们实现盈利,而不仅仅是为了增加交易量和佣金收入而让投资者频繁的操作,更是摆在每一个券商面前刻不容缓的重大课题。
本文试探性的将数据库技术应用于证券行业,初步探讨了数据挖掘技术在证券业客户群体划分、股票信息提供、股票推荐这三个方面的应用。文中初步提出了划分客户群体的数据需求和划分方法,还提及了如何建立数据库的概念模型和逻辑模型,并尝试了如何基于数据仓库进行数据挖掘。笔者结合上证综合指数15年以来的历史数据,明确叙述了通过数据挖掘技术进行股票推荐的详细的数据挖掘步骤,谨此希望能为今后的学者在该领域的研究起到抛砖引玉的作用。基于股票操作的实践,笔者归纳了利用周线KDJ技术指标选股的数学模型。通过二次数据挖掘,第一次选取的是一维二类的挖掘条件:周线KDJ指标的黄金交叉和死亡交叉两个类;二次数据挖掘选取的是二维五类的挖掘条件:成交金额比值的大于2、小于2的两个类和股票走势特征强势、弱势、陡坡式下跌三个类,进行了C21*C31排列组合,即6次细分数据挖掘,得到了通过细分的挖掘条进行数据挖掘的六组拆分数据,将六组数据中收益率的算术加和小于零(即亏损)的数据组剔除得到相应的规则知识,并据此建立了数学模型,讨论了应用两次数据挖掘技术进行股票操作的准确率和收益情况:通过选取了二维五类的挖掘条件进行二次数据挖掘,剔除了16个样本后,总共进行了30次投资,其中有19次的投资是盈利的,盈利概率提高至63%,而且经过二次挖掘后的30个样本的收益率算术加和增加为246%,即在不考虑交易成本的情况下,投资者13年来的收益为246%,平均的算术年收益率上升至18.9%。表明,二次数据挖掘的知识规则是成功的,达到了预期的提高赢利率的目的。
目前国内证券业的发展步履维艰,数据挖掘技术在证券行业的应用研究也是刚刚起步,笔者综合借鉴了国内外的研究成果,希望能够结合国情,为加强与提高数据挖掘技术在我国证券行业的应用抛砖引玉、进一点绵薄之力。