论文部分内容阅读
历次全球经济危机往往都伴随着贸易争端的高发。近一时期,随着全球经济形势恶化,一些国家自危、自利、自保倾向抬头,贸易保护主义和经济孤立主义蔓延。当前,金融危机已蔓延到制造业、服务业等实体经济领域,各国工厂倒闭剧增,失业率上升,政治压力和社会问题接踵而至。越来越多国家以产业安全、保护环境和保护本国人民健康等为由加强政府对经济的干预,阻挠我国企业出口。其中,技术性贸易壁垒(Technical Barriersto Trade,TBT)已成为阻止我国出口的主要手段,而且还在逐年加重。
为了合法、有效地保护我国产业和企业的正当权益,维护公平竞争,建立一套技术性贸易壁垒预警系统已经迫在眉睫。目前的TBT预警研究,使用经济理论和数学模型分析产业数据进行预警,有两个不足:一是产业数据收集困难,二是时效性差。在预警的准确度和时效性上难以保证。
进口国在设置技术性贸易壁垒之前,其国内舆论必然会产生相关报道或评论,通过大量的相关报道,利用文本挖掘技术及时发现进口国舆论的动向,是TBT预警中的有效方法,能够很好的弥补目前TBT预警系统的不足。文本挖掘是数据挖掘技术的一个分支,通过一系列的数据挖掘技术,从大量的、无结构的文本数据中发现潜在的、可能的数据模式、内在联系,获得对用户的有价值的知识;通过抽取散布于大量文本中的新的、合理的、对于未来行为有指导意义的知识,为未来提供有价值的参考信息。在时间轴上的文本聚类分析,即为话题检测技术,通过话题检测,能够自动检测新闻报道中的新话题。
本文分析文本挖掘技术的特点,并首次引入TBT预警领域,然后进行两次实验,证明了系统性能的优越性。
第一次实验,初步建立基于文本挖掘的TBT预警系统模型:通过抽取新闻评论关键词,分析关键主题的关注度及其变化趋势,在此基础上量化为设置技术性贸易壁垒的可能性指标。以我国产品出口美国为例,进行实证分析,验证了模型的有效性。实验证明,数据收集易于实现,预警及时。
第二次实验,首次将改进的话题检测技术应用于TBT预警:设计了基于改进的话题检测技术的TBT预警系统模型,建立了基于产品信息的话题模型,改进了leader-follower(领导者-追随者)聚类算法,并将改进的话题检测技术应用于TBT预警研究。实验结果证明,改进的话题检测技术显著提高了话题检测的精确度,进而提高了TBT预警的准确度。
在TBT预警领域首次引入文本挖掘技术,是该研究领域的一个补充和发展。