专项客户新闻自动检索方法研究与应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ncutwangx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网快速发展的今天,网络信息已经成为人们信息获取的主要来源。对于某些行业的发展而言,新闻信息的及时获取对企业的发展至关重要,是发展规划和决策的重要信息保障。由于网络新闻信息具有信息量大、增长速度快和及时性强的特征,而企业或个人对新闻信息的要求一般具有时变性弱、主题性强的特点。因此,研究如何快速准确、自动获取与客户相关的新闻信息,对企业及时了解交易对手状况,以便及时采取应对措施,具有重要的实际意义。   本文将在深入研究网络新闻信息自动识别、分类和检索等相关技术的基础上,采用JSH技术框架,并结合现有的网络主题爬虫、文本识别、SVM增量式算法等智能信息处理技术,设计并初步实现了一套专项客户新闻自动检索系统。论文的主要工作和贡献为:   1.研究了网络主题爬虫技术和文本特征提取等相关技术方法。在此基础上,采用专项主题爬虫,实现了针对指定信息源信息的定时爬取,并通过专项主题分析和模糊匹配的技术对爬取回来的信息进行过滤。最后,再根据中文分词技术和基于统计的特征空间提取法,实现对文本特征空间的建模识别。   2.在对SVM基本原理、基本增量算法I-SVM深入研究的基础上,提出了两种改进的SVM增量算法:TI-SVM算法和OCV-SVM算法。利用一组实际的新闻主题信息训练和分类,对所提出的算法进行了测试和验证。   3.设计并初步实现了一个专项客户新闻自动检索系统。该原型系统能接受客户对新闻源信息的定制和关键词维护,并可以根据客户历史新闻资料,向用户自动推送相关新闻信息。
其他文献
摘要:永磁同步电机(Permanent Magnet Synchronous Motors,PMSM)具有功率密度高、体积小、功率因数高、效率高等优点,获得非常广泛的应用。但中小容量PMSM调速控制系统逆变电源的工作方式使功率因数低,并产生谐波污染供电网。提高PMSM控制系统的功率因数能有效提高电网容量利用率和降低污染。传统PMSM转子位置检测采用位置传感器,传感器不但增加成本而且故障率高。采用转
机器人是一个多学科和技术相互交叉的领域,是一个国家高科技发展水平的象征。社会需求和技术进步的推动使机器人向智能化和多样化的方向发展,智能化程度的提高离不开感知能力,未
在当今传统能源日益缺乏的情况下,风力发电作为一种可再生的清洁能源被广泛关注,并得到了迅猛的发展。但随着风电规模在电网中所占比例的逐渐增加,风电对电网的影响也在日益加剧,主要表现为对电网电压稳定性的影响。静止同步补偿器STATCOM (StaticSynchronous Compensator)是目前无功补偿领域最新技术的代表,具有响应速度快,稳定性好,无功输出连续等优点,适合用来对系统进行无功补偿
随着网络应用服务的丰富和基础设施的完善,用户数量的大幅增长和由此带来的海量访问对网络系统架构提出了更高的要求。内容分发网络(CDN)和以BitTorrent为代表的对等网络(P2P)
泡沫浮选是广泛应用于矿物分离的一种方法。硫浮选是锌直接浸出工艺的一部分,采用浮选的方式分离出高酸浸出渣中的硫单质,不仅避免了含硫废渣的排放对环境造成的污染,同时还
压力容器是流程工业生产的重要设备。三级气罐压力控制系统由于存在大惯性、时变性和时间延迟等特性,所以是过程控制中一个难点。同时控制系统的执行机构和检测装置,比如阀门和仪表,都是有约束的,传统的PID控制和广义预测控制的控制精度和抗干扰能力不能满足生产要求,为此本文提出了一种有约束的广义预测控制方法来弥补其不足。该算法是以递推最小二乘法对系统参数进行在线辨识,通过求解Diophantine方程得到压力
对等网络(Peer-to-Peer, P2P)由于其具有工作效率高,可扩展性强,充分利用网络边缘节点等特点已被广泛应用于实际系统中。但P2P网络固有的匿名性,动态性和开放性,也给系统带来一些
近年来,多智能体系统的一致性问题由于其在分布式滤波、多车辆系统的队形控制以及无线传感器网络的数据融合等众多领域有着广泛应用,而引起了国内外学者的共同关注.   本文
大型复杂工业过程的控制策略研究一直是控制工程科学的重要研究方向。过热汽温控制是火电机组安全、经济运行的一个重要指标,其过高、过低或波动过大都会引起一系列安全问题。
随着科学技术的快速发展,以及劳动成本的增加,工业机器人已被广泛的应用于提高生产效率和产品质量,而示教系统是机器人系统中人机交互的一个重要手段,其作用越来越重要。  本文