基于语义分析的主题信息采集系统的设计与实现

来源 :计算机应用 | 被引量 : 28次 | 上传用户:ylw962203
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计并实现了一个基于语义分析的主题信息采集系统(SAFWC),提出一种链接价值预测算法(SPageRank)。该算法从语义的角度出发,结合“知网”,通过对扩展元数据进行主题相关性判定来选择、预测与主题相关的URL。实验结果表明,该系统具有较高的采集效率及精度。
其他文献
提出了一种新的频域盲分离排序算法。算法对不同频率点采用不同的排序算法:频率较低部分采用比较分离信号相邻频率点和谐波频率点之间幅度相关性相结合的排序算法;中频部分采用基于语音信号方位估计的排序算法;频率较高部分采用相关比较和方位估计结合的排序方法。仿真结果表明,该排序算法的鲁棒性和精确性较现有的单纯利用分离信号相关性的排序算法或者基于语音信号定位的排序算法有了一定的增强。
[摘 要] 随着科研项目的日益增加,传统的人工的科研项目管理方式逐渐暴露出诸多问题,利用信息技术手段完成业务管理成为解决这一问题的有效途径。本文主要阐述运用.NET多层式架构技术设计实现安全高效的科研项目管理信息系统的关键技术理论知识和各个功能模块的设计思路。系统功能模块设计较全面,基本囊括了科研项目管理的主要业务,可高效地完成科研项目的申报、审批、立项、资金监管、验收、成果展示等业务管理,使科研
研究了非结构化P2P系统的数据管理和相应的资源查询算法。提出了基于资源广告的非结构化P2P系统,即RAP2P。设计了一种类似谣言传播机制的资源信息广告算法AdGossip来传播共享
为提高Web服务匹配的时间效率,提出了Web服务与当前服务请求之间的泛化语义无关关系,并证明了满足该关系的服务与当前服务的不可匹配性;提出了判定服务与当前请求的语义泛化无关的高效判定规则,即两者的泛化语义的交是不可满足的;基于该判定规则,提出了支持Web服务匹配的服务过滤方法。应用和实验分析表明,该方法可提高服务匹配的时间效率。