基于共现词查询的主题爬虫研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户:hfzxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过建立一个共现词库改进主题模型,以提高下载网页的主题相关度及质量,并且能描述其语境的上下文,揣测用户意图,调节检索结果排序。在此基础上设计并实现一个FDC主题爬虫系统,该系统采用改进的主题敏感FDC-PageRank算法来计算网页优先级。实验表明其效果良好。
其他文献
目的探讨青少年运动员超声骨龄测试过程中声速(SOS)值的变化特点,为进一步完善超声技术判凄骨龄提供科学依据,方法用超声骨龄仪器埘上海市1843名青少年运动员遵行检测。结果男女
针对双窗口算法难以判断包丢弃类型的问题,提出一种新的包丢弃类型判断方法,对SCTP协议的确认块进行扩展,从确认块中获取包丢弃类型信息。在NS2上进行仿真实验,实验结果表明,改进
我科2005年1~12月对71例晚期肿瘤患者共施行了100次介入治疗,取得了满意的效果,现将介入治疗后的护理体会报告如下.
随着我国机械生产行业的快速发展,对机械加工工艺的要求也越来越多。数控铣工艺在模具零件的加工方面应用越来越多,但是,加工过程中的问题也不容忽视,特别是误差问题更要积极应对
目的了解南昌市大、中学生网络成瘾现状及其心理健康状况,为进一步开展网络成瘾的群体预防和个体治疗的研究提供依据。方法分层整群抽取南昌市3 508名大、中学生,采用中文网
高中生处于人生的价值观、行为观念逐渐成熟的关键时期,因此,在该阶段对高中生进行相关各个领域正确的价值观念形成以及行为习惯的养成至关重要。高中生作为未来我国社会经济
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
给出一种在复杂背景下的视频文字跟踪和文字笔画提取方法。用基于Harris角点特征的点模式匹配法跟踪视频序列中静止和运动的文字,以确定文字序列的时间属性,比较了采用图像整体像素匹配和点模式匹配的跟踪精度。用基于多帧融合思想的前景/背景识别算法提取视频文字笔画并作OCR识别。实验结果显示,点模式匹配的跟踪算法比图像整体像素匹配的算法跟踪精度更高,在图像背景复杂、变化快的情况下,基于多帧融合的文字笔画提
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield