基于概念获取的多文档主题划分研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:seed_sg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对多个相关文档进行主题划分对于信息检索、自动摘要等研究领域都有重要的应用价值。当前流行的文本主题划分技术中,多采用词频向量进行文本表示,而研究表明将特征向量映射到概念级,将改善多文档主题划分的效果。本文提出了一种应用知网(HowNet)来获取多文本的概念作为特征向量,再应用聚类的方法对文档集中的相似段落进行归类,得到主题划分的结果,解决了多文档的结构分析问题。实验结果表明该方法对多个相关文档的主题划分取得了良好的效果。
其他文献
随着网络规模的增大,数据的传输延迟和丢失概率也随之增大,进而对TCP传输造成了较大影响。针对此现象,本文提出基于VPN网关的快速重传机制,通过在VPN网络中引入隧道重传协议,降低
讨论了采用电压-电流法测定电线电缆绝缘电阻的过程中由测量重复性、电线电缆绝缘介质吸收和极化程度不均匀以及测量过程等因素所带来的不确定度分量,举例计算了测量电线电缆7
针对基于尺度不变特征变换(Scale Invariant Feature Transform,SIFT)的目标识别实时性差的缺陷,提出了一种结合目标主色集(Object Dominant Color Set,ODCS)初定位的SIFT彩色目标快速识别算法(ODCS-SIFT)。将目标识别分为两个阶段:在离线训练阶段,采用人机交互的方式提取目标特征;在实时图像处理阶段,首先基于目标主色集进行顺序网格
摘 要:多媒体技术在教学过程中的不断深入和发展,不仅改变了传统教学过程的组织序列,还改变了分析和处理教育、教学问题的思路,逐渐成为推动教育教学革新的科技平台和思想平台。关键词:体育教学; 多媒体技术; 教学过程中图分类号:G807.4 文献标识码:A 文章编号:1006-3315(2011)3-154-001体育教学是在教师的指导和学生的参加下,按照教学计划和教学大纲,由教师向学生传授知识、技术、
本文结合web用户浏览行为的特点,提出了一种新的路径相似度的计算方法,在计算相似度时不仅把用户的浏览模式仅作为一种序列模式来考虑,还充分考虑了用户在网上浏览的时间因素。
本文分析了量子论的诞生和发展过程,研究了物理学家的创造性思想与创造性方法在这个过程中所起的作用,提出了要在教学中结合历史上的创新过程培养学生创造性能力的问题。
Apriori是挖掘频繁项集的基本算法,目前该算法及其优化变种都没有解决候选项及重复扫描事务数据库的问题。文章通过对Apriori及其优化算法的深入探究,提出了一种基于单事务组合