基于元数据与领域概念树的文本相似度计算

来源 :系统工程与电子技术 | 被引量 : 0次 | 上传用户:candy136892
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络与信息技术的快速发展,导致网络上产生了大量的电子文本,而文本间的相似度计算是文本处理的一种重要手段。对于大规模的文本集,通常采用向量空间模型(vector space model,VSM)进行文本表示,但是该方法面临着文本向量维度较高及文本语义相似度难以度量的问题。提出一种改进的文本相似度计算方法,从大量的特征空间中选择出具有代表性的元数据特征向量元素,以降低向量空间的维度;构建领域概念树并设计基于领域概念树的文本相似度算法,对领域概念中广泛存在的同义词进行处理,以提高文本之间语义相似度度量的性能
其他文献
采用土壤与粉碎秸秆混合物室内氨挥发模拟试验,研究了不同秸秆添加物对尿素氨挥发的影响.结果表明,施用等量尿素,不同秸秆混合条件下尿素氨挥发损失具有明显差异;添加小麦或
随着计算机网络技术的飞速发展,无线局域网逐步在各个方面得到广泛的应用和重视,本文通过对无线局域网和有线局域网优缺点的比较,以及无线局域网改善等方面的分析,探讨了局域
刮板输送机是综采工作面运煤系统的主要输送设备,它承担着将工作面煤碳的输送工作,利用刮板链的循环运动输送煤炭。为了保证刮板输送机的正常使用,保证刮板链合理的张紧状态显得
介绍了化工生产开、停车过程人工误操作危险与可操作性分析系统(MO-HAZOP)、基于层次分析法的计算机辅助HAZOP分析方法和化工过程爆炸事故分析软件,系统地从物料、设备、工艺、
铁路是国民经济的关键基础设施,铁路投资是我国未来一段时期内拉动经济发展的重要方式,近年来,国家不断加快推进铁路建设,我国铁路建设迎来了发展繁荣期。铁路建设是一个重资
针对堆积法制造龙泉青瓷,采用水基料浆与流态化喷雾造粒相结合制备青瓷胎体陶瓷粉料,研究了水基料浆的分散稳定机制及其喷雾造粒行为,分析了固相含量对料浆流变性能、造粒粉
本文首先阐述了政府会计制度的实施背景,分析了事业单位财务管理方面存在的问题,结合政府会计制度实施视域下事业单位财务管理工作提出了具体的建议,以供参考。
旋光性高分子是在G.Natta实现定向聚合方法以后迅速发展起来的,它的合成方法遍及高分子聚合反应的所有类型。本文综述了旋光性高分子的各种类型及其合成方法。
1临床应用大蓟出自<本草经集注>.为菊科(Compositae)管状花亚科菜蓟族(Cvnareae)蓟属(Cirsium Mill.)植物C.japonicumDC.的干燥地上部分和根.其性凉,味苦甘.对于大蓟的归经认
叙述了甘肃省白马藏族民俗旅游开发的内容;以矩阵和模糊数学相结合的定量分析方法为主,探讨了白马藏族民俗旅游资源开发的可行性,并就白马藏族民俗旅游的开发条件、开发设想