基于领域本体的文档向量空间模型构建

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:shelley79
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对VSM不能揭示隐藏在不同特征词后面的相同概念语义、反映文档中的潜在语义关系、在相似度计算中精度较低的问题,提出一种基于领域本体的文档向量空间模型DOBVSM(domain ontology-based vector spacemodel)。该模型把领域本体中的概念扩展为文档特征词,并通过概念间的语义关系对特征词权重进行调整,最终建立包含语义关系的文档DOBVSM。通过实验分析表明:DOBVSM计算的文档相似度值更加发散,与专家评价值最为接近,能够较好地反映文档之间的相似情况。
其他文献
依据对室内定位算法的场景分析,在BVIRE算法的基础上,提出了一种室内定位的改进算法IMPRO_BVIRE。针对信号在无线信道中的衰减规律呈非线性,该算法采用一种非线性插值方法计算虚拟参考标签的RSSI值,在邻近参考标签的选择上采用小概率排除法,排除了小概率点对定位精度的影响,并通过取均值抵消了阴影带来信号的剧烈波动。仿真与实验结果表明,改进后的IMPRO_BVIRE算法相比于BVIRE算法具有更
分析了线性反馈移位寄存器(LFSR)和猫映射的基本结构,给出了一种基于LFSR与猫映射的伪随机序列生成方法。该方法根据LFSR的计算结果产生相应的选择函数,通过选择函数确定当前迭代计算中猫映射的系数矩阵;应用选定的系数矩阵进行迭代计算产生相应的混沌序列,将其二值化后作为反馈值与LFSR的反馈值进行异或运算,运算结果作为LFSR的最终反馈值,实现对LFSR生成序列的随机扰动。通过实验对生成序列的性能
针对sink区域受限及节点特征参数的问题,如何规划sink路径选择以满足动态传感器网络高效数据收集及低能耗的要求,提出了一种动态传感器网络区域受限的移动sink路径选择方法。该方法在缓存节点辅助通信模式下,建立sink受限区域图模型。针对不同应用情况,分别讨论了sink移动全局路径信息已知和sink移动局部路径信息已知这两种情况下的最优移动路径。在全局路径信息已知时,采用Vornon单元划分的思想
双支持向量机是近年提出的一种新的支持向量机。在处理模式分类问题时,双支持向量机速度远远超过传统支持向量机,而且显示出较好的推广能力。但双支持向量机没有考虑不同输入样本点可能会对分类超平面的形成产生不同影响,在某些实际问题中具有局限性。为了克服这个缺点,提出了一种基于混合模糊隶属度的模糊双支持向量机。该算法设计了一种结合距离和紧密度的模糊隶属度函数,给不同的训练样本赋予不同的模糊隶属度,构建两个最优
针对医学信息遭遇窜改、窃取等信息安全问题,提出了一种基于混沌的零水印算法。利用Arnold置乱算法对原始载体图像进行k次置乱,然后提取置乱图像每一个像素的最低有效位与二值水印作异或运算来构造零水印,实际嵌入的水印图像通过混沌映射加密来隐藏水印信息。提取水印后对原水印图像与提取的水印取绝对差,若遭遇窜改,则能定位窜改位置及窜改形状。实验证明,混沌系统的大密钥空间和对初值的敏感性增加了算法的鲁棒性,并
为了扩展尽可能多的极性副词(基于词典WordNet 3.0),提出了三种类型的查询字符串。除了Word-Net中的同义关系和反义关系,还使用了近义(similar to)和又见(also see)这两种关系。实验数据表明,后两种关系比前两种关系在扩展极性副词方面更重要。详细的实验验证了所提出的POAE算法加Transform转换函数在自动扩展极性副词方面是可行的。
高分辨率图像比对法是图像质量评价中简单而又行之有效的方法,其前提是两幅用于比较的高低分辨率图像具有良好的一致性,但实际情况往往很难满足这些一致性要求。为了使不能满足光照一致性的图像也能用于卫星在轨参数监测,需要进行光照一致性校正。针对如何定量评价多幅遥感图像的光照一致性问题,提出了一种定量评价方法。该方法根据Retinex原理,将图像分解为光照分量和反射分量,然后比较光照分量直方图的相似度,将这一
针对混洗蛙跳算法在求解连续函数优化问题中出现的收敛速度慢、求解精度低的缺点,提出了一种基于反向学习策略的改进算法,在种群初始化和进化过程中分别加入反向操作,产生更靠近优质解的种群,从而提高了算法的全局寻优能力,促进了算法收敛。实验仿真表明,新算法在寻优效率、计算精度等方面均优于原算法。
为了在使用基于位置的服务时用户的位置信息不被不可信的位置服务提供商所泄漏,k-匿名位置隐私保护已被广泛研究。然而在集中匿名器被黑客控制时原k-匿名算法会泄漏所有用户的位置隐私,在进行k个最近邻目标查询时对网络的负载较重,而Space Twist算法又不能保证k-匿名。提出了一种基于经纬网格的递增KNN位置隐私保护查询算法,将经典的k-匿名算法与Space Twist算法相杂交,并引入经纬网格代替原
为了在可研阶段合理、快速地制定重力坝设计方案,减少设计周期和成本,采用极限状态设计的方法,利用VB 6.0可视化编程工具开发出了一套能够与CAD动态交互的重力坝三维设计系统。该系统通过对Auto-CAD的二次开发实现了重力坝的三维参数化建模,并对所建三维模型进行结构计算,将设计与计算紧密结合,通过动态交互简化了大量复杂数据的计算,达到精确、快速完成断面设计的目的。经实践检验证明,该系统大大提高了断